TAREAPLANTEAMIENTO Y OBJETIVO: Tomamos datos de la siguiente publicación: "Using Cigarette Data for an Introduction to Multiple Regression", by Lauren Mcintyre in Volume 2, Number 1, of the Journal of Statistics Education. La primera parte del objetivo lo cubriremos con esta tarea p2p, y la segunda parte, lo cubriremos en la segunda tarea p2p al finalizar el módulo 4. Estudios realizados con anterioridad ponen de manifiesto que incrementos en el contenido de alquitrán y nicotina de los cigarrillos vienen acompañados por incrementos en el monóxido de carbono emitido al fumar. Partimos de estos datos y nos planteamos el siguiente objetivo: (3 PARTES) PARTE 1: Genere un breve informe estadístico descriptivo, a partir de la salida de ordenador que se adjunta (tómese el espacio que necesite pero sea breve), en el que señale: 1) el tamaño muestral, 2) cuál es la variable con mayor variabilidad, 3) cuál de las medias es más representativa de los datos y 4) cuál de las medias es más estable. 957300 1.68000 PESO 25 0. PARTE 2.03000 0.35000 0. su media está más cerca de la verdadera media de la población.0000 15. Escriba un breve informe con los resultados más relevantes entre los que al menos debe estar la Mediana y el Recorrido intercuartílico (debe calcularlo a partir de la tabla) para todas y cada una de las variables.016850 0.1500 7. Muestra: 25 2.RESPUESTAS 1.0963 .6500 9.2500 0.9000 NICOTINA 25 0. RESPUESTAS Tabla 1. los resultados obtenidos con la Media y su dispersión y la Mediana y su dispersión. 4. Todas las medias son representativas de sus distribuciones porque tienen indicadas medidas de dispersión.9000 7. La variable con media más estable es el peso: por tener un error estándar menor que las demás variables. Cálculo de la Mediana y el Recorrido intercuartílico N MEDIANA p50 p75 (Q3) p25(Q1) 25 13.90000 1. En el informe compare. Analice los percentiles a partir de la tabla correspondiente que aparece debajo.4000 15. además.7500 25 12.920550 MONÓXID O ALQUITR AN Recorrido (Q3Q1) 5. El Alquitrán es la variable que presenta una desviación típica más dispersa 3. en cambio el rango intercuartílico introduce un sesgo porque cuando saca del análisis un número importante de valores más bajos (Rubios) y altos (negros).957300 A pesar de los valores extremos en las observaciones correspondientes a las 3 primeras variables.07084 PESO 0. los resultados se resaltan en la tabla 1. indicando que estos valores discordantes no han logrado sesgar de manera importante la distribución aunque sí existe un sesgo negativo asociado a la mayor cantidad de cigarrillos de tipo Rubio en la muestra (64% del total de la muestra). el peso no muestra diferencia significativas en las medidas. la diferencia entre rubios y negros como explicación de la dispersión.90000 0. y sus respectivas medidas de dispersión.0000 ALQUITR AN 12.87600 0. se destaca que en todas ellas la Media es menor a la Mediana. ya que a diferencia de los negros. modificando sustancialmente el análisis objeto del estudio al perder .7397 0.9703 0.2500 11. los demás valores extremos (por debajo de p25 y por encima de p75) no afectan el análisis si se utiliza la media y la desviación típica para analizar de manera conjunta estos dos tipos diferentes de cigarrillos.8763 1.56 y cuando se toma el RI está queda en 0. estos rubios contienen menores cantidades de alquitrán.0877 0. El Alquitrán es el que muestra un mayor recorrido RI seguido del monóxido y la nicotina en menor grado.4000 0. lo cual sugiere que se trata de una variable irrelevante para el propósito del estudio. Dados los datos de las tablas. obsérvese que cuando están todos los elementos la razón entre cigarrillos negros y rubios es de 0.3. en tanto que el peso muestra un RI muy pequeño. construimos la Tabla 2 Tabla 2. estos RI permiten sustraer del análiis de la dispersión el sesgo introducido por los valores extremos que se evidencian en las tres primeras variables descritas.8160 5.9000 12.9479 7.0963 0. Por la explicación anterior.0175 MONÓXID O 13. los cuales se corrigen con el análisis de la Mediana y su RI.35000 0.5280 4. nicotina y menores valores de monóxido. cambia las proporciones en la muestra entre estos dos tipos de cigarrillo. Para comparar los resultados de la Mediana con la Media. considero que los dos valores outliers. Medidas de tendencia central y de dispersión del estudio de MEDIANA p50 Recorrido (Q3Q1) MEDIA DS EE 5.35420 0.Para el cálculo de la Mediana y el recorrido intercuartil de cada variable se tomaron de la tabla de percentiles los valores p50 para la mediana y la diferencia de los valores p75 y p25 para el recorrido.1753 NICOTINA 0. Alquitrán y Nicotina. sobre la posible asimetría y la existencia. de outliers RESPUESTAS Las distribuciones muestran asimetrías con trayectos mayores desde la mediana a la base (p25) en las variables Monóxido. indicando el mayor grado de dispersión de estas respecto a las demás. y cajas más grandes para el Monóxido y el Alquitrán. Debe escribir. PARTE 3. alquitrán y monóxido. los cuales están asociados a valores mayores de nicotina. o no. al menos. Analice los Box plot (diagramas de caja) que se adjuntan y saque las conclusiones más relevantes. Las asimetrías mantienen la misma .representatividad los cigarrillos negros. tendencia en los bigotes a pesar de excluir los valores outliers. con menor variabilidad (caja pequeña). El peso del cigarrillo muestra una mediana que se acerca a su base. reflejando la influencia descrita del mayor número de cigarrillos rubios en la muestra total. . y la variabilidad de los bigotes es contraria a la observada en las otras variables.