Practica 6

March 23, 2018 | Author: eloetes2 | Category: Confidence Interval, Spss, Statistics, P Value, Normal Distribution


Comments



Description

Práctica 6.Análisis de dos muestras 1 Práctica 6 ANÁLISIS DE DOS MUESTRAS Objetivos: En esta práctica utilizaremos SPSS para extender el análisis de una sola muestra visto en la Práctica 5 al de dos muestras, realizaremos estimación puntual, cálculo de intervalos de confianza y contrastes de hipótesis acerca de las medias poblacionales. Asimismo se estudia la adecuación de las hipótesis necesarias para la aplicación de la prueba T, planteándose, en su caso, contrastes no paramétricos. Índice: 1. Análisis de dos muestras independientes 1.1 Prueba T 1.2 Prueba Mann-Whitney 2. Análisis de dos muestras emparejadas o relacionadas 2.1 Prueba T 2.2 Prueba de los signos 3. Prueba de Normalidad 4. Ejercicios Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València Análisis de dos muestras 2 1.1. y otra que indica la población o grupo a que pertenece cada individuo. Comprobamos que así aparece en al archivo AMBIENTE en las columnas ph y ozono. A continuación. Prueba T Para poder efectuar la Prueba T para muestras independientes. Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València .Práctica 6. seleccionamos la única variable de agrupación ozono y pulsamos Definir grupos. SPSS necesita una columna en el editor de datos que contenga los valores de la variable cuyas medias en las dos poblaciones se desea comparar. Escribimos un valor para el Grupo 1 y otro para el Grupo 2. 1. Análisis de dos muestras independientes Vamos a considerar la comparación de las medias de dos poblaciones en base a dos muestras independientes procedentes de éstas. abrimos el archivo AMBIENTE y supongamos que queremos establecer si existe diferencia entre los niveles medios del ph en zonas con contenidos de ozono normal y alto. Los casos con otros valores (si existen) quedarán excluidos. En esta ventana debemos especificar los dos valores de la variables de agrupación que definen al grupo ozono normal y ozono alto. A continuación. Por ejemplo. en primer lugar seleccionamos la variable numérica ph y con el puntero la situamos en la ventana de Contrastar variables. eligiendo entre: • Usar valores especificados. seleccionamos Analizar/Comparar medias/Prueba T para muestras independientes y nos aparece la ventana siguiente: En ella. Práctica 6. Tras pulsar el botón Aceptar. podemos encontrar el estadístico del contraste (t). Escribimos un número que divida los valores de la variable de agrupación en dos conjuntos. la diferencia de medias. un intervalo de confianza para la diferencia del nivel dado.553008 4.312356-6. podemos escribir una cadena para el Grupo 1 y otra para el Grupo 2. A continuación.513695 4.002 -. encontramos la Prueba de Levene para la igualdad de varianzas y los resultados de una Prueba T para la igualdad de medias. Todos estos valores aparecen tanto en el caso de asumir varianzas iguales. Estadísticos de grupo PH PH OZONO Normal Normal Alto Alto N 144 144 156 156 MediaDesviación típ.996E-02 -. En los resultados encontramos el valor del estadístico del contraste (F) y el p-valor correspondiente (Sig. el error típico de la diferencia.513695 4. los grados de libertad (gl).191157 6. Los casos con otras cadenas quedarán excluidos del análisis. para cada variable. SPSS muestra en el Visor de resultados. Respecto a la prueba T.959E-02 -3. Una vez completada la ventana y tras pulsar Continuar. la media. Universitat de València . el p-valor bilateral (Sig). Si la variable de agrupación es de cadena corta.60840E-02 5. Todos los códigos menores que el punto de corte forman un grupo y los mayores o iguales que el punto de corte forman el otro grupo. SÍ y NO . cuyo valor por defecto es del 95%. se muestran: el tamaño de la muestra.104 298 .878. bajo el título de Prueba de muestras independientes. como si no se asume.191157 6.312726-6. la desviación típica y el error típico de la media.095291.823729 . por ejemplo. Departament d’Estadística i Investigació Operativa. de la diferencia IC(95%) para la diferencia Inferior Superior PHvarianzas iguales varianzas no iguales 2.014887 .553008 4. bajo el título de Estadísticos de grupo.091 -3.125 Salida del SPSS La Prueba de Levene es un contraste de igualdad de varianzas.177E-02 -.159E-02 -.823729 . de la media 5.05 asumimos la igualdad de varianzas.11285E-02 6. Pulsando el botón Opciones podemos introducir un valor entre 1 y 99 para el coeficiente de confianza de un intervalo.091 > 0.) al ser 0.Error típ.60840E-02 6. volvemos a la ventana de Prueba T para muestras independientes. t gl Sig.002 . Análisis de dos muestras 3 • Punto de corte.014887 . En este procedimiento el contraste que realiza el SPSS es el siguiente: H 0: µ1 = µ 2   HA : µ1 ≠ µ 2  Prácticas de Bioestadística. Diferencia (bilateral) de medias Error típ.11285E-02 Prueba de muestras independientes Prueba de Levene Prueba T para para la igualdad la igualdad de de varianzas medias F Sig. Vamos a realizar la prueba de Mann-Whitney para la variable ph dependiendo del nivel de ozono. además de una pequeña estadística de los rangos. Análisis de dos muestras 4 En nuestro caso µ1 y µ2 representan las medias de ph en las poblaciones donde el ozono es normal y alto.50 PH Prácticas de Bioestadística. Los contrastes direccionales deberán resolverse a partir del p-valor del contraste no direccional anterior. asintót.05 rechazamos H0. en la que se escogen.002 < 0. debemos plantearnos una prueba no paramétrica como Mann-Whitney.Práctica 6. respectivamente. Para obtenerla escogemos Analizar/Pruebas no paramétricas/2 muestras independientes y nos aparece la ventana siguiente. Ejercicio 1 ¿Podemos considerar que los niveles medios de sulfato son iguales en Castellón y Valencia? La Prueba T es válida siempre que los tamaños muestrales sean suficientemente grandes o cuando las muestras provengan de poblaciones con distribuciones normales.2. el valor del estadístico U de contraste (junto al de Wilcoxon y la aproximación Z) y una aproximación del p-valor (Sig.18 19465. Departament d’Estadística i Investigació Operativa. Pulsando el botón Aceptar obtenemos el resultado siguiente donde podemos ver. Prueba de Mann-Whitney Cuando la Prueba T no sea válida. Universitat de València . El Tipo de prueba es U de Mann-Whitney. 1. Puesto que el p-valor bilateral es 0. (bilateral)). como en el caso de la prueba T. la variable a contrastar y la variable de agrupación. En la Sección 3 veremos como comprobar si se satisface esta última condición. Rangos OZONO Normal Rango Suma de N promedio rangos 144 135. y se definen los grupos. (bilateral) a Variable de agrupación: OZONO 9025. 2. a diferencia de las muestras independientes. se necesita una columna en los datos para cada una de las variables a comparar.1. rechazando en ambos casos la hipótesis nula. Al hacer la primera selección en la columna de variables.64 25684.003 Vemos pues que con la prueba de Mann-Whitney la conclusión es la misma que con el test T.5191 . por ejemplo. Análisis de dos muestras emparejadas o relacionadas Ahora consideraremos la comparación de las medias de dos poblaciones en base a dos muestras emparejadas o relacionadas.00 Estadísticos de contraste PH U de Mann-Whitney W de Wilcoxon Z Sig. aquí cada caso representa a un mismo sujeto. típica Mínimo 5. por lo que se toman los niveles de glucosa antes (g1antes) y después (g1des) de tomar el jarabe. los datos del archivo GLUCOSA y supongamos que queremos establecer la influencia de la toma de un jarabe en el nivel de glucosa en sangre.00 1.540562 4.925300 6.7629 1 25 5.939 .271300 1. Prueba T Para efectuar la Prueba T para muestras emparejadas.923131 .50 0 Máximo 7. asintót. Universitat de València .576150 .50 Alto Total Estadísticos descriptivos N 300 300 156 300 PH OZONO Media Desv. esta aparece en el recuadro selecciones actuales como variable 1. Departament d’Estadística i Investigació Operativa.00 Percentiles 50 (Mediana) 75 5.500 -2.52 .500 19465. Consideremos. En ese Prácticas de Bioestadística. 2. Análisis de dos muestras 5 164. Si seleccionamos Analizar/Comparar medias/Prueba T para muestras relacionadas nos aparece la ventana: En ella seleccionamos las dos variables en cuya diferencia estamos interesados.Práctica 6. y al realizar la segunda selección aparecerá como variable 2. antes y Glucosa en sangre (mg/dl).3088 11. un intervalo de confianza y un contraste para la diferencia de las medias. Tiempo 1.2750 80 Correlaciones de muestras relacionadas N Par 1 Glucosa en sangre (mg/dl).0569 27. de la media Par 1 -23.3750 Glucosa en sangre (mg/dl).0251 3. desviación típica y error típico de la media de cada una de las dos variables.2644 1. Análisis de dos muestras 6 momento. La Prueba T es válida siempre que los tamaños muestrales sean suficientemente grandes o la diferencia de las muestras tenga una distribución normal. después Prueba de muestras relacionadas t Diferencias relacionadas Media Desviación típ.152 Sig. desviación típica y error típico de la media para la diferencia de las dos muestras. Universitat de València . Finalmente. tamaño muestral común.Glucosa en sangre (mg/dl). Tiempo 1. después 27.9000 80 73.2750 80 97.551 79 gl Sig. .000 se concluye que hay diferencia significativa entre ambas muestras. la media. encontramos los resultados de la prueba T de muestras relacionadas: media. (bilateral) 80 Correlación . después Glucosa en sangre (mg/dl).2644 3. Error típ. antes Glucosa en sangre (mg/dl).000 En el Visor de resultados podemos encontrar bajo el título de Estadísticos de muestras relacionadas. ya seleccionadas las dos es cuando las podemos introducir en la columna variables relacionadas y a continuación para ejecutar el procedimiento pulsamos Aceptar. de la media 1. Tiempo 1.0251 73. Tiempo 1. Tiempo 1.2130 -7.9000 80 97.0569 Error típ. después N Desviación típ. Tiempo 1. En la Sección 3 veremos como comprobar si se satisface esta última condición. Tiempo 1. antes Glucosa en sangre (mg/dl).Práctica 6.6897 3.177 . 11.5370 -17.3088 27. Departament d’Estadística i Investigació Operativa. Puesto que la significación o P-valor es 0. Prácticas de Bioestadística. antes . Estadísticos de muestras relacionadas Media Par 1 Par 1 Glucosa en sangre (mg/dl). Tiempo 1.0958 95% Intervalo de confianza para la diferencia Inferior Superior -29. A continuación vemos la correlación existente entre la pareja de variables escogida. Ejercicio 2 ¿ Son iguales los niveles medios de glucosa medidos por g2antes y g2des ?. En la ventana que aparece seleccionamos las dos variables a contrastar. Universitat de València . el valor del estadístico Z de contraste y una aproximación del p-valor ( Sig. En el Visor de resultados podemos ver además de una pequeña estadística con las diferencias positivas. (blilateral) ). el número de diferencias positivas y negativas no difiere de forma significativa. nos plantearíamos una prueba no paramétrica como la prueba de los signos.2. Análisis de dos muestras 7 2. siguiendo un proceso similar al expuesto para la prueba T. asintót. Si las dos variables tienen una distribución similar.Práctica 6. Prácticas de Bioestadística. Para obtenerla elegimos Analizar/Pruebas no paramétricas/2 muestras relacionadas. A continuación. seleccionamos como Tipo de prueba Signos. Departament d’Estadística i Investigació Operativa. Prueba de los signos Si la Prueba T pudiera no ser válida. negativas y empates. Esta prueba contrasta si las dos poblaciones tienen una distribución similar. Análisis de dos muestras 8 3. Para obtener una prueba de normalidad de los datos. Para dos muestras emparejadas hay que construir una nueva variable que contenga las diferencias de las dos originales en la ventana Dependientes. Pruebas de normalidad Como ya vimos en la Práctica 5 una de las hipótesis que deben comprobarse para la validez de las Pruebas T. debemos pulsar el botón Gráficos y en la nueva ventana escoger la opción de Prácticas de Bioestadística. En estos gráficos.Práctica 6. seleccionamos el menú Analizar/Estadísticos descriptivos/Explorar. A continuación. diagramas de cajas o gráficos Q-Q. situamos la variable a contrastar en la ventana Dependientes. es la de normalidad de los datos cuando el tamaño de las muestras es pequeño. y dejamos Factores en blanco. La condición de normalidad puede comprobarse con la prueba de Kolmogorov-Smirnov y mediante el dibujo de histogramas. Aparece la ventana siguiente: En el caso de dos muestras independientes. la distribución de los datos debe ser aproximadamente simétrica y sin valores atípicos. Universitat de València . Departament d’Estadística i Investigació Operativa. y la variable que forma los grupos en la de Factores. tanto en el análisis de uno o dos muestras. 50 6. 0 0 5. 00 7. 38 7.5 7.200 . 88 6.035 144 PH Normal .0 7. 75 5. 3 6 6.0 6.5 5. típ. 3 6 5. 88 4.5 8.086 156 * Este es un límite inferior de la significación verdadera.5 6. Pruebas de normalidad Kolmogorov-Smirnov OZONO Estadístico gl OZONO Estadístico gl PH Normal . a Corrección de la significación de Lilliefors Sig. = . 13 6. 13 7.0 4.035 144 Alto .5 5.0 7. 5 7 6.Práctica 6.0 6. Universitat de València .0 Valor observado Valor observado Prácticas de Bioestadística.5 7. 75 4. Sig. 88 5. Observar la asimetría a la derecha que presenta el histograma para nivel de ozono alto.0 5. 13 5. PH PH Observamos que el resultado del test Kolmogorov-Smirnov es aceptar la normalidad de la variable ph si ozono es normal su P-valor es 0.006 Histograma Para OZONO= Normal 16 14 12 10 8 6 20 30 Histograma Para OZONO= Alto 10 Frecuencia 4 Desv. 25 5.55 2 0 Media = 5. típ. 38 5. = . su P-valor es 0.00 25 7. Por ejemplo podemos estudiar la normalidad de la variable ph separada según los dos niveles de ozono. 00 6. Análisis de dos muestras 9 Histograma y activar la opción de Gráficos con pruebas de normalidad. 50 4.51 Media = 6.006. 38 6. En el Visor de resultados encontramos. 50 5. 25 6.2. la prueba de Kolmogorov-Smirnov con corrección de Lilliefors para contrastar la normalidad de la distribución (hipótesis nula) y el (los) histograma(s). Departament d’Estadística i Investigació Operativa. .200 . junto con los algunos estadísticos de la(s) variable(s) a estudiar.5 -2 -3 4.0 5.00 63 7. también observada en el siguiente gráfico Q-Q Gráfico Q-Q normal de PH Para OZONO= Normal 3 Gráfico Q-Q normal de PH Para OZONO= Alto 3 2 2 1 1 0 0 Normal esperado -1 Normal esperado -1 -2 -3 4.086 156 Alto .82 N = 144. mientras que habría que rechazarla si ozono es alto. Frecuencia Desv.5 6.01 0 N = 156.006 . los diagramas de caja siguientes. Análisis de dos muestras 10 Finalmente. Ejercicios Resolver los problemas que se plantean a continuación aplicando en cada caso el procedimiento más adecuado.Práctica 6. se cultivaron dos variedades diferentes durante 16 días en una estación espacial. Ejercicio 1. ii) Intervalos de confianza al 80% y al 95% para la diferencia de las medias (método agrupado y método no agrupado) en el caso de independencia o para la media de la diferencia en caso de emparejamiento. Obtener para todos los problemas i) Estimadores puntuales de la media y la desviación típicas de las poblaciones. dependiendo de si las muestras son independientes o emparejadas y de la adecuación de las hipótesis necesarias para la aplicación de un contraste paramétrico o no paramétrico. 4. dado que los tamaños muestrales son grandes (144 casos con ozono Normal y 156 con ozono Alto). Universitat de València . muestran las mismas características 8 222 45 191 209 7 6 5 PH 4 N= 144 156 Normal Alto OZONO En cualquier caso. iii) Plantear contrastes de hipótesis análogos a los de ii) y comprobar que conducen a los mismos resultados. es válido utilizar la prueba T. Departament d’Estadística i Investigació Operativa. (Fichero: Ensalada) En un estudio del crecimiento de la lechuga. El objetivo de este experimento era comprobar si Prácticas de Bioestadística. iv) Realizar contrastes direccionales cuando se considere necesario. Ejercicio 3 Realizar el estudio de normalidad de la variable sulfato para las dos poblaciones que define la variable ozono. 3. 3. 5.30.8.17.55. 3. 7.Práctica 6. una escasez de plata en Estados Unidos. Las dos variedades estudiadas fueron Ensalada y Bibbs y los datos fueron los siguientes: Variedad Ensalada: Variedad Bibbs: 3. 1. 5. Análisis de dos muestras 11 ambas tenían el mismo proceso de crecimiento.60. Primer 5.72. Históricamente.2. 3. los dos estaban hipnotizados. se pidió a 15 estudiantes que trataran de adivinar la forma de 200 cartas de Zener.8 Ejercicio 3. Se utilizó la misma persona como canal -esto es.77. 5. Universitat de València .para cada intento. 6.53 Ejercicio 2. Los resultados se midieron según el peso total en seco de las lechugas. 5. Los datos corresponden a los contenidos de plata de nueve monedas pertenecientes a la primera acuñación durante el reinado de Manuel I y de siete del cuarto acuñamiento. Pesando el precipitado. Departament d’Estadística i Investigació Operativa. 6. Prácticas de Bioestadística.5. Esta solución es tratada con cloruro sódico hasta que todo el cloruro de plata se precipita. 7. El análisis consiste en introducir la moneda en una solución con un 50% de ácido nítrico.06.20. (Fichero: Monedas) En 1965. La manera más obvia de comprobarlo es comparar las habilidades extrasensoriales de los sujetos cuando están despiertos y cuando están hipnotizados. (Fichero: Hipnosis) La investigación en percepción extrasensorial (ESP) ha tomado diferentes direcciones a lo largo del tiempo. llevó al Congreso a autorizar la acuñación de monedas de 10 y 25 centavos con una cantidad menor de plata. 1.4. es posible calcular el porcentaje de plata de la moneda. Para 100 de los intentos.3.6. 2. 6. las fluctuaciones en la cantidad de metales preciosos utilizados en las monedas son bastante frecuentes.2 Cuarto 5.9. También se recomendó que el contenido de plata de las monedas de medio dólar se redujera del 90% al 40%.62 1. 2. ambos (estudiante y canal) estaban despiertos y para los otros 100. 3. 2.2.6.81. Las monedas analizadas son parte de un gran descubrimiento en Chipre. Los experimentos de ESP habitualmente se realizan con cartas de Zener.52.0. 7.31. Estas cartas especiales tienen solo cinco figuras.1. El objetivo de este problema es comprobar si la proporción en el contenido de plata de una moneda bizantina era la misma en las dos acuñaciones. Los datos de este ejemplo comparan los contenidos de plata de una moneda Bizantina del siglo doce en dos diferentes momentos durante el reinado de Manuel I (1143-1180). 6.9.78. 1. 6. El objetivo del siguiente experimento es determinar si la habilidad de una persona para acertar cartas aumenta bajo hipnosis.8. 1. Recientemente. se ha considerado la posibilidad de que la hipnosis puede facilitar la aparición de la ESP en personas que creían no tenerla. 5.87. 1. la persona que se concentra en la carta. Los resultados del experimento vienen dados en forma del número de aciertos hecho por cada sujeto bajo ambas condiciones. En este estudio.7. 6. 4. se estudió cual era el impacto ecológico de la infección por el parásito de malaria Plasmodium . 5.5. 37.9. se investigó la respuesta de 15 lagartos infectados y 15 no infectados a una prueba de resistencia. corre más riesgo que otro que se mueva más lentamente.7. 4.1. (Fichero: Notas) En el siguiente banco de datos. 15. Otro factor. 5.2.5. 9. 7. 7. El aumento de temperatura hace más agresivas a las abejas. 8. 20.1.5.3 No infect: 22.4.0.5.1. 2. El objetivo de este problema está en investigar si hay evidencia para afirmar si las notas medias son distintas. 21.2.8. 7. Análisis de dos muestras 12 Despiertos: Hipnotizados: 18. 19. 5.5.4. 30.0.0.8 Ejercicio 6. 9.0. 27.1. 16. Cuatro de ellas. 6.0. 26.4. 7. 9. 6. 4. 6.0. 4.3. 6. 6. 28. 5. 4.2. 4.6. 9. 19. 26. 33 Sin picaduras previas: 33.9. 2. 20. 19.2. 22.8 Prácticas de Bioestadística.8.9. 4. 24.8.9. 16. 6. 7. 24. 11. 8.8. 29. 3. 37. 22. 4.2. 45.1. 8. 16.0. 27.7. 9.2. 7. 28. 7. 6. 2.0.6.8.0.7. 7.3. 5. 4.0. 8. Después de un tiempo prefijado de antemano.2.7.5. 16. 8.4.7. 29. 20. 1er parcial: 7. 30.0. Una persona que vista ropa oscura.1. 8. 4. El objetivo era comprobar si las abejas tenían preferencia por picar objetos que ya han sido picados. 4.5.1. 6.5. 4. 4. 8. 8. 33. 20.4.4 2º parcial: 6. 32.6. 5. Con picaduras previas: 70.6. 6.5.0. 29.8. 37.1. muy importante para los apicultores es si la persona acaba de ser picada por otra abeja. 15. 7.6.0. 18. 26.1. (Fichero: Lagarto) En un estudio sobre el lagarto Sceloropis occidentalis . 20. 1. 33.7. 8.5.1. 7. 7.9. 6.1. 3.8. Y alguien cuyos movimientos sean rápidos y bruscos.3. 15 25. 9.2. 21.8. 23. 5.5.3. 23.3.4.5. 6. 9. 7. 45. 27. 21. 5. 24. 8. 8. 7. 32. 5. 34.1. Los resultados vienen dados por la distancia (en metros) que cada animal recorría en dos minutos.7 28. 34.0. 4. Universitat de València . 36. Este último factor ha sido estudiado en el siguiente experimento. 42. 4. 27.5. Para ello.8. 5.8.7.2. 7.1.9. 5.8. 14. 21 Ejercicio 4. 21. 7. 3.0.0. 20.2.2. 5. 4. 16. Para realizarlo. 2.5. 8.9.5.5.0. 4. (Fichero: Abejas) Hay muchos factores que predisponen a una abeja a picar.6. Número de picaduras nuevas en cada grupo de 4 bolitas. 18.6. 9 Ejercicio 5. 4.4.7.3.0.6.0. 20. 5. 5.5. 6.8. por ejemplo.6. por orden de lista. se presentan las notas del primer y segundo parcial de un grupo de 47 estudiantes de Bioestadística.6.1. 4.1. El proceso se repitió nueve veces en distintos momentos del día. 9. 4. 9. 27. 14.5.3. Infectados: 16. 10. en lagartos que no estaban en cautividad. es más probable que sea picada por una abeja que otra que lleve ropa más clara. 4. 1. Departament d’Estadística i Investigació Operativa. 19. se contó el número de nuevas picaduras en cada grupo de cuatro bolitas.Práctica 6.1. 6. se agitaron ocho bolitas de algodón envueltas en muselina alrededor de la entrada a un panal. 6. 18. habían sido expuestas previamente a otro enjambre de abejas furiosas y hambrientas y estaban totalmente llenas de picaduras: las otras cuatro estaban totalmente sin picaduras.2. 6. 3.7.1.
Copyright © 2024 DOKUMEN.SITE Inc.