Módulo: II Unidad: II Semana: 04ESTADÍSTICA II Lic. Segundo A. García Flores TÍTULO DEL TEMA PRUEBA NO PARAMÉTRICAS ORIENTACIONES • Lea las previamente las orientaciones generales del curso. • Revise los temas afines a este en la Biblioteca Virtual de la UAP • Participe de los foros CONTENIDOS TEMÁTICOS Chi cuadrado Característica de la chi cuadrado Prueba de Hipótesis con Chi cuadrado . SUBTÍTULOS DEL TEMA .DESARROLLO DE CONTENIDOS . CHI CUADRADO ¿Cuándo usar esta distribución? Esta es una distribución de muestreo asociada a la probabilidad de la varianza (²). Fórmulas Función densidad v x 1 1 f ( x) x 2 e 2 v v 2 2 2 F ( x) f ( x) dx Forma de la curva de esta distribución Está tabulada según v . Por medio de ella se determina la probabilidad de ocurrencia de un valor específico de varianza con v=n-1 grados de libertad en una muestra de tamaño n. Determinar los grados de libertad (v) tal que v=n-1. Calcular el valor de S 2 v 2 2 . CHI CUADRADO ¿Cómo usar las tablas? La tabla da valores de probabilidad acumulados de derecha a izquierda. Para extraer valores de probabilidad de esta tabla se sigue el siguiente procedimiento: Estimar el valor de la verdadera desviación estándar. 975. Por ejemplo. el valor de la probabilidad mayor a el es 0.48 con 4 grados de libertad. tal y como se muestra a continuación. puede ser necesario interpolar para encontrar el valor exacto buscado. pues se localiza en la dirección vertical en la parte superior. de lo contrario. si ² = 0. . se escoge el que más se aproxime. En algunos casos. CHI CUADRADO ¿Cómo usar las tablas? Localizar en tablas el valor de la probabilidad asociada a los valores de ² y de v. CHI CUADRADO ¿Cómo usar las tablas? Nota: Si v. el valor chicuadrado que deja α del área en el extremo. el número de grados de libertad. . por 3 2 2 v 1 Z 2 9v 9v en la que Zα es el valor estándar normal que deja α del área en el extremo izquierdo. es mayor que 30. ². 29 38.85.05 0.89 1 P 38.89 P 17.9 P 38.05 0.89 1 0.9 0. CHI CUADRADO ¿Cómo usar las tablas? v 26 P 2 17.29 P 38.29 0. .89 2 2 2 0.95 2 2 P 17. Tabla CHI CUADRADO . 1 0. 2 2 14 * 1.83 g2. ¿cuál es la probabilidad de tener una varianza: a) superior a 1.249 g2 es 0.1.249 g2? 2 S 2 b) inferior a 0. CHI CUADRADO Ejemplo Una máquina llenadora ha ejecutado su operación con una varianza de 0.249 P ( 1.067 0.249) P P 2 21. Si se toma una muestra de 15 unidades.83 .3896 g ? v 2 2 Solución: a) La probabilidad de tener una varianza superior a 1. 3896 P ( 0.83 .3896 g2 es 0. 2 14 * 0.05.95 0.05 2 0.57 1 0.3896) P 2 P 6. CHI CUADRADO Solución: b) La probabilidad de tener una varianza inferior a 0. o cuando su distribución es no normal. pobl. típicamente cuando no Normales. y tests sobre la conocemos la distribución de media o la desv. se aplican población (por ejemplo. la población. . típica). Test de hipótesis No Paramétricos: no se Paramétricos: hipótesis sobre refieren a parámetros de la los parámetros que definen la población. pueden analizar datos nominales u ordinales. éstos deben ser resumidos a categorías discretas (a unas cuantas). ¿CUÁLES SON LAS SUPOSICIONES DE LA ESTADÍSTICA NO PARAMÉTRICA? Para realizar análisis no paramétricos. 15 . • Las variables no necesariamente deben estar medidas en un nivel por intervalo o de razón. debe partirse de las siguientes consideraciones: • La mayoría de estos análisis no requieren de supuestos acerca de la forma de la distribución poblacional. • Si se quieren aplicar análisis no paramétrica a datos por intervalos o razón. Las variables deben ser categorías. Aceptan distribuciones no normales. 4) Prueba de U de Mann Whitney 5) Pruebas W de Wilcoxon 16 . 2) Los coeficientes de correlación e independencia para tabulaciones cruzadas. 3) Los coeficientes de correlación por rangos ordenados de Spearman y Kendall. ¿CUÁLES SON LOS MÉTODOS O PRUEBAS ESTADÍSTICAS NO PARAMÉTRICAS MÁS UTILIZADAS? Las Pruebas no paramétricas más utilizadas son: 1) La Chi-cuadrada o Ji-Cuadrada o X2. Las fórmulas son: Total de Fila x Total de Columna F. El valor mínimo es 0.1). Esperada= 17 Total General . Todas las curvas son asimétricas 4. 3. Se utiliza para variables medidas en escala nominal u ordinal.L = (Nº de filas . La Distribución X2 se lee con grados de libertad G.1)(Nº de columnas . 6. Distribución Ji-Cuadrada o Chi-cuadrada o X2 Características: 1. No tiene valores negativos. 2. Cuando aumentan los grados de libertad las curvas son menos elevadas y más extendidas a la derecha. 5. Distribución Ji-Cuadrada o Chi-cuadrada o X2 . 19 . deberemos categorizar los datos asignado sus valores a diferentes clases o grupos. sea cual sea la variable de estudio. En este caso es necesario que los valores de la variable en la muestra y sobre la cual queremos realizar la inferencia este dividida en clases de ocurrencia.La prueba de bondad de ajuste Consiste en determinar si los datos de cierta muestra corresponden a cierta distribución poblacional. o equivalentemente. Distribución Ji-Cuadrada o Chi-cuadrada o X2 1. ¿estas tres muestras de estudiantes provienen de poblaciones con igual distribución de aprobados?. . por ejemplo. La prueba de Homogeneidad Consiste en comprobar si varias muestras de un carácter cualitativo proceden de la misma población. Distribución Ji-Cuadrada o Chi-cuadrada o X2 2. Es necesario que las dos variables medibles estén representadas mediante categorías con las cuales construiremos una tabla de contingencia. La prueba de Independencia Consistente en comprobar si dos características cualitativas están relacionadas entre si. Distribución Ji-Cuadrada o Chi-cuadrada o X2 3. deseamos estudiar si existen diferencias en las dos poblaciones respecto a la variable de estudio. . operativamente proporciona los mismos resultados. Aunque conceptualmente difiere del anterior. Este tipo de contrastes se aplica cuando deseamos comparar una variable en dos situaciones o poblaciones diferentes. es decir. por ejemplo: ¿el color de ojos esta relacionado con el color de los cabellos?. Distribución Ji-Cuadrada o Chi-cuadrada o X2 La pregunta es: ¿Existe o no relación entre las variables X e Y? es decir: Si X e Y son o no independientes La formulación de hipótesis: Ho: Las variables X e Y son independientes. ( X e Y no están relacionados) H1: Las variables X e Y no son independientes. ( X e Y están relacionados) 22 . Variable. Tabla de contingencia Ejemplo 1. La tabla de contingencia o tabulación cruzada es: CANDIDATO “A” “B” Masculino 20 30 SEXO Femenino 40 25 23 . categoría Sean las variables SEXO (Masculino y Femenino) y CANDIDATO (“A” y “B”). Tabla de contingencia Ejemplo 2. Variable. categoría La tabla siguiente clasifica a un grupo de personas según su opinión sobre un documental televisivo y el nivel de estudios: 24 . En este estudio se seleccionaron al azar 225 personas de ambos sexos. no tiene nada que ver con el sexo de la radio audiencia? . a quienes se les pregunto por la radio que mas frecuentemente sintonizaban de Lunes a Viernes en el horario de las 8 pm. Tabla de contingencia Ejemplo 3. a pedido del diario “Ultima Hora”. OPINION_PERU. Los resultados de este estudio se muestran en la siguiente tabla: Radioemisora A B C D Otros Total Masculino 32 5 42 27 8 114 Sexo Femenino 30 25 28 18 10 111 Total 62 30 70 45 18 225 ¿podría decirse que la preferencia por una radioemisora en el horario de las 8 pm. ha realizado un estudio de medición de la radio audiencia en el horario de las 8 pm. NIVEL DE EDUCACIÓN categorías: Primaria. Actitudinal. Secundaria. Tabla de contingencia Ejemplo 4. Se estudia a 1040 estudiantes de los niveles de educación primaria y secundaria y a los cuales se aplica un instrumento que mide el aprendizaje de la matemática. NIVEL DE EDUCACIÓN Primaria Secundaria Conceptual 180 100 APRENDIZAJE 190 280 Procedimental Actitudinal 170 120 . en las dimensiones de aprendizaje conceptual. Procedimental. procedimental y actitudinal. Variables: APRENDIZAJE categorías: Conceptual. Tabla de frecuencias observadas (O): NIVEL DE EDUCACIÓN TOTAL Primaria Secundaria Conceptual 180 100 280 APRENDIZAJE Procedimental 190 280 470 Actitudinal 170 120 290 TOTAL 540 500 1040 . Prueba Chi cuadrado Hipótesis: H0: El aprendizaje y los niveles de educación son independientes H1: El aprendizaje y niveles de educación no son independientes. se calcula mediante la siguiente fórmula aplicada a la tabla de frecuencias observadas: N = número total de frecuencias observadas. E = (marginal del reglón)*(marginal de columna) / N. NIVEL DE EDUCACIÓN Marginal de filas Primaria Secundaria Conceptual (280)*(540)/1040 (280)*(500)/1040 280 APRENDIZAJE Procedimental (470)*(540)/1040 (470)*( 500)/1040 470 Actitudinal (290)*(540)/1040 (290)*(500)/1040 290 marginal de columnas 540 500 1040 . Prueba Chi cuadrado Tabla de frecuencias esperadas (E): La frecuencia esperada de cada celda. 4 290 Actitudinal TOTAL 540 500 1040 Donde: O: frecuencia observada en cada celda E: frecuencia esperada en cada celda 29 .6 120 139.0 280 226.4 100 134. Prueba Chi cuadrado Frecuencias O y E en una sola tabla: NIVEL DE EDUCACIÓN TOTAL Primaria Secundaria O E O E Conceptual 180 145.6 280 APRENDIZAJE 190 244.0 470 Procedimental 170 150. 16 8.36 2.1)(Nº de columnas .4 2959. = (3-1)*(2-1) = 2. entonces g.11 Actitudinal / Primaria 170 150.4 34. Prueba Chi cuadrado O E 2 X 2 E Celda O E O-E (O . = (Nº de filas .33 Para saber si el valor de X2 es o no significativo.l.4 -54.6 -34. .80 Actitudinal / Secundaria 120 139. Nº de filas = 3 y Nº de columnas = 2.00 12.4 -19.36 12.E)2 (O .23 Procedimental/ Primaria 190 244.l.4 376.16 8. Así.6 1197.4 376.0 54.70 X2 = Ʃ 47.6 1197.6 19.69 Procedimental /Secundaria 280 226.36 2.E)2 / E Conceptual/Primaria 180 145. debemos calcular los grados de libertad: g.0 2916.50 Conceptual / Secundaria 100 134.1). decimos que las variables están relacionadas o no son independientes. Si el valor obtenido de X2 es igual o superior al valor de la “tabla”. Aplicación en este caso: Para el nivel de significancia de = 0. acudimos a la “tabla de distribución de Chi-cuadrado”.05 y g.9915 (ver tabla): X2Crítico = 5.l. = 2. Prueba Chi cuadrado Luego. el X2 de tabla es 5.9915 X2Obtenido = 47.33 31 .05). eligiendo nuestro nivel de significancia ( = 0. 32 . 33.9915 (tabla Chi) Para el ejemplo: X 2obtenido = 47.05 = 5% g. Resumen de la Prueba de hipótesis: H0: No existe relación entre el aprendizaje y los niveles de educación. (VARIABLES INDEPENDIENTES) H1: Existe relación entre el aprendizaje y niveles de educación. Entonces se rechaza la hipótesis nula (H0). es decir existe una relación entre Aprendizaje y los niveles educativos. = (Nº de filas-1) x (Nº de columnas-1) g.l. y por lo tanto se acepta la hipótesis alterna (H1).l. (VARIABLES RELACIONADAS) = 0. .= (3-1)(2-1) = 2 X 2crítico = 5. X2obtenido X2crítico entonces variables no son independientes. ¿Cuál es la hipótesis nula? b). durante los últimos años. 8% irlandeses. con los resultados que se presentan en la siguiente tabla: Países Noruegos Suecos Irlandeses Alemanes Italianos frecuencia 399 193 63 82 13 a). ¿Cuál es la conclusión?. Un politólogo cree que. 5% alemanes y 2% italianos. Las cifras más actuales (reunidas hace unos cuántos años) muestran que los habitantes de dicha ciudad presentan la siguiente composición étnica: 53% noruegos. la composición étnica de la ciudad donde vive ha cambiado. Ejercicios propuestos 1. 34 . ¿Cuál es la hipótesis alterna? c). este científico social obtiene una muestra aleatoria de 750 habitantes. Para verificar esta idea.05. 32% suecos. Utilice = 0. 35 . 200 de ciencias. y 100 de bellas artes.0 4.0 y 10% son a probados-reprobado. ¿Cuál es la hipótesis Ciencias 24 118 58 alterna? Ingeniería 20 112 68 c). (2) todas las calificaciones están en el sistema 4.05. Se pregunta a cada alumno cuál de los tres calificaciones prefieren. Se realiza una encuesta para determinar si existe una relación entre el área de interés de cada alumno y su presencia para algún sistema de calificación. ¿Cuál es la hipótesis Aprobado-reprobado 4. Se elige una muestra aleatoria de 200 estudiantes del área ingeniería. Ejercicios propuestos 2.0 y aprobado-reprobado nula? Bellas artes 26 55 19 b).0 y (3) 90% de las calificaciones están en el sistema 4. ¿Cuál es la conclusión?. Una universidad está pensando en implantar uno de los tres sistemas de calificaciones siguientes: (1) todas las calificaciones son aprobados- reprobado. Los resultados aparecen en la siguiente tabla: Sistema de calificación a). Utilice = 0. Un economista del gobierno. el número de individuos en la muestra que están a favor o contra de los controles. ¿Cuál es la hipótesis nula? b). ¿Cuál es la conclusión?. ¿Cuál es la hipótesis alterna? c). 36 . Los datos muestran. interesado en determinar si existe una relación entre el empleo y la actitud hacia este control. reúne los siguientes datos. Utilice = 0. Ejercicios propuestos 3. Actitud hacia el control de precios y salarios A favor En contra Obreros 90 60 Empresarios 100 150 Profesionales 110 90 a). para cada tipo de empleo. el gobierno está considerando la imposición de un control de precios y salarios. Debido a la inflación galopante.05. GRACIAS Parte del material es Cortesia: DR. . JORGE ACUÑA A.