UNIDAD 4 PRUEBAS DE BONDAD DE AJUSTE recortado.pdf

March 28, 2018 | Author: Humberto Moreno' | Category: Sampling (Statistics), Statistics, Hypothesis, Beer, Market (Economics)


Comments



Description

Instituto Tecnológico de León4 PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO PARAMÉTRICAS En la unidad 2 se analizaron datos a escala de intervalo, en la unidad 3 se realizaron pruebas de hipótesis respecto de una sola media de población y dos medias de población. Para estas pruebas supusimos que las poblaciones siguen una distribución de probabilidad normal. Sin embargo hay pruebas en las cuales no es necesaria una suposición respecto a la forma de la población. A estas se les conoce como no paramétricas. Esto significa que no es necesario suponer una población normal. Algunos experimentos generan respuestas que pueden ser ordenadas o clasificadas, pero el valor real de la respuesta no puede ser medido numéricamente excepto con una escala arbitraria que se puede crear. Puede ser que el experimentador diga sólo si una observación es mayor que otra. Quizá pueda clasificar todo un conjunto de observaciones sin saber en realidad los valores numéricos exactos de las mediciones. Por ejemplo:    La experiencia de ventas de cuatro vendedores son clasificadas de la mejor a la peor. Las características de comestible y sabor de cinco marcas de fibra de pasitas son clasificadas en una escala arbitraria de 1 a 5. Cinco diseños de automóvil son clasificados del más atractivo al menos atractivo. ¿Cómo pueden analizarse estos datos? Los métodos de muestra pequeña vistos en la unidad 3 son válidos sólo cuando la(s) población(es) muestreada(s) es (son) normal(es) o aproximadamente normal(es). Los datos formados por rangos de escalas arbitrarias de 1 a 5 no satisfacen la suposición de normalidad. En algunas aplicaciones, las técnicas son válidas si las muestras se toman al azar de entre poblaciones cuyas varianzas son iguales. Cuando los datos no parecen satisfacer éstas y otras suposiciones similares, puede usarse un método alternativo, es decir, métodos estadísticos no paramétricos. Los métodos no paramétricos por lo general satisfacen las hipótesis en términos de distribuciones poblacionales más que parámetros por ejemplo medias y desviaciones estándar. Es frecuente que las suposiciones paramétricas sean sustituidas por suposiciones más generales acerca de las distribuciones poblacionales y las clasificaciones de las observaciones se usen a veces en lugar de las mediciones reales. Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. Lilia Angélica Vázquez Gutiérrez Página 1 En consecuencia. Como su nombre lo indica. Hank Aaron y Johnny Bench. el propósito de la prueba de bondad de ajuste es comparar una distribución observada con una distribución esperada. la “medición” de la tarjeta se basa en el nombre del jugador. Es decir. instalo un puesto y ofreció tarjetas de los siguientes seis jugadores miembros del Salón de la Fama: Tom Seaver. Ella planea iniciar la venta de una serie de tarjetas con fotografías y estadísticas de juego de ex jugadores de las Ligas Mayores de Béisbol. ¿La señora Kilpatrick puede concluir que las ventas no son iguales por cada jugador? Jugador Tom Seaver Nolan ryan Ty Cobb George Brett Hank Aaron Johnny Bench Total Tarjetas vendidas 13 33 14 7 36 17 120 Tabla 4.1. cualquier discrepancia en las frecuencias observada y esperada puede atribuirse al muestreo (casualidad). se esperaría que las frecuencias observadas (fo) fueran iguales. Ningún jugador es mejor que otro.1. Ejemplo 1: La señora Jan Kilpatrick es la gerente de marketing de un fabricante de tarjetas deportivas. Nolan Ryan.Instituto Tecnológico de León 4. La primera situación de esta prueba supone el caso en que las frecuencias esperadas de las celdas son iguales. George Brett. Ty Cobb.1 PRUEBA DE BONDAD DE AJUSTE: frecuencias esperadas iguales. Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. cuando se vende una tarjeta.1 Número de tarjetas vendidas de cada jugador Si no hay una diferencia significativa en la popularidad de los jugadores. ¿Qué sucede con el nivel de medición en este problema? Observe que. se esperaría vender igual número de tarjetas de Tom Seaver que de Nolan Ryan. La prueba de bondad de ajuste es una de las pruebas estadísticas de uso más común. Uno de los problemas es la selección de ex jugadores. o casi iguales. se utiliza una escala nominal para evaluar cada observación. Lilia Angélica Vázquez Gutiérrez Página 2 . No hay un orden natural para los jugadores. El número de tarjetas vendidas de cada jugador aparece en la tabla 4. En una exhibición de tarjetas de béisbol en Southwyck Mall el pasado fin de semana. Al final del día vendió un total de 120 tarjetas. Por lo tanto. Un ejemplo describirá la situación de una prueba de hipótesis. 1 indica que la tarjeta de George Brett no se vende con frecuencia. Paso 1: Formulación de hipótesis. para este problema tomaremos 0. Seleccionamos el nivel de significancia.05.2). cualquier diferencia entre los dos conjuntos de frecuencias se puede atribuir al muestreo (casualidad). Si rechazamos Ho. Estas categorías se denominan celdas. Ho. Paso 2: Seleccionar el nivel de significancia. fe. es decir. ¿Se debe a la casualidad la diferencia en las ventas. es que no hay diferencia entre el conjunto de frecuencias observadas y el conjunto de frecuencias esperadas. H1. El estadístico de prueba sigue la distribución ji cuadrada. Lilia Angélica Vázquez Gutiérrez Página 3 . en tanto que las de Hank Aaron y Nolan Ryan se venden con más frecuencia. Paso 3: Calcular el estadístico de prueba o contraste. fo 13 33 14 7 36 17 120 Número vendido esperado. significa que las ventas no se distribuyen de igual forma entre las seis categorías (celdas). Un análisis del conjunto de frecuencias observadas en la tabla 4. La probabilidad de que rechacemos la hipótesis nula verdadera es 0. la frecuencia esperada. se espera que (f e) sea 20 tarjetas.2 Frecuencias observadas y esperadas de las 120 tarjetas vendidas SOLUCIÓN: Emplearemos el mismo procedimiento sistemático de cinco pasos visto en la unidad 3 de nuestro curso de estadística. es decir. o es posible concluir que hay una preferencia por las tarjetas de ciertos jugadores? Jugador Tom Seaver Nolan ryan Ty Cobb George Brett Hank Aaron Johnny Bench Total Tarjetas vendidas. aparecerá en cada una de las seis categorías (tabla 4. designada como: Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. La hipótesis alternativa.Instituto Tecnológico de León Como hay 120 tarjetas en la muestra.05. fe 20 20 20 20 20 20 120 Tabla 4. La hipótesis nula. es que hay una diferencia entre los conjuntos observado y esperado de frecuencias. En este problema en particular hay seis.05 es de 11.Instituto Tecnológico de León Con k – 1 grados de libertad. el cual se obtiene de las tablas ji cuadrada.45 33 14 7 20 20 20 13 -6 -13 169 36 169 169/20 = 8. La suma de estas diferencias es cero. De las 120 tarjetas vendidas en la muestra. Columna 3: Divida el resultado de cada observación entre la frecuencia esperada. . fe . es una frecuencia observada en una categoría en particular. donde: k es el número de categorías.070. Columna 1: Determine las diferencias entre cada y . Columna 2: Eleve al cuadrado la diferencia entre cada frecuencia observada y esperada.45 36/20 = 1. Los conteos se registran en la tabla 4. y cada uno de los demás jugadores. El valor crítico para cinco grados de libertad y el nivel de significancia 0.45 36 20 16 256 256/20 = 12. Como hay seis categorías.40. sume estos valores. (Observe una vez más que las frecuencias esperadas son las mismas para cada celda). una categoría se denomina celda.40 PASO 4: Formular la regla de decisión. Este número se denomina valor crítico. que es 34.1 Los siguientes son los cálculos para ji cuadrada. vendido fo esperado.45 34. Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. es decir . (1) (2) (3) 13 20 -7 49 49/20 = 2. Lilia Angélica Vázquez Gutiérrez Página 4 . El número de grados de libertad en este tipo de problema se encuentra mediante k – 1. resultado es el valor de Jugador Tom Seaver Nolan ryan Ty Cobb George Brett Hank Aaron Johnny Bench Total Tarjetas Número vendidas.80 169/20 = 8. es una frecuencia esperada en una categoría en particular. Es decir. donde k es el número de categorías.80 17 20 -3 9 120 120 0 9/20 = 0. Recordemos que la regla de decisión en las pruebas de hipótesis debemos determinar un número que separe la región donde no se rechaza la Ho de la región de rechazo. Es decir. se cuenta el número de veces que se vendieron Tom Seaver y Nolan Ryan. Finalmente. hay k – 1 = 6 – 1 = 5 grados de libertad. El . Como ya se mencionó. por lo que hay seis celdas. PRUEBA DE BONDAD DE AJUSTE: frecuencias esperadas desiguales. se concluye que es improbable que las ventas de tarjetas sean las mismas entre los seis jugadores.05. se debe rechazar la hipótesis nula.40 está en la región de rechazo más allá del valor crítico de 11. En la gráfica siguiente se muestra la regla de decisión. Lilia Angélica Vázquez Gutiérrez Página 5 . PASO 5: Tomar una decisión. Por tanto. 50% para la empresa B y 20% para la empresa C. Ejemplo 2: Consideremos un estudio sobre participación en el mercado realizado por la empresa Scott Marketing Research. lo que genera una calculada mayor que 11.05 11. una de Johnny Bench. El razonamiento es que es probable que esas diferencias pequeñas entre las frecuencias observada y esperada se deban a la casualidad. 20 veces de 120 intentos. se esperaba que una fotografía de Tom Seaver se vendiera de manera aleatoria 20 veces. Recuerde que las 120 observaciones son una muestra de la población. La calculada de 34. la regla decisión es rechazar Ho con un nivel de significancia de 0. La diferencia entre las frecuencias observada y esperada no se debe a la casualidad. A lo largo de los años las participaciones en el mercado se han estabilizado en 30% para la empresa A. la nación estadounidense (por ejemplo). Si es menor o igual a 11.Instituto Tecnológico de León La regla de decisión es rechazar Ho si el valor calculado de ji cuadrada es mayor que 11. Por tanto. Las frecuencias esperadas (fe) en la distribución de las tarjetas de béisbol fueron iguales (20).070. las diferencias entre fo y fe son lo bastante grandes para considerarse relevantes. Recién la empresa C ha elaborado un nuevo y mejorado producto para sustituir a uno de sus productos en el mercado Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic.070. De acuerdo con la hipótesis nula. La posibilidad de que estas diferencias se deban a un error de muestreo es muy pequeña. Más bien. etc.070 Valor crítico Escala de La regla de decisión indica que si hay diferencias grandes entre las frecuencias observada y esperada. El siguiente ejemplo ilustra el caso de frecuencias desiguales y también presenta un uso práctico de la prueba de bondad de ajuste ji cuadrada para determinar si una experiencia local difiere de una experiencia más amplia.070. La prueba ji cuadrada también es útil si las frecuencias esperadas no son iguales. no se rechaza H o. No se Rechaza Ho Región de rechazo 0.070. el siguiente paso consiste en calcular las preferencias esperadas en los 200 clientes. Después aplicará una prueba de hipótesis para ver si el nuevo producto modifica las participaciones en el mercado. Consideremos que para este estudio la empresa de investigación de mercado ha empleado un panel de 200 consumidores.Instituto Tecnológico de León y pidió a la empresa Scott Marketing que determinara si el nuevo producto modificaría su participación en el mercado. Las respuestas obtenidas se presentan a continuación en forma resumida: Producto de la empresa A = 48 Producto de la empresa B = 98 Frecuencias observadas (fo) Producto de la empresa C = 54 Ahora se realiza la prueba de bondad de ajuste para determinar si la muestra de las 200 preferencias de los clientes coincide (se ajusta o sea apega) con la hipótesis nula.20 H1: Las proporciones poblacionales NO son PA = 0.50 y PC = 0.30. (En este caso. Por tanto. de ahí surge lo multinomial). es decir cada cliente se clasifica como cliente de alguna de las empresas A. B o C.50 y PC = 0. es decir que son iguales. PB = 0. con el supuesto de que PA = 0. SOLUCIÓN: Scott realizará un estudio muestral y calculará la proporción que prefiere el producto de cada empresa. el de la empresa B o el nuevo producto de la empresa C.30. PB = 0. la población de interés es multinomial. las hipótesis nula y alternativa serían las siguientes: Ho: PA = 0. Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. PB = 0. entonces. A cada individuo se le pide que indique su preferencia entre el producto de la empresa A. Denotamos las proporciones así: PA = participación en el mercado de la empresa A PB = participación en el mercado de la empresa B PC = participación en el mercado de la empresa C Vamos a suponer que el nuevo producto de la empresa C no modifica las participaciones en el mercado. Lilia Angélica Vázquez Gutiérrez Página 6 .30. bajo la suposición de que la hipótesis nula es verdadera.20. Dicha prueba de bondad de ajuste se basa en la comparación de los resultados observados con los resultados esperados.20 Si los resultados muestrales llevan al rechazo de Ho Scott Marketing tendrá evidencias de que la introducción del nuevo producto afecta las participaciones del mercado.50 y PC = 0. 20) = 40 Como podemos observar. Veamos cómo desarrollar la formula anterior del estadístico de prueba: Categoría Empresa A Empresa B Empresa C Proporción Hipotética 0. la prueba de bondad de ajuste siempre es una prueba de una cola. Lilia Angélica Vázquez Gutiérrez Página 7 . la frecuencia esperada de cada categoría se encuentra multiplicando el tamaño de la muestra. por la proporción hipotética de cada categoría. Como ya se mencionó antes.50) = 100 Producto de la empresa C 200(0.90 =7. dicho estadístico se calcula con la siguiente fórmula: Donde: fo = frecuencia observada en la categoría 1 fe = frecuencia esperada en la categoría 1 Nota: el estadístico de prueba tiene una distribución ji cuadrada con k-1 grados de libertad.04 4.Instituto Tecnológico de León FRECUENCIAS ESPERADAS: Producto de la empresa A 200(0. Ahora debemos obtener el valor crítico usando las tablas de distribución .991 Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic.30 0. 200.50 0.05 y que los grados de libertad son K-1 o sea 3-1.34 Como ya sabemos. en la prueba de bondad de ajuste lo que interesa son las diferencias entre frecuencias observadas y esperadas. siempre que en todas las categorías las frecuencias esperadas sean 5 o más.20 Frecuencia Observada (fo) Frecuencia esperada (fe) Diferencia 48 98 54 200 60 100 40 -12 -2 14 (fo-fe) Cuadrado de la diferencia 2 (fo-fe) 144 4 196 Cuadrado de la diferencia dividido entre fe 2 (fo-fe) /fe 2.4 0. Se requiere de un estadístico de prueba o de contraste para poder decir si se rechaza o no la hipótesis nula. el valor de las tablas es:  5. en la que el rechazo se presenta en la cola superior de la distribución ji cuadrada.30) = 60 Producto de la empresa B 200(0. es decir entre lo que se tiene (observado) y lo que se esperaba tener (esperado). así que considerando que tenemos un nivel de significancia de 0. si las preferencias por los distintos tipos de cerveza dependían del género del consumidor. 4. la empresa ajustaría sus promociones a los mercados. Para determinar si la preferencia por un tipo de cerveza (ligera. clara u oscura) era independiente del género del consumidor (hombre o mujer) se usó una prueba de independencia.1. el grupo de investigación de mercado de la empresa se preguntó si las preferencias de los consumidores por estos tipos de cerveza diferían entre hombres y mujeres. Lilia Angélica Vázquez Gutiérrez Página 8 . iniciarían una campaña publicitaria para todas las cervezas de la Cuauhtémoc Moctezuma. la regla de rechazo de la cola superior es: Rechazar Ho si ≥ 5. clara y oscura. Las hipótesis para esta prueba de independencia fueron: Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. por lo que graficamos tanto el valor crítico como el estadístico de contraste quedando de la siguiente manera: Como lo vimos anteriormente.2 PRUEBA DE CONTINGENCIA INDEPENDENCIA Y TABLAS DE Otra aplicación importante de la distribución ji cuadrada es el empleo de datos muestrales para probar la independencia de dos variables.Instituto Tecnológico de León Por medio de la gráfica podemos ver que decisión es la que deberemos tomar respecto de la hipótesis nula. por lo tanto rechazamos Ho. En caso de que las preferencias fueran independientes del género del consumidor. Pero. Al analizar los segmentos de mercado de las tres cervezas. es decir .991 En la gráfica podemos ver claramente que la regla de rechazo se cumple. Esta cervecería produce y distribuye tres tipos de cerveza: ligera. Para ilustrar la prueba de independencia se considera la prueba de independencia realizada por la cervecería Cuauhtémoc Moctezuma de México. Y se concluye que el nuevo producto de la empresa C sí modifica la estructura de la participación de mercado. Suponga que toma una muestra aleatoria simple de 150 consumidores de cerveza. Si determina las frecuencias esperadas bajo la suposición de independencia entre cerveza preferida y género del consumidor. todas las posibles contingencias.2)).1)). a esta prueba también se le suele llamar prueba de tabla de contingencia. etc. 20 hombres prefirieron la cerveza ligera.3 Tabla con frecuencias observadas Los datos para la prueba de independencia se obtienen contando las cantidades o frecuencias correspondientes a cada celda o categoría. se toma una muestra y a cada individuo se le pide que indique cuál de las tres cervezas Cuauhtémoc Moctezuma prefiere. o una mujer que prefiera la cerveza oscura (celda (2. se puede tener un individuo que sea hombre y que prefiera la cerveza clara (celda (1. Lilia Angélica Vázquez Gutiérrez Página 9 . por ejemplo.2) Celda (2. De las 150 personas que formaban la muestra.3) Después de identificar la población como todos los consumidores de cerveza.3)). Cada individuo pertenecerá a una de las seis celdas de la tabla. a la tabla anterior se le llama TABLA DE CONTINGENCIA. 40 hombres prefirieron la cerveza clara. Como en la prueba de independencia se usa el formato de las tablas de contingencia. etc.Instituto Tecnológico de León : La preferencia por un tipo de cerveza es independiente del género del consumidor. Dado que en la tabla se han enumerado todas las posibles combinaciones de cerveza preferida y género o. Así. Los datos de esta tabla son las frecuencias observadas para cada una de las seis clases o categorías. en otras palabras.2) Oscura Celda (1. 20 hombres prefirieron la cerveza oscura. hombres y mujeres. o una mujer que prefiera la cerveza ligera (celda (2. En la siguiente tabla se tabulan las respuestas obtenidas en el estudio: Género Hombre Mujer Total Ligera 20 30 50 Cerveza preferida Clara 40 30 70 Oscura 20 10 30 Total 80 70 150 4.3) Celda (2. se puede Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic.1) Cerveza preferida Clara Celda (1. Cada individuo de la muestra prueba los tres tipos de cerveza y después se le pide que indique cuál prefiere o cuál es su primera elección. : La preferencia por un tipo de cerveza NO es independiente del género del consumidor Para describir la situación a estudio usaremos la siguiente tabla: Género Hombre mujer Ligera Celda (1.1) Celda (2. se supone que la hipótesis nula es verdadera. 70/150 =7/15 prefirieron la cerveza ligera y 30/150 =1/5 prefirió la oscura. En términos de proporciones se concluye que 50/150 = 1/3 de los consumidores prefirió la cerveza ligera. Segundo. es decir.33 50 Cerveza preferida Clara 37.67 prefieran la cerveza ligera. se obtienen las frecuencias esperadas que se muestran a continuación. es decir.Instituto Tecnológico de León emplear la distribución ji cuadrada para establecer si existe diferencia significativa entre las frecuencias observadas y las esperadas. Por consiguiente. se ve que Observe que en esta expresión. Siguiendo el argumento anterior para el cálculo de las frecuencias esperadas. Lilia Angélica Vázquez Gutiérrez Página 10 .67 23. es de esperarse que en la muestra de 80 consumidores del sexo masculino. estas proporciones serán las que se observen tanto entre los hombres como entre las mujeres. ahora se reconsiderará el calculo de la frecuencia esperada correspondiente a los hombres (renglón i=1) que prefieren la cerveza clara (columna j=2).33 prefieran la cerveza clara y (1/5)(80)=16 prefieran la oscura. 80 es el número total de hombres (total del renglón 1). (7/15)(80)=37. Si la suposición de independencia es correcta. bajo la suposición de independencia. que la cerveza preferida es independiente del género del consumidor.33 32. Género Hombre Mujer Total Ligera 26.4 Tabla con frecuencias esperadas Sea la frecuencia esperada en el renglon i columna j de la tabla de contingencia. se observa que en toda la muestra de 150 consumidores de cerveza.67 70 Oscura 16. Las frecuencias esperadas para las celdas de la tabla de contingencia se basan en la idea siguiente: Primero. De lo que se ve que: Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. Aplicando las proporciones correspondientes a los 70 consumidores del sexo femenino.00 14. la frecuencia esperada . 50 prefirieron la cerveza ligera. Mediante dicha notación. 70 es la cantidad total de individuos que prefieren la cerveza clara (total de la columna 2) y 150 es el tamaño total de la muestra.00 30 Total 80 70 150 4. (1/3)(80)=26. 70 la clara y 30 la oscura. El procedimiento de prueba para comparar las frecuencias esperadas con las frecuencias observadas es semejante a los cálculos para la prueba de bondad de ajuste vista al principio de esta unidad. el estadístico de prueba tiene una distribución ji cuadrada con (n-1)(m-1) grados de libertad. La doble sumatoria de la ecuación anterior indica que el cálculo debe hacerse con todas las celdas que aparecen en la tabla de contingencia. como veremos a continuación. Por tanto se puede proceder a calcular el estadístico de prueba ji cuadrada. se encuentra que la frecuencia esperada es . tal como vemos en la tabla de frecuencias esperadas anterior. Nota: Si una tabla de contingencia tiene n renglones y m columnas. Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. se ve que en cada categoría la frecuencia esperada es de 5 o más.Instituto Tecnológico de León La generalización de esta expresión lleva a la fórmula siguiente para obtener las frecuencias esperadas en una tabla de contingencia para una prueba de independencia. Lilia Angélica Vázquez Gutiérrez Página 11 . siempre y cuando en todas las categorías las frecuencias esperadas sean cinco o más. En concreto. FRECUENCIAS ESPERADAS EN UNA TABLA DE CONTINGENCIA BAJO LA SUPOSICIÓN DE INDEPENDENCIA Al aplicar esta fórmula para los consumidores hombres que prefieren cerveza oscura. el valor ji cuadrada que se basa en frecuencias observadas y esperadas se calcula como se indica a continuación: ESTADÍSTICO DE PRUEBA PARA INDEPENDENCIA: Donde: = frecuencia observada en la categoría del renglón i columna j de la tabla de contingencia. = frecuencia esperada en la categoria del renglón i columna j de la tabla de contingencia. basada en la suposición de independencia. En las frecuencias esperadas que aparecen en la tabla de ellas. 67 2. Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. A continuación se resumen los pasos para una prueba de tabla de contingencia para independencia.00 6.00 23.33 32.12.67 14.67 -2.67 0. De manera que la prueba de independencia es también una prueba del extremo superior. El número de grados de libertad para la distribución ji cuadrada adecuada se obtiene multiplicando el número de renglones menos 1 por el número de columnas menos 1.05 y por medio de las tablas de distribución se obtiene el valor crítico.67 -4. Dichas observaciones permiten comprender las diferentes preferencias por cerveza entre los hombres y las mujeres. Debido a que se tienen dos renglones y tres columnas.Instituto Tecnológico de León CÁLCULO DEL ESTADÍSTICO DE PRUEBA JI-CUADRADA PARA DETERMINAR SI LA PREFERENCIA POR UN TIPO DE CERVEZA ES INDEPENDIENTE DEL GÉNERO DEL CONSUMIDOR Cerveza preferida Hombre Hombre Hombre Mujer Mujer Mujer Ligera Clara Oscura Ligera Clara Oscura Total Frecuencia observada Frecuencia esperada 20 40 20 30 30 10 150 26.67 4.44 7.11 16.67 37. Como ocurre en la prueba de bondad de ajuste.00 44.14 6.22 1.00 44. Al observar las tablas de frecuencias observas y esperadas resalta que en los consumidores de sexo masculino las frecuencias observadas en la preferencia por cervezas clara y oscura son más altas que las frecuencias esperadas. los grados de libertad son (2-1)(3-1)=2.11 16.33 16. Considerando un nivel de significancia de 0. el valor del estadístico de prueba es X2= 6. en la prueba de independencia se rechaza Ho si las diferencias entre frecuencias observadas y esperadas dan un valor grande del estadístico de prueba. mientras que en las mujeres la frecuencia observada en la preferencia por cerveza ligera es mayor que en la frecuencia esperada.90 0. contra = 6.12 Como se observa.992. Lilia Angélica Vázquez Gutiérrez Página 12 .00 Diferencia ( ( -6. Mediante una comparación informal de las frecuencias observadas y esperadas se obtiene una idea de la dependencia entre cerveza preferida y género. para este caso en particular se tiene que =5.12 se rechaza la hipótesis nula y se concluye que la preferencia por una cerveza no es independiente del género del consumidor.00 2 X= 1.44 7.19 1 1. no se deberá utilizar ji cuadrada si más de 20% de las celdas f e tiene frecuencias esperadas menores de 5. al dividirlo entre un número muy pequeño. 3. Lilia Angélica Vázquez Gutiérrez Página 13 . Cómo proceder cuando las frecuencias de las celdas son pequeñas: para más de dos celdas. o sea el 43%. Esto sucede debido a que f e aparece en el denominador y. Si en una categoría la frecuencia esperada es menor que cinco. ji cuadrada puede generar una conclusión errónea. LIMITACIONES DE JI CUADRADA Si en una celda existe una frecuencia esperada pequeña inusual. Seleccionar una muestra aleatoria y anotar en cada celda de la tabla de contingencias las frecuencias observadas. 5. El estadístico de prueba para las pruebas ji cuadrada de esta sección requiere una frecuencia esperada de cinco o más en cada categoría. Regla de rechazo: Rechazar Ho si ≥ Donde: α es el nivel de significancia. hace el cociente muy grande. 4. tienen frecuencias esperadas (fe) menores que 5.Instituto Tecnológico de León 1. Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. Consideremos los siguientes datos: Nivel de administración Capataz Supervisor Gerente Gerencia de nivel medio Asistente de vicepresidente Vicepresidente Vicepresidente ejecutivo Total fo 30 110 86 23 5 5 4 263 fe 32 113 87 24 2 4 1 263 Observemos en la tabla anterior que tres de las siete celdas. : La preferencia por un tipo de cerveza NO es independiente del género del consumidor 2. Establecer las hipótesis nula y alternativa: : La preferencia por un tipo de cerveza es independiente del género del consumidor. y los n renglones y las m columnas dan los (n-1)(m-1) grados de libertad. Utilizar la ecuación correspondiente para calcular el estadístico de prueba o contraste. es conveniente combinar dos categorías adyacentes para tener una frecuencia esperada de cinco o más en cada categoría. Emplear la ecuación dada para calcular las frecuencias esperadas de cada celda. Retomando la tabla anterior notemos que más de 98% del valor calculado de ji cuadrada se explica por las tres categorías de vicepresidentes ([4.042 4.592.26 como veremos a continuación.011 0.011 0.042 7.250 9. Lilia Angélica Vázquez Gutiérrez (fo-fe)2/ fe 0.008 Para esta prueba.000 = 7.000 = 14. con un nivel de significancia de 0.080 0.080 0. rechace H o si el valor calculado de ji cuadrada es mayor que 12. se rechaza la hipótesis nula de que las frecuencias observadas representan una muestra aleatoria de la población de los valores esperados. Así tenemos: Nivel de administración Capataz Supervisor Gerente Gerencia de nivel medio Vicepresidente Total fo 30 110 86 23 14 263 fe 32 113 87 24 7 263 El valor calculado de ji cuadrado con las categorías combinadas es 7. Como vemos. pues a estas tres categorías se les dio mucha ponderación.500 0. el resultado sería: Nivel de administración Capataz Supervisor Gerente Gerencia de nivel medio Asistente de vicepresidente Vicepresidente Vicepresidente ejecutivo fo 30 110 86 23 5 5 4 fe 32 113 87 24 2 4 1 (fo-fe) -2 -3 -1 -1 3 1 3 (fo-fe)2 4 9 1 1 9 1 9 (fo-fe)2/ fe 0.500 + 0.250 + 9.258 Página 14 . por tanto.000] / 14. Lo cual es lógico.05.Instituto Tecnológico de León Si realizamos la prueba de bondad de ajuste haciendo caso omiso a que tres celdas son pequeñas. el valor calculado es 14.125 0.9815).008 = 0. Nivel de administración Capataz Supervisor Gerente Gerencia de nivel medio Asistente de vicepresidente fo 30 110 86 23 14 fe 32 113 87 24 7 (fo-fe) -2 -3 -1 -1 (fo-fe)2 4 9 1 1 7 49 Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. El dilema anterior se resuelve al combinar categorías si es lógico hacerlo.01. En el ejemplo anterior combinaremos tres categorías de vicepresidentes. lo que satisface la directriz de 20%.125 0. Por tanto.05. Lilia Angélica Vázquez Gutiérrez Página 15 . la hipótesis nula no se rechaza con el nivel de significancia de 0.05.488 para el nivel de significancia 0. Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic.Instituto Tecnológico de León Este valor es menor que el valor crítico de 9. Esto indica que no hay una diferencia relevante entre la distribución observada y la esperada.
Copyright © 2024 DOKUMEN.SITE Inc.