Pruebas de Hipostesis Proporciones y Chi Cuadarada



Comments



Description

PRUEBAS DE HIPÓTESIS DE PROPORCIONES Y CHI CUADRADA(VARIABLES NO-MÉTRICAS) Como investigadores en muchas ocasiones estamos interesados en un fenómeno cuyo comportamiento es expresado en porcentajes. Por ejemplo, podemos estar interesados en probar si la proporción de potenciales electores que planean votar por el candidato del PRI es estadísticamente distinta de la proporción que declaró preferir el candidato del PAN. I. Prueba de Hipótesis de Proporciones para una Sola Muestra. Una encuesta realizada por Bancomer a 35 clientes indicó que un poco más del 74 por ciento tenían un ingreso familiar de más de $200,000 al año. Si esto es cierto, el banco desarrollará un paquete especial de servicios para este grupo. La administración quiere determinar si el porcentaje verdadero es mayor del 60 por ciento antes de desarrollar e introducir este nuevo paquete de servicios. Los resultados mostraron que 74.29 por ciento de los clientes encuestados reportaron ingresos de $200,000 o más al año. El procedimiento para la prueba de hipótesis de proporciones es el siguiente: 1. Especifica la hipótesis nula y alternativa. Hipótesis Nula: H 0 = P ≤ .60 Hipótesis Alternativa: H a = P > .60 , donde P = la proporción de clientes con ingresos familiares anuales de $200,000 o más. 2. Específica el nivel de significación, α , permitido. Para una α = .05 , el valor de tabla de Z para una prueba de una sola cola es igual a 1.64. 3. Calcula el error estándar de la proporción específicada en la hipótesis nula. 95) que más de un 60 por ciento de sus clientes tienen ingresos familiares de $200.0828 5. El banco puede concluir con un 95 por ciento de confianza (1 − α = . n = tamaño de la muestra. Por consiguiente: sp = 0.73 0.7429 − 0. La hipótesis nula se rechaza porque el valor de la Z calculada es mayor que el valor crítico Z . 2 . La administración puede introducir el nuevo paquete de servicios orientado a este grupo.sp = p(1 − p ) n donde: p = proporción especificada en la hipótesis nula.60 = 1. Calcula la estadística de prueba: z= ( proporción _ observada) − ( proporción _ H 0 ) sp z= 0.000 o más.60) = .0828 35 4.60(1 − 0. 95 * 0.937 → 0.05. basado en su experiencia.100 Nivel de Significación = 0.El presidente del PRI en 1988.87 de votos por el PRI en la encuesta no cae en la región de aceptación.0066) = 0. 3 .95 Hipótesis Alternativa: H a : p ≠ 0. Los partidos de oposición levantaron una muestra de1. que el 95% de los votos son para su partido.96 * 0. El primer paso es calcular el error estándar de la proporción utilizando el valor hipotético del porcentaje que históricamente vota por el PRI: SE p = p(1 − p ) 0.05.05 = = 0. con un nivel de significación de 0.963 La proporción de . Hipótesis Nula: H o : p = 0.95 Tamaño de muestra: n=1. El presidente del PRI quiere probar la hipótesis.100 electores y encontraron que un 87% de ellos votaría por el PRI. por lo tanto el presidente del PRI debe de “preocuparse” por que la tendencia entre los votantes es a favorecer menos al PRI.95 ± (1.0066 n 1100 Ahora sólo es necesario construir el intervalo de confianza: po ± 1.96 * SE p 0. sostiene que un 95% de los votos para las elecciones presidenciales han sido a favor de su partido. 1 100.54 0.0074 La hipótesis nula se rechaza porque el valor de la Z calculada es menor que el valor crítico Z de 1.839 − 0.96.95) que la proporción captada por la ENAMIN es estadísticamente distinta de 0.88 = −5.0 Probemos la hipótesis de que el porcentaje de microempresas cuyos dueños son hombres captado por la ENAMIN es distinto de 88 por ciento. 4 .88) = .88 sp = z= 0.SEXO DEL PATRON Valid Hombre Mujer Total Frequency 1634 314 1948 Percent 83.88.9 100.0074 1948 0. Hipótesis Nula: H 0 = P = 0.9 16.0 Cumulative Percent 83.1 100.9 16. Podemos concluir con un 95 por ciento de confianza (1 − α = .88(1 − 0.88 Hipótesis Alternativa: H 0 = P ≠ 0.0 Valid Percent 83. Especifica el nivel de significación de α = . Las especificaciones requeridas y el procedimiento para probar esta hipótesis es la siguiente: 1. H a = PH − PM > 0 . sobre la base de una investigación.42 PH − PM = . El valor crítico para la prueba de una sola cola es de 1.II.64.05 . Algunas veces estamos interesados en analizar la diferencia entre las proporciones de poblaciones de grupos con distintas características.16 2.42 = . la proporción de hombres que reportan 9 o más visitas por mes es la misma o menor que la proporción de mujeres que hacen lo mismo. Por ejemplo. Prueba de Hipótesis para Diferencias entre Dos Proporciones (Muestras Independientes).58 − . 5 . la proporción de hombres que reportan 9 o más visitas por mes es mayor a la proporción de mujeres que hacen lo mismo. Las hipótesis nula y alternativa son las siguientes: H o = PH − PM ≤ 0 . que el porcentaje de hombres que visitan sus tiendas 9 o más veces al mes (clientes frecuentes) es mayor que el porcentaje de mujeres que hacen lo mismo. La información proporcionada es: nH = 45 nM = 71 PH = . pensemos que la administración de las tiendas Oxxo cree.58 PM = . 42) = 0.3.48(1 − .48) +  = 0.58) + 71(. Estima el error estándar de la diferencia de las dos proporciones:  1 1   s p h−m = P(1 − P) +  nH nM  donde: P= nH PH + nM PM nH + nM PH = proporción muestra de hombres (H) PM = proporción muestra de mujeres (M) NH = tamaño de muestra hombres NM = tamaño de muestra mujeres Por lo tanto: P= 45(.10  45 71  6 .48 45 + 71 y 1  1 s p h−m = . 73(1 − .73) +  = 0.4..42) − (0) = 1..58 − .10 La hipótesis nula es aceptada porque el valor de la Z calculada es menor que el valor crítico Z. P= 1634(83.60 . SPSS no cuenta con procedimientos para hacer pruebas de hipótesis de proporciones.9) + 314(16. La administración no puede concluir con un 95 por ciento de confianza que la proporción de hombres que visita 9 o más veces los Oxxo es mayor que la proporción de mujeres.1) = 72. Calcula de prueba estadística: Z= (diferencia _ entre _ proporciones _ observadas) − (diferencia _ entre _ proporciones _ H o ) s ph − m Z= (.0274 1634 314   7 . Probemos si el porcentaje de hombres dueños de microempresas es estadísticamente diferente del porcentaje de mujeres.97 1634 + 314 y 1   1 s p h−m = . 74 .839 − .Z= (. Podemos concluir que el porcentaje de hombres dueños de microempresas es estadísticamente superior al porcentaje de mujeres propietarias de microempresas.0274 La hipótesis nula es rechazada porque el valor de la Z calculada es mayor que el valor crítico Z. 8 .161) − (0) = 24. según la cual la frecuencia relativa (o proporción) se supone es la misma entre los dos grupos.III. y que sólo requiere datos nominales u ordinales. como la regresión lineal de mínimos cuadrados. Chi-Cuadrada La mayoría de la información que se trabaja en las ciencias sociales o administrativas es de carácter no-métrico nominal. ¿Cómo analizar información nominal o categórica? χ2 es una prueba estadística no paramétrica para diferencias entre dos o más muestras donde frecuencias esperadas son comparadas en relación con frecuencias obtenidas. muchas de las técnicas multivariadas más populares. y porque no siempre estamos seguros que la característica que deseamos estudiar se distribuye normalmente en la población. Prueba No Paramétrica: procedimiento estadístico que no adopta ningún supuesto acerca de cómo se distribuye la característica bajo estudio en la población. presentan serias limitaciones analíticas. 2 Las frecuencias esperadas f e se refieren a los términos de la hipótesis nula. La prueba de significación χ se refiere esencialmente a la distinción entre frecuencias esperadas y frecuencias obtenidas. Estas medidas son importantes porque la mayoría de la información en la investigación social y administrativa es de carácter nominal u ordinal. Por lo mismo. 9 . χ2 se utiliza para hacer comparaciones entre frecuencias y no entre valores medios. es la misma que la frecuencia relativa de microempresas que llevan una contabilidad formal y que iniciaron su actividad con ahorros personales.Por ejemplo. si se espera que un 50% de los negocios que llevan una contabilidad formal hayan iniciados sus actividades con ahorros personales. es la misma que la de microempresas con contabilidad formal cuyo inicio fueron ahorros personales. 2 Ejemplo: Hipótesis Nula: la frecuencia relativa de microempresas que llevan una contabilidad formal y que iniciaron su actividad con un financiamiento externo. por consiguiente. Sólo si la diferencia entre las frecuencias observadas y obtenidas es suficientemente grande. pueden variar o no de un grupo a otro. Mientras que la hipótesis de investigación señala que las diferencias entre las muestras reflejan diferencias reales en la población con respecto a la frecuencia relativa de una característica dada. ó Hipótesis Nula: la proporción de microempresas con contabilidad formal y cuyo inicio fue gracias a financiamiento externo. se rechaza la hipótesis nula. Como resultado. y se concluye que existe una diferencia real en la población. Las frecuencias obtenidas f o se refieren a los resultados obtenidos en el estudio y que. 10 . entonces también esperamos un 50% de aquellos que empezaron con financiamiento externo. la hipótesis nula para la χ señala que las poblaciones o grupos no difieren con respecto a la frecuencia de ocurrencia de una característica dada. value labels contab 1 'Informal' 2 'Formal'/ financia 1 'Ahorro Personal' 2 'Prestamo' . RECODE p17 (5=1) (else=2) INTO financia .La información de la ENAMIN proporciona la siguiente información: RECODE p25 (1=2) (2 thru 5=1) INTO contab. CROSSTABS /TABLES=contab BY financia /FORMAT= AVALUE TABLES /CELLS= COUNT. execute. CONTAB * FINANCIA Crosstabulation Count CONTAB Informal Formal Total FINANCIA Ahorro Personal Prestamo 465 302 624 557 1089 859 11 Total 767 1181 1948 . Una vez que tenemos las frecuencias esperadas y obtenidas.2 338.1 = (Total _ Columa )(Total _ Re nglón) Total _ Total Para la frecuencia observada de informal-personal.8 1948 Personal Externo Total Informal Formal 428.1 = (1089)(767) = 428. tenemos: f1e.8 767 1181 Total 1089 859 1948 12 χ 2 se . 465.8 660.2 520. el valor de la obtiene de la siguiente manera: ( f0 − fe )2 χ =∑ fe 2 Las frecuencias esperadas se obtienen de la siguiente manera: f1e. 8) χ = + + + 2 428.8) ( 302 − 338.5 χ 2 = 11.Noten que los totales de columnas y renglones no varían.2 = .2 520.2 660. los grados de libertad se calculan: df = (r − 1)(c − 1) En esta caso (un cuadro de 2x2): df = (2 − 1)(2 − 1) = (1)(1) = 1 13 . lo que hicimos fue corregir las proporciones de tal forma que no existiera diferencia entre tipo de financiamiento.8 338.1 + 3.8 = .2 ) ( 557 − 520.8 = 3.61 859 Aplicando la formula: ( f0 − fe )2 χ =∑ fe 2 2 2 2 2 ( 465 − 428.9 + 2.0 + 2. Para cuadros con un número determinado de renglones y columnas.61 y 1089 520.5 Para interpretar este valor de χ2 es necesario determinar los grados de libertad. Así 660.2) ( 624 − 660. 05 de nivel de significancia es igual a 3.2% 624 557 57. CONTAB * FINANCIA Crosstabulation CONTAB Informal Formal Total Count % within FINANCIA Count % within FINANCIA Count % within FINANCIA 14 FINANCIA Ahorro Personal Prestamo 465 302 42. CROSSTABS /TABLES=contab BY financia /FORMAT= AVALUE TABLES /STATISTIC=CHISQ /CELLS= COUNT COLUMN.6% 1948 100.Al observar la Tabla de Distribución de χ .3% 64.8% 1089 859 100.5 > 3.0% .0% Total 767 39.7% 35.841 Debemos rechazar la hipótesis nula de que no hay diferencia entre microempresas que iniciaron con ahorros personales y microempresas que requirieron financiamiento externo en cuanto a llevar una contabilidad formal o no.0% 100. Como: 2 2 11. Este el valor que debe excederse o igualar con el fin de rechazar la hipótesis nula. encontramos que una χ con 1 grado de libertad y .4% 1181 60.841. 15 .Chi-Square Tests Value 11. (2-sided) .439 1 .22. (2-sided) Exact Sig. Computed only for a 2x2 table b. Sig.0%) have expected count less than 5.000 Linear-by-Linear 11.001 .489 df Asymp. The minimum expected count is 338.445b 11.001 .001 Exact Sig.131 11.001 Association N of Valid Cases 1948 a. 0 cells (. (1-sided) Pearson Chi-Square 1 Continuity Correctiona 1 Likelihood Ratio 1 Fisher's Exact Test .001 .
Copyright © 2024 DOKUMEN.SITE Inc.