4ta. Unidad_Estimación con pruebas de hipótesis



Comments



Description

42 5 1 3 0011 0010 1010 1101 0001 0100 1011 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 c u a r t a U N I D A D ¿En que consiste la estimación con pruebas de hipótesis? µ=16 (1-o) = 0.95 0.4750 0.4750 1.96 No rechazar Valores de Z -1.96 o/2=0.025 Zona de rechazo cola derecha Zona de rechazo cola izquierda 0 Zona de no rechazo o/2=0.025 onzas X 16 : 16 : 0 = = µ µ A H H 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 1. ¿Cuál es el concepto de la prueba de hipótesis? 2. ¿Cuál es la diferencia entre una hipótesis nula y una hipótesis alternativa? 3. ¿Por qué se llaman valores críticos y zonas de rechazo? 4. ¿Qué indica el nivel de significancia y cuáles son los tipos de errores? 5. ¿En qué consiste la prueba de hipótesis de la media poblacional? 6. ¿Cuál es el uso y la interpretación del valor p.? 7. ¿En qué consiste la prueba de hipótesis de la media poblacional, en muestra pequeñas? 8. ¿En qué consiste la prueba de hipótesis de la proporción poblacional? Sumario 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 ORIENTACIONES Y PROPÓSITOS Esta unidad trata sobre la formulación de un procedimiento de decisión basado en datos que pueda producir una conclusión acerca de algún sistema científico, éstos procedimientos conducirán a la aceptación o rechazo de una de hipótesis estadística. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 L e c c i ó n 1 EL CONCEPTO DE PRUEBA DE HIPÓTESIS 1. Introducción El propósito del análisis estadístico es reducir el nivel de incertidumbre en el proceso de toma de decisiones. Los gerentes pueden tomar mejores decisiones sólo si tienen suficiente información, bajo una gran variedad de circunstancias. Ejemplos:  Un embotellador de bebidas suaves debe determinar si el peso promedio del contenido de sus botellas es 16 onzas (μ = 16 onzas).  Un productor de software de computador desea certificar que la proporción de sus productos que son defectuosos es menor del 3% (t< 0.03). 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. El concepto de prueba de hipótesis 2.1 Hipótesis • Es una suposición o inferencia sobre el valor desconocido de un parámetro. • Es un enunciado acerca de un parámetro. 2.2 Hipótesis estadística • Es una afirmación o conjetura acerca de una o más poblaciones. • Es un enunciado acerca de la distribución de probabilidad de una variable aleatoria, el cual a menudo involucran uno o más parámetros de ésta distribución. 2.3 Prueba de hipótesis Es el procedimiento que conduce a tomar una decisión en torno a la veracidad o falsedad de una hipótesis. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. El concepto de prueba de hipótesis (cont.) 2.4 Función de la prueba de hipótesis La prueba de hipótesis comienza con una suposición, llamada hipótesis, que hacemos con respecto a un parámetro de la población. Después recolectamos datos de muestra, calculamos las estadísticas de prueba y usamos esta información para decidir qué tan probable es que asea correcto nuestro parámetro de población acerca del cual hicimos la hipótesis. 2.5 Objetivo de la prueba de hipótesis El propósito de la prueba de hipótesis no es cuestionar el valor calculado de la estadística de la muestra, sino hacer un juicio con respecto a la diferencia entre esa estadística de muestra y un parámetro desconocido de la población. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 3. La hipótesis nula y la hipótesis alternativa 3.1 La hipótesis nula • Es el valor hipotético del parámetro que se compara con el resultado muestral. Se rechaza solo si el resultado muestral es muy poco probable en caso de que la hipótesis sea cierta. • La hipótesis nula referente a un parámetro poblacional siempre será establecida en forma tal que especifique un valor exacto del parámetro. El término nula implica nada o nulo. Tradicionalmente contiene alguna referencia de un signo con igual como “=“, “>“, “s“. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 3. La hipótesis nula y la hipótesis alternativa (cont.) 3.1 La hipótesis nula (cont.) Con base en los datos muestrales, esta hipótesis nula es rechazada o no rechazada. Nunca se puede “aceptar” la hipótesis nula como verdadera. El no rechazo de la hipótesis nula solamente significa que la evidencia muestral no es lo suficientemente fuerte como para llevar a su rechazo. Incluso si =16, no prueba que µ=16. Podría ser que µ sea 15.8 (o cualquier otro número), y debido al error de muestreo la media muestral acaba de igualar al valor de 16 que se plantea como hipótesis. Cuando se realiza una prueba de hipótesis, la hipótesis nula se supone que es verdadero hasta que una preponderancia de la evidencia indique que es falso. Una conclusión con base en un rechazo de la hipótesis nula es más significativa que una que termine en una decisión de no rechazo. El rechazo de la hipótesis nula implica que la hipótesis alterna es verdadera. X 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 3. La hipótesis nula y la hipótesis alternativa (cont.) 3.2 La hipótesis alternativa • Admite la posibilidad de varios valores. • Se acepta la hipótesis alterna solo si se rechaza la hipótesis nula. Ejemplo El embotellador de bebidas suaves citado anteriormente puede asumir, o plantear la hipótesis que el contenido promedio es de 16 onzas (μ=16). Esta hipótesis nula (H 0 ) se prueba contra la hipótesis alternativa (H A ) que establece lo contrario. En este caso, el contenido promedio no es de 16 onzas (μ=16). Por tanto, se tendría que: H 0 : μ = 16 H A : μ = 16 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 3. La hipótesis nula y la hipótesis alternativa (cont.) Ejemplo (cont.) Se asume que si se toma una muestra de n botellas y se halla una media de =16.15 onzas. ¿Se puede concluir que la media poblacional no es 16? Después de todo, ¡16.15 no es 16! Probablemente no. Esta pequeña diferencia podría ser estadísticamente insignificante puesto que podría explicarse fácilmente como un simple error de muestreo. Es decir, que debido al error de muestreo es posible tener una población con una media de 16 y salir con una media muestral de =16.15. Debido al azar, algunas botellas de la muestra pueden estar algo más llenas, produciendo una media muestral que sobrestime levemente la media poblacional. X X 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 3. La hipótesis nula y la hipótesis alternativa (cont.) Ejemplo (cont.) La evidencia muestral que =16.15 no es lo suficientemente fuerte como para desencadenar un rechazo de la hipótesis nula de que µ=16. Si la diferencia entre el valor de la media de 16 bajo la hipótesis y el hallado en la muestra de 16.15 es insuficiente para rechazar la hipótesis nula, el asunto entonces se vuelve simplemente que tan grande debe ser la diferencia para que sea estadísticamente significativa y conduzca un rechazo de la hipótesis nula. Vale la pena recordar de nuestra discusión sobre distribuciones de muestreo lo cual indica que se puede transformar toda unidad de medida, como las onzas del embotellador, hasta los valores correspondientes de Z con la fórmula Z. X 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 3. La hipótesis nula y la hipótesis alternativa (cont.) Ejemplo (cont.) Si o es desconocida, se utiliza la desviación estándar muestral s. La distribución normal resultante de los valores de Z tiene una media de cero y una desviación estándar de uno. La regla empírica dice que el 95% de las en la distribución de muestreo están a 1.96 errores estándar de la media poblacional desconocida; ver sigte. figura 4.1. n X X Z X o µ o µ ÷ = ÷ = µ=16 (1-o) = 0.95 0.4750 0.4750 1.96 No rechazar Valores de Z -1.96 o/2=0.025 Zona de rechazo cola derecha Zona de rechazo cola izquierda 0 Zona de no rechazo o/2=0.025 onzas X S X 16 : 16 : 0 = = µ µ A H H Figura 4.1 Valores críticos de Z y zonas de rechazo. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 4. Valores críticos de Z y zonas de rechazo Valor crítico, identifica el valor de estadística de prueba que se requiere para rechazar la hipótesis nula. Estos valores de Z de ± 1.96 son valores críticos que determinan las zonas de rechazo y permiten establecer una regla de decisión. Para hallarlos, se divide entre 2 el 95%. En la tabla Z, el área de 0.95/2= 0.4750 indica un valor Z de 1.96. El 5% restante está distribuido entre las dos colas, con 2.5% en cada zona de rechazo. Este 5% es el nivel de significancia, o el valor alfa de la prueba. Si un valor de Z mayor que 1.96 o menor que -1.96 ocurre, no es probable que la distribución esté entrada en µ=16, y la hipótesis nula sería rechazada. Regla de decisión: “No se rechaza la hipótesis nula si los valores Z están entre ± 1.96. Se rechaza si el valor Z es menor que -1.96 o mayor que +1.96”. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 5. El nivel de significancia y la probabilidad de error El nivel de significancia indicará el porcentaje de las medias de muestra que está fuera de ciertos límites. Algunas veces se le llama tamaño de la región crítica. Al probar una hipótesis se pueden cometer dos tipos de errores. 5.1 Error tipo I Es rechazar una hipótesis nula cuando es verdadera. La probabilidad de cometer un error tipo I es igual al nivel de significancia, o valor alfa en el que se prueba la hipótesis. En la figura 4.1, si la hipótesis del embotellador es verdadera y µ =16, todavía hay un 5% de oportunidad de que una media muestral pueda caer en cualquier zona de rechazo. Este 5% es el nivel de significancia y representa la probabilidad de un error tipo I. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 5. El nivel de significancia y la probabilidad de error (cont.) 5.2 Error tipo II Es no rechazar (aceptar) una hipótesis nula que es falsa. Si la hipótesis nula H 0 : μ= 16 no es correcta, pero la prueba falla en detectarlo, se comete un error tipo II. Está representado con la letra | y no se determina fácilmente. No se puede asumir que o+|= 1. Comentario Los niveles de significancia, o valores o, comúnmente seleccionados para pruebas de hipótesis son del 10%, 5% y 1 %. La selección de un valor o, depende del tipo de error, tipo I o tipo II, que más se desea evitar. Si se rechaza una hipótesis verdadera (error tipo I) es más serio que si no se rechaza una hipótesis falsa (error tipo II), se desearía seleccionar un valor o bajo, como 1% o 5%, para minimizar la probabilidad de cometer un error tipo I. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 5. El nivel de significancia y la probabilidad de error (cont.) Comentario(cont.) Por otra parte, si no rechazar una hipótesis falsa (error tipo II) es más serio, en este caso es preferible un valor o más alto como 10%, ver tabla 4.1 Se asume que el embotellador rechaza la hipótesis nula H 0 : μ= 16 y cierra el proceso de embotellado para ajustar el nivel del contenido. Sin embargo, si la media todavía es 16 onzas, el embotellador ha cometido un error tipo I. Si esto es más costoso que un error tipo II, al permitir que continúe el proceso cuando μ= 16, el embotellador desearía seleccionar para la prueba un valor o bajo, tal como 1%. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 5. El nivel de significancia y la probabilidad de error (cont.) Comentario(cont.) Tabla 4.1 Consecuencias de las decisiones en pruebas de hipótesis Decisiones posibles Situaciones posibles La hipótesis nula es verdadera La hipótesis nula es falsa Aceptar la hipótesis nula Se acepta correctamente Error tipo II Rechazar la hipótesis nula Error tipo I Se rechaza correctamente 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 6. Prueba de hipótesis de dos colas para la media de una población (n≥30) Se llama prueba de dos colas o bilateral, debido a que hay dos zonas de rechazo en ambas colas. Hay cuatro pasos involucrados en una prueba: Paso 1: Plantear las hipótesis. Paso 2: Con base en los resultados de la muestra, calcular el valor del estadístico de prueba Z. Paso 2.1: Gráfico Paso 3: Determinar la regla de decisión con base en los valores críticos de Z. Paso 4: Interpretación y conclusiones 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 6. Prueba de hipótesis de dos colas para la media de una población (n≥30) (cont.) Ejemplo El embotellador desea probar la hipótesis de que la media poblacional es 16 onzas y selecciona un nivel de significancia del 5%. Además, selecciona una muestra de n= 50 botellas con una media de =16.357 onzas y una desviación estándar de s= 0.866 onzas. X Solución µ = contenido promedio de todas las botellas = contenido promedio en la muestra X Muestra aleatoria n=50 botellas ? 16 ¿ = µ Población 357 . 16 = X 866 . 0 = s ? = o Figura 4.2 Esquema del ejemplo del embotellador. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 6. Prueba de hipótesis de dos colas para la media de una población (n≥30) (cont.) Ejemplo (cont.) Solución (cont.) Paso 1: Plantear las hipótesis: 16 : 16 : 0 = = µ µ A H H Paso 2: Calcular el estadístico de prueba Z El valor de Z utilizado para probar la hipótesis cuando σ es conocido n X Z H o µ ÷ = X n o En donde: es la media muestral µ H es el valor de la media poblacional bajo la hipótesis nula es el error estándar de la distribución muestral 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 6. Prueba de hipótesis de dos colas para la media de una población (n≥30) (cont.) Ejemplo (cont.) Solución (cont.) Cuando σ es desconocida, se utiliza la desviación estándar muestral (s) y Z se vuelve: El valor de Z utilizado para probar la hipótesis cuando σ es desconocido n s X Z H µ ÷ = 91 . 2 50 866 . 0 16 357 . 16 = ÷ = Z El valor de Z es: 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 6. Prueba de hipótesis de dos colas para la media de una población (n≥30) (cont.) Ejemplo (cont.) Solución (cont.) Paso 2.1: Gráfico Figura 4.3 Prueba de hipótesis para estimar el nivel promedio de contenido. µ=16 (1-o) = 0.95 0.4750 0.4750 1.96 No rechazar Valores de Z -1.96 o/2=0.025 Zona de rechazo cola derecha Zona de rechazo cola izquierda 0 Zona de no rechazo o/2=0.025 onzas X 16.357 2.91 16 : 16 : 0 = = µ µ A H H En la figura, el nivel de significancia del 5% se divide en dos colas. El 95% restante se divide por 2 para hallar el área de 0.4750. En la tabla Z esta área de 0.4750 da los valores críticos de Z de ±1.96. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 6. Prueba de hipótesis de dos colas para la media de una población (n≥30) (cont.) Ejemplo (cont.) Solución (cont.) Paso 3: La regla de decisión es: “No se rechaza la hipótesis nula si -1.96sZs1.96. Se rechaza si Z < -1.96 o Z > 1.96”. Paso 4: Interpretación y conclusiones Como el valor del estadístico para la muestra es de =16.357 onzas, produce una Z= 2.91 > 1.96 y cae en la zona de rechazo cola derecha, entonces rechazo H o . Se puede interpretar estos resultados como “la hipótesis nula es rechazada a un nivel de significancia del 5%”, es decir el contenido promedio de las botellas es µ=16. X 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 7. Ejercicios de la lección 1. Como gerente de compras para una gran empresa de seguros usted debe decidir si actualizar o no los computadores de la oficina. A usted se le ha dicho que el costo promedio de los computadores es de US$ 2,100. Una muestra de 64 minoristas revela un precio promedio de US$ 2,251, con una desviación estándar de US$ 812 ¿A un nivel de significancia del 5% parece que su información es correcta? Rpta. H 0 : μ= 2100; Z=1.49 entre ±1.96; no rechazar. 2. Debido al tiempo excesivo que se gasta en el sitio de trabajo, la oficina en donde usted trabaja está considerando espaciar las horas de trabajo para sus empleados. El gerente considera que los empleados gastan un promedio de 50 minutos para llegar trabajo. Setenta empleados se toman en promedio 47.2 minutos con una desviación estándar de 18.9 minutos. Fije o en 1% y pruebe la hipótesis. Rpta. H 0 : μ= 50 ; Z=-1.24 entre ±2.58; no rechazar. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 7. Ejercicios de la lección(cont.) 3. Cuando venían de regreso de las minas a la casa los siete enanos le dicen a Blancanieves que excavaron un promedio semanal de 12 toneladas de oro. Pero sin estar dispuesta a creer esta afirmación sin prueba alguna, la señorita Nieves recolecta datos durante 49 semanas y descubre una media de 11.5 toneladas y una desviación estándar de 1.1 toneladas. ¿A un nivel del 10% parece que los enanos están en lo cierto? Rpta. H 0 : μ= 12 ; Z=-3.18 menor que -1.65 ; rechazar. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 L e c c i ó n 2 PRUEBA DE HIPOTESIS DE UNA COLA DE LA MEDIA DE UNA POBLACIÓN (n≥30) 1. Introducción Las pruebas realizadas anteriormente eran pruebas de dos colas debido a que había zonas de rechazo en ambas colas. En algunas ocasiones se está interesado sólo en un extremo u otro. Ejemplos:  Una tienda minorista se alarmará sólo si los ingresos caen a niveles demasiado bajos. En particular, las ventas no son problema. En cada uno de estos casos la preocupación se concreta en un extremo u otro y se realiza una prueba de una cola. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Prueba de hipótesis de una cola Llamada también prueba de hipótesis unilateral. 2.1 Prueba de hipótesis de una cola izquierda Ejemplo Supone que el embotellador considera que el nivel de contenido promedio está “por lo menos en 16 onzas”. La hipótesis nula se convierte H o : µ≥16; es decir 16 o más. La hipótesis alternativa se plantea al contrario, y todo el conjunto de hipótesis es: H 0 : μ ≥16 H A : μ<16 (1-o)=0.95 Prueba de cola izq. Zona de rechazo o=0.05 µ=16 16.3 16.5 Zona de no rechazo onzas X Fig. 4.4 (a) Prueba de hipótesis de cola izq. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Prueba de hipótesis de una cola (cont.) 2.2 Prueba de hipótesis de una cola derecha Ejemplo Se asume, ahora, que el embotellador dice que el nivel del contenido promedio “es a lo más 16”. La hipótesis nula ahora se escribe como H 0 : μ ≤ 16. Las hipótesis son H 0 : μ ≤16 H A : μ>16 (1-o)=0.95 Prueba de cola der. Zona de rechazo o=0.05 µ=16 14 15 Zona de no rechazo onzas X Fig. 4.4 (b) Prueba de hipótesis de cola der. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 3. Ejemplos de prueba de hipótesis de una cola Ejemplo de cola izquierda El gerente de un hotel, reportó que el número promedio de habitaciones alquiladas por noche es de por lo menos 212 (μ≥212). Uno de los funcionarios considera que esta cifra puede estar algo sobreestimada. Una muestra de 150 noches produce una media de 201.3 habitaciones y una desviación estándar de 45.5 habitaciones. Si estos resultados sugieren que el gerente ha “inflado” su reporte, será amonestado severamente. A un nivel de 1% ¿Cuál es el destino del gerente? Fig. 4.5 Esquema del ejemplo de cola izq. Muestra aleatoria n=150 noches ? 212 ¿ > µ Población 3 . 201 = X 5 . 45 = s ? = o SOLUCION µ=número promedio de habitaciones alquiladas por noche. =número promedio de habitaciones alquiladas en la muestra. X 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 3. Ejemplos de prueba de hipótesis de una cola(cont.) Ejemplo de cola izquierda (cont.) Paso 1: Plantear las hipótesis H 0 : μ ≥212 H A : μ<212 Paso 2: Calcular el estadístico Z. Paso 2.1: Gráfico 88 . 2 150 5 . 45 212 3 . 201 ÷ = ÷ = Z Un nivel de significancia del 1% deja un área de 0.4900 que, de la tabla Z, requiere un valor crítico Z =2.33. (1-o)=0.99 Zona de rechazo o=0.01 µ=212 201.3 Zona de no rechazo onzas X µ=0 -2.88 -2.33 Z 0.4900 Zona de no rechazo 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 3. Ejemplos de prueba de hipótesis de una cola(cont.) Ejemplo de cola izquierda (cont.) Paso 3: La regla de decisión es: “No rechazar H 0 si Z> -2.33. Rechazar H 0 si Z < -2.33” Paso 4: Interpretación y conclusiones . Como Z=-2.88 cae en la zona de rechazo, entonces rechazo H o y concluyo que la tasa de ocupación es H A : μ<212. Al parecer que el gerente se ha excedido al estimar su tasa de ocupación y aparentemente recibirá una reprimenda de la oficina principal. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 3. Ejemplos de prueba de hipótesis de una cola (cont.) Ejemplo de cola derecha Una encuesta realizada por una Asociación de Estudiantes mostró que los estudiantes de las universidades de la nación gastan en promedio más de US$75 mensuales en entretenimiento. Si usted puede hallar evidencias para confirmar esta afirmación, podría utilizarla para solicitar a su casa ayuda monetaria adicional. De los 100 estudiantes que tomó de muestra, usted halla una media de US$80.23 con una desviación estándar de US$45.67. ¿A un nivel de significancia del 2%, se encuentra justificación para la solicitud? Fig. 4.7 Esquema para el ejemplo de cola der. Muestra aleatoria n=100 estud. ? 75 ¿ s µ Población 23 . 80 = X 67 . 45 = s ? = o SOLUCION µ = gasto promedio en entretenimiento de los estudiantes en todas las universidades = gasto promedio en entretenimiento de los estudiantes en la muestra. X 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 3. Ejemplos de prueba de hipótesis de una cola(cont.) Ejemplo de cola derecha (cont.) Paso 1: Plantear las hipótesis H 0 : μ ≤75 H A : μ>75 Paso 2: Calcular el estadístico Z. Paso 2.1: Gráfico Un nivel de significancia del 2% deja un área de 0.4800 que, de la tabla Z, requiere un valor crítico Z =2.05 (1-o)=0.98 Zona de rechazo o=0.02 µ=75 80.23 Zona de no rechazo onzas X µ=0 1.15 2.05 Z 0.4800 Zona de no rechazo 15 . 1 100 67 . 45 75 23 . 80 = ÷ = Z 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 3. Ejemplos de prueba de hipótesis de una cola(cont.) Ejemplo de cola derecha (cont.) Paso 3: La regla de decisión es: “No rechazar H 0 si Z≤2.05. Rechazar H 0 si Z >2.05” Paso 4: Interpretación y conclusiones . Como Z=1.15 cae en la zona de no rechazo, entonces se acepta H A y se concluye que el gasto promedio en entretenimiento no es superior $75. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 4. Ejercicios de la lección 1. Durante los últimos meses una compañía Raynor ha publicitado ampliamente su negocio de suministros eléctricos. El Sr. Raynor espera que el resultado haya sido incrementar las ventas promedio semanales por encima de US$7,880 que la compañía experimenté en el pasado. Una muestra de 36 semanas da una media de US$8.023 con una desviación estándar de US$1.733. A un nivel de significancia del 1%, ¿parece que la publicidad ha producido efecto? R. H 0 : μ s7880 ; Z=0.50 < 2.33 ; no rechazar. (Webster:2000,209) 2. Según The WalI Street Journal (mayo 12 de 1997) muchas compañías de ropa deportiva están tratando de comercializar sus productos entre los más jóvenes. El artículo sugirió que la edad promedio de los consumidores había caído por debajo del grupo de edad de 34.4 años que caracterizó los comienzos de la década. Si una muestra de 1,000 clientes reporta una media de 33.2 años y una desviación estándar de 9.4, ¿qué se concluye a un nivel de significancia del 4%?. Rpta. H 0 : μ ≥34.4 ; Z=-4.04 < -1.75 ; rechazar. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 4. Ejercicios de la lección (cont.) 3. A comienzos de los años 90, Hyundai, el fabricante coreano de automóviles, sufrió una severa caída en las ventas, por debajo de su pico mensual de 25,000 unidades de mayo de 1988. Hyundai Motor América (verano de 1997) reportó que las ventas habían bajado a menos de 10,000 unidades. Durante un período de 48 meses que comenzó en enero de 1990, las ventas promedio fueron de 9,204 unidades. Se asume una desviación estándar de 944 unidades. ¿A un nivel del 1% de significancia, parece que el número promedio de unidades ha caído por debajo de la marca de 10,000? Rpta. H 0 : μ ≥10,000 ; Z=-5.84 < -2.33 ; rechazar. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 L e c c i ó n 3 VALORES p :USO E INTERPRETACION 1. Introducción Como se ha visto, para probar una hipótesis se calcula un valor Z y se compara con un valor critico Z con base en el nivel de significancia seleccionado. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Valor p Definición • Es el nivel más bajo (de significado) en el cual el valor observado del estadístico de prueba es significativo. • Es el nivel más bajo de significancia (valor o ) al cual se puede rechazar la hipótesis nula. • Es el área en la cola que está más allá del valor del estadístico para la muestra. • Puede servir como método alternativo para probar hipótesis. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Valor p (cont.) 2.1 Valor p para la prueba de una cola de una media poblacional Ejemplo Se tiene que Chuck Cash es el jefe de personal. A partir de un breve análisis de los registros de los empleados, Chuck considera que los empleados tienen un promedio de más de US$31,000 en sus cuentas de pensiones (µ>31,000). Al tomar como muestra 100 empleados, Chuck encuentra una media de US$31,366, con s= US$ 1,894. Se supone que Chuck desea calcular el valor p relacionado con esta prueba de cola a la derecha. SOLUCION µ = promedio de inversión en cta. de pensiones de todos los empleados. = promedio de inversión en cta. pensiones en la muestra. X Muestra aleatoria n=100 emplead. ? 000 , 31 ¿ > µ Población 366 . 31 = X 894 , 1 = s ? = o 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Valor p (cont.) 2.1 Valor p de prueba de una cola de una media pobla. (cont.) Ejemplo (cont.) Paso 1: Plantear las hipótesis H 0 : μ ≤31,000 H A : μ>31,000 Paso 2: Calcular el estadístico Z. El valor p es el área de la cola que está más allá del valor del estadístico Z= 1.93. En la figura 4.9 (a), un valor Z= 1.93 da un área de 0.4732. Entonces, el valor p= 0.5000-0.4732 = 0.0268, o 2.68%. 93 . 1 100 1894 000 , 31 366 , 31 = ÷ = Z 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2.1 Valor p de prueba de una cola de una media pobla. (cont.) Ejemplo (cont.) 0 1.93 Valor p =0.0268 0.4732 Z Si o > p Rechazar H o 0 1.93 Zona de rechazo 0.4500 o =0.05 1.65 Z 000 , 31 : 000 , 31 : 0 > s µ µ A H H 0 1.93 Zona de rechazo 0.4900 o =0.01 2.33 Z Si o < p rechazar H o Fig. 4.9 Prueba de hipótesis de una cola usando valor p (a) (b) (c) 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Valor p (cont.) 2.1 Valor p de prueba de una cola de una media pobla. (cont.) Ejemplo (cont.) Interpretación ¿Exactamente qué le dice este valor p=2.68% a Chuck? En la fig. (b) muestra que si se fija o =0.05 > 0.0268, el área de 0.4500 requiere un valor crítico Z=1.65. Por tanto, el valor del estadístico Z=1.93 cae en la zona de rechazo. Por otra parte, en fig. (c), si se selecciona un valor o =0.01 < 0.0268, el área resultante es 0.4900 especifica un valor critico de Z=2.33 y el valor del estadístico Z= 1.93 cae en la zona de no rechazo. Por tanto, Chuck puede bajar el valor o de 0.0268 es el valor a más bajo que Chuck puede fijar y sin embargo rechazar la hipótesis nula. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Valor p (cont.) 2.2 Valor p en la prueba de dos colas de una media poblacional Ejemplo Se asume que Chuck también sospecha que los empleados invierten un promedio de US$100 mensuales en el plan de opción de compra de acciones de la compañía (μ=100). Al tomar como muestra 100 empleados, Chuck descubre una media de US$106.81 con una desviación estándar de US$36.60. Ahora desea determinar el valor p relacionado con la prueba de hipótesis. SOLUCION µ = promedio de inversión mensual en la compra de acciones de todos los empleados. = promedio de inversión en la muestra. X Muestra aleatoria n=100 emplead. ? 100 ¿ = µ Población 81 . 106 = X 60 . 36 = s ? = o 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Valor p (cont.) 2.2 Valor p en la prueba de 2 colas de una media poblacional (cont.) Ejemplo (cont.) Paso 1: Plantear las hipótesis H 0 : μ =100 H A : μ≠100 Paso 2: Calcular el estadístico de prueba Z. Para calcular el valor p, Chuck determina el área en la cola que va más allá del valor del estadístico Z= 1.86. En la figura 4.10 esta área es 0.0314. Esta área debe multiplicarse por 2 para obtener el valor p, entonces: El valor p = 0.0314 x 2= 0.0628. 86 . 1 100 60 . 36 100 81 . 106 = ÷ = Z Si o < p entonces no se rechaza H o 0.0314 0.0314 0.4686 1.86 -1.86 0 Z Fig. 4.10 Prueba de hipótesis de dos colas, usando valor p 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 3. Ejercicios de la lección 1. En el verano de 1997, el Congreso aprobó un presupuesto federal que contenía varias partidas para reducciones de impuestos. Los analistas afirmaron que ahorraría al contribuyente promedio US$800. Una muestra de 500 contribuyentes demostró una reducción promedio o los impuestos de US$785.10 con una desviación estándar de US$277.70. Pruebe la hipótesis aun nivel de significancia del 5%. Calcule el valor p. Rpta. H 0 : μ =8000 ; Z=-1.20 entre ±1.96 ; no rechazar ; p=0.2302. 2. A comienzos de los años 90 Sony Corporation introdujo su PlayStation de 32 bits en el mercado de los juegos de video. La gerencia esperaba que el nuevo producto incrementara las ventas mensuales en E.U. por encima de los US$283’000,000 que Sony había experimentado en la década anterior. Una muestra de 40 meses reportó una media de US$297’000,000. Se asume una desviación estándar de US$97’000,000. Pruebe la hipótesis a un nivel de significancia del 1%. Calcule e interprete el valor p. (Webster:2000,213) Rpta. H 0 : μ s283 ; Z=0.91 < 2.33 ; no rechazar ; p=0.1814. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 L e c c i ó n 4 PRUEBAS DE HIPOTESIS PARA LA MEDIA POBLACIONAL MUESTRAS PEQUEÑAS (n<30) 1. Introducción Al igual que con los intervalos de confianza, si la muestra es pequeña (n<30), σ es desconocida, y la población es normal o casi normal en cuanto a su distribución, puede utilizarse la distribución t. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Pruebas de hipótesis para la media poblacional 2.1 Pruebas de hipótesis de dos colas para la media poblacional Ejemplo Los estudiantes en una clase de estadística cuestionan la afirmación de que McDonald’s coloca 0.25 libras de carne en sus “hamburguesas de cuarto de libra”. Algunos estudiantes argumentan que en realidad se utiliza más, mientras que otros insisten que es menos. Para probar la afirmación publicitaria que el peso promedio es de 0.25 libras, cada estudiante compra una hamburguesa de cuarto y la lleva a clase, en donde la pesan en una balanza suministrada por el instructor. Los resultados de la muestra son = 0.22 libras y s= 0.09. Si hay 25 estudiantes en clase, ¿a qué conclusiones llegarían a un nivel de significancia del 5%. X SOLUCION µ = peso promedio de las “hamburguesas de cuarto de libra” en todo McDonald’s. = peso promedio de las hamburguesas en la muestra. Muestra aleatoria n=25 estudiantes ? 25 . 0 ¿ = µ Población 22 . 0 = X 09 . 0 = s ? = o X Fig. 4.5 Esquema del ejemplo de las hamburguesas 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Pruebas de hipótesis para la media poblacional (cont.) 2.1 Pruebas de hipótesis de dos colas para la media poblacional( cont.) Ejemplo (cont.) Paso 1: Plantear las hipótesis: 25 . 0 : 25 . 0 : 0 = = µ µ A H H Paso 2: Calcular el estadístico de prueba t Estadística t para la prueba de hipótesis de la media poblacional (muestras pequeñas) n s X t H µ ÷ = Dados los datos actuales, se halla 667 . 1 25 09 . 0 25 . 0 22 . 0 = ÷ = t 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Pruebas de hipótesis para la media poblacional (cont.) 2.1 Pruebas de hipótesis de dos colas para la media poblacional( cont.) Ejemplo (cont.) Paso 2.1 Gráfico: El valor t =1.667 se compara con un valor critico de t con n-1= 24 grados de libertad y un valor o=5%. De la tabla t para prueba de dos colas, t 0.05,24 = 2.064. o/2=0.025 o/2=0.025 2.064 1.667 -2.064 0 t Zona de rechazo Zona de no rechazo Zona de rechazo Fig. 4.12 Prueba t de dos colas para la media poblacional 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Pruebas de hipótesis para la media poblacional (cont.) 2.1 Pruebas de hipótesis de dos colas para la media poblacional( cont.) Ejemplo (cont.) Paso 3: Regla de decisión: Como t=1.667 cae entre ±2.064, no se rechaza la hipótesis nula. La evidencia de prueba confirma la afirmación de Mc Donald’s de que las hamburguesas de cuarto de libra contienen efectivamente 25 libras de carne. “No rechazar la hipótesis nula si t esta entre ± 2.064. Rechazar H 0 si t < -2.064 o t > 2.064”. Paso 4: Interpretación y conclusiones 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Pruebas de hipótesis para la media poblacional (cont.) 2.2 Pruebas de hipótesis de una cola para la media poblacional Ejemplo de cola derecha. The American Kenner Club (AKC) reportó que los perros cocker spaniel de un año de edad deberían pesar “un poco más de 40 libras” (µ>40) si han recibido una nutrición apropiada”. Hill’s, productor de alimentos para la dieta de los perros, pesa 15 perros cockers de un año de edad y descubre una media de 41.17 libras, con s= 4.71 libras. Seleccionando una probabilidad del 1% de cometer un error tipo I se tiene que: SOLUCION µ = peso promedio de todos los perros. = peso promedio de los perros en la muestra. Muestra aleatoria n=15 perros ? 40 ¿ > µ Población 17 . 41 = X 71 . 4 = s ? = o X Fig. 4.13 Esquema del ejemplo de los perros 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Pruebas de hipótesis para la media poblacional (cont.) 2.2 Pruebas de hipótesis de una cola para la media poblacional ( cont.) Ejemplo (cont.) Paso 1: Plantear las hipótesis: 40 : 40 : 0 > s µ µ A H H Paso 2: Calcular el estadístico de prueba t 96 . 0 15 71 . 4 40 17 . 41 = ÷ = t De la tabla t para pruebas de una cola, t 0.01,14 =2.624. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Pruebas de hipótesis para la media poblacional (cont.) 2.1 Pruebas de hipótesis de una cola para la media poblacional ( cont.) Ejemplo (cont.) Paso 2.1 Gráfico: o=0.01 2.624 0.96 0 t Zona de rechazo Zona de no rechazo Fig. 4.14 Prueba t de cola derecha para ejemplo de los perros Paso 3: Regla de decisión: “No rechazar H o si t s2.624. Rechazar si t > 2.624”. Paso 4: Interpretación y conclusiones El valor t=0.96 cae en la zona de no rechazo. La hipótesis nula H o : µs40 no se rechaza. La evidencia de la muestra sugiere que no se confirma la afirmación de AKC. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 3. Ejercicios de la lección 1. Los registros llevados por una gran tienda por departamentos indican que en el pasado las ventas semanales tenían un promedio de US$ 5,775. Para incrementar las ventas, la tienda comenzó recientemente una campaña agresiva de publicidad. Después de 15 semanas, las ventas promediaron US$ 6,012 con s= US$ 977 ¿La tienda debería seguir con el programa publicitario? Fije o en 1%. (Webster:2000,215) Rpta. H 0 : μ s5,775 ; t=0.9395 < 2.624 ; no rechazar ; no continuar. 2. Un nuevo bombillo producido por Sun Systems está diseñado para incrementar la vida útil de los bombillos a más de 5,000 horas que es el promedio de los que actualmente existen. ¿El nuevo producto de Sun proporciona una mejora si 25 bombillos se funden en promedio a las 5,117 horas con s = 1,886 horas? Fije o en 5%. Rpta. H 0 : μ s500 ; t=0.31 < 1.711 ; no rechazar 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 L e c c i ó n 5 PRUEBAS DE HIPOTESIS PARA LA PROPORCIÓN POBLACIONAL 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 1. Introducción Muchas decisiones en los negocios dependen de la proporción o porcentaje de la población que se ajusta a alguna característica. Ejemplos •Un especialista en mercadeo puede querer saber la proporción de residentes de una ciudad grande que se ajusta al mercado objetivo. •El político está interesado en saber qué fracción de los votantes lo favorecerá en las próximas elecciones. •Los analistas financieros y económicos pueden necesitar estimar la porción de los proyectos de capital que sufren de sobrecostos. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Pruebas de hipótesis para t utilizando la distribución normal 2.1 Pruebas de hipótesis de dos colas para t Para muestra pequeñas, utilizar la distribución binomial. El proceso de prueba de hipótesis para la proporción poblacional t es muy similar al de µ. Un valor Z calculado a partir de la muestra (n≥30) se compara con un valor crítico de Z con base en el valor a seleccionado. Z se calcula como: Estadística Z para la prueba de hipótesis de la proporción poblacional p H p Z o t ÷ = En donde: p = proporción muestral de las observaciones que se consideran “éxitos” t H = es el valor planteado como hipótesis para la proporción poblacional o p = es el error estándar de la proporción muestral 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Pruebas de hipótesis para t utilizando la distribución normal (cont.) 2.1 Pruebas de hipótesis de dos colas para t (cont.) Un error o p mide la tendencia de las proporcione muestrales a desviarse de la proporción poblacional desconocida, se calcula así: Error estándar de la distribución muestral de las proporciones muestrales n H H p ) 1 )( ( t t o ÷ = 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Pruebas de hipótesis para t utilizando la distribución normal (cont.) 2.1 Pruebas de hipótesis de dos colas para t (cont.) Ejemplo Como director de las operaciones de mercadeo, usted considera que el 60% de los clientes de la firma se han graduado de la universidad. Usted intenta establecer una importante política respecto a la estructura de precios sobre esta proporción. Una muestra de p= 492/800= 0.615. A un nivel del 5% ¿Qué puede concluir sobre la proporción de todos los clientes que se han graduado de la universidad? SOLUCION t= proporción de todos los clientes graduados en la población p= proporción de todos los clientes graduados en la muestra. Muestra aleatoria n=800 clientes ? 60 . 0 ¿ = t Población 615 . 0 800 492 = = p Fig. 4.15 Esquema del ejemplo de mercadeo 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Pruebas de hipótesis para t utilizando la distribución normal (cont.) 2.1 Pruebas de hipótesis de dos colas para t (cont.) Ejemplo (cont.) Paso 1: Plantear las hipótesis: 60 . 0 : 60 . 0 : 0 = = t t A H H Paso 2: Calcular el estadístico Z de prueba. El error estándar es ( ) 017 . 0 800 60 . 0 1 60 . 0 = ÷ = p o El estadístico Z: 88 . 0 017 . 0 60 . 0 615 . 0 = ÷ = Z 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Pruebas de hipótesis para t utilizando la distribución normal (cont.) 2.1 Pruebas de hipótesis de dos colas para t (cont.) Ejemplo (cont.) Paso 2.1: Gráfico o/2=0.025 o/2=0.025 1.96 0.88 -1.96 0 Z Zona de rechazo Zona de no rechazo Zona de rechazo 1-o=0.95 0.4750 0.4750 Fig. 4.16 Prueba de hipótesis para la proporción de clientes graduados Paso 3: Regla de decisión: “No rechazar H o si Z está entre ± 1.96. Rechazar si Z>1.96 o Z<-1.96”. Paso 4: Interpretación y conclusiones Como el Z=0.88 está en la zona de no rechazo. La evidencia de la muestra confirma la hipótesis de que t= 0.60. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Pruebas de hipótesis para t utilizando la distribución normal (cont.) 2.1 Pruebas de hipótesis de dos colas para t (cont.) Valor p 0.1894 0.1894 0.88 -0.88 0 Z Zona de rechazo Zona de no rechazo Zona de rechazo 0.3106 0.3106 Fig. 4.17 Valor p para la proporción de clientes graduados Decisión: Debido a que el valor o del 5% es menor que 37.88%, entonces la hipótesis nula no se rechaza. Es el área de la cola que está más allá del valor del estadístico para la muestra. La figura 4.17 muestra que esta área es 0.5000-0.3106=0.1894. Sin embargo, debido a que es una prueba de dos colas, el valor p es 0.1894 x 2= 0.3788. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Pruebas de hipótesis para t utilizando la distribución normal (cont.) 2.2 Pruebas de hipótesis de una cola para t Ejemplo de cola izq. El CEO de una firma manufacturera debe garantizar que por lo menos 75% de sus empleados (t>0.75) han concluido un curso avanzado de capacitación. De los 1,200 empleados seleccionados aleatoriamente, 875 lo han hecho. El CEO registra su asistencia para probar esta hipótesis y calcular el valor p. A un nivel de significancia del 5% ¿Qué conclusiones incluye usted en su reporte? SOLUCION t= proporción de empleados que han concluido un curso en la población p= proporción de empleados que han concluido un curso en la muestra. Muestra aleatoria n=1200 clientes ? 75 . 0 ¿ > t Población 729 . 0 200 , 1 875 = = p Fig. 4.18 Esquema para la proporción de empleados capacitados 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Pruebas de hipótesis para t utilizando la distribución normal (cont.) 2.2 Prueba de hipótesis de una cola para t (cont.) Ejemplo de cola izq. (cont.) Paso 1: Plantear las hipótesis: 75 . 0 : 75 . 0 : 0 < > t t A H H Paso 2: Calcular el estadístico Z de prueba. El error estándar es ( ) 0125 . 0 200 , 1 75 . 0 1 75 . 0 = ÷ = p o El estadístico Z: 68 . 1 0125 . 0 75 . 0 729 . 0 ÷ = ÷ = Z p= 875/1200= 0.729 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Pruebas de hipótesis para t utilizando la distribución normal (cont.) 2.2 Prueba de hipótesis de una cola para t (cont.) Ejemplo de cola izq. (cont.) Paso 2.1 Gráfico (a) 0.4500 Valor p=0.0465 -1.68 o=0.05 -1.65 -1.68 Z Z 0.4535 0 0 (b) Fig. 4.19 Prueba de hipótesis y valor para la proporción de empleados capacitados En la figura 4.19 (a), colocando toda la cantidad del valor o= 0.05 en la región única de rechazo, el área de 0.4500 requiere un valor critico Z de -1.65. La regla de decisión es: Zona de no rechazo 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 2. Pruebas de hipótesis para t utilizando la distribución normal (cont.) 2.2 Prueba de hipótesis de una cola para t (cont.) Ejemplo de cola izq. (cont.) Paso 3: Regla de decisión: “No rechazar H o si Z ≥ -1.65. Rechazar H o si Z<-1.65”. Paso 4: Interpretación y conclusiones Debido a que Z= -1.68 < -1.65. Se rechaza la hipótesis nula. El CEO debe tomar medidas para incrementar la proporción de empleados que requieren capacitación. Valor p El valor p es el área en la cola que está más allá del valor del estadístico para la muestra de Z=1.68. En la figura 4.19 (b), un valor Z=-1.68 da un área de 0.4535. Por tanto, el valor p= 0.5000-0.4535= 0.0465. 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 3. Ejercicios de la lección 1. Tradicionalmente el 35% de todos los créditos otorgados por un banco han sido para miembros de grupos minoritarios. Durante el año pasado, el banco ha hecho esfuerzos por incrementar esta proporción. De 150 créditos actualmente en curso, 56 han sido otorgados a las minorías. ¿El banco ha tenido éxito en sus esfuerzos por atraer más clientes de las minorías? Pruebe la hipótesis con un nivel de significancia del 5%. Calcule el valor p. Rpta. H 0 : t s0.35 ; Z=0.51 < 1.65 ; no rechazar ; p=0.3050 2. Radio Shack, el minorista de electrodomésticos, anuncié que vende el 21% de todos los computadores caseros. ¿Esta donación se confirma si 120 de los 700 propietarios de computadores se los compraron Radio Shack? Tome o de 5% y calcule e interprete el valor p. (Webster:2000,219) Rpta. H 0 : t =0.21 ; Z=-2.60 <-1.96 ; rechazar ; p=0.0094 4 2 5 1 3 0011 0010 1010 1101 0001 0100 1011 ME QUEDO AQUI X X ( ) X P X X S X o =0.05
Copyright © 2024 DOKUMEN.SITE Inc.