Pruebas de Hipótesis Actual



Comments



Description

Instituto Tecnológico de LeónMaterial didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 1 3 PRUEBAS DE HIPÓTESIS Las dos actividades principales de la estadística inferencial son el uso de datos para 1. Estimar un parámetro poblacional (como hicimos en la unidad anterior), y 2. Probar una hipótesis o afirmación con respecto a un parámetro poblacional (como veremos en esta unidad). DEFINICIÓN: La prueba de hipótesis comienza con una suposición, llamada hipótesis, que se hace respecto a un parámetro de población. Después recolectamos datos de muestra, para decidir qué tan probable es que sea correcto nuestro parámetro de población. Para probar la validez de la suposición se recolectan datos de muestra y se determina la diferencia entre el valor hipotético y el valor real de la media de dicha muestra; después se juzga si la diferencia obtenida es significativa o no. Mientras más pequeña sea la diferencia entre el valor hipotético y el real, mayor será la probabilidad de que el valor hipotético para la media sea correcto. Mientras mayor sea la diferencia entre el valor hipotético y el real, más pequeña será la probabilidad de que el valor hipotético para la media sea correcto. En la prueba de hipótesis, las soluciones infalibles son la excepción, no la regla. Ya sea que se acepte o se rechace una hipótesis, no se puede estar absolutamente seguro de que la decisión sea correcta; por consiguiente se tiene que aprender cómo enfrentar la incertidumbre en la toma de decisiones. No podemos aceptar o rechazar una hipótesis sobre un parámetro de población simplemente por intuición. Más bien necesitamos aprender cómo decidir objetivamente si aceptamos o rechazamos una corazonada, con base en la información acerca de la muestra. Es importante no olvidar que las hipótesis son proposiciones sobre la población no proposiciones sobre la muestra. HIPÓTESIS: es una aseveración o afirmación acerca de una propiedad de una población. Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 2 COMPONENTES DE UNA PRUEBA DE HIPÓTESIS HIPÓTESIS NULA: denotada por H o es la afirmación de que el valor de un parámetro de población (como una media o una proporción) es igual a un valor aseverado. Las siguientes son hipótesis nulas típicas: La hipótesis nula se prueba en forma directa, en el sentido de que suponemos que es verdadera, y llegamos a una conclusión para rechazar o no rechazarla. HIPÓTESIS ALTERNATIVA: denotada por es la afirmación de que el parámetro tiene un valor que, de alguna manera, difiere de la hipótesis nula. La hipótesis alternativa debe emplear alguno de estos símbolos: >, < o ≠. A continuación se presentan seis ejemplos diferentes de hipótesis alternativas que incluyen medias y proporciones: Medias: Proporciones: Nota sobre el uso del símbolo de igualdad en : realizamos la prueba de hipótesis suponiendo que la media o proporción es igual a algún valor especificado, por consiguiente usamos el signo de =. Nota sobre la identificación de la afirmación original puede convertirse en hipótesis nula, en la hipótesis alternativa o tal vez no corresponda con exactitud a ninguna de las dos. Por ejemplo, en ocasiones probamos la validez de la aseveración de alguien más, como la afirmación de la Coca-Cola de que “la cantidad media de las latas con Coca-Cola es de al menos 12 onzas”. Esta afirmación puede expresarse es símbolos tales como . Si la aseveración original es falsa, entonces . La hipótesis alternativa se vuelve , pero la hipótesis nula es . Estadístico de prueba: es un valor que se utiliza para tomar la decisión sobre la hipótesis nula, y se calcula convirtiendo el estadístico muestral (como la media o la proporción muestral ) en una puntuación (como z o t), bajo el supuesto de que la hipótesis nula es verdadera. Emplearemos los siguientes estadísticos de prueba: Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 3 Estadístico de prueba para proporciones: Estadístico de prueba para medias: El estadístico de prueba para una media usa una distribución normal o la distribución t de Student, dependiendo de los requisitos que se satisfagan. Se usarán los mismos criterios descritos en la estimación (para distribución t n<30 y σ desconocida, en cualquier otro caso distribución normal). Región crítica: es el conjunto de todos los valores del estadístico de prueba que pueden provocar que rechacemos la hipótesis nula. Por ejemplo, observe los extremos azules en la gráfica de la siguiente página. Nivel de significancia (denotado por α): es la probabilidad de que el estadístico de prueba caiga en la región crítica. Se trata de la misma α presentada en estimación, donde definimos el nivel de confianza para un intervalo de confianza como la probabilidad 1 – α. Las opciones comunes para α son 0.05, 0.01 y 0.10, aunque la más común es 0.05. Valor crítico: es cualquier valor que separa la región crítica (donde rechazamos la hipótesis nula) de los valores del estadístico de prueba que no conducen al rechazo de la hipótesis nula. Así por ejemplo, a un nivel de significancia de α =0.05 corresponde z = 1.64, como vimos en estimación. Dos colas, cola izquierda y cola derecha: las colas en una distribución son las regiones extremas limitadas por los valores críticos. Algunas pruebas de hipótesis incluyen dos colas, otras la cola derecha y otras la cola izquierda, pero no las tres.  Prueba de dos colas: la región crítica se encuentra en las dos regiones extremas (colas) bajo la curva.  Prueba de cola izquierda: la región crítica se encuentra en la región extrema izquierda (cola) bajo la curva.  Prueba de cola derecha: la región crítica se encuentra en la región extrema derecha (cola) bajo la curva En la prueba de dos colas, el nivel de significancia α está dividido equitativamente entre las dos colas que constituyen la región crítica. Por ejemplo, en una prueba de dos colas con un nivel de significancia de α = 0.05, existe un área de 0.025 en cada una de las dos colas. En las pruebas de cola derecha o cola izquierda, el área de la región crítica en una cola es α. Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 4 Al examinar la hipótesis alternativa, podemos determinar si la prueba es de cola derecha, izquierda o de dos colas. La cola corresponderá a la región crítica que contiene los valores que entrarán en conflicto, de manera significativa con la hipótesis nula. Criterio de decisión: la decisión de rechazar o no rechazar la hipótesis nula suele realizarse por medio del método tradicional o método clásico o de valor crítico. Método de valor crítico: Rechace H o si el estadístico de prueba cae dentro de la región crítica. No rechace H o si el estadístico de prueba no cae dentro de la región crítica. Redacción de la conclusión final: la conclusión de rechazar o no la hipótesis nula es adecuada para aquellos que tenemos en buen juicio de tomar un curso de estadística, pero debemos emplear términos sencillos y sin tecnicismos al establecer el verdadero significado de la conclusión. Aceptación/ no rechazo: algunos libros de texto dicen “aceptar la hipótesis nula” en vez de “no rechazar la hipótesis nula”. Ya sea que usemos el término aceptar o no rechazar, debemos reconocer que no estamos probando la hipótesis nula; únicamente estamos diciendo que la evidencia muestral no es lo suficientemente fuerte como para justificar el rechazo de la hipótesis nula. (Cuando un jurado no encuentra evidencia suficiente para sentenciar a un sospechoso, emite un veredicto de no culpabilidad y no un veredicto de inocencia). El término aceptar es Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 5 un poco confuso, ya que parece indicar incorrectamente que la hipótesis nula ha sido probada. (Es confuso decir que “existe evidencia suficiente para aceptar la hipótesis nula”). La frase no rechazar dice con mayor corrección que la evidencia disponible no es lo suficientemente fuerte para justificar el rechazo de la hipótesis nula. En este curso emplearemos la terminología no rechaza la hipótesis nula, en vez de aceptar la hipótesis nula. Múltiples negativos: Cuando se establece la conclusión final en términos no técnicos, es posible enunciar afirmaciones correctas con hasta tres términos negativos. Ejemplo: “No existe evidencia suficiente para justificar el rechazo de la aseveración de que no hay diferencia entre 0.5 y la proporción poblacional”. Las conclusiones con demasiados términos negativos resultan confusas, por lo que es aconsejable volver a redactarlas en una forma comprensible, pero teniendo cuidado de no alterar el significado. Por ejemplo, en vez de decir “no existe evidencia suficiente para justificar el rechazo de la aseveración de que no existen diferencias entre 0.5 y la proporción poblacional”, los siguientes serían mejores enunciados:  No se rechaza la aseveración de que la proporción poblacional es igual a 0.5.  Hasta no obtener evidencia más firme, continuamos suponiendo que la proporción poblacional es igual a 0.5. PASOS PARA ESTABLECER UNA PRUEBA DE HIPOTESIS PASO 1.- Debemos establecer el valor supuesto o hipotético del parámetro de población antes de comenzar. La suposición que deseamos probar se conoce como hipótesis NULA, la cual se denota con Ho. Esta hipótesis, es la afirmación sobre una o más características poblacionales que al inicio suponemos cierta (es decir, la “creencia a priori”). Suponiendo que se quiere probar la hipótesis nula de que la media poblacional (μ) es igual a 500; se escribe: Ho: μ = 500. Si los resultados de la muestra no respaldan la Ho, se concluye que se cumple alguna otra cosa. Siempre que se rechaza la Ho, la conclusión aceptada se llama hipótesis alternativa (H 1 ). Ejemplo: Dada Ho: μ= 200 (“La hipótesis nula es que la media poblacional es igual a 200”) Se consideran tres hipótesis alternativas posibles: H 1 : μ ≠ 200 (“La hipótesis alternativa es que la μ no es igual a 200”) Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 6 H 1 : μ > 200 (“La hipótesis alternativa es que la μ es mayor que 200”) H 1 : μ < 200 (“La hipótesis alternativa es que la μ es menor que 200”) El propósito de la prueba de hipótesis no es cuestionar el valor calculado del estadístico de muestra, sino hacer un juicio con respecto a la diferencia entre ese estadístico de muestra y un parámetro de población hipotético. PASO 2.- Después de establecer las hipótesis nula y alternativa respectivamente, se debe determinar qué criterio utilizaremos para decidir aceptar o rechazar la Ho. Es decir se debe determinar que diferencia debe haber entre y μ que se considere razonable; a dicha diferencia, establecida por nosotros, se le llama NIVEL DE SIGNIFICANCIA. Si suponemos que la hipótesis nula es correcta, entonces el nivel de significancia indicará el porcentaje de medias muestrales que están fuera de ciertos límites, en estimación el nivel de confianza indicaba el porcentaje de medias que caían dentro de los límites de confianza definidos. NOTA: siempre que afirmamos que NO rechazamos la , en realidad nos referimos a que no hay diferencia significativa para rechazarla. Cuando los datos No hay diferencia significativa entre y μ, por lo tanto NO RECHAZAMOS la H o H 1 Nivel de significancia de 0.025 H 1 Nivel de significancia de 0.025 H o Nivel de confianza de 0.95 Media poblacional hipotética Hay una diferencia significativa entre y por lo tanto rechazamos la si la cae en estas dos regiones Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 7 de la muestra no hacen que rechacemos una nos comportaremos como si esa hipótesis fuera cierta. Es posible probar una hipótesis a cualquier nivel de significancia; solo que mientras más alto sea el nivel de significancia que se use para probar una hipótesis, mayor será la probabilidad de rechazar una cuando es cierta, es decir cometer error tipo I, veamos en que consiste dicho error. ERROR TIPO I: se refiere al rechazo de una cuando es cierta. También es conocido como α o nivel de significancia. ERROR TIPO II: es el hecho de no rechazar una cuando es falsa. También es conocido como β. NO Rechazo 0.90 NO Rechazo 0.50 Nivel de significancia de 0.01 Nivel de significancia de 0.10 Nivel de significancia de 0.50 Misma media en diferentes niveles de significancia puede ser rechazada o no rechazada. Región de aceptación muy amplia, por lo tanto no se rechazaran H o falsas y ciertas; poca seguridad al decidir si rechazar o no rechazar. Región de aceptación media, equilibrada tal vez; este equilibrio es decidido por los tomadores de decisiones por medio de exámenes de costos o desventajas vinculadas con ambos tipos de errores. Región de aceptación bastante reducida, por lo tanto, rara vez aceptaremos una H o cuando sea falsa; pero como precio de esta seguridad, frecuentemente rechazaremos una H o cuando sea cierta. Rechazo 0.005 Rechazo 0.005 Rechazo 0.05 Rechazo 0.05 Rechazo 0.25 NO Rechazo 0.99 Rechazo 0.25 NO Rechazo 0.50 Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 8 La hipótesis nula y alternativa son afirmaciones opuestas acerca de la población. Una de las dos hipótesis es verdadera, pero no ambas. Lo ideal es que la prueba de hipótesis lleve a la aceptación de la H o cuando esta es verdadera y al rechazo de H o cuando la misma es falsa. Por desgracia, las conclusiones correctas no siempre son posibles. Como la prueba de hipótesis se basa en una información muestral debe tenerse en cuenta que existe la posibilidad de error. Por tanto, al probar cualquier hipótesis estadística, existen cuatro situaciones diferentes que determinan si la decisión final es correcta o errónea. Hipótesis Nula Investigador No rechaza Ho Rechaza Ho Ho es verdadera Decisión correcta Error Tipo I Ho es falsa Error Tipo II Decisión correcta PASO 3.- Decisión sobre el tipo de distribución a utilizar en la prueba de hipótesis. Después de decidir el nivel de significancia a utilizar, la siguiente tarea consiste en determinar la distribución de probabilidad adecuada. En la siguiente tabla se muestran las condiciones para usar la distribución normal y t en la prueba de hipótesis respecto a medias: Desviación estándar poblacional (σ) conocida Desviación estándar poblacional (σ) desconocida n > 30 Distribución normal Tabla z Distribución normal Tabla z n ≤ 30 Distribución normal Tabla z Distribución t Tabla t Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 9 PASO 4. Realizar la distribución, es decir determinar límites de la región de aceptación y rechazo, graficar posiciones de valores, tanto estandarizados como críticos. Regla de rechazo bilateral: Si z cal < z α/2 o si z cal > z α/2 PASO 5.- Comparamos valores y los interpretamos. Usaremos el siguiente ejemplo para ilustrar mejor los paso antes descritos. PRUEBA DE HIPÓTESIS PARA LA MEDIA Ejemplo: Un fabricante suministra los ejes traseros para los camiones del correo; estos ejes deben soportar 80,000 lbs por pulgada cuadrada en pruebas de carga, pero un eje excesivamente fuerte eleva los costos de producción de manera significativa. La larga experiencia indica que la desviación estándar de la fuerza de sus ejes es de 4,000 lbs por pulgada cuadrada. El fabricante selecciona una muestra de 100 ejes de la producción, los prueba y encuentra que la capacidad de carga media de la muestra es de 79,600 lbs por pulgada cuadrada. Si el fabricante de ejes utiliza un nivel de significancia de 0.05 en la prueba, ¿satisfarán los ejes los requerimientos de carga? RESUMEN DEL PROCESO DE 5 PASOS 1.- Establezca sus hipótesis; decida si es una prueba de dos extremos o de uno solo. Seleccione un nivel de significancia apropiado para esta decisión. 2.- Decida qué distribución (t o z) es la apropiada y encuentre el (los) valor (es) crítico(s) para el nivel de significancia escogido de la tabla adecuada. 3.- Calcule el error estándar del estadístico de muestra. Use el error estándar para convertir el valor observado del estadístico de muestra a un valor estandarizado. 4.- Esboce la distribución y marque la posición del valor de muestra estandarizado y del (de los) valor(es) crítico(s) para la prueba. 5.- Compare el valor del estadístico de muestra estandarizado con el (los) valor(es) crítico(s) para esta prueba e interprete el resultado. Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 10 SOLUCIÓN: Intervalo de confianza: 80,000 1.96 (400); 80,000784, por lo tanto: Límite inferior 79,216 a Límite superior 80,784. La está dada en escala sin procesar; pero los valores críticos (límites) usan valores estandarizados de z; es decir (1.96 en este caso), lo cual son dos escalas distintas y no podemos compararlas directamente cuando probamos hipótesis; así que debemos convertir uno de ellos a escala del otro. En vez de convertir los valores críticos z a la escala original o sin procesar, para obtener números directamente comparables con el valor observado de convertimos a escala estandarizada utilizando la fórmula de la distribución muestral de medias: = 80,000 lbs σ = 4,000 lbs n = 100 ejes = 79,600 lbs NS = 0.05 H o : μ= 80,000 H 1 : μ≠ 80,000 Error estándar: Requerimos conocer los límites de confianza, para ello, se usa , es la media poblacional hipotética, debido a que dichos límites están en torno a o sea a la hipótesis nula, no a la . Por otro lado, el valor de z se obtiene de las tablas de distribución normal, lo cual indica a cuantas desviaciones estándar por arriba (z>0) o por debajo (z<0) de la media se encuentra nuestra observación, por lo tanto se están usando dos escalas distintas. 79,216 =80,000 80,784 Método 1: Escala sin procesar, los valores están en libras por pulg cuadrada .95 .95 0.025 0.025 0.025 0.025 -1.96σ -1 0 1.96σ Método 2: Escala estandarizada, aquí se manejan valores estándar de z. Valores críticos que definen las fronteras del área de aceptación y rechazo; pero en la escala estandarizada los valores críticos indican a cuantas desviaciones estándar está cada límite o frontera. = 79,600 lbs Región de aceptación de Ho si el valor de está aquí Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 11 Retomando los valores del ejemplo mencionado, tenemos que: Indica que la está a una desviación estándar por debajo de la μ. Y como -1 desviación estándar cae dentro del área de aceptación, se concluye que no se debe rechazar H o ; el fabricante debe considerar que sus ejes satisfacen los requerimientos de carga. En realidad los dos métodos conducen a las mismas conclusiones pero trabajaremos con el método estandarizado, ya que como dijimos al principio, no se juzga la cantidad, sino la ubicación de la media muestral . Debido a que concluimos no rechazar la hipótesis nula ya que es verdadera, no cometimos error tipo I. Ejemplo: McGraw Hill supone que la vida de su prensa rotativa es de 14,500 horas, con una desviación estándar de 2,100 horas. De una muestra de 25 prensas, la compañía encuentra una media de muestra de 13,000 horas. A un nivel de significancia de 0.01 ¿Debería concluir la compañía que la vida promedio de las prensas es menor que las hipotéticas 14,500 horas? SOLUCION: = 14,500 hras σ = 2,100 hras n = 25 prensas = 13,000 hras NS = 0.01 H o : μ= 14,500 H 1 : μ< 14,500 Error estándar: Intervalo de confianza: 14,500 2.32 (420); 14,500974.40, por lo tanto: Límite inferior es 13,525.60 13,526 = 14,500 -2.32σ 0 -3.57 .49 .50 0.01 = 13,000 hras Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 12 INTERPRETACIÓN: la vida promedio de las prensas si es menor de 14,500 horas, por lo tanto se rechaza la hipótesis nula. PRUEBA DE HIPÓTESIS A PARTIR DE DOS MUESTRAS Ahora utilizaremos datos muestrales de dos muestras independientes para someter a prueba hipótesis acerca de dos medias, dos proporciones y la relación de varianzas. Comenzaremos por ver la prueba de hipótesis para la diferencia de medias. PRUEBA DE HIPÓTESIS PARA DIFERENCIA DE MEDIAS CON Y DESCONOCIDAS Requisitos 1. y se desconocen y no se hace una suposición sobre l igualdad de y . 2. Las dos muestras son independientes. 3. Ambas muestras son aleatorias simples. 4. Los tamaños muestrales no son grandes ( y ) o ambas muestras provienen de distribuciones normales. Estadístico de prueba de hipótesis: Grados de libertad: cuando calcule valores críticos, utilice gl = el menor de . Ejemplo: Los Revenue Commissioners de Irlanda realizaron un concurso de promoción. A continuación se muestran las edades de los solicitantes que tuvieron éxito y de los que no tuvieron éxito. Algunos de los solicitantes que no tuvieron éxito para obtener la promoción se quejaron de que hubo discriminación por edad en la competencia. Maneje los datos como muestras de poblaciones más grandes y utilice un nivel de significancia de 0.05 para poner a prueba la aseveración de que los solicitantes sin éxito provienen de una población con una edad media mayor que la de los solicitantes exitosos. Con base en ese resultado, ¿parece haber discriminación por la edad? Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 13 Edades de solicitantes sin éxito Edades de solicitantes con éxito 34 37 37 38 41 42 43 44 44 45 27 33 36 37 38 38 39 42 42 43 45 45 46 48 49 53 53 54 54 55 43 44 44 44 45 45 45 45 46 46 56 57 60 47 47 48 48 49 49 51 51 52 54 SOLUCIÓN: Verificamos que los requisitos se satisfagan: los valores de las dos desviaciones estándar poblacionales se desconocen, y no estamos haciendo una suposición de igualdad entre ellas. las dos muestras son independientes porque los valores de una muestra no están apareados con valores de la otra muestra. Podemos suponer que las muestras son aleatorias simples. Ambas muestras son pequeñas, podemos suponer que ambas provienen de distribuciones normales. Procedemos con la prueba de hipótesis. La aseveración de que en los solicitantes sin éxito tienen una edad media mayor que la edad media de los solicitantes con éxito se expresa simbólicamente como . Si la aseveración original es falsa, entonces . La hipótesis alternativa es la expresión que no contiene igualdad, y la hipótesis nula es una expresión de igualdad, de manera que tenemos  (Aseveración original) Ahora procedemos con la suposición de que o . El nivel de significancia es . Puesto que tenemos dos muestras independientes y estamos probando una aseveración acerca de dos medias poblacionales, utilizamos una distribución t con el estadístico de prueba dado anteriormente. El estadístico de prueba se calcula como sigue: Como estamos utilizando una distribución t, los valores críticos de t = 1.717 se encuentran es la tabla de dicha distribución. (Con un área de 0.05 en la cola derecha, buscamos el valor t correspondiente a 22 grados de libertad, que es el más pequeño de y [o el más pequeño de 22 y 29]). El estadístico de prueba, el valor crítico y la región crítica se muestran a continuación. Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 14 Puesto que el estadístico de prueba no se ubica dentro de la región crítica, no se rechaza la hipótesis nula (o INTERPRETACIÓN: no existe evidencia suficiente para sustentar la aseveración de que la edad media de los solicitantes sin éxito es mayor que la edad media de los solicitantes con éxito. Con base en esta prueba de hipótesis, no parece existir discriminación por edad. PRUEBA DE HIPÓTESIS PARA DIFERENCIA DE MEDIAS CON Y CONOCIDAS En realidad, las desviaciones estándar poblacionales y casi nunca se conocen, pero si son conocidas, el estadístico de prueba está basado en una distribución normal y no en una distribución t. veamos los siguientes requisitos: Requisitos: 1. Se conocen las dos desviaciones estándar poblacionales. 2. Las dos muestras son independientes. 3. Ambas muestras son aleatorias simples. 4. Los dos tamaños muestrales son grandes (con y ) y las dos muestras provienen de poblaciones que tienen distribuciones normales. Si los requisitos anteriores se satisfacen, el estadístico de prueba es: El procedimiento es el mismo que para la distribución t, descrito anteriormente. = 1.717 Estadístico de prueba de datos muestrales t = 1.678 Se rechaza No se rechaza Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 15 PRUEBA DE HIPÓTESIS PARA LA PROPORCIÓN Nuevamente, por medio del siguiente ejemplo veremos el proceso de probar hipótesis para la proporción. Ejemplo: Se ha visto que las redes de contacto son uno de los medios más eficaces para conseguir empleo. Por medio de los contactos, el individuo que busca un empleo se vincula con otros e intercambia información a través de una red informal de personas. Una encuesta reciente incluyó a 703 sujetos elegidos al azar, los cuales tenían un empleo. De ellos, el 61% dio que había conseguido el trabajo por medio del contacto con amigos y parientes. Utilice los datos muestrales, con un nivel de significancia de 0.05, para probar la aseveración de que la mayoría de los empleados (más del 50%) consiguen su trabajo por medio de redes de contactos. SOLUCIÓN: = 0.50 n = 703 personas = 0.61 NS = 0.05 H o : p= 0.50 H 1 : p> 0.50 Error estándar: Intervalo de confianza: 0.50 1.64 (0.0188); 0.500.0309, por lo tanto: Límite superior es 0.531 = 0.50 0.531 0 1.64σ 5.851 .45 .50 0.05 = 0.61 Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 16 INTERPRETACIÓN: existe suficiente evidencia muestral para sustentar la aseveración de que la mayoría de los empleados consiguen trabajo por medio de redes de contactos. PRUEBA DE HIPÓTESIS PARA DIFERENCIA DE PROPORCIONES Si bien esta sección se basa en proporciones, podemos utilizar los mismos métodos para tratar con probabilidades o podemos tratar con porcentajes utilizando los equivalentes decimales correspondientes. Cuando se prueba una hipótesis acerca de dos proporciones poblacionales o cuando se construye un estimado del intervalo de confianza de la diferencia entre dos proporciones poblacionales, los requisitos y la notación son los siguientes. Observe que cuando se prueba la hipótesis nula de , no hay necesidad de estimar los parámetros individuales y , sino que estimamos su valor común con la proporción muestral agrupada que se describe a continuación. Requisitos 1. Tenemos proporciones de dos muestras aleatorias simples que son independientes. (las muestras son independientes si los valores muestrales seleccionados de una población no están relacionados ni apareados de alguna forma con los valores muestrales seleccionados de la otra población). 2. Para ambas muestras, el número de éxitos es de al menos 5 y el número de fracasos es de al menos 5. Notación para dos proporciones Para la proporción 1 permitimos que = proporción poblacional = tamaño muestral = número de éxito en la muestra (La proporción muestral) Los significados correspondientes a , , , , son los mismos que los anteriores, solo que éstos provienen de la población 2. Proporción muestral agrupada: esta proporción se denota por y está dada por: Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 17 Denotamos el complemento de como , de manera que . Estadístico de prueba para dos proporciones (con ) Donde: supuesto en la hipótesis nula y Utilizamos la tabla de distribución normal, con base en el nivel de significancia α, obtenemos los valores críticos utilizando los procedimientos ya mencionados en la sección anterior. El siguiente ejemplo ayudará a aclarar los papeles que desempeñan , , , , etc. En específico, usted debe reconocer que bajo el supuesto de igualdad de proporciones, el mejor estimado de la proporción común se obtiene al combinar ambas muestras en una muestra grande, de manera que es el estimador de la proporción poblacional común. Ejemplo: El síndrome del túnel carpiano es un padecimiento común de la muñeca, producido por la presión en un nervio. Con frecuencia es el resultado del uso constante de movimientos de muñeca repetitivos, como los que se asocian al uso del teclado. De los distintos tratamientos disponibles, dos son los más comunes: aplicar un entablillado o practicar una cirugía. El tratamiento de entablillado tiene la ventaja de no ser invasivo, de ser más sencillo, más rápido y mucho menos costoso. Sin embargo, ¿estas ventajas justifican optar por el tratamiento del entablillado en vez del tratamiento quirúrgico? Un factor crucial es el éxito del tratamiento. En una prueba aleatoria controlada se identificó a 156 pacientes con síndrome del túnel carpiano, a los que se trató con entablillado o cirugía. Estos pacientes fueron evaluados un año después. El éxito se definió como “completamente recuperado” o “con una gran mejoría”, y se determinó, después de un año, que de los 73 pacientes que fueron tratados con cirugía, 67 resultaron exitosos. De los 83 pacientes tratados con entablillados, 60 resultaron exitosos. Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 18 Estos resultados se muestran a continuación: Tratamiento del síndrome del túnel carpiano Tratamiento Cirugía Entablillado Éxito un año después del tratamiento 67 60 Número total de sujetos tratados 73 83 Porcentaje de éxito 92% 72% Utilice los datos muestrales de la tabla anterior, con un nivel de significancia de 0.05 para probar la aseveración de que la tasa de éxito de la cirugía es mejor que la tasa de éxito del entablillado. SOLUCIÓN: primero debemos verificar que se satisfagan los requisitos necesarios. Dado el diseño de este experimento es razonable suponer que se trata de una muestra aleatoria simple. Además, el grupo de tratamiento con cirugía es independiente del grupo de tratamiento con entablillado. Para el segundo requisito, observe que el grupo de tratamiento con cirugía tiene 67 éxitos en 73 pacientes, de manera que existen 6 fracasos. Por lo tanto, el grupo de tratamiento con cirugía tiene al menos 5 éxitos y al menos 5 fracasos. Por otra parte, el grupo de tratamiento con entablillado tiene 60 éxitos en 83 pacientes, de manera que el número de fracasos es 23. Por lo tanto, el grupo de tratamiento con entablillado tiene al menos 5 éxitos y al menos 5 fracasos. Para cada una de las dos muestras revisamos que al menos 5 éxitos y al menos 5 fracasos. La verificación de los requisitos se completó con éxito y procedemos con la prueba de hipótesis. En los siguientes pasos estipulamos que los pacientes sometidos a cirugía constituyen la muestra 1, y que los pacientes tratados con entablillado constituyen la muestra 2. 1. La aseveración de una mayor proporción de éxitos en el grupo de tratamiento con cirugía se expresa como . Si es falso, entonces . Puesto que nuestra aseveración de no contiene igualdad, se convierte en la hipótesis alternativa. La hipótesis nula es la afirmación de igualdad, entonces tenemos: (Aseveración original) 2. El nivel de significancia es 3. Utilizaremos la distribución normal (con el estadístico de prueba dado con anterioridad). Estimamos el valor común de y con el estimado de la muestra agrupada , calculado como se indica a continuación, con espacios Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 19 decimales adicionales para minimizar errores de redondeo en cálculos posteriores. Con , se deduce que 4. Ahora podemos calcular el valor del estadístico de prueba: 5. Calculamos el valor crítico. Con un nivel de significancia en una prueba de cola derecha, basada en una distribución normal, nos remitimos a la tabla de distribución normal, para encontrar que un área de en la cola derecha corresponde al valor crítico de . En la siguiente figura podemos observar que el estadístico de prueba se localiza en la región crítica limitada por el valor crítico de . Por lo tanto rechazamos la hipótesis nula y concluimos que hay suficiente evidencia para sustentar la aseveración de que la cirugía es más exitosa que el entablillado. PRUEBA DE HIPÓTESIS PARA VARIANZA A continuación veremos cómo realizar una prueba de hipótesis respecto de una desviación estándar poblacional σ o varianza poblacional σ 2 . Para lo cual utilizaremos la distribución chi cuadrada, que se explicó en la unidad 3. El estadístico de prueba para probar la hipótesis acerca de σ o σ 2 es: z = 3.12 (estadístico de prueba) Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 20 Utilizaremos la tabla de distribución chi cuadrada, con gl = n – 1 para el número de grados de libertad. En la unidad 3 señalamos las siguientes propiedades de la distribución chi cuadrada. 1. Todos los valores son no negativos y la distribución no es simétrica. 2. Todos los valores críticos se encuentran en la tabla de dicha distribución, utilizando grados de libertad = n – 1. La tabla está basada en áreas acumulativas de la zona derecha. Para obtener los valores críticos en la tabla, primero se localiza el renglón correspondiente al número apropiado de grados de libertad (donde gl = n – 1). Luego, se utiliza el nivel de significancia α para determinar la columna correcta. Los siguientes ejemplos se basan en un nivel de significancia de α = 0.05, pero se puede emplear cualquier otro nivel de significancia de manera similar. Prueba de cola derecha: Puesto que el área a la derecha del valor crítico es 0.05, localice 0.05 en la parte superior de la tabla. Prueba de cola izquierda: Con un área de cola izquierda de 0.05, el área a la derecha del valor crítico es 0.95, así que localice 0.95 en la parte superior de la tabla. Prueba de dos colas: Divida el nivel de significancia de 0.05 entre la cola derecha y la cola izquierda, de manera que las áreas a la derecha de los dos valores críticos sean 0.975 y 0.025, respectivamente. Localice 0.975 y 0.025 en la parte superior de la tabla. (Véase la figura y el ejemplo en la unidad 3 pág. 20). Ejemplo: El mundo de la industria comparte esta meta común: mejorar la calidad rediciendo la variación. Los ingenieros de control de calidad desean asegurarse de que un producto tenga una media aceptable, pero también quieren producir artículos con una calidad consistente, eliminando los defectos. La Newport Bottling Company ha fabricado latas de bebidas de cola con cantidades que tienen una desviación estándar de 0.051 onzas. Se prueba una nueva máquina embotelladora, y una muestra aleatoria simple de 24 latas produce las cantidades (en onzas) que se listan a continuación. 11.98 11.98 11.99 11.98 11.90 12.02 11.99 11.93 12.02 12.02 12.02 11.98 12.01 12.00 11.99 11.95 11.95 11.96 11.96 12.02 11.99 12.07 11.93 12.05 Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 21 Estas 24 cantidades tienen una desviación estándar de s = 0.039 oz. Utilice un nivel de significancia de 0.05 para probar la aseveración de que las latas de bebidas de cola de la nueva máquina tienen cantidades con una desviación estándar menor que 0.051 oz. SOLUCIÓN: Probaremos la aseveración (hipótesis) de que las bebidas de cola provienen de una población con una desviación estándar menor que 0.051 oz. Analicemos la situación por pasos. 1: La expresión simbólica de la aseveración es σ < 0.051. 2: Si la aseveración original es falsa, entonces σ ≥ 0.051. 3: La expresión σ < 0.051 no incluye igualdad, por lo que se convierte en la hipótesis alternativa. La hipótesis nula es la afirmación de que σ = 0.051. Aseveración original 4: El nivel de significancia es α = 0.05 5: Puesto que la aseveración es respecto a σ, usamos la distribución chi cuadrada. 6: Calculamos el estadístico de prueba El valor crítico de 13.091 se encuentra en la tabla de distribución chi cuadrada, en el renglón 23 (grados de libertad = n – 1 = 23), en la columna correspondiente a 0.95. Observe el estadístico de prueba y los valores críticos que se muestran a continuación. 7: Puesto que el estadístico de prueba no está en la región crítica (zona lila), no rechazamos la hipótesis nula. 0 Estadístico de prueba de datos muestrales No rechazo α = 0.051 Rechazo α = 0.051 α = 0.05 Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 22 INTERPRETACIÓN: no hay suficiente evidencia para sustentar la aseveración de que la desviación estándar de las cantidades con la nueva máquina sea menor que 0.051 onzas. Quizás la nueva máquina produce cantidades de bebida de cola que son más consistentes, con una desviación estándar menor que 0.051 oz, pero aún no tenemos evidencia suficiente para sustentar esa aseveración. PRUEBA DE HIPÓTESIS PARA LA RELACIÓN DE VARIANZAS Puesto que la característica de variación entre los datos es extremadamente importante, esta sección presenta la prueba F para comparar dos varianzas (o desviaciones estándar) poblacionales utilizando dos muestras. La distribución F, vista en la unidad 3 es la que se utiliza para la prueba F. Por lo cual en esta unidad la volveremos a usar. Es sumamente importante estar conscientes de una grave desventaja de este procedimiento: la prueba F para comparar dos varianzas (o desviaciones estándar) poblacionales es muy sensible a las desviaciones que se alejan de la distribución normal. Debemos recordar que la varianza es el cuadrado de la desviación estándar y también debemos conocer la siguiente notación. s = desviación estándar muestral s 2 = varianza muestral (desviación estándar muestral al cuadrado) σ = desviación estándar poblacional 2 = varianza poblacional (desviación estándar poblacional al cuadrado) Los cálculos de esta sección se simplificarán considerablemente si designamos las dos muestras de manera que represente a la más grande de las dos varianzas muestrales. Matemáticamente no importa cuál muestra se designe como la muestra 1, así que la vida será más fácil si permitimos que represente a la mayor de las dos varianzas muestrales, como en el estadístico de prueba incluido en el cuadro de resumen siguiente. Requisitos 1. Las dos poblaciones son independientes una de la otra (en la unidad 3 aprendimos que dos muestras son independientes si la muestra seleccionada de una población no está relacionada con la muestra seleccionada de la otra población). 2. Las dos poblaciones están distribuidas normalmente. Notación para pruebas de hipótesis con dos varianzas o desviaciones estándar Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 23 La más grande de dos varianzas muestrales. Tamaño de la muestra que tiene la varianza más grande. Varianza de la población de donde se obtiene la muestra con la varianza más grande. Los símbolos , y se utilizan para la otra muestra y la otra población. Estadístico de prueba para pruebas de hipótesis con dos varianzas donde es la más grande de las dos varianzas muestrales Valores críticos: Utilice las tablas de distribución F para obtener valores críticos F que se determinan por lo siguiente: 1. El nivel de significancia (cada tabla tiene valores críticos para ). 2. Grados de libertad del numerador = (fila superior de cada tabla) 3. Grados de libertad del denominador = (columnas izquierda y/o derecha de cada tabla). Para dos poblaciones distribuidas normalmente con varianzas iguales (es decir, ), la distribución muestral del estadístico de prueba es la distribución F que se muestra a continuación. Algunas propiedades de de la distribución F son: 1. La distribución no es simétrica 2. Los valores de la distribución F no pueden ser negativos. Valores críticos: Para calcular un valor crítico, primero hay que remitirnos a la fila superior de las tablas de distribución F y localizar el valor de los grados de libertad del numerador = ( muestra que tiene la varianza más grande), luego en la columna de la izquierda y/o derecha de las tablas, localizamos el valor de los 0 Solo valores no negativos Valor de No simétrica (sesgada a la derecha) F Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 24 grados de libertad del denominador = , en seguida nos ubicamos en alguno de los 5 valores de , posteriormente interceptamos la fila de , la columna de con el valor de y ese será el valor crítico. Ejemplo: Determine el valor crítico de F con un , y grados de libertad respectivamente. SOLUCIÓN: localizamos el 8 ( en la fila superior y 15 ( en la columna de la izquierda, y enseguida el valor de 0.05 para , y vemos que el valor crítico es 2.64 Puesto que estamos estipulando que la varianza muestral más grande es , todas las pruebas de una cola serán de cola derecha y todas las pruebas de dos colas requerirán que encontremos sólo el valor crítico localizado a la derecha. Buenas noticias: No tenemos la necesidad de calcular un valor crítico separando una región crítica de cola izquierda. (Puesto que la distribución F no es simétrica y sólo tiene valores no negativos, un valor crítico de cola izquierda no puede encontrarse utilizando el negativo del valor crítico de cola derecha; en vez de ello, el valor crítico de cola izquierda se calcula utilizando el recíproco del valor de cola derecha con los números de grados de libertad invertidos. Interpretación del estadístico de prueba F: Si en realidad las dos poblaciones tienen varianzas iguales, entonces la proporción tiende a 1, puesto que los valores de y tienden a acercarse. Pero si las dos poblaciones tienen varianzas radicalmente diferentes, y tienden a ser números muy distintos. Si denotamos la más grande de las varianzas muestrales como , vemos que la proporción será un número grande siempre que y tengan valores lejanos entre sí. En consecuencia, un valor de F cercano a 1 será evidencia a favor de la conclusión de que , y un valor grande de F será evidencia en contra de la conclusión de igualdad de las varianzas poblacionales. Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 25 Los valores de F grandes son evidencia en contra de Aseveraciones acerca de desviaciones estándar: El estadístico de prueba F se aplica a una aseveración acerca de dos varianzas, pero también podemos utilizarlo para aseveraciones acerca de dos desviaciones estándar poblacionales. Cualquier aseveración acerca de dos desviaciones estándar poblacionales puede replantearse en términos de las varianzas correspondientes. Ejemplo: Los estadísticos muestrales de un conjunto de datos de muestras de Coca clásica y Pepsi clásica son los siguientes: Coca clásica Pepsi clásica n 36 36 0.81682 0.82410 s 0.007507 0.005701 SOLUCIÓN: Verifiquemos los requisitos. En primer lugar, es evidente que las poblaciones son independientes entre sí. En segundo lugar, las muestras sugieren que provienen de una población con una distribución aproximadamente normal. Los requisitos se cumplen y podemos continuar con la prueba. En vez de utilizar las desviaciones estándar muestrales para probar la aseveración de desviaciones estándar poblacionales iguales, utilizamos las varianzas muestrales para probar la aseveración de varianzas poblacionales iguales, pero podemos plantear conclusiones en términos de desviaciones estándar. Puesto que estipulamos en esta sección que la varianza mayor se denota por , permitimos que , , y . Ahora procedemos a utilizar los pasos para generar la prueba de hipótesis. 1. La aseveración de desviaciones estándar iguales es equivalente a una aseveración de varianzas iguales, lo cual se expresa simbólicamente como . Si la aseveración original es falsa, entonces . Puesto que la hipótesis nula es la afirmación de igualdad y dado que la hipótesis alternativa no puede contener igualdad, tenemos:  (Aseveración original) 2. El nivel de significancia es . 3. Puesto que esta prueba implica dos varianzas poblacionales, utilizaremos la distribución F. El estadístico de prueba es: Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 26 4. En cuanto a los valores críticos, primero observe que se trata de una prueba de dos colas con 0.025 en cada cola. En tanto que estamos estipulando que la varianza más grande se coloca en el numerador para el estadístico de prueba F, necesitamos encontrar sólo el valor crítico de cola derecha. En las tablas de distribución F vemos que no hay 35 grados de libertad así que tomamos 30 grados de libertad que es el valor más cercano al 35 pero no se excede, así tenemos que Esta figura indica que el estadístico de prueba F = 1.7339 no se localiza dentro de la región crítica, por lo tanto, no rechazamos la hipótesis nula de varianzas iguales. Se deduce que no existe evidencia suficiente para sustentar el rechazo de la aseveración de desviaciones estándar iguales. 5. INTERPRETACIÓN: no existe suficiente evidencia para justificar el rechazo de la aseveración de que las dos desviaciones estándar son iguales. Si utilizamos un poco de sentido común básico, sabemos que las latas de Coca y Pepsi provienen de dos procesos de fabricación completamente separados e independientes, de manera que es poco probable que las dos varianzas poblacionales sean exactamente iguales. No obstante, con base en nuestro análisis podemos concluir que cualquier diferencia entre las dos desviaciones estándar poblacionales no es significativa. En el ejemplo anterior utilizamos pruebas de dos colas para la aseveración de varianzas iguales. Una prueba de cola derecha produciría el mismo estadístico de prueba F = 1.7339, pero un valor crítico de F diferente. Rechazo de No Rechazo de Rechazo de 0 Datos muestrales F = 1.7339 Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 27 RESUMEN DE FÓRMULAS PARA PRUEBAS DE HIPÓTESIS Estadístico de contraste con conocida y población infinita Estadístico de contraste con conocida y población finita Estadístico de contraste de la diferencia de medias con conocida donde: Estadístico de contraste con desconocida Estadístico de contraste con desconocida y población finita Estadístico de contraste de la diferencia de medias con desconocida donde: Estadístico de contraste de la proporción con población infinita Estadístico de contraste de la proporción con población finita Estadístico de contraste de la diferencia de proporciones Donde: y Estadístico de contraste de la varianza Estadístico de contraste de la relación de varianzas Con y grados de libertad Para el valor crítico “mayor” se usa el siguiente teorema: Instituto Tecnológico de León Material didáctico/Pruebas de hipótesis Elaboró Lic. Lilia A. Vázquez Gutiérrez Página 28 BIBLIOGRAFIA Triola, Mario F. Estadística. Décima edición Pearson Educación, México, 2009 Gutiérrez Pulido, Humberto Control estadístico de Calidad y Seis Sigma McGraw Hill, 2009 Lind, Douglas A., Marchal, William G., Wathen Samuel A. Estadística aplicada a los negocios y a la economía McGraw Hill 2008
Copyright © 2024 DOKUMEN.SITE Inc.