4.1 INTRODUCCIÓN PRUEBAS DE HIPÓTESIS Introducción: Prueba de hipótesis En esta unidad nos concentraremos en la prueba de hipótesis, otro aspecto de la inferencia estadística que al igual que la estimación del intervalo de confianza, se basa en la información de la muestra. Se desarrolla una metodología paso a paso que le permita hacer inferencias sobre un parámetro poblacional mediante el análisis diferencial entre los resultados observados (estadístico de la muestra) y los resultados de la muestra esperados si la hipótesis subyacente es realmente cierta. En el problema de estimación se trata de elegir el valor de un parámetro de la población, mientras que en las pruebas de hipótesis se trata de decidir entre aceptar o rechazar un valor especificado (por ejemplo, si el nivel de centramiento de un proceso es o no lo es).Prueba de hipótesis: Estadísticamente una prueba de hipótesis es cualquier afirmación acerca de una población y/o sus parámetros. Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal contraste involucra la toma de decisión acerca de las hipótesis. La decisión consiste en rechazar o no una hipótesis en favor de la otra. Una hipótesis estadística se denota por “H” y son dos: - Ho: hipótesis nula - H1: hipótesis alternativa Partes de una hipótesis 1-La hipótesis nula “Ho” 2-La hipótesis alternativa “H1” 3-El estadístico de prueba 4-Errores tipo I y II 5-La región de rechazo (crítica) 6 -La toma de decisión 1. Concepto: Una prueba de hipótesis estadística es una conjetura de una o más poblaciones. Nunca se sabe con absoluta certeza la verdad o falsedad de una hipótesis estadística, a no ser que se examine la población entera. Esto por su puesto sería impráctico en la mayoría de las situaciones. En su lugar, se toma una muestra aleatoria de la población de interés y se utilizan los datos que contiene tal muestra para proporcionar evidencia que confirme o no la hipótesis. La evidencia de la muestra que es un constante con la hipótesis planteada conduce a un rechazo de la misma mientras que la evidencia que apoya la hipótesis conduce a su aceptación. Definición de prueba de hipótesis estadística es que cuantifica el proceso de toma de decisiones. Por cada tipo de prueba de hipótesis se puede calcular una prueba estadística apropiada. Esta prueba estadística mide el acercamiento del calor de la etc. se debe determinar el valor crítico en la distribución estadística que divide la región del rechazo (en la cual la hipótesis nula no se puede rechazar) de la región de rechazo. La prueba estadística.muestra (como un promedio)a la hipótesis nula. La importancia de esta distribución radica en que permitemodelar numerosos fenómenosnaturales. de ahí que al uso de la . A hora bien el valor crítico depende del tamaño de la región de rechazo. Esta curva se conoce comocampana de Gauss.2 DISTRIBUCIÓN NORMAL Y DISTRIBUCIÓN T DE STUDENT Enestadísticayprobabilidads e l l a m a d i s t r i b u c i ó n n o r m a l . a una de lasdistribuciones de probabilidaddevariable continua que con más frecuencia aparece en fenómenos reales. Para la explicació n c a u s a l e s p r e c i s o e l d i s e ñ o experimental. la estadística es un modelo matemático que sólo permit e describir unfenómeno. Al tomar la decisión con respecto a la hipótesis nula. Mientras que los mecanismos que subyacen a granparte de este tipo de fenómenos son desconocidos. d i s t r i b u c i ó n d e G a u s s o distribución gaussiana. el uso del modelo normal puede justificarsea s u m i e n d o q u e c a d a o b s e r v a c i ó n s e o b t i e n e c o m o l a s u m a d e u n a s p o c a s c a u s a s independientes. La distribución apropiada de la prueba estadística se divide en dos regiones: una región de rechazo y una de no rechazo. sigue una distribución estadística bien conocida (normal. Lagráficade sufunción de densidadtiene una forma acampanada y es simétrica respectode un determinado parámetro. sociales y psicológicos. De hecho. 4. Si la prueba estadística cae en esta última región no se puede rechazar la hipótesis nula y se llega a la conclusión de que el proceso funciona correctamente. sin explicación alguna. por la enorme cantidad de variablesincontrolables que en ellos intervienen.) o se puede desarrollar una distribución para la prueba estadística particular. La distribución normal es la más extendida en estadística y muchos tests estadísticos están basados en una supuesta "normalidad". En probabilidad y estadística. l a d i s t r i b u c i ó n t ( d e S t u d e n t ) e s u n a distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño. la distribución normal maximiza la entropía entre todas las distribuciones con media y varianza conocidas. el cociente es una variable aleatoria que sigue ladistrib ución t de Student no centralcon parámetro de no-centralidad μ. la distribución muestral de las medias muéstrales es aproximadamente normal. . uno de los métodos de estimación más simples y antiguos. psicología y sociología sea conocidocomo método La distribución normal también es importante por su relación con l a e s t i m a c i ó n p o r mínimos cuadrados. lo cual la convierte en la elección natural de la distribución subyacente a una lista de datos resumidos en términos de media muestral y varianza. Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias entre dos medias muestrales y para la construcción del intervalo de confianza p a r a l a d i f e r e n c i a e n t r e l a s m e d i a s d e d o s p o b l a c i o n e s c u a n d o s e d e s c o n o c e l a desviación típica de una población y ésta debe ser estimada a partir de los datos de una muestra. cuando la distribución de la población de la cual se extrae la muestra no es normal.estadística en correlacional. La distribución normal también aparece en muchas área s de la propia estadística. Por ejemplo. Además. La distribución t de Student es la distribución de probabilidad del cociente Donde • Z tiene una distribución normal de media nula yvarianza1 • V tiene unadistribución chi-cuadradocon grados de libertad • Z y V son independientes Si μ es una constante no nula. diferencias degrupos.3 PRUEBAS DE SIGNIFICANCIA Las pruebas de significancia estadística son un procedimiento que brinda un criterioobjetivo para calificar las diferencias que se presentan al comparar los resultados de dosmuestras. . la diferencia entre ellas resulta lo suficientemente grande como para inferir queha ocurrido un cambio real en el indicador 4. esdecir. o el valor de la variableque hará de corte para definir dichos grupos. s e u t i l i z a e l p r o c e d i m i e n t o P r u e b a T p a r a m u e s t r a s independientes. Si el valor de la variable para un individuo esmenor o igual que el valor especificado.4 COMPARACIÓN DE DOS MUESTRAS INDEPENDIENTES: PRUEBAS T PARA LASDIFERENCIAS ENTRE NORMALES.5 PRUEBA DE FISHER PARA VARIANZAS Y DE IGUALDAD DE LAS VARIANZASDE DOS POBLACIONES NORMALES. Para comparar las medias de dos muestras aleatorias procedentes de dos poblacionesn o r m a l e s e i n d e p e n d i e n t e s . Entonces el sistema activa elbotón definir grupos y al presionarlo aparece una ventana donde se introducen los valoresde la variable que definen los dos grupos de sujetos a comparar. y para ello. se selecciona A continuación se abre una ventana con los siguientes campos:Contrastar variables: donde se han de introducir las variables que se van a analizar. La necesidad de disponer de métodos estadísticos para comparar las varianzas de dospoblaciones es evidente a partir del análisis de una sola población. aquellas variables sobre las que se va a contrastar si hay o no.Opciones: presionando este botón se obtiene una ventana donde se especifica igual queen la sección anterior el nivel de confianza para el intervalo y la forma de tratar los valoresmissing 4. por elcontrario. y encaso contrario.4. con el objetivo de explicar si dichas diferencias se mantienen dentro de loslímites previstos por el diseño estadístico (un error y una confianza esperados) o si. al segundo. el individuo pertenecerá al primer grupo.Variable de agrupación: aquí se debe introducir la variable que se utiliza para definir losgrupos de sujetos sobre los que se estudian las diferencias. a m e d a i y a l v a r a i n z a d e a l d i s t r b i u c ó i n F s o n . Esto es. cada una dividida entre sus respectivos grados de libertad. Entonces la distribución de la vari ablealeatoria está dada po ESTADISTICA INFERENCIAL 1 UNIDAD 4: PRUEBAS DE HIPOTESIS CON DOS MUESTRAS Y VARIASM U E S T R A S D E D A T O S N U M É R I C O S y se dice que sigue la distribución F con grados de libertad en el numerador yg r a d o s d e b i l e r a t d e n e d l e n o m n i a d o r L . la estabilidadd e u n p r o c e s o d e m a n u f a c t u r a c o n l a d e o t r o o h a s t a l a f o r m a e n q u e v a r í a e l procedimiento para calificar de un profesor universitario con la de otro. Por otra parte.I n t u i t i va m e n t e . y . utilizando la razón de las varianzas muestrales s 21 /s 22 .Frecuentemente sedesea comparar la precisión de un instrumento de medición con la de otro.Donde U y V son variables aleatorias ji-cuadrada independientes con grados de libertad respectivamente. p o d r í a m o s c o m p a r a r l a s va r i a n za s d e d o s p o b l a c i o n e s . se tendrápoca evidencia para indicar que y no son iguales.La variable aleatoria F se define como el cociente de dos variables aleatorias jicuadradaindependientes. un valor muyg rande o muy pequeño para s 21 /s 22 . respectivamente. Si s 21 /s 22 es casi igual a 1. proporcionará evidencia de una diferencia en las varianzas de las poblaciones.Sean U y V dos variables aleatorias independientes que tienen distribución ji cuadradascon grados de libertad.