EL ANÁLISIS DE LA VARIANZA

March 28, 2018 | Author: Návi Beaches Cuisine | Category: Analysis Of Variance, Statistics, Scientific Method, Science, Mathematics


Comments



Description

Vilchis Cuessi Iván de Jesús Minatitlán, Veracruz a 9 de diciembre del 2009PROBABILIDAD Y ESTADISTICA EL ANÁLISIS DE LA VARIANZA En estadística, el análisis de la varianza o análisis de varianza (ANOVA, según terminología inglesa) es una colección de modelos estadísticos y sus procedimientos asociados, en el cual la varianza esta particionada en ciertos componentes debidos a diferentes variables explicativas. Las técnicas iniciales del análisis de varianza fueron desarrolladas por el estadístico y genetista R. A. Fisher en los años 1920 y 1930 y es algunas veces conocido como Anova de Fisher o análisis de varianza de Fisher, debido al uso de la distribución F de Fisher como parte del contraste de hipótesis. El análisis de varianza sirve para comparar si los valores de un conjunto de datos numéricos son significativamente distintos a los valores de otro o más conjuntos de datos. El procedimiento para comparar estos valores está basado en la varianza global observada en los grupos de datos numéricos a comparar. Típicamente, el análisis de varianza se utiliza para asociar una probabilidad a la conclusión de que la media de un grupo de puntuaciones es distinta de la media de otro grupo de puntuaciones. El análisis de la varianza es una potente herramienta estadística, de gran utilidad tanto en la industria, para el control de procesos, como en el laboratorio de análisis, para el control de métodos analíticos. Los ejemplos de aplicación son múltiples, pudiéndose agrupar, según el objetivo que persiguen, en dos principalmente: la comparación de múltiples columnas de datos y la estimación de los componentes de variación de un proceso. El objetivo de este análisis es introducir una de las técnicas fundamentales del diseño experimental: el análisis de la varianza; un contraste de hipótesis estadísticas, que afecta simultáneamente a los valores medios o esperados de k poblaciones (variables aleatorias) con distribución normal y homoscedásticas, es decir, con idénticas varianzas. Existen tres clases conceptuales de estos modelos: 1. El Modelo de efectos fijos asume que los datos provienen de poblaciones normales las cuales podrían diferir únicamente en sus medias. (Modelo 1) 2. El Modelo de efectos aleatorios asume que los datos describen una jerarquía de diferentes poblaciones cuyas diferencias quedan restringidas por la jerarquía. Ejemplo: El experimentador ha aprendido y ha considerado en el experimento sólo tres de muchos más métodos posibles, el método de enseñanza es un factor aleatorio en el experimento. (Modelo 2) 3. El Modelo de efectos mixtos describen situaciones que éste puede tomar. Ejemplo: Si el método de enseñanza es analizado como un factor que puede influir donde están presentes ambos tipos de factores: fijos y aleatorios. (Modelo 3) En el caso más sencillo, modelo de ANOVA de un factor de efectos fijos, interviene una variable aleatoria Y, denominada variable observable o variable respuesta, que se analiza en k situaciones experimentales, las cuales definen el llamado factor o vía : diferentes condiciones. controlado o aleatorio. Una de las herramientas estadísticas más utilizadas que permite la separación de las diversas fuentes de variación es el análisis de la varianza (ANOVA. hablaremos del ANOVA de un factor.. En la tabla 1 se muestran los resultados obtenidos (expresados en g/L). Así.. Las varianzas de cada conjunto de datos no deben diferir de forma significativa. puede interesar comparar diversos métodos de análisis con diferentes características. tales como la concentración de reactivo A y la temperatura a la que tiene lugar la reacción. Tomemos como ejemplo la comparación de 5 laboratorios que analizan nk veces con el mismo procedimiento la concentración de Pb en una misma muestra de agua de río. 3. Aparte de la variación natural en la medida tendremos una variación en la composición del vino de les diferentes partes del depósito. diversos analistas entre sí. o una serie de laboratorios que analizan una misma muestra con el mismo método (ensayos colaborativos). Cuando tengamos un factor. El ANOVA también puede utilizarse en situaciones donde ambas fuentes de variación son aleatorias. En todos estos ejemplos hay dos posibles fuentes de variación: una es el error aleatorio en la medida y la otra es lo que se denomina factor controlado (tipo de método.. seguido del ANOVA. por ejemplo. El objetivo del ANOVA aquí es comparar los errores sistemáticos con los aleatorios obtenidos al realizar diversos análisis en cada laboratorio. Hemos comentado antes que son condiciones importantes que cada laboratorio analice sus muestras de manera independiente y con precisiones parecidas a las del resto de laboratorios. 1997]. En los casos donde tenemos dos o más factores que influyen. 2. También sería el caso cuando queremos analizar una muestra que ha estado sometida a diferentes tratamientos o ha estado almacenada en diferentes condiciones. Para utilizar el ANOVA de forma satisfactoria deben cumplirse tres tipos de hipótesis. Los resultados obtenidos para cada conjunto deben seguir una distribución normal. del inglés Analysis of Variance) [Massart. Se puede deducir entonces si cada uno de los factores o una interacción entre ellos tienen influencia significativa en el resultado. Un ejemplo sería el análisis de algún compuesto de un vino almacenado en un depósito. analista o laboratorio. aunque se aceptan ligeras desviaciones de las condiciones ideales: 1.). Supongamos que las muestras se toman aleatoriamente de diferentes partes del depósito y se realizan diversos análisis replicados. entonces hablaríamos de un ANOVA de dos factores. Veracruz a 9 de diciembre del 2009 PROBABILIDAD Y ESTADISTICA La comparación de diversos conjuntos de resultados es habitual en los laboratorios analíticos. se realizan los experimentos para todas las combinaciones de los factores estudiados. Cada conjunto de datos debe ser independiente del resto.Vilchis Cuessi Iván de Jesús Minatitlán. aparte del error propio de la medida. En el caso de que estuviésemos desarrollando un nuevo método colorimétrico y quisiéramos investigar la influencia de diversos factores independientes sobre la absorbancia. . Veracruz a 9 de diciembre del 2009 PROBABILIDAD Y ESTADISTICA Observando los valores medios todo parece indicar que existen diferencias entre los laboratorios. debida a los errores aleatorios. de cada laboratorio (donde j indica el nº de repetición) y la media del laboratorio (xk) y. por lo tanto. se obtiene el cuadrado medio (o MS. Ahora bien. es una medida de la dispersión dentro de los laboratorios. dividido por sus grados de libertad. Matemáticamente. SSR mide las desviaciones entre los resultados individuales ( xkj). . los valores medios respectivos no diferirán mucho los unos de los otros y su dispersión. constituye el cuadrado medio "entre laboratorios". MSR.K). Cuando se divide SSR por los correspondientes grados de libertad. puede descomponerse como una suma de dos sumas de cuadrados: SST = SSR + SSlab SST es la suma de las diferencias al cuadrado de cada resultado individual respecto a la media de todos los resultados y por tanto. SSlab mide las desviaciones entre los resultados medios de los laboratorios y el resultado medio global y.Vilchis Cuessi Iván de Jesús Minatitlán. representa la variación total de los datos. en descomponer la variabilidad total de los datos en dos fuentes de variación: la debida a los laboratorios y la debida a la precisión dentro de cada laboratorio. El objetivo del ANOVA es comparar los diversos valores medios para determinar si alguno de ellos difiere significativamente del resto. pues. La Tabla 2 muestra las diferentes expresiones para calcular las sumas de cuadrados y las correspondientes varianzas. será comparable a la dispersión presente individualmente en cada laboratorio. del inglés Mean Square) "dentro de los laboratorios". El secreto está. ¿son dichas diferencias significativas? El ANOVA responde a esta cuestión. Por su lado. (k -1). (N . Para ello se utiliza una estrategia bien lógica: si los resultados proporcionados por los diversos laboratorios no contienen errores sistemáticos. MSlab. la suma de cuadrados total. SST. En el ejemplo que hemos presentado.Vilchis Cuessi Iván de Jesús Minatitlán. Veracruz a 9 de diciembre del 2009 PROBABILIDAD Y ESTADISTICA Se calculan. Una inspección visual de los resultados puede proporcionar sin duda alguna pista. A continuación se muestra la típica tabla ANOVA obtenida para los resultados del ejemplo de la Tabla 1: Como Fcal > Ftab. la presencia de errores aleatorios será la causa predominante de la discrepancia entre los valores medios. MSlab y MSR como una medida de las dispersiones comentadas y se comparan mediante una prueba de hipótesis F. MSlab será mucho mayor que MSR. El valor de probabilidad que aparece en la Tabla 3 indica aquel valor de a partir del cual el ANOVA no detectaría ninguna diferencia significativa. Si no existe diferencia estadísticamente significativa entre ellas. pero si se quieren tener criterios más sólidos. Si. por el contrario. Así pues. mayor seguridad de que existen diferencias significativas. Se hubiese podido plantear que cada laboratorio utilizase dos procedimientos comunes. en este caso se podría concluir que al menos uno de los laboratorios ha producido resultados la media de los cuales difiere de forma estadísticamente significativa del resto de laboratorios. Sería un ejemplo de ANOVA de dos factores. con lo cual el valor calculado de F será mayor que el valor tabulado Ftab para el nivel de significación escogido y los grados de libertad mencionados. En este caso dispondríamos de los resultados del contenido en plomo obtenidos por una serie de laboratorios con dos métodos distintos. hay diversas pruebas estadísticas que permiten saber de qué laboratorios se trata [Massart. y el ANOVA nos proporcionaría información sobre la existencia de discrepancias entre laboratorios y entre métodos. existe algún error sistemático. . todos los laboratorios han analizado la muestra siguiendo un procedimiento analítico común. a menor valor de probabilidad. por tanto. El ANOVA no indica cuántos laboratorios difieren ni cuáles son. por ejemplo el método oficial y un método alternativo. 1997].
Copyright © 2024 DOKUMEN.SITE Inc.