Familia de diseños para comparar tratamientos.docx

March 29, 2018 | Author: Alejandro Soberano Morales | Category: Analysis Of Variance, Statistical Theory, Statistics, Statistical Analysis, Scientific Theories


Comments



Description

2.1. Familia de diseños para comparar tratamientos.Los diseños experimentales más utilizados para comparar tratamientos son: 1. 2. 3. 4. Diseño completamente al azar (DCA) Diseño en bloque completamente al azar (DBCA) Diseño en cuadro latino (DCL) Diseño en cuadro grecolatino (DCGL) La diferencia fundamental entre estos diseños es el número de factores de bloque que incorporan o controlan de forma explícita durante el experimento. La comparación de los tratamientos en cuanto a la respuesta media que logran, en cualquiera de estos diseños, se hace mediante la hipótesis que se prueba con la técnica estadística llamada Análisis de Varianza (ANOVA) con uno, dos, tres o cuatro criterios de clasificación, dependiendo del número de factores de bloques incorporados al diseño. Dise ño DC A DB CA DCL DC GL Factores de 0 1 ANOVA Modelo estadístico Un criterio Dos criterios 2 Tres criterios 3 Cuatro criterios Y es la variable de salida, la media global, son los efectos de tres factores de bloqueo. el efecto del i-ésimotratamiento, error aleatorio, y, El modelo estadístico que describe el comportamiento de la variable observada Y en cada diseño, incorpora un término adicional por cada factor de bloqueo controlado. De acuerdo con los modelos dados en la tabla, para cada diseño comparativo se tienen al menos dos fuentes de variabilidad: los tratamientos o niveles del factor de interés y el error aleatorio. Se agrega una nueva fuente de variabilidad por cada factor de bloque que se controla directamente. Se observa que los diseños suponen que no hay efectos de interacción entre los factores, lo cual sería lo deseable que ocurra; de no ocurrir así, tal efecto se recarga al error y el problema de comparación no se resuelve con éxito. Un efecto de interacción entre dos factores hace referencia a que el efecto de cada factor depende del nivel en que se encuentra el otro. 2.2. El modelo de efectos fijos El modelo de efectos fijos (es cuando se estudian todos los posibles tratamientos) de análisis de la varianza se aplica a situaciones en las que el experimentador ha sometido al grupo o material analizado a varios factores, cada uno de los cuales le afecta sólo a la media, permaneciendo la "variable respuesta" con una distribución normal. Este modelo se supone cuando el investigador se interesa únicamente por los niveles del factor presentes en el experimento, por lo que cualquier variación observada en las puntuaciones se deberá al error experimental. Donde es el parámetro de escala común a todos los tratamientos, llamado media global, ; es un parámetro que mide el efecto del tratamiento y es el error atribuible a la medición . Este modelo implica que en el diseño completamente al azar actuarían a lo más dos fuentes de variabilidad: Los tratamientos y el error aleatorio. La media global de la variable de respuesta no se considera una fuente de variabilidad por ser una constante común a todos los tratamientos, que hace las veces de punto de referencia con respecto al cual se comparan las respuestas medias de los tratamientos. Si la respuesta media de un tratamiento particular es ¨muy diferente¨ de la respuesta media global , es un síntoma de que existe un efecto de dicho tratamiento, ya que como se verá más adelante. La diferencia que debe tener las medias entre sí para concluir que hay un efecto (que los tratamientos son diferentes), nos lo dice el análisis de varianza (ANOVA). En la práctica puede suceder que los tratamientos que se desea comparar sean demasiados como para experimentar con todos. Cuando esto sucede es conveniente comparar sólo una muestra de la población de tratamientos, de modo que pasa a ser una variable aleatoria con su propia varianza que deberá estimarse a partir de los datos. En este capítulo sólo se presenta el caso en que todos los tratamientos que se tienen se prueban, es decir, se supone una población pequeña de tratamientos, lo cual hace posible compararlos a todos. En este caso, el modelo dado por la ecuación (2.2) se llama modelo de efectos fijos. 2.3. Diseño completamente al azar y ANOVA Muchas comparaciones, como las antes mencionadas, se hacen con base en el diseño completamente al azar (DCA), que es el más simple de todos los diseños que se utilizan para comparar dos o más tratamientos, dado que sólo consideran dos fuentes de Para ello. Al hacer las pruebas en orden completamente al azar se evitan sesgos y las mediciones en un tipo de cuero resultan independientes de las demás. Como criterio de desgaste se usa la pérdida de peso después de un número fijo de ciclos.2 Comparación de cuatro tipos de cuero (cuatro tratamientos) Tipo de cuero Observaciones Promedi o .2 Tabla 2.1 Diseño completamente al azar para el ejemplo 1 Método de ensamble A B C 6 7 1 1 8 9 1 7 1 6 8 0 1 8 1 D 1 0 1 2 1 1 Ejemplo 2 Comparación de cuatro tipos de cuero. Un equipo de mejora investiga el efecto de cuatro métodos de ensamble A. las cuales se pueden hacer con uno de los cuatro tipos de cuero A.variabilidad: los tratamientos y el error aleatorio. C y D. la suela de éstos se desgasta al pasarla por dicha superficie. C y D disponibles en el mercado. no existe ningún otro factor que influya de manera significativa sobre la variable de respuesta (tiempo de ensamble) Tabla 2. Los tiempos de ensamble obtenidos se muestran en la tabla 2. la estrategia experimental es aplicar cuatro veces los cuatro métodos de ensamble en orden completamente aleatorio (las 16 pruebas en orden aleatorio).1. Se prueban en orden aleatorio 24 zapatos. Si se usa el diseño completamente al azar (DCA). éstas se corren al azar. B. En la siguiente unidad veremos diseños que consideran la influencia de otras fuentes de variabilidad (bloques). además del método de ensamble. Los datos (en miligramos) sobre el desgaste de cada tipo de cuero se muestran en la tabla 2. Este diseño se llama completamente al azar porque todas las corridas experimentales se realizan en orden aleatorio completo. se supone que. sobre el tiempo de ensamble en minutos con un nivel de significancia de 0.05. si durante el estudio se hacen en total N pruebas. Un fabricante de calzado desea mejorar la calidad de las suelas. B. En primera instancia. Ejemplo 1 Comparación de cuatro métodos de ensamble. De esta manera. seis de cada tipo de cuero. de manera que los posibles efectos ambientales y temporales se vayan repartiendo equitativamente entre los tratamientos. prueba los cueros con una máquina que hace pasar los zapatos por una superficie abrasiva. 8 220.7 .8 230.A B C 264 260 258 241 262 255 208 220 216 200 213 206 220 263 219 225 230 256.7 209. en lugar de rangos. si es pequeño se confirma la validez de . Estadístico F para el ANOVA con un criterio (2. es un método estadístico útil para comparar dos o más medias poblacionales. Se denomina estimación de la varianza al interior de las muestras (Método dentro) El estadístico entonces resulta y tiene una distribución muestral que sigue una distribución F.Diseños completamente al azar y ANOVA 52 El análisis de la varianza de un criterio (ANOVA de un criterio) es una metodología para analizar la variación entre muestras y la variación al interior de las mismas con varianzas. así como su solución utilizando un paquete computacional. en cambio. Como tal. posteriormente el simplificado y más práctico.3) El cual se contrastara con el valor de encontrado en tablas en relación a los grados de libertad del numerador entre grados de libertad del denominador y con un nivel de significancia ( ) prefijado. El método de ANOVA con un criterio requiere del cálculo de dos estimaciones independientes para . se contradice la hipótesis de que no hay efectos de tratamientos. la varianza poblacional común. Estas dos estimaciones se denotan por y . El objetivo del análisis de varianza en el DCA es probar las hipótesis de igualdad de los tratamientos con respecto a la media de la correspondiente variable de respuesta: Nota: Primeramente explicare el cálculo manual tradicional para ANOVA. . Se denomina estimación de la varianza entre muestras (Método entre) . Se rechaza la si Se deduce que si es grande. Esto se debe a que la variabilidad de los valores de la muestra se determina comparando cada elemento .Método dentro Diseños completamente al azar y ANOVA 53 El método dentro de estimación de la varianza produce una estimación válida sin importar si la hipótesis nula de las medias poblacionales iguales es cierta. entonces la varianza de la distribución es igual al 2 error estándar al cuadrado. cada elemento obtenido de la población B se compara con la media muestral B. Esta varianza es una medida de las diferencias entre todas las medias muestrales que puedan obtenerse de la distribución y la media de la población. Este valor. (2. En ANOVA. La raíz cuadrada de esta varianza es el error estándar de la media. es decir.  = media del grupo j  C = número de grupos  n = número de elementos de la muestra en cada grupo. con frecuencia se llama la suma de cuadrados entre (SCb). Después. Además como se tienen c grupos. la diferencia estándar entre una media muestral y la media poblacional. se determina la diferencia entre la media de cada grupo y esta media poblacional estimada. c se multiplica por (n-1) para obtener los grados de libertad para el método dentro.4) El número adecuado de grados de libertad para el método dentro se calcula como c(n-1) si el número de observaciones en cada grupo es igual. Para entender el método entre recuerde el teorema del límite central.  = i-ésimo elemento de los datos de grupo j. para estimar la varianza de la distribución muestral de medias. y estas diferencias se elevan al cuadrado y se suman. Este importante teorema en estadística establece que la distribución de las medias muestrales tiende a una distribución normal conforme crece el tamaño de la muestra. La media de todos los valores muestrales proporciona esa estimación.en los datos con la media muestral. Grados de libertad para glw = C(n – 1) Método entre El segundo método para estimar la varianza común de la población produce una estimación válida sólo si la hipótesis nula es cierta. sólo (n-1) elementos de cada grupo pueden variar. se debe estimar primero la media poblacional. Como a cada elemento del grupo se le resta la media de ese grupo.  n. y así sucesivamente. Esta suma se divide entonces entre el número adecuado de grados de libertad . La ecuación para calcular la estimación de la varianza con el método dentro es: = donde:  = Estimación de la varianza muestral con el método entre. Cada valor de la muestra obtenido de la población A se compara con la media muestral A. con una media  y una desviación estándar n. Si el error estándar de la media es n. para obtener la estimación de la varianza de la distribución muestral. La ecuación siguiente da el cálculo de la estimación de la varianza de la distribución muestral de las medias: . Esta tabla tiene un formato estándar que usan los libros y los problemas de computadora que ejecutan ANOVA. Grados de libertad para glb = (C – 1) Tabla ANOVA Los resultados del análisis de varianza se presentan en una tabla ANOVA que resume los valores importantes de la prueba. los grados de libertad. . y la suma de las diferencias al cuadrado se divide entre los grados de libertad c(n-1). C = número de grupos n = número de elementos de la muestra en cada grupo si el número de observaciones en cada uno es el mismo.= donde:      (2. = media del grupo j. La siguiente tabla muestra la forma general de la tabla ANOVA. las estimaciones de la varianza y el valor F para el procedimiento de análisis de varianza. = media global (media de todos los valores). En dicha tabla se resumen los cálculos necesarios para la prueba de igualdad de las medias poblacionales usando análisis de varianza. Primero se usa el método dentro para 2 estimar  . Fuente de variación Grupos Entre Grupos Dentro Total SC GL 2 c-1 2 c(n-1) Estimación de / glb2 Coeficiente F / / glb   ( xij – x ) donde:  = Número de la columna  i = Número de la fila  c = Número de columnas (grupos)  n = Número de elementos en cada grupo (tamaño de la muestra) La tabla ANOVA contiene columnas con las fuentes de variación.5) = Estimación del método entre de la varianza poblacional común. usada como estimación de . Cada valor de los datos se compara con su propia media. las sumas de cuadrados. C y D. B. sobre el tiempo de ensamble en minutos tenemos: .Retomando el problema del efecto de cuatro métodos de ensamble A. 25 23.12) = 3.45 = 9. quedando de la siguiente manera Fuente de 2 Variación SC gl Estimación de  Coeficiente F ---------------------------------------------------------------------------------------------------------Grupos entre 69.Método de ensamble A B C D 6 7 1 1 1 0 8 9 1 1 7 1 6 2 0 8 1 1 8 1 1 Media ( i) 7.75/3 = 23.75 10.49 .05 y 3 grados de libertad en el numerador y 12 grados de libertad en el denominador es F0.48/12 = 2.25 8.25/2.73 C = 4.48 12 29.49 3 69.----------------------------------------------TOTA 98.5 Media global : = 9.45 ----------------------------------------------------------.5 12. n = 4 =4 = + + + Completando la tabla ANOVA.97 15 Como la hipótesis a probar es H0: H1: 1 = 2 = 3 = 4 No todas las poblaciones tienen la misma media El valor de F calculado por tabla cuando tenemos un nivel de significancia de 0.05 (3.42 Grupos 29. . concluyendo que sí hay diferencia o efecto de los métodos de ensamble en cuanto a su tiempo promedio. rechazamos la hipótesis nula y aceptamos la alterna.49).42) excede el valor crítico tabulado (3.Como nuestro estadístico de prueba F (9. ANOVA Como ya lo mencionamos el objetivo del análisis de varianza en el DCA es probar la hipótesis de igualdad de los tratamientos con respecto a la media de correspondiente variable de respuesta. con y . Las cantidades de interés son las siguientes:     Note que el punto indica la suma sobre el correspondiente subíndice.6) donde es el total de observaciones. Para probar la hipótesis dada por la relación: mediante la técnica de ANOVA.3 . . Tratamientos … … . como se hace a continuación. . lo primero es descomponer la variabilidad total de los datos en sus dos componentes: la variabilidad debida a tratamientos y la que corresponde al error aleatorio (equivalente al método entre y método dentro). … Notación de puntos Sirve para presentar de manera abreviada cantidades numéricas que se pueden calcular a partir de los datos experimentales donde representa la observación en el tratamiento .Ahora veremos el procedimiento y notación más comúnmente utilizado para la solución de ANOVA Tabla 2. . . algunas relaciones válidas son: (2. Así. Una medida de la variabilidad total presente en las observaciones de la tabla 2. .3 Diseño completamente al azar (DCA) . es la suma total de cuadrados ( ) dada por: . En forma abreviada. entonces la diferencia tenderá a ser grande en valor absoluto. respectivamente.11) (2. ya que si hay mucha variación entre las observaciones de cada tratamiento entonces tenderá a ser grande en valor absoluto. ya que si éstos son muy diferentes entre sí. La suma de cuadrados de tratamientos ( ) ésta dado por: (2.8) donde apreciamos que la mide la variación o diferencias entre tratamientos. esta descomposición de la suma total de cuadrados se puede describir como: (2.(2. el estadístico . Los dos que más interesan son el cuadrado medio de tratamientos ( ) y el cuadrado medio del error ( .12) Con base en este hecho se construye el estadístico de prueba como sigue: se sabe que y son independientes. bajo el supuesto de que la hipótesis es verdadera. Entonces. por lo que y son dos variables son dos variables aleatorias independientes con distribución ji-cuadrada con y grados de libertad. y con ello también será grande la La suma de cuadrados del error ( ) ésta dado por: (2.10) La suma de cuadrados divididos entre sus respectivos grados de libertad se llaman cuadrados medios.9) donde la mide la variación dentro de tratamientos.7) donde es la suma de los datos en el experimento. que se denotan por: (2. se contradice la hipótesis de que no hay efecto de tratamientos. en cambio.13) sigue una distribución con ( grados de libertad en el numerador y ( ) grados de libertad en el denominador. De la ecuación (2.13) se deduce que si es grande.(2. si . 50 12.4 Tabla de ANOVA para DCA SC GL CM Valorp Tratamient os ) Er ro r Análisis del ejemplo 1 (comparación de cuatro tipos de métodos de ensamble). También se rechaza si el valor-p . cuadrado medio. suma de cuadrados. las abreviaturas significan lo siguiente: fuente de variabilidad (efecto).50 Desviaciones respecto -1. donde el valor-p es el área bajo la distribución a la derecha del estadístico .75 A la media global ( -2. Así para un nivel de significancia prefijado. es decir. se rechaza si donde es el percentil ( ) x 100 de la distribución . el ) Toda la información necesaria para calcular el estadístico hasta llegar al valorp se escribe en la llamada tabla de análisis de varianza (ANOVA) que se muestra en la tabla 2.4.es pequeño se confirma la validez de .75 10. En esta tabla.25 8. La interrogante que se planteó en el problema de la comparación entre los cuatro tipos de métodos de ensamble fue: ¿existen diferencias entre el tiempo promedio de los diferentes métodos de ensamble? La respuesta a esta pregunta es el resultado de contrastar las hipótesis: Cálculos manuales Detalles de los cálculos para el ANOVA en DCA para el tiempo de ensamble Métodos de ensamble Observaciones A B D6 7 11 10 8 9 16 12 7 10 11 11 C Total por Tratamiento ( 29 34 51 42 Numero de datos En cada tratamiento ( 4 4 4 4 Media muestral por Tratamiento ( 7. estadístico de prueba.25 3. valor-p = significancia observada Tabla 2.0 0. grados de libertad.50 Operaciones básicas = Suma de los cuadrados de todas las observaciones o datos = suma de los datos mediciones global total de media . El valor de la significancia observada o valor-p es el área bajo la curva de la distribución a la derecha de .4 2 Val or críti co 3.Suma de cuadrados de tratamientos o variabilidad debida a la diferencia entre métodos de ensamble: 3. lo cual es difícil de calcular de forma manual..5 Total 99 . 46 9.5 Error 29 . Sin embargo.Cuadrados medios de tratamientos y del error (efecto ponderado de cada fuente de variación): 5.0 G L C M 3 1 12 5 23. recordemos que otra forma de rechazar o no una hipótesis es comparar el estadístico de prueba contra un número crítico de tablas. cuando esto no sea posible.Suma de cuadrados del error o variabilidad dentro de métodos de ensamble: 4. en donde se lee que el valor crítico para es ... En el caso de las tablas de la distribución ..Estadístico de prueba: Con toda esta información se procede a llenar la tabla ANOVA..Suma total de cuadrados o variabilidad total de los datos: = 1620 2. Como: entonces se rechaza .49 .1. 17 2. con lo cual se concluye que sí hay diferencias o efecto de los métodos de ensamble en cuanto a su tiempo promedio Tabla ANOVA S Fuente de C variacione s Tratamient 69 os . para el ejemplo 1 de los tiempos de ensamble para los cuatro métodos. .Resultados arrojados en un paquete computacional (Excel y Minitab). por lo tanto.1) que el método C parece diferente al los métodos A y B en cuanto a sus medias.75 0 10.5 10. B. es necesario hacer pruebas estadísticas porque los datos que se analizan en los . se observa un poco más de variabilidad en el método C que en todos los demás.Est. Lo que sigue es verificar que lo que se observa en el diagrama de cajas implica diferencias significativas entre los distintos tratamientos. para hacer análisis por estratos (lotes.17 0 29.(ajustado) = 62. y es de suma utilidad para comparar procesos.5 2.46 0 99.0 Desv.500 12. En el resultado arrojado por Minitab se observa en la figura (figura 2.363 1.6 0 CAPÍTULO 2 Diseño de experimentos de un factor ANOVA unidireccional: A. 0. la media del método D también se ve diferente a la media del método A.Est. en general.957 1. proveedores.0 0 R-cuad.568 Diagrama de cajas simultáneos Los diagramas de cajas es una herramienta para describir el comportamiento e unos datos.5 15.20% Media 7.75% ICs de 95% individuales para la media basados en Desv. agrupada = 1.291 2.Est .5 23. turnos). tratamientos y.50 0 Desv. Por otra parte.250 8. = 70. agrupada --------+---------+---------+--------+(------*------) (------*------) (------*------) (------*------) --------+---------+---------+--------7.291 P 0.568 Niv el A B C D N 4 4 4 4 SC MC 69. C.00 2 R-cuad. D Minitab Fuent e Facto r Error Total G L 3 1 2 1 5 S = 1.0 12. factor diagramas .6 CAPÍTULO Diseño de experimentos de 0 2 de cajas son unmuestras. y la probabilidad es mayor en la medida que los diagramas están basados en más datos.7 266.1 Diagrama de cajas para los métodos de ensamble Análisis del ejemplo 2 (comparación de cuatro tipos de cuero). Cuando se traslapan un poco puede ser que haya o no diferencias significativas. se muestra el análisis de varianza para este ejemplo.1666667 Varianza 68.En general. y en cualquier caso es conveniente utilizar una prueba estadística para determinar cuáles diferencias son significativas.5 230.5 15. La interrogante que se planteó en el problema de la comparación entre los cuatro tipos de cuero fue: ¿existen diferencias entre el desgaste promedio de los diferentes tipos de cuero? La respuesta a esta pregunta es el resultado de contrastar las hipótesis: En el resultado arrojado por Excel. B.0 7.6666667 210. Como el valor-p = 0.6666667 52. Gráfica de caja de A.0000 es menor que la significancia prefijada .5 5. C.9666667 .0 12.5 Datos 10.0 A B C D Figura 2. cuando los diagramas no se traslapan es probable que los tratamientos correspondientes sean diferentes entre sí.966667 22. Estas pruebas se verán en la siguiente sección.8333333 221. se rechaza y se acepta que al menos un par de tipos de cuero tiene un desgaste promedio diferente Análisis de varianza de un factor en Excel RESUMEN Grupos A B C D Cuenta 6 6 6 6 Suma 1540 1263 1385 1327 Promedio 256. D 17. 81944 4 102.825 F Probabilidad 22. 5 9075.098391 224 .958333 Grados de 3 2 0 2 3 Promedio de los 2339.ANÁLISIS DE VARIANZA Origen de las Entre grupos Dentro de los grupos Total Suma de 7019.7553556 1.17615E-06 Valor crítico 3.458333 2056. 14 .29 67 210.17 4. 8. agrupada = 10.26 (----50 *----) 230. = 77. agrupada Media Desv. 7.3 (---221.79 (----*-----) ----+---------+---------+---------+----208 224 240 256 Desv. C.(ajustado) = 73.Est.ANOVA unidireccional: A.14 Nivel A 6 B 6 C 6 D N 6 SC MC F 70 2340 19 20 103 57 90 76 R-cuad. B.Est.34% P 0.94% ICs de 95% individuales para la media basados en Desv. ----+---------+---------+---------+----(----*-----) 256. D Minitab Fuent e Facto r Error Total G L 3 2 0 2 3 S = 10. 16.0 00 R-cuad.Est.
Copyright © 2024 DOKUMEN.SITE Inc.