Instituto Tecnológico De Lázaro Cárdenas5° Semestre Asignatura: Estadística Inferencial II Profesor: Lic. Isaac Vázquez Esqueda Unidad 5 Diseño Experimental con bloques al azar y diseños factoriales. Alumna: Arantza Aquino Prado Cd. Lázaro Cárdenas, Mich. A 30 de noviembre del 2013. Diseño experimental que sirve para estudiar el efecto individual y de interacción de varios factores sobre una o varias respuestas .Es decir lo que se busca es estudiar la relación entre factores y la respuesta, con la finalidad de conocer mejor como es esta relación y generar conocimiento que permita tomar acciones y decisiones que mejoren el desempeño de proceso.2Estadistica II Diseño factorial Uno de los objetivos particulares más importantes que en general tiene un diseño factorial es determinar una combinación de niveles de los factores en la cual el desempeño del proceso sea mejor que en las condiciones de operación actuales, es decir, encontrar nuevas condiciones de operación que eliminen o disminuyan cierto problema de calidad en la variable de salida. Contenido temático Unidad 5: Diseño experimental con bloques al azar y diseños factoriales. 5.1 Metodología del diseño experimental de bloques al azar. 5.2 Diseño de experimentos factoriales. 5.3 Diseño factorial 2k 5.4 Diseño de cuadrados latinos. 5.5 Diseño de cuadrados grecolatinos. 5.6 Aplicaciones. es el término del error aleatorio. Las restricciones del modelo son . los efectos de los tratamientos y de los bloques son definidos como desviaciones de la media global. Modelo Estadístico Para este diseño el modelo lineal esta dado por Donde es la media global de los tratamientos. Las observaciones pueden presentarse con el modelo estadístico lineal Donde μ es la media global. iτ es el efecto del i-ésimo tratamiento. los efectos de los tratamientos y de bloques son considerados como factores fijos.En principio. el cual se distribuye normal e independiente con media 0 y varianza .1 METODOLOGÍA DEL DISEÑO EXPERIMENTAL DE BLOQUES AL AZAR. el cual se supone que tiene una distribución normal e independiente con media cero y varianza (). Por otro lado. jβ es el efecto del j ésimo bloque y jiε es el término de error aleatorio. y que el experimento se efectúa en b bloques. y el orden en que se toman estas observaciones se asigna de manera aleatoria dentro del bloque. es el efecto del tratamiento el cual es constante para todas las observaciones dentro del tratamiento. El procedimiento general para el diseño aleatorizado por bloques completos consiste en seleccionar b bloques y realizar una réplica completa del experimento en cada uno de ellos. es el efecto del bloque. Unidad 5 5. Suponga que tiene interés en un solo factor que tiene a niveles. En cada bloque existen a observaciones (una por cada nivel del factor). En muchos problemas de diseño experimental es necesario diseñar el experimento de modo que sea posible controlar la variabilidad generada por un factor indeseable. se obtiene como estimadores de los parámetros Tabla Anova . Análisis de varianza para un diseño de bloques completos al azar Valor esperado Causa de Grados de Suma de Cuadrado de variación libertad cuadrados medio cuadrados medios Tratamient os Bloques Error Total Para contrastar las hipótesis de no efectos de tratamientos .Análisis de Varianza La tabla de análisis de varianza para este diseño se presenta a continuación: Tabla 02.Estimación de parámetros Al aplicar el método de mínimos cuadrados. Se puede utilizar el cociente ya que si es cierta y así . lo cual quiere decir que es un estimador intestado de y como además es también un estimador de entonces de tienen dos estimadores intestados de y por tanto su cociente deber ser un valor estadísticamente cercano a 1. Supuestos del modelo El residual en un diseño de bloques completos al azar es dado por Los supuestos del modelo son: El modelo es aditivo. Las varianzas de cada una de las poblaciones son iguales . es decir no existe interacción entre bloques y tratamientos Las variables aleatorias error se distribuyen normal con media cero Las variables aleatorias error son no correlacionadas (independientes) Otra manera de enunciar los supuestos es: . las respuestas dentro de los bloques tienen la misma tendencia con respecto a los efectos de los tratamientos. Los efectos de tratamientos y bloques son aditivos. Las observaciones en las celdas constituyen muestras aleatorias de tamaño 1 de cada una de las poblaciones Todas las poblaciones son normalmente distribuidas. Estas deben ser localizadas y examinadas para buscar causas asignables. Antes de probar cualquier supuesto se debe asegurar que no existan valores outlier en los datos. La eliminación arbitraria de valores extremos debe evitarse. Para algunos valores de solamente acotados para valores críticos pueden ser obtenidos. Si este valor excede el valor crítico de tabla.6b. el poco efecto es debido a que los tratamientos son igualmente replicados. Las clasificaciones filas y columnas son intercambiables. la mejor prueba para detectar un solo outlier es basada en el máximo residuo normalizado (MRN) Stefansky (1972) describe un método general para calcular valores críticos del MRN y provee tablas para el caso de dos vías de clasificación con una observación por celda.6a y C. El máximo residuo normalizado es dado por: Donde: y es el mayor residual en valor absoluto. 3. Cuando el diseño tiene residuales con varianza común. La no actividad puede ser más seria ya que puede aumentar el estimado del error experimental (CM resultando en posibles fallas para detectar diferencias reales de los tratamientos. como podría ser el caso de diseños balanceado. aunque este puede ser mayor que el nivel dado. Algunos trabajos han venido desarrollándose para detectar outlier en clasificaciones a dos vías que incluyen el DBC. la observación es declarada como un outlier potencial. La desviación relativamente grande del supuesto de homogeneidad de varianzas tiene muy poco efecto sobre el nivel de significancia. Esas tablas son reproducidas en Martin Tablas C.Si la primera condición se tiene se dice que los efectos de bloques y tratamientos no interactúan y una prueba para la no aditividad es debida a Tukey (1949) y Ascombe. . 2. Validación de los supuestos del modelo Antes de conocer los métodos de validación de supuestos es importante hacer las siguientes observaciones: 1. . Las pruebas analíticas para igualdad de varianza dadas por el DCA no son aplicables a bloques ya que no se tienen estimadores independientes de las varianzas de los tratamientos. Existen algunos procedimientos. .Homogeneidad de varianza La prueba gráfica de igualdad de varianza es graficar los residuales contra los valores predichos ( si existe algún patrón especial que muestre mayor dispersión para un lado de la gráfica se puede decir que no hay homogeneidad de varianza. pero son independientes entre bloques. Esta prueba es especialmente para un DBC y asume: Las poblaciones muestreadas sean normalmente distribuidas Los errores son igualmente correlacionados dentro de los bloques. La prueba estadística es: Donde el estimado de la varianza para el tratamiento es: Donde es el número de bloques y los son los residuales en el tratamiento . Observe que para el calculo de la varianza del tratamiento 1 utiliza a la medias de los bloques. por ello la no independencia de las varianzas. y para el tratamiento 2 utiliza también a a la medias de los bloques . pero quizá el más simple es el desarrollado por Han ( . Note que la varianza no es calculada directamente de los datos. Las respuestas en bushels por acre. Se rechaza la hipótesis de homogeneidad de varianzas si . Ejemplo Los datos presentados son tomados de Graybill (1954) de ensayos de variedades de trigo.56 12 7.47 19. Los puntos de porcentaje de han sido tabulados por Harter (1960) y pueden ser obtenidos en la tabla C-7 de Martin.45 10 46.48 29.69 20.05 20.32 34.59 29.70 26.53 22.40 21.28 11 14. y el aproximado percentil cinco de .56 25.57 18.76 16.15 39.95 8 55.16 Las varianzas muéstrales de los tratamientos son: Por consiguiente .29 24.08 14.61 17.60 24.19 16.84 3 18.69 16.79 21.65 23. 1 2 3 4 1 43.52 4.41 2 40.29 5 45.24 31.87 25.19 30.04 7 55.17 32. son dadas en la tabla.08 6 25.25 43. Tomando .31 27.20 29. Cuatro variedades de trigo crecieron en cada una de trece localidades del estado de Oklahoma.Los valores críticos de la prueba estadística son basados sobre puntos de porcentaje de la distribución rango estudentizado en vez de la distribución Fmax.08 4 19.33 20. .20 38.79 22.05 19.60 23.95 33.88 15.61 23.31 22.19 18. Bajo esta prueba la hipótesis nula de igualdad de varianzas es rechazada.68 19.78 18.08 13 41. variedades Loc.12 9 19.52 22.77 21. Aunque una prueba significante para tratamientos implicaría diferencias entre las medias de los tratamientos. Una tendencia cuadrática en el gráfico indica la presencia de no aditividad transformable. Para detectar la no aditividad gráficamente. esto es. Existe aditividad cuando se cumple que para todo y . Cuando no existe aditividad el estimado del error experimental es inflado resultando así un sesgo negativo para la prueba de tratamientos. una prueba no significativa no necesariamente implica que no hay efecto de las medias de los tratamientos. puede usarse . TUKEY(1949a). no aditividad que puede ser removida por la aplicación de una transformación. asumiendo un modelo de la forma Es decir. este procedimiento supone que la forma de interacción es particularmente simple o sea Donde es una constante desconocida. considere el modelo para el diseño de bloques completos al azar con interacción Donde es la componente de interacción (no aditividad). desarrolló una prueba de un solo grado de libertad para determinar si existe el efecto de interacción. se debe realizar un gráfico de dispersión entre los residuales (eje Y) y los valores predichos (eje X).La Aditividad del modelo Este es un problema más serio que la homogeneidad de varianzas. Para determinarla naturaleza de la no aditividad. Si se define la interacción de esta forma. Note que cada celda contiene exactamente observaciones que en el caso de bloques completos es una. La tabla de ANOVA es dada por: Causa de Grados de Suma de C.M variación libertad cuadrados Tratamientos t-1 SC Bloques b-1 SC Residual (t-1)(b-1) Error (t-1)(b-1)-1 SC No aditividad 1 SC TOTAL N-1 Acombe (1961) propuso una prueba general que puede ser usada para cualquier modelo lineal. incluyendo modelos de regresión Donde es dado en la instrucción . al probar la hipótesis .el método de regresión para probar la significancia de este término. MODEL Y= Bloque Ttos. VAR Z. MODEL Y2=Bloque Ttos/SS1.Utilizando SAS Data TRIGO. SET VALIDA.55 y el denominador es la Suma de cuadrados del error para el ANOVA obtenido en la instrucción MODEL Y2=Bloque Ttos/SS1 dado por . PROC ANOVA. Y2= PRE*PRE. CLASS Bloque Ttos./*excluye las variables PRE y RES*/ PROC MEANS DATA= NUEVO SUM. Input LOC VAR Y. Cards. DATA NUEVO. Z= RES*Y2. . RUN. El numerador de la suma de cuadrados de la no aditividad es el cuadrado del total de SUM de Z = 15957. OUTPUT OUT= VALIDA PREDICTED (o P)=PRE RESIDUAL (o R)= RES. DROP PRE RES. PROC GLM. CLASS Bloque Ttos. 9 6.94079804. .SC = 265419.8 4.55 0.000 Residual 36 2026.3 Error* 35 No aditividad 1 SC TOTAL 51 6251.6 Donde La hipótesis a probar es La hipótesis de aditividad es rechazada al nivel 5%.2 259.62 0.91 56.001 Bloques 12 3118.6 368. Luego la suma de cuadrados de no aditividad es dado por Causa de Grados de Suma de Cuadrado F Valor p variación libertad cuadrados medio Tratamientos 3 1106. como lo mostró Kempthorne (1952. por medio de las medias de tratamientos . Como una ilustración del primer caso puede ser que las unidades experimentales sean las hojas de las plantas y que las plantas sean los bloques. la no aditividad en una tabla a dos vías puede ser debida a interacción o a la no homogeneidad de varianzas. En vez de esto se puede remover tal no aditividad a través de una transformación disponible usando los métodos de transformación.Ejercicio Suponga la siguiente tabla de un BC Tratamientos Bloques A B C 1 4 7 4 2 4 4 4 3 2 5 2 Qué hacer si no se cumple el supuesto de aditividad Cuando no se cumple del supuesto de aditividad se pueden presentar los siguientes problemas: si el investigador quiere comparar y hacer recomendaciones sobre los tratamientos. La no aditividad puede conllevar a diferentes acciones dependiendo de la forma de construcción de los bloques: aquellos construidos de manera ``natural'' dividendo las unidades experimentales heterogéneas existentes en grupos homogéneos y aquellos donde los bloques son introducidos por el investigador en la forma de factores de bloqueo. principalmente para ampliar las inferencias acerca de los tratamientos. El segundo caso puede ser representado como por un experimento con plantas como unidades experimentales y los bloques las diferentes variedades de plantas. Sección 8. También.3). la presencia de interacción entre los bloques y los tratamientos implica que tales comparaciones no son la misma para todos los bloques. con la no aditividad no es posible obtener un ``razonable'' error estándar para la comparación de los tratamientos. Y finalmente. puede representar una idea equivocada. Por consiguiente hacer comparaciones de la manera usual. En el primer caso claramente cualquier intento por explicar o modelar la no aditividad no es de valor con respecto a la comparación de los tratamientos. En este caso es útil realizar un . si son dos factores en estudio se tiene: τi = τkl = αk + γl + ξkl . con la misma varianza para cada tratamiento o nivel del factor. los residuos se agrupan en una tabla de distribución de frecuencias. En el segundo caso puede ser muy importante modelar la posible no aditividad como un significado de la interpretación diferencial de los efectos de tratamientos. en este caso las interacciones entre bloques y tratamientos pueden ser más importantes que los mismos efectos de tratamientos. Si la suposición es válida los puntos tenderán a agruparse sobre una línea recta que pasa por el punto medio. Para esto. Los valores de los residuos del diseño aleatorizado por bloques completos se obtienen. En efecto. por la diferencia entre los valores observados y los estimados El análisis de varianza del modelo supone que las observaciones están distribuidas de manera normal e independiente. si el diseño experimental es bloques al azar. La suposición de normalidad puede verificarse mediante la construcción de una gráfica de probabilidad normal de los residuos. Se puede sugerir entonces que en lo posible se utilice un diseño diferente como el diseño de bloques generalizado. de manera que el efecto del tratamiento τi se considera a su vez compuesto de los efectos de los factores y sus interacciones.gráfico del valor absoluto de los residuales contra las observaciones para tener alguna idea sobre la transformación apropiada de los datos. el modelo es: yij = µ + τi + βj + ǫij Respuesta = media general + efecto de tratamiento + efecto de bloque + error Si se trata de un diseño factorial. Estas suposiciones deben verificarse mediante el análisis de los residuos. se calcula la frecuencia relativa acumulada para cada valor y se grafican en una hoja de papel de probabilidad normal. En cualquier experimento diseñado. Así.2 DISEÑO DE EXPERIMENTOS FACTORIALES. Por ejemplo. Independencia. los tratamientos se forman combinando los niveles de los factores en estudio. 5. Aditivita e Igualdad de varianzas) que pueden invalidar los resultados. es siempre importante examinar los residuos y verificar si se violan las suposiciones básicas (Normalidad. como es usual. por ejemplo. e. (Factoriales fraccionales) Suponga un diseño con dos factores: A con a niveles y B con b niveles. es decir. 3.e. Se amplía la base de la inferencia en relación a un factor.Tratamiento = factor A + factor B + interacción AB Haciendo una equivalencia entre los valores de i y los de k y l suponiendo que el factor A tiene K niveles y el factor B L: i k l 1 11 2 12 3 13 ... Economía en el material experimental al obtener información sobre varios factores sin aumentar el tamaño del experimento. . E. esto es..se utilizan para la evaluación de los efectos. Una desventaja de los experimentos factoriales es que requiere un gran número de u. 2. yijk = µ + τi + βj + γij + ǫijk . efectos fijos) Sea yijk la respuesta para la k-ésimau. Permite el estudio de la interacción. . ya que se discuta el análisis y la interpretación. t K L Y el modelo resultante es: yklj = µ + αk + γl + ξkl + βj + ǫklj Es poco usual tener diseños experimentales muy complicados en los experimentos factoriales. Todas las u. estudiar el grado y forma en la cual se modifica el efecto de un factor por los niveles de los otros factores. ya que se estudia en las diferentes condiciones representadas por los niveles de otros factores. en diseño completamente al azar. balanceado. se tiene un número grande de tratamientos. Las ventajas de los experimentos factoriales son: 1.. (Factorial a × b completo. Se amplía el rango de validez del experimento. sobre todo cuando se prueban muchos factores o muchos niveles de algunos factores. del nivel i de A y j de B. .j = 0 ∀ j Tipo de Temperatura (F) Material 15 70 125 1 130 155 34 40 20 70 74 180 80 75 82 58 2 150 188 136 122 25 70 159 126 106 115 58 45 3 138 110 174 120 96 104 168 160 150 139 82 60 El ingeniero quiere contestar las siguientes preguntas: 1. . j H02 :τi + ¯γi.. El modelo con interacción es: yij = µ + τi + βj + (τβ)ij + ǫiji = 1. . a j = 1. factores fijos. . n Las hipótesis que se prueban son: H01 :γij = 0 ∀i. . b F. experimento balanceado. . ... E(CM) A a−1 σ2 + bθ2ª B b−1 σ2 + aθ2b . .. Una observación por celda Suponga un experimento con dos factores A con a niveles y B con b niveles y una sola repetición en cada celda (tratamiento).l. = 0 ∀ i H03 : βj + ¯γ. . . Qué efectos producen el material y la temperatura en la vida de la batería? 2. .. g. b k = 1.V. Existe un material que produzca uniformemente más larga vida a la batería sin importar la temperatura? diseño completamente al azar. a j = 1.i = 1. .. . . completo. . . El Diseño Factorial General.. Tres factores El modelo para un factorial de tres factores en diseño completamente al azar: yijkl = µ+τi+βj +γk+(τβ)ij +(τγ)ik+(βγ)jk+(τβγ)ijk+ǫijkl i = 1.. . Balanceado El diseño factorial de dos factores se puede generalizar atener p factores: A con a niveles B con b niveles . .. . .. . y la embotelladora desea entender mejor las fuentes de esta variabilidad para eventualmente reducirla.. En general... l = 1. . c... .AB (a − 1)(b − 1) σ2 + θ2ab Error 0 σ2 Total ab − 1 σ2 no se puede estimar. j = 1. n Ejemplo: Se desea obtener más uniformidad en el llenado de botellas de refresco.. La máquina de llenado teóricamente llena cada botella a la altura correcta... por lo tanto no hay prueba para los efectos principales a menos que no haya interacción. Debe haber por lo menos 2 repeticiones (n ≥ 2) para podercalcular σˆ2 si todas las posibles interacciones están incluidas en el modelo. k = 1. habrá abc · · · n observaciones si hay n repeticionesdel experimento completo.. y entonces el modelo es yij = µ + τi + βj + ǫij ESTE ES EL CASO DE BLOQUES AL AZAR. ... . b. pero en la práctica hay variación.. a... El ingenio de procesos puede controlar tres factores durante el proceso de llenado: . de manera que tenga una contribución mínima a la suma de cuadrados del error. 5. Supongamos. como sería el caso de la pérdida de alguna unidad experimental. alguna de las observaciones en uno de los bloques puede faltar. A continuación se efectúa el análisis de varianza usual como si la observación estimada fuera un dato real. o por razones fuera del control del experimentador. que para estimar la observación faltante se elige x. Con frecuencia. respectivamente.3 DISEÑO FACTORIAL 2^k En ocasiones. La segunda es un análisis exacto usando la prueba de significancia de regresión general. Esto sucede debido algún descuido o error. Suponga que falta la observación correspondiente al tratamiento i y al bloque j. Existen dos formas generales de resolver el problema de los valores faltantes. cada tratamiento no ocurre en cada bloque. la presión del llenado (B) y las botellas llenadas por minuto (velocidad de la línea) (C). disminuyendo los grados de libertad del error en uno. Una observación faltante introduce un nuevo problema en el análisis.El % de carbonato (A). Al derivar la SCE con respecto a x e igualar a cero se obtiene Como un estimador para la observación faltante. Como la suma de cuadrados del error está dada en donde R incluye todos los términos que no contienen a x. cuando se utiliza un diseño aleatorizado por bloques completos. El efecto de un factor se define como el cambio en la respuesta producida por un cambio en el nivel del factor. Numéricamente 40 52 20 30 A 21 2 2 Tabla 1 Un experimento factorial . además. consideremos los datos de la tabla 1. Esta observación se representa mediante x el gran total con una observación faltante se representará mediante y los totales del tratamiento y del bloque con un dato faltante como y. La primera es un análisis aproximado en el que se estima la observación faltante. ya que los tratamientos dejan de ser ortogonales a los bloques. Por ejemplo. éste se conoce como efecto principalporque se refiere a los factores de interés primordial del experimento. El efecto principal del factor A podría interpretarse como la diferencia entre la respuesta promedio en el primer y segundo nivel de ese factor. En otras palabras. el efecto de A es: A = 50 .20 = 30 Mientras que en el segundo nivel de B.40 = 28 Puede observarse que existe una interacción entre los factores A y B porque el efecto de A depende del nivel elegido de B. Factor B B1 B2 A1 20 40 Factor A A2 50 12 Tabla 2. considérense los datos de la Tabla 2. el efecto principal de B es: 30 52 20 40 B 11 2 2 Si los factores tienen más de dos niveles. Cuando esto ocurre existe una interacción entre los factores. . Similarmente. el procedimiento anterior debe ser modificado ya que las diferencias entre las respuestas promedio pueden expresarse de muchas formas.En otras palabras incrementar el factor A del nivel 1 al 2 produce un cambio en la respuesta promedio de 21 unidades. En algunos experimentos puede encontrarse que la diferencia en la respuesta entre los niveles de un factor no es la misma en todos los niveles de los otros factores. Un experimento factorial con interacción En el primer nivel del factor B. el efecto de A es: A = 12 . Por ejemplo. no debe ser la única técnica para analizar los datos. Esto muestra que existe una interacción entre A y B. es engañosa. porque su interpretación es subjetiva y su apariencia. 60 B1 50 B2 Respuesta 40 30 20 B1 10 B2 A1 A2 Factor A Figura 2 Un experimento factorial con interacciones Hay que notar que cuando una interacción es grande los correspondientes efectos principales tienen poco significado práctico. Se observa que las rectas B1 y B2 son. 1 se muestra una gráfica de la respuesta de los datos de la Tabla 1 contra los niveles del factor A para ambos niveles del factor B. Una estimación del efecto principal de A de los datos de la Tabla 2 es: 50 12 20 40 A 1 2 2 . De manera similar. En la Fig. 2 se presenta una gráfica de la respuesta de los datos de la Tabla 2. a menudo.Estas ideas pueden ilustrarse gráficamente. Esto indica que no hay interacción entre los factores. Sin embargo. en la Fig. 60 B2 50 B1 Respuesta 40 30 B2 20 B1 10 A1 A2 Factor A Figura 1 Un experimento factorial sin interacciones En este caso se ve que las rectas B1 y B2 no son paralelas. paralelas. aproximadamente. se requiere un total de seis observaciones. Una interacción significativa oculta a menudo el significado de los efectos principales. dos observaciones de cada combinación de tratamientos y hacer una estimación de los efectos de los factores usando las respuestas promedio. . El factor A tiene un efecto. Son más eficientes que los experimentos de un factor a la vez. En otras palabras. Supongamos que se tienen dos factores. por ejemplo. Ventajas de los diseños factoriales Las ventajas de los diseños factoriales pueden ilustrarse fácilmente. La información acerca de ambos factores puede obtenerse variando un factor a la vez como aparece en la tabla 3. Por lo tanto. B1 y B1. Estos niveles se representan mediante A1. es conveniente realizar. cada uno con dos niveles. Factor B B1 B2 A1 A1B1 A1B2 Factor A A2 A2B1 12 Tabla 3 El método de un factor a la vez Los diseños factoriales poseen algunas ventajas. Sin embargo. para evitar hacer conclusiones engañosas. A causa de que existe error experimental. A2. El efecto de variar el factor A está dada por A2B1 -A1B2. Los diseños factoriales son necesarios cuando alguna interacción puede estar presente. es más útil conocer la interacción AB que el efecto principal.El cual resulta ser muy pequeño corriéndose el riesgo de concluir que no existe un efecto debido a A. cuando se examinó el efecto de A en niveles diferentes de B se concluyó que éste no era el caso. pero depende del nivel del factor B. A y B. y “B” se refiere al efecto del factor “B”. el efecto de un factor se denota por la letra latina minúscula. y “AB” se refiere a la interacción entre AB. B baja 28 25 27 80 A alta. A y B. 15% y 20%. Los diseños factoriales permiten estimar los efectos de un factor en diversos niveles de los otros factores. En el diseño 2 2 los niveles bajo y alto de A y B se denotan por “-“ y “+” respectivamente. El experimento se realiza (“replica o repite”) tres veces. el nivel alto o superior denota el uso de dos sacos de catalizador y el nivel bajo o inferior denota el uso de un solo saco. 2. los niveles del factor pueden llamarse “bajo” y “alto”. El catalizador constituye el factor B. Arbitrariamente. B baja 36 32 32 100 . Combinación de Replica tratamientos I II III Total A baja. produciendo conclusiones que son válidas sobre toda la extensión de las condiciones experimentales. Diseño factorial de dos factores 2 El primer diseño de la serie 2 es aquel en el que solo dos factores. “A” se refiere al efecto del factor “A”. Sea la concentración del reactivo el factor A con dos niveles de interés. Este diseño se conoce como diseño factorial 22. Así – en el eje B representa el nivel bajo de catalizador mientras que + denota el nivel alto. cada uno con dos niveles. y los datos son como sigue: En la figura 4 siguiente se presentan gráficamente las combinaciones de tratamiento para este diseño. De este modo. Ejemplo 1 Considérese una investigación llevada a cabo para estudiar el efecto que tiene la concentración de un reactivo y la presencia de un catalizador sobre el tiempo de reacción de un proceso químico. en los ejes A y B. promediado sobre los niveles del otro factor. el efecto de A en el nivel B es {a-(1)}/n. las letras minúsculas (1). cono se muestra en la figura 3. b y ab también se usan para representar los totales de las n replicas de las combinaciones de tratamientos correspondientes. Así “a” representa la combinación de tratamientos. Ahora bien. Como se ilustra en la figura 3. a. Por convención (1) se usa para representar a ambos factores en el nivel inferior. En esta figura se aprecia que el nivel superior de cualquier factor de una combinación de tratamientos esta representado por la presencia de la letra minúscula correspondiente. Mientras que el nivel superior B es {ab-b}/n. A baja. mientras que la ausencia de esta ultima representa el nivel inferior del factor. El efecto promedio de un factor se define como el cambio en la respuesta producida por un cambio en el nivel de ese factor. y “ab” representa a ambos factores en el nivel superior. B alta 31 30 29 90 Las cuatro combinaciones de tratamientos en el diseño pueden representarse por letras minúsculas. en la que A se encuentra en el nivel superior y B en el nivel inferior. Tomando el promedio de estas dos cantidades se obtiene: 1 1 A ab b a (1) ab a b (1) 2n 2n . B alta 18 19 23 60 A alta. “b” representa aquella en la que A se halla en el nivel inferior y B en el superior. A YA YA ab a b (1) 2n 2n . Las formulas para los efectos de A. + bajo (15%) alto (20%) Concentracion de reactivo A Figura 1: Combinaciones de tratamiento en el diseño factoriall El efecto promedio de B se determina a partir de su efecto en el nivel inferior de A (esto es. así: ab b a (1) ab (1) a (b) 1 1 AB 2n 2n Por otro lado se puede definir AB como la diferencia promedio entre el efecto de B en el nivel superior de A y el efecto de B en el nivel inferior de A. {b-(1)}/n.a (1) 1 1 B 2n 2n El efecto de la interacción AB se define como la diferencia promedio entre el efecto de A en el nivel superior de B y su efecto en el nivel inferior de B. El efecto de A puede hallarse como la diferencia en la respuesta promedio de las dos combinaciones de tratamiento en la mitad derecha (que llamaremos Y A+. b = 60(18+19+23) ab = 90(31+30+19) Cantidad de catalizador B Alto (2 sacos) + bajo (1 saco) - (1) = 80(28+25+27) a = 100(36+32+32) . Esto es. puesto que es la respuesta promedio para las combinaciones de tratamientos a las que A que se encuentra en el nivel alto) y las dos combinaciones de tratamientos en la mitad izquierda (o Y A). y de su efecto en el nivel superior de A (que es igual a [ab-a]/n obteniéndose: ab a b (1) ab b . B y AB pueden deducirse por otro método. 00 2(3) . o ab (1) a b AB 2n 2n 1 ab (1) a b 2n Con los datos que aparecen en la figura 1. 1 ab a b (1) 2n Este es exactamente el mismo resultado. el efecto de B se encuentra como la diferencia entre el promedio de las dos combinaciones de tratamientos en la parte superior del cuadrado ( Y B+) y el promedio de las dos combinaciones de tratamientos en la parte inferior ( Y B-).33 1 A 2(3) 90 60 100 80 1 B 5. las estimaciones de los efectos promedio son: 90 100 60 80 8. o B YB YB ab b a (1) 2n 2n 1 ab b a (1) 2n Finalmente el efecto de interacción AB es el promedio de las combinaciones de tratamientos en la diagonal de derecha a izquierda del cuadrado ab y (1) menos el promedio de las combinaciones de tratamientos en la diagonal de izquierda a derecha (a y b). el efecto de interacciones es pequeño comparado con los dos efectos principales. Consideremos la suma de cuadrados para A. En muchos experimentos que implican diseños 2K se examina la magnitud y la dirección de los efectos de los factores para determinar cuales variables es probable que sean importantes. Esta ecuación establece que la suma de cuadrados de contraste es igual al contraste elevado al cuadrado entre el producto del número de las observaciones de cada total del contraste por la suma de cuadrados de los coeficientes del mismo. B y AB sean: . se obtiene que las sumas de cuadrados de A. La suma de cuadrados de cualquiera de ellos puede calcularse usando la siguiente ecuación: SSc 1 aci yi . El efecto de B (catalizador) es negativo. esto sugiere que al elevar A del nivel bajo (15%) al nivel alto (25%) incrementará el rendimiento. ContrasteA ab a b (1) Este contraste suele llamarse efecto total de A. 90 80 100 60 1. esto sugiere que elevar la cantidad del catalizador agregada al proceso reducirá el rendimiento.2 na a ci 2 . puede apreciarse que también se utilizan contraste para estimar B y AB. Al parecer. En consecuencia. A partir de la segunda y tercera ecuación. En el diseño 2k existen algunos métodos rápidos especiales para realizar los cálculos del análisis de varianza. Obsérvese la primera ecuación que se utiliza un contraste para estimar A. estos tres contrastes son ortogonales. B y AB. Por lo general puede emplearse el análisis de varianza para confirmar esta interpretación. esto es.67 1 AB 2(3) El efecto de A (concentración de reactivo) es positivo. Además. 33 4(3) La suma total de cuadrados se determina de la manera usual mediante: 2 2 Y .34 . por diferencia.. 2 2 2 3 2 Y SS E Yi jk 9398. las sumas de cuadrados se pueden calcular aplicando las ecuaciones anteriores.00 323. La suma de cuadrados del error..33 31. SST i2 2 n 1 j1 k 1 Y ijk 4n En general SST tiene 4n –1 grados de libertad.L.00 i 1j 1k 1 4(3) SS E SS T SS A SS B SS AB 323.00 208. obteniéndose: 2 50 SSA 208. mediante.33 4(3) 2 30 SSB 75.00 4(3) 2 10 SSAB 8.00 9075.33 75. se puede calcular en la forma usual. SSA ab a b (1)2 n * 4 SSB ab b a (1)2 n * 4 SSAB ab (1) a b 2 n * 4 Con los datos de la figura 1. con 4(n-1) G.00 8. MS Fo A 208.33 2. Ambos efectos principales son significativos al 1%.34 8 3.92 Total 323. b.1 es la siguiente: Fuente de variación SS G.L.00 19.33 53. Este orden se conoce como orden estándar.13 Error 31. a.15a B 75.00 1 75.13a AB 8. Cuando se utiliza es posible apreciar que los coeficientes de los contrastes usados para estimar los efectos son Efectos (1) a b Ab A: -1 +1 -1 +1 B: -1 -1 +1 +1 AB: +1 -1 -1 +1 Tabla ANOVA para los datos del ejemplo 3.00 11 a significativo al 1% .33 1 208. A menudo se es conveniente escribir las combinaciones de tratamientos en el orden (1). y ab.33 1 8.El análisis de varianza completo se presenta en la tabla siguiente. el contraste para estimar A es –(1) + a – b + ab. que representa el total el total o el promedio de todo el experimento. Por ejemplo. Los renglones corresponden a las combinaciones de tratamientos. Para encontrar un contraste con el fin de estimar cualquier efecto. Los coeficientes de los contrastes siempre son +1 o –1 y se puede usar una tabla de signos positivos y negativos como la mostrada en la de signos algebraicos para determinar el signo apropiado de cada combinación de tratamientos. Se observa que la columna encabezada por I se compone de solo de signos positivos..+ - ab + + + + Observe que los coeficientes de los contrastes usados para estimar la interacción son iguales al producto de los coeficientes correspondientes a los dos efectos principales.Signos algebraicos para calcular los efectos en un diseño 22 Combinación Efecto Factorial De Tratamientos I A B AB (1) + . lo cual concuerda con la ecuación. simplemente se multiplican los signos de la columna apropiada de la tabla por la correspondiente combinación de tratamientos. y se suma.- b + . ab b a ab a 1 1 A (1) b (1) 2n 2n . la interacción AB. e I.+ a + + . En el encabezado de las columnas de tabla y se encuentran los efectos principales (A y B). es un cuadrado que contiene p renglones y p columnas. esto es. Un diseño cuadrado latino para p factores. En donde: Kjiy= observación correspondiente al i-ésimo renglón. la k-ésima columna y el j- ésimo tratamiento Μ= la media general Iα= es el i-ésimo efecto de renglón Jτ= es el j-ésimo efecto de tratamiento Kβ= es el k-ésimo efecto de la columna Kjiε= es el error aleatorio El modelo es completamente aditivo. o un cuadrado latino p x p. en otras palabras. Bajo la suposición de que el error aleatorio se distribuye en forma normal e independiente. tratamiento y error Cuyos grados de libertad. El diseño cuadrado latino se usa para eliminar dos fuentes de variabilidad problemáticas. y cada letra aparece una sola vez en cada renglón y columna. columna. variables aleatorias independientes con distribución ji-cuadrada. Haya “a” niveles del factor A y “b” niveles del factor B.4 DISEÑO DE CUADROS LATINOS. en otras palabras. hay nrepeticiones. 5. Los diseños en cuadrados latinos son apropiados cuando es necesario controlar dos fuentes de variabilidad. El análisis de varianza consiste en descomponer la suma total de cuadrados de las observaciones en sus componentes de renglón. cada una de las sumas de cuadrados es al dividir entre. Sólo dos de los subíndices i. j y k se requieren para especificar una observación en particular porque únicamente hay una observación en cada celda.Los tipos más sencillos de diseños factoriales implican sólo dos factores o conjuntos de tratamientos. las columnas y los tratamientos. Cada una de las p2 celdas contiene una de las p letras que corresponde a un tratamiento. permite analizar sistemáticamente por bloques en dos direcciones. En dichos diseños el número de niveles del factor . A continuación se presentan algunos ejemplos de cuadrados latinos. cada A repetición o réplica del experimento contiene todas las combinaciones de tratamiento ab. En general.dispuestos en un diseño factorial. no existe interacción entre los renglones. 7.principal tiene que coincidir con el número de niveles de las dos variables de bloque o factores secundarios y además hay que suponer que no existe interacción entre ninguna pareja de factores. cada uno de estos bloques corresponde a una de las posibles combinaciones de niveles de los dos factores de control. El procedimiento para construir un diseño en cuadrado latino es el siguiente: 1) Se elige aleatoriamente un cuadrado latino de los disponibles. el cuadrado así obtenido es un cuadrado latino estándar. el requerimiento anterior supone que cada tratamiento debe aparecer una vez y sólo una en cada fila y en cada columna. Supongamos que el número de niveles de cada uno de los factores es K. En el Apéndice B se muestran algunos cuadrados latinos estándares para los órdenes 3. Si consideramos una tabla de doble entrada donde las filas y las columnas representan cada uno de los dos factores de bloque y las celdillas los niveles del factor principal o tratamientos. Un cuadrado latino se denomina estándar cuando las letras de la primera Fila y la primera columna están ordenadas alfabéticamente. Se parte de una primera Fila con las letras latinas ordenadas alfabéticamente Columna1 Columna 2 Columna 3 ··· Columna k Fila 1 A B C ··· K Laposición (construcción por permutación cíclica). En cada bloque se aplica un solo tratamiento de manera que cada tratamiento debe aparecer con cada uno de los niveles de los dos factores de control. A continuación vamos a dar una forma simple de construcción de cuadrados latinos. . de tal forma que cada letra aparece una sola vez en cada Fila y en cada columna. 5. 8 y 9. 6. 4. El diseño en cuadrado latino utiliza K2bloques. A parte de los cuadrados latinos así obtenidos existen otros cuadrados latinos diferentes. 2) Se asigna aleatoriamente el orden de las filas y columnas. Recibe el nombre de cuadrado latino de orden K a una disposición en filas y columnas de K letras latinas. estándares y no estándares. i4). 3. i2.3) Se asignan aleatoriamente los tres factores a las filas. e insecticida. La selección de uno de los cuadrados se hace al azar. 3. 2). Al plantear este experimento se pensó que podría conseguirse mayor precisión si se controlaba la variabilidad introducida por los tipos de abono e insecticida. Supongamos que el orden seleccionado para las filas sea (2. El instituto de experimentación agrícola está interesado en estudiar 4 tipos de semilla de trigo. entonces el cuadrado latino anterior se convierte en BADC CDAB ABCD DCBA Se vuelven a generar otros 4 números aleatorios que se idéntica con el orden de las columnas de este último cuadrado. (a1. s2. Ilustremos este procedimiento con el ejemplo del rendimiento de la semilla de trigo. a4). Para ello selecciona 4 niveles para cada una de las variables de bloque: abono. a3. 1. s4) y decide realizar el experimento utilizando un diseño en cuadrado latino. a2. obteniéndose el siguiente cuadrado latino CDBA BACD DCAB ABDC . columnas y letras. Supongamos que el cuadrado latino elegido es el siguiente ABCD BADC CDAB DCBA A continuación. respectivamente. se asigna también al azar. el orden de las filas y las columnas. Supongamos que los números obtenidos son (4. s3. (i1. i3. (s1. 4). 1. . respectivamente. de tal forma que el diseño resultante es Table 5-1. se asignan al azar las filas. semillas y abonos. un factor principal y dos factores de bloque. K. en este caso el tipo de semilla. en las Celdillas. 2o) Cada uno de los factores tiene el mismo número de niveles. Semillas Insecticidess1 s2 s3 s4 i1 a3 a4 a2 a1 i2 a2 a1 a3 a4 i3 a4 a3 a1 a2 i4 a1 a2 a4 a3 Por convenio.Por último. Abonos Insecticidas a1 a2 a3 a4 i1 s4 s3 s1 s2 i2 s2 s1 s3 s4 i3 s3 s4 s2 s1 i4 s1 s2 s4 s3 En resumen. a los tipos de insecticidas. las columnas y las letras latinas a los tres factores. las columnas y las letras se asignan. Reordenando el diseño anterior se obtiene la siguiente tabla:7. podemos decir que un diseño en cuadrado latino tiene las siguientes características: 1o) Se controlan tres fuentes de variabilidad. supongamos que las filas. Por ejemplo. se suele situar el factor principal.2 Diseños en cuadrados latinos 5 Tabla 5-2. Consideremos un cuadrado latino p × p al que se le sobrepone un segundo cuadrado latino cuyos tratamientos se designan por letras griegas.5 DISEÑO DE CUADROS GRECOLATINOS. las columnas y los tratamientos de la letra latina porque cada letra griega ocurre una sola vez en cada renglón. letra griega y letra latina).3o) Cada nivel del factor principal aparece una vez en cada fila y una vez en cada columna. El análisis de varianza es muy similar al de un cuadrado latino. El diseño cuadrado greco-latino puede utilizarse para controlar sistemáticamente tres fuentes extrañas devariabilidad. la columna k. cada uno con p niveles. Se dice que los dos son ortogonales si al sobreponerse poseen la propiedad de que cada letra griega aparece solamente una vez con cada letra latina. En donde: lkjiy la observación que corresponde al renglón i. μ= La media general iθ= Es el efecto del i-ésimo renglón jτ= Es el j-ésimo efecto de tratamiento de las letras latinas kω= Es el k-ésimo efecto de tratamiento de las letras griegas lψ= Es el efecto de la columna l lkjiε= Es la componente del error aleatorio Sólo dos de los cuatro subíndices son necesarios para identificar completamente cualquier observación. El factor representado por las letras griegas es ortogonal a los renglones. se usa para hacer un análisis por bloques en tres direcciones. en cada columna y para cada letra latina. Los cuadrados grecolatinos existen para toda excepto para p = 6. 5. Por lo tanto la suma de cuadrados debida al factor letra griega puede calcularse usando los totales de la . 4o) No hay interacción entre los factores. usando solamente p2 ensayos. El diseño permite analizar cuatro factores (renglón columna. En otras palabras. la letra latina j y la letra griega k. . Las hipótesis nulas de igualdad entre los renglones. . Dos cuadrados reciben el nombre de ortogonales si.letra griega. . . 2 . 2 . K h = 1. uno de los cuadrados con letras latinas el otro con letras griegas. 2 . por superposición de dos de ellos. a cuadrados greco-latinos. En el Apéndice C se muestra una tabla de cuadrados latinos que dan lugar. . (8. .1) Donde . . . entre las columnas. entre los tratamientos de la letra latina y entre los tratamientos de la letra griega pueden probarse dividiendo la media de cuadrados correspondiente entre la media de cuadrados del error Los cuadrados greco-latinos se obtienen por superposición de dos cuadrados latinos del mismo orden y ortogonales entre sí. 2 . K p = 1. Cuadrado greco-latino AαBβCγDδ DγCδBαAβ BδAγDβCα CβDαAδBγ Planteamiento del modelo En un diseño en cuadrado greco-latino la variable respuesta yij(hp) viene descrita por la siguiente ecuación yij(hp) = µ + τi + βj + γh + δp + ǫij(hp) i = 1. K j = 1. La Tabla 5-8 ilustra un cuadrado greco-latino para K = 4 Tabla 5-8. . . El error experimental se reduce en esta cantidad. al superponerlos. . Notamos que no es posible formar cuadrados greco-latinos de orden 6. . cada letra latina y griega aparecen juntas una sola vez en el cuadrado resultante. K . La notación yij(hp) indica que los niveles i y j determinan los niveles h y p para un cuadrado greco-latino especificado. Dichos efectos están sujetos a la restricción iτi = 0.µ es un efecto constante. δp es el efecto producido por el p-ésimo nivel del factor letra griega. j). Es decir. . El total y el promedio de todas las observaciones. Dichos efectos están sujetos a la restricción jβj = 0. Dichos efectos están sujetos a la restricción hγh = 0. Γh es el efecto producido por el h-ésimo nivel del factor letra latina. los subíndices h y p toman valores que dependen de la celdilla (i. Dichos efectos están sujetos a la restricción p δp = 0. τi es el efecto producido por el i-ésimo nivel del factor fila. σ). Βj es el efecto producido por el j-ésimo nivel del factor columna. común a todas las unidades. Se utiliza la siguiente notación: N = K2 es el número total de observaciones. Ǫ ij(hp) son variables aleatorias independientes con distribución N(0.