1.INTRODUCCIÓN AL DISEÑO DE EXPERIMENTOS El diseño de experimentos es una técnica estadística que nos ayuda a identificar qué factores o variables afectan El comportamiento de un proceso productivo y de esta manera poder mejorarlo. O bien: es una prueba o una serie de pruebas en las cuales se inducen cambios deliberados en las variables de entrada de un proceso o sistema, de manera que sea posible observar e identificar las causas de los cambios en la respuesta de salida. Experimento: es una prueba o ensayo. Algunas de las variables del proceso x 1, x2,..., xk son controlables, mientras que otras z1, z2,...,zk son incontrolables (aunque pueden ser controlables para los fines de prueba). Entre los objetivos del experimento pueden incluirse: 1. Determinar cuáles variables tiene mayor influencia en la respuesta, y. 2. Determinar el mejor valor de las x que influyen en y, de modo que y tenga casi siempre un valor cercano a valor nominal deseado. 3. Determinar el mejor valor de las x que influyen en y, de modo que la variabilidad de y sea pequeña. 4. Determinar el mejor valor de las x que influyen en y, de modo que se minimicen los efectos de las variables no controlables z 1, z2,...zq. Lo métodos de diseño experimental tiene un propósito que puede ser desarrollar un proceso consistente o robusto; esto es, un proceso que no sea afectado por fuentes de variabilidad externas o ruido (las zi). En el diseño de experimentos se plantean varias preguntas importantes: 1. ¿Son estas dos soluciones los únicos medios para lograr la respuesta de interés? 2. ¿Existen otros factores que pueden afectar la respuesta de las muestras y que deban ser investigados o controlados? 3. ¿Cuántas muestras deben ser sometidas a cada solución de templado? 4. ¿En qué forma debe asignarse cada muestra a los tratamientos, y en qué orden deben realizarse las mediciones? 5. ¿Qué método de análisis debe utilizarse? 6. ¿Qué diferencia en los niveles promedio de respuesta entre los dos tratamientos debe considerarse como significativa? Estas, y quizá muchas otras preguntas, deberán ser contestadas satisfactoriamente antes de llevar a cabo el experimento. 1.1 Aplicaciones del diseño de experimentos El diseño de experimentos puede servir para mejorar el rendimiento de un proceso de manufactura, desarrollo de nuevos procesos con lo que se logra: 1. Mejorar el rendimiento del proceso. 2. Menor variabilidad y mayor apego a los requerimientos nominales y objetivos. 3. Menor tiempo de desarrollo. 4. Menores costos totales. Los métodos de diseño de experimentos también se aplican al diseño de productos como sigue: 1. Evaluación y comparación de conceptos de diseño básicos. 2. Evaluación de materiales alternativos. 3. Selección de parámetros de diseño de modo que el producto funcione bien desde una amplia variedad de condiciones de uso real; Esto es, de modo que el producto sea consistente (robusto). El uso del diseño de experimentos en estas áreas puede dar por resultado productos con mayor confiabilidad y mejor funcionamiento en el campo, menores costos, y menor tiempo de diseño y desarrollo del producto. El diseño estadístico de experimentos es el proceso de planear un experimento para obtener datos apropiados, que pueden ser analizados mediante métodos estadísticos, con objeto de producir conclusiones validas y objetivas. Cuando se identifican los factores y su influencia en un sistema productivo, se pueden tomar decisiones que efectivamente mejoren la calidad del producto o servicio. Se pueden identificar las fuentes de variación reales para su reducción en la búsqueda de la mejora continua. Cuando se usan experimentos pretendemos analizar el efecto de cambios que nosotros inducimos más que analizar variaciones al azar. Por ejemplo, mediante un diagrama causa-efecto podemos identificar las posibles causas o factores que inciden en un efecto o respuesta (Diagrama causa y efecto). Mediante un experimento podemos inducir cambios en uno varios factores (F2l. F33 y F11 por ejemplo) y analizar estadísticamente si el cambio en los factores afecta o no el resultado o efecto del proceso. Experimento: Es un conjunto de pruebas estructurado y coherente que son analizadas a fin de comprender la operación del proceso. Diseño de experimentos: Es el proceso de planear, ejecutar y analizar el experimento de manera que los datos apropiados sean recolectados, y que estos tengan validez estadística para obtener conclusiones validas y útiles. Se entiende por validez estadística, el que los resultados se puedan repetir consistentemente sobre todo en la operación a gran escala o masiva. Eficiencia de un experimento: Un experimento es eficiente cuando: 1. Se obtiene la información requerida. 2. Con el mínimo consumo de recursos. Esto es, un experimento eficiente debe ser lo más simple y económico posible pero efectivo. Las técnicas del diseño de experimentos pretenden que los experimentos sean eficientes. 1. 2 Principios básicos del diseño de experimentos Para que un experimento pueda tener validez estadística se deben de observar al menos tres principios: Reproducción: Esto significa que el experimento se pueda llevar a cabo o repetir bajo las mismas condiciones en más de una ocasión. La diferencia observada como resultado de un experimento es real, o se debe a simple error aleatorio, o aun más a otro factor como por ejemplo diferente tipo del material. Para aclarar esto, es necesario repetir el experimento y cuantificar si se presenta consistentemente o no la variación detectada. La reproducción por lo tanto es importante por al menos dos razones: i) Permite cuantificar el error aleatorio inherente al proceso y ii) Permite una mejor estimación de los parámetros. Aleatoriedad: Esto significa que tanto el material asignado a un experimento en particular, como el orden en que se efectúan las pruebas se efectué de una manera aleatoria. La aleatoriedad por lo tanto es importante por al menos dos razones i) Confunde el efecto de factores no controlables y ii) Valida las pruebas estadísticas al hacer que los errores experimentales sean estadísticamente independientes. Análisis por bloques: Es una técnica que se usa para incrementar la precisión del experimento. Un bloque es una porción del material experimental que sea más homogénea que el total del material o cuando las condiciones son más homogéneas. Al realizar un experimento por bloques se hacen las comparaciones entre las condiciones de interés del experimento dentro de cada bloque. 1.3. Metodología experimento general para realizar un ejemplos de esta son: porcentaje de contaminación. la hipótesis a probar debe quedar bien definida. de falla. Antes de poder planear un experimento necesitamos definir claramente que es la que estamos buscando. La variable dependiente o variable de respuesta es la característica de calidad que queremos mejorar y cuyo comportamiento deseamos conocer. La participación activa del personal involucrado en el problema es de vital importancia en este paso. Antes de planear un experimento se debe de investigar y. . analizar el conocimiento y datos que ya se tengan sobre este problema. En conclusión como resultado de este paso. 2) Identificar variables. aun cuando esto puede parecer trivial en ocasiones es tanta la presión para tomar decisiones que corremos a experimentar sin por lo menos definir claramente nuestros objetivos. En este paso es necesario definir qué tipo de información es exactamente la que nos interesa. la siguiente es una de ellas: 1) Identifique claramente el problema o situación a resolver. tiempo. etc. satisfacción de un cliente.Se sugieren varias metodologías en la literatura. ya que no podemos medir o variar todos y cada uno de los componentes de un experimento. variables dependientes y factores o variables independientes. desgaste de una herramienta. En este paso dos tipos de variables se deben de identificar. En ocasiones escuchamos que el experimento fue un éxito pero la calidad no mejoró. Un diagrama causa-efecto es una buena ayuda en este paso. altura. presión. Que tenga algún significado físico. a cada uno de estos valores o niveles se les llama tratamientos. tiempo. dos procesos diferentes. de entre los diferentes niveles o tratamientos posibles para el factor.Es deseable que una variable dependiente reúna las características siguientes: Cuantitativa Precisa. tiempo. etc). Por ejemplo tres proveedores. cualitativo. presión. turno.). tres turnos. etc. Las variables independientes o factores representan aquellas causas o factores cuyo efecto sobre la variable dependiente se quiere analizar. por ejemplo: temperatura. el factor es del tipo cualitativo. o cuantitativo (temperatura. Este caso es similar al anterior excepto que el factor es cuantitativo. Además. Factor fijo. esto nos lleva a cuatro situaciones generales: A. concentración de un . el experimentador está interesado en el efecto que ciertos niveles seleccionados por él previamente tienen sobre la variable de respuesta. operario. B. En general un factor puede ser cualitativo (proveedor. En este caso. Los niveles específicos en cualquier caso se pueden seleccionar ya sea aleatoriamente dentro de un cierto rango o a un nivel fijo definido por el experimentador previamente. Cada uno de estos factores se deberá probar al menos a dos valores diferentes para evaluar su efecto. Factor fijo. etc. ¿Cómo seleccionar los diferentes niveles de un factor?. cuantitativo. En el resto de este material se describen varios tipos de experimentos de los cuales se tomará el que mejor se ajuste a la situación particular. a menos que se especifique lo contrario. 30 y 40 °C: 5. Factor aleatorio. esto es. 10. 3) Definir el diseño del experimento. 20 y 25 psi. Esto imp1ica definir de qué manera se efectuaran las pruebas y qué modelo matemático describe mejor el experimento. Para este caso es recomendable que los diferentes niveles o tratamientos se tomen equiespaciados. C. D. Esto de acuerdo a lo que se defina en el paso 3. cuadrática. Factor aleatorio. Igual que en el caso anterior los diferentes niveles o tratamientos son seleccionados al azar. 15. por ejemplo 10. etc. En este material. En este caso los niveles o tratamientos se seleccionan al azar de entre varios posibles.. 20. se selecciona al azar cuáles de ellos analizar. 4) Efectuar el experimento.). cualitativo. cuantitativo. . etc. etc. 12.componente. en este caso la conclusión del experimento se extiende para cubrir todos los posibles niveles. 16 y 20 minutos. Por ejemplo: se tienen varios lotes de un mismo proveedor. los factores se consideran fijos. 8. La conclusión a que se puede llegar con este caso es si la variable de respuesta es diferente para cada uno de los tratamientos que se seleccionaron y de ser así el tipo de relación que existe entre el factor y la variable de respuesta (lineal. sin embargo. en la práctica no es sencillo darse cuenta de que existe un problema que requiere experimentación. Suele ser importante solicitar la opinión de todas las partes implicadas. Este punto pudiera parecer obvio. una idea cualitativa de cómo se van a analizar. 2) Elección de factores y niveles. se ofrece una guía del procedimiento recomendado: 1) Comprensión y planteamiento del problema. los intervalos de dicha variación y los niveles específicos de interés a los cuales se hará el experimento. y cómo se les medirá. Es necesario desarrollar todas las ideas sobre los objetivos del experimento. 6) Conclusiones y toma de decisiones. También debe considerarse la forma en que se controlarán estos factores para mantenerlos en los valores deseados. ni diseñar un planteamiento claro y aceptable del mismo. A continuación.5) Análisis de los datos. Montgomery es la siguiente: Para usar un enfoque estadístico al diseñar y analizar un experimento se requiere que todos los participantes en él tengan de antemano una idea clara de qué es exactamente lo que se va a estudiar. El experimentador debe elegir los factores que variarán en el experimento. Para ello es necesario conocer el proceso de manera práctica y teórica. . Un planteamiento claro del problema contribuye a menudo en forma sustancial a un mejor conocimiento del fenómeno y de la solución final del problema. Estos son básicamente análisis estadísticos. Una metodología (alterna) desarrollada por Douglas C. cómo se van a recopilar los datos y. al menos. el experimentador debe estar seguro de que la respuesta que se va a medir realmente provea información útil acerca del proceso de estudio. Si la capacidad de medición es deficiente. En otras situaciones habrá más interés en verificar la uniformidad. Por ejemplo. Cuando se realiza el experimento. 4) Elección del diseño experimental. el promedio o la desviación estándar (o ambos) de la característica medida serán la variable de respuesta. siendo A la estándar y B una alternativa de menor costo. Para elegir el diseño es necesario considerar el tamaño muestral (número de repeticiones). se tiene interés en identificar qué factores causan diferencias en estimar la magnitud del cambio de la respuesta. pueden compararse dos condiciones de producción A y 8.3) Selección de la variable de respuesta. en caso contrario deben hacerse repeticiones. En esta fase. Al seleccionar la respuesta o variable dependiente. 5) Realización del experimento. los errores en el procedimiento suelen anular la validez experimental. La capacidad de medición (o el error de medición) también es un factor importante. Es importante tener presente los objetivos experimentales al seleccionar el diseño. La planeación integral es decisiva para el . sólo puede esperarse que el experimento detecte efectos relativamente grandes de los factores. y determinar si hay implicado bloqueo u otras restricciones de aleatorización. Con mayor frecuencia. entre las dos condiciones. El investigador estará interesado en demostrar que no hay diferencia en cuanto a la productividad (por ejemplo). es vital vigilar el proceso cuidadosamente para asegurar que todo se haga conforme a lo planeado. seleccionar un orden adecuado para los ensayos experimentales. No son raras las respuestas múltiples. aplicados adecuadamente. de modo que los resultados y conclusiones sean objetivos más que apreciativos. y varios métodos gráficos sencillos son importantes en la interpretación de tales datos. no permiten probar algo experimentalmente. o asignar un nivel de confiabilidad a los resultados. En un complejo entorno de manufactura o investigación y desarrollo. Existen muchos excelentes paquetes de software para el análisis de datos. Los métodos estadísticos. En esta fase a menudo son útiles los métodos gráficos. Hay que recordar que los métodos estadísticos sólo proporcionan directrices para la veracidad y validez de los resultados. Una vez que se han analizado los datos. es fácil subestimar los aspectos logísticos y de planeación de la realización de un experimento diseñado.proceso. 7) Conclusiones y recomendaciones. También deben realizarse corridas de seguimiento y pruebas de confirmación para validar las conclusiones del experimento. en especial al presentar los resultados a otras personas. sólo hacen posible obtener el probable error de una conclusión. aunadas a un buen conocimiento técnico o del proceso y al sentido común. suelen llevar a conclusiones razonables. . El análisis de residuos y la verificación de la idoneidad del modelo son también técnicas de análisis de gran utilidad. Deben emplearse métodos estadísticos para analizar los datos. Las técnicas estadísticas. 6) Análisis de datos. él experimentador debe extraer conclusiones prácticas de los resultados y recomendar un curso de acción. La principal ventaja de los métodos estadísticos es que agregan objetividad al proceso de toma de decisiones. Si la temperatura de recocido afecta o no alguna propiedad mecánica del producto.1. Algunos ejemplos son: Si la materia prima que es entregada por tres diferentes proveedores producen características diferentes en el producto Si diferentes marcas de herramienta tienen o no vida diferente. Si un nuevo método de ensamble incrementa o no la productividad en una línea de producción. Si diferentes cabezales de una misma máquina producen productos similares. Cuál es el factor que más influye en la variabilidad de alguna característica de calidad. sin embargo tienen varias aplicaciones prácticas. Aplicaciones del diseño de experimentos.4. Es necesario tener claros y en todo caso revisar los siguientes conceptos estadísticos antes de seguir: ¿Qué es una prueba de hipótesis? ¿Qué e s un error tipo I y Qué es un error tipo II? ¿Qué es una prueba t para comparar dos medias? ¿Qué es la potencia de una prueba de hipótesis? ¿Qué es control estadístico? ¿Qué es nivel de significancia? . En muchas ocasiones él termino experimento se considera asociado exclusivamente para cuestiones científicas y teóricas. Ambas poblaciones son normales.. Como tal. Las varianzas poblacionales son iguales.. ANALISIS DE VARIANZA DE UN FACTOR (ANOVA 1 VIA) El análisis de la varianza de un factor (ANOVA) es una metodología para analizar la variación entre muestras y la variación al interior de las mismas mediante la determinación de varianzas. 2. El estadístico tiene una distribución muestral resultando: sb2 Fc 2 sw El valor crítico para la prueba F es: F . ( k 1). k ( n 1)) Donde el número de grados de libertad para el numerador (Sb^2 > Sw^2) es k-1 y para el denominador es k(n-1). Por ejemplo: el nivel de . es un método estadístico útil para comparar dos o más medias poblacionales. siendo significancia. k = número de muestras. 12 22 .. esto es. k H 1 : Al menos dos medias poblacionales son diferentes. Es llamado de una vía porque analiza un variable independiente o Factor ejemplo: Velocidad.2. El ANOVA de un criterio nos permite poner a prueba hipótesis tales como: H 0 1 2 3 . Los supuestos en que se basa la prueba t de dos muestras que utiliza muestras independientes son: 1. Variación total entre los 14 empleados. Como los empleados se seleccionan aleatoriamente para cada programa el diseño se denomina DISEÑO COMPLETAMENTE ALEATORIZADO Se observa el aprovechamiento de los empleados en los programas: TRATAMIENTOS c=3 c=1 c=2 J Programa Program Programa I 1 85 72 83 80 ** r=1 r=2 r=3 r=4 r=5 Media s a2 80 84 81 78 82 3 82 80 85 90 88 80.2 Tipos de variación y sumas de cuadrados 1. su puntuación no fue igual con todos VARIACIÓN TOTAL RESPECTO A LA MEDIA GENERAL r SCT i 1 c ( Xij X ) j 1 2 . Programa 2 y Programa 3.Ejemplo: Se tienen 14 empleados seleccionados al azar que se someten a 3 diferentes cursos de entrenamiento: Programa 1.00 Media de medias o media total Xj 82.14 2.00 85.00 81. Se denomina Variación dentro de los tratamientos.81.14)2 + (72-82.14)2+.. programa 2 y programa 3 EFECTO DE LA MEDIA DE CADA TRATAMIENTO RESPECTO A LA MEDIA GENERAL r SCTR rj ( X j X ) 2 j 1 SCTR = 4(79.SCTR = 186 4.81.1 = 2 .+(88-82.81.1 = 14-1 = 13 Grados de libertad de los tratamientos = c .71 3.14)2 SCT = 251..5 .. Variación dentro de un tratamiento o muestra o programa dado que no todos los empleados dentro de un mismo programa obtuvieron los mismos puntajes. Grados de libertad Grados de libertad totales = n ..333)2 SCTR = 65. Variación dentro del tratamiento o variación del error Cada valor respecto a la media de su tratamiento r SCE i 1 c (X j 1 ij X j )2 SCE = SCT .3333)2 + 5(81 .3333)2 + 5(85 .7 2. Variación entre los diferentes tratamientos o Variación entre muestras o variación entre programa 1.1 = 3 .SCT = (85-82.14)2+(83-82. = 6.946. Tratamientos = 13 . gl . 7.gl. Valor de P Fc P = distr.2 = 11 gl SCT = gl SCTR + gl SCE gl SCE = gl SCT . Cuadrados medios (Suma Cuadrados/ Grados libertad) CMT = Cuadrado medio total = SCT / (n-1) = 19. GL. 2.F.f(Fc.INV(0. GL.c 1.F. 11) = 0. TR. SCE) = distr. gl.deno min ador F .9 CME = 16. 11) = 3. SCTr.INV(ALFA.Grados de libertad del error = gl.f(1.gl SCTR = (n -1) .982297957 ZONA NO DE RECHAZAR RECHAZO Distr. gl.18898099 Como P es mayor a alfa no se rechaza Ho CONCLUSION: NO HAY SUFICIENTE EVIDENCIA PARA RECHAZAR HO.9 Cuadrado medio del error = SCE/ gle. ERR) =DISTR.(c .1) = n -c 5.946745562 Falfa . Totales . n c Cálculo de F con Excel =DISTR.4 CMTR = Cuadrado medio del tratamiento = SCTR / (c -1) = 32. 2. LAS MEDIAS DE LOS TRATAMIENTOS SON IGUALES . Estadístico de prueba Fc y estadístico F crítico de alfa Fc = CMTR / CME= 1.numerador . gl . F Como Fc es menor a Falfa no se rechaza Ho y las medias son iguales.05. ni deben estar relacionados con alguna variable.) Variación total SCT n-1 CMT Regla: No rechazar si la F de la muestra es menor que la F de Excel para una cierta alfa 2.3 Ningún patrón inusual es evidente. incluyendo la respuesta Y ij. .TABLA DE ANOVA FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADOS CUADRADO LIBERTAD MEDIO VALOR F Entre muestras (tratam. En esta grafica no debe revelarse ningún patrón obvio en la siguiente figura se grafican los residuos contra los valores ajustados de los datos de la resistencia a la tensión del ejemplo 2.5 Grafica de residuos contra el valor ajustado de S y ˆ ij i el modelo es correcto y las suposiciones se satisfacen. .) SCTR c-1 CMTR SCE n-c CME CMTR/CME Dentro de muestras (err. el promedio del tratamiento i-ésimo). Una comprobación sencilla consiste en graficar los residuos contra los ˆ ij (debe recordarse que para el modelo en un valores ajustados y sentido y ˆ ij - yi. los residuos no deben tener algún patrón. y la grafica de los residuos contra Yij parecerá un embudo que se ensancha o un altavoz. porque en las distribuciones sesgadas la varianza tiende a ser función de la media. Un bloque indica condiciones similares de los sujetos al experimentar con diferentes tratamientos. . Se trata de bloquear un factor externo que probablemente tenga efecto en la respuesta pero que no hay interés en probar su influencia. los residuos aumenta a medida que Yij lo hace. ANALISIS DE VARIANZA DE DOS VÍAS o DIRECCIONES (ANOVA 2 VIAS) 3. El bloqueo es completamente al azar. 3.Grafica de residuos contra valores ajustados Un efecto que en ocasiones revela la grafica es el de una varianza variable. Los tratamientos se asignan a las columnas y los bloques a los renglones. evitando que contamine la prueba de igualdad entre los tratamientos. sólo se bloquea para minimizar la variabilidad de este factor externo. La varianza variable también ocurre en casos cuyos datos no tienen distribución normal y están sesgados. Algunas veces la varianza de las observaciones lo hace. Si este es el caso. Esto resulta cuando el error es proporcional a la magnitud de la observación (comúnmente esto sucede en instrumentos de medición – el error es proporcional a la escala de la lectura).1 Introducción En este caso las fórmulas son parecidas a la del ANOVA de una vía pero ahora agregando el cálculo por renglones adicional al de columnas donde se incluye la variable de bloqueo. 233 Fbl = 3 4 41.6 Maq 3 25 35 39 37 45 36. Suponiendo que se quiere investigar si la producción de tres diferentes máquinas es igual.2 Promedios 24.09 191.13333 SCE = 7 8 806.Las hipótesis son: Ho: No hay diferencia en las medias del factor de columna Ha: Al menos una media del factor de columna es diferente Ho: No hay diferencia en las medias de la variable de renglón Ha: Al menos una media de la variable de renglón es diferente 3.26667 TABLA ANOVA SCTR SS GL 0.84 .933 CME= 3 SCT = 3 CMT= 57.25 5.33333 33 40 38.93333 CMTR CM Fc 0.0666 = 3 37.933 = CMBL 7 0.46666 Ftr = SCBL 3 2 764. tomando en cuenta la experiencia de los operadores a un nivel de significancia del 5%.46 = 3.66667 45.2 Ejemplos con cálculo manual Ejemplo 1. Experiencia de ops.6381 14 Falfa = 4. En Maq Máquinas años 1 2 3 4 5 Promedios Maq 2 21 33 39 41 46 36 1 27 31 42 38 45 36.33333 36. DISEÑOS FACTORIALES 4. A continuación se presentan las resistencias a la tención resultantes. Debido a que podría haber variabilidad de un rollo de tela a otro. el químico decide usar un diseño de bloques aleatorizados. Análisis y diseño de experimentos) Un químico quiere probar el efecto de 4 agentes químicos sobre la resistencia de un tipo particular de tela.1 Principios y definiciones básicas Muchos experimentos se llevan a cabo para estudiar los efectos producidos por dos o más factores. Agente Químico 1 2 3 4 Rollo 1 2 73 68 73 67 75 68 73 71 3 74 75 78 75 4 71 72 73 75 5 67 70 68 69 4.1 del Texto de Montgomery.Conclusión: No hay diferencia entre máquinas a pesar de la diferencia en experiencia de los operadores. Analizar los datos de este experimento (utilizar α=0. Selecciona 5 rollos y aplica los 4 agentes químicos de manera aleatoria a cada rollo. Ejemplo 2 (Problema 4. Puede mostrarse que en general los diseños factoriales son los más eficientes para este tipo de . con los rollos de tela considerados como bloques.05) y sacar las conclusiones apropiadas. Por ejemplo. El efecto de un factor se define como el cambio en la respuesta producida por un cambio en el nivel del factor. Con frecuencia. se dice que los factores están cruzados cuando éstos se arreglan en un diseño factorial. El efecto principal del factor A podría interpretarse como la diferencia entre la respuesta promedio en el primer y segundo nivel de ese factor. el efecto principal de B es: . Por ejemplo. consideremos los datos de la tabla 1. Similarmente. éste se conoce como efecto principal porque se refiere a los factores de interés primordial del experimento. si existen “a” niveles del factor A y “b” niveles del factor B. Numéricamente: Factor B B1 B2 A1 20 30 A2 40 52 Factor A Tabla 1 Un experimento factorial A 40 52 2 20 30 2 21 En otras palabras incrementar el factor A del nivel 1 al 2 produce un cambio en la respuesta promedio de 21 unidades. entonces cada réplica del experimento contiene todas las “ab” combinaciones de los tratamientos.experimentos. Por diseño factorial se entiende aquel en el que se investigan todas las posibles combinaciones de los niveles de los factores en cada ensayo completo o réplica del experimento. A menudo. el efecto de A es: A = 12 . 60 B2 50 B1 40 30 20 10 B2 B1 A1 Factor A A2 . paralelas. Factor B En el primer nivel B1 B2 A1 20 40 A2 50 12 Factor A de A es: del factor B. considérense los datos de la Tabla 2. En la Fig. En algunos experimentos puede encontrarse que la diferencia en la respuesta entre los niveles de un factor no es la misma en todos los niveles de los otros factores. 1 se muestra una gráfica de la respuesta de los datos de la Tabla 1 contra los niveles del factor A para ambos niveles del factor B. Por ejemplo. en la Fig. el procedimiento anterior debe ser modificado ya que las diferencias entre las respuestas promedio pueden expresarse de muchas formas.B 30 52 2 20 40 2 11 Si los factores tienen más de dos niveles. Esto indica que no hay interacción entre los factores. Se observa que las rectas B1 y B2 son.40 = 28 Puede observarse que existe una interacción entre los factores A y B porque el efecto de A depende del nivel elegido de B. Estas ideas pueden ilustrarse gráficamente. aproximadamente. 2 se presenta una gráfica de la respuesta de los datos de la Tabla 2. Cuando esto ocurre existe una interacción entre los factores. el efecto A = 50 . De manera similar.20 = 30 Mientras que en el segundo nivel de B. no debe ser la única técnica para analizar los datos. Ventajas de los diseños factoriales . Sin embargo. pero depende del nivel del factor B. es engañosa.Figura 1 Un experimento factorial sin interacciones En este caso se ve que las rectas B1 y B2 no son paralelas. El factor A tiene un efecto. cuando se examinó el efecto de A en niveles diferentes de B se concluyó que éste no era el caso. es más útil conocer la interacción AB que el efecto principal. Sin embargo. 60 B1 50 B2 40 30 20 B1 10 B2 A1 Factor A A2 Figura 2 Un experimento factorial con interacciones Hay que notar que cuando una interacción es grande los correspondientes efectos principales tienen poco significado práctico. Esto muestra que existe una interacción entre A y B. En otras palabras. Una estimación del efecto principal de A de los datos de la Tabla 2 es: A 50 12 2 20 40 2 1 El cual resulta ser muy pequeño corriéndose el riesgo de concluir que no existe un efecto debido a A. Una interacción significativa oculta a menudo el significado de los efectos principales. a menudo. porque su interpretación es subjetiva y su apariencia. dos observaciones de cada combinación de tratamientos y hacer una estimación de los efectos de los factores usando las respuestas promedio. por ejemplo. A causa de que existe error experimental. Los diseños interacción factoriales puede estar son necesarios presente. A y B. La información acerca de ambos factores puede obtenerse variando un factor a la vez como aparece en la tabla 3. El efecto de variar el factor A está dada por A 2B1 -A1B2. B1 y B1. Supongamos que se tienen dos factores. Los diseños factoriales permiten estimar los efectos de un factor en diversos niveles de los otros factores. Son más eficientes que los experimentos de un factor a la vez. cada uno con dos niveles. . Estos niveles se representan mediante A 1. A2.L as ventajas de los diseños factoriales pueden ilustrarse fácilmente. Factor B B1 B2 A1 A1B1 A1B2 A2 A2B1 12 Factor A Tabla 3 El método de un factor a la vez Los diseños factoriales poseen algunas ventajas. para cuando evitar alguna hacer conclusiones engañosas. se requiere un total de seis observaciones. produciendo conclusiones que son válidas sobre toda la extensión de las condiciones experimentales. es conveniente realizar. Por lo tanto. el nivel alto o superior denota el uso de dos sacos de catalizador y el nivel bajo o inferior denota el uso de un solo saco. 3 tratamientos A baja. el efecto de un factor se denota por la letra latina minúscula. bajo (1 saco) - (1) = 80(28+25+27) bajo (15%) a = 100(36+32+32) + alto (20%) Concentracion de reactivo A Figura 1: Combinaciones de tratamiento en el diseño factoriall . y los datos son como sigue: Combinación de Fig. en ejes A y B.4. Así – en b = 60(18+19+23) ab = los 90(31+30+19) Alto (2 sacos) + el eje B representa el nivel bajo de catalizador mientras que + denota el nivel alto. Ejemplo 1 Considérese una investigación llevada a cabo para estudiar el efecto que tiene la concentración de un reactivo y la presencia de un catalizador sobre el tiempo de reacción de un proceso químico. En el diseño 2 2 los niveles bajo y alto de A y B se denotan por “-“ y “+” respectivamente. Arbitrariamente. Este diseño se conoce como diseño factorial 22. cada uno con dos niveles.2 Diseño factorial de dos niveles (2^K) E l primer diseño de la serie 2 2 es aquel en el que solo dos factores. B alta 31 30 29 90 En la figura 3 siguiente se presentan gráficamente las combinaciones de tratamiento para este diseño. B alta 18 19 23 60 A alta. El catalizador constituye el factor B. El experimento se realiza (“replica o repite”) tres veces. y “B” se refiere al efecto del factor “B”. De este modo. y “AB” se refiere a la interacción entre AB. “A” se refiere al efecto del factor “A”. los niveles del factor pueden llamarse “bajo” y “alto”. 15% y 20%. A y B. B baja Replica I II 28 25 III 27 Total 80 A alta. B baja 36 32 32 100 A baja. Sea la concentración del reactivo el factor A con dos niveles de interés. Las cuatro combinaciones de tratamientos en el diseño pueden representarse por letras minúsculas. el efecto de A en el nivel B es {a-(1)}/n. cono se muestra en la figura 3. en la que A se encuentra en el nivel superior y B en el nivel inferior. Tomando el promedio de estas dos cantidades se obtiene: A 1 2n ab b a (1) 1 2n ab a b (1) . y “ab” representa a ambos factores en el nivel superior. Mientras que el nivel superior B es {ab-b}/n. b y ab también se usan para representar los totales de las n replicas de las combinaciones de tratamientos correspondientes. Por convención (1) se usa para representar a ambos factores en el nivel inferior. Así: “a” representa la combinación de tratamientos. “b” representa aquella en la que A se halla en el nivel inferior y B en el superior. En esta figura se aprecia que el nivel superior de cualquier factor de una combinación de tratamientos está representado por la presencia de la letra minúscula correspondiente. mientras que la ausencia de esta ultima representa el nivel inferior del factor. El efecto promedio de un factor se define como el cambio en la respuesta producida por un cambio en el nivel de ese factor. las letras minúsculas (1). promediado sobre los niveles del otro factor. Como se ilustra en la figura 3. Ahora bien. a. A YA YA ab a 2n 1 2n b (1) 2n ab a b (1) Este es exactamente el mismo resultado. puesto que es la respuesta promedio para las combinaciones de tratamientos a las que A que se encuentra en el nivel alto) y las dos combinaciones de tratamientos en la mitad izquierda (o Y A). {b-(1)}/n.El efecto promedio de B se determina a partir de su efecto en el nivel inferior de A (esto es. o B YB YB . Las formulas para los efectos de A. el efecto de B se encuentra como la diferencia entre el promedio de las dos combinaciones de tratamientos en la parte superior del cuadrado ( Y B+) y el promedio de las dos combinaciones de tratamientos en la parte inferior ( Y B-).a (1) El efecto de la interacción AB se define como la diferencia promedio entre el efecto de A en el nivel superior de B y su efecto en el nivel inferior de B. B y AB pueden deducirse por otro método. El efecto de A puede hallarse como la diferencia en la respuesta promedio de las dos combinaciones de tratamiento en la mitad derecha (que llamaremos Y A+. y de su efecto en el nivel superior de A (que es igual a [ab-a]/n obteniéndose: B 1 2n ab a b (1) 1 2n ab b . Esto es. así: AB 1 2n ab b a (1) 1 2n ab (1) a (b) Por otro lado se puede definir AB como la diferencia promedio entre el efecto de B en el nivel superior de A y el efecto de B en el nivel inferior de A. Por lo general puede emplearse el análisis de varianza para confirmar esta interpretación. Al parecer. las estimaciones de los efectos promedio son: A B 1 2(3) 1 2(3) AB 90 100 60 80 8.00 1 2(3) 90 80 100 60 1.67 El efecto de A (concentración de reactivo) es positivo. En muchos experimentos que implican diseños 2 K se examina la magnitud y la dirección de los efectos de los factores para determinar cuales variables es probable que sean importantes. .33 90 60 100 80 5. En el diseño 2k existen algunos métodos rápidos especiales para realizar los cálculos del análisis de varianza. esto sugiere que elevar la cantidad del catalizador agregada al proceso reducirá el rendimiento. el efecto de interacciones es pequeño comparado con los dos efectos principales. o AB 1 2n ab (1) 2n ab 2n ab (1) a b Con los datos que aparecen en la figura 1. El efecto de B (catalizador) es negativo. ab b 2n 1 2n a (1) 2n ab b a (1) Finalmente el efecto de interacción AB es el promedio de las combinaciones de tratamientos en la diagonal de derecha a izquierda del cuadrado ab y (1) menos el promedio de las combinaciones de tratamientos en la diagonal de izquierda a derecha (a y b). esto sugiere que al elevar A del nivel bajo (15%) al nivel alto (25%) incrementará el rendimiento. Consideremos la suma de cuadrados para A. La suma de cuadrados de cualquiera de ellos puede calcularse usando la siguiente ecuación: 2 2 n a a ci . obteniéndose: SSA SSB 50 2 208. Además.. ContrasteA ab a b (1) Este contraste suele llamarse efecto total de A. aciyi. A partir de la segunda y tercera ecuación. estos tres contrastes son ortogonales. 2 2 n SST i2 1 j1 k 1 Y ijk 4n .33 La suma total de cuadrados se determina de la manera usual mediante: 2 Y . En consecuencia.33 4(3) 30 SSAB 2 4(3) 10 75. Obsérvese la primera ecuación que se utiliza un contraste para estimar A. las sumas de cuadrados se pueden calcular aplicando las ecuaciones anteriores. SSc 1 Esta ecuación establece que la suma de cuadrados de contraste es igual al contraste elevado al cuadrado entre el producto del número de las observaciones de cada total del contraste por la suma de cuadrados de los coeficientes del mismo. B y AB.. se obtiene que las sumas de cuadrados de A. puede apreciarse que también se utilizan contraste para estimar B y AB.00 2 4(3) 8. esto es. B y AB sean: SSA SSB ab a b (1) 2 n* 4 ab b a (1) 2 SSAB n* 4 ab (1) a b 2 n* 4 Con los datos de la figura 3. 34 El análisis de varianza completo se presenta en la tabla siguiente. se puede calcular en la forma usual. mediante.33 75.00 323. Ambos efectos principales son significativos al 1%.33 a Total 31.00 8.L.34 11 3. con 4(n-1) G. 208. La suma de cuadrados del error.13 323. 2 2 2 3 Y 2 SS E Yijk 9398. y ab.33 31.3 53.92 2.33 8.13 Error 8.00 19. n A SS L.00 208.00 9075.15 B 3 3 AB 75.0 1 8 a . Cuando se utiliza es posible apreciar que los coeficientes de los contrastes usados para estimar los efectos son Efect (1 a b A os A: ) b -1 + -1 + B: -1 1 AB: + -1 1 1 -1 -1 1 + 1 + + 1 Tabla ANOVA para los datos del ejemplo 1 es la siguiente: Fuente de variació G. por diferencia. a. Este orden se conoce como orden estándar.00 1 75. A menudo se es conveniente escribir las combinaciones de tratamientos en el orden (1).00 i1j1k 1 4(3) SS E SS T SS A SS B SS AB 323.3 1 MS Fo 208.En general SST tiene 4n –1 grados de libertad. b. .0 a significativo al 1% Signos algebraicos para calcular los efectos en un diseño 22 Combinaci Efecto ón Factorial De I A B AB Tratamient os (1) + . Se observa que la columna encabezada por I se compone de solo de signos positivos. Los renglones corresponden a las combinaciones de tratamientos. En el encabezado de las columnas de tabla y se encuentran los efectos principales (A y B). la interacción AB.+ - ab + + + + Observe que los coeficientes de los contrastes usados para estimar la interacción son iguales al producto de los coeficientes correspondientes a los dos efectos principales. Para encontrar un contraste con el fin de estimar cualquier efecto. que representa el total el total o el promedio de todo el experimento. . e I. Los coeficientes de los contrastes siempre son +1 o –1 y se puede usar una tabla de signos positivos y negativos como la mostrada en la de signos algebraicos para determinar el signo apropiado de cada combinación de tratamientos. simplemente se multiplican los signos de la columna apropiada de la tabla por la correspondiente combinación de tratamientos.+ a + + . y se suma.- b + . cada A repetición o réplica del experimento contiene todas las combinaciones de tratamiento ab. DISEÑOS DE EXPERIMENTOS FRACCIONALES DE DOS NIVELES 5. esto es. lo cual concuerda con la ecuación. Así por ejemplo cuando se tienen siete factores. El número de efectos a evaluar (interacciones principalmente) crece exponencialmente también. el número de casillas o condiciones experimentales (y por lo tanto el número de lecturas o pruebas necesarias). dispuestos en un diseño factorial. existen 128 posibles condiciones experimentales. En general.1 Concepto de replicación fraccionada Conforme el número de factores del experimento crece. lo que implica que al hacer una . El número de efectos y casillas varía con el número de factores en una relación como se muestra en la tabla siguiente para un experimento factorial 2k. crece exponencialmente en un experimento factorial. hay n repeticiones. A 1 2n ab b a (1) 1 2n ab a b (1) Los tipos más sencillos de diseños factoriales implican sólo dos factores o conjuntos de tratamientos.Por ejemplo. 5. Haya “a” niveles del factor A y “b” niveles del factor B. el contraste para estimar A es –(1) + a – b + ab. por lo que en general se pueden suponer como no existentes. 2) En un experimento de varios factores lo más probable es que solo algunos de ellos sean relevantes para la variable de respuesta. 3) La mayor parte del efecto se debe a los factores principales y algunas interacciones de dos factores. 7 de seis en seis y una interacción de 7 factores. En general el número de interacciones de k factores tomados r en r es: K! r! (k r)! El concepto de replicación fraccionada parte de las siguientes hipótesis: 1) Las interacciones de tres o más factores son sumamente raras en la práctica.replicación por celda de todo el experimento requiere un total de 128 observaciones. y esto equivale a solo 29 unidades de información y no 128 como en el experimento original. Por otro lado. lo cual es una cantidad excesiva de pruebas para fines prácticos. 35 de cuatro. 21 interacciones de 2 factores. entonces serian necesarias 256 observaciones. Lo anterior implica que por ejemplo para siete factores son necesarios probablemente solo 28 grados de libertad (7 factores principales y 21 interacciones de dos factores). Si se decide tomar dos replicas por celda. Esto quiere decir que no es necesario el correr una replicación completa de todo . se necesitan 128 observaciones para un experimento con 7 factores por que se deben evaluar 127 posibles efectos (que son los grados de libertad totales en 128 observaciones) de estos efectos 7 son los factores principales. 27 de cinco en cinco. 35 de tres. 2 Fracción un medio del diseño 2k C onsidérese el caso en el que se estudian tres factores de dos niveles cada uno.-+ + -+ ++++ +++ + +. Esto sugiere una fracción un medio.+. Supóngase que para componer la fracción un medio.b..B. ¿Qué información se pierde? El responder a estas preguntas es uno de los objetivos de la replicación fraccionaria.. de un diseño 2 3. En la tabla 1 aparecen signos positivos y negativos del diseño 2 3.. ¿Cómo analizar los resultados? 3. la fracción un medio del diseño 2 3 se conoce también como un diseño 2 3-1 porque tiene 23-1 = 4 combinaciones de tratamiento.. se dice que se tiene una replicación fraccionada del experimento.c.+ . se seleccionan las combinaciones de tratamientos se usa indistintamente la notación convencional (a.el experimento cuando el número de factores crece.+ . La equivalencia Combinación notaciones se de continuación. Las preguntas que surgen son: 1.-.C -. si se puede costear 4 observaciones. sino solamente algunas casillas o condiciones experimentales. sin embargo.+ . 5. pero en el que los experimentadores no pueden costear las 23 = 8 combinaciones de tratamientos.+ ++. Cuando solamente una parte de las posibles casillas se prueban.+ + B AB C + + + + C + + + + - las dos muestra a . ¿Cuántas y cuales casillas probar? 2.-.. de Efecto factorial Notación Tratamientos I A 1 A a ++ B b +C c Abc + abc ++ ab ++ ac ++ bc +(1) +- Notación B C A A 2 + .) y la de signos positivos y negativos. Además. Por esto ABC se denomina generador de una fracción particular. por lo cual: I = ABC Se denominara relación definitoria de nuestro diseño. en general.Tabla 1 Signos positivos para el diseño 23 Nótese que el diseño 23-1 se forma al seleccionar solo las combinaciones de tratamientos que producen un signo positivo sobre la columna ABC. abc bc c ac b C ab B A a (a) Fracción principal I = ABC (1 ) (b) Fracción alterna I = -ABC . la relación definitoria de un factorial fraccionario siempre es el conjunto de todas las columnas que son iguales a la columna identidad I. la columna identidad I siempre es positiva. entre B y AC y entre C y AB. es imposible distinguir entre A y BC. Esto se indica empleando la notación: LA A BC. multiplicando cualquier efecto por la relación que define al diseño.Las combinaciones de tratamientos del diseño 2 3-1 producen 3 G. que pueden usase para estimar los efectos principales. modulo 2. En este ejemplo. lo que sé esta haciendo es estimar A + BC. y C son: LA 1/2(a b c abc) LB 1/2( a b c abc) LC 1/2( a b c abc) LBC 1/2(a b c abc) LAC 1/2( a b c abc) LAB 1/2( a b c abc) Por lo tanto LA = LBC. LB = LAC y LC = LAB. respectivamente. En consecuencia.L. En la tabla 1 se muestra que las combinaciones lineales de las observaciones que se utilizan para estimar los efectos principales A. B y AC y C y AB son alias. En el ejemplo anterior. De hecho. B y C. Dos o más efectos que tienen esta propiedad se conoce como alias. es posible mostrar que cuando se estima A. CB + AC y C + AB. LB B AC LC C AB La estructura de los alias de este diseño pueden determinarse fácilmente con la relación I = ABC. da como resultado los alias de dicho efecto. A y BC. B. en realidad. los alias son: A*I = A*ABC = A2BC . Generalmente la fracción asociada con I . Ahora supóngase que se eligió la otra mitad de la réplica.O dado que el cuadrado de cualquier columna es simplemente la identidad I. A = BC De modo similar. Esta fracción un medio o alterna que consta de las siguientes corridas: Notación Notación 1 (1) ab ac abc 2 --+++-+ -++ La relación definitoria de este diseño es: I = -ABC Usando la fracción alterna. Esta se compone de las combinaciones de tratamientos de la tabla 1 que tiene signo negativo asociado con ABC. se encuentra que los alias de B y C son: B*I = B*ABC = AB2C = AC C*I = C*ABC = ABC2 = AB Esta fracción un medio o semifracción. En la práctica. las combinaciones lineales de las observaciones. B – AC y C – AB al estimar A. L’B y L’C. son: L' A A BC L' B B AC L' C C AB Por lo tanto. no importa cual de las dos fracciones se utilice. L’A. con I = +ABC. suele llamarse fracción principal. B y C con esta fracción. en realidad se está estimando A – BC. se presenta la definición de estos diseños junto con un ejemplo. En tal diseño los alias de los efectos principales son interacciones de dos factores. se emplea el numeral romano como subíndice para indicar la resolución del diseño. en otras palabras. Los diseños de resolución III. de alguna interacción de dos factores. o bien.= +ABC se denomina fracción principal.1 es de resolución III. 1) Diseño con resolución III: éstos son diseños en los que ningún efecto principal es alias de otro. a su vez. Un diseño 2 4-1 con I = ABCD es de 4 1 resolución IV ( 2IV ).ABC) constituye un diseño 2III .3 Resolución del diseño E l diseño anterior 23-1 se conoce como diseño de resolución III. . Un diseño es resolución R si ningún efecto de p factores es alias de otro efecto que tenga menos R – p factores. A continuación. El diseño 23-1 de la tabla 4. pero si lo son de las interacciones de dos factores. la fracción un medio del diseño 2 3 definido 3 1 por la relación I = ABC (o bien I = . Usualmente. estas últimas son alias entre sí. 5. Así. Las interacciones de dos factores son “alias” entre sí. un diseño 2 51 con I = ABCDE es de resolución V ( 2 5V1 ). estas dos fracciones forman el diseño 23 completo. 3) Diseños resolución V: Estos son diseños en los que ningún efecto principal o interacción de dos factores es alias de ningún efecto principal o interacciones entre dos factores. Ambas fracciones pertenecen a la misma familia. 2) Diseño con resolución IV: En estos diseño ningún efecto principal es alias de otro efecto principal. IV y V son de importancia primordial. En la tabla 1 se presentan el experimento y los datos resultantes de duración observada de las baterías. el ingeniero desea contestar las siguientes preguntas: 1. Se prueban cuatro baterías a cada combinación de material de la cubierta y temperatura. las suposiciones relativas a las interacciones que deben despreciarse con el propósito de hacer una interpretación única de los datos son menos restrictivas. En consecuencia. único factor controlable a tres niveles de temperatura (15. 70 y 125 °F) consistentes en el entorno de uso final del producto. los diseños anteriores. ¿Existe una elección del material que dé por resultado una duración uniformemente larga sin importar la temperatura? Temperatura F . A mayor resolución. ¿Qué efecto tienen el tipo de material y la temperatura sobre la duración de la batería? 2. a menudo. 6. Por lo general se deben usar diseños fraccionarios con la mayor resolución posible congruentes con el fraccionamiento requerido. se conocen como diseños de 3. y las 36 pruebas se ejecutan al azar. 4 y 5 letras. DISEÑOS DE EXPERIMENTOS FACTORIALES COMPLETOS 6.1 Diseño factorial completo de 2 factores Un ingeniero decide probar los tres materiales de la cubierta. la resolución de un diseño factorial fraccionario de dos niveles es igual al mínimo número de letras de cualquier palabra de la relación que define al diseño. En este problema.En general. respectivamente. Para pasar al caso general.. Existe la posibilidad de hallar un material que no sea muy afectado por la temperatura. Duración en horas para el ejemplo del diseño de una batería Esta última pregunta reviste particular importancia. n). 2. Éste es un ejemplo del uso del diseño experimental estadístico para el diseño de un producto robusto (o consistente). el ingeniero puede hacer que la batería sea robusta a la variación de temperatura en el campo. Este diseño es un ejemplo específico del caso general de un diseño con dos factores (bifactorial)... los datos observados se verán como en la tabla 2. de aleatorizado. De ser así.Tipo de material 1 15 70 125 13 15 34 40 2 70 3 3 0 5 0 74 18 80 75 8 58 0 2 15 18 12 12 2 70 0 8 6 2 5 15 12 10 11 5 45 9 6 6 5 8 13 11 17 12 9 10 8 0 4 0 6 16 16 15 13 8 4 60 8 0 0 9 2 Tabla 1. sea Yijk la respuesta observada cuando el factor A se encuentra en el i-ésimo nivel (i -1.. modo que éste es un diseño completamente . El orden en el cual se toman las abn observaciones es aleatorio. En general. un importante problema de ingeniería. .... i es el efecto del i-ésimo nivel del factor renglón A. ()ij es el efecto de la interacción entre i y j. b k 1. ijk es el componente del error aleatorio.2.. Hay un total de abn observaciones porque se realizan n réplicas. Inicialmente se supone que ambos factores son fijos y que los efectos de tratamiento se definen como desviaciones de la media general.. En un diseño factorial de dos factores...2. n En donde es el efecto medio general. bj1βj 0 Se supone que los efectos de interacción son fijos y que se definen dé manera que: ia1 τβ ij 0 .. Disposición general para un diseño bifactorial Las observaciones pueden describirse mediante el modelo estadístico lineal: i 1.Tabla 2. tanto los factores (o tratamientos) de renglón como de columna tienen la misma ..2. por lo tanto.. j es el efecto del j-ésimo nivel del factor columna B.. ia1 τi 0. a Yijk μ τi βj τβ ij εijk j 1. El total de las observaciones bajo el j-ésimo nivel del factor B.. columna. Yij... Y .importancia. celda y general.j. el total de las observaciones bajo el i-ésimo nivel del factor A. y Yij.βb 0 H1 : al menos una βj 0 También es interesante determinar sí los tratamientos de renglón y columna interaccionan. específicamente el interés consiste en probar hipótesis acerca de la igualdad de los efectos de tratamiento de renglón. En otras palabras. es decir: Ho : τ1 τ2 .2 Análisis Estadístico del Modelo de Efectos Fijos S ea Yi. Y.τa 0 H1 : al menos una τi 0 Y de la igualdad de los efectos de tratamiento de columna: Ho : β1 β2 . e Y. El total de las observaciones de la ij-ésima celda. Se definen como los promedios de renglón. de y Y...... resulta conveniente probar: Ho : (ττβ)i 0 para toda i.. matemáticamente: . todas las observaciones.j. el total general Yi.. se muestra cómo pueden probarse estas hipótesis usando un análisis de variancia bifactorial o bidireccional (de dos factores o en dos sentidos). respectivamente.. 6.. j H1 : al menos una (ττβ)i 0 A continuación. .... .. Y i. . .. .. j . Y i.. 2 Y ij . Yijk Y... b . Y ij . Yijk k 1 Yij. a bn Y.... n Yij. Yi.. a j 1. Yij k Yij k Y . n i 1. j 1.. 2 a n Y. b an Y. j .. Simbólicamente. Y... Y . . j Y . Y ..2.. i 1. en una suma de cuadrados debida a la interacción entre A y B (SSAB). . a b i1 j1 Y . n k 1 2 Y ij k n a b i1 j1 - Y ij .. a n Y. i1j1k 1 abn La suma total de cuadrados corregida puede expresarse mediante: a i1 b j1 n k 1 a b i1 j1 a b i1 j1 bn a i1 Yij k n k 1 n k 1 Y i. Y . 2 b j1 Y . . y en una suma de cuadrados debida al error (SS E): Analizando el último término del miembro derecho de la Ecuación anterior es posible observar que es necesario tener al menos dos réplicas (n 2) para poder obtenerla suma de cuadrados del error....... ..b n Yi. Y. Y ij . Yijk i1k 1 Y. 2 Y . Se observa que la suma total de cuadrados se ha descompuesto en una suma de cuadrados debida a los “renglones” o al “factor” A (SSA) en una suma de cuadrados debida a las "columnas" o al factor B (SSB)..2... a b n Y.. . . ... Yijk j1k 1 Yi...j.j.2. 2 Dado que los seis productos cruzados del segundo miembro de la ecuación anterior son iguales a cero.j.j .2. . Y .. la Ecuación anterior puede expresarse mediante: S T S A S B S AB S E Los grados de libertad asociados a cada suma de cuadrados son: Y. simplemente deben dividirse las medias de cuadrados correspondientes entre la media de cuadrados del error. Los grados de libertad de la interacción simplemente corresponden a los grados de libertad de cada celda (los cuales son iguales a ab -1) menos los grados de libertad de los dos efectos principales A y B en otras palabras. Se observa que la suma de los grados de libertad de los términos del miembro derecho de la ecuación anterior es igual al total de los grados de libertad. ab -1 -(a -1) -(b -1) -(a. Dentro de cada una de las ab celdas hay n -1 grados de libertad entre las n réplicas. por lo tanto. para probar el significado de ambos efectos principales. . Por lo tanto. Valores grandes de estas razones implican que los datos no concuerdan con las hipótesis nulas. por lo tanto. respectivamente. así como de su interacción. hay ab(n -1) grados de libertad del error. tienen a -1 y b -1 grados de libertad como se muestra.1)(b -1). Cada suma de cuadrados dividida entre sus grados de libertad produce una media de cuadrados.Efecto Grados de libert ad A B Interacción a-1 b-1 (a-1)(b-1) AB Error Total ab(n-1) abn-1 Esta descomposición del total de abn -1 grados de libertad para las sumas de cuadrados se puede justificar como sigue: Los efectos principales de A y B tienen a y b niveles. entonces las razones de las medias de cuadrados MSA/MSE. Y ..1 B Interacción Fo MSA MSA SSA MSE a 1 MSB MSB SSB SSA (a ... Las regiones críticas corresponden al extremo superior de la distribución F. Fuente de Variación SS G. Y ..1 Tabla 2 ANOVA para el modelo bifactorial de efectos fijos Es posible obtener las fórmulas para calcular las sumas de cuadrados de la ecuación anterior.Si se considera que el modelo estadístico es adecuado y que los términos del error ijk son independientes con distribuciones normales con variancia constante 2.j.L. b. SSB j1 an abn SSA . y ab(n -1) grados de libertad en el denominador. La suma total de cuadrados se calcula en forma usual mediante: SST 2 a b n Y . Tratamientos SSA a . MSB/MSE y MSAB/MSE tienen distribución F con a -1.1)(b B Error MS 1) SSE ab(n-1) b 1 MSAB SSAB MSE MSAB MSE (a 1)(b 1) MSB SSE ab(n 1) Total SST abn .1 y (a -1)(b -1) grados de libertad en el numerador. i1 bn abn 2 2 b Y . 2 Y ijk i1j1k 1 abn Las sumas de cuadrados para los efectos principales son: 2 2 a Y i. Usualmente la prueba se presenta en una tabla de análisis de variancia como la que aparece en la tabla 2..1 A Tratamientos SSB b . respectivamente... En la tabla 3 se presenta la duración efectiva (en horas) observada en el ejemplo de diseño de una batería descrito en la anterior Los totales de renglón y de columna se indican en los márgenes de la tabla. Por lo tanto. Y .Es conveniente obtener SSAB en dos etapas. Tip Temperatura (F) o de 15 70 125 Yi. 1 13 15 0 5 539 4 134. la segunda etapa consiste en calcular SSAB mediante: SSAB SSsubtotales SSA SSB La SSE se calcula por diferencia: SSE SST SSAB SSA SSB o bien : SSE SST SSSubtotales Ejemplo: Más sobre el experimento de diseño de una batería. Mat . SSsubtotales i1j1 n abn Esta suma de cuadrados contiene a la SS A y SSB... Primero se calcula la suma de cuadrados entre los totales de las ab celdas.75 34 40 22 2 9 0 70 23 998 0 . los números subrayados son los totales de celda. conocida como la suma de cuadrados debido a los "subtotales": 2 2 a b Y ij.. 74 18 80 75 8 0 2 2 15 18 0 8 15 12 9 3 13 12 623 6 13 11 8 0 16 16 8 Y.j.78 SSE SST SSmaterial SStemperatura SSinteraccion SSE 77. 58 6 2 2 47 5 10 11 9 5 6 8 5 17 12 576 0 1738 4 0 9 58 6 15 13 3 8 0 2 9 1291 70 19 130 45 8 0 10 4 34 150 60 2 770 = 1 Y. Se concluye que existe una interacción significativa entre el tipo de material y la temperatura porque F0.72 39.27 = 2. SStemperat ura j1 an abn 2 2 2 2 1738 1291 770 3799 39.72 9.05...4.683.. Duración (en horas) para el experimento de diseño de una batería Las sumas de cuadrados se calculan a continuación: 2 a b n Y ..72 9.613..75 El análisis de variancia aparece en la tabla 4.646..230. Y .72 (3)(4) 36 2 2 b Y .118.j. 2 SST Y ijk i1j1 k 1 abn 130 2 155 2 74 2 .646.97 10.. Y .638. Y .. también son significativos los efectos .. SSinteracc ion i1j1 n abn 2 2 2 2 539 229 . Además.118. 342 3799 10. SSmaterial i1 bn abn 2 2 2 2 998 1300 1501 3799 10. 60 2 3799 36 2 77...683.78 18.72 4 36 39...73.613.= 379 9 Tabla 3.118..72 (3)(49 36 2 2 a b Y ij..97 2 2 a Y i. 341.8 2 6 19. 4 27 675.118.35. 175 150 125 Yij.2.646.principales del tipo de material y de la temperatura. ANOVA datos de duración batería Como en L. 2 MS 5.558. Interacción 72 9.7 4 Error 8 18. 28.21 Total 75 77.683. 36 2.4 Temperatura 72 39.27 = 3.O5. 100 Material tipo 3 75 Material tipo 1 Material tipo 2 50 25 15 70 Temperatura 125 Figura 1.56 la de la auxiliar 97 la interpretación de los resultados de este experimento resulta útil la construcción de una gráfica de las respuestas promedio de cada combinación de tratamiento. Gráfica de respuesta vs temperatura .9 para los 7 3. variación SS Tipo de material 10. Fuente de G.403. Esta gráfica se muestra en la figura 1.230.91 Tabla 4. 35 Fo 7. porque F O.613. El hecho de que las rectas no sean paralelas indica una interacción significativa. la duración disminuye con los materiales tipo 2 y 3. mientras que disminuye con los materiales tipo 1 y 2. 7. la duración aumenta con el material tipo 3. Para comprobar si el modelo es adecuado. a menor temperatura mayor duración. a fin de asegurar productos robustos. Cuando la temperatura varía de intermedia a alta. DISEÑO DE EXPERIMENTOS TAGUCHI 7. el material tipo 3 da los mejores resultados si lo que se desea es menor perdida de duración efectiva al cambiar la temperatura. de alta calidad y bajo costo.1 Introducción La parte fundamental de la metodología ideada por el matemático japonés G. independientemente del tipo de material. se analizan los residuos que tengan un comportamiento aleatorio y normal. mientras que con el tipo 1 esencialmente permanece sin cambio. En general. Al parecer. La metodología Taguchi consta de tres etapas: a) Diseño del sistema b) Diseño de parámetros c) Diseño de tolerancias . Al variar la temperatura de baja a intermedia. Taguchi es la optimización de productos y procesos. c) Identificar factores que no afectan substancialmente la característica de calidad a fin de liberar el control de estos factores y ahorrar costos de pruebas. Para lograr lo anterior se ha manejado una serie de herramientas estadísticas conocida como diseño de experimentos. La herramienta utilizada normalmente son fraccionados. tratadas anteriormente. Taguchi ha propuesto una alternativa no del todo diferente que se que conoce como: Arreglos Ortogonales y las Gráficas Lineales. sin embargo cuando el incrementado.De estas tres etapas. Taguchi desarrolló una serie de arreglos particulares que denominó: La (b)C . Un experimento factorial fraccionado es también un arreglo ortogonal. a fin de optimizar la operación del producto y hacerlo lo más robusto posible. de manera que conserva el concepto de ortogonalidad y contrastes. b) Definir los niveles “óptimos” en que debe fijarse cada parámetro o factor. así como la complicaciones para identificar cuáles son las condiciones específicas a experimentar. Un arreglo ortogonal se puede comparar con una replicación factorial fraccionada. la más importante es el diseño de parámetros cuyos objetivos son: a) Identificar qué factores afectan la característica de calidad en cuanto a su magnitud y en cuanto a su variabilidad. diseños Factoriales número de factores se ve las posibles interacciones aumentan. para un arreglo a dos niveles. Esto es el número de renglones o líneas en el arreglo. Un arreglo ortogonal es una tabla de números. cómo se usan y cuáles son los arreglos ortogonales más importantes para experimentos en los que cada factor toma dos niveles. . A 1 1 2 2 2 = F A C T O R E S (c) B C 1 1 2 2 1 1 2 1 Resultado Y1 Y2 Y3 Y4 Niveles de los Factores (b) arreglo ortogonal tenemos el siguiente: De acuerdo con la notación empleada por Taguchi al arreglo mostrado como ejemplo. En general. (a) 1 2 3 4 1 . se le llama un arreglo L4. es igual al número de renglones menos 1. esto es el número de columnas. por tener cuatro renglones.Donde: a = Representa el número de pruebas o condiciones experimentales que se tomarán. el número de columnas (efectos o factores) que se pueden analizar. 7. c = Es el número de efectos independientes que se pueden analizar. b = Representa los diferentes niveles a los que se tomará cada factor. se analiza qué son.2 Arreglos ortogonales para experimentos a dos niveles En esta sección. Como ejemplo de un No. Col. 1 2 3 4 5 6 7 8 tabla de interaccio nes Column as 1 2 3 4 1 (1) 2 3 (2) 3 2 1 (3) 4 5 6 7 (4) 5 4 7 6 1 6 7 4 5 2 7 6 5 4 3 . Col.Taguchi ha desarrollado una serie de arreglos para experimentos con factores a dos niveles. de factores a Arreglo analizar Entre 1 y 3 Entre 4 y 7 Entre 8 y 11 Entre 12 y 15 Entre 16 y 31 Entre 32 y 63 a No. Col. 1 2 3 4 5 6 7 1 1 1 1 2 2 2 2 1 1 2 2 1 1 2 2 1 1 2 2 2 2 1 1 1 2 1 2 1 2 1 2 1 2 1 2 2 1 2 1 1 2 2 1 1 2 2 1 1 2 2 1 2 1 1 2 Matriz o Exp. Col. utilizar L4 L8 L12 L16 L32 L64 de condiciones a probar 4 8 12 16 32 64 El arreglo ortogonal más popular es el arreglo L8. que se muestra a continuación junto con sus gráficas lineales: L8 Col. No. Col. los más utilizados y difundidos según el número de factores a analizar son: No. Col. 2) Seleccionar factores de control y sus niveles. asignar los factores de control al arreglo interno y los factores de ruido al arreglo externo. 3) Seleccionar los factores de ruido y sus niveles. 4) Seleccionar los arreglos interno y externo adecuados. 5) Realizar los experimentos.3 Caso menor es mejor 1) Seleccionar una característica de calidad de salida a ser optimizada.7 5 4 6 2 6 4 (a) (b) 7 Gráficas lineales Los pasos para un diseño de experimentos de parámetros en el caso de menor es mejor son: 7. . si son demasiados combinarlos en dos o tres factores combinados. identificando sus posibles interacciones.5 6 7 (5) 1 ¡(1) 1 3 2 6 (7) 3 2 5 1 . también se llama regresor o respuesta X = Variable independiente. dar prioridad a los que sirven para maximizar la relación S/N.La relación entre X y Y se representa por medio de una línea recta Regresión curvilínea . Y = f(X) Y = Variable dependiente que se desea explicar o predecir. regresor o predictor Regresión lineal . REGRESIÓN Y CORRELACIÓN LINEAL 8. 8.6) Realizar análisis estadístico con base en S/N para identificar los niveles de los factores de control óptimos Algunas veces ayuda realizar un estudio de la interacción entre factores de control y de ruido. también se llama variable explicativa.La relación entre X y Y se representa por medio de una curva. Y * ** * * * * * .1 Introducción Son dos herramientas para investigar la dependencia de una variable dependiente Y en función de una variable independiente X. 7) Realizar análisis estadístico con base en las medias para identificar los niveles de los factores de control óptimos que ajustan a la respuesta promedio en el nivel deseado. 8) Predecir el desempeño de salida óptimo con base en una combinación óptima de niveles de factores de control y realiza un experimento confirmatorio. Si hay conflicto entre los niveles de los factores para maximizar la relación S/N y ajustar la media. * * * * * b1 * * * * * * * * * * * * * * b0 Correlación positiva Correlación negativa X correlación La ecuación de la recta es la siguiente: El término de error es la diferencia entre los valores reales observados Yi y los valores estimados por la ecuación de la recta. * Error Re siduo (Yi Yi ) Y * * X Se trata de minimizar la suma de todos los errores o residuos: Las fórmulas resultado de la minimización de lo cuadrados del error se aplicarán en el siguiente ejemplo por claridad. Se trata de que estos sean mínimos. Se tienen los siguientes supuestos: Sin . para lo cual se utiliza el método de mínimos cuadrados. Yest) = 1. El coeficiente de Correlación r desarrollado por Carl Pearson es un indicador de la fuerza de la relación entre las variables X y Y.81 Ymedia =17. Se identifican tres medidas de desviación como sigue: Y Yest = 4. de lo contrario.2 Ejemplo manual Se sospecha que el tiempo requerido para hacer un mantenimiento preventivo está relacionado con su número. Las varianzas de los errores son las mismas en todos los valores de X (Homoscedasticidad) en caso contrario se tiene (Heteroscedasticidad) 3.1. Los errores o residuos se distribuyen normalmente alrededor de la recta de regresión poblacional 2.32 Variación total (Yimedia)=5. Los errores o residuos son independientes: No se muestra algún patrón definido.1 Desviación 3 explicada (Yest-Ymedia) = 3.4 + 1. sería necesario buscar la solución por otro lado. Calcular el coeficiente de .08 X Yi = 23 Desviación * no explicada Error = (Yi . se deben buscar soluciones al problema mediante acciones asociadas con la variable presión.87 X = 16 X 8. puede asumir valores entre -1 y 1 para correlación negativa y positiva perfecta respectivamente. Por ejemplo si se encuentra que la variable presión tiene una correlación positiva con el rendimiento de una caldera. 7045 9 1 10.45 1.7422 31.5477 16.0020 39.8694 3 0.9178 8.00 10.6337 9 1.9376 301.00 21.08 50.367872 0.9286 9 3 28.9408 28.6075 6 0.75 7.014272 138.4176 1.963072 0.3832 3 2 34.558928 0.989472 7.correlación y graficar.625472 52.336 8 27.60 121.95 8 (Xi-X)^2 (Yi-Y)^2 Yest Error 10.4763 3 0.238 47.50 0.0576 16.655 15 15 46.679872 17.099872 0.947 12 41.9776 124.0121 10.303072 17.568672 14.612672 17.0181 10.1533 9 0.9376 364.0021 2 2 37.0576 2.251 3.66 108.433472 38.00 10.456 9 24.919 119.141 10 34.0976 35.9776 148.919 2 9.141 10 35.2646 48.8142 9 0.7770 6 0.9776 142.686672 45.2111 34.9376 214.5776 21.502272 3.0976 .102 24.3495 2 0.655 14.6976 308.95 48.86 51.127072 45.7369 28.2553 251.93 10.1026 2 9 16.252 4 21.1258 37.6176 7.076672 38.1620 3 1.8541 0 4.89 47.919 2 11.725 4 17.499472 7.1337 1 4.2976 135.336 10.044 28.6991 16.597.972 2 14.005 20 1 69.725 4 17.725 24.6976 107.0576 21.9376 377.6176 63.30 470.919 11.260672 38.38 91. Los datos de tiempo tomados para n = 25 servicios se muestran a continuación: X Servicios Y Tiempo (Xi-X)*(Yi-Y) 2 9.35 -3.168 34.02 0.5057 3 3 16.044 11 37.59 44.88 118.245472 17.6216 48.379072 34.9776 54.1376 166.996 8 25.336 15.0172 5.3564 63.406272 38.725 4 16.3771 6 2 350.65 31.029 11 31.1771 3 0. 0176 47.5649 54. Como la correlación no siempre es perfecta.3164 220.6054 5 4.1606 19.751472 76.676672 60.5600 6.540272 10.1 2 51.114515575 Las sumas de cuadrados son: .1385 0 206 725. Los cálculos tomando las sumas de cuadrados siguientes se muestran a continuación: Sxy = 2027.628 5 21.7068 22.71 Sxx = 698.13 15.2176 629. se calculan a y b de tal forma que se minimice la distancia total entre puntos y la recta.63 241.56 Syy = 6105.7376 761.460 17 56.9447 26 Sxy Sxx Syy = SST SSE Sxy Sxx Syy 2.7132 698.902704421 XX Y ˆX = 5.12 194.6486 7 0.027.105.4976 62.09 X promedio Y Promedio Si todos los puntos estuvieran completamente sobre la recta la ecuación lineal sería y = a + bx.82 2.3676 8 6.557 16 54.462272 5.530 6 22.15 25.94 Las ecuaciones para el cálculo manual son las siguientes: b1 ˆ1 b0 ˆ0 ( Xi X )(Yi Y ) S S ( Xi X ) XY 2 Y i ˆ1 X i n = 2. 8521 El coeficiente de determinación r2 y el coeficiente de correlación r se calculan a continuación: r2 1 SSE ( SST SSE ) SSR = 0.SST (Yi Y ) 2 6.105. r r 2 = 0.885.0926 SSR SST SSE 5. y r = 0 indicaría correlación nula.9639 SST SST SST El coeficiente de determinación indica el porcentaje de la variación total que es explicada por la regresión. El coeficiente de correlación r = 0. El factor de correlación r es un número entre –1 (correlación negativa evidente) y +1 (correlación positiva evidente).9447 SSE (Yi Yˆi ) 2 (Yi (bo b1 * X i )) 2 220. .9816 El coeficiente de correlación proporciona el nivel de ajuste que tienen los puntos a la línea recta indicando el nivel de influencia de una variable en la otra.98 por lo cual tenemos suficiente evidencia estadística para afirmar que el tiempo de atención esta relacionado con el número de servicios atendidos.