DISEÑO Y ANALISIS DE EXPERIMENTOS

March 29, 2018 | Author: Iván Serrano | Category: Engineering, Welding, Statistics, Analysis Of Variance, Science


Comments



Description

DISEÑO Y ANÁLISIS DE EXPERIMENTOS¡W DISENO Y ~ ANALISIS DE EXPERIMENTOS segunda edición Douglas c. Montgomery UNIVERSIDAD ESTATAL DE ARIZONA ~LIMUSAWILEY@ .MP flA1c~5 PlI~ C::c7AlAl 'PAC¡¡;JRA- VERSiÓN AUTORIZADA EN ESPAÑOL DE LA OBRA PUBLICADA EN INGLES CON EL TiTULO: DESIGN ANO ANALYSIS OF EXPERIMENTS © JOHN WILEY & SONS, INC., NEW YORK, CHICHESTER, BRISBANE, SINGAPORE, TORONTO ANO WEINHEIM. COLABORADOR EN LA TRADUCCiÓN: RODOLFO PIÑA GARCíA REVISiÓN: ALMA ROSA GRISELDA ZETINA VÉLEZ INGENIERA OUiMICA POR LA FACULTAD DE QUiMICA DE LA UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO. DOCENTE EN MATEMÁTICAS. JEFA DEL DEPARTAMENTO DE ESTADisTICA DE LA UNIDAD DE ADMINISTRACiÓN DEL POSGRADO DGAE-UNAM. PROFESORA EN LA ESCUELA DE CIENCIAS QUíMICAS DE LA UNIVERSIDAD LA SALLE. r::!, j :u:t" e 1'[ 114-11' fU J5!~í~j ir iRl ¡", '/~-- ¿I/It (]" " ' r " I "" ;/(.7·" í OC' LA PRESENTACiÓN Y DISPOSICiÓN EN CONJUNTO DE DISEÑO Y ANÁliSIS DE EXPERIMENTOS SON PROPIEDAD DEL EDITOR. NINGUNA PARTE DE ESTA OBRA PUEDE SER REPRODUCIDA O TRANSMITIDA, MEDIANTE NINGÚN SISTEMA O METODO, ELECTRÓNICO O MECÁNICO (INCLUYENDO EL FOTOCOPIADO, LA GRABACiÓN O CUALOUIER SISTEMA DE RECUPERACiÓN Y ALMACENAMIENTO DE INFORMACiÓN), SIN CONSENTIMIENTO POR ESCRITO DEL EDITOR. DERECHOS RESERVADOS: © 2004, EDITORIAL L1MUSA, SA DE C.V. GRUPO NORIEGA EDITORES BALDERAS 95, MEXICO, D.F. C.P. 06040 'iIff2 85038050 01(800) 706 9100 ~ 55122903 '¡¡j [email protected] ~¡~ www.noriega.com.mx CANIEM NÚM. 121 SEGUNDA REIMPRESiÓN DE LA SEGUNDA EDICiÓN HECHO EN MEXICO ISBN 968-18-6156-6 Prefacio El presente libro es un texto de introducción que aborda el diseño y análisis de experimentos. Tiene como base los cursos sobre diseño de experimentos que he impartido durante más de 25 años en la Universidad Estatal de ATizona, la Universidad de Washington y el Instituto de Tecnología de Georgia. Refleja asimismo los métodos que he encontrado útiles en mi propia práctica profesional como consultor en ingeniería y estadística en las áreas generales de diseno de productos y procesos, mejoramiento de procesos e ingeniería de control de calidad. El libro está destinado a estudiantes que han llevado un primer curso de métodos estadísticos. Este curso previo debe incluir por lo menos algunas de las técnicas de estadística descriptiva, la distribución normal y una introducción a los conceptos básicos de los intervalos de confianza y la prueba de hipótesis para medias y varianzas. Los capítulos 10 y 11 requieren un manejo elemental de álgebra matricial. Como los requisitos para llevar este curso son relativamente modestos, este libro puede usarse también en un segundo curso de estadística enfocado en el diseño estadístico de experimentos para estudiantes de licenciatura de ingeniería, física, ciencias físicas y químicas, matemáticas y otros campos de las ciencias. Durante varios años he impartido un curso basado en este libro en el primer año de estudios de posgrado de ingeniería. Los estudiantes de este curso provienen de los campos tradicionales de ingeniería, física, química, matemáticas, investigación de operaciones y estadística. También he usado este libro como base de un curso breve para el sector industrial sobre diseño de experimentos para técnicos en ejercicio con una amplia diversidad en su formación profesional. Se incluyen numerosos ejemplos que ilustran todas las técnicas de diseño y análisis. Estos ejemplos se basan en aplicaciones del diseño experimental en el mundo real, y se han tomado de diferentes campos de la ingeniería y las ciencias. Esto lleva al terreno de las aplicaciones a un curso académico para ingenieros y científicos y hace de este libro una útil herramienta de referencia para experimentadores de una amplia gama de disciplinas. ACERCA DEL LIBRO La presente edición constituye una revisión sustancial del libro. He procurado mantener el equilibrio entre los tópicos de diseño y análisis; sin embargo, hay varios temas y ejemplos nuevos; asimismo he reorganizado gran parte del material. En la presente edición se resalta más el uso de la computadora. Durante los últimos años han surgido varios productos de software excelentes que auxilian al experimentador en las fases del diseño y el análisis para esta materia. He incluido las salidas de dos de estos productos, Minitab y Design-Expe/1, en varias partes del texto. Minitab es un paquete de software de estadística de carácter general ampliamente disponible, que cuenta con útiles herramientas de análisis de datos y que maneja bastante bien el análisis de experimentos tanto con factores fijos como aleatorios (incluyendo el modelo mixto). Design-Expe/1 es un paquete que se enfoca exclusivamente en el diseño experimental. Tiene muchas herramientas para la construcción y evaluación de diseños, así como múltiples características de análisis. En el sitio web de este libro puede obtenerse una versión para estudiantes de Design-Expe/1, y se hace una amplia recomendación para usarlo. Exhorto a todos los profesores que usen este libro para que incorporen software de computadora en sus cursos. En mi caso particular, llevo a todas mis clases una compuv vi PREFACIO tadora laptop y un monitor, y todos los diseños o tópicos del análisis tratados en clase se ilustran con la computadora. En esta edición destaco aún más la conexión entre el experimento y el modelo que puede desarrollar el experimentador a partir de los resultados del experimento. Los ingenieros (yen gran medida los científicos dt:: la física y la química) aprenden los mecanismos físicos y sus modelos mecanicistas fundamentales al principio de su formación académica, pero en la mayor parte de sus carreras profesionales tendrán que trabajar con estos modelos. Los experimentos diseñados estadísticamente ofrecen al ingeniero una base válida para desarrollar un modelo empírico del sistema bajo estudio. Después este modelo empírico puede manipularse (tal vez utilizando una superficie de respuesta o una gráfica de contorno, o quizá matemáticamente) como cualquier otro modelo de ingeniería. A lo largo de muchos años de docencia he descubierto que este enfoque es muy eficaz para despertar el entusiasmo por los experimentos diseñados estadísticamente en la comunidad de ingeniería. En consecuencia, al inicio del libro planteo la noción de un modelo empírico fundamental para el experimento y las superficies de respuesta y destaco la importancia del mismo. También me he esforzado por presentar mucho más rápido los puntos críticos en los que intervienen los diseños factoriales. Para facilitar este objetivo, condensé en un solo capítulo (el 3) el material introductorio sobre los experimentos completamente aleatorizados con un solo factor y el análisis de varianza. He ampliado el material sobre los diseños factoriales y factoriales fraccionados (capítulos 5 a19) en un esfuerzo por hacer que el material fluya con mayor eficiencia en la perspectiva tanto del lector como del profesor y por hacer mayor hincapié en el modelo empírico. El capítulo sobre las superficies de respuesta (el 11) sigue inmediatamente al material sobre diseños factoriales y factoriales fraccionados y modelado de regresiones. He ampliado este capítulo, agregando nuevo material sobre diseños óptimos alfabéticos, experimentos con mezclas y el problema de un diseño paramétrico robusto. En los capítulos 12 y 13 se analizan experimentos que incluyen efectos aleatorios, así como algunas aplicaciones de estos conceptos en diseños anidados y parcelas subdivididas. El capítulo 14 es una descripción general de temas importantes de diseño y análisis: la respuesta no normal, el método de Box-Cox para seleccionar la forma de una transformación, y otras alternativas; experimentos factoriales no balanceados; el análisis de covarianza, incluyendo covariables en un diseño factorial y mediciones repetidas. A lo largo del libro he destacado la importancia del diseño experimental como una herramienta que el ingeniero en ejercicio puede usar en el diseño y desarrollo de productos, así como en el desarrollo y mejoramiento de procesos. Se ilustra el uso del diseño experimental en el desarrollo de productos que sean robustos a factores ambientales ya otras fuentes de variabilidad. Considero queel uso del diseño experimental en las fases iniciales del ciclo de un producto puede reducir sustancialmente el tiempo y el costo de conducirlo, redundando en procesos y productos con un mejor desempeño en campo y una mayor confiabilidad que los que se desarrollan utilizando otros enfoques~ El libro contiene más material del que puede cubrirse sin prisas en un solo curso, por lo que espero que los profesores puedan variar el contenido de cada curso o bien estudiar más a fondo algunos temas, dependiendo de los intereses dela clase. Al final de cada capítulo hay un grupo de problemas (excepto en el 1). El alcance de estos problemas varía desde ejercicios de cálculo, destinados a consolidar los fundamentos, hasta la ampliación de principios básicos. Mi curso en la universidad lo enfoco principalmente en los diseños factoriales y factoriales fraccionados. En consecuencia, por lo general cubro el capítulo 1, el capítulo 2 (muy rápido), la mayor parte del capítulo 3, el capítulo 4 (sin incluir el material sobre bloques incompletos y mencionando sólo brevemente los cuadrados latinos), y trato en detalle los capítulos 5 a18 sobre diseños factoriales con dos niveles y diseños factoriales fraccionados. Para concluir el curso, introduzco la metodología de superficies de respuesta (capítulo 11) Yhago un repaso general de los modelos con efectos aleatorios (capítulo 12) y los diseños anidados y en parcelas subdivididas (capítulo 13). Siempre pido a los estudiantes que realicen un PREFACIO VÜ proyecto semestral que consiste en diseñar, conducir y presentar los resultados de un experimento diseñado estadísticamente. Les pido que trabajen en equipos, pues es la manera en que se realiza la mayor parte de la experimentación industrial. Deben hacer la presentación de los resultados de su proyecto de manera oral y por escrito. MATERIAL SUPLEMENTARIO DEL TEXTO Con esta edición he preparado un suplemento para cada capítulo del libro. En este material suplementario se desarrollan temas que no pudieron tratarse con mayor detalle en el libro. También presento algunos temas que no aparecen expresamente en el libro, pero que para algunos estudiantes y profesionistas en ejercicio podría resultar de utilidad una introducción de los mismos. El nivel matemático de parte de este material es más elevado que el del texto. Estoy consciente de que los profesores usan este libro con una amplia variedad de audiencias, y es posible que algunos cursos de diseño más avanzados puedan beneficiarse al incluir varios de los temas del material suplementario del texto. Este material está en formato electrónico en el CD/ROM del profesor (disponible sólo en inglés) y se encuentra en el sitio web de este libro. SITIOWEB En el sitio web http://www.wiley.com/legacy/college/engin/montgomery316490/student/student.html está disponible el material de apoyo para profesores y estudiantes. Este sitio se usará para comunicar información acerca de innovaciones y recomendaciones para el uso eficaz de este texto. El material suplementario del texto puede encontrarse en este sitio, junto con versiones electrónicas de las series de datos utilizadas en los ejemplos y los problemas de tarea, un plan de estudios del curso y proyectos semestrales del curso en la Universidad Estatal de Arizona. RECONOCIMIENTOS Expreso mi agradecimiento a los muchos estudiantes, profesores y colegas que han usado antes este libro y quienes me han hecho llegar útiles sugerencias para esta revisión. Las contribuciones de los doctores Rayrnond H. Myers, G. Geoffrey Vining, Dennis Un, John Ramberg, Joseph Pignatiello, Lloyd S. Nelson, Andre K.huri, Peter Nelson, John A. Comell, George C. Runger, Bert Keats, Dwayne Rollier, Norma Hubele, Cynthia Lowry, Russell G. Heikes, Harrison M. Wadsworth, William W Hines, Arvind Shah, Jane Arnmons, Diane Schaub, Pat Spagon y William DuMouche, y los señores Mark Anderson y Pat Whitcomb fueron particularmente invaluables. Mi Jefe de Departamento, el doctor Gary Hogg, ha proporcionado un ambiente intelectualmente estimulante en el cual trabajar. Las contribuciones de los profesionistas en activo con quienes he trabajado han sido invaluables. Es imposible mencionarlos a todos, pero algunos de los principales son Dan McCarville y Lisa Custer de Motorola; Richard Post de Intel; Tom Bingham, Dick Vaughn, Julian Anderson, Richard Alkire y Chase Neilson de Boeing Company; Mike Goza, Don Walton, Karen Madison, Jeff Stevens y Bob Kohm de Alcoa; Jay Gardiner, John Butora, Dana Lesher, Lolly Marwah, Paul Tobias y Lean Masan de IBM; Elizabeth A. Peck de The Coca-Cola Company; Sadri K.halessi y Franz Wagner de Signetics; Robert V. Baxley de Monsanto Chemicals; Harry Peterson-Nedry y Russell Boyles de Precision Castparts Corporation; Bill New y Randy Schmid de Allied-Signal Aerospace; John M. Fluke, hijo, de John Fluke Manufacturing viii PREFACIO Company; Larry Newton y Kip Howlett de Georgia-Pacific, y Ernesto Ramos de BBN Software Products Corporation. Me encuentro en deuda con el profesor E.S. Pearson y con Biometlika, John Wiley & Sons, Prentice-Hall, The American Statistical Association, The Institute of Mathematical Statistics y los editores de Biometlics por el permiso para usar material protegido por derechos de autor. Lisa Custer realizó un excelente trabajo de presentación de las soluciones que aparecen en el CD/ROM del profesor, y la doctora Cheryl Jennings realizó una corrección de estilo eficaz y de suma utilidad. Estoy agradecido con la Office of Naval Research, la National Science Foundation, las compañías integrantes de NSF/Industry/University Cooperative Research Center in Quality and Reliability Engineering de la Universidad Estatal de Arizona, e IBM Corporation por apoyar gran parte de mis investigaciones de estadística y diseño experimental de ingeniería. Douglas C. Montgomery Tempe, Alizona Contenido Capítulo 1. 1-1 1-2 1-3 1-4 1-5 1-6 Introducción Estrategia de experimentación Algunas aplicaciones típicas del diseño experimental Principios básicos Pautas generales para diseñar experimentos Breve historia del diseño estadístico Resumen: uso de técnicas estadísticas en la experimentación 1 1 8 11 13 17 19 Capítulo 2. 2-1 2-2 2-3 2-4 Experimentos comparativos simples Introducción Conceptos estadísticos básicos Muestreo y distribuciones de muestreo Inferencias acerca de las diferencias en las medias, diseños aleatorizados 2-4.1 Prueba de hipótesis 2-4.2 Elección del tamaño de la muestra 2-4.3 Intervalos de confianza 2-4.4 Caso en que ;é 2-4.5 Caso en que se conocen y 2-4.6 Comparación de una sola media con un valor especificado 2-4.7 Resumen Inferencias acerca de las diferencias en las medias, diseños de comparaciones pareadas 2-5.1 El problema de las comparaciones pareadas 2-5.2 Ventajas del diseño de comparaciones pareadas Inferencias acerca de las varianzas de distribuciones normales Problemas 21 21 22 26 33 33 40 42 44 44 45 46 47 47 50 51 54 a; a; a; a; 2-5 2-6 2-7 Capítulo 3. 3-1 3-2 3-3 Experimentos con un solo factor: el análisis de varianza Un ejemplo El análisis de varianza Análisis del modelo con efectos fijos 3-3.1 Descomposición de la suma de cuadrados total 3-3.2 Análisis estadístico 3-3.3 Estimación de los parámetros del modelo 3-3.4 Datos no balanceados 60 60 63 65 66 69 74 75 ix x CONTENIDO 3-4 3-5 3-6 3-7 3-8 3-9 3-10 3-11 Capítulo 4. Verificación de la adecuación del modelo 3-4.1 El supuesto de normalidad 3-4.2 Gráfica de los residuales en secuencia en el tiempo 3-4.3 Gráfica de los residuales contra los valores ajustados 3-4.4 Gráficas de los residuales contra otras variables Interpretación práctica de los resultados 3-5.1 Un modelo de regresión 3-5.2 Comparaciones entre las medias de los tratamientos 3-5.3 Comparaciones gráficas de medias 3-5.4 Contrastes 3-5.5 Contrastes ortogonales 3-5.6 Método de Scheffé para comparar todos los contrastes 3-5.7 Comparación de pares de medias de tratamientos 3-5.8 Comparación de medias de tratamientos con un control Muestra de salida de computadora Determinación del tamaño de la muestra 3-7.1 Curvas de operación característica 3-7.2 Especificación de un incremento de la desviación estándar 3-7.3 Método para estimar el intervalo de confianza Identificación de efectos de dispersión El enfoque de regresión para el análisis de varianza 3-9.1 Estimación de mínimos cuadrados de los parámetros del modelo 3-9.2 Prueba general de significación de la regresión Métodos no paramétricos en el análisis de varianza 3-10.1 La prueba de Kruskal-Wallis 3-10.2 Comentarios generales sobre la transformación de rangos Problemas 76 77 79 80 86 86 87 88 89 90 93 95 96 103 104 107 107 109 110 110 112 112 114 116 116 118 119 Bloques aleatorizados, cuadrados latinos y diseños relacionados Diseño de bloques completos aleatorizados 4-1.1 Análisis estadístico del diseño de bloques completos aleatorizados 4-1.2 Verificación de la adecuación del modelo 4-1.3 Otros aspectos del diseño de bloques completos aleatorizados 4-1.4 Estimación de los parámetros del modelo y la prueba general de significación de la regresión Diseño de cuadrado latino Diseño de cuadrado grecolatino Diseños de bloques incompletos balanceados 4-4.1 Análisis estadístico del diseño de bloques incompletos balanceados 4-4.2 Estimación de mínimos cuadrados de los parámetros 4-4.3 Recuperación de información interbloques en el diseño de bloques incompletos balanceados Problemas 126 126 127 135 136 141 144 151 154 155 159 161 164 4-1 4-2 4-3 4-4 4-5 CONTENIDO xi Capítulo 5. 5-1 5-2 5-3 Introducción a los diseños factoriales Definiciones y principios básicos La ventaja de los diseños factoriales Diseño factorial de dos factores 5-3.1 Un ejemplo 5-3.2 Análisis estadístico del modelo con efectos fijos 5-3.3 Verificación de la adecuación del modelo 5-3.4 Estimación de los parámetros del modelo 5-3.5 Elección del tamaño de la muestra 5-3.6 El supuesto de no interacción en un modelo de dos factores 5-3.7 Una observación por celda Diseño factorial general Ajuste de curvas y superficies de respuesta Formación de bloques en un diseño factorial Problemas 170 170 174 175 175 177 185 185 189 190 191 194 201 207 211 5-4 5-5 5-6 5-7 Capítulo 6. 6-1 6-2 6-3 6-4 6-5 6-6 6-7 Diseño factorial 2k Introducción El diseño 22 El diseño 23 El diseño general 2k Una sola réplica del diseño 2k Adición de puntos centrales en el diseño 2k Problemas 218 218 219 228 242 244 271 276 Capítulo 7. 7-1 7-2 7-3 7-4 7-5 7-6 7-7 7-8 Formación de bloques y confusión en el diseño factorial 2k Introducción Formación de bloques de un diseño factorial 2k con réplicas Confusión del diseño factorial 2k Confusión del diseño factorial 2k en dos bloques Confusión del diseño factorial 2k en cuatro bloques Confusión del diseño factorial ~ en 'l! bloques Confusión parcial Problemas 287 287 287 288 289 296 297 299 301 Capítulo 8. 8-1 8-2 8-3 8-4 8-5 8-6 8-7 8-8 Diseños factoriales fraccionados de dos niveles Introducción La fracción un medio del diseño 2k La fracción un cuarto del diseño 2k El diseño factorial fraccionado 2k- p general Diseños de resolución III Diseños de resolución IV y V Resumen Problemas 303 303 304 317 326 337 347 349 350 xii CONTENIDO Capítulo 9. Diseños factoriales y factoriales fraccionados con tres niveles y con niveles mixtos 363 363 363 365 367 372 9-1 9-2 9-3 9-4 9-5 Capítulo 10. Diseño factorial 3 9-1.1 Notación y motivación del diseño 3k 9-1.2 El diseño 32 9-1.3 El diseño 33 9-1.4 El diseño genera13 k Confusión en el diseño factorial 3k 9-2.1 El diseño factoria13 k en tres bloques 9-2.2 El diseño factoria13 k en nueve bloques 9-2.3 El diseño factoria13 k en 3P bloques Réplicas fraccionadas del diseño factorial 3k 9-3.1 La fracción un tercio del diseño factoria13 k 9-3.2 Otros diseños factoriales fraccionados 3k - p Diseños factoriales con niveles mixtos 9-4.1 Factores con dos y tres niveles 9-4.2 Factores con dos y cuatro niveles Problemas Ajuste de modelos de regresión k 373 373 377 378 379 379 382 383 384 385 387 392 392 393 394 409 409 412 415 415 416 416 416 417 420 421 422 10-1 10-2 10-3 10-4 10-5 10-6 10-7 10-8 10-9 Capítulo 11. Introducción Modelos de regresión lineal Estimación de los parámetros en modelos de regresión lineal Prueba de hipótesis en la regresión múltiple 10-4.1 Prueba de significación de la regresión 10-4.2 Pruebas de los coeficientes de regresión individuales y de grupos de coeficientes Intervalos de confianza en regresiones múltiples 10-5.1 Intervalos de confianza para los coeficientes de regresión individuales 10-5.2 Intervalo de confianza para la respuesta media Predicción de nuevas observaciones de la respuesta Diagnósticos del modelo de regresión 10-7.1 Residuales escalados y PRESS 10-7.2 Diagnósticos de influencia Prueba de falta de ajuste Problemas Métodos de superficies de respuesta y otros enfoques para la optimización de procesos 427 427 430 436 436 440 447 11-1 11-2 11-3 Introducción a la metodología de superficies de respuesta Método del ascenso más pronunciado Análisis de una superficie de respuesta de segundo orden 11-3.1 Localización del punto estacionario 11-3.2 Caracterización de la superficie de respuesta 11-3.3 Sistemas de cordilleras CONTENIDO xiii 448 455 455 456 462 466 472 11-4 11-5 11-6 11-7 11-8 11-3.4 Respuestas múltiples Diseños experimentales para ajustar superficies de respuesta 11-4.1 Diseños para ajustar el modelo de primer orden 11-4.2 Diseños para ajustar el modelo de segundo orden 11-4.3 Formación de bloques en los diseños de superficie de respuesta 11-4.4 Diseños (óptimos) generados por computadora Experimentos con mezclas Operación evolutiva Diseño robusto 11-7.1 Antecedentes 11-7.2 El enfoque de la superficie de respuesta para el diseño robusto Problemas 484 488 488 492 500 511 511 517 522 529 531 535 543 543 545 547 552 Capítulo 12. 12-1 12-2 12-3 12-4 12-5 12-6 12-7 Experimentos con factores aleatorios Modelo con efectos aleatorios Diseño factorial de dos factores aleatorios Modelo mixto con dos factores Determinación del tamaño de la muestra con efectos aleatorios Reglas para los cuadrados medios esperados Pruebas F aproximadas Algunos temas adicionales sobre la estimación de los componentes de la varianza 12-7.1 Intervalos de confianza aproximados para los componentes de la varianza 12-7.2 Método de grandes muestras modificado 12-7.3 Estimación de máxima verosimilitud de componentes de la varianza Problemas 12-8 Capítulo 13. 13-1 Diseños anidados y en parcelas subdivididas Diseño anidado de dos etapas 13-1.1 Análisis estadístico 13-1.2 Verificación del diagnóstico 13-1.3 Componentes de la varianza 13-1.4 Diseños anidados por etapas Diseño anidado general de 111 etapas Diseños con factores anidados y factoriales Diseño de parcelas subdivididas Otras variantes del diseño de parcelas subdivididas 13-5.1 Diseño de parcelas subdivididas con más de dos factores 13-5.2 Diseño de parcelas con doble subdivisión 13-5.3 Diseño de parcelas subdivididas en franjas Problemas 557 557 558 563 565 566 566 569 573 578 578 13-2 13-3 13-4 13-5 580 583 584 13-6 Capítulo 14. 14-1 Otros tópicos de diseño y análisis Respuestas y transformaciones no normales 590 590 xiv CONTENIDO 14-1.1 Selección de unatransformación: el método de Box-Cox 14-1.2 Modelo lineal generalizado 14-2 Datos no balanceados en un diseño factorial 14-2.1 Datos proporcionales: un caso sencillo 14-2.2 Métodos aproximados 14-2.3 Método exacto 14-3 Análisis de covarianza 14-3.1 Descripción del procedimiento 14-3.2 Solución por computadora 14-3.3 Desarrollo mediante la prueba general de significación de la regresión 14-3.4 Experimentos factoriales con covariables 14-4 Mediciones repetidas 14-5 Problemas 590 594 600 600 601 604 604 605 614 616 619 624 627 Bibliografía Apéndice 630 637 Distribución normal estándar acumulada Puntos porcentuales de la distribución t Puntos porcentuales de la distribuciónx2 Puntos porcentuales de la distribuciónF Curvas de operación característica para el análisis de varianza del modelo con efectos fijos Curvas de operación característica para el análisis de varianza del modelo con efectos aleatorios Rangos significativos para la prueba del rango múltiple de Duncan Puntos porcentuales del estadístico del rango studentizado Valores críticos para la prueba de Dunnett para comparar tratamientos con un control Coeficientes de polinomios ortogonales Números aleatorios Relaciones de alias para diseños factoriales fraccionados 2 Glosario para el uso de Design Expelt k -P Tabla l. Tabla 11. Tabla I1I. Tabla Iv. Tabla V. Tabla VI. Tabla VII. Tabla VIII. Tabla IX. Tabla X. Tabla XI. Tabla XII. 638 640 641 642 647 651 655 656 658 661 662 con le :5 15 Yn :5 64 663 680 681 Tabla XIII. Índice el templado en aceite y el templado en agua salada. ¿Estas dos soluciones son los únicos medios de templado de interés potencial? ¿Hay en este experimento otros factores que podrían afectar la dureza y que deberían investigarse o controlarse? 3.. un experimento es una prueba.Introducción 1. es decir.1 ESTRATEGIA DE EXPERIMENTACIÓN Investigadores de prácticamente todos los campos de estudio llevan a cabo experimentos. El ingeniero decide someter varios ejemplares o muestras para ensayo de la aleación a cada medio de templado y medir la dureza de los ejemplares después del templado. suponga que un ingeniero metalúrgico tiene interés en estudiar el efecto de dos procesos diferentes de endurecimiento. Al examinar este sencillo experimento salen a relucir varias cuestiones importantes: 1. sobre una aleación de aluminio. se usará la dureza promedio de los ejemplares tratados en cada solución de templado. ¿Cuántas muestras para ensayo de la aleación deberán probarse en cada solución de templado? 4. En una perspectiva más formal. por lo general para descubrir algo acerca de un proceso o sistema particular. Este libro trata de la planeación y realización de experimentos y del análisis de los datos resultantes a fin de obtener conclusiones válidas y objetivas. la experimentación desempeña un papel importante en el diseño de productos nuevos. El objetivo en muchos casos sería desarrollar un proceso robusto. Como ejemplo de un experimento. En un sentido literal. ¿Cómo deberán asignarse las muestras para ensayo de prueba a las soluciones de templado y en qué orden deberán colectarse los datos? 1 . El objetivo del experimentador es determinar cuál de las dos soluciones de templado produce la dureza máxima para esta aleación particular. el desarrollo de procesos de manufactura y el mejoramiento de procesos. un proceso que sea afectado en forma mínima por fuentes de variabilidad externas. Para determinar cuál de las soluciones es la mejor. En ingeniería. un experimento puede definirse como una prueba o serie de pruebas en las que se hacen cambios deliberados en las variables de entrada de un proceso o sistema para observar e identificar las razones de los cambios que pudieran observarse en la respuesta de salida. 2. La atención se centra en los experimentos de ingeniería y las ciencias físicas y químicas. . suponga que el ingeniero metalúrgico del experimento anterior utilizó ejemplares de una hornada para el templado en aceite y ejemplares de una segunda hornada para el templado en agua salada. y tal vez muchas más. cuando compare la dureza promedio. En cualquier experimento. es determinar la influencia que tienen estos factores sobre la respuesta de salida del sistema. Entonces. Determinar cuáles son las variables que tienen mayor influencia sobre la respuesta y. Los objetivos del experimento podrían comprender los siguientes: 1. Como se puede ver por el análisis anterior..xp son controlables. El proceso o sistema puede representarse con el modelo ilustrado en la figura 1-1.z2. . . los experimentos incluyen muchas veces varios factores. Zq sean mínimos. 4. 1 Un especialista en diseño experimental diría que los efectos de los medios de templado y las hornadas se confundieron. X2 Entradas Proceso Salida y Z. ¿Qué método de análisis de datos deberá usarse? 6... llamada el experimentador. uno de los objetivos de la persona que realiza un experimento. Determinar cuál es el ajuste de lasx que tiene mayor influencia para que los efectos de las variables no controlables Zl' Z2. . 2.. Z2 Zq Factores no controla bies Figura 1-1 Modelo general de un proceso o sistema. .. es decir. . Al enfo- Factores controlables x. mientras que otrasz 1. los resultados y las conclusiones que puedan sacarse dependen en gran medida de la manera en que se recabaron los datos. . El proceso puede por lo general visualizarse como una combinación de máquinas. En general. personas u otros recursos que transforman cierta entrada (con frecuencia un material) en una salida que tiene una o más respuestas observables.x2 . tendrán que responderse satisfactoriamente antes de llevar a cabo el experimento. los experimentos se usan para estudiar el desempeño de procesos y sistemas. métodos. 3. el ingeniero no podrá saber qué parte de la diferencia observada es resultado de la solución de templado y qué parte es el resultado de diferencias inherentes entre las hornadas. Determinar cuál es el ajuste de lasx que tiene mayor influencia para que y esté casi siempre cerca del valor nominal deseado. . Determinar cuál es el ajuste de las x que tiene mayor influencia para que la variabilidad de y sea reducida.Zq son no controlables (aunque pueden serlo para los fines de una prueba). los efectos de estos dos factores no pueden separarse. Para ilustrar este punto.2 CAPÍTULO 1 INTRODUCCIÓN 5. Habitualmente. 1 Por lo tanto. el método utilizado para recabar los datos ha afectado de manera adversa las conclusiones que pueden sacarse del experimento. Algunas variables del procesoxl. . ¿Qué diferencia en la dureza promedio observada entre los dos medios de templado se considerará importante? Todas estas preguntas. el carrito y el agua. Segunda. supóngase que la mejor conjetura inicial no produce los resultados deseados. Además. Existen varias estrategias que podría usar un experimentador. En la figura 1-2 se presenta una serie de gráficas para el experimento del golf. por lo que siempre busca la manera más sencilla para bajar su puntuación. manteniendo constantes los factores restantes en el nivel base. Los ingenieros y los investigadores deben tomar a menudo este tipo de decisiones acerca de algunos de los factores que examinan en experimentos reales. Sin embargo. supóngase que la mejor conjetura inicial produce un resultado satisfactorio. Sin embargo. cambiando los niveles de uno (o quizá dos) de los factores para la prueba siguiente. 2. suponga que se selecciona la combinación del palo grande. sin garantía alguna de éxito. así como amplia experiencia práctica. es común entre ingenieros y científicos. el experimentador se ve tentado a suspender las pruebas. con base en el resultado de la prueba en curso. Otra estrategia de experimentación muy común en la práctica es el enfoque de un factor a la vez. 4. Esta estrategia de experimentación. Suponga que en el curso del experimento pueden jugarse un máximo de ocho rondas de golf. para cada factor. el enfoque de la mejor conjetura presenta al menos dos desventajas. son los siguientes: 1. Evidentemente. Al autor le gusta mucho jugar golf. durante la ronda el autor notó varios tiros descontrolados con el palo grande (en el golf. 7. Funciona de manera adecuada si los experimentadores cuentan con una gran cantidad de conocimientos técnicos o teóricos del sistema que están estudiando. Primera. es decir. Desafortunadamente. en consecuencia. pero supongamos que éstos son los de interés primario. se construye por lo general una serie de gráficas en las que se muestra la forma en que la variable de respuesta es afectada al variar cada factor manteniendo los demás factores constantes. y que la puntuación resultante es 87. Entonces el experimentador tiene que hacer otra conjetura acerca de la combinación correcta de los niveles de los factores. Después de haber realizado todas las pruebas. Este enfoque podría continuar de manera casi indefinida. no le agrada practicar. o línea base de los niveles. El tipo de palo usado (grande o normal). Consideremos ahora cómo podrían probarse experimentalmente los factores 1 al 4 para determinar su efecto sobre la puntuación del autor. Algunos de los factores que él considera importantes. 6. El tipo de pelota usada (de goma de balata o de tres piezas). el autor decide que los factores 5 a18 pueden ignorarse. Esto podría continuar por mucho tiempo. teniendo en cuenta su larga experiencia en el juego. Se ilustrarán algunas de ellas con un ejemplo muy sencillo. Caminar cargando los palos de golf o hacer el recorrido en un carrito. manteniendo los demás factores en los mismos niveles usados anteriorm~nte. la pelota de goma de . conocida como enfoque de la mejor conjetura. Por ejemplo. decide jugar otra ronda con el palo normal. Un enfoque consistiría en seleccionar una combinación arbitraria de estos factores. Jugar en un día con viento o en uno apacible. Jugar cuando hace frío o cuando hace calor. s. Entonces. Jugar en la mañana o en la tarde. o que podrían influir en su puntuación. 8. estos factores no son importantes porque sus efectos son tan pequeños que carecen de valor práctico. aun cuando no hay ninguna garantía de que se ha encontrado la mejor solución. Beber agua o cerveza durante el juego. hay muchos otros factores que podrían considerarse. El tipo de spikes usados en los zapatos de golf (metálicos o de hule). 3. probarlos y ver qué ocurre. utilizando como línea base los niveles de los cuatro factores: el palo grande. Este método consiste en seleccionar un punto de partida.f ! / 1-1 ESTRATEGIA DE EXPERIMENTACIÓN 3 que general para planear y llevar a cabo el experimento se le llama estrategia de experimentación. grande no siempre es sinónimo de bueno) y. la pelota de goma de balata. para después variar sucesivamente cada factor en su rango. ) Los experimentos de un factor a la vez siempre son menos eficientes que otros métodos basados en un enfoque estadístico del diseño experimental.. pero si utiliza el palo grande. algunas personas piensan que esta estrategia se relaciona con el método científico o que es un principio "sólido" de ingeniería. el tipo de bebida consumida prácticamente no tiene efecto alguno sobre su puntuación.4 CAPÍTULO 1 INTRODUCCIÓN :§ ::l ::J e a. se concluiría que hacer el recorrido en el carrito mejora la puntuación. en consecuencia. Muchas personas no perciben esto y. TP (tres piezas) '0 '0 e ~ GB (goma de balata) L. la estrategia de un factor a la vez casi siempre producirá resultados deficientes. . en caso de existir.... En la figura 1-3 se muestra una interacción entre los factores del tipo de palo y la bebida para el experimento del golf. Se trata de una estrategia experimental en la que los factores se hacen variar en conjunto. El tipo de pelota de golf aparentemente carece de importancia.. ~ ::J • • :g ro a. el: ~ :J A (agua) C (cerveza) Bebida G (grande) N (normal) Palo GB (goma TP (tres de balata) piezas) Pelota C (caminando) EC (en carrito) Manera de desplazarse Figura 1-2 Resultados de la estrategia de un factor a la vez para el experimento de golf. e~ e~ e~ ----:g ro -----. desplazarse en el carrito y beber agua. Con base en estas gráficas de un factor a la vez. la combinación óptima que se seleccionaría sería el palo normal. ~ ~ ::J :g ro a.. a. se obtienen resultados mucho mejores cuando bebe agua en lugar de cerveza.. en lugar de uno a la vez.' -_ _ A (agua) Tipo de bebida C (cerveza) G (grande) Tipo de palo N (normal) Figura 1-3 Interacción entre el tipo de palo y el tipo de bebida para el experimento del golf. El enfoque correcto para trabajar con varios factores es conducir un experimento factorial. La interpretación de esta gráfica es directa. debido a que la pendiente de la curva de la manera de desplazarse es negativa.. Hay una interacción cuando uno de los factores no produce el mismo efecto en la respuesta con niveles diferentes de otro factor. balata. por ejemplo. Figura 1-4 Experimento factorial de dos factores que incluye el tipo de palo y el tipo de pelota. Las interacciones entre factores son muy comunes y. los experimentos de un factor a la vez son comunes en la práctica.-_. El tema se analizará con mayor detalle en el capítulo 5. (De hecho. Observe que si el autor utiliza el palo normal. caminar y beber agua.J- ~ : .. La desventaja principal de la estrategia de un factor a la vez es que no puede tomar en consideración cualquier posible interacción entre los factores. las cuatro corridas forman los vértices de un cuadrado. Un diseñador de experimentos diría que se han hecho dos réplicas del diseño.. Este diseño experimental permitiría al experimentador investigar los efectos individuales (o los efectos principales) de cada factor y determinar si existe alguna interacción entre los factores.2 Fe. En la figura 1-4 se muestra un experimento factorial para estudiar los efectos conjuntos de estos dos factores sobre la puntuación de golf del autor.1-1 E5TRATEGIA DE EXPERIMENTACIÓN 5 El concepto de diseño experimental factorial es de suma importancia..Ol Fe.. Geométricamente. Al encontrar la diferencia promedio de las puntuaciones que están en los lados derecho e izquierdo del cuadrado (como en la figura 1-5b).-.. Para ilustrar la forma en que se lleva a cabo un experimento factorial. se tiene una medida del efecto de cambiar del palo grande al palo normal.. así como algunas variantes y casos especiales útiles.2 e.L-.-_--'--- o :( TP (tres piezas) "O~ Oleo e. considere el experimento de golf y suponga que sólo dos de los factores son de interés. A este tipo particular de experimento factorial se le llama diseño factorial 22 (dos factores. o Efecto del palo = 92+94+93+91 4 88+91+88+90 4 = 325 . GB (goma de balata) L. el tipo de palo y el tipo de pelota..91 92. y varios capítulos de este libro se dedican a presentar experimentos factoriales básicos. GB(goma de balata) 1. 88. En los vértices del cuadrado se indican las puntuaciones de cada ronda de golf jugada con las cuatro combinaciones de prueba..2 El GB (goma de balata) IDl TP (tres piezas) .90 1..94 F 8..-. Observe que en este experimento factorial ambos factores tienen dos niveles y que en el diseño se usan todas las combinaciones posibles de los niveles de ambos factores. como se muestra en la figura 1-4...-. e. cada uno con dos niveles).. .1. TP (tres piezas) "! Ol "O i5 --~--- 88. Debido a que el autor considera razonable suponer que jugará ocho rondas de golf para investigar estos factores. 0.Ol Fe. un plan factible sería jugar dos rondas de golf con cada combinación de los niveles de los factores.. Observe que hay cuatro rondas de golf que proporcionan información acerca del uso del palo normal y cuatro rondas que proporcionan información sobre el uso del palo grande..1. -'-_ GB(goma de balata) G (grande) N (normal) Tipo de palo a) Puntuaciones del experimento de golf TP (tres piezas) ~~ 0.-..ª!9 0. En la figura 1-5a se presentan los resultados obtenidos al realizar el experimento factorial de la figura 1-4.Ol '--- G (grande) N (normal) Tipo de palo b) Comparación de las puntuaciones que conducen al efecto del palo G (grande) N (normal) Tipo de palo e) Comparación de las puntuaciones que conducen al efecto de la pelota G (grande) N (normal) Tipo de palo d) Comparación de las puntuaciones que conducen al efecto de la interacción pelota-palo Figura 1·5 Puntuaciones del experimento del golf de la figura 1-4 y cálculo de los efectos de los factores.. tal vez el autor debería jugar siempre con el palo grande. este experimento requeriría que se juegue una ronda con cada una de las combinaciones de los factores representadas por los ocho vértices del cubo de la figura 1-6. De hecho. Suponga que el autor desea estudiar los efectos del tipo de palo..J-. En este sencillo ejemplo se pone de manifiesto una característica muy importante del experimento factorial: en los diseños factoriales se hace el uso más eficiente de los datos experimentales.. Note que este experimento incluyó ocho observaciones.\ . Por ejemplo.. el tipo de pelota y el tipo de bebida consumida sobre su puntuación de golf. en promedio. puede obtenerse una medida del efecto de la interacción entre el tipo de pelota y el tipo de palo restando la puntuación promedio en la diagonal de izquierda a derecha del cuadrado de la puntuación promedio de la diagonal de derecha a izquierda (ver la figura 1-5d). cuyo resultado es · . de la pelota y de la interacción. el caso es que hay evidencia estadística razonablemente sólida de que el efecto del palo difiere de cero y de que no es el caso para los otros dos efectos. El concepto de experimento factorial puede extenderse a tres factores. Sin embargo. Por último. De manera similar.25 golpes por ronda.. el tipo de pelota y el tipo de bebida. la diferencia promedio de las cuatro puntuaciones de la parte superior del cuadrado y de las cuatro puntuaciones de la parte inferior miden el efecto del tipo de pelota usado (ver la figura 1-5e): Efecto de la pelota = ---4--- 88+ 91 + 92+ 94 88+90+93+91 4 = 075 .-..-. Suponiendo que los tres factores tienen dos niveles. el diseño factorial 23 produciría la misma información acerca de los efectos de los factores. Ninguna otra estrategia de experimentación hace un uso tan eficiente de los datos. Observe que hay ocho combinaciones de prueba de estos tres factores con los dos niveles de cada uno de ellos y que estos ocho ensayos pueden representarse geométricamente como los vértices de un cubo. al cambiar del palo grande al normal la puntuación se incrementa 3. en ambos diseños hay cuatro pruebas que proporcionan información acerca del palo normal y cuatro pruebas que proporcionan I I I I . y que las ocho observaciones se usan para calcular los efectos del palo. puede establecerse un diseño factorial como el que se muestra en la figura 1-6.6 CAPÍTULO 1 INTRODUCCIÓN Es decir...25 Los resultados de este experimento factorial indican que el efecto del palo es mayor que el efecto de la pelota o que el de la interacción.-"'Palo Figura 1-6 Experimento factorial de tres factores que incluye el tipo de palo. . al comparar esta situación con el diseño factorial de dos factores de la figura 1-4. Ésta es una característica importante y útil de los diseños factoriales. Se trata de un ejemplo de un diseño factorial 23 • Como el autor sólo desea jugar ocho rondas de golf. Por lo tanto. Podrían usarse pruebas estadísticas para determinar si cualquiera de estos efectos difiere de cero. 1 1 Efecto de l a mteraCClOn pe ota-pa o 92+94+88+90 =--4--88+ 91 : 93+ 91 = 0. Si el autor sólo puede jugar ocho rondas de golf.-. cuando el número de factores de interés aumenta. .. Un experimento factorial fraccionado es una variación del diseño factorial básico en la que sólo se realiza un subconjunto de las corridas.. el número de corridas requeridas se incrementa con rapidez. suponiendo que se repite dos veces cada corrida del diseño de dos factores de la figura 1-4. cinco o más factores. por ejemplo. si hay k factores. por lo general no es necesario probar todas las combinaciones posibles de los niveles de los factores. Puesto que los cuatro factores tienen dos niveles. Estos diseños se analizarán en el capítulo 8. cuando se trabaja con cuatro. un experimento con 10 factores en el que todos los factores tienen dos niveles requeriría 1024 corridas. En la figura 1-8 se ilustra un diseño factorial fraccionado para la versión de cuatro factores del experimento del golf.1-1 ESTRATEGIA DE EXPERIMENTACIÓN Manera de desplazarse 7 . el diseño factorial requeriría 2k corridas.en un diseño factorial 24 • Como en cualquier diseño factorial.1'"-----"'-----'1\ Caminando En carrito I I I [ [ I /// /-/~---- L----Palo Figura 1-7 Experimento factorial de cuatro factores que incluye el tipo de palo. Proporcionará información adecuada acerca de los efectos principales de los cuatro factores. así como en el mejoramiento de procesos. se usan todas las combinaciones posibles de los niveles de los factores. En general. así como cierta información acerca de la forma en que interactúan estos factores. . la pelota. el tipo de bebida y la manera de desplazarse. En la figura 1-7 se ilustra la forma en que podrían investigarse los cuatro factores -el palo. el tipo de pelota. Por ejemplo.f"" Manera de desplazarse --"A --'l\ En carrito Caminando I I I ' I I I // _.. cada uno con dos niveles. Este diseño requiere sólo 8 corridas en lugar de las 16 originales y se llamaría fracción un medio. Por fortuna. Esto pronto se vuelve impracticable en lo que se refiere al tiempo y los recursos. el experimento de la figura 1-7 requiere 16 corridas. éste es un excelente diseño en el cual estudiar los cuatro factores. Los diseños factoriales fraccionados son muy comunes en la investigación y el desarrollo industrial.@----Palo Figura 1-8 Experimento factorial fraccionado de cuatro factores que incluye el tipo de palo. En el experimento del golf.L---- . Evidentemente. la bebida y la manera de desplazarse (caminando o en carrito). el autor sólo puede jugar ocho rondas. por lo que incluso el experimento de la figura 1-7 resulta demasiado largo. sigue siendo posible hacer la representación geométrica de este diseño experimental mediante un cubo (en realidad un hipercubo). información acerca del palo grande. el tipo de pelota. el tipo de bebida y la manera de desplazarse.. 8 1~2 CAPÍTULO 1 INTRODUCCIÓN ALGUNAS APLICACIONES TÍPICAS DEL DISEÑO EXPERIMENTAL Los métodos del diseño experimental han encontrado amplia aplicación en diversas disciplinas. lo que lleva a nuevos experimentos. debido a que la tarjeta de circuitos impresos promedio contiene más de 2000 juntas de soldadura. se llevan a cabo experimentos para generar datos del proceso y después se usa la información del experimento para establecer nuevas conjeturas. EJEMPLO 1~ 1 Caracterización de un proceso . es decir. Reducción del tiempo de desarrollo. Los métodos del diseño experimental desempeñan también un papel importante en las actividades del diseño de ingeniería. Reducción de los costos globales. La selección de los parámetros del diseño para que el producto tenga un buen funcionamiento en una amplia variedad de condiciones de campo. en costos de producción más bajos y en tiempos más cortos para el diseño y desarrollo del producto. . Sin embargo. Variabilidad reducida y conformidad más cercana con los requerimientos nominales o proyectados. las somete a un proceso de precalentamiento y después las hace pasar por una onda de soldadura líquida mediante una transportadora. La aplicación de las técnicas del diseño experimental en las fases iniciales del desarrollo de un proceso puede redundar en 1. 2. incluso un nivel de defectos de 1% representa un número demasiado alto de juntas de soldadura que requieren corrección. Mejoras en el rendimiento del proceso. La determinación de los parámetros clave del diseño del producto que afectan el desempeño del mismo. 2. en productos que tengan un desempeño y confiabilidad de campo mejorados. Entre las aplicaciones del diseño experimental en el diseño de ingeniería se encuentran: 1. Es decir. La máquina limpia las tarjetas en un fundente. El proceso opera actualmente con un nivel de defectos aproximado de 1%. En general. 3. En este proceso de soldadura se hacen las conexiones eléctricas y mecánicas de los componentes recubiertos de plomo en la tarjeta. 4. El uso del diseño experimental en estas áreas puede redundar en productos cuya fabricación sea más sencilla. y así sucesivamente. el aprendizaje ocurre a través de una serie de actividades en las que se hacen conjeturas acerca de un proceso. En el proceso de fabricación de tarjetas de circuitos impresos se utiliza una máquina de soldadura líquida. A continuación se presentan varios ejemplos que ilustran algunas de estas ideas. También tiene múltiples aplicaciones en el desarrollo de procesos nuevos. De hecho. cerca de 1% de las juntas de soldadura de una tarjeta son defectuosas y requieren corrección manual. La evaluación de materiales alternativos. la experimentación puede considerarse parte del proceso científico y uno de los medios para conocer el funcionamiento de sistemas y procesos. para que el producto sea robusto. donde se desarrollan productos nuevos y se hacen mejoramientos en los productos existentes. El diseño experimental es una herramienta de importancia fundamental en el ámbito de la ingeniería para mejorar el desempeño de un proceso de manufactura. 3. 4. Al ingeniero responsable del proceso en esta área le gustaría usar un experimento diseñado para determinar cuáles son los parámetros de la máquina que influyen en la ocurrencia de los defectos de soldadura y qué ajustes deberían hacerse en dichas variables para reducir los defectos de soldadura. La evaluación y comparación de configuraciones de diseños básicos. .•..... De manera típica... EJEMPLO 1~ 2 .... ¿existe interacción entre los factores? En ocasiones a un experimento como éste se le llama experimento tamiz o de exploración exhaustiva. Con el tiempo.. s. 4.... quiere determinar los factores (tanto los controlables como los no controlables) que afectan la ocurrencia de defectos en las tarjetas de circuitos impresos. La temperatura del precalentamiento.. aunadas a las cartas de control de la producción del proceso.. 2. La información obtenida de este experimento tamiz se usará para identificar los factores críticos del proceso y determinar la dirección del ajuste de dichos factores a fin de conseguir una reducción adicional del número de defectos por unidad.. 3.. es decir. aunque podrían controlarse para los fines de una prueba.1-2 ALGUNAS APLICACIONES TÍPICAS DEL DISEÑO EXPERIMENTAL 9 En la máquina de soldadura líquida hay diversas variables que pueden controlarse. y si la modificación de los factores en conjunto produce resultados diferentes que los obtenidos mediante el ajuste individual de los factores. La velocidad de la transportadora. si se consigue una mejoría sensible del proceso. Además de estos factores controlables..•. 3.. Por ejemplo..... es decir.... La temperatura de la soldadura. el interés suele centrarse en determinar las variables del proceso que afectan la respuesta. En esta situación.•. si la respuesta es el rendi- .. El tipo de fundente. Para ello puede diseñar un experimento que le permitirá estimar la magnitud y dirección de los efectos de los factores.. Éstos son: 1. cuánto cambia la variable de respuesta (defectos por unidad) cuando se modifica cada factor. 1. quizá sea posible basar la mayor parte del programa de control del mismo en el control de las variables de entrada del proceso en lugar de aplicar cartas de control a la producción.... s.. 7. una consecuencia del experimento podría ser la aplicación de técnicas como las cartas de control a una o más de las variables del proceso (la temperatura de la soldadura. determinar la región de los factores importantes que conduzca a la mejor respuesta posible... Éstas incluyen: 2.•..... El siguiente paso lógico es la optimización. La profundidad de la onda de soldadura. hay otros que no es sencillo manejar durante el proceso de fabricación. La disposición de los componentes en la tarjeta.. 6. los experimentos tamiz incluyen el uso de diseños factoriales fraccionados. El operador.. El ángulo de la transportadora. el interés del ingeniero es caracterizar la máquina de soldadura líquida. El tipo de componentes usados en la tarjeta. es decir. Por lo tanto. El espesor de la tarjeta de circuitos impresos.. como en el ejemplo del golf de la figura 1-8...•.. Optimización de un proceso En un experimento de caracterización. es decir.. 4. por ejemplo). El experimento también puede proporcionar información acerca de los factores que deberían controlarse con mayor atención durante el proceso de fabricación a fin de evitar los niveles elevados de defectos y el desempeño errático del proceso..•. La gravedad específica del fundente. La rapidez de producción. Las respuestas que se observan en los cuatro vértices del cuadrado indican que. se buscaría una región de variabilidad mínima. En esta gráfica las líneas de rendimiento constante se unen para formar los contornos de respuesta. 90 Y95 por ciento. mientras que si la respuesta es la variabilidad de una dimensión crítica del producto. se buscaría la región del rendimiento máximo. la cual ilustra la experimentación para optimizar un proceso. es necesario llevar a cabo un experimento en el que se hagan variar conjuntamente el tiempo y la temperatura. un experimento factorial. Supongamos que el interés se centra en mejorar el rendimiento de un proceso químico. SO. A esta superficie se le llama en ocasiones superficie de respnesta. 70. Estos contornos son las proyecciones en la región tiempo-temperatura de las secciones transversales de la superficie del rendimiento correspondiente a los rendimientos porcentuales arriba mencionados. . para incrementar el rendimiento. Para localizar el rendimiento óptimo.10 CAPÍTULO 1 INTRODUCCIÓN miento. los cambios deberían hacerse en la dirección general del aumento de la 200 Segundo experimento de optimización 190 180 E :J ~ "§ 170 o. y se muestran las líneas de contorno para rendimientos de 60.0 2. produciendo rendimientos de cerca de SO%.5 Tiempo (horas) Figura 1-9 Gráfica de contorno del rendimiento como una función del tiempo de reacción y la temperatura de reacción. El personal del proceso no conoce la verdadera superficie de respuesta de la figura 1-9.5 2. En la figura 1-9 se muestran los resultados de un experimento factorial inicial realizado con dos niveles tanto del tiempo como de la temperatura. El proceso opera actualmente a 145°Fy con 2. E Q) 1Q) 160 150 140 Condiciones de operación actuales 0.5 1. En la figura 1-9 se muestra una vista desde arriba de la región tiempo-temperatura. Por los resultados de un experimento de caracterización se sabe que las dos variables más importantes del proceso que influyen en el rendimiento son la temperatura de operación y el tiempo de reacción.0 1. por lo que se necesitarán métodos experimentales para optimizar el rendimiento con respecto al tiempo y la temperatura.1 horas de tiempo de reacción. es decir. 3 PRINCIPIOS BÁSICOS . distancia horizontal del pivote al resorte. 2. cualquier problema experimental incluye dos . La La La La La distancia que se desplaza el cilindro. 3. altura del resorte del pivote a la base. suponga que un grupo de ingenieros está diseñando el gozne de la puerta de un automóvil. altura libre del resorte principal. el cilindro se desplaza por un arco que hace que el resorte de hojas se comprima. El equipo de ingenieros considera que el esfuerzo amortiguador es una función de los siguientes factores: 1. uno de los diseños experimentales más importantes que se usan en los estudios de optimización de procesos. Cuando la puerta se abre. la capacidad de retención del tope que impide que la puerta se cierre cuando el vehículo se estaciona en una pendiente. Se obtendrá así información respecto de los factores que tienen una mayor influencia sobre el esfuerzo amortiguador del tope y. la metodología estadística es el único enfoque objetivo de análisis. altura libre del resorte auxiliar. Si quiere llevarse a cabo un experimento como los descritos en los ejemplos 1-1 al 1-3 con la mayor eficiencia posible. podrá mejorarse el diseño del tope. EJEMPLO 1. Se realizarían algunas corridas adicionales en esta dirección. puede diseñarse un experimento que conste de varias combinaciones de los niveles de los factores. El enfoque estadístico del diseño experimental es necesario si se quieren sacar conclusiones significativas de los datos. Una vez que se ha encontrado la región del rendimiento óptimo. El objetivo de este segundo experimento es desarrollar un modelo empírico del proceso y obtener una estimación más precisa de las condiciones de operación óptimas para el tiempo y la temperatura. es necesario utilizar un enfoque científico para planearlo. la cual se examina en detalle en el capítulo 11. Por lo tanto. es decir. y el prototipo del gozne puede probarse con estas combinaciones. Los ingenieros pueden construir un prototipo del mecanismo del gozne en el que es posible variar todos estos factores dentro de ciertos rangos. 4. La característica de calidad del producto que les interesa es el esfuerzo amortiguador. 5.1-3 PRINCIPIOS BÁSICOS 11 temperatura y la reducción del tiempo de reacción. El diseño estadístico de experimentos se refiere al proceso para planear el experimento de tal forma que se recaben datos adecuados que puedan analizarse con métodos estadísticos que llevarán a conclusiones válidas y objetivas. mediante el análisis de esta información. Ilustración del diseño de un producto Con frecuencia los métodos de diseño experimental pueden aplicarse en el proceso de diseño de un producto. el siguiente paso típico sería realizar un segundo experimento. Una vez que se han identificado los niveles apropiados de estos cinco factores. El segundo diseño ilustrado en la figura 1-9 es un diseño central compuesto.3 . y esta experimentación adicional llevaría a la región del rendimiento máximo. Para ilustrar esto. El mecanismo amortiguador consta de un resorte de hojas y un cilindro. Para cerrar la puerta es necesario vencer la fuerza del resorte. 1. Cuando el problema incluye datos que están sujetos a errores experimentales. A este enfoque para la optimización de un proceso se le llama la metodología de superficies de respuesta. la cual produce el esfuerzo amortiguador. 12 CAPÍTULO 1 INTRODUCCIÓN aspectos: el diseño del experimento y el análisis estadístico de los datos. La realización de réplicas posee dos propiedades importantes. suponga que una oblea de silicio se graba con un proceso de grabado químico con plasma para oblea única. suponga que los ejemplares del experimento descrito antes presentan sólo ligeras diferencias en el espesor y que la efectividad del medio de templado puede ser afectado por el espesor del ejemplar. Este sesgo estorba en uno de los medios de templa- . Segunda. se procesan simultáneamente cuatro obleas en un horno de oxidación con una velocidad del flujo de gas y un tiempo particulares y que se hace después una medición del espesor del óxido en cada oblea. suponga que. la varianza de la media muestral es La consecuencia práctica de lo anterior es que si se hicieron n = 1 réplicas y se observó Yl = 145 (templado en aceite) YY2 = 147 (templado en agua salada). la medición de las cuatro obleas no son réplicas sino mediciones repetidas. La aleatorización correcta del experimento ayuda también a "sacar del promedio" los efectos de factores extraños que pudieran estar presentes. permite al experimentador obtener una estimación del error experimental. Por realización de réplicas se entiende la repetición del experimento básico. Estas mediciones no son réplicas. Por aleatorización se entiende que tanto la asignación del material experimental como el orden en que se realizarán las corridas o ensayos individuales del experimento se determinan al azar. como parte de un experimento en la manufactura de semiconductores. la realización de réplicas permite al experimentador obtener una estimación más precisa de este efecto. en este caso. La aleatorización es la piedra angular en la que se fundamenta el uso de los métodos estadísticos en el diseño experimental. Los tres principios básicos del diseño experimental son la realización de réplicas. Por ejemplo. quizá se esté introduciendo un sesgo sistemático en los resultados experimentales. si se usa la media muestral (por ejemplo. la diferencia observada podría ser resultado del error experimental. son una forma de mediciones repetidas y. Hay una diferencia importante entre réplicas y mediciones repetidas. si cr es la varianza de una observación individual y hay n réplicas. Por ejemplo. se dice que se han obtenido cinco réplicas. Uno de los requisitos de los métodos estadísticos es que las observaciones (o los errores) sean variables aleatorias con distribuciones independientes. la variabilidad observada en las tres mediciones repetidas es reflejo directo de la variabilidad inherente del sistema o instrumento de medición. En este caso reflejan las diferencias entre las obleas y otras fuentes de variabilidad dentro de esa operación de horneado particular. si se tratan cinco ejemplares en cada medio de templado. La aleatorización hace por lo general que este supuesto sea válido. la aleatorización y la formación de bloques. Si todos los ejemplares sometidos al templado en aceite son más gruesos que los sometidos al templado en agua salada. y se observó Yl < Y2' podría concluirse con una certeza razonable que el templado en agua salada produce una dureza mayor en esta aleación de aluminio particular que el templado en aceite. es decir. una réplica consistiría en el tratamiento de una muestra con el templado en aceite y el tratamiento de una muestra con el templado en agua salada. Como otro ejemplo. Por ejemplo. si n fue razonablemente grande y el error experimental fue lo suficientemente pequeño. Por lo tanto. probablemente no podrán hacerse inferencias satisfactorias acerca del efecto del medio de templado. En las réplicas se reflejan las fuentes de variabilidad tanto entre las corridas como (potencialmente) dentro de las mismas. Primera. Por otra parte. Ambos temas se tratan en este libro. Estos dos aspectos se encuentran íntimamente relacionados porque el método de análisis depende directamente del diseño empleado. En el experimento metalúrgico analizado en la sección 1-1. De nueva cuenta. Y) para estimar el efecto de un factor en el experimento. Esta estimación del error se convierte en una unidad de medición básica para determinar si las diferencias observadas en los datos son en realidad estadísticamente diferentes. y que se hacen tres mediciones de una dimensión crítica de esta oblea. Para mayores detalles. pero es común que en la práctica no sea sencillo darse cuenta de que existe un problema que requiere experimentación. 8. la realización de réplicas y la formación de bloques son parte de cada uno de los experimentos. es necesario que todos los que participan en el mismo tengan desde el principio una idea clara de qué es exactamente lo que va a estudiarse. sección 2-5. la aleatorización. invalida los resultados obtenidos. y al menos una comprensión cualitativa de la forma en que van a analizarse estos datos. En la tabla 1-1 se muestra un esquema general del procedimiento recomendado. ver Coleman y Montgomery [27]. un bloque es un conjunto de condiciones experimentales relativamente homogéneas. Entonces el experimentador divide las observaciones del diseño estadístico en grupos que se corren en cada bloque. 9. etc. En ocasiones los experimentadores se encuentran con situaciones en las que la aleatorización de un aspecto del experimento es complicada. Este punto podría parecer muy obvio. que se utilizarán en el experimento. Puede recurrirse a tablas de números aleatorios para asegurar que las asignaciones se hacen al azar. Por ejemplo. Es muy común el uso de programas de computadora para auxiliar a los experimentadores a seleccionar y construir diseños experimentales. Los tres principios básicos del diseño experimental. y . Sin embargo. Estos programas presentan a menudo las corridas del diseño experimental de manera aleatoria. En el capítulo 2. Se ilustrarán y resaltarán repetidamente a lo largo de este libro. podría haber diferencias entre los lotes debido a la variabilidad de un proveedor a otro y. en un proceso químico. De manera típica. Algunos de estos enfoques se revisarán en capítulos subsecuentes (ver en particular el capítulo 13). los lotes de materia prima se considerarían un factor perturbador. así como las referencias al final del libro. cómo van a colectarse los datos. Por ejemplo. cada nivel del factor perturbador pasa a ser un bloque. 1~4 PAUTAS GENERALES PARA DISEÑAR EXPERIMENTOS Para aplicar el enfoque estadístico en el diseño y análisis de un experimento. 1. En el ejemplo del proceso químico. La formación de bloques es una técnica de diseño que se utiliza para mejorar la precisión de las comparaciones que se hacen entre los factores de interés. 5. Identificación y enunciación del problema. 11 Y13. como en este ejemplo. en caso de no haber un interés específico en este efecto. También es útil el material complementario para este capítulo. con frecuencia seguirá siendo necesario que el experimentador haga la asignación del material experimental (como las obleas en los ejemplos de semiconductores mencionados antes). en consecuencia. la temperatura puede ser una variable muy difícil de modificar. es decir.1. Muchas veces la formación de bloques se emplea· para reducir o eliminar la variabilidad transmitida por factores perturbadores. Al hacer la asignación aleatoria de los ejemplares al medio de templado este problema se aligera en parte.1-4 PAUTAS GENERALES PARA DISEÑAR EXPERIMENTOS 13 do y. en un experimento de un proceso químico pueden requerirse dos lotes de materia prima para realizar todas las corridas necesarias. de los instrumentos o herramientas de medición. cada lote de materia prima formaría un bloque. Por lo general este modo aleatorio se crea utilizando un generador de números aleatorios. se presenta un ejemplo sencillo para ilustrar la estructura básica de la formación de bloques. En general. 7. haciendo casi imposible la aleatorización completa de este factor. Existen métodos de diseño estadístico para resolver las restricciones sobre la aleatorización. de los operadores. incluyendo los capítulos 4. En varias partes del texto se estudia en detalle la formación de bloques. A continuación se presenta una breve explicación de este esquema y se elaboran algunos de los puntos clave. Incluso con estos programas de computadora. aquellos factores que pueden influir en la respuesta experimental pero en los que no hay un interés específico.. ya que es de esperarse que la variabilidad dentro de un lote sea menor que la variabilidad entre lotes. administración. se recomienda un enfoque de equipo para diseñar experimentos. de este problema. por lo que es conveniente contar con alguna clasificación adicional de los mismos. Análisis estadístico de los datos. Elección de los factores." 4. aseguramiento de calidad." ] al experimento 3. es importante solicitar aportaciones de todas las áreas involucradas: ingeniería. Una enunciación clara del problema contribuye sustancialmente a menudo para alcanzar una mejor comprensión de los fenómenos bajo estudio y la solución final del problema. 5. por lo que se mantendrán fijos en un nivel específico. "En la práctica. Algunas clasificaciones útiles son factores del diseño. Por esta razón. por ejemplo. Con frecuencia en esta etapa de la formulación del problema muchos ingenieros y científicos se percatan de que no es posible que un experimento comprensivo extenso responda las cuestiones clave y de que un enfoque secuencial en el que se utilice una serie de experimentos más pequeños es una estrategia más adecuada. Sin embargo. los pasos 2 y3 suelen hacerse simultáneamente o en el orden inverso. manufactura. 2.14 CAPÍTULO INTRODUCCIÓN Tabla 1-1 Pautas generales para diseñar un experimento 1. Conclusiones y recomendaciones. el expelimentador suele descubrir que estos factores pueden clasificarse como factores potenciales del diseño o bien como factores perturbadores. 7. factores que se mantienen constantes y factores a los que se permite variar. el descubrimiento (¿qué ocurre si se exploran nuevos materiales. Obviamente.) Cuando se consideran los factores que pueden influir en el desempeño de un proceso o sistema. Como un ejemplo de factores . Realización del experimento. Generalmente. Los factores que se mantienen constantes son variables que pueden tener cierto efecto sobre la respuesta. (Como se indica en la tabla 1-1. 6. las cuestiones específicas que habrán de abordarse en el experimento se relacionan de manera directa con los objetivos globales. el cliente y el personal de operación (el cual por lo general conoce a fondo el proceso y al que con demasiada frecuencia se ignora). por lo que el experimentador puede decidir llevar a cabo todas las corridas experimentales en un grabador químico particular (idealmente "típico"). los niveles y los rangos. Los factores del diseño son los que se seleccionan realmente para estudiarlos en el experimento. Identificación y exposición del problema. incluyendo la confirmación (¿el sistema se comporta de la misma manera ahora que en el pasado?). de la herramienta específica para el grabado químico con plasma que se utiliza en el experimento. sería muy difícil variar este factor en un experimento. etc. Elección de los factores. También es importante tener presente el objetivo global. Los factores potenciales del diseño son aquellos que el experimentador posiblemente quiera hacer variar en el experimento. Planeación previa 2. los niveles y los rangos. con la que todos estén de acuerdo. Selección de la variable de respuesta.?) y la estabilidad (¿bajo qué condiciones las variables de respuesta de interés sufren una degradación seria?). que es único. Es frecuente encontrar que hay muchos factores potenciales del diseño. tampoco es fácil desarrollar una enunciación clara. Elección del diseño experimental. Es necesario desarrollar todas las ideas acerca de los objetivos del experimento. variables. este factor se mantiene constante. De este modo. en un experimento de grabado químico en la industria de los semiconductores puede haber un efecto. En la mayoría de los casos es conveniente hacer una lista de los problemas o las preguntas específicas que van a abordarse en el experimento. Por ejemplo. mercadotecnia. los pasos 2 y 3 muchas veces se hacen simultáneamente o en orden inverso. condiciones de operación. pero que para los fines del experimento en curso no son de interés. ¿se trata de un proceso o sistema nuevo (en cuyo caso el objetivo inicial posiblemente será la caracterización o tamizado de los factares) o se trata de un sistema maduro que se conoce con profundidad razonable y que se ha caracterizado con anterioridad (en cuyo caso el objetivo puede ser la optimización)? En un experimento puede haber muchos objetivos posibles. La estructura básica de la formación de bloques. no controlables o de ruido. es común que el objetivo sea encontrar los ajustes de los factores controlables del diseño que minimicen la variabilidad transmitida por los factores de ruido. En ocasiones a esto se le llama el estudio de robustez del proceso o el problema de robustez del diseño. el ingeniero ha definido 12 variables que pueden afectar la ocurrencia de defectos de soldadura. la humedad relativa en el medio ambiente del proceso puede afectar el desempeño del proceso. el experimentador puede seleccionar lotes diferentes de materia prima o diversos días de la semana para condUcir el experimento. la región de interés deberá ser relativamente grande. con frecuencia se le llama factor de ruido. Cuando el objetivo del experimento es el tamizado de los factores o caracterización del proceso. en el experimento de la soldadura líquida. es decir. Muchas veces se trabajará con el supuesto de que los efectos de los factores que se mantienen constantes y de los factores a los que se permite variar son relativamente pequeños. El ingeniero también tendrá que tomar una decisión en cuanto a la región de interés para cada variable (es decir. Por ejemplo. Para seleccionar la variable de respuesta. No son la excepción las respuestas múltiples. el experimentador puede decidir medir varias veces cada unidad . Cuando un factor que varía de manera natural y no controlable en el proceso puede controlarse para los fines de un experimento. comentada en la sección anterior. las unidades experimentales o los "materiales" a los que se aplican los factores del diseño no son homogéneos por lo general. Elegir la región de interés también es importante. por lo general es mejor mantener reducido el número de niveles de los factores. muchas veces puede usarse el procedimiento de análisis denominado análisis de covarianza para compensar este efecto. La formación de bloques. Este conocimiento del proceso suele ser una combinación de experiencia práctica y conocimientos teóricos. el experimentador sólo detectará los efectos relativamente grandes de los factores o quizá sean necesarias réplicas adicionales. la región de interés se hará por lo general más estrecha. Conforme se sepa más acerca de las variables que son importantes y de los niveles que producen los mejores resultados. el promedio o la desviación estándar (o ambos) de la característica medida será la variable de respuesta. el rango en el que se hacen variar los factores deberá ser amplio. no obstante lo cual con frecuencia se ignora esta variabilidad de una unidad a otra y se confía en la aleatorización para compensar cualquier efecto del material o la unidad experimental. el análisis de covarianza y los estudios de robustez del proceso se comentan más adelante. Una vez que el experimentador ha seleccionado los factores del diseño. Los factores perturbadores suelen clasificarse como factores controlables. los factores perturbadores pueden tener efectos considerables que deben tomarse en consideración. Por ejemplo. Si un factor perturbador no es controlable en el experimento. y si la humedad no puede controlarse. En tales situaciones. probablemente podrá medirse y tratarse como una covariable. Para ello se requiere del conocimiento del proceso. en particular cuando uno se encuentra en las fases iniciales de la experimentación o cuando el proceso no está del todo maduro. Un factor perturbador controlable es aquel cuyos niveles pueden ser ajustados por el experimentador. Por otra parte. Es importante investigar todos los factores que pueden ser de importancia y no dejarse influir demasiado por la experiencia pasada. En general. Por ejemplo. En algunas situaciones en que la eficiencia de los instrumentos de medición es pobre. así como los niveles específicos con los que se realizarán las corridas. debe elegir los rangos en los que hará variar estos factores. También deberá pensarse cómo van a controlarse estos factores en los valores deseados y cómo van a medirse. a pesar de que no haya interés en ellos en el contexto del experimento en curso. 3. suele ser útil para trabajar con factores perturbadores controlables. Si la eficiencia de los instrumentos de medición es inadecuada.1-4 PAUTAS GENERALES PARA DISEÑAR EXPERIMENTOS 15 a los que se permite variar. el rango en el que se hará variar cada factor) y en cuanto al número de niveles de cada variable que usará. Selección de la variable de respuesta. dos niveles funcionan bastante bien en los estudios de tamizado de factores. En la mayoría de los casos. el experimentador deberá tener la certeza de que esta variable proporciona en realidad información útil acerca del proceso bajo estudio. En el tamizado de factores. pero puede medirse. La eficiencia de los instrumentos de medición (o error de medición) también es un factor importante. Existen también varios paquetes interactivos de software de estadística que soportan esta fase del diseño experimental. donde A es el estándar y B es una alternativa con una eficiencia de costos mayor. se hace una amplia recomendación para el trabajo en equipo durante la planeación del experimento. Si las actividades de planeación previas al experimento se realizan como es debido. 5. Para un ejemplo. . Véase también la información complementaria del texto para más detalles y un ejemplo del uso de estas hojas de trabajo. En otras situaciones podría haber más interés en verificar la uniformidad.16 CAPÍTULO 1 INTRODUCCIÓN experimental y usar el promedio de las mediciones repetidas como respuesta observada. Por ejemplo. y puede usarse en última instancia como un catálogo para seleccionar el diseño experimental apropiado para una amplia variedad de problemas. los niveles y los rangos. En consecuencia. Coleman y Montgomery [27] sugieren que antes de llevar a cabo el experimento. Por lo tanto. Coleman y Montgomery [27] proporcionan hojas de trabajo que pueden ser útiles en la planeación previa al experimento. Se hace referencia a esto como planeación previa al experimento. es conveniente en muchas ocasiones realizar algunas corridas piloto o de prueba. En ocasiones se emplean experimentos diseñados para estudiar y mejorar el desempeño de los sistemas de medición. (Nosotros preferimos ver varias alternativas en lugar de confiar en la recomendación de la computadora en la mayoría de los casos. Estas corridas proporcionan información acerca de la consistencia del material experimental. Los errores en el procedimiento experimental en esta etapa destruirán por lo general la validez experimental. Suele ser de importancia determinante identificar los aspectos relacionados con la definición de las respuestas de interés y cómo van a medirse antes de llevar a cabo el experimento. Realización del experimento. Cuando se lleva a cabo el experimento es vital monitorear con atención el proceso a fin de asegurarse de que todo se esté haciendo conforme a la planeación. En muchos experimentos de ingeniería se sabe de antemano que algunos de los niveles de los factores producirán valores diferentes de la respuesta. El experimentador estará interesado entonces en demostrar que. El experimentador puede introducir la información del número de factores. 4. y estos programas presentarán a la consideración del experimentador una selección de diseños o recomendarán un diseño particular. de ser necesario. no hay ninguna diferencia en el rendimiento entre las dos condiciones. ver el capítulo 12. Al seleccionar el diseño.) Estos programas proporcionan también por lo general una hoja de trabajo (con el orden aleatorizado de las corridas) que se usará en la conducción del experimento. es importante tener en mente los objetivos experimentales. el interés se centra en identificar qué factores causan esta diferencia yen estimar la magnitud del cambio de la respuesta. Es fácil subestimar los aspectos de logística y planeación cuando se corre un experimento diseñado en un ambiente complejo de manufactura o de investigación y desarrollo. La mayor parte del éxito gravitará en torno a qué tan bien se haya hecho la planeación previa del experimento. la selección de un orden de corridas adecuado para los ensayos experimentales y la determinación de si entran en juego o no la formación de bloques u otras restricciones sobre la aleatorización. por ejemplo. este paso es relativamente sencillo. las decisiones tomadas en los pasos 1 al 4. En muchas situaciones. Poner en un primer plano la planeación es crucial para el éxito. En este libro se revisan algunos de los tipos más importantes de diseños experimentales. La elección del diseño implica la consideración del tamaño de la muestra (número de réplicas). una idea aproximada del error experimental y la oportunidad de poner en práctica la técnica experimental global. no es posible que una sola persona posea todos los conocimientos requeridos para hacer esto adecuadamente. Elección del diseño experimental. Esto ofrece también una oportunidad para revisar. pueden compararse dos condiciones de producción Ay B. una comprobación del sistema de medición. Se reitera lo crucial que es exponer todos los puntos de vista y la información del proceso en los pasos 1 al 3 anteriores. Si el experimento se ha diseñado correctamente y si se ha llevado a cabo de acuerdo con el diseño. Con frecuencia se encuentra que los métodos gráficos simples desempeñan un papel importante en el análisis e interpretación de datos. y así sucesivamente. Fisher en los años 1920 y principios de la década de 1930. Los métodos gráficos suelen ser útiles en esta etapa. Un experimento exitoso requiere conocer los factores importantes. no deberá invertirse más de 25% de los recursos disponibles en el primer experimento.1-5 BREVE HISTORIA DEL DISEÑO ESTADÍSTICO 17 Deberán usarse métodos estadísticos para analizar los datos a fin de que los resultados y las conclusiones sean objetivos y no de carácter apreciativo. los métodos estadísticos no permiten la demostración experimental de nada. como regla general. Una vez que se han analizado los datos. los procedimientos para probar hipótesis y estimar intervalos de confianza son muy útiles en el análisis de datos de un experimento diseñado. Más adelante se revisarán en detalle estos temas. los métodos estadísticos necesarios no deben ser complicados. La ventaja principal de los métodos estadísticos es que agregan objetividad al proceso de toma de decisiones. es decir. pero se aprende acerca de ellas sobre la marcha. generalmente la experimentación se hace en forma secuencial y. el experimentador debe sacar conclusiones prácticas acerca de los resultados y recomendar un curso de acción. 6. Fisher fue el responsable de las estadísticas y el análisis de datos en la Estación . 1~5 BREVE HISTORIA DEL DISEÑO ESTADÍSTICO Ha habido cuatro eras del desarrollo moderno del diseño experimental estadístico. llevarán por lo general a conclusiones sólidas. 7. el número apropiado de niveles que deberán usarse y las unidades de medición apropiadas para estas variables. mediante una ecuación derivada de los datos que expresa la relación entre la respuesta y los factores importantes del diseño. Muchas veces es muy útil también presentar los resultados de varios experimentos en términos de un modelo empírico. en la que se formulan hipótesis tentativas acerca de un sistema. A lo largo del proceso completo es importante tener presente que la experimentación es una parte esencial del proceso de aprendizaje. y muchos de los programas usados en el paso 4 para seleccionar el diseño cuentan con una interfase directa para el análisis estadístico. Por consiguiente. Debido a que muchas de las preguntas que el experimentador quiere responder pueden insertarse en el marco de la prueba de hipótesis. La era agrícola fue encabezada por el trabajo pionero de Sir Ronald A. Conclusiones y recomendaciones. en particular para presentar los resultados. sólo proporcionan pautas generales en cuanto a la confiabilidad y la validez de los resultados. Con esto se asegurará que se contará con los recursos suficientes para realizar las corridas de confirmación y que se alcanzará en última instancia el objetivo final del experimento. Análisis estadístico de los datos. aunadas a una buena ingeniería o conocimiento del proceso y el sentido común. Aplicados en forma correcta. modificar la región de exploración de algunos factores o incorporar nuevas variables de respuesta. Recuerde que los métodos estadísticos no pueden demostrar que un factor (o factores) posee un efecto particular. Las técnicas estadísticas. El análisis residual y la verificación de la adecuación del modelo son también técnicas de análisis importantes. También deberán realizarse corridas de seguimiento o pruebas de confirmación para validar las conclusiones del experimento. los rangos en los que deberán hacerse variar estos factores. se realizan experimentos para investigar estas hipótesis y se formulan nuevas hipótesis con base en los resultados. es común abandonar algunas variables de entrada e incorporar otras. A medida que avanza un programa experimental. En general. Por lo general es un gran' error diseñar un solo experimento comprensivo y extenso al principio de un estudio. pero sí sirven para medir el error posible en una conclusión o asignar un nivel de confianza a un enunciado. En este periodo. no se conocen las respuestas precisas de estas cuestiones. Existen varios paquetes de software excelentes diseñados para auxiliar en el análisis de datos. Esto sugiere que la experimentación es iterativa. 2. Parte de la controversia surgió porque en Occidente la metodología de Taguchi fue defendida al principio (y sobre todo) por empresarios. Taguchi propuso diseños factoriales altamente fraccionados y otros arreglos ortogonales junto con algunos métodos estadísticos nuevos para resolver estos problemas. Hacer procesos insensibles a los factores ambientales o de otra índole que son difíciles de controlar. la MSR y otras técnicas de diseño se generalizaron en las industrias química y de proceso. la aplicación del diseño estadístico a nivel de plantas o procesos de manufactura todavía no estaba muy generalizada. ver Box [21]. Hunter [59a. es decir. Fisher desarrolló las ideas que llevaron a los tres principios básicos del diseño experimental que se revisan en la sección 1-3: la aleatorización. b]. los resultados de esta revisión indicaron que aun cuando los conceptos y los objetivos enfocados en la ingeniería de Taguchi tenían bases sólidas. George Box fue el líder intelectual de este movimiento. Myers y Montgomery [85a] y Pignatiello y Ramberg [94]. y 2) el experimentador puede obtener pronto información crucial de un pequeño grupo de corridas que puede usarse para planear el siguiente experimento. la realización de réplicas y la formación de bloques. Para fines de la década de 1980. ver Box [12d]. Fisher incorporó de manera sistemática ~l pensamiento y los principios estadísticos en el diseño de las investigaciones experimentales.18 CAPÍTULO 1 INTRODUCCIÓN Agrícola Experimental de Rothamsted en las cercanías de Londres. 1. incluyendo el concepto de diseño factorial y el análisis de varianza. Box. Box [12f] denomina inmediatez y secuencialidad a estas dos características de los experimentos industriales. Kackar [62] y Taguchi [108a. Inglaterra. 3. Algunas de las razones de ello incluyen la capacitación inadecuada de ingenieros y otros especialistas en procesos en los conceptos y los métodos estadísticos básicos. Sin embargo. Sus libros [44a. así como la falta de recursos de computación y software de estadística que fueran fáciles de usar para apoyar la aplicación de experimentos diseñados estadísticamente. El trabajo de Genichi Taguchi (Taguchi y Wu [109]. fue el desarrollo de la metodología de superficies de respuesta (MSR) por parte de Box y Wilson [20]. b] tuvieron profunda influencia en el uso de la estadística. Bisgaard y Fung [14]. El interés creciente de la industria occidental en el mejoramiento de calidad que empezó a fines de la década de 1970 anunció la tercera era del diseño estadístico. La metodología resultante generó muchas discusiones y controversias. Si bien es cierto que la aplicación del diseño estadístico en ambientes industriales se inició en la década de 1930. Para una excelente biografía de Fisher. Fisher se percató de que las fallas en la forma en que se llevaba a cabo el experimento que generaba los datos obstaculizaban con frecuencia el análisis de los datos de los sistemas (en este caso sistemas agrícolas). Taguchi propugnaba por el uso de experimentos diseñados para lo que denominó el diseño paramétrico robusto. existían problemas sustanciales con su estrategia experimental y sus métodos para el análisis de los datos. Para detalles específicos de estas cuestiones. sobre todo en el trabajo de investigación y desarrollo. y no se había hecho la revisión escrutadora adecuada de la ciencia estadística fundamental. En los 30 años siguientes. Mediante la interacción con múltiples científicos e investigadores de diversos campos. b]) tuvo un impacto significativo en el aumento del interés y el uso de los experimentos diseñados. Gran parte de estas preo- . Estos autores se percataron y explotaron el hecho de que muchos experimentos industriales son fundamentalmente diferentes de sus contrapartes agrícolas en dos sentidos: 1) la variable de respuesta puede observarse por lo general (casi) de inmediato. el catalizador de la segunda era. Encontrar los niveles de las variables del proceso que obliguen a la media a un valor deseado mientras que al mismo tiempo se reduzca la variabilidad en torno a este valor. o era industrial. Fabricar productos insensibles a la variación transmitida por los componentes. particularmente en la agricultura y las ciencias biológicas relacionadas. et al. En este punto cabe hacer hincapié nuevamente en el paso 4 del procedimiento recomendado en la sección 1-4. Tercero. Los métodos de diseño y análisis relativamente simples son siempre los mejores. un ingeniero civil que trabaja en un problema de hidrología cuenta de manera típica con considerable experiencia práctica y capacitación académica formal en esta área. si el diseño se estropea grandemente por ineptitud. el uso de los experimentos diseñados se hizo más generalizado en las industrias con piezas discretas. las ciencias y la industria es empírica y hace un uso extensiva de la experimentación. Es necesario no exagerar en el uso de técnicas estadísticas complejas y sofisticadas. incluyendo la industria de manufacturas automotrices y aeroespaciales. decidir cuántas réplicas correr. 3. y muchas otras. no existe ninguna seguridad de que esta diferencia sea de la magnitud suficiente como para tener algún valor práctico. Este tipo de conocimientos no estadísticos es invaluable para elegir los factores. un ingeniero puede determinar que una modificación en el sistema de inyección de combustible de un automóvil puede producir un mejoramiento promedio real en el rendimiento del combustible de 0. la educación formal en diseño experimental estadístico se está haciendo parte de los programas de ingeniería en las universidades. que anteriormente hacían poco uso de esta técnica. se inició la cuarta era del diseño estadístico. El uso correcto de las técnicas estadísticas en la experimentación requiere que el experimentador tenga presentes los puntos siguientes: 1. no es posible que incluso la estadística más compleja y elegante salve la situación. Sin embargo. Hubo al menos tres resultados positivos de la controversia desatada por Taguchi. 2. determinar los niveles de los factores. Uso de conocimientos no estadísticos del problema. si .1 mi/gal. Por ejemplo. incluyendo alternativas a los métodos técnicos de Thguchi que permiten que sus conceptos de ingeniería se lleven a la práctica de manera eficaz y eficiente. Si un diseño se hace de manera cuidadosa y correcta. La integración exitosa de una buena práctica del diseño experimental en la ingeniería y las ciencias es un factor clave en la competitividad industrial futura. Sin embargo. Esta era ha incluido un renovado interés general tanto por parte de investigadores como de profesionales en ejercicio en el diseño estadístico y el desarrollo de varios enfoques nuevos y útiles para los problemas experimentales en el mundo industrial. El uso de la estadística no es sustituto de la reflexión sobre el problema. Tener presente la diferencia entre significación práctica y significación estadística. etc. Los métodos estadísticos pueden incrementar en gran medida la eficiencia de estos experimentos y con frecuencia pueden fortalecer las conclusiones así obtenidas. [86]). En algunos campos existe un cuerpo enorme de teoría física en el cual indagar para explicar las relaciones entre los factores y las respuestas. Primero. de electrónica y semiconductores. Los experimentadores suelen poseer amplios conocimientos de sus respectivos campos. el análisis casi siempre será relativamente directo. tanto a nivel de licenciatura como de posgrado.1-6 RESUMEN: USO DE TÉCNICAS ESTADÍSTICAS EN LA EXPERIMENTACIÓN 19 cupaciones se resumen también en el amplio panel de discusión del número de mayo de 1992 de TeehnomeDies (ver Nair. Mantener el diseño y el análisis tan simple como sea posible. 1~6 RESUMEN: USO DE TÉCNICAS ESTADÍSTICAS EN LA EXPERIMENTACIÓN Gran parte de la investigación en la ingeniería. interpretar los resultados del análisis. Segundo. en particular en el capítulo 11. Por ejemplo. Algunas de estas alternativas se revisarán e ilustrarán en capítulos subsecuentes. Éste es un resultado estadísticamente significativo. Debido justamente a que dos condiciones experimentales producen respuestas medias que son estadísticamente diferentes. En general. la diferencia de 0. y es necesario contar con recursos suficientes para alcanzar los objetivos finales del experimento. hay situaciones en las que un experimento comprensivo es totalmente apropiado pero. Los experimentos son generalmente iterativos. etc. la mayoría de los experimentos deberán ser iterativos. Recuerde que en la mayoría de las situaciones no es conveniente diseñar un experimento demasiado comprensivo al principio de un estudio. no deberá invertirse más de 25% de los recursos para la experimentación (corridas.) en el experimento inicial. Esto habla en favor del enfoque iterativo o secuencial analizado anteriormente. 4. presupuesto. . el número aprOpiado de niveles para cada factor y los métodos y las unidades de medición adecuados para cada factor y respuesta. Un diseño exitoso requiere conocer los factores importantes. tiempo. como regla general. Por consiguiente. sino que las respuestas aparecen sobre la marcha. ningún experimentador está en posición de responder estas cuestiones al principio del experimento. los rangos en los que estos factores se harán variar. Desde luego. Con frecuencia estos esfuerzos iniciales constituyen sólo experiencias de aprendizaje.1 mi/gal probablemente será muy pequeña para poseer algún valor práctico.20 CAPÍTULO 1 INTRODUCCIÓN el costo de la modificación es de $1000. con la fuerza del mortero sin modificar. con la fuerza del mortero modificado excediendo la de la formulación sin modificar. 2. muestras aleatorias. Esta impresión se confirma al comparar las fuerzas de la tensión de adhesiónpromedio'Yl = 16. distribuciones de probabilidad. a las cuales es común denominar experimentos comparativos simples. En la figura 2-1 se grafican los datos de este experimento. Los datos se muestran en la tabla 2-1.76 kgf/cm2 para el mortero modificado YY2 = 17. Posiblemente otras dos muestras produzcan el resultado contrario. Quizás esta diferencia observada en las fuerzas promedio sea el resultado de fluctuaciones del muestreo y las dos formulaciones sean idénticas en realidad. El experimentador ha reunido 10 observaciones de la fuerza de la formulación modificada y otras 10 observaciones de la formulación sin modificar.1 INTRODUCCIÓN La fuerza de la tensión de adhesión del mortero de cemento portland es una característica importante del producto.. como variables aleatorias. distribuciones de muestreo y pruebas de hipótesis.92 kgf/cm2 para el mortero sin modificar. El estudio lleva a revisar varios conceptos básicos de la estadística. Un ingeniero está interesado en comparar la fuerza de una formulación modificada en la que se han agregado emulsiones de látex de polímeros durante el mezclado. no es evidente que esta diferencia sea de la magnitud suficiente para implicar que las dos formulaciones son en realidad diferentes. Las fuerzas de la tensión de adhesión promedio de estas dos muestras difieren en lo que parece ser una cantidad no trivial. Puede usarse una técnica de la inferencia estadística llamada prueba de hipótesis (algunos autores prefieren el término prueba de significación) para auxiliar al experimentador en la comparación de estas 21 . Sin embargo. Podría hacerse referencia a las dos formulaciones diferentes como dos tratamientos o como dos niveles del factor formulaciones. A esta representación se le llama diagrama de puntos. Del examen visual de estos datos se obtiene la impresión inmediata de que la fuerza del mortero sin modificar es mayor que la fuerza del mortero modificado.Experimentos comparativos simples En este capítulo se examinan los experimentos para comparar dos condiciones (llamadas en ocasiones tratamientos). Se empieza conel ejemplo de un experimento que se realiza para determinar si dos formulaciones diferentes de un producto producen resultados equivalentes. o ruido.86 17. Por ejemplo. Es común llamar a este ruido el error experimeutal o simplemente el error.90 17.15 16. la fuerza de la tensión de adhesión.22 CAPÍTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES Tabla 2. en los resultados. en el experimento de la fuerza de tensión dé adhesión del cemento portland. de datos (digamos hasta unas 20 observaciones). entonces la variable aleatoria es continua. se hará una breve revisión de algunos conceptos elementales de la estadística.92 Diagrama de puntos de los datos de la fuerza de la tensión de adhesión de la tabla 2-1.04 16. entonces la variable aleatoria es discreta. Se trata de un error estadístico.21 16.50 17.00 17.59 16.15 1 2 3 4 5 6 7 8 9 10 Y1j 16.96 17. lo cual significa que se origina por la variación que no está bajo control y que generalmente es inevitable.57 dos formulaciones. es una variable aleatoria. Si el conjunto de todos los valores posibles de la variable aleatoria es finito o contablemente infinito. el diagrama de puntos revela ee_ 15 ee Ieee o 00 16 oro!> 000 18 y.35 16.52 17.63 18. El diagrama de puntos le permite al experimentador ver de inmediato la localización o tendencia central de las observaciones y su dispersión. 2. Descripción gráfica de la variabilidad Es frecuente usar métodos gráficos simples como ayuda para analizar los datos de un experimento.22 17. .1 Datos de la fuerza de la tensión de adhesión del experimento de la formulación del cemento portland Mortero modificado j Mortero sin modificar 17. mientras que si el conjunto de todos los valores posibles de la variable aleatoria es un intervalo.25 18. El diagrama de puntos.40 17. Antes de presentar los procedimientos de la prueba de hipótesis en experimentos comparativos simples.85 16. ilustrado en la figura 2-1. La presencia del error o ruido implica que la variable de respuesta. por lo que existen fluctuaciones. es un recurso muy útil para representar un cuerpo reducido. Observe que las corridas individuales difieren. Figura 2-1 ~ 1 17 Fuerza (kgf/cm 2) 1 19 20 e o ~ ~ Mortero modificado Mortero sin modificar 16.96 18. con el conocimiento de los riesgos asociados si se llega a una conclusión equivocada. Una variable aleatoria puede ser discreta o coutinua. La prueba de hipótesis permite que la comparación de las dos formulaciones se haga en términos objetivos.75 18.76 Y2 ~ 17.2 CONCEPTOS ESTADÍSTICOS BÁSICOS A cada una de las observaciones del experimento del cemento portland citado anteriormente se le llamaría una corrida. En la figura 2-2 se presenta el histograma de 200 observaciones de la recuperación de metal (o rendimiento) en un proceso de fundición. Ver Montgomery y Runger [83d] para más detalles. En un diagrama de caja se muestra el mínimo. Distribuciones de probabilidad La estructura de la probabilidad de una variable aleatoria.10 ro . Se trazan dos líneas (o bigotes) que se extienden de los extremos de la caja hasta (de manera típica) los valores mínimo y máximo.) En la figura 2-3 se muestran los diagramas de caja de las dos muestras de la fuerza de la tensión de adhesión en el experimento del mortero de cemento portland. Recuerde que un histograma se construye dividiendo el eje horizontal en intervalos (generalmente de longitud igual) y trazando un rectángulo sobre el intervalo j-ésimo con el área del rectángulo proporcional a l1j . respectivamente) y la mediana (el percentil50) en una caja rectangular alineada horizontal o verticalmente. es común hacer referencia a su distribución de probabili- . La caja se extiende del cuartil inferior al cuartil superior y se traza una línea por la mediana que atraviesa la caja.05 10 0. el número de observaciones incluidas en ese intervalo. es difícil distinguir las observaciones graficadas en un diagrama de puntos. los cuartiles inferior y superior (el percentil25 y el percentil 75.¡¡ c: ID ::J " . la dispersión y la forma general de la distribución de los datos. En esta representación se revela con toda claridad la diferencia en la fuerza promedio entre las dos formulaciones. Cuando los datos son muy numerósos. El diagrama de caja (o diagrama de caja y bigotes) es una manera muy útil de representar gráficamente los datos. se describe mediante su distribución de probabilidad. Cuando y es discreta. (Existen diversas variantes de los diagramas de caja que tienen reglas diferentes para denotar los puntos muestrales extremos. se usa el concepto de distribución de probabilidad. por ejemplo y. los histogramas y los diagramas de caja son útiles para resumir la información de una muestra de datos. Para describir con mayor detalle las observaciones que podrían presentarse en una muestra.2-2 CONCEPTOS ESTADÍSTICOS BÁSICOS 0.¡¡ c: 20 ro .15 30 23 ro ~ 'E ro ID ::J ID 0. pero que ambas producen aproximadamente la misma variación en la fuerza. Los diagramas de puntos. el máximo. y en tal caso sería preferible un histograma. El histograma muestra la tendencia central. que probablemente las dos formulaciones difieran en la fuerza promedio.00 60 65 70 75 Recuperación de metal (rendimiento) Figura 2-2 Histograma de 200 observaciones de la recuperación de metal (rendimiento) en un proceso de fundición. Indica asimismo que ambas formulaciones producen distribuciones de la fuerza razonablemente simétricas con una variabilidad o dispersión similar.t "- " ~ 0. una discreta y la otra continua.. " " 2l ro :J - .. es el área bajo la curva f(y) asociada con un L.L.-L-.8 '0 .. por ejemplo p(y).4 1u Cl - ~ -o .. es común hacer referencia a su distribución de probabilidad. Cuando y es continua. " w 18 1- ..¡¡.L__.!!! "O w 16. En la figura 2-4 se ilustran dos distribuciones de probabilidad hipotéticas.LI~. mientras que en el caso continuo.----..6 ro "O "O $ - 17.24 ¡. Observe que en la distribución de probabilidad discreta es la altura de la función p(Yj) la que representa la probabilidad. dad. por ejemplo f(y).¡¡.I. como la función de probabilidad de y.I__I_.4 w ~ $ 1 I Modificado Sin modificar Formulación del mortero 16 - - LL Figura 2-3 Diagramas de caja del experimeuto de la fuerza de la tensión de adhesión del cemento portland. como la función de densidad de probabilidad de y.¡- CAPÍTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES Diagramas de caja y bigotes 1 1 ¡¡. E 18..L--'---LI__'_I _ Y1 Y3 Ya Y7 Yj Yg Y11 Y13 Y2 Y4 Ya Ya Y10 Y12 Y14 a} Una distribución discreta b-----=--Y b) Una distribución continua Figura 2·4 Distribuciones de probabilidad discreta y continua..I:: w 17..2 16. . f(y)dy= 1 Media.t= E(y) = { LJYP(Y) toda y y continua y discreta ~ (2-2) donde E denota el operador del valor esperado.t. ¡. la cual se define como y continua y discreta (2-3) Observe que la varianza puede expresarse exclusivamente en términos del valor esperado debido a que (2-4) Por último.{ LYP(Y) toda y y continua y discreta (2-1) La media también puede expresarse en términos del valor esperado o valor promedio a la larga de la variable aleatoria y como J:oo yf(y)dy ¡. el uso de la varianza es tan frecuente que resulta conveniente definir un operador de la varianza V tal que V(y) = E[(y_¡.t. Matemáticamente.2-2 CONCEPTOS ESTADÍSTICOS BÁSICOS 25 intervalo dado la que representa la probabilidad. la media se define como f:oo yf(y) dy ¡. de una distribución de probabilidad es una medida de su tendencia central o localización. varianza y valores esperados La media. La variabilidad o dispersión de una distribución de probabilidad puede medirse con la varianza. Un resumen cuantitativo de las propiedades de las distribuciones de probabilidad sería el siguiente: y discreta: 0:5 p(Yj ):51 P(y= Yj) = p(Yj ) todos los valores de Yj todos los valores de Yj L todos los p(yJ=1 valores de y j y continua: 0:5 f(Y) P(a:5 y:5 b) = f: f(y)dy f:".t)2] = 0 2 (2-5) . 12.. 128-129). La covarianza es una medida de la asociación lineal entre Y1 y Y2" Más específicamente. sin imp01tar si Y1 y Y2 son independientes o no. media muestral y varianza muestral El objetivo de la inferencia estadística es sacar conclusiones acerca de una población utilizando una muestra de la misma.26 CAPÍTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES Los conceptos de valor esperado y varianza se usan constantemente a lo largo de este libro. observe que. es decir. 8. V(Y1 ±Y2)=V(Y1)+V(y 2 )= a¡ +a. por ejemplo'Y1 con E(Y1) E(Y1 +y2 )= E(Y1)+E(y 2 )= fl 1+fl2 = fl1 y V(Y1) = a. . entonces 1.Y2) = OYno obstante esto no implica que las variables sean independientes. V(Y1 . ver Hines y Montgomery ([55] pp. YY2 con E(Y2) = fl2 y V(Y2) = Es posible demostrar que V(Y1 +y2 )=V(Y1)+V(y2 )+2 COV(Y1' Y2) donde (2-6) es la covarianza de las variables aleatorias Y1 y Y2. se tiene 7. La mayoría de los métodos que se estudiarán aquí incluyen el supuesto de que se ¡ Observe que el recíproco no es necesariamente verdadero. Para un ejemplo. y puede ser útil revisar varios resultados elementales relacionados con estos operadores. 2. 1 entonces COV(y1' Y2) = O.Y2) = V(Y1)+ V(y 2 ).3 MUESTREO Y DISTRIBUCIONES DE MUESTREO Muestras aleatorias. 5. y Sin embargo. puede tenerse Cov Ú'¡. 6. Si hay dos variables aleatorias. Si y es una variable aleatoria con media fl y varianza if y c es una constante. se tiene 10. 2.2 Cov (yl' Y2) Si Y1 YY2 son independientes. puede demostrarse que si Y1 y Y2 son independientes. 4. E(c) = c E(y) = fl E( cy) = cE(y) = cfl V(c)= O _ V(y) = a 2 V(cy) = c 2V(y) = c 2a 2 a. en general. 3. También puede demostrarse que 9. esta propiedad por sí sola no siempre hace que un estimador sea adecuado. como medida de dispersión. entonces al procedimiento empleado se le llama muestreo aleatorio. suponga queY¡'Y2' .u. En ocasiones se usa S = -JS2. y si cada una de las N!/(N . Un estimador insesgado deberá tener la varianza mínima. Por ejemplo.u es ji" = 18. ' 2.Yn representa una muestra. calculado a partir de los datos muestrales. En la práctica. el parámetro que se está estimando deberá ser el promedio o valor esperado a la larga del estimador puntual. para lo cual pueden ser útiles las tablas de números aleatorios.6 Y la estimación de rJ2 es S2 = 1. Por ejemplo. como la tabla XI del apéndice. Un estadístico se define como cualquier función de las observaciones de una muestra que no contiene parámetros desconocidos. la estimación de . Estas cantidades son medidas de la tendencia central y la dispersión de la muestra. si la población contiene N elementos y va a seleccionarse una muestra de n de ellos. En la inferencia estadística se utilizan profusamente cantidades calculadas a partir de las observaciones de la muestra. El estimador puntual deberá ser insesgado.. se le llama una estimaciÓn. La media y la varianza muestrales se calculan de acuerdo con las ecuaciones 2-7 y 2-8. respectivamente.:1'-n-1 ! (Yi"':' y)2 _ (2-8) son estadísticos. Observe que un estimador puntual es una variable aleatoria. un estimador de un parámetro desconocido es un estadístico que corresponde con dicho parámetro. Al valor numérico particular de un estimador.n)!n! muestras posibles tiene una probabilidad igual de ser escogida. Esta propiedad establece que el estimador puntual de varianza mínima tiene una varianza que es menor que la varianza de cualquier otro estimador del parámetro en cuestión. Dos de las más importantes son las siguientes: 1. En general. Es decir.20. Es decir. llamada la desviación estándar muestral. en ocasiones es difícil obtener muestras aleatorias. Aun cuando la ausencia de sesgo es deseable.20. Un buen estimador puntual debe tener varias propiedades. Entonces la media muestral (2-7) y la varianza muestral S2 = -""i=::... y la varianza muestral S2 es un estimador puntual de la varianza poblacional rJ2.2-3 MUESTREO Y DISTRIBUCIONES DE MUESTREO 27 usan muestras aleatorias. . suponga que quiere estimarse la media y la varianza de la resistencia a la ruptura de un tipo particular de fibra textil.6 YS2 = 1. Propiedades de la media y la varianza muestrales La media muestralji" es un estimador puntual de la media poblacional. obteniéndose ji" = 18. respectivamente. Se prueba una muestra aleatoria de n = 25 ejemplares de prueba de la fibra y se registra la resistencia de cada uno de ellos. Los ingenieros suelen preferir el uso de la desviación estándar para medir la dispersión debido a que se expresa en las mismas unidades que la variable de interés y. Por lo tanto. y)2 ] n-1 donde SS = L~=l (Yi . se tiene er.t2 +a 2 In) (2-10) =(n-1)a 2 E(S2)=_1_ E (SS) n-1 =a 2 y se observa que S2 es un estimador insesgado de er. Considere =~E(~ Yi) 1 =. i=l Yi _ny2 ] 2: (¡..t porque el valor esperado de cada observación Yi es ¡. Al utilizar las propiedades del valor esperado.t n n i=l n i=l =¡..2: ¡.::i=:=.t y primero y. .t.y)2] (2-9) = E[~ = Por lo tanto.2: E(Yi) n 1 =.t2 +a 2)-n(¡. Por lo tanto.:.l (Yi - Y)2] _ n-1 = n~ 1 E[~ =_1_ E (SS) (Yi . Considere ahora la varianza muestral S2.y es un estimador insesgado de ¡.t.y)2 es la suma de cuadrados corregida de las observaciones Yi' Entonces E(SS) = E[~ n (Yi . Se tiene E(S2)= E ! .28 CAPÍTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES Es sencillo demostrar que y y S2 son estimadores insesgados de ¡. respectivamente. si y es una variable aleatoria con varianza if y SS = L(Yi .. z=-a (2-13) fJ. de hecho. . Debido a que las corridas muestrales que difieren como resultado del error experimental a menudo se encuentran descritas adecuadamente en la distribución normal. es decir. < 00 es la media de la distribución y if > Oes la varianza.y)2 en la ecuación 2-9 consiste en la suma de los cuadrados de los n elementos YI . A continuación se revisan brevemente varias distribuciones de muestreo útiles. sólo n -1 de ellos son independientes. Figura 2-5 La distribución normal.fJ. Siy es una variable aleatoria normal. lo cual implica que SS tiene n-1 grados de libertad. A la distribución de probabilidad de un estadístico se le llama la distribución de muestreo. No todos estos elementos son independientes porque L7=1 (Yi .. SS = L7=1 (Yi . Se trata de un resultado muy general. la variable aleatoria Y. Con frecuencia se usa la notación y .2-3 MUESTREO Y DISTRIBUCIONES DE MUESTREO 29 Grados de libertad A la cantidad n -1 de la ecuación 2-10 se le llama el número de grados de libertad de la suma de cuadrados SS. Y2 .N(¡t. Un caso especial importante de la distribución normal es la distribución normal estándar.. Se observa que si y .y)2 tiene v grados de libertad. .N(¡t.y. la distribución de probabilidad de y es f(y) = _1_ e-(1I2)[(Y-I')lu]' a. La distribución normal y otras distribuciones de muestreo En muchas ocasiones la distribución de probabilidad de un estadístico particular puede determinarse si se conoce la distribución de probabilidad de la población de la que se tomó la muestra.y) = O. En la figura 2-5 se ilustra la distribución normal. fJ. Por ejemplo. ésta desempeña un papel fundamental en el análisis de los datos de experimentos diseñados. = O y if = 1. if) para denotar que y sigue una distribución normal con media fJ.y. y varianza if. Una de las distribuciones de muestreo más importantes es la distribución normal. También es posible definir muchas distribuciones de muestreo importantes en términos de variables aleatorias normales. Yn .J2ii -oo<y<oo (2-12) donde -00 < fJ. entonces (2-11) El número de grados de libertad de una suma de cuadrados es igual al número de elementos independientes en dicha suma de cuadrados. es decir.y. if). . En muchos casos esta aproximación es adecuada para valores muy pequeños de n. En muchas técnicas estadísticas se supone que la variable aleatoria sigue una distribución normal. La distribución es asimétrica..[Fn(z)1 cI>(z)] = 1. digamos n > 100.Yn es una sucesión de n variables aleatorias independientes que tienen una distribución idéntica con E(Yi) = ¡t y V(Yi) = rT (ambas finitas) y x = YI + Y2 + '" + Ym entonces zn =.30 CAPÍTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES sigue la distribución normal estándar. por consiguiente. entonces la variable aleatoria ° sigue la distribución ji-cuadrada con k grados de libertad. cuya abreviatura es NID(O. A la operación ilustrada en la ecuación 2-13 suele llamársele la estandarización de la variable aleatoria normaly.1 El teorema clellímite central . digamos n < 10.------:¡ -- x-n¡t vna- tiene una distribución N(O. Zk son variables aleatorias que tienen una distribución normal e independiente con media yvarianza 1. o sesgada. Una importante distribución de muestreo que puede definirse en términos de variables aleatorias normales es la distribución X2 o ji-cuadrada. la distribución normal se convierte en un modelo recomendable para el error experimental combinado. .. TEOREMA 2. 1) aproximada en el sentido de que. 1). 1). Frecuentemente se considera que el error de un experimento surge de una manera aditiva de varias fuentes independientes. SiYI'Y2' ·. denotada z . En la tabla III del apéndice se presentan los puntos porcentuales de la distribución ji-cuadrada. En la tabla I del apéndice se presenta la distribución normal estándar acumulada.. El teorema del límite central es con frecuencia una justificación de la normalidad aproximada. si Fn(z) es la función de la distribución de Zn y cI>(z) es la función de la distribución de la variable aleatoria N(O. Si ZI' Z2' . Este resultado establece en esencia que la suma de n variables aleatorias independientes que tienen una distribución idéntica sigue una distribución aproximadamente normal. entonces límn -+ ". mientras que en otros casos se necesita un valor grande de n. La función de densidad de la distribución ji-cuadrada es x>O (2-14) En la figura 2-6 se ilustran varias distribuciones ji-cuadrada.N(O.. con media y varianza ¡l= k a2 = 2k respectivamente. 1).. . . SS/o2 sigue una distribución ji-cuadrada con n . 02). En la figura 2-7 se ilustran varias distribuciones t. Entonces SS a2 L i=l n (Yi .u = OY02 = k/(k . Al examinar la ecuación 2-8.. cuando una suma de cuadrados de variables aleatorias normales se divide por 02 sigue la distribución ji-cuadrada. Como un ejemplo de una variable aleatoria que sigue la distribución ji-cuadrada.2) para k> 2. respectivamente.2-3 MUESTREO Y DISTRIBUCIONES DE MUESTREO 31 Figura 2·6 Varias distribuciones ji-cuadrada. El resultado dado en la ecuación 2-15 es de suma importancia y aparece en múltiples ocasiones.Jkiir(k/2) [(t 2 /k)+1r k +I )/2 -oo<t<oo (2-18) y la media y la varianza de t son. la variable aleatoria t k = ---=== ~XUk z (2-17) sigue la distribución t con k grados de libertad.. entonces la distribución de S2 es [o2/(n -1)]X~_I' Porlo tanto. la distribución t se convierte en la distribución normal . la distribución de muestreo de la varianza muestral es una constante multiplicada por la distribución ji-cuadrada si la población tiene una distribución normal. respectivamente. suponga que YI' Y2. 02). denotada tic La función de densidad de t es r[(k+1)/2] 1 f(t)= . Si z y X~ son variables aleatorias independientes normal estándar y ji-cuadrada.y)2 a2 2 - Xn-I (2-15) Es decir. Muchas de las técnicas utilizadas en este libro requieren el cálculo y la manipulación de sumas de cuadrados.1 grados de libertad. Yn es una muestra aleatoria de una distribución N(¡t. se observa que la varianza muestral puede escribirse como (2-16) Si las observaciones de la muestra son NID(¡t. Observe que si k = 00. tU -o tU -o . u = 10 ..f1 t = SI..Jn (2-19) se distribuye como t con n .v=30 0. a2)..1 grados de libertad.32 CAPÍTULO 2 EXPERIMENTOS COMPARATNOS SIMPLES k= ~ (normal) o Figura 2-7 Varias distribuciones t. YX~ son dos variables aleatorias ji-cuadrada independientes con u y v grados de libertad.o e c.r(~)r(~)[(..u=10... Yn es una muestra aleatoria de una distribución N{fl.2 ID o Figura 2-8 Varias distribuciones F... Six es una variable aleatoriaF con u grados de libertad en el numeradoryv grados de libertad en el denominador..u = 4. u = 10 . estándar. 4 6 8 x .u=30 ------.4 -o tU -o D .lu X~ Iv (2-20) sigue la distribución F con u grados de libertad en el numerador y v grados de libertad en el denominador.V =-- X.u = 10. Siy¡....f Z x(u/Z)-l o<x<oo (2-21) :B . entonces el cociente F II. . respectivamente.~ 0.~+1rh)" 0.yz. La última distribución de muestreo que consideraremos es la distribución F. entonces la distribución de probabilidad de x es h x _ (). entonces la cantidad y. En la tabla II del apéndice se presentan los puntos porcentuales de la distribución t. Si X.u=4.6 ~ 0.8 r(T)(. DISEÑOS ALEATORIZADOS Estamos preparados ahora para volver al problema del mortero de cemento portland de la sección 2-1. . Y2nz represente las n z observaciones del segundo nivel del factor.1 Prueba de hipótesis Se retoma ahora el experimento del cemento portland introducido en la sección 2-1. Recuerde que el interés se encuentra en comparar la fuerza de dos formulaciones diferentes: una del mortero sin modificar y una del mortero modificado. En esta sección se examina cómo pueden analizarse los datos de este experimento comparativo simple utilizando procedimientos de prueba de hipótesis e intervalos de confianza para comparar las medias de dos tratamientos. o. . estas dos formulaciones pueden considerarse como dos niveles del factor "formulaciones". entonces 000' (2-22) donde SIZ y S. . YZ nz es una muestra aleatoria de nz observaciones de la segunda. En general...4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS. SiYn. Yln¡ represente las nI observaciones del primer nivel del factor y que YZl. DISEÑOS ALEATORlZADOS 33 En la figura 2-8 se ilustran varias distribuciones F. los datos se consideran como si fueran una muestra aleatoria de una distribución normal.Ylz.2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS. Yln¡ es una muestra aleatoria de nI observaciones de la primera población y SiYZl. En la figura 2-9 se ilustra la situación. Yzz. Nivel 1 del factor Nivel 2 del factor Figura 2-9 La situación del muestreo para la prueba t de dos muestras. En este diseño. son las dos varianzas muestrales. Recuerde que se estaban investigando dos formulaciones diferentes para determinar si difieren en la fuerza de la tensión de adhesión.Y2z. A lo largo de esta sección se supone que se usa un diseño experimental completamente aleatorizado. 2. En la tabla IV del apéndice se presentan los puntos porcentuales de la distribución F..oo. Sea queYn'Y12' . Como un ejemplo de un estadístico que sigue una distribuciónF. 2.4. Se supone que las muestras se sacan al azar de dos poblaciones normales independientes. Este resultado se sigue directamente de las ecuaciones 2-15 y 2-20. suponga que se tienen dos poblaciones normales independientes con varianza común cJ2. Esta distribución es muy importante en el análisis estadístico de experimentos diseñados. . 2.34 CAPÍTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES Un modelo de los datos Con frecuencia los resultados de un experimento se describen con un modelo. Si la hipótesis nula se rechaza cuando es verdadera. Una hipótesis estadística es un enunciado o afirmación ya sea acerca de los parámetros de una distribución de probabilidad o de los parámetros de un modelo. ha ocurrido un error tipo I. A la hipótesis alternativa que se especifica aquí se le llama hipótesis alternativa de dos colas porque sería verdadera si fl1 < fl2 o si fl1 > fl2' Para probar una hipótesis se proyecta un procedimiento para tomar una muestra aleatoria.2. i = 1. y cij es una variable aleatoria normal asociada con la observación ij-ésima. calcular un estadístico de prueba apropiado para después rechazar o no estar en posición de rechazar la hipótesis nula Ha. Se acostumbra hacer referencia a cq como el componente del error aleatorio del modelo. referirse al material suplementario del texto. Las probabilidades de estos dos errores se expresan con símbolos especiales: a = P( error tipo l) = P(rechazar Ha IHa es verdadera) f3 = P( error tipo II) = P( dejar de rechazar Ha IHa es falsa) Potencia = 1. Parte de este procedimiento consiste en especificar el conjunto de valores del estadístico de prueba que llevan al rechazo de Ha.u¡. Yij=fl¡+cij { )'=1'. 2. Puesto que las medias fl1 y fl2 son constantes. en el experimento del cemento portland. Si la hipótesis nula no se rechaza cuando es falsa. Hipótesis estadísticas . . Pueden cometerse dos tipos de errores cuando se prueban hipótesis.z!: fl2 donde fl1 es la fuerza de la tensión de adhesión promedio del mortero modificado y fl2 es la fuerza de tensión de enlace promedio del mortero sin modificar. i = 1. como se acaba de suponer arriba. Para más información acerca de los modelos de los datos. .. se observa directamente a partir del modelo que las Yijson NID(. Al enunciado H a:fl1 = fl2 se le llama la hipótesis nula y aH1:fl1 :. Esto puede enunciarse formalmente como H a :fl1 H 1 : fl1 = fl2 :. a¡). donde El procedimiento general en la prueba de hipótesis es especificar un valor de la probabilidad a del error tipo l. y después diseñar el procedimiento de prueba de tal modo que la probabilidadf3 del error tipo II tenga un valor convenientemente pequeño. La hipótesis refleja alguna conjetura acerca de la situación del problema. Se supone que las C ij son NlD(O. puede pensarse que las fuerzas de la tensión de adhesión promedio de las dos formulaciones del mortero son iguales. a¡). A este conjunto de valores se le llama la región c~ítica o región de re~ chazo de la prueba. ni (2-23) donde Yij es la observaciónj-ésima del nivel i del factor. fl¡ es la media de la respuesta para el nivel i-ésimo del factor. Por ejemplo.z!: fl2 se le llama la hipótesis alternativa.f3 = P(rechazar Ha IHa es falsa) En ocasi5>nes es más conveniente trabajar con la potencia de la prueba. Un modelo estadístico simple que describe los datos de un experimento como el que acaba de describirse es i =1 2 •. se ha cometido un error tipo II. llamada con frecuencia el nivel de significación de la prueba. Si It oI > t alZ. Sin embargo.Z (2-24) o S p JFfl -+lZl lZz dondeYl YYz son las medias muestrales.-v t = Y1 .2 grados de libertad. Y H o se rechazaría si t o < -t a .#z. Por lo tanto. DISEÑOS ALEATORIZADOS 35 La prueba t de dos muestras Considere que puede suponerse que las varianzas de las fuerzas de la tensión de adhesión fueron idénticas para ambas formulaciones del mortero. Por lo tanto.II¡ +112 -Z' Una muestra que produjera un valor de to que estuviera fuera de estos límites sería inusual si la hipótesis nula fuera verdadera y es evidencia de que H o deberá rechazarse.2 grados de libertad. entonces la distribución de Yl . Por lo tanto.II¡+1I2. Si el muestreo se está haciendo de distribuciones normales independientes. A este procedimiento de prueba se le llama generalmente la prueba t de dos muestras.lI1 +112 -z es el punto porcentual a/2 superior de la distribución t con nI + n z .92 kgf / cmZ si = 0. entonces se rechazada H o Y se concluiría que las fuerzas promedio de las dos formulaciones del mortero de cemento portland difieren. se especificaría una hipótesis alternativa de una cola H 1 :#1 > #z YH o sólo se rechazaría si t o > t a.100 Mortero sin modificar 5'z = 17.II¡ +112 -Z Yt alZ.2 Z (2-25) y y son las dos varianzas muestra1es individuales. Entonces el estadístico de prueba que deberá usarse para comparar las medias de dos tratamientos en el diseño completamente aleatorizado es .1)SI nI +(lZz -1)Si +n z . Ahora bien.2 grados de libertad.Z ' Para ilustrar el procedimiento.247 =10 . Observe que a es la probabilidad del error tipo 1 de la prueba.Yz es N[ul . lZlY lZz son los tamaños de las muestras.061 12 z SI = 0. Para determinar si deberá rechazarse H o:¡ll = #z. la distribución de Zo cambia de la normal estándar a la distribución t con nI + lZz . la distribución t con nI + n z . S~ es una estimación de la varianza común ai = = aZ calculada a partir de a.lI¡ +112 -z· Si se desea rechazar H o sólo si #1 es menor que #2' entonces la hipótesis alternativa es H 1:#1 < ¡lz. la distribución de (2-26) s¡ si seríaN(O. al sustituir a con Sp en la ecuación 2-26. Para estos datos. se encuentra que ll Mortero modificado 5'1 = 16. considere los datos del cemento portland de la tabla 2-1. En algunos problemas quizá quiera rechazarse H o únicamente si una de las medias es mayor que la otra.316 11¡ = 10 Sz = 0. se esperaría que 100(I-a) por ciento de los valores de to estén entre -t alZ. describe el comportamiento de t ocuando la hipótesis nula es verdadera. si H o es verdadera. 1).Z ' donde t alZ. se compararía to con la distribución t con lZl + lZz . por consiguiente.76 kgf / cmz S12 = Q. t o de la ecuación 2-24 se distribuye como t ¡ +1I2.Z y. er(l/n 1 + l/n z)]. si se conociera er. Este procedimiento puede justificarse de la siguiente manera.2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS.lI1 +1I2. SZ p = (lZ l. y si H O :#1 = ¡lz fuera verdadera.2 grados de libertad es la distribución de referencia apropiada para el estadístico de prueba too Es decir. 101.13 Puesto que t o = -9.100)+9(0. entonces H o:fl1 = fl2 se rechazaría si el valor numérico del estadístico de prueba to > tO.76-17. o si to < -tO.2 = 0. 18 = -2. no es improcedente concluir que las desviaciones estándar (o las varianzas) poblacionales son iguales.101.025 . 284J fa.3 'iñ "'C ro ij¡ 0.Y2 Sp R1 -+111 11 2 16. 111 +11 2 -2 = 9(0.025 . 18 = -2.O. Al utilizar la ecuación 2-25 se encuentra que S2 p = (111 -l)S{ +(11 2 -l)S. puede usarse la ecuación 2-24 para probar las hipótesis H o :fl1 = fl2 :. Estos límites de la región crítica se ilustran en la distribución de referencia (t con 18 grados de libertad) de la figur:a 2-10. Ysi se elige a = 0.13 < -tO. :B 1l ~ 0.2 = 10 + 10 .025 .1 o -6 -4 o to 2 4 Figura 2-10 La distribución t con 18 grados de libertad con la región crítica ±tO•025 • 18 = ±2.2 = 18.2 "'C "'C :2 ~ "'C 0.284 y el estadístico de prueba es t o = Y1 .081 Sp = 0. .05. Por lo tanto.92 .1Dl.+ fa=-9.101.z!: fl2 H 1 : fl1 Además. 11 1 + 11 2 .061) 10+10.36 CAPÍTULO 2 EXPERIMENTOS COMPARATNOS SIMPLES Puesto que las desviaciones estándar muestrales son razonablemente similares. se rechazaríaHoy se concluiría que las fuerzas de la tensión de adhesión promedio de las dos formulaciones del mortero de cemento portland son diferentes. 18 = 2. 0005.13 del experimento de la formulación del mortero de cemento portland como P = 3. Se acostumbra decir que el estadístico de prueba (y los datos) es significativo cuando se rechaza la hipótesis nula. al darse los resultados de esta manera se les impone a otros usuarios de la información el nivel de significación predefinido. Para evitar estas dificultades. En términos más formales. por consiguiente. El programa también prueba la hipótesis de interés.13 > 3.05 en este caso). 18 = 3. A continuación se indicará cómo obtener una aproximación del valor P para el experimento del mortero de cemento portland. Por la tabla II del apéndice. Ilo I = 9. Observe que la salida incluye algunos estadísticos concisos acerca de las dos muestras (la abreviatura "SE Mean" ["SE media"] se refiere al error estándar de la media.05. Este enfoque puede ser insatisfactorio porque algunos responsables de la toma de decisiones podrían sentirse incómodos con los riesgos que implica el valor a = 0. el responsable de la toma de decisiones puede llegar a una conclusión con cualquier nivel de significación especificado.922. s / J1i. DISEÑOS ALEATORIZADOS 37 El uso de valores P en la prueba de hipótesis Una manera de reportar los resultados de una prueba de hipótesis es estableciendo que la hipótesis nula fue rechazada o no para un valor de a o nivel de significación específico. y pueden obtenerse también en algunas calculadoras portátiles. así como alguna información sobre los intervalos de confianza para la diferencia en las dos medias (los cuales se revisan en las secciones 2-4.68 X 10-8.05. permitiendo que el analista especifique la naturaleza de la hipótesis alternativa ("not =" ["no ="] significa H 1:f-l1 :t: f-l2) Y la elección de a (a = 0. Sin embargo la mayoría de los programas de computación modernos para realizar análisis estadísticos reportan valores P. la probabilidad menor en el área de la cola es 0.0005) = 0. El valor P es la probabilidad de que el estadístico de prueba asuma un valor que sea al menos tan extremo como el valor observado del estadístico cuando la hipótesis nula Ha es verdadera. Observe que el valor calculado del estadístico l difiere ligeramente del valor que se calculó manualmente aquí y que el valor P que se reporta es P = 0.0005. ya que la hipótesis alternativa es de dos colas. Algunas calculadoras portátiles tienen la capacidad para calcular valores P. En la tabla 2-2 se presenta la salida del procedimiento para la prueba l de dos muestras de Minitab aplicado al experimento de la formulación del mortero de cemento portland.2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS.0000. Mu- . Ahora bien.3 y 2-6). Una de ellas es la HP-48. Solución por computadora Hay muchos paquetes de software de estadística que cuentan con la capacidad para probar hipótesis estadísticas. un valor P transmite mucha información acerca del peso de la evidencia en contra de Ha y. No siempre es sencillo calcular el valor P exacto de una prueba.). el valor P se define como el nivel de significación menor que llevaría a rechazar la hipótesis nula Ha. Utilizando esta calculadora se obtiene el valor P para el valor lo = -9.68 X 10-8• Por lo tanto. se sabe que el valor P debe ser menor que 2(0. el valor P (llamado el nivel de significación) y la decisión que debería tomarse dado el valor especificado de a. Una vez que se conoce el valor P. Además. La salida incluye el valor calculado de lo. en el experimento del mortero de cemento portland anterior puede decirse que H O :f-l1 = f-l2 se rechazó con el nivel de significación 0. por lo tanto.922. de donde.001. el responsable de la toma de decisiones puede determinar la medida en que los datos son significativos sin que el analista de los datos imponga formalmente un nivel de significación preseleccionado. el valor P puede considerarse como el menor nivel a en el que los datos son significativos. para la cual lO. Por lo tanto. en la práctica se ha adoptado extensivamente el enfoque del valor P. para una distribución l con 18 grados de libertad. Por ejemplo. Esta enunciación de las conclusiones es con frecuencia inadecuada porque no le ofrece al responsable de la toma de decisiones idea alguna de si el valor calculado del estadístico de prueba apenas rebasó la región de rechazo o si se adentró bastante en la misma. la hipótesis nula Ho:f-l 1 = f-l2 se rechazaría con cualquier nivel de significación a 2:: 3. se seleccionan al azar otras unidades y materiales experimentales)..248 SE Mean 0. la graficación de probabilidades es una técnica para determinar si los datos muestrales se ajustan a una distribución hipotetizada con base en un examen visual subjetivo de los datos. este supuesto por lo general se satisfará. conY(Il) la mayor. y que las observaciones son variables aleatorias independientes. se ha trazado en medio de los pun- . En el material suplementario del texto se analiza la construcción manual de las gráficas de probabilidad normal.0001 y en su lugar presentan un valor "por omisión". que las desviaciones estándar o las varianzas de ambas poblaciones son iguales.. El procedimiento general es muy simple y puede realizarse rápidamente con la mayoría de los paquetes de software de estadística.Yz.5)/n en la escala vertical izquierda (yen ocasiones se muestra 100[1. La escala de la frecuencia acumulada se ha dispuesto de tal modo que si la distribución hipotetizada describe de manera adecuada los datos... La mayoría de las gráficas de probabilidad normal muestran 100(j . de ser apropiado. El supuesto de independencia es crítico.885) 95% el for mu Modified t-Test mu Modified = mu Unmod (vs not =): T = -9.309 0.16 p = 0.O.5)/n] en la escala vertical derecha). Algunas gráficas de probabilidad normal convierten la frecuencia acumulada en un valor z normalizado. Es decir. . y así sucesivamente.O. la muestraYl. En general. si los puntos graficados muestran una desviación significativa de una recta.(j .411. con el valor de la variable graficado en la escala horizontal. el modelo hipotetizado no es apropiado.774 17. -0. elegida de manera subjetiva. En la figura 2-11a se ilustra una gráfica de probabilidad normal generada por computadora. Para ilustrar el procedimiento.Y(n)' donde Y(1) es la observación menor'Y(2) es la segunda observación menor. . Las observaciones ordenadas Y(í) se grafican entonces contra sus respectivas frecuencias acumuladas observadas (j . Para construir una gráfica de probabilidad. Una línea recta. primero se ordenan de menor a mayor las observaciones de la muestra.280 chos paquetes de software no reportarán un valor P real menor que 0. Inicialmente sólo se consideran las observaciones de la formulación del mortero sin modificar.078 mu Unmod: (-1. los puntos graficados estarán aproximadamente sobre una línea recta. Éste es el caso aquí. suponga que quiere verificarse el supuesto de que la fuerza de la tensión de adhesión en el experimento de la formulación del mortero de cemento portland sigue una distribución normal. determinar si los datos graficados pertenecen o no a una recta es una decisión subjetiva.098 0.5)/n.. Verificación de los supuestos en la prueba t Para utilizar el procedimiento de la prueba t se establecen los supuestos de que ambas muestras se toman de poblaciones independientes que pueden describirse con una distribución normal. Generalmente. pero si el orden de las corridas está aleatorizado (y. Los supuestos de la igualdad de las varianzas y la normalidad son fáciles de verificar utilizando una gráfica de probabilidad normal.922 StDev 0.0.Yn se ordena como Y(1)'Y(2)' .0000 DF = 18 Both use Pooled StDev = 0.38 CAPÍTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES Tabla 2-2 Prueba t de dos muestras usando Minitab para el experimento del mortero de cemento portland Prueba t de dos muestras e intervalo de confianza Two sample T for Modified vs Unmod N Mod i·f i ed Unmod 10 10 Mean 16. se concluye que la distribución normal es un modelo apropiado para la fuerza de la tensión de adhesión del mortero sin modificar. Ambas rectas tienen pendientes muy si- . se concluiría que es razonable el supuesto de una distribución normal. Puesto que los puntos de la figura 2-11a pasarían la prueba del lápiz grueso. entonces una distribución normal describe de manera adecuada los datos. Al trazar la línea recta.9 r-r--.--.--.--. 99 95 80 50 20 5 :i u ro ro E :o ro ro c: ro "O E o :c ro .1 16.2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS.--.--. Esto significa que el supuesto de la igualdad de las varianzas poblacionales en el experimento del cemento portland puede verificarse comparando las pendientes de las dos rectas de las figuras 2-lla y 2-llb. imagine un lápiz grueso colocado sobre la recta.1 Fuerza de la tensión de adhesión a) Mortero sin modificar o o ~ "O _ 99. DISEÑOS ALEATORIZADOS 39 o ro ro u 99. Así se determinó la recta de la figura 2-11a. Si este lápiz imaginario cubre todos los puntos. La media se estima como el percentil50 de la gráfica de probabilidad y la desviación estándar se estima como la diferencia entre los percentiles 84 y 50.--.o O- 32 ~ 0.9 99 95 80 50 20 5 ~ ~ "O :i ro E :o ro "O E o c: ro :a ro .--. tos graficados. Para evaluar la "proximidad" de los puntos a la línea recta.5 16. En la figura 2-11b se presenta la gráfica de probabilidad normal para las 10 observaciones de la fuerza de la tensión de adhesión del mortero modificado.¡-.--.--. Es posible obtener una estimación de la media y la desviación estándar directamente de la gráfica de probabilidad normal.9 Fuerza de la tensión de adhesión b) Mortero modificado Figura 2-11 Gráficas de probabilidad normal de la fuerza de la tensión de adhesión eu el experimento del cemento portland.7 16.o o ~ • c:: 0.--.3 16. De nueva cuenta. uno deberá guiarse más por los puntos de la parte media de la gráfica que por los puntos extremos. Una buena regla empírica es trazar la recta aproximadamente entre los puntos de los cuartiles 25 y 75.----r---r---r---r---r--¡--¡--¡--. Cuando ocurren violaciones importantes de los supuestos. Por lo tanto. se afectará el desempeño de h. las desviaciones moderadas de la normalidad no afectarán seriamente los resultados.é #2 Yque las medias no son iguales. por lo que o = #1 -#2' Puesto que H O :#1 = #2 no es verdadera. es adecuado para verificar el supuesto de normalidad. es más fácil detectar una diferencia especificada en las medias para tamaños grandes de la muestra que para los tamaños pequeños. . El error f3 también es una función del tamaño de la muestra. de la prueba. En general. Ésta es una de las razones por las que un procedimiento simple.756 posibles arreglos.4.é #2' A este tipo de procedimiento se le llama prueba de aleatorización. En resumen. También es posible utilizar procedimientos no paramétricos para la prueba de hipótesis cuando las observaciones provienen de poblaciones no normales. Es decir. Un recurso para resolver este problema son las transformaciones. A una gráfica de /3 contra opara un tamaño particular de la muestra se le llama la curva de operación característica. ver Box. deberá usarse la versión de la prueba t que se describe en la sección 2-4. pero no deberá ignorarse cualquier falla del supuesto de independencia. Puede argumentarse (por ejemplo. En general. por lo que el supuesto de la igualdad de las varianzas es razonable. como ya se mencionó.756 valores posibles. las violaciones de pequeñas a moderadas no son motivo de preocupación particular. Este tema se analiza con mayor detalle en el capítulo 3. se usarán aquí pruebas t (y otros procedimientos que pueden considerarse aproximaciones de pruebas de aleatorización) sin prestar demasiada atención al supuesto de normalidad. La probabilidad del error tipo 11 depende de la verdadera diferencia en las medias o. Aun cuando el supuesto de normalidad es necesario para desarrollar formalmente el procedimiento de prueba.2 Elección del tamaño de la muestra La elección de un tamaño de la muestra apropiado es uno de los aspectos más importantes de cualquier problema de diseño experimental. el error /3 se reduce cuando el tamaño de la muestra se incrementa.756 formas posibles en que podrían ocurrir las 20 observaciones son igualmente posibles. todas las [20!/(1O!l0!)] = 184. Si se viola este supuesto. o curva OC. es una indicación de que #1 :. Si el valor de to que se obtiene en realidad de los datos es inusualmente grande o inusualmente pequeño con referencia al conjunto de los 184. para un valor dado de o. Hay un valor de t o para cada uno de estos 184. el razonamiento es el siguiente. prueba t. la preocupación principal es cometer la equivocación de no rechazar H o. 2~4. La elección del tamaño de la muestra y la probabilidad/3 del error tipo 11 guardan una estrecha relación. como las gráficas de probabilidad normal.40 CAPÍTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES milares. En el material suplementario del texto hay más información acerca de la verificación de los supuestos de la prueba t. Si los tratamientos no tienen ningún efecto. Puede demostrarse que la prueba t es una buena aproximación de la prueba de aleatorización. Tanto el nivel de significación de la prueba como la capacidad para detectar diferencias entre las medias serán afectados adversamente por el incumplimiento de estos supuestos. Una justificación alternativa de la prueba t La prueba t de dos muestras que acaba de presentarse depende en teoría del supuesto fundamental de que las dos poblaciones de las que se seleccionaron las muestras al azar son normales. así como los indicios claros de que no se satisface el supuesto de normalidad. Hunter y Hunter [18]) que el uso de un diseño aleatorizado permite probar hipótesis sin ningún supuesto respecto de la forma de la distribución. Suponga que se están probando las hipótesis H O:#1=#2 H 1 : #1 :. Referirse a Montgomery y Runger [83d] para más detalles. . Las curvas de operación característica son con frecuencia útiles para seleccionar el tamaño de la muestra que debe usarse en un experimento. se observa lo siguiente: Entre más grande sea la diferencia en las medias. Suponga que si las dos formulaciones difieren en la fuerza promedio hasta en 0.L. el tamaño de la muestra usado para construir las curvas es en realidad n * = 211 . (Reproducida con permiso de "Operating Characteristics Curves for the Common Statistical Tests of Significance".---__¡ 0. la probabilidad del error tipo TI se hace más pequeña para una diferencia en las medias y un valor de a dados. es decir. Ferris. El parámetro del eje horizontal de la figura 2-12 es d)fll-fl21=~ 20 20 La división de 1<3 I por 20 permite al experimentador usar el mismo juego de curvas. EE. Weaver. puesto que fll . considere el problema del mortero de cemento portland comentado antes.-t~. para un tamaño de la muestra y un valor de a especificados.é fl2 para el caso en que las dos varianzas poblacionales o~ yo..05. = 0 2 ) Ypara un nivel de significación de a = 0.05.. sería deseable detectarlo con una probabilidad alta. Por ejemplo.1.. nI = n 2 = n.. la prueba detectará con mayor facilidad las diferencias grandes que las pequeñas. c. puede aumentarse la potencia de la prueba incrementando el tamaño de la muestra. Cuando el tamaño de la muestra se hace más grande.fl2 = 1.0 . Es decir.---p.------r-----¡-------r---~--. son desconocidas pero iguales (o~ = o.8 E. Es decir. DISEÑOS ALEATORIZADOS 41 En la figura 2-12 se muestra un juego de curvas de operación característica para las hipótesis H o :fll = fl2 H 1 : fll :.5 kgf/cm2. para detectar una diferencia <3 especificada.) .2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS. independientemente del valor de la varianza (la diferencia en las medias se expresa en unidades de desviación estándar)..-----+_--_¡ d Figura 2·12 Curvas de operación característica para la prueba t de dos colas con a = 0. 2. Al examinar estas curvas. Grubbs y C.--t--~d----¡ 13 J: 0. Por lo tanto.6 "C "C al :5 "C lO O.20 menor será la probabilidad del error tipo TI para un tamaño de la muestra y un valor de a dados. /11 -1.21--IrH!H\---\-\----*--:-~_+~. 1.4I--Hffi-t\-t--\--\--..(. Annals of Mathematical Statistics. Las curvas también parten del supuesto de que los tamaños de las muestras de las dos poblaciones son iguales. ~ lO lO 0.L.. Por otra parte.. Su utilización a este respecto se revisa en capítulos subsecuentes. La interpretación de este intervalo es que si.5=9 2 2 y se usarían los tamaños de las muestras n 1 = n 2 = n = 9. Si quiere rechazarse la hipótesis nula 95% de las veces cuandofll -fl2 = 0.05 Y d = 1 se obtiene n* = 16. entoncesf3 = 0.3 Intervalos de confianza Aun cuando la prueba de hipótesis es un procedimiento útil. 100(1 -a) por ciento de ellos contendrán el verdadero valor de e. se encuentra que d. es necesario encontrar dos estadísticos L y U tales que la declaración de probabilidad P(L::5 e::5 U) = 1. Por lo tanto. en ocasiones no cuenta la historia completa. puesto que n * = 2n . en muestreos aleatorios repetidos.25 2a a Desafortunadamente. A las declaraciones de estos intervalos se les llama intervalos de confianza. el tamaño de la muestra requerido es n= n*+l = 16+1 = 8.25 kgf/cm 2. d incluye al parámetro desconocido a.fl2' Para definir un intervalo de confianza.25 en la expresión anterior para d se obtiene d = 1.a (2-27) sea verdadera. Para obtener una estimación del intervalo de e.25.a) por ciento para el parámetro e. véase Montgomery y Runger [83d]. Quizás el experimentador decidió incrementar ligeramente el tamaño de la muestra a fin de prevenir la posibilidad de que la estimación previa de la desviación estándar común a haya sido demasiado conservadora y quizá fuera un poco mayor que 0. Por lo general el experimentador estaría más interesado en un intervalo de confianza para la diferencia en las medias fll . En el ejemplo que se ha venido considerando.5 kgf/cm2es la diferencia "crítica" en las medias que quiere detectarse. Alos estadísticosL y U se les llama los límites . En m~chos experimentos de ingeniería e industriales.5. Sin embargo. el experimentador sabe de antemano que las medias fll y fl2 difieren. 2~4. es d= Ifl l-fl21= 2a 0.5= 0. Y en la figura 2-12 conf3 = 0. Muchas veces es preferible proporcionar un intervalo dentro del cual cabría esperar que estaría incluido el valor del parámetro o los parámetros en cuestión. el parámetro del eje horizontal de la curva de operación característica de la figura 2-12. la prueba de la hipótesis fll = fl2 es de escaso interés. Entonces al usar a = 0. suponga que e es un parámetro desconocido.05. el experimentador utilizó en realidad un tamaño de la muestra de 10. se construye gran número de estos intervalos. Al intervalo (2-28) se le llama intervalo de confianza de 100(1. por consiguiente. Para un análisis de los usos de las curvas de operación característica en otros experimentos comparativos simples similares a la prueba t de dos muestras. aproximadamente.1. suponga que con base en la experiencia previa se piensa que es altamente improbable que la desviación estándar de cualquiera de las observaciones de la fuerza exceda 0.42 CAPÍTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES 0. Las curvas de operación característica desempeñan con frecuencia un papel importante en la elección del tamaño de la muestra en los problemas de diseño experimental. Es probable que la fuerza media de la formulación sin modificar exceda la fuerza media de la formulación modificada. La estimación real del intervalo de confianza de 95% para la diferenCia en la fuerza de la tensión de adhesión promedio de las formulaciones del mortero de cemento portland se encuentra haciendo la siguiente sustitución en la ecuación 2-30: 16.f.a se le llama el coeficiente de confianza. DISEÑOS ALEATORIZADOS 43 de confianza inferior y superior. Expresado en otros términos.-lz.-lz == Ono está incluida en este intervalo.a) por ciento para la verdadera diferencia de las medias f. El estadístico se distribuye como t /11 +112 -Z' Por lo tanto. El intervalo puede deducirse de la siguiente manera. no se sabe si la declaración es verdadera para esta muestra específica.-lI .92.89 kgf/cmz.43 kgf/cm z a -0.-lz == -1.a) por ciento para f.-lz '5.-lz en el problema del cemento portland. el intervalo de confianza de 95% estimado para la diferencia en las medias se extiende de -1.16 kgf/cm z ± 0.-lI == f.101 )0.-lZ '5. a la ecuación 2-28 se le llama intervalo de confianza de 95% para e.-lz con el nivel de significación de 5%.16-0.16+0.27'5.f. Observe que los intervalos de confianza tienen una interpretación de frecuencia.a) por ciento de las veces.-lI . Suponga que quiere encontrarse un intervalo de confianza de 100(1 . f. 92 + (2.(2. los datos no apoyan la hipótesis de que f.-lI . -0. Observe que como f.-lI-f.2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS.f. el intervalo de confianza es f.05.101)0.27 -1. pero sí se sabe que el método usado para generar el intervalo de confianza produce declaraciones correctas en 100(1 . f. == 1-a (2-29) (2-30) es un intervalo de confianza de 100(1 .f.16 kgf/cmz.43'5.-lz '5.f.-lI . Observe que en la ta- .27 kgflcmz.f.+ fa-1.76-17.27 kgf/cmz. o la diferencia enlasfuerzas promedio es -1.89 Por lo tanto.-lI .-1. respectivamente. es decir.16.284~fa.f.284~fa-+fa-'5. y a 1. y la precisión de esta estimación es de ±0.-lI . Si a == 0.76 -17. z!: /12 pueden probarse utilizando el estadístico z . H o : /11 H 1 : /11 Si se está probando = /12 :. _1_+_nI n2 (2-31) Este estadístico no se distribuye exactamente como t. son iguales.Y Y2 10- 2 2 _1 + _ 2 a a (2-33) nI n2 Si ambas poblaciones son normales. No obstante.4 Caso en que a¡ :. entonces es necesario hacer ligeras modificaciones en la prueba t de dos muestras. la distribución de Zo es N(O. H o : /11 H 1 : /11 Si las varianzas de ambas poblaciones se conocen. H ose rechazaría si IZo I > Za12' donde Zal2 es el punto porcentual a/2 superior de la distribución normal estándar. 1) si la hipótesis nula es verdadera. Por lo tanto.5 Caso en que se conocen a¡ ya. El lector no deberá encontrar problemas para desarrollar una ecuación para encontrar ese intervalo de confianza para la diferencia en las medias en el caso de varianzas desiguales. t es una buena aproximación de la distribución de to si se usa (2-32) para los grados de libertad.44 CAPÍTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES bla 2-2 Minitab también reportó este intervalo de confianza cuando se llevó a cabo el procedimiento de la prueba de hipótesis. En este caso el estadístico de prueba es J\ . Una indicación clara de la desigualdad de las varianzas en una gráfica de probabilidad normal sería una situación que requeriría esta versión de la prueba t. 2~4. o si los tamaños de las muestras son lo suficientemente grandes para aplicar el teorema del límite central. 2~4.z!: /12 y no hay bases para suponer que las varianzas a~ ya. la región crítica se encontraría utilizando la distribución normal en lugar de la distribución t.Y2 S2 S. entonces las hipótesis = /12 :. Específicamente. .z!: a. o si la población no es normal pero el tamaño de la muestra es lo suficientemente grande para aplicar el teorema del límite central. el fabricante aceptará el lote. El intervalo de confianza de 100(1-a) por ciento para#l-#Z cuando las varianzas se conocen es (2-34) Como ya se señaló. El fabricante desea saber si la resistencia a la ruptura promedio excede 200 psi.1 (2-36) . conocimientos o experimentación previos.Jii EJEMPLO 2. Por lo tanto. La experiencia pasada indica que un valor razonable para la varianza de la resistencia a la ruptura es 100(psif Las hipótesis que deberán probarse son HO:Jl = 200 H 1 : # > 200 Observe que se trata de una hipótesis alternativa de una cola. 2. entonces la hipótesis puede probarse utilizando una aplicación directa de la distribución normal.6 Comparación de una sola media con un valor especificado Algunos experimentos incluyen la comparación de la media# de una sola población con un valor especificado. el lote se aceptaría sólo si la hipótesis nula H o:# = 200 pudiera rechazarse (es decir. 2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS. Por lo tanto. por ejemplo #0. El estadístico de prueba es Z .Jii :5 # :5 y+ ZalZ a / .r 1: i: l: 1. el intervalo de confianza es con frecuencia un complemento útil del procedimiento de prueba de hipótesis. si Zo > Za). El intervalo de confianza de 100(1 .Y-#o 0- a/. De ser así. DISEÑOS ALEATORIZADOS 45 A diferencia de la prueba t de las secciones anteriores. puede ser resultado de especificaciones contractuales.a) por ciento para la verdadera media poblacional es Y.Jii (2-35) Si H o:# = #0 es verdadera. entonces la distribución de Zo es N(O.é. . #0 Si la población es normal con varianza conocida. El valor de la media #0 especificado en la hipótesis nula se determina por lo general mediante una de las tres formas siguientes. Las hipótesis son H o:# = #0 H 1 :W:.ZalZ a /.4. Un proveedor ofrece lotes de tela a un fabricante de textiles. la regla de decisión para H o:# = #0 es rechazar la hipótesis nula si IZo I > ZaIZ.YZ. 1). Puede aplicarse el teorema del límite central para justificar una distribución normal aproximada para la diferencia en las medias muestrales Yl . en la prueba de las medias con varianzas conocidas no se requiere el supuesto de que el muestreo se haga de poblaciones normales. Puede ser resultado de alguna teoría o modelo que describe la situación bajo estudio. Por último. Puede ser resultado de evidencia. Se seleccionan cuatro ejemplares aleatoriamente.1l-1' donde ta/2.#0 o-a/.Jii 10/.80 a /. se obtiene el estadístico de prueba t _Y-f1o 0- 5/.Jii (2-37) La hipótesis nula H o:1-1 = f10 se rechazaría si Ito I > ta /2. en la tabla 1 del apéndice se encuentra que Za = ZO.f10 = 214.46 ji CAPÍTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES = 214 psi.7 Resumen En las tablas 2-3 y 2-4 se resumen los procedimientos de prueba estudiados aquí para las medias muestrales.. Se muestran las regiones críticas para hipótesis alternativa tanto de una como de dos colas.Jñ Zo < -Za H o:#¡ = Jlz H¡:#z ~ #z H o:#¡ = #z H¡:Jl¡ < #z H o:#¡ = #z H¡:#¡ > Jlz . se usa la varianza muestral 52 para estimar if.200 = 2. Por lo tanto.05.645. aunque las desviaciones moderadas de la normalidad no afectarán seriamente los resultados. Para probar H o:f1 = f10 en el caso de la varianza desconocida.1l-1 denota el punto porcentual a/2 superior de la distribución t con n -1 grados de libertad.y . Al sustituir a con 5 en la ecuación 2-35. El intervalo de confianza de 100(1-a) por ciento es en este caso (2-38) 2~4. Cuando no se conoce la varianza de la población. Tabla 2-3 Pruebas para medias con varianza conocida Hipótesis H O:# = #0 Estadístico de prueba Criterios de rechazo H¡:# ~ #0 H o:# = #0 H¡:Jl < #0 H o:# = #0 H¡:#> #0 Z .J4 Si se especifica un error tipo 1 de a = 0. es necesario establecer el supuesto adicional de que la población sigue una distribución normal.05 = 1. y la resistencia a la ruptura promedio observada es El valor del estadístico de prueba es Z o = y. H ose rechaza y se concluye que la resistencia a la ruptura promedio del lote excede 200 psi. 1 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS. Puesto que se trata de un diseño completamente aleatorizado. Al medir la profundidad de la depresión producida por la punta. Podrían seleccionarse al azar varios ejemplares de prueba del metal (por ejemplo. La mitad de estos ejemplares de prueba podrían probarse con la punta 1 y la otra mitad con la punta 2. Sería posible realizar un experimento de la siguiente manera. / Il¡f + (Si / /2z)Z Il¡ -1 /2z-1 2. se descubriría una seria desventaja del diseño completamente aleatorizado en este problema.n-¡ t = o S p R1 y¡ -yz Il¡ -+/2z V =Il¡ + /2z-2 Ho:/-l¡ = flz H¡:/-l¡ < flz Ho:/-l¡ = /-lz H¡:/-l¡ > /-lz v = (S.5. DISEÑOS DE COMPARACIONES PAREADAS El problema de las comparaciones pareadas En algunos experimentos comparativos simples puede conseguirse un mejoramiento significativo de la precisión haciendo comparaciones de observaciones pareadas del material experimental. varianza desconocida Hipótesis Ho:/-l = /-lo H¡:/-l ~ /-lo Ho:/-l = /-lo H¡:/-l < /-lo Ho:fl = /-lo H¡:/-l> /-lo Ho:/-l¡ = flz H¡:fl¡ ~ /-lz Estadístico de prueba Criterios de rechazo t .r 2-5 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS.Jii t < o - t a.5 2.Ji -/-lo o . considere una máquina para probar la dureza que presiona una barra con una punta afilada sobre un ejemplar de prueba de metal con una fuerza conocida. la dureza promedio de las dos muestras podría compararse utilizando la prueba t descrita en la sección 2-4.S / . 20). DISEÑOS DE COMPARACIONES PAREADAS 47 Tabla 2-4 Pruebas para medias de distribuciones normales. Por ejemplo. Suponga que los ejemplares de prueba del metal se cortaron de barras di- . La asignación exacta de los ejemplares a las puntas se determinaría de manera aleatoria. En esta máquina pueden instalarse dos puntas diferentes y aun cuando la precisión (la variabilidad) de las mediciones hechas con las dos puntas parece ser la misma. Al reflexionar un poco al respecto. se determina la dureza del ejemplar de prueba. se sospecha que una de las puntas produce diferentes lecturas de la dureza que la otra. dj = Y1j /1d Y2j j = 1. haciendo más difícil detectar una diferencia real entre las puntas. Observe que si se calcula la diferencia pareada j-ésima a¡ . Suponga que cada ejemplar de prueba tiene el tamaño suficiente para que puedan hacerse en él dos determinaciones de la dureza. es la varianza de las mediciones el error experimental aleatorio con media cero y varianza de la dureza hechas con la punta 1 ya. para después asignar de manera aleatoria una punta a una mitad de cada ejemplar de prueba y la otra punta a la otra mitad. y sij es Es decir. Este diseño alternativo consistiría en dividir cada ejemplar de prueba en dos secciones. Para protegerse de esta posibilidad. cuando se llevó a cabo de acuerdo con este diseño con 10 ejemplares de prueba. 10 (2-40) el valor esperado de esta diferencia es = E(d j ) = E(Y1j - Y2j ) = E(Y1j). es la varianza de las mediciones de la dureza hechas con la punta 2. El orden en que se prueban las puntas en un ejemplar de prueba particular se seleccionaría al azar.E(Y2j) = /11 + {3 j . El experimento. a. Un modelo estadístico que describe los datos de este experimento puede expresarse como i =1 2 Yij = /1¡ +{3j +sij { j= 1: 2.. considere un diseño experimental alternativo.{3j es un efecto sobre la dureza debido al ejemplar de pruebaj-ésimo.48 CAPÍTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES ferentes que se fabricaron a temperaturas diferentes o que no fueran exactamente homogéneos en cualquier otra forma que pudiera afectar la dureza. Esta falta de homogeneidad entre los ejemplares contribuirá a la variabilidad de las mediciones de la dureza y tenderá a inflar el error experimental.. oo./12 haciendo inferencias acerca de la media de las diferencias /1d' Observe que el efecto adi- Tabla 2-5 Datos del experimento de la prueba de la dureza Ejemplar de prueba Punta 1 Punta 2 176 233 3 3 5 443 588 632 724 8 9 9 954 10 4 5 . 2. produjo los datos (codificados) que se muestran en la tabla 2-5. pueden hacerse inferencias acerca de la diferencia en las lecturas de la dureza promedio de las dos puntas /11 . 10 (2-39) donde Yij es la observación de la dureza para la puntai en el ejemplar de pruebaj. oo./1¡ es la verdadera dureza promedio de la punta i-ésima.(/12 + {3 j ) =/11-/12 Es decir. 10 = 1.8= O Por lo tanto.= d .JIO =-0.1.2= 1 d 1 = 7. Entonces. a este procedimiento suele llamársele prueba t pareada.10 10 _ Sd - [~ d.20 Suponga que se elige a = 0.n-l' Debido a que las observaciones de los niveles del factor están "pareadas" en cada unidad experimental. DISEÑOS DE COMPARACIONES PAREADAS 49 tivo de las f3j de los ejemplares de prueba se cancela cuando las observaciones están pareadas de esta manera. _ 1 d=n 2: d j=l 11 j 1 =-(-1)=-0. se encuentra d 6 = 3.05..(-l)Z ]1IZ = 10-1 10 = 1.Jii -0. Probar H o:/11 = /1z es equivalente a probar H o :/1d = O H 1:/1d # O El estadístico de prueba para esta hipótesis es (2-41) donde es la media muestral de las diferencias y Sd = r t (dj_d)z]l/Z }-1 [! }=1 Z d:-!(! dj)Z]l/ n }=1 (2-43) n-1 = n-1 es la desviación estándar muestral de las diferencias.20/ .2-5 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS.3= O d 3 =3-5=-2 d 4 =4-3=1 d 7 =2-4=-2 d s =9-9=0 d g =5-4=1 d lO = 4-5=-1 d s = 8.6= 1 dz = 3. H o: /1d = Ose rechazaría si ItoI > talZ.262. 9 = 2. -~(~ n-1 di 1']1IZ [13-. para tomar una decisión se calcularía toYH o se rechazaría si ItoI > tO. Por los datos de la tabla 2-5.025 .26 = -----. El valor calculado del estadístico de prueba t pareada es t o Sd/. Observe que el valor P para esta prueba es P=O. 9 = 2.262.50 CAPÍTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES "C :s jg o "C "C "C '¡ji <ti ~ 0.798 . El término bloque se refiere a una unidad experimental relativamente homogénea (en el caso tratado aquí.379 95% el for mean difference: (-0.706 0. En dicho capítulo el modelo matemático del diseño.025 . no hay evidencia que indique que las dos puntas producen lecturas de la dureza diferentes. el cual ilustra el principio de la formación de bloques comentado en la sección 1-3. la distribución de referencia para esta prueba.800 4.26 P-Value = 0. los ejemplares de prueba del metal son los bloques).757 0.2 0.394 2. la hipótesis Ho:fld = Ono puede rechazarse. De hecho. En la tabla 2-6 se muestra la salida de computadora del procedimiento para la prueba t pareada de Minitab para este problema.3 ~0. 2~5. Es decir. y el bloque representa una restricción sobre la aleatorización completa debido a que las combinaciones de los tratamientos sólo se aleatorizan dentro del bloque.956.197 SE Mean 0.2 Ventajas del diseño de comparaciones pareadas Al diseño que se utilizó en realidad para este experimento se le llama diseño de comparaciones pareadas.261> t O.900 -0. En la figura 2-13 se muestra la distribución de to con 9 grados de libertad. En el capítulo 4 se examina este tipo de diseños.SO. lo cual implica que no puede rechazarse la hipótesis nula con ningún nivel de significación razonable.234 1 . Tabla 2-6 Resultados de Minitab de la prueba t pareada para el ejemplo de la prueba de la dureza Prueba t pareada e intervalo de confianza Pair~d T for Tip 1 . 0. con el valor de t o indicado en relación con la región crítica. se escribe en una forma ligeramente diferente. es un caso especial de un tipo de diseño más general llamado diseño de bloques aleatorizados.756) t-Test of mean difference = O (vs not = O): T-Value = -0.1 :¡¡ Cl -6 -4 y como Ita I = 0.100 StDev 2.Tip 2 N Tip 1 Tip 2 Difference 10 10 10 Mean 4. la ecuación 2-39. realidad n -1 grados de libertad. Esto ilustra la propiedad de reducción del ruido de la formación de bloques. Utilizando los datos pareados. se cuenta únicamente con n .32)~to+to -0. 2~6 INFERENCIAS ACERCA DE LAS VARIANZAS DE DISTRIBUCIONES NORMALES En muchos experimentos.32. un intervalo de confianza de 95% para.1 grados de libertad y llevará en realidad a un intervalo de confianza con una anchura mayor para.18 El intervalo de confianza basado en el análisispareado tiene una anchura sensiblemente menor que el intervalo de confianza del análisis independiente.20)/ ..ul -flz.JIO -0. en algunos experimentos es la comparación de la variabilidad en los datos lo que es importante.4.ul . se observa que la formación de bloques o pareo ha reducido la estimación de la variabilidad en cerca de 50%.. La formación de bloques no es siempre la mejor estrategia de diseño.262)(1. la prueba se hace más sensible.1 = 9 grados de libertad para el estadístico t. pero se espera haber ganado un mejor conocimiento de la situación al eliminar una fuente adicional de variabilidad (la diferencia entre los ejemplares de prueba). por ejemplo. es necesario destacar varios puntos. la formación de bloques en esta situación sería una elección de diseño pobre porque la formación de bloques produce la pérdida de n .uz es 4.uz. Al utilizar los datos de la tabla 2-5 como dos muestras independientes. Sin embargo.20.) Al hacer la formación de bloques o pareo. De hecho. En la industria de alimentos y bebidas. es importante que la variabilidad del equipo de llenado sea pequeña para que todos los empaques estén cerca del peso neto nominal o el .90±(2. la desviación estándar combinada que se calcula con la ecuación 2-25 es Sp = 2.10±(2.86 Recíprocamente. Puede obtenerse unaindicación de la calidad de la información producida por el diseño pareado comparando la desviación estándar Sd de las diferencias con la desviación estándar combinada Sp que habría resultado si el experimento se hubiera conducido de manera completamente aleatorizada y se hubieran obtenido los datos de la tabla 2-5. Esta información también puede expresarse en términos de un intervalo de confianza para. (Se sabe que conforme se incrementan los grados de libertad para t.101 )(2. Observe que.. la varianza de Yl -Yz será la misma independientemente del diseño que se use. el interés se encuentra en las posibles diferencias en la respuesta media de dos tratamientos.2-6 INFERENCIAS ACERCA DE LAS VARIANZAS DE DISTRIBUCIONES NORMALES 51 Antes de dejar este experimento.80.uz es -0. aun cuando se han hecho 2n = 2(10) = 20 observaciones. un intervalo de confianza de 95% para. se han "perdido" en. al utilizar el análisis combinado o independiente. Si la variabilidad dentro de los bloques es la misma que la variabilidad entre los bloques. En el capítulo 4 se ofrece una revisión más amplia de la formación de bloques. Al comparar este valor con Sd = 1.ul .ul .10±2.1O±0. A continuación se examinan brevemente las pruebas de hipótesis y los intervalos de confianza para las varianzas de distribuciones normales.n-1' donde X~/2. o~. los procedimientos para las pruebas de varianzas son bastante más sensibles al supuesto de normalidad.Il¡-1. En la tabla 2-7 se presentan las regiones críticas para las hipótesis alternativas de una cola.. por ejemplo.n-l y XL(a/2).1 grados de libertad. Si se toman muestras aleatorias independientes de tamaño 12 1 y 12 2 de las poblaciones 1 y 2. Suponga que quiere probarse la hipótesis de que la varianza de una población normal es igual a una constante.1l-1 Considere ahora la prueba de la igualdad de las varianzas de dos poblaciones normales. El intervalo de confianza de 100(1 .é 2 (2-44) o~ El estadístico de prueba para la ecuación 2-44 es (2-45) donde SS = 2:7=1 (y¡ . tal vez quiera compararse la variabilidad de dos métodos de análisis. Expresado en términos formales. En los laboratorios químicos.n¡-1.1 grados de libertad. respectivamente. En el apéndice 2A de Davies [36] hay un buen análisis del supuesto de normalidad.1 O si Fa < F1-(a/2).n-l o si X ~ < X~-(a/2).1 YF1-(a/2). La distribución de referencia apropiada para X ~ es la distribución ji-cuadrada con 12 .1l2.1 ' donde Fa/2 .1l1 -1.a. quiere probarse H O:0 =o~ H 1 :0 2 .a) por ciento para if es (12-1)S2 < ? X~/2.n-l son los puntos porcentuales a/2 superior y 1 . La hipótesis nula se rechaza si X~ > X~/2.n2.1l-1 -o _ 2 < (12-1)S2 ? (2-46) Xi"-(a/2).v] (2-49) . respectivamente. el estadístico de prueba para H O''02 1 ? 2 0 2 ? (2-47) H l:°i". La hipótesis nula se rechazaría si Fa > Fa/2 . En la tabla IV del apéndice sólo aparecen los puntos porcentuales para la cola superior de F. A diferencia de las pruebas para las medias.(a/2) inferior de la distribución ji-cuadrada con 12 .vl'V2 = F.52 CAPÍTULO 2 EXPERIMENTOS COMPARATNOS SIMPLES volumen del contenido neto nominal.1l2.Il¡-1.v2 .n2. los puntos de las colas superior e inferior se relacionan por 1 F:l-a. sin embargo.é°í es el cociente de las varianzas muestrales (2-48) La distribución de referencia apropiada para Fa es la distribuciónF con 12 1 -1 grados de libertad en el numerador y 12 2 -1 grados de libertad en el denominador.(a/2) inferior de la distribuciónF con 12 1 -1 Y12 2 -1 grados de libertad.y)2 es la suma de cuadrados corregida de las observaciones muestrales.1 denotan los puntos porcentuales a/2 superior y 1. . El ingeniero sospecha que el equipo antiguo. por lo que no puede rechazarse la hipótesis nula... Ho:a: = a..fI-¡ Xo = > X~/2.. H¡:a: < a.... >a. 9 = 3. sI > a..a) por ciento para el cociente de las varianzas poblacionales es (2-50) .5 Y si = 10... tiene una varianza mayor que la del equipo nuevo. .os. si Fa > ~/2'fll-¡''''-¡ o Fa < F..'1l-¡.. tipo 1.-aI2.r 2-6 INFERENCIAS ACERCA DE LAS VARIANZAS DE DISTRIBUCIONES NORMALES I ¡ ¡ 53 ¡ ! Tabla 2-7 Pruebas para las varianzas de distribuciones normales Hipótesis 2 H o:a2 = a 0 Estadístico de prueba Criterios de rechazo X(j ? H¡ :a 2 :.3.34 2 si 10.. . Se revisará también el uso de la varianza o la desviación estándar como variable de respuesta en situaciones experimentales más generales... quiere probar las hipótesis H a''a2 1 H1 :a. se analizan los procedimientos de prueba para más de dos varianzas.. y las varianzas muestrales son S12 14. 11. El intervalo de confianza de 100(1 ..fI-¡ H o:a2 = a~ H¡ :a 2 X~ > X~'fI-¡ R = S¡2 o Ho:a: = a. Es decir.8 En la tabla IV del apéndice se encuentra que Fa. Un ingeniero químico investiga la variabilidad inherente de dos tipos de equipo de prueba que pueden usarse para monitorear la producción de un proceso. /a. EJEMPLO 2~2 .. Por lo tanto.. =a 2 2 = Se toman dos muestras aleatorias de 11 1 = 12 Y11 2 = 10 observaciones. a. El estadístico de prueba es F a = S1 = 14.fI-¡ ? o H o:a2 = a~ H¡:a 2 en -1 )S2 a2 o < a~ > a~ X~ < X:-a.. se ha encontrado evidencia estadística insuficiente para concluir que la varianza del equipo antiguo sea mayor que la varianza del equipo nuevo. H¡ :a: :......fI....5 = 1..é a~ 2 X~ < X:-a/2.....8. H¡:a: Ro=~ s.é a....-¡ Ho:a: = a... sección 3-4.10... En el capítulo 3. La experiencia pasada indica que la desviación estándar de la resistencia a la ruptura es o = 3 psi.975 .11 = 3. b) Probar estas hipótesis utilizando a = 0.59 Y F O.05. a) Quiere demostrarse que la vida media de anaquel excede los 120 días. La vida de anaquel de una bebida carbonatada es motivo de interés.54 .255 pulgadas. ¿A qué conclusiones se llega? e) Encontrar el valor P para la prueba del inciso b.9 = 1/3. Los diámetros de las flechas de acero producidas en cierto proceso de manufactura deberán tener un promedio de 0.01. b) Probar estas hipótesis utilizando a = 0.0. Encontrar el tamaño de la muestra que se necesita para construir un intervalo de confianza de 95% para la media. O 14. Se sabe que el diámetro tiene una desviación estándar de a = 0. y los resultados son Y¡ = 145. 9. 2-5.05.92 = 0. Supuestamente. d) Construir un intervalo de confianza de 95% para la resistencia a la ruptura promedio. obteniéndose los siguientes resultados: Días 108 124 124 106 115 138 163 159 134 139 2-1.59) 10.9. ¿A qué conclusiones se llega? e) Encontrar el valor P para esta prueba. a) Enunciar las hipótesis que deberán probarse.5 (3. el intervalo de confianza de 95% para el cociente de las varianzas .0001 pulgadas.8 o~ O2 :5 14. 2-4. ¿A qué conclusiones se llega? e) ¿Cuál es el valor P para la prueba? d) Encontrar un intervalo de confianza de 95% para la media. Suponga que se sabe que la desviación estándar de la viscosidad es a = 25 centistokes. 2-2. d) Construir un intervalo de confianza de 95% para el diá. utilizando F Para ilustrar el uso de la ecuación 2-50.255):5 10. la viscosidad de un detergente líquido debe promediar 800 centistokes a 25°C.l1.metro promedio de las flechas. Yz = 153. Una muestra aleatoria de 10 flechas tiene un diámetro promedio de 0.255.5 (0.2545 pulgadas. Se prueba una muestra aleatoria de cuatro ejemplares de prueba.025. CAPÍTULO 2 EXPERIMENTOS COMPARATNOS SIMPLES : o. b) Probar estas hipótesis utilizando a = 0.34:5 ---+-:5 4. ¿A qué conclusiones se llega? . a) Establecer las hipótesis apropiadas para la media !L.8 0. 2-3. del ejemplo 2-2 es. /o.l1 = 1/FO. Y3 = 150 YY4 = 147. Una variable aleatoria con una distribución normal tiene una media desconocida!L y varianza a2 = 9. 2~7 PROBLEMAS Se requiere que la resistencia a la ruptura de una fibra sea de por lo menos 150 psi. y la viscosidad promedio es 812. a) Enunciar las hipótesis que el lector considere que deberían probarse en este experimento. Se seleccionan 10 botellas al azar y se prueban. Se colecta una muestra aleatoria de 16 lotes del detergente.05. Establecer las hipótesis apropiadas para investigar esta afirmación. cuya anchura total sea de 1.025 . b) Probar estas hipótesis utilizando a = 0.81 0 2 o. d) ConstlUir un intervalo de confianza de 95% para el tiempo de reparación promedio. b) Probarlas hipótesis que se formularon en el inciso a. ¿La vida de anaquel puede describirse o modelarse adecuadamente con una distribución normal? ¿Qué efecto tendría la violación de este supuesto sobre el procedimiento de plUeba usado para resolver el problema 2-5? El tiempo para reparar un instlUmento electrónico es una variable aleatoria medida en horas que sigue una distribución normal.98 16.99 Máquina 2 16. 2-7. El tiempo de reparación de 16 de estos instlUmentos elegidos al azar es el siguiente: Horas 159 224 222 149 280 379 362 260 101 179 168 485 212 264 250 170 2-8. Probar estas hipótesis utilizando a = 0. a) Quiere saberse si el tiempo de reparación promedio excede 225 horas. Con base en la información muestral. En opinión del lector.015 yaz = 0.02 15. Se sabe que al = a z = 1.01 15. ¿A qué conclusiones se llega? Utilizara = 0. . Enunciar las hipótesis que deberán probarse en este experimento.04 16.018.05 16. ConstlUir un intervalo de confianza de 99% para la vida media de anaquel.01 16.03 16.05.99 16. ¿A qué conclusiones se llega? Encontrar el valor P para esta plUeba.2-7 PROBLEMAS 55 d) 2-6. ConstlUir un intervalo de confianza de 99% para la verdadera diferencia media en la resistencia a la lUptura. Establecer las hipótesis apropiadas para investigar esta cuestión.02 15. Encontrar un intervalo de confianza de 95 % para la diferencia en el volumen de llenado promedio de las dos máquinas. Puede supon~ se que el proceso de llenado es normal. sin importar si este volumen es 16. Un fabricante de calculadoras electrónicas puede usar dos tipos de plástico. 16. Considere nuevamente los datos del tiempo de reparación del problema 2-7. La compañía no empleará el plástico 1 a menos que su resistencia a la lUptura exceda la del plástico 2 por al menos 10 psi.02 16.00 a) b) e) d) 2-10.0.01 15. ¿el tiempo de reparación puede modelarse de manera adecuada con una distribución normal? Se utilizan dos máquinas para llenar botellas de plástico con un volumen neto de 16.96 15.97 15.96 16.05. e) Encontrar el valor P para la plUeba. La resistencia a la ruptura de este plástico es importante. 2-9. con desviaciones estándar de al = 0.04 16. El departamento de ingeniería de calidad sospecha que ambas máquinas llenan el mismo volumen neto.03 16.0 onzas o no. ¿deberá usarse el plástico 1? Para responder esta pregunta se deben establecer y probar las hipótesis apropiadas utilizando a = 0.5 YYz = 155.01. De muestras aleatorias de nI = 10 Yn z = 12 se obtiene YI = 162. Considere los datos de la vida de anaquel del problema 2-5.0 psi. Se realiza un experimento tomando una muestra aleatoria de la producción de cada máquina.02 Máquina 1 16. e) Encontrar el valor P para la plUeba del inciso b.05 16.0 onzas. 56 2-11. CAPÍTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES A continuación se presenta el tiempo de combustión de dos cohetes químicos con formulaciones diferentes. Los ingenieros de diseño se interesan tanto en la media como en la varianza del tiempo de combustión. Tipo 1 65 81 57 66 82 82 67 59 75 70 Tipo 2 64 71 83 59 65 56 69 74 82 79 a) Probar la hipótesis de que las dos varianzas son iguales. Utilizar a = 0.05. 2-12. b) Utilizando los resultados del inciso a, probar la hipótesis de que los tiempos de combustión promedio son iguales. Utilizar a = 0.05. ¿Cuál es el valor P para esta prueba? e) Comentar el papel del supuesto de normalidad en este problema. Verificar el supuesto de normalidad para ambos tipos de cohetes. En un artículo de Solid State Technology, "Diseño ortogonal para optimización de procesos y su aplicación en el grabado químico con plasma" de G.Z. Yin y D.W. Jillie, se describe un experimento para determinar el efecto de la velocidad del flujo de CZF 6 sobre la uniformidad del grabado en una oblea de silicio usada en la fabricación de circuitos integrados. Los datos de la velocidad del flujo son los siguientes: Flujo de CZF 6 125 200 Observación de la uniformidad 1 2.7 4.6 2 4.6 3.4 3 2.6 2.9 4 3.0 3.5 5 3.2 4.1 6 3.8 5.1 b) 2-13. a) ¿La velocidad del flujo de CZF 6 afecta la uniformidad del grabado promedio? Utilizar a = 0.05. ¿Cuál es el valor P para la prueba del inciso a? e) ¿La velocidad del flujo de CZF 6 afecta la variabilidad de una oblea a otra en la uniformidad del grabado? Utilizar a = 0.05. d) Trazar diagramas de caja que ayuden a interpretar los datos de este experimento. Se instala un nuevo dispositivo de filtrado en una unidad química. Antes de instalarlo, de una muestra aleatoria se obtuvo la siguiente información sobre el porcentaje de impurezas:)l1 = 12.5, Slz = 101.17 Y nI = 8. Después de instalarlo, de una muestra aleatoria se obtuvo )lz = 10.2, si = 94.73, n z = 9. a) ¿Puede concluirse que las dos varianzas son iguales? Utilizar a = 0.05. b) ¿El dispositivo de filtrado ha reducido de manera significativa el porcentaje de impurezas? Utilizar a = 0.05. Se hacen 20 observaciones de la uniformidad del grabado en obleas de silicio durante un experimento de evaluación de un grabador de plasma. Los datos son los siguientes: 5.34 6.00 5.97 5.25 6.65 7.55 7.35 6.35 4.76 5.54 5.44 4.61 5.98 5.62 4.39 6.00 7.25 6.21 4.98 5.32 2-14. a) Construir una estimación con un intervalo de confianza de 95% de aZ• b) Probar la hipótesis de que a Z = 1.0. Utilizar a = 0.05. ¿A qué conclusiones se llega? 2-7 PROBLEMAS 57 e) Comentar el supuesto de normalidad y su papel en este problema. d) Verificar la normalidad construyendo una gráfica de probabilidad normal. ¿A qué conclusiones se 2-15. llega? Doce inspectores midieron el diámetro de un cojinete de bolas, utilizando cada uno dos tipos diferentes de calibradores. Los resultados fueron Inspector 1 2 3 4 5 6 7 8 9 10 11 12 Calibrador 1 0.265 0.265 0.266 0.267 0.267 0.265 0.267 0.267 0.265 0.268 0.268 0.265 Calibrador 2 0.264 0.265 0.264 0.266 0.267 0.268 0.264 0.265 0.265 0.267 0.268 0.269 2-16. a) ¿Existe una diferencia significativa entre las medias de la población de mediciones de las que se seleccionaron las dos muestras? Utilizar a = 0.05. b) Encontrar el valor P para la prueba del inciso a. e) Construir un intervalo de confianza de 95 % para la diferencia en las mediciones de los diámetros promedio para los dos tipos de calibradores. En un artículo de Joumal ofStrainAnalysis (vol. 18, no. 2) se comparan varios procedimientos para predecir la resistencia al corte de vigas dé placas de acero. Los datos para nueve vigas en la forma del cociente de la carga predicha y la observada para dos de estos procedimientos, los métodos Karlsruhe y Lehigh, son los siguientes Viga Sl/l S2/1 S3/1 S4/1 S5/1 S2/1 S2/2 S2/3 S2/4 Método Karlsruhe 1.186 1.151 1.322 1.339 1.200 1.402 1.365 1.537 1.559 Método Lehigh 1.061 0.992 1.063 1.062 1.065 1.178 1.037 1.086 1.052 a) ¿Existe alguna evidencia que apoye la afirmación de que hay una diferencia en el des.empeño promedio entre los dos métodos? Utilizar a = 0.05. b) ¿Cuál es el valor P para la prueba del inciso a? e) Construir un intervalo de confianza de 95% para la diferencia en la carga promedio predicha y la observada. d) Investigar el supuesto de normalidad en ambas muestras. e) Investigar el supuesto de normalidad para la diferencia en los cocientes para los dos métodos. /) Comentar el papel del supuesto de normalidad en la prueba t pareada. 58 2-17. CAPÍTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES Se estudia la temperatura de deflexión bajo carga de dos formulaciones diferentes de un tubo de plástico ABS. Dos muestras de 12 observaciones cada una, se preparan utilizando cada'formulación y las temperaturas de deflexión (en °F) se presentan abajo: Formulación 1 193 192 207 210 185 194 189 178 Formulación 2 206 188 205 187 177 197 206 201 176 185 200 197 198 188 189 203 2-18. 2-19. a) Construir las gráficas de probabilidad normal para ambas muestras. ¿Estas gráficas apoyan los supuestos de normalidad y de la igualdad de la varianza de ambas muestras? b) ¿Los datos apoyan la afirmación de que la temperatura promedio de deflexión bajo carga de la formulación 1 excede la de la formulación 2? Utilizar a = 0.05. e) ¿Cuál es el valor P para la prueba del inciso a? Referirse a los datos del problema 2-17. ¿Los datos apoyan la afirmación de que la temperatura promedio de deflexión bajo carga de la formulación 1 excede la de la formulación 2 en al menos 3°F? En la fabricación de semiconductores es común el uso del grabado químico húmedo para eliminar el silicio de la parte posterior de las obleas antes de la metalización. La rapidez del grabado es una característica importante de este proceso. Se están evaluando dos soluciones de grabado diferentes. Se grabaron ocho obleas seleccionadas al azar en cada solución, y las cifras de la rapidez del grabado observada (en milésimas de pulgada/min) se muestran abajo Solución 1 10.6 9.9 9.4 10.3 9.3 10.0 9.8 10.3 Solución 2 10.2 10.6 10.0 10.2 10.7 10.4 10.5 10.3 2-20. a) ¿Los datos indican que la afirmación de que ambas soluciones tienen la misma rapidez de grabado promedio es verdadera? Utilizar a = 0.05 y suponer la igualdad de las varianzas. b) Encontrar un intervalo de confianza de 95% para la diferencia en la rapidez de grabado promedio. e) Usar gráficas de probabilidad normal para investigar la adecuación de los supuestos de normalidad e igualdad de las varianzas. Se están comparando dos populares analgésicos con base en la rapidez de absorción del cuerpo. Específicamente, se afirma que la tableta 1 se absorbe con el doble de rapidez que la tableta 2. Suponer que y a~ se conocen. Desarrollar un estadístico de prueba para a; H o:2f.l¡ = f.l2 H¡:2f.l¡ :;f:.f.l2 2-21. Suponga que se está probando Ho:f.l¡ =f.l2 H¡:f.l¡ :;f:.f.l2 2-22. donde a; y a~ se conocen. Los recursos para hacer el muestreo son limitados, por lo que n¡ + n 2 = N. ¿Cómo deberán asignarse las N observaciones entre las dos poblaciones para obtener la prueba con la potencia más alta? Desarrollar la ecuación 2-46 para un intervalo de confianza de 100(1- a) por ciento para la varianza de una distribución normal. í 2-7 PROBLEMAS 59 Desarrollar la ecuación 2-50 para un intervalo de confianza de 100(1- por ciento para el cociente donde y son las varianzas de dos distribuciones normales. 2-24. Desarrollar una ecuación para encontrar un intervalo de confianza de 100(1-a) por ciento para la diferencia en las medias de dos distribuciones normales donde ;t: Aplicar la ecuación desarrollada a los datos del experimento del cemento portland, y encontrar un intervalo de confianza de 95%. 2-25. .Construir un conjunto de datos para los que el estadístico de prueba t pareada sea muy grande, pero para el cual el estadístico de prueba t de dos muestras o combinada usual sea pequeño. En general, describir cómo se crearon los datos. ¿Le da esto al lector alguna idea respecto de cómo funciona la prueba t pareada? 2-23. ai a; a) ai / a;, ai a;. Experimentos con un solo factor: el análisis de varianza En el capítulo 2 se analizaron los métodos para comparar dos condiciones o tratamientos. Por ejemplo, el experimento de la fuerza de la tensión de adhesión del cemento portland incluyó dos formulaciones diferentes del mortero. Otra forma de describir este experimento es como un experimento con un solo factor, con dos niveles del factor, donde el factor es la formulación del mortero y los dos niveles son los dos métodos diferentes para hacer la formulación. Muchos experimentos de este tipo involucran más de dos niveles del factor. En este capítulo se presentan los métodos para el diseño y el análisis de los experimentos con un solo factor cona niveles del mismo (o a tratamientos). Se supondrá que el experimento se ha aleatorizado completamente. 3~ 1 UN EJEMPLO Un ingeniero de desarrollo de productos tiene interés en investigar la resistencia a la tensión de una fibra sintética nueva que se usará para hacer tela de camisas para caballero. El ingeniero sabe por experiencia previa que la resistencia a la tensión se afecta por el peso porcentual del algodón utilizado en la mezcla de materiales de la fibra. Además, sospecha que al aumentar el contenido de algodón se incrementará la resistencia, al menos en un principio. Sabe asimismo que el contenido de algodón deberá variar entre 10 y 40 por ciento para que el producto final tenga otras características de calidad que se desean (como la capacidad de ser sometido a un tratamiento de planchado permanente). El ingeniero decide probar ejemplares en cinco niveles del peso porcentual del algodón: 15,20,25,30 Y35 por ciento. También decide probar cinco ejemplares en cada nivel del contenido de algodón. Se trata de un ejemplo de un experimento con un solo factor con a = 5 niveles del factor y n = 5 réplicas. Las 25 corridas deberán realizarse de manera aleatoria. Para ilustrar cómo puede aleatorizarse el orden de las corridas, suponga que las corridas se numeran de la siguiente manera: 60 3-1 UN EJEMPLO 61 Peso porcentual del algodón Número de corrida experimental 15 20 25 30 35 1 6 11 16 21 2 7 12 17 22 3 8 13 18 23 4 9 14 19 24 5 10 15 20 25 Ahora se selecciona un número aleatorio entre 1 y 25. Suponga que este número es 8. Entonces la observación número 8 (20% de algodón) se corre primero. Este proceso se repetiría hasta que las 25 observaciones tengan asignada una posición en la secuencia de prueba. 1 Muchos paquetes de software de computadora para ayudar a los experimentadores a seleccionar y construir un diseño, aleatorizan el orden de las corridas utilizando números aleatorios de esta manera. Suponga que la secuencia de prueba obtenida es Secuencia de prueba Número de corrida Peso porcentual del algodón 1 2 3 4 8 5 6 18 10 23 17 5 7 8 9 10 14 6 15 20 9 4 11 12 13 12 7 14 15 16 17 1 24 21 11 18 19 20 21 22 23 24 25 2 13 22 16 25 19 3 20 30 20 35 30 15 25 20 25 30 20 15 25 20 15 35 35 25 15 25 35 30 35 30 15 Esta secuencia de prueba aleatorizada es necesaria para evitar que los efectos de variables perturbadoras desconocidas -las cuales quizá varíen fuera de control durante el experimento-- contaminen los resultados. Para ilustrar esto, suponga que las 25 corridas de prueba tuvieran que realizarse en el orden original no aleatorizado (es decir, primero se prueban los cinco ejemplares con 15% de algodón, después se prue1 La única restricción sobre la aleatorización en este caso, es que si se saca de nuevo el mismo número (es decir, 8), se descarta. Se trata de una restricción secundaria y se ignora. 62 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA Tabla 3-1 Datos (en lb/pulgadaZ) del experimento de la resistencia a la tensión Observaciones 1 7 12 14 19 7 2 7 17 18 25 10 3 15 12 18 22 11 4 11 18 19 19 15 5 9 18 19 23 11 Total 49 77 88 108 54 Promedio 9.8 15.4 17.6 21.6 10.8 -15.04 Peso porcentual del algodón 15 20 25 30 35 - 376 ban los cinco ejemplares con 20% de algodón, etc.). Si la máquina empleada para probar la resistencia a la tensión presenta un efecto de calentamiento tal que entre más tiempo esté funcionando sean menores las lecturas de la resistencia a la tensión observadas, el efecto del calentamiento contaminará potencialmente los datos de la resistencia a la tensión y destruirá la validez del experimento. Suponga que el ingeniero corre la prueba en el orden aleatorio que se ha determinado. En la tabla 3-1 se muestran las observaciones que obtiene para la resistencia a la tensión. Siempre es una buena idea examinar gráficamente los datos experimentales. En la figura 3-1 se muestran los diagramas de caja para la resistencia a la tensión con cada nivel del peso porcentual de algodón, y en la figura 3-2 se ilustra ún diagrama de dispersión de la resistencia a la tensión contra el peso porcentual del algodón. En la figura 3-2, los puntos rellenos son las observaciones individuales y los círculos huecos son los promedios de la resistencia a la tensión observada. Ambas gráficas indican que la resistencia a la tensión se incrementa cuando el contenido de algodón se incrementa, hasta cerca de 30% de algodón. Después de 30% de algodón, hay un marcado descenso de la resistencia a la tensión. No hay evidencia sólida que sugiera que la variabilidad de la resistencia a la tensión alrededor del promedio dependa del peso porcentual del algodón. Con base en este análisis gráfico simple, se tienen firmes sospechas de que 1) el contenido de algodón afecta la resistencia a la tensión y 2) alrededor de 30% de algodón produce la resistencia máxima. Suponga que se quiere ser más objetivo en el análisis de los datos. Específicamente, imagine que quieren probarse las diferencias entre las resistencias a la tensión promedio con todos los niveles a = 5 del 30 'b; :; c: '0 .¡¡; c: ~ l!l 20 ..!!! ro ro 'ü tí .¡¡; ij¡ 10 ID a: oL-_--L_ _- I -_ _...l-_ _l - _ - . . l ._ _- ' 15 20 25 30 Peso porcentual del algodón Figura 3-1 Diagramas de caja de la resistencia a la tensión contra el peso porcentual del algodón. 3-2 EL ANÁLISIS DE VARIANZA 63 30 "b; :; c: -o 'iñ c: ~20 ! O • • • • V • 10 •• • O •• •• O •• ..!!! ro ro '¡; c: 'iñ ~ •• • • O •• • • a: Q) OL---I.---'----'----'------' Pese eercentual del alcedón Figura 3-2 Diagrama de dispersión de la resistencia a la tensión contra el peso porcentual del algodón. peso porcentual del algodón. Por lo tanto, el interés se centra en probar la igualdad de las cinco medias. Pudiera parecer que este problema se resolvería realizando una prueba t para todos los pares de medias posibles. Sin embargo, no es ésta la mejor solución de este problema, porque llevaría a una distorsión considerable en el error tipo 1. Por ejemplo, suponga que quiere probarse la igualdad de las cinco medias usando comparaciones por pares. Hay 10 pares posibles, y si la probabilidad de aceptar correctamente la hipótesis nula en cada prueba individual es de 1 - a = 0.95, la probabilidad de aceptar correctamente la hipótesis nula en las 10 pruebas es de (0.95)10 = 0.60 si las pruebas son independientes. Por lo tanto, ha ocurrido un incremento sustancial en el error tipo l. El procedimiento correcto para probar la igualdad de varias medias es el análisis de varianza. Sin embargo, el análisis de varianza tiene un rango de aplicaciones mucho más amplio que el problema anterior. Probablemente sea la técnica más útil en el campo de la inferencia estadística. 3..2 EL ANÁLISIS DE VARIANZA Suponga que se tienen a tratamientos o niveles diferentes de un solo factor que quieren compararse. La respuesta observada de cada uno de los a tratamientos es una variable aleatoria. Los datos aparecerían como en la tabla 3-2. Una entrada de la tabla 3-2 (por ejemplo, Yij) representa la observaciónj-ésima to- Tabla 3-2 Datos típicos de un experimento de un solo factor 'Itatamiento (nivel) 1 fu Observaciones fu ~ ~ Totales Promedios h ~, 2 h h h h a Ya! Ya2 Yan y,. 5'.. 64 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA mada bajo el nivel del factor o tratamiento i. Habrá, en general,}1 observaciones bajo el tratamiento i-ésimo. Observe que la tabla 3-2 es el caso general de los datos del experimento de la resistencia a la tensión de la tabla 3-1. Modelos para los datos Se encontrará útil describir las observaciones de un experimento con un modelo. Una manera de escribir este modelo es i=l, 2, Yij=fl¡+cij { }=1,2, ,a ,11 (3-1) dondeYij es la observación ij-ésima, ¡t¡ es la media del nivel del factor o tratamiento i-ésimo, y cij es un componente del error aleatorio que incorpora todas las demás fuentes de variabilidad del experimento, incluyendo las mediciones, la variabilidad que surge de factores no controlados, las diferencias entre las unidades experimentales (como los materiales de prueba, etc.) a las que se aplican los tratamientos, y el ruido de fondo general en el proceso (ya sean la variabilidad con el tiempo, los efectos de variables ambientales, etc.). Es conveniente considerar que los errores tienen media cero, de tal modo que E(yij) = fl¡. A la ecuación 3-1 se le llama el modelo de las medias. Una forma alternativa de escribir un modelo de los datos es definiendo i de tal modo que la ecuación 3-1 se convierte en i=l, 2, ..., a y.. = fl+í. +1' .. { IJ IJ j= 1,2, ... ,11 1 = 1, 2, ..., a (3-2) En esta forma del modelo, fl es un parámetro común a todos los tratamientos al que se llama la media global, y í¡ es un parámetro único del tratamiento i-ésimo al que se le llama el efecto del tratamiento i-ésimo. A la ecuación 3-2 se le llama por lo general el modelo de los efectos. Tanto el modelo de las medias como el de los efectos son modelos estadísticos lineales; es decir, la variable de respuestaYij es una función lineal de los parámetros del modelo. Aun cuando ambas formas del modelo son útiles, el modelo de los efectos se encuentra con mayor frecuencia en la literatura del diseño experimental. Tiene cierto atractivo intuitivo por cuanto fl es una constante y los efectos de los tratamientos í¡ representan desviaciones de esta constante cuando se aplican los tratamientos específicos. A la ecuación 3-2 (o a la 3-1) se le llama también el modelo del análisis de varianza simple o de un solo factor (o dirección), porque únicamente se investiga un factor. Además, será un requisito que el experimento se lleve a cabo en orden aleatorio para que el ambiente en el que se apliquen los tratamientos (llamados con frecuencia unidades experimentales) sea lo más uniforme posible. Por lo tanto, el diseño experimental es un diseño completamente aleatorizado. Los objetivos serán probar las hipótesis apropiadas acerca de las medias de los tratamientos y estimarlas. Para probar las hipótesis, se supone que los errores del modelo son variables aleatorias que siguen una distribución normal e independiente con media cero y varianza el. Se supone asimismo que la varianza el es constante para todos los niveles del factor. Esto implica que las observaciones y que las observaciones son mutuamente independientes. 3-3 ANÁLISIS DEL MODELO CON EFECTOS FIJOS 65 ¿Factor fijo o aleatorio? El modelo estadístico (ecuación 3-2) describe dos situaciones diferentes con respecto a los efectos de los tratamientos. Primera, los a tratamientos pudieron ser elegidos expresamente por el experimentador. En esta situación quieren probarse hipótesis acerca de las medias de los tratamientos, y las conclusiones se aplicarán únicamente a los niveles del factor considerados en el análisis. Las conclusiones no pueden extenderse a tratamientos similares que no fueron considerados explícitamente. También se podría querer estimar los parámetros del modelo (p" Ti' 02). A éste se le llama el modelo con efectos fijos. De manera alternativa, los a tratamientos podrían ser una muestra aleatoria de una población más grande de tratamientos. En esta situación sería deseable poder extender las conclusiones (las cuales se basan en la muestra de los tratamientos) a la totalidad de los tratamientos de la población, sea que se hayan considerado explícitamente en el análisis o no. Aquí las Ti son variables aleatorias, y el conocimiento de las Ti particulares que se investigaron es relativamente inútil. Más bien, se prueban hipótesis acerca de la variabilidad de las Ti y se intenta estimar su variabilidad. A éste se le llama el modelo con efectos aleatorios o modelo de los componentes de la varianza. La revisión de experimentos con factores aleatorios se pospondrá hasta el capítulo 12. 3~3 ANÁLISIS DEL MODELO CON EFECTOS FIJOS En esta sección se desarrolla el análisis de varianza de un solo factor para el modelo con efectos fijos. Recuerde que Yi. representa el total de las observaciones bajo el tratamiento i-ésimo. Sea que Yi. represente el promedio de las observaciones bajo el tratamiento i-ésimo. De manera similar, sea que Y.. represente el gran total de todas las observaciones y que Y.. represente el gran promedio de todas las observaciones. Expresado simbólicamente, Yi.=}: j=l i = 1, 2, oo., a (3-3) Y.. = }:}: ¡=l j=l Y¡j Y .. = Y.. / N donde N = an es el número total de observaciones. Se nota que el subíndice "punto" implica la operación suma sobre el subíndice que reemplaza. El interés se encuentra en probar la igualdad de lasa medias de los tratamientos; es decir,E(y¡J =fl + T¡ = fli' i = 1, 2, a. Las hipótesis apropiadas son OO" Ho:fll H 1 : fli = fl2 = oo. = fla ;é fl j para al menos un par (i, j) En el modelo de los efectos, la mediafli del tratamiento i-ésimo se descompone en dos componentes tales que fli = fl + Ti' Por lo general, fl se considera como una media global, de tál modo que --=fl ~fli i=l a Esta definición implica que ~ i=l T¡ =O 66 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA Es decir, los efectos del tratamiento o factor pueden considerarse como desviaciones de la media globaI.z Por consiguiente, una forma equivalente de escribir las hipótesis anteriores es en términos de los efectos de los tratamientos Ti> por ejemplo H o :T 1 =T 2 =···T a =O H 1 : Ti ':¡!; O para al menos una i Por 10 tanto, se habla de probar la igualdad de las medias de los tratamientos o de probar que los efectos de los tratamientos (las Ti) son cero. El procedimiento apropiado para probar la igualdad de las medias de los a tratamientos es el análisis de varianza. 3~3.1 Descomposición de la suma de cuadrados total El nombre análisis de varianza se deriva de la partición de la variabilidad total en sus partes componentes. La suma de cuadrados total corregida se usa como una medida de la variabilidad global de los datos. Intuitivamente, esto es razonable porque, si SST tuviera que dividirse por el número apropiado de grados de libertad (en este caso, an -1 = N -1), se obtendría la varianza muestral de las y. La varianza muestral es, desde luego, una medida estándar de variabilidad. Observe que la suma de cuadrados total corregida SST se puede escribir como (3-4) o ~ ~ ( _ - )2 _ ~ (- _ - )2 + L.J ~ L.J ~ L.J L.J Yij Y. - n L.J Yi. Y.. i=l j=l i=l a n (Yij _ Yi. - )2 (3-5) i=l j=l +2"" - y-,t. ) L"., L"., (y-,~. - Y-.. )(y.. lJ i=l j=l Sin embargo, el término del producto cruzado de la ecuación 3-5 es cero, ya que .. -y-.)= y.t. -ny-.l. L"., (y lJ l. j=l ~ = y. l. -n(y. /n)= O l. Se tiene, por 10 tanto, ~ ~ ( _ - )2 _ ~ (- _ - )2 + L.J ~ L.J ~ (Yij L.J L.J Yij Y. - n L.J Yi. y.. i=l j=l _ Yi. - )2 (3-6) i=l i=l j=l La ecuación 3-6 establece que puede hacerse la partición de la variabilidad total de los datos, medida por la suma de cuadrados total corregida, en una suma de cuadrados de las diferencias eutre los promedios de los tratamientos y el gran promedio, más una suma de cuadrados de las diferencias de las observaciones dentro de los tratamientos y el promedio de los tratamientos. Entonces, la diferencia entre los promedios 2 Para más información sobre este tema, referirse al material suplementario del texto del capítulo 3. r J 3-3 ANÁLISIS DEL MODELO CON EFECTOS FI]OS 67 de los tratamientos observados y el gran promedio es una medida de las diferencias entre las medias de los tratamientos, mientras que las diferencias de las observaciones dentro de un tratamiento y el promedio del tratamiento, pueden deberse únicamente al error aleatorio. Por lo tanto, la ecuación 3-6 puede escribirse simbólicamente como SST = SSTratamientns +SSE donde a SSnatamientos se le llama la suma de cuadrados debida a los tratamientos (es decir, entre los tratamientos), y a SSE se le llama la suma de cuadrados debida al error (es decir, dentro de los tratamientos). Hayan = N observaciones en total; por lo tanto, SST tiene N -1 grados de libertad. Haya niveles del factor (y medias de a tratamientos), de donde SSnatamientos tiene a - 1 grados de libertad. Por último, dentro de cualquier tratamiento hay n réplicas que proporcionan n - 1 grados de libertad con los cuales estimar el error experimental. Puesto que haya tratamientos, se tienen a(n - 1) = an - a = N - a grados de libertad para el error. Es útil examinar explícitamente los dos términos del lado derecho de la identidad fundamental del análisis de varianza (ecuación 3-6). Considere la suma de cuadrados del error En esta forma es fácil ver que el término entre corchetes, si se divide por n -1, es la varianza muestral del tratamiento i-ésimo, o S~ , = ..:..j=_I ! _ n-1 i = 1, 2, oo., a .Ahora pueden combinarse a varianzas muestrales para obtener una sola estimación de la varianza poblacional común de la siguiente manera: 2 2 (n-1)SI- +(n-1)S2 +.oo + (n-1)Sa (n-1)+(n-1) + ... + (n-1) ? L,. __ a (Yif - Ji. )2] 1 = _---=.'-------= L.J (n-1) i=l [LJ'~_1 ~ SSE (N-a) Por lo tanto, SSEI(N -a) es una estimación combinada de la varianza común dentro de cada uno de los a tratamientos. De manera similar, si no hubiera diferencias entre las medias de los a tratamientos, podría usarse la variación de los promedios de los tratamientos y el gran promedio para estimar cr. Específicamente SSTratamientos i=l a-1 a-1 es una estimación de cr si las medias de los tratamientos son iguales. La razón de esto puede verse de manera intuitiva de la siguiente manera. La cantidad k~=l <Yi. -yY/(a -1) estima crin, la varianza de los pro- 68 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA medios de los tratamientos, de donde nL~=1 (jIi. - --YY/(a - 1) debe estimar cJl si no hay diferencias en las medias de los tratamientos. Se observa que la identidad del análisis de varianza (ecuación 3-6) nos proporciona dos estimaciones de cJl: una basada en la variabilidad inherente dentro de los tratamientos y una basada en la variabilidad entre los tratamientos. Si no hay diferencias en las medias de los tratamientos, estas dos estimaciones deberán ser muy similares, y si no lo son, se sospecha que la diferencia observada puede ser causada por diferencias en las medias de los tratamientos. Aun cuando se ha usado un razonamiento intuitivo para desarrollar este resultado, puede adoptarse un enfoque un tanto más formal. A las cantidades MS Tratamientos = SS Tratamientos a- 1 y SSE MS = - E N-a se les llama cuadrados medios. Se examinarán ahora los valores esperados de estos cuadrados medios. Considere SS) =-_-E 1 [a n (Yij-Yi.)2 ] E(MSE)=E~ ( N a N a LL j=1 i=1 1 E[a n (y~-2y.. y-. +Y~) ] ="" lj lj N - a LJLJ ;=1 j=1 l. l. = N_a E =_1 1 [a n ~# ;=1 j=1 N-a E[!I Al sustituir el modelo (ecuación 3-1) en esta ecuación se obtiene Entonces, al elevar al cuadrado y tomar el valor esperado de la cantidad entre corchetes, se observa que los términos que incluyen ac~ y c~ son reemplazados por cJly ncJl, respectivamente, debido a que E (cij) = O. Además, todos los productos cruzados que incluyen a cij tienen valor esperado cero. Por lo tanto, después de elevar al cuadrado y tomar el valor esperado, la última ecuación se convierte en E(MS E ) = N-a N,u2+n~ r:+Na2-N,u2-n~ r:-aa o 1 [a a] 2 3·3 ANÁLISIS DEL MODELO CON EFECTOS FIJOS 69 Aplicando un enfoque similar puede demostrarse también que 3 E ( MS n! o 'í; Tratamientos) = a - + -a--"--l- ¡=I Por lo tanto, como se argumentó heurísticamente, MSE = SSE/(N - a) estima dl y, si no hay diferencias en las medias de los tratamientos (lo cual implica que 'í¡ = O), MSnatamientos = SSTratamientoJ(a -1) también estima dl. Sin embargo, observe que si las medias de los tratamientos difieren, el valor esperado del cuadrado medio de los tratamientos es mayor que dl. Parece claro que es posible realizar una prueba de la hipótesis de que no hay diferencias en las medias de los tratamientos comparando MSnatamientos y MSE • Se considera ahora cómo puede hacerse esta comparación. 3,3.2 Análisis estadístico Se investiga ahora cómo puede llevarse a cabo una prueba formal de la hipótesis de que no hay diferencias en las medias de los tratamientos (HO:f.l1 = f.l2 = = Ila, o de manera equivalente, HO:'í 1 = 'í 2 = ''ía = O). Puesto que se ha supuesto que los errores Bij siguen una distribución normal e independiente con media cero y varianza dl, las observaciones Yij tienen una distribución normal e independiente con media f.l + 'í¡ y varianza dl. Por lo tanto, SST es una suma de cuadrados de variables aleatorias con una distribución normal; por consiguiente, puede demostrarse que SST/rJ2 tiene una distribución ji-cuadrada con N -1 grados de libertad. Además, puede demostrarse que SSE/dl es una variable ji-cuadrada con N -a grados de libertad y que SSnatamientoJdl es una variable ji-cuadrada con a -1 grados de libertad si la hipótesis nula Ho:'í¡ = Oes verdadera. Sin embargo, las tres sumas de cuadrados no son necesariamente independientes, ya que la suma de SSnatamientos YSSE es SS,!, El siguiente teorema, que es una forma especial de un teorema atribuido a William Cochran, es útil para establecer la independencia de SSE Y SSnatamientos' o" o. TEOREMA 3,1 Teorema de Cochran Sea Z¡ igual a NID(O, 1) para i . = 1, 2, o •• , vy í Z¡2 = QI +Q2 + ... + Q, ;=1 donde s :5 v, YQ¡ tiene Vi grados de libertad (i = 1,2, .", s). Entonces Ql' Q2' oo., Q, son variables aleatorias ji-cuadrada independientes con VI' V 2, oo., V, grados de libertad, respectivamente, si y sólo si ......................................................................... Puesto que los grados de libertad de SSnatamientos YSSE suman N -1, el número total de grados de libertad, el teorema de Cochran implica que SSnatamiento,/dl Y SSE/dl son variables aleatorias ji-cuadrada con 3 v = VI +V 2 + ... +v, Referirse al material suplementario del texto del capítulo 3 o Recuerde que al ingeniero de desarrollo de productos le interesa determinar si el peso porcentual del algo- . .J i=l a O MSE SSE = SST SST = SSTrntamicntos ~~ i=l 1'=1 (Yij -y.N-a donde Fa se calcula con la ecuación 3-7. bajo la hipótesis nula.7O CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA Tabla 3-3 Tabla de análisis de varianza para el modelo con un solo factor y efectos fijos Fuente de variación Entre los tratamientos Error (dentro de los tratamientos) Total SSTrntamientos Suma de cuadrados =n Grados de libertad a-l N-a Cuadrado medio F: = MSTratamicntos MSTrntamientos 2: (Yi.} N-l una distribución independiente. el cociente F. Por lo tanto. Se le conoce como tabla del análisis de varianza.Y. Es posible obtener fórmulas para calcular estas sumas de cuadrados reescribiendo y simplifican~o las definiciones de SSTratamientos Y SSy en la ecuación 3-6. el valor esperado de MSTIatamientos es mayor que el-. si la hipótesis nula de que no hay diferencias en las medias de los tratamientos es verdadera. Sin embargo. Se obtiene así Y. el valor esperado del numerador del estadístico de prueba (ecuación 3-7) es mayor que el valor esperado del denominador. Esto implica una región crítica de una sola cola superior. N (3-9) La suma de cuadrados del error se 'obtiene por sustracción como (3-10) E = SSy . Por lo tanto.a-l.Y. MSTratamientos es un estimador insesgado de el-. podría usarse el enfoque del valor P para tomar una decisión. Lo.SS Tratamientos El procedimiento de prueba se resume en la tabla 3-3.2 . Por los cuadrados medios esperados se observa que. De manera alternativa. Ha deberá rechazarse y concluirse que hay diferencias en las medias de los tratamientos si Fa > Fa. Asimismo. MS E es un estimador insesgado de el-.SS EJEMPLO 3. se retoma al ejemplo que empezó a comentarse en la sección 3-1. El experimento de la resistencia a la tensión Para ilustrar el análisis de varianza. si la hipótesis nula es falsa. Yi.N 2 2 (3-8) y 1 SS Tratamientos a 1=1 2 " =-.1 " . o = SSTratamientos I (a SSE I(N-a) 1) = MS Tratamieotos MS E (3-7) se distribuye como F con a . Yij .. en general.a grados de libertad.1 y N . y Ha deberá rechazarse para valores del estadístico de prueba que son muy grandes. La ecuación 3-7 es el estadístico de prueba para la hipótesis de que no hay diferencias en las medias de los tratamientos. Por lo tanto. . bajo la hipótesis alternativa. es decir.76 161.SS Tratamientos = 636.94/8. 4. = 376 Y .96 SSTratamientos 1 = 2 (376)2 n " Yi. +(54).=1 = 5[(49). puede calcularse el cociente F. utilizando paquetes de software con la capacidad de analizar datos de experimentos diseñados. También Tabla 3-4 Análisis de varianza de los datos de la resistencia a la tensión Fuente de variación Peso porcentual del algodón Error Total Suma de cuadrados 475.8 Y. 20 = 2.94 8.06 Fo Fo=14.76 = 161. Observe que el cuadrado medio entre los tratamientos (118.8 15. el peso porcentual del algodón en la fibra afecta de manera significativa la resistencia a la tensión media.3-3 ANÁLISIS DEL MODELO CON EFECTOS FIJOS 71 dón en una fibra sintética afecta la resistencia a la tensión.20 Generalmente estos cálculos se realizarían en una computadora. se rechaza Ha y se concluye que las medias de los tratamientos difieren.2 . . 20' Suponga que el experimentador ha seleccionado a = 0.4 17..6 21.=1 j=l 5 5 2 = (7)2 +(7)2 +(15)2 + .87.+ ..~ . = 15. a continuación se repiten los datos de la tabla 3-1: Peso porcentual del algodón 15 20 25 30 35 Resistencia a la tensión observada (lb/pulg2) 1 7 12 14 19 7 2 7 17 18 25 10 3 15 12 18 22 11 4 11 18 19 19 15 5 9 18 19 23 11 Totales Yi 49 77 88 108 54 Promedios Yi..]------zs-= 475.05...Y.20 636.06). En la tabla IV del apéndice se encuentra que F o . Esto indica qué no es posible que las medias de los tratamientos sean iguales. Las sumas de cuadrados requeridas se calculan como sigue: SST = 2:2: Y~ .06 = 14.LJ N .76 Valor P <0.04 Se usará el análisis de varianza para probar H o:fl1 = fl2 = fl3 = fl4 = fl5 contra la hipótesis alternativa H 1: algunas medias son diferentes.475.94) es varias veces mayor que el cuadrado medio dentro de los tratamientos o cuadrado medio del error (8.05. y ha llevado a cabo un experimento completamente aleatorizado con cinco niveles del peso porcentual del algodón y cinco réplicas.76 SSE 1? ? (376)2 = SST .76 > 2.96.87.6 10. En términos más formales.96 Grados de libertad 4 20 24 Cuadrado medio 118.76. En la tabla 3-4 se resume el análisis de varianza. Ycomparar este valor con un punto porcentual apropiado de la cola superior de la distribución F 4. 9. Por conveniencia.01 . Puesto que Fa = 14. Fa = 118. +(15)2 +(11)2 ------zs-= 636. .. 0. SS Tratamientos =n 2: (jii.)1..G1... P < 0....20 = 4.... puede concluirse que un límite superior del valor Pes 0.01 (el valor P exacto es P = 9.. ...N i=1 La razón principal de esto es por conveniencia.... no deberá prestarse demasiada atención a los cálculos..4 ro "O .. :¡¡ 0... Cálculos manuales Posiblemente el lector haya notado que la suma de cuadrados se definió en términos de promedios. es decir...01. ya que se cuenta con una amplia variedad de programas de computadora para realizarlos. LJ Yi.. . .. y Y. EJEMPLO 3... por la ecuación 3-6.. Esto se ilustra en el ejemplo siguiente. Evidentemente. En la figura 3-3 se muestta la distribución de referencia (F4.72 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA :s E! "O "O ID :Q "O 0....2 .2 o Figura 3-3 La distribución de referencia (F4... Puesto que F0...... . Por ejemplo... .. estos programas también ayudarán al experimentador a establecer el diseño.' En general... Por ejemplo. Estos programas de computadora son también útiles para realizar muchos otros análisis asociados con el diseño experimental (como el análisis residual y la verificación de la adecuación del modelo)... Codificación de observaciones Los cálculos del análisis de varianza pueden hacerse con frecuencia de manera más precisa o simplificada codificando las observaciones.¡¡.. .... considere los datos de la resistencia a la tensión del ejemplo .. para calcular SSnatamientoS' se usaría la ecuación 3-9: 1 a 2 SS ~ 2 Y... En muchos casos. Tratamientos = -..11 X 10-6) • ..... 20) para el estadístico de prueba F o en el ejemplo 3-1.6 E c. los totales Yi. están menos sujetos al error de redondeo que los promedios Yi. el valor P es muy pequeño en este caso.20) para el estadístico de prueba Fa. y Y.43. es decir.. además.... en ocasiones es útil codificar las observaciones.. )2 i=l a pero las fórmulas de cálculo se desarrollaron utilizando los totales.. Cuando es necesario realizar los cálculos manualmente.4..43 YFa> 4.. . podría calcularse un valor P para este estadístico de prueba......... si se dividen por 4 (es decir. Pruebas de aleatorización y análisis de varianza En el desarrollo del análisis de varianza con la prueba F. Por ejemplo. Suponga que se consideran todas las formas posibles de . 22).84.04/4 = 475.. Sin embargo.. que es idéntico al cociente F de los datos originales. 1903.76.04/4)/(644. Es sencillo verificar que SST = (-8)2 +(_8)2 + .3-3 ANÁLISIS DEL MODELO CON EFECTOS FIJOS 73 Tabla 3-5 Datos codificados de la resistencia a la tensión del ejemplo 3·2 Observaciones Peso porcentual 1 2 3 del algodón 4 5 -6 3 4 Totales Yi 15 20 25 30 35 -8 -3 -1 4 -8 2 3 10 O -4 -3 3 7 3 4 4 O -8 -5 -4 8 -4 -26 2 13 33 -21 3-1. para los datos codificados. +(_4)2 _ (~2 = 636. los resultados son idénticos.80. +(-21)2 5 (1)2 25 =4 576 7 . Asimismo. se ha utilizado el supuesto de que los errores aleatorios sij son variables aleatorias que siguen una distribución normal e independiente. TratamIentos = (-26)2 +(2)2 + . su~ ponga que se tienen cinco observaciones de cada uno de dos tratamientos y que quiere probarse la igualdad de las medias de los tratamientos.20 Al comparar estas sumas de cuadrados con las que se obtuvieron en el ejemplo 3-1. los análisis de varianza son equivalentes.80/20) = 14.76. Suponga ahora que cada una de las observaciones del ejemplo 3-1 se multiplica por 2. el cociente F es F = (1903. Suponga que se resta 15 de cada observación. Para ilustrar esto. SSE = 161. podría recurrirse a un enfoque un tanto diferente.04 Y SSE = 644. se observa que al restar una constante de los datos originales las sumas de cuadrados no se modifican. Es sencillo verificar que las sumas de cuadrados de los datos transformados son SST = 2547. .96 SS y .. para la suma de cuadrados de los tratamientos. Thmbién es posible justificar la pruebaF como la aproximación de una prueba de aleatorizacióu. Los datos aparecerían así: 1J:atamiento 1 Yl1 Y12 1J:atamiento 2 Y21 Y22 Y23 Y24 Y25 Y13 Y14 Y15 Podría usarse el análisis de varianza con la pruebaF para probar HO:#l = #2' De manera alternativa. Estas sumas de cuadrados parecen diferir considerablemente de las que se obtuvieron en el ejemplo 3-1. SSnatamientos = 1903. Por lo tanto. Los datos codificados se muestran en la tabla 3-5. ver Box..t a / Z •N . Por lo tanto. Para más detalles sobre las pruebas de aleatorización en el análisis de varianza. es una NID(u¡. ¡li .Yj.0198 (o 1. si cJ2 fuera conocida. cadaY¡.. la prueba F puede considerarse como una aproximación de la prueba de aleatorización.fij' sería Yi. i= 1. Por lo tanto.98%). Por ejemplo. Sin embargo. A la distribución de estos valores F se le llama distribución de aleatorización.a) por. un intervalo de confianza de 100(1. para la media fii del tratamiento i-ésimo es Y¡. incluso sin el supuesto de normalidad.Yj. Al utilizar MS E como estimador de cJ2.. Es posible determinar con facilidad una estimación del intervalo de confianza de la media del tratamiento i-ésimo. Por lo tanto. los 252 arreglos son igualmente posibles. Estos estimadores poseen un considerable atractivo intuitivo. + t a/Z. ciento . si el valor de F que se observó realmente fue excedido sólo por 5 de los valores de la distribución de aleatorización. Observe que no es necesario ningún supuesto de normalidad en este enfoque. y un valor grande de F indica que los datos no son consistentes con la hipótesis Ho:fil = fiz. Para cada uno de los 252 arreglos. podría usarse la distribución normal para definir el intervalo de confianza. Más adelante se demostrará que estimadores razonables de la media global y de los efectos de los tratamientos están dados por {t = Y.N-a __E_ ~MS n (3-12) Un intervalo de confianza de 100(1. 3~3.fi j :::. .-Y. a (3-11) fi=Yi.. La media del tratamiento i-ésimo es Un estimador puntual defi¡ sería{t¡ = {t+f¡ = Y¡. si se supone que los errores siguen una distribución normal.N-a s n ~ __E_< fi ¡ <- Y¡.a --n-:::. cJ2/n). . Y¡. Hunter y Hunter [18]. .. observe que la media global se estima con el gran promedio de las observaciones y que el efecto de cualquier tratamiento no es sino la diferencia entre el promedio del tratamiento y el gran promedio.' Ahora bien. incluso en problemas relativamente pequeños. 2.74 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA asignar los 10 números de la muestra anterior a los dos tratamientos.3 Estimación de los parámetros del modelo Se presentan ahora los estimadores de los parámetros del modelo con un solo factor y los intervalos de confianza para las medias de los tratamientos. La dificultad con este enfoque es que. esto correspondería con el rechazo de Ho:¡ll = fiz con un nivel de significación de a = 5/252 = 0. numerosos estudios han demostrado que la distribución F común de la teoría normal es una buena aproximación de la distribución de aleatorización exacta.. el intervalo de confianza se basaría en la distribución t. +t a / Z•N . se calcula el valor del estadístico F usando la ecuación 3-7. Hay 10!/5151 = 252 arreglos posibles de las 10 observaciones: Si no hay ninguna diferencia en las medias de los tratamientos. .a --n- _ _ J2MS E _ _ ~2MSE (3-13) . _ t a/Z. por ejemplo fii .a) por ciento para la diferencia en las medias de dos tratamientos cualesquiera. los cálculos requeridos hacen inviable la enumeración de la distribución de aleatorización exacta. 60 .65$ fl4 $ 21. el experimentador tal vez quiera calcular varios intervalos de confianza.25.Y.4 Datos no balanceados En algunos experimentos con un solo factor.56 ~ 5 = Ys. A éste se le llama el método de Bonferroni.086 ~8. . A la probabilidad ra se le llama con frecuencia índice de error en el modo del experi.24 ~1 Un intervalo de confianza de 95% para la media del tratamiento 4 (30% de algodón) se calcula con la ecuación 3-12 como 21. mento o coeficiente de confianza global.. = 15. Un enfoque para asegurarse de que el nivel de confianza simultáneo no sea demasiado pequeño es sustituir a/2 con a/(2r) en las ecuaciones 3-12 y 3-13 del intervalo de confianza uno a la vez.3-3 ANÁLISIS DEL MODELO CON EFECTOS FIJOS 75 EJEMPLO 3~3 ••••••••••••••••••••••••••••••••••••••••••..06 -5.086 ~8.50. el nivel de confianza simultáneo para el conjunto de los cinco intervalos de confianza es de al menos 0. el nivel de confianza 1. = 10.65 Por lo tanto. Se dice entonces que el diseño es no balanceado. la probabilidad de que los r intervalos sean correctos simultáneamente es al menos 1.80-15.05 (una elección típica). . Si hay interés en r de estos intervalos de confianza de 100(1.04 = +6.56 f 4 = Y4.. puede ser diferente el número de observaciones que se hacen dentro de cada tratamiento.06 -5- 21. = 17.. 60 + 2. en muchos problemas.24 f 2 = Y2.04 Y = Yl -Ji.80-15.. uno para cada una de varias medias o diferencias entre medias.Y . el intervalo de confianza de 95% deseado es 18. Sin embargo.60-15.a) por ciento.ra. Cuando r no es muy grande.40-15.$ o fl4 $ 21.04 = -2. Intervalos de confianza simultáneos Las expresiones para los intervalos de confianza dados en las ecuaciones 3-12 y 3-13 son intervalos de confianza uno a la vez. y le permite al experimentador construir un conjunto de r intervalos de confianza simultáneos para las medias de los tratamientos o las diferencias en las medias de los tratamientos para los que el nivel de confianza global es de al menos 100(1.04 = -4.Y .60+2.60-15. éste es un método muy atinado que produce intervalos de confianza razonablemente cortos. Es decir. Para más información.04 = +0. el nivel de confianza simultáneo es de al menos 0. -:. 3~3. Por ejemplo. = 21. = 9.2. Sigue siendo posible aplicar el análisis de varianza descrito arriba.Y.a sólo se aplica a una estimación particular.95 $ fl4 $ 24. pero deben hacerse ligeras modificaciones en las fórmulas .05.60.a) por ciento.2. El número de intervalos r no tiene que ser muy grande antes de que el conjunto de intervalos de confianza se vuelva relativamente falto de información. si hay r = 5 intervalos y a = 0. = 376/25 = 15.04=-5. referirse al material suplementario del texto del capítulo 3.75.•••••••••••••••••• Utilizando los datos del ejemplo 3-1 pueden encontrarse las estimaciones de la media global y de los efectos de los tratamientos como f1.36 f3 =h . y si r = 10 Ya = 0. Las violaciones de los supuestos básicos y la adecuación del modelo pueden investigarse con facilidad mediante el examen de los residuales..LJ i=l ~ a 2:'L_L N n¡ 2 2 (3-15) No se requieren más cambios en el análisis de varianza. la potencia de la prueba se maximiza cuando las muestras tienen el mismo tamaño. .. estos supuestos son que el modelo Yij = f1+r: i +sij describe de manera adecuada las observaciones. el uso de la partición para probar formalmente que no hay diferencias en las medias de los tratamientos requiere que se satisfagan ciertos supuestos. a) y que N = L~=ln¡.+(= Y. . El residual de la observaciónj-ésima en el tratamiento i-ésimo se define como (3-16) donde Yij es una estimación de la observación Yij correspondiente que se obtiene como sigue: Yij = jl+i¡ .76 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA de las sumas de cuadrados. Hay dos ventajas al elegir un diseño balanceado. es decir.. pueden descubrirse muchos tipos de inadecuaciones del modelo y violaciones de los supuestos subyacentes. En esta sección se indica cómo puede hacerse con facilidad la verificación de diagnóstico del modelo mediante el análisis gráfico de los residuales y cómo resolver varias anormalidades que ocurren comúnmente. Y¡. no deberán contener patrones obvios. Sin embargo. en general no es prudente confiar en el análisis de varianza hasta haber verificado estos supuestos. Primera. Si el modelo es adecuado. Específicamente.. el estadístico de prueba es relativamente insensible a las desviaciones pequeñas del supuesto de la igualdad de las varianzas de los a tratamientos cuando los tamaños de las muestras son iguales. Las fórmulas para calcular manualmente SST y SSTratamientos quedan como (3-14) y SS Tratamientos = . No es éste el caso cuando los tamaños de las muestras son diferentes. es común que en la práctica estos supuestos no se satisfagan exactamente. los residuales deberán estar sin estructura.2. Sin embargo. Sea que se hagan ni observaciones bajo el tratamiento i (i = 1. Si estos supuestos se satisfacen. (3-17) La ecuación 3-17 da el resultado intuitivamente claro de que la estimación de cualquier observación en el tratamiento i-ésimo no es sino el promedio del tratamiento correspondiente. Segunda. Por consiguiente. 3~4 VERIFICACIÓN DE LA ADECUACIÓN DEL MODELO La descomposición de la variabilidad presente en las observaciones mediante la identidad del análisis de varianza (ecuación 3-6) es una relación puramente algebraica. y que los errores siguen una distribución normal e independiente con media cero yvarianza cr constante pero desconocida. El examen de los residuales deberá ser una parte automática de cualquier análisis de varianza.. -) Y. A través de un estudio de los residuales. = Yi. el procedimiento del análisis de varianza es una prueba exacta de la hipótesis de que no hay diferencias en las medias de los tratamientos. 8 (21) I . Si la distribución fundamental de los errores es normal.6 (24) I 19 2. se dice que el análisis de varianza (y los procedimientos relacionados como las comparaciones múltiples) es robusto con respecto al supuesto de normalidad.1 El supuesto de normalidad La verificación del supuesto de normalidad podría hacerse graficando un histograma delos residuales.i. La tendencia de la gráfica de probabilidad normal a curvarse hacia abajo ligeramente del lado izquierdo.4 17.4 (8) 1-3.8 15. En el análisis de varianza.4 (10) I 0. Sin embargo. deberá prestarse más atención a los valores centrales de la gráfica que a los valores extremos.2 1 4. es decir.4 (20) 1 0.4 (9) 1. Los numeros entre parentesls mdlcan el orden en que se recolectaron los datos. por lo que la aparición de una desviación moderada de la normalidad no implica necesariamente una violación seria de los supuestos. esta gráfica no muestra una desviación marcada de la distribución normal.8 (19) 15 12 18 22 11 3 4 5 1-0.3-4 VERIFICACIÓN DE LA ADECUACIÓN DEL MODELO 77 3~4.2). suelen ocurrir fluctuaciones significativas. Una distribución de los errores que tiene colas considerablemente más gruesas o delgadas que la distribución normal es motivo de mayor preocupación que una distribución sesgada. La impresión general que surge al examinar esta representación es que la distribución de los errores puede tener un ligero sesgo. Puesto que la prueba F sólo se afecta ligeramente. En la tabla 3-6 se muestran los datos originales y los residuales de los datos de la resistencia a la tensión del ejemplo 3.2 (4) 1 2. La gráfica de probabilidad normal se muestra en la figura 3-4. .4 (2) 1 0. implica que la cola izquierda de la distribución de los errores sea un tanto más delgada de lo que se anticiparía con una distribución normal.4 (7) 1-2.2 10. Si se satisface el supuesto de NID(O.4 (5) I 19 I 23 . Desafortunadamente. Las desviaciones de la normalidad hacen por lo general que tanto el verdadero nivel de significación como la verdadera potencia difieran ligeramente de los valores anunciados.2 (25) I 11 18 19 19 15 1. cuando se trabaja con muestras pequeñas.4 (1) 1 0. Las desviaciones marcadas de la normalidad son potencialmente serias y requieren análisis adicional.6 21. esta gráfica tendrá la apariencia de una línea recta. las desviaciones moderadas de la normalidad no son motivo de gran preocupación en el análisis de varianza de efectos fijos (recuerde el análisis de las pruebas de aleatorización de la sección 3-3.6 I 5.6 (11) 1 1.8 (16) 11 (23) .8 (15) 1-3. por lo general es más eficaz (y directo) hacer lo mismo con los residuales.4 I 3. 35 1-0.2 (12) I 1. En general.8 (17) 7 17 18 25 10 Observaciones (j) 2 1-2. Tabla 3-6 Datos y residuales del ejemplo 3-1 a Peso porcentual del algodón 15 20 25 30 7 12 14 19 7 1-2. El modelo de los efectos aleatorios que se revisará en el capítulo 12 se afecta en forma más severa por la no normalidad.6 (3) 1. Recuerde que en el capítulo 2 se utilizó una gráfica de probabilidad normal de los datos originales para verificar el supuesto de normalidad cuando se usó la prueba t. 0 2) para los errores.8 (6) 9 9. con la potencia siendo generalmente más baja. Los reSIduales se mdlcan en el recuadro de cada celda.6 (22) 1-3.6 (14) (13) 1-3. 0. esta gráfica deberá aparecer como una muestra de una distribución normal con centro en cero. con la cola derecha siendo más larga que la izquierda. Un procedimiento en extremo útil es construir una gráfica de probabilidad normal de los residuales.6 (18) 1-2. los residuales negativos no son tan grandes (en valor absoluto) como se esperaba. Para visualizar la línea recta. el punto atípico puede ser más informativo que el resto de los datos. etc. A un residual así se le llama con frecuencia punto atípico. las circunstancias experimentales que rodean esta corrida particular deben estudiarse con atención. la causa del punto atípico es un error en los cálculos o un error al codificar o copiar los datos. d = __ 9(3 18) ij .JMSE - . La presencia de uno o más puntos atípicos puede introducir serias distorsiones en el análisis de varianza. uno con el punto atípico y uno sin él.55 0. Si no es ésta la causa.2 Figura 3-4 Gráfica de probabilidad normal de los residuales del ejemplo 3-1.7 Residual 2.c Ql 31 ro o.8 -1. Si la respuesta atípica ocurre en un valor particularmente deseable (alta resistencia. Una anomalía muy común que suele ponerse de manifiesto en las gráficas de probabilidad normal es un residual que es mucho más grande que cualquier otro. por lo que cuando se localiza un punto atípico potencial.95 5. Puede hacerse una verificación aproximada de los puntos atípicos examinando los residuales estandarizados e .:i' -3..78 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA 99 95 90 ro SO 70 50 30 20 10 5 E o t: "C :5 ro . costo bajo. puede terminarse con dos análisis. se requiere una investigación atenta. "C e ::!< o ¡g¡m ~.). Existen varios procedimientos estadísticos formales para detectar puntos atípicos (por ejemplo.. ver Barnett y Lewis [8]. Deberá tenerse cuidado de no rechazar o descartar una observación atípica a menos que se tengan razones no estadísticas de peso para hacerlo. John YPrescott [60] YStefansky [107]). En el peor de los casos. En muchas ocasiones. JMSE .83 .2 Gráfica de los residuales en secuencia en el tiempo La graficación de los residuales en el orden temporal de la recolección de los datos es útil para detectar correlaciones entre los residuales. cerca de 95% de ellos deberán estar incluidos dentro de ±2 y virtualmente todos ellos deberán estar incluidos dentro de ±3. Un residual mayor que 3 o 4 desviaciones estándar a partir de cero es un punto atípico potencial.06 2.3 y 3-4. Por lo tanto.84 el cual no deberá ser motivo de preocupación. Esto implicaría que el supuesto de independencia de los errores ha sido violado. Además. 3~4. los residuales estandarizados deberán ser aproximadamente normales con media cero y varianza unitaria.3-4 VERIFICACIÓN DE LA ADECUACIÓN DEL MODELO 79 Si los errores cij son N(O. La aleatorización adecuada del experimento es un paso importante para conseguir la independencia. 02). Esto producirá con frecuencia un cambio en la varianza del error con el tiempo. En las secciones 3-4. Una tendencia a tener corridas de residuales positivos y negativos indica una correlación positiva. cerca de 68% de los residuales estandarizados deberán estar incluidos dentro de los límites ±1. Se trata de un problema potencialmente serio y cuya solución es difícil. 1 :2 o -2 '" -1 a: -3 -4 -5 • • 5 • 20 • • • • • • •• • -6 Figura 3·5 Gráfica de los residuales contra el tiempo. En ocasiones las habilidades del experimentador (o los sujetos) pueden cambiar conforme el experimento avanza. En la tabla 3-6 se muestran los residuales y la secuencia en el tiempo de la recolección de los datos para el experimento de la resistencia a la tensión.2 =1.. Para los datos de la resistencia a la tensión del ejemplo 3-1. por lo que de ser posible es importante evitar el problema cuando se colecten los datos. o el proceso bajo estudio puede "vagar sin rumbo" o volverse más errático. Una varianza no constante es un problema potencialmente serio. Esta condición suele llevar a una gráfica de los residuales contra el tiempo que muestra una dispersión mayor en uno de sus extremos que en el otro. En la figura 3-5 se presenta una gráfica de estos residua6 5 4 • • • • • • •• • • 15 Tiempo 3 2 .4 se abundará sobre el tema. el residual estandarizado mayor es d 13 =~=~= 5. . la gráfica de probabilidad normal no produce indicio alguno de puntos atípicos.J8. ro :J ID :::. Específicamente.) Si éste fuera el caso. la prueba F sólo resulta afectada ligeramente en el modelo balanceado (el mismo tamaño de la muestra en todos los tratamientos) con efectos fijos.- c:r: -1 •• • • 10 15 Yij -• • • • 20 25 -2 -3 -4 • • • -5 -6 Figura 3·6 Gráfica de los residuales contra los valores ajustados. en diseños no balanceados o en casos en que una de las varianzas es considerablemente más grande que las demás. porque en las distribuciones sesgadas la varianza tiende a ser una función de la media.O • • • 5 -E '¡¡.----l. No es evidente ninguna estructura inusual. sesgada.80 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA les contra el tiempo. los residuales se harían mayores conforme Yij se hiciera más grande. al ro Ol-----'----J. si los niveles del factor con las varianzas mayores tienen también los tamaños de las muestras mayores. Sin embargo.>::. en particular. el problema es más grave. 3..· el índice de error tipo 1 real es mayor que lo previsto (o los intervalos de confianza tienen niveles de confianza reales más bajos que los que fueron especificados).----'----L. Recíprocamente.:. En la figura 3-6 se grafican los residuales contra los valores ajustados para los datos de la resistencia a la tensión del ejemplo 3-1. (Esto ocurre comúnmente con muchos instrumentos de medición. Si se viola el supuesto de la homogeneidad de las varianzas. No hay razón para sospechar cualquier violación de los supuestos de independencia o de una varianza constante. En ocasiones la varianza de las observaciones se incrementa cuando la magnitud de la observación se incrementa. Para los modelos con efectos aleatorios.3 Gráfica de los residuales contra los valores ajustados Si el modelo es correcto y se satisfacen los supuestos. Éste sería el caso si el error o ruido de fondo del experimento fuera un porcentaje constante de la magnitud de la observación.) Esta gráfica no deberá mostrar ningún patrón obvio. los niveles de significación son mucho menores que lo anticipado (los niveles de confianza son más altos). las 6 5 4 3 2 ri. incluyendo la respuesta predicha.4. Un defecto que sale a relucir en ocasiones en esta gráfica es una varianza no constante. y la gráfica de los residuales contraYij se vería como un embudo o un megáfono con la boca hacia afuera. . no deberán estar relacionados con ninguna otra variable. los residuales deberán estar sin estructura. Una verificación simple es graficar los residuales contra los valores ajustados Y¡j' (Para el modelo de un experimento con un solo factor. recuerde que Yij = Yi. Ésta es una buena razón para escoger tamaños de las muestras iguales siempre que sea posible. si los niveles del factor que tienen las varianzas mayores corresponden también con los tamaños de las muestras más pequeños. el error es un porcentaje de la escala de medición. Una varianza no constante también surge en los casos en que los datos siguen una distribución no normal.> el promedio del tratamiento i-ésimo.. Estas pruebas pueden considerarse como pruebas formales de las hipótesis Ho:o¡ =o~ = "'=0. si las observaciones siguen la distribución de poisson. Al final de esta sección se ofrecen algunos consejos al respecto. Las transformaciones que se hacen para la desigualdad de la varianza afectan también la forma de la distribución del error. es útil. Para más detalles sobre las transformaciones. En este enfoque..o.3026 1 c (3-19) q=(N-a)loglo c=1+ 1 3(a-1) S~ i=l ! (ni -1)10glO Si 2 (! a . Dolby [38] y Draper y Hunter [39]. Si los experimentadores conocen la distribución teórica de las observaciones. siendo el resultado un experimento cuya interpretación es más sencilla. . En los experimentos factoriales. otro enfoque es seleccionar una transformación que minimice el cuadrado medio de las interacciones.1 grados de libertad cuando las a muestras aleatorias son de poblaciones normales independientes. El procedimiento incluye el cálculo de un estadístico cuya distribución de muestreo está aproximada muy de cerca por la distribución ji-cuadrada con a . pueden hacer uso de esta información para elegir la transformación. se usaría la transformación de la raíz cuadrada Y~ = o Y~ = ~1 + Yij' Si los datos siguen la distribución lognormal. incluso cuando se usan diseños balanceados.3-4 VERIFICACIÓN DE LA ADECUACIÓN DEL MODELO 81 varianzas del error diferentes pueden introducir alteraciones significativas en las inferencias sobre los componentes de la varianza. la transformación logarítmica Y~ = log Yij es adecuada. la transformación arcseny~ = arcsenJY. Para datos binomiales expresados como fracciones.. H 1 : el enunciado anterior no es verdadero para al menos una o¡ Un procedimiento muy utilizado es la prueba de Bartlett. Se han dedicado considerables esfuerzos de investigación a la selección de una transformación adecuada. referirse a Bartlett [7]. S2 = P N-a y S¡2 es la varianza muestral de la población i-ésima. Cuando no hay una transformación obvia.i=-"l i=l (n¡-1 r1 -(N-a r1 ) _ 2: (n¡ -1)S. deberá tenerse presente que las conclusiones del análisis de varianza se aplican a las poblaciones trans!01madas. En el capítulo 14 se revisan con mayor detalle los métodos para seleccionar analíticamente la forma de la transformación. el experimentador realizará por lo general la búsqueda empírica de una transformación que iguale la varianza independientemente del valor de la media. El estadístico de prueba es x~ donde = 2. ¡y.. la transformación hace que la distribución del error esté más cerca de la distribución normal. El enfoque usual para abordar el problema de una varianza no constante que ocurre por las razones expuestas antes consiste en aplicar una transformación para estabilizar la varianza para correr después el análisis de varianza en los datos transformados. los cuales se introducen en el capítulo 5. se han propuesto también varias pruebas estadísticas. Box y Cox [15]. Por ejemplo. Pruebas estadísticas para la igualdad de la varianza Aun cuando es frecuente el uso de las gráficas residuales para diagnosticar la desigualdad de la varianza. En la mayoría de los casos. S~ = 9. _{i = 1.. = 6.3+ loglo 6.2+ 10glO 9.2.2] = 0. ..8+ 10glO 4.45 c= 1+ 3(14) y el estadístico de prueba es (%.93 o (1.0)= 1. 2. Entonces si S2 = 4(11. Johnson y Johnson [31]) es un procedimiento muy útil que es robusto en cuanto a las desviaciones de la normalidad.05. 2. = 8. Anderson y McLean [2] presentan una atinada revisión de algunas pruebas estadísticas de la igualdad de la varianza. Se calculan primero las varianzas muestrales de cada tratamiento y se encuentra que S12 = 11. puede haber situaciones en las que sería útil un procedimiento alternativo.3026 (0.06).2) = 8. y es igual a cero cuando todas las S¡ son iguales. EJEMPLO 3-4 .49. Por lo tanto.a-l donde X~.3.06 p 20 q = 20 10glO (8. Sea que estas desviaciones se denoten por =IYij . . es decir. cuando la validez de este supuesto está en duda.45) = 0. si = 4. las varianzas de las observaciones de . no deberá usarse la prueba de Bartlett.. 4 = 9.8+ 10glO 8. También podría usarse el enfoque del valor P para tomar una decisión.. se rechaza H o sólo cuando 2 X o >X2 a.8)+4(4.82 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA La cantidad q es grande cuando la diferencia entre las varianzas muestrales Si2 es considerablemente grande.8)+4(8. Se trata de la misma conclusión a la que se llegó al analizar la gráfica de los residuales contra los valores ajustados. a l' "i d¡j La prueba de Levene modificada evalúa entonces si la media de estas desviaciones es igual ó no para todos los tratamientos.a-l es el punto porcentual a superior de la distribución ji-cuadrada con a . Debido a que la prueba de Bartlett es sensible al supuesto de normalidad.. Para probar la hipótesis de que las varianzas son iguales en todos los tratamientos.. por ejemplo y.8.3)+4(6. La prueba de Bartlett es muy sensible al supuesto de normalidad. la prueba de Bartlett puede aplicarse a los datos de la resistencia a la tensión del experimento del peso porcentual de algodón del ejemplo 3-1.2)+4(9. Cuando las desviaciones medias son iguales. Ya que el supuesto de normalidad no está en entredicho.. la prueba de Levene modificada utiliza la desviación absoluta de las observaciones Yij de cada tratamiento de la mediana de los tratamientos. H o deberá rechazarse para los valores de X~ que sean muy grandes.4[10glO 11. Por consiguiente.10 X2 = 2. La prueba de Levene modificada (ver Levene [72] y Conover.Yil J"= 1.8 YS.1 grados de libertad. no puede rechazarse la hipótesis nula y se concluye que las cinco varianzas son iguales. .10) Puesto que X ~.2. 520 2.47 1.31 8.. podrían usar esta información como guía para la selección de la forma de la transformación.001 .66 1.77 Método de estimación Desviaciones d¡¡ para la prueba de Levene modificada 0.56 0.945 4.63 7. Un ingeniero civil está interesado en determinar si cuatro métodos diferentes para estimar la frecuencia de las inundaciones producen estimaciones equivalentes de la descarga pico cuando se aplican a la misma cuenca..71 2.12 0.. la prueba de Levene rechaza la hipótesis nula de que las varianzas son iguales.23 0.805 15. Cada procedimiento se usa seis veces en la cuenca.70 1. Por lo tanto. 0. La parte superior de la tabla 3-7 contiene las medianas de los tratamientos Ji.1041 76.94 6... Se aplicará la prueba de Levene modificada a los datos de la descarga pico.495 1.610 7.1157 3. coincidiendo en esencia con el diagnóstico que se hizo a partir del examen visual de la figura 3-7.. es preocupante porque la forma de embudo con la boca hacia afuera indica que no se satisface el supuesto de una varianza constante. implica que hay una diferencia en las estimaciones de la descarga pico promedio obtenidas en los cuatro procedimientos.12 4. La prueba de Levene consiste en realizar un análisis de varianza estándar en las dijo El estadístico de pruebaF que resulta en este caso es Fa = 4.09 1..59 s¡ 0..66 2.70 2.55 7.14 9.77 0.24 0.37 3 17.07 Valor P <0. El estadístico de prueba para la prueba de Levene es simplemente el estadístico F ANOVA usual para probar la igualdad de las medias que se aplica a las desviaciones absolutas....91 2 2.3-4 VERIFICACIÓN DE LA ADECUACIÓN DEL MODELO 83 Tabla 3-7 Datos de la descarga pico Método de estimación 0..715 1. Se Tabla 3-8 Análisis de varianza de los datos de la descarga pico Fuente de Suma de Grados de variación cuadrados libertad Métodos 708.95 0.34 1 0.40 0.... EJEMPLO 3 ~ 5 .09 17. para el cual el valor Pes P = 0. y los datos de las descargas resultantes (en pies cúbicos por segundo) se muestran en la parte superior de la tabla 3-7.61 1.86 9.82 Y¡.25 2..18 1..23 2. la cual se muestra en la figura 3-7...36 6.55.....20 1. La gráfica de los residuales contra los valores ajustados.25 1.24 16.64 0.23 1 2 3 4 todos los tratamientos serán iguales.35 0. 0..15 4 11.0811 Total 23 770.0137.94 0. Selección empírica de una transformación Se señaló ya que si los experimentadores conocieran la relación entre la varianza de las observaciones y la media.015 1.72 Ji.3471 3 Error 20 62.. El análisis de varianza de los datos.75 2.. y la parte inferior contiene las desviaciones dij alrededor de las medianas. el cual se resume en la tabla 3-8.565 1.18 0..33 0.565 3.82 Observaciones 1..82 14. Los datos de la descarga pico son un buen candidato para una transformación de datos.75 10...4282 Cuadrado medio 236.71 0.40 1.93 14. Observe que A = O implica la transformación logarítmica. SeaE(y) = ¡tIa media dey. si se hace A = 1 . y suponga que la desviación estándar dey es proporcional a una potencia de la media de y tal que Quiere encontrarse una transformación de y que produzca una varianza constante. Una transformación suave aplicada a datos que se extienden en un rango estrecho tiene escaso efecto sobre el Tabla 3-9 Transformaciones para estabilizar la varianza Relación entre OyY fl a A=l-a 1 1/2 O Transformación Sin transformación Raíz cuadrada Log Raíz cuadrada recíproca Recíproco Comentario Datos (números) de Poisson o 1/2 1 3/2 2 -1/2 -1 .a. Suponga que la transformación es una potencia de los datos originales. la varianza de los datos transformados y* es constante. Estas transformaciones se enlistan en el orden de fuerza creciente. En la tabla 3-9 se resumen varias de las transformaciones comunes analizadas anteriormente.84 4 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA 3 2 • • • '" ::::- o -1 • a I • • • • • 5 • • • • • -2 -3 -4 • o Figura 3·7 Gráfica de los residuales contra Yij para el ejemplo 3-5. por ejemplo i'=yA Puede demostrarse entonces que (3-20) a y' oc 11 A+a-l t'" (3-21) Evidentemente. desarrolla ahora este punto y se presenta un método para seleccionar empíricamente la forma de la transformación requerida de los datos. Por fuerza de una transformación se entiende la cantidad de curvatura que induce. pueden sustituirse estimaciones razonables de ellos en la ecuación 3-22 Yusar la pendiente del ajuste de la línea recta resultante como estimación de a.ui (3-22) Por lo tanto. y* = yY Fuente de variación Métodos Error Thtal Suma de cuadrados 32. para los datos de la descarga pico del ejemplo 3-5.3726 Grados de libertad 3 19 22 Cuadrado medio 10. en términos más generales. pueden tomarse logaritmos para obtener loga Yi = 10g8+alog.0 • • • 0. análisis.99 ValorP <0. por lo que se concIuTabla 3·10 Análisis de varianza de los datos transformados de la descarga pico. Puesto que no se conocen a Yi y. y en la figura 3-9 se muestra una gráfica de los residuales contra la respuesta predicha. esto implica que la transformación de la raíz cuadrada puede ser apropiada. se usaría la desviación estándar Si y el promedio y¡. una gráfica de lag a Yi contra log. Puesto que la combinación i-ésimo de los tratamientos a Yi ex: fl ~ = 8. El análisis de varianza de los datos transformadosy* = vy se presenta en la tabla 3-10.5 85 1.6842 2.3-4 VERIFICACIÓN DE LA ADECUACIÓN DEL MODELO 1...u¡.u ~ . a puede estimarse empíricamente a partir de los datos.6884 35. por la tabla 3-9. del tratamiento i-ésimo (o.001 . La pendiente de la recta que pasa por estos cuatro puntos está cerca de 1/2 y. Esta gráfica residual muestra una mejoría sensible en comparación con la figura 3-7. en la figura 3-8 se grafica lag S¡ contra logy¡. donde 8 es una constante de proporcionalidad. la combinación i-ésima de los tratamientos o conjunto de condiciones experimentales) para estimar a Yi y . Con frecuencia las transformaciones tienen escaso efecto a menos que el cociente YrnáJ/Yrnín sea mayor que 2 o 3. Para investigar la posibilidad de usar una transformación para estabilizar la varianza en los datos de la descarga pico del ejemplo 3-5.1415 76.8947 0. De manera típica.5 CIj- E O> O -0.u¡. mientras que una transformación fuerte aplicada en un rango amplio puede tener resultados dramáticos.5 • -1 Figura 3-8 Gráfica de lag Si contra logy.ui sería una línea recta con pendiente a. En muchas situaciones de diseño experimental en las que se usan réplicas. 25 .86 1. Sin embargo. llevar a cabo el análisis estadístico e investigar los supuestos fundamentales.00 0.00 • • • • • 110 I • • ti • • • • • O Figura 3-9 Gráfica de los residuales de los datos transformados contra yij para los datos de la descarga pico del ejemplo 3-5. muchos experimentadores seleccionan la forma de la transformación probando varias alternativas y observando el efecto de cada transformación en la gráfica de los residuales contra la respuesta predicha. Entonces se selecciona la transformación que produjo la gráfica residual más satisfactoria. el experimentador está listo para sacar conclusiones prácticas acerca del problema bajo estudio. por lo que los residuales deberán graficarse contra el espesor de la fibra. y ciertamente en los experimentos sencillos que s.25 -0. . 3~4. Muchas veces esto es relativamente fácil.50 0. ye que la transformación de la raíz cuadrada ha sido útil. Los patrones en tales gráficas residuales implican que la variable afecta la respuesta.e han considerado hasta este punto. En la práctica. En esta sección se presentarán algunas de ellas.4 Gráficas de los residuales contra otras variables Si se hán recolectado datos de cualesquiera otras variables que posiblemente pudieran afectar la respuesta.iJ::' O CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA • • • • • -0. tal vez mediante la inspección de las representaciones gráficas. los residuales deberán graficarse contra estas variables. los residuales deberán graficarse contra las máquinas. Esto sugiere que la variable debería controlarse con mayor atención en experimentos futuros o que debería incluirse en el análisis. Si se usaron diferentes máquinas de prueba para recolectar los datos. en algunos casos es necesario aplicar técnicas más formales. esto podría hacerse de manera un tanto informal.50 -0. como los diagramas de caja y el diagrama de dispersión de las figuras 3-1 y 3-2. Por ejemplo.75 0. Observe que en la tabla 3-10 se han reducido los grados de libertad del error en 1 para tomar en consideración el uso de los datos para estimar el parámetro de la transformación a. 3~5 INTERPRETACIÓN PRÁCTICA DE LOS RESULTADOS Después de realizar el experimento. la resistencia puede ser afectada de manera significativa por el espesor de la fibra. en el experimento de la resistencia a la tensión del ejemplo 3-1.75 -1. la presión o el tiempo. Si el factor es cualitativo. como la temperatura.3-5 INTERPRETACIÓN PRÁCTICA DE LOS RESULTADOS 87 3~5. son aquellos cuyos niveles no pueden ordenarse por magnitud. Véase también el material suplementario del texto para este capítulo.!!! ro ro '0 . El experimentador está interesado en determinar las diferencias. el experimentador tiene con frecuencia interés en desarrollar una ecuación de interpolación para la variable de respuesta del experimento. como los operadores. ambos tipos de factores se tratan de manera idéntica. En la figura 3-10 se presenta el diagrama de dispersión de la resistencia a la tensión y contra el peso porcentual del algodón x en la tela para el ~xperimento del ejemplo 3-1.1 Un modelo de regresión Los factores que intervienen en un experimento pueden ser cuantitativos o cualitativos. En esta sección se ilustra brevemente la técnica utilizando los datos de la resistencia a la tensión del ejemplo 3-1. Por lo tanto. . no tiene sentido considerar la respuesta de una corrida subsecuente en un nivel intermedio del factor. Los círculos huecos de la gráfica son las resistencias de tensión promedio para cada valor x del peso porcentual del algodón. ya que no existe ninguna razón para ordenarlos bajo algún criterio numérico particular.0 en el experimento.0 Y3.!!! 11I c: :!l 10 al a:: .. si se usan los niveles 1. por otra parte. los lotes de materia prima y los cambios de tumo son factores cualitativos típicos. A partir del examen del diagrama de dispersión. Los factores cualitativos. el experimentador tiene interés por lo general en el rango completo de los valores usados. Esta ecuación es un modelo empírico del proceso que se ha estudiado. en caso de haberlas. con un factor cuantitativo como el tiempo. tal vez quiera predecir la respuesta de 2. ~ 5 • • Figura 3-10 Diagrama de dispersión para los datos de la resistencia a la tensión del ejemplo 3-1. es evidente que la relación entre la resistencia a la tensión y el peso 25 • ~ ". En lo que se refiere al diseño inicial y al análisis del experimento. Es decir.5 horas. Los operadores. entre los niveles de los factores. el cual se analiza en detalle en el capítulo 10. particularmente la respuesta de una corrida subsecuente con un nivel intermedio del factor. c: :!l .¡¡.-X • 20 ¿ '" ~ 'o 15 . Sin embargo. Un factor cuantitativo es aquel cuyos niveles pueden asociarse con puntos en una escala numérica. Al enfoque general para ajustar modelos empíricos se le llama análisis de regresión. 2.0. Sin embargo. pero no se especifica exactamente cuáles medias difieren..9. Es común llamar a los procedimientos para hacer estas comparaciones métodos de comparaciones múltiples. En otros casos. La media del tratamiento i-ésimo se define como fl. el modelo empírico podría usarse para la optimización del proceso. El ajuste con el modelo cúbico resultante es y= 62. por ejemplo donde/3o. y es relativamente sencillo excederse en el ajuste. seleccionar el orden del polinomio de aproximación no siempre es fácil. El modelo cúbico parece mejor que el cuadrático porque proporciona un ajuste mejor para x = 25 Y x = 30% de algodón. + ti' y fl. Éste consiste en elegir estimaciones de las /3 tales que minimicen la suma de cuadrados de los errores (las [. Como una primera aproximación.6114. Más adelante se analizarán e ilustrarán en detalle estos problemas. sería preferible hacer el ajuste con el polinomio de orden menor que describa adecuadamente el sistema o proceso./31 y/32 son parámetros desconocidos que deberán estimarse y [.9886+4.¡ =fl. En ocasiones pueden ser de utilidad en esta situación las comparaciones y los anáUsis adicionales entre grupos de las medias de los tratamientos. ya que subestima de manera drástica las respuestas para x = 30% de algodón y sobrestima las respuestas para x = 25%.) En la figura 3-10 se muestra este modelo cuadrático. por lo que la complejidad adicional del modelo cúbico se justifica. En general.88 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA porcentual del algodón no es lineal. En este ejemplo. Quizá pueda lograrse un mejoramiento agregando un término cúbico enx. podría intentarse ajustar un modelo cuadrático para los datos.el modelo empírico podría usarse para predecir la resistencia a la tensión media para los valores del peso porcentual del algodón dentro de la región de experimentación. No parece muy satisfactorio. . para encontrar los niveles de las variables del diseño que dan como resultado los mejores valores de la respuesta. es decir. es un término del error aleatorio. 3~5.596x. El ajuste de mínimos cuadrados en el ejemplo que se considera aquí es y= -39.¡ se estima con y¡.0114x+0.2 Comparaciones entre las medias de los tratamientos Suponga que al hacer el análisis de varianza en el modelo con efectos fijos se rechaza la hipótesis nula.0.. agregar polinomios de orden superior que no mejoran en realidad el ajuste pero que incrementan la complejidad del modelo y con frecuencia demeritan su utilidad como predictor o ecuación de interpolación. En este ejemplo.0076x 3 Este ajuste cúbico se ilustra también en la figura 3-10. el polinomio cúbico parece un mejor ajuste que el cuadrático. hay diferencias entre las medias de los tratamientos. Por lo tanto. En varias de las secciones siguientes se analizan los métodos para hacer comparaciones entre las medias de los tratamientos individuales o de grupos de estas medias. Las comparaciones entre las medias de los tratamientos se hacen ya sea en términos de los totales de los tratamientos {y¡'} o bien de los promedios de los tratamientos {jIJ.0886x 2 (Si el lector no está familiarizado con los métodos de regresión.4814x 2 - 0. El método que se usa con mayor frecuencia para estimar los parámetros en un modelo como éste es el método de mínimos cuadrados. vea el 'capítulo 10 y el material suplementario del texto para este capítulo. es decir.). Sin embargo.JMSE / n =. Para trazar la distribución t de la figura 3-11. Por consiguiente. deberá haber una posición de esta distribución que haga evidente que los valores y¡... las medias muestrales observadas Y¡. Esto implica que las cinco medias no son iguales..J MS E/n en lugar de la distribución·normal. 25 5 10 15 • 30 20 • 25 Resistencia a la tensión promedio (lb/pulg 2 ) Figura 3-11 Promedio de la resistencia a la tensión del experimento del peso porcentual del algodón en relación con una distribución t con un factor de escalación . Si quiere obtenerse mayor precisión.Ya. La distribución puede tener un origen arbitrario. En la figura 3-11. si todas las medias de los niveles del factor son idénticas.Ya. Si todas las medias de los tratamientos son iguales.D6 / 5 =127. . se comportarían como un conjunto de observaciones tomadas al azar de una distribución normal con mediaY.JS.. la figura es una representación gráfica de los resultados del análisis de varianza. . Dada la gran similitud entre la distribución t y la normal.. Hunter y Hunter [18] se incluye una tabla de los valores de las abscisas t y las ordenadas correspondientes. Suponga que el factor de interés tiene a niveles y que Y1.5. por lo general este trazo se construye fácilmente a ojo.JMSE / n = . y desviación estándar a/. Visualice una distribución normal con la capacidad de ser deslizada sobre un eje abajo del cual están graficadasY1. En la figura 3-11 se muestra este arreglo para los datos de la resistencia a la tensión del ejemplo 3-1. y que 15 o 35 por ciento de algodón (las cuales son aproximadamente iguales) producirían resistencias a la tensión aún más bajas. los valores Y¡. el origen es 15 lb/pulg2 • Visualice ahora el desplazamiento de la distribución t de la figura 3-11 sobre el eje horizontal y examine las cinco medias graficadas en la figura. se sacaron de la misma distribución. La figura indica que 30% de algodón produce resistencias a la tensión mucho más altas que 20 o 25 por ciento de algodón (las cuales son aproximadamente iguales). que van a compararse. aun cuando por lo general es mejor uno que esté en la región de los valores Y¡.... Si no es éste el caso. . La única falla en esta lógica es que a es desconocida. excepto porque la primera es un poco más plana cerca del centro y tiene colas más largas. Si se conoce a.3-5 INTERPRETACIÓN PRÁCTICA DE LOS RESULTADOS 89 3. el promedio de cualquier tratamiento tendría una desviación estándar aNli. .[ii. simplemente se multiplica el valor de la abscisa t por el factor de escalación . puede sustituirse a con .J8... son los promedios de los tratamientos. que no parecen haberse sacado de esta distribución se asocian con los niveles del factor que producen respuestas medias diferentes. en Box..06/ 5 = 1. Observe que no hay ninguna posición de la distribución tal que los cinco promedios puedan considerarse como observaciones típicas seleccionadas al azar de la distribución.27 y se grafica contra la ordenada de t en ese punto.'Y2.3 Comparaciones gráficas de medias Es muy sencillo desarrollar un procedimiento gráfico para la comparación de las medias después de un análisis de varianza.JMS E del análisis de varianza y usar una distribución t cQn un factor de escalación.'Y2. por lo tanto. un contraste es una combinación lineal de parámetros de la forma donde las constantes de los contrastes cl .4 Contrastes Muchos métodos de comparaciones múltiples utilizan el concepto de contraste. es decir.. H o : ¡l4 .fls =O + flz - =O (3-24) En general. Puesto que se rechazó la hipótesis nula.é O .fls =O (3-23) H l :fl4-fls . 3. ¿cuáles son los que causan en realidad esta diferencia? Al principio del experimento podría sospecharse que los niveles 4 y 5 del peso porcentual del algodón (30 y 35 por ciento) producen la misma resistencia a la tensión. Considere el problema de la prueba de la fibra sintética del ejemplo 3-1. L ~=l c¡ riores pueden expresarse en términos de contrastes: Ho Hl = O. A continuación se presenta una breve revisión de algunos de estos procedimientos.. ca suman cero. Sin embargo.é0 Si desde el principio del experimento se hubiera sospechado que el promedio de los niveles más bajos del peso porcentual del algodón (1 y 2) no difería del promedio de los niveles más altos del peso porcentual del algodón (4 Y 5). existen métodos más formales.5. pero.é fl4 +fls o Ho:fll H l : fll +flz -fl4 -fls fl4 . de manera equivalente. oo. entonces la hipótesis habría sido Ho:fll Hl:fll +flz +flz = fl4 +fls . Las dos hipótesis ante- :! :! ¡=1 i=1 c¡fl¡ =O (3-25) C¡fl¡. lo cual implicaría que la hipótesis por probar sería H o : fl4 = fls H l :fl4 .é fls o. se sabe que algunos pesos porcentuales del algodón producen resistencias a la tensión diferentes que otros. Cz.90 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA Este procedimiento simple es una técnica aproximada pero eficaz en muchos problemas de comparaciones múltiples. . N-a' En el segundo enfoque se utiliza la prueba F.)2 1=1 nMSE 2: C.. En el primer método se utiliza la prueba t.. i=1 a (3-28) como un estadístico F para probar la ecuación 3-25. obteniéndose • c=! i=l La varianza de C es V(C) = n0 2 2: c. El contraste de interés se escribe en términos de los totales de los tratamientos. La hipótesis nula se rechazaría si It oI de la ecuación 3-27 excede tal2.o = t o 2 ! ( = C i y¡. Entonces se sustituiría la varianza desconocida a2 con su estimación. el error cuadrático medio MSE' y se utilizaría el estadístico (3-27) para probar las hipótesis de la ecuación 3-25. Si la hipótesis nula de la ecuación 3-25 es verdadera. Por lo tanto.. Entonces.:.N-a' Este estadístico de prueba de la ecuación 3-28 puede escribirse como MS c SSc /1 Fo = MS = MS E E donde la suma de cuadrados de los contrastes con un solo grado de libertad es SS C = . La hipótesis nula se rechazaría si Fo > Fa .:.. el cociente i=1 tiene la distribuciónN(O. el cuadrado de una variable aleatoria t con v grados de libertad es una variable aleatoria F con un grado de libertad en el numerador y v grados de libertad en el denominador.3-5 INTERPRETACIÓN PRÁCTICA DE LOS RESULTADOS 91 Las pruebas de hipótesis que incluyen contrastes pueden hacerse de dos maneras básicas.1.. ¡=1 a (3-26) cuando los tamaños de las muestras de cada tratamiento son iguales.1=~1_ _-'--i=1 ! C¡Yi. puede obtenerse F.)2 ( n! C¡2 (3-29) . 1). se obtendrá un contraste estandarizado con varianza cJ2. puede ser más útil construir un intervalo de confianza. no podría rechazarse la hipótesis nula en fa ecuación 3-25.a) por ciento para el contraste "L~=1cdti es (3-30) Evidentemente. Suponga que el contraste de interés es r=}: i=1 Al sustituir las medias de los tratamientos con los promedios de los tratamientos se obtiene y V(C)=~ L c. =0 L. n i=1 2 a cuando los tamaños de las muestras son iguales. Entonces el contraste estandarizado es en realidad donde Tamaños de las muestras desiguales Cuando los tamaños de las muestras de cada tratamiento son diferentes. con frecuencia es útil evaluarlos en la misma escala.J ~. el intervalo de confianza de 100(1 . . Una forma de hacer esto es estandarizando el contraste para que su varianza sea a2 • Si el contraste "L~=1Cif. Contraste estandarizado Cuando hay interés en más de un contraste. al dividirlo por ~ n"L ~=1 c. se introducen modificaciones menores en los resultados anteriores.c. Entonces el contraste suele expresarse en términos de los promedios de los tratamientos Yi. l a i=1 . si este intervalo de confianza incluye al cero.92 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA Intervalo de confianza para un contraste En lugar de probar hipótesis acerca de un contraste. observe que la definición de un contraste requiere ahora que ~ n. Primero. Si se usaMSE para estimar cJ2.1i se expresa en términos de los totales de los tratamientos como "L ~=1 C i Yi. . En general.1 componentes independientes con un solo grado de libertad. · ¡ '··1'·.1. si haya = 3 tratamientos. donde el tratamiento 1 es de control y donde los niveles del factor en los tratamientos 2 y 3 son de interés para el experimentador. 1. los contrastes se especifican antes de llevar a cabo el experimento y de examinar los datos.5 Contrastes ortogonales Un caso especial útil del procedimiento de la sección 3-5.4 es el de los contrastes ortogonales. Por ejem'plo. 1 compara los dos niveles del factor de interés. si las comparaciones se seleccionan después de examinar los I!i! 1. -1. los contrastes ortogonales apropiados podrían ser los siguientes: Coeficientes de los contrastes ortogonales Tratamiento 1 (control) 2 (nivel 1) 3 (nivel 2) -2 1 1 o -1 1 Observe que el contraste 1 con c¡ = -2. Por lo tanto. En general. el estadístico t de la ecuación 3-27 queda como y la suma de cuadrados de los contrastes de la ecuación 3-29 queda como 3~5. algún elemento en la naturaleza del experimento deberá sugerir las comparaciones que son de interés. mientras que el contraste 2 con di = O. Es decir. Por ejemplo. si c¡d¡ =O ¡=1 ! n¡c¡d¡ =0 ¡=1 Para a tratamientos.3-5 INTERPRETACIÓN PRÁCTICA DE LOS RESULTADOS 93 Otros cambios requeridos son directos. Dos contrastes con coeficientes {cJ y {dJ son ortogonales si ! o. el método de contrastes (o de contrastes ortogonales) es útil para lo que se llama comparaciones preplaneadas. para un diseño no balanceado. las pruebas que se realizan en los contrastes ortogonales son independientes. el conjunto de a -1 contrastes ortogonales hace la partición de la suma de cuadrados debida a los tratamientos en a . La razón de esto es que. 1 compara el efecto promedio del factor con el control. :i ~ ii li: li . Existen varias maneras de elegir los coeficientes de los contrastes ortogonales para un conjunto de tratamientos. El método de Scheffé para todas las comparaciones.25 152.60 31.l2 = f.10 5(2) C4 = -1(49)+4(77)-1(88)-1(108)-1(54) = 9 SS ( 9)2 =--=0.ll + f. Hay cinco medias de los tratamientos y cuatro grados de libertad entre estos tratamientos.25) (152.l1 + f.l1 =f.25 + 1(88)-1(108)-1(54) = -25 SS -1(88) =-39 SS C2 C3 = +1(49) c.l3 + f.20 636. Utilizando los datos de la tabla 3-4.l4 + f. C2 = Y!.06 <0. C3 = YI. C4 = -Y!.81) 161.76 .l2 = f.ll =f. +Y3. se encuentra que los valores numéricos de los contrastes y de las sumas de cuadnidos son los siguientes: c1 = C 2 =+1(49) -1(108)+1(54) = -54 ss Cl = (-54)2 = 291.l5 Contraste C¡ = -Y4+Y5.10 Valor P <0..001 <0.6 .l4 + f.76 (291. las diferencias observadas serán el resultado del error. Considere los datos del ejemplo 3-1.l5 Ho:f. . 5(20) Tabla 3-11 Análisis de varianza de los datos de la resistencia a la tensión Fuente de variación Peso porcentual del algodón contrastes ortogonales C¡:f.001 0.10) (0.06 Fo 14. en un porcentaje inusualmente elevado de las comparaciones seleccionadas.Y4. Estas diferencias grandes podrían ser el resultado de la presencia de efectos reales o podrían ser el resultado del error aleatorio. .96 Grados de libertad 4 1 1 1 1 20 24 Cuadrado medio 118.60 5(2) = (-25)2 5(4) 31.l4 = f.l3 = f.l5 Error Total Suma de cuadrados 475.87 0.10 0.l3 = f.94 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA datos.Y3. la mayoría de los experimentadores construirían pruebas que corresponderían con las diferencias grandes observadas en las medias. Suponga que antes de correr el experimento se especificó la siguiente serie de comparaciones entre las medias de los tratamientos (y sus contrastes asociados): Hipótesis HO :f. Si los experimentadores se inclinan consistentemente a escoger las diferencias más grandes para hacer las comparaciones.81 c. EJEMPLO 3.l3 + f. Al examen de los datos para seleccionar las comparaciones de interés potencial se le llama con frecuencia curioseo o sondeo de datos. + 4Y2.-Y4. inflarán el error tipo 1 de la prueba porque es probable que. Observe que los coeficientes de los contrastes son ortogonales. -Y3.18 3. . = (-39)2 = 152.ll + f. el cual se comenta en la sección siguiente.l3 H o:4f.l5 Ho:f.Y5.l5 C2:f.76 36.81 8.ll + f.-Y5.88 18.l5 C3:f.l3 C4:4f. permite el curioseo o sondeo de datos.001 0.60) (31.l4 + f.l4 = f.94 291.l4 + f. Yi h -) _4. las comparaciones de interés sólo se descubren después del examen preliminar de los datos. el error tipo 1 es a lo sumo a para cualquiera de las comparaciones posibles.a. 2. por ejemplo C u Sa. son intervalos de confianza simultáneos por cuanto la probabilidad de que todos ellos sean verdaderos simultáneamente es al menos 1 .a-1. . Yque el nivel 2 no difiere del promedio de los otros cuatro niveles . o pueden tener interés en más de a -1 posibles comparaciones. como se muestra en la tabla 3-11.3-5 INTERPRETACIÓN PRÁCTICA DE LOS RESULTADOS 95 Estas sumas de cuadrados de los contrastes hacen la partición completa de la suma de cuadrados de los tratamientos. Por los valores P se concluye que hay diferencias significativas entre los niveles 4 y 5 Y1 Y3 del peso porcentual del algodón. = 9.u = SCu . Los intervalos resultantes. 3~5.t1-¡. m (3-32) SCu = MsEI (c~ In i=1 i ) (3-33) donde ni es el número de observaciones en el tratamiento i-ésimo. Scheffé [98a] ha propuesto un método para comparar todos y cada uno de los contrastes posibles entre las medias de los tratamientos. Ys.u.80 = 5.. y el error estándar de este contraste es + o" +cauYa. se rechaza la hipótesis de que el contraste r" es igual a cero. Puede demostrarse que el valor crítico contra el que deberá compararse C" es Sa. Las pruebas de estos contrastes ortogonales se incorporan por lo general en el análisis de varianza. En el método de Scheffé. u=l. es C u = c1u J\ +C 2"Y2.21. En muchos experimentos de exploración. se compara C" con el valor crítico.. Si IC" I > Sa.t4 Los valores numéricos de estos contrastes son C-+i-1 . .60-10. El contraste correspondiente de los promedios de los tratamientos Yi.. m (3-31) en las medias de los tratamientos de interés. • • • • • • • • • • • • • • • • • (1 •••••• 1Il . 2.80+ 17. los experimentadores pueden no conocer de antemano cuáles son los contrastes que quieren comparar.N-a (3-34) Para probar la hipótesis de que el contraste r" difiere de manera significativa de cero. pero que el promedio de los niveles 1 y 3 no difiere del promedio de los niveles 4 y 5 con el nivel a = 0.05.6 Método de Scheffé para comparar todos los contrastes En muchas situaciones. Para ilustrar el procedimiento. considere los datos del ejemplo 3-1 y suponga que los contrastes de interés son y r2 =¡.u ::5 r" ::5 Cu + Sa.00 ..".60. Suponga que se ha determinado un conjunto de m contrastes u=l.. El procedimiento de Scheffé puede usarse también para formar intervalos de confianza para todos los contrastes posibles entre las medias de los tratamientos..J(a-1)Fa. a-l.l = Sc¡ ~(a-1)Fo.58 < SO. Por 10 tanto.Z' se concluye que el contraste r z = fll .54~4( 4.l' se concluye que el contraste r l = fll + fl3 .flj para toda i :¡é j.Z Comparación de pares de medias de tratamientos Supongaque el interés se encuentra en comparar todos los pares de a medias de tratamientos y que las hipótesis nulas que quieren probarse son Ho:fl¡ = flj para toda i :¡é j. 3~5.06(1+1)/5=1.Ol. los valores críticos de 1% son SO.Ol.80 Por la ecuación 3-34. es decir. ~(a -1 )FO. quieren probarse todas las comparaciones de las medias por pares: Ho:fli=flj Hl:ft¡:¡é flj para toda i :¡é j. querrán compararse sólo pares de medias.Ol.06(1+1+1+1)/5=2. En muchas situaciones prácticas.80 y los errores estándar se encuentran con la ecuación 3-33 como 5 Sc! = MSEL ¡=l (c~/ni)=~8.69 y Puesto que ICll existe evidencia sólida para concluir que las medias de los tratamientos 1 y 3 como grupo difieren de las medias de los tratamientos 4 y 5 como grupo. Se pasa ahora a la consideración de los métodos diseñados específicamente para las comparaciones por pares entre todas las a medias poblacionales.Ol. después de un análisis de varianza en el que se ha rechazado la hipótesis nula de la igualdad de las medias de los tratamientos.fl4 .Ol. no es el procedimiento más sensible para tales comparaciones.fl5 es igual a cero.43) = 10.54 y 5 SC. como ICzl > SO. = 9. = MSEL (C.fl4 no es igual a cero. el interés se encuentra en los contrastes de la forma r = fli .43) = 7.a-l.Z i=l /ni)=~8. Aun cuando el método de Scheffé podría aplicarse fácilmente a este problema. no SO. es decir. Sin embargo.80.Ol. 7 = Sc.21. las resistencias medias de los tratamientos 1 y 4 difieren significativamente.96 y CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA Cz = Yr -Y4.60 = -11. es posible determinar cuáles son las medias que difieren probando las diferencias entre todos los pares de medias de los tratamientos.80~4( 4.N-a = 1. Prueba de Tukey Suponga que.N-a = 2. A continuación se presentan cuatro métodos para hacer estas comparaciones. Frecuentemente. Tukey [ll1d] propuso un procedimiento para probar hipótesis para las que el nivel de significación global es exactamente a cuando los tamaños de las muestras son iguales y es a 10 sumo a cuando . 23~8.os(S. donde f es el número de grados de libertad asociados con MSE • Para tamaños de las muestras iguales.j). el nivel de confianza simultáneo es de 100(1 .05 yf = 20 grados de libertad para el error.a) por ciento para todos los pares de medias de la siguiente manera: i . Con a = 0.37 . Por lo tanto. Para ilustrar la prueba de Tukey. sacadas de un grupo de p medias muestrales. Cuando los tamaños de las muestras no son iguales. Se trata de un procedimiento excelente para curiosear sobre los datos cuando el interés se centra en pares de medias. 20) = 4. La tabla VIII del apéndice contiene los valores de qaCp. A la versión para tamaños de las muestras diferentes se le llama en ocasiones el procedimiento Tukey-Kramer.a) por ciento cuando los tamaños de las muestras son iguales y de al menos 100(1.a) por ciento cuando los tamaños de las muestras no son iguales. podría construirse una serie de intervalos de confianza de 100(1.06 -5. la prueba de Tukey declara que dos medias son significativamente diferentes si el valor absoluto de sus diferencias muestrales excede (3-35) De manera equivalente. en la tabla VIII del apéndice se obtiene tio. se usan los datos del experimento del peso porcentual del algodón del ejemplo 3-1.. 20) ~MSE --n- = 4.os (5. respectivamente. las ecuaciones 3-35 y 3-36 quedan como (3-36) (3-37) y respectivamente. Este procedimiento puede usarse también para contraer los intervalos de confianza para las diferencias en todos los pares de medias. EJEMPLO 3.7 ' . Para estos intervalos. los puntos porcentuales a superiores de q.Ymio donde Ymáx YYrnín son las medias muestrales mayor y menor.23.é j. El procedimiento de Tukey hace uso de la distribución del estadístico del rango studentizado q = ----'~~M. To.====S:::::E=/n=- Ymáx .os = qo. por la ecuación 3-35.3-5 INTERPRETACIÓN PRÁCTICA DE LOS RESULTADOS 97 los tamaños de las muestras no son iguales.= 5. . Por lo tanto.6 = Yz. en los datos a la mano. Es decir. quizá no todos los contrastes significativos sean de la forma fii . =17. Para el estadístico del rango studentizado q se tiene i)p( má:x(Yi. la pertenencia a estos grupos no es del todo clara. Cuando se utiliza cualquiera de los procedimientos para probar las medias por pares. Los cinco promedios de los tratamientos son Y i = 9.8 Figura 3-12 Resultados de la prueba de Tukey.8 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA Ys.fij' Algunos paquetes de software de computadora presentan comparaciones por pares con intervalos de confianza.37 implicaría que el par correspondiente de medias poblacionales son significativamente diferentes.0 6. ( f)) = 1.Ys. . = 9.6= Yz.Y4. Esta gráfica da una indicación de que las medias de los tratamientos forman tres grupos: fi1 y fis.8-10.6 * -7. .Y4. = 21.8. .4 Y3. = 21. Para el procedimiento de Tukey. .fi i ) < -qa a.6-10. = 9.2 . = 9.Ys.Y3.6. de medias que son significativamente diferentes.a .6 -4. Esta situación ocurre porque la prueba F considera simultáneamente todos los contrastes posibles en los que intervienen las medias de los tratamientos.4 = Yi .8. = 10. estos intervalos se calcularían con la ecuación 3-36 o la 3-38.6 = Yi .5. La deducción del intervalo de confianza de Tukey de la ecuación 3-36 para tamaños de las muestras iguales es directa.8= Los valores marcados con asterisco indican pare¡. 10. -Y4. = 15. = 17.Ys.98 5'. no sólo las comparaciones por pares.JMSE/n fi min(Yi. fiz Y fi3' Y fi4' Sin embargo. pero la comparación de las medias por pares falla para revelar cualquier diferencia significativa.6-10.21. -h =15. 9. y las diferencias en los promedios son Yi . = 15.0 -2. = 9. ocasionalmente se encuentra que la pruebaF global del análisis de varianza es significativa. . cualquier par de promedios de los tratamientos que difieran en valor absoluto por más de 5.Ys.8* -1.8= Y4.21.8* 10. = 15.8-15. como la de la figura 3-12.8= Yz.6-21.4-17..8* Ys. dependiendo de si los tamaños de las muestras son iguales o no.6 .8* -11.8-17. Suele ser útil trazar una gráfica.2 * 4.4-10. donde se subraya a los pares de medias que no difieren significativamente.8= Y3.4.6 = Yi . = 17.6= Y3.Yz.8 Yz.6 Y4. 6-10.0 .6 = )lz.zo -11.j difieren.j entre las desigualdades se llegará al conjunto de intervalos de confianza simultáneos de 100(1 .y.f1.8= )13.a . . :::.======¡= 11 j Y¡. ..)14.6 = Yl .8= . .21.6* .1 li !i .J MS E /11 para cada par de medias. Para ilustrar el procedimiento. = 17.21.j (3-39) t o = ¡:::==. SE y. .4 = Yl .f1. = 11 a = 11.06) 5 = 3.j) I Si máx(Y¡. .= 1. 11 1 = LSD = t a / Z . .4-17. .4-10.4.N-a MSE(~+~) 11¡ 11 j 11 z (3-40) se le llama diferencia significativa mínima.mín(Y¡. los pares de medias f. .8* -1. = 21. debe ser verdadero que I(Y¡. = 9.6 = )lz.Y4.0* 6.f) --:::.6 = )13.05 es LSD = t. Si I)I¡. Por lo tanto.1 > ta /Z N-a~ MS E (1 / 11¡ + 1/ 11 j ).Yz. 025 .)15.6 = Yl .2 * 4. se concluye que las medias poblacionales f1. J a ( ~ __ l. si se usan los datos del experimento del ejemplo 3-1. -11.J\ = 9. . la LSD con a = 0.)13.f) ~SE) P -q (a.21.¡) .¡ = f1. a 11 J. Si el diseño es balanceado.(yj.8-15..)15. qa(a.t¡ y f1.8-17.)15.N-a ~2MSE -11- = . cualquier par de promedios de los tratamientos que difiera del valor absoluto por más de 3.8* ~¡ .6. f). Las diferencias en los promedios son Yl . Y (3-41) Para usar el procedimiento LSD de Fisher.f1.(f1.. simplemente se compara la diferencia observada entre cada par de promedios conlaLSD correspondiente.f1. = 9. A la cantidad LSD = ta/Z.8* -11. . .¡ . = 15.8-10.086 ~2MSE ~2(8.)14. .Yj.2.¡) .8.f). q (a. .8= )14.4.5.a) por ciento dado en la ecuación 3-38.)lj.6-10.f1.75 Por lo tanto.75 implicaría que el par correspondiente de medias poblacionales es significativamente diferente. = 9. 1 Al reordenar esta expresión para aislar f1. = 17. -)lj.3-5 INTERPRETACIÓN PRÁCTICA DE LOS RESULTADOS 99 f1. El método de la diferencia significativa mínima (LSD) de Fisher En este procedimiento se utiliza el estadístico F para probar H o:f1.8= Yz.8* 10.j se declararían significativamente diferentes si I)I¡.J MS E /11. .¡ y f1. MSE(~+~) 11¡ Suponiendo una hipótesis alternativa de dos colas. = 15.)15.= 2. . ) :::.6* -7.1 > LSD.¡) es menor o igual que qaCa.6. = 15.2 . EJEMPLO 3~8 . 3. Estos rangos se convierten en un conjunto de a -1 rangos mínimos de significación (por ejemplo. Para aplicar la prueba del rango múltiple de Duncan cuando los tamaños de las muestras son iguales. 9.8 Figura 3-13 Resultados del procedimiento LSD. el error tipo I del experimento (el cociente del número de experimentos en los que se comete al menos un error tipo I y el número total de experimentos) se hace grande.. Por último.j) parap = 2. En la tabla de Duncan de los rangos significativos (tabla VII del apéndice) se obtienen los valores ra(p. empezando con la más grande contra la menor.... los a promedios de los tratamientos se arreglan en orden ascendente. se sustituye n en la ecuación 3-42 con la media armónica n¡. cuando a se hace más grande. a (3-44) Entonces. Prueba del rango múltiple de Duncan Un procedimiento muy utilizado para comparar todos los pares de medias es la prueba del rango múltiple desarrollada por Duncan [41]. a calculando oo. Evidentemente. Yel tratamiento 4 produce una resistencia a la tensión significativamente mayor que los otros tratamientos. donde a es el nivel de significaciónyfes el número de grados de libertad del error. 10. Para evitar . . del {ni}' donde nh =-a---- a L (l/ni) i=l (3-43) Observe que si nI = n z = = na. Rp ) para p = 2. = ~MSE -n- (3-42) Para tamaños de las muestras desiguales. Si una diferencia observada es mayor que el rango de significación mínima correspondiente.. la cual se compararía con el rango mínimo de significaciónRa • Después se calcula la diferencia de la mayor y la segunda menor y se compara con el rango mínimo de significación R a -1' Estas comparaciones se continúan hasta que todas las medias se han comparado con la media mayor.1)/2 pares de medias posibles.. En la figura 3-13 se resumen los resultados. 3. parap = 2. nh = n.8 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA Ys. y el error estándar de cada promedio se determina como SYi. Observe que el riesgo global a puede inflarse de manera considerable al utilizar este método. los únicos pares de medias que no difieren significativamente son 1 y 5 Y2 Y3. se calcula la diferencia entre la segunda media mayor y la menor y se compara con el rango mínimo de significación R a -1' Este proceso se continúa hasta que se han considerado las diferencias entre todos los a(a . Los valores marcados con asterisco indican pares de medias que son significativamente diferentes. se concluye que el par de medias en cuestión es significativamente diferente. a. oo. se prueban las diferencias observadas entre las medias. Específicamente. oo.3.100 Y. 8 = 4.os(5...8 10..06.25)(1.13 > > > > > > < > > < 4. se obtiene 'o.. 'o.. 20) = 3.. 20) = 3.6 El error estándar de cada promedio es 8 Yi....... .75 (R z) 3..8 10. = (3..6 17..94 (R 3 ) 3....75 = 'o.27) = 3...05 (5.75 (R z) 3...8 15. .8 = 10...04 (R 4) 3.04 (R 4) 3...05. ....4 15...6 21.95..3-5 INTERPRETACIÓN PRÁCTICA DE LOS RESULTADOS 101 contradicciones.8 = 1.. Observe que en este ejemplo la prueba del rango múltiple de Duncan y el método LSD llevan a conclusiones idénticas.8 = 7.4 = 2.18)(1.27.....8 15. 20) = 2.2 9. Por lo tanto.13 (R s) 4. R 4 = '0. 2 vs. .. EJEMPLO 3~9 0• • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • 0 • • • • • • • • • • • • • • • • La prueba del rango múltiple de Duncan puede aplicarse al experimento del ejemplo 3-1. 'o.. 9.10)(1.. ... 3 vs. 20)Syi.04 = (3..75 (Rz) 4. 3 vs.. 20)8 Yi.75 (Rz) Los resultados de las comparaciones serían 9.18 Y 'o.. . N = 25.os(2.27) = 4.. .8 = 5. = 17.6 17.4 = 6.os(3. Y.8 Ys . 20)S Yi. .os (3. .8 = 11. Al arreglar los promedios de los tratamientos en orden ascendente.4 10.. En el conjunto de rangos significativos de la tabla VII del apéndice para 20 grados de libertad y a = 0.6 17.6 Figura 3-14 Resultados de la prueba de rango múltiple de Duncan.. 20) = 3..6 h = 21..... .. = 10. R s = '0. 10. Recuerde que MSE = 8.05 (4.25.2 17..95 (R 3 ) 3. 2 vs.10.6 21... 5 VS.6 21.. 3 vs.0 9.8 Yz.12 = 5. 1: 5: 2: 3: 1: 5: 2: 1: 5: 1: 21.TI075 = 1.os(4. En la figura 3-14 se muestra una gráfica en la que esas medias que no son significativamente diferentes aparecen subrayadas.6 = 4. 4 vs. R3 4 vs.95)(1. 4 vs.27)=3.8 20)S Yi. los rangos de significación mínima son R z ='o.6 15. = v'8.. 4 vs. = 15..27) = 4.os(2.. Yhay 20 grados de libertad del error...0 Por el análisis se observa que hay diferencias significativas entre todos los pares de medias con excepción de la 3 y la 2 y la 5 y la 1.94 (R 3 ) 3. se tiene Yl = 9.94 = (3.6 9. =(2..8 = 6.4 Y3. ninguna de las diferencias entre un par de medias se considera significativa si las dos medias en cuestión se localizan entre otras dos medias que no difieren significativamente. 17.6 10.8 Ys.8 Ya.. La prueba de Newman-Keuls es más conservadora que la prueba del rango múltiple de Duncan por cuanto a que el índice de error tipo 1 es menor. muchos experimentadores prefieren su uso. si el nivel de protección es a. Reportan asimismo un buen desempeño en la detección de diferencias reales con la prueba del rango múltiple de Duncan.94 (tres medias). Operacionalmente. si a = 0. cuando el tamaño del grupo es p.75 (dos medias) mientras queR 3 = 3. es muy eficaz para detectar diferencias entre medias cuando existen diferencias reales. Esto no es motivo de sorpresa. 3.. Por esta razón.(1 .05. y los especialistas en estadística están con frecuencia en desacuerdo en cuanto a la utilidad de los diferentes procedimientos.(1. no hay una respuesta precisa para esta pregunta. entonces 1.a Y-1. el valor crítico R 2 será exactamente igual al valor LSD de la prueba t.0.05)1 = 0. Sin embargo. es decir. las pruebas de las medias tienen un nivel de significación que es mayor o igual que a. Desafortunadamente.10 es el nivel de significación para medias que están un paso aparte. f)SYi. Específicamente. Por lo tanto.0. el procedimiento de Duncan tiene una gran potencia. Los valores ra(p.f) es el punto porcentual a superior del rango studentizado para grupos de medias de tamaño p y con!grados de libertad del error..05? = 0. el índice de error de reportar al menos una diferencia significativa incorrecta entre dos medias es 1. incluyendo algunos que no se han considerado aquí. debido a que a es por lo general bajo. el procedimiento es similar a la prueba del rango múltiple de Duncan. en el ejemplo anterior R 2 = 3. En general. . al procedimiento se le llama la prueba de Newman-Keuls. Por consiguiente. La prueba de N ewman-Keuls Esta prueba fue creada por Newman [90]. Por consiguiente. salvo porque las diferencias críticas entre las medias se calculan en una forma un tanto diferente. la potencia de la prueba de Newman-Keuls casi siempre es menor que la de la prueba del rango múltiple de Duncan.(1. Carmer y Swanson [24] han realizado estudios de simulación Montecarlo con varios procedimientos de comparaciones múltiples. P = 2. se calcula una serie de valores críticos K p = qa(P. el nivel de protección es (1. el error tipo 1 del experimento es a para todas las pruebas que incluyen el mismo número de medias.. Por ejemplo. y así sucesivamente. Una vez que se calculan los valores Kp con la ecuación 3-45. Debido a que el método de Tukey efectúa un control sobre el índice de error global.~ ! 102 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA En la prueba del rango múltiple de Duncan se requiere una diferencia observada más grande para detectar pares significativamente diferentes de medias.a y -\ donde a es el nivel de significación especificado para dos medias adyacentes. cuando se comparan dos medias que están p pasos aparte. una pregunta lógica en este punto es qué método de comparación por pares debe usarse. Para dos medias. Debido a que un interés renovado en la prueba de Newman fue generádo por Keuls [64]. Es decir. a (3-45) donde qa(P. la prueba del rango múltiple de Duncan es muy popular. cuando el número de medias incluidas en el grupo aumenta. Para demostrar que el procedimiento de Newman-Keuls lleva a una prueba con menor potencia que la prueba del rango múltiple de Duncan. estos métodos no incluyen el índice de error en el modo del experimento.f) de la tabla VII del apéndice se eligen de tal modo que se obtenga un nivel de protección especificado. los pares de medias extremos en los grupos de tamaño p se comparan conKp exactamente igual que en la prueba del rango múltiple de Duncan. se observa por una comparación de las ta- .05 es el nivel de significación para comparar el par de medias adyacentes. ¿Qué método de comparación por pares debe usarse? Ciertamente. ya que estos dos métodos son los más poderosos delos que se han comentado aquí. Específicamente. 1 . Estos autores reportan que el método de la diferencia significativa mínima es una prueba muy eficaz para detectar diferencias reales en las medias si se aplica sólo después de que la prueba F en el análisis de varianza sea significativa en 5 %. De esta forma. ) Observe que a es el nivel de significación conjunto asociado con las a -1 pruebas...os(4. sólo es necesario hacer a . 3~5. 2.6 - 10.!) se da en la tabla IX del apéndice.58 5.8= -1..8 Comparación de medias de tratamientos con un control En muchos experimentos. 5: Y4.53 8 4.. Las diferencias observadas son 1 vs.-F~' '-)-'\ (3-46) IV' donde la constante daCa -1..6 = 21. y el analista se interesa en comparar cada una de las medias de los a -1 tratamientos restantes con el control. = 9. 4 4. ...... Para cada hipótesis se calculan las diferencias observadas en las medias muestrales /1.f) 1/ () MS E ~+l. (Pueden hacerse pruebas tanto de una como de dos colas.8= 4..01.. 5: Y3. a = 8 Y p 2 4.84 4. la diferencia crítica es do.Ys. oo.8= 10. Por lo tanto.. H 1 :p¡:... .Ys.os(4.02 4.. a -1.. es "más difícil" declarár que un par de medias es significativamente diferente al utilizar la prueba de Newman-Ketils que cuando se f = 20: usa el procedimiento de Duncan.6 10. ...... 2. Esto se ilustra a continuación para el caso en que a = 0...z!: Pa ~ para i = 1. n¡ na e 'd' \¡l~" ¡ . Con el nivel de 5%.. -Ya.. considere el experimento del ejemplo 3-1. uno de los tratamientos es un control..8 10.. . O'Neill y Wetherill [91] YNelson [89].:i' IY· l.02 5 4.65.8 .02 3 4. También se recomienda el libro de Miller [77]....J.= 2.. 20) = 2...06) 5 = 4.•. Para ilustrar la prueba de Dunnett....47 5.40 6 7 4. asumiendo que el tratamiento 5 es el control.76 se declararía significativamente diferente.I>da(~-l.....22. a -1 = 4.r i = 1. 4 vs.. a = 5.33 5..64 5. Un procedimiento para hacer estas comparaciones ha sido desarrollado por Dunnett [42]..... Por lo tanto.Ys.. en la tabla IX del apéndice se encuentra que do. .76 (Observe que se trata de una simplificación de la ecuación 3-46 que resulta de un diseño balanceado.. 2 vs. EJEMPLO 3~lO ..4 = 17.oo.. existen otros procedimientos de comparaciones múltiples. Algunos artículos que describen estos métodos son los de Miller [78]. Es decir.. 5: YI.29 4.. a-1 La hipótesis nula Ho:p¡ = Ila se rechaza utilizando un índice a de error tipo I si 2 ¡l(C j..f) > ra(P'[)... 20) --n.0 10. 5: Y2.lcomparaciones. En este ejemplo. El procedimiento de Dunnett es una modificación de la prueba t común...8= 6. 3 vs.3-5 INTERPRETACIÓN PRÁCTICA DE LOS RESULTADOS 103 bIas VII YVIII del apéndice que parap > 2 se tiene qa(P.69 Como se señaló antes..Ys.[ = 20 Yni = n = 5.8 = 15..) Por lo tanto. ... cualquier media de los tratamientos que difiera del control por más de 4. Suponga que el tratamiento a es el control y que quieren probarse las hipótesis 14-1 Ho:p¡ = Pa ¡.65 ~2MS E ~2(8.51 5.... La suma de cuadrados correspondiente al "Modelo" ("Model") es la SSnatamientos usual de un diseño con un solo factor. El estadístico "Predicción adecuada" (''Adeq Precision") se calcula dividiendo la diferencia entre la respuesta predicha máxima y la respuesta predicha mínima por la desviación estándar promedio de todas las respuestas predichas. los grados de libertad ("DF".0001 se les asigna el valor por omisión 0. el cual no es irrazonable. suponiendo un número igual de observaciones para los a -1 tratamientos restantes. definido como (.") es la raíz cuadrada del cuadrado medio del error. v'8. En la figura 3-15 se muestra la salida de uno de estos programas. na) que para los demás tratamientos (por ejemplo. Es decir. Design-Expert. el factor "peso porcentual del algodón" explica cerca de 74. Dev. degrees offreedom). SSModelo SSTotaI R2 = .J MS E I y)100. Por 10 tanto.0001). indican alguna diferencia significativa cuando se comparan con el control. Alternativamente. Esta R. Además del análisis de varianza básico. "Desviación estándar" ("Std. "PRESS" son las siglas de Prediction EITor Sum 01Squares (suma de cuadrados del error de predicción) y es una medida de la adecuación con que es posible que el modelo del experimento predecirá las respuestas en un nuevo experimento. Puede ser un estadístico útil en experimentos más complejos en los que intervienen varios factores en el diseño.746923 636. se concluye que /13 ~ /15 Y /14 ~ /15' Cuando se hace la comparación de los tratamientos con un control.6046. B. utilizando los datos del experimento con un solo factor del ejemplo 3-1. Y)l4. por lo tanto. n). se elige naln = . La columna "Prob > F" es el valor P (de hecho. 3~6 MUESTRA DE SALIDA DÉ COMPUTADORA Hay una gran cantidad de programas de computadora para apoyar el diseño experimental y la realización de análisis de varianza. -)15. los cuadrados medios ("Mean Square") y el estadístico de pruebaFo ("F Value") acostumbrados. en los datos para probar la resistencia de la fibra sintética. El coeficiente de variación mide la variabilidad no explicada o residual de los datos como un porcentaje de la media ("Mean") de la variable de respuesta.060 = 2. Cuando hay más de un factor en el experimento.104 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA Sólo las diferencias )13. ya que a las probabilidades menores que 0. debe tenerse O:5 R 2 :5 1. la suma de cuadrados ("Sum of Squares") del modelo se descompondrá en varias fuentes (A. etc. La cantidad "R cuadrada" ("R-Squared") se define como 475.839. puede calcularse una R 2 para predicciones con base en PRESS (más adelante se indicará cómo hacer esto)..76 = 0. siendo más deseables los valores más grandes. En la salida se presentan también otros estadísticos enR2 • R 2 "ajustada" (''Adj R-Squared") es una variante del estadístico R 2 común que refleja el número de factores presentes en el modelo.V:" es el coeficiente de variación. y "C.96 y se interpreta en términos generales como la proporción de la variabilidad en los datos "explicada" por el modelo del análisis de varianza. el límite superior del valor p. Evidentemente. y los valores que exceden cuatro indican por lo general que el modelo tendrá un desempeño razonable en la predicción. El cociente naln deberá elegirse de tal modo que sea aproximadamente igual a la raíz cuadrada del número total de tratamientos. Son deseables valores grandes de esta cantidad.). una buena idea es usar más observaciones para el tratamiento de control (por ejemplo.69% de la variabilidad en la resistencia a la tensión. -)15.¡¡¡ · ~ . Esa fuente se identifica adicionalmente como ''A''. Son deseables valores pequeños de PRESS. el programa presenta información adicional útil. considerando que el modelo explica cerca de 75% de la variabilidad del experimento en curso. cuando quiere evaluarse el impacto de aumentar o disminuir el número de términos del modelo.red ("Pred R-Squared") para el problema tratado aquí es 0. Observe que el resumen del análisis de varianza de la parte superior de la salida de computadora contiene las sumas de cuadrados. 76 14.23 -3.0012 <0. Std.80 1.6046 9.79 6. Una diferencia mayor que 0.80 -1.27 1. "Precisión adecuada" mide la relación de la señal a ruido. PRESS 2.6963 0. Sólo hay una probabilidad de 0.0001 <0.60 -7. If Necessary) Estimated Standard Mean Error 1-15 2-20 3-25 4-30 5-35 Treatment 1 vs 2 1 vs 3 1 vs 4 1 vs 5 2 vs 3 2 vs 4 2 vs 5 9.80 1. Figura 3·15 Salida de computadora de Design-Expel1 para el ejemplo 3-1. Treatment Means (Adjusted.1000 indican que la diferencia en las medias de los dos tratamientos no es significativa.80 1.80 -11. .0054 0.88 R-Squared Adj R-Squared Pred R-Squared Adeq Precision 0.84 15. Los valores de "Prob > Iti" mayores que 0.76 475.80 Mean Difference DF 1 1 1 1 1 1 1 1 1 1.7469 0.40 17.294 indica una señal adecuada para usar este modelo para navegar el espacio del diseño.34 -6.0001 significativo 20 24 8.27 Standard Error t for Ho Coeff=O Prob> Itl 3 vs 4 3 vs 5 4vs 5 -5.01 0.76 161.0001 0.80 1.27 1. la reducción del modelo puede mejorarlo. Los valores de "Prob > F" menores que 0.01 % de que un 'Valor F del Modelo" de esta magnitud pudiera ocurrir debido a ruido.06 El valor F del Modelo de 14.6046 concuerda razonablemente con la "R cuadrada ajustada" de 0.5838 0.06 14.20 entre la "R cuadrada predicha" y la "R cuadrada ajustada" indica un posible problema con el modelo y/o los datos.20 4.1000 indican que los términos del modelo no son significativos.80 10. Mean C.96 4 4 20 O 118. Los valores mayores que 0.80 -3.80 1.294 La "R cuadrada predicha" de 0.0375 0.000 161.45 2.94 118.0500 indican que la diferencia en las medias de los dos tratamientos es significativa.20 0.76 <0.60 -4.88 251.04 18.76 implica que el modelo es significativo. Dev.80 1.57 -0.12 -4.60 21. Si hay muchos términos del modelo no significativos (sin contar los que se necesitan para apoyar la jerarquización).80 1.80 1.94 8.20 636.23 3.0001 Los valores de "Prob > Itl" menores que 0. La relación de 9. En este caso A son términos significativos del modelo.6963.00 -2. Response: Strength in psi ANOVA for Selected Factorial Model Analysis of variance table [Partial sum of squares] Source Model Sumof Squares DF Mean Square F Value Prob> F A Residual Lack of Fit Pure Error Cor Total 475.00 6. Es deseable una relación mayor que 4.80 1.2347 0.60 10.80 15.0500 indican que los términos del modelo son significativos.20 -6.56 -2.80 1 1.27 1.0025 Ome6 0.56 -1.V.27 1.0003 <0.PO' Utilice el mouse para posicionarse en una celda y su definición. 000 -1.60 21.20 -0.315 -1.315 0.200 0.200 0.200 0.80 15.024 0.80 -3.200 0.109 -1.005 0.00 7.158 0.368 1.200 0.154 -1.654 0.40 1. Las diferencias entre pares de medias ("Mean Difference") de los tratamientos se investigan utilizando el método LSD de Fisher descrito en la sección 3-5.20 0.80 0.200 0.60 10.103 -1.200 0.024 -1.00 18.542 0.200 -1.210 0.40 -2.20 4.368 0.109 2.106.00 25.015 0.00 9.00 15.200 0.00 11.542 -1.40 15.00 17.090 0.025 -1.112 0.200 0.154 0. Esta salida aconsej able puede ser eliminada por el usuario.005 0.200 0.40 1.60 -3.60 21. es decir.00 11.308 0.025 1.308 -1.025 0. Figura 3-15 (Continuación.00 23.00 18. finalizar con el icono Model Graphs (Gráficas del Modelo).418 0.00 19.339 0.80 -0.80 9.020 0.80 5.) Se hace la estimación de las medias ("Estimated Mean") de los tratamientos y se muestra el error estándar ("Standard Error") (o desviación estándar muestral de la media de cada tratamiento.80 -2.00 11.200 0.200 0.245 0.40 0.025 1.00 22.015 0.80 9.551 -1. según se definen en la ecuación 3-16.80 10.40 -2.103 2.J MS E/n).60 21.40 0.200 0.052 0. y quizá no se ajusten exactamente a los requerimientos de redacción del reporte de un experimentador particular.80 9.60 3.00 19.00 7.061 0.200 0.551 0.200 0.001 0.7.457 0.137 0. Si todos los estadísticos del modelo y las gráficas de diagnóstico están correctos.090 0.052 0.542 -1.620 -1.60 17.052 0.60 21.079 1.00 18.339 1.60 1.60 -3.052 0. En la salida se muestran asimismo varios diagnósticos residuales más.200 0.20 1. CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA Diagnostic Case Statistics Standard Actual Predicted Order Value Value Residual Leverage Student Residual .40 17.60 21.548 -0.00 14.60 0.079 0.001 0. Asegurarse de examinar: 1) La gráfica de probabilidad normal de los residuales studentizados para verificar la normalidad de los residuales.200 0.368 0.463 -0.60 17.630 -1.200 0.001 0.80 -2.00 9.40 -3. recuerde que están escritas en términos muy generales.20 0.40 15.00 19.00 18.40 2.473 -0.061 0.00 12.048 0.024 1.00 10.60 17.40 15. .80 10.40 1.200 0. . valores influyentes o importantes 4) La gráfica de Box-Cox para las transformaciones de potencia.015 0.200 0.154 0.339 0.077 Proceder con las gráficas de diagnóstico (el icono siguiente en progresión).00 15. observe que el programa de computadora incluye también algunas guías para hacer la interpretación.00 12.158 0.000 0. 2) Los residuales studentizados contra los valores predichos para verificar la constante del error.077 1. Cook's Distance Outlier t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 7.735 0.200 0.024 1. El programa de computadora también calcula y despliega los residuales. Esta información "aconsejable" es muy común en muchos paquetes de estadística para computadoras personales. Por último.551 -1.496 -0.158 -1. Algunos de ellos se revisarán más adelante.200 0. 3) Los puntos atípicos t contra el orden de las corridas para buscar puntos atípicos. Al leer estas guías.011 0.100 0.200 0.40 15.80 10.200 0.80 9.60 17.80 10.60 2.00 19. El programa producirá también todas las gráficas de los residuales que se comentaron en la sección 3-4.090 0. antes de hacer la elección final. si H oes falsa. Con frecuencia es difícil hacer esto en la práctica. Se requiere asimismo una estimación de 02.1 YN . el estadístico F o = MSTralamienloJMSE se distribuye como una variable aleatoria F no central con a . la distribuciónF no central se convierte en la distribución F (central) común.a-l. .p{Rechazar H oIH o es falsa} = 1. En esta sección se analizan varios enfoques para determinar el tamaño de la muestra. Por lo tanto.3-7 DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA 107 3~7 DETERMINACIÓN DEL TAMAÑO DÉ LA MUESTRA En cualquier problema de diseño experimental. un experimento anterior o una prueba preliminar (como se sugirió en el capítulo 1). En estas curvas se grafica la probabilidad del error tipo II (/3) contra un parámetro <1>.1 Curvas de operación característica Recuerde que una curva de operación característica es una gráfica de la probabilidad del error tipo II de una prueba estadística para un tamaño de la muestra particular contra un parámetro que refleja la medida en que la hipótesis nula es falsa. Una manera de determinar <1> es elegir los valores reales de las medias de los tratamientos para los que querría rechazarse la hipótesis nula con una alta probabilidad. Las curvas de operación característica que se presentan en la parte V del apéndice se usan para evaluar el enunciado de probabilidad de la ecuación 3-47. /-la son las medias de los tratamientos especificadas. Si 15 = O.05 Ya = 0. se necesitan más réplicas que cuando el experimentador se interesa en detectar efectos grandes. Al usar las curvas de operación característica. El experimentador puede usar estas curvas como guía en la selección del número de réplicas para que el diseño sea sensible a diferencias potenciales importantes en los tratamientos.N-al H o es falsa} (3-47) Para evaluar el enunciado de probabilidad de la ecuación 3-47. una decisión crítica es la elección del tamaño de la muestra. donde ¡¡ = (l/a)~ :=1 =lf-li es el promedio de las medias de los tratamientos individuales.01 Y un rango de grados de libertad para el numerador y el denominador.oo. a fin de estudiar el efecto de este Parámetro sobre el tamaño de la muestra requerido. En ocasiones se cuenta con este valor por experiencia previa.a grados de libertad y parámetro de no centralidad 15. los tamaños de las muestras podrían determinarse para un rango de valores posibles de 02. determinar el número de réplicas que deben correrse. el experimentador debe especificar el parámetro <1>.¡¡.-i 1-::-_ = -'C n! T¡ aa 2 (3-48) La cantidad <lJ2 está relacionada con el parámetro de no centralidad 15. es necesario conocer cuál es la distribución del estadístico de pruebaFosi la hipótesis nula es falsa.p{ Fo > Fa . 3~7. por ejemplo f3 = 1. si /-l1' /-l2' . Aun cuando la revisión se centra en un diseño con un solo factor. Se considera la probabilidad del error tipo II del modelo con efectos fijos para el caso en que se usa el mismo tamaño de las muestras en cada tratamiento. o por una estimación discrecional. donde <1>2 = ----. Cuando no se tiene la seguridad acerca del valor de 02. la mayoría de los métodos pueden usarse en situaciones experimentales más complejas. es decir. Puede demostrarse que. la Ti de la ecuación 3-48 se encuentra como Ti = /-li . Se cuenta con curvas para a = 0. si el experimentador tiene interés en detectar efectos pequeños. En general. Como primera conjetura para el tamaño de la muestra requerido.U=11-15=-4 'l' 2 = . Si la diferencia entre las medias de dos tratamientos cualesquiera es tan grande como D. Esto produce ep2 = 1.36 2.30 = 0.15 0. Un enfoque alternativo es seleccionar un tamaño de la muestra tal que si la diferencia entre las medias de dos tratamientos cualesquiera excede un valor especificado. puede demostrarse que el valor mínimo de ep2 es ep2 = nD 2a0 2 2 (3-49) .108 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA EJEMPLO 3~11 . Considere el experimento de la resistencia a la tensión descrito en el ejemplo 3-1. En este caso.90 requerido.U = 12 -15 =. Por consiguiente. al utilizar la ecuación 3-48.U=19-15= 4 Por lo tanto. Entonces.44.u5-.01 (ver la parte V del apéndice).85 0. que es menor que el 0.30 0.[3) 0. Procediendo de manera similar. se tiene Se usa la curva de operación característica para a -1 = 5 -1 = 4 con N -a = a(n ~ 1) = 5(n -1) grados de libertad del error y a = 0.0.01.u 3 .11 2.15 = 3 'l's=. = 50.U = 18. ep = 2. la potencia de la prueba es aproximadamente 1.u1-.58 a(n -1) 15 Potencia (1. se prueba con n = 4 réplicas.90 si las medias de los cinco tratamientos son . "Li=1 'l'. Suponga que el experimentador está interesado en rechazar la hipótesis nula con una probabilidad de al menos 0. en la parte V se encuentra que fJ =0. por lo que se concluye que n = 4 réplicas no son suficientes.04 0.U = 15.uz=12 .u4=18 y . puesto que "Li=1.11 Y5(3) = 15 grados de libertad del error.3 'l' 3 = .11(4) = 4.70.fJ = 1.u 4 -. El único problema con este enfoque para usar las curvas de operación característica es que por lo general es difícil seleccionar el conjunto de las medias de los tratamientos en el que se basará la decisión del tamaño de la muestra. se tiene ji = (1/5)75 = 15 Y =.70 0..55 6.66 2.u3=15 . puede construirse la siguiente tabla: n 4 «I>2 4. Por lo tanto.u¡ 'l'1 = 75.u1=11 Planea utilizar a . la hipótesis nula deberá rechazarse.15 = O 'l' 4 = .us=19 = 0.44 5. Suponga que el experimentador piensa que la desviación estándar de la resistencia a la tensión con cualquier nivel particular del peso porcentual del algodón no será mayor que 0=3 psi.96 5 6 20 25 Por lo tanto.30.u 2 -. deben realizarse al menos n = 6 réplicas para obtener una prueba con la potencia requerida. Jn Por lo tanto. . esto es equivalente a escoger 2 0 +(t 7:¡ /a) = 1=1 o 1 +O. Si las medias de los tratamientos no difieren. = 6 réplicas para obtener la sensibilidad 3. suponga que en eL experimento de la resistencia a la tensión del ejemplo 3-1.11n 2(5)(3 2 ) y.90 si las medias de dos tratamientos cualesquiera difieren hasta en 10 psi.01.3-7 DETERMINACIÓN DEL TAMAÑO DELA MUESTRA 109 puesto que éste es un valor mínimo de <1>2. más allá del cual quiera rechazarse la hipótesis de que las medias de todos los tratamientos son iguales. <1> puede calcularse con la ecuación 3-50 y después usar las curvas de operación característica de la parte V del apéndice para determinar el tamaño de la muestra requerido.2 Especificación de un incremento de la desviación estándar Este enfoque es útil en ocasiones para elegir el tamaño de la muestra. el experimentador quisiera rechazar la hipótesis nula con una probabilidad de al menos 0. suponiendo que o = 3 psi.. Entonces. el tamaño de la muestra correspondiente que se obtiene de la curva de operación característica es un valor conservador. la desviación estándar de una observación elegida al azar es Si se escoge un porcentaje P para el incremento de la desviación estándar de una observación. Para ilustrar este enfoque. la desviación estándar de una observación elegida al azar es o.01P)2 -1(. por el análisis del ejemplo 3-11. para un valor especificado de P. proporciona una potencia al menos tan grande como la que especificó el experimentador. se concluye que se necesitan n deseada cuando a = 0. Sin embargo.01P (P = por ciento) o de donde <1>= --'--'-'i=1=--------::~= ~(1 + 0.Jn) ! 7:¡ / a (3-50) o/..7. se encuentra que el valor mínimo de <1>2 es <1>2 = n(10)2 = 1. si las medias de los tratamientos son diferentes. es decir. se encuentra que la precisión del intervalo de confianza es ±t a/2. puede usarse el mismo enfoque general si el experimentador desea especificar de antemano un conjunto de intervalos de confianza acerca del cual se hace un enunciado de confianza simultáneo o conjunto (ver los comentarios acerca de los intervalos de confianza simultáneos de la sección 3-3. Por ejemplo. 3~7. El nivel de significación consignado en el ejemplo anterior se aplica a un solo intervalo de confianza. al usar a2 = 3 2 = 9 como una estimación de MSE . suponga que en el experimento de la resistencia a la tensión del ejemplo 3-1 se quiere que un intervalo de confianza de 95% para la diferencia en la resistencia a la tensión media de dos pesos porcentuales del algodón cualesquiera sea ±5 psi y una estimación previa de a es 3.ar los niveles del factor que resultan en diferencias entre las medias de los tratamientos o los niveles del factor.3).132~2~) = ±4. Entonces.Jii La referencia a las curvas de operación característica indica que'se necesita n lidad deseada. Sin embargo. al utilizar la ecuación 3-13.3 = 9 para obtener la sensibi- Método para estimar el intervalo de confianza En este enfoque se supone que el experimentador quiere expresar los resultados finales en términos de intervalos de confianza y que está dispuesto a especificar por anticipado cuál es el ancho que desea para estos intervalos de confianza.Jii) = 0.22~2~) = ±5. n = 4 es el tamaño de la muestra menor que llevará a la precisión deseada. los intervalos de confianza podrían construirse con respecto a contrastes más generales en las medias de los tratamientos. que la comparación por pares ilustrada antes.2)2 -1(. suponga que se desea detectar un incremento de la desviación estándar de 20% con una probabilidad de al menos 0.66.46 Evidentemente.96 que es más preciso que el requerimiento. Además.90 y a = 0. la precisión del intervalo de confianza es ±2. Entonces. en el experimento de la resistencia a la tensión del ejemplo 3-1. Cuando ocurrió la desigual- . Entonces cI>= ~(1. 3~8 IDENTIFICACIÓN DE EFECTOS DE DISPERSIÓN Nos hemos enfocado aquí en el uso del análisis de varianza y de otros métodos relacionados para determin. Se acostumbra referirse a estos efectos como efectos de localización.110 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA Por ejemplo.N-a ~2MSE n Suponga que se prueba con n = 5 réplicas. Al probar con n = 4 se obtiene ±2.52 Al probar con n = 3 se obtiene ±2.086~2~) = ±3.05. Se llevó a cabo un análisis de varianza para determinar si los diferentes algoritmos para controlar la proporción afectan el voltaje promedio de la celda.04) 4.86(0. produciendo miles de mediciones del voltaje durante cada corrida del experimento.95(0.02) 4.02) 4.88(0. Específicamente.03) 2 4.96 Valor P <0.) . considere los datos de la tabla 3-12.09) 4. Las variables de respuesta estudiadas se relacionaron con el voltaje de la celda.90(0. Sin embargo.055 0.82(0.93(0. un sensor registra el voltaje de la celda varias veces cada segundo. el algoritmo para controlar la proporción tiene un efecto de disTabla 3-13 Análisis de varianza del logaritmo natural del ruido del crisol Fuente de variación Algoritmo para controlar la proporción Error Thtal Suma de cuadrados 6. (Referirse al problema 3-28.06) 4. Éste reveló que el algoritmo para controlar la proporción no tuvo ningún efecto de localización.02) 4.04) 4.91(0. se usará y= -ln(s) como la variable de respuesta. Para ilustrar estos conceptos. Esto ocurrirá siempre que la desviación estándar.094 21. el logaritmo natural del "ruido del crisol". se utilizaron transformaciones para estabilizar la varianza y mejorar así las inferencias hechas sobre los efectos de localización.76(0.03) 4. en algunos problemas el interés se centra en descubrir si los diferentes niveles del factor afectan la variabilidad. Puesto que todas las desviaciones estándar del voltaje del crisol son menores que la unidad.85(0. al cambiar los algoritmos para controlar la proporción no hubo ningún cambio en el voltaje promedio de la celda.94(0.11) 4.13) 4.03) 4.05) dad de la varianza con los diferentes niveles del factor. el interés está en descubrir efectos de dispersión potenciales.89(0. En la tabla 3-13 se presenta el análisis de varianza para esta respuesta.75(0.05) 5 4.872 8. Los ingenieros del proceso decidieron usar como variables de respuesta el voltaje promedio y la desviación estándar del voltaje de la celda (indicado entre paréntesis) en la corrida experimental.85(0. es decir.15) 4.05) 4.3-8 IDENTIFICACIÓN DE EFECTOS DE DISPERSIÓN 111 Tabla 3-12 Datos del experimento de fundición Algoritmo para controlar la proporción 1 2 3 4 Observaciones 1 4.79(0.038 Grados de libertad 3 20 23 Cuadrado medio 2. la varianza o cualquier otra medida de la variabilidad se use como variable de respuesta.12) 4.05) 4.79(0.79(0. es decir. Observe que la elección de un algoritmo para controlar la proporción afecta el ruido del crisol.166 1.001 . El voltaje promedio es importante porque afecta la temperatura de la celda.05) 4.83(0.04) 3 4 4.75(0.90(0. los cuales se obtuvieron de un experimento diseñado en una fundición de aluminio.03) 6 4. y la desviación estándar del voltaje (llamada "ruido del crisol" por los ingenieros del proceso) es importante porque afecta la eficiencia global de la celda.88(0. La alúmina se agrega de manera continua a la celda para mantener la proporción apropiada de la misma con respecto a los otros ingredientes. El aluminio se produce combinando alúmina con otros ingredientes en una celda de reacción y aplicando calor al hacer pasar una corriente eléctrica a través de la celda.77(0. es decir.75(0. ya que la transformación logarítmica es eficaz para estabilizar la variabilidad en la distribución de la desviación estándar muestral.08) 4.85(0. lo mejor suele ser utilizar log(s) o log(s2) como variable de respuesta.05) 4. Para investigar los efectos de dispersión.03) 4. En este experimento se investigaron cuatro algoritmos para controlar la proporción.86(0. 112 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA 2.094/ 6 =0.125.". 3.00 I~ 4 • • 2 4. persión. utilizando el método de mínimos cuadrados. Se dieron ya (en la sección 3-3. indican que no hay problemas con la validez del experimento. La diferencia entre estas dos sumas de cuadrados es la suma de cuadrados de los tratamientos con la que puede realizarse la prueba de la hipótesis nula. El método será de utilidad más adelante para entender los fundamentos del análisis estadístico de diseños más complejos. el procedimiento consiste en esencia en encontrar la reducción en la suma de cuadrados total para ajustar el modelo con todos los parámetros incluidos y la reducción en la suma de cuadrados cuando el modelo se restringe a la hipótesis nula. Sin embargo. No parece haber gran diferencia entre los algoritmos 1. Llamada la prueba general de significación de la regresión.9 EL ENFOQUE DE REGRESIÓN PARA EL ANÁLISIS DE VARIANZA Se ha ofrecido un desarrollo intuitivo o heurístico del análisis de varianza. ahora se presenta un desarrollo formal. sin embargo.=1 j=l ¡=1 j=l . 2 Y 4. El procedimiento requiere los estimadores de mínimos cuadrados de los parámetros en el modelo del análisis de varianza.) En la figura 3-16 se grafica el logaritmo promedio del ruido del crisol de cada algoritmo para controlar la proporción y se presenta también una distribución t escalada que se usa como distribución de referencia para discriminar entre los algoritmos de la proporción.. Las pruebas estándares de la adecuación del modelo. Esta gráfica revela con toda claridad que el algoritmo 3 para controlar la proporción produce más ruido del crisolo una desviación estándar del voltaje de la celda mayor que los otros algoritmos.00 Ruido del crisollogarítmíco promedio [-1 n (5)] Figura 3-16 Ruido del crisol logarítmico promedio [-ln(s)] de cuatro algoritmos para controlar la proporción en relación con una distribución t escalada con factor de escalamiento ~ MS E / II = . es posible presentar un desarrollo más formal.3) las estimaciones de estos parámetros.. Para encontrar los estimadores de mínimos cuadrados de fl y primero se forma la suma de cuadrados de los errores (3-51) .00 • 3 3.0.. incluyendo las gráficas de probabilidad normal de los residuales.9. 3. (Referirse al problema 3-29.1 Estimación de mínimos cuadrados de los parámetros del modelo Se desarrollan ahora los estimadores de los parámetros en el modelo con un solo factor 'C¡. . .t.. ciertas funciones del parámetro del modelo son estimadas de manera única. Por lo tanto. y no existe una solución única para¡. .Y . Los valores adecuados serían las soluciones de las a + 1 ecuaciones simultáneas - aLI a¡. esta solución no es única y depende de la restricción (ecuación 3-53) que se ha elegido.ti = ¡. 2. .... .. no produce preocupación alguna que í¡ no pueda estimarse de manera úni1 ) l. por ejemplo ílyf¡. (3-54) i=1... +nr z +nf a (3-52) = Ya. las ecuaciones normales no son linealmente independientes. Al derivar la ecuación 3-51 con respecto a ¡. Observe que si se suman la últimas a ecuaciones normales. ..í J. a Evidentemente. se obtiene Níl+nf 1 +nf z + . que minimicenL.3-9 EL ENFOQUE DE REGRESIÓN PARA EL ANÁLISIS DE VARIANZA 113 y se eligen después los valores de¡. Puesto que los efectos de los tratamientos se han definido como desviaciones de la media global.. Al principio esto puede parecer desafortunado porque dos experimentadores diferentes podrían analizar los mismos datos y obtener resultados diferentes si aplican restricciones diferentes. A las a + 1 ecuaciones (ecuación 3-52) con a + 1 incógnitas se les llama las ecuaciones normales de mínimos cuadrados. í a • Esta dificultad puede superarse mediante varios métodos. ... se obtiene la primera ecuación normal. f¡ = Y¡. Puesto que el interés se encuentra generalmente en las diferencias entre los efectos de los tratamientos y no en sus valores reales.t • • aLI =0 . 2. que se estimaría con r.f . a aí¡ . . to i-ésimo ¡.t Yí¡.. .. parece razonable aplicar la restricción ! íl= f¡=O (3-53) ¡=1 Utilizando esta restricción.t.T¡ =O fl. se obtiene como solución de las ecuaciones normales Y . y la media del tratamienrestricción. 2. .t + í¡.y. independientemente de la .t y íi Y al igualar con cero se obtiene -2!! ¡=1 j=1 (Yij-íl-f¡)=O y -2! j=1 (Yij-íl-f¡)=O i=1. Sin embargo..T:¡ i=1. = Yi = Yz. = y. J. ¡. a de la que. Algunos ejemplos son í¡ .. que se estimaría con íl ¡ = íl + f ¡ = y¡.. +nf a níl+nf 1 níl níl = Y. í 1.. . después de simplificar.. La primera ecuación normal corresponde al parámetro fl. ya que todas las observaciones incluyen a fl. REGLA 3. se cuenta con un método más sencillo. A las funciones que se estiman de manera única independientemente de la restricción que se use se les llama funciones estimables. el miem- bro izquierdo de cualquier ecuación normal es el valor esperado del miembro derecho. ésta sería Nfi. la variabilidad no explicada se reduce en cierta cantidad. La reducción en la variabilidad no explicada es siempre la suma de las estimaciones de los parámetros.+ni 1 = YL porque sólo las observaciones del primer tratamiento contienen a r 1 (esto daYL como miembro derecho). REGLA 2. Los parámetros se escriben con un acento circunflejo (A) para indicar que son estimadores y no los verdaderos valores de los parámetros. 3~9. y todas las demás r i aparecen cero veces.. donde cada parámetro está multiplicado por el número de veces que aparece en el total del miembro derecho. Sin embargo. El miembro izquierdo de cualquier ecuación normal es la suma de todos los parámetros del modelo. r 1 sólo aparece en las n observaciones hechas bajo el primer tratamiento. etc. Nos encontramos listos para usar estas estimaciones de los parámetros en un desarrollo generál del análisis de varianza. + ni a = Y. Las reglas siguientes permiten escribir directamente las ecuaciones normales del modelo de cualquier diseño experimental: REGLA 1. fl Yr 1 aparecen exactamente n veces enYL. considere encontrar la reducción en la suma de cuadrados ajustando un modelo particular a los datos. Hay una ecuación normal para cada parámetro del modelo que va a estimarse..114 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA ca. es decir. considere el modelo con un solo factor. Para más información.. por lo tanto. cualquier función de los parámetros del modelo que sea una combinación lineal del miembro del lado izquierdo de las ecuaciones normales (ecuaciones 3-52) puede estimarse de manera única. El miembro derecho de cualquier ecuación normal es sólo la suma de todas las observaciones que contienen el parámetro asociado con esa ecuación normal particular.2 Prueba general de significación de la regresión Una parte fundamental de este procedimiento es escribir las ecuaciones normales del modelo. Por ejemplo.. Por la ecuación 3-52 se verifica que la ecuación presentada arriba es correcta. Al ajustar un modelo a los datos se "explica" parte de la variabilidad. De acuerdo con las reglas anteriores. Para ilustrar esta regla. En general. considere la primera ecuación normal en un experimento con un solo factor. Estas ecuaciones siempre podrán obtenerse formando la función de mínimos cuadrados y derivándola con respecto a cada parámetro desconocido.. En general. el miembro derecho es y. como se hizo en la sección 3-9. + ni 1 + ni 2 + . La segunda ecuación normal correspondería a r 1 y es nfi. porque fl aparece en las N observaciones. r 2 aparece sólo en las n observaciones tomadas bajo el segundo tratamiento. Ahora bien. cada una de ellas multiplicada por el segundo miembro de la .1. ver el material suplementario del texto de este capítulo. en un experimento con un solo factor.=1 = ~+ ¿ 2 a Yi. Por ejemplo... . la reducción debida al ajuste del modelo completo Yij = fl + 7:¡ + cij es (3-55) f...7:) i=l j=l (3-56) Esta cantidad se usa en el denominador del estadístico de prueba de H O:7: 1 = 7: 2 = .=1 a Yi. tal como R(¡1" 7:). a = r". El modelo es Yij = fl + 7:¡ + cij' y las ecuaciones normales se encuentran con las reglas anteriores como Nft+nf 1 +nf 2 nft+nf 1 nft nft +nf 2 + . í1y + L. El número de grados de libertad asociado con una reducción en la suma de cuadrados.. Yl =h Compare estas ecuaciones normales con las que se obtuvieron en la ecuación 3-52. 2.. los estimadores de fl y 7:i son ft= Y . Al aplicar la restricción 2: ~=1 f 1 = O. =¿ i=l a Yi. i=l.3-9 EL ENFOQUE DE REGRESIÓN PARA EL ANÁLISIS DE VARIANZA 115 ecuación normal que corresponde al parámetro específico.... . = 7:a = O. siempre es igual al número de ecuaciones normales linealmente independientes. +nf a = = Y.Y. AR(¡1" 7:) se le llama en ocasiones la suma de cuadrados "de regresión" del modelo completo Y¡j = fl + 7:¡ + cij.y.. 7:) = fty.=1 2 ¿ .. 1 l. . El resto de la variabilidad no explicada por el modelo se encuentra con SSE = ~}: Y~ -R(fl.. A continuación se ilustra la prueba general de significación de la regresión para un experimento con un solo factor y se demuestra que produce el análisis de varianza de un solo factor común. " 1=1 La notación R(¡1" 7:) significa la reducción en la suma de cuadrados a partir del ajuste del modelo que contiene afl Y{7:¡}. n . +~ i=l f i Yi.Yi. a La reducción en la suma de cuadrados debida al ajuste de este modelo completo se encuentra con la ecuación 3-55 como R(fl. .. R(¡t) tiene un grado de libertad..10..R(Jl. 3.N ? 1. . es la diferencia entre R(¡t. del estadístico de prueba para el análisis de varianza de un solo factor. La suma de cuadradosl:del errores. .. el experimentador quizá quiera usar un procedimiento alternativo del análisis de varianza con la prueba F que no dependa de este su- . la reducción enla suma de cuadrados que resulta de ajustar el modelo. La suma de cuadrados debida al \ü"¡}. 7:) I(N-a) ] que se distribuye como Fa~l.una sola. que es R(rl Jl) = R.leión normal para este modelo reducido.ij' Hay .N-a bajo la hipótesis nula.grados de libertad.. El modelo reducido eSYij = Jl + f. Para encontrarla. r) .10 3. Por lo tanto.¿ Yi. 7:) y tiene N . elestadístico apropiado para probar H o: 7: 1 = r 2 = . queporla ecuación 3-9 se identifica como SS1tatamientos' Estableciendo el supuesto de normqlidadusual.. 7:) Y R(¡t).: y2 1=1 con a -1..R(Jl) .1 j=l .ecuaciónnormalpara este modelo: NA = Y. es decir. SSE = !:! Y~ ¡=.·Y. = r a = O es F= o '[ 11 R(rIJl)/(a-l) a ~# Y~ -R(Jl. reducido que sólo contiene a Jl es 2 R(')-()'( )-L Jl-Y. grados de libertad porque haya ecuaciones normales:linealmenteindependientes.a grados de libertad.·N Puesto que hay una sola ecu<. 7:¡ = Opara todai.suma de cuadrados que resulta de los efectos de los tratamientos (el {7:¡}). por la ecuación 3-56..116 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA que tiene.1 MÉTODOS NOPARAMÉTRICOS EN EL ANÁLISIS DE VARIANZA La prueba de Kruskal.= R(Modelo Completo) .R(Modelo Reducido) =. Se trata.(¡l..hipótesis nula.Wallis En situaciones en las que el supuesto de normalidad no está justificado. desde luego. se considera que el modelo se restringe ala. y el estimador de ¡l esA = y. dado que Jl ya está incluida en el modelo.a. a-l 2 la hipótesis nula se r~chaza. El estadístico de.3-10 MÉTODOS NO PARAMÉTRICOS EN EL ANÁLISIS DE VARIANZA 117 puesto. Por lo tanto. y el estadístico de (3-59) R2 _i. EJEMPLO 3". Kruskal y Wallis [68] han desarrollado este procedimiento. SeaR¡. prueba es (3-57) donde ni es el número de observaciones del tratamiento i-ésimo. N es el número total de observaciones y S2 = -l-[I~ N-1 i=l j=l R~ _ N(N+1)2] 4 (3-58) Observe que S2 es sólo la varianza de los rangos. si H> Xa.-l bajo la hipótesis nula. por ejemplo n¡ . En la tabla 3-14 se muestran los datos del ejemplo 3-1 y sus rangos correspondientes. habrá pequeñas diferencias entre las ecuaciones 3-57 y 3-59. La prueba de Kruskal-Wallis se usa para probar la hipótesis nula de que los a tratamientos son idénticos contra la hipótesis alternativa de que algunos de los tratamientos generan observaciones que son mayores que otras. primero se hace la clasificación en rangos de lasYij observaciones en orden ascendente y cada observación se reemplaza con su rango.25(26)2] 24 = 53. Ypuede usarse la forma más simple (ecuación 3-59).79. la ecuación 3-57 se usa como el estadístico de prueba. Para realizar la prueba de Kruskal-Wallis.· Por la ecuación 3-58 se encuentra S2 = -l-[I~ N-1 ¡=l j=l R~ _ N(N+1)2] 4 4 = ~[5497.03 .12 . N(N +1) f:t " n¡ -3(N+1) Cuando el número de empates es moderado.la suma de los rangos del tratamiento i-ésimo. Si las ni son razonablemente grandes. La prueba de Kruskal-Wallis es una alternativa no paramétrica del análisis de varianza usual. También podría usarse el enfoque del valor P. H se distribuye aproximadamente como X. por ejemplo Rij' asignándole a la observación menor el rango 1.::: 5. S2 prueba se simplifica a H= 12 a = N(N + 1)/12. se asigna el rango promedio a cada una de las observaciones empatadas. Si no hay empates. En el caso de empates (observaciones que tienen el mismo valor). Puesto que hay un número bastante grande de empates. en ocasiones es conveniente considerar la prueba de Kruskal-Wallis como una prueba de la igualdad de las medias de los tratamientos. Debido a que el procedimiento está diseñado para ser sensible al probar las diferencias en las medias. probablemente los supuestos del análisis de varianza se satisfacen razonablemente. el resultado es un procedimiento aproximado que tiene buenas propiedades estadísticas (ver Conover e lInan [30a.0 16.25 esP = 0. deberá darse preferencia a la transformación de rangos.5 7.5 16.5 7.5 85. (El valor PparaH = 19.0 5.5 12 17 12 18 18 9.0 7 10 11 15 11 2. 337). bD. p.25(26)2] 53.0 14 18 18 19 19 11.0 33.0 4. y el análisis estándar es satisfactorio.0 2.5 16.5 66.0 7.2 Comentarios generales sobre la transformación de rangos Al procedimiento utilizado en la sección anterior de reemplazar las observaciones con sus rangos se le llama la transformación de rangos. ya que es menos posible que sea distorsionada por una condición de no normalidad o la presencia de observaciones inusuales.0 9.5 16.0 20.5 y el estadístico de prueba es H = -1 [a Ri~ S2 i=l N(N+1)2] L-ni ------'---''-4 = _1_[5245. Cuando ambos procedimientos producen resultados similares.28.5 20.il j . Si se aplicara la prueba F común a los rangos en lugar de a los datos originales. Esto incluye muchos de los diseños de capítulos subsecuentes de este libro.5 24.4' 4 = 13. Es una técnica muy poderosa y útil. Observe que cuando el estadístico H de Kruskal-Wallis se incrementa o decrementa.25 Puesto que H > X~.5 14.0 27. Cuando los dos procedimientos difieren.118 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA Tabla 3-14 Datos y rangos para el experimento de la resistencia a la tensión del ejemplo 3-1 Peso porcentual del algodón 15 Ylj 7 7 15 11 9 R¡. Fa también se incrementa o decrementa.0.0 12.5 25. se recomienda que el análisis de varianza común se realice tanto en los datos originales como en los rangos.0002.0 113.03 4 = 19. Si los datos están en rangos y se aplica la pruebaF común. se rechazaría la hipótesis nula y se concluiría que los tratamientos difieren.0 23. En tales casos. por lo que la prueba de Kruskal-Wallis es equivalente a aplicar el análisis de varianza común a los rangos. se obtendría Fa = -(N---1------'-H)-/(--'-N---a-) H/(a-1) (3-60) como el estadístico de prueba (ver Conover [20]. tal vez el experimentador quiera investigar el uso de transfor- :¡ )1 . La transformación de rangos tiene una amplia aplicabilidad en los problemas de diseño experimental para los que no existe ninguna alternativa no paramétrica para el análisis de varianza.0 19 25 22 19 23 20.0 12. 3~10. Cuando existe preocupación acerca del supuesto de normalidad o por el efecto de puntos atípicos o valores"absurdos". 20 Rlj Y2¡ R2¡ Y3j 25 R 3j Y4j 30 R4j YSj 35 R Sj 2.) Se trata de la misma conclusión obtenida por el análisis de varianza usual con la prueba F.01.5 20. 6 21.7 21. ¿Qué conclusiones se sacarían acerca de la validez .4 21. Comentar la gráfica. Se han colectado los siguientes datos: Técnica de mezclado 1 2 3 4 3-1.05.8 21. Se llevó a cabo un experimento a fin de determinar si cuatro temperaturas de cocción específicas afectan la densidad de cierto tipo de ladrillo. ¿A qué conclusiones se llega? e) Usar el método LSD de Fisher con a = 0. 3-3. ¿Hay alguna diferencia en las conclusiones? b) Resolver de nuevo el inciso b del problema 3-1 utilizando la prueba de Tukey con a = 0.8 21.8 21. 3~11 PROBLEMAS Se estudia la resistencia a la tensión del cemento portland.9 21. ¿Sirve esto de ayuda para interpretar los resultados del experimento? 3-4. 3-2. ¿Esta gráfica resume adecuadamente los resultados del análisis de varianza del inciso a? .5 21.3-11 PROBLEMAS 119 maciones para la faIta de normalidad y examinar los datos y el procedimiento experimental a fin de determinar si hay puntos atípicos y por qué han ocurrido. d) Construir una gráfica de probabilidad normal de los residuales.9 21. Encontrar también un intervalo de confianza de 95% para la diferencia en las medias de las técnicas 1 y 3.6 21. Utilizar a = 0.4 21. El experimento produjo los siguientes datos: Temperatura 100 125 150 175 21. Encontrar un intervalo de confianza de 95 % para la resistencia a la tensión media del cemento portland que produce cada una de las cuatro técnicas de mezclado.5 a) ¿La temperatura de cocción afecta la densidad de los ladrillos? Utilizar a = 0. ¿Se llega a las .7 21. b) ¿Es apropiado comparar las medias utilizando la prueba del rango múltiple de Duncan (por ejemplo) en este experimento? e) Analizar los residuales de este experimento.9 21.4 21. /) Hacer un diagrama de dispersión de los resultados como ayuda para la interpretación de los resultados de este experimento. Considere nuevamente el problema 3-1.8 21.mismas conclusiones con la prueba de Tukey que las obtenidas con el procedimiento gráfico y/o con la prueba del rango múltiple de Duncan? e) Explicar la diferencia entre los procedimientos de Duncan y de Tukey. a) Resolver de nuevo el inciso b del problema 3-1 utilizando la prueba del rango múltiple de Duncan con a = 0. Pueden usarse económicamente cuatro diferentes técnicas de mezclado. ¿Se satisfacen los supuestos del análisis de varianza? d) Construir una representación gráfica de los tratamientos como se describió en la sección 3-5.05.05.del supuesto de normalidad? e) Graficar los residuales contra la resistencia a la tensión predicha. Resistencia a la tensión (lb/pulg2) 3129 3200 2800 2600 3000 3300 2900 2700 2865 2975 2985 2600 2890 3150 3050 2765 a) Probar la hipótesis de que las técnicas de mezclado afectan la resistencia del cemento. b) Construir una representación gráfica como se describió en la sección 3-5.05.3.7 Densidad 21.3 para comparar las resistencias a la tensión promedio de las cuatro técnicas de mezclado.7 21.05 para hacer comparaciones entre pares de medias. Un fabricante de televisores está interesado en el efecto de cuatro tipos diferentes de recubrimientos para cinescopias de color sobre la conductividad de un cinescopio. b) Encontrar el valor P para el estadístico F del inciso a. Se usó un cilindro de 3 x 6 pulgadas. no. Los datos del experimento se muestran en la . e) Calcular la estimación de un intervalo de confianza de 95% para la media del tipo de recubrimiento 4. 4) se describe un experimento en el que se investigó la cantidad de radón liberado en las duchas. Se usó agua enriquecida con radón en el experimento. En un artículo de Environment Intematianal (vol.3 para comparar las medias. y se probaron seis diámetros diferentes de los orificios de las regaderas. y el número de veces que esta barra se utilizó es la variable del diseño. como se describió en la sección 3-5. ¿A qué conclusiones se llega? Explicar en detalle cómo se modificó la técnica para tomar en cuenta los tamaños de las muestras desiguales. Considere nuevamente el experimento del problema 3-6. ¿Cuál es el tip9 de recubrimiento que produce la conductividad más alta? f) Suponiendo que el recubrimiento tipo 4 es el que se está usando actualmente. 3-7. Resolver de nuevo el inciso d del problema 3-4 utilizando el método LSD de Fisher. 213-216) se describen varios experimentos para investigar el varillado del concreto para eiiminar el aire atrapado.05. 84. e) Usar el método gráfico comentado en la sección 3-5.05. 3-9. ¿Qué conclusiones pueden sacarse acerca de los supuestos fundamentales del modelo? d) Construir una representación gráfica para comparar las medias de los tratamientos.~ siguiente tabla: " j . CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA 3-6.3. Calcular la estimación de un intervalo de confianza de 99% para la diferencia media entre los tipos de recubrimiento 1 y 4. 3-8. Analizar los residuales y sacar conclusiones acerca de la adecuación del modelo. Los datos se muestran en la tabla siguiente: Nivel de varillado 10 15 20 25 Resistencia a la compresión 1530 1610 1560 1500 1530 1650 1730 1490 1440 1500 1530 1510 a) ¿Hay alguna diferencia en la resistencia a la compresión debida al nivel de varillado? Utilizar a = 0.120 3-5. En un artículo deACI Matelials Jaumal (vol. b) Estimar la media global y los efectos de los tratamientos. La resistencia a la compresión resultante de la muestra de concreto es la respuesta. 18.05. e) Analizar los residuales de este experimento.•. pp. Se obtienen los siguientes datos de la conductividad: Tipo de recubrimiento 1 2 3 4 143 152 134 129 Conductividad 141 150 149 137 132 136 127 132 146 143 127 129 a) ¿Hay alguna diferencia en la conductividad debida al tipo de recubrimiento? Utilizar a = 0. d) Probar todos los pares de medias utilizando el método LSD de Fisher con a = 0. ¿qué se recomendaría al fabricante? Quiere minimizarse la conductividad. d) Encontrar un intervalo de confianza de 95% para el porcentaje promedio de radón liberado cuando el diámetro de los orificios es 1.6 21. b) Usar la prueba de Tukey para comparar pares de medias de los tratamientos.3 23.40. Se estudia la vida efectiva de los fluidos aislantes en una carga acelerada de 35 kV.3 22.1 18.5 20.40 1. ¿Se satisfacen los supuestos del análisis de varianza básico? 3-11.05. Los resultados se muestran en la siguiente tabla: Tipo de circuito 1 2 3 9 20 6 Tiempo de respuesta 12 21 5 10 23 8 8 17 16 15 30 7 a) Probar la hipótesis de que los tres tipos de circuitostienen'd mismo tiempo de respuesta.9 21. ¿Qué conclusiones pueden sacarse? ¿Cómo se comparan con las conclusiones del inciso b? d) Construir un conjunto de contrastes ortogonales.3.3 18.3 18.5 18.6 16. e) Si el lector fuera el ingeniero de diseño y quisiera minimizar el tiempo de respuesta.. e) Usar el procedimiento gráfico de la sección3-5.9 20. e) Construir una representación gráfica para comparar las medias de los tratamientds. b) Encontrar el valor P para el estadístico F del inciso a. Los resultados fueron los siguientes: Tipo de fluido 1 2 3 4 17.99 80 75 74 67 62 60 Radón liberado (%) 83 83 75 79 73 76 72 74 62 67 61' 64 77: 74 69' 66 85" 79 ¡ a) ¿El tamaño de los orificios afecta el porcentaje promedio del radónliberad6?.02 1.4 19.9 15.como se describió en la sección 3-5.5 19.71 1. e) Analizar los residuales de este experimento.01. 'Utilizar a= 0.6 17.5 16.1 19. ¿qué tipo de circuito seleccionaría? f) Analizar los residuales de este experimento. suponiendo que al principio del experimento se sospechaba que el tiempo de respuesta del circuito tipo 2 era diferente del de los otros dos.1 Vida (en horas) con 35 kV de carga 17.4 16.37 0.8 .3-Ü:PROBLEMAS 121 Diámetro de los orificios 0. ¿Qué conclusiones pueden sacarse? Se determinó el tiempo de respuesta en milisegundos para tres diferentes tipos de circuitos que podrían usarse en un mecanismo de desconexión automática.51 0.4 17.01.utilizar a = 0.3 19. 3-10. Utilizar a = 0.3 para comparar las medias de los tratamientos.6 20.3 21. Se han obtenido datos de una prueba para cuatro tipos de fluidos. ¿Cuál fluido seleccionaría el lector. ¿Se satisfacen los supuestos del análisis de varianza básico? Se estudian cuatro diferentes tipos de diseños de un circuito digital de computadora para comparar la cantidad de ruido presente. Se someten a estudio tres marcas de baterías. Construir la estimación del intervalo de confianza de 99% para la diferencia media entre las vidas de las baterías marcas 2 y 3.05.16 84. Se sospecha que las vidas (en semanas) de las tres marcas son diferentes.04 84.05.13 84. dado que el objetivo es conseguir la vida efectiva más larga? e) Analizarlos residuales de este experimento. Cada químico hace tres determinaciones.20 84. b) Analizar los residuales de este experimento.55 3-14.38 85. e) Construir la estimación de un intervalo de confianza de 95% para la vida media de la batería marca 2. .72 84.15 85.48 85. Se pide a cuatro químicos que determinen el porcentaje de alcohol metílico en cierto compuesto químico. Se obtienen los siguientes datos: Diseño del circuito 1 2 3 4 19 80 47 95 20 61 26 46 Ruido observado 19 30 56 73 25 35 83 78 8 80 50 97 3-13.122 b) CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA 3-12.88 84. b) Analizar los residuales de este experimento.10 84.05. y los resultados son los siguientes: Químico 1 2 3 4 Porcentaje de alcohol metílico 84. a) ¿Los químicos difieren significativamente? Utilizar a = 0. Se prueban cinco baterías de cada marca con los resultados siguientes: Marca 1 100 96 92 96 92 Semanas de vida Marca 2 76 80 75 84 82 Marca 3 108 100 96 98 100 a) ¿Las vidas de estas tres marcas son diferentes? b) Analizar los residuales de este experimento. a) ¿La cantidad de ruido presente es la misma para los cuatro diseños? Utilizar a = 0. a) ¿Hay algún indicio de que los fluidos difieran? Utilizar a = 0.99 84. e) Si el químico 2 es un empleado nuevo. ¿Se satisfacen los supuestos del análisis de varianza? e) ¿Qué diseño del circuito se seleccionaría para usarlo? El ruido bajo es mejor. construir un conjunto razonable de eX>ntrastes ortogonales que podría haberse usado al principio del experimento. Se probaron cuatro muestras de cada material con un nivel elevado de voltaje para acelerar el tiempo de falla.050 2 3-17.9 50. Se llevó a cabo un experimento para investigar la eficacia de cinco materiales aislantes.5 57. Construir una gráfica de probabilidad normal de los residuales.4 55.2 57.9 2 56.3 54.7 50.0 55.8 54.3-11 PROBLEMAS 123 d) 3-15. ¿qué porcentaje esperaría reemplazar la compañía? Se están investigando cuatro catalizadores que pueden afectar la concentración de un componente en una mezcla líquida de tres componentes. a) ¿Los cinco materiales tienen el mismo efecto sobre el tiempo de falla? b) Graficar los residuales contra la respuesta predicha. ¿Qué marca seleccionaría el lector para usarla? Si el fabricante reemplazara sin cargo cualquier batería que dure menos de 85 semanas.9 49.3 3 4 52. realizar otro análisis de los datos del tiempo de falla y sacar las conclusiones apropiadas.2 55. Un fabricante de semiconductores ha desarrollado tres métodos diferentes para reducir el conteo de partículas en las obleas. 3-16. Los tiempos de falla (en minutos) se muestran abajo: Material 1 2 3 4 5 110 1 880 495 7 Tiempo de falla (minutos) 157 2 1256 7040 5 194 4 5276 5307 29 178 18 4355 10. Los datos se muestran abajo: Método Conteo 31 62 53 10 40 27 21 24 120 4 30 97 1 35 68 .4 a) ¿Los cuatro catalizadores tienen el mismo efecto sobre la concentración? b) Analizar los residuales de este experimento.2 58. e) Construir la estimación de un intervalo de confianza de 99% para la respuesta media del catalizador 1. realizar otro análisis de los datos del conteo de partículas y sacar las conclusiones apropiadas.0 51.1 54. Los tres métodos se prueban en cinco obleas y se obtiene el conteo de partículas después del tratamiento. e) 1 2 3 a) ¿Todos los métodos tienen el mismo efecto sobre el conteo promedio de partículas? b) Graficar los residuales contra la respuesta predicha. Construir una gráfica de probabilidad normal de los residuales. Se obtienen las-siguientes concentraciones: Catalizador 1 58. . ¿Qué información transmiten estas gráficas? e) Con base en la respuesta del inciso b. ¿Hay motivo de preocupación potencial acerca de la validez de los supuestos? Con base en la respuesta del inciso b. Se investigaron cuatro diferentes velocidades de alimentación en un experimento con unamáquina CNC que produce una pieza que se usa en la unidad de potencia auxiliar de un avión. Si quiere construirse un intervalo de confianza de 95% para la diferencia en las vidas medias de dos baterías que tenga una precisión de ±2 semanas. Si quiere detectarse una diferencia máxima en los tiempos de respuesta promedio de 10 milisegundos con una probabilidad de al menos 0.. Utilizar la prueba de Bartlett para determinar si el supuesto de la igualdad de las varianzas se satisface en el problema 3-14. Qi.90? Considere el experimento del problema 3-14.05. Utilizar a = 0. Graficar los residuales contra los valores predichos. El procedimiento de prueba apropiado es la prueba t agrupada o combinada. Verificar que los métodos para controlar la proporción de alúmina no afectan el voltaje promedio de la celda. 3-29. Utilizar a = 0.90. 3-23. 3-20.90.124 3-18.. En un experimento con efectos fijos. 3-26.u2 = 60. 3-28. Sean (42. 3-22. Q. 3-25. ¿Se llegó a la misma conclusión respecto de la igualdad de las varianzas con el examen de las gráficas de los residuales? Utilizar la prueba de Levene modificada para determinar si el supuesto de las varianzas iguales se satisface en el problema 3-14. a) ¿En qué forma cambiaría la respuesta si una estimación razonable de la varianza del error experimental fuera a2 = 36? b) ¿En qué forma cambiaría la respuesta si una estimación razonable de la varianza del error experimental fuera a2 = 49? e) ¿Puede sacarse alguna conclusión acerca de la sensibilidad de la respuesta dada en esta situación particular acerca de cómo afecta la estimación de a la decisión referente al tamaño de la muestra? d) ¿Puede hacerse alguna recomendación acerca de cómo debería usarse este enfoque general para elegir n en la práctica? Referirse al experimento de la fundición de aluminio descrito en la sección 3-8.. ¿Cuántas observaciones deberán hacerse en cada población para que la probabilidad de rechazar la hipótesis nula de la igualdad de las medias poblacionales sea al menos 0. Demostrar que la varianza de la combinación lineal ~:=¡CiYi. Considere la prueba de la igualdad de las medias de dos poblaciones normales. a) Si quiere detectarse una diferencia máxima en la vida de las baterías de 10 horas con una probabilidad de al menos 0. Demostrar que la prueba t combinada es equivalente al análisis de varianza de un solo factor.90? Suponer que a = 0. los componentes con un solo grado de libertad de los contrastes ortogonales. 3-27. 3-24. la experiencia previa indica que es probable que sólo estén presentes . Examinar las gráficas de los residuales usuales y comentar la validez del experimento. Verificar el análisis de varianza del ruido del crisol que se resume en la tabla 3-13. CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: ELANÁLISrS DE VARIANZA 3-19.05. ¿Existe algún indicio de que se violan algunos de los supuestos fundamentales? Referirse al experimento de la fundición de aluminio de la sección 3-8. El ingeniero de manufactura a cargo del experimento sabe que una dimensión crítica de la pieza de interés puede ser afectada por la velocidad de alimentación. ¿qué tamaño de la muestra deberá usarse? Comentar cómo se obtendría una estimación preliminar de a2 para responder esta pregunta. Sin embargo. donde las varianzas son desconocidas pero se suponen iguales. Construir una gráfica de probabilidad normal de los residuales.u4 = 60. Referirse al problema 3-26. Demostrar que S STratamientos = Q¡2 + Qi + Q. ¿cuántas baterías de cada marca deben probarse? Suponga que cuatro poblaciones normales tienen medias.u3 = 50 y. ¿qué tamaño de la muestra deberá usarse? ¿Cómo se obtendría una estimación preliminar de a2 ? Referirse al problema 3-14.u¡ = 50. es a2~:=¡nici2. ¿qué tamaño de la muestra deberá usarse si quiere detectarse esto con una probabilidad de al menos 0. 3-30. b) Si la diferencia entre las marcas es lo suficientemente grande para que la desviación estándar de una observación se incremente en 25%. suponga que hay n observaciones para cada uno de cuatro tratamientos. 3-21.05 y que una estimación razonable de la varianza de error es a2 = 25. ¿Se llegó a la misma conclusión respecto de la igualdad de las varianzas con el examen de las gráficas de los residuales? Referirse al problema 3-10. 20 5 0.11 0.05 0.06 0.07 0. Suponga que la observación mayor de la resistencia a la tensión se registró incorrectamente como 50.19 2 0.09 0. ¿Hay algún problema 3-31. 3-33. Es decir. El ingeniero realiza cinco corridas de producción con cada velocidad de alimentación y obtiene la desviación estándar de la dimensión crítica (en 10-3 mm). ¿Los resultados son comparables con los encontrados por el análisis de varianza usual? Considere el experimento del ejemplo 3-1.08 0.11 a) ¿La velocidad de alimentación tiene algún efecto sobre la desviación estándar de esta dimensión crítica? b) Usar los residuales de este experimento para investigar la adecuación del modelo. ¿Qué efecto tiene esto sobre el análisis de varianza usual? ¿Qué efecto tiene sobre la prueba de Kruskal-Wallis? . Usar la prueba de Kruskal-Wallis en el experimento del problema 3-11.08 0.T3. Demostrar que el procedimiento produce los mismos resultados que el análisis de varianza usual.3-11 PROBLEMAS 125 efectos de dispersión.13 3 0.12 0. ¿Los estimadores i i Yit son los mismos que se encontraron en el inciso a? ¿Por qué? Estimar ahora T 1 -T2 Y compararla respuesta con la del inciso a.15 4 0.12 0. Aplicar la prueba general de significación de la regresión en el experimento del ejemplo 3-1. Usar la prueba de Kruskal-Wallis en el experimento del problema 3-12. Yfl + T1 + T 2 utilizando las dos soluciones de las ecuaciones normales. Suponer que todas las corridas se hicieron en orden aleatorio. Velocidad de alimentación (pulgadas/minuto) 10 12 14 16 Corrida de producción 1 0.09 0. 3-32.06 0. Los datos se muestran abajo.08 0. a) Escribir las ecuaciones normales de mínimos cuadrados para este problema y resolverlas para it y Ti' utilizando la restricción usual C~:¡=1Ti = O). 3-34. ¿Qué afirmación puede hacerse respecto de estimar los contrastes en las Ti? e) Estimar fl + T¡.T 2• b) Resolver las ecuaciones del inciso a utilizando la restricción i 3 = O. al cambiarse la velocidad de alimentación no se afecta la dimensión promedio. 3-35.10 0. Comparar las conclusiones obtenidas con las del análisis de varianza usual.13 0. Comparar los resultados obtenidos en cada caso. con la validez experimental? Considere los datos del problema 3-10.07 0. 2T 1 -T2 . Estimar T 1 . pero podría afectarse la variabilidad dimensional. a un ejemplar de prueba de metal. La aleatorización es la técnica de diseño que se utiliza para protegerse contra estos factores perturbadores "que están al acecho". El experimentador ha decidido obtener cuatro observaciones para cada punta. En general. Un experimento como éste podría ser parte de un estudio de la aptitud en la calibración de los instrumentos. se desconoce la existencia de ese factor e incluso puede tener niveles variables mientras se está realizando el experimento. Si por lo menos puede observarse el valor que asume el factor perturbador en cada corrida del experimento. y observar qué resulta de la lectura de la dureza. la variabilidad que surge de un factor perturbador puede afectar los resultados. y por la profundidad de la depresión resultante puede determinarse la dureza del ejemplar. una técnica que se revisará en el capítulo 14. Por lo tanto.Bloques aleatorizados. un factor perturbador puede definirse como un factor del diseño que probablemente tenga un efecto sobre la respuesta. En otros casos. y es la materia de este capítulo. La formación de bloques es una técnica de diseño en extremo importante que se utiliza ampliamente en la experimentación industrial. es decir. cuadrados latinos y diseños relacionados 4~ 1 DISEÑO DE BLOQUES COMPLETOS ALEATORIZADOS En cualquier experimento. el factor perturbador es conocido pero no controlable. pero en el que no existe un interés específico. En ocasiones un factor perturbador es desconocido y no controlable. se necesitarían 16 ejemplares de prueba de metal en este experimento. es decir. es posible hacer la compensación correspondiente en el análisis estadístico mediante el uso del análisis de covarianza. Hay un solo factor---'-el tipo de punta-. Existe un problema potencialmente serio con un experimento por completo aleatorizado en esta situación de diseño. suponga que quiere determinarse si cuatro puntas diferentes producen o no lecturas diferentes en una máquina para probar la dureza. Para ilustrar la idea general. Si los ejemplares de prueba de metal difieren ligeramente en sus durezas. La máquina funciona presionando la punta en un ejemplar de prueba de metal. uno por cada corrida del diseño. y un diseño completamente aleatorizado de un solo factor consistiría en asignar al azar cada una de las 4 X 4 = 16 corridas a una unidad experimental. Cuando la fuente de variabilidad perturbadora es conocida y controlable. puede usarse una técnica de diseño llamada formación de bloques para eliminar de manera sistemática su efecto sobre las comparaciones estadísticas entre los tratamientos. como podría 126 . 4 9. esta estrategia de diseño mejora la precisión de las comparaciones entre las puntas al eliminar la variabilidad entre los ejemplares de prueba. Un diseño para lograr esto requiere que el experimentador pruebe cada punta una vez en cada uno de los cuatro ejemplares de prueba. Dentro de un bloque. El diseño de bloques completos aleatorizados es una generalización de ese concepto. El diseño de bloques completos aleatorizados se muestra en la figura 4-1. randomized complete block design). La respuesta observada es la dureza en la escala C de Rockwell menos 40.6 9. querría eliminarse del error experimental la variabilidad entre los ejemplares de prueba.2 ocurrir si se tomaran de lingotes que se produjeron con temperaturas diferentes. Las unidades de equipo o maquinaria de prueba son con frecuencia diferentes en sus características de operación y serían un factor de formación de bloques típico. El objetivo sería hacer el error experimental tan pequeño como fuera posible.4 9. donde cada bloque consiste en alguna combinación de estos factores no controlables.9 9.5 10. donde se analizó la prueba t: pareada. Observe la similitud de este problema de diseño con el de la sección 2-5. en general. los bloques o ejemplares de prueba forman una unidad experimental más homogénea en la cual comparar las puntas. se le llama diseño de bloques completos aleatorizados (ReBD. suponga que un ingeniero químico está interesado en el efecto de la velocidad de alimentación del catalizador sobre la viscosidad de un polímero. está utilizando los bloques para probar la robustez de su variable de proceso (la velocidad de alimentación) para las condiciones que no puede controlar con facilidad. el orden en que se prueban las cuatro puntas se determina aleatoriamente.4 9. Por ejemplo. De hecho.8 9.4-1 DISEÑO DE BLOQUES COMPLETOS ALEATORIZADOS 127 Tabla 4-1 Diseño de bloques completos aleatorizados para el experimento de la prueba de la dureza Tipo de punta 1 2 3 4 1 9. ver Coleman y Montgomery [27]. La palabra "completos" indica que cada bloque (ejemplar de prueba) contiene todos los tratamientos(puntas). a tratamientos que van a compararse y b bloques. Por lo tanto.7 10. y el orden en que se corren los tratamientos dentro de cada bloque se determina al azar.0 4 10. la temperatura. personas y el tiempo también son fuentes de variabilidad perturbadora comunes en un experimento que pueden controlarse de manera sistemática mediante la formación de bloques.3 9. Como resultado.6 9.0 9. como la fuente de la materia prima.1 Análisis estadístico del diseño de bloques completos aleatorlzados Suponga que se tienen. La formación de bloques también puede ser útil en situaciones que no incluyen necesariamente factores perturbadores.2 9. el operador y la pureza de la materia prima. Sabe que hay varios factores. Hay una observación por tratamiento en cada bloque. Debido a . A este diseño. que son muy difíciles de controlar en proceso en gran escala. Lotes de materia prima. las unidades experimentales (los ejemplares de prueba) contribuirán a la variabilidad observada en los datos de la dureza. el error experimental reflejará tanto el error aleatorio como la variabilidad entre los ejemplares de prueba. que se muestra en la tabla 4-1. Para un análisis más amplio de este punto. El RCBD es uno de los diseños experimentales más utilizados. Son numerosas las situaciones en las que el RCBD es apropiado.3 9. De hecho. es decir. Al utilizar este diseño.7 Ejemplar de prueba 2 3 9. 4-1. decide probar en bloques la velocidad de alimentación del catalizador. y 8ij es el término del error NID(O. por ejemplo H o :T 1 =T 2 ='''=T a =O H 1 : T ¡ :. en este capítulo se usará el modelo de los efectos de la ecuación 4-1. Expresado matemáticamente.. Sin embargo. .. Por lo tanto.é O para al menos una i Seay¡. donde fl¡j = fl + T¡ + f3j. . los efectos de los tratamientos y los bloques se consideran por lo general como desviaciones de la media global.r']' I 128 Bloque 1 CAPÍTULO 4 BLOQUES ALEATORIZADOS. con frecuencia se dice que los bloques representan una restricción sobre la aleatorización. 'o . = fla 2 H 1 : al menos una fl ¡ :. que la única aleatorización de los tratamientos se hace dentro de los bloques. Se considerará inicialmente que los tratamientos y los bloques son factores fijos.é fl j Puesto que la media del tratamiento i-ésimo es fl¡ = (l/b)L ~=l (¡J. por ejemplo Yij=flij+8ij { )'=1 i=l. El tradicional es el modelo de los efectos: Yij=fl+T¡+f3j+8ij i=l. el interés se encuentra en probar la igualdad de las medias de los tratamientos. T¡ es el efecto del tratamiento i-ésimo.. a { ) '=1" 2 . . el gran total de las observaciones y N = ab el número total de observaciones. En consecuencia. + T¡ + f3j) = fl + T¡. 02) usual.y'. 2. f3j es el efecto del bloque j-ésimo. el total de observaciones hechas bajo el tratamiento i'YJ el total de observaciones del bloquej. CUADRADOS LATINOS Y DISEÑOS RELACIONADOS Bloque b Bloque 2 Yab Figura 4·1 El diseño de bloques completos aIeatorizados.... b (4-1) donde fl es la media global.. las hipótesis de interés son H o : fll = fl = . a 2 b . En un experimento en el que se use el RCBD.. por lo que También es posible usar un modelo de las medias para el RCBD. Como en el modelo del diseño experimental con un solo factor del capítulo 3. una manera equivalente de escribir las hipótesis anteriores es en términos de los efectos de los tratamientos. . .. 2. el modelo de los efectos para el RCBD es un modelo sobreespecificado... El modelo estadístico del RCBD puede escribirse de varias maneras. SS T tiene N .) LJ LJ Yj ..Y. _ Y. a b a b "" . Yj _ Y. -Y.Y. LJ LJ Yi. . . a j=1.)(. .)2 LJLJ i=1 j=1 (4-7) representa una partición de la suma de cuadrados total. se tiene SST = SSTratamientos +SSBloques +SSE (4-8) Puesto que hay N observaciones..j .. j=1 b +" " (Yij . . = Yi.j +Y. se prueba que los tres productos cruzados son cero. --)( Y. Yi..)2 LJ (Yi.... Por lo tanto. . =L j=1 b Yj -(4-4) De manera similar'Yi. Al expresar simbólicamente las sumas de cuadrados de la ecuación 4-7. pero laboriosos.. )]2 i=1 j=1 i=1 j=1 Al desarrollar el miembro del lado derecho de la ecuación 4-6 se obtiene a b a b (4-6) " LJ " ( Yij _ Y. La suma de cuadra- . Yij -Yi.)2 + 2" " (. . . )2 = LL [(Yi. )+(Yij . Y.j . i=1 j=1 a i=1 j=1 b + 2" " (-)( Yij .._ Y. ..Y.+ Y. 2. Yj _ Y... i=1 j=1 a b +2"" LJLJ (Yi. respectivamente.. Haya tratamientos y b bloques. .4-1 DISEÑO DE BLOQUES COMPLETOS ALEATORIZADOS 129 (4-2) Yi.1 grados de libertad.. )+(Y. .Yi.Yj ...Yi. Es decir.Y.. _ Y. .=1 a (. _ Y.2. j _ Y. ) i=1 j=1 Mediante procedimientos algebraicos simples.+ Y.)2 +a LJ " (.YJ es el promedio de las observaciones del bloque j. es el promedio de las observaciones hechas bajo el tratamiento i... de donde SSltatamientos y SSBloques tienen a -1 y b -1 grados de libertad.y. / b a b Y.. Y.) LJ " LJ ( Yij _ Yi.=1 j=1 = b" LJ . = 2: L i=1 j=1 Yij =L i=1 ~ Yi.. / N (4-5) La suma de cuadrados total corregida puede expresarse como LL (Yij .. ..Y. b Yj =~ i=1 a b Yij (4-3) y Y. j / a Y.j + Y.j = Y. i=1 a a b j=1 b a b +" .j + Y. ..)2 + a LJ " (.)2 LJ i=1 j=1 = b" .)2 Yi.Yi..)2 LJ LJ ( Yij _ Y. = 2: j=1 b Yij i=1. es el gran promedio de todas las observaciones. al establecer los supuestos de normalidad usuales para los errores. examinar el cociente MSBloque/MSEes muy razonable.130 CAPÍTULO 4 BLOQUES ALEATORIZADOS. considerar Fo = MSBloque/MSE como una pruebaF exacta para la igualdad de las medias de los bloques no es una buena práctica general. Puede demostrarse que el valor esperado de los cuadrados medios. Box.(a -1) . en caso de que la diferencia entre estas medias no sea considerable. pero si los errores son NID(O. Entonces. Anderson y McLean [2] argumentan que la restricción sobre la aleatorización impide que este estadístico sea una prueba significativa para comparar las medias de los bloques y que este cociente F es en realidad una prueba de la igualdad de las medias de los bloques más la restricción sobre la aleatorización (a la que llaman el error de la restricción. quizá no sea necesaria la formación de bloques en experimentos futuros. a-1. se usaría el estadístico de prueba = MSTratamientos MS E que se distribuye como F a_1. recuerde que la aleatorización sólo se ha aplicado a los tratamientos dentro de los bloques. ¿qué se hace en la práctica? Debido a que con frecuencia el supuesto de normalidad es cuestionable. Por otra parte. es decir. y H o se rechazaría si F o > Fa. como un procedimiento aproximado para investigar el efecto de la variable formación de bloques. Hayab celdas conab -1 grados de libertad entre ellas. Cada suma de cuadrados dividida por sus grados de libertad es un cuadrado medio. (a-1j(b-1) si la hipótesis nula es verdadera. Agregan que en la prueba para comparar las medias de los bloques no puede recurrirse a dicha justificación debido a la restricción sobre la aleatorización. if). SSBloque/if y SSE/if son variables aleatorias ji-cuadrada con distribuciones independientes. Hunter y Hunter [18] señalan que la pruebaF del análisis de varianza común puede justificarse exclusivamente con base en la aleatorización. CUADRADOS LATINOS Y DISEÑOS RELACIONADOS dos del error es sólo la suma de cuadrados entre las celdas menos la suma de cuadrados de los tratamientos ylos bloques. b-1. la suma de los grados de libertad del lado derecho de la ecuación 4-8 es igual al total del lado izquierdo. (a-l)(b-1)' También podría haber interés en comparar las medias de los bloques porque. Por esa razón. esta prueba F no se incluye en la tabla del análisis de varianza. o 2 2 + aL f3~ 1'=1 b-1 Por lo tanto. ¿Qué efecto tiene esto sobre el estadístico F o = MS Blo _ que/MSE? Existen diferentes puntos de vista para abordar esta cuestión. La región crítica es la cola superior de la distribución F. Sin embargo. Además. puede usarse el teorema 3-1 para demostrar que SSTratamiento/if.1 sin el uso directo del supuesto de normalidad. Si este cociente es muy 1 De hecho. (a-1)(b-1)' Sin embargo. aparentemente la hipótesis H o:f31' = O puede probarse comparando el estadístico Fo = MSBloque/MSE con Fa.de la distribución de aleatorización generada al calcular F o a partir de cada asignación posible de las respuestas a los tratamientos. de donde SSEtiene ab -1. los bloques representan una restricción sobre la aleatorización. ver Anderson y McLean [2] para detalles adicionales). puede usarse el estadístico Fo = MSBloque/MSE para comparar las medias de los bloques.(b -1) = (a -l)(b -1) grados de libertad. la distribución F de la teoría normal es una aproximación. por lo tanto. si los tratamientos y los bloques son fijos. es b E( MS Tratamientos ) = a 2 L 7:7 b a i=l + --'-a--'---l- E(MSBloques) = a E(MS E)= a F. para probar la igualdad de las medias de los tratamientos. Por ejemplo. . Por los cuadrados medios esperados. ~ F'o.4 9..2 9. Los datos obtenidos se repiten por conveniencia en la tabla 4-3. resultando un diseño de bloques completos aleatorizados. es posible obtener fórmulas de cálculo manual de las sumas de cuadrados para los elementos de la ecuación 4-7 expresándolos en términos de los totales de los tratamientos y los bloques.4 9. . Sin embargo.6 9. Considere el experimento de la prueba de la dureza de la sección 4-1.0 4 10.5 10. Recuerde que el orden en que se probaron las puntas en un ejemplar particular se determinó al azar. 4-1 DISEÑO DE BLOQUES COMPLETOS ALEATORIZADOS 131 Tabla 4-2 Análisis de varianza de un diseño de bloques completos aleatorizados Fuente de variación 'Itatamientos Bloques Error Total Suma de cuadrados SS1i:atamientos Grados de libertad a-1 b-1 (a -l)(b -1) N-1 Cuadrado medio SSTrntamientos a-1 SSBloques MSTratamientos SSBloques SSE SST b-1 SSE (a-1)(b -1) grande.6 3 9.? Y. En general.8 9.4 9.~ J=1 y la suma de cuadrados del error se obtiene por sustracción como SSE = SST -SSTratamientos -SSBloques (4-12) EJEMPLO 4 1 .2 1 2 3 4 . los cálculos se realizarían con un paquete de software de estadística. Estas fórmulas de cálculo son SST = LL Y~-~ i=1 j=1 a b 2 (4-9) y. implica que el factor formación de bloques tiene un efecto considerable y que la reducción del ruido obtenida por la formación de bloques probablemente fue útil para mejorar la precisión de la comparación de las medias de los tratamientos. Cada punta se prueba una vez en cada ejemplar. Para simplificar los Tabla 4-3 Diseño de bloques completos aleatorizados para el experimento de la prueba de la dureza Ejemplar de prueba (bloque) ~~p~ 1 9.7 10.~ SSTratamientos SSBloques b? Yi.j .0 9.3 9.7 2 9.3 9. como el que se muestra en la tabla 4-2.N = 1 a 2 1=1 (4-10) (4-11) 1 b 2 y. . Hay cuatro puntas y cuatro ejemplares de prueba de metal.N = -. El procedimiento suele resumirse en un esquema de análisis de varianza.9 9. 00.SSBJoqUes = 129.N a L j=1 SS E = 1.44 0. Además. al parecer los ejemplares (bloques) difieren de manera significativa. asignando al azar las puntas a cada uno de ellos.50.82. Suponga que se usaran cuatro ejemplares. Utilizando a = 0. El análisis incorrecto de estos datos como un diseño completamente aleatorizado de un solo factor se presenta en la tabla 4-6.38..9 = 3.N SSBloqnes =1. Puesto que 14.00 Grados de libertad Cuadrado medio 12. Las sumas de cuadrados se obtienen de la siguiente manera: SST = LL y~_L N i=1 j=1 4 4 2 = 154.00 En la tabla 4-5 se presenta el análisis de varianza.50= 8. 3 4 -2 15 20 = Y.44 > 3. y que resultara (por casualidad) el mismo diseño que el de la tabla 4-3. -3 cálculos.50 8. se concluye que el tipo de punta afecta la lectura de la dureza media.83 27.~ Yi. [(3)2 +( 4)2 +(_2)2 +(15)2]. CUADRADOS LATINOS Y DISEÑOS RELACIONADOS Tabla 4-4 Datos codificados del experimento de la prueba de la dureza Ejemplar de prueba (bloque) Tipo de punta 1 234 1 2 3 4 -2 -1 -3 2 -4 -1 -2 -1 1 1 3 O 5 9 5 4 2 7 18 Yi. Se obtienen así los datos de la tabla 4-4.0009 Error Total 15 . el valor crítico de Fes F O•05 . los datos originales se codifican restando 9.00SSTratamientos (22t = 129. ya que el cuadrado medio de los bloques es grande en relación con el error.86.(20)2 = 82.SSTratamientos . [(_4)2 +(_3)2 +(9)2 +(18)2].5 de cada observación y multiplicando el resultado por 10.00 129.50 4 16 = SST .50 82.50 0. Tabla 4-5 Fuente de variación Tratamientos (tipo de punta) Bloques (ejemplares) Análisis de varianza del experimento de la prueba de la dureza Suma de cuadrados 38.05.3. Es interesante observar los resultados que se habrían obtenido si no se hubiera tenido conocimiento de los diseños de bloques aleatorizados.50 4 16 1 4 2 l =y'j . El valor P para la prueba también es muy pequeño.00 =bL 4 1=1 1 2 Y.(20)2 = 38. .86.132 CAPÍTULO 4 BLOQUES ALEATORIZADOS.89 Valor P 3 3 9 14. Comparaciones múltiples Si los tratamientos en un RCBD son fijos. Esto ilustra un punto muy importante. (4-13) En la sección siguiente se indicará cómo se usan los residuales en la verificación de la adecuación del modelo. Para ello puede utilizarse cualquiera de los procedimientos de comparaciones múltiples del capítulo 3 (sección 3-5).j + Y. :5 Yl. de donde = Yij - Yi..-l4 es diferente de las otras tres medias.05 .. puesto que Y3. Los residuales se enlisüin en la parte inferior de la salida de computadora.54 1. Si un experimentador no. el efecto puede ser inflar el error experimental a tal grado que las diferencias importantes entre las medias de los tratamientos sean indetectables. (es decir. no puede rechazarse la hipótesis de la igualdad de las mediciones de la dureza media de las cuatro puntas..49.-l3' Ahora bien.-l2 = f. f. Asimismo. En la salida de Design-Expert de la figura 4-2 se ilustra el procedimiento LSD de Fisher.t3' Además.t2 = ¡. . es necesario recordar usar el número de grados de libertad del error para el bloque aleatorizado [(a -l)(b -1)] en lugar de los grados de libertad del diseño completamente aleatorizado [a(n . . • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • e. :5 Y2. Por lo tanto.50 129. una conclusión inmediata sería que ¡. los valores ajustados son Yij eij = Yi. (Las respuestas originales se codificaron restando 9.) El análisis de computadora utilizó las respuestas originales.00 Grados de libertad 3 12 15 Cuadrado medio 12.Y. Observe que si se usa a = 0.83 7. Recuerde que en el análisis original de la tabla 4-5 se utilizaron datos codificados. Por consiguiente.05. el diseño de bloques aleatorizados reduce lo suficiente la cantidad de ruido en los datos para que las diferencias entre las cuatro puntas sean detectadas. recurre a la formación de bloques cuando debería haberlo hecho.70 Puesto que F O. abarcan algunas de las medias restantes). y Y3.3.50 90. + YJ - Y. y el análisis indica una diferencia significativa en las medias de los tratamientos. las medias Y2. Éstos se calculan como eij = Yij - Yij y.tl = ¡.l2 = 3.1)]. Se concluye por lo tanto que la punta tipo 4 produce una dureza media que es significativamente más alta que las lecturas de la dureza media de los otros tres tipos de puntas. Simplemente se sustituye en las fórmulas de la sección 3-5 el número de réplicas (n) en el diseño completamente aleatorizado de un solo factor con el número de bloques (b). se concluiría que f.4-1 DISEÑO DE BLOQUES COMPLETOS ALEATORIZADOS 133 Tabla 4-6 Análisis incorrecto del experimento de la prueba de la dureza como un diseño completamente aleatorizado Fuente de variación Tipo de punta Error Total Suma de cuadrados 38. • • • • • • • • • • • • Muestra de salida de computadora En la figura 4-2 se muestra la salida de computadora condensada obtenida con Design-Expert para los datos de la prueba de la dureza del ejemplo 4-1. al experimentador le interesarán por lo general comparaciones múltiples para descubrir cuáles son los tratamientos cuyas medias difieren.5 Ymultiplicando el resultado por 10. como se demostrará más adelante. las sumas de cuadrados de la figura 4-2 son iguales a las de la tabla 4-5 divididas entre 100 (observe que Design-Expe/1 ha redondeado las sumas de cuadrados con dos cifras decimales). 354 -1.025 -0.00 9.336 2.90 9.30 9.40 9.437 0.889E-003 Std.354 -1.222 0.7163 0.437 -0.686 -1.20 -0.0009 0. If Necessary) Estimated Standard Mean Error 1-A1 2-A2 3-A3 4-A4 9.414 -0.43 1 1 1 1 1 1 0.336 -1.50 2.78 9.437 0.65 9.121 -0.000 Salida de Design-Expe/1 (condensada) para el ejemplo 4-1.87 -4.98 0. Mean C.30 0.014 0.438 0.686 -1.13 -0.512 0.100 0.069 1.55 9.40 9.025 0.37 Student Residual 0.069 0.63 0.414 1.93 9.88 0.134 CAPÍTULO 4 BLOQUES ALEATORIZADOS.50 9.336 0.067 0.67 9.025 -0.067 0.025 0.60 9.57 9.100 -0.025 0.707 0.014 0.70 9.Dev.050 -0.056 0.90 9.38 1.15 -0.000 0.014 0.150 -0.000 0.354 -0.125 0.45 9.60 10.707 -1.438 0.828 -0.437 0. .354 0.075 0.438 0.V.25 -4.222 0.437 0.014 0.438 0.47 Mean Difference DF Standard Error t for Ho Coeff=O Prob> Treatment Itl 1 vs 2 1 vs 3 1 vs 4 2 vs 3 2 vs 4 3 vs 4 -0.067 0.20 9.025 -0.075 0.38 9.8280 0.40 9.707 -1.437 0.44 0.067 0.050 -0.38 0.27 -0.35 9.080 1.438 0.414 0.069 0.512 1.050 0.12 -6.000 -0.47 0.354 2.100 0.13 0.86 0.38 9.061 1.014 0.22 9.70 9. PRESS R-Squared Adj R-Squared Pred R-Squared Adeq Precision 0.635 Treatment Means (Adjusted.70 9.68 9.094 9.438 0.00 10.512 -0.40 9.7706 0.6.437 0.4563 15.20 9.47 0.0026 0.44 14.82 0.067 0.061 0.067 -0.056 0.29 0. CUADRADOS LATINOS Y DISEÑOS RELACIONADOS Response: Hardness in Rockwell C ANOVA for Selected Factorial Model Analysis of variance table [Partial sum of squaresl Source Sumof Squares DF Mean Square F Value Prob> F Block Model A Residual Cor Total 0.25 9 15 8.336 -1.056 0.97 10.60 10.0935 0.80 9.075 0.500 0.27 0.0001 Cook's Distance Outlier Diagnostics Case Statistics Standard Actual Predicted Order Value Value Residual Leverage t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Figura 4-2 9.125 0.25 9.0015 0.336 -0.125 0.0009 significant 0.222 0.437 0.0510 0.13 14.437 0.30 9.437 0.47 0.061 0.38 3 3 3 0. 00 -1.4-1 DISEÑO DE BLOQUES COMPLETOS ALEATORIZADOS 135 Punta Punta Punta Punta -1 • 3 o • • 1 2 • 2 4 I 3 4 Dureza promedio (codificada) Figura 4-3 Las medias del tipo de punta en relación con una distribución t escalada con un factor de escaIación . Las observaciones.00 1. Esta figura confirma los resultados de la prueba LSD de Fisher incluida en la salida de Design-Expert de la figura 4-2.75 -2.50 0.47.00 0.25 -0. Esta gráfica indica que las puntas 1.50 1.00 2.75 4.75 0.50 0.00 3.75 1.00 1.50 -0.00 0.25 1.2 Verificación de la adecuación del modelo Se ha comentado ya la importancia de verificar la adecuación del modelo supuesto.25 0.J0.75 4. deberá estarse alerta a los problemas potenciales con el supuesto de normalidad.25 1.25 -0. Thmbién puede usarse el procedimiento gráfico del capítulo 3 (sección 3-5. En la parte inferior de la salida de Design-Expel1 de la figura 4-2 se enlistan los residuales del diseño de bloques aleatorizados.00 En la figura 4-4 se muestra la gráfica de probabilidad normal y el diagrama de puntos de estos residuales. 89 1-4 = 0. y con la interacción bloque-tratamiento. Los residuales codificados se encontrarían multiplicando estos residuales por 10.25 -1.50 -0. 4~ 1.00 1. con la desigualdad de la varianza por tratamiento o bloque.89 / 4 = 0.1) para comparar las medias del tipo de punta.75 7.00 5.00 4. En la figura 4-5 se muestran las gráficas de los residuales por tipo de punta o . Como en el diseño completamente aleatorizado.JMSE / b =.Jo.J MS E/ b = . los valores ajustados y los residuales de los datos codificados de la prueba de la dureza del ejemplo 4-1 son los siguientes: Yij Yij eij -2.50 -0.50 2.50 -1. En general.00 7.47.00 5.00 -3. No hay indicios marcados de no normalidad y tampoco hay evidencia que apunte a la posible presencia de puntos atípicos.25 -1.00 -1.00 -1. pero que la punta 4 produce una dureza media mucho más alta.75 1.00 -1.00 4.00 2.00 -0.00 -1.00 -2.25 -2.00 2. En la figura 4-3 se grafican las cuatro medias del tipo de punta del ejemplo 4-1 en relación con una distribuciónt escalada con un factor de escalación.75 0. 2 Y3 producen probablemente mediciones de la dureza promedio idénticas.00 -0. el análisis residual es la herramienta principal que se utiliza en estos diagnósticos de verificación. 136 CAPÍTULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEÑOS RELACIONADOS -0.1 -0.0375 0.025 Residuales 0.0875 0.15 Figura 4·4 Gráfica de probabilidad normal de los residuales del ejemplo 4-1. tratamiento y por ejemplar de prueba o bloque. Estas gráficas podrían ser, potencialmente, muy informativas. Si hay una dispersión mayor en los residuales de una punta particular, esto podría indicar que dicha punta produce lecturas de la dureza más erráticas que las otras. Una dispersión mayor en los residuales de un ejemplar de prueba particular podría indicar que la dureza del ejemplar no es uniforme. Sin embargo, en el ejemplo tratado aquí, la figura 4-5 no ofrece indicios de desigualdad de la varianza por tratamiento o por bloque. En la figura 4-6 se grafican los residuales contra los valores ajustados Yij' No deberá haber relación entre el tamaño de los residuales y los valores ajustados Yij' En esta gráfica no se observa nada de interés extraordinario. En ocasiones la gráfica de los residuales contra Yij tiene una forma curvilínea; por ejemplo, puede haber una tendencia para que ocurran residuales negativos con valores bajos de Yij' residuales positivos con valores intermedios de Yij y residuales negativos con valores altos de Yij' Este tipo de patrón sugiere la existencia de una interacción entre los bloques y los tratamientos. Cuando se presente este patrón, deberá usarse una transformación en un esfuerzo por eliminar o minimizar la interacción. En el capítulo 5 (sección 5-3.7) se describe una prueba estadística que puede utilizarse para detectar la presencia de interacción en un diseño de bloques aleatorizados. 4~ 1.3 Otros aspectos del diseño de bloques completos aleatorlzados Aditividad del modelo de bloques aleatorlzados El modelo estadístico lineal que se ha usado para el diseño de bloques aleatorizados Yij = #+T:¡ +f3 j +cij . 4-1 DISEÑO DE BLOQUES COMPLETOS ALEATORIZADOS 137 2.0 1.0 • • •• 2 • • • • • 3 ';'''' 0.0 -1.0 • • • 4 • -2.0 Tipo de punta a) e contra tratamiento ü 2.0 • 1.0 ';'''' 0.0 • • • • • • 3 • • 4 -1.0 • • 2 • -2.0 Ejemplar de prueba b) eij contra bloque Figura 4-5 Gráfica de los residuales por tipo de punta (tratamiento) y por ejemplar de prueba (bloque) para el ejemplo 4-1. es completamente aditivo. Esto quiere decir que, por ejemplo, si el primer tratamiento hace que la respuesta esperada se incremente cinco unidades (í 1 = 5) Ysi el primer bloque incrementa la respuesta esperada 2 unidades (/31 = 2), el incremento esperado en la respuesta tanto del tratamiento 1 como del 1.50 1.00 0.50 ';'''' 0.00 • • • .. -4 • o 2 4 • • 6 -0.50 -1.00 -1.50 • -2 8 • •• Yij • • • Figura 4-6 Gráfica de los residuales contra Yij para el ejemplo 4-1. 138 CAPÍTULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEÑOS RELACIONADOS bloque 1 en conjunto esE(Yll) = f-l + 'i I + f3I = It + 5 + 2 = f-l + 7. En general, el tratamiento 1 incrementa siempre la respuesta esperada 5 unidades sobre la suma de la media global y del efecto del bloque. Aun cuando este modelo aditivo simple muchas veces es útil, hay situaciones en las que resulta inadecuado. Suponga, por ejemplo, que se están comparando cuatro formulaciones de un producto químico utilizando seis lotes de materia prima; los lotes de materia prima se consideran bloques. Si una impureza en el lote 2 afecta de manera adversa la formulación 2, dando como resultado un rendimiento inusualmente bajo, pero no afecta las demás formulaciones, ha ocurrido una interacción entre las formulaciones (o tratamientos) y los lotes (o bloques). De manera similar, pueden ocurrir interacciones entre los tratamientos y los bloques cuando la respuesta se mide en la escala incorrecta. Por lo tanto, una relación que es multiplicativa en las unidades originales, por ejemplo es lineal o aditiva en una escala logarítmica, ya que, por ejemplo, o Aun cuando este tipo de interacción puede eliminarse con una transformación, no todas las interacciones pueden tratarse con tanta facilidad. Por ejemplo, una transformación no elimina la-interacción formulación-lote que se señaló antes. El análisis residual y otros procedimientos de diagnóstico de verificación pueden ser útiles para detectar la no aditividad. Si una interacción está presente, puede afectar seriamente el análisis de varianza y posiblemente lo invalide. En general, la presencia de una interacción infla el cuadrado medio del error y puede afectar adversamente la comparación de las medias de los tratamientos. En situaciones en las que ambos factores, así como su posible interacción, son de interés, deben usarse diseños factoriales. Estos diseños se analizan en detalle en los capítulos 5 al 9. Tratamientos y bloques aleatorios Aun cuando el procedimiento de prueba se ha descrito considerando los tratamientos y los bloques como factores fijos, se utiliza el mismo procedimiento de análisis si los tratamientos o los bloques (o ambos) son aleatorios. Sin embargo, hay algunas modificaciones en la interpretación de los resultados. Por ejemplo, si los bloques son aleatorios, como es con mucha frecuencia el caso, se espera que las comparaciones entre los tratamientos sean las mismas a lo largo de la población de bloques de la cual se seleccionaron aleatoriamente para realizar el experímento. Están también las modificaciones correspondientes en los cuadrados medios esperados. Por ejemplo, si los bloques son variables aleatorias independientes con varianza común, entonces E(MSBIOqUes) = if + aa~, donde a~ es el componente de la varianza de los efectos de los bloques. En cualquier situación, E(MSnatamientos) siempre está libre de cualquier efecto de bloque, y el estadístico de prueba para la variabilidad entre los tratamientos siempre es F o = MSnatamientoJMSE' En situaciones en las que los bloques son aleatorios, si está presente una interacción tratamiento-bloque, las pruebas para las medias de los tratamientos no están afectadas por la interacción. La razón de ello es que los cuadrados medios esperados de los tratamientos y del error contienen ambos el efecto de la interacción; por consiguiente, la prueba de las diferencias en las medias de los tratamientos puede realizarse como de costumbre comparando el cuadrado medio de los tratamientos con el cuadrado medio del error. Este procedimiento no proporciona ninguna información acerca de la interacción. 4-1 DISEÑO DE BLOQUES COMPLETOS ALEATORIZADOS 139 Elección del tamaño de la muestra La elección del tamaño de la muestra, o número de bloques que deben correrse, es una decisión impor- tante cuando se usa un RCBD. Al incrementar el número de bloques, se incrementa el número de réplicas y el número de grados de libertad del error, con lo cual se aumenta la sensibilidad del diseño. Cualquiera de las técnicas déscritas en el capítulo 3 (sección 3-7) para seleccionar el número de réplicas que deben correrse en un experimento completamente aleatorizado con un solo factor puede aplicarse de forma directa al RCBD. Para el caso de un factor fijo, las curvas de operación característica de la parte V del apéndice pueden usarse con b <])2=~ Il"7 aa 2 (4-14) donde haya -1 grados de libertad en el numerador y (a -1 )(b -1) grados de libertad en el denominador. EJEMPLO 4..2 . Considere el problema de la prueba de la dureza del ejemplo 4-1. Suponga que quiere determinarse el número apropiado de bloques que deben correrse si el interés se encuentra en detectar una diferencia máxima real en las lecturas de la dureza media de 0.4 con una alta probabilidad, y una estimación razonable de la desviación estándar de los errores es a = 0.1. (Estos valores se dan en las unidades originales; recuerde que el análisis de varianza se realizó usando datos codificados.) Por la ecuación 3-49, el valor mínimo de <])2 es (escribiendo b, el número de bloques, en lugar de n) <])2 = bD 2aa 2 2 donde D es la diferencia máxima que quiere detectarse. Por lo tanto, <])2 = b(0.4)2 = 2.0b 2(4)(0.1)2 Si se usan b = 3 bloques, entonces <]) = "';2.0b = "';2.0(3) = 2.45, Yhay (a -1 )(b -1) = 3(2) = 6 grados de libertad del error. La parte V del apéndice con V¡ = a -1 = 3 Ya = 0.05 indica que el riesgo f3 de este diseño es aproximadamente 0.10 (potencia = 1- f3 = 0.90). Si se usan b = 4 bloques, <]) = "';2.0b = "';2.0(4) = 2.83, con (a -l)(b -1) = 3(3) = 9 grados de libertad del error, y el riesgo f3 correspondiente es aproximadamente 0.03 (potencia = 1-f3 = 0.97). Tres o cuatro bloques darán como resultado un diseño con una alta probabilidad de detectar la diferencia entre las lecturas de la dureza media consideradas importantes. Debido a que los ejemplares de prueba (bloques) son baratos y están en disponibilidad y el costo de la prueba es bajo, el experimentador decide usar cuatro bloques. ............ ........ ........ ........... ................ .......... ........ Estimación de valores faltantes Cuando se usa el RCBD, en ocasiones falta una observación en uno de los bloques. Esto puede ocurrir debido a descuido o error o por razones fuera del control del experimentador, tal como un daño inevitable a una unidad experimental. Una observación faltante introduce un nuevo problema en el análisis debido a que los tratamientos dejan de ser ortogonales a los bloques; es decir, no ocurren todos los tratamientos en 140 CAPÍTULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEÑOS RELACIONADOS Tabla 4-7 Diseño de bloques completos aleatorizados para el experimento de la prueba de dureza con un valor faltante Tipo de punta 1 2 3 4 1 -2 -1 -3 2 Ejemplar de prueba (bloque) 2 3 -1 1 -2 x -1 O 1 5 4 5 4 2 7 cada uno de los bloques. Existen dos enfoques generales para el problema de los valores faltantes. El primero es un análisis aproximado, en el cual la observación faltante se estima y se lleva a cabo el análisis de varianza usual como si la observación estimada fuera un dato real, con los grados de libertad del error reducidos en 1. Este análisis aproximado es materia de esta sección. El segundo es un análisis exacto, el cual se revisa en la sección 4-1.4. Suponga que falta la observaciónYij del tratamiento i en el bloque j. La observación faltante se denota comox. Como una ilustración, suponga que en el experimento de la prueba de dureza del ejemplo 4-1 el ejemplar de prueba 3 se rompió mientras se probaba la punta 2 y que no pudo obtenerse el dato para esa punta. Los datos aparecerían como en la tabla 4-7. En general, se hará que i represente el gran total con una observación faltante, que y;. represente el total del tratamiento con una observación faltante, y que Y.~ sea el total del bloque con una observación faltante. Suponga que quiere estimarse la observación faltante x de tal modo que x tenga una participación mínima en la suma de cuadrados del error. Puesto que SSE = L~=lL~=l(Yij - Yi. - Y.j + y.. )2, esto es equivalente a elegir x para minimizar SSE= i;~ Y:-¡;i; ~ SS a b 1 a (b ]2 Yij -~~ 1 b (a 1 (a b ]2 i; Yij )2 +ab i;~ Yij o E 1 1 1 = X2 --(y~ +X)2 __ (y'. +X)2 +-(y' +X)2 +R b a') ab" l. (4-15) donde R incluye todos los términos en los que no interviene x. A partir de dSSE/dx=O, se obtiene x= Yi. a ' +b ' _ Y.j Y. ' (4-16) (a-1)(b-1) como la estimación de la observación faltante. Para los datos de la tabla 4-7, se encuentra que 4-16, y;. = 1, Y.'3 = 6 YY.~ = 17. Por lo tanto, por la ecuación (3)(3) x= Y23 = 4(1)+4(6)-17 = 1.22 Ahora puede realizarse el análisis de varianza común utilizando Y23 = 1.22 Yreduciendo los grados de libertad del error en 1. El análisis de varianza se muestra en la tabla 4-8. Compare los resultados de este análisis aproximado con los resultados obtenidos para el conjunto de datos completo (tabla 4-5). 4-1 DISEÑO DE BLOQUES COMPLETOS ALEATORIZADOS 141 Tabla 4~8 Análisis de varianza aproximado del ejemplo 4-1 con un valor faltante Fuente de variación Tipo de punta Ejemplares de prueba (bloques) Error 'Ibtal Suma de cuadrados 39.98 79.53 6.22 125.73 Grados de libertad 3 3 8 Cuadrado medio 13.33 26.51 0.78 17.12 Valor P 0.0008 14 Si son varias las observaciones faltantes, pueden estimarse escribiendo la suma de cuadrados del error como una función de los valores faltantes, derivando con respecto a cada valor faltante, igualando los resultados con cero y resolviendo las ecuaciones resultantes. De manera alternativa, puede usarse la ecuación 4-16 de manera iterativa para estimar los valores faltantes. Para ilustrar el enfoque iterativo, suponga que faltan dos valores. Se estima arbitrariamente el primer valor faltante y después se usa este valor junto con los datos reales y la ecuación 4-16 para estimar el segundo. Entonces puede usarse la ecuación 4-16 para volver a estimar el primer valor faltante, y después de esto, puede volver a estimarse el segundo. Este proceso se continúa hasta que se obtiene la convergencia. En cualquier problema con valores faltantes, los grados de libertad del error se reducen en una unidad por cada observación faltante. 4-1.4 Estimación de los parámetros del modelo y la prueba general de significación de la regresión Si tanto los tratamientos como los bloques son fijos, los parámetros del RCBD pueden estimarse por mínimos cuadrados. Recuerde que el modelo estadístico lineal es i=1' 2, ..., a Yij=fl+7:¡+(3j+sij { '=12 b J " ..., (4-17) Al aplicar las reglas de la sección 3-9.2 para encontrar las ecuaciones normales del modelo de un diseño experimental, se obtiene fl: abjl + blt1 + br2 + 7:1: 7:2: oo' + bra + aPl + aP2 + ... + a'A = Y. bjl + blt1 bjl + M2 + PI + 132 + ... + 'A + PI + 132 + ... + Pb + bfa + 131+ 132 + ... + + ra + aPl = YI. = Y2. 7: a: bjl (31: (32: Pb = Ya. = Yl = Y2 (4-18) + r1 + f 2 + ajl + í\ + r2 + ajl + fa + aP2 (3b: ajl + r1 + r2 + ... + fa + aPb = Yb Observe que la suma de la segunda a la (a + 1)-ésima ecuaciones de la ecuación 4-18 es la primera , ecuación normal, como también es el caso de las b últimas ecuaciones. Por lo tanto, hay dos dependencias 142 CAPÍTULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEÑOS RELACIONADOS lineales en las ecuaciones normales, lo cual implica que deben imponerse dos restricciones para resolver la ecuación 4-18. Las restricciones usuales son ! ri=O (4-19) i=l Al utilizar estas restricciones, las ecuaciones normales se simplifican considerablemente. De hecho, quedan como abJt = Y. bJt+bf. = y. aJt+af = ;'. J .J cuya solución es i=l, 2, j= 1,2, ,a ,b (4-20) Jt = Y.. Ji = Yi. -Y.. {3j = Y.j - Y.. i=l, 2, , a j= 1,2, , b (4-21) Al utilizar la solución de la ecuación normal de la ecuación 4-21, puede encontrarse el valor estimado o ajustado de Yij como Yij = Jt+r i +(Jj = Y. - +(- )+(Yi. - Y. Yj =Yi. + Y.j - Y.. - ) Y. Este resultado se usó anteriormente en la ecuación 4-13 para calcular los residuales de un diseño de bloques aleatorizados. La prueba general de significación de la regresión puede usarSe para desarrollar el análisis de varianza del diseño de bloques completos aleatorizados. Al utilizar la solución de las ecuaciones normales dada por la ecuación 4-21, la reducción en la suma de cuadrados para ajustar el modelo completo es R(j-l, 7:, {3) = Jty. + L r iYi. + L (J Yj i=l j=l j a b = Y. - Y. + LJ ~ (-)Yi. + LJ ~ (- )Yj Yi. - Y. Yj - Y. i=l a b = ~'b + = 2 L Yi. Yi. 1=1 + b a ~'b + L J=l y2 ab a 2 b j=l _ y2 Yj Yj - ab L a i=l y2 _l. b L j=l y2 _.J - - " con a + b - 1 grados de libertad, y la suma de cuadrados del error es SSE = LL Y~ -R(j-l,7:,{3) i=l j=1 a b a b =LLY~-L~-L i=1 j=1 j=1 i=1 a 2 b _'_J l. +L 2 b j=1 a ab ~ ~ (Yij - Yi. - - Yj - += LJLJ Y.. )2 i=1 4-1 DlSEÑO DE BLOQUES COMPLETDS ALEATORIZADOS 143 con (a - l)(b - 1) grados de libertad. Compare esta última ecuación con SSE en la ecuación 4-7. Para probar la hipótesis Ho:íi = 0, el modelo reducido es Yij = ¡,t+(3j +B ij que es un análisis de varianza de un solo factor. Por analogía con la ecuación 3-5, la reducción en la suma de cuadrados para ajustar el modelo reducido es R(¡,t, (3) = 2.: j=l b ~ a 2 que tiene b grados de libertad. Por lo tanto, la suma de cuadrados debida a {íJ después de ajustar ¡,t y {(3) es R( íl ¡,t, (3) = R(¡,t, í, (3) - R(¡,t, (3) = R(Modelo completo) - R(Modelo reducido) = 2.: 11:..+ 2.: a 2 b 2 Yj i=l b j=l a _L_ 2.: 2 b 2 Yj ab j=l a = 2.: Y; - ~b i=1 a 2 2 expresión que se identifica como la suma de cuadrados de los tratamientos con a - 1 grados de libertad (ecuación 4-10). La suma de cuadrados de los bloques se obtiene ajustando el modelo reducido Yij = ¡,t+í i +Bij que también es un análisis de un solo factor. De nueva cuenta, por analogía con la ecuación 3-5, la reducción en la suma de cuadrados para ajustar este modelo es R(¡,t, í) = 2.: i=l a ~. 2 con a grados de libertad. La suma de cuadrados de los bloques {(3j} después de ajustar ¡,t y {íJ es R((31 ¡,t, í) = R(¡,t, í, (3)- R(¡,t, í) =~ ;=1 Yi. + b j=l 2 2 2.: b 2 =2: j=l b Y.j Y. -- a ab con b - 1 grados de libertad, la cual se había dado anteriormente como la ecuación 4-11. Se han desarrollado las sumas de cuadrados de los tratamientos, de los bloques y del error en el diseño de bloques completos aleatorizados utilizando la prueba general de significación de la regresión. Aun cuando la prueba general de significación de la regresión no se usaría ordinariamente para hacer el análisis real de los datos en un bloque completo aleatorizado, en ocasiones el procedimiento resulta útil en diseños de bloques aleatorizados más generales, como los que se revisan en la sección 4-4. 144 CAPÍTULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEÑOS RELACIONADOS Análisis exacto del problema del valor faltante En la sección 4-1.3 se presentó un procedimiento aproximado para solucionar las observaciones faltantes en el RCBD. Este análisis aproximado consiste en estimar el valor faltante de tal modo que se minimice el cuadrado medio del error. Puede demostrarse que el análisis aproximado produce un cuadrado medio sesgado de los tratamientos en el sentido de que E(MSnatamientos) es mayor que E(M8E) si la hipótesis nula es verdadera. Por consiguiente, se reportan demasiados resultados significativos. El problema del valor faltante puede analizarse exactamente utilizando la prueba general de significación de la regresión. El valor faltante hace que el diseño sea no balanceado, y dado que no todos los tratamientos ocurren en todos los bloques, se dice que los tratamientos y los bloques no son ortogonales. Este método de análisis también se usa en tipos más generales de diseños de bloques aleatorizados; el tema se analiza con mayor amplitud en la sección 4-4. En el problema 4-26 se le pide al lector que realice el análisis exacto para un diseño de bloques completos aleatorizados con un valor faltante. 4~2 DISEÑO DE CUADRADO LATINO En la sección 4-1 se introdujo el diseño de bloques completos aleatorizados como un diseño para reducir el error residual de un experimento al eliminar la variabilidad debida a una variable perturbadora conocida y controlable. Hay otros tipos de diseños que utilizan el principio de la formación de bloques. Por ejemplo, suponga que un experimentador estudia los efectos que tienen cinco formulaciones diferentes de la carga propulsora utilizada en los sistemas de expulsión de la tripulación de un avión basado en la rapidez de combustión. Cada formulación se hace con un lote de materia prima que sólo alcanza para probar cinco formulaciones. Además, las formulaciones son preparadas por varios operadores, y puede haber diferencias sustanciales en las habilidades y experiencia de los operadores. Por lo tanto, al parecer hay dos factores perturbadores que serán "calculados en promedio" en el diseño: los lotes de materia prima y los operadores. El diseño apropiado para este problema consiste en probar cada formulación exactamente una vez con cada uno de los cinco operadores. Al diseño resultante, ilustrado en la tabla 4-9, se le llama diseño de cuadrado latino. Observe que el diseño es un arreglo cuadrado y que las cinco formulaciones (o tratamientos) se denotan por las letras latinas A, B, C, D YE; de ahí el nombre de cuadrado latino. Se observa que tanto los lotes de materia prima (renglones) como los operadores (columnas) son ortogonales a los tratamientos. El diseño de cuadrado latino se usa para eliminar dos fuentes de variabilidad perturbadora; es decir, permite hacer la formación de bloques sistemática en dos direcciones. Por lo tanto, los renglones y las columnas representan en realidad dos restricciones sobre la aleatorización. En general, un cuadrado latino para p factores, o cuadrado latino p X p, es un cuadrado con p renglones y p columnas. Cada una de las p2 Tabla 4-9 Diseño del cuadrado lat!no para el problema de la carga propulsora Lotes de materia prima 1 A=~ 2 Operadores 3 c=~ 4 D =24 E=27 A =27 B = 23 C= 29 1 2 3 4 5 B = 17 C = 18 D = 26 E = 22 B=W C D E A = 24 = 38 = 31 = 30 D E A B = 30 = 26 = 26 = 20 5 E= 24 A =36 B = 21 C = 22 D = 31 4-2 DISEÑO DE CUADRADO LATINO 145 celdas resultantes contiene una de las p letras que corresponde a los tratamientos, y cada letra ocurre una y sólo una vez en cada renglón y columna. Algunos ejemplos de cuadrados latinos son 4x4 ABDC BCAD CDBA DACB 5x5 ADBEC DACBE CBEDA BEACD ECDAB 6x6 ADCEBF BAECFD CEDFAB DCFBEA FBADCE EFBADC El modelo estadístico de un cuadrado latino es ,P Yijk=fl+a¡+t'j+f3k+Sijk j:1, 2, , p { k-1, 2, , p i=l' 2, (4-22) donde Yijk es la observación en el renglón i-ésimo y la columna k-ésima para el tratamiento j-ésimo, fl es la media global, a¡ es el efecto del renglón i-ésimo, t'j es el efecto del tratamientoj-ésimo, f3k es el efecto de la columnak-ésima, y Sijk es el error aleatorio. Observe que se trata de un modelo de los efectos. El modelo es completamente aditivo; es decir, no hay interacción entre renglones, columnas y tratamientos. Puesto que hay una sola observación en cada celda, sólo se necesitan dos de los tres subíndices i, j y k para denotar una observación particular. Por ejemplo, con referencia al problema de la carga propulsora de la tabla 4-9, si i = 2 Yk = 3, se encuentra automáticamente que j = 4 (formulación D), y si i = 1 Yj = 3 (formulación C), se encuentra que k = 3. Ésta es una consecuencia de que cada tratamiento aparezca una vez exactamente en cada renglón y columna. El análisis de varianza consiste en hacer la partición de la suma de cuadrados total de las N = p2 observaciones en los componentes de los renglones, las columnas, los tratamientos y el error, por ejemplo, SST = SSRenglones +SSColnmnas +SSTratamientos +SSE (4-23) con los respectivos grados de libertad p2 -1= p-1+p-1+p-1+(p-2)(p-1) Bajo el supuesto usual de que Sijk es NID(O,o2), cada suma de cuadrados del lado derecho de la ecuación 4-23 es, al dividir por 02, una variable aleatoria ji-cuadrada con una distribución independiente. El estadístico apropiado para probar que no hay diferencias en las medias de los tratamientos es F. O = MS Tratamientos MS E que se distribuye como Fp _ 1, (p -2)(P-l) bajo la hipótesis nula. También puede probarse la ausencia de efectos de los renglones o la ausencia de efectos de las columnas formando el cociente de MSRengloneS o MSColumnas con MSE' Sin embargo, puesto que los renglones y las columnas representan restricciones sobre la aleatorización, estas pruebas quizá no sean apropiadas. En la tabla 4-10 se presenta el procedimiento de cálculo para el análisis de varianza. Por las fórmulas de cálculo para las sumas de cuadrados, se observa que el análisis es una extensión simple del RCBD, con la suma de cuadrados resultante de los renglones obtenida a partir de los totales de los renglones. 146 CAPÍTULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEÑOS RELACIONADOS Tabla 4-10 Análisis de varianza del diseño del cuadrado latino Fuente de Grados de variación Suma de cuadrados libertad Tratamientos Renglones Columnas SSTratamientns = 1i p. P Cuadrado medio S STratamientns 2 y. Y.j. - N 2 . p-1 F = o MSTratamientns J=l p"":l SSRenglnnes MSE SS Renglnnes = p.2: Yi.. - Y... N 2 1=1 1 2 p-1 p-1 p:-1 SSColumnas 1 SS _ Cnlumnas =p 2 2: y ..2k _L. N P k=l p-l SSE (p-2)(p-1) Error Total SSE(por sustracción) (p -2)(P -1) ? SST = 2:2::f Y~k -Yj¡ 1 p2-1 J EJEMPLO 4~3 '~ . Considere el problema de la carga propulsora descrito previamente, donde tanto los lotes de materia prima como los operadores representan restricciones sobre la a1eatorización. El diseño para este experimento, el cual se muestra en la tabla 4-9, es un cuadrado latino 5 x 5. Después de codificar los datos restando 25 de cada observación, se obtienen los datos de la tabla 4-11. Las sumas de cuadrados del total de los lotes (renglones) y los operadores (columnas) se calculan de la siguiente manera: SST = LLL i j Y:k - k ~ 2 SS Lotes (10)2 = 680---= 676.00 25 1 P 2 = _" 2 _ Y... p ~ Yi.. N = 2:.[(-14)2 +9 2 +5 2 +3 2 +7 2 ]_ (10)2 = 68 00 5 25 . 1 P 2 _ " 2_~ - p LJ Y. k N k=l SS Operadores = 2:.[(-18)2 + 18 2 +(_4)2 +5 2 +9 2]_ (10)2 = 150.00 25 5 Tabla 4-11 Datos codificados para el problema de la carga propulsora Operadores Lotes de materia prima 1 2 3 4 D=-l E= 2 A= 2 B =-2 c= 4 5 E= A= B= C= D= 9 Yi.. 1 2 3 4 5 Y.. k A =-1 B =-8 C=-7 D= 1 E=-3 B =-5 C=-l D=13 E= 6 A= 5 C=-6 D= 5 E= 1 A= 1 B=-5 -1 11 -4 -3 6 -14 9 5 3 7 -18 18 -4 5 10 = Y.. 4-2 DISEÑO DE CUADRADO LATINO 147 Tabla 4-12 Análisis de varianza del experimento de la carga propulsora Suma de Grados de Cuadrado cuadrados libertad medio Fuente de variación 330.00 4 82.50 Formulaciones 68.00 4 17.00 Lotes de materia'prima 150.00 4 37.50 Operadores 12 10.67 128.00 Error 676.00 24 Total 7.73 ValorP 0.0025 Los totales para los tratamientos (las letras latinas) son Letra latina Total del tratamiento y.!. A = = 18 B e D E Y.2. = -24 Y.3. = -13 YA. Y.s. = 24 5 La suma de cuadrados que resulta de las formulaciones se calcula a partir de estos totales como 1 SS P -_" Formulaciones ~ J=l p 2_~ Yj. N (10)2 2 = 18 2 +(-24)2 +(_13)2 +24 2 +5 2 = 330.00 5 La suma de cuadrados del error se encuentra por sustracción: SSE 25 = SST - SSLotes - SS Operadores - SSFormulacioncs = 676.00- 68.00-150.00- 330.00 = 128.00 El análisis de varianza se resume en la tabla 4-12. Se concluye que hay una diferencia significativa en la rapidez de combustión media generada por las diferentes formulaciones de' la carga propulsora. También hay indicios de que hay diferencias entre los operadores, por lo que la formación de bloques de este factor fue una buena precaución. No hay evidencia sólida de una diferencia entre los lotes de materia prima, por lo que al parecer en este experimento particular hubo una preocupación innecesaria en esta fuente de variabilidad. Sin embargo, la formación de bloques de los lotes de materia prima es por lo general una buena idea. ..... .... ....... ......... ...... ..... ......... ...... ............ ..... ..... eijk Como en cualquier problema de diseño, el experimentador debería investigar la adecuación del modelo inspeccionando y graficando los residuales. Para un cuadrado latino, los residuales están dados por = Yijk - Yijk - Yijk - Yi.. - - Yj. - - Y.k - +T Y.. El lector deberá encontrar los residuales del ejemplo 4-4 y construir las gráficas apropiadas. \ Thmaño Cuadrados latinos estándares Ynúmero de cuadrados latinos de varios tamaños· 3x3 4x4 5x5 6x6 7x7 ABC BCA CAB ABCD BCDA CDAB DABC ABCDE BAECD CDAEB DEBAC ECDBA ABCDEF BCFADE CFBEAD DEABFC EADFCB FDECBA ABCDEFG BCDEFGA CDEFGAB DEFGABC EFGABCD FGABCDE GABCDEF p xp Ejemplos de cuadrados estándares ABC BCD CDE P A B PAB ... (P-l) Número de cuadrados estándares Número total de cuadrados latinos 1 12 4 56 161,280 9408 818,851,200 16,942,080 61,479,419,904,000 576 p!(P -1)! x (número de cuadrados estándares) "Parte de la información de esta tabla se encuentra en Statistical Tables for Biological, Agn"cul/llral and Medical Researc1J, 4a. edición, de R.A Fisher y E Yates, Oliver & Boyd, Edimburgo. Es poco lo que se sabe de las propiedades de los cuadrados latinos más grandes que 7 x 7. A un cuadrado latino en el que el primer renglón y la primera columna constan de letras escritas en orden alfabético se le llama cuadrado latino estándar, que es el diseño que se utilizó en el ejemplo 4-3. Siempre es posible obtener un cuadrado latino estándar escribiendo el primer renglón en orden alfabético y escribiendo después cada renglón sucesivo como la sucesión de letras que están justo arriba, recorridas un lugar a la izquierda. En la tabla 4-13 se resumen varios hechos importantes acerca de los cuadrados latinos y de los cuadrados latinos estándares. Como con cualquier diseño experimental, las observaciones del cuadrado latino deberán tomarse de manera aleatoria. El procedimiento de aleatorización correcto es seleccionando al azar el cuadrado empleado. Como se observa en la tabla 4-13, hay un gran número de cuadrados latinos de un tamaño particular, por lo que es imposible enumerar todos los cuadrados y seleccionar uno al azar. El procedimiento usual es seleccionar un cuadrado latino de una tabla de estos diseños, como en Fisher y Yates [45], Y después arreglar al azar el orden de los renglones, las columnas y las letras. Esto se analiza con mayor detalle en Fisher y Yates [45]. Ocasionalmente, falta una observación en un cuadrado latino. Para un cuadrado latino p x p, el valor faltante puede estimarse con Yijk = ~ + Y¡. '. + Y..'k )- 2Y.. ' P( y,.. (p_ 2)(p-l) (4-24) donde las primas indican los totales del renglón, la columna y el tratamiento con el valor faltante, y es el gran total con el valor faltante. Los cuadrados latinos pueden ser útiles en situaciones en las que los renglones y las columnas representan los factores que el experimentador en realidad quiere estudiar yen las que no hay restricciones sobre la aleatorización. Por lo tanto, los tres factores (renglones, columnas y letras), cada uno conp niveles, pueden investigarse en sólo p2 corridas. En este diseño se supone que no existe interacción entre los factores. Se abundará más adelante sobre el tema de la interacción. Réplicas de cuadrados latinos Una desventaja de los cuadrados latinos pequeños es que proporcionan un número relativamente pequeño de grados de libertad del error. Por ejemplo, un cuadrado latino 3 x 3 sólo tiene dos grados de libertad del error, un cuadrado latino 4 x 4' sólo tiene seis grados de libertad del error, etc. Cuando se usan cuadrados latinos pequeños, con frecuencia es deseable hacer réplicas de los mismos para incrementar los grados de libertad del error. Y:. 4-2 DISEÑO DE CUADRADO LATINO 149 Tabla 4-14 Análisis de varianza de un cuadrado latino con réplicas, caso 1 Fuente de variación Tratamientos Renglones Columnas Réplicas Error Total Suma de cuadrados 1 P 2 " 2 y .... n'PL... Y.j .. -Ji )~1 Grados de libertad Cuadrado medio SSTratamientos p-1 p-1 p-1 n-1 (p -l)[n(p + 1) - 3] np2-1 MSTratamiemos p-1 S SRenglones MSE " 2 y.... n'PL... Yi."-Ji l=l 1 P 2 " 2 y .... n'P L... Y..k. -Ji 1 2 " 2 y .... 2L... Y...l-Ji P 1=1 k~l tI 1 P 2 p-1 SSColumnas p-1 SSRéPlicas n-1 SSE Sustracción (p-1)[n(p+1)-3] Existen varias maneras de hacer réplicas de un cuadrado latino. Para ilustrar este punto, suponga que se hacen n réplicas del cuadrado latino 5 x 5 utilizado en el ejemplo 4-3. Esto podría haberse hecho de la manera siguiente: 1. Usando los mismos lotes y operadores en cada réplica. 2. Usando los mismos lotes pero operadores diferentes en cada réplica (o, de manera equivalente, usando los mismos operadores pero lotes diferentes). 3. Usando diferentes lotes y diferentes operadores. El análisis de varianza depende del método utilizado para hacer las réplicas. Considere el caso 1, donde en cada réplica se usan los mismos niveles de los factores para la formación de bloques en los renglones y las columnas. Sea Yijklla observación del renglón i, el tratamiento j, la columna kylaréplical. Hay en total N = np2 observaciones. El análisis de varianza se resume enla tabla 4-14. Considere ahora el caso 2 y suponga que en cada réplica se usan nuevos lotes de materia prima pero los mismos operadores. Por lo tanto, hay ahora cinco nuevos renglones (en general,p nuevos renglones) Tabla 4-15 Análisis de varianza de un cuadrado latino con réplicas, caso 2 Fuente de Grados de variación libertad Suma de cuadrados 1 P 2 " 2 y .... Tratamientos p-1 n'PL... Y.j .. -Ji )=1 Cuadrado medio SSTratamientos p-1 MSTratamientos Renglones Columnas Réplicas Error Total 1 ~~ P f;t f;t Yi~.l ? - f;t ~ Y~ .. p2 n(p -1) p-1 n-l (p -l)(np -1) np2-1 sS Renglones n(p -1) SSColumnas 1 P 2 " 2 y.... n'PL... Y..k.-Ji k=1 p-1 SSRéPlieas 1 ~ 2 Y.~.. 2L... Y...l-Ji P 1=1 Sustracción n-1 SSE (p -l)(np -1) 9. Cuadrados latinos Sujeto Periodo 1 Periodo 2 1 2 A B B A IV -.. En general. a la mitad de los sujetos (elegidos al azar) se le administra el fluido A y a la otra mitad el fluido B. un analista del desempeño humano está estudiando el efecto de dos fluidos de restitución para la deshidratación en 20 sujetos. Hay otros enfoques para analizar cuadrados latinos con réplicas que permiten la presencia de algunas interacciones entre tratamientos y cuadrados (referirse al problema 4-19). H. Diseños alternados y diseños balanceados para efectos residuales Ocasionalmente aparece un problema en el que los periodos son uno de los factores del experimento. 11 ? ? p-1 n(p ':"'1) n(p -1) n-1 (p -l)[n(p -1) -1] ? p-1 SSReng¡Ones MSE r. 1 n L p J~1 y.-ID I Il V VI Vil VID IX X 3 4 B A A B 5 6 B A A B 7 8 A B B A 9 10 A B B A Il 12 B A A B 13 14 A B B A 15 16 A B B A 17 18 A B B A 19 20 A B B A Figura 4·7 Un diseño alternado. i j k / N np2-1 dentro de cada réplica.. En la figura 4-7 se muestra la disposición de este diseño. CUADRADOS LATINOS Y DISEÑOS RELACIONADOS Tabla 4-16 Análisis de varianza de un cuadrado latino con réplicas. Y·j··-N 2 2 P .l LLYi~.~ 7 1 L Y"'/. Después el experimentador hace que los sujetos que tomaron el fluido A tomen el fluido B y aquellos que tomaron el fluido B tomen el fluidoA. Observe que los renglones del cuadrado latino representan a los periodos y que las columnas representan a los sujetos. A este diseño se le llama diseño alternado o entrecruzado.-. 12.150 Fuente de variación CAPÍTULO 4 BLOQUES ALEATORIZADOS./ p~~ y..-. Por último. 13. El análisis.-. 7.-. . Observe que la fuente de variación de los renglones mide en realidad la variación entre los renglones dentro de las n réplicas. 15. Las dos columnas en cada uno de los 10 cuadrados corresponden a los sujetos.de varianza se resume en la tabla 4-16. 17 Y 19) se determinaron al azar. Por ejemplo. . y se deja transcurrir un lapso en el que se elimina cualquier efecto fisiológico de los fluidos. Se analiza como un conjunto de 10 cuadrados latinos con dos renglones (los periodos) y dos tratamientos (los tipos de fluido).-. considere el caso 3. El análisis de varianza se resume en la tabla 4-15. donde se usan nuevos lotes de materia prima y nuevos operadores en cada réplica. p2 N /=1 n(p -1) SSColuronas n P lJ n(p-1) SSRéPliCas n 2 2 1~1 Sustracción n-1 SSE (p -l)[n(p -1)-1] LLLLY~H-r . 6. caso 3 Suma de cuadrados 1 Grados de libertad Cuadrado medio S STratamientos A1STratamientos Tratamientos Renglones··· Columnas Réplicas Error Total np.y.-./-L p.-. En el primer periodo. 4. Ahora la variación que resulta tanto de los renglones como de las columnas mide la variación que resulta de estos factores dentro de las réplicas. hayp tratamientos que deben probarse enp periodos utilizando np unidades experimentales. Los 10 sujetos que reCibieron primero el fluido A (1. P i=1 /~1 1 2 Y=. . Al término del periodo se mide la respuesta. se dice que los dos cuadrados latinos son 011ogonales. y la suma de cuadrados de los fluidos se calcula como la suma de cuadrados entre los totales de las letras corregida. la suma de cuadrados de los periodos es la suma de cuadrados entre los renglones corregida. es decir. Para más detalles del análisis estadístico de estos diseños. 4~3 DISEÑO DE CUADRADO GRECOLATINO Considere un cuadrado latino p x p al cual se le superpone un segundo cuadrado latino p x p en el que los tratamientos se denotan con letras griegas. Si cuando se hace la superposición los dos cuadrados tienen la propiedad de que cada letra griega aparece una y sólo una vez con cada letra latina. El diseño de cuadrado grecolatino puede usarse para controlar sistemáticamente tres fuentes de variabilidad extraña. En Cochran y Cox [26] y John [61d] se estudian en . En la tabla 4-18 se muestra un ejemplo de un cuadrado grecolatino 4 x 4. columnas. También es posible emplear diseños tipo cuadrado latino para experimentos en los que los tratamientos tienen un efecto residual. por ejemplo. John [61d] y Anderson y McLean [2]. detalle los diseños balanceados para efectos residuales. y al diseño obtenido se le llama cuadrado grecolatino. es decir. ver Cochran y Cox [26].4-3 DISEÑO DE CUADRADO GRECOLATINO 151 Tabla 4-17 Análisis de varianza del diseño alternado de la figura 4-7 Fuente de Grados de variación libertad Sujetos (columnas) Periodos (renglones) Fluidos (letras) Error Total 19 1 1 18 39 En la tabla 4-17 se resume un análisis de varianza. Tabla 4-18 Diseño del cuadrado grecolatino 4 X 4 Columna Renglón 1 2 3 Cy 4 1 2 3 4 Aa Ba Cf3 Dy Bf3 Ay Da Ca Df3 Aa Ba Do Ca By Af3 . cada una conp niveles en sólo p2 corridas. si los datos del fluido B en el periodo 2 siguen reflejando algún efecto del fluido A tomado en el periodo 1. para hacer la formación de bloques en tres direcciones. El diseño permite la investigación de cuatro factores (renglones. letras latinas y letras griegas). excepto p = 6. La suma de cuadrados de los sujetos se calcula como la suma de cuadrados entre los totales de los 20 sujetos corregida. Existen cuadrados grecolatinos para toda p :::: 3. ¡:¡ y . podría ser importante. e¡ es el efecto del renglón i-ésimo.2. T¡ es el efecto del tratamiento de letra latinaj. El análisis de varianza es muy parecido al de un cuadrado latino..~"l I 152 CAPÍTULO 4 BLOQUES ALEATORIZADOS. 'PI es el efecto de la columna l. Sólo son necesarios dos de los cuatro subíndices para identificar completamente una observación. y 8ijkl es un componente NID(O.4 . puede calcularse una suma de cuadrados debida al factor de las letras gtiegas a partir de los totales de las letras griegas y el error experimental se reduce adicionalmente en esta cantidad. letras latinas y letras griegas. (4-25) donde Yijkl es la observación del renglón i y la columna l para la letra latinaj y la letra griega k.. 0"') del error aleatorio.L. columnas. Y. (P-3)(P-l) Total SST = L...00 .. _~ N 2 1 P 2 SSRenglones = -p L. P Yijk/=j-l+e¡+T¡+W k +\jI/+8ijkl k=l 2 .L.2. los operadores (columnas) y las formulaciones (letras latinas) son idénticos a los del ejemplo 4-3... Sea que haya cinco montajes de prueba denotados por las letras griegas a. y.2_~ Tratamientos con letras latinas j •• N Grados de libertad p-l p-l p-l p-l =-" j~l Tratamientos con letras griegas Renglones Columnas Error SSG 1 =-" Y. P i = 1. (P-3)(P-l)' EJEMPLO 4.P { l= 1. {3.L.2. . . Suponga que en el experimento de la carga propulsora del ejemplo 4-3 un factor adicional. W k es el efecto del tratamiento de letra griega k. Puesto que las letras griegas aparecen exactamente una vez en cada renglón y columna. P pL. se tiene SSLotes = 68.00 y SSFormula~iones = 330. La hipótesis nula de la igualdad de tratamieñtos de renglones.. " " ~ " Yijk/-¡:¡ 2 r../ N /~l SSE (por sustracción) / j . las columnas y los tratamientos de letras latinas. k~l 2 k. " h 2 . Observe que.. Por lo tanto. . los montajes de prueba. y exactamente una vez con cada letra latina. CUADRADOS LATINOS Y DISEÑOS RELACIONADOS Tabla 4-19 Análisis de varianza de un diseño del cuadrado grecolatino Fuente de variación Suma de cuadrados 1 P 2 SSL pL. se probaría dividiendo el cuadrado medio correspondiente por el cuadrado medio del error.. el factor representado por las letras griegas es ortogonal a los renglones.. 1=1 1 P 2 SSColumnas . ... k I El modelo estadístico para el diseño de cuadrado grecolatino es .P j= 1.p L." 2_~ .. La región de rechazo es la cola superior del punto de la distribución Fp _ 1. debido a que los totales de los lotes de materia prima (renglones). En la tabla 4-20 se muestra el diseño de cuadrado grecolatino 5 x 5 resultante. Y. .00 SS Operadores = 150. o Y 8. . En la tabla 4-19 se ilustran los detalles de los cálculos. .4-3 DISEÑO DE CUADRADO GRECOLATINO 153 Tabla 4-20 Diseño del cuadrado grecolatino para el problema de la carga propulsora Operadores Lotes de materia prima 1 2 3 1 2 4 5 Aa Bf3 Cy Do Ee =-1 =-8 =-7 = 1 = -3 By Ca De Ea Af3 = -5 = -1 =13 6 = 5 18 3 Cs =-6 Da= 5 Ef3 = 1 Ay = 1 Ba =-5 4 Df3 Ey Aa Be Ca =-1 = 2 = 2 =-2 = 4 5 5 Ea =-1 As =11 Ba =--4 Cf3 =-3 Dy= 6 Yi.50 15.00 Grados de libertad 4 4 4 4 8 24 Cuadrado medio 82./ -18 --4 9 10 = Y. el error experimental disminuye.. Las formulaciones son diferentes significativamente en 1%.k. la suma de cuadrados debida a los montajes de prueba es 1 P 2 SSEnsamblajes _ " 2_~ . se han reducido también los grados de libertad de 12 (en el diseño del cuadrado latino del ejemplo 4-3) a 8. Los totales de los montajes de prueba (las letras griegas) son Letra griega Total de la prueba de ensamblaje a Y..p LJ Y.25 10.. Tabla 4-21 Análisis de varianza del problema de la carga propulsora Suma de cuadrados 330. la estimación del error tiene menos grados de libertad..00 62..00 37.0033 Fuente de variación Formulaciones Lotes de materia prima Operadores Montajes de la prueba Error Total . se observa que al sacar la variabilidad debida a los montajes de prueba.3. al disminuir el error experimental. N k=l 1 (10)2 = -[10 2 +(_6)2 +(_3)2 +(_4)2 +13 2] . Al comparar las tablas 4-21 y 4-12.= 62.00 68... = 10 f3 y = -6 = -3 = -4 o = 13 Por lo tanto. Y..50 8.00 150.00 66.. Por lo tanto. Y.1. Sin embargo. Y.00 5 25 En la tabla 4-21 se resume el análisis de varianza completo.00 676. Y.. -14 9 5 3 7 Y..s.00 Valor P 0.50 17. y la prueba puede ser menos sensible.A.2.. Tablas de BIBD se proporcionan en Fisher y Yates [45]. un diseño de bloques incompletos balanceados (BIBD. Debido a que las variaciones en los lotes de materia prima pueden afectar el desempeño de los catalizadores. Cuando las comparaciones de todos los tratamientos son igualmente importantes. . Para este tipo de problema es posible utilizar diseños de bloques aleatorizados en los que cada tratamiento no está presente en cada bloque. por lo que se necesita una estimación independiente de la varianza del error. En este diseño se utilizarían todos los (p + 1)(P . el ingeniero decide usar los lotes de materia prima como bloques. cada lote es apenas lo suficientemente grande para permitir que se prueben tres catalizadores. Sin embargo. Por ejemplo. Por lo tanto. hasta p + 1 factores podrían estudiarse si se dispone de un conjunto completo de p -1 cuadrados latinos ortogonales. puede obtenerse un diseño balanceado con menos de (~ ) bloques. En general. Situaciones como ésta ocurren generalmente por limitaciones del aparato experimental o de las instalaciones o por el tamaño físico del bloque. aplicar cada catalizador en una corrida separada de la planta piloto y observar el tiempo de reacción. sin embargo. Por lo tanto. Un diseño de bloques incompletos balanceados puede construirse tomando (~) bloques y asignando una combinación de tratamientos diferente a cada bloque. debe usarse un diseño Tabla 4-22 Diseño de bloques incompletos balanceados para el experimento del catalizador Tratamiento (catalizador) 1 2 3 4 Bloque (lote de materia prima) 1 2 3 4 73 73 75 221 74 75 75 224 67 68 72 207 71 72 75 218 Yi.1) = p2 .. Desde luego. Se están investigando cuatro catalizadores. Como un ejemplo. Un hipercuadrado p x p es un diseño en el que se superponen tres o más cuadrados latinos ortogonales p x p. es decir. 4~4 DISEÑOS DE BLOQUES INCOMPLETOS BALANCEADOS En ciertos experimentos en los que se utilizan diseños de bloques aleatorizados quizá no sea posible correr todas las combinaciones de los tratamientos en cada bloque. CUADRADOS LATINOS YDISEÑOS RELACIONADOS Puede hacerse cierta ampliación del concepto de los pares ortogonales de cuadrados latinos que forman un cuadrado grecolatino. cargar l~ planta piloto. no debe haber interacciones entre los factores cuando se usan hipercuadrados. balanced incomplete block design) es un diseño de bloques incompletos en el que dos tratamientos cualesquiera aparecen conjuntamente el mismo número de veces. El procedimiento experimental consiste en seleccionar un lote de materia prima. suponga que debido a sus dimensiones cada ejemplar de prueba sólo puede usarse para probar tres puntas. 218 214 216 222 870= y. en el experimento de la prueba de la dureza (ejemplo 4-1).1 grados de libertad. Estos diseños se conocen como diseños de bloques incompletos aleatorizados. suponga que un ingeniero químico piensa que el tiempo de reacción de un proceso químico es una función del tipo de catalizador empleado. de tal manera que cualquier par de tratamientos ocurra conjuntamente el mismo número de veces que cualquier otro par. no es posible probar todas las puntas en cada uno de los ejemplares. Davies [36] y Cochran y Cox [26]. las combinaciones· de los tratamientos usadas en cada bloque deberán seleccionarse en una forma balanceada. Por lo tanto.r 154 CAPÍTULO 4 BLOQUES ALEATORIZADOS. Suponga que haya tratamientos y que cada bloque puede contener exactamente k (k < a) tratamientos. Con frecuencia. Ya. 02) del error aleatorio.. 4~4: 1 Análisis estadístico del diseño de bloques incompletos balanceados Como de costumbre. considere cualquier tratamiento.oY2. A(a . Por lo tanto. Asimismo. Estas r(k -1) observaciones también tienen que representar a los a -1 tratamientos restantes A veces. La suma de cuadrados de los bloques es SSBloques =k L b J=1 1 2 Y. Este ajuste es necesario porque cada tratamiento está representado en un conjunto diferente de rbloques.1). junto con las observaciones registradas. La variabilidad total en los datos se expresa por la suma de cuadrados totales corregida: (4-27) Puede hacerse la partición de la variabilidad total en SST = SSTratamientos(ajustados) + SSBIoques + SSE donde la suma de cuadrados de los tratamientos está ajustada para separar los efectos de los tratamientos y de los bloques. por ejemplo el tratamiento 1. +/3j +eij (4-26) donde Yij es la observación i-ésima en el bloquej-ésimo.1) = r(k . El diseño de bloques incompletos balanceados para este experimento.4-4 DISEÑOS DE BLOQUES INCOMPLETOS BALANCEADOS 155 de bloques incompletos aleatorizados.j . 7:¡ es el efecto del tratamiento i-ésimo. Además. Para deducir la relación paraA. La suma de cuadrados de los tratamientos ajustada es SS Tratamientos(ajustados) = --'--'A'---a-- . se muestran en la tabla 4-22. /1 es la media global. Puesto que el tratamiento 1 aparece en r bloques y hay otros k -1 tratamientos en cada uno de esos bloques. hay r(k -1) observaciones en un bloque que contiene al tratamiento 1. se dice que el diseño es simétrico.0 oo. también son afectadas por las diferencias entre los bloques.N l (4-28) donde Y j es el total del bloquej-ésimo. y que hay N = ar = bk observaciones en total.=1 (4-29) . y eij es el componente NID(O. el número de veces que cada par de tratamientos aparece en el mismo bloque es A = r(k-1) a-1 = b. que cada tratamiento ocurre r veces en el diseño (o que se hacen r réplicas del mismo). se supone que haya tratamientos y b bloques. SSBloqueS tiene b -1 grados de libertad. las diferencias entre los totales de los tratamientos no ajustadosyl. El orden en que se corren los catalizadores en cada bloque está aleatorizado. El parámetro A debe ser un entero./3j es el efecto del bloquej-ésimo. El modelo estadístico del BIBD es Si a Yij = /1+7:. se supone que cada bloque contiene k tratamientos. Por lo tanto. .~. a (4-30) ¡=1 con n í¡ = 1 si el tratamiento i aparece en el bloque j y nij = Oen caso contrario. La suma de cuadrados totales SST = L¡ 1 Y~ . o = MSTratamientos(ajustadOS) MS E En la tabla 4-23 se resume el análisis de varianza. el cual se calcula como Q¡ = Yí. Los totales de los tratamientos ajustados siempre sumarán cero. .¡ i = 1. El análisis de estos datos es el siguiente...b + 1 grados de libertad. k = 3.a .. CUADRADOS LATINOS Y DISEÑOS RELACIONADOS Tabla 4-23 Análisis de varianza del diseño de bloques incompletos balanceados Fuente de Grados de variación Suma de cuadrados libertad Cuadrado medio Tratamientos (ajustados) 1 Bloques Error Total k¿ (J2 Aa a-l SSTratamientoS(3jUstadOS) E = o MSTratamieotoS(.J Y. 2_2:'::.(870)2 = 81.. ¡ 12 J=l 1 4 2 . 12 ? J = 63156. La suma de cuadrados de los bloques se encuentra con la ecuación 4-28 como SS Bloques = -" 3. -y¿ L b 1 nijy.156 CAPÍTULO 4 BLOQUES ALEATORIZADOS. SS1tatamientos(ajustados) tiene a -1 grados de libertad. Se trata de un BIBD con a = 4. El estadístico apropiado para probar la igualdad de los efectos de los tratamientos es F. r = 3. b = 4. A = 2 YN = 12. La suma de cuadrados del error se calcula por sustracción como SSE = SST - SS Tratamientos(njustados) - SS Bloques (4-31) y tiene N .just.00 .L.2. Considere los datos de la tabla 4-22 para el experimento del catalizador. EJEMPLO 4~5 ..dOS) a-l SSBloques MSE k¿Y~-~ ? 2 b-l N-a-b N-l SSE(por sustracción) +1 b -1 SSE N-a-b+l ¿¿Y~-~ donde Q¡ es el total ajustado del tratamiento i-ésimo. . Pueden usarse otros métodos de comparación múltiple . se concluye que el catalizador empleado tiene un efecto significativo sobre el tiempo de reacción.' .-_1=_1.25 Enla tabla 4-24 se muestra el análisis de varianza. las pruebas para las medias de tratamientos individuales pueden ser de interés.00 Grados de libertad 3 3 5 Cuadrado medio 7.+(221 + 224+ 218) = -9/3 Q2 = (214)-+(207+224+218)= -7/3 Q3 = (216)-+(221+207+224)= -4/ 3 Q4 = (222). SSTratamientos(ajustlldOS) 4 = ---"i==~-a3[(-9/3)2 +(-7/3)2 +(-4/3)2 +(20/3)2] (2)(4) 22. Si el factor bajo estudio es fijo.75-55. donde {c) son los coeficientes de los contrastes.00 3.25 81.+(221 + 207 + 218) = 20/3 La suma de cuadrados de los tratamientos ajustados se calcula con la ecuación 4-29 como k¿ Q.58 Fo 11.65 11 Para calcular la suma de cuadrados de los tratamientos ajustados para los bloques.66 Valor P 0.00= 3. las {Q) en lugar de las {Ji¡).75 55.0107 Error lbtal 0. La suma de cuadrados de los contrastes es SS e = k(! C i=l i Qi )2 ---.00-22. los contrastes deben hacerse sobre los totales de los tratamientos ajnstados. primero se determinan los totales de los tratamientos ajustados utilizando la ecuación 4-30 como Q1 = (218).4-4 DISEÑOS DE BLOQUES INCOMPLETOS BALANCEADOS 157 Tabla 4-24 Análisis de varianza del ejemplo 4-5 Suma de cuadrados Fuente de variación natamientos (ajustados para los bloques) Bloques 22..- Aa! c.75 La suma de cuadrados del error se obtiene por sustracción como SSE = SST - SS Tratamientos(aju~tados) - SS Bloques = 81. Puesto que el valor P es pequeño. Si se emplean contrastes ortogonales. 0010 11 . El error estándar del efecto de un tratamiento ajustado es s=~kMSE Aa (4-32) En el análisis que acaba de describirse.25 81.67 55. y 1 a j= 1.. una suma de cuadrados de los bloques sin ajuste y una suma de cuadrados del error. .75 11.. Por lo tanto.03 0.65 33. En ocasiones habría interés en evaluar los efectos de los bloques.11.J r . ss Tratamientos = (218)2 +(214)2 +(216)2 +(222)2 _ (870)2 _ 3 12 .. = (221)-+(218+216+222)= 7/3 =(224)-+(218+214+216)= 24/3 = (207).58 11.90 0. puede obtenerse una fórmula simple para SSBloques(ajustadOS)' Los totales de los bloques ajustados son Q~=y·--Ln . es decir.0 3 3 3 3 5 7.+(214+ 216+ 222) = -31/3 =(218)-+(218+214+222)= O y ss Asimismo. Q. Para ello se requiere hacer una partición alternativa de SSn es decir. SS1tatamientos está sin ajuste. Si el diseño es simétrico.67 Tabla 4-25 Análisis de varianza del ejemplo 4-5.=1 lJ l.0107 22. J . . se ha hecho la partición de la suma de cuadrados total en una suma de cuadrados de los tratamientos ajustados.66 Valor P 0. Bloques(aJustados) = 3[(7/3)2 +(24/3)2 +(-31/ 3? +(0)2] = 6608 (2)( 4) .158 CAPÍTULO 4 BLOQUES ALEATORIZADOS. si a = b. y. SST = SSTratamientos + SS Bloqnes(ajustados) +SSE Aquí. CUADRADOS LATINOS Y DISEÑOS RELACIONADOS para comparar todos los pares de efectos de los tratamientos ajustados (sección 4-4.2. b (4-33) SS Bloques(ajustados) = -"-i=_1 Ab _ (4-34) El BIBD del ejemplo 4-5 es simétrico porque a Q~ Q~ Q~ = b = 4. incluyendo tanto los tratamientos como los bloques Suma de Grados de Cuadrado Fuente de variación cuadrados libertad medio Tratamientos (ajustados) ltatamientos (sin ajuste) Bloques (sin ajuste) Bloques (ajustados) Error Total 22.2)..00 66. los cuales se estiman con:i¡ = kQJ(Aa).08 3. se observa que Minitab ha calculado la suma de cuadrados de los tratamientos ajustados y la suma de cuadrados de los bloques ajustados (en la salida de Minitab se les llama ''AdjSS'' o SS ajustada). donde Q¡ es el total del tratamiento ajustado i-ésimo (ver la ecuación 4-29)..j (4-36) p~i Observe que el miembro del lado derecho de la ecuación 4-36 es kQ¡. es otro. 2. Al comparar las tablas 4-26 y 4-25.. j~l p~l a ~ j~l b nijy.. la ecuación 4-36 puede reescribirse como r(k-1)i¡ -. j~l b í¡:rft+ri¡ +~ j~l b nijP j = Y¡.~~ nijnpji p =ky¡. Entonces.. Las ecuaciones normales de mínimos cuadrados son fl: Nft+r ~ i¡ +k ¡~1 a L P j = Y. Observe que las sumas de cuadrados asociadas con los cuadrados medios de la tabla 4-25 no producen la suma de cuadrados total... 2.tí p~l ip = kQ¡ i=l. se encuentra que ft = Y. .4-4 DISEÑOS DE BLOQUES INCOMPLETOS BALANCEADOS 159 En la tabla 4-25 se presenta un resumen del análisis de varianza del BIBD simétrico.t sip :. Salida de computadora Existen varios paquetes de computadora que realizarán el análisis de un diseño de bloques incompletos balanceados... b (4-35) !3 j : k ft+ Al imponer las restricciones Li ¡ í niji¡ +kP j = Y. . Observe que el método de Tukey llevaría a la conclusión de que el catalizador 4 es diferente de los otros tres.. Además. El procedimiento de Modelos Lineales Generales (General Linear Models) del SAS es uno de ellos.. La parte inferior de la tabla 4-26 es un análisis de comparaciones múltiples. 4~4. un paquete de estadística para computadoras personales de uso generalizado. en el que se utiliza el método de Tukey. a (4-37) p~i .z!: iyn~j = n pj (ya que n pj = O o 1). se obtiene rki¡-ri¡.. y Minitab. i = 1.j i=1 = LP j = O. es decir. al utilizar las ecuaciones b para {fJj} para eliminar los efectos de los bloques de las ecuaciones para {í¡}. .z!: SSTratamientoS(ajUstados) + SSBIOqueS(ajustadOS) + SSE Esto es consecuencia del carácter no ortogonal de los tratamientos y los bloques.2 Estimación de mínimos cuadrados de los parámetros Considere la estimación de los efectos de los tratamientos en el modelo BIBD. puesto que L~~ln¡ppj =. a j= 1. 2. SST :.. Se presentan los intervalos de confianza para las diferencias de todos los pares de medias y la prueba de Tukey.. . La parte superior de la tabla 4-26 es la salida del procedimiento de Modelos Lineales Generales de Minitab para el ejemplo 4-5. 8338 Adjusted P-VaLue 0. Tabla 4-26 Análisis de Minitab (Modelo Lineal General) para el ejemplo 4-5 Modelo Lineal General Factor CataLyst BLock Type LeveLs VaLues fixed 4 1 2 3 4 fixed 4 1 2 3 4 AnaLysis of Variance for Time.083 3.6250 Upper 2.67 33.8085 0.327 -1.0 2.6982 T-VaLue 4.5371 4.8951 5.0 (---------*~--------) Tukey SimuLtaneous Tests Response VariabLe Time ALL Pairwise Comparisons among LeveLs of CataLyst CataLyst = 1 subtracted from: LeveL CataLyst 2 3 4 CataLyst LeveL CataLyst 3 4 Difference of Means 0.C'.0 2.000 Adj SS 22.6982 T-VaLue 0.3750 3.89 0.4228 Center 3.9825 0.000 Upper 5.583 22.0281 .048 Center 0.202 ----------+---------+---------+-----(---------*---------) .6982 0.001 Tukey 95.250 81.3750 SE of Difference 0.3750 3.0 2.297 Adjusted P-VaLue 0.667 66.083 3.011 0.3581 0.028 0.5 5.0175 CataLyst = 3 subtracted from: LeveL CataLyst 4 Difference of Means 3.0 ----------+---------+---------+-----(---------*---------) (----------*---------) ----------+---------+---------+-----0.6250 SE of Difference 0.2500 0.6982 0.(----------*---------) (----------*---------) ----------+---------+---------+-----0.3750 Upper 2. using Adjusted SS for Tests Source CataLyst BLock Error TotaL DF 3 3 5 11 Seq SS 11.750 66.6250 3.2500 0.5 5.6250 3.250 Ad j MS 7.000 SE of Difference 0.0 CataLyst = 2 subtracted from: CataLyst 3 4 Lower -2.798 Center 0.6982 T-VaLue 0.952 CataLyst CataLyst 4 3 subtracted from: Lower 0.6982 0.202 6.9462 0.0130 2 subtracted from: Difference of Means 0.5 5.202 0..827 3.1918 Adjusted P-VaLue 0.577 ----------+---------+---------+----~- ----------+---------+---------+-----0.952 5.0% SimuLtaneous Confidence IntervaLs Response VariabLe Time ALL Pairwise Comparisons among LeveLs of CataLyst CataLyst = 1 subtracted from: CataLyst 2 3 4 Lower -2.952 1.650 F P 11 . .1. . =Y .j = k¡.~ l1ij't¡ Se obtienen así las siguientes ecuaciones normales de mínimos cuadrados: ¡. Yates [1l3c] señaló que si los efectos de los bloques son variables aleatorias no correlacionadas con medias cero y varianza a~. 2'00" a p=1 p.t:. Los estimadores interb10ques de ¡. de bloques incompletos balanceados Al análisis del BIBD presentado en la sección 4-4.j p a b (4-41) i=l.. 2.t+ ~ l1ij't¡ + (k. observe que la restricción L~=1f ¡ = oimplica que L~=1f p = -f ¡ yrecuerde que r(k -1) = A(a1). considere elBIBD del ejemplo 4-5. a (4-39) Como una ilustración. se obtiene f = 3(-9/3)=_9/8 f = 3(.t: Nfi+r! T¡ ¡=1 't¡:kr¡1+rf¡ +.. es posible obtener información adicional acerca de los efectos de los tratamientos 'ti' Yates llamó análisis interbloques al método para obtener esta información adicional. Este análisis es apropiado independientemente de si los bloques son fijos o aleatmios.i j=1 .t. a (4-38) por lo tanto.4-4 DISEÑOS DE BLOQUES INCOMPLETOS BALANCEADOS 161 por último.1. 2.7 / 8 1 (2)( 4) 2 (2)(4) f = 3(-4/3)=_4/8 3 (2)(4) f 4 =3(20/3)=20/8 (2)( 4) como se encontró en la sección 4-4.7 / 3) . Q3 = -4/3 Y Q4 = 20/3.3 Recuperación de información interbloques en el diseño . los estimadores de mínimos cuadrados de los efectos de los tratamientos en el modelo de bloques incompletos balanceados son i = 1.Bj +~ Sij) (4-40) donde el término entre paréntesis puede considerarse como el error. L T = L l1ijY.j -k¡. de donde se obtiene p"..1 suele llamársele el análisis intrabloques porque las diferencias de los bloques se eliminan y todos los contrastes de los efectos de los tratamientos pueden expresarse como comparaciones entre las observaciones del mismo bloque.¡ Aaf¡ =kQ¡ i=l..t y 'ti se encuentran minimizando la función de mínimos cuadrados L= b ( a)2 ~ Y.... Puesto que Q1 = -9/3. 4~4. El modelo para estas observaciones (siguiendo a John [61d]) es Y. Considere los totales de los b10quesYj como una colección de b observaciones. Q2 = -7/3. . las ponderaciones óptimas son inversamente proporcionales a las varianzas de Ti Yf i . 2'00" a . Por lo tanto.50) = 10..l-- j=l i=l..50 f = 652. y.-:------I 1 T..-J.50 1 3-2 i Z = 649.. los estimadores interbloques para el BIDD del ejemplo 4-5 se calculan de la siguiente manera: i = 663.. Por ejemplo. Los estimadores interbloques {i 1 } pueden diferir de los estimadores intrabloques {T i }..l) fJ .} b ..50) = -6. donde U1 = l/V(T i ) YU z = l/V(f i ). ~ n . CUADRADOS LATINOS Y DISEÑOS RELACIONADOS donde íí y Ti denotan los estimadores interbloques.(3)(3)(72.la z ~~~a k( a .-!------:::-:---.. Suponga ahora que quieren combinarse los estimadores interbloques e intrabloques para obtener una sola estimación de la varianza mínima insesgada de cada Ti' Es posible demostrar que T¡ Yf son insesgados y también que 1 V(~ )= k(a-1) Z Ti .ayLJ l}.. = --:-':--. deberá tener las ponderaciones al = U1 /(U 1 + u z) y a z = UZ /(u 1 + u z). el estimador combinado insesgado de la varianza mínima T.(3)(3)(72.1) z + k( a -1) ( a z + ka z) z i=l. a (4-43) Es posible demostrar que los estimadores interbloques {i¡} Ylos estimadores intrabloques {Ti} no están correlacionados... por ejemplo (4-44) para estimar T¡..(3)(3)(72.la a(r-. k(a-1) (a z +ka z )+7:. k(a-1) aZ a(r-. se obtienen las (4-42) íí = Y . .50 3-2 Observe que los valores de :2: ~=1 nij Y. 2.l) fJ ... T¡ = ~-r---. Al imponer la restricción :2::=1 Ti soluciones de las ecuaciones 4-41 como = O.50) -0. En este método de estimación.la z a y (intrabloques) (intrabloques) Se usa una combinación lineal de los dos estimadores..50 3-2 7: 4 = 646-(3)(3)(72.j se usaron en la página 157 para calcular los totales de los tratamientos ajustados en el análisis intrabloques. Esto implica que el mejor estimador combinado es T..50) 3-2 3 -3.162 CAPÍTULO 4 BLOQUES ALEATORIZADOS. . l' A continuación se calculan las estimaciones combinadas para los datos del ejemplo 4-5. El enfoque común es estimar a2 y a ~ a partir de los datos y sustituir estos parámetros de la ecuación 4-45 con las estimaciones. Por lo tanto. La estimación que suele tomarse para a2 es el cuadrado medio del error del análisis de varianza intrabloques. para un diseño de bloques incompletos balanceados. MSE .(I)' +M.A)a 2+Aa(a 2 +ka~) (4-45) Desafortunadamente.0. En general.-----'-------A 2 [MSBloqUeS(ajustados) - fJ MS E ](b-1) a(r-1) (4-47) y si MSBloques(ajustadOS) S..J - 2 a i=l 2 Yi. pueden sustituirse fJ2 = 0. T* i- )+(~ n.Y. se usa la ecuación 4-47 para estimar a~ como a A 2 = fJ (22. la ecuación 4-45 no puede usarse para estimar Ti porque no se conocen las varianzas a2 y a ~ ..65 YMSBIOques(ajustadOS) = 22. este cuadrado medio es k~Q2 LJ i i=l + 2 b j=l y2 _.02 Por lo tanto. a Ti = (1'.02 en la ecuación 4-48a para obtener las estimaciones combinadas que se enlistan enseguida.03.j . )a 2 i=l.65 y fJ~ = 8. Esto resulta en el estimador combinado kQ.¡ -kry.. si MSBloqueS(ajustadOS) > MSE .. fJ2 = MS E La estimación de a~ se encuentra a partir del cuadrado medio de los bloques ajustados para los tratamientos.=. se hace fJ~ = O. también se presentan las estimaciones intrablo- . Por conveniencia. o el error intrabloques. 2.. -(l/a)y.4-4 DISEÑOS DE BLOQUES INCOMPLETOS BALANCEADOS 163 que puede simplificarse como 2 kQi (a + * ka~ )+ (± J=l llij Y.03.lay.:.65)(3) 4(3-1) 8. l' Aa MSBloqUeS(ajustadOS) k = -'-----(b---1-)------'- (4-46) y su valor esperado (cuya deducción se hace en Graybill [50]) es E[ MS Bloques(ajustados) ] = a 2 a(r-1) 2 + b _ 1 a fJ Por lo tanto. (Observe que para calcular MSBloqueS(ajustadOS) se hace uso del hecho de que éste es un diseño simétrico. En general. .) Puesto que MSBloques(ajustados) > MSE . JI)' (4-48a) (4-48b) (r-A)fJ 2 + Aa(fJ 2 +kfJ~) Yi. Por la tabla 4-25 se obtiene fJ2 = MSE = 0. la estimación de fJ~ es a = ------'----. debe usarse la ecuación 4-46. 12 -0. el experimentador decide usar un diseño de bloques aleatorizados.47 4~5 PROBLEMAS Un químico quiere probar el efecto de cuatro agentes químicos sobre la resistencia de un tipo particular de tela. Parámetro Estimación intrabloques Estimación interbloques Estimación combinada -1.09 -0. El análisis se hace en un laboratorio y sólo pueden realizarse tres ensayos en un día. 73 73 75 73 2 68 67 68 71 3 74 75 78 75 4 71 72 73 75 5 67 70 68 69 Se están comparando tres soluciones de lavado diferentes a fin de estudiar su efectividad para retardar el crecimiento de bacterias en contenedores de leche de 5 galones. 4-4. Selecciona cinco rollos y aplica los cuatro agentes químicos de manera aleatoria a cada rollo. A continuación se presentan las resistencias a la tensión resultantes.05) Ysacar las conclusiones apropiadas. con los rollos de tela considerados como bloques. Se hacen observaciones en cuatro días. . ¿Qué conclusiones pueden sacarse? En un artículo de Fire Safety Joumal ("El efecto del diseño de boquillas en la estabilidad y el desempeño de surtidores de agua turbulenta". En este ejemplo. vol. cuyos datos se muestran enseguida. 4-5. 4) se describe un experimento en el que se determinó un factor de la forma para varios diseños diferentes de boquillas con seis niveles de la velocidad del flujo de salida del surtidor.50 10.50 -6. CUADRADOS LATINOS Y DISEÑOS RELACIONADOS ques e interbloques.88 -0. Puesto que 19s días podrían representar una fuente potencial devariabilidad.50 -1.50 2.50 -0. ¿Qué conclusiones se sacarían a partir de esta representación gráfica? Graficar los conteos de bacterias promedio para cada solución en el problema 4-2 y compararlos con una distribución t escalada. 164 CAPÍTULO 4 BLOQUES ALEATORIZADOS.05) Y sacar las conclusiones apropiadas. Analizar los datos de este experimento (utilizar a = 0. 16 5 2 22 24 4 3 18 17 1 4 39 44 22 Graficar las resistencias a la tensión medias observadas para cada tipo de agente químico en el problema 4-1 y compararlas con una distribución t con la escalación apropiada.50 2. Agente químico 1 Rollo 1 4-1.88 -0.50 -3. Debido a que podría haber variabilidad de un rollo de tela a otro. Analizar los datos de este experimento (utilizar a = 0. 2 3 4 4-2. Días Solución 1 13 1 2 3 4-3.1'' '. el químico decide usar un diseño de bloques aleatorizados. las estimaciones combinadas están próximas a las estimaciones intrabloques debido a que la varianza de las estimaciones interbloques es relativamente grande. 05) (0.03) 2 4.85 4.05.81 0.89 0. por lo que en cualquier experimento que se corra en la fundición en el que se use más de un horno.06) (0.85 4.95 4.74 0.) ¿La elección del algoritmo para controlar la proporción afecta el voltaje promedio de las celdas? b) Realizar el análisis apropiado de la desviación estándar del voltaje. .77 (0.79 (0.78 0.75 0.75 (0.03) 4.03) 4. El experimento se llevó a cabo en realidad como un diseño de bloques aleatorizados.78 0. sección 3-8.08) 4.89 0.97 0.90 4. los hornos se considerarán como una variable perturbadora. con la velocidad considerada como una variable perturbadora.02) a) Analizarlos datos del voltaje promedio de las celdas.02) (0. Algoritmo para controlar la proporción 1 2 3 4 4. Se sabe que cada horno tiene sus propias características únicas de operación.86 16.05) (0.4-5 PROBLEMAS 165 El interés se centró en las diferencias potenciales entre los diseños de las boquillas.59 0. b) Analizar los residuales de este experimento. El voltaje promedio de la celda y la desviación estándar del voltaje (indicada entre paréntesis) para cada celda son los siguientes: 4-6.80 0.75 1 2 3 4 5 a) ¿El diseño de la boquilla afecta el factor de la forma? Comparar las boquillas con un diagrama de dispersión y con un análisis de varianza.73 0. La compañía produce el producto en cuatro hornos.79 (0.86 0.05) 4. en el que se seleccionaron seis periodos como bloques.98 0.83 0.13) 4.11) 4.15) (0. Cada horno puede operarse con 4-7.85 0. Los datos se presentan a continuación.83 4.75 (0.93 4.97 14.) ¿La elección del algoritmo para controlar la proporción afecta el ruido del crisol? c) Realizar los análisis residuales que parezcan apropiados.95 0.76 28.04) 4.05.43 0.78 20.90 (0.86 (0.86 0.140.91 (0.79 (0.05) 5 4. (Utilizar a = 0.86 4 (0.88 0.94 (0. d) ¿Qué algoritmo para controlar la proporción debería seleccionarse si el objetivo es reducir tanto el voltaje promedio de las celdas como el ruido del crisol? El fabricante de una aleación maestra de aluminio produce refinadores de textura en forma de lingotes.85 0.05) 4. Diseño de la boquilla Velocidad del flujo de salida del surtidor (m/s) 11. Los ingenieros del proceso sospechan que la velocidad de agitación afecta la medida de la textura del producto.37 0.04) 3 4.93 1. Comparar las conclusiones que se sacaron a partir de esta gráfica con las de la prueba del rango múltiple de Duncan.46 0.09) (0.03) 4.77 0.76 6 (0.02) 4. c) ¿Qué diseños de las boquillas son diferentes con respecto al factor de la forma? Trazar una gráfica del factor de la forma promedio para cada tipo de boquilla y compararla con una distribución t escalada.92 0.81 0.04) (0.88 (0.82 (0.05) (0.12) (0. Considere el experimento del algoritmo para controlar la proporción de alúmina del capítulo 3.85 4.83 0.03) 4.88 4. utilizando a = 0. y se probaron los cuatro algoritmos para controlar la proporción en cada periodo. (Recuerde que a éste se le llamó "ruido del crisol".76 23.75 4.83 0.89 Tiempo 1 (0.92 0. Interpretar esta gráfica. Dos valoresfaltantes en un bloque aleatorizado. Trazar una curva de operación característica para el diseño del problema 4-2. Los datos obtenidos se presentan a continuación. 4-10.05) Ysacar las conclusiones apropiadas. estimar los parámetros del modelo Ti y {Ji del problema 4-1. ¿Esta gráfica proporciona alguna información útil? d) ¿Cuál sería la recomendación de los ingenieros del proceso con respecto a la elección de la velocidad de agitación y del horno para este refinador de textura particular si es deseable una medida de la textura pequeña? Analizar los datos del problema 4-2 utilizando la prueba general de significación de la regresión. ¿La prueba parece ser sensible a las diferencias pequeñas en los efectos de los tratamientos? Suponga que falta la observación del agente químico 2 y el rollo 3 en el problema 4-1. CUADRADOS LATINOS Y DISEÑOS RELACIONADOS cuatro diferentes velocidades de agitación.3. Un ingeniero industrial está realizando un experimento sobre el tiempo de enfoque del ojo. como se describe en la sección 4-1. Analizar el diseño utilizando estas dos estimaciones de los valores faltantes. Distancia (pies) 4 6 1 10 7 5 6 2 6 6 Sujeto 3 6 6 4 6 5 6 6 8 10 3 4 3 4 1 2 2 5 3 . Cuatro distancias diferentes son de interés. e) Graficar los residuales contra el horno y la velocidad de agitación. Analizar el problema estimando el valor faltante. Analizar los datos de este experimento (utilizar a = 0. Realizar el análisis exacto y comparar los resultados. 4-9. a) ¿Existe evidencia de que la velocidad de agitación afecta la medida de la textura? b) Representar los residuales de este experimento en una gráfica de probabilidad normal. Se interesa en el efecto de la distancia del objeto alojo sobre el tiempo de enfoque. 4-13. Se lleva a cabo un diseño de bloques aleatorizados para un refinador particular y los datos resultantes de la medida de la textura se muestran a continuación: Horno 2 3 4 5 5 6 6 9 9 Velocidad de agitación (rpm) 5 10 15 20 1 8 14 14 17 4 6 9 2 6 3 4-8. b) Derivar SSE con respecto a los dos valores faltantes. Suponiendo que los tipos de agentes químicos y los rollos de tela son fijos. e) Deducir las fórmulas generales para estimar dos valores faltantes cuando las observaciones están en bloques diferentes. 4-12. Cuenta con cinco sujetos para el experimento. Suponga que en el problema 4-1 faltan las observaciones del agente químico tipo 2 y el rollo 3 y del agente químico tipo 4 y el rollo 4. d) Deducir las fórmulas generales para estimar dos valores faltantes cuando las observaciones están en el mismo bloque. a) Analizar el diseño haciendo la estimación iterativa de los valores faltantes.f1 I 166 CAPÍTULO 4 BLOQUES ALEATORIZADOS. 4-11. Debido a que puede haber diferencias entre los individuos. igualar los resultados con cero y resolver las ecuaciones para las estimaciones de los valores faltantes. el ingeniero decide realizar el experimento en un diseño de bloques aleatorizados. cada corrida requiere aproximadamente 11/ 2 horas. el ingeniero emplea el diseño del cuadrado latino que se presenta a continuación. Cada lote de material nuevD sólo alcanza para permitir la realización de cinco corridas.) El cuadrado latino p x p contiene únicamente p observaciones para cada tratamiento. 2. No es relevante si los cuadrados usados son el mismo o son diferentes.p . Diseños que incluyen varios cuadrados latinos.n . independientemente del método. B. y realizar el análisis utilizando este valor.OS) y sacar conclusiones. 4-19. fJk y Tj . Analizar los datos de este experimento (a = O. k =1 2 . Un ingeniero industrial investiga el efecto de cuatro métodos de ensamblaje (A. Estimar el valor faltante con la ecuación 4-24. .P . Para obtener más réplicas. Analizar los datos de este experimento (utilizar a= O. Considere un cuadrado latino p x p con renglones (a¡). El experimentador decide realizar el experimento como un cuadrado latino para que los efectos del día y el lote puedan controlarse sistemáticamente. Orden de ensamblaje Operador 1 C=lO B =7 A =S D = 10 D 2 3 A D 4 1 2 3 4 = 14 C = 18 B = 10 A = 10 =7 = 11 C = 11 B = 12 B=8 A = 8 D=9 C=14 4-16. 4-17.OS) y sacar las conclusiones apropiadas. columnas (A) y tratamientos (iJ fijos. Deducir la fórmula del valor faltante (ecuación 4-24) para el diseño del cuadrado latino. Para tomar en cuenta esta fuente de variabilidad. el experimentador puede usar varios cuadrados. Día Lote 1 2 3 4 S 1 2 3 D = 1 A =7 C = 10 E=6 B = 3 4 S A = 8 C=11 B=4 D= 6 E=4 B =7 E=2 A = 9 C=8 D=2 C=7 D =3 E= 1 B =6 A = 8 E=3 B=8 D =S A=lO C=8 4-1S. Se seleccionan cuatro operadores para el estudio. El modelo apropiado es Yijkh = !l+ Ph +a¡(h) +-r j + f3k(h) + (-rp) ji. el ingeniero sabe que todos los métodos de ensamblaje producen fatiga. Suponga que en el problema 4-14 falta la observación del lote 3 en el día 4. Obtener estimaciones de mínimos cuadrados de los parámetros del modelo a¡.4-5 PROBLEMAS 167 4-14. j= 1. h= 1. Además.p . de tal modo que el tiempo requerido para el último ensamblaje puede ser mayor que para el primero. 1 i=1. Obtiene los datos que se muestran enseguida. Se estudia el efecto de cinco ingredientes diferentes (A.2. C. se desarrolla una tendencia en el tiempo de ensamblaje requerido. (Ver Cochran y Cox [26] y John [61d]. Dy E) sobre el tiempo de reacción de un proceso químico. +8 ijid. por ejemplo n. B. Además. 4-18. Es decir. . C y D) sobre el tiempo de ensamblaje de un componente de televisores a color. por lo que sólo pueden realizarse cinco corridas en un día.2. Desarrollar la tabla del análisis de varianza para este diseño. analizar los datos utilizando el método desarrollado en el problema 4-19. Orden de ensamblaje 1 2 3 4 1 Cf3 = 11 By = 10 Do = 14 Ba =8 CA = 12 Ay = 10 Da = 11 Bf3 = 7 Aa =9 Dy=9 Af3 = 8 Ca = 18 Operador 2 3 4 Aa=8 Df3 = 12 Cy = 15 Bo =6 4-24. 4-27.. En laprueba de carretera el ingeniero desea usar los automóviles corno bloques.:'" - 168 CAPÍTULO 4 BLOQUES ALEATORIZADOS. Desarrollar un análisis apropiado para los datos restantes. L/ip)j1¡ = Opara cada h y L h(ip)j11 = Opara cadaj. Analizar los datos utilizando el análisis exacto del problema del valor faltante revisado en la sección 4-1. y.4. e). o. 13. El rendimiento de un proceso químico se midió utilizando cinco lotes de materia prima. b) Desarrollar la tabla del análisis de varianza para este diseño. Es posible introducir un cuarto factor. Construir un hipercuadrado 5 x 5 para estudiar los efectos de cinco factores. L¡a¡(h) = OY L kf3k(h) = Opara cada h. Comentar la forma en que pueden utilizarse las curvas de operación característica del apéndice cón el diseño del cuadrado latino. Después de eliminar las letras griegas del problema 4-23. sin embargo. Suponga que las condiciones auxiliares apropiadas de los parámetros son LhPh = O. 4-21. Comparar los resultados con el análisis aproximado de estos datos que se presenta en la tabla 4-8. CUADRADOS LATINOS Y DISEÑOS RELACIONADOS 4-20. Analizar los datos de este experimento (utilizar a = 0. Concentración del ácido Lote 1 2 3 4 5 1 2 3 4 19 18 16 22 17 5 &=13 Af3 = 21 Bo = 13 Ca = 17 Dy = 14 Aa=26 By = 18 Ce = 20 Df3 = 15 Ea = 10 Bf3 = 16 Ca = 21 Da= 12 Ey = 15 Ae = 24 Cy = De = Ef3 = Aa = Ba = Do = 16 Ea = 11 Ay=25 Be = 14 Cf3 = 17 4-23. Observe que a¡(h) Yf3k(h) son los efectos del renglón y la columna en el cuadrado h-ésimo. 4-25.05) Y sacar conclusiones. Analizar los datos de este experimento (utilizar a = 0. debido a . L/r j = O. ¡ '. a) Establecer las ecuaciones normales para este modelo y resolverlas para las estimaciones de los parámetros del modelo. B. Considere el diseño de bloques aleatorizados con un valor faltante en la tabla 4-7. D y E) Ycinco concentraciones del catalizador (a. y. y realizar otro experimento. cinco tiempos de procesamiento (A. 13. . cinco concentraciones del ácido. donde Y¡jkh es la observación del tratamiento j en el renglón i y la columna k del cuadrado h-ésimo. Un ingeniero estudia las características del rendimiento de combustible de cinco tipos de aditivos de gasolina. Considere los datos de los problemas 4-15 y 4-23. Se usó el cuadrado grecolatino siguiente. 4-26. 4-22. Suponga que en el problema 4-15 el ingeniero sospecha que los sitios de trabajo usados por los cuatro operadores pueden representar una fuente adicional de variación. de donde resulta el cuadrado grecolatino siguiente. el sitio de trabajo (a.05) Y sacar conclusiones. Suponga que en el problema 4-14 los datos tornados en el día 5 se analizaron incorrectamente y fue necesario descartarlos. o). C. Ph es el efecto del cuadrado h-ésimo y (r:P)jh es la interacción entre los tratamientos y los cuadrados. Encontrar un BIBD para este experimento con seis bloques. el analista utiliza el diseño de bloques incompletos balanceados que se muestra abajo. k = 4 Y b = 16. Desarrollar el análisis estadístico. 4-36. Automóvil Aditivo 1 2 3 4 5 4-28. Sin embargo. se tiene.b + . Realiza el diseño balanceado con los cinco bloques siguientes. Se estudian siete concentraciones diferentes de madera dura para determinar su efecto sobre la resistencia del papel producido. Un diseño extendido de bloques incompletos consiste en una sola réplica de cada tratamiento en cada bloque junto con un diseño de bloques incompletos con k* = k-a.1. en la planta piloto sólo pueden hacerse tres corridas de producción por día.a 2 ).by. 4-34. 4-29. = 2r . 1. 4-33.05) Y sacar conclusiones. 4-31. = 3. 1. 4-38.. 127 Analizar los datos del ejemplo 4-6 utilizando la prueba general de significación de la regresión. Dado que los días pueden diferir. el diseño de bloques incompletos tendrá los parámetros k* = k . En el caso balanceado.4-5 PROBLEMAS 169 una restricción de tiempo. Demostrar que k'2. Analizar los datos de este experimento (utilizar a = 0. Un experimentador quiere comparar ocho tratamientos en bloques de cuatro corridas. 4-32. Realizar el análisis interbloques del diseño del problema 4-29. Realizar el análisis interbloques del diseño del problema 4-27. Comprobar que no existe un BIBD con parámetros a = 8.. (Sugerencia: en el diseño extendido de bloques incompletos.) . Demostrar que la varianza de los estimadores intrabloques {iJ es k(a -1 )a2 / (. r* = r . 4-37.1.a. Concentración de madera dura (%) 2 4 6 8 10 Días 1 114 126 141 145 120 136 2 120 137 3 4 5 120 119 117 129 134 149 150 143 118 123 130 6 7 117 12 14 4-30. Diseños ertendidos de bloques incompletos. debe utilizar un diseño de bloques incompletos.~=lQ! / (Aa) es la suma de cuadrados ajustada de los tratamientos en un BIBD. Un experimentador quiere comparar cuatro tratamientos en bloques de dos corridas. 1 14 12 13 11 2 17 14 11 12 3 14 13 11 10 4 5 12 10 9 8 13 13 12 12 Construir un conjunto de contrastes ortogonales para los datos del problema 4-27. *. Calcular la suma de cuadrados para cada contraste. el tamaño del bloque cumple con la relación a < k < 2a. 4-35. Ocasionalmente. Encontrar un BIBD con 14 bloques y . Analizar los datos de este experimento (utilizar a = 0. r = 8.05) Ysacar conclusiones. *..1. De manera similar. Cuando los factores están incluidos en un diseño factorial. si el factor A tiene a niveles y el factor B tiene b niveles. es necesario modificar el procedimiento anterior. cada réplica contiene todas las ab combinaciones de los tratamientos.Introducción a los diseños factoriales 5~ 1 DEFINICIONES Y PRINCIPIOS BÁSICOS En muchos experimentos interviene el estudio de los efectos de dos o más factores. Se trata de un experimento factorial de dos factores en el que los dos factores del diseño tienen dos niveles. ya que existen otras formas de definir el efecto de un factor. los dise· ños factoriales son los más eficientes para este tipo de experimentos. A estos niveles se les ha denominado "bajo" y "alto" y se denotan como "-" y "+". En general. En algunos experimentos puede encontrarse que la diferencia en la respuesta entre los niveles de un factor no es la misma para todos los niveles de los otros factores. Por ejemplo. considere el experimento sencillo de la figura 5-1. Por diseño factorial se entiende que en cada ensayo o réplica completa del experimento se investigan todas las combinaciones posibles de los niveles· de los factores. respectivamente. cuando el factor A se incrementa del nivel bajo al nivel alto se produce un incremento de la respuesta promedio de 21 unidades. Este punto se estudia con mayor profundidad más adelante. El efecto principal del factor A de este diseño de dos niveles puede visualizarse como la diferencia entre la respuesta promedio con el nivel bajo de A y la respuesta promedio con el nivel alto de A. Con frecuencia se le llama efecto principal porque se refiere a los factores de interés primario en el experimento. es común decir que están cruzados. el efecto principal de B es B= 30+52 _ 20+40 = 11 2 2 Cuando los factores tienen más de dos niveles. Numéricamente. existe una interac- 170 . esto es A= 40+52 _ 20+30 = 21 2 2 Es decir. Cuando esto ocurre. Por ejemplo. El efecto de un factor se define como el cambio en la respuesta producido por un cambio en el nivel del factor. ~ co (Bajo) . Gráficas como éstas son de gran ayuda para interpretar las interacciones significativas y para reportar los resultados al personal sin preparación estadística. Sin embargo. considere el experimento factorial de dos factores que se ilustra en la figura 5-2. Con el nivel bajo del factor B (o B-). en la figura 5-4 se grafican los datos de las respuestas de la figura 5-2. Experimento factorial sin in- Figura 5-4 Experimento factorial con interacción. Por ejemplo. o AB = (-28 .. no deberán utilizarse como la única técnica para el análisis de datos. Esto indica una interacción entre los factores A y B. ción entre los factores. en este experimento la interacción es grande. el efecto de A es A= 50-20= 30 y con el nivel alto del factor B (o B+). lo cual indica la ausencia de interacción entre los factores A y B.5-1 DEFINICIONES Y PRINCIPIOS BÁSICOS 171 + (Alto) 30 52 l:l:1 + (Alto) 40 12 l:l:1 u. . Observe que las rectasB-y B+ son aproximadamente paralelas. Estas ideas pueden ilustrarse gráficamente. 30 al a: 20 B+ m co ~BFactor A m40 ¡¡¡. ya que su interpretación es subjetiva y su apariencia con frecuencia es engañosa. se observa que existe una interacción entre A y B. De manera similar. Evidentemente. o co 40 + (Bajo) 20 D Factor A 50 + (Bajo) (Alto) (Bajo) (Alto) Figura 5·1 Experimento factorial de dos factores con la respuesta (y) indicada en los vértices.y B+ no son paralelas.30)/2 = -29. 30 al ::1 co 60 50 B- a: 20 10 10 + Factor A + Figura 5-3 teracción. La magnitud del efecto de la interacción es la diferencia promedio de estos dos efectos de A. Figura 5-2 Experimento factorial de dos factores con interacción. 60 50 40 ::1 ¡¡¡. el efecto de A es A=12-40=-28 Puesto que el efecto deA depende del nivel que se elige para el factor B.. En la figura 5-3 se grafican los datos de las respuestas de la figura 5-1 contra el factorA para ambos niveles del factor B. 20 D Factor A ti u. En este caso se observa que las rectas B. 5. y e es un término del error aleat. ~1 = 21/2 = 10. etc.172 CAPÍTULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES El concepto de interacción puede ilustrarse de otra manera.5x1 + 5.6 al La superficie de respuesta b) La gráfica de contorno Figura 5-5 La superficie de respuesta y la gráfica de contorno para el modelo y = 35. .x 2 es una variable que representa al factor B.5x1 x 2 49 y 39 29 -0. Para el experimento ilustrado en la figura 5-1 se encuentra que los efectos principales deA y B sanA = 21 YB = 11. las /3 son parámetros cuyos valores deben determinarse. presión. el modelo de regresión ajustado es )7= 35. Xl es una variable que representa al factorA. Las variables Xl y X 2 se definen en una escala codificada de -1 a + 1 (los niveles bajo y alto deA y B). por lo que el valor del coeficiente de la interacción en el modelo de regresión es ~12 = 1/2 = 0. El efecto de la interacción de la figura 5-1 es AB = 1. o ~o = (20+40+30+52)/4= 35.).5xz. El parámetro /30 se estima con el promedio de las cuatro respuestas.orio.5x1 +5. Las estimaciones de /31 y/32son la mitad del valor del efecto principal correspondiente. Entonces una representación con un modelo de regresión del experimento factorial de dos factores podría escribirse como y= /30 +/31 X 1 +/32 X 2 +/312 X 1X 2 +e donde y es la respuesta.2 0.5x 2 +0. YX 1X 2 representa la interacción entre Xl y X 2• Las estimaciones de los parámetros en este modelo de regresión resultan estar relacionadas con las estimaciones de los efectos.5. por lo tanto. Suponga que los dos factores del diseño tratado son cuantitativos (temperatura.5. tiempo.2 0.5 Y ~ 2 = 11 /2 = 5. Por lo tanto.5 + lO.5+10. S) es pequeño en comparación con los coeficientes de los efectos principales /31y /3 2' La interpretación que se hará de este hecho es que la interacción es pequeña y puede ignorarse. es decir. que el coeficiente /312 no fuera pequeño.2 -0.5 + lD. En la figura S-6 se presenta la superficie de respuesta y la gráfica de contorno del modelo x.Sx.6 al La superficie de respuesta 0. El coeficiente ~e l~ interacción (/312 = O. al eliminar el término 0. 0.5-1 DEFINICIONES Y PRINCIPIOS BÁSICOS 173 Las estimaciones de los parámetros obtenidas de esta manera para el diseño factorial en el que todos los factores tienen dos niveles (. En la figura S-Sb se muestran las líneas de contorno para las respuestas constantes y en el plano Xl' x 2 • Observe que como la superficie de respuesta es un plano.x2 se obtiene el modelo y= 3S.5x2 + 8x¡x2 • .5x¡ + 5. Suponga ahora que la contribución de la interacción en el experimento no fuera insignificante.Sx 2 En la figura S-S se muestran las representaciones gráficas de este modelo.2 ~ -0.Sxl +S.S+10. Por lo tanto.6 -1 b l La gráfica de contorno Figura 5·6 La superficie de respuesta y la gráfica de contorno para el modelo y = 35.2 0.6 0. En la figura S-Sa se tiene una gráfica del plano de los valores de ygenerados por las diferentes combinaciones de Xl y X 2• A esta gráfica tridimensional se le llama gráfica de superficie de respuesta. la gráfica de contorno contiene líneas rectas paralelas.y +) resultan ser estimaciones de mínimos cuadrados (se abundará sobre el tema más adelante). Es decir. Este torcimiento de la superficie de respuesta produce líneas de contorno curvas para las respuestas constantes en el planox1. En el experimento de la figura 5-2. Una interacción significativa suele enmascarar la significación de los efectos principales. El modelo de superficie de respuesta de un experimento es de gran importancia y utilidad.A+. Debido a que está presente el error-experimental. se necesita un total de seis observaciones. A +E+. se habría registrado una combinación adicional de los tratamientos. pueden hacerse dos estimaciones del efecto deA:A+E. la estimación del efecto principal deA sería A= 50+12 _ 20+40 =1 2 2 que es muy pequeño. para cada combinación de tratamientos y estimar los efectos de los factores utilizando las respuestas promedio. .-A-E-yA+E+ -A-E+. Los niveles de los factores se denotan porA-. Por lo tanto. En general. cada uno con dos niveles. una interacción es una forma de curvatura en el modelo de superficie de respuesta fundamental del experimento. como se muestra en la figura S-6b. ~ ca A-BA+B- + Factor A Figura 5·7 Experimento con un factor a la vez. El efecto de cambiar el factor A está dado por A +E. Ahora. los efectos principales correspondientes tienen escaso significado práctico. En presencia de una interacción significativa. por ejemplo. como se muestra en la figura 5-7. el experimentador deberá por lo general examinar los niveles de uno de los factores. Podría obtenerse información acerca de ambos factores haciéndolos variar uno a la vez.E-y E+. pueden hacerse dos estimaciones del A-B+ + c:¡ ~ u. Suponga que se tienen dos factores A y E. Estos puntos se ponen de manifiesto con claridad en la gráfica de la interacción de la figura 5-4.174 CAPÍTULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES (Se ha hecho que el efecto de la interacción sea el promedio de los dos efectos principales. por ejemplo del factor A. y el efecto de cambiar el factor E está dado por A-E + A-E-. El factorA tiene un efecto. 5~2 LA VENTAJA DE LOS DISEÑOS FACTORIALES Es sencillo ilustrar la ventaja de los diseños factoriales.) Observe que el efecto significativo de la interacción provoca el "torcimiento" del plano de la figura S-6a. El tema se ampliará en la sección 5-5 y en capítulos posteriores.x2. Sin embargo. cuando una interacción es grande. Por lo tanto. cuando se examinan los efectos deA con niveles diferentes del fa ctor E. el conocimiento de la interacciónAB es más útil que el conocimiento del efecto principal. utilizando sólo cuatro observaciones. y se llegaría a concluir que no hay ningún efecto debido a A. es deseable realizar dos observaciones. Si se hubiera efectuado un experimento factorial. se observa que no es éste el caso.-A-E-. De manera similar. manteniendo fijos los niveles de los otros factores para sacar conclusiones acerca del efecto principal de A. pero depende del nivel del factor E. Como ejemplo de un diseño factorial en el que intervienen dos factores. observe que los diseños Jactoriales ofrecen varias ventajas.0 2. el ingeniero no tendrá control sobre las temperaturas extremas en las que operará el dispositivo. Estas dos estimaciones de cada efecto principal podrían promediarse para producir efectos principales promedio que tienen la misma precisión que las estimaciones del experimento con un solo factor.5 ro ''. Haya niveles del factorA y b niveles del factor B. En resumen. y nosotros diríamos que la eficiencia relativa del diseño factorial con respecto al experimento de un factor a la vez es de (6/4) = 1. En general.5-3 DISEÑO FACTORIAL DE DOS FACTORES 175 4.:¡ . un ingeniero está diseñando una batería que se usará en un dispositivo que se someterá a variaciones de temperatura extremas. produciendo conclusiones que son válidas para un rango de condiciones experimentales. 3.. Suponga ahora que está presente una interacción.0 1. Sin embargo. En general.5. referirse al experimento de la figura 5-2. los diseños factoriales permiten la estimación de los efectos de un factor con varios niveles de los factores restantes. cada réplica del experimento contiene todas las ab combinaciones de los tratamientos. es decir.0 3 4 Número de factores ~ '0 ¡¡:: ro '0 lO III UJ 2 5 6 Figura 5·8 Eficiencia relativa de un diseño factorial con respecto a un experimento de un factor a la vez (dos niveles del factor). Cuando el dispositivo esté fabricado y se envíe al campo.1 DISEÑO FACTORIAL DE DOS FACTORES Un ejemplo Los tipos más simples de diseños factoriales incluyen únicamente dos factores o conjuntos de tratamientos.5 1. pero sabe por expe- . Además.0 3. Si el diseño de un factor a la vez indicara queA-B+ yA +B.dieron mejores respuestas queA-B-. y tiene tres elecciones posibles. hay n réplicas. Son más eficientes que los experimentos de un factor a la vez. como se muestra en la figura 5-8.5 2. El único parámetro del diseño que puede seleccionar en este punto es el material de la placa o ánodo de la batería. efecto de B. Para un ejemplo. esta conclusión puede ser una equivocación grave. un diseño factorial es necesario cuando puede haber interacciones presentes a fin de evitar llegar a conclusiones incorrectas. 5~3 5~3. Por último. esta eficiencia relativa aumentará conforme se incremente el número de factores. si está presente una interacción. los cuales se disponen en un diseño factorial. una conclusión lógica sería que A +B+ sería todavía mejor. pero sólo se requieren cuatro observaciones en total. .oo. por lo que este diseño es un diseño completamente aleatorizado. ""Ylbn Y2bI. Tabla 5-2 Arreglo general de un diseño factorial de dos factores Factor B 1 1 Factor A Ylll. Yabl. la temperatura puede controlarse en el laboratorio donde se desarrolla el producto para fines de prueba. El anterior es un ejemplo específico del caso general de un diseño factorial de dos factores.Y2b2. .Ylb2. oo. El orden en que se hacen las abn observaciones se selecciona al azar. el ingeniero puede hacer que la batería sea robusta para la variación de la temperatura en el campo. Quizá sea posible encontrar una alternativa del material que no resulte afectada considerablemente por la temperatura. Para pasar al caso general.Yaln Ya21. . 70 Y 12S oP-.Ya2n .Yab2. ya que estos niveles de temperatura son consistentes con el medio ambiente donde se usará finalmente el producto. oo. y las 36 pruebas se corren de manera aleatoria.Y1l2.Yabn ···.2. "·'YI2J..Y222' b Ylbl. a) y e1factor B tiene el nivelj-ésimo (j = 1. 2. el experimento factorial de dos factores aparecerá como en la tabla 5-2. • . Y221."'. El ingeniero decide probar los tres materiales de la placa con tres niveles de temperatura -15. ""Y2bn 2 Y2ll. b) en la réplicak-ésima (k = 1. En la tabla 5-1 se presentan los datos del experimento y de la vida observada de la batería. un problema de ingeniería muy importante. n). ""Y2In ···'Y22J1 a I Ya 11' Ya12.Ya22.. De ser éste el caso. 176 CAPÍTULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES Tabla 5-1 Tipo de material 1 2 3 Datos de la vida (en horas) para el ejemplo del diseño de la batería Temperatura (OF) 15 130 74 150 159 138 168 155 180 188 126 110 160 34 80 136 106 174 150 70 40 75 122 115 120 139 20 82 25 58 96 82 125 70 58 70 45 104 60 riencia que la temperatura probablemente afectará la vida efectiva de la batería.Yl1n 2 Yl2lo Yl22.2. Se prueban cuatro baterías con cada combinación del material de la placa y la temperatura. ·. En general.·r "'· : i . ···. 2. . Se trata de un ejemplo de la aplicación del diseño experimental estadístico en el diseño de productos robustos. sea Yijk la respuesta observada cuando el factor A tiene el nivel i-ésimo (i = 1. el ingeniero quiere responder las preguntas siguientes: 1.Y212. Sin embargo.. ¿Qué efectos tienen el tipo de material y la temperatura sobre la vida de la batería? ¿Existe alguna elección del material que produzca de manera regular una vida larga de la batería independientemente de la temperatura? La segunda pregunta es de particular importancia. En este problema. 2. denote el total de observaciones bajo el nivelj-ésimo del factor B.é O y de la igualdad de los efectos de los tratamientos de las columnas.5-3 DISEÑO FACTORIAL DE DOS FACTORES 177 Las observaciones de un experimento factorial pueden describirse con un modelo.. b { k = 1. .. 2. a j=l. . En el diseño factorial de dos factores. De manera similar. denote el total de observaciones bajo el nivel i-ésimo del factor A.. En la mayor parte de este capítulo se usará el modelo de los efectos (ecuación 5-1) con referencia al modelo de regresión en la sección 5-5. . por ejemplo. . también querría probarse Ha: (Tf3)ij =O para todas las i. y los efectos de los tratamientos se definen como las desviaciones de la media global. son de igual interés. Los modelos de regresión resultan particularmente útiles cuando uno o más de los factores del experimento son cuantitativos. los factores (o tratamientos) de los renglones y las columnas. Se supone que ambos factores son fijos. Puesto que hay n réplicas del experimento. El modelo de los efectos es Yijk =/l+T¡+f3j+(Tf3)ij+Cijk i=l. T¡ es el efecto del nivel i-ésimo del factor A de los renglones. 5-3. por ejemplo.= f3b = O :. 2. . b k = 1. que Yij. A y B. 2.é (5-2b) H 1 : al menos una f3 j O También existe interés en determinar si los tratamientos de los renglones y las columnas interactúan.: { 1. n (5-1) donde /l es el efecto promedio global. j :. 2.= Ta = O H 1 : al menos una T ¡ :. (Tf3)ij es el efecto de la interacción entre T¡ y f3 j. el interés se encuentra en probar hipótesis acerca d~ la igualdad de los efectos de los tratamientos de los renglones. H a :f31 (5-2a) = f32 =. a ] -1. los efectos de las interacciones son fijos y se definen de tal modo que 2:~=l(Tf3)ij = 2:~=l(Tf3)ij = O. YC¡jk es un componente del error aleatorio.. f3j es el efecto del nivelj-ésimo del factor B de las columnas.2. por lo que 2:~=1 T¡ = Oy 2:~=1f3 j = O. Por lo tanto. . Específicamente. que y J. n = /l+T¡ +f3j +(Tf3)ij Thmbién podría usarse un modelo de regresión como en la sección 5-1. Ha: TI = T2 =.é (5-2c) H 1:al menos una (Tf3) ij O A continuación se indica cómo se prueban estas hipótesis utilizando un análisis de varianza de dos factores. denote el total de observaciones de la celda .2 Análisis estadístico del modelo con efectos fijos Sea que Yi. hay abn observaciones en total. Hay varias formas de escribir el modelo de un experimento factorial. Otro modelo posible de un experimento factorial es el modelo de las medias Yijk donde la media de la celda ij-ésima es /lij = /lij +cijk i.. Yi. -Y. i=l j=l a + LLL (Yijk-YijY i=l j=l k=l a b n ya que los seis productos cruzados del lado derecho de la igualdad son cero. = bn y. = abn Y. Yi. una suma de cuadrados debida a la interacción entre A y B (SSAB).Y. j= 1.. )2 = LLL [(Yi.+ . b + anLJ ~ (-)2 Yj..=.lJ.. las celdas y el gran promedio.)2 LJ Yij.. )+(Y. j=l b (5-4) + nLJ ~ ~ (. = Yj. + Y-'" )+(Y.J. y una suma de cuadrados debida al error (SSE). ..Y. Yj. 2. y que Y. La suma de cuadrados total corregida puede escribirse como LLL (Yijk _y. las columnas... i=l j=l k=l i=l j=l k=l a b n a b n j.:::: 2) para obtener una suma de cuadrados del error.. una suma de cuadrados debida a "las columnas". an j= 1. .. .. = LLL i=l j=l k~l a b n Yijk Y.. (5-3) . i=l. .. o factor B (SSB). La ecuación 5-4 puede escribirse simbólicamente como SST = SSA +SSB +SS AB +SSE (5-5) El número de grados de libertad asociado con cada suma de cuadrados es Efecto A B Interacción AB Error Total Grados de libertad a-l b-l (a-l)(b-l) aben -1) abn-l .... o factor A (SSA).a . .. a = í! Yijk i=l k=l _ Yj.. ..._ .Y-. 2. LL Yijk j=l k=l b n Yi.b Y. k . se observa que debe haber por lo menos dos réplicas (n ...fi"\'l' 178 CAPÍTULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES ij-ésima.J.. )]2 lJ· lJo ~ =bnLJ i=l a (-)2 Yi... Observe que se ha hecho la partición de la suma de cuadrados total en una suma de cuadrados debida a "los renglones". . . 2.. Y. . Yi. Se definenYi...Yij.. . b i = 1....y-ol. -Y.2. Y'¡. como los promedios correspondientes de los renglones. . Expresado matemáticamente. Y Y . ) +(Y-. Por el último componente del lado derecho de la igualdad de la ecuación 5-4... .. denote el gran total de todas las observaciones.Y. por lo general se emplea un paquete de software de estadística para realizar el análisis de varianza.mbargo.(b -1) = (a -1 )(b -1). Los grados de libertad de la interacción son sólo el número de grados de libertad de las celdas (que es ab . 1 y la región crítica sería la cola superior de la distribución F.l)(b . Sin embargo. por lo tanto hay aben -1) grados de libertad para el error. entonces los cuadrados medios correspondientes serán mayores que MSE' Por lo tanto. Los valores esperados de los cuadrados medios son SS ) A E(MSA)=E. simplemente se divide el cuadrado medio correspondiente por el cuadrado medio del error.1) grados de libertad en el numerador.1 grados de libertad. Dentro de cada una de las ab celdas hay n -1 grados de libertad entre las n réplicas. El procedimiento de prueba suele resumirse en una tabla del auálisis de varianza. Observe que la suma del número de grados de libertad en el lado derecho de la ecuación 5-5 es igual al número total de grados de libertad. MSB. como se señaló anteriormente.=a2+ ( a-1 bn~ 7:7 a-1 anL f3~ b-1 nL L (7:f3)~ . es decir.1ü F con a . respectivamente. entonces MSA será mayor que MSE • De manera similar. Sin e. Cada suma de cuadrados dividida por sus grados de libertad es un cuadrado medio. entonces MSA. respectivamente. como se muestra en la tabla 5-3. si están presentes efectos de los tratamientos de las columnas o de la interacción. no es complicado obtener fórmulas para calcular manual1 La prueba F puede considerarse como una aproximación de una prueba de aleatorización.(a -1) . Los valores grandes de este cociente implican que los datos no apoyan la hipótesis nula. MSB/MS E y MSAB/MSE se distribuyen con. para probar la significación de los dos efectos principales y su interacción. tienen a -1 y b . En lo que a los cálculos se refiere. ni de los tratamientos de las columnas. ab -1. por lo tanto. b -1 Y (a . .1) menos el número de grados de libertad de los dos efectos principales A y B. MSAB y MSE son todas estimaciones de aZ. por ejemplo. y aben -1) grados de libertad en el denominador. ni interacción.1 grados de libertad totales a las sumas de cuadrados puede justificarse de la siguiente manera: los efectos principalesA y B tienen a y b niveles. como se indica. entonces cada uno de los cocientes de cuadrados medios MSA/MSE. si hay diferencias entre los efectos de los tratamientos de los renglones.5-3 DISEÑO FACTORIAL DE DOS FACTORES 179 Esta asignación de los abn .=1 j=1 a b b .1.=1 E(MS B )= E(SSB b-1 E(MS AB) )= a 2 + j=1 = E( SS AB (a-1)(b-1) )= a2 + (a-1)(b-1) y SSE ) 2 E(MSE ) = E ( ab(n-1) = a Observe que si es verdadera la hipótesis nula de que no hay efectos de los tratamientos de los renglones. Si se supone que el modelo (ecuación 5-1) es adecuado y que los términos del error Cijk tienen una distribución normal e independiente con varianza aZ constante. ..~1 y2 . modelo con efectos fijos Fuente de variación 'ITatamientosA Tratamientos B Interacción Error Total Suma de cuadrados Grados de libertad Cuadrado medio F: = MSA o MSE MSE SSB SSAB SSE SSr b-1 (a-1)(b -1) aben -1) abn-1 MS = SSB B b-1 M _ SSAB SAB . El experimento del diseño de la batería En la tabla 5-4 se prese1}ta la vida efectiva (en horas) observada en el ejemplo del diseño de la batería que se describió en la sección 5-3. Se calcula primero la suma de cuadrados entre los totales de las ab celdas. L L J~l ab 2 y..SS A . .(a-1)(b-1) F: = MSB o F: = MSAB o MSE MS = SSE E aben -1) mente las sumas de cuadrados de la ecuación 5-5.J.SS AB . 2 abn 2 (5-7) y SSB =~ an 1 ± j~l .180 Tabla 5-3 CAPÍTULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES La tabla del análisis de varianza para el diseño factorial de dos factores.L l. _ L abn (5-8) Es conveniente obtener SSAB en dos pasos. a la que se denomina la suma de cuadrados debida a los "subtotales": SS Sublotales =.SS A .SSB o SS E = SST - SS Subtotales EJEMPLO 5~ 1 .~ (5-6) Las sumas de cuadrados de los efectos principales son 1 a SS A bn =-" f:t i. Los totales de los renglones y las columnas se indican en los márgenes de la tabla y los números encerrados en un círculo son los totales de las celdas.SSB Puede calcularse SSE por sustracción como (5-10) SSE = SST .~ yij. La suma de cuadrados total se calcula como de costumbre con SST= LLL Yijk-b a n i~l j~l k~l abn 2 y.abn Esta suma de cuadrados también contiene a SSA y SSB' Por 10 tanto. el segundo paso consiste en calcular SSAB comO (5-9) SS AB = SS Subtotales .1. 72 = SST - SS Material . = an LJ Y.72 SS Temperatura 1.72.-b n a n ab 2 . F a. 27 = 2. 1 2 3 Ji.683.78 y SS E 10. ª @) = LJLJLJ ~~~ T i=1 j=1 k=1 el 0 34 80 136 106 174 150 1291 @ @ @ 20 82 25 58 96 82 770 70 58 70 45 104 60 @ @ @ 998 1300 1501 3799 = Y. por lo que los efectos principales del tipo de material y la temperatura también son significativos.39.97 2 = (130)2 +(155)2 +(74)2 + . independientemente del tipo de material. 27 = 3. El hecho de que las rectas no sean paralelas indica que la interacción es significativa. es conveniente construir una gráfica de las respuestas promedio para cada combinación de los tratamientos.9613..118.35.118.5-3 DISEÑO FACTORIAL DE DOS FACTORES 181 Tabla 5-4 Datos de la vida (en horas) del experimento del diseño de la batería Tipo de material Thmperatura ("F) 15 130 74 150 159 138 168 1738 155 180 188 126 110 160 70 125 40 75 122 115 120 139 YL.72. Como ayuda para interpretar los resultados de este experimento. +(60)2 SS Materia! 1 a 2 =_~ 2_~ bn LJ Yi.39.=1 j=1 SSMaterial - SSTemperatura = ¡[(539)2 +(229)2 + .97-10.73. se concluye que hay una interacción significativa entre los tipos del material y la temperatura.646.(37::)2 = 10.75 En la tabla 5-5 se muestra el análisis de varianza. Al cambiar de una temperatura baja a una intermedia..230. En la tabla 5-5 también se muestran los valores P para los estadísticos de la prueba.j. Esta gráfica se muestra en la figura 5-9..78= 18... 4. Además.72= 9613.(37::)2 = 39.a5 . la vida de la batería con el material tipo 3 tiene un in- .646. abn 1=1 = (3)1(4)[(998)2 +(1300)2 +(1501)2]..~ LL Yij. Puesto que F a.SSTemperatura - SS Interacción = 77..72 SSInteracción =- 1 Y.(37::)2 . .683.118.abn 2 )=1 1 ~ b 2 = (3)1(4) [(1738)2 +(1291)2 +(770)2].683. En general... 2.a5 . Las sumas de cuadrados se calculan de la siguiente manera: b n SS Y~-~ gk b a n (3799)2 36 = 77. . +(342)2]. se consigue una vida más larga con una temperatura baja. 683.21 7. . 175 150 1'.':$125 :g :> ro -o o e o. Para ilustrar. esta comparación se hace con un solo nivel de la temperatura. Se ilustra ahora el uso de la prueba de Tukey con los datos de la vida de la batería del ejemplo S-l. Se supone que la mejor estimación de la varianza del error es MSE de la tabla del análisis de varianza. las comparaciones entre las medias de uno de los factores (por ejemplo.72 2 39. .97 Cuadrado medio 5.559.403.182 CAPÍTULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES Tabla 5-5 Análisis de varianza de los datos de la vida de la batería Fuente de Suma de Grados de variación cuadrados libertad Tipos de material 10. por ejemplo el nivel 2 (70°F). utilizando el supuesto de que la varianza del error experimental es la misma para todas las combinaciones de tratamientos. A ) pueden ser oscurecidas por la interacciónAB.78 Error 27 18. E 100 75 50 Material tipo 3 . Puesto que la interacción es significativa.72 2 Temperatura Interacción 4 9. Cuando la interacción es significativa. la vida de la batería disminuye para los materiales tipos 2 y 3 y se mantiene en esencia sin cambio pára el material tipo 1.----.¡~ Material tipo 1 Material tipo 2 25 0'-----:'::-----::':-------:-:-::----Temperatura (DFI Figura 5-9 Gráfica tipo de material-temperatura para el ejemplo 5-1.0020 0. por lo general es de interés hacer comparaciones entre las medias individuales de los renglones o las columnas para descubrir diferencias específicas. Los métodos de comparaciones múltiples revisados en el capítulo 3 son útiles a este' respecto.613. la interacción es significativa.0001 0. Con una temperatura de intermedia a alta.36 2.75 Total 35 77..97 3. suponga que en el ejemplo S-l el interés se encuentra en detectar las diferencias entre las medias de los tres tipos de material. Comparaciones múltiples Cuando el análisis de varianza indica que las medias de los renglones o las columnas difieren.341. El material tipo 3 parece producir los mejores resultados si se quiere una pérdida menor de la vida efectiva cuando la temperatura cambia.91 28. Observe que en este experimento.56 Valor P 0.230... .118. Una forma de abordar esta cuestión consiste en fijar el factor B en un nivel específico y aplicar la prueba de Tukey a las medias del factorA con ese nivel.86 19.0186 cremento real. .646. mientras que con los materiales tipos 1 y 2 disminuye.44 675. 47 119. la vida media de la batería es la misma para los materiales tipos 2 y 3.50 > T O. Si la interacción es significativa.05 = 45. la temperatura y la interacción entre el tipo de material y la temperatura. A continuación se indica cómo usar estos residuales para verificar la adecuación del modelo. = 57. así como ambos efectos principales. En este análisis. 05 (3.7652 77. 3 vs.75 . .50~67~21 = 45.683.50 > T O•05 = 45.25 = 62. Las comparaciones por pares dan como resultado 3 vs. 05 = qo . Observe que SS Modelo = SS Material + SS Temperatura + SS Interacción = 10.119.00 < T O•05 = 45.47 Este análisis indica que con el nivel de temperatura de 70°F. Y22. las diferencias entre las medias de las celdas incluyen los efectos de la interacción.05(3.97 Es decir.72+9613. 27) = 3. esto daría 36 comparaciones entre todos los pares posibles de las nueve medias de las celdas.57.75 = 145. el experimentador podría comparar las medias de todas las ah celdas para determinar cuáles difieren significativamente.75 .57.47 donde qo. Y32.646.22 = 0.78 = 59.72+39. En la salida de computadora se muestran también los residuales del modelo ajustado. En el ejemplo 5-1. 2: 2 vs. 1: .75 = 26.50 se obtiene por interpolación en la tabla VIII del apéndice. Yque la vida media de la batería para el material tipo 1 es significativamente menor.416. cerca de 77% de la variabilidad de la vida de la batería es explicada por el material de la placa de la batería.75 (material tipo 1) (material tipo 2) (material tipo 3) y TO. Saüda de computadora En la figura 5-10 se presenta la salida de computadora de Design-Expert para los datos de la vida de la batería del ejemplo 5-1.25 = 119. 1: 145.25 = 88.5-3 DISEÑO FACTORIAL DE DOS FACTORES 183 Los promedios de los tres tipos de material a 70°F dispuestos en orden ascendente son Y12. 27) ~MSE -11 - = 3.75 .47 145.416.118.22 y que 59. 189 -1.153 0.03 8 59416.00 58.50 -4.75 155.250 0.25 4.761 0.250 0.00 60.56 <0.611 0.022 -1.50 0.142 1.00 -23.250 0.250 0.75 145.75 3.817 -1.044 0.031 0.00 7.75 134.00 138.002 0.011 -0.726 1.002 0.463 -1.014 0.151 -0.0001 0.250 0.00 82.700 0.53 24.156 0.548 0.50 85.822 -1.00 144.50 85.093 0.98 105.75 134.25 57.00 58.25 32.100 -0.085 0.089 0.250 0.25 -25.00 20.75 16.103 0.75 27 Pure Error 77646.7652 0.50 49.00 122.133 0.033 1.139 Figura 5·10 Salida de Design-Expert para el ejemplo 5-1.6956 0.75 119.25 -5.50 20.008 0.75 2.50 24.25 -29.00 24.0020 <0.322 -0.00 75.25 -13.75 119.75 -6.97 3.897 2.144 -0.50 -25.042 0.75 155.00 120.50 -3.50 85.250 0.001 0.250 0.019 0.069 -1.250 0.00 144.00 180.378 0.722 -0.178 Student Residual Cook's Distance Outlier t Diagnostics Case Statistics Standard Actual Predicted Value Value Order Residual Leverage 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 130.066 -1.00 40.140 -0.269 0.666 1.093 0.250 0.467 -0.75 -6.040 0.00 134.250 0.00 34.75 57.089 0.25 57.300 -1.711 -1.250 0.076 0.044 0.25 45.270 0.75 119.50 49.900 2.262 1.211 1.025 0.75 -60.00 25.00 150.50 57.030 0.704 -1.604 0.098 -0.000 0.250 0.00 174.75 134.002 0.75 27 Residual 0.00 45.72 A 19559.250 0.011 -0.065 0.75 28.908 -0.460 -0.25 57.023 0.50 8.75 -17.36 2 39118.00 74.250 0.50 10.250 0.211 -2.001 0.00 155.789 0.250 0.00 168.295 -1.250 0.022 0.00 150.5826 8.75 145.22 Model 5341.433 -1.251 0.00 70.75 144.25 17.00 16.50 12. PRESS 25.00 160.250 0.035 1.75 155.00 144.00 110.00 139.50 18.50 57.555 0.75 -37.50 -24.21 18230.72 B 2403. .00 136.207 1.005 0.00 -34.~I 184 CAPÍTULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES in hours Response: Life ANOVA for Selected Factorial Model Analysis of variance table [Partial sum of squares] Mean Sum of Square Squares DF Source 7427.022 -1.00 82.250 0.00 159.75 20.250 0.185 -1.75 145.019 0.767 0.86 2 10683.038 0.716 -0.00 57.250 0.00 70.00 106.256 0.783 0.50 0.250 0. Dev.003 0.25 119.25 -4.78 4 AB 675.50 85.0001 0.250 0.011 0.50 49.250 0.048 -0.250 0.91 28.250 0.75 155.00 126.048 0.250 0.75 145.250 0.150 0.50 -4.001 0.341 -0.25 ·22.144 1.00 96.97 35 Cor Total Std.44 9613.000 O Lack of Fit 675.511 0.250 0.255 0.207 -3.0186 significant C.058 0.250 0.550 0.250 -0.00 188.003 0.250 0.50 57.00 80.011 -0.100 0.50 49.001 0.250 0.267 1. Mean F Value Prob> F 11.911 -0.00 115.V.372 0.21 18230.196 0.250 0.250 0.000 0.22 R-Squared Adj R-Squared Pred R-Squared Adeq Precision 0.00 104.62 32410.200 0. En la figura 5-12 se grafican los residuales contra los valores ajustados Yijk' Esta gráfica indica una ligera tendencia de la varianza de los residuales a incrementarse cuando la vida de la batería se incrementa.50 10. por lo que estas respuestas se aceptan como legítimas.00 16.75 28.75 -6. aun cuando el residual negativo más grande (-60.75 con 15°F para el material tipo 1) se aparta un poco de los demás.25 -4.00 24.25 4.50 8.75 -25. tal como un error al registrar los datos. Al examinarse nuevamente los datos no se observa ningún problema obvio.75 16.25 45.25 32. la ecua(5-12) En la salida de computadora de Design-Expert (figura 5-10) y en la tabla 5-6 se muestran los residuales de los datos de la vida de la batería del ejemplo 5-1.50 -3.25 -6. (el promedio de las observaciones de la celda ij-ésima). deberá verificarse la adecuación del modelo fundamental. la herramienta primaria de diagnóstico es el análisis residual. El valor estandarizado de este residual es -60.5-3 DISEÑO FACTORIAL DE DOS FACTORES 185 ·5.25 70 -17. el problema no es lo suficientemente grave como para tener un impacto dramático en el análisis y las conclusiones.75 -5.34. Estos dos residuales son los principales responsables de la desigualdad de la varianza detectada en las figuras 5-12 a 5-14.50 18.50 0.50 .75 y 45.25 -29. Como anteriormente.75 3.75 2.25 17. En la tabla 5-6 se observa que la celda 15°F-material tipo 1 contiene los dos residuales extremos (-60.50 -4. respectivamente.3 Verificación de la adecuación del modelo Antes de adoptar las conclusiones del análisis de varianza.50 -24.4 Estimación de los parámetros del modelo Los parámetros del modelo de los efectos para el diseño factorial de dos factores Yijk = fl +í¡ + f3 j +(íf3)ij +8 ijk (5-13) Tabla 5-6 Tipo de material 1 2 3 Residuales del ejemplo 5-1 Temperatura 15 -4. Los residuales del modelo factorial de dos factores son (5-11) y puesto que el valor ajustado Yijk ción 5-11 queda como = )lij.75 -60.3. En las figuras 5-13 y 5-14 se grafican los residuales contra los tipos del material y la temperatura.75 -34.3.21 = -2.25 22. Y es el único residual cuyo valor absoluto es mayor que 2. Ambas gráficas indican una ligera desigualdad de la varianza. con la combinación del tratamiento 15°F y material tipo 1.25 -13. 5. Es posible que esta combinación de tratamientos particular produzca una vida de la batería ligeramente más errática que las demás.25).50 -25. Sin embargo.75 -37.50 20.00 -23.50 (OF) 125 12.00 20.751'1675.50 24. La gráfica de probabilidad normal de estos residuales (figura 5-11) no revela nada particularmente problemático. teniendo posiblemente una varianza mayor que las demás. Al utilizar el método de la sección 3-9. hay 1 + a + b + ab ecuaciones normales..75 Residuál 18.186 CAPÍTULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES 99 ro E o c: o .25 -7. pueden estimarse por mínimos cuadrados.75 -34.c -o ro o.25 Figura 5-11 Gráfica de probabilidad normal de los residuales del ejemplo 5-1.g :c ro ..75 45.. no es difícil demostrar que las ecuaciones normales son a tt:abn{t+bnL tri i=l +anL~j +n j=l b LL i=l j=l a b A (rf3)ij = Y. Puesto que el modelo tiene 1 + a + ab parámetros que deben estimarse. (5-14a) 80 60 40 20 . • • ·50 • • • • 100· Yijk •• •• • 200 '" ~ O -20 -40 • •• • • • •• • -60 -80 • Gráfica de los residuales contra Yijk para el ejemplo 5-1. -o ::R o '" -60. Figura 5-12 .. 60 40 20 • • • • • • • • • : 125 Temperatura (OF) • • -20 -40 -60 -130 • • • Figura 5-14 Gráfica de los residuales contra la temperatura para el ejemplo 5-1. ~ O • • • • '12 I I • 63 -20 -40 -60 -130 • • • l1po de materia I • " • • • • Figura 5·13 Gráfica de los residuales contra el tipo de material para el ejemplo 5-1. . 2. el parámetro que corresponde a cada ecuación normal se indica a la izquierda de las ecuaciones 5-14.0 . 000' b (5-14b) (5-14c) (5-14d) i 1. i j = 1.2'000' b : o o o..5-3 DISEÑO FACTORIAL DE DOS FACTORES 187 60 40 20 • • • ·1 I . a { } -1.. 2. o Por conveniencia. .a = 1. 2. el efecto del renglón i-ésimo y el efecto de la columna j-ésima.. _ Ji. los parámetros del modelo no tienen estimaciones únicas.. los tratamientos de las columnas se estiman con el promedio de la columna menos el gran promedio. + ) +( Yij. 2.a r:¡ = Yi.. se imponen las restricciones L f¡=O ¡=1 L fij = O j=1 b a a (S-ISa) (5-15b) (5-15c) L ¡=1 y /1 (r:(3)ij = O j = 1.r: u + (r:(3)i.2. . Este resultado se usó en la ecuación 5-12 para obtener los residuales del modelo factorial de dos factores..2. es decir.Yj. .a = 1. + Y. que podría considerarse como la "verdade- . Y¡.(r:(3)". j /1 j..188 CAPÍTULo 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES El modelo de los efectos (ecuación 5-13) está sobreparametrizado. Por lo tanto. . i = 1. b _ (r:(3)ij = Yij... Los efectos de los tratamientos de los renglones se estiman con el promedio del renglón menos el gran promedio... j {i=1'2.. Sin embargo.. Asimismo. _ j = 1.)+(-) = Y. oo. el número que se requiere. se tienen en total a + b + 1 restricciones. Y... . . b L j=1 b /1 (r:(3)ij = O i = 1. tienen una estimación única independientemente de las restricciones elegidas. 2. . h /1 =Yij... la operación suma de la ecuación 5-14d sobre j para una i particular dará la ecuación 5-l4b.oo.. - _ Y¡.1 restricciones independientes. . . b (5-16) Observe el gran atractivo intuitivo de esta solución de las ecuaciones normales. Al aplicar estas restricciones.+(. la observación k-ésima de la celda ij-ésima se estima con el promedio de las n observaciones de esa celda. y se obtiene la solución jl = Y . Por lo tanto.. Yj.a (5-15d) Las ecuaciones S-ISa y 5-15b constituyen dos restricciones.. ciertas funciones importantes de los parámetros del modelo son estimables. el valor ajustado Y¡jk puede encontrarse como Yijk = jl+f¡ +(3j +(r:(3h . y la operación suma de la ecuación 5-14d sobre i para unaj particular dará la ecuación 5-14c. Es decir. y la interacción ij-ésima se estima con el promedio de la celda ij-ésima menos el gran promedio. ' Al utilizar la ecuación 5-16. las ecuaciones normales (ecuaciones 5-14) se simplifican considerablemente.. Observe que la suma de las a ecuaciones de la ecuación 5-14b es igual a la ecuación 5-14a y que la suma de las b ecuaciones de la ecuación 5-14c es igual a la ecuación 5-14a.. mientras que las ecuaciones 5-15c y 5-15d forman a + b . ..... h _ _ fi = Y. Un ejemplo es r:¡ . haya + b + 1 dependencias lineales en este sistema de ecuaciones y no existirá ninguna solución única..Y..Y.Yj. Puesto que se han usado restricciones (ecuaciones 5-15) para resolver las ecuaciones normales. .... . 2. A fin de obtener una solución.Y¡.. . .Y. Suponga que antes de correr el experimento se decide que la hipótesis nula deberá rechazarse con una alta Tabla 5-7 Parámetros de la curva de operación característica de la parte V del apéndice para el diseño factorial de dos factores. entonces el valor mínimo de <1>2 es <1>2 . ver el material suplementario del texto de este capítulo. Por ejemplo. n) apropiado en un diseño factorial de dos factores. como se señaló anteriormente. En general.5-3 DISEÑO FACTORIAL DE DOS FACTORES 189 ra" diferencia entre los niveles i-ésimo y u-ésimo del factorA. si la diferencia en las medias de dos renglones cualesquiera es D. considere los datos de la vida de la batería del ejemplo S-1. el experimentador puede apoyarse en las curvas de operación característica que aparecen en la parte V del apéndice. Es este resultado el que perturba las pruebas de los efectos principales en presencia de una interacción. En la tabla S-7 se muestra el valor apropiado del parámetro <1>2. 5-3. Observe que la verdadera diferencia entre los niveles de cualquier efecto principal incluye un efecto de la interacción "promedio".5 Elección del tamaño de la muestra Para determinar un tamaño de la muestra (el número de réplicas. entonces el valor mínimo de <1>2 es (S-17) 2aa mientras que si la diferencia en las medias de dos columnas cualesquiera es D. Esta propiedad también se hizo notar en el capítulo 3 cuando se estudió el modelo de un solo factor. cualquier función de los parámetros del modelo que sea una combinación lineal del miembro izquierdo de las ecuaciones normales es estimable. Una forma muy eficaz de emplear estas curvas consiste en encontrar el valor menor de <1>2 que corresponde a una diferencia especificada entre las medias de dos tratamientos cualesquiera. modelo con efectos fijos Factor a Grados de libertad del numerador Grados de libertad del denominador A bn¿ i=l Ti a -1 aben -1) aa b 2 B an a ¿ f3~ j=l b-1 aben -1) AB n¿¿ (Tf3)~ i=l j=l b (a -1)(b -1) aben -1) a 2 [(a-1 )(b -1)+ 1] . el valor mínimo de <1>2 que corresponde a una diferencia D entre dos efectos de interacción cualesquiera es nD 2 <1>2 =--. 2 = nbD2 2 (S-18) 2ba Por último. así como los grados de libertad del numerador y el denominador. Para mayores detalles.-----_ (S-19) 2a 2 [(a-1)(b-1)+ 1] <1>2 = naD2 Para ilustrar el uso de estas ecuaciones. Suponiendo que a construir la tabla siguiente: n 2 3 4 <1>2 <1> = 0.95 21..341.2. se deberá ser muy cuidadoso al hacer caso omiso de los términos de interacción. En caso de duda. oo. se concluye que cuatro réplicas bastan para proporcionar la sensitividad deseada siempre y cuando la estimación usada para la desviación estándar de la vida de la batería no tenga un error grave. de rechazar la hipótesis nula si la diferencia en la vida media de la batería con dos niveles de temperatura cualesquiera es hasta de 40 horas. suponiendo que es válido el mose Tabla 5-8 Análisis de varianza de los datos de la vida de la batería suponiendo que no hay interacción Fuente de variación Tipos de material Temperatura Error Total Suma de cuadrados 10. Por lo tanto D = 40. El análisis estadístico de un modelo factorial de dos factores sin interacción es directo.96 Grados de libertad 2 2 31 35 Cuadrado medio 5. el experimentador podría repetir el procedimiento anterior con otros valores de a para determinar el efecto que tendría una estimación equivocada de este parámetro sobre la sensitividad del diseño. En la tabla 5-8 presenta el análisis de los datos de la vida de la batería del ejemplo 5-1.. entonces por la ecuación 5-18 se obtiene <1>2 = naD 2 2ba n(3)(40)2 2 2(3)(25)2 =1. oo.646.559. por ejemplo '. a J -1.86 19.06 2.¡T 190 CAPÍTULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES probabilidad si la diferencia en la vida media de la batería entre dos temperaturas cualesquiera es hasta de 40 horas.52 77.72 39.e no interacción en un modelo de dos factores Ocasionalmente.: 1. ahora puede usarse la parte V del apéndice para v2 = Grados de libertad del error 9 18 27 VI = Grados de libertad del numerador f3 0.844.18 0. Por lo tanto.05.56 3. .36 898. un experimentador siente que es apropiado un modelo de dos factores sin interacción. o una probabilidad aproximada de 94%.96 2. n (5-20) Sin embargo.28n como el valor mínimo de <1>2.6 El supuesto d.118.60 1.21 5. Ysi se supone que la desviación estándar de la vida de la batería es aproximadamente 25.45 0..06." r . b { k = 1.84 5.2.683. ya que la presencia de una interacción significativa puede tener un impacto dramático sobre la interpretación de los datos. 5~3.2.72 27..26 2 2 2 Observe que con n = 4 réplicas se obtiene un riesgo f3 de cerca de 0.78 ...12 1. b (5-21) El análisis de varianza para esta situación se presenta en la tabla 5-9. En la figura 5-15 se presenta la gráfica de Yij. el modelo de los efectos es i.Yijk pasan de positivo a negativo. 2. Cualquier patrón en estas cantidades sugiere la presencia de una interacción. no se cuenta con pruebas para los efectos principales a menos que el efecto de la interacción sea cero. Esta estructura es el resultado de la interacción entre los tipos del material y la temperatura. 2.. Ahora las cantidades Yij. Para el modelo de dos factores sin interacción. suponiendo que ambos factores son fijos. . . { J-1. : 1. es decir. los dos efectos principales son significativos. MSResidUa¡' 30 30 10 • 50 100 (~ I~ I • • • • 150 200 o -10 Yijk -20 -30 • • • Figura 5-15 Gráfica de Yij. de la batería. que el efecto de la interacción de los dos factores (rf3)ij y el error experimental no pueden separarse de alguna manera obvia. . y después de nuevo a positivo y a negativo.3. + yj. Cuando hay dos factores y una sola observación por celda. .2. en los que sólo hay una observación por celda.y..a .b (5-22) Si el modelo (ecuación 5-22) es apropiado. 2. Sin embargo.5-3 DISEÑO FACTORIAL DE DOS FACTORES 191 delo sin interacción (ecuación 5-20). { J -1.Jijk contra Jijk para los datos de la vida . entonces (rf3)ij = Opara toda i y j. es decir.a . los valores ajustados son J¡jk =)li. tan pronto como se efectúa el análisis residual de estos datos.7 Una observación por celda En ocasiones se encuentran experimentos de dos factores con una sola réplica.. . Por consiguiente.. y un modelo plausible es er i. . Si no hay una interacción presente. se pone de manifiesto que el modelo sin interacción es inadecuado. Al examinar los cuadrados medios esperados. se observa que la varianza del error es no estimable. En la figura 5-15 se observa un patrón claro cuando las cantidades Yij. Como ya se señaló. 5. . : 1. entonces el cuadrado medio de los residuales de la tabla 5-9 es y los efectos principales pueden probarse comparando MSA y MSB con un estimador insesgado de er.Yijk pueden considerarse como las diferencias entre las medias de las celdas observadas y las medias de las celdas estimadas suponiendo que no hay interacción.J¡jk (los promedios de las celdas menos el valor ajustado de esa celda) contra el valor ajustado Yijk. Para probar la presencia de una interacción. se tiene (5-23) con un grado de libertad.I!f'" .1 grados de libertad. EJEMPLO 5 2 .B~ b -1 a ab Sustracción (a -l)(b -1) ab-1 MSResidunl (J- ? + L L(!. 1. En la prueba se hace la partición de la suma de cuadrados de los residuales en un componente con un solo grado de libertad debido a lana aditividad (interacción) yun componente del error con (a -l)(b -1) -1 grados de libertad.l)(b -1) .. Al definir así el término de la interacción. ('ífJ)ij = Y'í i fJ j donde y es una constante desconocida.B)~ (a-1)(b-1) LL Yi~-Y~ i~l j~l ab b ? Una prueba desarrollada por Tukey [111a] es útil para determinar si está presente una interacción. a saber. En el procedimiento se supone que el término de la interacción tiene una forma particularmente simple. la presión y la temperatura. En lo que a los cálculos se refiere. 192 CAPÍTULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES Tabla 5-9 Análisis de varianza de un modelo de dos factores. Las impurezas presentes en un producto químico son afectadas por dos factores. puede usarse un enfoque de regresión para probar la significación del término de la interacción. y SS Error = SSResidunl-SSN (5-24) con (a . (u _ 1)(b _ 1) _ b debe rechazarse la hipótesis de que no hay ninguna interacción. Las sumas de cuadrados son . En la tabla 5-10 se muestran los datos de una sola réplica de un experimento factorial. una observación por celda Fuente de variación Renglones (A) Columnas (B) Residual o AB Total a Suma de cuadrados a Grados de libertad ? Cuadrado medio MSA MSB Cuadrado medio esperado (J2+-_' L i=l b Yi~ ? _r ab b ? a-1 b-1 bL!2 a-1 L j~l Y. se calcula F o = SSN SS Error /[(a-1)(b-1)-1] (5-25) Si F o > Fa.j _r ? (J2+ _ _ 1 aL. 60 3 (3)(5) SST = L Ly~-L. El estadístico de prueba para la no aditividad es Fa = 0..07)]2 (3)(5)(23. SS Error = SSResidual - SS N = 2.33)(11.J J=1 1 "y b _ L.96..5-3 DISEÑO FACTORIAL DE DOS FACTORES 193 Tabla 5-10 Datos de las impurezas del ejemplo 5-2 'Thmperatura ("F) Presión 25 5 3 1 9 30 4 1 1 6 35 6 100 125 150 y'j 4 3 13 40 3 2 1 6 45 5 3 2 10 YL 23 13 8 44 = 1..36. +(2)(8)(10)= 7236 i=1 j=1 a b SS N - -=--------------~--=-- [~~ y.60+129.23. se hace notar que el modelo factorial de dos factores con una observación por celda (ecuación 5-22) luce exactamente igual que el modelo de bloques completos aleatorizados .0985 4059.0985= 1.42 y la suma de cuadrados del error es. +..00]2 = 0..2716 = 0.:o. Los efectos principales de la temperatura y la presión son significativos.60 = 2.33+ 11..0..j = (5)(23)(9)+(4)(23)(6)+..9015 El análisis de varianza completo se resume en la tabla 5-11...Y. ab 2 ".J.33-11.(44)(23.07 = 36.0985/0.Y. ~[92 +6 2 +13 2 +6 2 +102]_~= 11.Yn(SSA +SS.. Para concluir esta sección. de donde se concluye que no hay evidencia de interacción en estos datos..93 y SSResidual = SST - SS A ..SSB = 36.00. 2 SS = B a L.00 La suma de cuadrados de la no aditividad se calcula con la ecuación 5-23 de la siguiente manera: LL YijY¡. por la ecuación 5-24._---''---'-'- [7236.:)J abSSASSB _'_=__ =.60) = [20. i=1 j=1 a b 2 ab = 166-129. todas las ab corridas se hacen de manera aleatoria.. considere el modelo del análisis de varianza de tres factores: Yijkl = ¡. De nueva cuenta. es muy diferente. 2. Cuando todos los factores del experimento son fijos. los estadísticos de prueba para cada efecto principal e interacción pueden construirse dividiendo el cuadrado medio correspondiente del efecto o interacción por el cuadrado medio del error.2.2716 Fo 42.0001 0. mientras que en el modelo de bloques aleatorizados la aleatorización sólo ocurre dentro del bloque..33 Presión 11.36 Valor P 0. . Todas estas pruebas F serán de una cola superior. Los bloques constituyen una restricción sobre la aleatorización. observe que es necesario un mínimo de dos réplicas (n ~ 2) para determinar una suma de cuadrados debida al error si todas las interacciones posibles están incluidas en el modelo. la manera en que se corren los experimentos.. oo.93 (ecuación 4-1).. la tabla del análisis de varianza se presenta en la tabla 5-12. es sencillo formular y probar hipótesis acerca de los efectos principales y las interacciones. dispuestos en un experimento factorial.90 0.9015 36. De hecho.1.. Sin embargo.60 No aditividad 0.67 2. oo. así como la interpretación de los dos modelos. El número de grados de libertad de cualquier efecto principal es el número de niveles del factor menos uno.0985 Grados de libertad 2 4 1 7 14 Cuadrado medio 11.t +r: i + f3 j ( f3 ) +y k +( r:f3)ij +( r:y)ik + (f3y) jk i. habrá abe . e ] . En general. n observaciones totales si se hacen n réplicas del experimento completo.194 CAPÍTULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES Tabla 5-11 Análisis de varianza del ejemplo 5·2 Suma de Fuente de variación cuadrados Temperatura 23. y el número de grados de libertad de una interacción es el producto del número de grados de libertad asociados con los componentes individuales de la interacción. b l= 1. 5. oo. etc. e niveles del factor e. B y e son fijos. 2. Las pruebas F para los efectos principales y las interacciones se siguen directamente de los cuadrados medios esperados..2. Por lo tanto. :: 1. a + r: y ijk +Sijkl {k = 1.97 10. n (5-26) Suponiendo queA.0042 0. .68 0..5674 Error Total 1. b niveles del factor B. oo. la prueba de Tukey con un solo grado de libertad para la no aditividad puede aplicarse directamente para probar la presencia de una interacción en el modelo de bloques aleatorizados.0985 0. Para un modelo con efectos fijos. En el modelo factorial. Por ejemplo.4 DISEÑO FACTORIAL GENERAL Los resultados del diseño factorial de dos factores pueden ampliarse al caso general en que haya niveles del factor A. es necesario recordar que las situaciones experimentales que llevan al modelo de bloques aleatorizados y al modelo factorial son muy diferentes. MS E MS R = -BC o MSE R .MS E R _ MSAC 0 .-AB 0 .Tabla 5-12 La tabla del análisis de varianza del modelo de tres factores con efectos fijos Fuente de variación Suma de cuadrados Grados de libertad Cuadrado medio Cuadrado medio esperado Fo R _MSA 0 .MS E AB AC BC ABC Error Total SSAB (a -l)(b -1) MSAB a 2+ en a 2+ bn 2:2: (Tf3)~ (a-1)(b -1) SSAC (a -l)(e -1) MSAC 2:2: (ry)~ (a-1)(e-1) SSBC (b-1)(e-1) MSBC a+ a 2+ n 2 an (f3y )~k (b -l)(e -1) 2:2: SSABC SSE SST (a -l)(b -l)(e -1) abe(n -1) aben -1 MS ABC MSE 2:2:2: (Tf3Y)~k a7 (a-1)(b -l)(e -1) 1-' \O U1 .MSABC 0 .MS E A B C SSA a-1 MSA MSB MSc a+ 7 ben Ti a-1 aen f3~ b-1 abn y~ e-1 2: SSB b-'-l a-+ a-+ 7 2: Fa = MSB MS E SSc e-1 2: MSc R=-o MSE MS R . ~. -~-SS b A -SSB en 1=1 j=l a en = SSSubtotaleS(AB) -SSA -SSB SS (5-31) SSC AC = -b 2:2: n i=l k=l 1 a e 2 yZk.SS A .A x Cy B x C.~.SSc 1 b 2 (5-32) y SSBC =- 2:2: l· an j=l k=l e -~-SS -SSc .2:2:2: a b e 1 2 n i=l j=l k=l Yijk... .SSc aben y. los cálculos del análisis de varianza se efectuarían utilizando un paquete de software de estadística.LJ "" LJ l g. B(y JJ Y C(Y.J. (5-27) Las sumas de cuadrados de los efectos principales se encuentran a partir de los totales de los factores A(yiJ.k) de la siguiente manera: 1 a 2 2 (5-28) SS Aben LJ yi.SSBC (5-34a) (5-34b) = SSSubtotaleS(ABC) -SSA -SSB -SSc -SSAB -SSAC -SSBC La suma de cuadrados del error puede encontrarse restando la suma de cuadrados de cada efecto principal e interacción de la suma de cuadrados total o con SSE = SST -SSSubtotaleS(ABC) (5-35) . -~ aben =-" 1=1 ss = _1_ ~ B J=l aen LJ y2 _ y..~. se necesitan los totales de las celdasA x B.. SS AB - SS AC .196 CAPÍTULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES En general. Con frecuenciaes útil desplegar la tabla de los datos originales en tres tablas de dos vías para calcular estas cantidades.. Sin embargo. Las sumas de cuadrados se encuentran con 1 a b 2 SS AB = . en ocasiones resultan útiles las fórmulas para calcular manualmente las sumas de cuadrados de la tabla 5-12.. aben B SS = SSSubtotaleS(BC) - B .. . C abn LJ . La suma de cuadrados de la interacción de los tres factores se calcula a partir de los totales de las celdas (yijd de tres vías como SS ABC =. aben (5-29) SS =_1 ~ y2 _ y..~. .SSB .Jk..SS A . La suma de cuadrados total se encuentra de la manera acostumbrada como SST = 2:2:2:2: Yijkl--b a en i=l j=l k=l 1=1 a b e n 2 y.Y···· .SSc (5-33) Observe que las sumas de cuadrados de los subtotales de dos factores se encuentran a partir de los totales de cada tabla de dos vías. aben k=l (5-30) Para calcular las sumas de cuadrados de las interacciones de dos factores.SS A aben = SSSubtotales(AC) . k. / fí6\ ~ 1 1 6 5 10 11 (3) @ @ 34 -4 20 59 75 = Y.= 336.. mientras que las desviaciones negativas son alturas de llenado abajo del objetivo.(75)2. y a la embotelladora le gustaría entender mejor las fuentes de esta variabilidad y. La variable de respuesta observada es la desviación promedio de la altura del llenado objetivo que se observa en una corrida de producción de botellas con cada conjunto de condiciones. 54 TotalesA x C Yi. pero en la práctica. Las desviaciones positivas son alturas de llenado arriba del objetivo. Yijki - aben = 571. Sin embargo. la presión de operación en el llenador (B) y las botellas producidas por minuto o rapidez de línea (e).. para los fines de un experimento.. En la tabla 5-13 se muestran los datos que resultaron de este experimento. Y. El ingeniero del proceso puede controlar tres variables durante el proceso de llenado: el porcentaje de carbonatación (A).5-4 DISEÑO FACTORIAL GENERAL 197 EJEMPLO 5. 12 Y14 por ciento. C B A 10 12 14 25 -5 4 22 30 1 16 37 A 200 -5 6 25 250 1 14 34 1 1 10 12 14 I 1\ .' La suma de cuadrados total corregida que se encuentra con la ecuación 5-27 es SST = ~~~~ a b e n 2 y'~.v -1 C[\ 12 14 Totales B x C Y. Elige dos niveles para la presión (25 y 30 psi) Ydos niveles para la rapidez de línea (200 y 250 bpm). ~ CD ® 21 i ~ 15 ® @ O 2 3 7 9 20 c.jk. Es sencillo controlar la presión y la rapidez. Los números encerrados en círculos de la tabla 5-13 son los totales de las celdas de tres vías Yijk... reducirla. ¡ 6 TbtalesA x B Yij.j.. existe variación en torno a este objetivo. el ingeniero puede controlar la carbonatación en tres niveles: 10. El ingeniero decide correr dos réplicas de un diseño factorial con estos tres factores.v '5' \:!.3 ó •••••••••••••••••••••••••••••••••••••••••••••••••••••• El problema del embotellado de un refresco Una empresa embotelladora de refrescos está interesada en obtener alturas de llenado más uniformes en las botellas que se fabrican en su proceso de manufactura.. pero el porcentaje de carbonatación es más difícil de controlar durante la manufactura real debido a que varía con la temperatura. haciendo las 24 corridas de manera aleatoria.625 24 Tabla 5-13 Datos de la desviación de la altura de llenado del ejemplo 5-3 Presión de operación (B) 25 psi Porcentaje de carbonatación (A) 10 30 psi Rapidez de línea (C) 200 250 Rapidez de línea (C) 200 250 -3 -1 Gj:\ '0 -1 O C[\ c. en última instancia.k. la máquina de llenado llena cada botella a la altura objetivo correcta. Teóricamente.. = _ V y 2 -~ abn L.45.375 4 ..J . aben A 2 B = -[(_5)2 +(1)2 +(4)2 +(16)2 +(22)2 +(37)2 ] .j.{ = 252.250 Para la carbonatación-rapidez o interacciónAC se usan los totales de las celdasA x C {YUe} que se muestran en la tabla 5-13 y la ecuación 5-32: SS AC = -b L L Y~k. aben k=1 1 e 2 = 12 [(26)2 +(49)2 ]_ (7. Por ejemplo.) que se muestran en la tabla 5-13.042 1 Para calcular las sumas de cuadrados de las interacciones de dos factores.. k.{ y SS Rapidez 1 = 45.375.22..(7.(7.{ = 1. Yi. 5-29 Y5-30 son SS Carbonatación =-~ 2_~ ben -f::.{ = 0. -~-SSB -SSC an j=1 k=1 1 b e 2 aben =i[(6)2 +(15)2 +(20)2 +(34)2]. aben ]=1 = 12 [(21)2 +(54)2].252.750..22.375 .. se necesitan los totales de las celdas A x B {Yij.750 SS Presión 1 b 2 =_~ 2_~ aen LJ y. n i=1 k=l 1 a e 2 yb···· . para encontrar la carbonatación-presión o interacciónAB.198 CAPÍTULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES y las sumas de cuadrados de los efectos principales que se calculan con las ecuaciones 5-28. aben 1 a 2 = ~[(_4)2 +(20)2 +(59)2]. se deben encontrar los totales de las celdas de dos vías.(7.042 45.042 = ¡[(_5)2 +(1)2 +(6)2 +(14)2 +(25)2 +(34)2].~~ en ~LJ ¡=1 ]=1 1 a b Y~ -~-SS -SS y.042 ..583 La presión-rapidez o interacción BC se encuentra con los totales de las celdas B x C {y Jk} que se muestran en la tabla 5-13 y la ecuación 5-33: SSBC = ~ LL Y. Utilizando la ecuación 5-31.(7..SSA a en - SS C 252.{ = 22. se encuentra que las sumas de cuadrados son SS AB = . ~ 1 (75)2 = 5.750..~k. 042 2. Por la ecuación 5-34a se encuentra 1 a b e 2 Y. en la figura 5-16 se grafican los tres efectos principales y la interacciónAB (carbonatación-presión).=1 j=l k=l 1 a b e 2 2 y.412 64:059 31.0558 0.706 0.4867 . la presión de operación y la rapidez de línea afectan significativamente el volumen de llenado.471 0. 328125 Y¡ik . LLL .042 = 1.500 En la tabla 5-14 se resume el análisis de varianza.375 45. El siguiente paso deberá ser un análisis de los residuales de este experimento.}.+(-1).625 Grados de libertad 2 1 1 2 2 1 2 12 23 Cuadrado medio 126.? ? ? 2 24 . La interacción entre la cabonatación y la presión es bastante pequeña.5-4 DISEÑO FACTORIAL GENERAL 199 . ..375 22.·'1 I Fuente de variación Porcentaje de carbonatación (A) Presión de operación (B) Rapidez de línea (C) AB AC BC ABC Error Total Suma de cuadrados 252. Las representaciones de los efectos principales son sólo gráficas de los promedios de las respuestas marginales para los niveles de los tres factores.0001 <0.042.125 = 8. el ingeniero decide recomendar el nivel bajo de la presión de operación (25 psi) y el nivel alto de la rapidez de línea (250 bpm.~.042 5. ----SSA -SSB -SSC -SSAB -SSAC -SSBC n .Á. La suma de cuadrados de la interacción de los tres factores se encuentra con los totales de las celdas B X e {Yijk.708 Fa 178.0558.625. Se observa que el porcentaje de carbonatación.042 0.118 3.042 1. En la figura 5-17 se grafica la desviación Tabla 5-14 Análisis de varianza del ejemplo 5-3 . al observar que SSsublotaleS(ABC) =-.0.375. como lo indica la forma similar de las dos curvas de la figura 5-16d.083 por último.083 8.583 1.292 1. Puesto que la empresa quiere que la desviación promedio del llenado objetivo esté cerca de cero. que maximizará la rapidez de producción). es decir.6713 0.375 22. los cuales están encerrados en un círculo en la tabla 5-13. Se deja como ejercicio para el lector.765 Valor P <0. Observe que las tres variables tienen efectos principales positivos..+···+(16). SSABC = Yijk.252.500 336.250 0.328. Como ayuda para la interpretación práctica de este experimento..542 0..750 45.0001 0.583-1. --b-= a en se tiene SSE = SST .0001 0.750.2485 0.625 0. lo cual indica cierta interacción entre estos factores.+(21) ] .SS Subtotales(ABC) = 336.5.45. pero se señala que la gráfica de probabilidad normal de los residuales y los demás diagnósticos usuales no indican ningún motivo de preocupación importante.=1 j=l k=l aben X LLL ? 2 (75) 2 1 = -[(-4)+(-1).250.412 1.22. el incremento de la variable mueve hacia arriba la desviación promedio dell1enado objetivo. El cociente F de la interacción carbonatación-presión tiene un valor P de 0. . el nivel de la carbonatación no puede actualmente controlarse perfectamente en el proceso de manufactura. y la distribución normal indicada con la línea continua de la figura 5-17 es una aproximación de la variabilidad de los niveles de carbonatación que se -o co o 8 6 =co "0-oE :::loa " 1:: ~I:: ~'Cii .> -oco o"" 0co JEa ~lii E-o 0 0 ~o.~ 1::1:: co" Distribución mejorada del porcentaje de carbonatación 4 2 O :Q o co o. lI) o " -2 10 12 14 A -2 B Porcentaje de carbonatación (Al al 10 o -o co 1:: 8 6 6 -o o 'O 4 E ª Qi " ~ 00 o.. o. O o " -2 lI) / 200 250 C Rapidez de linea (Cl 4 2 O -2 10 12 14 A el Interacción carbonatación-presión dI Figura 5-16 Gráficas de los efectos principales y la interacción del ejemplo 5-30 a) Porcentaje de carbonatación (A). 2 1:: o¡¡ co o. b) presión (B).. d) interacción carbonatación-presióno promedio observada de la altura de llenado objetivo con los tres diferentes niveles de carbonatación para este conjunto de condiciones de operación. e) rapidez de línea (e).200 o -o co Qi CAPÍTULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES 8 6 8 6 1:: ª " ~ 1:: -o o 'O E o. 4 2 4 2 O -o o¡¡ / 25 Presión (B) bl co O o. Ahora. uu lI) o " -2 10 12 14 Porcentaje de carbonatación (Al Figura 5·17 Desviación promedio de la altura de llenado con rapidez alta y presión baja para diferentes niveles de carbonatacióno .. ... la fluctuación de las alturas de llenado será considerable.. hay tres niveles de la temperatura. Se utilizará un paquete de software de computadora para generar los modelos de regresión.. La reducción de la desviación estándar de la distribución del nivel de carbonatación se consiguió finalmente mejorando el control de la temperatura durante la manufactura. . referirse al capítulo 10 y al material suplementario del texto de este capítulo. . es decir. la construcción del estadístico de prueba no siempre se hace de esta manera...... puede calcularse un efecto de la temperatura lineal y uno cuadrático para estudiar la forma en que la temperatura afecta la vida de la batería... Los componentes "A" Y"A 2" representan los efectos lineal y cuadrático de la temperatura. donde se supone que la temperatura es cuantitativa y el tipo de material es cualitativo.. En general. Para mayor información acerca del análisis de regresión.. . Esta ecuación podría utilizarse para hacer interpolaciones... Este procedimiento se ilustra en la sección 3-5.. se usan métodos de regresión lineal para ajustar estos modelos a los datos experimentales.. la construcción del estadístico de prueba es directa.... Es necesario examinar los cuadrados medios esperados para determinar las pruebas correctas. Recuerde que el tipo de material es un factor cualitativo con tres niveles.. . El estadístico para probar cualquier efecto principal o interacción se forma siempre dividiendo el cuadrado medio del efecto principal o la interacción por el cuadrado medio del error.. El factor temperatura es cuantitativo y el tipo de material es cualitativo. En la tabla 5-15 se presenta la salida condensada de Design-Expert para este experimento.. para predecir la respuesta en niveles intermedios entre los factores. pero en este .. Cuando al menos dos de los factores son cuantitativos. puede ajustarse una superficie de respuesta para predecir y con varias combinaciones de los factores del diseño..1 para un experimento con un solo factor..5-5 AJUSTE DE CURVAS YSUPERFICIES DE RESPUESTA 201 registran actualmente. y "B" representa el efecto principal del factor tipo de material..... Sin embargo.. ....... .. .. Los términos "AB" y "A2B" son las interacciones delfactor temperatura lineal y cuadrático con el tipo de material... respecto de los que se utilizaron realmente en el experimento.. Además. ... si el experimento factorial incluye uno o más factores aleatorios. Los valores P indican queA 2 y AB no son significativos..... Como el proceso es impactado por los valores del nivel de carbonatación sacado de esta distribución. Esta variabilidad de las alturas de llenado podría reducirse si la distribución de los valores del nivel de carbonatación siguieran la distribución normal indicada con la línea punteada de la figura 5-17.. El análisis de varianza de la tabla 5-15 indica que la fuente de variabilidad "modelo" se ha subdividido en varios componentes. . 5~5 AJUSTE DE CURVAS y SUPERFICIES DE RESPUESTA Se ha visto que puede resultar útil ajustar una curva de respuesta a los niveles de un factor cuantitativo para que el experimentador cuente con una ecuación que relacione la respuesta con el factor... Se señaló ya que si todos los factores de un experimento factorial son fijos... EJEMPLO 5~4 . Por consiguiente... mientras que el términoA 2B es significativo. ... La revisión completa de los experimentos con factores aleatorios se pospone hasta el capítulo 12..... Con frecuencia se piensa en eliminar los términos o factores no significativos del modelo.. A continuación se presentan dos ejemplos que incluyen experimentos factoriales. Considere el experimento que se describe en el ejemplo 5-1. 5826 8. Dev.98 105.60 -21.22 Na Residual Lack of Fit Pure Error Aa A2 a 39042.6956 0.61 10.97 -29.03 39042.75 0.76240 +0.96 *NB[1] -14.06 11.96 -14.93 15.22 Coefticient Estimate 35 0.62 12.17 *B[2] -3.1991 0.58 -40.33 -50.012851 *Temp 2 Material Type 2 Life = +159.08 1.21 R-Squared Adj R-Squared Pred R-Squared Adeq Precision 1.72 76.62 VIF DF Standard Error Intercept A-Temp B[1] B[2] N AB[1] AB[2] NB[1] NB[2] 107.33 *A -50.18 15.45 -28.178 95%CI Low 92.000 18230.00 1.77 17.41627 *Temp 2 Material Type 3 Life = +132.38017 -2.V.17 -3.00 57.61 9.62397 -0.30 -40.70 95%CI High 122.19 -51.97 25.04 1 1 1 1 1 1 1 1 1 7.10 -9.91 0.40 Cor Total Std.89264 *Temp -0.7398 0.33 *B[1] +12.69 18230.99 1.08 7298.0001 <0.68 -28.86 76.50 7.99 12.58 -40. Mean C.60 68.82 7.33 12.62 32410.71 *AB[1] -12.P" " Tabla 5-15 Salida de Design-Expert para el ejemplo 5-4 Response: Life in hr ANOVA for Response Surface Reduced Cubic Model Analysis of variance table [Partial sum of squares] Sum of Mean F Squares DF Square Source Value Prob> F Model A 59416.50 12.35 675.06 2315.67 10683.10 2.00 Final Equation in Terms of Coded Factors: Life = +107.54 3649.48860 *Temp +0. PRESS Term 77646.53 24.0001 0.71 -12.21 675.0106 significant 1157.19 7.57 33.08 *N +1.7652 0.71 5.0020 0.22 -72.04 *NB[2] Final Equation in Terms of Actual Factors: Material Type 1 Life = +169.11 <0.79 41.79 *AB[2] +41.50 5.67 5341.93 -13.17901 *Temp +0.43218 *Temp 2 .30 10.75 8 1 2 1 2 2 27 O 27 7427. y muchos constructores de modelos estadísticos siguen rigurosamente este principio. 125°F).----- Tipo de material 123 1 O O 1 -1 -1 B[l] B[2] Hay también ecuaciones para la predicción de la vida de la batería en términos de los niveles de los factores reales.00 Temperatura • • 97. 0.50 125. Sin embargo.70. los niveles de la temperatura sanA = -1. respectivamente. Las variables B[l] YB[2] son variables iudicadoras codificadas que se definen de la siguiente manera: ---------. deberá contener también todos los términos de orden inferior que lo componen (A 2 y AB en este caso). El priucipio de jerarquía establece que si un modelo contiene un término de orden superior (tal comoA 2B). En la figura 5-18 se muestran 188 • • • 146 ~ 104 62 20 15. ver el material suplementario del texto de este capítulo. la jerarquía no es siempre una buena idea. La salida de computadora incluye también estimaciones de los coeficientes del modelo y una ecuación para la predicción final de la vida de la batería en términos de factores codificados. .5-5 AJUSTE DE CURVAS Y SUPERFICIES DE RESPUESTA 203 caso eliminar A 2 YAB Yconservar A 2B resultará en un modelo que no es jerárquico. cuando la temperatura está en los niveles bajo. hay una ecuación para la vida predicha como una función de la temperatura para cada tipo de material. intermedio y alto (15.00 42. + 1. La jerarquía promueve un tipo de consistencia interna en un modelo. En esta ecuación.50 70. ejemplo 5-4. y muchos modelos en realidad funcionan mejor como ecuaciones de predicción que no incluyen los términos no significativos que propone la jerarquía.00 Figura 5-18 La vida predicha como una función de la temperatura para los tres tipos de material. Observe que como el tipo de material es un factor cualitativo. Para mayor información. En la tabla 5-16 se muestran los datos codificados. OY+ 1 de A y B para representar los niveles bajo. y By B 2 son los efectos lineal y cuadrático de la velocidad. De manera similar. el cual se estudiará en detalle en el capítulo 11. El examen de esta superficie de respuesta indica que la vida máxima de la herramienta se consigue con velocidades de corte de alrededor de 150 rpm y ángulos de la herramienta de 25°.. Si varios de los factores de un experimento factorial son cuantitativos. Compárense con la gráfica de la interacción de dos factores para este experimento de la figura 5-9. puede usarse una superficie de respuesta para modelar la relación entre y y los factores del diseño. respectivamente. pero ofrece una perspectiva diferente. La exploración de las superficies de respuesta es un aspecto muy importante del diseño experimental. EJEMPLO 5~5 ..A 2B. En la ecuación de predicción expresada en factores codificados se utilizan los niveles -1. es posible hacer la partición de las interacciones de factores cuantitativos en componentes de interacción con un solo grado de libertad. de la superficie de respuesta de la vida de la herramienta. intermedio y alto. y se lleva a cabo un experimento factorial con dos réplicas. @ (1) @ -3 O 1 @ G) 2 3 4 6 O -1 14 0) @ -1 16 9 3 5 6 12 @ @ 24 = Y. Los números de las celdas encerrados en círculos son los totales de las celdas {yij)' En la tabla 5-17 se presenta la salida condensada de Design-Expen para este ejemplo. de estos factores.. Los términos A y A 2 son los efectos lineal y cuadrático del ángulo de la herramienta. Los términosAB. Velocidad de corte (pulg/min) 125 -2 -1 O 2 -1 O -2 150 175 Yi.j.AB 2 y A 2B 2 representan los componentes lineal x lineal. Aun cuando hay algunos valores P grandes. Se piensa que la vida efectiva de una herramienta de corte instalada en una máquina controlada numéricamente se afecta por la velocidad de corte y el ángulo de la herramienta. En la figura 5-19 se presenta la gráfica de contorno de la superficie generada por la ecuación de predicción de la vida de la herramienta. Se seleccionan tres velocidades y tres ángulos. Tabla 5-16 Datos del experimento de la vida de la herramienta de corte Ángulo de la herramienta (grados) 15 20 25 Y. . Además. La gráfica de la superficie de respuesta tridimensional de la figura 5-20 proporciona en esencia la misma información.ffr""! 204 CAPÍTULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES las curvas de respuesta generadas por estas tres ecuaciones de predicción. Esto se ilustra en el ejemplo siguiente. lineal x cuadrático y cuadrático x cuadrático de la interacción de dos factores. se han conservado todos los términos del modelo para respetar la jerarquía. cuadrático x lineal. los efectos de los factores cuantitativos pueden representarse con efectos polinomiales con un solo grado de libertad. y en ocasiones más útil. 00 0.67 42.00 -1.66 -5.000 13.00 3.34 -0.V.92000E-004 *Tool Angle 2 *Speed2 .86 3.00 -3.8020 0.92 11.14 52.35 -1.00 *8 +0.0013 0.67 8.33 8. -0.00 3.000 *N +1.00 49.00 3.056000 *Tool Angle 2 *Speed +6.14 0.0000 0.60 1.35 -0.000 1.00 0.54 1.35 3.00 5.00 1 1 1 1 1 1 1 1 1 0.92 5.000 1.00 16.0003 0.00 +3.00 0.40000E-003 *Tool Angle *Speed2 -1.30000 *Tool Angle +14.50 *A +2.s-s Tabla 5-17 Salida de Design-Expert para el ejemplo S-S AJUSTE DE CURVAS Y SUPERFICIES DE RESPUESTA 205 Response: Life in Hours ANOVA for Response Surface Reduced Order 4 Model Analysis of variance table [Partial sum of squares] Sum of Mean F DF Square Value Squares Source Prob> F Model A A2 B2 AB B NB Residual AB2 A 2 B2 Lack of Fit Pure Error CorTotal Std.44 1.50 2.000 0.00 0.44 9.0431 significant R-Squared Adj R-Squared Pred R-Squared Adeq Precision DF Standard Error 0.00 *A2 *8 2 Final Equation in Terms of Actual Factors: Life = -1068.049600 *Speed 2 -1.67 8.00 *A *82 -3.00 -4.00 *8 2 -1.00 2.42 0.87 49.66 -2.00 *A *8 -1.74 1.00 Final Equation in Terms of Coded Factors: Life = +2.039 0.00 13.00 16.86400 *Tool Angle *Speed +0.00 1.8952 0.27 0.33 8.88 3.36 2.04 0.00r:! 1.00 -1.54 5.00 1.85 29.12 3.00000 +136.0431 0.67 42.08 0.078 2.00 Coefficient Estimate 8 1 1 1 1 1 1 1 1 9 O 9 17 13.66 -5. Mean C.54 0.08000 *Tool Angle2 .0088 1.237 95%CI Low 95%CI High VIF Intercept A-Too 1 Angle B-Speed A2 B2 AB NB A8 2 NB 2 2.00 3.85 0.64 -2.96 -2.00 2.92 4.00 *N *8 -4.5806 8.2073 0.04 1.35 -1. PRESS Factor 111.00 124.61 33. Dev.00 3.74 0.60 0.48000 *Speed -4.3618 0.33 90.00 3.00 1.20 1.0004 0. 2 175.~"__ ~t- .. ..50 1:l 1:l 'C:.50 ~ 17.f ..00 • 2 2 ...00 Figura 5·20 Superficie de respuesta tridimensional de la vida de la herramienta del ejemplo 5-5.5 :> 1:l ro Velocidad Ángulo de la herramienta 125..:==:....00 2 15.... .. 206 . .L__"""'" 22.. ._-L --l.50 125..... 5..00 Ángulo de la herramienta Figura 5·19 Gráfica de contorno bidimensional de la superficie de respuesta de la vida de la herramienta del ejemplo 5-5.-__--'<.50 20...00 . 162..------.--.00 15. ro > o ID 137.::--------.. donde 7:¡. 9 Y 13. a o (5-37) Yijk = p. .+7:¡ +f3 j +(7:f3)ij +cijk j= 1. Un ingeniero estudia los métodos para mejorar la capacidad para detectar objetivos en el campo de acción de un radar. y se corre una sola réplica de un experimento factorial completo dentro de cada bloque. De hecho. respectivamente. Por consiguiente. .2. Esta materia prima está disponible en lotes cuyo tamaño no es suficiente para permitir que se corran todas las abll combinaciones de los tratamientos con el mismo lote. si el experimento factorial completo no pudo correrse en un día.6 . Suponga ahora que para realizar este experimento se necesita una materia prima particular. . los operadores. Desde luego. como el tiempo. 2. Los conceptos básicos de la formación de bloques se analizaron en el capítulo 4 en el contexto de un experimento con un solo factor. . no pueden separarse del componente del error. los lotes de materia prima representan una restricción sobre la aleatorización o un bloque. Sin embargo. Considere un experimento factorial con dos factores (A y B) Y11 réplicas. . El modelo estadístico lineal de este diseño es i = 1. En ocasiones no es factible o práctico hacer la aleatorización completa de todas las corridas de un diseño factorial. . la suma de cuadrados de los bloques se encuentra como la suma de cuadrados entre los totales de los n bloques {Yook}' En el ejemplo anterior. la presencia de un factor perturbador puede hacer necesario que el experimento se corra en bloques. Por consiguiente. a (5-36) Yijk = p. si un lote contiene material suficiente para hacer ab observaciones. entonces el experimentador podría correr una réplica completa el día 1. cada día sería un bloque. entonces un diseño alternativo es correr cada una de las 11 réplicas utilizando un lote separado de materia prima. EJEMPLO 5. una diversidad de fenómenos pueden producir restricciones sobre la aleatorización. b { k= 1. B y la interacciónAB. dentro de un bloque el orden en que se corren las combinaciones de los tratamientos está completamente aleatorizado. el término del error en este modelo se compone en realidad de las interacciones (7:0)¡k' (f30)jk y (7:f30)ijk' En la tabla 5-18 se describe el análisis de varianza. en el campo de acción del radar y el tipo de filtro colocado sobre la pantalla. .2. La disposición tiene un gran parecido con la de un diseño factorial. Por ejemplo.11 o •• . En la práctica.6 FORMACIÓN DE BLOQUES EN UN DISEÑO FACTORIAL Se han revisado los diseños factoriales en el contexto de un experimento completamente aleatorizado.2. o "desorden de terreno". Dos factores que el ingeniero considera importantes son la cantidad de ruido de fondo. una segunda réplica el día 2. En el modelo (ecuación 5-37) se supone que la interacción entre los bloques y los tratamientos es insignificante. etc.+7:¡ +f3j +(7:f3)ij +Ok +cijk J -1. etc. Si estas interacciones existen. 2.11 donde Ok es el efecto del bloque k-ésimo. El modelo de los efectos para este nuevo diseño es i : 1. 2. con la suma de cuadrados del error reducida por la suma de cuadrados de los bloques. En lo que a los cálculos se refiere. Por ejemplo. Ahora se indica la forma en que la formación de bloques puede incorporarse en un diseño factorial. b { k=1. 8. Se . Anteriormente se estableció el mismo supuesto en el análisis de diseños de bloques aleatorizados. Otros aspectos de la formación de bloques en diseños factoriales se presentan en los capítulos 7. la aleatorización se restringió al interior de un lote de materia prima.5-6 FORMACIÓN DE BLOQUES EN UN DISEÑO FACTORIAL 207 5. f3j Y (7:f3)ij representan los efectos de los factores A. Las sumas de cuadrados del desorden de terreno. f3j representa el efecto del tipo de filtro.L2 L. Ok es el efecto del bloque y C¡jk es el componente NID(O. se tiene una corrida de un experimento factorial 3 X 2 en un bloque completo aleatorizado.j.J . La suma de Tabla 5-19 Nivel de intensidad al detectarse el objetivo Operadores (bloques) Tipo de filtro Desorden de terreno Bajo Intermedio Alto 90 102 114 86 87 93 96 106 112 84 90 91 100 105 108 92 97 95 92 96 98 1 1 2 1 2 2 1 3 2 1 4 2 81 80 83 .2. """ L. Se seleccionan cuatro operadores al azar. Por lo tanto.J L. 2. Debido a la disponibilidad de los operadores. Entonces se mide el nivel de intensidad en el momento de la detección como la variable de respuesta. del tipo de filtro y de su interacción se calculan de la manera usual. Estos factores se considerarán fijos.J . abn 2 a-1 b-1 MSA MSE MSB MSE MSAB MSE _ " y2_~ . Una vez que se ha elegido a un operador.208 CAPÍTULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES Tabla 5-18 Análisis de varianza de un diseño factorial de dos factores en bloques completos aleatorizados Fuente de Suma de Grados de Cuadrado variación cuadrados libertad medio esperado 1 2 _ " y 2 -~ (/+aba~ n-1 Bloques ab L..4 donde r:¡ representa el efecto del desorden de terreno. el orden en que se corren las seis combinaciones de los tratamientos se determina aleatoriamente. Además. abn-1 diseña un experimento utilizando tres niveles del desorden de terreno y dos tipos de filtro.J } y~ -~-SS -SSB 'J.J abn AB 1 "" n L. parece lógico usar los operadores como bloques. Los datos se presentan en la tabla 5-19. L. abn A Sustracción 2 (a -l)(b -1) (ab -l)(n -1) Error Total . El experimento se lleva a cabo seleccionando al azar una combinación de los tratamientos (nivel del desorden de terreno y tipo de filtro) e introduciendo después una señal que representa el objetivo en el campo de acción del radar. cr) del error. (r:f3)ij es la interacción.J } k 2 Yijk - abn y~.J L. 2 k=1. El modelo lineal para este experimento es Yijk = fl+r:¡ +f3j +(r:f3)ij +Ok +cijk ¡ f i = 1. los operadores difieren en su habilidad y capacidad para operar el sistema. k abn k A B _ " y2_~ 1 2 bn. ) 1 an L. La intensidad de este objetivo se incrementa hasta que el operador lo observa. 3 j= 1.3. es conveniente seleccionar un operador y mantenerlo en el sistema hasta que se han realizado todas las corridas necesarias. Por consiguiente. .13 96. los días se convierten en una segunda restricción sobre la aleatorización. si p = ab . en este diseño cada operador se usaría una sola vez en cada día.0003 <0.09 Fa 15.17 En la tabla 5-20 se resume el análisis de varianza completo de este experimento.48 Valor P 0. Por ejemplo. mientras que su interacción sólo es significativa en el nivel de 10%.. Por lo tanto. Observe que se necesitan ahora seis operadores..ab L. Suponga ahora que debido a limitaciones de tiempo.17 166. y existe cierta evidencia de una ligera interacción entre ambos factores.. En esta tabla se han usado las letras minúsculas!. E YF representan las 3 x 2 =6 combinaciones de tratamientos del diseño factorial como sigue:A =f¡gl.¡ Y.(~~~~~~:) = 402.5-6 FORMACIÓN DE BLOQUES EN UN DISEÑO FACTORIAL 209 Tabla 5-20 Análisis de varianza del ejemplo 5-6 Suma de cuadrados Fuente de variación r>esorden de terreno (G) Tipo de filtro (F) GF Bloques Error Total 335. entonces el diseño factorial puede correrse en un cuadrado latino p x p.58 1066.67 71.06 11.54 134. es decir. En el caso de dos restricciones sobre la aleatorización.19 3. Las letras latinas A.79 1066. en lugar de los cuatro del experimento original.0001 0.67 38.83 Grados de libertad 2 1 2 3 15 23 Cuadrado medio 167. Los factores de este experimento son el tipo de filtro (dos niveles) y el desorden de terreno (tres niveles). sólo pueden hacerse seis corridas por día. k abn k=l = (3)1(2) [(572)2 +(579)2 +(597)2 +(530)2]. como se muestra en la tabla 5-21. C. si el número de combinaciones de los tratamientos en un diseño factorial de k factores es exactamente igual al número de niveles de la restricción.k} de la siguiente manera: 1 11 2 SS -_~ 2_~ . Por lo tanto. m.33 2047. Tanto el desorden de terreno como el tipo de filtro son significativos en el nivel de 1 %. y gj para representar los nivelesi-ésimo yj-ésimo del tipo de filtro y del desorden de terreno. La presentación de la tabla 5-20 indica que todos los efectos se probaron dividiendo sus cuadrados medios por el cuadrado medio del error. cada una con p niveles. Además. respectivamente. C = f¡g3. y los operadores se consideran como bloques.08 402. lo cual resulta en un diseño del cuadrado latino 6 x 6. B. por lo que el número de combinaciones de tratamientos en el diseño factorial 3 x 2 es exactamente igual al número de niveles de restricción. D. Bloques . Es decir. se concluye que tanto el nivel del desorden de terreno como el tipo de filtro de campo usado en la pantalla afectan la habilidad del operador para detectar el objetivo.f¡gz representa el filtro tipo 1 y un desorden de terreno intermedio.B = f¡gz.0573 cuadrados debida a los bloques se encuentra a partir de los totales de los operadores {Y. considere una modificación del experimento de la detección del objetivo en el radar del ejemplo 5-6..D = f'l!Sl' E :::: f'l!Sz y F = f'l!S3' . G a-1 285.6 donde 'l"j YfJk son los efectos del desorden de terreno y del tipo de filtro..k. Filtro tipo 1 560 607 646 -1813 Filtro tipo 2 512 528 543 -1583 Y.0001 0.87 4. . Tabla 5-22 Análisis de varianza del experimento de la detección en el radar realizado como un diseño factorial 3 X cuadrado latino Fórmula general Fuente de Suma de para los grados Cuadrado Grados de medio Fo variación cuadrados libertad de libertad Desorden de terreno. 1072 1135 1189 -3396 =Y.0071 .60 Operadores 428..00 36 2en un ValorP <0..75 28. El modelo estadístico lineal de este diseño es i.00 20 (ab)Z-l Total 2798. .43 1 63. 2 { Yijkl = ¡.0001 <0. 2.44 148.33 5 ab-1 85.j.00 5 (columnas) (ab -l)(ab . y a¡ y el representan las restricciones sobre la aleatorización de los días y los operadores. respectivamente.40 GF 126... F 1469.t+a¡ +'l"j + fJk +('l"fJ)jk +e l +cijkJ (5-38) 1= 1..50 2 Tipo de filtro.73 2 (a -l)(b -1) Días (renglones) ab-1 0. Se ha agregado una columna a esta tabla que indica cómo se determina el número de grados de libertad de cada suma de cuadrados.2) 9.37 6..3 k = 1.. : 1. Además.j/d): Columnas (yijk. respectivamente.2.): 563 572 568 579 568 597 568 530 565 561 564 557 En la tabla 5-22 se resume el análisis de varianza..44 b-1 1469. los totales de los renglones y las columnas son Renglones (Y.86 571. 2. el desorden de terreno (dos grados de libertad) y su interacción (dos grados de libertad). la siguiente tabla de dos vías de los totales de los tratamientos es útil: Desorden de terreno Bajo Intermedio Alto Y. 6 J-1...90 Error 198.210 CAPÍTULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES Tabla 5-21 El experimento de la detección del radar realizado en un cuadrado latino 6 X 6 Operador 6 3 4 5 Día 2 1 F(fzg3 = 90) D(fzgl = 81) E(fzgz = 88) B(flgz = 106) C(flg3 = 108) 1 A(flgl = 90) F(fzg3 = 83) E(fzgz = 86) D(fzgl = 84) B(flgZ = 105) 2 C(flg3 = 114) A(flgl = 96) D(fzgl = 85) F(fzg3 = 95) A(flgl = 92) C(f¡g3 = 104) 3 B(flgZ = 102) E(fzgz = 90) B(flgz = 96) C(flg3 = 110) F(fzg3 = 91) E(fzgz = 887) D(fzg¡ = 84) A(f¡g¡ = 100) 4 E(fzgz = 80) A(flgl = 90) B(f¡gz = 98) F(fzg3 =93) C(flg3 = 112) D(fzg¡ = 92) 5 C(f¡g3 = 98) B(flgz = 100) A(flgl = 92) D(fzgl = 86) F(fzg3 = 91) E(fzgz = 97) 6 Los cinco grados de libertad entre las seis letras latinas corresponden a los efectos principales del tipo de filtro (un grado de libertad). Para calcular las sumas de cuadrados. calcular la estimación de un intervalo de confianza de 95% de la diferencia media en la respuesta para velocidades de alimentación de 0..3 90.2 90.15 74 64 60 92 86 88 99 98 102 Profundiad de corte (pulg) 0.20 0.9 90. Los datos son los siguientes: . Temperatura (OC) 150 160 170 200 90. En un artículo de Industrial Quality Control se describe un experimento para investigar el efecto del tipo de cristal y del tipo de fósforo sobre la brillantez de un cinescopio. Utilizar a = 0.4 89. Selecciona tres velocidades de alimentación y cuatro profundidades de corte.6 90..25 79 82 99 68 88 104 73 92 96 98 99 104 104 108 110 88 95 99 104 108 114 99 110 111 95 99 107 5-3. Los datos del rendimiento son: 5-1.20 y 0. b) Construir las gráficas de los residuales apropiadas y comentar la adecuación del modelo. Después realiza un experimento factorial y obtiene los siguientes datos: Velocidad de alimentación (pulg/min) 0.05. Utilizar a = 0.1 90.1 5-2.2 90. a) Analizar los datos y sacar conclusiones.9 230 90.5 90. a) Analizar los datos y sacar conclusiones. e) Obtener estimaciones puntuales del acabado superficial promedio con cada velocidad de alimentación. Para los datos del problema 5-2.25 0.18 0.30 0.7 Presión (psig) 215 90.4 90. b) Construir las gráficas de los residuales apropiadas y comentar la adecuación del modelo.4 90. ! \I '.7 90.'i 5-7 PROBLEMAS 211 5~7 PROBLEMAS Se estudia el rendimiento de un proceso químico.6 90. ".20 0.1 90. La variable de respuesta es la corriente (en microamperes) necesaria para obtener un nivel de brillantez específico. d) Encontrar los valores P para las pruebas del inciso a.5 90.'i. Se seleccionan tres niveles de cada factor y se lleva a cabo un experimento factorial con dos réplicas. 5-4. Se piensa que las dos variables más importantes son la presión y la temperatura. e) ¿Bajo qué condiciones debería operarse este proceso? Un ingeniero sospecha que el acabado superficial de una pieza metálica se afecta por la velocidad de alimentación y la profundidad de corte.8 90.25 pulg/min.05. 22 17. e) Graficar la torcedura promedio con cada nivel del contenido de cobre y compararlas con una distribución t con la escala apropiada.31 30.05. ¿qué nivel del contenido de cobre debería especificarse? d) Suponga que no es sencillo controlar la temperatura en el medio ambiente donde van a usarse las placas de cobre. 9 16. Se eligen cuatro máquinas de producción y tres operadores y se corre un experimento factorial utilizando fibra del mismo lote de producción. Los resultados son los siguientes: Máquina Operador 1 2 3 1 109 110 110 112 116 114 2 110 115 110 111 112 115 3 108 109 111 109 114 119 4 110 108 114 112 120 117 . b) ¿Los dos factores interactúan? Utilizar a = 0. Los datos fueron los siguientes: Contenido de cobre (%) Temperatura (OC) 50 75 100 125 40 17. John Wiley) describen un experimento realizado para investigar la torcedura de placas de cobre.12 25. La variable de respuesta fue una medida de la cantidad de torcedura.20 12. e) Analizar los residuales de este experimento. a) ¿Existe algún indicio de que alguno de los dos factores afecta la cantidad de torcedura? ¿Hay alguna interacción entre los factores? Utilizar a = 0.22 100 28.05.212 CAPÍTULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES Tipo de cristal 1 2 Tipo de fósforo 123 280 300 290 290 310 285 285 295 290 230 260 220 235 240 225 240 235 230 a) 5-5. b) Analizar los residuales de este experimento.21 80 24. 17 60 16.23 29.27 27. ¿Existe algún indicio de que alguno de los dos factores influye en la brillantez? Utilizar a = 0. Si es deseable una torcedura baja.31 5-6. Johnson y Leone (Statisties and Expelimental Design in Engineeling and the Physieal Scienees.21 23. Describir las diferencias en los efectos de los diversos niveles del contenido de cobre sobre la torcedura. Los dos factores estudiados fueron la temperatura y el contenido de cobre de las placas. 12 21.13 18.21 18. ¿Este hecho modifica la respuesta que se dio para el inciso e? Se estudian los factores que influyen en la resistencia a la ruptura de una fibra sintética.23 23.05. 60 2. Obtiene los siguientes resultados.83 2.015 0.94 2. Un ingeniero mecánico estudia la fuerza de empuje desarrollada por una taladradora. Considere el experimento del problema 5-1.87 5-8. 5-7 PROBLEMAS 213 5-7. ¿Existe un efecto de interacción significativo? ¿El tipo de cristal o la temperatura afectan la respuesta? ¿A qué conclusiones se llega? b) Ajustar un modelo apropiado que relacione la salida luminosa con el tipo de cristal y la temperatura. Velocidad de taladrado 125 200 Velocidad de alimentación 0.72 2.030 0. Se realiza un experimento para estudiar la influencia de la temperatura de operación y tres tipos de placas de recubrimiento de cristal. b) Construir las gráficas de los residuales apropiadas y comentar la adecuación del modelo. e) Analizar los residuales de este experimento.75 2. Comentar la adecuación de los modelos que se hayan considerado.86 2.49 2.05.. Usar este modelo como guía para las condiciones de operación del proceso.05.70 2. en la salida luminosa de un tubo de osciloscopio. Analizar los datos y sacar conclusiones.85 2. Usar la prueba de Tukey para determinar los niveles del factor presión que son significativamente diferentes para los datos del problema 5-1. a) Utilizar a = 0.80 2. Se registraron los siguientes datos: Tipo de cristal 1 100 580 568 570 550 530 579 546 575 599 2 3 Temperatura 125 1090 1087 1085 1070 1035 1000 1045 1053 1066 150 1392 1380 1386 1328 1312 1299 867 904 889 5-9. Utilizar a = 0. Selecciona cuatro velocidades de alimentación y usa una velocidad de taladrado alta y otra baja elegidas para representar las condiciones de operación extremas. Utilizar a = 0.88 2.78 2. 5-10.05 en el análisis. a) Analizar los datos y sacar conclusiones.86 2. .45 2. Ajustar un modelo apropiado a los datos de la respuesta.045 0.86 2.060 2. Sospecha que la velocidad de taladrado y la velocidad de alimentación del material son los factores más importantes. oo.80 Presión (lb/pulg2) 120 130 140 150 5-15.. b { k= 1. incluyendo los cuadrados medios esperados. Deducir los cuadrados medios esperados para un análisis de varianza de dos factores con una observación por celda. : 1..t+7:¡ +f3j +Yk +(7:f3)q +(f3Y)jk +cijk i.43 9. Factor de la columna 3 2 39 20 37 36 22 33 Factor del renglón 1 2 3 5-14. ¿Qué conclusiones pueden sacarse? Comentar la adecuación del modelo. Realizar una prueba de no aditividad.00 9.2.69 8. Suponiendo que los tres factores son fijos. Considere los siguientes datos de un experimento factorial de dos factores.1 214 5-11.60 9. Los datos se presentan a continuación: Temperatura ("C) 825 1063 1080 1043 988 1026 1004 Posición 1 800 570 565 583 528 547 521 2 850 565 510 590 526 538 532 5-12. a J -1. Se realiza un experimento factorial en el que ambos factores se suponen fijos. oo.2. e Observe que hay una sola réplica. CAPÍTULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES Se llevó a cabo un experimento para determinar si la temperatura de cocción o la posición en el horno afectaban el espesor del endurecimiento de un ánodo de carbono. ¿Qué se usaría como "error experimental" para probar las hipótesis? . Considere el modelo de tres factores Yijk = ¡. Utilizar a = 0. Desarrollar el modelo estadístico.. 2. Realizar una prueba de no aditividad. desarrollar la tabla del análisis de varianza. Analizar los datos y sacar conclusiones.98 11.01 10.05.44 9. oo. Analizar los datos y sacar conclusiones.. Realizar el análisis de varianza y probar las hipótesis sobre los efectos principales.28 10.10 11.03 9. Suponga que se considera que no existe ninguna interacción. Temperatura ("F) 250 260 270 9. . 1 36 18 30 4 32 20 34 Se piensa que la resistencia al corte de un adhesivo se afecta por la presión de aplicación y la temperatura. suponiendo que ambos factores son fijos.57 9. 5-13. b) Construir las gráficas de los residuales apropiadas y comentar la adecuación del modelo.4 198.0 horas Presión 400 196.. Comentar la adecuación del modelo. Los datos se presentan enseguida.6 198.4 198. Suponga que en el problema 5-1 quiere rechazarse la hipótesis nula con una alta probabilidad si la diferencia entre el verdadero rendimiento promedio con dos presiones cualesquiera es mayor que 0.0 198.7 198. obteniéndose los siguientes datos: Porcentaje de la concentración de madera dura 2 4 8 Tiempo de cocción 3. 5-7 PROBLEMAS 215 5-16. Analizar los datos y sacar conclusiones. Se lleva a cabo un experimento factorial con dos réplicas. ¿cuántas réplicas deberán correrse? Se estudia el rendimiento de un proceso químico.1. Los dos factores de interés son la temperatura y la presión.6 200. tres niveles de la presión y dos tiempos de cocción.4 198.1 197.8 650 200. El porcentaje de la concentración de madera dur& en la pulpa bruta.6 197.4 198.2 650 199. Utilizar a = 0. la presión de la cuba y el tiempo de cocción de la pulpa se investigan en cuanto a sus efectos sobre la resistencia del papel. sólo es posible hacer nueve corridas en un día.05. y se le asignó una evaluación numérica.0 196. La tela terminada se comparó con un patrón.6 196. Thmperatura 300 Dumción del ciclo 40 1 23 24 25 36 35 36 28 24 27 2 27 28 26 34 38 39 35 35 34 0 350 3 31 32 29 33 1 24 23 28 37 39 35 26 29 25 2 38 36 35 34 38 36 36 37 34 0 Operador Operador 3 34 36 39 34 36 31 28 26 24 50 34 35 26 27 25 60 5-18. Se seleccionaron tres operadores. Se seleccionan tres niveles de la concentración de madera dura.4 500 199.0 197.9 195.8 I! a) Analizar los datos y sacar conclusiones.0 197.5 199. tres duraciones del ciclo y dos temperaturas.4 197.6 197.6 500 197.6 196.0 198. e) ¿B&jo qué conjunto de condiciones deberí& operárse este proceso? ¿Por qué? 5-17..9 199. El ex- . 5-19.5 198.1 Tiempo de cocción 4. _ El dep&rtamento de control de calidad de una planta de acabados textiles estudia el efecto de varios factores sobre el teñido de una tela de algodón y fibr&s sintéticas utilizada para fabricar camisas para caballero. Si una estim&ción previa razonable de la desviación estándar del rendimiento es 0.5. Se seleccionan tres niveles de cada factor.6 199. y se tiñeron tres ejemplares pequeños de la tela b&jo cada conjunto de condiciones. sin embargo.0 horas Presión 400 198.5 196.0 196.8 199.2 197.5 197.6 200.7 196. 01 4. El experimento que se muestra a continuación es una variante de dicho estudio.06 11.23 2. Dopado del polisilicio (iones) 1 X lOzo 2 X 10z0 Temperatura de revenido ("C) 900 950 1000 4.03 3. La variable de respuesta es la corriente fundamental. Los datos se muestran en la tabla siguiente. En un artículo de IEEE Transactions on Electron Devices se describe un estudio sobre el dopado del polisilicia.40 10. Analizar los datos.96 10.93 1.3 90.58 3. Temperatura Baja Intermedia Alta 250 86.20 3. e) Repetir los análisis de los incisos a y b utilizando ln(y) como la respuesta.02 10. 16.24 2. suponiendo que las réplicas son bloques.06 2. Analizar los datos.7 260 85.3 93.3 88. suponiendo que los días son bloques.1 HzO 2. 2. 5-21. b) Analizar los residuales.2 89.06 3.24 9.81 3.38 2.96 3.30 HzO salada 1.18 3.1 89.81 2.05).10 3.50 10. a) Analizar los datos de este experimento (utilizar a = 0.8 89.06 2. Los datos del experimento se presentan abajo (la respuesta es el índice de crecimiento de las fisuras por fatiga): Medio ambiente Frecuencia Aire 2.98 3.75 2. no.24 3.5 89.0 91.40 5-23. Comentar los resultados.64 11.15 11.48 2.29 2.60 .36 10.00 9.3 90. Considere los datos del problema 5-5.1 Día 1 Presión 260 84.47 2.216 CAPÍTULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES perimentador corre una réplica completa en cada día. suponiendo que las réplicas son bloques.20 10.0 87.71 2. Considere los datos del problema 5-6.68 2.00 11. 508-515) se investigaron los efectos de la frecuencia de carga cíclica y de las condiciones ambientales sobre el crecimiento de las fisuras por fatiga con un esfuerzo constante de 22 MPa para un material particular.7 5-20.38 10.3 250 86.01 9. pp.60 10.20 9.08 10 1 0.2 Día 2 Presión 270 85.12 2. Analizar los datos.05 2.9 93.90 1.4 91.2 270 87. En un artículo de JOllrnal ofTesting and Evalllation (vol. 5-22.65 2. .05) que indique que el nivel de dopado del polisilicio o la temperatura de fijación afecten la corriente fundamental? b) Construir representaciones gráficas como ayuda para interpretar este experimento. e) Analizar los residuales y comentar la adecuación del modelo. X 2 = temperatura)? Estimar los parámetros de este modelo y graficar la superficie de respuesta. d) mI modelo y= /30 +/31 x l +/32 x 2+/322 x i +/312 x lx 2+8 está apoyado por este experimento (Xl = nivel de dopado.5-7 PROBLEMAS 217 a) ¿Existe evidencia (cona = 0. 218 .: " 6~1 INTRODUCCIÓN Los diseños factoriales se usan ampliamente en experimentos que incluyen varios factores cuando es necesario estudiar el efecto conjunto de los factores sobre una respuesta. \~ :K Diseño factorial 2k . Puesto que sólo hay dos niveles para cada factor. Sin embargo. Este diseño proporciona el menor número de corridas con las que pueden estudiarse k factores en un diseño factorial completo. En muchos experimentos de tamizado de factores. estos diseños se usan ampliamente en los experimentos de tamizado o selección de factores. En el capítulo 5 se presentaron los métodos generales para el análisis de los diseños factoriales. Estos niveles pueden ser cuantitativos. A lo largo del capítulo se supone que 1) los factores son fijos. El más importante de estos casos especiales es el de k factores. Por consiguiente. como dos valores de temperatura. x 2 = 2k observaciones y se le llama diseño factorial 2k • Este capítulo se enfoca en esta clase en extremo importante de diseños. o bien cualitativos. El diseño 2k es de particular utilidad en las etapas iniciales del trabajo experimental. y se analizarán las acciones que deberán emprenderse en caso de que se viole. como dos máquinas. presión o tiempo. este supuesto suele ser razonable.. cada uno con sólo dos niveles. cuando probablemente se estén investigando muchos factores. se supone que la respuesta es aproximadamente lineal en el rango elegido para los niveles de los factores.'. Una réplica completa de este diseño requiere 2 x 2 x . hay varios casos especiales del diseño factorial general que son importantes debido a su uso generalizado en el trabajo de investigación y porque constituyen las bases de otros diseños de gran valor práctico. o quizá la presencia o ausencia de un factor. cuando se acaba de iniciar el estudio del proceso o sistema. 2) los diseños son completamente aleatorizados y 3) se satisfacen los supuestos de normalidad usuales.. los niveles "alto" y "bajo" de un factor. En la sección 6-6 se presentará un método simple para verificar este supuesto. dos operadores. A y B. Por lo tanto. Por convención. Y.en el ejeA representa el nivel bajo de la concentración (15%). por ejemplo. "B" al efecto del factor B. Las cuatro combinaciones de tratamientos suelen representarse con letras minúsculas. y sean 15 y 25 por ciento los dos niveles de interés. Balto Total 28 36 18 31 25 32 19 30 27 32 23 29 80 100 60 90 Las combinaciones de los tratamientos se ilustran gráficamente en la figura 6-1. el efecto de un factor se denota con una letra mayúscula latina. y "AB" alainteracciónAB. En el diseño 22. como se muestra en la figura 6-1. con el nivel alto denotando el uso de 2 libras del catalizador y el nivel bajo denotando el uso de 1 libra. los niveles bajoy alto deAy B se denotan por "-" y "+".. I 6-2 EL DISEÑO 22 219 6. "A" se refiere al efecto del factorA. a repreb =60 Alto + (18 (2 libras) + 19 + 23) ab = 90 (31 + 30 + 29) Bajo _ (1 libra) (28 (1) = 80 + 25 + 27) a= 100 (36 + 32 + 32) I Bajo (15%) Concentración del reactivo. + Alto (25%) I A Figura 6·1 seño 22. respectivamente.. y los datos son los siguientes: Factor B Réplica 1 II III A + + + + Combinación de tratamientos A bajo. B bajo A bajo. Sea la concentración del reactivo el factor A. cada uno se corre a dos niveles. Balto A alto.2 EL DISEÑO 22 I I El primer diseño de la serie 2k es el que sólo tiene dos factores. considere la investigación del efecto de la concentración del reactivo y de la cantidad del catalizador sobre la conversión (rendimiento) de un proceso químico.en el eje B representa el nivel bajo del catalizador. en los ejesA y B. Combinaciones de los tratamientos en el di- . El catalizador es el factor B. A este diseño se le llama diseño factorial 22• Los niveles de los factores pueden denominarse arbitrariamente "bajo" y "alto". B bajo A alto. . Se hacen tres réplicas del experimento. mientras que + denota el nivel alto. Por lo tanto. Por 10 tanto. Como un ejemplo. mientras que + representa el nivel alto (25%).en una combinación de tratamientos se denota por la ausencia de la letra respectiva. Por la figura se observa que el nivel alto de cualquiera de los factores en una combinación de tratamientos se denota por la letra minúscula correspondiente y que el nivel bajo de un factor . Las fórmulas de los efectos deA. senta la combinación de tratamientos conA en el nivel alto y B en el nivel bajo. y ab representa ambos factores en el nivel alto. el efecto promedio de un factor puede definirse como el cambio en la respuesta producido por un cambio en el nivel de ese factor promediado para los niveles del otro factor. Esto llevará también a la ecuación 6-3.b. se usa (1) para denotar que ambos factores están en el nivel bajo.a]/n) como 1 B= -{[ab-a]+[b-(l)]} 2n = -[ab+b. ecuación 6-2. Es decir.(1)] 2n 1 (6-1) El efecto principal promedio deB se encuentra a partir del efecto deB con el nivel bajo deA (es decir."'1" 220 CAPÍTULO 6 DISEÑO FACTORIAL 21< L. los símbolos (1). [ab .(l)]/n) y con el nivel alto de A (o sea. Por convención. ByAB pueden deducirse con otro método. El efecto deA puede encontrarse como la diferencia en la respuesta promedio de las dos combinaciones de tratamientos situadas a la derecha del cuadrado de la figura 6-1 (a este promedio se le llamay>.(1)] 2n 1 (6-2) El efecto de la interacciónAB se define como la diferencia promedio entre el efecto deA con el nivel alto de B y el efecto de A con el nivel bajo de B. como se ilustra en la figura 6-1. a. AB puede definirse como la diferencia promedio entre el efecto de B con el nivel alto de A y el efecto de B con el nivel bajo de A. [b . A= YA + - YA - ab+a _ b+(l) 2n 2n = -[ab+a-b-(l)] 2n Se trata exactamente del mismo resultado que el de la ecuación 6-1. Ahora el efecto deA en el nivel bajo deB es [a . Asimismo. b representaA en el nivel bajo y B en el nivel alto. by ab representan ahora el total de las n réplicas hechas con la combinación de los tratamientos. AB= 2n ([ab-b]-[a-(l)]} = 2n [ab+(l)-a-b] 1 1 (6-3) De manera alternativa. Por lo tanto. porque es la respuesta promedio con las combinaciones de tratamientos donde A está en el nivel alto) y las dos combinaciones de tratamientos situadas a la izquierda del cuadrado de la figura 6-1 (o YA-). se encuentra como la diferencia entre el promedio de las dos combinaciones de tratamientos de la parte su1 .Al promediarse estas dos cantidades se obtiene el efecto principal de A: 1 A= -([ab-b]+[a-(l)]} 2n = -[ab+a. Esta notación se utiliza en todas las series 2k • En un diseño factorial con dos niveles.b]/n. El efecto de B.a.(1) ]/n y el efecto deA con el nivel alto de Bes [ab . Considere las sumas de cuadrados deA.. By AB. En la mayoría de los casos puede usarse el análisis de varianza para confirmar esta interpretación. esto sugiere que al incrementar la cantidad del catalizador que se agrega al proceso se reducirá el rendimiento.80) = 8.olr l' . a saber Contraste A 1 . se observa que también se usan contrastes para estimar B y AB. El efecto de la interacción parece ser pequeño en comparación con los dos efectos principales.00 AB = 2(3) (90+ 80-100. 6-2 EL DISEÑO 22 221 perior del cuadrado (YB+) y el promedio de las dos combinaciones de tratamientos de la parte inferior (JB-) . la cual establece que la suma de cuadrados del contraste es igual al cuadrado del contraste dividido por el número de observaciones en . ¡'.67 El efecto de A (concentración del reactivo) es positivo.(1) (6-4) A este contraste suele l1amársele el efecto total deA.. o AB= ab+(l) 2n 1 a+b 2n =-[ab+(l)-a.60) = 1. estos tres contrastes son ortogonales. los efectos promedio pueden estimarse como A = 2(3) (90+ 100~ 60. que se usó un contraste para estimar A.b] 2n resultado que es idéntico a la ecuación 6-3. A partir de las ecuaciones 6-2 y 6-3. el efecto de la interacciónAB es el promedio de las combinaciones de tratamientos de la diagonal de derecha a izquierda del cuadrado [ab y (1)] menos el promedio de las combinaciones de tratamientos de la diagonal de izquierda a derecha (a y b). ID 'o•• " I ! = ab+a. por la ecuación 6-1. Utilizando el experimento de la figura 6-1. Hay varios paquetes de sofíware de estadística excelentes que son útiles para establecer y analizar diseños 2k • Se cuenta también con métodos especiales que ahorran tiempo cuando los cálculos se hacen manualmente. el rendimiento se incrementará. Observe. La suma de cuadrados de cualquier contraste puede calcularse con la ecuación 3-29. En muchos experimentos que incluyen diseños 2\ se examinará la magnitud y la dirección de los efectos de los factores a fin de determinar las variables que son de posible importancia. o B= YB + - YB 2n = ab+b _ a+(l) 2n 1 = 2n[ab+b-a-(1)] Por último. El efecto de B (catalizador) es negativo.33 1 1 B= 2(3)(90+60-100-80)=-5. esto sugiere que al incrementar A del nivel bajo (15%) al nivel alto (25%).b. Además.. es decir. B YAB.SS AB al utilizar SSA' SSB y SSAB de la ecuación 6-8.00. suele calcularse por sustracción como SS E = SST - SS A . = 75. se obtiene 2 2 3 SST = t. Con base en los valores P. Con frecuencia resulta conveniente escribir las combinaciones de los tratamientos en el orden (1). se tienen ss = [ab+a-b-(1)]2 A 4n (6-5) (6-6) SS B = [ab+b-a-(1)]2 4n y s _ [ab+(1)-a-b]2 4n SAB - (6-7) como las sumas de cuadrados de A. La suma de cuadrados del error. Por Consiguiente.00.00 (6-8) y ss = (10)2 = 8. a.SSB .9075.SSB . con 4(n -1) grados de libertad. 6-6 Y6-7 pueden encontrarse como 4(3) (-30)2 SSB = 4(3) A ss = (50)2 = 208 33 . . En la tabla 6-1 se resume el análisis de varianza completo.SS AB (6-10) Para el experimento de la figura 6-1.8. se concluye que los efectos principales son estadísticamente significativos y que no hay interacción entre estos factores. 22n 2 y'~ SST = Yijk-4 2:2:2: i=1 j=1 k=1 (6-9) n En general. SST tiene 4n -1 grados de libertad. Esto confirma la interpretación de los datos que se hizo originalmente con base en las magnitudes de los efectos de los factores. A! utilizar el experimento de la figura 6-1. las sumas de cuadrados de las ecuaciones 6-5.00 = 323.00 y SS E = 323.00.33 = 31.208.34 = SST - SS A .33 AB 4(3) La suma de cuadrados total se encuentra como de costumbre.222 CAPÍTULO 6 DISEÑO FACTORIAL 2k cada total del contraste multiplicado por la suma de cuadrados de los coeficientes del contraste.33-75.~'3) 2 = 9398.#~ Y~k . 33 3. que representa el total o promedio del experimento completo.00 11 Total Cuadrado medio 208. el contraste es -(1) + a . y puede usarse una tabla de signos positivos y negativos como la tabla 6-2 para determinar el signo correcto para cada combinación de tratamientos. La . abo Se hace referencia a esto como el orden estándar (u orden de Yates. la interacciónAB e J. Puesto que 2k es tan sólo un diseño factorial. por el Dr. El coeficiente de un contraste es siempre + 1 o -1. El modelo de regresión En un diseño factorial2 k es sencillo expresar los resultados del experimento en términos de un modelo de regresión.relación enTabla 6-2 Signos algebraicos para calcular los efectos en el diseño 22 Combinación de tratamientos (1) a b ab Efecto factorial 1 A B AB + + + + + + + + + + .33 1 AB 31.92 Fo 53.00 8.6-2 EL DISEÑO 22 223 Tabla 6-1 Análisis de varianza del experimento de la figura 6-1 Suma de Grados de Fuente de cuadrados libertad variación 208. simplemente se multiplican los signos de la columna apropiada de la tabla por la combinación de tratamientos correspondiente y se hace la suma. se observa que los coeficientes de los contrastes usados para estimar los efectos son Efectos (1) a b A: B: -1 -1 +1 AB: +l -1 -1 -1 +1 -1 ab +1 +1 +1 Observe que los coeficientes de los contrastes para estimar el efecto de la interacción son sólo el producto de los coeficientes correspondientes de los dos efectos principales.33 1 A 75. Las etiquetas de los renglones son las combinaciones de los tratamientos. pero el enfoque del modelo de regresión es mucho más natural e intuitivo. Frank Yates). Por ejemplo. podría usarse un modelo de los efectos o de las medias. Para encontrar el contraste para estimar cualquier efecto. Al utilizar este orden estándar.1826 b.13 2.13 ValorP 0.s donde Xl es una variable codificada que representa la concentración del reactivo y x 2 es una variable codificada que representa la cantidad del catalizador y las {J son los coeficientes dé regresión. Los encabezados de las columnas de la tabla 6-2 son los efectos principales (Ay B). el modelo de regresión es y= {Jo +{JIXI +{J2 X2 +.34 8 Error 323. Observe que la columna que corresponde a J incluye únicamente signos positivos.00 1 B 8. para estimarA. Para el experimento del proceso químico de la figura 6-1.0001 0. que concuerda con la ecuación 6-1.15 19.0024 0.33 75.b + ab. observe que Concentración .33) (-1)+ (-5. esta codificación producirá la familiar notación ± 1 para los niveles de las variables codificadas.2 . Por ejemplo.(Catalizadorbajo + Catalizadoralto ) / 2 (Catalizadoralto - Catalizadorbajo ) / 2 Cuando las variables naturales sólo tienen dos niveles.20 = 5 Por lo tanto.00) y= 27. Los residuales son las diferencias entre el valor observado y el valor ajustado de y.5 = + 1. Residuales y adecuación del modelo El modelo de regresión puede usarse para obtener el valor predicho o ajustado de y en los cuatro puntos del diseño. entoncesx2 = + 1.(Concentración baa + Concentración alta) / 2 X 1 = J (Concentración alta - Concentración baja) / 2 y x2 = Catalizador . entonces Xl = -1.(15 + 25) / 2 x = 1 (25-15)/2 Concentración .5+ (2 . La razón de que el coeficiente de regresión sea la mitad de la estimación del efecto es que un coeficiente de regresión mide el efecto de un cambio unitario enx sobre la media de y. y los coeficientes de regresión '/31 y '/3 2 son la mitad de las estimaciones de los efectos de los factores correspondientes.(-1) = 25. entonces Xl centración está en el nivel bajo (Concentración = 15%). Además. Se demostrará más adelante que este método simple para estimar los coeficientes de regresión consiste en producir las estimaciones de mínimos cuadrados de los parámetros. Catalizador.224 CAPÍTULO 6 DISEÑO FACTORIAL 2k tre las variables naturales -la concentración del reactivo y la cantidad de catalizador. entonces X 2 = -1. Ver también el material suplementario de este capítulo. si el catalizador está en el nivel bajo (Catalizador = 1 libra). y la estimación del efecto se basa en un cambio de dos unidades (de -1 a + 1).00) y= 27. El modelo de regresión ajustado es 8.835 . cuando la concentración del reactivo está en el nivel bajo (Xl = -1) Yel catalizador está en el nivel bajo (x 2 = -1).x2 donde la ordenada al origen es el gran promedio de las 12 observaciones.y las variables codificadas es Concentración . si la concentración está en el nivel alto (Concentración = 25%). si la con- Por lo tanto.33) Xl + (-5.(1 + 2) /2 X = -----~--<--2 (2-1)/2 Catalizador-1. Para ilustrar esto en el ejemplo tratado.5+ (2 -2. el rendimiento predicho es 8. si el catalizador está en el nivel alto (Catalizador = 2 libras).5 0. 29.2 .5+ (-2.165 y elO = 31.5+ (-2.34. 8.835= -2.165= 0.33) (-1)+ (-5.20.25.34.835= 2.25. y los residuales son el = 28-25.20. La superficie de respuesta El modelo de regresión 8. Estas gráficas parecen ser satisfactorias.00) y= 27. Para el nivel alto de la concentración del reactivo y el nivel bajo del catalizador.20.165 = -0.5+ (-2.x2 . para el nivel alto de ambos factores.165 e 6 = 32.835= -0.2 .835 e3 = 27.165 En la figura 6-2 se presenta una gráfica de probabilidad normal de estos residuales y una gráfica de los residuales contra el rendimiento predicho.835= -1.835 es = 32.00) y= 27.835 en = 30-29.(+1) = 20.165= -2. por lo que no hay razón para sospechar problemas con la validez de las conclusiones.165 y e4 = 36.835 eg = 23.165 Para el nivel bajo de la concentración del reactivo y el nivel alto del catalizador.(-1) = 34.2 .33) (+1)+ (-5.33) (+1)+ (-5.835 es = 19.835 el2 = 29.00) y= 27.29.165 = 1.835= 1.835 y e 7 = 18.5+ (-2-2.165= -2.835= 2.33) Xl + (-5.165 = 1. 8.6-2 EL DISEÑO 22 225 Hay tres observaciones en esta combinación de tratamientos.00) y= 27.165 e2 = 25.165 Por último.165 Los valores predichos y los residuales restantes se calculan de manera similar.(+1) = 29.34. 8. . Al examinar ...83 I I I I I I 23.~.1 - "- ~ 20..17 Rendimiento predicho b) Residuales contra el rendimiento predicho Figura 6-2 Gráficas de los residuales para el experimento del proceso químico.. y la figura 6-3b es la gráfica de contorno... Puesto que el modelo es de primer orden (es decir.t 20 + al Gráfica de probabilidad normal 2.. entonces simplemente las relaciones entre las variables naturales y las codificadas que se dieron anteriormente se sustituyen en el modelo de regresión. .500 - X X EL:..r ... ".94 34.167 1.72 31... Si se desea construir estas gráficas en términos de los niveles de los factores naturales.3)(Concentr.50 29..833 X f- - ce w X :2 ..28 27.-. ..000 -2.20)+(-5~OO)(Cataliz~. la superficie de respuesta ajustada es un plano. .g '00 'w " ro -0.. de donde se obtiene y= 27.333 f--1.06 25.33+ O.. .. . puede usarse para generar gráficas de superficie de respuesta.ción .. ..~or-1.... 95 90 + ~ 80 o 70 :c ... ..226 CAPÍTULO 6 DISEÑO FACTORIAL 2k 99. .¡ .167f--2.333 - ~ I IX I I I I _ X X X X X i: /: 0.5+ (8.. contiene únicamente los efectos principales).00Catalizador En la figura 6-3a se presenta la gráfica de superficie de respuesta tridimensional del rendimiento de este modelo.:~r . .. 8333Concentración - 5...5) = 18.-.g 50 J!l 30 10 5 -o c: . ..167 1...333 1.00 21.00 18.83 "" "" "" 2.00 ~ ~B'l>C'S 17. la gráfica de contorno se observa que el rendimiento aumenta cuando la concentración del reactivo se incrementa y la cantidad de catalizador disminuye.. Frecuentemente se usa una superficie ajustada como ésta para encontrar la dirección del mejoramiento potencial de un proceso.17 29. 6-2 EL DISEÑO 22 ..72 y 25.' ... . .400 $ C'~!~¡" 1..00 Co~ "" .000 '--_---I.600 25.: r .00 23.800 "" 0.833 (. "O .000 1.j~~ 2..._ _L-_-L..L-_---l 15.... se presentará en el capítulo 11 cuando se estudien los métodos para realizar la exploración sistemática de las superficies de respuesta.. 1..l-_ _-L.'-'-__--l.33 25.~ al "O "O ~ ro :g á 1. llamada método del ascenso más pronunciado.r l 1...~'l>C B \br-° i 1 I 1 :i a) Superficie de respuesta i i j.r .'''''' I~O'Ql 1...28 20.. Una manera formal de hacer esto.67 23.jo 19...33 20.200 1.:1i! 1] 227 34..000 r .. 1'>~O'or 1..000 15.I 1'1 'r l.-L.00 '.00 Concentración del reactivo b) Gráfica de contorno Figura 6-3 Gráfica de la superficie de respuesta y gráfica de contorno del experimento del proceso químico. .00 CBr-'l.00 21. bc y abc.(l)]/n. AC y BC y uno con la interacción ABe. Se le conoce en ocasiones como la matriz del diseño. como se muestra en la figura 6-4a. en lugar de + y -. c. La primera es la notación + y -. cada uno con dos niveles. Al diseño se le llama diseño factorial 23. Existen en realidad tres notaciones diferentes para las corridas del diseño 23 que son de uso general.}J--// Bajo " (1) ~" a Alto Factor A -Z 3• Factor Corrida A + + + + B e ab + Alto ~~o 1 2 ~ . y en este caso la representación geométrica de las ocho combinaciones de tratamientos puede hacerse con un cubo. son de interés. El efecto deA cuando B y C están en el nivel bajo es [a . La tercera y última notación utiliza 1 y Opara denotar los niveles alto y bajo. considere la estimación del efecto principalA. respectivamente. las ocho corridas del diseño 23 pueden enlistarse como en la figura 6-4b.Bajo <e I Bajo + I 3 4 5 6 + + 7 B + + + + + + a) Vista geométrica b) La matriz del diseño Figura 6·4 El diseño factorial 2 . las combinaciones de los tratamientos en el orden estándar se escriben como (1). Haciendo una ampliación de la notación de las etiquetas revisada en la sección 6-2. b. ab. Estas diferentes notaciones se ilustran enseguida para el diseño 23 : Corrida 1 2 3 4 5 6 A B e Etiquetas (1) A B o 1 O 1 O 1 O 1 + + + + o O 1 1 O O 1 1 e o O O O 1 1 1 1 + + + + 7 8 + + + + a b ab e ae be abe Hay siete grados de libertad entre las ocho combinaciones de tratamientos del diseño 23 • Tres grados de libertad se asocian con los efectos principales deA. ac. By C. el efecto deA be abe I I ~ Alto +1 e : ae . Utilizando la notación" +" y "-" para representar los niveles alto y bajo de los factores. La segunda es el uso de las etiquetas en letras minúsculas para identificar las combinaciones de los tratamientos. uno con cada una de las interacciones AB.A. de los factores. Cuatro grados de libertad se asocian con las interacciones.. Primero. De manera similar. Recuerde que estos símbolos representan también el total de las n observaciones hechas con esa combinación de tratamientos particular. By C.228 CAPÍTULO 6 DISEÑO FACTORIAL 2k 6~3 EL DISEÑO 2 3 Suponga que tres factores. Considere la estimación de los efectos principales. llamada con frecuencia notación geométrica. a. be]/n.[a + ab + ae + abe .b+ae. Por lo tanto. Es decir.b . el efecto deA cuando tanto B como C están en el nivel alto es [abe . .está en el nivel alto y B está en el nivel bajo es [ae . el efecto promedio deA es sólo el promedio de estos cuatro efectos. o 1 A= -[a-(l)+ab. el efecto deA es sólo el promedio de las cuatro corridas donde A está en el nivel alto (YA + ) menos el promedio de las cuatro corridas dondeA está en el nivel bajo (Y[).6-3 EL DISEÑO 23 229 cuandoB está en el nivel alto y C está en el nivel bajo es [ab -b l/no El efecto deA cuando C. o A= YA + .(1) .e+abe-be] 4n (6-11) Esta ecuación también puede desarrollarse como un contraste entre las cuatro combinaciones de tratamientos de la cara derecha del cubo de la figura 6-5a (donde A está en el nivel alto) y las cuatro de la cara izquierda (dondeA está en el nivel bajo).el/no Por último.YA - = a+ab+ae+abe 4n (l)+b+e+be 4n Esta ecuación puede reescribirse como 1 A = .e . A B C al Efectos principales AB AC b) Interacción de dos factores BC CfL A • = corridas + O = corridas - ABC cl Interacción de los tres factores Figura 6-5 Representación geométrica de los contrastes que corresponden a los efectos principales y las interacciones del diseño 23 .be] 4n que es idéntica a la ecuación 6-11. l~)] 4n (6-14) La ecuación 6-14 puede escribirse de la siguiente manera: AB= abe+ab+e+(l) be+b+ae+a 411 411 En esta forma. resulta fácil ver que la interacciónAB es la diferencia en los promedios entre las corridas de dos planos diagonales del cubo de la figura 6-5b. C= Ye + 1 - Yc(l) . Utilizando un razonamiento lógico similar y con referencia a la figura 6-5b. Una medida de la interacciónAB es la diferencia entre los efectos promedio deA con los dos niveles de B.[(1) + a ..ae + be + abe] 4n 1 (6-16) .b ..230 CAPÍTULO 6 DISEÑO FACTORIAL 2k De manera similar.be + ab .b . es decir.ab] (6-13) =.ae + e .[e + ae + be + abe 411 Los efectos de la interacción de dos factores pueden calcularse con facilidad.e)+ [a -(1)]} 2n Diferencia [ abe .e-ae] El efecto de C es la diferencia en los promedios entre las cuatro combinaciones de tratamientos de la cara superior del cubo y las cuatro de la cara inferior.a . Utilizando símbolos. B Alto (+) Bajo (-) Efecto promedio de A [(abe -be)+(ab -b)] 2n {(ae .a + (1)] 2n Puesto que la interacción AB es la mitad de esta diferencia.ab .o. Por convención. a la mitad de esta diferencia se le llama la interacción AB. las interacciones AC y BC son 1 ! AC= -[(l)-a+b-ab.e . el efecto de B es la diferencia en los promedios entre las cuatro combinaciones de tratamientos de la cara frontal del cubo y las cuatro de la cara posterior.b . AB = -"-a[ _b_c_-_b_e_+_ab_-_b_-_a_e_+_e_-_a_+_(. Se obtiene así B= YB + 1 4n - YB (6-12) = -[b+ab+be+abe-(l)-a.e+ae-be-liabe] 4n (6-15) y BC = . exponente sólo puede ser Oo 1. En el diseño 23 con n réplicas. Es posible desarrollar una tabla de signos positivos y negativos a partir de los contrastes. Una vez que se han establecido los signos de los efectos principales. En las ecuaciones 6-11 a 6-17. ya que cada efecto tiene un contraste correspondiente con un solo grado de libertad.[ab. Por lo tanto. A x B = AB. éstas definen los vértices de los dos tetraedros que componen el cubo de la figura 6-Sc. . la interacciónABC puede considerarse como la diferencia de dos promedios.) Todas estas propiedades se derivan de la ortogonalidad de los contrastes usados para estimar los efectos. la suma de cuadrados de cualquier efecto es ss = (Contraste )2 8n Signos algebraicos para calcular los efectos del diseño 23 Efecto factorial (6-18) Tabla 6·3 Combinación de tratamientos (1) 1 A B AB C a b ab e ae be abe + + + + + + + + + + + + + + + + + + + + AC + BC ABC + + + + + + + + + + + + + + + .(1)]} 4n 1 1 =-[abc-bc-ac+c-ab+b+a-(1)] 4n (6-17) Como antes. Y ABxB= AB 2 = A Se observa que los exponentes de los productos se forman utilizando la aritmética módulo 2.b]+[a.[ac. 4) El producto de dos columnas cualesquiera produce una columna de la tabla. Por ejemplo. La tabla 6-3 tiene varias propiedades interesantes: 1) Con excepción de la columna J. el .Las sumas de cuadrados de los efectos se calculan con facilidad. Es decir. Por ejemplo. J es un elemento identidad. las cantidades entre corchetes son contrastes de las combinaciones de los tratamientos. 2) La suma de los productos de los signos de dos columnas cualesquiera es cero. Si se aíslan las corridas de los dos promedios. ABC = -{[abc.bc]. cada una de las columnas tienen el mismo número de signos positivos y negativos.6-3 EL DISEÑO 23 231 La interacciónABC se define como la diferencia promedio entre la interacciónAB para los dos diferentes niveles de C. los signos de las columnas restantes pueden obtenerse multiplicando las columnas precedentes apropiadas. los signos de la columnaAB son el producto de los signos de la columnaA y la columna B en cada renglón. 3) La columna J multiplicada por cualquiera de las columnas deja la columna sin cambio. la cual se muestra en la tabla 6-3. se reduce con múltiplos de 2 hasta que es Oo 1. (Es decir. Los signos de los efectos prinCipales se determinan asociando un signo positivo con el nivel alto y un signo negativo con el nivel bajo. renglón por renglón. El contraste de cualquier efecto puede obtenerse fácilmente con esta tabla.c]. si es mayor que 1. (-4)-1.3] = 8 [18] = 2. ejemplo 6·1 Factores codificados Corrida 1 2 3 4 5 6 7 8 A -1 1 -1 1 -1 1 -1 1 B -1 -1 1 1 -1 -1 1 1 e -1 -1 -1 -1 1 1 1 1 Desviación de la altura de llenado Réplica 2 Réplica 1 -3 O -1 2 -1 2 1 6 -1 1 O 3 O 1 1 5 Niveles del factor Bajo (-1) A (psi) 10 B (psi) 25 e (b/min) 200 Alto (+1) 12 30 250 .25 1 C= -[c+ac+bc+abc-(l)-a-b-ab] 1 1 411 1 = 8[-1+3+2+ 11. Los datos (es decir. Tabla 6-4 El experimento de la altura de llenado.(-1)+3.5] =-[14]=175 8 .2] 1 = 8[24] = 3.2.(-4)-1-(-1).(-1)+ 11. y en la figura 6-6 se presenta la representación geométrica del diseño. las desviaciones de la altura de llenado de especificación) se muestran en la tabla 6-4.3+(-1)] 1 1 = -[6]= 075 8 . la presión de operación y la velocidad de línea sobre la altura de llenado de una bebida carbonatada.(-1).(1). donde se presentó un estudio del efecto del porcentaje de carbonatación. Suponga que sólo se usan dos niveles de carbonatación.ac+c] 1 = 8[5-1-(-1)+(-4)+ 11. 1 AB = 411 [ab-a. Recuerde el ejemplo 5-3.ac] 1 1 = 8[-1 +5+2+ 11. Al utilizar los totales bajo las combinaciones de los tratamientos que se muestran en la tabla 6-4.b+(l)+abc-bc.00 B = 411 [b+ab+bc+abc. de tal modo que el experimento es un diseño factorial 23 con dos réplicas. los efectos de los factores pueden estimarse de la siguiente manera: A= -[a-(l)+ab-b+ac-c+abc-bc] 411 1 = 8[1.(-4)+5.c.a.232 CAPÍTULO 6 DISEÑO FACTORIAL 2k EJEMPLO 6~ 1 . la presión (B = 2.c+ac-bc+abc] 411 = -[-4-1 +(-1). 200bpm _ 11)=-4 '---l+1 -7730PSi Presión(B) a=1~. 1 AC= -[(1)-a+b-ab.2:. Las sumas de cuadrados se calculan con la ecuación 6-18 de la siguiente manera: 1 1 SS = (24)2 = 36.2+ 11] 8 = -[2]= 025 2 .6-3 EL DISEÑO 23 be =2 abe =11 233 e =-1 250 bpm + ~--"""I--"" Velocidad (e) I I I ".00). si bien el efecto de la interacción no parece tener un impacto tan grande sobre la desviación de la altura de llenado como los efectos principales... BC= -[(1)+a-b-ab-c-ac+bc+abc] 411 = -[-4+1-(-1)-5-(-1). 25 psi 12% 10% Carbonatación (A) Figura 6·6 El diseño 23 para el experimento de la desviación de la altura de llenado del ejemplo 6-1. la velocidad (C = 1.3+2+11] 8 = -[4]= 050 8 . Los efectos más grandes son para la carbonatación (A = 3..25 16 e SS = (14)2 16 = 12.75) Yla interacción carbonatación-presión (AE = 0.-2.2.00 A 16 SS B = (18)2 = 20.75).5+(-1)+1-(-4)] = -[4]= 050 8 . y 1 1 1 1 1 1 AEC= 411 [abc-bc-ac+c-ab+b+a-(1)] = 8[11.5.25 .).25).(-1)+3..3+(-1). 28205 1.88462 0.60 3.00 78.00 1. Observe que los efectos principales dominan en realidad este proceso.625 AB AC BC ABC Error Total Fa 57.5447 0.25 16 = (2)2 = 0.234 CAPÍTULO 6 DISEÑO FACTORIAL 2" Tabla 6-5 Factor Resumen de la estimación de los efectos del ejemplo 6-1 Estimación del efecto 3.00 20.2415 0. explicando más de 87% de la variabilidad total.320513 1.25 2.75 0.0022 0.25 2.00 78.00 16 SS AC SS BC y SS ABC = (4)2 = 1.0943 0.00 1 1 1 1 1 1 1 8 15 Cuadrado medio 36. SSE = 5.25 0.25 1.25 1.25 12.28205 6. La columna etiquetada "contribución porcentual" mide la contribución porcentual de cada uno de los términos del modelo a la suma de cuadrados total.00 1.40 1.00 20.25 2.25 0. mientras que la interacción AB explica menos de 3%.00 16 La suma de cuadrados total es SST = 78.0005 0.60 1.41026 A B C AB AC BC ABC Error puro Total ss AB = (6)2 = 2.25 0.25 16 =(4)2=1.00 20.40 19.60 Valor P <0.00.25 12. Por la tabla 6-6 se observa que los efectos principales son altamente significativos (todos tienen valores P muy Tabla 6-6 Análisis de varianza de los datos de la altura de llenado Fuente de Suma de Grados de variación cuadrados libertad Porcentaje de carbonatación (A) Presión (B) Velocidad de línea (C) 36.25 1.00.00 0. Ypor sustracción.60 0.2415 .00 5.75 0.1538 25. La contribución porcentual es con frecuencia una guía aproximada pero efectiva de la importancia relativa de cada término del modelo.00 Contribución porcentual 46. En la tabla 6-5 se resumen las estimaciones de los efectos y las sumas de cuadrados.25 0.50 0.60 32.00 1.25 1.7051 2. El análisis de varianza de la tabla 6-6 puede usarse para confirmar la magnitud de estos efectos.50 Sumas de cuadrados 36.25 12.00 2.0001 0.9615 15.00 5. 63 está probando las hipótesis Ha: /31 = /32 = /33 = /312 = H 1 : al menos una /3 ~ ° /313 = /323 = /3123 = ° .ti 6-3 EL DISEÑO 23 235 pequeños). El término X 1X 2 es la interacciónAB.. Quizá el lector quiera referirse al ejemplo 5-3 para la interpretación práctica de este experimento......x 2 + (1.00+ (-2-2. existe una ligera interacción entre la carbonatación y la presión.:od. . . En la parte superior de la tabla se presenta el análisis de varianza del modelo completo. .. donde las variables codificadas Xl' X 2 YX 3 representan a A...69 0. El análisis de estos residuales se deja como ejercicio para el lector..75) 2 X 3 + (0...... el estadístico = _M_S----::. Se consiguió así una reducción sustancial en la desviación de la altura de llenado del valor objetivo. El modelo de regresión y la superficie de respuesta El modelo de regresión para predecir la desviación de la altura de llenado es y= ~a +~lX1 +~2X2 +~3X3 +~12X1X2 3.. se muestra en la tabla 6-7.. En la figura 6-7 se muestra la superficie de respuesta y la gráfica de contorno para la desviación de la altura de llenado obtenida con el modelo de regresión. .....75) 2 X 1X 2 .... El formato de esta presentación es un tanto diferente de los resultados dados en la tabla 6-6. . Observe que el primer renglón del análisis de varianza es un resumen global del modelo completo (todos los efectos principales y las interacciones)....::.. entonces hay varias combinaciones de los niveles de la carbonatación y la presión que satisfarán este objetivo. B Ye. suponiendo que la velocidad de línea está en el nivel alto (x 3 = 1).. .0 F.. .... parlo tanto.00) Xl + (2....... Design-Expelt.:M.. y la suma de cuadrados del modelo es .. respectivamente.. La salida de uno de estos programas de computadora..:.. .. será necesario ejercer un control preciso de estas dos variables. Sin embargo. La gráfica de contorno indica que si la velocidad de línea está en el nivel alto...... Los responsables del proceso decidieron correrlo con presión baja y velocidad de línea alta.. .. Observe que como el modelo contiene la interacción. y reducir la variabilidad de la carbonatación controlando con mayor precisión la temperatura. La interacciónAB es significativa con un nivel aproximado de 10%. Los residuales pueden obtenerse como la diferencia entre las desviaciones de la altura de llenado observada y la predicha.o MS E 10........ Es deseable operar este proceso de llenado de tal modo que la desviación del llenado esté tan cerca de cero como sea posible... las líneas de contorno de la desviación de las alturas de llenado constantes son curvas (o la superficie de respuesta es un plano "torcido")...:el...... SSModelo = SSA +SSB +SSc +SSAB +SSAC +SSBC +SSABC = 73.43 = 16. Solución por computadora Hay muchos paquetes de software de estadística que establecerán y analizarán diseños factoriales con dos niveles.25) = 1. a Por lo tanto... 00 10.00 L.00 26. a.-----:-~:__---L=--~":_:_-__:'":":'::____:'"::":=_-_=' 10.67 25.00 al La superficie de respuesta 30.\ 10.50 26.20 10. .00 29.375 -0.¡¡.60 11.00 "'''''61¡ 11.-~--" 29. ~ 27.o" "" "" 12. con la velocidad en el nivel alto (250 bpm).00 ~-~-'---or-r---r---"'-~--.875 y 1.17 c: -o . ejemplo 6-1.80 \'Oc\b<.00 28.4O C'O~ 0<'\'0 25.3750 "" 30.00 Carbonatación b) La gráfica de contorno Figura 6-7 Superficie de respuesta y gráfica de contorno de la desviación de la altura de llenado..00 .00 12.00 27.í 236 CAPÍTULO 6 DISEÑO FACTORIAL 2k 4. 00 +1.71 0.00 A 57.13 *8 +0.60 1 1.00 1 1.60 AB 0.00 1 36.00000E-00: *Carbonation *Pressure *Speed Reduced Model: Response: FiII Deviation in Height ANOVA for Selected Factorial Model Analysis of variance table [Partial sum of squares] 237 .00 1.21 High 1.20 0.0943 0.081 -0.25 1 0.06 20.25 0.040000 *Pressure *Speed +4.20 0.50000 +21.25 1 2.00 1.V.67 0.20 0.0003 <0.00 1.2415 0.20 0.25 *A *8 *C Final Equation in Terms of Actual Factors: FiII Deviation = -225.00 1.96 1.88 *C +0.2415 significant 950/0 Cl 95% CI Low 0.38 *A *8 +0.13 0.50 1.43 Model 36.69 73.7436 13.00 1.0001 0.20 0.10500 *Carbonation *Speed -0.000 O Lack of Fit 0.20 0.20 0.5447 0.Tabla 6-7 Salida de Design-Expert para el ejemplo 6-1 Response: FiII Deviation in Height ANOVA for Selected Factorial Model Analysis of variance table [Partial sum of squares] Sum of Mean F Squares DF Square Value Source 16.25 1 12.58 0.0022 0.20 0.25 *8 *C +0.416 Prob> F 0.25 AC 0.46 1.60 C 2. PRESS Factor Intercept A-Carbonation B-Pressure C-Speed AB AC BC ABC 0.42 -0.00 1.00 1.00 79.33 0.25 19.38 0.08000 *Speed -0.80000 *Pressure + 1.40 B 12.54 1.00 1.88 0.25 3.00 Final Equation in Terms of Coded Factors: FiII Deviation = +1.63 Residual 0.00 15 Cor Total Std.60 ABC 5. Mean C.58 1.79 1.9359 0.0005 0.00000 *Carbonation +7.13 0.71 VIF 1.50 *A +1.00 BC 1.00 8 Pure Error 78.00 7 10.21 -0.00 Coefficient Estimate 1.04 0.13 *A *C +0.8798 0.25 R-Squared Adj R-Squared Pred R-Squared Adeq Precision DF 1 1 1 1 1 1 1 1 Standard Error 0.40 1.33 -0.83 0.75000 *Carbonation *Pressure -0.63 5.Dev.00 8 0.00 1.60 2~25 1 2~25 32. 078 0.928 0.05 0. Dev.313 0.186 1.37 0.254 0.20 0.0002 0.~'.254 0.00 20.50 *A +1.00 15 4.00 20.13 2 0.0012 0.88 16 5.313 0.25 Residual Lack ofFit Pure Error 12.12 -1.00 +1.3700 significant 12.15000 *Carbonation *Pressure Diagnostics Case Statistics Standard Actual Predicted Order Value Value -3.845 -0.003 Outlier t -1.0917 0.34 DF 4 1 1 1 1 11 3 8 15 Mean Square 17.177 -0.000 3 0.00 81.845 -0.25 F Value 26.59 3.37 9 10 0.00 1.177 -0.62500 *Carbonation -1.13 -0.13 -0.38 *A *B Final Equation in Terms of Actual Factors: FiII Deviation = +9.00 7 3.186 1.557 0.000 -0.63 -1.300 -0.424 95% CI Low 0.20 0.347 -0.00 -0.88 -0.13 3.V.186 -0.25 2.313 0.003 0.12 1.154 0.177 -1.88 0.63 18.928 -1.25 7.154 0.'~:':j1 ~~:~ :~~~ Final Equation in Terms of Coded Factors: FiII Deviation = +1.88 -0.00 -0.313 0.12 0.313 0.72 Prob> F <0.88 *C +0.13 -0.Tabla 6-7 (continuación) Source Model A B AB Sumof Squares 70.313 0.41 1.254 0.313 0.300 -0.300 1.13 1.00 4.922 -1.671 -0.035000 *Speed +0.347 1.313 0.00 -2.078 0.62 30.13 -0.003 0.69 36.347 -0.13*B +0.0001 <0.45 1.00 12 1.63 0.18 15.88 1.072 95% CI High 1.313 0.00 1.:1 .88 13 1.13 6.: j~: Residual -0.43 -0.75 0.539 0.00 1.38 0.95 1.922 0.003 0.37 2.000 6 2.50 1.68 0.32 0. Mean C.00 -2.557 0.~:-.88 Student Residual -1.539 0.00 0.00 11 1.00 1.25 5.20 0.8033 15.313 238 .845 0.671 0.20 0.313 0.13 1 -1.13 Leverage 0.55 1.63 0.57 1.62500 -2.00 3.177 I.00 14 1.003 0.38 w' '.003 0.63 5 -0.25 2.25 0.13 0.00 Cor Total Std.028 0.81 1.82 VIF 1.00 4 0.313 0.88 1.25 2.177 1.313 0.20 not significant R-Squared Adj R-Squared Pred R-Squared Adeq Precision DF 1 1 1 1 1 Standard Error 0. PRESS Factor Intercept A-Ca rbo natio n B-Pressure C-Speed AB 78.66 0.13 0.177 1.84 54.154 0.186 -1.20 0.186 -0.00 Coefficient Estimate 1.313 0.00 1.0001 0.9071 0.13 8 -1.671 -0.313 0. .13 1.20000 *Pressure +0.13 -0.8733 0.186 Cook's Distance 0.028 0.75 e 36.313 0. k = A n2 ~O..625 = 0. excepto la i-ésima). ~ +t O. N es el número total de corridas en el experimento (16). se concluiría que al menos una de las variables tiene un efecto diferente de cero. En la última sección de la tabla 6-7 se ilustra la salida después de eliminar los términos de las interacciones no significativas. Thmbién se presenta el modelo completo en términos de las variables codificadas y de las variables naturales.00/15' es un estadístico que está ajustado para el "tamaño" del modelo. definido como R 2. Estos resultados concuerdan con la tabla 6-6. y se calcula a partir de los errores de predicción obtenidos al predecir el punto i-ésimo de los datos con un modelo que incluye todas las observaciones.t O. Este modelo reducido contiene ahora sólo los efectos principales A. y la interacciónAB. Ajustada =1- SSTotal SSEldfE =1. El estadístico "R2 de predicción" se calcula como R2 .PRESS = 1.025. compuesto por las sumas de cuadrados de las interacciones que se eliminaron del modelo (Be.20. Abajo del análisis de varianza del modelo completo se presentan varios estadísticosR2 • LaR 2 ordinaria es R2 = SSModelo = 73. El estadístico PRESS es una medida de qué tan bien predecirá datos nuevos el modelo (PRESS es en realidad el acrónimo de Prediction En'or Sum ofSquares -suma de cuadrados del error de predicción-. es decir. La R 2 ajustada puede decrecer en realidad si se agregan términos no significativos al modelo. definido como ~ se(f3) = V V(f3) = ~MSE . La siguiente sección de la salida presenta el coeficiente de regresión de cada término del modelo y el error estándar (se.9359 SSTotal 78. y p es el número de parámetros del modelo (8). El estadístico R 2 ajustada. By C.N_pse(~):o:. standard error) de cada coeficiente.• Predlcclon = 1." 6-3 EL DISEÑO 23 239 puesto que F o es grande. Un problema potencial con este estadístico es que siempre se incrementa cuando se agregan factores al modelo.20 2(8) Los intervalos de confianza de 95% para cada coeficiente de regresión se calculan a partir de ~ .00 = 0. incluso cuando estos factores no son significativos.025.00 y mide la proporción de la variabilidad total explicada por el modelo. Un modelo con un valor pequeño de PRESS indica que es posible que el modelo sea un buen predictor. AC y ABC). f3:O:.5. es decir.N-pse(~) donde los grados de libertad de t es el número de grados de libertad del error. La suma de cuadrados de los residuales o del error se compone ahora de un componente del error puro ("Pure Error") que surge de las réplicas de los ocho vértices del cubo. para el número de factores. la representación del modelo de regresión de los resultados experimentales se presenta en términos de las variables codificadas y las variables na- .00/8 =08798 1 dfTotal 78.7436 SS Total 78 • 00 Esto indica que se esperaría que el modelo completo explique cerca de 74% de la variabilidad de los datos nuevos. De nueva cuenta. y un componente de falta de ajuste ("Lack of Pit").00 = 0. Entonces se prueba la significación de cada efecto factorial individual utilizando el estadístico F. Design-Expel1 también construirá todas las gráficas de los residuales que se estudiaron anteriormente.240 CAPÍTULO 6 DISEÑO FACTORIAL 2k turales.. Yin son las observaciones de la corridai-ésima.. Existen varios métodos más que son útiles. . Evidentemente. Observe que los intervalos de confianza para los coeficientes de regresión del modelo reducido son ligeramente más cortos que los intervalos de confianza correspondientes en el modelo completo. entonces i = 1. Por lo tanto. 2. que se ilustrará en la sección 6-5. V(Contraste) = n2 k 0 2 . La proporción de la variabilidad total de lá desviación de la altura del llenado que se explica por este modelo es R2 = SS Modelo = 70..~~lste ) k-l 1 (n2 )- ? V(Contraste) Cada contraste es una combinación lineal de los 2k totales de los tratamientos. Si se supone que hay n réplicas en cada una de las 2k corridas del diseño. A continuación se indica cómo calcular el error estándar de los efectos y cómo usar los errores estándar para construir intervalos de confianza para los efectos. La varianza de la estimación de cada efecto es V(Efecto) = V (c:n. sin embargo. 2k es una estimación de la varianza de la corrida i-ésima.00 que es menor que laR 2 del modelo completo. que laR 2 ajustada del modelo reducido apenas ha cambiado ligeramente respecto de laR 2 ajustada del modelo completo. Es sencillo encontrar el error estándar de un efecto. Otros métodos para evaluar la significación de los efectos El análisis de varianza es una manera formal de determinar cuáles son los efectos de los factores que son diferentes de cero.. Las estimaciones de la varianza del diseño 2k pueden combinarse para dar una estimación de la varianza global: (6-19) Ésta es también la estimación de la varianza dada por el cuadrado medio del error en el análisis de varianza.9071 SSTotal 78. En la última sección de la salida se presentan los residuales del modelo reducido. lo cual produce un valor más grande de R. y PRESS del modelo reducido es considerablemente menor. utiliza gráficas de probabilidad normal para valorar la importancia de los efectos. la eliminación de los términos no significativos del modelo completo ha producido un modelo final que posiblemente funcionará con mayor eficiencia como predictor de datos nuevos. Otro método... y si Yi!' Yi2' . y cada total consta de n observaciones. Observe.rediccióo del modelo reducido.75 = 0. ¿alguno de los factores afecta la variabilidad de la desviación de la altura de llenado de una .92 Este análisis indica queA. Por lo tanto. es decir.92 ABC: 0.025 • gSe(Efecto) :=: 2.92.JOJ?E ~2(23 ) :=: 0.31 y t O. porque son las únicas estimaciones de los efectos de los factores para las que los intervalos de confianza de 95% aproximados no incluyen al cero.92 AB: 0.40 Entonces.p :=: número total de corridas . (6-20) n2 Observe que el error estándar de un efecto es el doble del error estándar de un coeficiente de regresión estimado en el modelo de regresión del diseño 2k (ver la salida de computadora de Design-Expel1 del ejemplo 6-1).40) 95% aproximados para los efectos de los factores son :=: 0. By C son factores importantes. considere el experimento de la desviación de la altura de llenado del ejemplo 6-1." 6-3 EL DISEÑO 23 241 y la varianza de un efecto es V(Efecto):=: :=: (n2 :-1 ) 2n2 a k 2 1 ? -ak 2 n2 2a .025.92 AC: 0.75±0.Jn2 k :=: El error estándar estimado se encontraría sacando la raíz cuadrada de esta última expresión y sustituyendo ¿ con su estimación S2: .92 BC: 0.número de parámetros del modelo). Para ilustrar este método.8 :=: 2.92 C: 1. Los intervalos de confianza de 100(1 .25±0. donde los grados de libertad de t son sólo los grados de libertad de los residuales o del error (N . Efectos de dispersión El ingeniero de proceso que trabajó en el caso del llenado también se interesó en los efectos de dispersión. 2S se(Efecto):=:. de donde los intervalos de confianza de A: 3.31(0. tO.50±0. El cuadrado medio del error esMSE :=: 0.75±0.J k.00±0.92 B: 2.a) por ciento para los efectos se calculan a partir de Efecto ± ta/2.50±0. el error estándar de cada efecto es (utilizando S2 :=: MSE) se(Efecto):=: :=: vn2 k ~ 2S 2.25±0.N_pSe(Efecto).625. ab. para un diseño 2k el modelo completo contendría 2k -1 efectos.242 CAPÍTULO 6 DISEÑO FACTORIAL 2k R=O R= 1 R= 1 250 bpm Velocidad (e) +~--~I--"" I I I . ad. (~) interacciones de tres factores. suele emplearse un paquete de software de computadora en este proceso de análisis... 3. A estas alturas. a. 2. el orden estándar de un diseño 24 es (1). ~_. Estimar los efectos de los factores Formar el modelo inicial Realizar las pruebas estadísticas Refinar el modelo Analizar los residuales Interpretar los resultados . be. en un diseño 25.. Como se señaló anteriormente. bd. Las combinaciones de los tratamientos pueden escribirse en orden estándar introduciendo los factores uno a la vez y combinando sucesivamente cada nuevo factor con los que lo preceden. no hay evidencia sólida que indique que alguna de las variables del proceso afecte directamente la variabilidad de la desviación de la altura de llenado en el proceso. 4.~!.--------:-:" 10% 12% Carbonatación (A) Figura 6-8 Rangos de la desviación de la altura de llenado del ejemplo 6-1. Por consiguiente. El enfoque general para el análisis estadístico del diseño 2k se resume en la tabla 6-8. b. De este modo el experimentador obtiene inTabla 6-8 Procedimiento de análisis para un diseño 2" 1. es decir. Presión (B) .. ed. 6. los tratamientos.. Por ejemplo. d."~ 200 bpm R =_2F-" R=ll__ -7730 + 25 psi R=1 psi R_=~1.. 6~4 EL DISEÑO GENERAL 2k Los métodos de análisis que se han presentado hasta este punto pueden generalizarse para el caso de un diseño factorial2k. un diseño con k factores que tfenen dos niveles cada uno. Thmbién se usa aquí la notación introducida anteriormente para las combinaciones de . bed y abed. la secuencia de pasos de la tabla 6-8 debe resultar familiar. El modelo estadístico para un diseño 2k incluiría k efectos principales. El primer paso es estimar los efectos de los factores y examinar sus signos y magnitudes. Observe que los rangos son aproximadamente iguales para las ocho corridas del diseño. abd. By D en el nivel alto y los factores e y E en el nivel bajo. ae. abd denota la combinación de tratamientos con los factoresA. 5.. Es decir. abe. Por ejemplo. e. aed. oo. y una interacción de k factores. corrida a otra? Una manera de responder esta pregunta es examinando el rango de las desviaciones de la altura de llenado para cada una de las ocho corridas del diseño 23 • Estos rangos se grafican en el cubo de la figura 6-8. (~) interacciones de dos factores. ti 6-4 EL DISEÑO GENERAL 2k 243 formación preliminar respecto de los factores y las interacciones que pueden ser importantes. primero debe determinarse el contraste asociado con ese efecto. todos los efectos principales y las interacciones. y puede usarse un método alternativo. Para formar el modelo inicial del experimento. Esto puede hacerse siempre utilizando una tabla de signos positivos y negativos. como la tabla 6-2 o 6-3. Aun cuando los cálculos descritos se realizan por lo general con una computadora.... Sin embargo. siempre que se haya hecho una réplica de al menos uno de los puntos del diseño (en la sección siguiente se revisa una modificación de este paso). y en qué direcciones deberán ajustarse estos factores para mejonrr la respuesta. En la tabla 6-9 se presenta la forma general de un análisis de varianza para un diseño factorial 2k con 11 réplicas. el contraste del efecto AB"K se determina expandiendo el miembro derecho de Contraste AB. en el paso 3 se usa el análisis de varianza para probar formalmente la significación de los efectos principales y las interacciones. Después. por lo general se elige el modelo completo. En ocasiones ocurrirá una refinación del modelo después del análisis residual. suele consistir en la eliminación de las variables no significativas del modelo completo. ) interacciones de tres factores ABC ABD IJK (Z ) = 1 interacción de k factores ABC···K Error Total SSABC. En general.. El paso 4.K = (a ± l)(b ± 1)·· ·(k ±1) Grados de libertad 1 1 1 1 1 1 1 1 1 (6-21) Tabla 6-9 Análisis de varianza de un diseño 2k Fuente de Suma de variación cuadrados k efectos principales A B K (~ ) interacciones SSA SSB SSK de dos factores SSAB SSAC SSJK SSABC SSABD SSIJK AB AC JK (. El último paso consiste generalmente en el análisis gráfico: gráficas de los efectos principales o las interacciones. El paso 5 es el análisis residual usual para verificar la adecuación del modelo y los supuestos. o superficies de respuesta y gráficas de contorno. para valores grandes de k esto resulta laborioso. Para estimar un efecto o calcular la suma de cuadrados de un efecto. refinar el modelo. si se encuentra que el modelo es inadecuado o que hay violaciones serias de los supuestos.K SSE SST 1 2k (n -1) n2 k -1 . es decir. en ocasiones es necesario calcular manualmente la estimación de un efecto o la suma de cuadrados de un efecto. 6~5 UNA SOLA RÉPLICA DEL DISEÑO 2k Incluso para un número moderado de factores. Para ilustrar el uso de la ecuación 6-21. pueden estimarse los efectos y calcular las sumas de cuadrados de acuerdo con 2 AB . un diseño 25 tiene 32 combinaciones de tratamientos.11' i 244 CAPÍTULO 6 DISEÑO FACTORIAL 2k Para expandir la ecuación 6-21 se usa el álgebra ordinaria reemplazando "1" con (1) en la expresión final. la posibilidad de una conclusión errónea será más reducida.abee .bed . si la respuesta y es sumamente variable. etc. el número total de combinaciones de tratamientos en un diseño factoria12k es grande.a . Por consiguiente.abde . donde n denota el número de réplicas.b. Sin embargo.ce .. Por ejemplo.b Como un ejemplo más. los recursos disponibles permiten hacer únicamente una sola réplica del diseño.K) (6-22) y SS AB' .de . el experimentador obtiene en realidad las dos respuestas medidas representadas por los puntos negros. un diseño 2 6 tiene 64 combinaciones de tratamientos. Un riesgo obvio cuando se realiza un experimento que tiene una sola corrida para cada combinación de prueba es que el modelo puede ajustarse al ruido...a.d . Ahora bien. como se ilustra en .. El signo de cada grupo de paréntesis es negativo si el factor está incluido en el efecto y es positivo si el factor no está incluido. Otra forma de asegurarse de que se obtienen estimaciones confiables de los efectos es incrementando la distancia entre los niveles bajo (-) y alto ( +) del factor..be . Con frecuencia. En esta figura.K 2 ) (6-23) respectivamente. · K = n2 k (Contraste AB . el número de réplicas que el experimentador puede emplear quizás esté restringido. pueden resultar conclusiones engañosas del experimento. en un diseño 25. si hay menos variabilidad en la respuesta.abe .aede . debido a la variabilidad aleatoria presente en la variable de respuesta (representada por la franja sombreada).e .bede Una vez que se han calculado los contrastes de los efectos. Se cuenta también con un algoritmo tabular debido al Dr. la línea recta representa el verdadero efecto del factor. La situación se ilustra en la figura 6-9a.ae . Es decir. considere un diseño factorial 2 3• El contraste deAB sería Contraste AB = (a-1)(b-1)(e+1) = abe + ab + e + (1) ae .abd .be . a menos que el experimentador esté dispuesto a omitir algunos de los factores originales. Frank Yates que en ocasiones puede ser útil para el cálculo manual de las estimaciones de los efectos y las sumas de cuadrados.. Debido a que por lo general los recursos son limitados. Referirse al material suplementario del texto de este capítulo. el contraste de ABCD sería Contraste ABCD = (a-1)(b-1)(e-1)(d-1)(e+1) =abede + ede + bde + ade + bee + aee + abe + e + abed + ed + bd +ad +be+ae+ab+(l). el efecto del factor estimado está cerca de cero y el experimentador ha llegado a una conclusión errónea respecto de este factor.K = n2 k 1 (Contraste AB .aed . Una forma de abordar este análisis de un diseño factorial no replicado consiste en suponer que algunas interacciones de orden superior son insignificantes y combinar sus cuadrados medios para estimar el error. la figura 6-9b. Una sola réplica de un diseño 2k se denomina en ocasiones diseño factorial no replicado. no se cuenta con ninguna estimación interna del error (o "error puro"). x bl Separación agresiva de los niveles del factor Figura 6-9 El impacto de la elección de los niveles del factor en un diseño no replicado. Con una sola réplica. . una buena práctica en este tipo de experimentos es separar los niveles de los factores de manera agresiva. Debido a que en estos casos nunca puede tenerse la certeza absoluta de que el error experimental es pequeño. Quizás el lector encuentre útil releer las pautas generales para elegir los niveles de los factores del capítulo 1. Esto es una apelación al principio de efectos esparcidos. es decir. y la mayor parte de las interacciones de orden superior son insignificantes. Observe que en esta figura la distancia incrementada entre los niveles bajo y alto del factor resulta en una estimación razonable del verdadero efecto del factor. x al Distancia pequeña entre los niveles del factor Verdadero efecto del factor Efecto estimado del factor + Factor. la mayoría de los sistemas están dominados por algunos de los efectos principales y las interacciones de orden inferior.6-5 UNA SOLA RÉPLICA DEL DISEÑO 2k 245 Verdadero efecto del factor Efecto estimado del factor + Factor. El uso de la estrategia de una sola réplica es común en los experimentos de exploración cuando hay un número relativamente grande de factores bajo consideración. con base en la gráfica de probabilidad normal. ocasionalmente ocurren interacciones de orden superior reales. El análisis de estos datos se iniciará construyendo una gráfica de probabilidad normal de las estimaciones de los efectos. Daniel sugiere examinar una gráfica de probabilidad normal de las estimaciones de los efectos.246 CAPÍTULO 6 DISEÑO FACTORIAL 2k Cuando se analizan datos de diseños factoriales no replicados. en el proceso actual la concentración de formaldehído. la presión (B). se usa en el nivel alto. el modelo preliminar se especificará de tal modo que contenga aquellos efectos que aparentemente son diferentes de cero. La matriz del diseño y los datos de la respuesta obtenidos de una sola réplica del experimento 24 se muestran en la tabla 6-10 y en la figura 6-10. factor C. y tenderán a localizarse sobre una línea recta en esta gráfica. con media cero y varianza cT. Las condiciones actuales del proceso producen índices de filtración de alrededor de 75 gal/h. Una sola réplica del diseño 24 Un producto químico se fabrica en un envase presurizado. Al ingeniero le gustaría reducir la concentración de formaldehído lo más posible. Se lleva a cabo un experimento factorial en la planta piloto para estudiar los factores que se piensa influyen en el índice de filtración de este producto. Por lo tanto. La formación de signos positivos y negativos para las constantes de los contrastes lF. El ingeniero del proceso está interesado en maximizar el índice de filtración. 11" Tabla 6-10 Experimento del índice de filtración en la planta piloto Número de corrida Factor A B e D Etiqueta de la corrida Índice de filtración (gal/h) 1 2 3 4 5 6 7 8 9 10 11 + + + + + + + + + + + + + + + + (1) a b ab 45 71 + + + + e 12 13 14 15 16 + + + + + + + + + + + + ae be abe d ad bd abd ed acd bed abed 48 65 68 60 80 65 43 100 45 104 75 86 70 96 . mientras que los efectos significativos tendrán medias diferentes de cero y no se localizarán sobre la línea recta. la concentración del formaldehído (C) y la velocidad de agitación (D). Las 16 corridas se hacen de manera aleatoria. Los cuatro factores son la temperatura (A). Asimismo. Los efectos que son insignificantes siguen una distribución normal. El uso de un cuadrado medio del error que se obtiene agrupando las interacciones de orden superior no es apropiado en estos casos. Un método de análisis atribuido a Daniel [35a] proporciona una forma simple de resolver este problema. Cada factor está presente con dos niveles. Los efectos aparentemente insignificantes se combinan como una estimación del error. pero no ha podido hacerlo porque siempre produce índices de filtración más bajos. EJEMPLO 6~2 . Las interaccionesAC y AD se grafican en la figura 6-12b. C y D con dos réplicas. C y D en la matriz del diseño que se muestra en la tabla 6-10 y observando que esas columnas forman dos réplicas de un diseño 23• En la tabla 6-13 se resume el análisis de varianza de los datos utilizando este supuesto de simplificación. . de tal modo que el diseño se convierte en un factorial 23 enA. del diseño 24 se muestra en la tabla 6-11. Esto es fácil de ver examinando únicamente las columnas A. los tres factores se correrían en el nivel alto a fin de maximizar el índice de filtración. Las conclusiones que se sacarían de este análisis se mantienen enesencia sin cambios respecto de las del ejemplo 6-2. Los efectos importantes que surgen de este análisis son los efectos principales de A. y si sólo se consideraran estos efectos principales. y las sumas de cuadrados se presentan en la tabla 6-12. Todos los efectos que caen sobre la recta son insignificantes. se tiene ahora tanto una estimación de la interacciónACD como una estimación del error basada en lo que en ocasiones se denomina réplica oculta. A partir de estos contrastes pueden estimarse 15 efectos factoriales. En la figura 6-11 se muestra la gráfica de probabilidad normal de estos efectos. otro de los objetivos del experimentador. que el efecto de la temperatura es muy pequeño cuando la concentración está en el nivel alto y muy grande cuando la concentración está en el nivel bajo. por la interacciónAC. obteniéndose los mejores resultados con la concentración baja y la temperatura alta. Puesto que B (presión) no es significativa y todas las interacciones en las que interviene B son insignificantes. siempre es necesario examinar cualquier interacción que sea importante. mientras que los efectos grandes están apartados de ella. Por lo tanto. Recuerde que los efectos principales no tienen mucho significado cuando están presentes en interacciones significativas. Observe que al hacer la proyección de la réplica única del diseño 24 en un diseño 23 con dos réplicas. Los efectos principales de A. Observe." 6·5 UNA SOLA RÉPLICA DEL DISEÑO 2k 247 r----I D + ctL A Figura 6-10 Datos del experimento del índice de filtración en la planta piloto para el ejemplo 6-2. C y D Ylas interacciones ACyAD. La interacciónAD indica que la velocidad de agitaciónD tiene un efecto reducido con una temperatura baja. los mejores índices de filtración parecerían obtenerse cuandoA y D están en el nivel alto y C está en el nivel bajo. Estas interacciones son la clave para resolver el problema. Sin embargo. B puede descartarse del experimento. Proyección de un diseño Es posible hacer otra interpretación de los efectos de la figura 6-11. Los tres efectos son positivos. Esto permitiría la reducción de la concentración de formaldehído a un nivel más bajo. pero un efecto positivo grande con la temperatura alta. C y D se grafican en la figura 6-12a. nfg'nr~~~n~.~ "~~ .¡:.1(1 n~~n~\~Ll~~7... 00 N Tabla 6-11 (1) Constantes de los contrastes del diseño 24 A - B - AB C AC BC + - - + - a b ab c + - - + + - ABC - D - AD BD ABD - CD ACD - BCD - ABCD + - + - + + - + - + + - + + - + - + + - + + - - ac bc abc d ad bd abd cd acd bcd abcd + - - + - + + - + + - + + + + - + - - + - - - + + + + - + + + + + + + + + - + - + + - + + - + + - + - - + - + + - - + + + + - + - + + + - - + + + + - + + - + - + - + + - + + - + - - + + + + + + + + - + - - + - + + + - + + + + + + + + + - + - - + + - + - + + - + - + + - + - - + + + + + + + + + - + + + . 875 14.875 4.0625 1314.625 -2.125 9.125 -1.375 Suma de cuadrados 1870.375 -0.5625 5.480942 0.0625 10.681608 6.375 -1.125 1.0625 68.80626 14.18763 0.625 2.625 1.c ro 50 30 20 10 5 e o.625 3.9288 0.5625 27.00109057 22.56 22.0625 14.6397 0.125 16.5625 Contribución porcentual 32.ti 6-5 UNA SOLA RÉPLICA DEL DISEÑO 2k 249 Tabla 6-12 Estimaciones de los efectos de los factores y sumas de cuadrados del diseño factorial 24 del ejemplo 6-2 Término del modelo Estimación del efecto 21. .5625 0.62 Efecto Figura 6-11 Gráfica de probabilidad normal de los efectos para el diseño factorial 24 del ejemplo 6-2.2911 0.125 -18.0883363 0.56 39.393696 0.131959 A B C D AB AC AD BC BD CD ABC ABD ACD BCD ABCD 99 95 90 ro 1J 80 E o c: 70 ~ :¡. ro o• • C AC AO • A .9293 19.245379 1.062 855.625 0.0625 390.06 1105.00981515 0.563 0.184307 0.5625 7. 1J ~ o " 111 21. '0 E e '13 al "C al tJ 70 ii= ~ 60 / A Interacción AC 80 70 60 / C 70 60 / D '5 .06 855.9 o CAPÍTULO 6 DISEÑO FACTORIAL 2k 90 90 80 1j 80 e o.56 1314.0001 <0.0001 <0.250 ~ ro 90 .27 <1 <1 Valor P <0.56 390.56 5.56 390.0001 <0.06 10.38 38.13 58.9 90 o '5 al ro E 80 '0 e '13 ~ e o.36 17.56 49.06 855.0001 n AC AD cn ACn Error Total .0001 <0.52 5730. 70 60 ~ al "C al tJ '5 .56 179. Gráficas de los efectos principales y las interacciones para el ejem- Tabla 6-13 Análisis de varianza del experimento del índice filtración en la planta piloto en A. C y D Fuente de variación A C Suma de cuadrados 1870.06 10.56 1314.E SO 40 A SO 40 A b) Gráficas de las'interacciones + Figura 6·12 plo 6-2.E 50 SO SO al Gráficas de los efectos principales § 100 C=- 100 90 80 70 60 .56 5.06 1105.94 Grados de libertad 1 1 1 1 1 1 1 8 15 Cuadrado medio 1870.56 22.06 1105.44 83. 40 e =y-y -1.23 3.35 2. C = 9.125 YAD = 16.625. y (1) y 46. El índice de filtración predicho para la corrida (1) es y= 70.y para las 16 observaciones. Los puntos de esta gráfica se localizan razonablemente próximos a una línea recta. A continuación se pre- = 46. AC yAD son los únicos efectos significativos y que se satisfacen los supuestos fundamentales del análisis.14 74. En general. entonces los datos originales corresponden a un diseño factorial completo con dos niveles en los k .~25) (-1)(-1) = -1. si se tiene una sola réplica del diseño 2\ y si h (h < k) factores son insignificantes y pueden descartarse.77 -6.65 44.39 -6.22 1.06 es la respuesta promedio y las variables codificadas Xl' X 3.22 69.875. X4 asumen valores entre -1 y + 1.AC = -18.22 69.625.86 -1.625." 6-5 UNA SOLA RÉPLICA DEL DISEÑO 2k 251 El concepto de proyectar un diseño factorial no replicado en un diseño factorial con réplicas en menoS factores es muy útil. . Verificación de diagnóstico Deberán aplicarse las verificaciones de diagnóstico usuales a los residuales de un diseño 2k • El análisis realizado indicaquelos únicos efectos significativos sanA = 21.22 100. D.40 72.D·= 14. y y e = y .40 -2.23 61.39 74.65 72.~25)(-1) (18~25) (-1)(-1)+ (16.23 -1.78 3.22 -0.60 a b ab e ae be abe d ad bd abd ed aed bed abed 45 71 48 65 68 60 80 65 43 100 45 104 75 86 70 96 En la figura 6-13 se muestra la gráfica de probabilidad normal de los residuales.h factores restantes con 2" réplicas.22 100.77 3.~25) _ (-1)+ (9.65 0.14 44.23 61.23 92. Si esto es correcto. los índices de filtración estimados están dados por donde 70.22 Puesto que el valor observado es 45.22 sentan los valores de y.y = 45 .~75)(_1)+(14. C.61 1.39 46.14 5.46.22.78 -4. brindando apoyo a la conclusión de queA.06+(21. el residual es e = y .23 92. 125) -2.(8.375 -3.625) -2. -6.875) Y = 7006 .3125 Residual 2.n c. Cuando se hace Xl = 1 en el modelo de regresión se obtiene y= 80. o 38. -o Q) e 10 5 <Ji. Los contornos se generan a partir del modelo anterior conx4 = 1. En ocasiones es útil emplear la superficie de respuesta para este fin. 252 CAPÍTULO 6 DISEÑO FACTORIAL 2k 99 ro ro o c: -o E 80 70 .x 3 - (18. La figura 6-14b es la gráfica de contorno de la superficie de respuesta cuando la temperatura está en el nivel alto (es decir.71875 5. La superficie de respuesta Las gráficas de las interacciones de la figura 6-12 se utilizaron para ofrecer una interpretación práctica de los resultados de este experimento.X I X 3 + (16.X IX 4 En la figura 6-14a se muestra la gráfica de contorno de la superficie de respuesta cuando la velocidad de agitación está en el nivel alto (es decir.(2 .x 4 A .25) Xl + (9.625) 2 Xl + 2 x 3 + (14. X 4 = 1). La superficie de respuesta se genera por el modelo de regresión (9.X IX 3 Observe que los contornos son líneas curvas porque el modelo contiene un término de interacción.75 Figura 6·13 Gráfica de probabilidad normal de los residuales del ejemplo 6-2.875) y= 77. + (21.8725.1'11'1 1.125) .25) -2.625) 2 x4 A 18.25) 2 X 3 + (31.g 50 :o ro . Xl = 1).34375 -0.3725+ (-2-2. -_----lL...000 Temperatura.A (x.-.... Estos contornos son rectas paralelas porque el modelo contiene únicamente los efectos principales de los factores e (x3 ) y D (x 4 ). x4 = 1 1.J..000 0.333 > -0...l_ _._ _-I-_ _.----..._ _. La línea recta de la mitad de gráfica normal siempre pasa por el origen y deberá pasar también cerca del valor de los datos del percentil cincuenta.~ ro el Q) -c 'C il ID ro o -0.L..------..667 Concentración... Ambas gráficas de contorno indican que si se quiere maximizar el índice de filtración...J.667 -0. las variables A (Xl) y D (x4) deberán estar en el nivel alto y que el proceso es relativamente robusto para la concentración C.000 1 C¡ ¿ 'O '13 ..----ll-.667 _ 1' C...000 -0.0001oo:::::==-_l.... Es una gráfica del valor absoluto de las estimaciones de los efectos contra sus probabilidades normales acumuladas.. (x3) e b) Gráfica de contorno con la temperatura (A).000 -0.J -1.000 l.333 0..... En la figura 6-15 se muestra la mitad de gráfica normal de los efectos para el ejemplo 6-2.333 0.333 0.333 0.00 ¿ o() .-_--1_.. La mitad de gráfica normal de los efectos Una alternativa para la gráfica de probabilidad normal de los efectos de los factores es la mitad de gráfica normal.:::.000 .667 -0......6-5 UNA SOLA RÉPLICA DEL DISEÑO 2k 1.333 90.667 -1.J_ _L.J -1....000 0.667 -1.----l_l. 253 0..000 e Q) 8-0.~ 0. Se obtuvieron conclusiones similares a partir de las gráficas de las interacciones.333 c: " -0... x.667 1. Muchos analistas sienten que es más fácil interpretar la mitad de .-----r----r---.) a) Gráfica de contorno con la velocidad de agitación (D)..LL_ _.. = 1 Figura 6-14 Gráficas de contorno del índice de filtración. ejemplo 6-2..---.l 0. g lO e c. en particular si sólo se cuenta con pocas estimaciones de los efectos. Ramada y Balakrishnan [52] compararon algunos de estos métodos.00 5.22 21. estos contrastes corresponden a las m = 2k -1 estimaciones de los efectos de los factores.5 x mediana (Icji) y . DISEÑO FACTORIAL 2" 99 A 97 ~ ISJ AC 95 90 85 80 70 60 40 20 D ~ ~ 'E Ci ro ~ 19 c. Cm' Si el diseño es un factoria12k no replicado. gráfica normal. o 0. Encontraron que el método propuesto por Lenth [70] tiene una potencia adecuada para detectar efectos significativos. Otros métodos para analizar diseños factoriales no replicados El procedimiento de análisis estándar para un diseño factorial de dos factores no replicado es la gráfica normal (O mitad de gráfica normal) de los efectos estimados de los factores. como resultado.. Sean So =1. Algunos paquetes de software construirán ambas gráficas. ID 'ift. Se ofrece una breve descripción del método de Lenth. los diseños no replicados son tan usados en la práctica que se han propuesto muchos procedimientos formales de análisis para resolver la subjetividad de la gráfica de probabilidad normal.254 CAPÍTULO 6. .63 Figura 6-15 Mitad de gráfica normal de los efectos de los factores del ejemplo 6-2. por ejemplo el' C2. está empezando a aparecer en algunos paquetes de software para analizar datos de diseños factoriales no replicados. Sin embargo. E Ci c: :c oC lO ~ . Suponga que se tienen m contrastes de interés.81 Efecto 16. como cuando el experimentador ha usado un diseño de ocho corridas. También es fácil de implementar y.41 10.. La base del método de Lenth es estimar la varianza de un contraste a partir de las estimaciones más pequeñas (en valor absoluto) de los contrastes. . Loughin [73]. ya que las estimaciones de sus efectos exceden SME. Sin embargo. por 10 que la carta de inferencia condicional está diseñada para ayudar al experimentador a evaluar la magnitud de los efectos para un rango de valores de la desviación estándar. Bisgaard [10] ha proporcionado una sutil técnica gráfica. La finalidad de esta gráfica es ayudar al experimentador a juzgar los efectos significativos.d xPSE donde el punto porcentual de la distribución t que se usa es y = 1 .5 x 3. Para ilustrar el método de Lenth. Varios autores (ver Ramada y Balakrishnan [52]. margin of error) ME= t O.6251 = 3. En diseños no replicados.625= 13.082 4.163 31 2.295 9. y que pueden usarse métodos de simulación para calibrar su procedimiento.030 Estos resultados coinciden en gran medida con los de Ye y Ramada [114]. El criterio SME indicaría que los cuatro efectos más grandes (en magnitud) son significativos. o si pudiera estimarse a partir de los datos.5 x 1-2.140 5.625 ME=2. pero no con respecto al SME. no se cuenta con ninguna estimación interna de 0.891 15 2. Esto sería relativamente sencillo si se conociera la desviación estándar 0.9375 = 9. Observe que en este ejemplo el método de Lenth produjo la misma respuesta que la obtenida anteriormente con el examen de la gráfica de probabilidad normal de los efectos. Sin embargo.. recomendamos utilizarlo como complemento de la gráfica de probabilidad normal usual de los efectos.571 2. no como su sustituto. como ayuda para interpretar la gráfica de probabilidad normal.70 Considere ahora las estimaciones de los efectos de la tabla 6-12. Loughin y Noble [74] y Larntz y Whitcomb [69]) han hecho notar que el método de Lenth falla para controlar los índices del error tipo I. puesto que es evidente que la interacciónAC es importante. Para hacer inferencias sobre un grupo de contrastes. Los cálculos dan como resultado So = 1. llamada carta de inferencia condicional.219 x 2. Un contraste individual puede compararse con el margen de error (ME. el método de Lenth es un procedimiento ingenioso y útil. y Lenth demuestra que es un estimador razonable de la varianza del contraste cuando no hay muchos efectos activos (significativos). Lenth sugiere usar el margen de error simultáneo (8ME. El efecto principal de C es significativo de acuerdo con el criterio ME. probablemente C se incluiría en la lista de efectos significativos..75 SME= 5. de donde PSE= 1. 025 . 6-5 UNA SOLA RÉPLICA DEL DISEÑO 2k 255 PSE denota el "pseudo error estándar".764 2.84375. simultaneous margin of error) SME= t)'.5 x 11.751 = 2.9375 Y 2.571 x 2. considere el experimento 24 del ejemplo 6-2.008 4.d xP8E donde los grados de libertad se definen como d = m13.218 2. En general.625= 6. Larntz y Whitcomb [69] sugieren reemplazar los multiplicadores ME y SME con multiplicadores ajustados de la siguiente manera: Número de contrastes ME original ME ajustado SME original SME ajustado 7 3.(1 + 0. .218 4. EIPSE se usa para juzgar la significa- ción de los contrastes.951/m )/2.219 4.. En esta figura se han usado las estimaciones de los efectos del ejemplo 6-2. . se hace una gráfica como la que se muestra en la figura 6-16. -14 -18 AC • -22 Figura 6-16 Carta de inferencia condicional para el ejemplo 6-2. OX.256 CAPÍTULO 6 DISEÑO FACTORIAL 21< Bisgaard fundamenta la gráfica en el resultado de que el error estándar de un efecto. con las estimaciones de los efectos graficadas en el eje vertical. El eje horizontal. para cualquier valor dado de la desviación estándar a. Por lo tanto.y y = .JN . N = 2k ). Es decir.JN donde a es la desviación estándar de una observación individual. o eje y. por lo que las rectas están eny = +ayy = -a. entonces los factores A. Las dos rectas están en 4a 4a y=+. de la figura 6-16 es la escala de la desviación estándar (a). Entonces ±2 veces el error estándar de un efecto es 4a +-- -. N = 16.JN En el ejemplo tratado aquí. Si el experimentador piensa que la desviación estándar tiene un valor de hasta 10. AD 18 • D 14. en un diseño de dos niveles con N corridas (para un diseño factorial no replicado. C. es 2a . la distancia entre estas dos rectas puede leerse como un intervalo de confianza de 95% aproximado para los efectos insignificantes. para A 22. D y las interaccionesAC y AD son significativos.JN Una vez que se estiman los efectos. el factor C quizá no sea significativo.- . En la figura 6-16 se observa que si el experimentador piensa que la desviación estándar está entre 4 y 8. Los datos del experimento se presentan en la figura 6-17. .24--t-3 .-/ ). Con base en esta gráfica. requieren interpretación.97---9..44 " 7. 6 8 -1..'''' . EJEMPLO 6~3 .07 .-/ -5.44 6·5 UNA SOLA RÉPLICA DEL DISEÑO 2k 257 + /1 9.53 " 1 .ll5---=:)6.70 2. Por ejemplo. los factores B.-/ -9. La carta también puede usarse en sentido inverso.--. D 3.¡. la velocidad de rotación (C) y el tipo de lodo de perforación usado (D). la rapidez de flujo (B). junto con las interacciones Be y BD.98 . Se presentan ahora tres ilustrativos ejemplos de diseños factoriales 2k no replicados.07---2. suponga que estuviera en duda si el factor e es significativo o no. Figura 6·17 .o '" o. La figura 6-19 es la gráfica de probabilidad normal de los residuales y la fi- 99 B 5 ~ 10 o • 95 90 80 70 o o R:' 20 1 ~ x 30 -¡¡¡ 50 E o c: 50 '. entonces puede concluirse que e es significativo.43 c~ A Datos del experimento de perforación del ejemplo 6-3. cualquier supuesto dado acerca de la magnitud de a. e y D. Si es improbable que a sea tan grande como 10.g '" 70 "C 80 30 20 10 e 95 • o Estimación del efecto 5 99 7 Figura 6-18 Gráfica de probabilidad normal de los efectos del ejemplo 6·3.L-'~.30 4. 90 :c . En la figura 6-18 se muestra la gráfica de probabilidad normal de las estimaciones de los efectos de este experimento. ¡.L _1~.09-¡--4. 1J:ansformación de datos en un diseño factorial Daniel [35b] describe un diseño factorial 24 utilizado para estudiar la rapidez de avance de una perforadora como una función de cuatro factores: la carga de la perforadora (A). Entonces el experimentador podría preguntar si es razonable esperar que a pudiera ser tan grande como 10 o más. el experimentador puede construir una "cinta de medir" para juzgar la significación aproximada de los efectos. 20 S 30 ro .. c:: o • • • • • • • • • -1 • • 2 5 8 Velocidad de avance predicha Figura 6-20 Gráfica de los residuales contra la velocidad de avance predicha en el ejemplo 6-3. Con frecuencia se usa una transformación de los datos para abordar estos problemas." E 50 o c: 50 '. ¡¡'.258 CAPÍTULO 6 DISEÑO FACTORIAL 2k 99 5 o o • 95 90 80 70 o o .-' ." ro :J al al •¡¡. Hay problemas evidentes con la normalidad y la igualdad de la varianza. gura 6-20 es la gráfica de los residuales contra la velocidad de avance predicha a partir del modelo que contiene los factores identificados.. 10 x I .g '" 70 J3 80 "- 30 20 10 . • 2 Ul .. la transformación logarítmica parece un candidato razonable.. .a '" e 90 95 99 -2 -1 • o Residuales 5 2 Figura 6-19 Gráfica de probabilidad normal de los residuales del ejemplo 6-3.:-. Puesto que la variable de respuesta es una razón de cambio.. Observe que al parecer ahora es posible una interpretación mucho más simple. ya que sólo los factores B. . En la figura 6-21 se presenta la gráfica de probabilidad normal de las estimaciones de los efectos después de hacer la transformación y* = lny.2 Figura 6·22 Gráfica de probabilidad normal de los residuales del ejemplo 6-3 después de la transformación logarítmica..'" 16 70 "O ~ 90 95 99 80 30 20 10 • o 0. . e y D están activos.~ ~ 30 ii1 o c: :B E 50 50 ~ ¡i.6 Estimación del efecto 5 0.9 1..g " 30 20 ~ 90 95 99 -0.. I J~ i ' 99 5 o o .:.. 10 20 x ¡.'" :c oC " .6-5 UNA SOLA RÉPLICA DEL DISEÑO 2' 259 99 B 5 • 95 90 80 70 o o g . .1 o Residuales 0.2 Figura 6·21 Gráfica de probabilidad normal de los efectos del ejemplo 6-3 después de la transformación logarítmica.. expresar los datos en la métrica correcta ha simplificado su estructura hasta el punto de que las dos interacciones han dejado de requerirse en el modelo explicatorio.:. Es decir.1 0. 20 :::: 30 ro "O E o c: 50 70 80 50 ~ ¡i..2 • 10 5 • -0. x I 95 90 80 70 o o 10 ¡.. 79 <0.115 YR 2 = SSModelo/SST = 7.1 • • O 0.431 0. Se concluye que el modelo y* = lny sólo requiere los factores B.¡ .014 ValorP 381.5 • • Velocidad de avance logarftmica predicha Figura 6·23 Gráfica de los residuales contra la velocidad predicha para el ejemplo 6-3 después de la transformación logarítmica.64 <0. una gráfica de probabilidad normal de los residuales y una gráfica de los residuales contra la rapidez de avance predicha para el modelo en la escala logarítmica que contiene a B. por lo que el modelo explica cerca de 98% de la variabilidad de la rapidez de avance de la perforadora.345 1.288 = 0. Efectos de localización y dispersión en un diseño factorial no replicado Se corrió un diseño 24 en un proceso de manufactura de paneles laterales y ventanas de un avión comercial.288 Grados de libertad 1 1 1 12 15 Cuadrado medio 5.431 = 7. e y D. La suma de cuadrados del modelo es SSModelo = SSB +SSc +SSD = 5. En las figuras 6-22 y 6-23 se presentan.0001 .98.339 0.¡. En la tabla 6-14 se resume el análisis de varianza de este modelo. "O al al oc O • • -0.79 <0.345 1. Los paneles se hacen en una prensa.339 + 0.431 0.345+ 1.0001 95. y bajo las condiciones actuales es demasiado elevado el número Tabla 6-14 Análisis de varianza del ejemplo 6·3 después de la transformación logarítmica Fuente de variación B (Flujo) e (Velocidad) D (Lodo) Error Total Suma de cuadrados 5.11517. respectivamente. EJEMPLO 6~4 .1 Ul • • • ro ::.339 0.260 0.2 CAPÍTULO 6 DISEÑO FACTORIAL 2k • • • 0.5 1. e y D para una interpretación adecuada.173 7.0001 30. Ahora estas gráficas son satisfactorias.. Los factores son la temperatura (A). Ningún efecto de los otros factores parece ser tan grande.c " e ~ 20 10 5 -10 -5 O Efectos de los factores 5 10 Figura 6·25 Gráfica de probabilidad normal de los efectos de los factores para el experimento del proceso de los paneles del ejemplo 6-4. y A YC explican cerca de 77% de la variabilidad total. por lo que se concluye que la temperatura (A) baja y el flujo de resina (C) alío reducirían la incidencia de defectos en los paneles.. La gráfica de probabilidad normal de los residuales no indicó anomalías. promedio de defectos por panel en una operación de prensado. el flujo de resina (C) y el tiempo de cierre en el prensado (D). pero cuando el experimentador graficó los resi99 eA 5 10 o 95 90 80 70 50 ~ 20 ¡.) Se investigan cuatro factores utilizando una sola réplica de un diseño 2\ en el que cada réplica corresponde a una sola operación de prensado.5 /¡ 8/ 0. 50 70 80 90 95 99 Ce g E o c: "C x 30 ¡:¡'. En la figura 6-24 se muestran los datos de este experimento.25. . El análisis residual cuidadoso es un aspecto importante de cualquier experimento. " . el tiempo de sujeción (B). (El promedio actual del proceso es 5.5 I 5 5 5~ )5-+7' 11 CtL: A Figura 6·24 Datos del experimento del proceso de los paneles del ejemplo 6·4.5 9.5 defectos por panel. En la figura 6-25 se muestra la gráfica de probabilidad normal de los efectos de los factores.75 YC = -4. Es evidente que los dos efectos más grandes sanA = 5." 6-5 UNA SOLA RÉPLICA DEL DISEÑO 2k Factores Bajo(-) Alto(+) 261 ji""= Temperatura (OF) B = Tiempo de sujeción (min) 295 7 325 9 e = Flujo de resina D = Tiempo de cierre (s) 10 15 20 30 D 1.30 I x S ¡¡.-' :c ll.--. 5 R =4. Los residuales de un diseño 2k proporcionan mucha información acerca del problema bajo estudio. Puede hacerse el examen sistemático de los residuales de un diseño 2k no replicado para proporcionar información acerca de la variabilidad del proceso..V" 0. el tiempo de sujeción y el flujo de resina para el ejemplo 6-4.?75-- R=6. .75 I ¡ I I I R=2/ 7. que carece de importancia en lo que se refiere al número promedio de defectos por panel. el ingeniero decidió operar el proceso con la temperatura baja y el flujo de resina alto para reducir el número promedio de defectos. _ eee e eee B = Tiempo de sujeción ce e e -5 Figura 6·26 Gráfica de los residuales contra el tiempo de sujeción para el ejemplo 6-4.- e ----J. y cuandoB está en el nivel bajo esRB . con el tiempo de sujeción bajo dando como resultado una variabilidad menor en el número promedio de defectos por panel en una operación de prensado. Como resultado de este experimento. El nuevo ajuste de las condiciones de operación produjo un nuevo promedio del proceso de menos de un defecto por panel.25.0 c= Flujo de resina IR =4. B y c. la gráfica de los residuales contraB (tiempo de sujeción) presentó el patrón de la figura 6-26.5 3. Este factor.W!l! I 262 5 CAPÍTULO 6 DISEÑO FACTORIAL 2" e e ee Ul .= 1.g <ti .25-----7.~9 10 R = 1 '" '" R_= 5. Puesto que los residuales pueden considerarse como los valores observados del ruido o error.5 ".5' 11. duales contra cada uno de los factoresA aD.75. con frecuencia ofrecen información acerca de la variabilidad del proceso. y con el tiempo de cierre en el prensado bajo (el cual no tuvo ningún efecto ni sobre la localización ni sobre la dispersión). es muy importante en su efecto sobre la variabilidad del proceso.5 -~12. El efecto de dispersión del tiempo de sujeción también es muy evidente en la gráfica de cubo de la fi· gura 6·27.75 I I 295 325 A = Temperatura (OF) 7 B = Tiempo de sujeción (min) 7 Figura 6·27 Gráfica de cubo de la temperatura.25 R=O. R 20 = 3. El rango promedio cuando B está en el nivel alto (la cara posterior del cubo de la figura 6-27) esRB + = 4. donde se grafica el número promedio de defectos por panel y el rango del número de defectos en cada punto del cubo definido por los factoresA.~ QJ Of . con el tiempo de sujeción bajo para reducir la variabilidad en el número de defectos por panel. 44 -2.28 + 1.81 -0.Tabla 6-15 Corrida 1 2 3 4 5 6 7 8 9 10 11 Cálculo de los efectos de dispersión para el ejemplo 6-4 A - B - AB C - AC BC ABC - D AD BD ABD CD ACD - BCD - ABCD Residual -0.58 0.06 3.97 2.09 1.61 2.74 - + - + + - + - + + - + - + + - + + - + + - + - + 2.16 -0.55 0.¡J .70 + + 2.85 0.26 -0.25 1.93 0.24 -0.14 + + + + 1.86 0.44 + + + - + - + + + - + + - + - - + - + + - + + - + - + + - + + - + + + + - + + - + - + - + + + + - + + - + + + + - - + - + - + - - + + - + + - + + - + - + + + + - - + - + + - + + + + - • + - + + - + + + - - + - 12 13 14 15 16 + - + + + 2.33 -0.19 2.46 + 1.74 SV) s(1-) F* I N 0\ \.34 - + - + 2.06 0.56 -0.12 + + 2.28 + - + - + 1.80 2.28 1.44 + + + + + + + + 2.06 0.19 0.80 2.24 1.37 + + + + 1.72 0.39 + + 2.20 -0.83 2.69 -1.91 2.11 -0.94 -0.81 2.31 -2..61 0.43 + + 1.24 -0.44 3.69 -1.93 1.21 1.05 1.70 + 1.40 + - + - + 1.81 2.69 -2.89 0.52 2. * tiene una distribución aproximadamente normal.1 0. . el valor de F. Cada columna de esta tabla contiene el mismo número de signos positivos y negativos. El estadístico S2 F*=ln (B:) (6-24) B S2(B-) tiene una distribución aproximadamente normal cuando las dos varianzas if(B+) y if(B-) son iguales.n "- :.-' I s ro o ro E c: 50 20 5 ~ x ~.2 1. Entonces S2 (i +) F. "O ....2 r 1 Figura 6·28 Gráfica de probabilidad normal de los efectos de dispersión F¡' del ejemplo 6-4. Los valores de F. 2.9 99 o o ~ / x 95 80 o o ii:. y es posible calcular la desviación estándar de los residuales de cada grupo de signos en cada columna. B es un factor importante en lo que se refiere a la dispersión del proceso.72.37 En la tabla 6-15 se presenta el conjunto completo de contrastes para el diseño 24 junto con los residuales para cada corrida del experimento del proceso de los paneles del ejemplo 6-4.83)2 = 2. La figura 6-28 es la gráfica de probabilidad normal de los efectos de dispersión F. Evidentemente.. Si la varianza de los residuales de las corridas donde el factor i es positivo es igual a la varianza de los residuales de las corridas donde el factor i es negativo. Para ilustrar los cálculos. 15 (6-25) S2(i-) 1 es un estadístico que puede usarse para evaluar la magnitud de los efectos de dispersión del experimento. SW) y Sen.. i = 1. ..2. La desviación estándar de los ocho residuales donde B está en el nivel bajo es S(B-) = 0. por ejemplo.c ro e 0. 15.*. entonces F. Yla desviación estándar de los ocho residuales donde B está en el nivel alto es S(B+) = 2.264 CAPÍTULO 6 DISEÑO FACTORIAL 2k Considere la gráfica de los residuales de la figura 6-26.* se presentan al final de cada columna de la tabla 6-15. es S2(B+) F* = In ---'----'B S2(B-) = In (2.g .83. Para un estudio más amplio de 0.. .* = In i = 1.2 2.72)2 (0..1 99. .. Se "apilan" cuatro obleas en el horno.67 1.33 .67 2 0. las cuatro columnas bajo el encabezado "Espesor" contienen las mediciones del espesor del óxido de cada oblea individual... para que los residuales del modelo ofrezcan la información apropiada acerca de los efectos de dispersión.... el promedio de las mediciones del espesor es la variable de respuesta correcta que deberá considerarse inicialmente. Sin embargo.•..67 0. cada oblea se habría procesado individualmente en una sola corrida del horno.. recibieron los factores de los tratamientos (es decir.. procesando las obleas y midiendo después el espesor del óxido en las cuatro obleas. debido a que las cuatro obleas se procesaron en conjunto.67 8. y las dos últimas columnas contienen el promedio muestral y la varianza muestral de las mediciones del espesor en las cuatro obleas de cada corrida.. La manera apropiada de analizar este experimento es considerar las mediciones del espesor de las obleas individuales como mediciones duplicadas.. ver Boxy Meyer [19] y Myers y Montgomery [85a]. Asimismo.•.. Por lo tanto....••. el tiempo (B).67 12.. y la variable de respuesta de interés es el espesor del óxido en las obleas.. por lo que hay mucho menos variabilidad en las mediciones del espesor de las obleas individuales que la que se habría observado si cada oblea fuera una réplica... Si fueran en realidad réplicas...67 3. El experimento se lleva a cabo cargando cuatro obleas en el horno... es necesario especificar correctamente el modelo de localización.... Referirse al material suplementario del texto de este capítulo para mayores detalles y un ejemplo.. ajustando las variables del proceso en las condiciones de prueba requeridas por el diseño experimental..33 3. la pre. Mediciones duplicadas de la respuesta Un equipo de ingenieros en una fábrica de semiconductores realizaron un diseño factorial 24 en un horno de oxidación vertical... los niveles de las variables d~l diseño) simultáneamente.. EJEMPLO 6~5 .67 6 1.. En la tabla 6-17 se muestran las estimaciones de los efectos de este experimento..•.•. En la tabla 6-16 se presentan el diseño y las mediciones del espesor resultantes. En esta tabla. Los cuatro factores del diseño son la temperatura (A).....sión (e) y el flujo de gas (D).....33 6.. y no como réplicas. utilizando el espesor del óxido promedio ycomo la variable de respuesta..33 34 0.ti 6-5 UNA SOLA RÉPLICA DEL DISEÑO 2k 265 este procedimiento. Observe que los factoresA y B Yla interacciónAB tienen efectos grandes que explican en conjunto cerca de 90% de la variabilidad del espesor promedio del Tabla 6-16 El experimento del espesor del óxido Orden estándar Orden de la corrida 10 A B \ e -1 -1 -1 -1 1 1 1 1 -1 -1 -1 -1 1 1 1 1 D Espesor y S2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 7 3 9 6 2 5 4 12 16 8 1 14 15 11 13 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 -1 -1 -1 -1 -1 -1 1 1 1 1 1 1 1 1 378 415 380 450 375 391 384 426 381 416 371 445 377 391 375 430 376 416 379 446 371 390 385 433 381 420 372 448 377 391 376 430 379 416 382 449 373 388 386 430 375 412 371 443 379 386 376 428 379 417 383 447 369 391 385 431 383 412 370 448 379 400 377 428 378 416 381 448 372 390 385 430 380 415 371 446 378 392 376 429 2 0.00 14.•.... 12).000570753 AB AC AD BC BD CD ABC ABD ACD BCD ABCD óxido.0625 1.563 5.125 -0.125 3.. la "ventana" de operación se corre hacia el extremo izquierdo.06 1314.875 -10.19+ 21.625 1. Es interesante observar los resultados que se hubieran obtenido si las mediciones del espesor del óxido de las obleas se hubieran considerado incorrectamente como réplicas.61.31x1X 3 El análisis residual de este modelo es satisfactorio.06x z - 5.56x1 + 9. La estimación del error que se obtiene en la tabla 6-18 es mucho más grande. Al examinar esta representación. como ciertamente sería el caso en el análisis incorrecto de la tabla 6-19. Ésta es la mejor estimación del error que deberá usarse para juzgar la significación de las variables del proceso que se modifican de una corrida a otra.44x 1x Z . o más bajo. indicando que se necesitarán duraciones del ciclo más cortas para conseguir el espesor del óxido deseado.5625 1139. Observe que hay muchos factores significativos en este análisis.402 4.125 18. en el nivel bajo (es decir. Sin embargo.19x 3 + 8. La figura 6-29 es una gráfica de probabilidad normal de los efectos.875 1.375 2.0964573 10.301929 0.rlt 266 CAPÍTULO 6 DISEÑO FACTORIAL 2k Tabla 6-17 Estimaciones de los efectos del ejemplo 6-5. la variable de respuesta es el espesor promedio del óxido Término del modelo A B C D Estimación del efecto 43. es evidente que hay muchas combinaciones del tiempo y la temperatura (factores A y B) que producirán resultados aceptables.125 -10. El modelo para predecir el espesor promedio del óxido es y= 399. y las especificaciones del producto requieren que el espesor sea de entre 390y 410 A.875 -0.046231 0.548494 0.12369 0.5625 0.9339 12.875 -3. Al examinar estas gráficas de contorno. Una pregunta lógica que podría plantearse es: ¿qué daño causa identificar demasiados factores como importantes?. si la presión se mantiene constante en el nivel bajo.562 10.06 451.93192 0. la presión. Yes principalmente una medida de la variabilidad entre las corridas.0625 Contribución porcentual 67.125 Suma de cuadrados 7439. La respuesta es que .548494 0.06 430. del eje del tiempo.625 16. En la figura 6-30 se presentan dos gráficas de contorno del espesor promedio.0625 5.5625 33. El cuadrado medio de los residuales de la tabla 6-19 refleja la variabilidad entre las obleas dentro de una corrida yla variabilidad entre las corridas. By C y las interaccionesAB yAC son importantes.5.0625 0. La razón de esto es que la estimación de la varianza del error de la tabla 6-19 es muy pequeña (a z = 6. X 3 = -1) Yla otra con C (o x 3) en el nivel alto (es decir.0142688 0.0001 3.00513678 0.375 -1.625 0. En la tabla 6-19 se presenta el análisis de varianza del modelo completo basado en tratar el experimento como un diseño factoria12 4 con réplicas. X 3 = + 1).0625 0.0625 60.046231 0. se concluiría que los factores A. aZ = 17. una con el factor C (o x 3 ).125 -0. Los experimentadores están interesados en obtener un espesor promedio del óxido de 400 A. En la tabla 6-18 se muestra el análisis de varianza de este modelo.000570753 0.0625 60. lo cual sugiere un modelo mucho más complejo del que se encontró cuando se utilizó el espesor promedio del óxido como la respuesta. 000 0. R-Squared Pred.35 422.12 10950.53 6.9759 0. Dev.06 451.0006 <0. 6-5 UNA SOLA RÉPLICA DEL DISEÑO 2k 267 A ~ AS ~ s ~ 29.05 396.56 1139.000 <0.05 1. ejemplo 6-5 Source Sum of Squares DF Mean Square F Value Prob> F Model A B C AB AC Residual Cor Total Std.06 451.06 -5.97 .37 74.45 64.86 7439.05 450.0005 R-Squared Adj.56 1139.56 17.31 7439.88 Coefficient Estimate 5 1 1 1 1 1 10 15 2154.13 Figura 6-29 Gráfica de probabilidad normal de los efectos para la respuesta del espesor promedio del óxido. PRESS 10774..44 -5.85 19.65 401.61 122.20 399.78 -2. R-Squared Adeq.05 1.000 <0.67 25.69 Efecto 43.000 0.06 430.967 95% CI Low 95% CI High Factor DF 1 1 1 1 1 1 Intercept A-Time B-Temp C-Pressure AB AC 399. Precision Standard Error 0. ejemplo 6-5. Tabla 6-18 Análisis de varianza (de Design-Expert) para la respuesta espesor promedio del óxido.64 <0. Mean C.05 1.56 176.06 1314.53 23.19 21.9588 27..61 24.44 4.9839 0.V.05 1.06 430.05 1.19 8.72 -7.10 -7.19 1.31 1.40 -2.56 9.06 1314.85 10.22 6.90 11. 50 1.. casi siempre hay información útil acerca de algún aspecto de la variabilidad del proceso contenida en estas observaciones._ _ l -1...00 ~ -0..------.00 -0.00 L--L.. si las mediciones duplicadas son pruebas múltiples hechas con un instrumento de medición en la misma unidad ex- . intentar manipular u optimizar los factores que no son importantes sería un desperdiéio de recursos.l..------¡----..:::.00 0...00.50 ..00.----..l.50 -1._ ~ ...._ _L ....---._-1-_ _.I-----... 0.----.----:-! -1.50 Tiempo (a) x 3 =-1 1.. Por ejemplo.-. y podría resultar en agregar variabilidad innecesaria a otras respuestas de interés... Cuando se hacen mediciones duplicadas de la respuesta.00 Tiempo lb) x 3 = +1 Figura 6-30 Gráficas de contorno del espesor promedio del óxido con la presión (x3 ) mantenida constante._ _-l..¡----.. 0.--..a ~ 0.50 '§ al :J ~ ~ 0...50 _1....268 CAPÍTULO 6 DISEÑO FACTORIAL 21< 1.50 0.00L----2--.00 380 E ~ ~ ~ -0.------..00 -0..l-_---\.----r--. 000 294.25 6. . En este caso. pero el factor A y la interacción BD son los más grandes.0001 <0.0001 0.25 20. Recuerde que en el capítulo 3 se indicó que la transformación logarítmica es por lo general apropiada para modelar la variabilidad.25 294.16 858.88 294.25 132.59 0. Sería de interés determinar si alguna de las variables del proceso influye en la variabilidad al interior de las corridas.0001 0.25 240.0753 <0.8407 0.12 29756.12 6.25 0.0001 <0.90 3. Si las mediciones duplicadas se hacen en diferentes lugares dentro de una unidad experimental.0753 <0. los experimentadores se enfocaron en seleccionar valores de las variables de diseño que dieran un espesor medio del óxido dentro de las especificaciones del proceso y tan cerca de 400 Á como fuera posible.0001 <0.25 5256. entonces el modelo de ln(S2) es /i-ln(s )=1. La figura 6-31 es una gráfica de probabilidad normal de las estimaciones de los efectos obtenidas utilizando ln(s2) como la respuesta.5473 0. pueden brindar cierta información acerca de la uniformidad de la variable de respuesta en esa unidad.25 1722.25 240.75 29756.25 6.25 1806.20x 4 -0.75 15 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 48 O 48 63 2920.00 44095. Esta elección del flujo de gas produce los valores mínimos de la varianza predicha en la región de la gráfica de contorno. ya que se tiene una observación en cada una de cuatro unidades experimentales que se han sometido a un procesamiento conjunto. lo cual desde luego no es nada espectacular para un modelo empírico.25 2. La figura 6-32 es una gráfica de contorno de la varianza predicha (no del logaritmo de la varianza predicha) con la presiónx3 en el nivel bajo (recuerde que con esto se minimiza la duración del ciclo) y el flujo de gasx4 en el nivel alto.08+0Alx 1 -OAOx 2 +0. Esta información se encuentra contenida en la varianza de las mediciones del espesor del óxido de las cuatro obleas de cada corrida. por ejemplo S2 :::.25 5256.25 0.16 281. No hay ningún efecto individual fuerte.0001 0." 6-5 UNA SOLA RÉPLICA DEL DISEÑO 2k 269 Tabla 6-19 Análisis de varianza (de Design-Expert) de la respuesta individual del espesor del óxido de las obleas Source Surnof Squares DF Mean Square F Value Prob> F Model A B C O AB AC AO BC BO CO ABO ABC ACO BCD ASCO Residual Lack of Fit Pure Error Coro Total 43801.8407 perimental.25 240. Si se incluyen también los efectos principales de By D para obtener un modelo jerárquico.25 1722.25 240.25 2..75 4858. se tiene cierta información acerca de la variabilidad dentro de las corridas del proceso.3175 0. pero con frecuencia es difícil obtener modelos excepcionalmente buenos de las varianzas.37 0.25 20.041 1.25 0.31 39.041 <0.25 4556.13 476.0115 <0.0001 <0. haciendo al mismo tiempo que la variabilidad dentro de las corridas sea pequeña.25 4556.25 6. 2.25 42.18 6.56x 2 x 4 El modelo explica apenas poco menos de la mitad de la variabilidad en la respuesta ln(S2).25 42. En el ejemplo tratado aquí.25 20.22 3.22 39.90 743.25 20.25 1806. entonces las mediciones duplicadas proporcionan cierta información acerca de la eficiencia del instrumento de medición.31 21.25 132.25 0.0001 <0.02 0.00 0.0001 0. 15 Efecto 0.l.n al :!2 e c.64 -0.00 Tiempo Figura 6-32 Gráfica de contorno de S2 (variabilidad dentro de las corridas) con la presión en el nivel bajo y el flujo de gas en el nivel alto. 0...12 -0.00 -0.J. 1._..00.--""'O:::'-"--.-----:-' -1. ejemplo 6-5..--------""7'---------:... ..34 0..50 1. "C ?f' -1.00 E ~ -1.82 Figura 6-31 Gráfica de probabilidad normal de los efectos utilizando In (S2) como la respuesta.00 L------"::::.. e ::l 1§ 15.---L----.270 CAPÍTULO 6 DISEÑO FACTORIAL 2k 99 A 95 90 illJl ro ro E 80 70 50 o c: "C :a ro . 6-6 ADICIÓN DE PUNTOS CENTRALES EN EL DISEÑO 2k 1.50 -1. 6~6 ADICIÓN DE PUNTOS CENTRALES EN EL DISEÑO 2k Una preocupación potencial en el uso de diseños factoriales de dos niveles es el supuesto de la linealidad de los efectos de los factores.00 -0. la presión se mantiene constante en el nivel bajo y el flujo de gas se mantiene constante en el nivel alto.00 -1. Desde luego. Una manera posible de encontrar un conjunto de condiciones adecuado es superponiendo las gráficas de contorno de las figuras 6-30 y 6-32. Esta curvatura. En esta gráfica. y el sistema 2k funcionará bastante bien incluso cuando el supuesto de linealidad sea válido sólo de manera muy aproximada. no es necesaria la linealidad perfecta.00 -0. con las especificaciones del espesor medio del óxido y la restricción S2 :5 2 indicadas como contornos. e (1) 0. Este problema se analizará con mayor detalle en el capítulo 11. es resultado del torcimiento del plano inducido por los términos de interacción f3¡l'iXj' . La gráfica de la superposición se muestra en la figura 6-33.50 Figura 6·33 Superposición del espesor promedio del óxido y las respuestas S2 con la presión en el nivel bajo y el flujo de gas en el nivel alto. De hecho.00 271 0. desde luego. de donde se obtiene Y=f30+ L j=l k f3 j Xj + LL ¡<j f3ijX¡X j +c (6-26) entonces se tiene un modelo con la capacidad de representar cierta curvatura en la función de respuesta. Éste es un ejemplo simple del uso de las gráficas de contorno para estudiar dos respuestas simultáneamente.50 0.50 ~ l!! {!!.00 Tiempo 0. se ha señalado ya que si se agregan los términos de interacción a un modelo de los efectos principales o de primer orden. La región no sombreada cerca de la parte central izquierda de la gráfica identifica una región factible para las variables tiempo y temperatura. entonces está presente una curvatura cuadrática. O). oo. nF es el número de puntos del diseño factorial.Ye es pequeña. Existe un método para hacer una réplica de ciertos puntos de un diseño factorial2 k que ofrecerá protección contra la curvatura de los efectos de segundo orden a la vez que permitirá una estimación independiente del error que va a obtenerse.. El método consiste en agregar puntos centrales en el diseño 2k • Éstos consisten en n réplicas que se corren en los puntos Xi = O(i = 1. +)y (+. cuando se y I -1 Figura 6-34 Diseño 22 con puntos centrales.. se supone que los k factores son cuantitativos.Ye es grande. y no hay curvatura cuadrática. . en general. (-. pero deberá estarse alerta ante la posibilidad de que el modelo de segundo orden de la ecuación 6-27 sea en realidad más apropiado. (+. Sea YF el promedio de las cuatro corridas en los cuatro puntos factoriales y sea Ye el promedio de las ne corridas en el punto central. En tales casos. La suma de cua· drados de la curvatura cuadrática pura con un solo grado de libertad está dada por SS Cuadrática pura e = ---. si YF . Si la diferenciaYF . por lo general se anticipa el ajuste del modelo de primer orden de la ecuación 6-26. considere un diseño 22 con una observación en cada uno de los puntos factoriales (-.----=--'-'---'------'-=---=-n +n F nFn (JiF . k). entonces los puntos centrales caen en el plano (o cerca de él) que pasa por los puntos factoriales. Más específicamente. En la figura 6-34 se ilustra la situación. Esta cantidad puede compararse con el cuadrado medio del error para probar la curvatura cuadrática pura.Ye )2 e (6-28) donde. Para ilustrar este enfoque. Una razón importante para agregar réplicas de las corridas en el centro del diseño es que los puntos centrales no afectan las estimaciones usuales de los efectos en un diseño 2k • Cuando se agregan puntos centrales. +). A la ecuación 6-27 se le llama modelo de superficie de respuesta de segundo orden. -).272 CAPÍTULO 6 DISEÑO FACTORIAL2h Habrá situaciones en que la curvatura de la función de respuesta no esté modelada adecuadamente por la ecuación 6-26.. -). yn e observaciones en el punto central (O.:. Cuando se realiza un experimento factorial de dos niveles. Por otra parte. 2. un modelo lógico por considerar es y= {30 + 2: j=l k {3jX j + 2:2: i<j {3ijX i X j + 2: j=l k {3jjXJ +8 (6-27) donde las {3jj representan efectos cuadráticos o de segundo orden puros. : fi j=l k jj =O .o. si los puntos factoriales del diseño no tienen réplicas..Pu""n""tos'-"ce""ntr:. Un ingeniero químico estudia el rendimiento de un proceso.1720 E ~ 11 :J E E ~ I:l:l c.46)2 4 _ = 4 = 0.0430 40. En la tabla 6-20 se resume el análisis de varianza de este experimento.3 I -1 r' 40. Hay dos variables de interés.1 grados de libertad. EJEMPLO 6~6 .z!:'0 2.40. El diseño y los datos del rendimiento se muestran en la figura 6-35.: (Yi .5 40.: fi j=l k jj Además.7 40. Debido a que no se tiene la seguridad sobre el supuesto de linealidad en la región de exploración. por la tabla 6-20.es'--Por lo tanto.9 I +1 o I 35 I I 30 I 40 A = Tiempo de reacción (min) Figura 6-35 El diseño 22 con cinco puntos centrales para el ejemplo 6-6.6 40. el tiempo de reacción y la temperatura de reacción.2 40.0 160 41. El cuadrado medio del error se calcula a partir de los puntos centrales de la siguiente manera: MS E = SSE 12-1 e _ (6-29) = .5 0.::al::::. 155 o • 150 -1 39. el ingeniero decide realizar un diseño factorial 22 (con una sola réplica de cada corrida factorial) aumentando con cinco puntos centrales. 5 MS E = -"i=""l 2. pueden usarse los He puntos centrales para construir una estimación del error con He .!Ir I 6-6 ADICIÓN DE PUNTOS CENTRALES EN EL DISEÑO 2k 273 agregan puntos en el centro del diseño 2\ con la prueba de la curvatura (utilizando la ecuación 6-28) en realidad se prueban las hipótesis H O: H1: 2. . llamado diseño central compuesto.0022 8 Total Cuadrado medio 2.274 CAPÍTULO 6 DISEÑO FACTORIAL 2k Tabla 6-20 Análisis de varianza del ejemplo 6-6 Fuente de Suma de Grados de libertad variación cuadrados 1 A (Tiempo) 2. Una solución simple y de gran efectividad de este problema es aumentar el diseño 22 con cuatro corridas axiales.8185 0.035)2 4+5 = 0. y que no hay evidencia de curvatura de segundo orden en la respuesta en la región de exploración.0027 El análisis de varianza indica que ambos factores tienen efectos principales significativos. Habrá situaciones en las que se necesitarán los términos cuadráticos.4225 0. los parámetros desconocidos (las fJ) de este modelo no pueden estimarse. que no existe interacción. Este diseño tiene 14 + 1le corridas (generalmente 3:5 1l e :5 5). ya que hay seis parámetros por estimar y el diseño 22 más los puntos centrales de la figura 6-35 sólo tienen cinco corridas independientes. El diseño resultante. es decir.0025 1 0.87 9.83 0. " En el ejemplo 6-6 se llegó a la conclusión de que no había indicios de efectos cuadráticos. la hipótesis nula H o: fJn + fJ22 = O no puede rechazarse. La suma de cuadrados de la curvatura cuadrática pura de la tabla del análisis de varianza se calcula con la ecuación 6-28 de la siguiente manera: SS Cuadrática pura = 1lp1l e (rp 1l p + 1l e re )2 = (4)(5)(-0.0025 0.46. se tendrá que suponer entonces un modelo de segundo orden tal como y= fJo +fJl x l +fJ2 x 2+fJ12 x l x 2 +fJnx~ +fJ22X~ +8 Desafortunadamente. . como se ilustra en la figura 6-36a. Yes un diseño muy eficiente para ajustar el modelo de segundo orden con 10 parámetros en k = 3 factores.0027 Cuadrática pura 4 0.0430 Valorp 55.4025 0.0027 0.425. .035 parece ser pequeña.0350 0. Y el promedio de los puntos situados en el centro eSYe = 40. un modelo de primer orden y= fJo +fJl x l +fJ2 x 2+fJ 12 x 1x 2+8 es apropiado (aun cuando probablemente no se necesite el término de la interacción).. . Es decir.1720 Error 3.8185 El promedio de los puntos de la parte factorial del diseño esyp = 40.4225 1 AB 0. La diferenciaYp-Ye = 40.0017 0.4025 1 B (Temperatura) 0. Los diseños compuestos centrales se usan ampliamente para construir modelos de superficie de respuesta de segundo orden. En la figura 6-36b se muestra un diseño central compuesto parak = 3 factores.06 0.46 = -0. Estos diseños se estudiarán con mayor detalle en el capítulo 11. Es decir.06 0. puede usarse entonces para ajustar el modelo de segundo orden.425 -40. si ha ocurrido una tendencia en la respuesta mientras se realizaba el experimento. uno odas cerca de la parte media. Sin embargo. 4. se continúa. Es decir. En estos casos. se utilizan puntos centrales cuando todos los factores del diseño son cuantitati· vos. deberán correrse uno o dos puntos centrales en o cerca del principio del experimento. s. si la variabilidad observada es mayor que la anticipada (io que la razonable!).) Dos factores b ) Tres factores Figura 6·36 Diseños centrales compuestos. y uno o dos cerca del final. por otra parte. En ocasiones los experimentos tienen que realizarse en situaciones en las que la información previa acerca de la variabilidad del proceso es escasa o nula. Específicamente. En ocasiones las respuestas de los puntos centrales pueden graficarse directamente en la carta de control como una verificación de la forma en que estuvo operando el proceso durante el experimento. Considere correr las réplicas del punto central en orden no aleatorio. Se concluye esta sección con algunas sugerencias y observaciones adicionales útiles referentes al uso de puntos centrales. 6-6 ADICIÓN DE PUNTOS CENTRALES EN EL DISEÑO 2k 275 _-f---+---f--- X1 a.. Si la magnitud de la variabilidad parece razonable. las respuestas del punto central deberán ser muy similares a las respuestas observadas históricamente en la operación rutinaria del proceso. en ocasiones habrá una o más variables cualitativas o categóricas y varias cuan1. correr dos o tres puntos centrales como las primeras corridas en el experimento puede ser de suma utilidad. considere utilizar las condiciones de operación actuales (o de receta) como el punto central del diseño. Al separar los puntos centrales en el tiempo. Cuando un experimento factorial se lleva a cabo en un proceso en marcha. Por ejemplo. el experimentador puede usar las respuestas observadas en el punto central para proporcionar una verificación aproximada de si algo "inusual" ocurrió durante el experimento. Con frecuencia es muy provechoso estudiar la cuestión de por qué es tan grande la variabilidad antes de proceder con el resto del experimento. habrá que detenerse. Generalmente. Estas corridas pueden proporcionar una estimación preliminar de la variabilidad. Con frecuencia el personal de operación llevará una carta de control para monitorear el desempeño del proceso. . 2. el experimentador tiene una verificación aproximada de la estabilidad del proceso durante el experimento. 3. Esto con frecuencia le asegura al personal de operación que al menos una parte de las corridas del experimento van a realizarse bajo condiciones familiares. graficar las respuestas de los puntos centrales contra el tiempo puede poner de manifiesto esta situación. Cuando el punto central de un experimento factorial corresponde con las condiciones de operación actuales. y por lo tanto es improbable que los resultados obtenidos (por lo menos para estas corridas) sean peores que los que se obtienen típicamente. y un solo factor cualitativo.. .-----o I I I I I I I I I I I 1 I I o I "\\e~"O ~ Eb Tipo de catalizador I I I I I . . el tiempo y la temperatura.. B Y C que se recomendaría utilizar? Considere nuevamente el inciso e del problema 6-1.. siempre y cuando esos subespacios incluyan únicamente factores cuantitativos... En otras palabras. la geometría de la herramienta (B) y el ángulo de corte (C) sobre la vida (en horas) de una máquina herramienta. ¿cuáles serían los niveles de A. Se eligen dos niveles de cada factor y se corren tres réplicas de un diseño factorial 23 • Los resultados fueron los siguientes: Combinación de tratamientos (1) Réplica I 22 32 35 55 44 40 60 39 II III 6-1. '-1 '1 ¡I¡ . ~.!. i :¡ '¡ 276 I I CAPÍTULO 6 DISEÑO FACTORIAL 21< """'----=---+-:---. a) Estimar los efectos de los factores. . d) Analizar los residuales.. Interpretar estas gráficas. titativas. también con dos niveles (orgánico e inorgánico). ¿Qué efectos parecen ser grandes? b) Usar el análisis de varianza para confirmar las conclusiones del inciso a. ---~--------------- -------- Figura 6-37 Un diseño 23 con un factor cualitativo y puntos centrales. .•: •.. considere un experimento con dos factores cuantitativos. --_ . A B C + + + + + + + + a b ab + + + + e ae be abe 31 43 34 47 45 37 50 41 25 29 50 46 38 36 54 47 6-2. Para ilustrar este punto.. •. 6~7 PROBLEMAS Un ingeniero está interesado en los efectos de la velocidad de corte (A). Sigue siendo posible emplear los puntos centrales en estos casos. e) Escribir un modelo de regresión para predecir la vida de la herramienta (en horas) con base en los resultados de este experimento. los puntos centrales pueden correrse con las combinaciones de los tratamientos en los niveles alto y bajo de los factores cualitativos. ¿Hay algún problema evidente? e) Con base en el análisis de las gráficas de los efectos principales y las interacciones. el tipo de catalizador.. Observe que los puntos centrales se colocan en las caras opuestas del cubo que incluyen los factores cuantitativos. En la figura 6-37 se muestra el diseño 23 para estos factores. ¿Ofrecen alguna idea respecto de las condiciones de operación deseables para este proceso? . Utilizar el modelo de regresión para generar las gráficas de la superficie de respuesta y de contorno de la respuesta. cada uno con dos niveles. la vida de la herramienta..~. \\~ 11 1. y yz) en cada tarjeta de prueba. Se seleccionan dos tamaños de las ranuras (kyt de pulgada) y dos velocidades (40 Y 90 rpm). Combinación de tratamientos (1) Réplica I 18. ¿A qué conclusiones se llega? e) Escribir un modelo apropiado para predecir la vida de la herramienta.4 22.4 15.3 IV 14. e) ¿A qué conclusiones se llegaría acerca de las condiciones de operación apropiadas para este proceso? Se llevó a cabo un experimento para mejorar el rendimiento de un proceso químico. Se piensa que dos factores influyen en la vibración: el tamaño de las ranuras (A) Y la velocidad de corte (E). ¿Qué efectos son grandes? b) Efectuar un análisis de varianza. Los resultados se presentan en la tabla siguiente: Combinación de tratamientos (1) Réplica I II 90 74 81 83 77 81 88 73 93 78 85 80 78 80 82 70 Combinación de tratamientos Réplica I 98 72 87 85 99 79 87 80 II a b ab e ae be abe d ad bd abd ed aed bed abed 95 76 83 86 90 75 84 80 . Se seleccionaron cuatro factores y se corrieron dos réplicas de un experimento completamente aleatorizado. El nivel de vibración en la superficie de la tarjeta cuando se hacen las ranuras se considera una fuente principal de variación dimensional de las ranuras. 40. y se hacen ranuras en cuatro tarjetas con cada conjunto de condiciones que se muestran abajo. inciso e? d) Analizar los residuales.2 15.1 36. 6-7 PROBLEMAS 277 6-3. ¿En esta representación gráfica se identifican de manera adecuada los factores importantes? Comparar las conclusiones de esta gráfica con los resultados del análisis de varianza. con base en los resultados de este experimento. 6-4. ¿Qué niveles del tamaño de las ranuras y la velocidad se recomendarían para la operación rutinaria? Considere nuevamente el experimento descrito en el problema 6-1. e) Hacer la gráfica de la interacciónAE. 43. 1:. Encontrar el error estándar de los efectos de los factores y aproximar los límites de confianza de 95% para los efectos de los factores en el problema 6-1.0 II III A E + + + + a b ab 18. Interpretar esta gráfica.9 24. Se usa una máquina para hacer ranuras de localización en una tarjeta de circuitos impresos.9 41. La variable de respuesta es la vibración medida como el vector resultante de tres acelerómetros (x. Además.2 27.5 14. Interpretar estas gráficas. corrió cuatro puntos centrales y obtuvo los siguientes valores de la respuesta: 36. y graficar los residuales contra el nivel de vibración predicho. 45. a) Estimar los efectos de los factores. 6-5. incluyendo una verificación de la curvatura cuadrática pura. Suponga que el experimentador efectuó únicamente ocho ensayos de la réplica 1. a) Analizar los datos de este experimento. b) Construir una gráfica de probabilidad normal de los residuales.0 14.2 39.9 22.9 6-6. ¿Este modelo difiere en alguna forma sustancial del modelo del problema 6-1. 6-7.5 43.9 12. ¿Los resultados de este análisis concuerdan con las conclusiones del análisis de varianza? Representar los efectos de los factores del problema 6-1 en una gráfica relativa a una distribución t escalada apropiadamente. Analizar los datos y sacar las conclusiones apropiadas. Analizar los residuales y comentar la adecuación del modelo.28 4.89 5. midió el aumento del ritmo cardiaco (pulso) inducido por la tarea. el ingeniero también estuvo interesado en las diferencias en la fatiga potencial que resulta de los tipos de botellas. Analizar los residuales y comentar la adecuación del modelo. . ¿Estas dos gráficas ayudan en la interpretación de los datos? ¿Dónde se recomendaría que se corriera el proceso con respecto a las cuatro variables? Un bacteriólogo está interesado en los efectos de dos medios de cultivo diferentes y dos tiempos diferentes sobre el crecimiento de un virus particular.98 4. Analizar los datos y sacar conclusiones. Repetir lo anterior utilizando los factores A.ABCyABD.27 4.49 5. By C con los rendimientos promedio indicados en cada vértice. Los resultados se presentan a continuación. Tiempo. En el problema 6-9.95 4. Un ingeniero industrial empleado por una compañía refresquera está interesado en los efectos de dos diferentes tipos de botellas de 32 onzas sobre el tiempo de entrega de cajas de 12 botellas del producto.91 4. ¿El análisis residual parece ser satisfactorio? e) Dos interacciones de tres factores.00 4.25 6. e) Escribir un modelo de regresión para predecir el rendimiento. aparentemente tienen efectos grandes. d) Graficar los residuales contra el rendimiento predicho y en una escala de probabilidad normal.75 2 6. h 12 21 23 20 37 38 35 1 Medio de cultivo 2 22 28 26 39 38 36 25 24 29 31 29 30 26 25 27 34 33 35 18 6-9.95 4. Trazar una gráfica de cubo en los factores A. Analizar los residuales y comentar la adecuación del modelo. Como una medida de la cantidad de esfuerzo requerido.24 5.71 6-10. Se usan dos empleados para realizar una tarea que consiste en mover 40 cajas del producto 50 pies en una plataforma de carga estándar y acomodarlas en un estante de venta. Se hacen cuatro réplicas de un diseño factorial 22 y los tiempos observados se enlistan en la siguiente tabla.55 4.65 5. Realiza seis réplicas de un diseño 22. haciendo las corridas de manera aleatoria. Analizar los datos del crecimiento viral que se presentan enseguida y sacar las conclusiones apropiadas.12 4. B y D. suponiendo que los cuatrc factores se hicieron variar en el rango de -1 a +1 (en unidades codificadas).278 CAPÍTULO 6 DISEÑO FACTORIAL2k 6-8. Los dos tipos de botellas son de vidrio y de plástico. b) Construir la tabla del análisis de varianza y determinar cuáles factores son importantes para explicar el rendimiento. a) Estimar los efectos de los factores. Empleado Tipo de botella Vidrio Plástico 1 5. b) Conducir un análisis de varianza. d) Analizar los residuales. La formación de fisuras es un problema potencialmente serio de las piezas terminadas. 65. Continuación del problema 6-12.860 14.032 14.907 13. se colocan en el interior de una campana de cristal y se introducen vapores químicos.914 14.6-7 PROBLEMAS 279 Empleado Tipo de botella Vidrio Plástico 1 39 58 44 42 45 35 35 21 20 16 13 16 2 13 11 10 15 6-11.415 13. El susceptor se hace girar y se aplica calor hasta que la capa epitaxial tiene el espesor suficiente.5!lm. ya que pueden provocar fallas irreversibles. Se corrieron cuatro réplicas y se midió el espesor de la capa epitaxial (en !lm).037 13. Calcular los límites de confianza aproximados para los efectos de los factores del problema 6-10.932 A B Bajo (-) 55% Corto (10 min) Alto (+) 59% Largo (15 min) 6-13. a) Estimar los efectos de los factores. Se corrió un experimento utilizando dos factores: rapidez de flujo de arsénico (A) y tiempo de deposición (B). Los cuatro factores son la temperatura de vaciado (A). Un paso básico del procesamiento es hacer crecer una capa epitaxial sobre obleas de silicio pulidas. ¿Qué factores son importantes? e) Escribir una ecuación de regresión que podría usarse para predecir el espesor de la capa epitaxial en la región de la velocidad de flujo del arsénico y el tiempo de deposición utilizado en este experimento.821 14. Se hacen dos réplicas de un diseño 24 y se mide la longitud de las fisuras (en mm x 10-2) inducidas en un ejemplar de prueba de muestra sometido a una prueba estándar. Usar el modelo de regresión del inciso e del problema 6-12 para generar una gráfica de contorno de la superficie de respuesta para el espesor epitaxial. 6-12. Los datos se muestran a continuación: Réplica Niveles de factores III A B 1 II IV + + + + 14.165 13. Se realiza una prueba de las piezas para determinar el efecto de cuatro factores sobre las fisuras. Las obleas se montan en un susceptor. el método de tratamiento térmico (C) y la cantidad de refinador de grano usada (D). ¿Los resultados de este análisis concuerdan con el análisis de varianza realizado en el problema 6-10? En un artículo deAT&T Technical Joumal (vol.843 14. ¿Qué ajustes de la velocidad de flujo del arsénico y del tiempo de deposición se recomendarían? Continuación del problema 6-13.921 13. pp.878 14. ¿Se observa algún residual que debiera causar preocupación? e) Comentar la forma en que se podría resolver el punto atípico potencial encontrado en el inciso d. 39-50) se describe la aplicación de diseños factoriales de dos niveles en la fabricación de circuitos integrados.el contenido de titanio (B).757 14.888 16. Los datos se muestran en la siguiente tabla: .880 14. 6-15. Suponga que es de importancia crítica obtener un espesor de la capa de 14.972 14. 6-14. ¿En qué forma cambiaría la respuesta dada en el problema 6-13 si la velocidad de flujo del arsénico fuera más difícil de controlar en el proceso que el tiempo de deposición? Se utiliza una aleación de níquel y titanio para fabricar componentes de los motores de turbina de aviones. 635 17.867 13. Escribir un modelo de regresión que pueda usarse para predecir la longitud de las fisuras como una función de los efectos principales y las interacciones significativas que se han identificado en el inciso b.25 a) Construir una gráfica de probabilidad normal de estos efectos. .78 BC = 20.037 14.78 BD = 14. A = 76.846 6. .151 4.098 9.273 10. ¿Alguno de los factores afecta la formación de fisuras? Utilizar a = 0.05.gresión del inciso a.84 D = -18. es una variable categórica.923 8. Una de las variables del experimento descrito en el problema 6-15. en caso de haberlas. ¿Qué efectos de los factores parecen ser grandes? b) Conducir un análisis de varianza.053 a) Estimar los efectos de los factores. a) Escribir dos modelos de regresión para predecir la longitud de las fisuras.403 4. uno para cada nivel de la variable método de tratamiento térmico.98 ABCD = -6.69 AD = 9.20 BCD =-7. b) Identificar un modelo tentativo.904 10. Un experimentador corre una sola réplica de un diseño 24• Se calcularon las siguientes estimaciones de los efectos: e) 6-16. e) ¿Hay algún indicio de que alguno de los factores afecte la variabilidad de la formación de fisuras? f) ¿Qué recomendaciones se harían respecto de las operaciones del proceso? Utilizar gráficas de las interacciones y/o de los efectos principales como ayuda para sacar conclusiones. se observan en estas dos ecuaciones? b) Generar las gráficas de contorno apropiadas de la superficie de respuesta para los dos modelos de re.50 ACD = 10.561 16.52 C = -7.658 19.951 17.440 8. I I '1 \"~ ':\!.052 13. By D si se utiliza el método de tratamiento térmico C = +? d) Repetir el inciso e suponiendo que quiere usarse el método de tratamiento térmico C = -.82 ABD = -6.935 15. Continuación del problema 6-15.876 19. 280 CAPÍTULO 6 DISEÑO FACTORIAL 2k A + + + + + + + + B C D Combinación de tratamientos (1) Réplica I 7.824 11.360 13.368 9. ¿Qué diferencias. con base en la gráfica de los efectos del inciso a. .815 10.653 II + + + + + + + + + + + + + + + + + + + + + + + + a b ab e ae be abe d ad bd abd ed aed bed abed 6.707 11.337 5.73 AB = -51.74 CD = 1.639 12.376 15. el método de tratamiento térmico (C).ff¡W'I' .190 15. d) Analizar los residuales de este experimento.253 12.219 12.32 AC = 11. 6-17. Suponga que los demás factores son continuos.125 11.089 17.27 ABC = -2. e) ¿Qué conjunto de condiciones se recomendaría para los factoresA.95 B = -67. Conducir este análisis y comparar los resultados con los que se obtuvieron en el ejemplo. b) Suponga que fuera necesario operar este proceso con una rapidez de 800 Álmin.80 1. 6-19. Considere una gráfica de probabilidad normal de los efectos de los factores.20 A (cm) 669 B (mTorr) 450 550 604 C (SCCM) 125 200 650 275 325 D(W) 633 642 601 635 1037 749 1052 868 1075 860 1063 729 a) Estimar los efectos de los factores. los datos se muestran enseguida: Número de Orden real de la corrida corrida 1 2 3 4 5 6 7 8 9 10 13 8 12 9 4 15 16 3 1 14 5 10 A B C D + + + + + + + + + + + + + + + + + + + + + 11 12 13 14 15 16 + + + + + + 11 2 7 6 + + + + + Rapidez de grabado Niveles de los factores Bajo (-) Alto (+) (Álrnin) 550 0. 6-20. e) ¿Cuál es el. En un artículo de Solid State Technology ("Diseño ortogonal para optimización de procesos y su aplicación en el grabado químico con plasma") se describe la aplicación de diseños factoriales en el desarrollo de un proceso de grabado químico con nitruros en un dispositivo de grabado químico con plasma para una sola oblea. f) Trazar gráficas para interpretar cualquier interacción significativa. cada uno con dos niveles. La respuesta de interés es la rapidez de grabado para el nitruro de silicio. ." 6-7 PROBLEMAS 281 6-18. El proceso usa ~F6 como gas de reacción. g) Graficar los residuales contra el orden real de las corridas. Suponga que se decidió arbitrariamente analizar los datos suponiendo que las interacciones de tres y cuatro factores eran insignificantes. Cuatro factores son de interés: el entrehierro ánodo-cátodo (A). 6-21. Comentar la adecuación del modelo. Los factores (y los niveles) fueron: A = ajuste de apertura (pequeña. a) Construir las gráficas de contorno de la rapidez de grabado utilizando este modelo. el flujo del gas C 2F 6 (C) y la potencia aplicada al cátodo (D). Considere el modelo de regresión obtenido en el inciso e del problema 6-18. e) Si no todos los factores son importantes. ¿Qué efectos parecen ser grandes? b) Efectuar un análisis de varianza para confirmar los resultados obtenidos en el inciso a. ¿Qué problemas podrían ponerse de manifiesto en esta gráfica? Continuación del problema 6-18. grande). 20% arriba del nominal). la presión en la cámara del reactor (B). Se corre una sola réplica de un diseño 24 . ¿Piensa el lector que es una buena idea suponer de manera arbitraria que las interacciones son insignificantes incluso cuando sean de orden relativamente alto? Se realizó un experimento en una fábrica de semiconductores en un esfuerzo para incrementar el rendimiento. B = tiempo de exposición (20% abajo del nominal.modelo de regresión que relaciona la rapidez de grabado con las variables significativas del proceso? d) Analizar los residuales de este experimento. Se estudiaron cinco factores. ¿Cuáles serían los ajustes de las variables del proceso que se recomendarían? Considere la réplica única del diseño 24 del ejemplo 6-2. hacer la proyección del diseño 24 en un diseño 2k con le < 4 y conducir el análisis de varianza. a) Analizar de nuevo el experimento. Comentar las gráficas. 74. Esquematizar el diseño e indicar el promedio y el rango de los rendimientos en cada corrida. 45 s). 76 y 70. g) ¿Qué recomendaciones se harían respecto de las condiciones de operación del proceso? 11) Hacer la proyección del diseño 25 de este problema en un diseño 2k en los factores importantes. Los rendimientos obtenidos en las corridas de los puntos centrales fueron 68. 6-23. Suponga que el experimentador corrió cuatro puntos centrales además de los 32 ensayos del experimento original. la presión (C) y la temperatura (D). incluyendo una prueba para la curvatura cuadrática pura. en un estudio del rendimiento de un proceso: el tiempo (A). Se corrió el diseño 25 no replicado que se muestra a continuación.5 14 60 225 Alto (+) 3 18 80 250 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + . ¿Qué efectos parecen ser grandes? b) Efectuar un análisis de varianza para confirmar los resultados obtenidos en el inciso a. d) Graficar los residuales en papel probabilidad normal. (1) = 7 a=9 b = 34 ab = 55 e = 16 ac = 20 be = 40 abe =60 d=8 ad = 10 bd = 32 abd = 50 cd = 18 aed = 21 bed = 44 abed = 61 e=8 ae = 12 be = 35 abe = 52 ce = 15 aee = 22 bee = 45 abee = 65 de = 6 ade = 10 bde = 30 abde = 53 cde = 15 aede = 20 bede = 41 abcde= 63 a) Construir una gráfica de probabilidad normal de las estimaciones de los efectos.282 CAPÍTULO 6 DISEÑO FACTORIAL 2k e = tiempo de desarrollo (30 s. la concentración (B). Continuación delproblema 6-21. Se corrió una sola réplica de un diseño 24 y los datos obtenidos se muestran en la siguiente tabla: Número de Orden real de corrida la corrida 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 5 9 8 13 3 7 14 1 6 11 2 15 4 16 10 12 A B e D Rendimiento (lbs) 12 18 13 16 17 15 20 15 10 25 13 24 19 21 17 23 Niveles de los factores BajoH A (h) B (%) e (psi) DCC) 2. grande) y E = tiempo de grabado (14. Se estudiaron cuatro factores. e) Escribir el modelo de regresión que relacione el rendimiento con las variables significativas del proceso.D = tamaño de la máscara (pequeña.5 min. ¿Es de ayuda este esquema para interpretar los resultados de este experimento? 6-22. b) Comentar cuál sería el siguiente paso. ¿La gráfica es satisfactoria? e) Graficar los residuales contra los rendimientos predichos y contra cada uno de los cinco factores. 1) Interpretar cualquier interacción significativa. 15. cada uno con dos niveles.5 min). Analizar el valor práctico de esta gráfica de superficie de respuesta.) Un panel de prueba integrado por ocho personas hizo el muestreo de cada lote y llenó el cuestionario. el aroma.ti 6-7 PROBLEMAS 283 6-24. El experimento del brownie (pastelito) exquisito. esquematizar el diseño con el promedio y el rango del rendimiento indicados en cada punto del cubo. Usar el modelo de regresión del inciso e del problema 6-23 para generar una gráfica de contorno de la superficie de respuesta del rendimiento. la marca de la harina para brownies y el método de batido afectan la exquisitez de los brownies. (Este cuestionario incluía aspectos como el sabor. Existen muchas formas diferentes de hornear brownies. Durante muchos años ha impartido el curso de diseño experimental a una amplia variedad de audiencias y siempre asigna la planeación. ¿Qué factores parecen tener efectos grandes? b) Efectuar un análisis de varianza utilizando la gráfica de probabilidad normal del inciso a como guía para formar el término del error. Continuación del problema 6-23. . El autor es un ingeniero hecho en la práctica y un firme creyente de aprender haciendo las cosas. d) Analizar los residuales de este experimento. la apariencia. La matriz del diseño y los datos de la respuesta se presentan a continuación: Lote de brownies 1 2 3 4 5 6 7 8 Resultados del panel de prueba A B e 1 11 15 9 16 10 12 10 15 2 9 10 12 17 11 13 12 12 3 10 16 11 15 15 14 13 15 4 10 14 11 12 8 13 10 13 5 11 12 11 13 6 9 7 12 + + + + + + + + + + + + 6 109 11 13 8 13 7 12 7 8 6 11 11 9 14 17 9 8 9 15 12 11 14 9 13 14 a) Analizar los datos de este experimento como si se tratara de ocho réplicas de un diseño 23• Comentar los resultados. El propósito de este experimento fue determinar la forma en que el material del molde. ¿El análisis indica algún problema potencial? e) ¿Es posible plegar este diseño a un diseño 23 con dos réplicas? De ser así. Los niveles de los factores fueron: Factor A :=: material del molde B :=: método de batido e :=: marca de la harina BajoH Vidrio Cuchara Cara Alto (+) Aluminio Batidora Barata La variable de respuesta fue la exquisitez. 6-25. ¿A qué conclusiones se llega? e) Escribir un modelo de regresión que relacione el rendimiento con las variables importantes del proceso. etc. En este problema se utilizan los resultados de un experimento realizado por Gretchen Krueger en la Universidad Estatal de Arizona. una medida subjetiva derivada de un cuestionario aplicado a los sujetos que hicieron el muestreo de cada lote de brownies. realización y análisis de un experimento real a los participantes de la clase. Los participantes parecen disfrutar esta experiencia práctica y siempre aprenden mucho de ella. a) Construir una gr~fica de probabilidad normal de las estimaciones de los efectos. Interpretar los resultados. la consistencia. e) Repetir los incisos a-d utilizando la respuesta de la viscosidad. el tiempo (C) y la presión (D). a) Construir una gráfica de contorno de la superficie de respuesta para el peso molecular.1' ~:~:'::.l J~!~~: JI. a) Considere únicamente la respuesta del peso molecular. ¿En qué dirección se ajustarían las variables del proceso a fin de incrementar el peso molecular? b) Construir una gráfica de contorno de la superficie de respuesta para la viscosidad.. ::~!' ::: ji. Los cuatro factores estudiados fueron la temperatura (A).· :3 Número Orden real de de corrida las corridas A 1 18 2 9 + 3 13 4 8 + 5 3 6 11 + 7 14 8 17 + 9 6 10 7 + 11 2 12 10 + 13 4 14 19 + 15 15 16 20 + 17 1 O 18 5 O 19 16 O 20 12 O B C D Peso molecular 2400 2410 2315 2510 2615 2625 2400 2750 2400 2390 2300 2520 2625 2630 2500 2710 2515 2500 2400 2475 Niveles de los factores Viscosidad 1400 1500 1520 1630 1380 1525 1500 1620 1400 1525 1500 1500 1420 1490 1500 1600 1500 1460 1525 1500 Bajo (-) A (oC) 100 4 B (%) 20 C (min) 60 D (psi) Alto (+) 120 8 30 75 + + + + + + + + + + + + + + O O O O + + + + + + + + O O O O + + O O O O 6-27. Comentar los resultados. Utilizar los modelos de regresión del peso molecular y la viscosidad para res· ponder las preguntas siguientes. ¿El análisis del inciso a es el enfoque correcto? Hay únicamente ocho lotes.:. ¿Hay algún indicio de curvatura? e) Escribir un modelo de regresión para predecir el peso molecular como una función de las variables importantes. Graficar las estimaciones de los efectos en una escala de probabilidad normal. la concentración del catalizador (B). ¿En qué dirección se ajustarían las variables del proceso para disminuir la viscosidad? .:' ji:. el peso molecular y la viscosidad. ~::.284 b) CAPÍTULO 6 DISEÑO FACTORIAL 2k 6·26. ¿Este análisis es más apropiado que el del inciso a? ¿Por qué sí o no? Se condujo un experimento en un proceso químico para producir un polímero.". ¿se tienen en realidad ocho réplicas de un diseño factorial 23 ? e) Analizar el promedio y la desviación estándar del puntaje de la exquisitez.:: l:: :1n. ¿Qué efectos parecen ser importantes? b) Usar un análisis de varianza para confirmar los resultados del inciso a. Continuación del problema 6-26. d) Analizar los residuos y comentar la adecuación del modelo. Se observaron dos respuestas. La matriz del diseño y los datos de la respuesta se presentan a continuación: ~!~¡~~ ·jl::: ~!~ ". Los resultados de un experimento factorial 24 realizado durante un paso crítico del procesamiento se muestran en la tabla ~iguiente: .00182 0. 15 pulg/min) y D = enfriador del fluido de corte usado (no. + 1) se muestran a continuación. e) ¿Qué condiciones de operación se recomendarían si fuera necesario producir un producto con peso molecular entre 2400 y 2500.. Convertir esta ecuación de predicción en un modelo en las variables naturales. Sin embargo. 400). b) Ajustar el modelo identificado en el inciso a y analizar los residuales. o alguna otra razón. Un enfoque lógico es estimar el valor faltante con un número que haga cero el contraste de la interacción de orden más alto.00308 0. ¿Hay algún indicio de que el modelo no sea adecuado? e) Repetir el análisis de los incisos a y b utilizando l/y como la variable de respuesta. suponiendo que falta la corrida abo Compare los resultados obtenidos con los del ejemplo 6-2. O.00340 0.00253 0.00160 0. Los factores (y sus niveles) sanA = ángulo de la herramienta (12. O.00301 0. ¿Hay algún indicio de que la transformación ha sido útil? d) Ajustar un modelo en términos de las variables codificadas que pueda usarse para predecir la rugosidad superficial. una prueba fallida. 6-29. e = velocidad de alimentación (10.00344 0. Los datos de este experimento (con los factores codificados en los niveles usuales -1. Interpretar los resultados. puede emplearse alguna de las técnicas estudiadas en el capítulo 5. Un ingeniero realizó un experimento para estudiar el efecto de cuatro factores sobre la aspereza superficial de una pieza maquinada.00163 + + + + + + + + + + + + + + + + + + + + 11 1ft .6-7 PROBLEMAS 285 6-28.4 . para un diseño factorial sin réplicas (n = 1) debe usarse otro método. Probar la curvatura en este experimento.00252 0. Y con la viscosidad más baja posible? Considere una sola réplica del diseño 24 del ejemplo 6-2. Representar las efectos de los factores en una gráfica de probabilidad normal y seleccionar un modelo tentativo.00269 0. 71. Corrida 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 A B e D Rugosidad superficial 0. B = viscosidad del fluido de corte (300. O) Yque se observaron las respuestas siguientes: 73. 75.!$ 1.00280 0. sí). :( I~ . Si el diseño se hace con n réplicas (n > 1).00290 0.00336 0. a) Estimar los efectos de los factores. Suponga que se hicieron cinco corridas de puntos en el centro (O.¡ "~ji 6-31. 69 Y76. La resistividad de una oblea de silicio está influida por varios factores. Un valorfaltallte ellll1l diseñofactoria12 k • No es raro encontrar que falta una de las observaciones de un diseño 2k debido a un equipo de medición defectuoso.00362 0.00284 0. 15°). Aplicar esta técnica al experimento del ejemplo 6-2.00184 0. I~ i + + + + + + + + + + + + . 75 2. 8. a) Estimar los efectos de los factores. la jerarquía no es un principio absoluto que deba seguirse en todos los casos.07 5. se han incluido términos de orden inferior no significativos en un modelo porque eran factores que estaban incluidos en términos de orden superior significativos.15.35 1.•• .30 6-32. . a) Encontrar la varianza de la respuesta predicha y en un punto Xl' Xz. el cual requirió que se incluyera un efecto principal no significativo para respetar la jerarquía.53 1.95 y 6.09 5.16 4.73 1. ¿qué modelo preferiría el lector? .13 9.60 11.28 1.16 9. es decir. e) Encontrar un intervalo de confianza de 95 % para la estimación de la respuesta media en el vértice de un cubo (Xl = X z = x 3 = ±1). . Sugerencia: usar los resultados del problema 6-33. 6-34. a) Ajustar el modelo jerárquico y el modelo no jerárquico.92 11.•• . b) Calcular el estadístico PRESS. considere el modelo que resultó en el problema 6-1.63. ¿Hay algún indicio de que el modelo no sea adecuado? e) Repetir el análisis de los incisos a y b utilizando In (y) como la variable de respuesta. Analizar de nuevo el experimento incorporando los puntos centrales.11 1.a) por ciento para la verdadera respuesta media en el punto Xl' Xz. Xk del espacio del diseño.48. y suponga un diseño 2k con el mismo número de réplicas n en cada punto del diseño. Xk del espacio del diseño. Continuación del problema 6-31. Se ha usado varias veces el principio de jerarquía para seleccionar un modelo. Utilizar los datos del problema 6-1. Representar las efectos de los factores en una gráfica de probabilidad normal y seleccionar un modelo tentativo. Las mediciones de la resistividad en los puntos centrales son: 8. Ciertamente.~ 1 i 286 CAPÍTULO 6 DISEÑO FACTORIAL 2k Corrida 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 A B e D + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + Resistividad 1.03 5. b) Usar el resultado del inciso a para encontrar la ecuación de un intervalo de confianza de 100(1. la RZ ajustada y el cuadrado medio del error para ambos modelos. Suponga que el experimentador corrió también cuatro puntos centrales junto con las 16 corridas del problema 6-31. Para ilustrar esto. d) Con base en los análisis que se han realizado. b) Ajustar el modelo identificado en el inciso a y analizar los residuales. Modelosjerárquicos. ¿Hay algún indicio de que la transformación haya sido útil? d) Ajustar un modelo en términos de las variables codificadas que pueda usarse para predecir la resistividad. ¿Qué conclusiones pueden sacarse ahora? Es frecuente usar el modelo de regresión ajustado de un diseño factoria12 k para hacer predicciones en puntos de interés del espacio del diseño. 6-33. Sugerencia: recuerde que lasx están codificadas. de tal modo que la varianza de un coeficiente de regresión /3 sea aZ/(n2k ) y que la covarianza entre cualquier par de coeficientes de regresión sea cero. 7.68 2. que sean robustos) en diversas situaciones que es posible encontrar en la práctica. un lote de materia prima podría no ser suficiente para hacer todas las corridas requeridas. La técnica de diseño utilizada en estas situaciones es la formación de bloques. un ingeniero químico puede correr un experimento en una planta piloto con varios lotes de materia prima porque sabe que en el proceso real a gran escala posiblemente se usarán diferentes lotes de materia prima con diversos grados de calidad.1 INTRODUCCIÓN Hay múltiples situaciones en las que es imposible efectuar todas las corridas de un experimento factorial 2k bajo condiciones homogéneas. Por ejemplo. Este capítulo se enfoca en algunas técnicas especiales para separar en bloques un diseño factorial 2k • 7. En otros casos. donde se indicó cómo correr un diseño factorial general en bloques.2 FORMACIÓN DE BLOQUES DE UN DISEÑO FACTORIAL 2k CON RÉPLICAS Suponga que se han corrido n réplicas del diseño factoria12k • Esta situación es idéntica a la que se estudió en el capítulo 5. El análisis del diseño Tabla 7-1 Experimento del proceso químico en tres bloques Bloque 1 (1) = 28 a = 36 b = 18 ab = 31 Totales de los bloques Bloque 2 Bloque 3 (1) a b ab = 27 = 32 = 23 = 29 (1) = 25 a = 32 b = 19 ab = 30 B l = 113 B 2 = 106 B 3 = 111 287 . entonces cada conjunto de condiciones no homogéneas define un bloque. y cada réplica se corre en uno de los bloques. Por ejemplo. Si hay n réplicas. Las corridas de cada bloque (o réplica) se harían de manera aleatoria.Formación de bloques y confusión en el diseño factorial 2k 7. podría ser conveniente modificar deliberadamente las condiciones experimentales para asegurar que los tratamientos tengan la misma efectividad (es decir. donde el tamaño del bloque es menor que el número de combinaciones de los tratamientos de una réplica. estos diseños pueden correrse en dos bloques.33 4. véase la revisión de la sección 5-6. en cuatro bloques.33 75. EJEMPLO 7 ~ 1 .288 Tabla 7-2 CAPÍTULO 7 FORMACIÓN DE BLOQUES Y CONFUSIÓN EN EL DISEÑO FACTORIAL 21< Análisis de varianza del experimento del proceso químico en tres bloques Fuente de variación Bloques A (concentración) B (catalizador) AB Error Total Suma de cuadrados 6. ya que cada bloque no contiene todos los tratamientos o las combinaciones de los tratamientos.2060 es similar al de cualquier experimento factorial separado en bloques.33 24. si el diseño se hubiera corrido en bloques. Se considera la construcción y el análisis del diseño factorial 2k en 2P bloques incompletos. en ocho bloques. Sea que Bl> B 2 YB 3 representen los totales de los bloques (ver la tabla 7-1).50 208.12 2. se necesitarán tres lotes de materia prima para correr las tres réplicas de este diseño. Por consiguiente. 1 .01 0.25 208.32 18.84 323. la estructura especial del sistema factorial2 k permite un método de análisis simplificado.00 8. Entonces SS Bloques = L 4-12 1=1 3 B¡2 y. En la tabla 7-2 se muestra el análisis de varianza de este diseño separado en bloques. Considere el experimento del proceso químico que se describió en la sección 6-2.14 Valor P 50. Todas las sumas de cuadrados se calculan exactamente igual que en un diseño 2k estándar sin formación de bloques. Por lo tanto.00 8.50 Hay dos grados de libertad entre los tres bloques. por ejemplo. La suma de cuadrados de los bloques se calcula a partir de los totales de los bloques.0004 0.0053 0.00 Grados de libertad 2 1 1 1 6 11 Cuadrado medio 3. La tabla 7-2 indica que las conclusiones de este análisis. donde p < k. En la tabla 7-1 se muestra el diseño donde cada lote de materia prima corresponde a un bloque. La técnica hace que la información acerca de ciertos efectos de los tratamientos (por lo general las interacciones de orden superior) sea indistinguible de los bloques o esté confundida con los bloques. Suponga que sólo pueden hacerse cuatro ensayos experimentales con un solo lote de materia prima.~ = (113)2 +(106)2 +(111)2 4 (330)2 12 = 6. son idénticas a las de la sección 6-2 y que el efecto de los bloques es relativamente pequeño. etcétera.33 75. En este capítulo la atención se centra en los sistemas de confusión (o mezclado) para el diseño factorial 2k • Observe que aun cuando los diseños que se presentan son diseños de bloques incompletos. 7~3 CONFUSIÓN DEL DISEÑO FACTORIAL 2 k Hay muchos problemas en los que es imposible realizar una réplica completa de un diseño factorial en un bloque. La confusión (o mezclado) es una técnica de diseño mediante la cual un experimento factorial completo se distribuye en bloques. se necesitan dos lotes de materia prima. indica que las combinaciones de tratamientos localizadas en diagonales opuestas se asignan a bloques diferentes. Por las ecuaciones 6-1 y 6-2 se obtiene A = t[ab+a. cualquier diferencia entre el bloque 1 y el bloque 2 se cancela. por ejemplo. Si los lotes de materia prima se consideran como bloques. y cada lote de materia prima sólo alcanza para probar dos combinaciones de tratamientos. La razón de esto es evidente en la tabla de signos positivos y negativos del diseño 22 • Se presentó originalmente en la tabla 6-2. Es decir. Por lo tanto. • ~ ~ i! Corrida en el bloque 1 Corrida en el bloque 2 I B O + A a) Vista geométrica Bloque 1 Bloque 2 rml L:J [JJ b) Asignación de las cuatro corridas en dos bloques Figura 7-1 Diseño 22 en dos bloques. entonces deben asignarse a cada bloque dos de las cuatro combinaciones de tratamientos. Suponga que los efectos principales deA y B se estiman como si no se hubiera hecho la formación de bloques. Desde luego. La vista geométrica. que el bloque 1 contiene las combinaciones de los tratamientos (1) Yab y que el bloque 2 contiene-a y b.a. el orden en que se corren las combinaciones de los tratamientos dentro de un bloque se determina aleatoriamente. .7·4 CONFUSIÓN DEL DISEÑO FACTORIAL 2k EN DOS BLOQUES 289 CONFUSIÓN DEL DISEÑO FACTORIAL 2'< EN DOS BLOQUES suponga que quiere correrse una sola réplica del diseño 22 • Cada una de las 22 = 4 combinaciones de los tratamientos requiere una cantidad de materia prima. Es decir. Thmbién se decidirá aleatofiamente cuál de los bloques se correrá primero. En la figura 7-1 se muestra uno de los diseños posibles para este problema. por la figura 7-1b. el efecto de los bloques y la interacciónAB son idénticos. +0------. Observe. debido a que en cada estimación hay una combinación de un tratamiento positivo y uno negativo de cada bloque. pero por conveniencia se repite como la tabla 7-3.(1)] Observe que niA ni B son afectados por la formación de bloques. A partir de esta tabla se observa que todas las combinaciones de tratamientos que tienen signo positivo para AB se asignan al bloque 1.(1)] B = t[ab+b. figura 7-1a. AB está confundido (o mezclado) con los bloques.b. Considere ahora la interacción AB AB= Hab+(l)-a-b] Puesto que las dos combinaciones de tratamientos con signo positivo [ab y (1)] están en el bloque 1 y las dos con signo negativo (a y b) están en el bloque 2. Otros métodos para construir bloques Se cuenta con otro método para construir estos diseños. Este esquema puede usarse para confundir o mezclar cualquier diseño 2k en dos bloques. Ala ecuación 7-1 se le llama la definición de contrastes. Puesto que los únicos valores posibles deL (mod 2) son Oy 1. Las combinaciones de tratamientos que producen el mismo valor de L (mod 2) se colocarán en el mismo bloque. Por la formación de signos positivos y negativos de la tabla 7-4. Por ejemplo. La práctica usual es confundir la interacción de orden más alto con los bloques. las combinaciones de tratamientos que son negativas paraABC se asignan al bloque 1 y las que son positivas paraABC al bloque 2. El diseño resultante se muestra en la figura 7-2. Tabla 7-4 Tabla de signos positivos y negativos para el diseño 23 Combinación de tratamientos (1) Efecto factorial 1 A B AB C AC BC ABC a b ab e ae be abe + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + . El método utiliza la combinación lineal (7-1) dondex¡ es el nivel del factor i-ésimo que aparece en una combinación de tratamientos particular y a¡ es el exponente que aparece en el factor i-ésimo para el efecto que va a confundirse. si (1) Yb se hubieran asignado al bloque 1 ya yab al bloque 2. Para el sistema 2\ se tiene a¡= O01 yx¡ = O(nivel bajo) ox¡ = 1 (nivel alto). el efecto principal deA se habría confundido con los bloques. Este enfoque puede usarse para confundir o mezclar cualquier efecto (A. Como un segundo ejemplo.290 CAPÍTULO 7 FORMACIÓN DE BLOQUES Y CONFUSIÓN EN EL DISEÑO FACTORIAL 2" Tabla 7-3 Tabla de signos positivos y negativos para el diseño 22 Efecto factorial 1 Combinación de tratamientos (1) A B AB a b ab + + + + + + + + + + mientras que todas las combinaciones de tratamientos que tienen signo negativo para AB se asignan al bloque 2. considere un diseño 23 que se corre en dos bloques. De nueva cuenta se resalta que las combinaciones de tratamientos dentro de un bloque se corren de manera aleatoria. con esto las 2k combinaciones de tratamientos se asignarán a exactamente dos bloques. Suponga que se quiere confundir la interacción de los tres factoresABC con los bloques. B o AB) con los bloques. Para ilustrar este enfoque.x3 a Cy al = a z = a 3 = 1. Por lo tanto. obteniéndose L= 1(1)+1(0)+1(0)= 1= 1 (mod 2) Por lo tanto. ab. ae y be se corren en el bloque 1 ya. forman un grupo con respecto a la mu1ti- . la combinación de tratamientos a es 100. por lo tanto. b. (1). Xl corresponde aA. Para el resto de las combinaciones de tratamientos se tiene b: L= 1(0)+1(1)+1(0)= 1= 1 (mod 2) ab: L= 1(1)+1(1)+1(0)= 2= O (mod 2) e: L= 1(0)+1(0)+1(1) = 1 = 1 (mod 2) ae: L= 1(1)+1(0)+1(1)= 2= O (mod 2). la definición del contraste correspondiente aABC es ¡\ I L= Xl +x z +x3 La combinación de tratamientos (1) se escribe 000 en la notación (O. a saber. el cual se generó con la tabla de signos positivos y negativos. Puede usarse otro método para construir estos diseños. considere un diseño 23 conABC confundido con los bloques.x z aB. Se trata del mismo diseño que se ilustró en la figura 7-2. 1). Las combinaciones de los tratamientos incluidas en este bloque poseen una útil propiedad de la teoría de grupos." 7-4 CONFUSIÓN DEL DISEÑO FACTORIAL 2k EN DOS BLOQUES • = Corrida en el bloque 1 O = Corrida en el bloque 2 291 I I I / / / &--geométrica Bloque 1 (1) el¿ A Bloque 2 al Vista a b e abe ab ae be b) Asignación de las ocho corridas en dos bloques Figura 7-2 El diseño 23 en do~ bloques conABC confundido. En este caso. Al bloque que contiene la combinación de tratamientos (1) se le llama el bloque principal. e yabe se corren en el bloque 2. be: L= 1(0)+1(1)+1(1)= 2= O (mod 2) abe: L= 1(1)+1(1)+1(1)= 3= 1 (mod 2) Por lo tanto. (1) ya se correrían en bloques diferentes. L= 1(0)+1(0)+1(0)= 0= O (mod 2) De manera similar. puesto que el bloque principal es (1). Además. Si se cuenta con recursos suficientes para hacer réplicas de un diseño confundido. AB. ae y be. por lo general es necesario hacer réplicas del experimento a fin de obtener una estimación del error. se sabe que b está en el otro bloque. En la tabla 7-S se presenta la descomposición de esos siete grados de libertad. por lo general es mejor usar un método ligeramente diferente para diseñar los bloques en cada réplica. Observe que ab'ae= a 2 be= be ab . los elementos de este segundo bloque son b'(l) b'ab= ab b'ae 2 2 =b =a = abe b'be=b e=e Estos resultados concuerdan con los que se obtuvieron anteriormente. AC. La suma de cuadrados del error se compone en realidad de las interacciones de dos factores entre las réplicas. suponga que un diseño factorial 23 debe correrse en dos bloques con ABC confundido. Esto implica que cualquier elemento [con excepción de (1)] del bloque principal pue. Este enfoque consiste en confundir un efecto diferente en cada réplica para obtener cierta información sobre todos los Réplica [ Réplica 1I Réplica [[[ Réplica IV Bloque 1 (1) Bloque 2 Bloque 1 (1) Bloque 2 Bloque 1 (1) Bloque 2 Bloque 1 (1) Bloque 2 abe a b abe a b e abe a b e abe a b e ae ab be ae ab be ae ab be ae ab be Figura 7-3 Cuatro réplicas del diseño 23 con ABe confundido. considere el bloque principal del diseño 23 conABC confundido. En la tabla 7-S se muestra el análisis de varianza de este diseño. y cada uno de los efectos (A. siete grados de libertad deben asociarse con estos bloques. Para el di· seña 23 conABC confundido. Por ejemplo. puesto que hay ocho bloques. Por lo general es seguro considerar que las interacciones son cero y tratar el cuadrado medio resultante como una estimación del error. como se muestra en la figura 7-2. Hay 32 observaciones y 31 grados de libertad. be = ab 2 e = ae ae . Estimación del error Cuando el número de variables es pequeño. y el experimentador decide hacer cuatro réplicas del diseño. Por ejemplo. Observe queABC está confundido en cada réplica. be = abe 2 = ab Las combinaciones de tratamientos del otro bloque (o bloques) pueden generarse multiplicando uno de los elementos del nuevo bloque por cada uno de los elementos del bloque principal módulo 2. por ejemplo k = 2 o 3. ab. de generarse multiplicando otros dos elementos del bloque principal módulo 2. que es en realidad réplicas x bloques. Esta prueba suele tener una sensibilidad muy baja. Por lo tanto. . Los efectos principales y las interacciones de dos factores se prueban contra el cuadrado medio del error. El diseño resultante podría verse como el de la figura 7-3.I 1 292 CAPÍTULO 7 FORMACIÓN DE BLOQUES Y CONFUSIÓN EN EL DISEÑO FACTORIAL 2" plicación módulo 2. BC). B. Cochran y COX [2Sb] hacen notar que el cuadrado medio del bloque oABC podría compararse con el error del cuadrado medioABC. C. en la columna ABCD. El experimentador suele suponer que las interacciones de órdenes superiores son insignificantes y combina sus sumas de cuadrados como el error. La definición del contraste es . El lote de calidad menor se convierte en el bloque 1y el lote de buena calidad se convierte en el bloque 2 (no es relevante a cuál de los dos lotes se le llama bloque 1 o bloque 2). todas las respuestas serán 20 unidades menores en este lote de material que en el otro. como resultado. EJEMPLO 7. uno de ellos es de calidad mucho más baja y. puede examinarse la tabla 6-12 y observar que las combinaciones de los tratamientos que son + en la columna ABCD se asignan al bloque 1 y que las que son . están en el bloque 2. de manera aleatoria). De manera alternativa. desde luego.2 . la presión (B).:: 4. pero las respuestas son 20 unidades más bajas que las que se habrían obtenido si se hubiera usado el material de buena calidad. En la figura 7-4b se muestran las respuestas resultantes. El experimentador puede correr ocho combinaciones de los tratamientos con un solo lote de material. Primera. La gráfica de probabilidad normal de los efectos de los factores puede ser muy útil a este respecto. Se introducirán dos modificaciones al experimento original. Considere la situación descrita en el ejemplo 6-2. Si k es moderadamente grande. por lo que un diseño 24 confundido en dos bloques parece apropiado. Entonces todas las pruebas del bloque 1 se realizan primero (las ocho corridas del bloque se hacen. y se estudia en la sección 7-7. Se usará este experimento para ilustrar las ideas de la formación de bloques y la confusión en un diseño no replicado. rt j ·1. Suponga que cuando se seleccionan los dos lotes de materia prima que se necesitan para correr el experimento. Recuerde que se estudian cuatro factores-la temperatura (A). Es lógico confundir la interacción de orden más alto ABCD con los bloques. A este procedimiento se le llama confusión (o mezclado) parcial. suponga que no es posible correr las 24 = 16 combinaciones de tratamientos utilizando un solo lote de materia prima.'- I y es sencillo verificar que el diseño es como el que se ilustra en la figura 7-4. la concentración de formaldehído (C) y la velocidad de agitación (D). con frecuencia sólo es posible hacer una réplica. por ejemplo k . li I I 1. observe que éstas se han encontrado .7-4 CONFUSIÓN DEL DISEÑO FACTORIAL 2" EN DOS BLOQUES 293 Tabla 7-5 Análisis de varianza de cuatro réplicas de un diseño 23 con ABe confundido Grados de libertad Fuente de variación Réplicas Bloques (ABC) Error deABC (réplicas x bloques) A B 3 1 3 1 1 1 1 1 1 18 C AB AC BC Error (o réplicas x efectos) Total 31 efectos.en una planta piloto para determinar su efecto sobre el índice de filtración del producto. La segunda modificación que se hará es introducir un efecto de los bloques para que pueda demostrarse la utilidad de la formación de bloques. .•. por lo que las respuestas son exactamente como fueron originalmente en el ejemplo 6-2. (El lector deberá verificar esto. la interacción ABCD estima el efecto de la interacción original (1. En el presente ejemplo.) ¿Qué puede decirse del efecto de la interacciónABCD? La estimación de este efecto en el experimento original (ejemplo 6-2) fueABCD == 1.625.375) más el efecto de bloque (-20). . (¿Puede el lector ver por qué el efecto del bloque es -20?) El efecto del bloque . Es decir..20). D y las interaccionesAC y AD aparecen como los efectos importantes. Las demás respuestas de este bloque se obtienen de manera similar. r~ '. Cuando se construye una gráfica de probabilidad normal de estas estimaciones de los efectos.375 + (-20) == -18. de dondeABCD == 1. la respuesta original de la combinación de tratamientos (1) fue 45. En la tabla 7-6 se muestran las estimaciones de los efectos para esta versión "modificada" del ejemplo 6-2.375. Observe que las estimaciones de los cuatro efectos principales. se prosigue con las ocho pruebas del bloque 2.:' . . •. Puesto queABCD está confundido con los bloques. 4 restando el efecto del bloque de las observaciones originales dadas en el ejemplo 6-2. Yen la figura 7-4b se consigna como (1) == 25 (== 45 . r 294 CAPÍTULO 7 FORMACIÓN DE BLOQUES Y CONFUSIÓN EN EL DISEÑO FACTORIAL 21< D " + • = Corridas en el bloque 1 o = Corridas en el bloque 2 eL¿ A a) Vista geométrica Bloque 1 (1) = 25 Bloque 2 ab=45 ae=40 bc = 60 ad=80 bd=25 ed= 55 abed = 76 a = 71 b=48 e = 68 d=43 abe = 65 bed = 70 aed =86 abd = 104 b) Asignación de las 16 corridas en los dos bloques Figura 7·4 El diseño 2 en dos bloques para el ejemplo 7-2. Después de que se realizan las pruebas del bloque 1. justo como en el experimento original. de las seis interacciones de dos factores y de las cuatro interacciones de tres factores son idénticas a las estimaciones de los efectos obtenidas en el ejemplo 6-2. No hay ningún problema con la materia prima de este lote. C. la estimación del efecto de la interacciónABCD esABCD == -18. los factoresA.625. donde no hubo ningún efecto de bloques. 55 0.625 -2.19 -0.5625 20.625 0.5625 1387.0625 855.0625 14.5625 1314.5625 1870.5625 187.94 2.125 1.56 0. En la tabla 7-7 se resume el análisis de varianza de este experimento.625 -18.05 63.0625 855." 7-4 CONFUSIÓN DEL DISEÑO FACTORIAL 2k EN DOS BLOQUES 295 Tabla 7-6 Estimaciones de los efectos para el diseño ejemplo 7-2 Coeficiente de regresión 10.625 Desde luego.8403 Fuente de variación Bloques (ABCD) A C D AC Fo 89.0625 1105.0019 0.875 14.125 -1.0625 855.32 <0.5625 27. y la suma de cuadrados de los bloques es ss Bloques = (406)2 +(555)2 8 (961)2 16 = 1387.31 0.0625 1105.625 24 separado en bloques del Término del modelo Suma de cuadrados 1870.5625 Tabla 7-7 Análisis de varianza del ejemplo 7-2 Suma de cuadrados 1387.4375 Grados de libertad 1 1 1 1 1 1 9 15 Cuadrado medio 1870.03 <0.5625 39.0625 1314.125 16.96 0.0625 10.5625 390.55 5. Los efectos que tienen estimaciones grandes están incluidos en el modelo.5625 390.YBloque 2 406 555 --8 8 -149 8 = -18. este efecto es en realidad la estimación de Bloques + ABCD.625 3.20 0.5625 Contribución porcentual 26.31 Estimación del efecto 21.05 53.76 18.01 18.125 9.0625 1105. o Efecto del bloque = YBloque 1 .0001 <0.49 12.375 -1.48 15.625 2.07 0.01 0.875 4.72 41.375 -0.06 -0.94 7.56 4.5625 1314.51 A B C D AB AC AD BC BD CD ABC ABD ACD BCD Bloques (ABCD) también puede calcularse directamente como la diferencia en la respuesta promedio entre los dos bloques.5625 7111.5625 5.0001 <0.125 -18.5625 22.31 1.062 -9.39 19.0001 AD Error Total .05 Valor P <0.06 8.81 1.19 -0.0625 68.30 0.0625 390.0001 0.5625 0.81 -1.5625 0.15 0. .... Estos diseños son particularmente útiles en situaciones en las que el número de factores es moderadamente grande. L 2 =O .. L... . por ejemplo k 2: 4. O).... ...ae... abe. bed.. Se seleccionan dos efectos para confundirlos con los bloques. Puesto que hay cuatro bloques con tres grados de libertad entre ellos.aed..". .. L z) se asignan al mismo bloque. bee.... es decir.1). los resultados pudieron haber sido muy diferentes. O) o bien (1. Estos efectos tienen las dos definiciones de contrastes L¡ = x¡ +x 4 +x s L z = X z +x 3 +x s asociadas con ellos. entonces deberán usarse cuatro bloques. ab.. de. Las combinaciones de tratamientos que producen los mismos valores de (L¡..z observaciones cada uno.. BCE y ABCD confundidos. ...... La construcción de este diseño es relativamente directa. donde no estuvo presente ningún efecto de bloques...d.L. ad. ya que los 16 ensayos se habrían corrido en orden aleatorio en un diseño sin formación de bloques)...abe. la cual se Bloque 1 Bloque 2 Bloque 3 Bloque 4 L.. CONFUSIÓN DEL DISEÑO FACTORIAL 2" EN CUATRO BLOQUES 7~5 Es posible construir diseños factoriales 2k confundidos en cuatro bloques con 2k . nos damos cuenta de que otro efecto además deADE y BCE debe confundirse con los bloques...bd. Con un poco de reflexión.\ 296 CAPÍTULO 7 FORMACIÓN DE BLOQUES Y CONFUSIÓN EN EL DISEÑO FACTORIAL 2k Las conclusiones de este experimento coinciden exactamente con las del ejemplo 6-2..e.cualquiera de (L¡. y puesto que ADE y BCE tienen un solo grado de libertad cada una......abde... (O.ade.. Lz = 1 L¡ = 1.. abede.. por ejemploADE y BCE. En el ejemplo tratado aquí se encuentra L¡ . Observe que si el experimento no se hubiera corrido en bloques. ~. be.be...! ede. es evidente la necesidad de confundir un efecto adicional con un grado de libertad.. y si un efecto de magnitud -20 hubiera afectado los 8 primeros ensayos (los cuales se habrían seleccionado de manera aleatoria. Lz = O =1' Z L =0 para T = O. abed..ae. ee..' ..abd.J¡ = O. L2 =O =1 abee ae bede de L.aede para b. . Como un ejemplo.. considere el diseño 2s . Entonces cada combinación de tratamientos producirá un par particular de valores deL¡ (mod 2) yL z (mod 2). Y el tamaño de los bloques es relativamente pequeño... L z = 1 L¡ (1).... L z) = (O... Este efecto es la interacción generalizada deADE y BCE.. ... bede para e. .. =0 L 2 =O (1) L = 1.. Si cada bloque incluirá únicamente ocho corridas. ed Estas combinaciones de tratamientos se asignarían a bloques diferentes. abee. . (1. L2 =1 =1 abe ace a d abe be abde ce b abd e aed e abede ade bd bee ab ae ed ad be ede abed bde bed aede Figura 7·5 El diseño 25 en cuatro bloques conADE... En la figura 7-5 se muestra el diseño completo. bde para a.... ...~T I .. 1).1 . .... aee. La inspección de esta tabla revela que las combinaciones de los tratamientos se asignan a los bloques de la siguiente manera: Combinaciones de los tratamientos en el Bloque 1 Bloque 2 Bloque 3 Bloque 4 SignodeADE Signo de BCE Signo deABCD + + + + + + Observe que el producto de los signos de dos efectos cualesquiera de un bloque particular (por ejemplo ADE y BCE) produce el signo del otro efecto de ese bloque (en este caso. Por ejemplo. El procedimiento general para construir un diseño 2k confundido en cuatro bloques consiste en elegir dos efectos para generar los bloques. un efecto que es de posible interés. 7·6 CONFUSIÓN DEL DISEÑO FACTORIAL 2 k EN 2 P BLOQUES Los métodos descritos antes pueden extenderse a la construcción de un diseño factoria12k confundido (o mezclado) en 2P bloques (p < k). L 2 ) Ylas propiedades de la teoría de grupos del bloque principal. se observa que el producto de dos combinaciones de tratamientos del bloque principal produce otro elemento del bloque principal. be = abed y abe' bde = ab 2 de 2 = ad etcétera. con lo cual se confunde automáticamenteABCD. el bloque principal puede obtenerse a partir de la definición de contrastes y de la propiedad de la teoría de grupos. Al seleccionar los efectos que van a confundirse con los bloques. Es decir. ABCD). Por ejemplo. en un diseño 25 podría elegirse confundir ABCDE y ABD. lo que producirá las ocho combinaciones de tratamientos del bloque 3. BCE y ABCD están confundidos con los bloques. Yb se multiplica por todas las combinaciones de tratamientos del bloque principal. Es sencillo verificar esto refiriéndose a la tabla de signos positivos y negativos del diseño 25. Para construir otro bloque se selecciona una combinación de tratamientos que no esté en el bloque principal (por ejemplo b). y los demás bloques pueden determinarse a partir de estas combinaciones de los tratamientos aplicando el método que se presentó anteriormente.p corridas. Se obtiene así b ·(1)= b b'ad= abd b 'abed = ab 2 ed = aed etcétera. Los bloques pueden generarse mediante . confundiéndose automáticamente un tercer efecto que es la interacción generalizada de las dos primeras. Por lo tanto. ADE. Una mejor elección es confundir ADE y BCE. donde por "independientes" se entiende que ninguno de los efectos elegidos es la interacción generalizada de los demás. con lo cual se confunde automáticamente CE. Es preferible sacrificar información en las interacciones de tres factoresADE y BCE en lugar de la interacción de dos factores CE.7-6 CONFUSIÓN DEL DISEÑO FACTORIAL 2k EN 2» BLOQUES 297 define como el producto deADE y BCE módulo 2. Por lo tanto. debe tenerse cuidado de obtener un diseño en el que no estén confundidos efectos que pueden ser de interés. en el ejemplo tratado aquí la interacción generalizada (ADE)(BCE) =ABCDE2 =ABCD también está confundido con los bloques. Se seleccionan p efectos independientes que van a confundirse. Las propiedades de la teoría de grupos del bloque principal mencionadas en la sección 7-4 siguen siendo válidas. como en Davies [36]. Después se construye el diseño utilizando las dos definiciones de contrastes (L 1. En la práctica. ad . donde cada bloque contiene exactamente 2k. ACDF. BCG. ABDE ABE. ADEF. ABCD. CD ABCDE ABC. ACDEG. CE.ACD. Be. DE. BDF. DEG.. BDEFG. CDE. M~) ~ ~ '!"'l:. ADEF. EFG. EF ABCDEFG ABCFG. ¡ --------- . ADG. ABDE ABEF. Be. ACF. ABFG. ADG. ACEFG. DEF..AC. CDEF.l - . CDEFG. CFG. DEF. ABDE ABC. DE. CDEF. ABCD ABCDE ABC. BCG.. CDEF ABEF.. ACE.ACD AB. CD. DF. BCE. EFG. AEF. BEG. ACF. cuatro y seis factores (63 efectos) Interacciones confundidas con los bloques 4 2 4 4 2 8 4 8 5 2 4 2 16 8 4 8 4 2 32 16 6 2 4 8 16 8 16 32 4 2 7 2 64 32 4 8 16 8 16 32 4 64 2 AB. BCFG. BD.2P 2 Tamaño del bloque. CDE. EF. BCEF. ACF. DE ABCDEF ABCF. BCEF. ADG ABG. CDE. CDEF.AC ABCD ABC. cuatro y seis factores (31 efectos) ABCDEFG ABCFG.. ABCD. ABDE. ABCEG. AFG ABCD. ACDE.tn~Pt'íff:L:TI. ABCDEF.~ C1J \O N Tabla 7-8 Número de factores. BDEG. ADF ABE. ACEG. ~. BCF. CDE ABE.:. '!i! 'o. ADE Todas las interacciones de dos y cuatro factores (15 efectos) ABCDEF ABCF. AC. CD.BD AB. CDG. CDE AB. CDG.AFG Todas las interacciones de dos. CDFG. 2k-p Efectos elegidos para generar los bloques ABC AB. ABEF. ABE. BD.{ Iiiltfji:HuKIñ . BCDEG ABCD. AD. ABCEF. AD. ABCD. BCDE. CE.. BCDEF. ABCF. DEF. BDE. CDE. ABDE.S'lIut.V1Y. CD. AFG.BC ABCD ABC. CDEFG ABC. BDF. DEF AB. CD. AC.. AC. ADEG. ABCDEFG. BCG. FG . EFG ABC AB. BDF. k 3 Disposiciones de los bloques sugeridas para el diseño factorial 21< Número de bloques. BE Todas las interacciones de dos. ABCD. BE. ABCDEFG. BC. DEG. AC. AE. BCE. BD. ABDFG.. BC. EFG. BDF ABG.-·H. Be. ABCD. ACE ABF. deben hacer réplicas del diseño para obtener una estimación del error. la suma de cuadrados de los bloques se encuentra sumando las sumas de cuadrados de todos los efectos confundidos con los bloques. Para ilustrar el uso de esta tabla. 7. Se dice que este diseño está completamente confundido (o mezclado). Es decir. es decir. La tabla 7-8 indica que se elegiríanABEF. ••• . Deberá tenerse cuidado al seleccionar los efectos que van a confundirse para que no se sacrifique información sobre los efectos que pueden ser de interés potencial. ABCD . siendo éstos las interacciones generalizadas de los p efectos independientes elegidos inicialmente.AB está confundido en la réplica n. Después.3 -1 = 4 efectos restantes que están confundidos son las interacciones generalizadas de estos tres.7-7 CONFUSIÓN PARCIAL 299 el uso de las p definiciones de contrastes L 1. BC está confundido en la réplica nI yAC está confundido en la réplica IV: Como resultado puede obtenerse información deABC a partir de los datos de las réplicas n. In y IV. el cual se presenta en la tabla 7-5.p -1 = 23 . ya que la estructura de la confusión (o mezclado) del diseño depende directamente de ellos.P -1 efectos con los bloques. L 2 . Asimismo.ABC está confundido en la réplica I. yACE como los p = 3 efectos independientes para generar los bloques. Considere la alternativa que se presenta en la figura 7-6. suponga que quiere construirse un diseño 26 confundido en 23 = 8 bloques con 23 = 8 corridas cada uno. El análisis estadístico de estos diseños es directo. con cuatro réplicas.rán otros 2P . información deAC puede obteRéplica ID BC Confundido (1) Réplica I ABe Confundido (1) Réplica U Réplica IV AC Confundido (1 ) AB Confundido (1 ) a b a b b a e ab be ab e ab abe a be abe e ab ae b ae abe ae be e abe ae be Figura 7·6 Confusión parcial en el diseño 23 • . se confundi. Por el análisis de varianza de este diseño. De nueva cuenta hay cuatro réplicas del diseño 23. la elección de los p efectos usados para generar el bloque es crítica. información deAB puede obtenerse de las réplicas I. Los 2f' . a menos que los experimentadores cuenten con una estimación previa del error o que estén dispuestos a suponer que ciertas interacciones son insignificantes. Las sumas de cuadrados de todos los efectos se calculan como si no se hubiera hecho la formación de bloques. L p asociadas con estos efectos. nI y IV. En la figura 7-3 se muestra un diseño factorial 23 en dos bloques conABC confundido. Obviamente. (ABEF)(ABCD) (ABEF)(ACE) (ABCD)(ACE) (ABEF)(ABCD)(ACE) = A 2 B 2 CDEF= CDEF = A 2 BCE 2 F= BCF = A 2 BC 2 ED= BDE = A 3 B 2 C 2 DE 2 F= ADF En el problema 7-11 se le pide al lector que genere los ocho bloques de este diseño. se observa que no puede sacarse información acerca de la interaccióllABC debido a queABC está confundido con los bloques en todas las réplicas. pero en cada réplica se ha confundido una interacción diferente.7 CONFUSIÓN PARCIAL En la sección 7-4 se subrayó que. En la tabla 7-8 se presenta una lista de diseños útiles. La suma de cuadrados del error consta de las sumas de cuadrados de réplicas x sumas de cuadrados de efecto principal. Un diseño 2 con confusión parcial Considere el ejemplo 6-1.3 3 . Además. cada réplica del diseño 23 debe correrse en dos bloques. :5 nerse de las réplicas I. con ABC confundido en la réplica I y AB confundido en la réplica II. e información de BC puede obtenerse de las réplicas I. Es común hacer la partición de tres grados de libertad para las réplicas y cuatro grados de libertad para los bloques dentro de las réplicas. Se corren dos réplicas.IIn ~l' . III YIV) Error Total ::?!' ¡¡. II YIV) ABC (de las réplicas 1. en el que se realizó un estudio para determinar el efecto del porcentaje de carbonatación (A). II) 4 1 1 1 1 1 1 1 17 31 A B C AB (de las réplicas 1. III YIV) A C (de las réplicas 1. EJEMPLO 7. 1) + BC (rép. En la tabla 7-9 se muestra el análisis de varianza de este diseño. IV)] Grados de libertad 3 + AB (rép. Se dice que pueden obtenerse tres cuartas partes de la información de las interacciones porque no están confundidas en sólo tres réplicas. II Y IV. réplicas x ABC para las réplicas II. r. ~: 1" ¡¡. más las sumas de cuadrados de réplicas x sumas de cuadrados de interacción para cada réplica en la que esa interacción no está confundida (por ejemplo. III Y IV). Para calcular las sumas de cuadrados de las interacciones.. La composición de la suma de cuadrados de los bloques se muestra en la tabla 7-9 y se sigue directamente de la elección del ef~cto confundido en cada réplica. II YIII) BC (de las réplicas 1.:. III) + AC (rép. la presión de operación (B) y la velocidad de línea (C) sobre la altura de llenado de una bebida carbonatada. II Y III. Los datos son los siguientes: Réplica 1 ABC confundido (1) = -3 ab = 2 ae = 2 be = 1 Réplica II AB confundido (1) = -1 a= O b =-1 e = -1 abe = 6 a = 1 e= ab = abe = O 3 5 b=O ae ="l be = 1 . sólo se usan los datos de las réplicas en las que no está confundida una interacción. Por lo tanto. Yates [l13b] llama a la relación 3/4 la información relativa de los efectos confundi· dos. Suponga que cada lote de jarabe alcanza sólo para probar cuatro combinaciones de tratamientos. hay siete grados de libertad entre los ocho bloques. Se dice que este diseño está parcialmente confundido ( o mezclado).·1 300 CAPÍTULO 7 FORMACIÓN DE BLOQUES Y CONFUSIÓN EN EL DISEÑO FACTORIAL 2" Tabla 7-9 Análisis de varianza de un diseño 23 parcialmente confundido Fuente de variación Réplicas Bloques dentro de réplicas [oABC (rép. Suponga que sólo pudieron hacerse 16 corridas en un solo día. C.33 1.00 48.00 20. SSABC debe encontrarse utilizando únicamente los datos de la réplica n y SSAB utilizando únicamente los datos de la réplica 1 de la siguiente manera: [a+b+c+abc.50 (1)(8) S AB = [(l)+abc-ac+c-a-b+ab-bcf n2k [-3+6-2+(-1)-0-(-1)+2-1]2 = 0.67 0.ac.4503 0.0099 0.8 7-1.25 1. en general.25 1.67 0. En la tabla 7-10 se resume el análisis de varianza.50 (1)(8) La suma de cuadrados de las réplicas es.5905 0.00 2.00 0. AC y BC pueden calcularse de la manera usual.00 1. Sin embargo. Considere el experimento de la formación de fisuras en la aleación de níquel y titanio descrito en el problema 6-15.00 0. o SSBloques = 2. PROBLEMAS Considere el experimento descrito en el problema 6-1.00 16.50 3.bc-(1)]2 SSABC = k n2 = [1+0+0+5-3-1-1-(-1)f =0.75 78.50 36.25 36. Considere el experimento descrito en el problema 6-5.25 12.3009 0. 7. Analizar este experimento suponiendo que cada una de las cuatro réplicas representa un bloque. 'Ibtal 1. B. n R2 2 SS _ h _I::Rep LJ 2 k N =" h=l (16)2 = 16 foo donde R h es el total de las observaciones en la réplica h-ésima.50.0035 0. Analizar este experimento suponiendo que cada réplica representa un bloque de un solo turno de producción.00 20.50 0. 7-2.33 0.25 0.25 12.25 0. Analizar el experimento y sacar conclusiones.ab. La suma de cuadrados de los bloques es la suma de SSABC de la réplica 1 y SSAB de la réplica n.4503 Las sumas de cuadrados deA. Tabla 7-10 Análisis de varianza del ejemplo 7-3 Fuente de Suma de variación cuadrados Réplicas Bloques dentro de las réplicas A B C AB (sólo en la réplica 1) AC BC ABC (sólo en la réplica 11) Grados de libertad 1 2 1 1 1 1 1 1 1 5 15 Cuadrado medio 1.75 Fa Valor P Error . 7-3." 7-8 PROBLEMAS \1' 301 .0001 0.50 0. utilizando las 16 observaciones. . por lo que cada réplica se trató como un bloque.00 27. Los tres efectos principales son importantes.50 0.33 0. . Considere los datos del ejemplo 7-2. Encontrar los demás efectos confundidos con los bloques. Delinear el análisis de varianza y comentar la información obtenida. Analizar los datos. construir y analizar un diseño en dos bloques con ABCDE confundido con los bloques. Estimar el efecto de bloque. 7-9. Analizar los datos que resultarían. diferente del que se ilustró en la tabla 7-8. Considere el diseño 22 en dos bloques conAB confundido.302 7-4. Utilizando los datos del diseño 25 del problema 6-21. Diseñar un experimento para confundir un diseño factorial 26 en cuatro bloques. servaciones utilizando barras del mismo lote. CAPÍTULO 7 FORlviACIÓN DE BLOQUES Y CONFUSIÓN EN EL DISEÑO FACTORIAL 2k 7-5. Suponga que todas las observaciones del bloque 2 se incrementan en 20. 7-11. Confundir ABD y ABC (y por consiguiente CD) con los bloques. 7-12. 7-13. Sugerir un esquema de confusión (o mezclado) razonable. Suponga que fue necesario correr este diseño en cuatro bloques con ACDE y BCD (y por consiguiente ABE) confundidos. Suponga que no fue posible correr todas estas ob. Considere los datos de la primera réplica del problema 6-7. Considere el diseño 26 en ocho bloques con ocho corridas cada uno conABCD. Repetir el problema 7-7 suponiendo que se necesitan cuatro bloques. Realizar el análisis estadístico de este diseño. Repetir el problema 7-5 suponiendo que se requieren cuatro bloques. ACE y ABEF como los efectos independientes elegidos para confundirlos con los bloques. Sugerir un esquema de confusión apropiado. Hacer la demostración algebraica de que SSAB = SSmoques' 7-14. Construir un diseño 23 conABC confundido en las dos primeras réplicas y BC confundido en la tercera réplica. Analizar los datos de este diseño. Establecer un diseño para correr estas observaciones en dos bloques de cuatro observaciones cada uno con ABC confundido. Analizar los datos. 7-7. 7-16. servaciones cada uno con ABCD confundido. 7-10. 7-15. Considere los datos del diseño 25 del problema 6-21. 7-17. Calcular las estimaciones de los efectos. Generar el diseño. Construir un diseño con dos bloques de ocho ob. 7-8. 7-6. Considere los datos de la primera réplica del problema 6-1. ¿Puede el lector explicar su magnitud? ¿Los bloques parecen ser ahora un factor importante? ¿Hay otras estimaciones de los efectos que sufran el impacto de este cambio hecho en los datos? Suponga que en el problema 6-1 se confundióABC en la réplica I. Repetir el problema 6-1 suponiendo que ABC se confundió con los bloques en todas las réplicas. Suponga que en el problema 6-7 ABCD se confundió en la réplica I yABC se confundió en la réplica 11. Construir la tabla del análisis de varianza.AB en la réplica 11 y BC en la réplica 111. Los 42 grados de libertad restantes se asocian con las interacciones de tres o más factores. 2. Por ejemplo. Elprincipio de efectos esparcidos o escasez de efectos. Cuando hay varias variables. 3. Una de las principales aplicaciones de los diseños factoriales fraccionados es en los experimentos de tamizado o exploración. Los diseños factoriales fraccionados pueden proyectarse en diseños más fuertes (más grandes) en el subconjunto de los factores significativos. y sólo 15 a las interacciones de dos factores. Entonces los factores que se identifican como importantes se investigan con mayor detalle en experimentos subsecuentes." Diseños factoriales fraccionados de dos niveles 8. Si el experimentador puede suponer razonablemente que ciertas interacciones de orden superior son insignificantes. En este diseño. ro 1:' ~: r: t. Se trata de experimentos en los que se consideran muchos factores y el objetivo es identificar aquellos factores (en caso de haberlos) que tienen efectos grandes. Experimentación. es posible obtener información de los efectos principales y las interacciones de orden inferior corriendo únicamente una fracción del experimento factorial completo. Estos diseños factoriales fraccionados se encuentran entre los tipos de diseños de uso más generalizado en el diseño de productos y procesos y en el mejoramiento de procesos. sólo 6 de los 63 grados de libertad corresponden a los efectos principales. el número de corridas necesarias para realizar una réplica completa del diseño rebasa con rapidez los recursos de la mayoría de los experimentadores.~ 1 JI 303 . El uso exitoso de los diseños factoriales fraccionados se basa en tres ideas clave: 1. es posible que el sistema o proceso esté dominado principalmente por algunos de los efectos principales y las interacciones de orden inferior. La propiedad de proyección. Es posible combinar las corridas de dos (o más) diseños factoriales fraccionados para ensamblar secuencialmente un diseño más grande para estimar los efectos de los' factores y las interacciones de interés.secuencial.1 INTRODUCCIÓN Cuando el número de factores de un diseño factorial 2k se incrementa. una réplica completa de un diseño 26 requiere 64 corridas. cuando es posible que muchos de los factores considerados en un principio tengan un efecto reducido o nulo sobre la respuesta. Los experimentos de tamizado suelen realizarse en las etapas iniciales de un proyecto. son de interés. la columna identidad 1 también es siempre positiva.e+abe) B fc = H-a. por lo que a I=ABC se le llama la relación de definición del diseño. e yabe como la fracción un medio con la que se trabajará. Con referencia a la tabla 8-1. Esto sugiere una fracción un medio de un diseño 23 • Puesto que el diseño contiene 23. Por lo tanto. se observa que las combinaciones lineales de las observaciones usadas para estimar los efectos principales de A. cada uno con dos niveles. Observe que el diseño 23.1 producen tres grados de libertad que pueden usarse para estimar los efectos principales. 8~2 LA FRACCIÓN UN MEDIO DEL DISEÑO 2 k Considere una situación en la que tres factores.1 se forma seleccionando sólo las combinaciones de tratamientos que tienen signo positivo en la columnaABC.e+abe) eAB = H-a . aABC se le llama el generador de esta fracción particular. pero los experimentadores no están en posición de correr las 23 = 8 combinaciones de tratamientos. En ocasiones se hará referencia a un generador. Además. En general. B Y C son eA = Ha . Las combinaciones de tratamientos del diseño 23. Sin embargo. es común llamar diseño 23 -1 a una fracción un medio del diseño 23 • En la tabla 8-1 se muestra la agrupación de signos positivos y negativos del diseño 23 • Suponga que se seleccionan las cuatro combinaciones de tratamientos a.b .e + abe) eAC = H-a+b. los cuales se ilustran con varios ejemplos. pueden llevar a cabo cuatro corridas.304 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES Este capítulo se enfoca en estos principios.b+e+abe) También es sencillo verificar que las combinaciones lineales de las observaciones usadas para estimar las interacciones de dos factores son = Ha . como una palabra. por ejemploABC.b . b. la relación de definición de un diseño factorial fraccionado será siempre el conjunto de todas las columnas que son iguales a la columna identidad!.e + abe) e = H-a+b. Estas corridas se muestran en la parte superior de la tabla 8-1 y en la figura 8-1a.b + e + abe) f BC Tabla 8-1 Signos positivos y negativos del diseño factorial 23 Efecto factorial 1 Combinación de tratamientos A B C AB AC BC ABC a b C abc ab ae be (1) + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + .1 = 4 combinaciones de tratamientos. / a) La fracción principal.8-2 LA FRACCIÓN UN MEDIO DEL DISEÑO 2k abe 305 I I I . A dos o más efectos que tienen esta propiedad se les llama alias. R Bo R A =R B= R AC YR c = RAE. por consiguiente. J~-a . es decir. entreB. Esta fracción un medio alterna o com- . R B ~ B + ACy R ~ C +AB. 1 . 1 ./ ./ . B + AC y C + AB. +ABC be . -ABC Figura 8-1 seño 23 . se encuentra que los alias de B y C son B·J=B·ABC B= AB 2 C= AC y C'J=C'ABC C=ABC 2 =AB A esta fracción un medio. Suponga ahora que se eligió la otra fracción un medio. By C.ByAC son aliasyCyAB son alias. c La estructura de los alias para este diseño puede determinarse con facilidad utilizando la relación de definición J = ABC. En el ejemplo tratado aquí.A y BC son alias./ . es imposible diferenciar entre A y BC. cuando se estimanA. se están estimando en realidadA + BC. En el ejemplo tratado aquí se encuentra que el alias de A es A' J = A· ABC = A 2 BC o. De hecho. Al multiplicar cualquier columna (o efecto) por la relación de definición se obtienen los alias de esa columna (o efecto)./ ab (1) b) La fracción alterna. A=BC De manera similar. con J = +ABC. puesto que el cuadrado de cualquier columna es la identidad J. las combinaciones de tratamientos de la tabla 8-1 asociadas con los signos negativos de la columnaABC. Esto se indica con la notación eA ~A + BC.Y AC y entre C y AB. Las dos fracciones un medio del di- Por lo tanto./ . suele llamársele la fracción principal. milia. las dos fracciones un medio forman un diseño 23 completo. es decir... El diseño 23.B-AC e~. Por ~ se emplea un subíndice con un numeral romano para denotar la resolución del diseño.. Esto puede observarse con facilidad con referencia a los incisos a y b de la figura 8-1. B YC con esta fracción particular. En este diseño. Se trata de diseños en los que ninguno de los efectos principales es alias de ningún otro efecto principal..P factores.Be. 2. B-AC y C-AB. Por lo tanto.1 de la tabla 8-1 es un diseño de resolución 111 (2~1). no importa cuál de las fracciones se usa.. Diseños de resolución JI!.. Los diseños de resolución 111.306 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES plementaria (la cual se compone de las corridas (1). IV YV son particularmente importantes.. los efectos principales son alias de las interacciones de dos factores.A y que tUA -P~)= hA+BC-A+BC).... BC Por lo tanto... Suponga que después de correr una de las fracciones un medio del diseño 23... En la práctica.. considere P A .. cuando se estiman A. se cuenta ahora con las ocho corridas asociadas con el diseño 23 completo. Esto implica que tUA +P~)=hA+BC+A-BC). A .1 precedente se le llama diseño de resolución ill. Diseños de resolución Iv. A + BC y J!'A .... en realidad se están estimando A-BC.. A continuación se presentan las definiciones de estos diseños y un ejemplo de cada uno: 1. Por ejemplo.A-BC P~ . para los tres pares de combinaciones lineales se obtendría lo siguiente: A B e A B e Ae AB Be Resolución del diseño Al diseño 23.. la fracción un medio del diseño 23 con la relación de definición 1 = ABC (o 1 = -ABC) es un diseño 2~1. Se trata de diseños en los que ninguno de los efectos principales es alias de ningún otro efecto principal ni de las interacciones de dos factores. La relación de definición de este diseño es I=-ABC De la combinación lineal de las observaciones... por ejemplo J!'A' P' BY J!' CJ de la fracción alterna se obtiene P~ . ab. Esto también podría hacerse sumando y restando la combinación lineal de los efectos de las dos fracciones individuales. y algunas de las interacciones de dos factores pueden ser alias entre sí. pero las interacciones de . Un diseño es de resolución R cuando ningún efecto del factor p es alias de otro efecto que contiene menos de R . también se corrió la otra. pero los efectos principales son alias de las interacciones de dos factores. Pueden obtenerse entonces las estimaciones sin alias de todos los efectos analizando las ocho corridas como un diseño 23 completo en dos bloques de cuatro corridas cada uno. por lo tanto...... Ambas fracciones pertenecen a la misma fa. ae y be) se ilustra en la figura 8-1b.c-AB Por lo tanto. si un experimentador tiene varios factores de interés potencial pero piensa Tabla 8-2 Las dos fracciones un medio del diseño 23 Diseño factorial 22 completo (diseño básico) Corrida 2~1. K confundida. Entre más alta sea la resolución..8-2 LA FRACCIÓN UN MEDIO DEL DISEÑO 2k 307 dos factores son alias entre sí..1). y agregándole después el factor k-ési- mo identificando sus niveles positivo y negativo con los signos positivo y negativo de la interacciónABC (K -1) del orden más alto. o •• Proyección de fracciones en diseños factoriales Cualquier diseño factorial fraccionado de resolución R contiene diseños factoriales completos (posiblemente diseños factoriales con réplicas) en cualquier subconjunto de R -1 factores. cuatro y cinco letras. no se producirá el diseño con la _________ resolución más alta posible. Sin embargo. Diseños de resolución V. La fracción alterna se obtendría igualando el factor C con la interacción -AB.1completo.. Por consiguiente. que consta de las corridas de un diseño factorial2k. K se resuelve entonces para la columna faltante (K). Este enfoque se ilustra en la tabla 8-2. Otra forma de visualizar la construcción de una fracción un medio es mediante la partición de las corridas en dos bloques con la interacción de orden más altoABC . menos restrictivos serán los supuestos que se requieren respecto de cuáles de las interacciones son insignificantes para obtener una interpretación única de los datos. Observe que podría usarse cualquier efecto de interacción para generar la columna del factor k-ésimo. es preferible emplear diseños fraccionados que tengan la resolución más alta posible que sea consistente con el grado de fraccionamiento requerido.... Observe que el diseño básico siempre tiene el número correcto de corridas (renglones). Por lo tanto. de tal modo que K =ABC ..1con 1 = ABCDE es un diseño de resolución V (2~-1).I=ABC 2~\I=-ABC A B A B C=AB A B C=-AB 1 2 3 4 + + + + + + + + + + + + + + + + . = ABCD es un diseño de resolución IV 3. respectivamente. Construcción de fracciones un medio Una fracción un medio del diseño 2k de la resolución más alta puede construirse apuntando el diseño básico.1 con la resolución más alta. Se trata de diseños en los que ninguno de los efectos principales ni de las interacciones de dos factores son alias de otro efecto principal o interacción de dos factores. En general. pero le falta una columna.. el diseño factorial fraccionado 2~1 se obtiene apuntando el diseño 22 completo como diseño básico e igualando después el factor C con la interacciónAB. (K -1) define el producto de los signos positivos y negativos que deberá usarse en cada renglón para producir los niveles del factor k-ésimo. pero las interacciones de dos factores son alias de las interacciones de tres factores. Por ejemplo. Cada bloque es un diseño factorial fraccionado 2k . al utilizarse cualquier efecto que no seaABC . Éste es un concepto importante y útil. los diseños precedentes podrían denominarse diseños de tres. (K . Por lo común. Un diseño 24-1 con 1 (2~1). Un diseño 25. El generador 1 = ABC . la resolución de un diseño factorial fraccionado de dos niveles es igual al menor número de letras en cualquier palabra de la relación de definición. . etcétera. el diseño factorial fraccionado de resolución R se proyectará en un diseño factorial completo en los R . el cual es un diseño 23. ya que esta elección del generador dará como resultado un diseño con la resolución más alta posible (IV).3 factores. el nivel deD de cada corrida Tabla 8-3 Corrida El diseño 2. .308 CAPÍTULO 8 ~B DISEÑOS FACTORIALES FRACCIONADOS DE DOS NNELES ~ / -.':.1 factores significativos.J_ / /a I I I I / .1 de ellos tienen efectos importantes. Si el experimentador está en lo correcto. como se muestra en las tres primeras columnas de la tabla 8-3.1 con la relación de definición I=ABCD Diseño básico A B C D=ABC Combinación de tratamientos Índice de filtración 1 2 3 + + + + 4 5 6 7 8 + + + + + + + + + + + + (1) ad bd ab ed ae be abed 45 100 45 65 75 60 80 96 . entonces un diseño factorial fraccionado de resolución R es la elección de diseño apropiada.1 puede proyectarse en dos réplicas de un factorial ca.. Para construir el diseño. pleto en cualquier subconjunto de le . C y D Y las interaccionesAC y AD eran diferentes de cero.2 factores..1 I / / __ . todos los diseños ~-1 se proyectarán en un factorial completo en (k -1) cualq iera de los k factores originales.1. EJEMPLO 8~1 . Para encontrar los niveles del cuarto factor. .! en tres diseños 22 • que sólo R . Este proceso se ilustra en la figura 8-2 para el diseño 2::. Este diseño básico tiene el número necesario de corridas (ocho) pero sólo tres columnas (factores). Se retoma ahora este experimento y se simula lo que habría ocurrido si se hubiera corrido una fracción un medio del diseño 24 en vez del diseño factorial completo. ilustrado en la tabla 6-10. Por lo tanto. se resuelve! =ABCD paraD.----1/ ---7-/ / / -----1- I I I I I / / / / / / / / b / -/j I / /' 1- --7-- -7r-e I I I I abe I"/L. un diseño 2k. Se usará el diseño 24-1 con! =ABCD.. es una sola réplica del diseño 24• En ese ejemplo se encontró que los efectos principales deA. primero se apunta el diseño básico. ~ Puesto que la máxima resolución posible de una fracción un medio del diseño 2k es R = k. el cual se proyecta en un diseño 22 en cada subconjunto de dos factores. Considere el experimento del índice de filtración del ejemplo 6-2. Además. El diseño original. cuatro réplicas de un factorial completo en cualquier subconjunto de k .?C _V~~V Figura 8-2 Proyección de un diseño 2i. oD =ABC. es el producto de los signos positivos y negativos de las columnas A. C y D son los efectos principales importantes.. __ . AB = t(45-100. By C. la combinación lineal de las observaciones asociadas con el efecto de A es f!..00 f! AB = -18. Utilizando la relación de definición.B =AB 2CD =ACD..L. cada interacción de dos factores es alias de otra interacción de dos factores.00 ..A =A 2BCD = BCD./ .. no es irrazonable concluir que los efectos principales deA.. El diseño se ilustra gráficamente en la figura 8-3.. Además. En este punto.. Estas observaciones se muestran en la última columna de la tabla 8-3. Los cuatro efectos principales más los tres pares de alias de interacciones de dos factores representan los siete grados de libertad del diseño.80+96)= 19./ . C y D son grandes. Puesto que se ha corrido ya el diseño 24 completo. así como en la figura 8-3. este diseño 2~1 es la fracción principal. siA.AC = BD YBC = AD. Para ilustrar los cálculos.50 f!B 14.45+65+75.8-2 LA FRACCIÓN UN MEDIO DEL DISEÑO 2k D 309 + be = 80 ed =75 .. simplemente se seleccionan los ocho índices de filtración observados del ejemplo 6-2 que corresponden a las corridas del diseño 2~1..00 f!AD A+ BCD B+ACD C+ ABD D+ ABC AB+ CD AC+ BD AD+BC aLas efectos significativos se indican en negritas. En la tabla 8-4 se muestran las estimaciones de los efectos obtenidas de este diseño 2~1 .80+96)= -1. Estas relaciones de los alias sonAB = CD.ae = 60 abed = 96 I I I I . Además. se observa que cada uno de los efectos principales es alias de una interacción de tres factores. . ya que Tabla 8-4 Estimaciones de los efectos y los alias del ejemplo 8-1 a Estimación f!A f!B Estructura de los alias f!c f!D AB e f!AC f!.. El proceso se ilustra en la tabla 8-3. Puesto que el generadorABCD es positivo./ ./ I I I ab = 65 bd = 45. entonces es lógico concluir que las dos cadenas de alias de interaccionesAC + BD y AD + BC tienen efectos grandes.. es decir.50 f!D -1./ . A = t(-45+100..00 f!A 1./ (1) =45 ad = 100 Figura 8-3 El diseño 2~1 para el experimento del índice de filtración del ejemplo 8-1.00e c 16. normalmente se aleatorizarían las ocho corridas y se llevaría a cabo el experimento. C =ABC2D =ABDyD = ABCD 2 = ABC.w 19.L----"1r-----.00 . A+BCD mientras que para el efecto AB se obtendría f!...45+65-75+60./ .60.50 f!AC = 19. AB+CD Por la inspección de la información de la tabla 8-4. Por consiguiente. . la concentración (C) tiene un efecto positivo grande. C y D son significativos. entonces lo más posible es que las interacciones significativas seanAC y AD. Esto se debe probablemente a la interacción AD que se identificó de manera tentativa unos párrafos antes. Puesto que el factor B no es significativo. Este modelo es muy similar al que resultó del diseño factorial 2k completo del ejemplo 6-2. la velocidad de agitación tiene un efecto positivo grande. Por lo tanto. mientras que si la temperatura está en el nivel alto.r I~(" i 310 CAPÍTULO 8 75 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES 96 80 Alta I I I I 60 c '0 U '13 10 l!l o 2 \J / / ~ c: / / / . siA. la interpretación más simple suele ser la correcta. mientras que si la temperatura está en el nivel alto. El examen visual de esta gráfica de cubo nos hace sentirnos más cómodos con las conclusiones a las que se llegó antes. En otras palabras. + 1) que representan aA. el efecto de la velocidad de agitación (D) es insignificante. este diseño 2::. la concentración tiene un efecto muy pequeño. si la temperatura está en el nivel bajo.J en un diseño 23 enA. Observe que si la temperatura (A) está en el nivel bajo. Xi :::. la ecuación de predicción es Recuerde que la ordenada al origen lJ o es el promedio de todas las respuestas en las ocho corridas del diseño. puede sacarse de consideración. como se muestra en la figura 8-4. ~-------. un principio científico que establece que cuando uno se confronta con varias interpretaciones posibles de un fenómeno. y D para el ejemplo 8-1.¡ puede proyectarse en una sola réplica del diseño 23 en los factores A. Además. C y D.. Ylas lJ son coeficientes de regresión que pueden obtenerse a partir de las estimaciones de los efectos como se hizo anteriormente. Se trata de una aplicación de la navaja de Ockham (en honor de Guillermo de Ockham). Cy D. Con base en el análisis anterior. Esto se debe probablemente a una interacciÓnAC. e las interaccionesAC y AD también son significativas.y /65 Baja A (temperatura) Alta Figura 8-4 Proyección del diseño 2::~.-*----- I 1 45 100 /' / / Baja ~ Ud~v:gitación) Baja -7~'O:::aad 45. Observe que esta interpretación concuerda con las conclusiones del análisis del diseño 24 completo del ejemplo 6-2. puede obtenerse ahora un modelo para predecir el índice de filtración en la región experimentaL Este modelo es y= lJo +lJ¡x¡ +lJ3 X3+lJ4 X4+lJ13 X¡X3 +lJ14 X¡X4 donde Xl' X3YX4son variables codificadas (-1 :::. todos los efectos principales son alias de una interacción de cuatro factores (por ejemplo.•••. En la figura 8-6 se presenta la gráfica de probabilidad normal de las estimaciones de los efectos de este experimento. el diseño es de res'olución V Se esperaría que este diseño 25. En la figura 8-5 se presenta una representación geométrica del diseño. Los cinco factores fueron A = ajuste de apertura (pequeña. 1I t " Tabla 8-5 Corrida Un diseño 25.1• Observe que el diseño se construyó apuntando el diseño básico que tiene 16 corridas (un diseño 24 enA.. 45 s).. estos efectos son en realidad A + BeDE.••••••••••...•. Un diseño 25.. En la tabla 8-5 se muestra la construcción del diseño 25. 15. AB + CDE).. En la tabla 8-7 se resume el análisis de varianza de este experimento. Recuerde que. debido a los alias.1 con el objetivo de mejorar el rendimiento del proceso.. Por lo tanto. B. grande).5 min). C YAB son los efectos importantes..•••. La suma de cuadrados del modelo es SS Modelo = SSA + SSB + SSc + SSAB = 5747. 20% arriba del nominal).••. En la figura 8-7 se presenta la gráfica de probabilidad normal de los residuales . .••••••••••••••.8-2 LA FRACCIÓN UN MEDIO DEL DISEÑO 2k 311 EJEMPLO 8~2 .. B. seleccionando ABCDE como generador.. Por consiguiente. i!AB . Sin embargo.••..••. Yesto explica más de 99% de la variabilidad total del rendimiento.. B + ACDE.1 para el ejemplo 8·2 Diseño básico A B C D E=ABCD Combinación de tratamientos Rendimiento 8 9 1 2 3 4 5 6 7 8 9 + + + + + + + + + + + + + + + + + + + + e a b abe e + + + + + + I + + + + + + + + + + 10 11 12 13! 14 15 16 + + + + aee bee abe d ade bde abd ede aed bed abede 34 52 16 22 45 60 6 10 30 50 15 21 44 63 .. . A + BCDE). uno siente seguridad en concluir que sólo A.. B = tiempo de exposición (20% abajo del nominal. las sumas de cuadrados y los coeficientes del modelo de regresión para los 15 efectos de este experimento..••. La tabla 8-6 contiene las estimaciones de los efectos. C = tiempo de desarrollo (30 s. grande) y E = tiempo de grabado (14. y cada una de las interacciones de dos factores son alias de una interacción de tres factores (por ejemplo.1 proporcionara excelente información respecto de los efectos principales y las interacciones de dos factores. y ajustando después los niveles del quinto factor E = ABCD.. La relación de definición del diseño es 1 = ABCDE. C + ABDE y AB + CDE.. By C y la interacciónAB son grandes.25.••. C y D). D = tamaño de la máscara (pequeña.. Los efectos principales deA. puesto que parece plausible que las interacciones de tres factores y de órdenes superiores sean insignificantes. eA .1 usado para mejorar un proceso Se investigaron cinco factores en un proceso de manufactura de un circuito integrado en un diseño 25.5 min. 062 473.000 -1./ ./ .8750 0.563 7.4375 0.8750 -0.4375 0.1875 0.3750 Suma de cuadrados 495.0625 -0./ .063 0.000 1.4375 -0./ abe = 52 ./ .1250 0.1250 33.5625 0.8750 0.3750 -1.000 -1.063 0.5625 16./ __ .563 AC AD AE BC BD BE CD CE DE .000 -1./ ./bde = 30 ~-ade = 10 e=8 E abe = 60 beb = 44 I I I b=34~ .062 4590.1875 -0.000 1.563 0.063 1.563 189./ . coeficientes de regresión y sumas de cuadrados del ejemplo 8·2 Variable A B C D E Nombre Apertura Tiempo de desarrollo Tiempo de exposición Thmaño de la máscara Tiempo de grabado Coeficiente de regresión 30.6250 -0.8750 10.000 -1.8750 0.6250 6.4375 0.3125 3.3750 1.563 5.3125 -0.062 3.000 Variable Promedio global A B C D E AB Efecto estimado 11./ abd = 50 a=9 d=6 cÍ¿B A Figura S-S El diseño 2~-1 del ejemplo 8-2.063 5./ .1250 0.3125 5.063 3./ ./ .6875 Nivel-1 -1.000 1.0625 0.1250 1.063 0.1250 -0.000 Nivel +1 1. Tabla 8-6 Efectos.000 1.063 1.5625 0./ I I I .9375 5.312 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES D + abede = 63 ede = 15 bce = 45 + . c "- 80 :5 ro e 90 95 99 o 5 10 15 20 25 30 Estimaciones de los efectos Figura 8-6 Gráfica de probabilidad normal de los efectos del ejemplo 8-2..20 1791.61 73..1875 5775. 10 x I Cl Cl 2"~ 20 30 50 S ¡ij E o c: 50 : 30 20 10 5 -o ro 70 :g . ¡.-.78 ValorP <0..0625 28. 313 . . I x S 30 ro "C E o c: ro 50 50 : 30 20 10 5 ..0625 2...24 184....5625 Fo 193.99 B 5 • 95 90 80 70 o o ~.c "- e 90 95 99 -3 -2 -1 o Residuales Figura 8-7 Gráfica de probabilidad normal de los residuales del ejemplo 8-2.0001 " " ! H' f 99 r ¡ o o ~ 5 10 20 • 95 90 80 70 o o ~.4375 Grados de libertad 1 1 1.0001 <0.0625 473.0625 473. Tabla 8-7 Análisis de varianza del ejemplo 8-2 Fuente de variación A (Apertura) B (Tiempo de exposición) e (Tiempo de desarrollo) AB Error 'Ibtal Suma de cuadrados 495. 1 11 15 Cuadrado medio 495.0001 <0.g 70 80 :o ro .0625 189..0625 4590.0625 189.0625 4590.0001 <0. Los tres factoresA..L-_ _..' -_ _ 10 20 30 40 50 60 Rendimiento predicho Figura 8-8 Gráfica de los residuales contra el rendimiento predicho para el ejemplo 8-2.. 63 ~ al 'E 15 c: al B+ a: . ro ::J a: al al Ul o • el • • • • e -1 • • -2 -3 L-_.' -_ _.L-_ _. B ye tienen efectos positivos grandes. B- B-6 Bajo A Alto Figura 8-9 Interacción apertura-tiempo de exposición del ejemplo 8-2. Ambas gráficas son satisfactorias.Ir'" !':"I ~ 314 2 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES • • • • • • "O .. .' • -'---_ _..¡¡. Esta gráfica confirma que el rendimiento es más alto cuando tanto A como B están en el nivel alto. y la figura 8-8 es una gráfica de los residuales contra los valores predichos. La interacción apertura-tiempo de exposición oAB se grafica en la figura 8-9. Secuencias de diseños factoriales fraccionados o El uso de los diseños factoriales fraccionados lleva con frecuencia a una gran economía y eficiencia en la experimentación......8-2 LA FRACCIÓN UN MEDIO DEL DISEÑO 2k 44......~--J. Considere nuevamente el experimento del ejemplo 8-1. Casi siempre es preferible correr un diseño fraccionado 2~1 (ocho corridas)..5 L A + I Figura 8-10 Proyección del diseño 2~-1 del -ejemplo 8-2 en dos réplicas de un diseño 23 en los factores A.5 315 61.. 9.. Hay dos efectos grandes asociados con interacciones de dos factores........AC + BD yAD + BC..1 se reducirá a dos réplicas de un diseño 23 en tres cualesquiera de los cinco factores originales..... analizar los resultados y después decidir cuál es la mejor serie de corridas que deberá correrse después.. By C en el nivel alto... En el ejemplo 8-2 se utilizó el hecho de que el efecto principal de B era insignificante para concluir de manera tentativa que las interacciones importantes eran ..... . EJEMPLO 8~3 .0 B L-. Cy D.5 I I 21..... en particular si las corridas pueden hacerse secuencialmente. Algunas de estas posibilidades se ilustran gráficamente en la figura 8-11. . ...... siempre puede correrse la fracción alterna y completar el diseño 24• Cuando se usa este método para completar el diseño.. .I---'-51.¡~----..... Su ven. Los factores D y E tienen un efecto pequeño sobre el rendimiento promedio del proceso y pueden ajustarse en los valores que optimicen otros objetivos (como el costo). . la experimentación secuencial tiene como resultado la pérdida de información sólo en la interacción de orden más alto... By C con los rendimientos promedio superpuestos en los ocho vértices.5 + ~. El diseño 25.. o la variación de algunos de los factores en nuevos rangos.5 /(¡------7/' r.. . Por lo tanto.. ...... 115.. suponga que se están investigando k = 4 factores (24 = 16 corridas). B Y C. ambas fracciones un medio representan bloques del diseño completo con las interacciones de orden superior confundidas con los bloques (en este casoABCD estaría confundida).. Por ejemplo.~ ... (Observar la figura 8-5 ayuda a visualizar esto....) La figura 8-10 es una gráfica de cubo en los factores A.. lo cual podría implicar la incorporación o eliminación de factores.. el cambio de las respuestas. Se ha usado un diseño 2~1 y se ha hecho la identificación tentativa de los tres efectos principales grandes: A.... taja es que en muchos casos se saca información suficiente de la fracción un medio para proceder a la siguiente etapa de la experimentación. Si es necesario resolver ambigüedades.... Es evidente por la inspección de la gráfica de cubo que los rendimientos más altos se consiguen conA. ~ t e / / I • c. En ocasiones el experimentador tendrá que procesar conocimientos que puedan ayudarle a discriminar entre las interacciones que probablC?mente sean importantes. e) Hacer una réplica para mejorar las estimaciones de los efectos o porque algunas corridas se hicieron incorrectamente t -o -¡¡. Sin embargo.. }------cl Reescalar algunos factores porque pueden haberse hecho variar en los rangos inapropiados f) Hacer un aumento para modelar la curvatura aparente . c.~~ Temperatura ~ d) Eliminar y agregar factores porque el factor original correspondiente a la velocidad de alimentación del cstalizador es insignificante Figura 8-11 Posibilidades para el seguimiento de la experimentación después de un experimento factoria! fraccionado [adaptado de Box ("Sequential Experimentation and Sequential Assembly of Designs") con permiso del editor]_ AC yAD. siempre es posible aislar la interacción significativa corriendo la fracción alterna.316 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NNELES I I I / / ·0 )---a) Moverse a una nueva localización para explorar una tendencia aparente a la respuesta b) Agregar otra fracción Diseño inicial para resolver las ambigüedades de la fracción original -o -¡¡. Es directa la demostración de que el diseño y las respuestas son los siguientes: Diseño básico Corrida A B C D =-ABC Combinación de tratamientos Índice de filtración 1 2 3 4 5 6 7 8 + + + + + + + + + + + + d a b abd e 43 71 + + + + aed bed abe 48 104 68 86 70 65 .. dada por I = -ABCD. ~ e I I I • )---- / / S-<f "-----.)~~-Q.. 75 A .13 9.75 12.e~ = 1.2 • El diseño 2k .BD AD-BC = 14. Evidentemente.75 e~ AB.13 -0.8-3 LA FRACCIÓN UN CUARTO DEL DISEÑO 2k 317 Las combinaciones lineales de las observaciones obtenidas a partir de esta fracción alterna son . En ocasiones un experimento de confirmación no es tan elaborado como éste.13 16. correr después realmente ese ensayo (quizá varias veces) y usar la comparación entre la respuesta predicha y la observada para confirmar los resultados.BCD B-ACD C-ABD D.CD AC.e~ .e~c = -17. son las interaccionesAC y AD las que son grandes.38 ~BeD ~AeD ~ABD ~ABe ~ eD ~BD ~Be Estas estimaciones concuerdan exactamente con las del análisis original de los datos como una sola réplica de un diseño factorial 2\ como se consigna en el ejemplo 6-2. 8~3 LA FRACCIÓN UN CUARTO DEL DISEÑO 2" Para un número moderadamente grande de factores.2 corridas y es común llamarlo diseño factorial fraccionado 2k .63 ~A ~B ~ e ~D ~AB ~Ae ~AD -2.ABC .88 -1.e~ 24. En la sección 8-5 se investigarán otros aspectos de la combinación de diseños factoriales fraccionados para aislar las interacciones. .2 factores. Agregar la fracción alterna a la fracción principal puede considerarse como un tipo de experimento de confirmación.63 4. podría usarse la ecuación del modelo para predecir la respuesta en un punto de interés dentro del espacio del diseño (no uno de los puntos del diseño actual). Por ejemplo.63 0. por cuanto proporciona información que permitirá fortalecer las conclusiones iniciales acerca de los efectos de la interacción de dos factores.13 1.88 14.25 :estas estimaciones pueden combinarse con las que se obtuvieron de la fracción un medio original para obtener las siguientes estimaciones de los efectos: A B e D AB Ae AD 21. con frecuencia son útiles fracciones menores del diseño 2k • Considere una fracción un cuarto del diseño 2k • Este diseño contiene 2k.25 .38 2.e~ .2 puede construirse apuntando primero un diseño básico compuesto por las corridas asociadas con un diseño factorial completo en k .25 4.75 5.63 3.13 -18.63 -1.e~ .2 factores y asociando después las dos columnas adicionales' con las interacciones elegidas apropiadamente que incluyan los primeros k . Por lo tanto. 2 con relaciones generadoras I = ABCE e I = BCDF. Después se añaden los dos factoresEy F.. Tabla 8-8 Estructura de los alias del dis~ño 2~. esto produce A = BCE = ABCDF = DEF . respectivamente. Las cuatro fracciones asociadas con la elección de los generadores ±Py ±Q pertenecen a la misma familia. ParaA. por ejemplo. Para encontrar los alias de cualquier efecto (por ejemplo deA). Éstas constarán de P. Los signos de P y Q ( + o -) determinan cuál de las fracciones un cuarto se produce. se trata de la fracción principal. y puesto que los dos generadoresABCE y BCDF son positivos. ABCDEF AF = DE = BCEF =ABCD BD= CF = ACDE =ABEF BF = CD = ACEF = ABDE . Q y PQ de la relación de definición se les denomina pa. Cy D. por lo tanto. Como un ejemplo. Por lo tanto. mientras que las interacdones de dos factores son alias entre sí y de interacciones de órdenes superiores. A los elementos P. labras. Otra forma de construir este diseño es deduciendo los cuatro bloques del diseño 26 con ABCE y BCDF confundidas y eligiendo después el bloque con las combinaciones de tratamientos que son positivas paraAB CE y BCDF. Se trataría de un diseño factorial fraccionado 26. Si P YQ representan los generadores escogi_ dos. La fracción para la que tanto P como Q son positivas es la fracción principal.B. el cual consiste en las 16 corridas para un diseño completo 26--2 = 24 enA. cuando se estimaA. se multiplica ese efecto por cada palabra de la relación de definición. Evidentemente. En la tabla S-S se muestra la estructura completa de los alias de este diseño. asociando sus niveles más y menos con los signos más y menos de la interacciónABC y BCD. Si las interacciones de tres factores y de órdenes superiores son insignificantes. La relación de definición completa del diseño está compuesta por todas las columnas que son iguales a la columna identidadI. entonces a I = P e I = Q se les llama las relaciones generadoras del diseño. Entonces la interacción generalizada de los generadores ABCE y BCDF es ADEF. Los alias de cualquier efecto se obtienen mediante la multiplicación de la columna de ese efecto por cada palabra de la relación de definición. Este procedimiento se muestra en la tabla S-9. Q y su interacción generalizadaPQ.2 • Suponga que se escogen I = ABCE e I = BCDF como los generadores del diseño. considere el diseño 26.318 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES una fracción un cuarto del diseño 2k tiene dos generadores. la relación de definición es I = P = Q = PQ. se trata de un diseño de resolución IV. es decir. Para construir este diseño se anota primero el diseño básico.2 con I = ABCE = BCDF = ADEF A = BCE = DEF = ABCDF B = ACE = CDF = ABDEF e = ABE = BDF = ACDEF D = BCF = AEF = ABCDE E =ABC =ADF = BCDEF F = BCD = ADE = ABCEF ABD = CDE = ACF = BEF ACD = BDE = ABF = CEF AB = CE = ACDF = BDEF AC = BE = ABDF = CDEF AD = EF = BCDE = ABCF AE = BC = DF . en realidad se está estimando A + BCE + DEF + ABCDF. este diseño produce estimaciones claras de los efectos principales. la relación de definición completa de este diseño es I = ABCE = BCDF = ADEF Por consiguiente. El experimentador deberá estar atento al elegir los generadores para que los efectos potencialmente importantes no sean alias entre sí. Es sencillo verificar que todos los efectos principales son alias de interacciones de tres y cinco factores. cada efecto tiene tres alias. ABCDF. Ahora ciertos signos en la estructura de los alias de la tabla 8-9 se han cambiado. etc. 1 = -ABCE el = BCDF. tres fracciones alternas de este diseño 2~2 particular. Hay otras 12 combinaciones de los seis factores.DEF . Por lo tanto. entonces en la última columna de la tabla 8-9 se hace F = -BCD. Un equipo de mejoramiento de calidad ha deeidido llevar a cabo un experimento . los alias deA son A = BCE = -DEF = -ABCDF. porque éstas son las palabras de la relación de definición. k . Las piezas fabricadas en un proceso de moldeo por inyección están presentando una contracción excesiva. si quiere encontrarse la fracción para la que 1 = ABCE el = -BCDF. observe que el diseño factorial fraccionado 2~2 se proyectará en una sola réplica de un diseño 24 en cualquier subconjunto de cuatro factores que no sea una palabra de la relación de definición. desde luego.2 puede plegarse en un diseño factorial completo o bien en un diseño factorial fraccionado en algún subconjunto de r :5.. Yla columna de los niveles del factor F queda como ++----++--++++-La relación de definición completa de esta fracción alterna es 1 = ABCE = -BCDF = -ADEF. Estos subconjuntos de variables que forman diseños factoriales completos no son palabras de la relación de definición completa. También se pliega en una fracción un medio con una réplica de un diseño 24 en cualquier subconjunto de cuatro factores que sea una palabra de la relación de definición. Por lo tanto. el diseño de la tabla 8-9 se convierte en dos réplicas de un diseño 24-1 en los factoresABCE. la combinación lineal de las observaciones eA estima en realidad A + BCE . Por ejemplo. para las que el diseño se proyecta en una sola réplica del diseño 24 • Este diseño también se pliega en dos réplicas de un diseño 23 en cualquier subconjunto de tres de los seis factores o en cuatro réplicas de un diseño 22 en cualquier subconjunto de dos factores. BCDF y ADEF.2 con los generadores 1 = ABCE e 1 = BCDP Diseño básico Corrida A B C D E=ABC F=BCD 1 2 3 + + + + + + + + 4 5 6 7 8 9 + + + + + + + + + + + + + + + + + + + + + + + + + + ·11 13 10 12 14 15 16 + + + + + + + + + + + + + + Hay. por ejemplo. comoABCD. cualquier diseño factorial fraccionado 2k. Esto está ocasionando problemas en las operaciones de ensamblaje que se realizan después del moldeo por inyección. En general.2 de los factores originales. EJEMPLO 8~4 . el = -ABCE el = -BCDF. Se trata de las fracciones con las relaciones generadoras 1 = ABCE e 1 = -BCDF. Es sencillo construir estas fracciones con el método que se muestra en la tabla 8-9." 8-3 LA FRACCIÓN UN CUARTO DEL DISEÑO 2k 319 Tabla 8-9 Construcción del diseño 2~. Por último.ABCF. así como para obtener información preliminar acerca de la forma en que los factores interactúan. A la luz de las relaciones de los alias de la tabla 8-8. Los únicos efectos grandes sanA (temperatura de moldeo). sin embargo.320 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES diseñado para estudiar el proceso de moldeo por inyección a fin de poder reducir la contracción. parece razonable adoptar estas conclusiones de manera tentativa. En la figura ~ Tabla 8-10 Un diseño 2~'. junto con la contracción observada (x 10) en la pieza de prueba producida en cada una de las 16 corridas del diseño.z para el experimento del moldeo por inyección del ejemplo 8-4 Diseño básico Corrida A B C D E=ABC F=BCD Contracción observada (x 10) 1 2 3 4 + + + + + + + + 5 6 7 8 9 + + + + + + + + + + + + + + + + + + + + + + + + + + 6 10 32 60 4 15 26 60 8 10 11 12 13 14 15 16 + + + + + + + + + + + + + + 12 34 60 16 5 37 52 .con dos niveles cada uno. El equipo decide usar el diseño factorial fraccionado de 16 corridas con dos niveles de la tabla 8-9. la variabilidad de la contracción de una pieza a otra sigue siendo un problema potencial. La gráfica de la interacción AB de la figura 8-13 indica que el proceso muestra una alta insensibilidad a la temperatura si la velocidad del enroscado está en el nivel bajo. Sin embargo. En la figura 8-12 se presenta la gráfica de probabilidad normal de las estimaciones de los efectos de este experimento. la variabilidad de la contracción de una pieza a otra en una corrida de producción podría seguir causando problemas en el ensamblaje. En la figura 8-14 se presenta la gráfica de probabilidad normal de los residuales. el equipo decide hacer el ajuste de la temperatura de moldeo y la velocidad del enroscado en el nivel bajo. Con base en este análisis inicial. Una manera de abordar esta cuestión es investigando si alguno de los factores del proceso afecta la variabilidad de la contracción de las piezas. el tamaño del vaciadero (E) y la presión de la retención (F). pero que es muy sensible a la temperatura si la velocidad del enroscado está en el nivel alto. las sumas de cuadrados y los coeficientes de regresión de este experimento. En la tabla 8-11 se muestran las estimaciones de los efectos. De hecho. independientemente del nivel de temperatura elegido. la contracción media puede reducirse adecuadamente mediante las modificaciones anteriores. El diseño se muestra de nuevo en la tabla 8-10. el proceso deberá producir una contracción promedio de alrededor de 10%. con el fin de saber cómo se afecta la contracción debido a cada factor. el tiempo de retención (C). la duración del ciclo (D). El equipo decide investigar seis factores -la temperatura de moldeo (A). Este conjunto de condiciones reducirá la contracción media de las piezas en alrededor de 10%. la velocidad del enroscado (B). Esta gráfica parece ser satisfactoria. Con la velocidad del enroscado en el nivel bajo. Se construyeron después las gráficas de los residuales contra cada factor. B (velocidad del enroscado) y la interacciónAB. 9375 0. 99 • 5 o o ~ B 95 90 80 70 o o A AB 10 20 30 x ¡Z.562 3.6250 -0.6875 0.6250 -5.0625 -2. 90 e 95 99 -5 Figura 8-12 o 5 10 15 20 25 30 35 40 Estimaciones de los efectos Gráfica de probabilidad normal de los efectos del ejemplo 8-4.4375 0.563 564. I • • S ro E 50 o c: 50 '.063 1.6875 -0.9375 17..063 7.9375 -0.3750 0. sumas de cuadrados y coeficientes de regresión del ejemplo 8-4 Variable A B C D E F Variable" 'Promedio global A B C D E F AB+CE AC+BE AD+EF AE+BC+DF AF+DE BD+CF BF+CD ABD ABF Nombre temperatura_moldeo velocidad enroscado duración retención duración-ciclo tamaño_vaciadero presiónJetención Coeficiente de regresión 27.8750 0.8750 Nivel +1 1.1250 0.8750 35.8750 1.063 0.000 -1.1250 -0.3750 11.1250 --4.1875 0.000 Efecto estimado 13.000 Suma de cuadrados 770.000 1.063 95.000 -1.4375 Nivel-1 -1.8125 -2.000 -1.563 0.562 115.000 1.000 1.063 10.0625 0.562 14..0625 -0.000 1.563 0.6250 -0.3750 0.062 5076.3750 -1.000 -1.063 0.000 1.063 "Sólo los efectos principales y las interacciones de dos factores. R..-' :a ro J:l ~ 70 80 30 20 10 5 a.000 -1.8125 -0.8750 -1.1875 5.1 1 I 8-3 LA FRACCIÓN UN CUARTO DEL DISEÑO 2" 321 Tabla 8-11 Efectos.3125 6.563 0.3125 -0. . B- 4'-Baja Temperatura de moldeo.. 9375x1 +17. = 27..g o " ro 70 e 90 95 50 '. ¡. .8125x 2 +5.. . la de los residuales contra el factor e (tiempo de retención).n c.. 30 20 10 • -6 -3 5 99 o Residuales 3 6 Figura 8-14 Gráfica de probabilidad normal de los residuales del ejemplo 8-4... A Alta _ Figura 8·13 Gráfica de la interacciónAB (temperatura de moldeo-velocidad del enroscado) para el ejemplo 8-4. 5 • 95 90 80 70 o o ~. x o o 10 30 ro E 50 "tl 80 :c ro ...:.3125+ 6.9375x1X 2 99 JI . 1: l' 8-15 se muestra una de estas gráficas. Estos residuales se obtuvieron de la manera usual a partir del modelo de la contracción predicha: X2 y= Po +P1 X l +P2 X 2+P12 X1 e: r ~.. La gráfica revela que hay una dispersión sensiblemente menor en los residuales con el tiempo de retención bajo que con el tiempo de retención alto..r I l 322 60 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NNELES B+ 5" ~ '0 '13 " u ~ U B+ o " . B" _---------. 20 I ~ .. -----2 • Baja Tiempo de retención (e) -4 • • Alta Figura 8-15 Residuales contra el tiempo de retención (e) para el ejemplo 8-4.63] es considerablemente menor que la desviación estándar de los residuales con C en el nivel alto [S(C+) = 5. los efectos de localización deA. Lo anterior se observa con mayor claridad en el análisis de los residuales que se presenta en la tabla 8-12. por lo tanto.8-3 LA FRACCIÓN UN CUARTO DEL DISEÑO 2k 323 6 • : 4 2 • I 01----------------. se concluiría que la aparente dispersión o efecto de variabilidad observado en la figura 8-15 es real.*=1n l S2(i-) 1 1 ¡ I! !' Recuerde que si las varianzas de los residuales en los niveles alto ( +) y bajo (-) del factor i son iguales. Por lo tanto. Entonces los residuales son e= y-y El modelo de regresión usado para producir los residuales elimina. En esta tabla. ajustar el tiempo de retención en su nivel bajo contribuiría a reducir la variabilidad de una pieza a otra durante una corrida de producción. ByAB de los datos. Observe que la desviación estándar de los residuales con C en el nivel bajo [S(C-) = 1. En el último renglón de la tabla 8-12 se presenta el estadístico S2('+ ) F. entonces este cociente sigue una distribución aproximadamente normal con media cero. en esencia. La figura 8-15 indica que existe un patrón en la variabilidad y que la variabilidad de la contracción de las piezas puede ser menor cuando el tiempo de retención está en el nivel bajo (recuerde que en el capítulo 6 se señaló que los residuales sólo transmiten información acerca de los efectos de dispersión cuando es correcto el modelo de localización o la media). los residuales se ordenan en los niveles bajo (-) y alto ( +) de cada factor. y puede usarse para evaluar la diferencia en la variabilidad de la respuesta en los dos niveles del factor i. y se ha calculado la desviación estándar de los residuales en los niveles bajo y alto de cada factor.70]. los residuales contienen información acerca de la variabilidad no explicada. Puesto que el cociente F~ es relativamente grande. donde Xl' X 2 YX IX 2 son las variables codificadas que corresponden a los factores A y B Ya la interacciónAB. En la figura 8-16 se presen- . 59 4.01 S(i-) 4. "-"'.01 3.33 5. "-"-"'t.23 -0.38 -0.64 3.50 + + 1.75 4.04 0.12 4..59 I BF=CD + + + + - ACD - - + + + + 4.17 4.51 0..50 + -5..52 3.42 -0.10 4.53 4.50 + -0.75 + -6..87 3.50 3. .-~~!':~~ !-~"':.'o..72 F - .19 0.•.50 + + 1.!~=~=- -.00 7.~~ -= ~ W N Tabla 8-12 Cálculo de los efectos de dispersión del ejemplo 8-4 Corrida A B AB=CE C AC=BE AE=BC=DF E D AD=EF BD=CE ABD 1 + + + + + 2 + + + + + 3 + + + + + 4 + + + 5 + + + + + 6 + + + + + 7 + + + + + 8 + + + + + + + 9 + + + + + 10 + + + + + 11 + + + + + 12 + + + + + + + 13 + + + + + 14 + + + + + 15 + + + + + 16 + + + + + + + + + + + 4.50 + + 4.72 S(i+) 3.68 4. •.23 -0.65 0.50 + 4.85 4.70 3.51 AF = DE Residual -2.71 3.41 3.80 4.40 0.19 0.60 4.31 0.42 -0.63 4.41 1.25 + 2..00 -0.50 -0. _ • • .00 + + + -4.50 + -0.j:~~j~I.75 + + 2.51 F' -0.25 + + 2..00 + + + 3.--O="-=---" .88 4.25 3.11 2.50 + + -6.33 2."-"" __----"<..39 4.f~\~~ =.. By C.. La contracción promedio observada y el rango de la contracción observada se indican en cada vértice del cubo..0 I R I I 1:Ji~31.9 99 325 " ~ I c.una pieza a otra en una corrida de producción. E 50 o ¡¡¡ -g c: 50 20 5 ¡¡:. virtualmente cualquier combinación de la temperatura (A) Yel tiempo de retención (C) resultará en valores bajos de la contracción promedio de las piezas.. . 5 20 95 x ¡....del ejemplo 8·4.1 0.. .6 1.01 ..1 2.. es claro de inmediato que ajustar el tiempo de retención (C) en el nivel bajo es la única elección razonable si se quiere mantener baja la variabilidad de la contracción de . al examinar los rangos de los valores de la contracción en cada vértice del cubo.. ta una gráfica de probabilidad normal de los valores F¡* de la tabla 8-12.. B Y e para el ejemplo 8·4. e y ~ 56..5 ~ 11 R~S 08+ :Ji ~ 60.0 "C e c: " ~ o " 1l Ul R~O :E ] :Ji ~ 10.6 2. SiB está en el nivel bajo.1 1.~ so o o ~ . e tiene un efecto de dispersión grande.99. temperatura de moldeo + Figura 8·17 Contracción promedio y rango de la contracción en los factores A..:..6 r Figura 8-16 1 Gráfica de probabilidad normal de los efectos de dispersión F'¡.~ x ~ ~ "C 0. Sin embargo.0 R ~ 11 _ rtl y ~:'Od' ""0016" A..8·3 LA FRACCIÓN UN CUARTO DEL DISEÑO 2" . ésta también indica que el factor En la figura 8-17 se muestran los datos de este experimento proyectados en un cubo en los factoresA.. Por la inspección de la figura se observa que correr el proceso con la velocidad del enroscado (B) en el nivel bajo es la clave para reducir la contracción promedio de las piezas. de manera más simple.326 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES 8. considere los tres diseños 2~2 de la tabla 8-13. > A un diseño factorial fraccionado 2k que contiene 2k . de una elección inferior porque sacrifica de manera innecesaria información acerca de las interacciones. Deberá prestarse atención al elegir los generadores para que los efectos de interés potencial no sean alias entre sí. de tercero y cuarto orden y superiores) son insignificantes. En ocasiones la resolución por sí sola no es suficiente para distinguir entre los diseños. 4. En estos diseños deben seleccionarse p generadores independientes.8-13 Tres elecciones de generadores para el diseño 2~2 Generadores del diseñoA: F ==ABC. donde se usaron los generadores E =ABCyF = BCD. Para el diseño B es {4. con lo cual se simplifica en gran medida la estructura de los alias. Para valores moderadamente grandes de k.4 EL DISEÑO FACTORIAL FRACCIONADO 2"-P GENERAL ¡:: . es común suponer que las interacciones de órdenes superiores (por ejemplo.p de tal modo que se obtengan las mejores relaciones de los alias posibles. mientras que los demás diseños tienen dos o tres. el diseño A es el que tiene más alias y el diseño C el que tiene menos. Las tres palabras del diseñoA tienen longitud 4.p resultante tenga la resolución más alta posible. La estructura de los alias puede encontrarse multiplicando la columna de cada efecto por la relación de definición.2 de la tabla 8-9.p corridas se le llama fracción 1/2! del diseño 2k o. el patrón de la longitud de las palabras es {4. Para ilustrar. ' <:: 1"" ". Se trata.:. 5. Cada efecto tiene 2P -1 alias. 4}. por lo que el diseño C sería una buena elección para un diseño 2~2 . Minimizar la aberración en un diseño de resoluciónR asegura que el diseño tiene el número mínimo de efectos principales que son alias de Tabla. Evidentemente. G == BCD 1 == ABCF == BCDG == ADFG Alias (interacciones de dos factores) AB==CF AC=BF AD==FG AG=DF BD=CG BG=CD AF=BC=DG Generadores del diseño B: F ==ABc. diseño factorial fraccionado 2k-p. En la presente sección se estudia la construcción y el análisis de estos diseños. La relación de definición de este diseño se compone de los p generadores elegidos inicialmente y sus 2! -p -1 interacciones generalizadas. 4. A un diseño como éste se le llama diseño de aberración mínima. la relación de definición completa hubiera sido 1 = ABCE = ABCDF = DEF. pero tienen estructuras de los alias muy diferentes (se ha supuesto que las interacciones de tres factores y las de órdenes superiores son insignificantes) con respecto a las interacciones de dos factores. el diseño C minimiza el número de palabras de la relación de definición que son de longitud mínima. con lo cual se produce un diseño de resolución IV Éste es el diseño con la resolución más alta. Yel diseño habría sido de resolución III. 6} Ypara el diseño C es {4. Por lo tanto.. Observe que la relación de definición del diseño C tiene una sola palabra de cuatro letras. considere el diseño 2C. 5}. Un criterio razonable es seleccionar los generadores para que el diseño 2k. G =ABDE 1 = ABCDF = ABDEG == CEFG Alias (interacciones de dos factores) AB=CF AC==BF AD=EG AE=DG AF=BC AG==DE Alias (interacciones de dos factores) CE==FG CF=EG CG==EF . G ==ADE 1 = ABCF = ADEG = BCDEFG Generadores del diseño C: F=ABCD. Si se hubieran seleccionado E == ABC y F = ABCD. Es importante seleccionar los p generadores de un dise~o factorial fraccionado 2k. es decir. Todos estos diseños son de resolución IV. Por ejemplo. evidentemente. Se da la relación de definición completa para cada diseño. permitirá la estimación de los efectos principales y dará cierta idea respecto de las interacciones de dos factores.2.p • Por ejemplo. La relación de definicióncompletaesI=ABCE = BCDF =ADEF =ACDG =BDEG = CEFG = ABFG. Las relaciones de los alias incluidas en esta tabla se enfocan en los efectos principales Ylas interacciones de dos y tres factores.p para k :5 15 factores y hasta n :5 128 corridas. etcétera. Estamos dispuestos a suponer que las interacciones de tres factores y de órdenes superiores son insignificantes. suponga que se tienen siete factores y que el interés se encuentra en estimar los siete efectos principales y hacerse una idea aproximada de las interacciones de dos factores. Esta tabla del apéndice hace muy sencillo seleccionar un diseño con la resolución suficiente para asegurar que cualesquiera interacciones de interés potencial puedan estimarse. Las relaciones de los alias para todos los diseños de la tabla 8-14 para los que n :5 64 se presentan en la tabla XII(a-w) del apéndice. En la tabla 8-14 se presenta una selección de diseños factoriales fraccionados 2k. Son también los diseños con aberración mínima.p sólo permite la estimación de 2k. Las interacciones de dos factores son alias en grupos de tres. el programa Design-Expel1 ilustrado en el capítulo 6 tiene esta capacidad. el efecto i-ésimo se estima con J!¡ = 2(Contraste¡) Contraste¡ N = (N/2) donde el Contraste¡ se encuentra utilizando los signos positivos y negativos de la columna i y donde N = 2k. el número mínimo de interacciones de dos factores que son alias de interac'dones de orden R . Para ilustrar el uso de la tabla 8-14. El diseño 2k.) Ésta es más de la información necesaria acerca de las interacciones. La tabla XII del apéndice contiene las relaciones de los alias completas para estos dos diseños.p Hay varios programas de computadora que pueden usarse para analizar el diseño factorial fraccionado 2k. C y D como el diseño básico y agregando después las tres columnas E = ABC. Esta información sugiere que un diseño de resolución IV sería apropiado. El diseño también puede analizarse recurriendo a los principios básicos. Por lo tanto.I = BCDF e 1 = ACDG (tabla 8-14). Los alias para el diseño 2~3 de 16 corridas se encuentran en la tabla XII(i) del apéndice. Los generadores son 1 = ABCE.p -1 efectos (y sus alias). La tabla 8-14 muestra que se cuenta con dos fracciones de resolución IV: la 2~2 con 32 corridas y la 2~3 con 16 corridas. Observe que se construyó empezando con la corrida 16 del diseño 24 enA. . El diseño completo se muestra en la tabla 8-15. F = BCD YG = ACD. (Recuerde que las interacciones de tres factores y de órdenes superiores son insignificantes. Referirse a Fries y Hunter [46] para mayores detalles. este diseño satisfará los objetivos del problema. La tabla XII(j) del apéndice indica que este diseño permitiría la estimación de los siete efectos principales y que 15 de las 21 interacciones de dos factores también podrían estimarse de manera única. Análisis de los diseños factoriales fraccionados 2k. el cual requeriría 32 corridas.8-4 EL DISEÑO FACTORIAL FRACCIONADO zk-P GENERAL 327 interacciones de orden R -1. No es necesario correr el diseño 2~2.p es el número total de observaciones. Observe que los siete efectos principales son alias de interacciones de tres factores. Los generadores sugeridos en esta tabla resultarán en un diseño con la resolución más alta posible. EJEMPLO 8~5 . B. es decir. f.2 V 64 32 2 8. ~:! 8 2 8.4 IV 16 9 29 -2 VI -3 29 IV 128 64 2 9.r e.3 2 ID 7.2 2 IV 64 32 16 7..1 2 ID 4 2 IV -1 5 2 v. " ji r" t.1 Tabla 8-14 Diseños factoriales fraccionados Número de factores.4 IV 32 9. k 3 4 Fracción 3.4 2 ID 8 :ir U~ ¡ '.3 It 1" IV <: .5 2 ID 16 10 2 10 -3 V 128 328 .1 25 -2 ID 26 -1 VI 6 2 -2 IV 26-~ III 21<-1' seleccionados Generadores del diseño C= ±AB D = ±ABC E= ±ABCD D= ±AB E= ±AC F= ±ABCDE E= ±ABC F= ±BCD D= ±AB E=±AC F= ±BC G= ±ABCDEF F= ±ABCD G= ±ABDE E= ±ABC F= ±BCD G= ±ACD D= ±AB E= ±AC F=±BC G= ±ABC G= ±ABCD H= ±ABEF F= ±ABC G= ±ABD H= ±BCDE E= ±BCD F= ±ACD G= ±ABC H= ±ABD H= ±ACDFG J= ±BCEFG G= ±ABCD H= ±ACEF J= ±CDEF F= ±BCDE G= ±ACDE H= ±ABDE J= ±ABCE E= ±ABC F= ±BCD G = ±ACD H= ±ABD J= ±ABCD H= ±ABCG J= ±ACDE K= ±ACDF Número de corridas 4 8 16 8 32 16 8 5 6 7 -1 27 VII 7 . ~t : .: 2 8. [: ~I ..9 III 16 329 ..I!.w " r~ ll~ 'ji I i ! 12 212 .~ ::4~i 211 -6 N 32 .6 III 16 11 211 ..7 III 16 -I"'-j ~~:-. .~ 211.11 Tabla 8-14 (continuación) Fracción 210 -4 N Número de corridas 64 Generadores del diseño G= ±BCDF H= ±ACDF J= ±ABDE K= ±ABCE F= ±ABCD G= ±ABCE H= ±ABDE J= ±ACDE K= ±BCDE E= ±ABC F= ±BCD G = ±ACD H= ±ABD J= ±ABCD K=±AB G= ±CDE H= ±ABCD J= ±ABF K= ±BDEF L = ±ADEF F= ±ABC G= ±BCD H= ±CDE J= ±ACD K= ±ADE L = ±BDE E= ±ABC F= ±BCD G= ±ACD H= ±ABD J= ±ABCD K=±AB L= ±AC E= ±ABC F= ±ABD G= ±ACD H= ±BCD J= ±ABCD K=±AB L= ±AC M=±AD E= ±ABC F= ±ABD G= ±ACD H= ±BCD J= ±ABCD K=±AB Número de factores.I.8 III 16 13 213 .l:~ W¡:::i ::1..:?~ 'rr .5 N 64 1'1 I ~ m ".5 N 32 210. k 210../!t .¡j "1'" :~. 1['~ m:." II. 10 111 16 15 ~¡: 215. k 14 214 .r 330 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES Tabla 8-14 (continuación) Fracción Número de corridas Generadores del diseño Número de factores. lt l' <: -.' ¡: '." "~ L= ±AC M=±AD N=±BC E= ±ABC F= ±ABD G= ±ACD H= ±BCD J= ±ABCD K= ±AB L= ±AC M=±AD N= ±BC 0= ±BD E= ±ABC F= ±ABD G = ±ACD H= ±BCD J= ±ABCD K= ±AB L= ±AC M=±AD N= ±BC 0= ±BD p= ±CD "o j¡ Tabla 8-15 Corrida 1 2 3 4 5 6 Un diseño factorial fraccionado ziv 3 Diseño básico A B C D E=ABC F=BCD G=ACD + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + 7 8 9 10 11 12 13 14 15 16 + + + + + + + + + + + + + + .11 111 16 :ir f. r' l. pero es probable que sean insignificantes. Si se está en lo correcto y las "variables menores" E. de la tabla 8-15. La muesca. Para ilustrar apropiadamente la utilidad de esta proyección. Por lo tanto.p puede proyectarse entonces en un factorial completo. Como un ejemplo. Al seleccionar una interacción para confundirla con los bloques. F YG. Esos subconjuntos de factores que producen diseños factoriales fraccionados son subconjuntos que aparecen como palabras en la relación de definición completa. Las conclusiones a que se llegue con diseños de este tipo deberán considerarse tentativas y someterse a análisis adicional. C Y D.8-4 EL DISEÑO FACTORIAL FRACCIONADO z"-P GENERAL 331 Proyección del diseño factorial fraccionado 2 k-p El diseño 2k. k . Este diseño fraccionado contiene 16 combinaciones de tratamientos. respectivamente. el ángulo de la criba y el nivel de vibración de la criba se asignarían a las columnas E. 5. Se sabe menos del papel de los otros tres factores. Se trata de un diseño con 16 corridas en el que intervienen siete factores. Esto resulta de particular utilidad en los experimentos de tamizado cuando se sospecha desde el principio del experimento que la mayoría de los factores originales tendrán efectos pequeños. los diseños factoriales fraccionados pueden confundirse o mezclarse en bloques. un diseño factorial fraccionado requiere tantas corridas que no es posible realizarlas todas bajo condiciones homogéneas.p de los factores originales. B. en los factores de mayor interés. La tabla XII del apéndice contiene los arreglos recomendados para la separación en bloques de varios de los diseños factoriales fraccionados de la tabla 8-14. Velocidad del motor Muesca Modo de alimentación Tamaño de la alimentación Tipo de material Ángulo de la criba Nivel de vibración de la criba Se tiene una certeza razonable de que la velocidad del motor. B. Separación en bloques de diseños factoriales fraccionados Ocasionalmente. respectivamente. Suponga que quiere correrse este diseño en dos bloques con ocho combinaciones de tratamientos cada uno. el tamaño de la alimentación y el tipo de material a las columnas A. El diseño factorial fraccionado 2k. En estas situaciones. suponga que se realiza un experimento para mejorar la eficiencia de un molino de bolas y los siete factores son los siguientes: 1. El tamaño mínimo de los bloques para estos diseños es de ocho corridas. hay 28 subconjuntos de cuatro factores que formarían diseños 24• Una combinación que es obvia al inspeccionar la tabla 8-15 es A. Fy G son insignificantes. 7. siete de los cuales aparecen en la relación de definición completa (ver la tabla 8-15). Cy D. considere el diseño factorial fraccionado 2~2 con la relación de definición! =ABCE = BCDF =ADEF que se muestra en la tabla 8-10. quedará un diseño 24 completo en las variables clave del proceso. Por lo general es posible encontrar explicaciones alternativas de los datos que intervienen en interacciones de órdenes superiores. 4. considere el diseño 2~3 del ejemplo 8-5. el tamaño de la alimentación y el tipo de material afectarán la eficiencia y que además estos factores pueden interactuar. Para ilustrar el procedimiento general. Hay 35 subconjuntos de cuatro factores. Una estrategia razonable sería asignar la velocidad del motor. 3. 2. se observa por el examen de la estructura de los alias de la tabla XII(f) del apéndice que hay dos . el modo de alimentación. por ejemplo.p se reduce a un factorial completo o bien a un factorial fraccionado en cualquier subconjunto de r :::. 6. Se proyectará en un factorial completo en cuatro cualesquiera de los siete factores originales que no sean una palabra de la relación de definición. . . La máquina tiene cuatro areómetros.001 pulg) e = desviación en el eje z (0. . Por la tabla 8-14. . . .001 pulg) B = desviación en el eje y (0. ..001 pulg) H = velocidad de alimentación (%) Nivel bajo (-) o O O 1 O 15 15 15 90 O lio 15 2 30 90 110 Se selecciona un álabe de prueba en cada pieza para inspeccionarlo. Puesto que puede haber diferencias en los areómetros. . . inicialmente dos . . . . . pero están renuentes a ignorar las interacciones de dos factores. .n rnI I I I 332 Bloque 1 (1 ) CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES Bloque 2 ae aef bef be df abd ede abedef abf eef abee abef bde aed bedf Figura 8-18 El diseño 2~2 en dos bloques con ABD confundida. La desviación del perfil se mide utilizando una máquina de medición coordenada. . Los ingenieros se sienten confiados de que las interacciones de tres o más factores no son muy importantes. Son también las combinaciones de tratamientos para las que L = Xl + X 2 + X 4 = O (mod 2). . Los perfiles de los álabes son una característica importante de la calidad. / series de alias que incluyen únicamente interacciones de tres factores. . .. . La tabla sugiere seleccionar ABD (y sus alias) para confundirla con los bloques. y la desviación estándar de la diferencia entre el perfil real y el perfil especificado se usa como la variable de respuesta. . Se obtendrían así los dos bloques que se muestran en la figura 8-18. ..6 . Observe que el bloque principal contiene las combinaciones de tratamientos que tienen un número igual de letras en común conABD. . . . . es de interés la desviación del perfil del álabe del perfil especificado en el plano de ingeniería. . . .. . . . . Específicamente. . Se corre un experimento para determinar cuáles son los parámetros de la máquina que afectan la desviación del perfil. . Se usa una máquina CNC de cinco ejes para maquinar un propulsor utilizado en un motor de turbina. . . .001 pulg) D = fabricante de la herramienta E = desviación del eje a (0. . EJEMPLO 8.001 grados) F = velocidad del areómetro (%) G = altura de la plantilla sujetadora (0. . . . . . . . los ingenieros del proceso piensan que éstos deberán tratarse como bloques. . . . . . . . Los ocho factores seleccionados en el diseño son los siguientes: Nivel alto ( +) Factor A = desviación en el ejex (0. . . . . . . 28 2.39 3.40 4.01 2.64 5.~ 1 ..30 4. y la cadena de alias que incluyeAD + EG. La interacción EH es la interacción entre la desviación del eje a y la velocidad de alimentación.87 3.18 2. La figura 8-19 es una gráfica de probabilidad normal de las estimaciones de los efectos. E == desviación del eje y.efectos.37 2.11 4.• Orden real Desviación estándar Bloque de las corridas (x 103 pulg) 3 2 4 1 1 4 2 3 1 4 2 3 3 2 4 1 2 3 1 4 4 1 3 2 4 1 3 2 2 3 1 4 18 16 29 4 6 26 14 22 8 32 15 19 24 11 27 3 10 21 7 28 30 2 17 13 25 1 23 12 9 20 5 31 2. Además..'-~ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + ¡.41 3.35 4. Por lo tanto..96 3. utilizando In (desviación estándar x 103) como la variable de respuesta. habrá un número considerable de alias con interacciones de dos factores.10 3.~ " ~ .. los experimentadores deciden usar el diseño 2~3 en cuatro bloques. La tabla Xn(l) del apéndice indica que si se usa el diseño con 16 corridas.91 2.76 6.43 4. Ahora bien.AD es la in- Tabla 8-16 El diseño Corrida 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 28-3 en cuatro bloques del ejemplo 8-6 .57 5. .diseños parecen ser apropiados: el diseño 2~4 con 16 corridas y el diseño 2~3 con 32 corridas.03 2.65 4. con frecuencia es mejor efectuar el análisis después de una transformación logarítmica.41 4. este diseño no puede correrse en cuatro bloques sin confundir cuatro interacciones de dos factores con los bloques.32 3. Puesto que la variable de respuesta es una desviación estándar.27 3.40 1 Diseño básico ji: .8-4 EL DISEÑO FACTORIAL FRACCIONADO Zk-p GENERAL 333 . Los únicos efectos grandes sonA == desviación del ejex.~¡ II." r:~ 11 11i I~ I + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + . En este diseño se confunden con los bloques una cadena de alias de interacciones de tres factores y una interacción de dos factores (EH) y sus alias de interacciones de tres factores.. r.48 5. y los ingenieros consideran que una interacción entre estas dos variables es altamente improbable.95 2. En la tabla 8-17 se muestran las estimaciones de los .:S jJ!= 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 + + + + + + + + + + + + + + + + + + 1::~ .24 4. A B C D E F=ABC G=ABD H=BCDE :: 1 I.22 3.18 3.78 5.r ¡.44 3. La tabla 8-16 contiene el diseño y las respuestas resultantes en términos de desviación estándar x 103 pulg."¡ ~:¡.~.50 2. 14513 0.006308 GH 0.914E-04 0.674020 B -0.01467 0.00784 0.050E-06 F -0.01767 -0.02644 0.02521 -0.29026 0.00654 0.01991 CE 0.10813 0.05371 EH -0.02685 0.01936 -0.01417 0.023078 -0.01288 -0.002334 DH 0.001969 0. Promedio global 1.09851 0.009535 0.023617 -0.05407 0.00804 5.00708 0. .008874 0.03871 0.767E-04 -0.093540 E -2.20054 0.28007 A 0.063E-04 2.00245 1.05804 0.06206 AC + BF -0.00631 -0.01708 0.020339 BE 0.01569 EF -0.00489 ABE 0.00733 -0.01665 0.170E-04 -0.18706 -0.002616 EG -0.03103 0.001721 CH 0.009993 FH -0.321729 C -0.011988 G 0.00588 2.001371 CD + FG 0.022370 AH -0.04502 AF + BC -0.00402 0.012685 CG + DF -0.531E-04 -5.334 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NNELES Tabla 8-17 Estimaciones de los efectos. coeficientes de regresión y sumas de cuadrados del ejemplo 8-6 Variable Nombre Nivel-1 Nivel + 1 A Desviación del eje x O 15 B Desviación del eje y O 15 C Desviación del eje z O 15 D Fabricante de la herramienta 1 2 E Desviación del eje a O 30 F Velocidad del areómetro 90 110 G Altura de la plantilla sujetadora O 15 H Velocidad de alimentación 90 110 Variable" Coeficiente de regresión Efecto estimado Suma de cuadrad.03331 ABH -0.001606 AB + CF + DG -0.107799 H 0.005310 D 0.001273 ACD -0.02808 0.00904 -0.00294 -0.03040 0.016214 AG + BD 0.06080 0.03452 0.077627 BH 0.03982 0.030815 AD + BG -0.029568 DE 0.02717 0.04925 0.11608 0.01404 -0.00854 0.03534 0.10027 -0.37412 1.119705 AE 0.01309 0.02576 0.05288 0.05042 0.05433 "Sólo los efectos principales y las interacciones de dos factores.02251 0.01808 0.01261 0.01726 0. 8-4 EL DISEÑO FACTORIAL FRACCIONADO z"-P GENERAL 335 A • 99 5 95 90 80 70 10 ¡¡¡ 50 E o "C lU o o ~.6740 0.42 18.20 . y como estas dos interacciones son alias es imposible separarlas con base en los datos del experimento en curso.1197 0.48 Valor P A B D AD Bloques Error Thtal 0. B.0067 0. Si se contara con algún conocimiento de ingeniería o del proceso que arrojara luz sobre la situación.18 Análisis de varianza del ejemplo 8-6 Fuente de variación Suma de cuadrados Grados de libertad Cuadrado medio . D yAD (el factor D se incluyó para preservar el principio de jerarquía).0001 . 50 '.1 Fo 39. 30 20 10 5 AD " .3217 0. en caso contrario. La figura 8·20 es una gráfica de probabilidad normal de los residuales de este experimento.. Suponga que el conocimiento del proceso sugiere que posiblemente la interacción apropiada seaAD.0002 0.30 Estimaciones de los efectos Figura 8-19 Gráfica de probabilidad normal de las estimaciones de los efectos del ejemplo 8-6.4099 2.10 o . entonces quizá podría hacerse una elección entre las dos interacciones. por lo que posiblemente deTabla 8..0935 1.0001 0. se estudia en la sección 8-5 y en el material suplementario de este capítulo).3217 0.6740 0. La tabla 8-18 es el análisis de varianza resultante para el modelo con los factores A.0171 <0. lo cual sugiere que los areómetros de la máquina no son muy diferentes. "C 70 80 90 95 99 e • -040 -.10 . también es difícil aplicar cualquier simplificación lógica "obvia" en esta situación.0280 <0. '. Esta gráfica sugiere la presencia de colas ligeramente más gruesas que las normales.1197 0..0935 1. se necesitarán más datos para separar estos dos efectos (el problema de agregar corridas en un diseño factorial fraccionado para separar los alias de las interacciones.6389 1 1 1 1 3 24 31 0.47 65.0201 0.lU :a J:J [1. Puesto que ambas interacciones incluyen un efecto principal grande.30 -. Observe que el efecto del bloque es pequeño. y BG es la interacción desviación del eje y-altura de la plantilla sujetadora.20 -. 'il '~~l' ~ teracción desviación del eje x-fabricante de la herramienta.81 5.. ..75 Baja Desviación del eje x (Al Alta Figura 8-21 Gráfica de la interacción AD para el ejemplo 8-6.. 1. 'O "D Ol ro ~ " ro .825 M o ~ X " 'E ~'E ro ro .25 Figura 8·20 Gráfica de probabilidad normal de los residuales del ejemplo 8-6..2 c: 'ro iñ c: '¡. 90 e 95 99 -0.25 o Residuales 0.D .~ 10 20 30 50 x o::~ 1 S ro ro E o c: 50 '.g 70 80 :c ro a.336 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES • 5 o o 99 95 90 80 70 o o .~ o " D- 0.. . 30 20 10 5 "D . By D.::. F = BC YG = ABC.247 1. Otro diseño factorial fraccionado saturado muy útil es el diseño para estudiar siete factores en ocho corridas.1. En la figura 8-22 se muestra la proyección de este diseño 2~3 en cuatro réplicas de un diseño 23 en los factores A. CarrerA en el nivel bajo (O desviación) y comprar las herramientas al fabricante 1 produce los mejores resultados. Es posible construir diseños de resolución III para investigar hasta le = N . Un diseño para analizar hasta tres factores en cuatro corridas es el diseño 2:. es decir. La gráfica de la interacciónAD se presenta en la figura 8-21.273 337 0.015 en desviación) y D en el nivel bajo (fabricante de herramientas 1). 8~5 DISEÑOS DE RESOLUCIÓN III Como se señaló anteriormente. De particular importancia son los diseños que requieren 4 corridas para hasta 3 factores.3"10 I +15 1 A Figura 8-22 El diseño 2~3 del ejemplo 8-6 proyectado en cuatro réplicas de un diseño 23 en los factores A.8-5 DISEÑOS DE RESOLUCIÓN III 1. bla 8-19.370 1 I Desviación del eje y.::'--'~~5-~. de las especificaciones de diseño.504 1. Si le = N . Con frecuencia estos diseños son útiles en la experimentación industrial.1.B O /~:. Observe que el fabricante de la herramienta (D) y la magnitud de la desviación del ejex (A) tienen un impacto profundo en la variabilidad. el uso secuencial de los diseños factoriales fraccionados es muy útil.~~~D I O Desviación del eje x. el cual se presentó en la sección 8-2. Los diseños en los que N es una potencia de 2 pueden construirse con los métodos presentados anteriormente en este capítulo. Por lo tanto. . B Y D. del perfil del álabe. Este diseño es una fracción un dieciseisavo del diseño 27 • Puede construirse apuntando primero los niveles positivos y negativos de un diseño 23 completo en A. B Y C como el diseño básico. llevando con frecuencia a una gran economía y eficiencia de la experimentación.8280 +15 ~--"""I------f( 1. y éstos se presentan primero.1 factores en sólo N corridas. y asociando después los niveles de cuatro factores adicionales con las interacciones de los tres factores originales de la siguiente manera: D = AB. se dice que el diseño factorial fraccionado está saturado. ban considerarse otras transformaciones. I 11.¡4 . los generadores de este diseño sonl =ABD. La mejor combinación de las condiciones de operación esA en el nivel bajo (O desviación). Se ilustran ahora estas ideas utilizando la clase de los diseños de resolución lIl. El diseño se muestra en la ta. B en el nivel alto (0. donde N es un múltiplo de 4. el diseño 2i.I =ACE. 8 corridas para hasta 7 factores y 16 corridas para hasta 15 factores.I = BCF el =ABCG.. E = AC. Cualquiera de los 16 diferentes diseños 2. BCFyABCG de dos en dos. ACE. Los siete grados de libertad de este diseño pueden usarse para estimar los siete efectos principales. B+AD+CF+EG ee -. Por ejemplo. C + AE + BF + DG Rn -.. los alias de B son B= AD= ABCE= CF= ACG= CDE= ABCDF= BCDG= AEF= EG = ABFG= BDEF = ABDEG= BCEFG= DFG= ACDEFG Este diseño es una fracción un dieciseisavo.. se consigue entonces una simplificación considerable en la estructura de los alias. Es también de resolución III porque el número menor de letras de cualquier palabra de la definición de contraste es tres. A + BD+ CE + FG RE -.: i 1 338 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES Tabla 8-19 El diseño 2~-4 con los generadores 1 = ABD. . ignorando las interacciones de tres factores y de órdenes superiores. simplemente se multiplica el efecto por cada palabra de la re"-.. I = ±BCF. 1 = BCF e 1 = ABCG Diseño básico Corrida A B C D=AB E=AC F=BC G=ABC 1 2 3 4 5 6 7 8 + + + + + + + + + + + + + + + + + + + + + + + + + + + + def afg beg abd edg aee bef abedefg La relación de definición completa de este diseño se obtiene multiplicando entre sí los cuatro generadoresABD.... Cada uno de estos efectos tiene 15 alias. se trata de la fracción principal..rr r . G+CD+BE+AF (8-1) Estos alias se encuentran en la tabla XII(h) del apéndice. E+AC+BG+DF RF -. Estableciendo este supuesto. y como los signos elegidos para los generadores son positivos. D+AB+CG+EF RE -... sin embargo. lación de definición. 1 = ACE. I = ±ABCG.F+BC+AG+DE RG -.4 de esta familia podría construirse utilizando los generadores con 1 de los 16 arreglos posibles de los signos en I = ±ABD. de donde se obtiene I= ABD= ACE= BCF= ABCG= BCDE= ACDF= CDG = ABEF= BEG= AFG= DEF= ADEG= CEFG= BDFG= ABCDEFG Para encontrar los alias de cualquier efecto. cada una de las combinaciones lineales asociadas con los siete efectos principales de este diseño es en realidad una estimación del efecto principal y las tres interacciones de dos factores: RA -. si se supone que las interacciones de tres o más factores son insignificantes.-. I = ±ACE. de tres en tres y los cuatro a la vez. la nueva relación de definición se obtiene de las palabras de la relación de definición original que no contienen ninguna de las letras eliminadas. También es posible obtener un diseño de resolución In para estudiar hasta 15 factores en 16 corridas. cuando se eliminan d factores para producir un nuevo diseño. se obtiene un diseño para tres factores en ocho corridas. simplemente se elimina cualquiera de las columnas de la tabla 8-19.8-5 DISEÑOS DE RESOLUCIÓN III 339 El diseño saturado 2.B.ri 4 original.. de hecho es un diseño 2~.En general. F YG de la tabla 8-19. cada uno de los 15 efectos principales es alias de siete interacciones de dos factores. para generar un diseño para seis factores en ocho corridas.3 . Por ejemplo. Cuando se construyen diseños con este método. ::1 111 Tabla 8-20 El diseño 2. En este diseño. Se obtiene así el diseño que se muestra en la tabla 8-20. deberá prestarse atención para obtener el mejor arreglo posible. la relación de definición del nuevo diseño ei5/ . Por lo tanto. D. o una fracción un octavo. 1 = ABD = ACE = BCF = BCDE = ACDF = ABEF = DEF . no obstante que las combinaciones de tratamientos corresponden a dos réplicas de un diseño 23 . del diseño 26• La relación de definición del diseño 2~Ii3 es igual a la relación de definición del diseño 2. C y E.3 con los generadores 1 = ABD. La estructura de los alias de cualquier fracción con los signos de uno o más de los factores invertidos se obtiene haciendo el cambio de signo apropiado en los factores de la estructura de los alias de la fracción original. tres y cuatro factores de los cuatro factores originales. Puede usarse un procedimiento similar para el diseño 2i~-26. Este diseño 2~~-1l saturado puede generarse apuntando primero las 16 combinaciones de tratamientos asociadas con un diseño 24 enA. Si se eliminan las columnas B. A este tipo de experimento secuencial se le llama doblez O plegado ifold over) del diseño original. con las palabras que incluyen la letra G eliminadas. es posible aislar de manera sistemática los efectos de interés potencial.4 de la tabla 8-19 puede usarse para obtener diseños de resolución nI para estudiar menos de siete factores en ocho corridas. 1 = ACE e 1 = BCF Diseño básico Corrida A B C D=AB E=AC F=BC 1 2 3 4 + + + + + + + + + + + + + + + + + + 5 6 7 8 + + + + + + def af be abd ed aee bef abedef . Cy D e igualando después 11 nuevos factores con las interacciones de dos. digamos la G. Es sencillo verificar que este diseño es también de resolución In. Ensamblaje secuencial de fracciones para separar efectos Mediante la combinación de diseños factoriales fraccionados en los que se han intercambiado ciertos signos. Probablemente el experimentador preferiría correr un diseño 23 completo enA. lo cual permite el estudio de hasta 31 factores en 32 corridas. . (:.. la distancia del objetivo al ojo (B)... el nivel de iluminación (D). li l' ......"' A B C D E F G Det((+.•..r. Es decir..) A + CE+FG B+ CF+EG C+AE+BF D E+AC+BG F+BC+AG G+BE+AF Det(( -.... Por lo tanto.J!' ¡) se obtiene .•. l.5:. y a partir de la segunda fracción se obtiene J!~ ~A-BD+CE+FG e~ ~B-AD+CF+EG J!~ ~C+AE+BF-DG es decir.. Un analista de desempeño humano conduce un experimento para estudiar el tiempo de enfoque del ojo y ha construido un aparato en el que pueden controlarse varios factores durante la prueba..e... Se consideran dos niveles de c.~' 340 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES Considere el diseño 2iI~4 de la tabla 8-19...ada factor. En general.. El analista sospecha que sólo algunos de estos siete factores son de importancia principal y que pueden omitirse las interacciones de órde- .. J!~ ~D-AB-CG-EF J!~D ~-D+AB+CG+EF J!~ ~E+AC+BG-DF e~ ~F+BC+AG-DE e~ ~G-CD+BE+AF (8-2) suponiendo que no son significativas las interacciones de tres factores y de órdenes superiores. " " ~] 1'" " 1"" n.) BD AD DG AB + CG+EF DF DE CD .. Suponga ahora que a un diseño fraccionado de resolución III se le agrega una segunda fracción en la que los signos de todos los factores están inveltidos... Los factores que considera importantes inicialmente son la agudeza o claridad visual (A).. la densidad del objetivo (F) y el sujeto (G). el tamaño del objetivo (E)... la columna de D de la segunda fracción es -++--++Los efectos que pueden estimarse a partir de la primera fracción se muestran en la ecuación 8-1.... Este tipo de doblez (llamado en ocasiones doblez como pleto o reflexión) rompe los vínculos de alias entre los efectos principales y las interacciones de dos factores... Suponga que junto con esta fracción principal se corre también un segundo diseño fraccionado con los signos invertidos en la columna del factor D. si a un diseño fraccionado de resolución III o mayor se le agrega una fracción adicional con los signos de un solo factor invertidos... se ha aislado el efecto principal de D y todas sus interacciones de dos factores. Ahora bien...•. Es decir..... En el siguiente ejemplo se ilustra la técnica..... la forma del objetivo (C). EJEMPLO 8~7 .. a partir de las dos combinaciones lineales de los efectos t( J!¡ + J!' ¡) y t( J!¡ .e. entonces el diseño combinado producirá las estimaciones del efecto principal de ese factor y sus interacciones de dos factores....•... puede usarse el diseño combinado para estimar todos los efectos principales quitados de todas las interacciones de dos factores... obteniendo los tiempos de enfoque en milisegundos.A será alias de BD. se corre una segunda fracción con todos los signos invertidos. o tal vezA.¡4 no se proyecta en un factorial 23 enABD. Note que cuando se hace el doblez de un diseño de resolución III de esta manera. y la interpretación podría haber sido más sencilla. este diseño 2i. Por la ecuación 8-1 se observa que los efectos y sus alias son == fE == fe == f n == fE == f F == ea == fA 20. o quizáB.63 38. D y la interacción BD. A partir de estos datos pueden estimarse siete efectos principales y sus alias.28 ~E+AC+BG+DF -0.7+77. como se muestra en la tabla 8-21.8-5 DISEÑOS DE RESOLUCIÓN III 341 Tabla 8-21 Corrida 1 2 3 4 5 6 7 8 Diseño 2{11 4 para el experimento del tiempo de enfoque del ojo Diseño básico A B C D=AB E=AC F=BC G=ABC Tiempo + + + + + + + + + + + + + + + + + + + + + + + + + + + + def afg beg abd edg aee bef abedefg 85.8) == 20.1 es de resolución III. Para separar los efectos principales y las interacciones de dos factores. como se ilustra en la figura 8-23. quizá el analista haya tenido mala suerte.95.1 93. de hecho se .63 Los tres efectos más grandes son fA' fE yen' La interpretación más simple de los datos es que los efectos principales deA. en cambio. junto con las respuestas observadas. por lo que no es posible separar las interacciones de los efectos principales. Observe queABD es una palabra en la relación de definición de este diseño. En este caso.5+75. Sin embargo. ya que otra conclusión lógica sería queA. Este doblez del diseño se muestra en la tabla 8-22. se proyecta en dos réplicas de un diseño 23-1. el experimentador corre las combinaciones de tratamientos del diseño 2i. B será alias deAD y D será alias deAB.43 ~G+CD+BE+AF Por ejemplo.0 141.0+ 141.38 -0. B y la interacciónAB.28 ~A+BD+CE+FG ~B+AD+CF+EG ~ C+AE+BF+DG 28. el diseño se habría proyectado en un diseño 23 completo.83. Para explorar estos siete factores. Con base en este supuesto.4.6. esta interpretación no es única. 88 ~ D + AB + CG+ EF -0.7 77.¡4 de la tabla 8-19 de manera aleatoria.2 145.8 nes superiores entre los factores. el analista decide correr un experimento de tamizado para identificar los factores más importantes para después enfocar el estudio en los mismos. Puesto que el diseño 23.2+ 145. fA == H-85. D y la interacción AD son los verdaderos efectos.1. B y D son todos significativos.63 ~F+BC+AG+DE -2. Por lo tanto.6 95.4 83.93. Si hubiera asignado el nivel de iluminación a C en lugar de aD.5 75. AC.B y D... cambian los signos de los generadores que tienen un número impar de letras..68 G. ..' enA.4 73.0< A + I I I I Figura 8-23 El diseño 2i.50 G = 0. ".05 C = -1.7 82.3 136.13 BD + CE +FG = 19. E~ E/o = = 1. Los efectos estimados por esta fracción son e~ =-17.53 AB + CG +EF = -0..50 AC + BG + DF = -0.CD.BC..342 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES + r.BG.63 2..DG D.48 B = 38.AE..CG. . C..33 E~ = 29..68 -?oA-BD-CE-FG e~ = 37.40 BC +AG +DE =-1.~4 proyectado en dos réplicas de un diseño 2.¡¡4 en el experimento del tiempo de enfoque del ojo Diseño básico Corrida A B C D=-AB E=-AC F=-BC G=ABC Tiempo 1 2 3 4 5 6 7 8 + + + + + + + + + + + + + + + + + + + + + + + + + + + + abcg bcde acdf cefg abef bdfg adeg (1) 91.AB.'1' .73 -?oB-AD-CF-EG -?o -?o -?o -?o -?o te = .4 94.3 71.EF E.8 87.BE. Al combinar esta segunda fracción con la original se obtienen las siguientes estimaciones de los efectos: .AG.( ' D //---.' Il:::..9 .53 CD + BE + AF = -2..88 E~ = 0.53 r' :r..38 E = 0.3..55 Tabla 8-22 Un doblez del diseño 2..BF.:: .80 D = 29.1 143. A B C D E F G A = 1.r .AF 1"" (~: .DF F.13 F = 0.15 AD + CF + EG = 0.33 AE + BF + DG = 1. I " .DE "'... mientras que en la mitad inferior de la tabla se presentan los bloques de signos positivos y negativos para construir el diseño paraN = 28.... Asimismo. Para la primera fracción.... donde N es un múltiplo de 4...... Cada fracción separada tendrá L + U palabras usadas como generadores: L palabras con el mismo signo y U palabras con signos diferentes. (Los productos pares son las palabras tomadas de dos en dos.. E y F en ajustes estándar...... .. Puesto que estos diseños no pueden representarse como cubos. considere el diseño del ejemplo 8-7. los generadores son I=ABD. observe queL + U = 1 + 3 = 4... para N = 12. I=BCF e I=ABCG I=-AC~ I=-BCF e I=ABCG Observe que en la segunda fracción se han intercambiado los signos de los generadores con un número impar de letras. distancia (B) y nivel de iluminación (D). Los diseños para N = 12... y el proceso se continúa hasta que se genera la columna (o renglón) k. los diseños de Plackett-Burman en ocasiones son de interés. Por ejemplo.... En la mitad superior de la tabla 8-23 se presentan los renglones de signos positivos y negativos que se usan para construir los diseños de Plackett-Burman paraN = 12... Entonces se genera una segunda columna (o renglón) a partir de la primera moviendo los elementos de la columna (o renglón) hacia abajo (o hacia la derecha) una posición y colocando el último elemento en la primera posición.. por lo que parece razonable atribuir esto a la interacciónBD..... estos diseños son idénticos a los que se presentaron anteriormente en esta sección.... C...r'l'l S-5 DISEÑOS DE RESOLUCIÓN III 343 Los dos efectos más grandes son By D. entonces I = (ABD)(BCF) = ACDF es un generador del diseño combinado... atribuidos a Plackett y Burman.... el tercer efecto más grande es BD + CE + FG. entonces I = (ABD)(ACE) = BCDE es un generador del diseño combinado. tómese I = ABD e I = BCF.. son diseños factoriales fraccionados de dos niveles para estudiar k = N -1 variables enN corridas. El diseño combinado tendráI =ABCG (la palabra con el mismo signo) como generador y dos palabras que son productos pares independientes de las palabras con signos diferentes. Asimismo. en ocasiones se les llama diseños no geométricos. SiN es una potencia de 2.. Puede determinarse con facilidad. Decidió usar los sujetos como bloques en estos nuevos experimentos en lugar de ignorar el efecto potencial del sujeto debido a que fue necesario utilizar varios sujetos diferentes para completar el experimento. . de cuatro en cuatro. En el diseño combinado se usaránL + U -1 palabras como generadores. Sin embargo..... La relación de definición completa para el diseño combinado es I= ABCG= BCDE= ACDF= ADEG= BDFG= ABEF= CEFG Diseños de Plackett-Burman Estos diseños.. 20. Éstas serán lasL palabras con el mismo signo y las U -1 palabras que constan de productos pares independientes de las palabras que tienen signos diferentes. 24. y para la segunda fracción son I=-AB~ I=ACE. y verificó los resultados obtenidos aquí.24 Y36.28 Y36. etcétera.20.. tómese I = ABD e I = ACE. El analista usó los dos factores. es una técnica muy útil.. 20..... La relación de definición para un diseño de doblez La combinación de diseños factoriales fraccionados por medio de un doblez. Una tercera columna (o renglón) se produce a partir de la segunda de manera similar....... Además.. 1 ¡ i I ..... Con frecuencia es de interés conocer la relación de definición del diseño combinado. como la que se hizo en el ejemplo 8-7.) Para ilustrar este procedimiento... 24 Y36 se obtienen escribiendo el renglón apropiado de la tabla 8-23 como una columna (o renglón).... en experimentos subsecuentes con los demás factores A. la interacción AB es alias de los nueve efectos principales e. N = 24+++++ -+ -++ --++ --+ -+ ---le = 35.28 Y36 tienen estructuras de los alias muy intrincadas. N =20++--++++-+-+ ----++le = 23. . K. Por ejemplo.. '" '. k = 11 Corrida A B e + + + + + + D E F G H 1 J K 1 2 3 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + 4 5 6 7 8 + + + + + + + + + + + + + + + + + + + + + + + + + + 9 10 11 12 + + . la situación es todavía más compleja. ParaN = 28.. XYZ ZXy YZX y se agrega un renglón de signos negativos a estos 27 renglones. El diseño para N = 12 corridas y k = 11 . N=28 -+---+--+ +-++++----++--+-++ -+++ --+---+--+-+++++----+-+---+ ---+-++++ ---++~+++ +----++-----+++++ -+-+---++++---+-+ --+--+-++++ ---+++--+----+ +++----++ -+--+-+-- ++-+-++-+ -++++ -+++-+-++-++ +-+++-+-+ ++--++++-+++-+-++ + -++ -+++++-++--++ -++-+++-+ Después se agrega un renglón de signos negativos. los tres bloques X. En diseños más grandes.. " 1". Y YZ se apuntan en el orden I "111 1'". factores se muestra en la tabla 8-24. Además. cada uno de los efectos. en el diseño de 12 corridas. Los diseños no geométricos de Plackett-Burman paraN = 12. Por ejemplo. Se recomienda al experimentador usar estos diseños con mucho cuidado. :' "" ". '" . D. l'" l••. principales son alias parciales de 45 interacciones de dos factores. 1'-.24. completándose así el diseño.344 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES Tabla 8-23 Signos positivos y negativos para los diseños de Plackett-Burman le =11. r:: 1::' )1 1" Tabla 8-24 Diseño de Plackett-Burman para N = 12.20. N = 36 -+ -+++ ---+++++ -+++ --+ ----+ -+ -++ --+le =27. todos los efectos principales son alias parciales de cada una de las interacciones de dos factores en los que no están incluidos. N =12 ++ -+++ ---+le =19. Por ejemplo. El diseño 2. + 1 ye es un término NID(O. en tres factores. EJEMPLO 8~8 . el diseño proyectado es un diseño 23 completo más un factorial fraccionado 2~¡ (ver la figura 8-24a). El modelo es y= 200+8x¡ +10x 2 +12x 4 -12x¡x 2 +9x¡x 4 +e donde cadax¡ es una variable codificada definida en el intervalo -1. Por lo tanto./ ~-. Las propiedades proyectivas de los diseños no geométricos de Plackett-Burman no son avasalladoramente atractivas.P sólo tiene proyectividad 2. Las proyecciones de cuatro dimensiones se muestran en la figura 8-24b. Este diseño luce diferente al diseño de 12 corridas de la tabla 8-24 porque se construyó utilizando el ren- ./ b) Proyección en cuatro factores Figura 8-24 Proyección del diseño de PlackeU-Burman de 12 corridas en diseños de tres y cuatro factores. Observe que estas proyecciones de tres y cuatro factores no son diseños balanceados./~-. considere el diseño de 12 corridas de la tabla 8-24. En la tabla 8-25 se presenta el diseño de Plackett-Burman con 12 corridas y las respuestas simuladas. 9) del error aleatorio. Este diseño se proyectará en tres réplicas de un diseño 22 completo en dos cualesquiera de los 11 factores originales. D) Ydos interacciones significativas de dos factores (AB y AD). Se ilustrarán algunas de las dificultades potenciales asociadas con los diseños de Plackett-Burman utilizando el diseño de 11 variables con 12 corridas y un conjunto de datos simulados./ ./ . el diseño de Plackett-Burman de resolución III tiene proyectividad 3. Se supondrá que el proceso tiene tres efectos principales significativos (A./ . y hay dos interacciones grandes. + • a) Proyección en tres factores I I I . Sin embargo./. tres de los k = 11 factores son grandes. B. lo cual significa que se plegará en un diseño factorial completo en cualquier subconjunto de tres factores. la situación no está fuera de razón./ . Por lo tanto./ .8-5 DISEÑOS DE RESOLUCIÓN III 345 • I I I . desde luego. Si la elección está entre un diseño geométrico 2~i~7 con 16 corridas o un diseño de Plackett-Burman con 12 corridas que quizá tenga que doblarse (para 10 cual se requerirían 24 corridas).000 D 17.167 aTados los efectos principales son alias parciales de 45 interacciones de dos factores. coeficientes de regresión y sumas de cuadrados del ejemplo 8-S Variable" Promedio global Coeficiente de regresión Efecto estimado Suma de cuadrados 12. 200.667 -0.667 K -5.167 6. J YK (y. Con esto por 10 general se resolverán los efectos principales.333 e 6. pero con frecuencia sigue dejando al experimentador con la incertidumbre acerca de los efectos de las interacciones. ilustrada en el ejemplo anterior. E. D.667 481.333 .333 G -1.167 3. C. Para mayores detalles ver Montgomery. N = 12 de la tabla 8-23 como renglón.333 3468.000 560.833 12.667 13.667 E 6.sta 1 2 3 4 5 6 7 8 9 10 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + 11 12 + + + + + + + + + + + 231 207 230 217 175 176 183 185 181 220 229 168 - glón de signos para k = 11.833 F 0.000 481. Parte de esta ambigüedad podría resolverse haciendo el doblez del diseño. Observe que hay siete efectos grandes: A.333 408.333 560. los alias de un diseño no geométrico de Plac- Tabla 8-26 Estimaciones de los efectos. sus alias). ocurre con mucha frecuencia en la práctica.333 L -0.333 27.500 1.333 3.500 J -6. En la tabla 8-26 se muestran las estimaciones de los efectos. el diseño geométrico puede resultar una mejor elección. Borrar y Stanley [81]. B.667 34.833 -11.000 H 1.000 13. Bajo ciertas condiciones.333 -12. No es evidente de inmediato que algunos de estos efectos podrían ser interacciones. La dificultad para interpretar un diseño de Plackett-Burman.346 Tabla 8-25 Corrida CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES Diseño de Plackett-Burman para el ejemplo S-S A B e + + + D E F G H J K L Respu. A B .000 -2.333 0.333 6.000 16.333 533. 2) romper las interacciones de dos factores en una cadena de alias específica. Montgomery y Runger [83c] hacen notar que un experimentador puede tener varios objetivos al hacer el doblez de un diseño de resolución IV. Esto se analiza en Hamada y Wu [53]. Cualquier diseño 2~ P debe incluir al menos 2k corridas. Recuerde que para hacer el doblez de un diseño 2~?. También es posible hacer el doblez de diseños de resolución IV para separar las interacciones de dos factores que son alias entre sí. Una manera de hacer el doblez de un diseño de resolución IV es corriendo una segunda fracción en la que se invierte el signo de todos los generadores del diseño que tienen un número impar de letras. simplemente se agrega a la fracción original una segunda fracción con todos los signos invertidos. El resultado es un diseño factorial fraccionado 2~1-P.8-6 DISEÑOS DE RESOLUCIÓN IV Y V 347 kett-Burman pueden desenredarse utilizando técnicas de construcción de modelos de regresión. El proceso se muestra en la tabla 8-27 para el diseño 2~1. Además. como 1) romper tantas cadenas de alias de interacciones de dos factores como sea posible. La segunda fracción usaría los Tabla 8. considere el diseño 2~2 usado en el experimento del moldeo por inyección del ejemplo 8-4.p es de resolución IV si los efectos principales están separados de las interacciones de dos factores y algunas interacciones de dos factores son alias entre sí. 8-6 DISEÑOS DE RESOLUCIÓN IV Y V Un diseño factorial fraccionado 2k. Por lo tanto. A los diseños de resolución IV que contienen exactamente 2k corridas se les llama diseños mínimos. si se suprimen las interacciones de tres factores y de órdenes superiores. Los generadores del diseño de la tabla 8-10 son 1 = ABCE el = BCDF. los efectos principales pueden estimarse directamente en un diseño 2~p. y el factor (k + 1)-ésimo podría asociarse con esta columna. Un ejemplo es el diseño 2~2 de la tabla 8-10.1 obtenido por doblez D 1 A B e + Diseño 2~1 orginal con 1 = ABe + + + + + + + + + + + + + + + Segundo diseño 2~1 con los signos intercambiados . Entonces los signos positivos en la columna identidad 1 de la primera fracción podrían intercambiarse en la segunda fracción. Los diseños de resolución IV pueden obtenerse a partir de diseños de resolución III por el proceso de doblado. las dos fracciones combinadas del diseño 2~4 del ejemplo 8-7 producen un diseño 2~3 .27 Diseño 2i. o 3) romper las interacciones de dos factores que incluyen un factor específico. Es sencillo verificar que el diseño resultante es un diseño 2~1 con la relación de definición 1 =ABCD. Para ilustrar. Los alias de estas interacciones pueden por lo general separarse agregando un número pequeño de corri- . Montgomeryy Runger [83c] dan una tabla de diseños hechos doblez recomendados para fracciones de resolución N con 6 :5 le :5 10 factores. Ejemplos adicionales de estos diseños se presentan en Box y Hunter [17c]. tienen al menos una de tales cadenas de alias de interacciones de dos factores. y el generador único para el diseño combinado sería I = ADEF. Observe que cuando se empieza con un diseño de resolución III. I = ABDG e I = BCDEH. no necesariamente se separarán todas las interacciones de dos factores. Por lo tanto. De hecho. siempre que todas las interacciones de tres factores y de órdenes superiores sean insignificantes. el diseño combinado sigue siendo un diseño factorial fraccionado de resolución N. si la fracción original tiene una estructura de los alias con más de dos interacciones de dos factores en cualquier cadena de alias. sólo hay una o dos (o muy pocas) interacciones con alias que son de interés potencial. considere el diseño 2~3 con 32 corridas. En la tabla XII (m) del apéndice se muestran los alias para este diseño. La palabra más pequeña de la relación de definición de tal diseño debe tener cinco letras. Cuando se hace el doblez de un diseño de resolución IV. I = -ABDG e I = BCDEH. la segunda fracción tendría los generadoresI = -ABCF. junto de generadores para este diseño es I = ABCF. es posible estimar los cinco efectos principales y las 10 interacciones de dos factores.1 con la relación de definición I =ABCDE es de resolución v: Otro ejemplo es el diseño 2~-2 con las relaciones de definición I = ABCDG e I = ABEFH. cabe señalar que un doblez completo de un diseño de resolución IV o V suele ser innecesario. Como otro ejemplo. Los diseños de resolución V son factoriales fraccionados en los que los efectos principales y las interacciones de dos factores no tienen como alias otros efectos principales u otras interacciones de dos factores. CF = DG YCG = DF. y la relación de definición completa es I = CDFG= BCDEH = BEFGH '1 ~ .. Se trata de una simplificación considerable de los alias de la fracción original. e12~2 y el2~3. existe cierto interés práctico en los diseños factoriales fraccionados irregulares de resolución V. El diseño de 24 corridas para le = 5 factores se muestra en la tabla 8-28.348 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES generadores I = -ABCE e I = -BCDF. Para le = 6. y el diseño de nueve factores tiene 96 corridas. Todas las demás interacciones de dos factores pueden estimarse a partir del diseño combinado. El diseño para le = 4 factores tiene 12 corridas y se comenta en el problema 8-22. Por último. el procedimiento de doblez garantiza que el diseño combinado será de resolución Iv. Sin embargo. Observe que hay seis pares de interacciones de dos factores y un grupo de tres interacciones de dos factores que son alias. 7 Y8. con lo cual se asegura que todos los efectos principales pueden separarse de sus alias en interacciones de dos factores. permitiendo la estimación única de todos los efectos principales y las interacciones de dos factores. De hecho. AE = DFyAF = DE. estos diseños tienen 48 corridas. La tabla 8-14 indica que el mejor con. El diseño combinado tiene los generadores I = CDFG e I = BCDEH. Se cuenta con diseños útiles para 4:5 1e:5 9 factores. Puesto que se trata de un diseño de resolución V.'~ El diseño combinado es de resolución IV. el doblez no separará completamente todas las interacciones de dos factores. Estos diseños son muy poderosos. suponiendo que las interacciones de tres factores y órdenes superiores son insignificantes. En general. El paquete de software Design-Expert contiene todos estos diseños. El diseño 25. las únicas interacciones de dos factores que tendránalias sonAD = EF. Si se hace el doblez de este diseño. las relaciones de los alias serán mucho más sencillas que en el diseño 2~2 original.' I~ . Ambos ejemplos anteriores. Debido a que los diseños estándar de resolución V son diseños grandes cuando el número de factores es moderadamente grande. pero las únicas interacciones de dos factores que siguen teniendo alias son CD = FG. . El ensamblaje secuencial de estos diseños por medio de un doblez es una manera muy eficaz de obtener información adicional acerca de las interacciones que pueden identificarse como de posible importancia en un experimento inicial.. Por ejemplo. 8. el diseño de 16 corridas es un factorial completo para 4 factores. La propiedad de proyección de estos diseños hace posible en muchos casos examinar los factores activos con mayor detalle. Para formarse una idea de cómo se hace esto. 16 Y32 corridas son muy útiles. 11 :¡ji. y muchas de sus estructuras de los alias se muestran en la tabla XII del apéndice. identificando cuántos factores pueden usarse con cada diseño para obtener diferentes tipos de experimentos de tamizado.l. ~~ il 8~7 I_! RESUMEN [!. referirse al ejemplo 10-5 y al material suplementario del texto de este capítulo.p • Se ha hecho hincapié en el uso de estos diseños en experimentos de tamizado para identificar de manera rápida y eficaz el subconjunto de factores que están activos.) das a la fracción original. - I Ir . En la tabla 8-29 se resumen estos diseños. los diseños factoriales fraccionados 2k-p con N = 4. En la práctica. así como para proporcionar cierta información sobre las interacciones. una fracción de resolución IV para 6 u 8 factores y una fracción de resolución III para 9 a 15 factores. l' ! 1 En este capítulo se introdujo el diseño factorial fraccionado 2k. una fracción un medio para 5 factores. Esta técnica se denomina en ocasiones doblez parcial. Todos estos diseños pueden cons~ truirse utilizando los métodos explicados en este capítulo. "11 :'~r !. Comentar el diseño resultante e interpretar los resultados. Establecer un diseño 25. Ramberg delJoumal 01Quality Teehnology (vol.68 e= aee = abe = 1. Suponga que ha hecho las ocho corridas del diseño 25. Suponga que en el problema 6-15 sólo pudo correrse una fracción un medio del diseño 24• Construir el diseño y llevar a cabo el análisis utilizando los datos de la réplica I.06 b = -2.63 a= abe = d = 6. plegar el diseño 25. e) Si algunos de los factores son insignificantes. li 1: 8-4.350 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES Tabla 8-29 Diseños factoriales y factoriales fraccionados útiles del sistema 2h-p. 8-6. Los números en las celdas son el número de' factores del experimento Número de corridas Tipo de diseño Factorial completo Fracción un medio Fracción de resolución IV Fracción de resolución III 4 2 3 3 8 3 4 4 5-7 16 4 5 6-8 9-15 32 5 6 7-16 17-31 8~8 PROBLEMAS Suponga que en el experimento del desarrollo del proceso químico descrito en el problema 6-7 sólo pudo correrse una fracción un medio del diseño 24• Construir el diseño y llevar a cabo el análisis estadístico utilizando los datos de la réplica I. Los factores sanA = tem- .1 aun diseño factorial completo en los factores activos. En un artículo de 1.22 aed = 4.S.09 8-7. B = catalizador/reactivo. r ". editores. 8-3. D = pureza del reactivo y E = pH del reactivo. Snee ("Experimentación con un número grande de variables". y J. pp. Considere el experimento del grabado con plasma del problema 6-18. Snee.B.79 ade = 5. en Experiments in Industry: Design. ¿Qué corridas adicionales se necesitarían para identificar los efectos de los factores que son de interés? ¿Cuáles son las relaciones de los alias en el diseño combinado? R.D. Suponga que sólo pudo correrse una fracción un medio del diseño.45 abd = 5.2 apropiado y encontrar la estructura de los alias. Jr. Los factores sanA = solvente/reactivo.51 1. ASQC) describe un experimento en el que se usó un diseño 25. de R.1 con 1 = ABCDE para investigar los efectos de cinco factores sobre el color de un producto químico.2 del problema 8-4. Construir una gráfica de probabilidad normal de los residuales y graficar los residuales contra los valores ajustados. Suponga que sólo pudieron hacerse ocho corridas de este proceso. Los resultados obterJdos fueron los siguientes: 8-1.38 bed = 4. 198-206) se describe el uso de un diseño factorial fraccionado con réplicas para investigar el efecto de cinco factores sobre la altura libre de los resortes de hojas utilizados en una aplicación automotriz. C = temperatura.30 abede = 4.93 bee = -2.' ~: 8-5.68 ede = 5.05 2. ¿Qué conclusiones pueden sacarse? Continuación del problema 8-4.B.D. Comentar las gráficas. 8-2.22 1. L. Analysis and Inte¡pretation 01Results. 17.66 2. ¿Qué efectos parecen estar activos? b) Calcular los residuales.47 bde = 3. Pignatiello.1. Establecer el diseño y analizar los datos. En el problema 6-21 se describe el estudio para mejorar un proceso durante la manufactura de un circuito integrado. e = -0. Utilizar las observaciones apropiadas del problema 6-21 como las observaciones de este diseño y estimar los efectos de los factores. a) Construir una gráfica de probabilidad normal de los efectos. Trout. Rare y J. independientemente de la temperatura del aceite de templado usada? 8-10. Los resultados obtenidos son los siguientes: e = 23.81 7.69 7.62 7. e) Graficar los residuales contra los valores ajustados. B = cantidad del material 1.78 8.56 7.56 7.50 7. 8-9.00 8.50 7.44 7.liI 1\ r 8-8 PROBLEMAS 351 E peratura del horno.44 7.50 7.25 7. Considere el experimento con el resorte de hojas del problema 8-7. C = tiempo de transferencia. ¿Cuál es la resolución de este diseño? . C YD para reducir la variabilidad de la altura libre tanto como sea posible.54 7.56 7.32 7. ¿Cuál sería el ajuste de los factores A.44 7.78 8.18 7.2 seleccionando dos interacciones de dos factores como los generadores independientes.15 7. e) ¿Este diseño es el mejor posible para cinco factores en 16 corridas? Específicamente. B. Verificar que las interaccionesAB y AD están disponibles para usarlas como error.18 7. ¿es posible encontrar un diseño fraccionado para cinco factores en 16 corridas con una resolución más alta que la de este diseño? En un artículo de Industrial and Engineering Chemistry ("Información adicional acerca de la planeación de experimentos para aumentar la eficiencia de la investigación") se utiliza un diseño 25. ¿Qué resolución tiene este diseño? b) Analizar los datos.50 7.2 ed = 23.59 7.09 7. ¿Qué factores influyen en la altura libre promedio? e) Calcular el rango y la desviación estándar de la altura libre para cada corrida. Los datos se presentan a continuación: A B C D E Altura libre 7.56 7.2 para investigar el efecto deA = temperatura de condensación.88 7.56 7.50 7.12 7. B = tiempo de calentamiento.1 a) Verificar que los generadores que se utilizaron en el diseño fueron I b) Apuntar la relación de definición completa y los alias de este diseño.69 7.5 ad =16. Construir también la gráfica de probabilidad normal de los residuales. ¿Hay algún indicio de que cualquiera de estos factores afecta la variabilidad de la altura libre? d) Analizar los residuales de este experimento y comentar los resultados. Suponga que el factor E (temperatura del aceite de templado) es muy difícil de controlar durante la manufactura. D = tiempo de retención y = temperatura del aceite de templado.18 7.81 7. d) Elaborar la tabla del análisis de varianza. D = tiempo de condensación y E = cantidad del material 2 sobre el rendimiento.9 be =16.25 7. Delinear la tabla del análisis de varianza.44 7. a) Escribir la estructura de los alias de este diseño.56 7.8 aee = 23.59 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + 8-8.88 7.06 7.88 8.52 7. = ACE e I = BDE.50 7.88 7. C = volumen del solvente.81 7. Apuntar la estructura de los alias completa de este diseño.75 7.56 8. Comentar los resultados.75 7.4 bde =16.69 7. Construir un diseño 27.63 7. e) Estimar los efectos principales.8 abede =18.2 ab =15. Suponga que sólo pudo correrse una fracción un medio. ~ii ::11 Considere el diseño 25 del problema 6-21.55). Proyectar el diseño en un factorial completo en el subconjunto de los cuatro factores originales que parecen ser significativos. por ejemplo. Hacer el doblez del diseño 2~4 de la tabla 8-19 para producir un diseño de ocho factores. aed = 139. 8-20. 'Ir' ~"I ¡1'1 -: . ¿Se trata de un diseño mínimo? 8-18. .:1 '. 2). ae = 134.2 • Indicar cómo puede correrse el diseño en cuatro bloques de ocho observaciones cada uno. el costo de organización (C). B = tipo de material de empaque (1. Hacer el doblez de un diseño 2i..!" ~ 1. Considere el diseño 2~3 qel problema 8-15. Repetir el problema 8-12 utilizando I = -ABCD. Este diseño podría considerarse como una fracción tres cuartos.3 y se . el costo del refrendo de pedidos (D) y la tarifa de transportación (E). 8-12. 8-15. ce = 96. La variable de respuesta es el costo anual promedio. e = 99. Analizar los datos y sacar conclusiones. Determinar los efectos que pueden estimarse si se corre una segunda fracción de este diseño con todos los signos invertidos. ¿Alguno de los efectos principales o de las interacciones de dos factores están confundidos con los bloques? 8-21.. aede = 135. Determinar los efectos que pueden estimarse si se corre una segunda fracción de este diseño con los signos del factor A invertidos. . D = localización de la chimenea (adentro. Indicar cómo pueden combinarse las tres fracciones 24-2 restantes para estimar los efectos requeridos. Construir el diseño y analizar los datos. abee·= 191 Ybede = 150. Seis variables son de interés. bde = 152. 8-17. 0. e) Suponga que se corrió la fracción abe = 189. ¿El uso de la fracción alterna modifica la interpretación de los datos? 8-14. b) Suponga que se agrega una segunda fracción a la primera. Además se requirieron dos días para hacer las 16 observaciones. Proyectar el diseño 2~1 del ejemplo 8-1 en dos réplicas de un diseño 22 en los factores A y B. abe = 193. suponiendo que las interacciones de tres factores y de órdenes superiores son insignificantes.'¡ ji: I. Los resultados que obtiene son de = 95. pero no puede correrse el factorial 24 completo. abd = 190. Construir un diseño 27. Verificar que el diseño resultante sea 2~4. Construir un diseño 2~3.'el :'. Se corre un diseño 26. Estimar los efectos suponiendo que las interacciones de tres factores y de órdenes superiores son insignificantes. El tamaño del bloque más grande posible contiene 12 corridas..1 :!(.¡ i i/ I I I l: '11. Construir un diseño 25. 24 horas).. bd = 153. ade = 136. 8-23. 195°C) y F = tiempo de retraso antes del empaque (cero. 8-16.. Las variables independientes de su modelo son la cantidad del pedido (A). afuera). cada una con dos niveles: A = relación paso/finos (0.~.I. 8-19. b = 158. bee = 155 Y abede = 185.. ¿Cómo se obtuvo esta fracción? Incorporar estos datos en la fracción original y estimar los efectos. Para ahorrar tiempo de computadora. CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES ! I . Fracciones irregulares del diseño 2k (John [61dJ). Se corre un experimento en el horno para determinar cuáles son los factores que influyen en el peso del material de empaque que se adhiere a los ánodos después de la cocción. Los ánodos de carbono utilizados en un proceso de fundición se fabrican en un horno anular. Verificar que el diseño resultante sea 2~2. Analizar los datos del problema 6-23 como si provinieran de un diseño 2~1 conI =ABCD.: '1 352 8-11. y fue necesario confundir el diseño 25. Estas 12 corridas pueden obtenerse de las cuatro réplicas un cuarto definidas por I = ±AB = ±ACD = ±BCD omitiendo la fracción principal. el ingeniero decide investigar estos factores utilizando un diseño 2.. e = 93. ae = 187.. a) Verificar que las combinaciones de tratamientos dadas sean correctas. Considere un diseño 24• Tienen que estimarse los cuatro efectos principales y las seis interacciones de dos factores.45. . 8-l3.1 .BCE. el punto de un nuevo pedido (B). Un ingeniero industrial realiza un experimento utilizando un modelo de simulación Montecarlo de un sistema de inventario. ed = 92.1 en dos bloques.2 con I = ABD e I =. ab = 187. . Comparar este diseño con el diseño 2~2 de la tabla 8-10.? para producir un diseño de seis factores.. bed = 154.'. ¿Alguno de los efectos principales o de las interacciones de dos factores están confundidos con los bloques? 8-22. ¿Cómo se obtuvo esta segunda fracción? Incorporar estos datos a la fracción original y estimar los efectos. C = temperatura del material de empaque (ambiente. 325°C).1• Indicar cómo puede correrse el diseño en dos bloques de ocho observaciones cada uno. ad = 137 Y(1) = 98. l"" r". ~~ll r" ". E = temperatura del foso (ambiente. 705.0041 0. 1253).976.0250 0.0032 0.1457).0060 4 0.821).0296 0.8-8 PROBLEMAS 353 8-24.0255 0.025 22.0042 0.l¡1 ·61 io' rjlh I 1.0158 3 0.0044 0. 1299.00 97.75 55. 826. obtienen tres réplicas en cada uno de los puntos del diseño. 1541).890).1201.00 44.083 25.0092 0. El peso del material de empaque adherido a los ánodos se mide en gramos.0050 0.0062 0. abedef= (1275. -1"" mí. ed = (765.5 29 29 17.5 17.0086 0.0073 0. 1254.0185 0.5 29 29 17.0226 0.42 26.00 55.0047 0.25 Desviación estándar 24.0069 0.0045 Total (10-4 pulg/pulg) 629 192 176 223 223 920 389 900 201 341 Media (10-4 pulg/pulg) 157. af= (1474.0023 0.75 230.913). ::1 )1 '~I ".0043 0.029 39.0121 0. 936). def= (1320.25 85.0219 0. y se hizo una medición de la combadura del sustrato. ¿Cuál es la estructura" de los alias? b) Usar el peso promedio como respuesta.639 16.410 63.725 50. ¿Qué factores parecen tener influencia? e) Usar el rango de los pesos como respuesta.0169 0.0078 2 0.418 20.0066 0. -.0089 0.5 29 17. 1164. be = (1217.0030 0.0090 0. Los datos en el orden de las corridas son los siguientes: abd = (984.00 50.0040 0.1156. Las seis variables y sus niveles se presentan a continuación: Temperatura de laminación Corrida 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 CC) 55 75 55 75 55 75 55 75 55 75 55 75 55 75 55 75 Tiempo de laminación (s) 10 10 25 25 10 10 25 25 10 10 25 25 10 10 25 25 Presión de laminación (tn) 5 5 5 5 10 10 10 10 5 5 5 5 10 10 10 10 Thmperatura de cocción (oC) 1580 1580 1580 1580 1580 1580 1580 1580 1620 1620 1620 1620 1620 1620 1620 1620 Duración del ciclo de cocción (h) 17.0149 0. .t"T' 1.341 .0047 0.25 225.0128 0.0167 0. a) Verificar que las ocho corridas correspondan a un diseño 2~3. ¿Qué factores parecen tener influencia? d) ¿Qué recomendaciones podrían hacerse a los ingenieros del proceso? Se corrió un experimento de 16 corridas en una planta de manufactura de semiconductores para estudiar los efectos de seis factores sobre la curvatura o combadura de los dispositivos del sustrato producidos.5 17.0258 0.0020 0. Se desea minimizar la cantidad de material de empaque adherido.:. Se hicieron cuatro réplicas de cada corrida.0077 0. aee = (1338.0147 0.5 29 Punto de rocío de la cocción CC) 20 26 20 26 26 20 26 20 26 20 26 20 20 26 20 26 ~¡ ::: " "".976 4. ~~t.5 29 17.0081 0.25 48.5 29 17. 1294) Ybef = (1325. Los datos se presentan enseguida: Combadura por réplica (pulg/pulg) Corrida 1 2 3 4 5 6 7 8 9 10 1 0.0039 0. .7 4656 4478.3 4542.7 4196.0093 2 0..7 4690.0145 0.7 4493.¡. Rango 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 5 5 3 3 3 5 3 5 5 3 3 3 5 3 5 5 3 3 5 3 5 3 5 3 5 3 3 5 5 5 5 3 Lote 2 Lote 1 Lote 1 Lote 2 Lote 1 Lote 1 Lote 1 Lote 2 Lote 1 Lote 1 Lote 2 Lote 1 Lote 1 Lote 1 Lote 2 Lote 2 Lote 2 Lote 1 Lote 2 Lote 2 Lote 1 Lote 2 Lote 1 Lote 2 Lote 1 Lote 2 Lote 1 Lote 2 Lote 1 Lote 2 Lote 2 .0110 0.0133 Total (10-4 pulg/pulg) 126 640 455 371 603 460 Media (10-4 pulg/pulg) 31.0126 0. .7 4223. ¡: )!: 1::' .7 4467 4262 4515.0158 0.7 4235 4220.50 160.0124 3 0.7 4300.7 4446 4464.7 4535 4497.75 92.3 4451 4664.75 115.0186 0.0158 0.0159 0.75 17.0137 0. Lote 2 14 6 6 14 14 6 6 14 14 14 14 6 6 6 14 6 14 14 6 6 14 6 14 6 14 6 14 6 6 6 14 14 7350 7350 6650 7350 7350 6650 7350 6650 6650 6650 6650 7350 6650 6650 7350 7350 7350 6650 7350 7350 6650 6650 7350 7350 7350 6650 7350 6650 7350 6650 6650 6650 5 5 5 20 5 20 5 20 5 5 20 20 5 20 20 5 5 20 20 5 20 5 20 20 5 20 20 5 20 20 5 5 Sin Sin Sin Sin .0158 0.0028 0. Prom.083 31.0071 0.7 16 36 38 20 18 25 20 9 30 25 16 16 22 25 45 44 37 9 13 33 24 38 14 20 15 22 58 29 33 33 32 35 1I~ 1: ~" e:.7 4317.0101 0.3 4297 4485.3 4530.0155 0.0028 0.11' .7 4474. s Velocidad Aceleración Cubierta Izq.00 113..7 4521. ~::: ~~~: ~:!!. Sin Sin Con Sin Sin Con Con Sin Con Con Con Con Con Sin Sin Sin Con Con Sin Con Con Sin Con Sin Con Con Con Sin 4531 4446 4452 4316 4307 4470 4496 4542 4621 4653 4480 4221 4620 4455 4255 4490 4514 4494 4293 4534 4460 4650 4231 4225 4381 4533 4194 4666 4180 4465 4653 4683 4531 4464 4490 4328 4295 4492 4502 4547 4643 4670 4486 4233 4641 4480 4288 4534 4551 4503 4306 4545 4457 4688 4244 4228 4391 4521 4230 4695 4213 4496 4685 4712 4515 4428 4452 4308 4289 4495 4482 4538 4613 4645 4470 4217 4619 4466 4243 4523 4540 4496 4302 4512 4436 4656 4230 4208 4376 4511 4172 4672 4197 4463 4665 4677 4525.45 ¡1~ :j Ij a) b) e) d) ¿Qué tipo de diseño utilizaron los experimentadores? ¿Cuáles son las relaciones de los alias en este diseño? ¿Alguna de las variables del proceso afecta la combadura promedio? ¿Alguna de las variables del proceso afecta la variabilidad de las mediciones de la combadura? Tabla 8-30 Datos para el problema 8-25 B F A e D E Espesor del recubrimiento protector Corrida Volumen Lote Tiempo.0109 0.'" 354 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES 1 '~'i L¡' .681 20.12 29.7 4626.j Combadura por réplica (pulg/pulg) Corrida 11 12 13 14 15 16 1 0.00 Desviación estándar 7.".7 4198.3 4382.0043 0.:. Centro DeI.0065 0.3 4625.51 6. '.0110 4 0.0145 0.0027 0.75 150.7 4667.7 4677. ~~II ".0086 0. siendo la calificación lla mejor. Cultivan varias variedades de uvas y fabrican vino. El experimentador decide usar un diseño 26-1 y hacer tres lecturas del espesor del recubrimiento protector en cada oblea de prueba.ais Nueva Montrachet Todos Medio 10% Alta (92°F máx. Se encontrará útil examinar una gráfica de probabilidad normal de las estimaciones de los efectos. las cuales se muestran en este experimento: Variable A = Clan de Pinot Noir B = Tipo de roble e = Edad de la barrica D = Levadura/contacto con la piel E = Vapores F = Tostado de las barricas G = Racimos completos H = Temperatura de fermentación Nivel bajo (-) Pornmard Allier Vieja Champagne Ninguno Ligero Ninguno Baja (75°F máx. ¿Ayuda esto en la interpretación? e) Usar el rango del espesor del recubrimiento protector como variable de respuesta. . y el espesor promedio del recubrimiento protector y la variabilidad del espesor del mismo tienen un impacto importante en los pasos subsecuentes de manufactura.1.f I 8-8 PROBLEMAS 355 8-25. Oregon. El diseño y los resultados del panel de catadores se muestra en la tabla 8-31.) Harry y Judy decidieron usar un diseño 2~4 con 16 corridas. a) ¿Cuáles son las relaciones de los alias en el diseño seleccionado por Harry y Judy? b) Usar las calificaciones promedio 6i) como variable de respuesta. b) ¿Qué factores parecen afectar el espesor promedio del recubrimiento protector? e) Considerando que el volumen del recubrimiento protector aplicado tiene un efecto reducido sobre el espesor promedio. Presentar los resultados gráficamente. Las variables y sus niveles alto y bajo se presentan a continuación: Factor Velocidad de centrifugado final Índice de aceleración Volumen de recubrimiento protector aplicado Tiempo del centrifugado Variación del lote del recubrimiento protector Presión de descarga Nivel bajo 7350 rpm Nivel alto 6650 rpm 20 5 cc 6s Lote 2 Con cubierta 5 3 cc 14 s Lote 1 Sin cubierta 8-26. Harry y Judy han usado diseños factoriales para el desarrollo de procesos y productos en el segmento de fabricación vinícola de su negocio. Cada experto calificó las 16 muestras de vino catadas. ¿qué recomendaciones se harían? Se usa un revestimiento por centrifugado para aplicar un recubrimiento fotoprotector en una oblea de silicio natural. Seis variables se usan en el experimento.) Nivel alto ( +) Wadenswil Tron<. Originalmente se estudiaron ocho variables. El vino fue catado por un panel de expertos e18 de marzo de 1986. ¿tiene esto alguna implicación práctica im~ortante para los ingenieros del proceso? d) Proyectar este diseño en un diseño menor que incluya únicamente los factores significativos. Esta operación suele hacerse en las fases iniciales del proceso de fabricación de semiconductores. Analizar los datos y sacar conclusiones.. Los datos se muestran en la tabla 8-30. Este problema describe el experimento realizado para su Pinot Noir 1985. Discutir las relaciones de los alias de este diseño. ¿Hay algún indicio de que alguno de estos factores afecte la variabilidad del espesor del recubrimiento protector? f) ¿Dónde se recomendaría que corrieran el proceso los ingenieros? Harry y Judy Peterson-Nedry (dos amigos del autor) son propietarios de un viñedo y una fábrica vinícola en Newberg. a) Verificar que se trata de un diseño 26. e) Si es importante reducir la combadura tanto como sea posible. 79 3.2 12. -=:~¡¡- .11 2.jJ \J1 0\ Tabla 8-31 Diseño y resultados del experimento de la prueba del vino Variable Corrida 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 A CaIificaciones del panel Resumen RGB 7 9 15 12 10 16 3 14 2 6 8 4 5 1 11 13 - + - B - e - D + + + + + + - + + - - - E - F .52 4.02 1.6 10.0 15.6 9.0 5.79 1. G H - HPN 12 10 14 9 8 16 6 15 1 7 13 3 2 4 5 11 JPN 6 7 13 9 8 12 5 16 2 11 3 1 10 4 15 14 CAL DCM Ji 9.0 15.2 2.---~~.6 s - - + + - - + + + + - - + + + + - + - + + - + + - + + + - + + - - + + - - - + + + + + + + + + + + + + + + + + - + + + + - + - + + + - - - + + + - - + + - + + + 13 14 10 7 11 15 6 16 3 4 8 5 2 1 9 12 10 14 11 9 8 16 5 15 3 7 12 1 4 2 6 13 3.0 8.6 2.55 3.84 0.8 2.8 9.2 7.05 3.14 .96 1.73 1.8 12.22 0...84 2.2 9. \.41 1.07 1.29 1.4 9. y que las 16 corridas tendrían que hacerse con las barricas viejas. Harry y Judy se enteraron de que las ocho nuevas barricas que ordenaron de Francia para usarlas en el experimento no llegarían a tiempo.28 4. la humedad del cacahuate (C).05 1.28 Y 63 21 36 99 24 66 71 54 23 74 80 33 63 21 44 96 .28 4.05 1.28 1. Esto se confirmó e18 de marzo de 1986 en la prueba del vino.05 1.In 8-8 PROBLEMAS 357 Usar la desviación estándar de las calificaciones (o alguna transformación apropiada tal como lag s) como variable de respuesta. por lo que decidieron eliminar su calificación. Si Harry y Judy simplemente eliminan la columna C de su diseño. Por ejemplo. Quieren establecer un nuevo diseño para su Pinot Noir 1986 utilizando estas mismas ocho variables. tamaño de las partículas (mm) 1. pp. 19-23) M.28 4.05 1. ¿Qué conclusiones pueden sacarse acerca de los efectos de las ocho variables sobre la variabilidad de la calidad del vino? d) Después de mirar los resultados. pero no quieren correr el experimento con los ocho factores en el nivel alto.28 4. ¿Qué efecto tendría esto en los resultados y las conclusiones de los incisos b y c? e) Suponga que justo antes de empezar el experimento.28 1.28 4. Los niveles que usó para estos factores son los siguientes: A. la velocidad de flujo del COz (D) Yel tamaño de las partículas de cacahuate (E) sobre el rendimiento total del aceite por lote de cacahuates (y). temperatura c) Nivel codificado -1 1 CC) 25 95 C.05 4. flujo (litros/min) 40 60 E. ¿qué ocurre con las relaciones de los alias? ¿Es necesario que empiecen de nuevo y construyan otro diseño? f) Harryy Judy saben por experiencia que es improbable que algunas de las combinaciones de tratamientos produzcan buenos resultados. humedad (% por peso) 5 15 415 550 D. A B C 5 5 5 5 15 15 15 15 5 5 5 5 15 15 15 15 D E 415 550 415 550 415 550 415 550 415 550 415 550 415 550 415 550 25 25 95 95 25 25 95 95 25 25 95 95 25 25 95 95 40 40 40 40 40 40 40 40 60 60 60 60 60 60 60 60 1.B. Harry y Judy coincidieron en que uno de los miembros del panel (DCM) sabía más de cerveza que de vino. En un artículo de Quality Engineering ("Una aplicación de los diseños experimentales factoriales fraccionados". ¿Qué diseño sugeriría el lector? 8-27.05 1. 1.05 Kilgo realizó el experimento factorial fraccionado con 16 corridas que se muestra a continuación. Kilgo describe un experimento para determinar el efecto de la presión del COz (A). vol. la corrida con las ocho variables en el nivel alto generalmente resulta en un vino con una calificación baja.05 4.05 4. presión (bar) B.28 4. la temperatura del COz (B). ~¡.955 arcsenJP 1.363 1.(. e) Efectuar el análisis estadístico apropiado para probar las hipótesis de que los factores identificados en el inciso b anterior tienen un efecto significativo sobre el rendimiento del aceite de cacahuate. Construir también una gráfica de probabilidad normal de los residuales.958 0. b) Estimar los efectos de los factores y usar una gráfica de probabilidad normal para hacer la identificación tentativa de los factores importantes.571 1.679 0.364 1. arcsen de la raíz cuadrada de p.000 0. El diseño y la proporción resultante de vaciados no defectuosos p que se observaron en cada corrida se presentan enseguida.417 1.. a) ¿Qué tipo de diseño se ha utilizado? Identificar la relación de definición y las relaciones de los alias. Modificación deF&T 1. e) El lector habrá notado en el inciso d un indicio de que la varianza de la respuesta no es constante (consi.419 1.160 1.357 !~:: t:.130 1. 1":·" l:::: + + + + + + + + + + + + + + + + + . Comentar la adecuación de estas gráficas.J=AByK=ABC.813 0. el cual se describe en el artículo "Estudio del proceso de vaciado evaporativo para múltiples de admisión de 3.781 1.958 0. esto debería haberse anticipado).130 1. d) Ajustar un modelo que pueda usarse para predecir el rendimiento del aceite de cacahuate en términos de los factores que se han identificado como importantes.11/ + + + + + + + + + + a) Encontrar la relación de definición y las relaciones de los alias de este diseño.363 1.083 1. d) Graficar los residuales de este modelo contra la proporción predicha de vaciados no defectuosos. "r 1'" .0 litros 'Poor Sandfill"'.896 0.358 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES 8-28.derando que la respuesta es una proporción. H=AC.161 1.556 1.077 1.259 0.363 1.. b) Estimar los efectos de los factores y usar una gráfica de probabilidad normal para hacer la identificación tentativa de los factores importantes.124 1.356 : Ir (" Corrida 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 A B C D E F G H J K P 0.I + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + !"j 11.969 1.977 0.968 1.076 1. La tabla anterior también muestra una transformación de p. e) Analizar los residuales de este experimento y comentar la adecuación del modelo.363 1.259 0.571 1.~:~:~ + + + + + + + + + + + + + + + + + + + + + r"\1'" ~~~il ~~:~~ (" . que es de uso generalizado como tralls!onnacióll para estabilizar la vmiallza de los datos de la proporción (referirse a la discusión de las transformaciones para estabilizar la varianza del capítulo 3).123 1. Los ingenieros de la planta EssexAluminum de Ford Motor Company llevaron a cabo un experimento factorial fraccionado en 10 factores con 16 corridas para el vaciado en arena de tubos múltiples para motor.841 0.242 1.775 0. G =BC.000 0.081 1. Se trata de una fracción de resolución 111 con generadores E = CD.958 1.F =BD.958 0. 120-130).906 0.364 1. Dearborn. El objetivo fue determinar cuáles de los 10 factores tienen un efecto sobre la proporción de vaciados defectuosos. Becknell (FoUlth Symposium Oll Taguchi Methods.:]1.818 0. pp. de D. American Supplier Institute.364 1.555 1.. . Repetir los incisos a al d anteriores utilizan- .241 1. e) Ajustar el modelo apropiado utilizando los factores identificados en el inciso b anterior. MI.364 1. Suponga que el número de vaciados hechos en cada corrida del diseño es 1000. vol.I. 7. La modificación de F&T es: [arcsen.00 Modificación deF&T 7.00 1.41 1.73 2.46 1.07 1. MI.) Un experimento factorial fraccionado en nueve factores y 16 corridas fue conducido por el departamento Chrysler Motors Engineering y se describe en el artículo "Mejoramiento del proceso compuesto de moldeo de planchas". de S. Se trata de una fracción de resolución III con generadores E = BD. pp.48 4. Asimismo. Goodwin (Fowth Symposium on Taguchi Methods. d) Graficar los residuales de este modelo contra el número predicho de defectos. 429-443.12 1.87 2.50 + + + + + + + + + + + + + a) Encontrar la relación de definición y las relaciones de los alias de este diseño.41 2.T. de P.Jnp 1(n+ 1) + arcsen.18 1. Fuller.12 1. El objetivo era reducir el número de defectos en el acabado de rejillas de planchas moldeadas de recuadros abiertos.57 1. propuesta por Freeman y Tukey ("Transformaciones relacionadas con ángulos y la raíz cuadrada". El diseño y el número resultante de defectos. 21.12 7.fC 7.73 3. Quality Engineering. Annals ofMathematical Statistics. b) Estimar los efectos de los factores y usar una gráfica de probabilidad normal para hacer la identificación tentativa de los factores importantes. . Corrida 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 A B C D E F G H J + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + e 56 17 2 4 3 4 50 2 1 O 3 12 3 4 O O .73 2. F = BCD.57 2.00 1.s-s PROBLEMAS 359 f) do la respuesta transformada y comentar los resultados. pp.00 0. 13-21). referirse a ''Análisis de experimentos factoriales con defectos o partes defectuosas como respuesta".52 4. Bisgaard y H.00 7. observados en cada corrida se muestran a continuación. pp.E. (Para una interesante discusión y análisis de este experimento.12 0.. construir una gráfica de probabilidad normal de los residuales. e) Ajustar un' modelo apropiado utilizando los factores identificados en el inciso b anterior. 607-611) que mejora su desempeño en las colas. e.21 0. H = ACD y J = AB. ¿son mejores ahora las gráficas de los residuales? Hay una modificación de la transformación arcsen de la raíz cuadrada.50 0.54 1. G = AC.87 2. Hsieh y D.00 0. 8-29. Dearborn.J(np+ 1)1 (n+ 1)]/2 Resolver de nuevo los incisos a al d utilizando esta transformación y comentar los resultados.50 1. American Supplier Institute.12 1.87 3. vol. Comentar la adecuación de estas gráficas. Específicamente.00 0. ) Se corre un experimento en una fábrica de semiconductores para investigar el efecto de seis factores sobre la amplificación del transistor. B = duración del ciclo.+ + + + + + - 1 6 12 4 7 16 . Analizar los residuales y comentar los resultados. propuesta por Freeman y Tukey. ¿han mejorado ahora las gráficas de los residuales? Hay una modificación de la transformación de la raíz cuadrada.. Resolver de nuevo los incisos a al d utilizando esta transformación y comentar los resultados.360 e) CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NNELES f) El lector habrá notado en el inciso d un indicio de que la varianza de larespuesta no es constante (considerando que la respuesta es un conteo. como engranes. Se estudiaron seis factores en un diseño 2~2:A = temperatura del horno.T. Puller. Usar una gráfica normal de los efectos para identificar los factores significativos. (Para una interesante discusión y análisis de este experimento. Específicamente. vol. La modificación de F&T de la transformación de la raíz cuadrada es: 8-30. y suele medirse realizando un análisis de carbono del paso del engrane (la cara superior del diente del engrane). La tabla anterior también incluye una transformación de c.+ + + + + + - . de S.+ + + 14 15 16 + + + . la raíz cuadrada. El diseño seleccionado es el 2~2 que se muestra a continuación: ~. 2 8 5 9 3 14 11 10 15 13 + + + + - + + + + + + + + - + + + . referirse a '1\nálisis de experimentos factoriales con defectos o partes defectuosas como respuesta". El espesor de la capa carbonizada es una variable de salida crítica de este proceso. 21.+ + + Amplificación 1455 1511 1487 1596 1430 1481 1458 1549 1454 1517 1487 1596 1446 1473 1461 1563 8-31.D = duración del a) b) c) d) . vol. ("Transformaciones relacionadas con ángulos y raíz cuadrada". pp. 7.+ + + + + + + + + + + + . Conducir las pruebas estadísticas apropiadas para el modelo identificado en el inciso a. que es una transfonnación para estabilizar la varianza de uso generalizado con datos de conteos (referirse a la exposición de las transformaciones para estabilizar la varianza del capítulo 3). . Bisgaard y H. ::1...' 1'. 607-611) que mejora su desempeño. e = concentración de carbono. "1. 429-443. Annals ofMathematical Statistics. Repetir los incisos a al d utilizando la respuesta transformada y comentar los resultados. Quality Engineering.. ¿Es posible encontrar un conjunto de condiciones de operación que produzca una amplificación de 1500 ± 25? El tratamiento térmico es de uso común para carbonizar piezas metálicas.: ' ..'" 1~1I1 I'~~ ::::1 Orden Orden de estándar las corridas 1 2 3 4 5 6 7 8 9 10 11 12 13 A B e D E F 1"". 1'1 . esto debería haberse anticipado).. pp. d) Interpretar los resultados de este experimento. Suponer que es deseable un espesor de la capa de entre 140 y 160.96 23. I~ I I Orden Orden de estándar las corridas 1 1 2 10 5 3 4 4 15 5 19 6 16 7 8 7 8 9 10 3 11 13 12 11 12 13 20 14 15 9 A B e D E Y + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + 16.58 21.12 18.78 .95 14.33 18. Seleccionar un modelo tentativo. e) Analizar los residuales y comentar la adecuación del modelo.03 26. a) Estimar los efectos de los factores y representarlos en una gráfica de probabilidad normal.43 27.52 15. b) Efectuar las pruebas estadísticas apropiadas en el modelo. El exp'erimento se presenta a continuación: Orden estándar 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Orden de las corridas 5 7 8 2 10 12 16 1 6 9 14 13 11 3 15 4 A B e D E F + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + Paso 74 190 133 127 115 101 54 144 121 188 135 170 126 175 126 193 8-32.15 15. Se estudian cinco factores en el diseño factorial fraccionado irregular de resolución V mostrado enseguida: l11i ~.11 8-8 PROBLEMAS 361 ciclo de carbonización. E = concentración de carbono del ciclo difuso y F = duración del ciclo difuso.56 29.73 21.74 20.58 19.07 16. ¿Qué factores influyen en la respuesta y? b) Analizar los residuales.03 21..31 17.' ...' ~::i.' 362 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NNELES Orden Orden de estándar las corridas 16 22 21 17 18 6 19 23 20 18 21 24 22 17 23 2 24 14 A B e + + + D E + + + + + + + + + + + + + + + + + + + + + + + + + + + Y 13.01 17..63 19.::. r. . Comentar la adecuación del modelo..39 18..49 29. '1 "1""" ·1'~" ~~ ·~"I.."" ."'1 ./!I'l...~ .62 16.· "I¡''f'.¡ r.:!::: "'"'''' ¡:.:JI.".42 a) Analizar los datos de este experimento..96 20.:: '11-. respectivamente.. Cada combinación de tratamientos del diseño 3k se denotará por k dígitos. donde el primer dígito indica el nivel del factor A.1 DISEÑO FACTORIAL 3 k 9·1.y factoriales fraccionados con tres niveles y con niveles mixtos Las series con dos niveles de los diseños factoriales y factoriales fraccionados que se comentaron en los capítulos 6. K~ cada uno. para representar estos niveles de los factores.. Hay algunas extensiones y variantes de estos diseños que en ocasiones son útiles. f-'::r t') ~i~. m~~ ~i ::i!' >" 9. En el diseño 2k se prefirió la notación ± 1 porque facilita la vista geométrica del diseño y porque puede aplicarse directamente al modelado de regresión. 00 denota la combinación de tratamientos correspondiente aA y B ambos en el nivel bajo. ~ tj1 ro\f>. oo. y el dígito k-ésimo indica el nivel del factor K.. Hay varias notaciones diferentes que se usaJ? ~ §. Se usarán letras mayúsculas para denotar los factores y las interacciones. ~~ ~g f. utilizando Oy 1 en lugar del 1 negativo y el1 positivo. un arreglo factorial de k factores que tienen tres nivelfff." Diseños factoriales. OY + 1.. respectivamente. es decir. una posibilidad es representar los niveles de los factores con los dígitos O(bajo). ~t'.1 Notación y motivación del diseño 3 k . respectivamente. intermedio y alto con -1. Estos diseños 3k se analizan en este capítulo. Con esto se facilita el ajuste de un modelo de re· r-.. Se hará referencia ~) los tres niveles de los factores como bajo. En las figuras 9-1 y 9-2 se muestra la representación geométrica de los diseños 32 y 33.. es común denotar los niveles bajo. Por ejemplo. el segundo dígito indica el nivel del factor B.~ F ft~ ". 1 (intermedio) y 2 (alto). En el sistema de los diseños 3\ cuando los factores son cuantitativos. y 01 denota la combinación de tratamientos correspondiente aA en el nivel bajo y B en el nivel intermedio.~. como los diseños para los casos en que todos los factores están presentes con tres niveles. intermedio y alto.1 %l 363 . utilizando esta notación. la separación en bloques y la construcción de factoriales fraccionados.. Este sistema de notación pudo haberse usado en los diseños 2k presentados anteriormente. Se estudia ahora el diseño factorial 3k . 7 Y8 son de uso generalizado en la investigación y el desarrollo industrial. en un diseño 32. Se consideran también los casos en que algunos de los factores tienen dos niveles y otros factores tienen ya sea tres o cuatro niveles. .o'220 O Figura 9-2 1 Factor A Combinaciones de tratamientos en un diseño 33 .----~':"::"::----::.. considere el diseño 32 de la figura 9-1. . Sin embargo. El diseño 3k es ciertamente una elección posible para un experimentador que se preocupa por la curvatura en la función de respuesta. Un modelo de regresión que relaciona la respuesta y con Xl y X 2 que se basa en este diseño es (9-1) Observe que la adición de un tercer nivel de los factores permite que la relación entre la respuesta y los factores del diseño se modele como un modelo cuadrático. y sea que Xl represente al factorA y quex2 represente al factor B. es necesario tomar en consideración dos puntos: 1. 222 . El diseño 3k no es la forma más eficiente de modelar una relación cuadrática. Por ejemplo.364 CAPÍTULO 9 DISEÑOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NNELES 2 02 12 22 'Q B u uro 01 11 21 O 00 10 20 Factor A Figura 9-1 diseño 32• 111 Combinaciones de tratamientos en un gresión que relaciona la respuesta con los niveles de los factores. los diseños de superficie de respuesta que se exponen en el capítulo 11 son alternativas superiores. si uno de los cuadrados se superpone en el otro. El primer método consiste en subdividir AB en los cuatro componentes con un solo grado de libertad que corresponden a ABL x UABL x Q. . observe que SSAB = SSABL xL + SSABL x Q + SSABQ xL + SSABQXQ = 61. esto sólo tiene sentido si el factor es cuantitativo. R = -2 YS = 8. el cual tiene dos factores. Esta estrategia secuencial de experimentación es más eficiente. Los dos factoresA yB corresponden a los renglones y las columnas. el diseño de dos niveles puede aumentarse con corridas axiales para obtener un diseño central compuesto. La partición de la interacción de dos factores AB puede hacerse de dos maneras. Estos totales se muestran en la figura 9-3 como los números encerrados en círculos dentro de los cuadrados. Yla suma de cuadrados entre estos totales Factor B Factor B 2 o o Q R 2 1 o o Q S 2 1 2 S G G 0 0 8 G 8 G G R S S Q Q R R G G 0 0 8 G G G 8 R S Q S R Q a) b) Figura 9-3 Totales de las combinaciones de los tratamientos del ejemplo 5-5 con dos cuadrados latinos superpuestos.SSABL xQ = 42. En la figura 9-3 se muestran dos cuadrados latinos 3 x 3 particulares.67y SSABQxQ = 8. cada letra del primer cuadrado aparecerá exactamente una vez con cada letra del segundo cuadrado. respectivamente. de un cuadrado latino 3 x 3. es decir. Permite conservar reducido el tamaño y la complejidad del diseño y al mismo tiempo permite obtener cierta protección contra la curvatura. cada uno con un solo grado de libertad.1.67. Si hay n réplicas. Los totales de las letras en el cuadrado a son Q = 18. superpuestos en los totales de las celdas. Puesto que están presentes 32 = 9 combinaciones de tratamientos. Los efectos principales deA y B tienen dos grados de libertad cada uno. Desde luego. como se observa en la ecuación 9-1. como se indicó en el ejemplo S-S.9-1 DISEÑO FACTORIAL 3k 365 2.ABQ x L YABQ x Q' Esto puede hacerse ajustando los términos /3l'iX¡X2' /312iXIX~. Para los datos de la vida de la herramienta de ese ejemplo se obtiene SSABL xL = 8. Considere los totales de las combinaciones de los tratamientos para los datos del ejemplo S-S.00. que correr un diseño factoria13 k con factores cuantitativos. B YAB pueden calcularse mediante los métodos usuales para los diseños factoriales analizados en el capítulo S. /3112X¡X2y f31122X¡ x~. Entonces. como se ilustra en la figura 6-36. El segundo método se basa en los cuadrados latinos ortogonales.2 El diseño 3 2 El diseño más simple del sistema 3k es el diseño 32. y la interacciónAB tiene cuatro grados de libertad. El diseño 2k aumentado con los puntos centrales. Puesto que se trata de una partición ortogonal deAB. Las sumas de cuadrados de A. como se analizó en el capítulo 6. es una forma excelente de obtener una indicación de la curvatura. respectivamente. si la curvatura es importante.34.00. hay ocho grados de libertad entre estas combinaciones de tratamientos. habrá n3 2 -1 grados de libertad totales y 32(n -1) grados de libertad del error. Estos dos cuadrados latinos son ortogonales. 9. por mucho. Las combinaciones de tratamientos de este diseño se mostraron en la figura 9-1.SSABQXL = 2. cada uno con tres niveles. Cada efecto principal puede representarse con un componente lineal y uno cuadrático. 34 = SS ÁB con 2 + 2 = 4 grados de libertad. entonces se encuentra que las letras ocupan celdas de acuerdo con el siguiente patrón: Cuadrado a Q: Xl + X 2 = O(mad 3) R:xl +x 2 =1 (mad3) S: Xl + x 2 = 2 (mad 3) Cuadradob Q: Xl + 2X 2 = O(mad 3) S: Xl + 2x 2 = 1 (mad 3) R: Xl + 2x 2 = 2 (mad 3) Por ejemplo.00. De manera similar. Cada uno de los componentes AB y AB2 tiene dos grados de libertad. A 2B es lo mismo que AB 2 porque Los componentesAB y AB 2 de la interacciónAB no tienen significado real y por lo general no se incluyen en la tabla del análisis de varianza. Si se hace la suma de los datos en las diagonales hacia abajo de izquierda a derecha. y Q ocuparía la celda de en medio. R = 6 YS = 18. Además. y a la suma de cuadrados calculada con el cuadrado b se le llama el componenteAB 2 de la inte· racción. la expresión completa se eleva al cuadrado y los exponentes se reducen al módulo 3. La suma de cuadrados entre estos totales es 33.34+ 28. es decir.x l + 2x2 = 1 + (2)(1) = 3 = O(mod 3). 2) deA y B se denotan por Xl y X 2. Sin embargo.34. no hay relación entre los componentesAB y AB 2 de la interacción y las sumas de cuadrados de ABL x Lo ABL x Q' ABQ x L YABQ x Q' Los componentesAB yAB 2 de la interacción pueden calcularse de otra manera. -3 + 10 -1 = 6 Y5 + 11 + 2 = 18. respectivamente. respectivamente. 1. por lo tanto. La suma de cuadrados entre estos totales es 28. Se usa esta terminología porque si los niveles (O. con dos grados de libertad.34 (AB). a la suma de cuadrados calculada con el cuadrado a se le llama el componenteAB de la in· teracción. con dos grados de libertad. -3 + 2-1 = -2 Y-3 + 11 + 10 = 18. Yla suma de cuadrados entre estos totales es [0 2 + 62 + 182]/(3)(2) . se obtienen los totales -3 + 4 -1 = O. los totales de la diagonal hacia abajo de derecha a izquierda son 5 + 4-1 = 8. Se usarán aquí indistintamente las dos notaciones. esta partición en gran medida arbitraria de la interacciónAB en dos componentes ortogonales con dos grados de libertad es muy útil para construir diseños más complicados. I(AB) = AB 2 J(AB) = AB .[242 /(9)(2)] = 28. Cuando se consideran expresiones de la formaAPBq.[242/(9)(2)] = 33.00 (AB 2 ). En forma similar. Considere los totales de las combinaciones de los tratamientos en cualquiera de los cuadrados de la figura 9-3. en el cuadrado b se observa que la celda de en medio corresponde aXI = 1 YX 2 = 1. los totales de las letras en el cuadrado b son Q = O.366 CAPÍTULO 9 DISEÑOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES es [18 2 + (_2)2 + 82]/(3)(2) . Si el exponente de la primera letra no es 1. Observe que la suma de estos dos componentes es 33. se establece la convención de que el único exponente permitido en la primera letra es 1.00 = 61. En general. Por ejemplo. Yates llamó a estos componentes de la interacción los componentes 1 y J de la interacción. Las sumas de cuadrados se calcularon con los métodos usuales. Éstos se designarían AB. AB 2C. y la disposición experimental y la notación de las combinaciones de los tratamientos se presentaron anteriormente en la figura 9-2. si los factores son cuantitativos... Si se hacen 11 réplicas. AC2. la velocidad del llenado (B) y la presión de operación (C).. B YC) bajo estudio..v. y y Z de la interacción. tres velocidades de llenado y tres presiones..3 El diseño 3 3 Suponga ahora que hay tres factores (A...... Por último. y se corren dos réplicas de un experimento factorial 33 • En la tabla 9-1 se muestran los datos codificados... Las sumas de cuadrados pueden calcularse utilizando los métodos estándares para los diseños factoriales. Esta descomposición de la interacción de tres factores no es por lo general de gran utilidad.... es posible hacer la partición de los efectos principales en un componente lineal y uno cuadrático.. etcétera.. Cada efecto principal tiene 2 grados de libertad.. El nivel intermedio de la velocidad produce el mejor desempeño.. lineal x lineal x cuadrático. los componentes ¡:.... AB 2.. BC YBC2. puede hacerse la partición de la interacción de tres factoresABC en ocho componentes con un solo grado de libertad que corresponden a lineal x lineal x lineal... es decir.. y que cada factor tiene tres niveles dispuestos en un experimento factorial.. El análisis de varianza de los datos de la pérdida de jarabe se muestra en la tabla 9-2. cada interacción de dos factores tiene 4 grados de libertad y la interacción de tres factores tiene 8 grados de libertad..... W(ABC) = AB 2 C 2 X(ABC) = AB C Y(ABC) = ABC Z(ABC)=ABC 2 2 Observe que ninguna de las primeras letras puede tener un exponente diferente de 1. AC. . mientras que las boquillas tipo 2 y 3. cuadrático x lineal y cuadrático x cuadrático.. ABC2 YABC de la interacción ABC.. En la figura 9-4 se analizan gráficamente las interacciones de dos factores.... Se seleccionan tres boquillas. X. Las interacciones de dos factores pueden descomponerse en efectos lineal x lineal... Además.... y la presión baja (10 psi) o bien alta (20 psi) parecen ser las más efectivas para reducir la pérdida de jarabe. Se observa que la velocidad de llenado y la presión de operación son estadísticamente significativas.... cada uno con un solo grado de libertad. EJEMPLO 9~ 1 . lineal x cuadrático. . Al igual que los componentes 1 y J. y cada componente tendría dos grados de libertad.. Sin embargo. . hay 113 3 -1 grados de libertad totales y 33 (11 -1) grados de libertad del error. a los que suele denominarse los componentes ¡:. También es posible hacer la partición de las interacciones de dos factores en sus componentes 1 y J. .v.. Es posible hacer la partición de la interacción de tres factoresABC en cuatro componentes ortogonales con dos grados de libertad. Las tres interacciones de dos factores también son significativas...... y y Z no tienen ninguna interpretación práctica. La vari.. Las 27 combinaciones de tratamientos tienen 26 grados de libertad... Se usa una máquina para llenar contenedores metálicos de 5 galones con jarabe para una bebida gaseosa... estos componentes no tienen significación física..... Se piensa que tres factores influyen en el espumeo: el diseño de la boquilla (A).. Las dos notaciones se usan indistintamente. Se trata de un diseño factorial 33. ....able de interés es la cantidad de jarabe perdida debido al espumeo. Como en el diseño 32.. ..9-1 DISEÑO FACTORIAL3k 367 9~ 1.. respectivamente. son útiles para construir diseños más complejos.. X. Thmbién se hace referencia a ellos como los componentes AB 2C2 . y se supusieron los siguientes niveles naturales para la presión y la velocidad: Nivel codificado -1 Velocidad (rpm) 100 120 140 Presión (psi) 10 15 20 O +1 En la tabla 9-3 se presentan estos modelos tanto en términos de estas variables codificadas como en términos de los niveles naturales de la velocidad y la presión. presión AB AC EC ABC Error Total Suma de cuadrados 993.36 Valor P 0. Las f3 de estos modelos se estimaron usando un programa de computadora de regresión lineal estándar. Por lo tanto.102.34 4.70) Tipo de boquilla (A) 1 2 Velocidad (en rpm) (E) 140 -40 15 80 54 31 36 100 17 24 55 120 -23 120 -65 -58 -55 -44 140 20 4 110 44 -20 -31 100 -39 -35 90 113 -30 -55 3 120 -55 -67 -28 -26 -61 -52 140 15 -30 110 135 54 4 Presión (en psi) (C) 10 15 20 100 -35 -25 110 75 4 5 120 -45 -60 -10 30 -40 -30 -64 -62 -5 ~:::: '~ . velocidad C. suponga que sólo hay tres diseños de la boquilla que son de interés. En este ejemplo. La velocidad de llenado y la presión de operación son factores cuantitativos.50 1.595.0.213. El ejemplo 9-1 ilustra una situación en la que el diseño de tres niveles suele encontrar cierta aplicación.17 71.77 61. como se estudió anteriormente..2737 .50 174.58 578.0001 <0.60 426. ! ·. n· " I 368 Tabla 9-1 CAPÍTULO 9 DISEÑOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES Datos de la pérdida de jarabe del ejemplo 9-1 (las unidades son centímetros cúbicos ..628.190.300. Se trata evidentemente.17 34.89 30. En la tabla 9-3 se muestran estos modelos de regresión cuadráticos. velocidad y presión. con cada nivel del factor boquilla.76 11.575.0025 0.. de un factor cualitativo que requiere tres niveles. las variables Xl YX2 están codificadas en los niveles -1. y los demás factores son cuantitativos.) En estos modelos.f' '.33 69. Tabla 9-2 Análisis de varianza de los datos de la pérdida de jarabe Fuente de variación A.0001 0. (En el capítulo 10 se analizará con mayor detalle la regresión de mínimos cuadrados.67 1.74 81.22 1.878.90 7.69 4.33 6. asumiendo desde luego tres niveles.0222 0.83 Grados de libertad 2 2 2 4 4 4 8 27 53 Cuadrado medio 496.47 3.0383 0. uno o más de los factores es cualitativo.515.552.53 1.01 3.90 12. entonces.854.···:·· 1 . + 1. boquilla E.3256 <0. podría ajustarse un modelo cuadrático como el de la ecuación 9-1 en los dos factores.513. i: • ' •.105.40 7. 18958S 2 -3.8733p2+ O.1 + 20.' .8x¡2 .O.56.- 2 3 Tipo de boquilla b) (Al 600 e = 15 400 O CQ '"C x 200 en ro .12917S 2 -2.02875SP y = 25.1-40..' ..475S+ 66.1-9.22.7x¡x 2 y =180.r I 9-1 DISEÑO FACTORIAL3" 369 400 O 400 ~C=15 ~ i(J 200 ~B=140 B = 100 x ~ '"C 200 íi .058S+ 102.' .8x~ + 2.sx¡x2 y = 194Q.48P+ Q.7967p 2+ 0.1 + 3.9x¡x2 y = 1217. Tabla 9-3 Modelos de regresión para el ejemplo 9-1 X¡ Tipo de boquilla = velocidad (S)...6 .1x¡2 ..017P+ O.75P+ Q...2767p 2 -O..5x¡ + 16..9x 2+ 75.L---- -400 ' . C=20 ~ -400 I-..0075SP y = 15.105SP ...8x¡ -12.3x2+ 51.100 120 140 Velocidad en rpm (B) el Figura 9-4 Interacciones de dos factores del ejemplo 9-1.256S+ 86.9x~ + 10.' : .3 -31.rg "C "C en ro O -¡¡¡ ~ " en " -200 ~8_12C al ! ~-200 ~C=10 O '" Qi A...3x¡ + 5.3x2+ 14.' : ..l:---:--...7x¡2 -71.rg '"C Qi u C=20 o C= 10 " ¡jJ -200 ~ -400 ' .035S 2 -2.94.9x~ .' ...x 2 = Presión (P) en unidades codificadas 1 2 3 y = 22. Cuando se construyen gráficas de contorno para un experimento que tiene una mezcla de factores cuantitativos y cualitativos. 10 15 20 100 120 140 100 120 140 100 120 140 1 -60 -105 -25 185 20 134 9 -70 67 2 3 41 -74 -123 -122 24 -15 175 203 -99 -54 154 245 -28 -85 -126 -113 -51 58 J -198 -106 -155 331 255 377 -59 -74 -206 -222 -79 -158 238 440 285 -144 -40 -155 Después. Estos cálculos se presentan a continuación: . no es raro encontrar que las formas de las superficies de respuesta de los factores cuantitativos son muy diferentes en cada nivel de los factores cualitativos. los totales I(AB) y J(AB) se arreglan en una tabla de dos vías con el factor C. y se calculan los totales de las diagonales I y J de esta nueva disposición: Thtales Totales e 10 15 20 -198 331 -59 I(AE) I J e 10 15 20 -222 238 -144 J(AE) I J -106 255 -74 -155 377 -206 -149 212 102 41 19 105 -79 440 -40 -158 285 -155 63 62 40 138 4 23 Los totales de las diagonales I y J calculados arriba son en realidad los totales que representan las cantidades I[I(AB) X C] = AB2C2 .r 370 CAPÍTULO 9 DISEÑOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NNELES !e " . . El procedimiento general ha sido descrito por Cochran y Cox [26] y Davies [36].' En la figura 9-5 se muestran las gráficas de contorno de las superficies de respuesta de la pérdida de jarabe constánte.. implica que las condiciones de operación óptimas (y otras conclusiones importantes) en términos de los factores cuantitativos son muy diferentes en cada nivel de los factores cualitativos. 1[I(AB) X C] = AB2C. ya que los contornos observados más pequeños (-60) sólo aparecen en esta gráfica. Las sumas de cuadrados se encuentran de la manera usual. I[J(AB) x C] = ABC2 y 1[J(AB) x C] = ABC. Esto puede observarse en cierta medida en la figura 9-5. por ejemplo AB. o los componentes U{ X. donde la forma de la superficie para la boquilla tipo 2 es considerablemente alargada en comparación con las superficies de las boquillas tipo 1 y 3. y se calculan los totales I y J de la interacciónAB en cada nivel del tercer factor C. es decir. como una función de la velocidad y la presión para cada tipo de boquilla.. Puesto que el objetivo es minimizar la pérdida de jarabe.' .' A Totales I e B .. Es sencillo mostrar la partición numérica de la interacciónABC en sus cuatro componentes ortogonales con dos grados de libertad utilizando los datos del ejemplo 9-1. se preferiría la boquilla tipo 3. Estas gráficas revelan información de considerable utilidad acerca del desempeño de este sistema de llenado. Deberán usarse la velocidad de llenado cerca del nivel intermedio de 120 rpm y el nivel de presión ya sea bajo o alto. Cuando esto ocurre. Yy Z deABC. Primero se seleccionan dos cualesquiera de los tres factores. 0 Velocidad b) Boquilla tipo 2 126.7 al Boquilla tipo 1 -40.00 0.7 133.33 16.000 oQ c: 'iñ a.70) como una función de la velocidad y la presión para las boquillas tipo 1.0 '0 c: 'iñ a. e: 20.3 1120.00 -20. Figura 9-5 .7 113. 2 Y3.00 100.67 10..9-1 DISEÑO FACTORIAL3k 20.000 -20.3 140.00 0.33 11. ejemplo 9-1.0 ¡1: 106.00 106..00 18.67 '0 371 c: 'iñ al 15. e: Contornos de la pérdida de jarabe constante (unidades: cc .00 13. AB2C2D. . por lo que 0120 representa una combinación de tratamientos en un diseño 34 conA y D en los niveles bajos. cualquier interacción de h factores tiene 2/z-1componentes ortogonales con dos grados de libertad.1.) interacciones de dos factores. Si se hacen n réplicas.77 = (63)2 +(62)2 +(40)2 18 J[J(AB)xC]= ABC= Z(ABC) (138)2 +(4)2 +(23)2 18 = 584. Estas combinaciones de tratamientos permiten determinar las sumas de cuadrados de k efectos principales.4 El diseño general 3 k . . entonces la expresión completa debe elevarse al cuadrado y los exponentes deben reducirse al módulo 3. considere Estos componentes de la interacción no tienen ninguna interpretación física. etcétera. El tamaño del diseño se incrementa rápidamente con k. ABC2D 2 . AB 2CD.1 grados de libertad totales y 3k (n ..1 grados de libertad entre ellas. En secciones subsecuentes se analiza la necesidad ocasional de calcular uno o más de estos componentes. 9. un diseño 33 tiene 27 combinaciones de tratamientos por réplica.372 CAPÍTULO 9 DISEÑOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NNELES I[I(AB)xC]= AB 2 C 2 = W(ABC) (165)2 54 _ (-149)2 +(212)2 +(102)2 18 J[I(AB)xC]= AB 2 C= X(ABC) (41)2 +(19)2 +(105)2 18 2 I[J(AB)xC]= ABC = Y(ABC) = 3804. pero son útiles para construir diseños más complejos. y una interacción de k factores con 2k grados de libertad. i:J Los conceptos utilizados en los diseños 32 y 33 pueden extenderse de inmediato al caso de k factores. con 3k . De manera típica. cada una con cuatro grados de libertad. 77 = 18. cada uno con tres niveles. B en el nivel intermedio y C en el nivel alto. es decir. 7" ¡".11 (165/ 54 (165)2 54 (165)2 54 = 221.. (. un diseño 34 tiene 81.. la interacción de cuatro factores ABCD tiene 24-1 = 8 componentes ortogonales con dos grados de libertad. Si el exponente de la primera letra no es 1. Por lo tanto.. un diseño 35 tiene 243.ii ''''1 •. a un diseño factoria13 k • Se emplea la notación digital usual para las combinaciones de tratamientos. Como una ilustración.. Por ejemplo. En general.. AB2CD 2 y AB 2C2D 2 • Al escribirse estos componentes.1) grados de libertad del error. si las interacciones de tres I . Hay 3k combinaciones de tratamientos. ABCD. observe que el único exponente permitido en la primera letra es 1. hay n3 k . Las sumas de cuadrados de los efectos y las interacciones se calculan con los métodos usuales para los diseños factoriales.. una interacción de h factores tiene 2/z grados de libertad. Para ilustrar lo anterior. Por ejemplo.11 Aun cuando se trata de una partición ortogonal de SSABC' se señala de nuevo que no se acostumbra presentarla en la tabla del análisis de varianza. denotados por ABCD2 . con frecuencia sólo se considera una sola réplica del diseño 3\ y las interacciones de órdenes superiores se combinan para proporcionar una estimación del error. no se hace ninguna descomposición adicional de las interacciones de tres factores y de órdenes superiores. ABCD.. cada uno con dos grados de libertad. Sin embargo. por consiguiente. AB 2C y AB 2C2 ). es conveniente confundir un componente de interacción con los bloques. El procedimiento general consiste en construir una definición de contrastes . Por lo tanto. suponga que quiere construirse un diseño factorial 32 en tres bloques. AB y AB2 ). 1 (nivel intermedio) o 2 (nivel alto). Por lo tanto. El diseño 3k puede confundirse en Y' bloques incompletos. son de escasa utilidad. donde p < k. puede confundirse con los bloques. Estos tres bloques tienen dos grados de libertad entre ellos.. cada interacción de tres factores tiene ocho grados de libertad y puede descomponerse en cuatro componentes de la interacción (por ejemplo. cada uno con dos grados de libertad. Por lo tanto. cada interacción de dos factores tiene cuatro grados de libertad y puede descomponerse en dos componentes de la interacción (por ejemplo. Cualquiera de los componentes de la interacciónAB. se obtiene la definición de contrastes 11 j' El valor de L (mod 3) de cada combinación de tratamientos puede encontrarse de la siguiente manera: 00: 01: 02: 10: L=1(0)+2(0)=0=0(mod3) 11: L= 1(1)+2(1)= 3= O(mod 3) L=1(0)+2(1)=2=2(mod3) 21: L=1(2)+2(1)=4=1(mod3) L= 1(0)+2(2)= 4= 1 (mod 3) 12: L= 1(1)+2(2)= 5= 2(mod 3) L=1(1)+2(0)=1=1(mod3) 22: L=1(2)+2(2)=6=0(mod3) 20: L= 1(2)+2(0)= 2= 2(mod 3) En la figura 9-6 se muestran los bloques.AB oAB2 . Para la serie 3k se tiene a¡ = O. Recuerde que en la serie factorial 3k cada efecto principal tiene dos grados de libertad. tres bloques están definidos de manera única.. 9-2. Las combinaciones de tratamientos del diseño 3k se asignan a los bloques con base en el valor de L (mod 3). ABC. estos diseños pueden confundirse en tres bloques. etcétera. .¡I¡ .l' ~I ~ (9-2) donde a¡ representa el exponente del factor i-ésimo en el efecto que va a confundirse y X¡ es el nivel del factor i-ésimo en una combinación de tratamientos particular.1 El diseño factorial3 k en tres bloques Suponga que se quiere confundir el diseño 3k en tres bloques incompletos. 1 o 2. Este bloque incluirá siempre la combinación de tratamientos 00 . Además. Al elegir arbitrariamente AB 2. con frecuencia es necesario hacer la confusión (o mezclado) en bloques. Por ejemplo. Las combinaciones de tratamientos que satisfacen L = O(mod 3) constituyen el bloque principal. cada uno con dos grados de libertad. 9-2 CONFUSIÓN EN EL DISEÑO FACTORIAL 3 k Incluso cuando se considera una sola réplica del diseño 3\ ésta requiere tantas corridas que es improbable que puedan hacerse las 3k corridas bajo condiciones uniformes.0. nueve bloques. Estos diseños siguen siendo grandes para k ~ 3 y. por lo tanto. Puesto que L (mod 3) sólo puede asumir los valores O. ABC2. y así sucesivamente. 1 o 2. debe haber dos grados de libertad confundidos con los bloques. y x¡ = O(nivel bajo). donde la primera a¡ diferente de cero es la unidad.FI 1 9-2 CONFUSIÓN EN EL DISEÑO FACTORIAL 3" 373 factores Yde órdenes superiores son insignificantes. entonces una sola réplica del diseño 33 proporciona 8 grados de libertad del error. y una sola réplica del diseño 34 proporciona 48 grados de libertad del error. . '.•. al utilizar 01. cualquier elemento del nuevo bloque con los elementos del bloque principal......22.. Bloque 1 00= 4 Bloque 2 10=-2 Bloque 3 01 = 5 11 =-4 22 = O Totales de los bloques = O 21 = 1 02 = 8 7 12 =-5 20= O O Al aplicar los métodos convencionales para el análisis de factoriales.. se encuentra que SSA == 131.... Por lo tanto.... 1" I....... .. los cuales provienen de la réplica única del diseño 32 que se muestra en la figura 9-6.56 Y SSB == 0............¡.....• El análisis estadístico del diseño 32 confundido en tres bloques se ilustra empleando los datos siguientes.. ro 01 11 21 • = Bloque 1 O = Bloque 2 O () = Bloque 3 00 10 20 O Factor A b) Vista geométrica Figura 9-6 fundida. Las combinaciones de tratamientos de los otros dos bloques pueden generarse sumando. ... Con referencia a la figura 9-6.. El diseño 32 en tres bloques conAB2 con- .374 CAPÍTULO 9 Bloque 1 DISEÑOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES Bloque 3 Bloque 2 888 ~ L:J L:J 12 22 a) Asignación de las combinaciones de tratamiento a los bloques 2 02 ex:¡ B 1 u Ll... se encuentra 01 + 00 == 01 01 + 11 == 12 Y 01 + 22 == 20 EJEMPLO 9~2 ........ para el bloque 2 se usa 10 para obtener 10+00==10 10+11==21 Y 10+22==02 Para generar el bloque 3.." :J Los elementos del bloque principal forman un grupo con respecto a la adición módulo 3.. en módulo 3.. se observa que 11 + 11 == 22 Y11 + 22 == OO.•....•. 56 0. no puede hacerse una prueba formal.89 131.56 Se encuentra también que ss = (0)2 +(7)2 +(0)2 _ (7)2 = 10. La definición de contrastes es Es sencillo verificar que las combinaciones de tratamientos 000.2. Se considera ahora un diseño un poco más complicado.Ji 11 11 1 -4 1 Recuerde. 012 Y101 se encuentran en el bloque principal. SSBloques es exactamente igual al componenteAB 2 de la interacción.9-2 CONFUSIÓN EN EL DISEÑO FACTORIAL 3" 375 Tabla 9-4 Análisis de varianza de los datos del ejemplo 9-2 Fuente de Suma de Grados de variación cuadrados libertad Bloques (AE") A B AE Total 10. El componenteAB 2C2 de la interacción de tres factores se confundirá con los bloques. Para ver esto.22 2. Puesto que hay una sola réplica. las observaciones se escriben de la siguiente manera: Factor B Factor A O 1 2 O 4 -2 O 2 1 5 2 8 -5 O . por la sección 9-1. No es una buena idea utilizar el componenteAB de la interacción como una estimación del error.89 2 2 2 2 8 145. un diseño factorial 33 confundido en tres bloques con nueve corridas cada uno. El análisis de varianza se presenta en la tabla 9-4. valor que es idéntico a SSBloques.89 Bloques 3 9 Sin embargo. que el componente! oAB de la interacciónAB puede encontrarse calculando la suma de cuadrados entre los totales de la diagonal de izquierda a derecha de la representación anterior. Se obtiene así SS AB 2 = (0)2 +(0)2 +(7)2 3 (7)2 9 = 10 89 . Las corridas restantes del bloque principal se generan de la siguiente manera: (1) 000 (4) 101 + 101 = 202 (2)012 (5) 012 + 012 = 021 (3) 101 (6) 101+012= 110 (7) 101 + 021 = 122 (8) 012+202= 211 (9) 021+202= 220 . se obtiene (1) 100+000= 100 (2) 100+012= 112 (3) 100+101 = 201 Los bloques se ilustran en la figura 9-7.r. . " 000 012 101 202 021 110 122 211 220 200 212 001 102 221 010 022 111 120 100 112 201 002 121 210 222 011 020 a) Asignación de las combinaciones de tratamientos a los bloques . ~ ca 0111 1 201 «0'"... Bloque 2 CJ..-o O O ~í'> 020 1 ..) ~ 221 u. Por lo tanto. Al usar 100 como arriba. Bloque 1 o.376 CAPÍTULO 9 DISEÑOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES Para encontrar las corridas de otro bloque se observa que la combinación de tratamientos 200 no está en el bloque principal. Bloque 3 022 CJ112 002 122 222 2 C.. . ri . los elementos del bloque 2 son (1) 200+000= 200 (2) 200+012= 212 (3) 200+ 101 = 001 (4) 200+202= 102 (5) 200+021 = 221 (6) 200+110= 010 (7) 200+ 122 = 022 (8) 200+211 = 111 (9) 200+220= 120 Observe que todas estas corridas satisfacenL = 2 (mod 3).110 000 O 220 100 1 Factor A b) 200 Vista geométrica Figura 9·7 El diseño 33 en tres bloques con AB'C' confundida. . El último bloque se encuentra observando que 100 no pertenece al bloque 1 ni al bloque 2. Bloque 1 Bloque 2 Bloque 3 (4) 100+202=002 (5) 100+021 = 121 (6) 100+110= 210 (7) 100+122= 222 (8) 100+211 = 011 (9) 100+ 220 = 020 I¡: ". Las definiciones de contrastes de la ecuación 9-3 implican nueve ecuaciones simultáneas especificadas por el par de valores paraL 1 y L z. 2 +f3kxk = h (mod 3) h= 0. El bloque principal consta de las combinaciones de tratamientos que satisfacenL 1 = L z = (mod 3). por lo tanto. con la convención de que las primeras a¡ y f3j diferentes de cero son la unidad. En general.2 (9-3) donde {a¡} y {f3j} son los exponentes de la primera y la segunda interacciones generalizadas. Los elementos de este bloque forman un grupo con respecto a la adición módulo 3. como resultado. ocho grados de libertad se confundirán con los bloques. Los dos componentes de interacción elegidos inicialmente producen dos definiciones de contrastes L¡ = a1x1+azx z + L z = f3 1X 1+f3 zx z + +akxk = u (mod 3) u= 0. Py Q) se definen como PQ y PQz (o pZQ). En el sistema 3\ las interacciones generalizadas de dos efectos (es decir.L z) se asignan al mismo bloque. La suma de cuadrados de esos tres componentes podría obtenerse por sustracción. Por lo tanto. Para construir estos diseños se eligen dos componentes de interacción y. Los demás componentes de esta interacción que no están confundidos pueden obtenerse calculando la interacción de k factores de la manera usual y restando de esta cantidad la suma de cuadrados de los bloques. Las combinaciones de tratamientos que tienen el mismo par de valores para (L1. para el diseño 3k en tres bloques se seleccionaría siempre un componente de la interacción de orden más alto para confundirlo con los bloques. ABzC y ABCz) se combinan como una estimación del error. dos más se confundirán automáticamente.1 puede usarse para generar los bloques. Estos dos son las interacciones generalizadas de los dos efectos elegidos originalmente.1. el esquema presentado en la sección 9-2. 9~2.2 El diseño factorial3 k en nueve bloques. Los componentes restantes de la interacción de tres factores (ABC.9-2 CONFUSIÓN EN EL DISEÑO FACTORIAL3k 377 l' 1 Tabla 9-5 Análisis de varianza de un diseño 33 con AB 2C 2 confundida Fuente de variación Bloques (AB2C2) A B C AB Grados de libertad 2 2 2 2 4 4 4 6 AC BC Error (ABC Total + AB2C +ABC2) 26 En la tabla 9-5 se presenta el análisis de varianza de este diseño. Al utilizar este esquema de confusión (o mezclado). respectivamente. se cuenta con información acerca de todos los efectos principales y las interacciones de dos factores. produciendo los ocho grados de libertad requeridos. 1. En algunas situaciones experimentales puede ser necesario confundir el diseño 3k en nueve bloques. ° . 1) Bloque 3 2000 2122 2211 0021 0110 0202 1012 1101 1220 (2. Los demás componentes de estas interacciones que no están confundidos pueden determinarse restando la suma de cuadrados del componente confundido de la suma de cuadrados de la interacción completa. Suponga que se elige confundir ABC y AB2 D 2.0) Bloque2 0001 0120 0212 1022 1111 1200 2010 2012 2221 (0. Suponga que se eligenABC2DG. Las definiciones de contrastes de ABC y AB 2 Ll = Xl +X 2 +X 3 L 2 = Xl +2x 2 +2x 4 (9-4) Los nueve bloques pueden construirse utilizando las definiciones de contrastes (ecuación 9-4) Yla propiedad de la teoría de grupos del bloque principal.3 El diseño factorial3 k en 3p bloques El diseño factorial 3k puede confundirse en Y' bloques con 3k. AB2D2. Para el diseño 3k en nueve bloques habrá cuatro componentes de interacción confundidos. Como una ilustración. . A partir de estos efectos pue- Bloque 1 0000 0122 0211 1021 1110 1202 2012 2101 2220 (L" L z) = (0. BCE 2F 2G y BDEFG.0) Bloque 9 0002 0121 0210 1020 1112 1201 2011 2100 2222 (0.2) Figura 9-8 El diseño 34 en nueve bloques con ABC. Sus interacciones generalizadas 2 (ABC)(AB 2D 2 ) = A 2B 3 CD 2 = (A 2B 3 CD 2 )2 = AC D (ABC)(AB 2D 2 )2 =A 3 B 5 CD 4 =B 2CD=(B 2CD)2 =BC 2D 2 D 2 son también están confundidas con los bloques. 9~2.p observaciones cada uno.2(3) -1]/2 = 10.1)/2 efectos se confunden de manera automática. donde p < k. El método descrito en la sección 9-1. considere un diseño 37 que va a confundirse en 27 bloques. El procedimiento consiste en seleccionar p efectos independientes que habrán de confundirse con los bloques. AC2D y BC2D2 confundidas.1) Bloque 8 0100 0222 0011 1121 1210 1002 2112 2201 2020 (1.2p .2) Bloque 7 1000 1122 1211 2021 2110 2202 0012 0101 0220 (1. Como resultado.1) Bloque 6 0010 0102 0221 1001 1120 1212 2022 2111 2200 (1. se seleccionarían tres componentes de interacción independientes y se confundirían automáticamente otros [3 3 . Estos efectos son las interacciones generalizadas de los efectos elegidos originalmente.378 CAPÍTULO 9 DISEÑOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES_ Como un ejemplo. Puesto que p = 3.3 puede ser útil para calcular los componentes de interacción. considere el diseño factorial 34 confundido en nueve bloques con nueve corridas cada uno. exactamente otros (Y' .0) Bloque 5 0020 0112 0201 1011 1100 1222 2002 2121 2210 (2.2) Bloque 4 0200 0022 0111 0221 1010 1102 2212 2001 2120 (2. El diseño se muestra en la figura 9-8. . entonces al = AB a ca. las réplicas fraccionadas de estos diseños son de interés.9-3 RÉPLICAS FRACCIONADAS DEL DISEÑO FACTORIAL 3k 379 den construirse tres definiciones de contrastes. Cada uno de los tres bloques resultantes es un diseño fraccionado 3k .1 tiene dos alias. Por consiguiente. como se verá más adelante. se hace referencia a él como el diseño factorial fraccionado 3k. '" Kak se le llama la relación de definición del diseño factorial fraccionado. Si AB a Ca. los cuales pueden encontrarse multiplicando el efecto tanto por 1 como por P módulo 3. Suponga que se selecciona el componente deAB 2C2 • Cada fracción del diseño 33.1 y puede seleccionarse cualquiera de los bloques para usarlo.1 corridas.ABC2oAB2C2 • Por los componentes de la interacciónABC para construir el diseño. 9-3. hay en realidad 12 fracciones un tercio diferentes del diseño 3 definidas por 2 2 Xl +a 2 x 2 +a 3 x 3 = u (mod 3) donde a = 10 2 y u = O.1• Para construir un diseño factorial fraccionado 3k..AB 2 3 lo tanto. 9-3 RÉPLICAS FRACCIONADAS DEL DISEÑO FACTORIAL 3k El concepto de réplica fraccionada puede extenderse a los diseños factoriales 3k • Debido a que una réplica completa del diseño 3k puede requerir un número bastante grande de corridas incluso para valores moderados de k.1 se selecciona un componente de interacción con dos grados de libertad (generalmente. Cada efecto principal o componente de interacción estimado a partir del diseño 3k . la interacción de orden más alto) y se hace la partición del diseño 3k completo en tres bloques. Los otros 10 efectos confundidos con los bloques son (ABC 2DG)(BCE 2F 2G)= AB 2DE 2F 2G 2 (ABC 2DG)(BCE 2F 2G)2 = AB 3 C 4 DE 4 F 4 G 3 = ACDEF (ABC 2DG)(BDEFG) = AB 2C 2D 2EFG 2 (ABC 2DG)(BDEFG) 2 = AB 3 C 2D 3 E 2F 2G 3 = Ac 2E 2F 2 (BCE 2F 2G)(BDEFG) = B 2CDE 3 F 3 G 2 = BC 2D 2G (BCE 2F 2G)(BDEFG)2 = B 3 CD 2E 4 F 4 G 3 = CD 2EF (ABC 2DG)(BCE 2F 2G)(BDEFG) = AB 3 C 3 D 2E 3 F 3 G 3 = AD 2 (ABC 2DG)2(BCE 2F 2 G)(BDEFG) = A 2B 4 C 5 D 3 G 4 = AB 2CG 2 (ABC 2DG)(BCE 2 F 2G)2(BDEFG) = ABCD 2E 2F 2G (ABC 2DG)(BCE 2F 2G)(BDEFG)2 = ABC 3 D 3 E 4 F 4 G 4 = ABEFG Se trata de un diseño enorme que requiere 37 = 2187 observaciones dispuestas en 27 bloques con 81 observaciones cada uno. es decir.1 resultante contendrá exactamente 32 = 9 combinaciones de tratamientos que deben satisfacer .ABC. algunos de estos diseños tienen estructuras de alias complicadas. Como un ejemplo. considere una fracción un tercio del diseño 33 • Puede seleccionarse cualquiera de C. 10 2. Sin embargo.. Kak es el componente de interacción utilizado para definir los bloques.1 La fracción un tercio del diseño factoria13 k La fracción más grande del diseño 3k es la fracción un tercio que contiene 3k. y los 27 bloques pueden generarse con los métodos descritos anteriormente. Cada efecto principal es alias de un componente de interacción. la estructura de los alias resultante es A=A(AB2C2)=A2B2C2 =ABC A=A(AB 2C 2 )2 =A 3 B 4 C 4 =BC B= B(AB 2C 2 )= AB 3 C 2 = AC 2 B=B(AB 2C 2 )2 =A 2B 5 C 4 =ABC 2 C=C(AB 2C 2 )=AB 2 C 3 =AB 2 C=C(AB 2 C 2 )2 =A 2 B 4 C 5 =AB 2C AB= AB(AB 2 C 2 )= A 2B 3 C 2 = AC AB= AB(AB 2C 2 )2 = A 3 B 5 C 4 = BC 2 Por consiguiente. por ejemplo.380 CAPÍTULO 9 DISEÑOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES donde u = 0. a menos que se suponga que todas las interacciones son insignificantes. Si se corre cualquiera de los diseños 33.1 de la figura 9-9. Si. B + AC2 + ABC2. C + AB2 + AB2C y AB + AC + BC2 • Este diseño sólo tendría valor práctico si todas las interacciones fueran pequeñas en comparación con los efectos principales. esto distorsionará potencialmente la estimación del efecto principal de A y hará que sea muy complicada la interpretación del efecto deAB + AC + BC2 • Es muy dificil ver cómo este diseño podría ser de utilidad. Es sencillo verificar que las tres fracciones un tercio son las que se muestran en la figura 9-9. 1 o 2.--- )--- u=o '" '" '" u=1 '" e' '" u=2 b) Vista geométrica Figura 9-9 Las tres fracciones un tercio del diseño 33 con la relación de definición 1 = AB 2 C2 • . la interacción de dos factores BC es grande. Puesto que los efectos principales son alias de las interacciones de dos factores. los cuatro efectos que en realidad se estiman a partir de los ocho grados de libertad del diseño sanA + BC + ABC. ". Observe lo complejas que son las relaciones de los alias en este diseño. Diseño 1 Diseño 1 Diseño 1 u=o 000 012 101 202 021 110 122 211 u=1 100 112 201 002 121 210 222 011 020 u=2 200 212 001 102 221 010 022 111 220 120 al Combinaciones de tratamientos e ~A )---- '" '" '" . se trata de un diseño de resolución lII. Kak pueden construirse utilizando un método similar al que se empleó en la serie 2k. entonces el diseño puede escribirse como 000 202 012 211 021 220 101 110 122 que es un cuadrado latino 3 x 3. la ecuación 9-5 queda como (9-6) Los niveles del cuarto factor satisfacen la ecuación 9-6. uno como consecuencia de la réplica fraccionada y el otro de las restricciones sobre la aleatorización. si se hace queA denote el renglón y B la columna. Éste es el diseño básico en la terminología del capítulo 8. Por la tabla 4-13 se observa que sólo hay 3 x 3 cuadrados latinos y .1 con I=AB 2CD 0000 0101 1100 1002 0202 1201 2001 2102 2200 0012 0110 0211 1011 1112 1210 2010 2111 2212 2221 0021 0122 0220 1020 1121 1222 2022 2120 .1 . se tiene 2(0) + 1(0) + 2(0) = 0. mediante la relación (9-5) donde/3¡ = (3-ak)a¡ (mod 3) para 1:5 i :5 k-l. 2. Esto implica que /31 = (3 -1 )a1 (mod 3) = (3 -1)(1) = 2. Después se introduce el factor k-ésimo igualando sus Xk niveles con el componente apropiado de la interacción de orden más alto.ir 1\ l' 9-3 RÉPLICAS FRACCIONADAS DEL DISEÑO FACTORIAL 3k 381 Antes de dejar el diseño 3~1. Es sencillo verificar que los tres primeros dígitos de cada combinación de tratamientos de esta tabla son las 27 corridas de un diseño 33completo. ···(K./32 = (3-1)a 2 (mod3) = (3 -1)(2) = 4 = 1 (mod3) Y/33 = (3 -1)a 3 (mod3) = (3 -1)(1) = 2. que cada uno corresponde a uno de los doce diferentes diseños factoriales fraccionados 33-1.'.l tk . por ejemplo AB a2 Ca. 2(1) + 1(1) + 2(0) = 3 = O. 1. Las combinaciones de tratamientos en un diséño 3k . etcétera. El supuesto de las interacciones insignificantes requerido para la interpretación única del diseño 3t~1 tiene su paralelo en el diseño del cuadrado latino.:~ :J " Tabla 9-6 Un diseño 3. Por ejemplo. Los alias l . Como una ilustración.. Parlo tanto. Sin embargo.1 con la relación de definición 1 = AB a2 Ca.. . Se trata del diseño básico. los dos diseños surgen por motivos diferentes. Se obtiene así un diseño con la resolución más alta posible.1 corridas para un diseño factorial de tres niveles completo en k . El diseño 3~1 resultante tiene 26 grados de libertad que pueden usarse para calcular las sumas de cuadrados de los 13 efectos principales y los componentes de las interacciones (y sus alias)... observe que para el diseño con u = O(ver la figura 9-9).2(0) + 1(1) + 2(0) = 1.1 factores. se usa este método para generar el diseño 3~1 con la relación de definición 1 = AB2CD que se muestra en la tabla 9-6. ParaAB2CD se tiene al = a 3 = a 4 = 1 ya 2 = 2." 1 """ 1"' :.. con la notación común O.p • Primero se escriben las 3k . :) Para moderar los valores grandes de k. Cuando interprete los resultados. El alias de cualquier efecto principal o componente de interacción se obtiene con la multiplicación módulo 3 del efecto por I e P. Las corridas que definen un diseño factorial fraccionado 3k.382 CAPÍTULO 9 DISEÑOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES de cualquier efecto se encuentran de la manera usual. es decir. Puede verificarse que los cuatro efectos principales están separados de cualquier componente de interacciones de dos factores.1.2 Otros diseños factoriales fraccionados 3k-p j'!¡. es deseable un fraccionamiento todavía mayor del diseño 3k • En general. . pero que algunos componentes de interacciones de dos factores son alias entre sí. Las de definición de este diseño es I = AB C = BCD = AC2 nueve combinaciones de tratamientos del diseño se encuentran apuntando un diseño 32en los factores A y B.p • La relación de definiciónI de cualquier fracción consta de los p efectos elegidos inicialmente y sus (Y . El procedimiento se ilustrará construyendo un diseño 34-2. Entonces cada bloque es un diseño factorial fraccionado 3k.p • Por lo tanto. Una vez más se observa la complejidad de la estructura de los alias. Por lo tanto. probablemente será muy difícil aislarla con este diseño. por ejemplo.2 es una fracción un noveno.p corridas. Y agregando después dos nuevos factores haciendo X3 X4 = 2x¡ +X 2 = 2x 2 +2x 3 Tabla 9-7 Un diseño 3ri~2 con 1 =AB 2C e 1 =BCD 0000 1021 2012 0111 1102 2120 0222 1210 2201 . Yel diseño es de resolución lII. Si cualquiera de las interacciones de dos factores es grande.3 es una fracción un veintisieteavo. El análisis estadístico de un diseño 3k-¡ se lleva a cabo con los procedimientos usuales del análisis de varianza para experimentos factoriales. 9~3.p también pueden generarse anotando primero las combinaciones de tratamientos de un diseño factorial3 k-p completo e introduciendo después los p factores adicionales igualándolos con los componentes de las interacciones. Las sumas de cuadrados de los componentes de interacciones pueden calcularse como en la sección 9-1.2p . como se hizo en la sección 9-3. donde la fracción contiene 3k. un diseño 3k. puede construirse una fracción (ir del diseño 3k parap < k.1)/2 interacciones generalizadas. un diseño 3k. A este diseño se le llama el diseño factorial fraccionado 3k . recuerde que los componentes de las interacciones no tienen ninguna interpretación práctica. los alias de A son A (AB 2CD) == ABC2 D 2y A(AB 2CD)2 = BC2 D 2.:. la relación teracciones generalizadas son (AB 2C)(BCD) = AC2 2 D = ABD2. Sus inD y (AB 2C)(BCD)2 = ABD2. una fracción un noveno del diseño 34• SeanAB 2C y BCD los dos componentes de interacciones elegidos para construir el diseño. El procedimiento para construir un diseño factorial fraccionado 3k-p consiste en seleccionar p componentes de interacciones y usar estos efectos para hacer la partición de las 3k combinaciones de tratamientos en Y bloques. etcétera. y el factor cualitativo tiene (por ejemplo) tres niveles. En la tabla 9-8 se presenta la estructura de los alias completa del diseño.AC2D. 9. no son. El uso del diseño 3k suele sugerirse cuando hay curvatura presente. por ejemplo k ~ 4 o 5. si k es moderadamente grande. si no imposible. Esto. Este escrito se elaboró para la National Bureau of Standards y es la tabla más completa disponible de los planes 3k. Además. Además. no hay esquemas de aumento simples (como el doblez) que puedan usarse para combinar dos o más fracciones a fin de aislar las interacciones significativas. Los alias de cualquier efecto pueden encontrarse multiplicando el efecto módulo 3 por AB 2C.p • En esta sección se ha hecho notar en varias ocasiones la complejidad de las relaciones de los alias de los diseños factoriales fraccionados 3k. Sin embargo. siA denota los renglones y B las columnas. detección de defectos y mejoramiento.p son soluciones que causan problemas. existen situaciones en las que es necesario incluir un fac~ tor (o algunos factores) que tiene más de dos niveles. y la mayoría de las fracciones pequeñas tienen relaciones de alias complejas que requerirían supuestos muy restrictivos respecto de las interacciones para ser útiles. BCD. El sistema de tres niveles presentado en este capítulo es de utilidad mucho menor debido a que los diseños son relativamente grandes incluso para un número modesto de factores. a su vez. estos diseños tienen relaciones de alias que incluyen alias parciales de componentes de interacciones con dos grados de libertad. Este diseño tiene ocho grados de libertad que pueden usarse para estimar cuatro efectos principales y sus alias. Sin embargo. ABC 2 Efecto ! ABCD ACD 2 2 1. Esto suele ocurrir cuando hay factores tanto cuantitativos como cualitativos en el experimento. 7 y 8 es de particular utilidad.p • En general.4 DISEÑOS FACTORIALES CON NIVELES MIXTOS i 1: Se han resaltado los diseños factoriales y factoriales fraccionados en los que todos los factores tienen el mismo número de niveles. se puede concluir que los diseños factoriales fraccionados 3k. El diseño completo se muestra en la tabla 9-7.1 I1 ii¡ I1 11 :I . hay alternativas más eficientgs (ver el capítulo 11). si las interacciones no son insignificantes. I l' 11 Ii 11 I[ . El escrito de Connory Zelen [28] contiene una extensa selección de diseños para 4:5 k :5 10.ABD 2 y sus cuadrados. el tamaño del diseño 3k llevará a muchos experimentadores a considerar fracciones bastante pequeñas. Por la estructura de los alias se observa que este diseño sólo es útil en ausencia de interacciones. Por estas razones. en general. Estamos convencidos de que los diseños factoriales y factoriales fraccionados de dos niveles deberán ser la piedra angular de la experimentación industrial para el desarrollo de productos y procesos.9-4 DISEÑOS FACTORIALES CON NNELES MIXTOS 383 Tabla 9-8 Estructura de los alias del diseño 3~~2 de la tabla 9-7 Alias . buenos diseños. Desafortunadamente. 1: 11 I . El sistema con dos niveles revisado en los capítulos 6. resulta en un diseño cuya interpretación será difícil.2 AB D ABCD AB 2 2 A B BC AB 2 AB C D CD BD BC 2 2 2 CD 2 AB 2C 2D ACD AC 2 BD 2 AD 2 ABC 2D 2 ABD AC AB C 2 BC 2 D 2 ABC 2 D AB 2 D 2 BC D 2 ABC 2 C D AD AC 2D 2 AB 2CD BCD 2 AB 2CD 2 Esto es equivalente a usar AB 2C y BCD para hacer la partición del diseño 34 completo en nueve bloques y luego seleccionar uno de estos bloques como la fracción deseada. entonces al examinar la tabla 9-7 se observa que el diseño 3~~2 también es un cuadrado grecolatino. 384 CAPÍTULO 9 DISEÑOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES Tabla 9-9 Uso de factores con dos niveles para formar un factor con tres niveles Factores con tres niveles Factores con dos niveles B C x + + + + Si todos los factores son cuantitativos, entonces deberán usarse diseños de dos niveles con puntos centrales. En esta sección se indica cómo pueden incorporarse factores con tres y cuatro niveles en un diseño 2k • 9~4.1 Factores con dos y tres niveles ~" '1 Los diseños en los que algunos factores tienen dos niveles y otros tres niveles pueden derivarse de la tabla de signos positivos y negativos del diseño 2k usual. El procedimiento general se ilustra mejor con un ejemplo. Suponga que se tienen dos variables, dondeA tiene dos niveles y X tres. Considere la tabla de signos positivos y negativos del diseño 23 usual con ocho corridas. Los signos de las columnas B y e tienen el patrón que se muestra en el lado izquierdo de la tabla 9-9. Sea que los niveles deX estén representados por Xl' X 2 Yx 3 · En el lado derecho de la tabla 9-9 se muestra cómo se combinan los patrones de los signos de 13 y e para formar los niveles del factor con tres niveles. Entonces el factor X tiene dos grados de libertad, y si el factor es cuantitativo, es posible hacer su partición en un componente lineal y uno cuadrático, con cada componente teniendo un grado de libertad. En la tabla 9-10 se muestra un diseño 23 con las columnas rotuladas para indicar los efectos reales que estiman, donde XL y X Q denotan los efectos lineal y cuadrático, respectivamente, deX. Observe que el efecto lineal deX es la suma de las estimaciones de los dos efectos calculadas a partir de las columnas asociadas generalmente conB y e, y que el efecto deA sólo puede calcularse a partir de las corridas donde X está en el nivel bajo o bien en el alto, es decir, las corridas 1, 2, 7 Y8. De manera similar, el efecto A x XL es la suma de los dos efectos que se habrían calculado a partir de las columnas rotuladas generalmente AB y Tabla 9-10 Un factor con dos niveles y un factor con tres niveles en un diseño 23 A Corrida XL XL A xXL AB A xXL AC XQ A xXQ ABC Combinaciones de tratalnientos reales A B C BC A Bajo Alto Bajo Alto Bajo Alto Bajo Alto X 1 2 3 4 5 6 7 8 + + + + + + + + + + + + + + + + + + + + + + + + + + + + Bajo Bajo Intermedio Intermedio Intermedio Intermedio Alto Alto 9-4 DISEÑOS FACTORIALES CON NIVELES MIXTOS 385 Tabla 9-11 Análisis de varianza del diseño de la tabla 9-10 Fuente de Suma de Grados de Cuadrado variación cuadrados libertad medio A X (XL +XQ) AX(A xXL +A xXQ) Error (a partir de las corridas 3 y 5 y de las corridas 4 y 6) Total SSA SSx SSAX SSE SST 1 2 2 2 MSA MSB MSAX MS E 7 AC. Además, observe que las corridas 3 y 5 son réplicas. Por 10 tanto, puede hacerse una estimación del error con un grado de libertad del error utilizando estas dos corridas. De manera similar, las corridas 4 y 6 son réplicas, y esto llevaría a una segunda estimación del error con un grado de libertad. La varianza promedio de estos dos pares de corridas podría usarse como cuadrado medio del error con dos grados de libertad. En la tabla 9-11 se resume el análisis de varianza completo. Si se está dispuesto a suponer que las interacciones de dos factores y de órdenes superiores son insignificantes, el diseño de la tabla 9-10 puede convertirse en una fracción de resolución III con hasta cuatro factores con dos niveles y un solo factor con tres niveles. Esto se conseguiría asociando los factores de dos niveles con las columnasA,AB,AC y ABe. La columnaBC no puede usarse para un factor de dos niveles porque contiene el efecto cuadrático del factor X de tres niveles. Puede aplicarse el mismo procedimiento en los diseños 2k de 16, 32 Y64 corridas. Para 16 corridas es posible construir factoriales fraccionados de resolución V con dos factores de dos niveles y con dos o tres factores de tres niveles. También puede obtenerse una fracción con 16 corridas de resolución V con 3 factores de dos niveles y un factor de tres niveles. Si se incluyen cuatro factores de dos niveles y un solo factor de tres niveles en 16 corridas, el diseño será de resolución III. Los diseños de 32 y 64 corridas permiten arreglos similares. Para un estudio adicional de algunos de estos diseños, ver Addleman [lb]. 9~4.2 Factores con dos y cuatro niveles Es muy sencillo incorporar un factor con cuatro niveles en un diseño 2k • El procedimiento para hacerlo implica el uso de dos factores con dos niveles para representar el factor con cuatro niveles. Por ejemplo, suponga queA es un factor de cuatro niveles con los niveles al' az, a3ya 4. Considere dos columnas de la tabla usual de signos positivos y negativos, por ejemplo las columnas P y Q. El patrón de los signos de estas dos columnas se muestra en el lado izquierdo de la tabla 9-12. El lado derecho de esta tabla muestra cómo estos cuatro patrones de signos corresponderían con los cuatro niveles del factorA. Los efectos represen- Tabla 9-12 El factor A con cuatro niveles expresado como dos factores con dos niveles Factores con dos niveles Corrida P Factores con cuatro niveles A al Q 1 2 3 4 + + + + az a3 a4 · - fj!~-'g~AV! ~t:!C ~U ~~ H~l~~JiJ~n .. _._~~::!II w 00 0\ Tabla 9-13 Un factor con cuatro niveles y 2 factores con dos niveles en 16 corridas AB Corrida C D AC BC =x (A B) 1 Xl + + + 2 Xz + + X3 3 + + 4 x4 + + + 5 Xl + + 6 Xz + + + 7 x3 + + + 8 x4 + + + + + + 9 Xl + + + + 10 Xz + + + 11 x3 + + + 12 X4 + + + + 13 Xl + + + 14 Xz + + + + 15 X3 + + + + 16 ABC AD BD ABD CD ACD - BCD ABCD - + + - + - + - + + - + + - + - + - + - + - + + - + + + + - + - + + + + + + + + + + + - + + - + + - + + + + + + - + + - + - + - + - + + - - + + + + - + - + + X4 + + + + + + + + + + + + + + - + + + 9-5 PROBLEMAS 387 tados por las columnasPy Q y la interacciónPQ son mutuamente ortogonales y corresponden al efecto de A con tres grados de libertad. Para i~ustrar esta idea con mayor detalle, suponga que se tiene un factor de cuatro niveles y dos factores de dos niveles y que es necesario estimar todos los efectos principales y las interacciones en las que intervienen estos factores. Esto puede hacerse con un diseño de 16 corridas. En la tabla 9-13 se presenta la tabla usual de signos positivos y negativos del diseño 24 con 16 corridas, donde las columnas A y B se usan para formar el factor de cuatro niveles, por ejemplo X, con los niveles Xl' X 2, X 3 YX 4. Se calcularían las sumas de cuadrados de cada columnaA, B, ...,ABCD exactamente igual que en el sistema 2k usual. Después las sumas de cuadrados de todos los factores X, C, D y sus interacciones se forman de la manera siguiente: = SSA +SSB +SSAB SSc = SSc SSD = SSD SSCD = SSCD SS xc = SS AC +SSBC +SSABC SSx SS XD SS XCD = SS AD +SSBD +SSABD = SS ACD + SSBCD + SS ABCD (3 grados de libertad) (1 grado de libertad) (1 grado de libertad) (1 grado de libertad) (3 grados de libertad) (3 grados de libertad) (3 grados de libertad) A este diseño podría llamársele 4 x 22 • Si uno está dispuesto a ignorar las interacciones de dos factores, pueden asociarse hasta nueve factores adicionales de dos niveles con la columna de la interacción de dos factores (exceptoAB), la columna de la interacción de tres factores y la columna de la interacción de cuatro factores. 9-5 9-1. PROBLEMAS Se estudian los efectos de la fuerza del revelador (A) Yel tiempo de revelado (B) sobre la densidad de la película de placa fotográfica. Se usan tres fuerzas y tres tiempos, y se corren cuatro réplicas de un experimento factorial 32 • Los datos de este experimento se presentan a continuación. Analizar los datos utilizando los métodos estándares para experimentos factoriales. Tiempo de revelado (minutos) Fuerza del revelador 1 2 3 10 14 2 4 1 4 3 2 8 7 10 7 2 4 9 8 12 9 18 O 5 4 7 7 8 5 6 10 6 5 10 7 6 7 10 8 5 10 8 9-2. 9-3. Calcular los componentes 1 y J de la interacción de dos factores del problema 9-1. Se llevó a cabo un experimento para estudiar el efecto de tres tipos diferentes de botellas de 32 onzas (A) y tres tipos diferentes de aparadores de venta (B) -anaqueles permanentes lisos, aparadores al final del pasillo con anaqueles emejados y refrigeradores para refrescos- sobre el tiempo que toma acomodar diez cajas de 12 botellas en los aparadores. Se usaron tres empleados (factor C) en el experimento, y se corrieron dos réplicas de un diseño factorial 33 • Los datos del tiempo observado se muestran en la tabla siguiente. Analizar los datos y sacar conclusiones. "'l. ~n 388 CAPÍTULO 9 DISEÑOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES Empleado 1 Tipo de botella Plástico Vidrio de 28 mm Vidrio de 38 mm Plástico Vidrio de 28 mm Vidrio de 38 mm Plástico Vidrio de 28 mm Vidrio de 38 mm 2 3 Réplica II Réplica 1 Final del Final del pasillo Refrigerador Permanente Permanente pasillo Refrigerador 4.14 3.36 3.45 5.80 4.19 5.23 3.52 4.07 4.38 5.48 4.26 4.85 4.20 4.26 5.67 3.68 4.37 5.58 6.21 5.22 4.40 4.80 4.70 5.88 6.25 4.44 4.52 5.15 4.65 6.20 4.96 5.17 6.03 4.39 4.75 6.38 4.08 3.94 5.14 3.65 4.08 4.49 4.30 4.53 4.99 4.04 4.08 4.59 4.17 4.86 4.85 3.88 4.48 4.90 9-4. Un investigador médico estudia el efecto de la lidocaína sobre el nivel de enzimas en el músculo cardiaco de perros beagle. En el experimento se usan tres marcas comerciales de lidocaína (A), tres dosis (B) y tres perros (C), y se corren dos réplicas de un diseño factorial 33 • Los niveles de enzimas observados se presentan a continuación. Analizar los datos de este experimento. Réplica 1 Marca de lidocaína 1 Fuerza de la dosis 1 2 3 1 2 3 1 2 3 Perro 1 96 94 101 85 95 108 84 95 105 2 84 99 106 84 98 114 83 97 100 3 85 98 98 86 97 109 81 93 106 1 84 95 105 80 93 110 83 92 102 Réplica II Perro 2 85 97 104 82 99 102 80 96 111 3 86 90 103 84 95 100 79 93 108 2 3 9-5. 9-6. Calcular los componentes 1 y J de las interacciones de dos factores del ejemplo 10-1. Se realiza un experimento en un proceso químico utilizando un diseño factorial 32 • Los factores del diseño son la temperatura y la presión, y la variable de respuesta es el rendimiento. Los datos que resultan de este experimento se presentan a continuación: Presión, psig Temperatura, oC 80 90 100 100 47.58, 48.77 51.86, 82.43 71.18, 92.77 120 64.97, 69.22 88.47, 84.23 96.57, 88.72 140 80.92, 72.60 93.95, 88.54 76.58, 83.04 a) Analizar los datos de este experimento conduciendo un análisis de varianza. ¿Qué conclusiones pueden sacarse? b) Analizar gráficamente los residuales. ¿Hay algún motivo de preocupación respecto de los supuestos subyacentes o de la adecuación del modelo? l ir l' I 9-5 PROBLEMAS 389 e) Verificar que si se hace que los niveles bajo, intermedio y alto de ambos factores de este diseño asuman los niveles -1, OY + 1, entonces un ajuste de mínimos cuadrados de un modelo de segundo orden del rendimiento es d) Confirmar que el modelo del inciso e puede escribirse en términos de las variables naturales -la temperatura (T) y la presión (P)- como y= -1335.63+18.56T+8.59P- ü.ünT 2 e) ü.ü196p 2 - ü.ü384TP 9-7. 9-8. 9-9. 9-10. 9-11. 9-12. 9-13. 9-14. 9-15. 9-16. 9-17. 9-18. 9-19. 9-20. 9-21. 9-22. Construir una gráfica de contorno del rendimiento como una función de la presión y la temperatura. Con base en el examen de esta gráfica, ¿dónde se recomendaría operar este proceso? a) Confundir un diseño 33 en tres bloques utilizando el componenteABC2 de la interacción de tres factores. Comparar los resultados obtenidos con el diseño de la figura 9-7. b) Confundir un diseño 33 en tres bloques utilizando el componenteAB2C de la interacción de tres factores. Comparar los resultados con el diseño de la figura 9-7. e) Confundir un diseño 33 en tres bloques utilizando el componenteABC de la interacción de tres factores. Comparar los resultados obtenidos con el diseño de la figura 9-7. d) Después de observar los diseños de los incisos a, b y e y la figura 9-7, ¿qué conclusiones pueden sacarse? Confundir un diseño 34 en tres bloques utilizando el componenteAB2CD de la interacción de cuatro factores. Considere los datos de la primera réplica del problema 9-3. Suponiendo que no fue posible hacer las 27 observaciones el mismo día, establecer un diseño para conducir el experimento en tres días conAB2C confundida con los bloques. Analizar los datos. Delinear la tabla del análisis de varianza del diseño 34 en nueve bloques. ¿Se trata de un diseño práctico? Considere los datos del problema 9-3. SiABC está confundida en la réplica 1 y ABC2 está confundida en la réplica II, realizar el análisis de varianza. Considere los datos de la réplica 1 del problema 9-3. Suponga que sólo se corre una fracción un tercio de este diseño con l = ABe. Construir el diseño, determinar la estructura de los alias y analizar los datos. Por el examen de la figura 9-9, ¿qué tipo de diseño quedaría si después de completar las nueve primeras corridas pudiera eliminarse uno de los tres factores? Construir un diseño 3i;;1 con l = ABCD. Escribir la estructura de los alias de este diseño. Verificar que el diseño del problema 9-14 es un diseño de resolución IV Construir un diseño 35- 2 conl =ABC el = CDE. Escribir la estructura de los alias de este diseño. ¿Cuál es la resolución de este diseño? Construir un diseño 39- 6 y verificar que es un diseño de resolución III. Construir un diseño 4 x 23 confundido en dos bloques con16 observaciones cada uno. Delinear el análisis de varianza de este diseño. Delinear la tabla del análisis de varianza de un diseño factorial 2232• Comentar la manera en que este diseño puede confundirse en bloques. Empezando con un diseño 24 de 16 corridas, indicar cómo pueden incorporarse dos factores de tres niveles en este experimento. ¿Cuántos factores de dos niveles pueden incluirse si se quiere cierta información sobre las interacciones de dos factores? Empezando con un diseño 24 de 16 corridas, indicar cómo pueden incorporarse un factor con tres niveles y tres factores con dos niveles, de tal modo que siga siendo posible la estimación de las interacciones de dos factores. En el problema 8-26 el lector conoció a Harry y Judy Peterson-Nedry, dos amigos del autor que son propietarios de un viñedo y una fábrica vinícola en Newberg, Oregon. En ese problema se describió la aplicación de diseños factoriales fraccionados de dos niveles en su producto Pinot Noir 1985. En 1987 quisieron conducir otro experimento Pinot Noir. Las variables de este experimento fueron ~' • 1 390 CAPÍTULO 9 DISEÑOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES Variable Clan de Pinot Noir Tamaño de la uva Temperatura de fermentación Uva completa Tiempo de maceración Tipo de levadura Tipo de roble Niveles Wadenswil, Pommard Pequeño, grande 80 oP, 85°P, 90/80 oP, 90 P 0 Ninguno, 10% 10 días, 21 días Assmanhau, Champagne Tron«ais, Allier Harry y Judy decidieron usar un diseño factorial fraccionado de dos niveles con 16 corridas, tratando los cuatro niveles de la temperatura de fermentación como dos variables de dos niveles. Como en el problema 8-26, utilizaron las calificaciones de un panel de catadores como variable de respuesta. El diseño y las calificaciones promedio resultantes se presentan enseguida: Corrida Clan q"1.1iI1 Tamaño de la uva Temperatura de Tiempo de Uva fermentación completa maceración Tipo de levadura Tipo de roble Calificación promedio 4 10 6 9 11 1 15 5 12 2 16 3 8 14 7 13 {""l'~ ni" ' ;::~¡,: ''''', ~:'''::: .. " ,::.::::1 .~~:¡:~~' '''~'''''' :::;1' 'n ::!'J "Ji:)' Sil . ~. 111 ·"~I ::~. li":l 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + 9-23. a) Describir los alias de este diseño. b) Analizar los datos y sacar conclusiones. e) ¿Qué comparaciones pueden hacerse entre este experimento y el experimento del Pinot Noir 1985 del problema 8-26? En un artículo de WD. Baten publicado en el volumen de 1956 de Industlial Quality Contl'Ol se describe un experimento para estudiar el efecto de tres factores sobre la longitud de unas barras de acero. Cada barra se sometió a uno de dos procesos de tratamiento térmico y se cortó en una de cuatro máquinas en una de tres horas durante el día (8 a.m., 11 a.m. o 3 p.m.). Los datos de la longitud codificada son los siguientes: Máquina 1 6 1 4 9 3 6 1 2 3 9 5 5 4 1 4 2 4 6 7 4 5 6 3 5 4 Hora del día Proceso de tratamiento térmico 1 7 5 6 3 O -1 8 a.m. 2 O 1 O O ., 9-5 PROBLEMAS 391 Hora del día Proceso de tratamiento térmico Máquina 1 6 2 3 -1 8 4 6 3 7 8 4 3 4 1 11 a.m. 1 3 1 5 9 6 3 2 1 1 -2 4 6 1 10 6 11 4 7 3 p.m. 2 O 7 8 10 O 2 O 2 O -1 1 -1 2 6 1 O -2 4 -4 3 1 7 11 9 6 10 4 4 7 9 6 4 3 5 8 3 O a) Analizar los datos de este experimento suponiendo que las cuatro observaciones de cada celda son réplicas. b) Analizar los residuales de este experimento. ¿Existe algún indicio de que hay un punto atípico en una de las celdas? Si se encuentra un punto atípico, eliminarlo y repetir el análisis del inciso a. ¿A qué conclusiones se llega? e) Suponga que las observaciones de las celdas son las longitudes (codificadas) de barras que se procesaron conjuntamente en el tratamiento térmico y después se cortaron secuencialmente (es decir, en orden) en las cuatro máquinas. Analizar los datos y determinar los efectos de los tres factores sobre la longitud promedio. d) Calcular la varianza logarítmica de las observaciones de cada celda. Analizar esta respuesta. ¿Qué conclusiones pueden sacarse? e) Suponga que la hora en que se corta una barra en realidad no puede controlarse durante la producción rutinaria. Analizar la longitud promedio y la varianza logarítmica de la longitud de cada una de las 12 barras cortadas en cada combinación máquina/proceso de tratamiento térmico. ¿Qué conclusiones pueden sacarse? Ajuste de modelos de . "' regreslon 10~1 INTRODUCCIÓN En muchos problemas hay dos o más variables relacionadas, y el interés se centra en modelar y explorar esta relación. Por ejemplo, en un proceso químico el rendimiento del producto está relacionado con la temperatura de operación. Quizá el ingeniero químico quiera construir un modelo que relacione el rendimiento con la temperatura para usarlo después como herramienta de predicción o bien de optimización o control del proceso. En general, suponga que hay una sola variable dependiente o de respuesta y que depende de k variables independientes o regresores, por ejemplo, Xl' X 2, ••• , X k • La relación que existe entre estas variables se caracteriza por un modelo matemático llamado modelo de regresión. Dicho modelo se ajusta a un conjunto de datos muestrales. En ocasiones el experimentador conoce la forma exacta de la verdadera relación funcional entreyyx ü x 2, .•. ,Xk , por ejemplo y = r/J(X I ,X2, ••• ,xk ). Sin embargo, en la mayoría de los casos no se conoce la verdadera relación funcional, y el experimentador elige una función apropiada para aproximar r/J. Los modelos polinomiales de orden inferior son de uso generalizado como funciones de aproximación. Existe una fuerte relación recíproca entre el diseño de experimentos y el análisis de regresión. A lo largo de este libro se ha destacado la importancia de expresar cuantitativamente los resultados de un experimento, en términos del modelo empírico, a fin de facilitar su comprensión, interpretación e implementación. Los modelos de regresión constituyen la base para conseguirlo. Se ha presentado en múltiples ocasiones el modelo de regresión que representaba los resultados de un experimento. En este capítulo se presentan algunos aspectos del ajuste de estos modelos. Presentaciones más completas de la regresión se encuentran en Montgomery y Peck [82] y Myers [84]. Los métodos de regresión se utilizan con frecuencia para analizar datos de experimentos no planeados, como podría ser el caso de la observación de fenómenos no controlados o de registros históricos. Los métodos de regresión también son muy útiles en experimentos diseñados cuando algo "salió mal". En este capítulo se ilustran algunas de estas situaciones. 392 10-2 MODELOS DE REGRESIÓN LINEAL 393 10-2 MODELOS DE REGRESIÓN LINEAL La atención se centrará en el ajuste de modelos de regresión lineal. Para ilustrar, suponga que quiere desarrollarse un modelo empírico que relacione la viscosidad de un polímero con la temperatura y la velocidad de alimentación del catalizador. Un modelo que podría describir esta relación es (10-1) donde y representa la viscosidad, Xl la temperatura y X 2 la velocidad de alimentación del catalizador. Se trata de un modelo de regresión lineal múltiple con dos variables independientes. Es común llamar a las variables independientes variables predictoras o regresores (variables de regresión). Se utiliza el término lineal porque la ecuación 10-1 es una función lineal de los parámetros desconocidos /30' /31 y /32' El modelo describe un plano en el espacio bidimensional Xl' X 2. El parámetro /30 define la intersección del plano con el eje de las ordenadas. En ocasiones /31 y /32 se denominan los coeficientes de regresión parcial, porque (31 mide el cambio esperado en y para cada cambio unitario de Xl cuando X 2 se mantiene constante, y /32 mide el cambio esperado en y para cada cambio unitario de X 2 cuando Xl se mantiene constante. En general, la variable de respuesta y puede relacionarse con k regresares. Al modelo (10-2) se le llama modelo de regresión lineal múltiple con k regresares. A los parámetros /3j,j = O, 1, ..., k se les llama los coeficientes de regresión. Este modelo describe un hiperplano en el espacio de k dimensiones de los regresares {xj }. El parámetro /3j representa el cambio esperado en la respuesta y para un cambio unitario en xj cuando las variables independientes restantes Xi (i :t:- j) se mantienen constantes. Con frecuencia los modelos cuya apariencia es más compleja que la ecuación 10-2 pueden también analizarse mediante técnicas de regresión lineal múltiple. Por ejemplo, considere la incorporación de un término de interacción en el modelo de primer orden en dos variables, por ejemplo (10-3) Si se hace X3 = XrX2 Y/33 = /312' entonces la ecuación 10-3 puede escribirse como y= /30 + /31 x 1 + /32 x 2 + /33 x 3 +s (10-4) que es un modelo de regresión lineal múltiple estándar con tres regresares. Recuerde que en algunos ejemplos de los capítulos 6, 7 Y8 se presentaron varios modelos empíricos similares a las ecuaciones 10-2 y 10-4 para expresar cuantitativamente los resultados de un diseño factorial de dos niveles. Como otro ejemplo, considere el modelo de superficie de respuesta de segundo orden en dos variables: y= /3 0+ /3 1x1 + /3 2 x 2 + /3u x; + /322X~ + /312 x 1x 2 +s (10-5) Si se hacex3= x; 'X4 = x~ ,Xs =X1X 2,/33 = /3u,/34 = /322Y/3s = /312' entonces esta expresión queda como (10-6) que es un modeio de regresión lineal. Este modelo se ha visto también en ejemplos anteriores de este libro. En general, cualquier modelo de regresión que es lineal en los parámetros (los valores /3) es un modelo de regresión lineal, independientemente de la forma de la superficie de respuesta que genera. En este capítulo se resumirán los métodos para estimar los parámetros de los modelos de regresión lineal múltiple. A este procedimiento suele llamársele el ajuste del modelo. Se analizarán también los métodos para probar hipótesis y para construir intervalos de confianza para estos modelos, así como para 394 CAPÍTULO 10 AJUSTE DE MODELOS DE REGRESIÓN verificar la adecuación del ajuste del modelo. La atención se centra en los aspectos del análisis de regresión que son útiles en los experimentos diseñados. Para presentaciones más completas de la regresión, referirse a Montgomery y Peck [82] y Myers [84]. 10~3 ESTIMACIÓN DE LOS PARÁMETROS EN MODELOS DE REGRESIÓN LINEAL El método de mínimos cuadrados se usa de manera típica para estimar los coeficientes de regresión de un modelo de regresión lineal múltiple. Suponga que se cuenta con n > k observaciones de la variable de respuesta, por ejemplo, YI, Yz, ... ,Yn- Junto con cada respuesta observaday¡ se tendrá una observación de cada uno de los regresares, y sea quexij denote la observación o nivel i-ésimo de la variablexj . Los datos aparecerán como en la tabla 10-1. Se supone que el término del error e del modelo tiene E( e) = OYV( e) = ,j2 y que las {e¡} son variables aleatorias no correlacionadas. La ecuación del modelo (ecuación 10-2) puede escribirse en términos de las observaciones de la tabla 10-1 como Y¡ ¡:II.. = f30 +f3I Xil +f32 X¡2 + ... +f3k X¡k +e¡ k (10-7) i=1,2, ...,n =f3o+Lf3jXij+e¡ j=l iJ¡ ..." ''''1 ji" El método de mínimos cuadrados consiste en elegir las f3 de la ecuación 10-7 de tal modo que la suma de cuadrados de los errores, e¡, se minimice. La función de mínimos cuadrados es ,,' 'H "U L=! e~ ¡=l (10-8) La función L debe minimizarse con respecto a f3o, f31, ejemplo ~o' ~1' ... , ~k' deben satisfacer ..., f3k' Los estimadores de mínimos cuadrados, por (10-9a) y (10-%) Tabla 10-1 y YI Y2 Datos de una regresión lineal múltiple Xl XJl X2 X12 X 22 Xk Xlk X 2k X 21 YtI XIII X Il2 X llk 10-3 ESTIMACIÓN DE LOS PARÁMETROS EN MODELOS DE REGRESIÓN LINEAL 395 Al simplificar la ecuación 10-9, se obtiene n~o +~I~ ;=1 Xil +~2~ X¡2 ;=1 n + ... +~kL i=1 n X¡k i=1 + ~2 L ;=1 X il X i2 + ... + ~ k L ;=1 n XilX ik = L ;=1 n XilY¡ (10-10) Estas ecuaciones se denominan ecuaciones normales de mínimos cuadrados. Observe que hay p = k + 1 ecuaciones normales, una para cada uno de los coeficientes de regresión desconocidos. La solución de las ecuaciones normales serán los estimadores de mínimos cuadrados de los coeficientes de regresión ~o, ~1" .. , ~k' Es más sencillo resolver las ecuaciones normales si se expresan en la notación matricial. A continuación se presenta el desarrollo matricial de las ecuaciones normales que es análogo al desarrollo de la ecuación 10-10. El modelo en términos de las observaciones, ecuación 10-7, puede escribirse en notación matricial como y= donde YI Y2 ] Xp + e . [11 X x ll 2I X x 12 22 ",x .. , X Ik ] 2k y= [ ;n ' y X= . : . :. : : . ' ••• 1 x nI x n2 x nk En general, y es un vector (n X 1) de las observaciones, X es una matriz (n X p) de los niveles de las variables independientes, p es un vector (p xl) de los coeficientes de regresión, ye es un vector (n Xl) de los errores aleatorios. Quiere encontrarse el vector de los estimadores de mínimos cuadrado~, jJ, que minimice L= ~ ;=1 s; =e'e=(y-Xp)'(y-xP) (10-11) Observe que L puede expresarse como L= y'y-P'X'y-y'XP+P'X'XP = y'y- 2P'X'y+P'X'XP ya quep'X'y es una matriz (1 x 1), o un escalar, y su transpuesta (/J'X'y)' estimadores de mínimos cuadrados deben satisfacer = y'XP es el mismo escalar. Los 396 CAPÍTULO 10 AJUSTE DE MODELOS DE REGRESIÓN aL/ = -2X'y + 2X'xjJ = o ap Í3 cuya simplificación es X'xjJ= X'y (10-12) La ecuación 10-12 es la forma matricial de las ecuaciones normales de mínimos cuadrados. Es idéntica a la ecuación 10-10. Para resolver las ecuaciones normales, ambos miembros de la ecuación 10-12 se multiplican por la inversa de X'X. Por lo tanto, el estimador de mínimos cuadrados de p es (X'Xr I X'y (10-13) p= Es sencillo ver que la forma matricial de las ecuaciones normales es idéntica a la forma escalar. Al desarrollar en detalle la ecuación 10-12, se obtiene n n n L ;=1 Xil L 2: ;=1 Xil n Xi; i=l L L i=1 n X i2 n X il X i2 i=1 L L i=1 n n X ik {Jo n X iI X ik {JI ;=1 L = L ;=1 Y¡ n XilY¡ ;=1 n n n n n L ;=1 X¡k L ;=1 XikX il L i=1 X ik X i2 L i=1 X ik {Jk 2 L ;=1 XikY¡ ::;1' I"H ;:¡ :.1 Si se efectúa la multiplicación matricial indicada, se obtendrá la forma escalar de las ecuaciones normales (es decir, la ecuación 10-10). En esta forma es sencillo ver que X'X es una matriz simétrica (p X p) y que X'y es un vector columna (p X 1). Observe la estructura especial de la matriz X'X. Los elementos de la diagonal de X'X son las sumas de cuadrados de los elementos de las columnas de X, y los elementos que no están en la diagonal son las sumas de los productos cruzados de los elementos de las columnas de X. Además, observe que los elementos de X/y son las sumas de los productos cruzados de las columnas de X y las observaciones {y¡}. El modelo de regresión ajustado es (10-14) y= xjJ En notación escalar, el modelo ajustado es Ji = {Jo + L ;=1 k {JjXij i = 1, 2, .oo, n Ji ei La diferencia entre la observación real Yi y el valor ajustado correspondiente = Yi - Ji' El vector (n X 1) de los residuales se denota por e es el residual, es decir, (10-15) =y - y Estimación de a2 Por lo general también es necesario estimar rT. Para desarrollar un estimador de este parámetro, considere la suma de cuadrados de los residuales, por ejemplo SSE = I =I (Yi - Ji )2 i=1 e¡2 ;=1 = e'e 10-3 ESTIMACIÓN DE LOS PARÁMETROS EN MODELOS DE REGRESIÓN LINEAL 397 Al sustituir e = y - y = y - Xp, se tiene SS E = (y - xjJ)(y - xjJ) = y'y - P'X'y - y'xjJ+ P'X'xjJ = y'y-2P'X'y+P'X'xjJ puesto que X'xjJ= X'y, esta última ecuación queda como SSE = y'y- P'X'y (10-16) A la ecuación 10-16 se le llama la suma de cuadrados residual o del error, y tiene n - p grados de libertad asociados con ella. Puede demostrarse que por lo que un estimador insesgado de cr está dado por ~2 a =-- SSE n-p (10-17) Propiedades de los estimadores El método de mínimos cuadrados produce un estimador insesgado del parámetro p del modelo de regresión lineal. Esto puede demostrarse fácilmente tomando el valor esperado de de la siguiente manera: P E(P) = E[(X'XrIX'y] = E[(X'X)-I(xp+S)] = E[(X'Xr l X'xp+(X'Xr l X's] =p ya que E(s) = O Y (X'xtIX'X = l. Por lo tanto, es un estimador insesgado de p. La propiedad de la varianza de se expresa en la matriz de covarianza: p p Cov(P) == E{[P- E(P)][P- E(P)]'} (10-18) que es una matriz simétrica cuyo elemento i-ésimo de la diagonal principal es la varianza del coeficiente de regresióp individual Ycuyo elemento (ij)-ésimo es la covarianza entre Y j • La matriz de covarianza de p es Pi' Pi p (10-19) EJEMPLO 10,1 .....................................................•...... En la tabla 10-2 se muestran 16 observaciones de la viscosidad de un polímero (y) y dos variables del proceso: la temperatura de reacción (Xl) y la velocidad de alimentación del catalizador (x 2 ). Se ajustará el modelo de regresión lineal múltiple ' ::::lr '.¡ ) :!' 1 80 8 1 93 9 1 100 10 1 82 12 1 90 11 1 99 8 1 81 8 1 96 10 X= 1 94 12 1 93 11 1 97 13 1 95 11 1 100 8 1 85 12 1 86 9 1 87 12 La matriz X'X es 2256 2340 2426 2293 2330 2368 2250 2409 y= 2364 2379 2440 2364 2404 2317 2309 2328 x'x~H 1 93 9 1 87 12 l 80 93 87 l~j . lb/h) Viscosidad (Xl' oC) Observación 8 2256 1 80 9 2340 2 93 10 2426 3 100 12 2293 4 82 11 2330 5 90 8 2368 6 99 8 2250 7 81 10 2409 8 96 12 2364 9 94 11 2379 10 93 11 97 13 2440 12 95 11 2364 13 100 8 2404 12 2317 14 85 15 86 9 2309 12 2328 16 87 11Ih" ::II~: 'rll..' 'I! 398 CAPÍTULO 10 AJUSTE DE MODELOS DE REGRESIÓN Tabla 10-2 Datos de la viscosidad del ejemplo 10-1 (viscosidad en centistokes @ 100°C) Temperatura Velocidad de alimentación del catalizador (x z.-' 111""- 'ji"' "'''41 ''':j' :~:: .MI'I. La matriz X y el vector y son "11 ..1' a estos datos. 27 .2 -4.4 2389.62129 8.277 0.79 -0.550 385.60 1.1 0.32 0.64 -1.177 0.1 0.946 14.52 0.062 0. residuales y otros diagnósticos del ejemplo 10-1 Observación Valor predicho Residual i e¡ hu Yi Ji 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 2256 2340 2426 2293 2330 2368 .58485 El ajuste de mínimos cuadrados.023 0.350 0.9 2384.080 0.3 2416.763947x10.096 0.098 0.046 0.5 1566.5 3.319 0.102 0.1 10.1 -20.156 Residual studentizado 0.134 0.001 0.80 -0.1D-3 ESTIMACIÓN DE LOS PARÁMETROS EN MODELOS DE REGRESIÓN LINEAL 399 =[1458 164 16 1458 164] 133.36 0.5 2369.5 2352.01 0.137 0.763947x10.61 -0.562 La estimación de mínimos cuadrados de P es 37.77 0.9 2316.2 -0.28 Di 0.0 2346.66 -1.3 2252. es Tabla 10-3 Valores predichos.0 -16.9 2298.8 2332.1 2414.030 0.577] o lJ = r =[ 14.251 0.550 [ 385.023 0.429.07 -1.62 1.429.78 0. 2250 2409 2364 2379 2440 2364 2404 2317 2309 2328 2244.1 25.67 -0.5 2396.1 2383.354 0.005 R-student 0.1 11.5 -12.52 -0.223453 -4.111 0.50 <0.289 0.87 -0.15 1.1 11.142 0.176004 -0.87 -0.42 0.48 0.726 y el vector X'y es 1 [2256] 87] 12 2328 2~40 = 3.80 -1.07 -1.946 1.07777] 7.7 23.15 1.185 0.036 0.004 0.097 0.4 -21.560 14.3 -2.9 -1.05 -1.5 9.562 2.1 2294.000 0.129746 -0.429184x10. con los coeficientes de regresión expresados con dos cifras decimales.6 2385.011 0.577] -0.222381x10.05 -1.265 0.077 0.5 7.223453 ][ 37.278 0.01 0.4 -21.3 -4.76 -1.66 -0.129746 1. 08+ 7. 25. ejemplo 10-1. I 1 1 +1 1- + - 17.".61 9.43 -' .2417 2273 2331 2359 Viscosidad predicha en centistokes Figura 10-2 Gráfica de los residuales contra la viscosidad predicha. Como en los experimentos diseñados. 'd t1 En las tres primeras columnas de la tabla 10-3 se presentan las observaciones reales Yi' los valores predichos o ajustados Yi y los residuales.68 - + + + + + + 1 -21. . ejemplo 10-1. 62xI +8. La figura 10-3 sugiere que la variabilidad de la viscosidad aumenta cuando se incrementa la temperatura.. e 70 5 50 e E e5 10 ll.5Sx 2 '1Il"" .¡ "C '¡ji Ul 1.h ::1I¡. :B ro ~ 30 20 Figura 10-1 Gráfica de probabilidad normal de los residuales.. La figura 10-1 es una gráfica de probabilidad normal de los residuales.50 -.85 -13. respectivamente.' Y== 1566.79 - + + + + + - ro '" . la graficación de los residuales forma parte integral de la construcción de modelos de regresión. Las gráficas de los residuales contra los valores predichos Ji y contra las dos variables Xl y X 2 se muestran en las figuras 10-2... 2244 1 . 2302 I 1ft 2388 .97 - cr: '" -5. Estas gráficas indican que en la varianza de la viscosidad observada existe una tendencia a incrementarse con la magnitud de la viscosidad.~ 'j i 400 99 _ 95 CAPÍTULO 10 AJUSTE DE MODELOS DE REGRESIÓN 390 'o" 80 e ro c. 10-3 Y10-4. Se han visto ya muchas salidas de computadora como ésta en este libro.97 f- .00 I I I 1 +1 1- 10.43 17.0 temperatura Figura 10-3 Gráfica de los residuales contraxt (temperatura).85 f- :\: + + + + - -13.68 f- -21.61 9. ya.33 12.~ 'O " a: ++ -5. Uso de la computadora El ajuste de los modelos de regresión casi siempre se hace por medio de un paquete de software de estadística.00 8.61 1-1 f- 1 1 + 1 1 1 1- + + 9.68 f-21.3 + 1100.83 9.0 1 1+ 93.50 f-t 8. 'O Ql ro '" Ql + 1.17 13.10-3 ESTIMACIÓN DE LOS PARÁMETROS EN MODELOS DE REGRESIÓN LINEAL 401 25.0 86.97 f- el: + -5. En la tabla 10-4 se muestra la salida obtenida cuando se usa el programa Minitab para ajustar el modelo de regresión de la viscosidad del ejemplo 10-1.50 11.¡¡.50 h 80. ejemplo 10-1.85 f- + + + + 1 83.7 x" 90. En secciones subsecuentes se revisará en detalle el análisis de varianza y la información de la prueba t de la tabla 10-4 y se indicará de manera pormenorizada cómo se calcularon estas cantidades. .3 I - + 1 96. ejemplo 10-1.67 x2' velocidad de alimentación del catalizador Figura 10·4 Gráfica de los residuales contra X 2 (velocidad de alimentación). que sus significados son similares a las cantidades de las salidas de computadora para el análisis de datos de experimentos diseñados.79 f- + + + - " .79 P f- 1 I I 1 +1 + L + + + f- + - '" ro Ql + 1. 25. Muchas de las cantidades de esta salida deberán ser familiares.7 -13.43 17. 585 StDev 61.402 Tabla 10-4 CAPÍTULO 10 AJUSTE DE MODELOS DE REGRESIÓN Salida de Minitab para el modelo de regresión de la viscosidad. -1 -1 -1 -1 1 1 1 1 O O O O y 32 46 57 65 36 48 57 68 50 44 53 56 1 2 3 4 5 6 7 8 9 10 11 12 120 160 120 160 120 160 120 160 140 140 140 140 40 40 80 80 40 40 80 80 60 60 60 60 15 15 15 15 30 30 30 30 22..62 Temp + 8.439 T P 25." 57 - 46 Variables del proceso Corrida Temperatura (OC) Presión (psigi Concentración (gil) Variables codificadas Rendimiento.50 0.scos.5 22.ance Source Regress.000 0.5 x.59 0.= Temperatura -140 Presión. .5 22.000 57 68 36 I I I 32 "" I . -1 -1 1 1 -1 -1 1 1 O O O O x.08 7.60 20 • x.on .004 R-Sq = 92.43 12. x.6184 2. ..5 22.32 3.225 7.6% Analys.on equat. ejemplo 10-1 Análisis de regresión The regress.= Concentración.7% R-Sq<adj) = 91 ..dual Error Total Source Temp Feed Rat DF 1 1 DF 2 13 15 Seq SS 40841 3316 SS 44157 3479 47636 MS 22079 268 F P 82. x.5 Figura 10-5 Diseño experimental del ejemplo 10-2.000 0.6213 8.36 Coef 1566.s V.58 Feed Rate Pred.ctor Constant Temp Feed Rat S = 16.ty = 1566 + 7.s of Var.=~.52 0.on Res.. -1 1 -1 1 -1 1 -1 1 O O O O x. y las estimaciones de mínimos cuadrados de los coeficientes de regresión son 1/12 O 45 [51. y el ingeniero decide correr un diseño 23 con cuatro puntos centrales. la presión y la concentración del catalizador. Se ofrece ahora un ejemplo completo donde se indica cómo se hace esto. -1 que se utiliza normalmente en los diseños factoriales 2k para representar los niveles de los factores. donde se presentan tanto los niveles naturales del diseño como la notación de variables codificadas + 1. . la matriz X y el vector y son 1 -1 -1-1 1 1 -1-1 1 -1 1-1 1 1 1-1 1 -1 -1 1 1 1 -1 1 X= 1 -1 1 1 1 1 1 1 1 O O O 1 O O O 1 O O O 1 O O O Es sencillo demostrar que 36 48 y= 57 68 50 44 53 56 12 O X'X. Análisis de regresión de un diseño factorial 23 Un ingeniero químico está investigando el rendimiento de un proceso.10-3 ESTIMACIÓN DE LOS PARÁMETROS EN MODELOS DE REGRESIÓN LINEAL 403 Ajuste de modelos de regresión en experimentos diseñados Se ha usado con frecuencia un modelo de regresión para presentar los resultados de un experimento diseñado en una forma cuantitativa.625 [ 9 1.[ O O O O O O 8 O O] O O 8 X'y= 612] [ ¿g Puesto que X'X es diagonal.000] 5. Suponga que el ingeniero decide ajustar un modelo que sólo incluye los efectos principales.O 8 .125 O 1/8 p= El modelo de regresión ajustado es y= 51. por ejemplo y= /30 +/31 x l +/32 X2+/33 X3+8 32 46 57 65 Para este modelo. Se presentan enseguida otros tres ejemplos breves que ilustran otras aplicaciones útiles del análisis de regresión en los experimentos diseñados. Cada variable puede correrse en un nivel bajo y uno alto.000+ 5. Tres de las variables del proceso son de interés: la temperatura. 625x 2 +1. EJEMPLO 10-2 . 625x 1 + 10. el inverso que se requiere también es diagonal. En la figura 10-5 se muestra el diseño y los rendimientos resultantes.125x 3 .625 O O O] [612] 1 (X'Xr X'y= ~ 1/ ~ 1/8 O 85 = 10. Esto siempre se cumplirá para un diseño 2k • Como se señaló antes... en los capítulos 6 al 8 se empleó este resultado para producir modelos de regresión... Esto se ilustra en los dos ejemplos siguientes... Suponga que cuando se realizó este experimento...... En general.. En el ejemplo 10-2 es sencillo obtener la matriz inversa porque X'X es diagonal.404 CAPÍTULO 10 AJUSTE DE MODELOS DE REGRESIÓN Como se ha hecho uso de ellos en muchas ocasiones.. Se ajustará el modelo de los efectos principales y= [Jo + [JlX l +[J2 X2+[J3 X3 +8 utilizando las 11 observaciones restantes... estas columnas deben ser ortogonales....25 Observe que el coeficiente de regresión de Xl es (11.. ...25)/2 = 5....75. Por lo tanto. el coeficiente de regresión es exactamente la mitad de la estimación usual del efecto.... Intuitivamente.... La matriz X y el vector y son ...... Se sabe que los elementos de X'X que están fuera de la diagonal son las sumas de los productos cruzados de las columnas en X. los coeficientes de regresión guardan una estrecha relación con las estimaciones de los efectos que se obtendrían por el análisis usual de un diseño 23 • Por ejemplo..... quizá sea deseable diseñar el experimento de tal modo que resulte una X'X diagonal. COV(~i' ~j) = O. Un diseño factorial 23 con una observación faitante Considere el diseño factorial 23 con cuatro puntos centrales del ejemplo 10-2... etcétera...50 = 11.... Los métodos de regresión son en extremo útiles cuando algo "sale mal" en un experimento diseñado. el diseño factorial 2k es un diseño ortogonal para ajustar el modelo de regresión lineal múltiple. es decir. la combinación de los niveles 'de los factores quizá no sea la apropiada.45... no sólo porque los cálculos se simplifican sino también porque los estimadores de todos los coeficientes de regresión no están correlacionados. el efecto de la temperatura es (referirse a la figura 10-5) T=)ir -)ir = 56.. esto parece ofrecer ventajas.. EJEMPLO 10~3 ...... Si los niveles de las variables X pueden elegirse antes de recabar los datos......... es necesario hacer que el producto interior de las columnas deX sean iguales a cero. valores ajustados y residuales en varios experimentos de dos niveles.. faltó la corrida con todas las variables en el nivel alto (la corrida 8 de la figura 10-5).. es decir... A los diseños experimentales que poseen esta propiedad para ajustar un modelo de regresión se les llama diseños ortogonales.625 Es decir. la unidad experimental puede estar dañada... Esto puede ocurrir por varias razones: el sistema de medición puede producir una lectura incorrecta.. Este ejemplo demuestra que las estimaciones de los efectos de un diseño 2k son estimaciones de mínimos cuadrados... En la práctica puede ser relativamente sencillo conseguir esto. 92307 XlO.z = [ 1. Los métodos de regresión son útiles en el análisis de un . pero las grandes son motivo de preocupación potencial.z 17 0. las conclusiones no sufrirían una alteración sustancial por la observación faltante.92307XlO.15385 2.61538X 10-z 1. observe que las estimaciones de los efectos han dejado de ser ortogonales.75x z +1. Niveles imprecisos de los factores del diseño Cuando se corre un experimento diseñado.z 0.88462x10.92307 XlO.z 1.88462 x lO.z 2. Las discrepancias pequeñas no son importantes.25 )1= 51.z 2.15385 1. Debido a la estrecha relación entre los coeficientes de regresión y los efectos de los factores.92307x10-z 0. en ocasiones es difícil alcanzar y mantener los niveles precisos de los factores requeridos por el diseño.15385 -59 = [:~:. ya que (X'X) y su inversa ya no son diagonales.10-3 ESTIMACIÓN DE LOS PARÁMETROS EN MODELOS DE REGRESIÓN LINEAL 405 1 1 1 1 1 X= 1 1 1 1 1 1 -1 1 -1 1 -1 1 -1 O O O O -1 -1 1 1 -1 -1 1 O O O O -1 -1 -1 -1 1 1 1 O O O O y= 32 46 57 65 36 48 57 50 44 53 56 Para estimar los parámetros del modelo se forman X'X= -1 11 -1 [-1 y entonces ~~ =~ =:1 -1 -1 7 X'y= r =~ j -59 Z jJ = (X'X) -1 X'y 9.~] 1.88462x10.25+ 5. el modelo ajustado es Compare este modelo con el que se obtuvo en el ejemplo 10-2.z ] [544] -23 2. •••••••••••••••••••••••••••••••••••••••••••••• e_e ••••••••••••••••••••••••• EJEMPLO 1O~4 .88462xlO.z 1. Sin embargo.88462 XlO.92307 XlO. donde se usaron las 12 observaciones.z 1. 75x 1 +10.25x 3 Por lo tanto.88462xlO2.92307 XlO. Los coeficientes de regresión son muy similares.z 2. 2670] 0.4 1 1 1 O O O O 32 46 57 65 36 48 y= 57 68 .144 [ .75 0.50 612 77.10 1.90 1.95 1 -1.1 1 -1.25 0.25 O O O O· -0.5 22.55 ] 19.25 0.5 22.31 -0.25 O O O O -0.31 8.60 0.90 -0. el experimento de la tabla 10-5 presenta una variación del diseño 23 del ejemplo 10-2.5 -0.1403 -0.133 -1 -1 -1 1.15 -0.5375 -0. Para ilustrar. Las dificultades parecen haber ocurrido sobre todo con la variable temperatura.95 -1 1.133 -1 -1 -1 1.[ 0.05 -1 1 1. donde muchas de las combinaciones de prueba no son exactamente las que se especifican en el diseño.406 Tabla lO-S CAPÍTULO 10 AJUSTE DE MODELOS DE REGRESIÓN Diseño experimental del ejemplo 10-4 Variables del proceso Concentración Temperatura Presión (g/l) (psig) CC) Variables codificadas X¡ X2 X3 Corrida Rendimiento y 1 2 3 4 5 6 7 8 9 10 11 12 125 158 121 160 118 163 122 165 140 140 140 140 41 40 82 80 39 40 80 83 60 60 60 60 14 15 15 15 33 30 30 30 22.05 -1 1 1. 50 44 53 56 Para estimar los parámetros del modelo se necesitan 12 0.1403 X'X .95 1 -1.10 1.60 8.14 1 1 1 O O O O 32 46 57 65 36 48 57 68 50 44 53 56 experimento diseñado cuando el experimentador no ha podido obtener los niveles requeridos de los factores.75 0. Se ajustará el modelo de los efectos principales Y= f30 +f3¡x¡ +f32 x 2 +f33 x 3+8 La matriz X y el vector y son 1 1 1 1 1 1 X= 1 1 1 1 1 1 -0.15 O O O O -1.15 -0.18 .90 -0.3437 9.15 O O O O -1.5 22.1 1 -1.2670 -0.95 -1 1.0.3437 0.2437 I Xy= 161.90 1. 37447x10-2 _ -6.. donde los niveles de los factores fueron exactamente los que se especificaron en el diseño. En la tabla 8-3 se muestra la fracción principal de este diseño. C..... Para dilucidar cuáles son las interacciones importantes podría....0Sx 3 Al comparar este resultado con el modelo original del ejemplo 10-2. La interpretación práctica de los resultados de este experimento no sufriría alteraciones sustanciales por la incapacidad del experimentador para alcanzar exactamente los niveles deseados de los factores ..10-3 ESTIMACIÓN DE LOS PARÁMETROS EN MODELOS DE REGRESIÓN LINEAL 407 Entonces 8. Por lo general es posible separar los alias de ciertas interacciones de interés aumentando el diseño original con un número de corridas menor que las que se requieren en un plegado completo..09871 x10..... es 51= 50.. Suponga que después de que se observaron los datos de los ocho primeros ensayos. Para un diseño de resolución III.37851 x 10-3 -2. suponga que se ha corrido un diseño 2~1.. Para ilustrar.50 0.59833 10.. Suponga que quiere ajustarse el modelo y= 130 +f31 x 1+f32 x 2 +f33 x 3 +f34 x 4 +f312 XI X2 +f3 34 x 3x 4 +10 .... .. y la cadena de aliasAE + CD...3 1.. Las otras dos cadenas de alias pueden ignorarse..3 0....3 .59833xlO-3 50. Los métodos de regresión son una forma fácil de formular este problema y de ver cómo puede resolverse... los efectos más grandes fueron A ..3 161..36+2x1+10..... correrse la fracción alterna.41932 = [ 10.. Es posible separar los alias deAB y CD en un número de ensayos adicionales menor que ocho.10845 19..... 88490 x 10-3 -2... en la que 1 = AECD..12289 -4.09871xlO..-2..3 ] [612 ] 77.. Entoncesel diseño combinado puede usarse para separar los alias de todos los efectos principales de las interacciones de dos factores... pero es claro queAE o CD o ambas interacciones de dos factores son grandes.3 [ -2.33542xlO..88490x104...144 X 3 El modelo de regresión ajustado.20766 X 10-3 0. se observa muy poca diferencia.. EJEMPLO 10-5 Separación de alias de interacciones en un diseño factorial fraccionado En el capítulo 8 se señaló la posibilidad de separar los alias de las interacciones de un diseño factorial fraccionado mediante el proceso llamado doblez o plegado. con los coeficientes reportados con dos cifras decimales. ..20766x10... desde luego. Una dificultad con el plegado es que requiere un segundo grupo de corridas de tamaño idéntico al del diseño original.36496] 5.07653 -6. un plegado completo se construye corriendo' una segunda fracción en la que los signos están invertidos respecto de los signos de la fracción original........ Entonces las 16 corridas podrían usarse para estimar los efectos principales y las interacciones de dos factores..55 1.16672 1. D (se ignoran las interacciones de tres factores que son alias de estos efectos principales).17x 2 +1. para lo cual se requerirían otros ocho ensayos..11753 4....... E.33542x10-3 -4..37851 x 10. O' x¡ x2 x3 x 4 X1X2 X~4 ''''~. se obtiene lo siguiente: X¡ X2 X3 X4 X¡X2 X~4 bloques 1 1 1 1 X== 1 1 1 1 1 -1 1 -1 1 -1 1 -1 1 -1 -1 -1 1 1 -1 -1 1 1 -1 -1 -1 -1 -1 1 1 1 1 -1 -1 1 1 -1 1 -1 -1 1 1 1 -1 -1 1 1 -1 -1 1 1 1 -1 -1 1 1 -1 -1 1 -1 -1 -1 -1 -1 -1 -1 -1 -1 1 . Suponga que existe un efecto de tiempo (o un efecto de bloque) entre las ocho primeras corridas y la última corrida que se agregó arriba.""I IT. Utilizando el diseño de la tabla 8-3. y el modelo puede ajustarse incluyendo a las dos interaccionesx¡x2 (AE) y X~4 (CD). ya queAB ox¡x 2 es alias de CD OX~4)' lo cual implica una dependencia lineal en las columnas de X.. Cy D.x3 == -1 Yx 4 == 1 de la fracción alterna a las ocho corridas originales...x2. Aun cuando al agregar una sola corrida se separarán los alias de las interaccionesAE y CD. Al agregarse una columna a la matriz X para los bloques."- . no pueden estimarse tanto (3¡2 como (334 en el modelo. este enfoque tiene una desventaja.408 CAPÍTULO 10 AJUSTE DE MODELOS DE REGRESIÓN dondex¡. Las magnitudes de los coeficientes de regresión brindarán información respecto a cuáles son las interacciones importantes..".x3yx4son las variables codificadas que representan aA. Sin embargo. Observe que la columnax¡x 2 es idéntica a la columnax~4 (como se anticipaba..x2 == -1. Entonces la matriz X del modelo queda como ::u¡:¡ "~. la matriz X de este modelo es X¡ X2 X3 X4 X¡X2 X~4 1 1 1 1 X== 1 1 1 1 -1 1 -1 1 -1 1 -1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 -1 -1 1 1 1 1 -1 1 1 -1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 donde se han anotado las variables arriba de las columnas a fin de facilitar la comprensión. "':jl !\~ ~ll :::lo 'H 1 1 1 1 1 X== 1 1 1 1 1 -1 1 -1 1 -1 1 -1 1 -1 -1 -1 1 1 -1 -1 1 1 -1 -1 -1 -1 -1 1 1 1 1 -1 -1 1 1 -1 1 -1 -1 1 1 1 -1 -1 1 1 -1 -1 1 1 1 -1 -1 1 1 -1 -1 1 -1 Observe que ahora las columnas x¡x2 YX~4 ya no son idénticas. Por lo tanto.B. suponga que se agrega la corrida únicax¡ == -1. Como resultado de este supuesto. debe agregarse un número par de corridas. En general. . las observaciones Yi tienen una distribución normal e independiente con media /30 + 2:. 10. En esta sección se describen varios procedimientos de prueba de hipótesis importantes. Se cuenta también con métodos basados en computadora para construir diseños que pueden ser útiles en el aumento del diseño para separar los alias de los efectos.4.•• . lo cual se abrevia 8 . 10. el impacto de las estrategias específicas para aumentar el diseño puede evaluarse utilizando los resultados generales de los modelos de regresión que se presentan más adelante en este capítulo.x2. suele ser directo el examen de la matriz X del modelo reducido que se obtiene de un diseño factorial fraccionado.~=¡/3jX.z!: O = ···=/3k =0 para al menos una j (10-20) El rechazo deHode la ecuación 10-20 implica que almenas uno de los regresoresx¡.. o que el efecto del bloque afecta ahora a las estimaciones de los coeficientes de regresión del modelo.10-4 PRUEBA DE HIPÓTESIS EN LA REGRESIÓN MÚLTIPLE 409 Se ha supuesto que el factor del bloque estaba en el nivel bajo o "-" durante las ocho primeras corridas. El procedimiento de prueba incluye un análisis de varianza en el que se . ciertas pruebas de hipótesis acerca de los parámetros del modelo son una ayuda para medir la utilidad del modelo. X k • Las hipótesis apropiadas son H o :/3¡ =/32 H¡ : /3 j :. •• "Xk contribuye de manera significativa al modelo. Estos procedimientos requieren que los errores 8 i del modelo sigan una distribución normal e independiente con media cero y varianza er.4 PRUEBA DE ffiPÓTESIS EN LA REGRESIÓN MÚLTIPLE En los problemas de regresión lineal múltiple. Estos diseños generados por computadora se revisarán en el capítulo siguiente. con las cuatro corridas X¡ X2 X3 X4 -1 1 -1 1 -1 -1 1 1 -1 -1 1 1 1 -1 1 -1 se separarán los alias deAB de CD y permitirán que los bloques sean ortogonales (esto puede verse desarrollando la matriz X como se hizo anteriormente).1 Prueba de significación de la regresión La prueba de significación de la regresión es un procedimiento para determinar si existe una relación lineal entre la variable de respuesta y y un subconjunto de los regresores Xl' X 2. er). Es sencillo ver que la suma de los productos cruzados de cada columna con la columna del bloque no es cero. Para conseguir la ortogonalidad de los bloques. y en el nivel alto o "+" durante la novena corrida.NID(O. lo cual significa que los bloques han dejado de ser ortogonales para los tratamientos. Además.j y varianza er.. Por ejemplo. así como la determinación de cuáles son las corridas que habrán de aumentarse en el diseño original para separar los alias de las interacciones de interés potencial. .k.:i.. la ecuación anterior puede o Por lo tanto. donde el número de grados de libertad parax2 es igual al número de regresores del modelo. SSE == y'y. es decir. puesto que SST == L7=1 reescribirse como l.JI Ahora bien. == ¡3k == O consiste en calcular SSR / k MS R Fo == SSE /(n-k-1) MS (10-22) E yen rechazar H o siFoexcede aFa ..= 1=------. (10-21) Ahora bien. Por lo general la prueba se resume en una tabla del análisis de varianza como la tabla 10-6.. gresión) y una suma de cuadrados debida a los residuales (o al error).:.'=l Yi)2 / n == y'y .---- ! ( Yi)2 n (10-23) mientras la suma de cuadrados del error es SSE == y'y.. puede demostrarse que SSE/cr se distribuye como X~-k-l y que SSE y SSR son independientes. Asimismo. podría usarse el enfoque del valor Ppara la prueba de hipótesis y. El procedimiento de prueba para H O :¡31 == 132 == .lI-k-l' De manera alternativa.(L7=1 Yi)2 / n. rechazar H o si el valor P del estadístico F o es menor que a. es decir.(L. la suma de cuadrados de regresión es SS == /J'X'Y_ R . == ¡3k == Oes verdadera. si la hipótesis nula H o:¡31 == 132 == ./J'X'y '''.--. entonces SSRkr se distribuye como X~.1 .410 CAPÍTULO 10 AJUSTE DE MODELOS DE REGRESIÓN hace la partición de la suma de cuadrados total SS T en una suma de cuadrados debida al modelo (o a la re../J'X'y (10-24) Tabla 10-6 Análisis de varianza de la significación de la regresión en una regresión múltiple Fuente de variación Regresión Error o residual Total Suma de cuadrados SSR SSE Grados de libertad le n-le -1 Cuadrado medio MS R MS E SST n. Es sencillo encontrar una fórmula para calcular SSR' En la ecuación 10-16 se estableció una fórmula para calcular SSE. por lo tanto. -i=-=--l. X k en el modelo. es posible que los modelos que tienen valores grandes de R Z produzcan predicciones pobres de nuevas observaciones o estimaciones pobres de la respuesta media. Puesto que R 2 siempre se incrementa cuando se agregan términos al modelo. considere el modelo de regresión de la viscosidad.p (1..G~)(l.R 2 ) = 1. Sin embargo. independientemente de que la variable adicional sea estadísticamente significativa o no. Por ejemplo.tiene un coeficiente de regresión diferente de cero. En la tabla 10-4 se presenta también el coeficiente de determinación múltiple R 2. Se calcula como Z RajUstnda = 1.92697) = 0. De hecho. un valor grande de R 2 no implica necesariamente que el modelo de regresión sea adecuado. Por ejemplo.. La prueba de significación de la regresión en este ejemplo incluye las hipótesis H O :/3 l H l : /3 j = /3 2 = O :j:. Cuando la diferencia entre R Z YR~ustnda es considerable.(n-1) n. existe un buen riesgo de que se hayan incluido en el modelo términos no significativos. R 2 se incrementará. .-. donde R =-=1-- 2 SSR SST SSE SST (10-26) Como en los experimentos diseñados. el estadístico R Z ajustada no siempre se incrementará cuando se agreguen variables al modelo. Siempre que se agregue una variable al modelo. .. Por lo tanto.p (10-27) En general. por lo que se concluiría que al menos una de las dos variables -la temperatura (Xl) y la velocidad de alimentación (x z).' .915735 que está muy cerca de la R Z ordinaria. el valor de R~ustndn se decrementará con frecuencia. si se agregan términos innecesarios. R 2 es una medida de la cantidad de reducción en la variabilidad de y que se obtiene al utilizar las variables de regresión Xl' xz. algunos constructores de modelos de regresión prefieren usar el estadístico R 2 ajustada definido como R2 aJustnda =1_SSEI(n-p)=1_(n-1)(1_R2) SST I (n-1) n. La R 2 ajustada para el modelo se muestra en la tabla 10-4.. como se señaló antes. O para al menos una j El valor P de la tabla 10-4 para el estadístico F (ecuación 10-22) es muy pequeño.10-4 PRUEBA DE HIPÓTESIS EN LA REGRESIÓN MÚLTIPLE 411 y la suma de cuadrados total es SS T = Y'y _ -.0. en la tabla 10-4 se muestra una parte de la salida de Minitab para el modelo de regresión de la viscosidad del ejemplo lO-lo La sección superior de esta presentación es el análisis de varianza del modelo.n (I Yi)2 (10-25) Estos cálculos casi siempre se realizan con software de regresión. el modelo podría ser más eficaz con la inclusión de variables adicionales o quizá con la eliminación de una o más de las variables que están ya en el modelo. ya que el coeficiente de regresión 13 j depende de todos los demás regresares Xi (i :. entonces esto indica quexj puede eliminarse del modelo. En la sección superior de esta tabla se da la estimación de mínimos cuadrados de cada parámetro. Estas pruebas serían útiles para determinar el valor de cada uno de los regresares del modelo de regresión.. Se concluiría que ambas variables.. se le llama con frecuencia error estándar (se) del coeAl denominador de la ecuación 10-28. También puede examinarse directamente la contribución de una variable particular. el error estándar. Agregar una variable al modelo de regresión ocasiona siempre que la suma de cuadrados de regresión se incremente y que la suma de cuadrados del error se decremente. la cual contiene la salida de Minitab para el ejemplo 10-1.i: j) que están en el modelo. una manera equivalente de escribir el estadístico de prueba de la ecuación 10-28 es to = 13j . .412 10~4. agregar una variable no importante al modelo en realidad puede incrementar el cuadrado medio del error. A (10-29) Por lo tanto."~O Si H o:f3j = Ono se rechaza. El procedimiento para hacer esto es la prueba general de la significación de la regresión o. por ejemplo f3j . Por ejemplo. ~a2 C» ficiente de regresión f3 j' Es decir. el estadístico t y el valor P correspondiente. Este procedimiento también puede usarse para investigar la contribución de un subconjunto de los regresores al modelo. Considere el modelo de regresión con k regresores: y= Xf3+e . considere la tabla 10-4. la temperatura y la velocidad de alimentación. a la suma de cuadrados de regresión. reduciéndose así la utilidad del modelo. como se denomina con frecuencia. el método de suma de cuadrados extra.2 CAPÍTULO 10 AJUSTE DE MODELOS DE REGRESIÓN Pruebas de los coeficientes de regresión individuales y de grupos de coeficientes Muchas veces el interés se centra en probar hipótesis sobre los coeficientes de regresión individuales. contribuyen de manera significativa en el modelo.A - (10-30) se(f3 j ) La mayoría de los programas de computadora de regresión proporcionan la prueba t para cada parámetro del modelo. Las hipótesis para probar la significación de cualquier coeficiente de regresión individual. .z-c J (10-28) VA L- jj donde Cjj es el elemento de la diagonal de (X'xt1 correspondiente a 13 j' La hipótesis nula H o:f3j = Ose rechazasi ItoI > t a /2. Por ejemplo.i: j) están incluidas en el modelo. El estadístico de prueba para esta hipótesis es t o 13· = r:. Además.i: O . son H o :f3j = O H 1 :f3j:.. por ejemploxj . dado que otras Xi variables (i :.n-k-l' Observe que se trata en realidad de una prueba parcial o marginal. Es necesario decidir si el incremento de la suma de cuadrados de regresión es suficiente para garantizar el uso de la variable adicional en el modelo. SSR(/JIIP2) es independiente de MSE. Algunos autores llaman a la prueba de la ecuación 10-36 la prueba F parcial.ees(n x l)yp =k+ 1. ••• .Xes(n x p). la suma de cuadrados de regresión para todas las variables incluyendo la ordenada al origen es SSR (P) = /J'X'y y (p grados de libertad) MS E = y'y-/JX'y n.r) X [.. al menos una de las variablesxh x2.:J =O O 1]. X r (r < k) contribuye significativamente al modelo de regresión.t= El modelo puede escribirse como (10-32) donde Xl representa las columnas de X asociadas con PI y X2 representa las columnas de X asociadas con po. .pes(p x l). P.SSR(P2) (10-35) Esta suma de cuadrados tiene r grados de libertad.i~ 10-4 PRUEBA DE HIPÓTESIS EN LA REGRESIÓN MÚLTIPLE 413 donde y es (n x l). . ""Xr en Xl contribuye significativamente al modelo de regresión. Para encontrar la contribución de los términos enPl a la regresión. Querría determinarse si el subconjunto de regresares Xl' X 2. se rechazaHo.n-p.. Es la "suma de cuadrados extra" debida aPl' Observe que SSR(/JIIP2) es el incremento en la suma de cuadrados de regresión debido a la inclusión de las variables Xl' X 2 . por consiguiente. y (10-34) La suma de cuadrados de regresión debida a PI dado que P2 está ya en el modelo es SSR(PIIP2) = SSR(P).r. Sea que se haga la partición del vector de los coeficientes de regresión de la siguiente manera: P= donde PI es (r x 1) y P2 es [(p . Ahora bien. y se concluye que al menos uno de los parámetros enPl es diferente de cero y. y la hipótesis nulaPl = Opuede probarse con el estadístico (10-36) SiFo > Fa. . se ajusta el modelo suponiendo que la hipótesis nulaHo:fJl = Oes verdadera. Quieren probarse las hipótesis HO:Pl (10-31 ) Hl:Pl :. X r en el modelo.ra el modelo completo (incluyendo tanto aPl como ap2) se sabe que /J = (X'xtlX'y. Además.p A SSR(/J) se le llama la suma de cuadrados de regresión debida ap. El modelo reducido se encuentra a partir de la ecuación 10-32 con PI = O: y = X 2P2 +e (10-33) El estimador de mínimos cuadrados de P2 es /J2 = (X' 2X2tlX '2Y. por el estadístico de prueba se obtiene F. Esta suma de cuadrados tiene dos grados de libertad.. calculando SSR(/3jl/3o. Por lo tanto. /3j-1' /3j+1' oo.8 Observe que SSR(J311/30) se muestra en la parte inferior de la salida de Minitab de la tabla 10-4 bajo el encabezado "Seq SS".•••••••••••.3926 Observe que en el denominador deFose usaMSE del modelo completo (tabla 10-4). EJEMPLO 1O~6 .3955+ 7. Éste es el incremento en la suma de cuadrados de regresión que resulta de agregar X 2 a un modelo que contenía ya axlo Yse muestra en la parte inferior de la salida de Minitab en la tabla 10-4.. Observe que la prueba F parcial de una sola variable xj es equivalente a la prueba t de la ecuación 10-28. Para probar H O:/32 = O. se rechazaría H O:/32 = Oy se concluiría quex2 (velocidad de alimentación) contribuye significativamente al modelo. /3k) Éste es el incremento en la suma de cuadrados de regresión debido a que se agregaxj a un modelo que ya contiene ax1.t:.•••••••.••••••• Considere los datos de la viscosidad del ejemplo 10-1.3/1 267.840. SS R (/321 /30' (31) = 44.•••••••••. /31' . Entonces.os. Sin embargo.157.. Puede usarse para medir la contribución dexj como si fuera la última variable que se agregó al modelo. 13 = 1.67.40.157. 6397x 1 y la suma de cuadrados de regresión para este modelo (con un grado de libertad) es SS R (/311 (30) = 40.8 = 3316..1 a la que se llamó en la tabla la suma de cuadrados del modelo.414 CAPÍTULO 10 AJUSTE DE MODELOS DE REGRESIÓN La pruebaF parcial es muy útil. o = SSR(/321/30' MS E (31)/1 3316.. puesto que Fo.. las hipótesis que quieren probarse son H O :/32=0 H 1:/32 :.xj + l' oo. 1. O Esto requerirá la suma de cuadrados extra debida a /32' o SSR(/321/31' (30)=SSR(/30' /31' (32)-SSR(/30' (31) =SSR(/31' /321(30) -SSR(/321/30) Entonces. Es decir. xk..3 con 2 -1 = 1 grado de libertad. se tiene SS R (/31' /321(30) = 44. la prueba F parcial es un procedimiento más general por cuanto puede medir el efecto de conjuntos de variables.1. . El modelo reducido es Y= /30 + /31 X 1+10 El ajuste de mínimos cuadrados de este modelo es y= 1652. donde se probó la significación de la regresión..840.••••. por la tabla 10-4. oo..604 = 12.•••••••••••••. Suponga que se quiere investigar la contribución de la variablex2 (velocidad de alimentación) al modelo. xj_1 . .n_pse(~ j ) EJEMPLO 10-7 Se construirá un intervalo de confianza de 95% para el parámetro f3I del ejemplo 10-1.. es equivalente a la prueba t porque el cuadrado de una variable aleatoria t con v grados de libertad es una variable aleatoria F con 1 y v grados de libertad..62129.429184X103) ~ f3I ~ 7. obtenida con la ecuación 10-17.429184XlO-3) 7.2.. que el estadístico t para H O :f32 = Odio como resultado t o == 3.n_pse(~ j ) ~ f3 j ~ ~ j +ta/2. = ..604)(1. un intervalo de confianza de 100(1-a) por ciento para el coeficiente de regresión f3¡..... se sigue que jJ tiene una distribución normal con vector medio Py matriz de covarianza aZ(X'xtI • Entonces cada uno de los estadísticos ~¡-f3¡ ~O'2e¡¡ j= 0..604 yen == 1. El desarrollo de un procedimiento para obtener estos intervalos de confianza requiere suponer que los errores {s¡} tienen una distribución normal e independiente con media cero yvarianzaaZ. 10-5.. .1.2855 ~ f3I ~ ~ 7..62129+ 2. INTERVALOS DE CONFIANZA EN REGRESIONES MÚLTIPLES 10-5 Con frecuencia es necesario construir estimaciones de intervalos de confianza para los coeficientes de regresión {(3) y para otras cantidades de interés del modelo de regresión.....:: ~f3I ~~I +tO...13..025 ... ~I 7.......62129.9570 . k.6184) ~ f3I y el intervalo de confianza de 95% para f3I es 6...16~(267... el mismo supuesto que se estableció en la sección sobre la prueba de hipótesis de la sección 10-4.... Puesto que el estimador de mínimos cuadrados jJ es una combinación lineal de las observaciones.1 Intervalos de confianza para los c()eficientes de regresión individuales .. Por lo tanto. ....3925 = F o• .62129.. por la tabla 10-4.16~(267. Ahora bien.. . .5203? == 12. se encuentra que .025.p grados de libertad.2.16(0... y puesto que 0'2 = 267. es ~¡-ta/2. k (10-37) se distribuye como t con n . .. observe..16(0. 1... donde e¡¡ es el elemento (jj)-ésimo de la matriz (X'xt\ y 0'2 es la estimación de la varianza del error...........¡¡..62129+2.n_p~O'2e¡¡ ~f3j ~~j+ta/2.zc..429184 x 10-3....n_p~O'2ejj Observe que este intervalo de confianza también podría escribirse como (10-38) ~j - ta/2.10-5 INTERVALOS DE CONFIANZA EN REGRESIONES MÚLTIPLES 415 Debido a que esta prueba F parcial incluye un solo regresor.5203 y que t~ = (3. j == O........ Para ver esto.13~O'2ell ~I -t O 7...6184) 8....604)(1... f al2 .a) por ciento para la respuesta media en el puntoxOl . un intervalo de confianza de 100(1. como se ilustró en el ejemplo 10-1.XOk se calcula con la ecuación 10-39: Y(X O) = x~jJ Un intervalo de predicción de 100(1-a) por ciento para esta observación futura es Y(x o ). . ••• .416 1O~5. X 02 . por ejemploxOl . ••• . la verificación de la adecuación del modelo es una parte importante en el procedimiento del análisis de datos.. ••.2 CAPÍTULO 10 AJUSTE DE MODELOS DE REGRESIÓN Intervalo de confianza para la respuesta media También puede obtenerse un intervalo de confianza para la respuesta media en un punto particular.XOk • Si x'o = [1. X Ok • Se define primero el vector Xo x10l] = X 02 X Ok La respuesta media en este punto es J.. por ejemplo. es necesario tener cuidado para no hacer una extrapolación fuera de la región que contiene las observaciones originales. . 1O~7 DIAGNÓSTICOS DEL MODELO DE REGRESIÓN Como se destacó en los experimentos diseñados. ya que E[5{x o)] = E(x~jJ) ~ x~p = Jl ylxo' Y la varianza de Y(xo V[y(x o )] = a2x~ (X'Xr I X o (10-40) Por lo tanto. ••• .x02 . XOI' X 02 .lYl xo = (30 + (3IX Ol +(32 X 02 + . en un modelo de regresión deberán examinarse . +(3k X Ok = x~p Y(x o ) = x~jJ (10-39 La respuesta media estimada en este pU'1to es ) es Este estimador es insesgado. (10-42) Y(x o )+f aI2 .X OI 'X02' ••• . X Ok ."-p ~a2 (1 +x~ (X'XrIxo) Cuando se predicen nuevas observaciones y se estima la respuesta media en un punto dadox ol ..x02. Es de igual importancia en la construcción de modelos de regresión y.x02 . Yo S. Es muy posible que un modelo que se ajuste bien en la región de los datos originales deje de hacerlo fuera de esa región.XOk]' entonces una estimación puntual de la observación futura yo en el punto X OI . XOk es (10-41) ::1 ')' II I 1O~6 PREDICCIÓN DE NUEVAS OBSERVACIONES DE LA RESPUESTA Es posible usar un modelo de regresión para predecir observaciones futuras de la respuesta y que corresponden a valores particulares de los regresores.. .lI-p ~a2 (1 +x~ (X'XrIxo) S. En esta sección se presenta un breve resumen de estos procedimientos. A continuación se presenta una escalación que toma en consideración esta situación. En algunos conjuntos de datos. Para análisis más completos. Estos residuales escalados transmiten con frecuencia más información que los residuales ordinarios. siempre es necesario: 1) examinar el modelo ajustado para asegurarse de que proporciona una aproximación adecuada del verdadero sistema y 2) verificar que no se infringe ninguno de los supuestos de la regresión de mínimos cuadrados. por consiguiente. En general. ver Montgomery y Peck [82] y Myers [84]. como una región del espacio del regresor. Además de las gráficas de los residuales. El proceso de estandarización de la ecuación 10-43 escala los residuales al dividirlos por su desviación estándar promedio aproximada.y y resulta que la matriz de covarianza de los residuales es (10-45) Cov(e)= a 2 (I-H) La matriz 1 . 1O~ 7. ya que pueden representar algo tan simple como un error al registrar los datos o algo que sea motivo de mayor preocupación.10-7 DIAGNÓSTICOS DEL MODELO DE REGRESIÓN 417 siempre las gráficas de los residuales que se usaron en los experimentos diseñados. donde el modelo ajustado es una aproximación pobre de la verdadera superficie de respuesta. . I i . por lo que los residuales tienen varianzas diferentes y están correlacionados. y cualquier observación con un residual estandarizado que esté fuera de este intervalo es potencialmente inusual con respecto a su respuesta observada.. H = X(X'xt1X' se le llama generalmente la matriz "gorro" porque mapea el vector de los valores observados en un vector de los valores ajustados.. La matriz gorro y sus propiedades desempeñan un papel central en el análisis de regresión. los residuales pueden tener desviaciones estándar que difieren considerablemente. son muy útiles para buscar puntos atípicos. La mayoría de los residuales estandarizados deberán localizarse en el intervalo -3 :5 di :5 3. . Estos residuales estandarizados tienen media cero y varianza aproximadamente unitaria. Estos puntos atípicos deberán examinarse con atención. Un tipo de residual escalado es el residual estandarizado: d.12 (10-43) donde por lo general se usa fj = ~ MS E en los cálculos. existen otros diagnósticos del modelo que con frecuencia son útiles en la regresión. 2. Los residuales del modelo ajustado pueden escribirse convenientemente en la notación matricial como e =y.1 Residuales escalados y PRESS Residuales estandarizados y studentizados Muchos constructores de modelos prefieren trabajar con residuales escalados en lugar de los residuales de mínimos cuadrados ordinarios.=2 fj ¡ i = 1.H no es por lo general diagonal. El vector de los valores ajustados )Ji que corresponden a los valores observados Yi es y =xP =X(X'X)-¡ X'y (10-44) =Hy A la matriz 12 x 12. El modelo de regresión probablemente producirá resultados pobres o equivocados a menos que sea un ajuste adecuado. en particular para conjuntos de datos grandes.418 CAPÍTULO 10 AJUSTE DE MODELOS DE REGRESIÓN Por lo tanto.. Inicialmente. Además.. parecería que para calcular la PRESS es necesario ajustar 11 regresiones diferentes.. 11 e¡ (10-49) Por lo tanto. Sin embargo. Resulta que el residual PRESS i-ésimo es e(i) = 1.h. Las violaciones de los supuestos del modelo son más probables en los puntos remotos. Se sugiere graficar los residuales studentizados: r.. la PRESS utiliza cada subconjunto posible de 11 -1 observaciones como un conjunto de datos de estimación. 11 (10-47) con (j2 = MS E en lugar de e¡ (o d¡). Residuales PRESS La suma de cuadrados del error de predicción (PRESS. . En la tabla 10-3 se presentan las diagonales gorro hu Ylos residuales studentizados para el modelo de regresión de la viscosidad del ejemplo 10-1. del inglés Prediction Error Sum of Squares) proporciona una útil escalación de los residuales. . puesto que hu es una medida de localización del punto i-ésimo en el espacio x. ya que la PRESS es tan sólo la suma de cuadrados de los residuales PRESS. e(n)' Entonces el estadístico PRESS se define como la suma de cuadrados de los 11 residuales PRESS como en PRESS = ! i=l e~¡) = ! [Yi . En muchas situaciones la varianza de los residuales se estabiliza.Y(i)]2 (10-48) i=l Por lo tanto. y se utiliza una observación a la vez para formar un conjunto de datos de predicción. al utilizar el cuadrado medio residual MSE para estimar la varianza de los residuales en realidad se está sobreestimando V( e¡).11. suele recomendarse el examen de los residuales studentizados. ya que cualquier punto con un residual grande y una hu grande tiene una influencia potencialmente considerable sobre el ajuste de mínimos cuadrados. los residuales situados cerca del centro del espacio x tienen varianzas más grandes que los residuales situados en lugares más apartados. y estas violaciones pueden ser difíciles de detectar por la inspección de e¡ (o d¡) porque sus residuales serán por lo general más pequeños. los residuales estandarizados y studentizados transmiten con frecuencia información equivalente... 2. Se ajusta el modelo de regresión a las 11 . Para calcular la PRESS se selecciona una observación. Se recomienda tomar en consideración esta desigualdad de la varianza cuando se escalen los residuales. 2.. por ejemplo la i. Puesto que O ~ h¡¡ ~ 1.1 observaciones restantes y se usa esta ecuación para predecir la observación que se apartó Yi' Al denotar este valor predicho Y(i)' puede encontrarse el error de predicción del punto i como e(i) = Y¡ = Y(i)' Al error de predicción suele llamársele el residual PRESS i-ésimo. I 2 V(e i )=a (1-h¡i) = e¡ ~(j2(1-hi¡) i = 1. Los residuales studentizados tienen varianza constante V(r¡) = 1 independientemente de la localización de X¡ cuando la forma del modelo es correcta. produciéndose un conjunto de 11 residuales PRESS e(l)' e(2)' oo. En estos casos puede haber poca diferencia entre los residuales estandarizados y los studentizados. una fórmula de cálculo simple es PRESS = ! ( ~¡h )2 i=l (10-50) 1 u . la varianza de e¡ depende de dónde esté el punto Xi' En general. la PRESS puede calcularse a partir de los resultados de un solo ajuste de mínimos cuadrados a las 11 observaciones totales. . Sin embargo. la varianza del residual i-ésimo es (10-46) donde hu es el elemento i-ésimo de la diagonal de H. Por lo tanto. Este procedimiento se repite para cada observación i = 1. 7.p . En general. PRESS (10-51 ) RprediccióD = 1S JY Este estadístico ofrece cierto indicio de la capacidad predictiva del modelo de regresión. en comparación con el aproximadamente 93% de la variabilidad en los datos originales que explica el ajuste de mínimos cuadrados. En la siguiente sección se estudiarán otras medidas de influencia. al que es común llamar R-student. 1 = e. La capacidad predictiva global del modelo basado en este criterio parece ser muy satisfactoria.. si la observación i-ésima es influyente. dado por t. pero un modelo construido sin dicho punto producirá predicciones pobres. Otro enfoque sería usar una estimación de cr basada en un conjunto de datos en el que se elimina la observación i-ésima. ya que MSE es una estimación de cr generada internamente que se obtiene del ajuste del modelo a las n observaciones. R-student Es común considerar al residual studentizado T¡ comentado antes como el diagnóstico de un punto atípico. Por último. entonces S puede diferir significativamente de MSE. . ti) . Los puntos de los datos para los que hu es grande tendrán residuales PRESS grandes.10-7 DIAGNÓSTICOS DEL MODELO DE REGRESIÓN 419 por la ecuación 10-49 es sencillo ver que el residual PRESS es sólo el residual ordinario ponderado de acuerdo con los elementos de la diagonal de la matriz gorro hu. por ejemplo ? .h¡¡) 1 i = 1. En la tabla 10-3 se muestran los valores de laR-student para el modelo de regresión de la viscosidad del ejemplo 10-1. cabe señalar que la PRESS puede usarse para calcular una R 2 aproximada de predicción. n (10-53) En muchas situaciones habrá una ligera diferencia entre t¡ y el residual studentizado ri' Sin embargo. 2. podría esperarse que este modelo "explique" cerca de 89% de la variabilidad al predecir nuevas observaciones. Para el modelo de regresión de la viscosidad del ejemplo 10-1..9 = 0. La estimación de cr así obteniPuede demostrarse que da se denota por S 2 (n. ti tiene una distribución tll . la R-student ofrece un procedimiento más formal para detectar puntos atípicos a través de la prueba de hipótesis. El valor correspondiente del estadístico PRESS es PRESS = 5207. Se acostumbra usar MSE como una estimación de cr en el cálculo de T¡. Ninguno de esos valores es inusualmente grande.. y por lo tanto la R-student será más sensible a este punto. Estas observaciones serán por lo general puntos de alta influencia.8907 Por lo tanto. Se hace referencia a este enfoque como la escalación interna del residual. una diferencia grande entre el residual ordinario y los residuales PRESS indicará un punto donde el modelo se ajusta bien a los datos. los residuales PRESS pueden calcularse utilizando los residuales ordinarios y el valor de hu encontrado en la tabla 10-3.p)MSE _e¡2 /(l-h¡¡) S(i)= n-p-1 (10-52) t¡).7 47. Entonces 2 PRESS RprediccióD = 1S JY = 1- 5207. La estimación de cr de la ecuación 10-52 se usa en lugar de MSE para producir un residual studentizado externamente.635. bajo los supuestos usuales. Además.1' Por lo tanto. ~sti) (1. observe que 2pln :=: 2(3)/16 :=: 0. Puntos de acción de palanca La localización de los puntos en el espacio x es importante para determinar las propiedades del modelo. La atención suele centrarse en los elementos de la diagonal h¡¡. Para aplicar lo anterior al modelo de la viscosidad del ejemplo 10-1. quizá no haya nada malo con estos puntos. Puede demostrarse que este cociente es la distancia del vector X¡ al centroide de los datos restantes. se concluiría que no hay puntos de acción de palanca en estos datos. Es deseable considerar la localización del punto y la variable de respuesta cuando se mide la influencia. las estimaciones o predicciones de los parámetros pueden depender más del subconjunto influyente que de la mayoría de los datos. Como guía aproximada. :=: r/ V[Y(x¡ )] . las observaciones apartadas tienen potencialmente acciones o brazos de palanca desproporcionados sobre las estimaciones de los parámetros. Puesto que L.H). los valores predichos y los estadísticos de resumen usuales. ya que podría afectar el uso del modelo. por ejemplo P(i)' Esta medida de la distancia puede expresarse como P D. 11 (10-55) Observe que. el tamaño promedio de los elementos de la diagonal de la matriz H es pln. entonces. aparte de la constante p. H determina las varianzas y covarianzas de y y e. basada en todos los n puntos y la estimación obtenida al eliminar el punto i.revelar puntos que son potencialmente influyentes en virtud de su localización en el espacio x. Sería conveniente localizar estos puntos influyentes y valorar su impacto en el modelo. Como ya se señaló.~l h¡¡:=: rango(H) :=: rango(X) :=: p. Es decir. Cook [32a. El estadístico D¡ se calcula en realidad a partir de D. D¡ es el producto del cuadrado del residual studentizado i-ésimo y hu/(l-h¡¡). deberán eliminarse. en general las observaciones para las que D¡ > 1 se consideran influyentes.2 CAPÍTULO 10 AJUSTE DE MODELOS DE REGRESIÓN Diagnósticos de influencia En ocasiones se encuentra que un subconjunto pequeño de los datos ejerce una influencia desproporcio_ nada sobre el modelo de regresión ajustado. la observación i es un punto con acción de palanca alta. En particular. Si estos puntos influyentes son valores "malos". si un elemento h¡¡ de la diagonal es mayor que 2pln. Pero si controlan propiedades clave del modelo.375. En la tabla 10-3 se dan las diagonales gorro h¡¡ para el modelo de primer orden. sería deseable saberlo.375. p V(e¡) r/ h¡¡ p (l-h¡¡) i :=: 1. ya que V(Y) :=: a2H y V( e) :=: a2(I .P) pMS E i :=: 1. 2. :=: . (P u) . D¡ está compuesto por un componente que refleja la medida en que el modelo ajusta .oo.r 420 1O~7. Por lo tanto. puesto que ninguna de las h¡¡ excede 0. 2. la inspección de los elementos de H puede . Los elementos hu de H pueden interpretarse como la cantidad de acción de palanca ejercida porYj sobre J¡. Por lo tanto. En esta sección se describen e ilustran algunas medidas útiles. La matriz gorro H :=: X(X'Xt1X' es muy útil para identificar las observaciones influyentes. .P)'X'x(jJU) . b] ha sugerido el uso de una medida del cuadrado de la distancia entre la estimación de mínimos cuadrado~. de influencia. Influencia sobre los coeficientes de regresión Las diagonales gorro identificarán los puntos potencialmente influyentes debido a su localización en el espaciox. Es decir. Por otra parte. OO" n (10-54) Un valor de referencia razonable paraD¡ es la unidad. es decir. ni' Hay n = 2:.. ya que para calcular SSPE sólo se usa la variabilidad de las y en cada nivel Xi' Puesto que hay ni .':1 ni observaciones en total. Esto permite hacer la partición de la suma de cuadrados de los residuales SSE en dos componentes. 2. . Suponga que se tienen ni observaciones de la respuesta en el nivel i-ésimo de los regresores Xi' i = 1. .. Los dos componentes del segundo miembro miden el error puro y la falta de ajuste.1 grados de libertad del error puro en cada nivel Xi' el número total de grados de libertad asociados con la suma de cuadrados del error puro es ~ i=l (n¡-l)=n-m (10-59) La suma de cuadrados de la falta de ajuste SSWF =~ i=1 n¡(Yi -)Ji)2 (10-60) . Se observa que la suma de cuadrados del error puro (10-58) se obtiene calculando la suma de cuadrados corregida de las observaciones repetidas en cada nivel de X y haciendo después la agrupación en los m niveles de x. Sea queYij denota la observaciónj-ésima de1a respuesta en Xi' i = 1... SSE = SSpE +SSWF donde SSPE es la suma de cuadrados debida al ~rror puro y SSLOF es la suma de cuadrados debida a la falta de ajuste. Cualquiera de los componentes (o ambos) puede contribuir a un valor grande de Di' En la tabla 10-3 se muestran los valores de Di para el ajuste del modelo de regresión a los datos de la viscosidad del ejemplo 10-1.2. por 10 que no hay evidencia sólida de observaciones influyentes en estos datos. ésta es una medida independiente del modelo del error puro.. El residual (ij)-ésimo puede escribirse como (lO-56) donde jii es el promedio de las ni observaciones en Xi' Al elevar al cuadrado ambos miembros de la ecuación 10-56 y hacer la operación suma sobre i y j se obtiene (10-57) El primer miembro de la ecuación 10-57 es la suma de cuadrados de los residuales ordinaria. .. .2.m yj = 1.. m.lO-S PRUEBA DE FALTA DE AJUSTE 421 la observación i-ésimaYi y un componente que mide qué tan alejado está ese punto del resto de los datos. Ninguno de estos valores de Di excede 1. 10-8 PRUEBA DE FALTA DE AJUSTE En la sección 6-6 se indicó cómo agregar puntos centrales a un diseño factorial 2" le permite al experimentador obtener una estimación del error experimental puro. Si se satisface el supuesto de la varianza constante.. Puede presentarse un desarrollo general de esta partición en el contexto de un modelo de regresión. si Fa no excede Fa.J=If3 jXij' y el segundo término de la ecuación 10-62 es cero. entonces es probable que la función de regresión no sea lineal. si la verdadera función de regresión es lineal. Si los valores ajustados )Ji están cerca de las respuestas promedio)í.-SSPE I(n-m) . por lo general SSLOF se obtiene restando SSPE de SSE' El estadístico de prueba para la falta de ajuste es F a- SSWF I (m. entonces E(Yi ) = f3 a + 2:.p grajos de libertad asociados con SSLOF porque hay m niveles de x. dando como resultado E(MSLOF) = er.J=If3 jXij y E(MSLOF) > er. Si lasv¡se desvían mucho de lasy¡. entonces hay un fuerte indicio de que la función de regresión es lineal. Además. En una planta se destila aire líquido para producir oxígeno. La resistencia a la tensión de un producto de papel se relaciona con la cantidad de madera dura en la pulpa. Se producen 10 muestras en la planta piloto y los datos obtenidos se presentan en la siguiente tabla. donde las réplicas de las corridas son puntos centrales de un diseño factorial 22 • 10~9 PROBLEMAS 10-1.p) MSWF . entonces el modelo tentativo habrá de abandonarse y deberán hacerse intentos para encontrar una ecuación más apropiada. e) Encontrar un intervalo de confianza de 95% para el parámetro {31' 10-2. Probar el modelo del inciso a para la significación de la regresión.t: f3 a + 2:. entonces el estadístico Fa sigue la distribución Fm-p. nitrógeno y argón. Sin embargo. para probar la falta de ajuste.n-m' Por lo tanto.n-m' Es sencillo incorporar este procedimiento de prueba en el análisis de varianza. m-p. y el valor esperado de MSLOF es (10-62) Si la verdadera función de regresión es lineal. correspondientes. Resistencia 160 Porcentaje de madera dura 10 Resistencia Porcentaje de madera dura 171 175 182 184 b) 15 15 20 20 181 188 193 195 200 20 25 25 28 30 a) Ajustar un modelo de regresión lineal que relacione la resistencia con el porcentaj e de madera dura. entonces E(Yi ) :. De manera alternativa. Si se concluye que la función de regresión no es lineal.422 CAPÍTULO 10 AJUSTE DE MODELOS DE REGRESIÓN es una suma ponderada de los cuadrados de las desviaciones entre la respuesta media Yi en cada nivel Xi y el valor ajustado correspondiente. si la verdadera función de regresión no es lineal. medida por el .MS pE (10-61) El valor esperado de MSPE es er.m-p. se calcularía el estadístico de prueba Fa y se concluiría que la función de regresión no es lineal si Fa > Fa. El ejemplo 6-6 es una ilustración muy completa de este procedimiento. y se pierden p grados de libertad porque deben estimarse p parámetros para el modelo. En lo que a los cálculos se refiere. Se piensa que el porcentaje de impurezas en el oxígeno se relaciona linealmente con la cantidad de impurezas en el aire. n-m' no existe evidencia sólida de falta de ajuste y MSPE y MSLOF se combinan con frecuencia para estimar er. Hay m . 3 1. Una muestra de los datos de operación de la planta se presenta a continuación: Pureza (%) Conteo de contaminación (ppm) 93.22 92. 10-6.9 1.0 33.75 91. 10-4. Se realizó un estudio sobre el desgaste y de un cojinete y su relación conx¡ = viscosidad del aceite y X 2 = carga.1 0.1 2.9 1. 10-5.6 0. b) Probar la significación de la regresión. Graficar los residuales del problema 10-1 y comentar la adecuación del modelo.0 40.59 91. e) Calcular el estadístico t para cada parámetro del modelo.81 94.4 1.6 15.45 92. Se llevó a cabo un experimento en el laboratorio y los datos colectados fueron: Potencia al freno 225 212 229 222 219 278 246 237 233 224 223 230 rpm 2000 1800 2400 1900 1600 2500 3000 3200 2800 3400 1800 2500 Octanaje 90 94 88 91 86 96 94 90 88 86 90 89 Compresión 100 95 110 96 100 110 98 100 105 97 100 104 .83 92.08 90.68 10-3. Se piensa que la potencia al freno desarrollada por el motor de un automóvil en un dinamómetro es una función de la rapidez del motor en revoluciones por minuto (rpm).20 91.47 91. e) Encontrar un intervalo de confianza de 95% para 13¡.3 1.6 1.0 1. Graficar los residuales del problema 10-2 y comentar la adecuación del modelo.0 43.36 92.5 22.03 94. Utilizando los resultados del problema 10-1.7 1.0 1. el octanaje del combustible y la compresión del motor.2 1. a) Ajustar un modelo de regresión lineal a los datos. ¿Qué conclusiones pueden sacarse? 10-7.Il'rrnm i 1 " i 10-9 PROBLEMAS 423 "conteo de contaminación" en partes por millón (ppm). b) Probar la significación de la regresión.6 1. probar el modelo de regresión para la falta de ajuste. Se obtuvieron los siguientes datos: y 193 230 172 91 113 125 x¡ 1.2 0.0 X2 851 816 1058 1201 1357 1115 a) Ajustar un modelo de regresión lineal múltiple a los datos.99 93.75 93.10 93. Analizar los residuales del modelo de regresión del problema 10-7.00 Temperatura 150 180 150 180 150 180 150 180 a) Suponga que quiere ajustarse un modelo de los efectos principales a estos datos. Considere el experimento factaria12 4 del ejemplo 6-2.1.00 1.00 2.00 2.00 2. b) ¿La matriz que se obtuvo en el inciso a es diagonal? Comentar la respuesta. 10-9.424 CAPÍTULO 10 AJUSTE DE MODELOS DE REGRESIÓN a) Ajustar un modelo de regresión múltiple a estos datos.00 2.00 1. ¿Esta matriz es diagonal? Comentar la respuesta.150 30 Establecer la matriz X'X para el modelo en términos de este conjunto de variables codificadas.O 1. El rendimiento de un proceso químico se relaciona con la concentración del reactivo y la temperatura de operación. ¿son necesarios los tres regresares en el modelo? 10-8. ajustar el modelo de regresión polinomial de segundo orden . Se realiza un experimento con los siguientes resultados: Rendimiento 81 89 83 91 79 87 84 90 Concentración 1. ¿Cómo se comparan estas conclusiones con las del ejemplo original? 10-11. Suponga que falta la última observación.5 x2 = Temperatura -165 15 Establecer la matriz X'X para el modelo en términos de estas variables codificadas.5 0. Establecer la matriz X'X utilizando los datos exactamente como aparecen en la tabla. b) Probar la significación de la regresión. e) Suponga que el modelo se escribe en términos de las variables codificadas "usuales" xI = Concentración -1.0 X 2 =------''---------- Temperatura . 10-10. Suponga que faltan las dos últimas observaciones. Volver a analizar los datos y sacar conclusiones. ¿Cuál es el resultado de la comparación de estas conclusiones con las del ejemplo original? 10-12.00 1. ¿Qué conclusiones pueden sacarse? e) Con base en las pruebas t. Considere el experimento factorial 24 del ejemplo 6-2. ¿Esta matriz es diagonal? Comentar la respuesta. Volver a analizar los datos y sacar conclusiones. Comentar la adecuación del modelo. d) Definir un nuevo conjunto de variables codificadas XI = -------- Concentración . e) Resumir lo que se haya aprendido acerca de la codificación de variables con este problema. Dados los datos siguientes. Demostrar que el modelo con un solo factor Yij = 1-1 + T¡ + cij.130 .11 donde las W¡ son constantes desconocidas.5 0.0 4. pero la varianza de las y depende ahora del nivel de x.10-9 PROBLEMAS 425 y 26 24 175 160 163 55 62 100 26 30 70 71 x¡ 1.5 Después de que se haya ajustado el modelo. Mínimos cuadrados ponderados.f3¡x¡ )2. donde la matriz X se compone de ceros y unos. 3. Demostrar que si se eligen las estimaciones de los coeficientes de regresión para minimizar la suma de cuadrados de los errores ponderados dada por.0 1. Al trabajar con la restricción de un número par de puntos experimentales.5 1.5 2.5 1. Relación entre el análisis ae varianza y el análisis de regresión.± w¡(y¡ . ¿dónde deberán colocarse estos puntos para minimizar V(/3¡)? (Nota: usar el diseño que se pide en este ejercicio con sumo cuidado. b) Encontrar el rango de X'X.0 1. tiene propiedades indeseables.0 2. llamadas con frecuencia ponderaciones. 10-13.=1 =! . aun cuando minimiza V(/3¡). ¿Es posible obtener (X'X)-¡? e) Suponga ql1e se elimina la primera ecuación normal y se agrega la restricción ~.0 1. 10-14. las ecuaciones normales de mínimos cuadrados resultantes son 1=1 ~02: w¡+~¡2: w¡x¡ = i=l i=1 n n 2: w¡Y¡ .0 4. a) Considere el modelo de regresión cuadrático del problema 10-12. . Después a) Escribir las ecuaciones normales (X'X)jJ = X'y y compararlas con las ecuaciones normales que se encontraron en el capítulo 3 para este modelo. por ejemplo. encontrarla. x~ y X¡X 2 del modelo. Suponga que se está haciendo el ajuste de una línea recta y se desea hacerla varianza de /3¡ tan pequeña como sea posible.0 1. Myers y Montgomery [85a]. Únicamente si se tiene una gran seglllidad de que la verdadera relación funcional es lineal deberá considerarse el uso de este diseño.=1 n ~o! W¡x¡+~¡! W¡X.5 1.5 2.5 X2 1. es decir.~¡ ni ¡ = o. probar la significación de la regresión.0 4.0 3.j = 1. ya que.=1 . b) Usar el método de la suma de cuadrados extra para evaluar el valor de los términos cuadráticos X¡2.) 10-16.5 1. V(ylx. Cualquier modelo del análisis de varianza puede expresarse en términos del modelo lineal general y = xfJ + e.0 1.3..5 0. i = 1. .)=a 2 = 1 l a? w¡ i = 1. Hallar la suma de cuadrados de regresión jJ'X'yy compararla con la suma de cuadrados de los tratamientos del modelo con un solo factor.2.4 puede escribirse en la forma del modelo lineal general.=1 W¡X¡Y¡ .2. Calcular los estadísticos t de cada uno de los parámetros del modelo y comentar las conclusiones a que se llega a partir de estas cantidades.5 1.0 2. . 10-15.0 0.2..5 1. ¿Tiene solución el sisterila de ecuaciones resultante? De ser así. Suponga que se está ajustando la línea recta Y = 130 + f3¡x + c. ver. . d) Considerando los incisos a y e. ¿qué estrategia de aumento se preferiría y por qué? 10-18.~'''1 426 CAPÍTULO 10 AJUSTE DE MODELOS DE REGRESIÓN 10-17. Considere el diseño 2i. Quiere aumentarse el diseño original con un grupo de cuatro corridas para separar los alias de estos efectos. Encontrar las varianzas y las covarianzas de los coeficientes de regresión (ignorando los bloques) para el modelo del inciso a. los efectos observados más grandes sanA + BD.:/ analizado en el ejemplo 10-5. B + AD y D + AB. :11 "¡ ~:J +13 24X2X4 + e e) ¿Es posible separar los alias de estos efectos con menos de cuatro corridas adicionales? . a) Suponga que se opta por aumentar el diseño con la corrida única seleccionada en ese ejemplo. Considere un diseño 2. a) ¿Cuáles son las cuatro corridas que se harían? b) Encontrar las varianzas y las covarianzas de los coeficientes de regresión del modelo b) y= 130 +f3¡x¡ +f32 X2+f34 x 4+f312 X¡X 2 +f3¡4 X¡X 4 :::1 . Encontrar las varianzas y las covarianzas de los coeficientes de regresión del modelo (ignorando los bloques): y= 130 +f3¡x¡ +f32 x 2+f33 x 3+f34 x 4 +f3 12 X¡X 2 +f334X3X4 +e ¿Hay otras corridas de la fracción alterna que separarían los alias AB de CD? e) Suponga que el diseño se aumenta con las cuatro corridas sugeridas en el ejemplo 10-5.t Suponga que después de correr el experimento. como se muestra en la figura 11-2. Por 10 tanto. El rendimiento del proceso es una función de los niveles de la temperatura y la presión.Métodos de superficies de respuesta y otros enfoques para la optimización de procesos 11~1 INTRODUCCIÓN A LA METODOLOGÍA DE SUPERFICIES DE RESPUESTA La metodología de superficies de respuesta. +f3k Xk +8 (11-1) 427 . En la mayoría de los problemas MSR. la forma de la relación entre la respuesta y las variables independientes es desconocida. Si la respuesta está bien modelada por una función lineal de las variables independientes. Por ejemplo. el primer paso de la MSR es encontrar una aproximación adecuada de la verdadera relación funcional entre y y el conjunto de variables independientes. En la gráfica de contorno se trazan las líneas de respuesta constante en el plano Xl' X 2• Cada contorno corresponde a una altura particular de la superficie de respuesta. o MSR. por ejemplo. con frecuencia se grafican los contornos de la superficie de respuesta. Para ayudar a visualizar la forma de una superficie de respuesta. particularmente en los capítulos sobre diseños factoriales. y= ¡(xp X2 )+8 donde 8 representa el ruido o error observado en la respuestay. donde r¡ se grafica contra los niveles de X¡ y X 2• Se han visto ya gráficas de superficie de respuesta como ésta.. Si la respuesta esperada se denota por E(y) = ¡(Xl' X2) = r¡. Por 10 general se emplea un polinomio de orden inferior en alguna región de las variables independientes. entonces a la superficie representada por r¡ = ¡(Xp X2 ) se le llama· superficie de respuesta.. entonces la función de aproximación es el modelo de primer orden y= 130 +f3¡x¡ +f32 X2 + . es una colección de técnicas matemáticas y estadísticas útiles en el modelado y el análisis de problemas en los que una respuesta de interés recibe la influencia de diversas variables y donde el objetivo es optimizar esta respuesta. suponga que un ingeniero químico quiere encontrar los niveles de temperatura (Xl) y presión (x 2) que maximicen el rendimiento (y) de un proceso. También se ha visto antes la utilidad de las gráficas de contorno. Por 10 general la superficie de respuesta se representa gráficamente como en la figura 11-1. '1 428 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA 70 ¡::11 :b "O Ql Ql "" o ~ 60 o. ~ Temperatura (oC) X 2 ~ Presión (psi) 10 Figura 11-2 Gráfica de contorno de una superficie de respuesta. . CIl 50 e 'E 'C e OC Ql Ql o 40 100 X. CIl 50 El e 'E 'C e OC Ql Ql 40 X. 70 ¡::11 :b 60 "" o "O Ql Ql ~ o. ~ Temperatura (oC) 20 X 160 10 2 ~ Presión (psi) Figura 11-1 Superficie de respuesta tridimensional donde se indica el rendimiento esperado (1]) como una función de la temperatura (Xl) y la presión (x 2). tal como el modelo de segundo orden y= 130 + L i=l k f3¡X¡ + L i=1 k f3¡¡X. Los parámetros del modelo pueden estimarse de manera más eficiente cuando se emplean los diseños experimentales apropiados para recolectar los datos. entonces el análisis de la superficie ajustada será un equivalente aproximado del análisis del sistema real. Desde luego. es probable que un modelo polinomial sea una aproximación razonable de la verdadera relación funcional en el espacio completo de las variables independientes. como el de segundo orden. Estos diseños se revisan en la sección 11-4. como en el caso de las condiciones de operación actuales de la figura 11-3. o ambos.11-1 INTRODUCCIÓN A LA METODOLOGÍA DE SUPERFICIES DE RESPUESTA 429 Si hay curvatura en el sistema. Región del óptimo """""--. Una vez que se ha encontrado la región del óptimo. pero para una región rdativamente pequeña suelen funcionar bastante bien. El método de mínimos cuadrados. El objetivo en este caso es llevar al experimentador de manera rápida y eficiente por la trayectoria del mejoramiento hasta la vecindad general del óptimo. entonces la situación puede considerarse como "el descenso a un valle". entonces debe usarse un polinomio de orden superior. el sistema presenta una curvatura moderada y el modelo de primer orden será apropiado. Si la superficie ajustada es una aproximación adecuada de la verdadera función de la respuesta. Muchas veces. Después se realiza el análisis de la superficie de respuesta utilizando la superficie ajustada. estudiado en el capítulo 10. La MSR es un procedimiento secuencial. .Región de la operabilidad del proceso ) 85 / / l!ayectoria del _ mejor~miento //80 /75 / r/E--~-- ¡: 70 Contornos de respuesta constante // /' // /' Figura 11·3 El carácter secuencial de la MSR. + LL i<} f3ijX¡X j +10 (11-2) En casi todos los problemas MSR se usa uno de estos modelos. Si el verdadero óptimo es un punto de respuesta mínima. El objetivo último de la MSR es determinarlas condiciones de operación óptimas del sistema o determinar una región del espacio de los factores en la que se satisfagan los requerimientos de operación. En la figura 11-3 se puede ver que el análisis de una superficie de respuesta puede considerarse como "el ascenso a una colina". se usa para estimar los parámetros de los polinomios de aproximación. donde la cima de ésta representa el punto de la respuesta máxima. cuando se está en un punto de la superficie de respuesta que está apartado del óptimo. y llevarse a cabo un análisis para localizar el óptimo. Los diseños para ajustar superficies de respuesta se denominan diseños de superficie de respuesta. puede emplearse un modelo más elaborado. es decir. entonces esta técnica se llama método del deseen. es decir. si lo que se pretende es una minimización. el objetivo del experimentador es pasar con rapidez a la vecindad general del óptimo.". Desde luego. El método del ascenso más pronunciado es un procedimiento para moverse secuencialmente sobre la trayectoria del ascenso más pronunciado. los·contornos de y. en la dirección del incremento máximo de la respuesta.r . los pasos sobre la de respuesta de primer orden ajustada ~i~rli'" y=10 Trayectoria del ascenso m. En tales circunstancias. .. Por lo tanto. Para ello desea usarse un procedimiento experimental económico y eficiente. 11~2 MÉTODO DEL ASCENSO MÁs PRONUNCIADO Frecuentemente la estimación inicial de las condiciones de operación óptimas del sistema estarán lejos del óptimo real. El modelo ajustado de primer orden es y= ~o + L ~iXi i=l k (11-3) y la superficie de respuesta de primer orden. .. so más pronunciado. Análisis más detallados de la MSR se encuentran en Myers y Montgomery [85a]. Cuando se está muy lejos del óptimo. La dirección del ascenso más pronunciado es aquella enla que y se incrementa con mayor rapidez.. 430 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA 1 ~. por lo general se supone que un modelo de primer orden es una aproximación adecuada de la verdadera superficie en una región pequeña de las x.\ y = 50 y=20 X1 Figura 11·4 Superficie de respuesta de primer orden y trayectoria del ascenso más pronunciado. Por lo general se toma como la trayectoria del ascenso más pronunciado a la recta que pasa por el centro de la región de interés y que es normal a la superficie ajustada. Esta dirección es paralela a la normal de la superficie de respuesta ajustada. Khuri y Cornell [67] y Box y Draper [16b]. es una serie de líneas paralelas como las que se muestran en la figura 11-4. 775x1 +0. Puesto que es improbable que esta región contenga el óptimo.5 40.6 35 35 35 35 35 -1 -1 1 1 O O O O O -1 1 -1 1 O O O O O . El tamaño real del paso lo determina el experimentador con base en el conocimiento del proceso o de otras consideraciones prácticas. El ingeniero opera actualmente el proceso con un tiempo de reacción de 35 minutos y una temperatura de 155°F.44+0. Entonces puede ajustarse un nuevo modelo de primer orden. En general.7 40.35 x =--1 5 y x2 = -5 . EJEMPLO 11~ 1 .5 40. Se conducen experimentos sobre la trayectoria del ascenso más pronunciado hasta que deja de observarse un incremento adicional en la respuesta.1. determinarse una nueva trayectoria del ascenso más pronunciado y el procedimiento continúa.11-2 MÉTODO DEL ASCENSO MÁs PRONUNCIADO 431 trayectoria son proporcionales a los coeficientes de regresión {~¡}.l denota la variable natural tiempo y. Observe que el diseño usado para recabar estos datos es un factorial 22 aumentado con cinco puntos centrales. En última instancia.0 -155 El diseño experimental se muestra en la tabla 11-1. En este momento se realizan experimentos adicionales para obtener una estimación más precisa del óptimo. que dan como resultado rendimientos de cerca de 40%. la falta de ajuste del modelo de primer orden indica que se ha llegado a ella. 160tE Para simplificar los cálculos.9 41.0 40.3 40. si. Aplicando los métodos para diseños de dos niveles se obtiene el siguiente modelo en las variables codificadas: y= 40. Un ingeniero químico está interesado en determinar las condiciones de operación que maximizan el rendimiento de un proceso. el experimentador llegará a la vecindad del óptimo.3 40.1).2 la variable natural temperatura. el ingeniero ajusta un modelo de primer orden y aplica el método del ascenso más pronunciado.2 40. Por lo tanto.325x 2 Tabla 11-1 Datos del proceso para ajustar el modelo de primer orden Variables naturales 30 30 40 40 150 160 150 160 155 155 155 155 155 Variables codificadas Xl X2 Respuesta y 39. El ingeniero decide que la región de exploración para ajustar el modelo de primer orden deberá ser (30. Además. Las réplicas del centro se usan para estimar el error experimental y permitir la verificación de la adecuación del modelo de primer orden. Es posible ajustar un modelo de primer orden a estos datos por el procedimiento de mínimos cuadrados.40) minutos de tiempo de reacción y (150. Dos variables controlables influyen en el rendimiento del proceso: el tiempo de reacción y la temperatura de reacción. las variables independientes se codificarán en el intervalo usual (-1. el diseño está centrado alrededor de las condiciones de operación actuales del proceso. entonces las variables codificadas son . 058 que es pequeño. con la respuesta promedio en el centro del diseño.9)] =t(-0.432 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA Antes de explorar a lo largo de la trayectoria del ascenso más pronunciado. Obtener una estimación del error.Ye = 40. Las réplicas del centro pueden usarse para calcular una estimación del error de la siguiente manera: a A 2 =-'--"'----------'----'---'----<----'-----''----------'----'-----'------'--- (40.035 . Recuerde que ésta consiste en comparar la respuesta promedio en los cuatro puntos de la porción factorial del diseño. Si /311 y/322 son los coeficientes de los términos "cuadráticos puros" x¡ y x~.2)2 +( 40.40. La suma de cuadrados de la interacción con un solo grado de libertad es (-0. entoncesYF-Ye es una estimación de/311 + /322' En el ejemplo tratado aquí. entonces y F -ye es una medida de esta curvatura.3)+(lx41. Si existe curvatura cuadrática en la verdadera función de la respuesta. lo cual indica que la interácción es insignificante.5)+(-lx40.3)2 +( 40. 7)2 +( 40.425. Verificar los efectos cuadráticos (curvatura). deberá investigarse la adecuación del modelo de primer orden.425.(202. La interacción entre las variables se representaría por el coeficiente /312 del término de un producto cruzadox¡x2sumado al modelo. La estimación de mínimos cuadrados de este coeficiente es simplemente la mitad del efecto de la interacción que se calcula como en un diseño factorial 22 ordinario.1)2 SS Interacción = 4 = 0. El diseño 22con puntos centrales permite al experimentador 1.0025 0. por ejemplo Ye = 40.0)+(-lx40.1) = -0.46 = -0. Otra verificación de la adecuación del modelo de línea recta se obtiene aplicando la verificación del efecto de curvatura cuadrática pura de la sección 6-6.3)2 /5 4 = 0.5)2 +( 40. 2.0430 = 0. una estimación del término cuadrático puro es ~11 +~22 = YF .025 :J .46. 3. o ::1 '1 11 ~¡2 = t[(lx39.0025 Al comparar SSInteracción con &2 se obtiene el estadístico para la falta de ajuste F = SSInteracción &2 0. por ejemplo YF = 40. Verificar las interacciones (o términos de productos cruzados) del modelo.0430 En el modelo de primer orden se supone que las variablesx¡ y X 2 tienen un efecto aditivo sobre la respuesta.6)2 . x2 = O) Y tiene pendiente 0.063 0.8142 La suma de cuadrados con un solo grado de libertad asociada con la hipótesis nula.0022 Grados de libertad 2 6 1 1 4 8 Cuadrado medio 1. los pasos sobre la trayectoria del ascenso más pronunciado son &1 = 1.11-2 MÉTODO DEL ASCENSO MÁS PRONUNCIADO 433 Tabla 11-2 Análisis de varianza del modelo de primer orden Suma de cuadrados Fuente de variación Modelo (/31' /32) Residual (Interacción) (Cuadrático puro) (Error puro) Total 2.8250 0.0:30 =0. En la tabla 11-2 se resume el análisis de varianza de este modelo.0002 0. En la tabla 11-3 se muestran los resultados tanto en variables codificadas como naturales.=~0. se haría un movimiento de 0.42. Aun cuando la manipulación matemática de las variables codificadas es más sencilla.775 unidades en la dirección Xl por cada 0. Para apartarse del centro del diseño -el punto (Xl = 0.x2 = 0).058 0.10 i=1.0027 es pequeño.063 Valor P 0.2 Ambos coeficientes de regresión 131 y 132 son grandes en comparación con sus errores estándar. H o:/3u + /322 = O. mientras que la prueba F de la regresión global es significativa. Además. El ingeniero calcula puntos sobre esta trayectoria y observa los rendimientos en los mismos hasta que se nota un decremento en la respuesta.325/0.0027 donde /1 F Y/1 e son el número de puntos de la porción factorial y el número de puntos centrales. En este punto no hay razón para cuestionar la adecuación del modelo de primer orden.0430 = 0.0027 0.0027) (0.775. El ingeniero decide usar 5 minutos de tiempo de reacción como tamaño básico del paso.8215 0.sobre la trayectoria del ascenso más pronunciado.1720) 3. el error estándar de 131 y 132 es se(13i)=~M:E =P. deben usarse las variables naturales cuando se corre el proceso. respectivamente. no hay indicios de un efecto cuadrático puro.0025) (0. Las verificaciones de la interacción y la curvatura no son significativas.325 unidades en la direcciónx2 • Por lo tanto.035)2 4+5 = 0.83 0. la trayectoria del ascenso más pronunciado pasa por el punto (Xl = 0.775) &1 = 0.0025 0.1772 (0.0000 Y &2 = (0.325/0.4125 0.0430 Fo 47. En la figura 11-5 se grafica el . es /1 F/1 e (rF )2 SS Cuadrática pura = /1 F +/' re 'e = (4)(5)(-0. Al utilizar la relación entre Sl y Xl' se observa que 5 minutos de tiempo de reacción es equivalente a un paso en la variable codificada Xl de &1 = 1. Puesto que F = SSCuadráticapura 8'2 = 0. Por lo tanto. 7 53. +~ + 2~ + 3~ + 4~ + 5~ +M + 7~ + S~ + 9~ + 10~ + 1l~ + 12~ O 0.3 76.20 4.62 5.00 X2 Origen Origen Origen Origen Origen Origen Origen Origen Origen Origen Origen Origen ".26 1.00 3.36 3.1 ::1 :¡ Ii .42 0.00 7. todos los pasos después de este punto resultan en un decremento del rendimiento.00 6.1 49.52 2.00 12.00 4.6 80.42 0.10 2. 180]. deberá ajustarse otro modelo de primer orden en la vecindad general del punto (~l = 85.84 1.00 2. ~2 = 175). Por lo tanto.8 59.78 4. las variables codificadas son ~l .00 5. Se observan incrementos de la respuesta hasta el décimo paso.04 35 5 40 45 50 55 60 65 70 75 SO 85 90 95 '.OO 9.2 155 2 157 159 161 163 165 167 169 171 173 175 179 181 Respuesta y 41.00 10. ~2 = 175).4 77. 90] Y para ~2 es [170.9 65. '1 rendimiento en cada paso de la trayectoria del ascenso más pronunciado.1 x1 O 1.00 1. Por lo tanto.00 11. La región de exploración para ~1 es [80.2 75. sin embargo.0 42.0 70.434 Tabla 11-3 Pasos Origen ~ CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA Experimento del ascenso más pronunciado para el ejemplo 11-1 Variables codificadas Variables naturales '.00 S. Se ajusta un nuevo modelo de primer orden alrededor del punto (~l = 85.94 3.85 x =--1 5 y x2 = ~2 -175 5 90 80 E e 70 'E 'C e Ql ~ 60 50 2 3 4 5 6 Pasos 7 8 9 10 11 12 Figura 11-5 Rendimiento contra pasos sobre la trayectoria del ascenso más pronunciado para el ejemplo 11-1.9 47.68 2. . Tabla 11-5 Análisis de varianza del segundo modelo de primer orden Fuente de variación Regresión Residual (Interacción) (Cuadrático puro) (Error puro) Total Suma de cuadrados 5. = Xk = Oes la base o punto origen.72 201.2120) 16.00xl +O.0 79. o se seleccionaría la variable que tiene el coeficiente de regresión absoluto I~ j I más grande.00 11. Entonces 1.7 79.3 80.2500) (10.5 o o o o o De nueva cuenta se usa un diseño 22 con cinco puntos centrales..2500 10.xj • En general.0530 4.1200 (0.9 80. se seleccionaría la variable de la que se tenga mayor información. Esta curvatura en la verdadera superficie puede indicar que el experimentador se encuentra cerca del óptimo.1200 Grados de libertad 2 6 Cuadrado medio Fa Valor P 1 1 4 0.6580) (0. por ejemplo D.8 76.. Suponga que el punto Xl =X 2 = . Se elige el tamaño del paso en una de las variables del proceso. Por el ejemplo 11-1 se observa que la trayectoria del ascenso más pronunciado es proporcional a los sig~ nos y magnitudes de los coeficientes de regresión del modelo ajustado de primer orden Y=~a+ L ~iXi i=l k Es sencillo dar un algoritmo general para determinar las coordenadas de un punto sobre la trayectoria del ascenso más pronunciado.0955 0.0001 8 . incluyendo las verificaciones de la interacción y del término cuadrático puro.6580 0. El diseño experimental se muestra en la tabla 11-4.09 0.SOx 2 En la tabla 11-5 se presenta el análisis de varianza de este modelo.0 79. En este punto es necesario hacer análisis adicionales para localizar el óptimo con mayor precisión. El ajuste del modelo de primer orden a las variables codificadas de la tabla 11-4 es y= 78.5 79.11-2 MÉTODO DEL ASCENSO MÁs PRONUNCIADO 435 Tabla 11-4 Datos para el segundo modelo de primer orden Variables naturales ~l 80 80 90 90 85 85 85 85 85 ~2 170 180 170 180 175 175 175 175 175 Variables codificadas Xl Respuesta y Xz -1 -1 1 1 o o o o o -1 1 -1 1 no 78.97+1. Las verificaciones de la interacción y del término cuadrático puro implican que el modelo de primer orden no es una aproximación adecuada. = ay / aXk = O. éste es &1 = 1. se usan las relaciones & =5 1 que dan como resultado ~Sl y y ~S2 = &2(5)= 0. será el conjunto de las XI' X ..42 (0. 11~3.325 = 0. . .. 3.. Por lo tanto..x2.. Estas tres posibilidades se ilustran en las figuras 11-6 a 11-8. o 3) un punto silla...436 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA 2. . . ""Xk que optimizan la respuesta predicha...0 Y&2 = 0. El tamaño del paso de las otras variables es L. considere la trayectoria del ascenso más pronunciado calculada en el ejemplo 11-1. Puesto quex I tiene el coeficiente de regresión más grande. En esta sección se indicará cómo usar este modelo ajustado para encontrar el conjunto óptimo de condiciones de operación para lasx.1 Localización del punto estacionario Suponga que quieren encontrarse los niveles dex¡. por lo general se requiere un modelo que incorpore la curvatura para aproximar la respuesta. se le llama punto estacionario.0. se selecciona el tiempo de reacción como la variable del paso 1 del procedimiento anterior. Cinco minutos de tiempo de reacción es el tamaño del paso (con base en el conocimiento del proceso). El punto estacionario podría representar 1) un punto de respuesta máxima.. en caso de existir. En la mayoría de los casos. Mediante la generación de gráficas de contorno utilizando software de computadora para el . el modelo de segundo orden y= 130 + 2: f3¡x¡ + 2: f3¡¡x: + 2:2: i=1 k k f3ijx¡X j +8 (11-4) i=1 i<j es adecuado.. el tamaño del paso de la temperatura es & 2 = ~I / &1 ~2 = 0. Para ilustrar. z'-+J' ..77511. 2) un punto de respuesta mínima. X 2 k para las que las derivadas parciales ay / aXI = ay / aX 2 = . A este punto. ""Xk. Z k = 12 . En términos de las variables codificadas. así como para caracterizar la naturaleza de la superficie de respuesta.42(5)= 2°P 11~3 ANÁLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN Cuando el experimentador se encuentra relativamente cerca del óptimo.U A"'=A 1 f3 j /&j ~¡ . Este punto. por ejemplo x¡. Las gráficas de contorno desempeñan un papel muy importante en el estudio de las superficies de respuesta.. Se convierten las &¡ de variables codificadas a variables naturales.. x2 .0) Para convertir los tamaños de los pasos codificados (&1 = 1. por el lineamiento 2....42) a las unidades naturales de tiempo y temperatura. ---...L__. .. 0..." 11-3 ANÁLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN 437 103.. 0.00_---. b) Gráfica de contorno Figura 11-6 Superficie de respuesta y gráfica de contorno que ilustran una superficie con un máximo.04 92.00 -L L- ===-.-!!.....02 70.03 81.---r------cr-----.50 0..00 -0..50 l-(N 0.50 _1..01 59 1....00e-1.00 -0.50 1.....00 x.00 a) Superficie de respuesta 1...::. 50 0.:.-------''''------l... b) Gráfica de contorno Figura 11-7 Superficie de respuesta y gráfica de contorno que ilustran una superficie con un mínimo.00 0.::-----"'--~-__..:.-----. .00 -0.---l.:N 0..50 -1. 0..00 -0.00.00...L.--..438 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA 1..-----...--.... -1.50 1.::=:..00 x.50 .¡¡:_____..--'-----'.:::. .50 _1.50 .l_ _ _.. .11-3 ANÁLlSIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN 439 x.-----¡-----r-----.._ _L .L__ _4I 0..00.00_---._ ...00 -0.J ~. 0...00 b) Gráfica de contorno Figura 11-8 Superficie de respuesta y gráfica de contorno que ilustran una superficie con un punto silla (o minimax).-.50 1.----¡. -0.L.00 x..L -1. 1..----. Además.. La derivada de y con respecto a los elementos del vector x igualada con O es . . llamado análisis canónico. Xk' Como ya se señaló. oo. A la ecuación 11-9 se le llama la forma canónica del modelo. Si sólo hay dos o tres variables en el proceso (las x).f32k/ 2 [ simétrica lJ kk Es decir. . Por lo general también se desea estudiar la sensibilidad relativa de la respuesta a las variables Xl' X 2 . +lLkW k (11-9) donde las {w¡} son las variables independientes transformadas y las {A¡} son constantes. incluso cuando hay un número relativamente reducido de variables.I! t\" [. generalmente es necesario caracterizar la superficie de respuesta en la vecindad inmediata de este punto.t: j). Es conveniente transformar primero el modelo en un nuevo sistema de coordenadas con el origen en el punto estacionario x. la forma más directa de hacer esto es examinando una gráfica de contorno del modelo ajustado.= b+2Bx = O El punto estacionario es la solución de la ecuación 11-6. l'b (11-8) 11~3. Puede demostrarse que se obtiene así el modelo ajustado ~ ~ y= y.: 2 1? 1 2 + oo. el experimentador puede por lo general caracterizar la forma de la superficie y localizar el óptimo con una precisión razonable. la respuesta predicha en el punto estacionario puede encontrarse como ~ y. un análisis más formal. = f3~ o +i x . mínima o un punto silla. se tiene y= lJo +x'b+x'Bx donde (11-5) lJn' lJ12J 2. o ay ax (11-6) x.. b es un vector (k Xl) de los coeficientes de regresión de primer orden y B es una matriz simétrica (k x k) cuyos elementos de la diagonal principal son los coeficientes cuadráticos puros (lJi!) y cuyos elementos que están fuera de la diagonal son la mitad de los coeficientes cuadráticos mixtos (lJ ij' i :. Al escribir el modelo de segundo orden en notación matricial. y después hacer la rotación de los ejes de este sistema hasta que sean paralelos a los ejes principales de la superficie de respuesta ajustada. Es posible obtener una solución matemática general para la localización del punto estacionario. Por caracterizar se entiende determinar si el punto estacionario es el punto de una respuesta máxima. +1 ILIW I +1L 2 W. ~lk /2] y B= f322. Sin embargo. las {A¡} son sólo eigenvalores o raíces características de la matriz B. 440 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA análisis de superficie de respuesta. la construcción e interpretación de esta gráfica de contorno es relativamente sencilla. =-tB-Ib (11-7) Además. al sustituir la ecuación 11-7 en la 11-5. Esta transformación se ilustra en la figura 11-9.·:·.2 Caracterización de la superficie de respuesta Una vez que se ha encontrado el punto estacionario. puede ser útil... No es posible ajustar un modelo de segundo orden en las variables Xl y X 2 utilizando el diseño de la tabla 11-4.4).• Se continuará el análisis del proceso químico del ejemplo 11-1.••••••••. La naturaleza de la superficie de respuesta puede determinarse a partir del punto estacionario y de los signos y magnitudes de las {A¡}. Además. La tabla 11-7 contiene la salida de Design-Expel1. La separación en bloques en los diseños de superficie de respuesta se revisa en la sección 11-4. la figura 11-9 describe un sistema para el que X s es un máximo (Al y .•••••••. el cual se estudiará con mayor detalle en la sección 11-4.1.••. y el diseño se ilustra en la figura 11-10. El experimento completo se muestra en la tabla 11-6.3. Al examinar la tabla se observa que este paquete de software calcula primero las "sumas de cuadrados extra o secuenciales" de los términos lineales. X s es un punto de respuesta mínima.•••.x2 = O). Primero suponga que el punto estacionario está dentro de la región de exploración para ajustar el modelo de segundo orden. Si todas las {A¡} son positivas.x2 = ±1. A este diseño se le llama diseño central compuesto (o DCC). si todas las {A¡} son negativas. La atención se centrará en el ajuste de un modelo cuadrático para la respuesta rendimiento Y1 (las otras respuestas se analizarán en la sección 11-3. habría sido necesaria la separación en bloques.••••. Por lo general se utiliza software de computadora para ajustar una superficie de respuesta y construir las gráficas de contorno.. cuadráticos y cúbicos del modelo (hay un mensaje de advertencia referente a los alias del modelo cúbico. y si las {A¡} tienen signos diferentes.•••. la viscosidad y el peso molecular del producto.2 son negativas) con 1. En esta segunda fase del estudio. dos respuestas adicionales fueron de interés.1.1. la superficie presenta una inclinación mayor en la dirección w¡ para la que \A¡ I es el máximo. ya que el DCC no contiene corridas suficientes para apoyar un modelo cúbico completo).2. Por ejemplo. Las respuestas también se muestran en la tabla 11-6.11-3 ANÁLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN X2 441 Figura 11-9 Forma canónica del modelo de segundo orden..414) Y(Xl = ±1... Si hubiera transcurrido un lapso grande entre las dos series de corridas.••••••••••. . X s es un punto silla.1 \ > 1.414. El experimentador decide aumentar este diseño con puntos suficientes para ajustar un modelo de segundo orden.•••••. Con base en el valor P pequeño de los términos cuadrá1 El ingeniero corrió las cuatro observaciones adicionales aproximadanlente en el mismo periodo en que corrió las nueve observaciones originales. 1 Obtiene cuatro observaciones en (Xl = 0. X s es un punto de respuesta máxima.2\' EJEMPLO 11~2 •••••••. 414 76. -1.5 77.442 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA Tabla 11-6 Diseño central compuesto para el ejmplo 11-2 Respuestas Variables naturales ~¡ Variables codificadas X¡ X2 ~2 Y¡ Y2 Y3 (rendimiento) (viscosidad) (peso molecular) 80 80 90 90 85 85 85 85 85 92. se decide ajustar un modelo de segundo orden a la respuesta rendimiento.0 79.414 O O 1.0 79. -1) -2 - Figura 11·10 Diseño central compuesto para el ejemplo 11-2.8 78.6 78:5 77.0) (1.7 79.93 -1 -1 1 1 O O O O O -1 1 -1 1 O O O O O O O 1.3 80.414.07 77. .0 62 60 66 59 72 69 68 70 71 68 71 58 57 2940 3470 3680 3890 3480 3200 3410 3290 3500 3360 3020 3630 3150 ticos.1) (1. En la figura 11-11 se muestra la gráfica de la superficie de respuesta tridimensional y la gráfica de contorno para la respuesta rendimiento en términos de las variables del proceso tiempo y temperatura.414.5 79. Por el examen de la gráfica de contorno se observa que el proceso puede ser ligeramente más sensible a los cambios en el tiempo de reacción que a los cambios en la temperatura.4 75.414 -1. +2 1- (0. O) +2 x.9 80. La salida de computadora muestra el modelo final en términos tanto de las variables codificadas como de los niveles naturales o reales de los factores. 1) I I -2 (-1.414) (-1. (-1.0 78. O) (0.414 -1. Es relativamente sencillo ver por el examen de estas figuras que el óptimo se encuentra muy cerca de 175°P y 85 minutos de tiempo de reacción y que la respuesta está en un máximo en este punto.1.-1) (O.93 85 85 170 180 170 180 175 175 175 175 175 175 175 182.414) (1.07 167. 094 0.31 0.27 78. que maximiza la "R CUADRADA DE PREDICCION".98 1.12 13.12 13.099 6160.28 0.97 a~ 111.2193 0.48 0.9897 Suggested Aliased "Suma de cuadrados del modelo secuenciar': se selecciona el polinomio de orden más alto cuando los términos adicionales son significativos.0826 Ouadratic Cubic Pure Error "p'ru~!?as.49 80090.0001 0.18 6.31 Suggested Aliased significativa.12 Prob> F 0.21 28.1441 0.053 F Value 58.094 0.9705 0.92 2.33 Suggested Aliased "Estadísticos de resumen del modelo": se enfocan en el modelo que minimiza "PRESS" o.11-3 ANÁLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN 443 Tabla 11-7 Salida de computadora de Design-Expert para ajustar un modelo a la respuesta rendimiento del ejemplo 11-2 Response: yield ***WARNING: The Cubic Model is Aliased!*** Sequential Model Surn of Squares Surn of Squares Source DF Mean 80062.97 a~ 1 1 1 1 1 7 3 7.25 F Value 2.1166 0.28 0.010 <0.9705 0.16 1 Linear 10. Response: yield ANOVA for Response Surface Quadratic Model Analysis of variance table [Partial surn of squares] Surn of Mean Squares Source DF Square Model 28.0008 0.0001 <0.3494 1.25 1 Mean Square 80062. Mean 0.de 3 1 4 1.93 30.2897 0.14 68. Source Dev.9828 0.3622 Model Surnrnary Statistics Std.53 1.99 36.0001 0.053 R-Squared Adj R-Squared Pred R-Squared Adeq Precision 0.2897 C. Dev.2730 0.85 A B N B2 AB Residual 7.37 0.92 2.9588 Predicted R-Squared -0.78 Prob> F <0. de manera equivalente.042E-003 0.35 18.84 126.071 Lack of Fit Pure Error Cor Total Std. PRESS 0.018 .78 5.49 18.9184 0.74 0.43 0.27 0.95 2.65 0.25 5 5.1022 0.02 0.16 5.021 E-003 0.V.9828 PRESS 29.90 2 2 5 13 8.28 0.3581 2FI Ouadratic 0. Lack of Fit Tests Source Linear 2FI Surn of Squares 18.69 0.56 3.04 2 2FI 0.65 F Value 79.35 4 12 0. falta de ajuste" : se quiere que el Iliodeloseleécionado no tenga falta de ajuste Adjusted R-Squared 0.59 2.18 6.50 0.24 0.0006 0.01 186.9184 23.34 2.0001 <0.0001 0.0009 <0.28 0.21 DF 6 5 Mean Square 3. R-Squared Linear 1.0435 -0.08 3.7350 Ouadratic Cubic Residual Total 17.9828 Cubic 0.88 0.22 98.82 Prob> F 0. 80749 * time +13.019 -0.21 0.24 -0.055050 ~ time 2 -0.003 0.200 1. el punto estacionario es xs=-tB-1b __ 1.513 0.00 77.13 95% CI Low 79.94 0.52 * B -1.625 0.94 +0.94 79.00 79.17 -0.625 0.027 1.200 0.00 A2 B2 AB Final Equation in Terms of Coded Factors: yield = +79.21 -0.089 -1.02 1.0917 -1.625 0.409 0.200 0.389] -0.040 0.78 78.99 * A +0.341 0. 001 y.264 1.995] b = 0.52285 + 7.70 79.064 95% CI High 80.99 0.00 * B2 +0.36 0.30 80. por la ecuación 11-7.59 77.50 75.40 77.00 1.588 0.010000 * time * temp Diagnostics Case Statistics Student Cook's Outlier Run Standard Actual Predicted Order Order Value Value Residual Leverage Residual Distance t 8 6 9 11 12 10 7 1 5 3 13 2 4 1 2 3 4 5 6 7 8 9 10 11 12 13 76.19 -0.17 0.275 1.00 78.38 * A 2 -1.457 0.023 -0.94 0.~I I 444 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA Tabla 11·7 (continuación) Factor Intercept A-time B-temp Coefficient Estimate 79.095 0.014 1.94 79.32 75.76 0.376 0.009 -0.80 76.515 .293 0.195 -1.22 1.010 -0.040050 * temp 2 +0.60 78.90 80.25 DF 1 1 1 1 1 1 Standard Error 0.200 0.10 0.358 -1.30 77.396 0.107 -1.625 0.50 78. Observe que [0.1250 -1.25 * A * B Final Equation in Terms of Actual Factors: yield = .094 0.347 1.21 78.559 La localización del punto estacionario también podría encontrarse utilizando la solución general de la ecuación 11-7.00 1.18 -0.77 0.20 0.7345 2 -0.27053 * temp -0.29 -1.12 0.200 0.79 76.0.213 1.625 0.-1430.106 -1.66 0.52 -1.625 0.61 -1.0917] [0.032 1.18 -0.452 0.283 -1.042 0.094 0.001 0.235 -1.0096 0.38 -1.129 -1.306 .50 79.24 -0.1250] 0. [-0.240 -1.625 0.995]_ [0.83 79.168 1.10 0.329 0.252 -1.94 79.060 -0.22 0.67 79.708 0.156 1.74 -1.94 79.625 0.14 -0.56 VIF 1.515 B= [-1.289 0.02 1.00 0.14 0.00 79. " 11-3 ANÁLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN 445 80.306 = -. s = 0.07 a) La gráfica de contorno 80.8 ~\e~ b) La gráfica de superficie de respuesta Figura 11-11 Gráficas de contorno y de superficie de respuesta de la respuesta rendimiento. ejemplo 11-2.21.99 'ti <:: " 'E a: E <:: " 73.76 167.-"-.SOF Este valor está muy cerca del punto estacionario que se encontró por examen visual en la gráfica de contorno de la figura 11-11.o 92.9 77. Es decir. la respuesta predicha en el punto estacionario puede encontrarse como Ys = 80.55 182.--2_ _ 5 de donde se obtienes 1 = 86.00 Tiempo 87.389 = _"1__ S f: -175 0.41 83. Al utilizar la ecuación 11-8.1 179.389 YX 2.4 173.s = 0. el punto estacionario es f: -85 0.306.95 =87 minutos de tiempo de reacciónYs2 = 176.29 82.. En términos de las variables naturales. .07 89.93 ~o 176.36 92. Xl.59 80.24 86.21 77.6 &I'~ ~(¡I'" 170.64 85.2 ): &/}¡.53 = 176. ParaA I == -0........A . Por lo tanto..9641.1250 ][mn ]_ [ 0. Los eigenvalores Al y Az son las raíces de la ecuación de determinantes IB-AII == O -1... En algunos problemas MSR puede ser necesario encontrar la relación entre las variables canónicas {w¡} y las variables del diseño {x¡}..... wz) en puntos del espacio (Xl' X z).0377m ZI == O Quiere obtenerse la solución normalizada de estas ecuaciones.. Las columnas de M son los eigenvectores normalizados asociados con {A i }.... suponga que en el ejemplo 11-2 el proceso no pudo operarse en ~l == 87 minutos y ~z == 176SF debido a que esta combinación de factores resulta en un costo excesivo. si mi es la columna i-ésima de M... se concluye que el punto estacionario es un máximo.446 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA El análisis canónico que se describe en esta sección también puede usarse para caracterizar la Superficie de respuesta.1250 (-1...376-A 0.9641) 0... Primero es necesario expresar el modelo ajustado en la forma canónica (ecuación 11-9).. aquella para la que m lz l + mil == 1...3788A+1..9641) m ZI .1250 1- que se reduce a AZ +2.. la ecuación 11-10 queda como (-1..4147... Como una ilustración....... ...... El procedimiento se ilustra usando el modelo de segundo orden ajustado del ejemplo 11-2..001. La exploración de la forma canónica requiere convertir los puntos del espacio (w l .9641 YAz == -1...0 \ 0.3639== O Las raíces de esta ecuación cuadrática sonA I == -0....001+0..21.4147wi Puesto que tanto Al como Az son negativas y el punto estacionario está en la región de exploración.1250 -1....0..376+0.1250m n .... No existe una solución única para estas ecuaciones.9641w. la forma canónica del modelo ajustado es y== 80.O [OJ o -0. entonces mi es la solución de (B .A¡I)m¡ == O (11-10) para la que LJ=lm~ == 1.. Se quiere "regresar" ahora del punto estacionario a un punto con un costo menor sin incurrir en pérdidas considerables en el rendimiento. Es decir..1250m zl == O 0.. En general.. -1..4129m n + 0.. Esto es particularmente cierto cuando es imposible operar el proceso en el punto estacionario. La forma canónica del modelo indica que la superficie es menos sensible a la pérdida de rendimiento en la dirección wl .. las variables x se relacionan con las variables canónicas w por w == M'(x-xs) donde M es una matriz ortogonal (k x k).. es decir......0.. por lo que lo más conveniente es asignar un valor ar- .. 11-3 ANÁLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN 447 m;l bitrario a una de las incógnitas, resolver el sistema y normalizar la solución. Al hacer m;l = 0.3027. Para normalizar esta solución, m;l Y m;l se dividen entre = 1, se encuentra Se obtiene así la solución normalizada m 11 = ~ = 0.3027 = 0.2897 1. 0448 1. 0448 m~l =--=-1- = 0.9571 y m 21 1. 0448 1. 0448 que es la primera columna de la matriz M. Utilizando A2 = -1.4147 puede repetirse el procedimiento anterior, obteniéndose m22 = 0.2888 como la segunda columna de M. Por lo tanto, se tiene M- [0.2897 -O. 9574J - 0.9571 0.2888 La relación entre las variables w y x es m 12 = -0.9574 Y 1]= [0.2897 W [w2 -0.9574 o 0.9571] [Xl - 0.389] 0.2888 x 2 - 0.306 W1 = 0.2897(x1 - 0.389)+0.9571(x 2 - 0.306) w 2 = -0.9574(x1 - 0.389)+0.2888(x 2 - 0.306) Si quisiera explorarse la superficie de respuesta en la vecindad del punto estacionario, podrían determinarse los puntos apropiados en los cuales hacer las observaciones en el espacio (W1' w2) Yusar después la relación anterior para convertir estos puntos en el espacio (X 1,X2) para que puedan realizarse las corridas. 11 ~ 3.3 Sistemas de cordilleras No es raro encontrar variaciones de las superficies de respuesta con máximos o mínimos puros o con puntos silla estudiadas en la sección anterior. Los sistemas de cordilleras, en particular, son muy comunes. Considere la forma canónica del modelo de segundo orden presentado anteriormente en la ecuación 11-9: Y= Ys +A 1W; +A2W~ + oo. +AkW~ Suponga ahora que el punto estacionario X s está dentro de la región de experimentación; además, sea que una o más de lasA¡ sean muy pequeñas (por ejemplo, A¡ = O). Entonces la variable de respuesta es muy insensible a las variables W¡ multiplicadas por las A¡ pequeñas. En la figura 11-12 se presenta una gráfica de contorno en la que se ilustra esta situación parak = 2 variables canAl = O. (En la práctica, Al estaría cerca de cero pero no sería exactamente igual a cero.) En teoría, el modelo canónico para esta superficie de respuesta es y= Ys A A +A 2 W 1 í ? 448 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA 60 65 65 L.- 60 x, L- x, Figura 11·12 Gráfica de contorno de un sistema de cordilleras estacionarias. Figura 11·13 Gráfica de contorno de un sistema de cordilleras crecientes. conA z negativa. Observe que el marcado estiramiento en la dirección W 1 ha resultado en una línea de centros en y = 70 Yel óptimo puede tomarse en cualquier lugar a lo largo de esta línea. A este tipo de superficie de respuesta se le llama sistema de cordilleras estacionarias. Si el punto estacionario está muy apartado de la región de exploración para el ajuste del modelo de segundo orden y unaA¡ (o más) está cerca de cero, entonces la superficie puede ser un sistema de cordille· ras crecientes. En la figura 11-13 se ilustra una cordillera creciente para k = 2 variables con Al cerca de cero YA z negativa. En este tipo de sistema de cordilleras no pueden hacerse inferencias acerca de la verdadera superficie o del punto estacionario porque X s está fuera de la región donde se ha ajustado el modelo. Sin embargo, la exploración adicional está garantizada en la dirección w1• Siíl. z hubiera sido positiva, este sistema se habría llamado cordillera descendente. 11~3.4 Respuestas múltiples Muchos problemas de superficies de respuesta incluyen el análisis de varias respuestas, como en el ejemplo 11-2, donde el experimentador midió tres. En dicho ejemplo, el proceso se optimizó únicamente con respecto a la respuesta rendimiento Y1' La consideración simultánea de respuestas múltiples requiere construir primero un modelo de superficie de respuesta apropiado para cada respuesta y después intentar encontrar un conjunto de condiciones de operación que optimice en cierto sentido todas las respuestas o que al menos las mantenga en los rangos deseados. Un estudio completo del problema de las respuestas múltiples se ofrece en Myers y Montgomery [85a]. En el ejemplo 11-2 pueden obtenerse modelos para las respuestas viscosidad y peso molecular (yz YY3' respectivamente) de la siguiente manera: yz = 70.00- 0.16x1 - 0.95x z - 0.69x; - 6.69x; -1.25x1 x z Y3 = 3386.2+ 205. lx 1 4- 17.4x z En términos de los niveles naturales del tiempo (';1) y la temperatura (.;z), estos modelos son Yz = -9030.74+ 13.393'; 1 + 97. 70s.; z - 2.75xlO- 2 .;i - 0.26757.;; - 5xlO- z ';l';Z y 11-3 ANÁLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN 449 En las figuras 11-14 y 11-15 se presentan las gráficas de contorno y superficie de respuesta para estos modelos. Un enfoque relativamente directo para optimizar varias respuestas que funciona bien cuando sólo hay pocas variables en el proceso es la superposición de las gráficas de contorno de cada respuesta. En la figura 11-16 se muestra una gráfica de superposición para las tres respuestas del ejemplo 11-2, con los contornos para los que YI (rendimiento) ;:o: 78.5, 62 :5 Yz (viscosidad) :5 68, YY3 (peso molecular Mn) :5 3400. Si estos límites representan condiciones importantes que el proceso debe satisfacer, entonces, como se muestra en la porción no sombreada de la figura 11-16, existen varias combinaciones del tiempo y la temperatura que resultarán en un proceso satisfactorio. El experimentador puede hacer el examen visual de 182.1 60.00 179.7 58.00 62.00 65.00 68.00 177.4 ~ Ql E c. 175.0 ~ E <::::::::> 70.00 172.6 170.3 82.64 85.00 Tiempo 87.36 89.71 92.07 a} La gráfica de contorno 70.03 63.75 E Ql o 'ti 'E <:: Ql 57.47 tI: 51.19 182.1 179.2 /: 176.4 &0 :0& 173.6 >'"<i't, Vl'<i' 92.07 89.24 86.41 83.59 ~Qo 80.76 77.93 ~\e 170.8 167.9 b) La gráfica de la superficie de respuesta Figura 11-14 Gráfica de contorno y gráfica de la superficie de respuesta de la viscosidad, ejemplo 11-2. 450 182.1 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA r-~-'----r--...-----'----r~--'---' 179.7 177.4 2 E ~ 175.0 c. E ~ 172.6 170.3 167.9 L--_ _L--_"'>O"''--_---'_---3o...-J._ _--L_-''--' 77.93 80.29 82.64 85.00 Tiempo a) La gráfica de contorno 3566 ~ 3266 2845 .... .... 182.1 179.2 h 176.4 &O.0 173.6 Qtl¡" I!'I' 170.8 Q .... .... .... .... 92.07 89.24 83.59 80.76 77.93 -<.\e~~ 86.41 o 167.9 b) La gráfica de la superficie de respuesta Figura 11-15 Gráfica de contorno y gráfica de la superficie de respuesta del peso molecular, ejemplo 11-2. la gráfica de contorno para determinar las condiciones de operación apropiadas. Por ejemplo, es posible que el experimentador esté más interesado en la región más grande de las dos regiones factibles que se muestran en la figura 11-16. Cuando hay más de tres variables del diseño, se hace muy complicada la superposición de las gráficas de contorno, ya que la gráfica de contorno es bidimensional, y k - 2 de las variables deldiseño deben mantenerse constantes para construir la gráfica. Con frecuencia se necesita una gran cantidad de ensayo y error para determinar cuáles son los factores que deben mantenerse constantes y qué niveles seleccionar para obtener la mejor vista de la superficie. Por lo tanto, existe interés práctico en métodos de optimización más formales para las respuestas múltiples. 11-3 ANÁLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN 182.1"""""~""""" 451 179.7 177.4 e ~ ~ 175.0 t! E 80.29 82.64 85.00 Tiempo 87.36 89.71 92.07 Figura 11-16 Región del óptimo encontrada superponiendo las superficies de respuesta delrendimiento, la viscosidad y el peso molecular, ejemplo 11-2. Un enfoque popular consiste en formular y resolver el problema como un problema de optimización restringida. Para ilustrar este enfoque utilizando el ejemplo 11-2, el problema podría formularse como MáxYl sujeto a 62:5 Y2 :5 68 Y3 :5 3400 Se cuenta con varias técnicas numéricas que pueden usarse para resolver este problema. En ocasiones se hace referencia a estas técnicas como métodos de programación no lineal. El paquete de software Design-Expert resuelve esta versión del problema utilizando un procedimiento de búsqueda directa. Las dos soluciones encontradas son tiempo y = 83.5 temperatura = 177.1 5'1 = 79.5 temperatura = 172.25 5'1 = 79.5 tiempo = 86.6 Observe que la primera solución es la región factible superior (la más pequeña) del espacio del diseño (referirse a la figura 11-16), mientras que la segunda solución es la región más grande. Ambas soluciones están muy cerca de los límites de las restricciones. Otro enfoque útil para la optimización de respuestas múltiples es usar la técnica de optimización simultánea popularizada por Derringery Suich [37]. Su procedimiento hace uso de las funciones con condición de deseable. El enfoque general consiste en convertir primero cada respuesta Yi en una función con condición de deseable individual di que varía en el rango 0:5d i :51 donde si la respuesta Yi está en su meta u objetivo; entonces di = 1, Ysi la respuesta está fuera de una región aceptable, di = O. Después las variables del diseño se eligen para maximizar la condición de deseable global D = (d1 . d2 ..... d )l/m . m donde hay m respuestas. 452 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA Las funciones con condición de deseable individual están estructuradas como se indica en la figura 11-17. Si el objetivo T para la respuesta y es un valor máximo, d=¡(;~~r ~::~T 1, y>T (11-11) cuando la ponderación t = 1, la función con condición de deseable es lineal. Al elegir t > 1 se pone más interés en estar cerca del valor objetivo, y cuando se elige O < t < 1 esto tiene menos importancia. Si el objetivo para la respuesta es un valor mínimo, 1 y<T d= ¡ (~-o-:r T75y75U y>U (11-12) La función con condición de deseable de dos colas que se muestra en la figura 11-17c supone que el objetivo se localiza entre los límites inferior (L) Y superior (U), y se define como O y<L L75y75T d= (y-Lr T-L (U-Y)" U-T (11-13) T75y75U y>U O Se usó el paquete de software Design-Expel1 para resolver el ejemplo 11-2 utilizando el enfoque de la función con condición de deseable. Se eligió T = 80 como el objetivo para la respuesta rendimiento, U = 70, Yse fijó la ponderación de esta condición de deseable individual igual a la unidad. Se hizo T = 65 para la respuesta viscosidad con L = 62 Y U = 68 (para ser consistente con las especificaciones), con ambas ponderaciones t 1 = t z = 1. Por último, se indicó que cualquier peso molecular abajo de 3400 era aceptable. Se encontraron dos soluciones. Solución 1: Tiempo Solución 2: = 86.5 Temperatura j\ = 78.8 Tiempo = 170.5 yz = 65 D = 0.822 3287 Y3 = D = 82 Temperatura = 178.8 Y1 = 78.5 Yz = 65 = 0.792 3400 Y3 = La solución 1 tiene la condición de deseable global más alta. Observe que resulta en una viscosidad acorde con el objetivo y en un peso molecular aceptable. Esta solución está contenida en la más grande de las dos regiones de operación de la figura 11-16, mientras que la segunda solución está contenida en la región más pequeña. En la figura 11-18 se muestran las gráficas de la superficie de respuesta y de contorno de la función con condición de deseable global D. 11-3 ANÁLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN 453 ,r..--I-- r = 1 OL----&<~-------..l--- L T y a) El objetivo (blanco) es maximizar y r>1 O<r<1 OL-----L.--------=ilI--T u y b) El objetivo (blanco) es minimizar y r, > 1-+--~'----->-/ OL-----:::::..----------'--------~'------- L T u y e) El objetivo (blanco) es que y esté tan cerca como sea posible de la especificación Figura 11·17 Funciones con condición de deseables individuales para la optimización simultánea. 454 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA 0.820 :¡; Q) Q) ro "' -o Q) Q) -o ·0 .C:; e e 'O U O 175.00 Temperatura 172.50 170.00 a) Superficie de respuesta Tiempo 180.00----..----------------------1l 177.50 ~========~ E ~ Q) 175.00 c. E ~ ::J • 5 172.50 170.00~----..L--------' ~========::I===~~ 80.00 82.50 85.00 87.50 Tiempo bl Gráfica de contorno 90.00 Figura 11-18 Gráfica de la superficie de respuesta y de contorno de la función con condición de deseable del ejemplo 11-2. ·'1 11-4 DISEÑOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA 455 11-4 DISEÑOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA El ajuste y análisis de superficies de respuesta se facilita en gran medida con la elección apropiada del diseño experimental. En esta sección se revisan algunos aspectos de la selección del diseño apropiado para ajustar superficies de respuesta. Cuando se selecciona un diseño de superficie de respuesta, algunas de las características deseables en el diseño son las siguientes: 1. Proporciona una distribución razonable de los puntos de los datos (yen consecuencia informa- 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. ción) en toda la región de interés. Permite que se investigue la adecuación del modelo, incluyendo la falta de ajuste. Permite que los experimentos se realicen en bloques. Permite que los diseños de orden superior se construyan secuencialmente. Proporciona una estimación interna del error. Proporciona estimaciones precisas de los coeficientes del modelo. Proporciona un buen perfil de la varianza de predicción en toda la región experimental. Proporciona una robustez razonable contra los puntos atípicos o los valores faltantes. No requiere un gran número de corridas. No requiere demasiados niveles de las variables independientes. Asegura la simplicidad del cálculo de los parámetros del modelo. Estas características entran en conflicto en ocasiones, por lo que con frecuencia debe aplicarse la discrecionalidad al seleccionar un diseño. Para mayor información sobre la elección de un diseño de superficie de respuesta, referirse a Myers y Montgomery [85a], Box y Draper [16b] y Khuri y Cornell [67]. 11-4.1 Diseños para ajustar el modelo de primer orden Suponga que quiere ajustarse el modelo de primer orden en k variables y= f30 + 2: f3i X +8 ¡ k (11-14) i=l Hay una clase única de diseños que minimizan la varianza de los coeficientes de regresión {~i}' Se trata de los diseños de primer orden ortogonales. Un diseño de primer orden es ortogonal si todos los elementos que están fuera de la diagonal de la matriz (X'X) son cero. Esto implica que la suma de los productos cruzados de las columnas de la matriz X sea cero, La clase de los diseños de primer orden ortogonales incluye los factoriales 2k y las fracciones de la serie 2k en las que los efectos principales no son alias entre sí. Al usar estos diseños se supone que los niveles bajo y alto de los k factores están codificados en los niveles usuales ± 1. El diseño 2k no permite la estimación del error experimental a menos que se hagan réplicas de algunas corridas. Un método común de incluir las réplicas en el diseño 2k es aumentar el diseño con varias observaciones en el centro (el punto Xi = 0, i = 1, 2, 'oo, k). La adición de puntos centrales al diseño 2k no influye en las {~¡ } para i ;::: 1, pero la estimación de f30 se convierte en el gran promedio de todas las observaciones. Además, la adición de puntos centrales no altera la propiedad de ortogonalidad del diseño. En 456 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA x, 0.) X 3 b) Figura 11-19 El. diseño símplex para a) le = 2 variables y b) le = 3 variables. el ejemplo 11-1 se ilustra el uso de un diseño 22 aumentado con cinco puntos centrales para ajustar un modelo de primer orden. Otro diseño de primer orden ortogonal es el diseño símplex. El diseño símplex es una figura de lados regulares con k + 1 vértices en k dimensiones. Por 10 tanto, el diseño símplex para k = 2 es un triángulo equilátero, y para k = 3 es un tetraedro regular. En la figura 11-19 se muestran diseños símplex de dos y tres dimensiones. 11~4.2 Diseños para ajustar el modelo de segundo orden En el ejemplo 11-2 se hizo la introducción informal (e incluso antes en el ejemplo 6-6) del diseño central compuesto o DCC para ajustar un modelo de segundo orden. Se trata de la clase más popular de diseños usados para ajustar estos modelos. En general, el DCC consta de un factoria12k (o de un factorial fraccionado de resolución V) con 11 F corridas, 2k corridas axiales o estrella y 11 c corridas centrales. En la figura 11-20 se muestra el DCC para k = 2 Y k = 3 factores. El despliegue práctico de un DCC surge con frecuencia a través de la experimentación secuencial, como en los ejemplos 11-1 y 11-2. Es decir, se ha usado un diseño 2k para ajustar un modelo de primer orden, este modelo ha presentado falta de ajuste, y después se agregaron las corridas axiales para permitir la incorporación de los términos cuadráticos en el modelo. El DCC es un diseño muy eficiente para ajustar el modelo de segundo orden. Hay dos parámetros en el diseño que deben especificarse: la distancia a de las corridas axiales al centro del diseño y el número de puntos centrales 11 c . A continuación se analiza la elección de estos dos parámetros. 11-4 DISEÑOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA 457 (O,a) (-1, +1) (+1, +1) --_'I---b~-I---¡"""--X1 (-a, O) (0,0) (a, O) (-1,-1) (O, -a) (+1, -1) Figura 11-20 Diseños centrales compuestos para k = 2 Y k = 3. Rotabilidad Es importante que el modelo de segundo orden proporcione buenas predicciones en toda la región de interés. Una manera de definir "buenas" es requerir que el modelo tenga una varianza razonablemente consistente y estable de la respuesta predicha en los puntos de interés x. Recuerde, por la ecuación 10-40, que la varianza de la respuesta predicha en algún punto x es V[Y(x)] = a 2 x'(X'Xr 1 x Boxy Hunter [17a] propusieron que un diseño de superficie de respuesta de segundo orden debe ser rotable. Esto significa que la V[Y(x)] es la misma en todos los puntos x que están a la misma distancia del centro del diseño. Es decir, la varianza de la respuesta predicha es constante en esferas. En la figura 11-21 se muestran los contornos de v'V[Y(x)] constante para el ajuste del modelo de segundo orden utilizando el DCC en el ejemplo·11-2. Observe que los contornos de desviación estándar constante de la respuesta predicha son círculos concéntricos. Un diseño con esta propiedad dejará la varianza de ysin cambio cuando el diseño se rota alrededor del centro (O, 0, ..., O), de ahí el nombre de diseño rotable. La rotabilidad es una base razonable para la selección de un diseño de superficie de respuesta. Puesto que la finalidad de la MSR es la optimización, y la localización del óptimo se desconoce antes de correr el experimento, tiene sentido el uso de un diseño que proporcione una precisión de estimación igual en todas las direcciones (puede demostrarse que cualquier diseño de primer orden ortogonal es rotable). Un diseño central compuesto se hace rotable mediante la elección de a. El valor de a para la rotabilidad depende del número de puntos en la porción factorial del diseño; de hecho, a = (fI F)1/4 produce un diseño central compuesto rotable, donde nF es el número de puntos usados en la porción factorial del diseño. El DCC esférico La rotabilidad es una propiedad esférica; es decir, tiene mayor sentido como criterio de diseño cuando la región de interés es una esfera. Sin embargo, no es importante tener una rotabilidad exacta para tener un buen diseño. De hecho, para una región esférica de interés, la mejor elección de a desde el punto de vista de la varianza de predicción para el DCC es hacer a = Vk. Este diseño, llamado DCC esférico, coloca todos los puntos factoriales y axiales del diseño sobre la superficie de una esfera de radio Vk. Para una exposición más amplia del tema, ver Myers y Montgomery [85a]. 458 CAPÍTULO 11 0.3019 MÉTODOS DE SUPERFICIES DE RESPUESTA 0.3484 179.7 ro ;;;¡ ~ Q. O; 175.0 E ~ 172.6 170.3 0.3019 87.36 a) Contornos de ~V[y(x)1 0.3949 0.3020 ~ 0.2091 0.1161 182.1 179.2 176.4 )'$ 0.0 173.6 19¡-"t...,,, 170.8 92.07 89.24 86.41 83.59 o 80.76 77.93 " -<;\0~9 167.9 b) La gráfica de la superficie de respuesta Figura 11-21 Contornos de desviación estándar constante de la respuesta predicha para el DCC rotable, ejemplo 11-2. Corridas centrales en el DCC La elección de a en el DCC está dictada principalmente por la región de interés. Cuando esta región es una esfera, el diseño debe incluir corridas centrales para proporcionar una varianza razonablemente estable de la respuesta predicha. En general, se recomiendan de tres a cinco corridas centrales. El diseño de Box-Behnken Box y Behnken [13] han propuesto algunos diseños de tres niveles para ajustar superficies de respuesta. Estos diseños se forman combinando factoriales 2k con diseños de bloques incompletos. Los diseños re- 11-4 DISEÑOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA Tabla 11-8 Diseño de Box-Behnken para tres variables Xl X2 X3 459 Corrida 1 2 3 4 5 6 7 8 9 -1 -1 1 1 -1 -1 1 1 O O O O O O O -1 1 -1 1 O O O O O O O O 10 11 12 13 -1 -1 1 1 O O O -1 1 -1 1 -1 1 -1 1 O O O 14 15 sultantes suelen ser muy eficientes en términos del número requerido de corridas, y son rotables o casi rotables. En la tabla 11-8 se muestra el diseño de Box-Behnken para tres variables. El diseño también se ilustra geométricamente en la figura 11-22. Observe que el diseño de Box-Behnken es un diseño esférico, con todos los puntos localizados en una esfera de radio...n. Asimismo, el diseño de Box-Behnken no contiene ningún punto en los vértices de la región cúbica creada por los límites superior.e inferior de cada variable. Esto podría ser una ventaja cuando los puntos de los vértices del cubo representan combinaciones de los niveles de los factores cuya prueba es prohibitivamente costosa o imposible debido a restricciones físicas del proceso. Región cuboidal de interés Existen muchas situaciones en las que la región de interés es cuboidal en lugar de esférica. En estos casos, una variante útil del diseño central compuesto es el diseño central compuesto con centros en las caras o el cubo con centros en las caras, en el que a = 1. En este diseño los puntos axiales o estrella se localizan en los centros de las caras del cubo, como se muestra en la figura 11-23 para k = 3. Esta variante del diseño central compuesto se usa en ocasiones d.ebido a que sólo requiere tres níveles de cada factor, y en la prác- -1 +1 . Figura 11·22 Diseño de Box-Behnken para tres factores. Figura 11-23 Diseño central compuesto con centros en las caras para k == 3. .<:. fl 460 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA -1.00 (a) -1.00 Superficie de respuesta Xl lb) Gráfica de contorno Figura 11-24 Desviación estándar de la respuesta predicha ~V[y(x)] para el cubo con centros en las caras con k = 3, /le = 3 YX 3 = O. y esto puede ser un factor limitante para su aplicación. un diseño equirradial rotable se obtiene combinando n z . Por lo tanto. El cubo con centros en las caras no requiere tantos puntos centrales como el DCC esférico. podrían usarse diseños compuestos de puntos cuya separación en un círculo es igual y que forman polígonos regulares. En la tabla 11-10 se muestra un diseño híbrido para k = 3. el cual consiste en un factorial fraccionado en el cubo de resolución III* (los efectos principales son alias de las interacciones de dos factores y ninguna de las interacciones de dos factores es alias entre sí) y las corridas axiales y centrales usuales. Otros diseños útiles incluyen el diseño compuesto pequeño. El diseño de la tabla 11-9 tiene n c = 4 corridas centrales. Diseños de particular utilidad para k = 2 son el pentágono y el hexágono. por lo que se trata de un diseño muy eficiente con respecto al número de conidas.::: 1 punto en el centro del círculo. El diseño tiene cuatro corridas en el cubo y seis corridas axiales. Otros diseños Existen muchos otros diseños de superficie de respuesta que en ocasiones son útiles en la práctica. Observe que la desviación estándar de la respuesta predicha es razonablemente uniforme en una porción relativamente larga del espacio del diseño. Se seleccionó a = 1. En la figura 11-24 se muestra la raíz cuadrada de la varianza de predicción v'V[5'(x)] del cubo con centros en las caras para k = 3 con n c = 3 puntos centrales (x 3 = O). b) Pen- tica con frecuencia es difícil cambiar los niveles de los factores. Para dos variables.--\-t--. Este diseño usa la fracción un medio estándar del diseño 23 en el cubo. el diseño tiene un mínimo de N = 11 ensayos. En la práctica. Estos diseños pueden ser de valor considerable cuando es importante reducir el número de corridas tanto como sea posible. Diseños equirradiales para dos variables. observe que los diseños centrales compuestos no son rotables. a) Hexágono. Algunos de estos diseños tienen niveles irregulares. ya que satisface los criterios de la resolución III*.x . y debe incluir al menos un punto central. Estos diseños se muestran en la figura 11-25.. se trata de diseños muy . y la clase de los diseños híbridos. Cabe señalar que en ocasiones se emplearán más corridas centrales para dar una estimación razonable del error experimental. Sin embargo. nc = 2 o 3 es suficiente para proporcionar una buena varianza de predicción en toda la región experimental. a estos arreglos con frecuencia se les llama diseños equirradiales.11-4 DISEÑOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA 461 --'---"---¡~--Xl ---t+--. Puesto que los puntos del diseño son equidistantes del origen. Sin embargo.::: 5 puntos con una separación igual en un círculo con nI . 73 para obtener un diseño esférico debido a que el diseño compuesto pequeño no puede hacerse rotable. al b) Figura 11·25 tagono. y el modelo de segundo orden en k = 3 variables tiene p = 10 parámetros por estimar. Para k = 2. En la tabla 11-9 se muestra un diseño compuesto pequeño para k = 3 factores. 00 -1.00 1.00 -1.00 0.00 -1.00 1.00 1.71 -0.00 0.00 0.00 -1.00 -1.00 0.00 0.00 1.73 1.41 0.00 -1.73 1.00 1.00 0.41 0.00 0.00 0.00 0.00 0.73 0. I l' ~'l 462 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA Tabla 11-9 Diseño compuesto pequeño para k = 3 factores Orden X2 X3 Xl estándar 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1.00 -1.00 -1. con frecuencia es necesario considerar la formación de bloques para eliminar las variables perturbadoras.00 0.00 1.00 0.73 0.00 0. como se ilustró en los ejemplos 11-1 y 11-2.73 1.00 0.00 .00 0..71 0.00 0. y poseen excelentes propiedades de la varianza de predicción. referirse a Myers y Montgomery [85a].00 -1.00 1.00 0.00 1.71 -0.71 0.00 0.00 1.00 -1.00 0. este problema puede ocurrir cuando un diseño de segundo orden se ensambla secuencialmente a partir de un diseño de primer orden.00 0.00 0. 11~4.00 0.00 pequeños. Para mayores detalles acerca de los diseños compuestos pequeños y los diseños 1uoridos.71 0.71 -0.71 -0.00 0.73 0.41 -1.41 -1.71 0.00 1.00 0.00 -1.00 1.00 0.41 -1.00 0.00 0.00 -1.00 -1.3 Formación de bloques en los diseños de superficie de respuesta Cuando se usan diseños de superficie de respuesta.41 0.00 1. Puede transcurrir tiempo considerable entre que se corre el modelo de primer orden y se corren los experimentos complementarios requeridos para construir un diseño de se- Tabla 11-10 Diseño híbrido para k = 3 factores Orden X2 x3 Xl estándar 1 2 3 4 5 6 7 8 9 10 11 0.00 0. Por ejemplo. k para todab donde N es el número de corridas del diseño. j= 0. k para todab donde X ill Yxju son los niveles de las variables i-ésima y j-ésima en la corrida u-ésima del experimento con X Oll = 1 para toda u..t:. Si se usa un diseño 2/c o 2/c-P como un diseño de superficie de respuesta de primer orden.. Como un ejemplo de la aplicación de estas condiciones. entonces estas condiciones son 1.414 O -1. La fracción de la suma de cuadrados total para cada variable con que contribuye cada bloque. 2..1. considere un diseño central compuesto rotable en k = 2 variables con N = 12 corridas.. es decir. . Los puntos centrales de estos diseños deberán asignarse por igual entre los bloques..414 O O O O 1 Bloqoe 1 Bloque 2 Observe que el diseño se ha dispuesto en dos bloques. pueden usarse los métodos del capítulo 7 para disponer las corridas en 2' bloques. Se dice que un diseño de superficie de respuesta se forma de bloques ortogouales si se divide en bloques tales que sus efectos no afecten las estimaciones de los parámetros del modelo de superficie de respuesta. L x~ L X~t ll=l N ll=l nb i = 1. Si hay nb observaciones en el bloque b-ésimo.i 11-4 DISEÑOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA 463 gundo orden. y durante este tiempo las condiciones de prueba pueden cambiar. 2.. Los niveles Xl y X 2 de este diseño pueden escribirse en la matriz del diseño Xl X2 -1 -1 1 -1 -1 1 1 1 O O O O D= 1. con el primer bloque consistiendo en la porción factorial del diseño más dos puntos centrales y el segundo bloque consistiendo en los puntos axiales más . haciendo necesaria la formación de bloques. es decir.. L u=l nb XillX jll =O i =. Para hacer la formación de bloques ortogonales de un diseño de segundo orden. debe ser igual a la fracción de las observaciones totales que están contenidas en el bloque.414 O -1. deben satisfacerse dos condiciones.414 O O 1. . Cada bloque debe ser un diseño ortogonal de primer orden. =8 12 Puesto que la condición 2 también se satisface en el bloque 2. considere primero el bloque 1 y observe que ~ X¡" = ~ xi" = 4 u=l 1l=1 N N L x¡" = Lxi" = 8 u=l 1l=1 y Por lo tanto. el diseño central compuesto siempre puede construirse para hacer la formación de bloques ortogonales en dos bloques con el primer bloque consistiendo en nF puntos factoriales más n CF puntos centrales y el segundo bloque consistiendo en nA = 2k puntos axiales más nCA puntos centrales. Es claro que la condición 1 se satisface. 4 I " ". X iu o 2 X'~l n2 N 6 u=l .. Para que la segunda condición se cumpla. la ecuación para el valor de a que resultará en la formación de bloques ortogonales puede resolverse como 112 a= nF(nA +nCA ) [ 2(n +n ] CF ) F (11-16) . En general.LJ X 211 u=! 2 _ ~ u=l - 4 y Por lo tanto. L L u=l N ". ambos bloques son diseños de primer orden ortogonales. nI N 6 1l=1 ASÍ. L Xi~l L X~l u=l N ". Para investigar la condición dos. x~. es decir. este diseño está formado de bloques ortogonales. i 464 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA dos puntos centrales adicionales. (11-15) LXi:' " El miembro izquierdo de la ecuación 11-15 es 2a 2/np. Para el bloque 2 se tiene 2 Xl" .. 4 8 - 12 la condición 2 se satisface en el bloque 1. La primera condición de la formación de bloques ortogonales se cumplirá siempre independientemente del valor que se use para a en el diseño. y después de sustituir esta cantidad. la porción factorial del diseño puede dividirse en dos o más bloques. un diseño rotable o esférico.-----=:"--'-- 2(8+n CF ) 2.0000 2.0000 2. En la práctica podría relajarse un tanto el requerimiento de la rotabilidad o bien el de la formación de bloques ortogonales sin ninguna pérdida importante de información. entonces el segundo miembro es 48+8(2) 2.83= 48+8n CA 16+2n CF Es imposible encontrar valores de nCA Yn CF que satisfagan exactamente esta última ecuación.4142 1.4142 1. (El número de bloques factoriales debe ser una potencia de 2.:.3333 2.8284 2.3636 2.91 16+2(3) por lo que el diseño se separa en bloques casi ortogonales. Por ejemplo. si k = 3. observe que si n CF = 3 Y n CA = 2.6818 2.11-4 DISEÑOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA 465 Este valor de a no dará como resultado.3664 3.3784 2.0000 2. en general.8284 1. El diseño central compuesto es muy versátil en cuanto a su capacidad para incorporar la formación de bloques.. Tabla 11-11 Algunos diseños centrales compuestos rotables y casi rotables que se separan en bloques ortogonales 6 5 7 6 2 5 k tRepo tRepo 7 3 4 tRepo Bloque(s) factorial(es) 16 64 32 4 8 16 32 128 64 nF Número de bloques Número de puntos en cada bloque Número de puntos centrales en cada bloque Número total de puntos en cada bloque Bloque axial 1 4 3 7 4 3 7 14 2 4 2 6 6 2 8 20 2 8 2 10 8 2 10 30 4 8 2 10 10 4 14 54 1 16 6 22 10 1 8 8 1 9 12 6 18 90 2 16 4 20 12 2 14 54 16 8 1 9 14 8 8 1 9 14 4 18 80 nA nCA Número total de puntos en el bloque axial Número total de puntos N del diseño Valores dea Separación en bloques ortogonales Rotabilidad 11 25 169 11 33 1. la ecuación 11-17 se reduce a (8) 1/ ? = 8(6+n CA ) ---. Sin embargo.3664 2.8284 2. entonces a = (n F)I/4 Y (n F ) 1/? - = nF(n A +n CA ) 2(n F +n CF ) (11-17) No siempre es posible encontrar un diseño que satisfaga exactamente la ecuación 11-17.3784 3. Si se requiere que el diseño también sea rotable.6330 2.8284 . con la porción axial formando un solo bloque. n F = 8 Y nA = 6.) En la tabla 11-11 se presentan varias disposiciones útiles de la formación de bloques para el diseño central compuesto.0000 2. Si k es lo suficientemente grande. hay otra restricción sobre los niveles de los factores Xl +X z :51 En la figura 11-26 se muestra la región experimental que resulta de aplicar estas restricciones. Por ejemplo. si la temperatura es demasiado elevada y se aplica mucho adhesivo. la suma de cuadrados de los bloques es SSBloques =L b=! ni nb N (11-18) donde E b es el total de las n b observaciones en el bloque b-ésimo y G es el gran total de las N observaciones en los m bloques. entonces estas estimacionesdel error puro podrían agruparse. tomados como -1 a + 1 en la escala de la variable codificada usual. Sólo los puntos centrales que se corren en el mismo bloque pueden considerarse como réplicas. como el diseño central compuesto y el diseño de Box-Behnken y sus variantes (como el cubo con centros en las caras). En los rangos de estos dos factores. Por lo tanto. puede usarse la prueba general de significación de la regresión (el método de la "suma de cuadrados extra") que se describió en el capítulo 10. por lo que el término del error puro sólo puede calcularse dentro de cada bloque. produciendo una región experi- . Las regiones de interés irregulares ocurren con bastante frecuencia. ocasionalmente un experimentador se encuentra con una situación en la que el diseño estándar de superficie de respuesta puede no ser una elección obvia. Una región experimental irregular.4 Diseños (óptimos) generados por computadora Los diseños estándares de superficie de respuesta estudiados en las secciones anteriores. esto lleva a una restricción sobre las variables del diseño. de manera típica existe un diseño de superficie de respuesta que será aplicable al problema. Cuando los bloques no son exactamente ortogonales. 11~4. Sin embargo. El segundo punto se refiere al efecto de bloque. El primero se refiere al uso de los puntos centrales para calcular una estimación del error puro. Si la región experimental es un cubo o una esfera. En términos de las variables codificadas. Los dos factores de interés son la cantidad de adhesivo aplicada y la temperatura de curado. Hay tres situaciones en las que puede ser apropiado algún tipo de diseño generado por computadora. el experimentador sabe que si se aplica muy poco adhesivo y la temperatura de curado es muy baja. son de uso generalizado porque son diseños bastante generales y flexibles. Si el diseño se forma de bloques ortogonales en m bloques. Si la región de interés del experimento no es un cubo o una esfera. un experimentador está investigando las propiedades de un adhesivo particular. 1. Si la variabilidad es consistente en todos los bloques. Además. por ejemplo dondex l representa la cantidad aplicada de adhesivo YXzla temperatura. Los diseños generados por computadora son una alternativa por considerar en estos casos. El adhesivo se aplica a dos piezas y después se cura a una temperatura elevada. los diseños estándares quizá no sean la mejor elección. las piezas resultarán dañadas por la fatiga térmica o bien ocurrirá un pegado inadecuado. las piezas no se pegarán satisfactoriamente.466 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA Cabe destacar dos puntos importantes acerca del análisis de varianza cuando el diseño de superficie de respuesta se ha corrido en bloques. Observe que las restricciones eliminan de hecho dos de los vértices del cuadrado. 5 -1.5 1.X2 +E puede ser de interés. Por ejemplo. consciente de que este modelo empírico es una aproximación del verdadero mecanismo subyacente. Por ejemplo.11-4 DISEÑOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA 467 0. Si las corridas tienen un costo muy elevado o se llevan mucho tiempo. Aun cuando los diseños generados por computadora pueden usarse para este fin. El diseño central compuesto para esta situación requiere entre 28 y 30 corridas. Un modelo no estándar.0 Figura 11-26 Región restringida del diseño en dos variables. Por ejemplo. el modelo y= f3 0 + f31 x l + f32 x 2 + f312 x IX2 + f3llx~ + f322 x i +f31l2X~X2 +f31112X.5 x. suponga que se pretende ajustar un modelo de segundo orden en cuatro variables.0 -0. b 0. No existe ningún diseño de superficie de respuesta estándar que se ajuste exactamente a esta región. El experimentador estaría interesado en obtener un diseño eficiente para ajustar este modelo reducido de cuarto graqo. el experimentador querrá un diseño con menos ensayos. mental irregular (en ocasiones a estas regiones irregulares se les llama "latas abolladas"). ~~ experimentador elige un modelo de superficie de respuesta de primer o de segundo orden. 3. Ocasionalmente. No hay diseños de superficie de respuesta estándares para esta situación (referirse a Myers y Montgomery [85a] para un estudio de las variables categóricas en problemas de superficie de respuesta). el modelo sólo tiene 15 términos. Requerimientos inusuales para el tamaño de la muestra. Como otra ilustración. puede construirse un diseño compuesto pequeño para cuatro factores . por lo general se cuenta con enfoques mejores. en ocasiones se encuentran problemas de superficie de respuesta en los que algunos de los factores del diseño son variables categóricas. un experimentador quizá necesite reducir el número de corridas requeridas en un diseño estándar de superficie de respuesta. Por lo general. 2. Sin embargo. Sin embargo. dependiendo del número de puntos centrales seleccionados. en ocasiones el experimentador puede tener un conocimiento o idea especial acerca del proceso bajo estudio que puede sugerir un modelo no estándar. Existen algunas situaciones en las que el diseño optimal alfabético se conoce o bien . Quizá el de uso más generalizado es el criterio de optimalidad D. Gran parte del desarrollo de los diseños generados por computadora se deriva del trabajo de Kiefer [65a.gonal principal de (X'xtl [a ésta se le llama la traza de (X'xt\ denotada generalmente como tr(X'Xtl]. De manera típica. NV[5'(x)] max a? (11-20) El criterio V considera la varianza de predicción en un conjunto de puntos de interés en la región del diseño. seleccionar el número de corridas que deberán hacerse. Quizás el más popular de estos criterios sea el criterio de optimalidad G. Una medida de la eficiencia relativa del diseño 1 respecto del diseño 2 de acuerdo con el criterio D está dada por (11-19) donde Xl Y X2 son las matrices X de los dos diseños y p es el número de parámetros del modelo. XIII. Un diseño es optimalA si minimiza la suma de los elementos de la dÜj. Un diseño que minimiza la varianza de predicción promedio en este conjunto de m puntos es un diseño optimal V. especificar el criterio de optimalidad y después elegir los puntos del diseño de un conjunto de puntos candidatos que el experimentador consideraría usar. ••• . los criterios de la varianza de predicción son de gran interés práctico. Es decir. En conjunto. o podría ser alguna otra colección de puntos que tienen un significado específico para el experimentador.468 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA con 20 corridas. b] y Kiefer y Wo1fowitz [66] en la teoría de los diseños optimales. Por diseño optimal se entiende un diseño que es "mejor" con respecto a algún criterio. Éstas son en general elecciones superiores al uso de un diseño generado por computadora para reducir el número de ensayos. El enfoque usual es especificar un modelo. donde N es el número de puntos del diseño. Se dice que un diseño es optimal G si minimiza la varianza de predicción escalada máxima en la región del diseño. El criterio de optimalidadA sólo se ocupade las varianzas de los coeficientes de regresión. El conjunto de puntos podría ser el conjunto de candidatos del que se seleccionó el diseño. a los criterios de diseño que se han venido estudiando suele llamárseles criterios de optimalidad alfabética. incluyendo cuatro puntos centrales. Ocurre que un diseño optimal D minimiza el volumen de la región de confianza conjunta para el vector de los coeficientes de regresión. Hay varios criterios de optimalidad populares. Puesto que muchos experimentos de superficie de respuesta se refieren a la predicción de la respuesta. los puntos candidatos son una matriz de puntos distribuidos en la región factible del diseño. Por lo tanto. y también se cuenta con un diseño híbrido con apenas 16 corridas. determinar la región de interés. si el valor máximo de en la región del diseño es un mínimo. por ejemplo Xl' X 2 . Se requieren programas de computadora para construir estos diseños. un diseño optimalA minimiza la suma de las varianzas de los coeficientes de regresión. la eficiencia G de un diseño es precisamente p Ge = . Si el modelo tiene p parámetros. Se dice que un diseño es optimal D si se minimiza. generado con el paquete de software Design-Expert. Se trata de un diseño que no es rotable. En la figura 11-27b se muestra la gráfica de superficie de respuesta correspondiente. el experimentador selecciona una matriz de puntos candidatos y un diseño inicial (quizá al azar) a partir de este conjunto de puntos. región en el diseño optimalD y pasarlas al centro del diseño. para incrementar la posibilidad de que se obtendrá un diseño final que esté muy cerca del optimal. I(X'xt11 = 2.375.11-4 DISEÑOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA 469 puede construirse analíticamente. En la figura 11-29a se muestran también los contornos de desviación estándar constante de la predicción para este diseño optimalD modificado. Debido a que no se evalúan explícitamente todos los diseños posibles. Esto podría ser una idea útil. Para este diseño. donde el DCC inscrito no incluye ninguno de los puntos del diseño. En la figura 11-27a también se muestran los contornos de desviación estándar constante de la respuesta predicha.516 para el diseño optimal D. La eficiencia relativa del DCC inscrito con respecto al diseño optimal D es Es decir.6% que la del diseño optimalD. G YV para ajustar el modelo de primer orden en k variables o para ajustar el modelo de primer orden con interacción. En la figura 11-29a se muestra un tercer diseño. En la figura 11-27a se muestra un diseño central compuesto con cuatro puntos centrales (12 corridas en total) inscrito dentro de esta región. calculada suponiendo que a = 1. Entonces el algoritmo intercambia los puntos que están en la matriz.476 = 2. Para este diseño I(X'xt11 = 1. Para ilustrar algunas de estas ideas. empezando con diseños iniciales diferentes. Algunas implementaciones repiten varias veces el proceso de construcción del diseño. Yla traza de (X'xt1 es 6. en la mayoría de los casos el diseño optimal no se conoce y debe emplearse un algoritmo basado en computadora para encontrar un diseño. En la figura 11-28a y en la tabla 11-12 se muestra un diseño optimalD de 12 corridas para este problema. pero el procedimiento de intercambio suele asegurar que se obtiene un diseño que está "cerca" del optimal. La traza de (X'xt1 es 2. Muchos paquetes de software de estadística que soportan experimentos diseñados cuentan con esta capacidad. y en la fi- . ya que la figura 11-28b muestra que la desviación estándar de la respuesta predicha se incrementa ligeramente cerca del centro de la región del diseño para el diseño optimalD.153 E-4. Sin embargo. creado al tomar las dos réplicas de los vértices de la . Un buen ejemplo es el diseño 2\ que es optimal D. considere el experimento del adhesivo expuesto anteriormente y que llevó a la región experimental irregular de la figura 11-26. En general. los contornos de la desviación estándar de la predicción son más bajos para el diseño optimalD que para el DCC inscrito. Esto implica que tendrían que hacerse 1/0. La mayoría de los procedimientos para construir diseños se basan en el algoritmo de intercambio. Suponga que la respuesta de interés es la fuerza de desprendimiento y que quiere ajustarse un modelo de segundo orden para esta respuesta. A. particularmente cerca de los límites de la región de interés. En las figuras 11-28a y b se muestran también los contornos de desviación estándar constante de la respuesta predicha y la gráfica de la superficie de respuesta asociada (suponiendo que a = 1). no hay garantía de que se ha encontrado un diseño optimal. pero es el DCC más grande que puede ajustarse dentro del espacio del diseño. Observe que el criterio D es considerablemente mejor para este diseño que el DCC inscrito. En esencia.1 réplicas del DCC (o aproximadamente el doble) para tener la misma precisión de la estimación de los coeficientes de regresión que la que se consigue con el diseño optimalD.852 E-2. pero no en el diseño. con los puntos que están actualmente en el diseño. lo cual indica que la suma de las varianzas de los coeficientes de regresión es considerablemente más pequeña para este diseño que para el DCC. el DCC inscrito tiene una eficiencia de sólo 47. en un esfuerzo por mejorar el criterio de optimalidad seleccionado. 50 >iN 0.50 (a) 0.00 %. 0.001------1.00 El diseño y los contornos de "'¡V (9(xll/oZ constante -0.50 -0.50 (1)) La gráfica de superficie de respuesta Figura 11·27 Un diseño central compuesto inscrito para la región restringida del diseño de la figura 11-26.50 1.470 CAPÍTULO 11 1.00 MÉTODOS DE SUPERFICIES DE RESPUESTA 0. .00 -0.50 -1.00 -0. 00 -0.00 -1.. Un diseño optimaI D para la región restringida del diseño de la figura .:::::::~__--.=::t:::i..00 Ibl La gráfica de superficie de respuesta Figura 11-28 11-26.11-4 DISEÑOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA 2 471 l-{N 0.00 ~~...50 0.50 1. 0.00 L -1.. (a) El diseño y los contornos de N [ji(x) 1/0' constante -1..00 2 -1.J~- __.00 x.. 00 0. entonces i = 1.00 -0.25 -1.00 0.00 0.25 -1.00 -0. particularmente en el centro de la región.00 -0.08 -1.0002153)1/6 =0. Los contornos de desviación estándar constante de la predicción para este diseño dan la impresión visual de ser al menos tan buenos como los del diseño optimal D.08 1.xp denota las proporciones de p componentes de una mezcla. En problemas experimentales reales.00 -0.. por lo general hay muchos criterios que es necesario evaluar para seleccionar un diseño.00 1.000371 Es decir. referirse a Myers y Montgomery [85a. un valor ligeramente mayor que el que se obtuvo para el diseño optimalD. Sin embargo.00 -1. Los diseños generados por computadora con base en los criterios de optimalidad alfabética pueden ser ciertamente útiles en situaciones en las que la región experimental no es ni esférica ni cuboidal.00 0. Por ejemplo. El criterioD para este diseño es I(X'xyll = 3.91 I(X~Xlfll 0. no son sustitutos de los diseños estándares en la mayoría de los problemas. 100%) .X 2 fll )lIP =(0. 11~5 EXPERIMENTOS CON MEZCLAS En las secciones anteriores se presentaron diseños de superficie de respuesta para aquellas situaciones en las que los niveles de cada factor son independientes de los niveles de otros factores. Y la eficiencia relativa es D = e (I(X.472 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA Tabla U-12 Diseño optimal D para la región restringida de la figura 11-26 Xl X2 Orden estándar 1 2 3 4 5 6 7 8 9 10 11 12 -0. . Para un estudio más amplio de este tema. los factores son los componentes o ingredientes de una mezcla y.50 0. La traza de (X'xtl es 2. Los diseños optimales alfabéticos se generan apegándose estrictamente a un solo criterio y. En los experimentos con mezclas. capítulo 8].00 1.08 gura 11-29b se muestra la gráfica de la superficie de respuesta.00 -1.71 E-4.x2.2.448 para este diseño.00 1.00 1.08 -1.50 1. como se señaló al principio de la sección 11-4. donde se enlistaron varios criterios para diferentes diseños. .00 0.. este diseño es casi tan eficiente como el diseño optimalD. incluyen varios que son de carácter un tanto cualitativo o subjetivo. por consiguiente. +x 2 +oo·+XP =1 (es decir. sus niveles no son independientes.00 -0. oo.. p y xl . six l . 00 -1..1'11' 1 11 11-5 EXPERIMENTOS CON MEZCLAS 473 -0. .50 -1.29 Un diseño optimalD modificado para la región restringida del diseño de la figura 11-26.::::::::::::=~--JC=~_ -0.50 0.50 1.00 0.00 L __~~. la) El diseño y los contornos de ~V [jilxll/a2 constante lb) La gráfica de superficie de respuesta Figura 11.00 X. Cada uno de los tres lados de la gráfica de la figura 11-31 representa una mezcla que no contiene nada de alguno de los tres componentes (el componente indicado en el vértice opuesto). Cuando hay tres componentes en la mezcla.r1 . . p (11-21) m m y se usan todas las combinaciones posibles (mezclas) de las proporciones de la ecuación 11-21. Para dos componentes. Un diseño símplex reticular {p.1 i = 1. con cada componente siendo acotado por Oy 1. Como un ejemplo. como se muestra en la figura 11-31. 1 2 Xi = 0. Estas restricciones se ilustran gráficamente en la figura 11-30 para p = 2 YP = 3 componentes. m} parap componentes consta de los puntos definidos por los siguientes arreglos de las coordenadas: las proporciones asumidas por cada componente toman los In + 1 valores que están separados por una distancia igual de O a 1. el espacio de la mezcla es un triángulo con vértices que corresponden a las formulaciones que son mezclas puras (mezclas que son 100% de un solo componente)."'. Los diseños símplex se usan para estudiar los efectos de los componentes de una mezcla sobre la variable de respuesta. 2.. 474 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA o X.2. Figura 11-31 Sistema coordenado trilineal. 3 . X. sean p = 3 Y m = 2. el espacio de los factores del diseño incluye todos los valores de los dos componentes que están sobre el segmento de recta Xl + X 2 = 1.-.oo. b) Figura 11-30 Espacio de los factores restringidos para mezclas con a) p = 2 componentes y b)p = 3 componentes. Las nueve líneas de graduación en cada dirección marcan incrementos de 10% en el componente respectivo. la región experimental restringida puede representarse convenientemente en papel milimétrico trilineal. + x 2 = 1 a) X. Entonces i = 1. Con tres componentes.-. O. En la figura 11-32 se muestran también los diseños símplex reticulares {3. y el diseño símplex reticular consta de las seis corridas siguientes: (xl'x 2 . O. mientras que los puntos (t. t.. 2] Retícula [4. 1) son las mezclas puras. O. oo. O). 3}. t). 3}. 1. O). O.--) ! m!(p-1)! Una alternativa del diseño símplex reticular es el diseño símplex de centroide. oo. Yel centroide global (. O).. O). O. hay 2P -1 puntos. O)...oo. x 3 ) = (1.).oo. 1. O). = 1 Retfcula [3. O). 2] X. . O) Y(O. O. m} es N = . el número de puntos en un diseño símplex reticular {P. 2} Y{4. En la figura 11-33 se muestran algunos diseños símplex de centroide. a) b) Figura 11-33 Diseños símplex de centroide con a) p = 3 componentes y b) p = 4 componentes.. O. t) y (O. las (f) permutaciones de (t. (O. oo. En un diseño símplex de centroide con p componentes.:(p. t. (t. t) En la figura 11-32 se ilustra este diseño. O.:. . t) son mezclas binarias o mezclas de dos componentes localizadas en los puntos medios de los tres lados del triángulo.11-5 EXPERIMENTOS CON MEZCLAS Xl 475 = 1 X.. 1). (O. O). . t. En general. O. t. . las (~) permutaciones de (t. = 1 Retícula [3. t. 31 Figura 11-32 Algunos diseños símplex reticulares para p = 3 YP = 4 componentes. Los tres vértices (1.. (t.. . O. (t. (O. t. 31 Xl = 1 X3 = 1 X 3 = 1 Retfcula [4. (O. que corresponden a las p permutaciones de (1.-+_n_l_-_1. t. {4. Los modelos para mezclas difieren de los polinomios usuales empleados en los diseños de superficie de respuesta debido a la restricción Lx¡ = 1.=1 i<j p j (11-23) E(y) = L .=lf3¡X¡ se le llama porción de mezcla lineal. Las formas estándares de los modelos para mezclas que se usan ampliamente son Lineal: p E(y) = Cuadrático: L f3¡x¡ ¡=1 p (11-22) E(y) = Cúbico completo: L f3¡x¡ + LL f3ijx¡X . Una mezcla de tres componentes Comell [33] describe el experimento con una mezcla en el que se combinaron tres componentes -polietileno (Xl). En las ecuaciones 11-22 a 11-25.3 .para hilar una fibra que se usará en cortinas. los parámetros f3ij representan una mezcla sinérgica o bien antagónica.=1 p f3¡x¡ + LL f3ijx¡X i<j p j (11-25) Los términos de estos modelos tienen interpretaciones relativamente simples. Se usa un diseño símplex . en consecuencia.=1 p f3¡x¡ + LL f3ijx¡X i<j p j (11-24) i<j Cúbico especial: E(y) = L . incluyen sólo p -1 de los p componentes.:é i. Los términos de órdenes superiores suelen ser necesarios en los modelos para mezclas porque 1) los fenómenos estudiados pueden ser complejos y 2) la región experimental con frecuencia es la región de operabilidad completa y. ver Comell [33] y Myers y Montgomery [85a]. el parámetro f3¡ representa la respuesta esperada para la mezcla purax¡ = 1 Yxj = Ocuando j .476 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA Una crítica a los diseños símplex descritos antes es que la mayoría de las corridas ocurren en la frontera de la región y. La variable de respuesta de interés es la elongación del hilo en kilogramos de fuerza aplicada.. por consiguiente. Cuando hay curvatura derivada de una mezcla no lineal entre pares de componentes. poliestireno (x z) y polipropileno (x3). Para un estudio más amplio. es grande y requiere un modelo elaborado. EJEMPLO 11. A la porción L. Suele ser deseable aumentar el diseño símplex reticular o de centroide con puntos adicionales en el interior de la región donde las mezclas estarán formadas por la totalidad de los p componentes. 0XI X2 + 11. 14. La desviación estándar del error puede estimarse a partir de estas réplicas de las observaciones como fj = 0. .4 10.4.6x 2 x 3 Puede demostrárse que este modelo es una representación adecuada de la respuesta.5 16.0.4 16.1 8.12.16.9 reticular para estudiar el producto. obteniendo y= 11.85. Los componentes 2 y 3 tienen efectos de mezclado antagónicos. se observa que si se desea la elongación máxima.16.7 15.8 16.16.4xl x 3 - 9. Observe que todos los puntos del diseño incluyen mezclas puras o binarias.11-5 EXPERIMENTOS CON MEZCLAS 477 Tabla 11-13 El diseño símplex reticular {3. También se corren réplicas de las observaciones.7xI + 9.9.0 10. Observe que como {J3 > {JI > {J2' se concluiría que el componente 3 (polipropileno) produce el hilo con la elongación máxima.0.4 15. lo cual puede ser de utilidad para interpretar los resultados. con dos réplicas de cada una de las mezclas puras y tres réplicas de cada una de las mezclas binarias. la mezcla de los componentes 1 y 2 o de los componentes 1 y 3 produce valores más altos de la elongación de los que se esperarían si nos limitáramos a promediar las elongaciones de las mezclas puras. deberá elegirse la mezcla de los componentes 1 y 3. la cual está formada por aproximadamente 80% del componente 3 y 20% del componente 1. x. puesto que {J12 y {J13 son positivos.7.0 17.8. Al examinar la figura. En la figura 11-34 se grafican los contornos de la elongación. Comel1 ajusta el polinomio de segundo grado de la mezcla a los datos. 2} para el problema de la elongación del hilo Proporciones de los componentes Valores observados Punto del diseño Xl X2 X3 de la elongación Valor promedio_ de la elongación (y) 1 2 3 4 5 6 1 "2 l O "2 l O O O l 1 O O O "2 l "2 O O "2 l 1 "2 l 11. Se trata de un ejemplo de los efectos de mezclado "sinérgicos". únicamente se usan a lo sumo dos de los tres componentes en cualquier formulación del producto. es decir.6 11. 16.4x 2 + 16.8.4x3 + 19.8. ya que {J23 es negativa. El diseño y las respuestas observadas se muestran en la tabla 11-13.0. 11.7.3 9. Figura 11·34 Contornos de la elongación estimada del hilo constante en el modelo de segundo orden para la mezcla del ejemplo 11-3.10. Además. é i. Esto es de particular utilidad cuando el experimentador no está seguro acerca del modelo apropiado que debe usar y también planea construir un modelo secuencialmente empezando con un polinomio simple (quizá de primer orden).é i. mientras que la retícula símplex aumentada no lo hará. al vértice opuesto dondex¡ = 1.xj = 1/(p -1). Si el experimentador quiere hacer predicciones acerca de las propiedades de mezclas completas.] La longitud del eje del componente es una unidad. El valor máximo de!1 es (p -1)/p. Se recomienda que las corridas axiales se coloquen a la mitad entre el centroide del diseño símplexy cada vértice para que!1 = (p -1)/2p. con cuatro de ellos en el interior del diseño símplex. sería muy deseable contar con más corridas en el interior del símplex. La retícula símplex {3. El eje del componente i es la recta o rayo que se extiende del punto basex¡ = O. como ¡31233XIX2X~. xj = O para todaj . Este diseño tiene 10 puntos. En ocasiones a estos puntos se les llama mezclas de verificación axial.é i. porque es una práctica común excluirlas cuando se ajusta el modelo preliminar de la mezcla y usar después las respuestas en estos puntos axiales para verificar la adecuación del ajuste del modelo preliminar. probar el modelo para la Figura 11-35 Un diseño símplex reticular aumentado. Los puntos axiales se sitúan sobre los ejes de los componentes a una distancia !1 del centroide.xj = Opara todaj . El punto base siempre se localizará en el centroide de la frontera de (p . [Ala frontera se le llama en ocasiones el (p . 3}. para toda j . 2} aumentado con los puntos axiales. Se recomienda aumentar los diseños símplex ordinarios con corridas axiales y el centroide global (si el centroide no es ya un punto del diseño). 3} soportará el ajuste del modelo cúbico completo.2) dimensiones del diseño símplex que está opuesto al vértice Xi = 1. ra.478 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA Se señaló ya que los diseños símplex reticular y símplex de centroide son diseños de puntos fronte. la retícula símplex aumentada permitirá al experimentador ajustar el modelo cúbico especial o agregar al modelo cuadrático términos especiales de cuarto orden. La retícula símplex aumentada tiene más potencia para detectar la falta de ajuste que la retícula {3. La retícula símplex aumentada es superior para estudiar la respuesta de mezclas completas en el sentido de que puede detectar y modelar la curvatura en el interior del triángulo que no puede tomarse en consideración por los términos del modelo cúbico completo. . En la figura 11-35 se muestra el diseño símplex reticular {3.2)-llano. sin embargo. . 2. . . . . . . . probar el nuevo modelo para la falta de ajuste y así sucesivameme. . Esta situación puede simplificarse mediante la introducción de pseudocomponentes. 25 25':::. El recubrimiento total es una mezcla de tres componentes. Es decir.:::. . +(1. . . Formulación de una pintura Un experimentador está intentando optimizar la formulación de una pintura automotriz de recubrimiento total. . six~es el valor asignado al pseudocomponente i-ésimo en una de las corridas del experimento. . . . . en particular. . . Se trata de productos complejos que tienen requerimientos de desempeño muy específicos.~ 1¡ )x. . . Puesto que la región de interés no es símplex. .:::. . Xl . . .x 3 . .. que la dureza Knoop exceda de 25 y que el porcentaje de sólidos esté abajo de 30. . .:::. . .:::. . . .. En algunos problemas de mezclas surgen restricciones sobre los componentes individuales. . EJEMPLO 11. . . . ~ 1. se usará un diseño optimal D para este problema. . la región factible del diseño sigue siendo un diseño símplex. . Puesto que la región experimental no tiene una forma "estándar". . Existen restricciones sobre las proporciones de los componentes: Xl +x 2 +x 3 = 100 5. . . . será. definidos como x> (1:'~\1 x' l +x' 2 +···+x' P =1 (11-26) por lo que el uso de pseudocomponentes permite utilizar diseños tipo símplex cuando las fronteras inferiores forman parte de la situación experimental. Suponiendo que posiblemente ambas respuestas serán modeladas con un modelo cuadrático de una mezcla. . pero se inscribe dentro de la región del símplex original. El cliente quiere. la región factible deja de ser un diseño símplex. un politopo irregular. el componente i-ésimo de la mezcla original es x.11-5 EXPERIMENTOS CON MEZCLAS 479 falta de ajuste. Cuando sólo están presentes restricciones sobre la frontera inferior. Las restricciones sobre la frontera inferior de la forma i = 1. Las formulaciones especificadas por el diseño símplex para los pseudocomponentes se transforman en formulaciones para los componentes originales invirtiendo la transformación de la ecuación 11-26.. . . . . (11-27) Cuando los componentes tienen restricciones tanto sobre la frontera superior como la inferior.4 .:::. después aumentar el modelo con términos de órdenes superiores. . . los diseños generados por computadora son muyútiles para este tipo de problemas de mezclas. . . . . un entrelazador (x 2 ) y una resina (x3 ). en cambio. 40 50.x 2 . el diseño optimalD ilustra- . . P son muy comunes. 70 El resultado es la región de experimentación restringida ilustrada en la figura 11-36. que consiste en un monómero (Xl). . . . .. . 00 50.59 19.01 41.00 53.13 8.480 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA Monómero 25.00 70.00 25.98 31.13 25.75 28.00 25. Tabla 11-14 Diseño optimal D para el problema de la formulación de la pintura del ejemplo 11-4 Orden Monómero Entrelazador Resina Dureza Sólidos estándar Corrida X2 X3 X¡ Y¡ Y2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 2 1 4 13 7 3 6 11 10 14 12 9 5 8 17.2 23.00 5.00 25.539 27.00 Resina Figura 11-36 La región experimental restringida para el problema de la formulación de la pintura del ejemplo 11-4 (mostrada en la escala real del componente).00 50.00 60.00 5.33 63.00 40.50 10.00 32.46 74.50 40.00 18.75 25.00 45 Entrelazador 5.50 56.00 25.00 25.00 15.13 50.00 28.00 50.25 5.50 40.21 30.00 29 26 17 28 35 31 21 20 29 25 19 14 30 23 9.00 10.50 32.98 70.5 15.46 32.49 23.00 11.00 25.00 15.00 5.44 32.00 32.00 70.00 62.00 50.25 55.33 29.95 .00 60. 3635 4.62 0.80 1 1 1 1 1 1 3.57 DF Standard Error 23. el centroide global y las corridas de verificación (los puntos localizados a la mitad entre el centroide y los vértices) como los puntos candidatos.56 Linear Mixture F Value Prob> F 2.55 34. En las figuras 11-37 y 11-38 se muestran las gráficas de contorno de las respuestas.5630 0.79 19. se harían cuatro corridas diferentes adicionales para verificar la falta de ajuste y que se harían réplicas de cuatro de estas corridas a fin de proporcionar una estimación del error puro.63 125.25 67.91 31.67 8.40 29. Observe que los modelos cuadráticos se ajustan muy bien tanto a la respuesta dureza como a la respuesta sólidos.26 23.36 7.51 468.00 1 1 1 8 4 4 72.11-5 EXPERIMENTOS CON MEZCLAS 481 Tabla 11-15 Ajuste del modelo para la respuesta dureza Response: hardness ANOVA for Mixture Quadratic Model Analysis of variance table [Partial sum of squares] Mean Sumof Squares DF Square Source 279.62 3.975 95%CI Low 16.60 Coefficient Estimate 13 0. Evidentemente. Dev.63 63. El diseño con 14 corridas se muestra en la tabla 11-14 junto con las respuestas dureza y sólidos.12 37.68 '3.94 23.32 Final Equation in Terms of Pseudo Components: hardness = +23.81 +16. La figura 11-39 es una gráfica de superposición de las dos superficies de respuesta.86 24.45 +44.80 *A *B *C *A*S *A*C *S*C do en la figura 11-36 puede generarse utilizando Design-Expelt.36 4.40 +29.58 15.42 -44. además de las seis corridas requeridas para ajustar el modelo cuadrático de una mezcla.01 13.61 179.08 0.97 95%CI High 31.37 0. La región factible para este producto es el área sin sombrear cerca del centro de la gráfica.80 -7.59 638. los centros en los bordes.3455 -0.07 -1.67 8. existen varias elecciones .V.36 25.95 -80.31 15.81 16. Los resultados del ajuste de modelos cuadráticos para ambas respuestas se resumen en las tablas 11-15 y 11-16.1329 0.5973 0.71 -13.19 102. Mean C.25 R-Squared Adj R-Squared Pred R-Squared Adeq Precision 7.26 188.73 5 55. En estas tablas se muestran las ecuaciones ajustadas para ambas respuestas (en términos de los pseudocomponentes). Design-Expen utilizó los vértices.61 179.32 21. Se supuso que.35 0. PRESS Component A-Monomer B-Crosslinker C-Resin AS AC SC 72.0247 0.42 -44.01 +13. donde se muestra el contorno de la dureza Knoop de 25% y el contorno de 30% para los sólidos.78 -39.95 Model 29.1174 0.45 44.5703 0.7354 AB AC BC Residual Lack of Fit Pure Error Cor Total Std.13 2 14. 53 64.67 1036.23 -75.60 +73.0001 0.67 Final Equation in Terms of Pseudo Components: solids = +26.73 5.0005 0.61 1 1 1 1 1 1 3.V.0191 0. Dev.98 31.68 82.50 -154.00 Resina Figura 11-37 Gráfica de contorno de la respuesta dureza Knoop.22 -218.99 9.32 25. PRESS Component A-Monomer B-Crosslinker C-Resin AB AC BC 266.09 2 1465.9416 0.94 5 859.79 139.35 34.23 -75.075 95%CI Low 95%CI High DF Standard Error 26.02 -145.r' Tabla 11-16 Ajuste del modelo para la respuesta sólidos Response: solids ANOVA for Mixture Quadratic Model Analysis of variance table [Partial sum of squares] Sum of Mean Source Squares DF Square Model 4297.43 -6.78 43.95 6.72 R-Squared Adj R-Squared Pred R-Squared Adeq Precision 0.0001 <0.14 3.86 4564. Mean C.9050 0.61 *B *C *A* B *A*C * B* C *A Monómero 25.01 17.77 33.20 F Value Prob> F AC BC 285.66 AB 211.00 2 2 45. ejemplo 11-4.96 27.56 35.7827 15.49 991.76 -55.33 8.10 <0.86 Coefficient Estimate 1 1 8 4 4 13 285.57 31.99 30.74 67.19 -99.0360 0.53 +46.59 Linear Mixture 2931.00 Entrelazador 5.60 73.4633 33.09 1.53 46.67 1036.73 17.11 18.92 126.77 -90.34 -11.00 70.50 -154. .20 1 211.76 -55.72 25.72 Residual Lack of Fit Pure Error Cor Total Std. 00 5..00 L+o_~.L.00 2 '+45.11-5 EXPERIMENTOS CON MEZCLAS Monómero 483 25. __ 2 70.00 5. ejemplo 11-4.00 70.00 Entrelazador Resina Figura 11-39 Gráfica de contorno de las respuestas dureza Knoop y porcentaje de sólidos. ..00 Entrelazador Resina Figura 11-38 Gráfica de contorno de la respuesta sólidos... Monómero 25. donde se indica la región factible para la formulación de la pintura.00 2 45. . .. La EVOP consiste en introducir de manera sistemática pequeños cambios en los niveles de las variables de operación bajo consideración.. la calidad o la cantidad.. la EVOP puede aplicarse akvariables del proceso....... La planta piloto puede producir 2 libras de producto por día. Está diseñado como un método de operación rutinaria en la planta que lleva a cabo el personal de manufactura con un mínimo de asistencia del equipo de investigación y desarrollo.... Se colectan datos de las variables de respuesta de interés en cada punto del diseño 2k • Cuando se ha hecho una observación en cada punto del diseño...6 Personal de investigación y desarrollo aplica con frecuencia la metodología de superficies de respuesta en operaciones de plantas piloto. Box y Draper [16a] ofrecen un estudio detallado del caso de tres variables. es decir. . Finalmente. ... Se supone que los cambios de las variables son lo suficientemente pequeños para que no ocurran perturbaciones serias en el rendimiento. el diseño 2k se centra por lo general en torno a las mejores condiciones de operación actuales. suele hacerse una sola vez (o con poca frecuencia).. . por ejemplo.. La operación evolutiva (EVOP. Sin embargo.. Para probar la significación de las variables e interacciones del proceso. pero lo suficientemente grandes para descubrir en última instancia mejoras potenciales en el desempeño del proceso. Se requiere un método para el monitoreo y el mejoramiento continuo de un proceso a gran escala cuyo objetivo sea mover las condiciones de operación hacia el óptimo o después de una "desviación". ... ya que el procedimiento experimental es relativamente minucioso.... es posible verificar la curvatura o cambio en la media (CIM... OPERACIÓN EVOLUTIVA 11. si el proceso en realidad se centra en el máximo.. mientras que el proceso a gran escala puede generar 2000 libras diarias. con el tiempo se "desvía" de ese punto debido a las variaciones en las materias primas.. Se presentará un ejemplo del procedimiento para dos variables... Incluso si la planta a gran escala empieza a operar en el óptimo. Cuando se han detectado las condiciones mejoradas.. En este punto se debe tomar una decisión para modificar las condiciones de operación básicas a fin de mejorar la respuesta. Generalmente se emplea un diseño 2k para hacer esto.. Entonces pueden calcularse los efectos y las interacciones de las variables del proceso.. Esta "escalación" de la planta piloto al proceso de producción a gran escala da por lo general como resultado la distorsión de las condiciones óptimas... ..... Myers y Montgomery [85a] revisan la implementación en computadora de la EVOP... .. El método no deberá requerir cambios grandes o repentinos de las condiciones de operación que pudieran interrumpir la producción. las condiciones que fueron óptimas para la planta piloto quizá no lo sean para el proceso a gran escala. Ésta se calcula a partir de los datos del ciclo... los cambios ambientales y el personal de operación.484 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA para las proporciones del monómero.. el entrelazador y la resina para el recubrimiento total que redunda_ rá en un producto que satisfaga los requerimientos de desempeño.. En la práctica es común considerar sólo dos o tres variables..... por sus siglas en inglés). se dice que se ha terminado una fase.... Mediante la comparación de la respuesta en este punto con los 2k puntos de la porción factorial. se necesita una estimación del error experimental.. entonces la respuesta en el centro deberá ser significativamente mayor que las respuestas en los puntos periféricos del diseño 2k • En teoría. incluyendo las formas y hojas de trabajo necesarias. Cuando se apli~a a un proceso de producción a gran escala. el efecto de una o más variables del proceso o sus interacciones sobre la respuesta puede parecer significativo. .. por sus siglas en inglés) fue propuesta por Box [12c] como un procedimiento de operación con estas características... Además..... se dice que se ha completado un ciclo.. después de varios ciclos... . 9 84.17 Hoja de cálculo EVOP para el ejemplo 11-5.5'5) = 0.2 84.5). 2 Para el nuevo promedIo = Jii S = Para los nuevos efectos Jii S = 2 1.9 84. El procedimiento EVOP utiliza el diseño 22 más el punto central mostrado en la figura 11-40.5 84.9 84.5'4 .5 x.(iü)] (v) Nuevas sumas [(i) + (iii)] (vi) Nuevos promedios lYi = (v)/n] 84.78 · en 1 Para e1camb10 a me d' 13 Jii S = .02 Cálculo de los límites de error . 145 H N 84. la cual se muestra en la tabla 11-17.2 84. Considere un proceso químico cuyo rendimiento es una función de la temperatura (Xl) y la presión (x2 ). EJEMPLO 11~5 . Los rendimientos del primer ciclo se anotan en la hoja de cálculo EVOP.5 84. Las condiciones de operación actuales sonx I = 250°F YX 2 = 145 psi.2 245 (4) 84.3 Rango de (iv)= Nueva suma S = Nuevo promedio S = Nueva sumaS n-l Cálculo de los efectos Efecto de la temperatura = t(5'3+ 5'4 . Tabla 11.5 84. n = 1 5 í]l3 2 W 4 Ciclo: n = 1 Respuesta: Rendimiento Fase: 1 Fecha: 1/11/00 Cálculo de la desviación estándar (5) Suma anterior S = Promedio anterior Cálculo de los promedios Condiciones de operación (i) Suma del ciclo anterior (ii) Promedio del ciclo anterior (1) (2) (3) (4) S= (iü) Nuevas observaciones (iv) Diferencias [(ii) .= 84.4.5 • (2) 140 84.5 84. 250 (OF) Figura 11·40 Un diseño 22 para la EVOP.25 Efecto de la interacción T x P = !(5'2 + 5'3 .15 Efecto del cambio en la media =t(5'2 + 5'3 + 5'4 + 5'5 -45'1) = 0.3 84.2 84.45 Efecto de la presión = !(5'3 + 5'5 .5'5) = 0.5'4) = 0.5 84.11-6 OPERACIÓN EVOLUTIVA 84.9 (3) 485 (1) ].3 Nueva S = rango x /5". El ciclo se completa corriendo cada punto del diseño en orden numérico (1.3 150 (5) 84. Los rendimientos del primer ciclo se muestran también en la figura 11-40.3..5 84.5'2 .5'2 .2. Al término del primer ciclo no puede hacerse ninguna estimación de la desviación estándar. 17 t(Y2 + Y3 + Y4 + Ys .2 84.85 . Esto se consigue mediante un tablero con información EVOP a la vista de todos. probablemente el verdadero efecto sea cero.3 84.6 -0.486 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA = Tabla 11-18 Hoja de cálculo EVOP para el ejemplo 11-5.Ys) = 0.9 85..8 84.Y4 .83 Efecto del cambio en la media = -0.70 (2) 84. parece razonable empezar una nueva fase EVOP alrededor del punto (3).Ys) = 0.4 169. Observe que el rango se refiere al rango de las diferencias del renglón (iv).n = 0. Puesto que ninguno de los efectos de la tabla 11-18 excede sus límites de error. el error experimental puede estimarse y las estimaciones de los efectos pueden compararse con límites aproximados de 95% (dos desviaciones estándar). por lo tanto.8 85. y no se contemplan modificaciones en las condiciones de operación.¡n S = 0.¡n 1.9 -1.(iii)] (v) Nuevas sumas [(i) + (iii)] (vi) Nuevos promedios lYi = (v)/n] (3) 84. 2 Para el nuevo promedlO = . Probablemente ahora se justifique un cambio en las condiciones de operación.76 Para el camblO Los efectos y la interacción de la temperatura y la presión se calculan de la manera usual para un diseño 22 • Después se corre un segundo ciclo y los datos del rendimiento se registran en otra hoja de cálculo EVOp.¡n Efecto de la presión = hY3 + Ys -Y2 -Y4) = 0. En la tabla 11-20 se muestra el tablero de información para este ejemplo al final del ciclo 3.60 n-1 Cálculo de los efectos Efecto de la temperatura = t (y3 + Y4 - Y2 ...4 168.15 Suma anterior S = Promedio anterior S = Nueva S = rango x Ciclo: n = 2 Respuesta: Rendimiento Cálculo de los promedios Condiciones de operación (1) 84. el rango es + 1. A la luz de los resultados.5 84.60 Rango de (iv) = 2.60 Nuevo promedio S = Nueva suma S .40 (4) 84.0 170.58 Efecto de la interacción T x P = t(Y2 + Y3 .2 84. de información generada por el proceso para operadores y supervisores. Ahora.0) = 2.(-1.00 fs.3 84.0.43 Cálculo de los límites de error . Xl = 225°F Y X 2 = 150 psi serían el centro del diseño 22 en la segunda fase.5 84. -----=0..0 168. n 5 rjl3 2 W 4 2 Fase: 1 Fecha: 1/11/00 Cálculo de la desviación estándar (5) 84. en 1a me d'la.5 +1. Por lo tanto. Un aspecto importante de la EVOP es la retroalimentacióp.5 83.0 0. En la tabla 11-19 se muestran los resultados de un tercer ciclo.3 84.85 2 Para los nuevos efectos e S = 0. la cual se muestra en la tabla 11-18.78 S = 0.0 Nueva suma S = 0.9 -0.40 (i) Suma del ciclo anterior (ii) Promedio del ciclo anterior (iii) Nuevas observaciones (iv) Diferencias [(ii) . .0 84.4 84.9 84. el efecto de la presión excede su límite de error y el efecto de la temperatura es igual al límite de error.5 84. Al final del segundo ciclo.0 .4Yl) = .3 168. 27 • 140 • 84.9 -0. 11 Tabla 11-20 Tablero de información EVOp.07 .4 85.40 84.30 (i) Suma del ciclo anterior (ii) Promedio del ciclo anterior (iii) Nuevas observaciones (iv) Diferencias [(ii) .5 84.4 84.58 0.0 +0.60 Nueva suma S = 1.70 85.60 .Y4 .56 Rango de (iv) = 1.8 85.1 Cálculo de los promedios Condiciones de operación (1) 169.64 Efecto del cambio en la media =!(Y2+ Y3+ Y4 + Y5 -0.67 -4Yl) = · en 1a me d'la 1.20 257.Y2 .80 (2) 168.30 255 Temperatura • Límites de error para los promedios: ±0.67 0.Y2 ." 11-6 OPERACIÓN EVOLUTIVA 487 Tabla 11-19 Hoja de cálculo EVOP para el ejemplo 11-5.30 254.Y5) = 0.2 -1.60 Nueva S = rango x f5.6 -1.67 in S = 0..67 Efectos con limites de error de 95%: Desviación estándar Thmperatura Presión 0.90 252.60 Promedio anterior S = 0.8 84.50 Suma anterior S = 0.80 84.67 ±0.0 -0.50 • 85.9 84.80 (4) 168.80 • ~ 145 "~ c::: 84.4 84.. ciclo 3 Respuesta: Rendimiento porcentual Requerimiento: Maximizar 150 84.(iii)] (v) Nuevas sumas [(i) + (iii)] (vi) Nuevos promedios ¡Ji = (V)/I1] Cálculo de los efectos Efecto de la temperatura = Cálculo de los límites de error Para el nuevo promedio = Para los nuevos efectos t(Y3 + Y4 .n S = 0.40 86..Y5) = 0.05 253.67 ±0.64 0.67 Efecto de la presión = teY3 + Y5 .n = 0.15 85.8 84..67 ±0.0 84.16 Nuevo promedio S = Nueva sumaS = 0.58 11.60 TxP Cambio en la media 0.40 252.00 84. n = 3 5 i]13 2 W 4 Ciclo: 11 = 3 Respuesta: Rendimiento Fase: 1 Fecha: 1/11/00 Cálculo de la desviación estándar (5) 168.27 (3) 170.87 Efecto de la interacción T x P = t(Y2 + Y3 .07 2 .Y4) = 0.87 ±0.3 84.78 P ara e1camb la e S =0. (n-l).31 0. V(CIM) = V[~(Y2 + Y3 + Y4 + Ys .29 0. A partir de la década de 1980.31 La mayoría de las cantidades de la hoja de cálculo EVOP se obtienen directamente del análisis del di.29 6 0. por ejemplo Rn .78al"¡¡:¡'.32 0. desarrollo y mejoramiento de productos y procesos. Sea que y¡(n) denote la observación en el punto del diseño i-ésimo en el ciclo n. Para un diseño 22 con un punto central se tiene k = 5.n)Rn = S A para estimar la desviación estándar de las observaciones. La varianza de estas diferencias es V[y¡(n)-y¡(n-l)]=a~ =a 2[1+-I_J=a (n-l) 2 ( nI) n- El rango de las diferencias.39 0. n 2 0. se relaciona con la estimación de la desviación estándar de las diferencias por an = RJd2 • El factor d 2 depende del número de observaciones utilizadas para calcular R n · Entonces R nld2 = tNnl(n .Por ejemplo.31 0.)= (20)~ 25 y y 25n Por lo tanto.4Y1)] = ~(5a1.27 0. La varianza del cambio en la media es cr crin.30 0. la varianza de cualquier efecto.1 DISEÑO ROBUSTO Antecedentes A lo largo de este libro se ha hecho hincapié en la importancia del uso de experimentos diseñados estadísticamente en el proyecto.26 4 0. y para un diseño 23 con un punto central se tiene k = 9.40 0. los ingenieros y científicos han adquirido la conciencia creciente de los beneficios del uso de experi- .35 0.40 0.30 9 0. por lo que puede usarse /n-l) R n _ a= -n-d.37 0.30 0.30 7 0.31 10 0.(n) -)l.30 8 0.+16a1. 11~7 11~7. los límites de error de dos desviaciones estándar para el CIM son ± (2V20/25)al"¡¡:¡' = ±1.38 0. Por lo tanto. Los valores de k n se dan en la tabla 11-21.32 0.31 0. como tcY3 + )lS-)l2 -)14)' es simplemente seño factorial2k donde es la varianza de las observaciones (y). donde k denota el número de puntos que se utilizaron en el diseño.41 0. los límites de error de dos desviaciones estándar (que corresponden a 95 %) para cualquier efecto serían ± 2a1"¡¡:¡'.23 3 0.1).=(fk.28 5 0.!1I 488 n= k=5 9 10 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA Tabla 11-21 Valores de A.40 0.24 0. La desviación estándar a se estima por el método del rango. Las cantidades del renglón (iv) de la hoja de cálculo EVOP son las diferenciasy. Yquey¡(n) denote el promedio correspondiente dey¡(n) después de n ciclos. transistores y fuentes de poder que son los componentes del aparato. Un ejemplo es el diseño de un amplificador electrónico para que el voltaje de salida esté tan cerca como sea posible del valor nominal deseado. bD. y la ciencia estadística subyacente no había sido revisada adecuadamente por los especialistas. ver Box [12d]. el ingeniero japonés Genichi Taguchi introdujo un enfoque para resolver problemas de este tipo. Muchas de estas preocupaciones se encuentran resumidas también en el amplio panel de . Parte de la polémica surgió porque la metodología de Taguchi fue defendida en Occidente inicialmente (y principalmente) por empresarios. independientemente de la variabilidad de los parámetros eléctricos de los resistores. Determinar las condiciones de operación de un proceso para que las características críticas del producto estén tan cerca como sea posible del valor objetivo deseado y la variabilidad en torno a este objetivo se minimice. Hunter [59a. Se establece el supuesto de que aun cuando los factores de ruido no son controlables en el sistema a gran escala. donde la atención se centra en uno o más de los siguientes puntos: 1. Box. pueden controlarse para los fines de un experimento. Hizo uso de diseños factoriales altamente fraccionados y otros tipos de diseños fraccionados obtenidos a partir de arreglos ortogonales. el responsable de la formulación del producto quiere que éste sea robusto contra un amplio rango de factores de temperatura. aun cuando sea imposible controlar con toda precisión algunas variables del proceso (como la temperatura) o las características de las materias primas. Taguchi introdujo algunos métodos estadísticos novedosos y ciertas variantes de las técnicas establecidas como parte de este procedimiento RPD. Su metodología generó múltiples debates y controversias. Bisgaard y Fung [14]. Referirse a la figura 1-1 para una ilustración gráfica de las variables controlables y no controlables en el contexto general de un experimento diseñado. Montgomery [80b]. ha habido muchas áreas de aplicaciones nuevas. Para finales de la década de 1980. A principios de la década de 1980. había problemas de fondo con esta estrategia experimental y con los métodos para el análisis de datos. Una de las más importantes de éstas es el diseño robusto. los resultados de una revisión muy completa indicaron que aun cuando los conceptos de ingeniería de Taguchi y el objetivo global del RPD tenían bases sólidas. SU enfoque se basó en la clasificación de las variables de un proceso o producto como variables de control (o controlables) y variables de ruido (o no controlables) para después encontrar los ajustes de las variables controlables que minimizan la variabilidad transmitida a la respuesta por las variables no controlables. Puesto que las condiciones climáticas no son del todo predecibles. b]. Uno de ellos sucede en la manufactura de semiconductores. Para detalles específicos de estos temas. Myers y Montgomery ~85a] y Pignatiello y Ramberg [94]. por sus siglas en inglés) (ver Taguchi y Wu [109] y Taguchi [108a. Ejemplos de este tipo de problema ocurren con frecuencia. 3. El diseño de sistemas (productos o procesos) que no sean sensibles a factores ambientales que puedan afectar el desempeño una vez que el sistema se ha desplegado en el campo. El diseño de procesos para que el producto manufacturado esté tan cerca como sea posible de las especificaciones nominales. humedad y precipitación pluvial que afectan el desgaste y acabado de la pintura. a los que se hace referencia de manera conjunta como el problema del diseño paramétrico robusto (RPD. Un ejemplo es la formulación de una pintura para exteriores que debe tener gran duración cuando se exponga a una variedad de condiciones climáticas. 4.11-7 DISEÑO ROBUSTO 489 mentas diseñados y. donde sería deseable que el espesor del óxido de una oblea estuviera lo más cerca posible del espesor objetivo promedio. El diseño de productos para que no sean sensibles a la variabilidad transmitida por los componentes del sistema. y ciertamente no son constantes. en consecuencia. así como que la va~ riabilidad del espesor a lo largo de la oblea (una medida de uniformidad) fuese lo más pequeña posible. 2. 6 14.7 25.2 16.7 16.6 19.1 15.6 19.9 19.1 19..4 19.0 25.1 21..2 22.6 19.9 19.8 17.8 23.0 16.0 24.9 20.5 22.6 16.6 19.6 18.9 21.2 15.7 17.6 21.2 18.3 23.4 19.6 22.6 16.7 22.6 18.3 19.1 19.6 24.5 24.2 23.0 18.8 23.1 18.¡:. \O o Tabla 11-22 Diseño paramétrico con arreglos tanto interior como exterior b) Arreglo exterior E F G Corrida 1 1 1 1 1 2 1 2 1 1 2 2 2 1 1 2 1 2 2 2 1 2 2 2 1 2 3 4 5 6 7 8 9 A 1 1 1 2 2 2 3 3 3 a) Arreglo interior B e 1 2 3 1 2 3 1 2 3 1 2 3 2 3 1 3 1 2 D 1 2 3 3 1 2 2 3 1 15.8 17.1 19.9 16.5 16.8 18.2 16.2 28.4 24.6 .4 20.3 19.7 16.6 19.6 25.3 24.3 23.7 20.3 19.4 18.9 19.3 18.7 21.2 16.2 27.3 19.4 15.1 9.6 15.4 14. La metodología de Taguchi para el problema RPD gira en torno al uso de un diseño ortogonal para los factores controlables. Taguchi sugirió que los datos de un experimento de arreglo cruzado se resumieran con dos estadísticos: el promedio de cada observación en el arreglo interior para todas las corridas del arreglo exterior y un resumen de estadísticas que intentaba combinar información acerca de la media y la varianza. no hay ningún problema de diseño robusto. pero el diseño tiene 72 corridas. Taguchi lo llama el diseño de arreglo interior. En la figura 11-41a no hay ninguna interacción x x z. Entonces se lleva a cabo un análisis para determinar cuáles son los ajustes de los factores controlables que dan como resultado 1) una media tan próxima como sea posible al objetivo deseado y 2) un valor máximo de la relación señal a ruido. Un punto importante acerca del diseño de arreglo cruzado es que sí proporciona información acerca de las interacciones factor controlable x factor de ruido. ya que los efectos principales tienen estrechas relaciones de alias con las interacciones de dos factores. el enfoque del arreglo cruzado llevará a un experimento muy grande. no es posible obtener ninguna información acerca de las interacciones entre las variables controlables. Por lo tanto. Observe que cuando x se pone en el nivel bajo. Como se verá en la siguiente sección. Además. En el ejemplo tratado aquí sólo hay siete factores. Referirse al material complementario del texto para mayores detalles. El panel b de la tabla 11-22 contiene un diseño 23 para los factores de ruido.F = temperatura de acondicionamiento y G = humedad relativa del acondicionamiento). B = espesor de la pared del conector. al maximizarse la relación no se minimiza necesariamente la variabilidad. Estas interacciones son cruciales para la solución de un problema RPD. [86]). El examen de la tabla 11-22 revela un problema importante con la estrategia de diseño de Taguchi. por lo que a pesar del gran número de corridas. El panel a de la tabla 11-22 contiene el diseño para los factores controlables. Hay cuatro factores controlables. Ocurre también que las relaciones señal a ruido de Taguchi son problemáticas. Observe que se trata de un diseño factorial fraccionado de tres niveles. el diseño de arreglo interno es un diseño 34-2 de resolución III (ver el capítulo 9 para un estudio de este diseño). produciéndose las 72 observaciones de la fuerza de separación que se muestran en la tabla. Las relaciones señal a ruido se definen a propósito para que un valor máximo de la relación minimice la variabilidad transmitida por las variables de ruido. Por ejemplo. incluso la información acerca de los efectos principales está potencialmente corrompida. llamado relación señal a ruido. e = profundidad de inserción y D = porcentaje de adhesivo). específicamente. en la figura 11-41b hay una fuerte interacciónx x z.11-7 DISEÑO ROBUSTO 491 discusión publicado en Technometrics (ver Nair. a saber. y tres factores de ruido o no controlables (E = tiempo de acondicionamiento. no hay ningún valor de la variable controlable x que afecte la variabilidad transmitida a la respuesta por la variabilidad enz. considere las gráficas de las interacciones de dos factores de la figura 11-41. En el material suplementario del texto de este capítulo también se comentan e ilustran muchos de los problemas implícitos en los métodos técnicos de Taguchi. De hecho. por lo tanto. al que Taguchi llama el diseño de arreglo exterior. enfocarse en la identificación y el modelado de estas interacciones es una de las claves de un enfoque más eficiente y eficaz del RPD. hay mucho menos variabilidad en la variable de respuesta que cuando x está en el nivel alto. Sin embargo. cada uno con tres niveles (A = interferencia. . es un diseño 34-2. et al. el cual se "cruza" con un diseño ortogonal separado para los factores de ruido. donde x es el factor controlable y z el factor de ruido. A este tipo de diseño se le llama diseño de arreglo cruzado. a menos que haya como mínimo una interacción factor controlable x factor de ruido. En la tabla 11-22 se presenta un ejemplo de Byrne y Taguchi [23] que trata del desarrollo de un método para ensamblar un conector elastométrico en un tubo de nylon que produciría la fuerza de separación requerida. Entonces se realiza cada corrida del arreglo interior para todas las combinaciones de tratamientos del arreglo exterior. 11~7. aun cuando son controlables para los fines de un experimento.492 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA y x = + La variabilidad eny se reduce cuando x =- z a) Ninguna interacción control x ruido z b) Interacción control x ruido significativa Figura 11-41 El papel de la interacción control x ruido en un diseño robusto. el cual incorpora a las variables controlables y las de ruido. tienen su centro en cero y tienen límites inferior y superior ±a). suele l1amársele modelo de respuesta o de reacción. puede evitarse la estructura de los arreglos interior y exterior del enfoque de Taguchi. Como se señaló anteriormente. varianza y que si hay varias variables de ruido. Al diseño que contiene tanto los factores controlables como los de ruido suele l1amársele diseño de arreglo combinado. tienen covarianzas cero. Una ventaja importante del enfoque del modelo de respuesta es que tanto los factores controlables como los factores de ruido pueden colocarse en un solo diseño experimental. donde el subíndice z del operador expectativa es un recordatorio para tomar el valor esperado con respecto a ambas variables aleatorias de la ecuación 11-28. A este tipo de modelo. Excepto cuando al menos uno de los coeficientes de regresión 0 11 y 021 sea diferente de cero. las interacciones entre los factores controlables y los de ruido son la clave en un problema de diseño robusto. se supone que las variables de ruido son aleatorias. su interacción. Por lo tanto.. un modelo lógico es (11-28) Observe que este modelo incluye los efectos principales de ambos factores controlables. se supone que las variables de ruido están expresadas en unidades codificadas. es lógico usar un modelo de respuesta que incluya tanto a los factores controlables como a los factores de ruido y sus interacciones. Si quiere considerarse un modelo de primer orden que incluya las variables controlables. Para encontrar un modelo de la varianza de la . Zl Yc. Se obtiene así a. Se supone que tanto los factores controlables como el de ruido se expresan como las variables codificadas usuales (es decir. es decir. suponga que se tienen dos factores controlables Xl YX 2 yun solo factor de ruidoz 1 . Específicamente.2 El enfoque de la superficie de respuesta para el diseño robusto Como se señaló en la sección anterior. el efecto principal de la variable de ruido y las dos interacciones entre las variables controlables y la de ruido. que tienen valor esperado cero. no habrá ningún problema de diseño robusto. Para ilustrar. Bajo estos supuestos es sencillo encontrar un modelo para la respuesta media tomando el valor esperado de y en la ecuación 11-28. la estructura de h(x.4. Esto significa que es potencialmente posible fijar las variables controlables para alcanzar un valor objetivo de la media y minimizar la variabilidad transmitida por la variable de ruido. el modelo de respuesta de la ecuación 11-28 se expande en una serie de Taylor de primer orden alrededor de Zl = O. z) es . z) = f(x)+h(x.11 11-7 DISEÑO ROBUSTO 493 respuesta y se usa el enfoque de la transmisión del error.0 )+R+s Zl dy == f30 +f31 x l +f32 x 2+f312 x l x 2 +(Yl +Oll Xl +021 X2)Zl +R+s donde R es el término del residuo de la serie de Taylor. Se han derivado modelos simples para la media y la varianza de la variable de respuesta de interés. El modelo de la varianza es una función cuadrática de las variables controlables. Se obtiene así Y== Yz=o +-d (zl. incluye asimismo los coeficientes de regresión de la interacción entre las variables controlables y la de ruido. El modelo de respuesta general que incluye estas variables se escribirá como y(x. Para dar un uso operacional a estos modelos sería necesario: 1. El modelo para la varianza resultante es 2 Vz(Y)= a~(Yl +OllXl +021X2)2 +a De nueva cuenta se ha usado el subíndice z en el operador varianza como recordatorio de que tanto Zl como s son variables aleatorias. De manera típica. Suponga que hay k variables controlables yrvariables de ruido. z) son los términos que incluyen los efectos principales de los factores de ruido y las interacciones entre los factores controlables y los de ruido. Aun cuando en el modelo de la varianza intervienen sólo las variables controlables. Los modelos de la media y la varianza incluyen únicamente las variables controlables. 2. se ignorará el término del residuo. Sustituir los coeficientes de regresión desconocidos en los modelos de la media y la varianza con sus estimaciones de mínimos cuadrados del modelo de la respuesta o de reacción. 4~ El modelo de la varianza (dejando de lado if) es sólo el cuadrado de la pendiente del modelo de respuesta ajustado en la dirección de la variable de ruido. y sustituir la if del modelo de la varianza con el cuadrado medio de los residuales que se encontró cuando se ajustó el modelo de respuesta. Es así como la variable de ruido influye en la respuesta. Realizar un experimento y ajustar un modelo de respuesta apropiado. Observe lo siguiente: 1. 2. Primero. 3. Optimizar los modelos de la media y la varianza utilizando los métodos estándares de optimización de respuestas múltiples revisadas en la sección 11-3. 3. Ahora puede obtenerse la varianza de y aplicando el operador varianza en esta última expresión (sin R). Es muy sencillo generalizar estos resultados. Como es común en la práctica. tal como la ecuación 11-28. z)+s (11-29) dondef(x) es la porción del modelo que incluye sólo las variables controlables y h(x. respectivamente. entonces el modelo de la media para la respuesta es Ez[Y(x.88x 2 + 179. y las variables controlablesxl.94x 2 +7.625) -2. EJEMPLO 11~6 .06x 2 +8. el factor de ruidoz1 es la temperatura. la concentración y la velocidad de agitación.625) 2 Zl + (9.~ [a~~¡ Z)r +a .08x. z)]=a.91+ 82.875) 2 x 2 + (14.!'\ x.06+10. Utilizando los resultados del ejemplo 6-2.06xi .31x 3 -9.81. varianza y covarianzas cero.625) 2 x3 18.X 2 Z 1 + (16. z)]= ¡(x) (11-30) y el modelo de la varianza para la respuesta es a. z)=:¿i=l riZi + :¿:¿ i=l j=l k r OijX¡Zj La estructura de ¡(x) dependerá de cuál sea el tipo de modelo que el experimentador considere apropiado para las variables controlables.51 (éste es el cuadrado medio de los residuales obtenido al ajustar el modelo de respuesta). (116.42-195. el modelo de la varianza queda como a. Se supondrá que el factor A.58x 2 x 3 + 82.x2 y X 3 son la presión. 66x 3 -150. se encuentra que los modelos de la mediay la varianza son Ez[y(x. Para ilustrar el procedimiento anterior. Suponga ahora que los niveles bajo y alto de la variable de ruido. Zl)]= a. son fáciles de controlar. Por lo tanto. Por lo tanto. Las elecciones lógicas son el modelo de primer orden con interacción y el modelo de segundo orden. Vz [y(x.X3 Z1 = 70. la temperatura.06x 2 Z1 +8. y que las variables de ruido y los errores aleatorios s tienen covarianzas cero. el diseño factorial 24 utilizado en este experimento es un ejemplo de un diseño de arreglo combinado. Zl ) = 7006 .81z1 + 4. Yque se usaa 2 = 19. Vz[y(x.31x 3 )2 +a 2 = a.66x 3 -150. + (21.(10."1 494 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA r h(x.31x 3 z 1 Utilizando las ecuaciones 11-30 y 11-31. la concentración (C) y la velocidad de agitación (D). pero que puede controlarse durante el experimento (el cual se llevó a cabo en una planta piloto). 2 (11-31) Myers y Montgomery [85a] presentan una forma un tanto más general de la ecuación 11-31 basada en la aplicación directa de un operador de varianza condicional al modelo de respuesta. + 69. considere nuevamente el ejemplo 6-2 en el que se estudiaron cuatro factores en un diseño factorial 24 para investigar su efecto sobre la rapidez de filtración de un producto químico.06+4.125) .06xi -195. Los otros tres factores. Puesto que tanto los factores controlables como el factor de ruido están en el mismo diseño.08x. el modelo de respuesta es fI .58x 2 x 3 )+a 2 respectivamente. temperatura. se corrieron a una desviación estándar a ambos lados de su valor típico o promedio. Si se supone que las variables de ruido tienen media cero.88x 2 + 179. de tal modo que = 1.31x 3 y Vz[y(x. 94x 2 +7.(2 . Zl)]= 70. la presión (B). + 69.9. Zl)] = 136. es difícil de controlar en el proceso a gran escala. Para construir esta gráfica se fijó el factor de ruido (temperatura) en cero y el factor controlable no significativo (presión) también en cero.000 = Velocidad de agitación Figura 11·42 Contornos del índice de filtración medio constante. En la figura 11-44 se muestra una gráfica de superposición de los contornos de la rapidez de filtración media y la POE como una función de la concentración y la velocidad de agitación.000 >t'"' -0.11-7 DISEÑO ROBUSTO 1. El ejemplo 11-6 ilustra el uso de un modelo de primer orden con interacción como el modelo para los factores controlables. obtenida con Design-Expert (en esta gráfica la variable de ruido se mantiene constante en cero. Design-Expel1 constituirá también de manera automática gráficas de la raíz cuadrada de los contornos de la varianza. Observe que la rapidez de filtración promedio se incrementa cuando tanto la concentración como la velocidad de agitación se incrementan._ ..500 - -o ·ü e e 1] U l'. Se presenta ahora un ejemplo adaptado de Montgomery [8Üb] que induye un modelo de segundo orden.000 ..r--------~--_.-----r---------. ~ . Para conseguir los objetivos deseados será necesario mantener la concentración en el nivel alto y la velocidad de agitación muy cerca del nivel intermedio.000 -0. la POE no es sino la desviación estándar de la variabilidad que se transmite a la respuesta como una función de las variables controlables. Suponga que el experimentador quiere mantener una rapidez de filtración promedio de cerca de 75 y minimizar la variabilidad alrededor de este valor.L . que denomina propagación del error (o POE. como se explicó anteriormente).500 1. 495 0. ejemplo 11-6. En la figura 11-42 se presenta la gráfica de contorno del paquete de software Design-Expert de los contornos de respuesta del modelo de la media.500 -1. Evidentemente.: o 11 e 0. En la figura 11-43 se muestra la gráfica de contorno y la gráfica de superficie de respuesta tridimensional de la POE.l____ll~ _ ___J -1.000 0. . las variables controlables significativas.500 X4 0.f(x).000 L -_ _i . por sus siglas en inglés). con Xl = temperatura = o. ..-L --' 0.00 '---_ _--"''---JL.L.5315 22.4748 ~ 10.496 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA '0 c: '13 QJ ¡g c: c: " o 11 >{'" U -1. con Xl = temperatura = O..5032 16..-1.00 -0.50 1.50 X4 .00 1.00 = Velocidad de agitación 0.4465 4.00 al Gráfica de contorno 28. 1. .41816 w O Q.00 b) Gráfica de superficie de respuesta Figura 11·43 Gráfica de contorno y superficie de respuesta de la propagación del error (POE) en el ejemplo 11-6.l --J. .58x1 z 3 + 2...20x1 + 12..60x.....l:l <...50 0..00 L..18x~ + 2. 87x1X 2 y Vz[y(X.""'.27x1 Z 1 +0....73z1 . ejemplo 11-6..92x1 .. Este diseño soportará un modelo de respuesta que tiene un modelo de segundo orden en las variables controlables.. En una fábrica de semiconductores se realizó un experimento que incluyó dos variables controlables y tres variables de ruido..37-2.21x1 x 2 donde se han sustituido las estimaciones de los parámetros del modelo de respuesta ajustado en las ecuaciones de los modelos de la media y la varianza y.45x 2 + 7.60x. z)]= 30.00 1--'==::::::::=::::::z=:::::..11-7 DISEÑO ROBUSTO 1.---:-~-:--~.00 -0...2..00 0. = Velocidad de agitación Figura 11-44 Gráfica de superposición de los contornos de la media y la POE del índice de filtración.00 Concentración x... z)= 30.7----:--:-----:-1 497 0.. se supone que =1. a.... .2.43x 2 Z2 + 1...26+3..00 -0..52x~ +2..50 1..•.J 11 c: " o >l M 0.13x 2 +2.l3x 2 +2.L..C~~=--=-.... +2. -1.56x2 Z3 Los modelos de la media y la varianza son Ez[y(x. 52x.33z 2 +2.50 -1.. +2."... 87x 1 X 2 +2.89x1 Z 2 +2.. En las figuras 11-45 y 11-46 se presentan las gráficas (de Design-Expel1) de contorno de la media y la POE del proceso (recuerde que la POE es la raíz cuadrada de la varianza de la superficie de respuesta) generadas a partir de estos modelos.18x~ + 2...37..4.. .. El diseño es una variante de 23 corridas de un diseño central compuesto que se creó empezando con un DCC estándar para cinco factores (la porción del cubo es un diseño 25-1) Yeliminando las corridas axiales asociadas con las tres variables de ruido.92x1 -4.......50 ·0 ni c: c: el> '<.. +8.. El modelo de respuesta ajustado es Y(x.... los efectos principales de las tres variables de ruido y las interacciones entre los factores controlables y los de ruido.. z)]= 19. EJEMPLO 11~7 . como en el ejemplo anterior.33z 3 - 0. con Xl = temperatura = O. En la tabla 11-23 se muestra el diseño de arreglo combinado utilizado por los experimentadores.01x 2 Z1 -1..."'.. 00 1.00 -1.1 36.0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 -1.00 0.00 -1.00 1.::.-_ _ -1.00 -1.00 1.00 1.00 -1..00 -1.00 1.00 -1.00 2.00 -1.00 0.2 30.00 0..¡------------------.8 36.00.00 1.3 41..00 1.00 -1.00 1.00 1.00 -1.00 -1.50 1-t N 0.00 -1..00 1.00 -1.00 -1. .00 1.00 -1.00 -1.00 1.00 1.00 -1.00 0.00 Figura 11·45 Gráfica de contorno del modelo de la media.00 L-_.00 -2..00 1.00 0.00 -1.00 1.00 1.00 -1.---..00 -1.00 1.00 -1.00 0.00 1.00 0.00 1.00 0.1 47.4 43.00 -1.00 0.5 30.50 0.2 30.__ ---J --0.00 1..00 1.8 30.00 0.00 -1.0 43.00 -1.00 1.00 0.00 -1.00 -1.::I..00 0.00 1.00 -1.00 -2. ejemplo 11-7.5 36..00 0.00 1.00 1.00 1.00 1.00 0.::::=o 30 0.00 --0.00 1.00 1.0 35.00 0.50 -1.00 1.00 -1.00 -1.00 0.00 -1.00 0.0 30.00 1.00 1.r:' 498 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA Tabla 11-23 Experimento de arreglo combinado con dos variables controlables y tres variables de ruido.00 2.00 0.00 0.00 1.00 1.00 1.00 -1.00 0.00 1.00 x.3 30.00 0.00 1.4 31.00 1.00 0.00 -1.00 0.3 31.00 0.7 16.2 46.00 -1..00 -1.00 0.00 -1.00 0.00 -1.1 39..00 ~ __.1 22.50 1.00 0.00 0.00 1.00 0.7 31. ejemplo 11-7 Número de corrida X¡ X2 Z¡ Z2 Z3 y 44.4 49.00 -1.00 1.00 0.00 1._ __JL.00 -1.00 0. 0.00 -1.00 -1. :::--------.50 1.50 }iN 0.50 -1.L-~'__ _ ___l -0. con la región en blanco indicando condiciones de operación satisfactorias para la media y la varianza. 0. .00 -0.00 LL -1..50 0.00 Xl 0.00 -L ---l . ejemplo 11-7. 499 0.00 Figura 11-46 1.50 ~N 0.50 0.50 1.00 Gráfica de contorno de la POE.00 á.11-7 DISEÑO ROBUSTO 1.00 -0.00 Figura 11-47 Superposición de los contornos de la media y la POE para el ejemplo 11-7.00 r---------------O.001.50 -1.00 -0.'-"'~~~= -1.. .........0 84.... Esta gráfica muestra los contornos para los que la media del proceso es menor o igual que 30 y la desviaciónestándar del proceso es menor o igual que 5.. La pureza del oxígeno es una función de la temperatura del condensador principal y de la relación de la presión entre las columnas superior e inferior.. ..... .....8 -225 1. Identificar el diseño experimental...2 -220 1. Un ingeniero industrial ha desarrollado un modelo de simulación por computadora para un sistema de inventario de dos artículos.. Las condiciones de operación actuales son temperatura (s¡) == -220°C y la relación de la presión (S2) == 1.....3 83. .3 85.7 -215 1.. como se muestra en la figura 11-47.1 84.....5 -215 1.. La respuesta que debe minimizarse es el costo total del inventario.2 84.. ..1 -220 1.1 82. Artículo 1 Cantidad del pedido (s¡) 100 140 140 140 100 100 100 140 120 120 120 Punto de reorden (S2) 25 45 25 25 45 45 25 45 35 35 35 Cantidad del pedido (S3) 250 250 300 250 300 250 300 300 275 275 275 Artículo 2 Punto de reorden (S4) 40 40 40 80 40 80 80 80 60 60 60 Costo total 625 670 663 654 648 634 692 686 680 674 681 . es claro que se necesitará hacer un ajuste si se quiere hacer pequeña la varianza del proceso.5 -220 1...9 -220 1.. El modelo de simulación se usa para producir los datos que se muestran en la tabla siguiente...... Encontrar la trayectoria del descenso más pronunciado... encontrar la trayectoria del ascenso más pronunciado: Temperatura (s¡) Índice de la presión (S2) Pureza -225 1.. . .2 84. Utilizando los datos siguientes...... PROBLEMAS 11·8 11-1... Puesto que sólo hay dos variables controlables...500 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA En este problema es deseable mantener la media del proceso abajo de 30. La región delimitada por estos contornos representaría una zona de operación típica de respuesta media baja y varianza del proceso baja....2.. una forma lógica de llegar a este arreglo es superponer los contornos de la respuesta media constante y la varianza constante. En una planta química se produce oxígeno licuando aire y separándolo por destilación fraccionada en sus gases componentes.... Al inspeccionar las figuras 11-45 y 11-46..2 83. Las variables de decisión son la cantidad del pedido y el punto de reorden de cada artículo...3 11-2. Se ha ajustado un modelo de primer orden en variables codificadas a los datos del rendimiento de un diseño 23 • El modelo es y= 30+5x¡ +2.0x 3 encontrar la trayectoria del ascenso más pronunciado. P = 60 está en la trayectoria del ascenso más pronunciado? 11-6. X¡ y o -J2 O J2 11-4. es decir. ¿aproximadamente cuántos pasos en la trayectoria del ascenso más pronunciado se necesitan para moverse a la región de interés? 11-7. Se desea mover a una región donde los pesos moleculares rebasen 2500.xzY X 3• Son deseables los valores grandes de y (rendimiento en gramos). Para ilustrar.5 17. que no hay interacción. incluso si hay interacción. La región de experimentación de tres factores son el tiempo (40 ::5 T¡ ::5 SO min). la temperatura (200 ::5 Tz ::5 300°C) y la presión (20 ::5 P ::5 50 psig). 11-5.5x 3 ¿El punto T¡ = S5.11-8 PROBLEMAS 501 11-3. Para el modelo de primer orden J2 O -J2 O -1 1 -1 1 lS. La trayectoria del ascenso más pronunciado suele calcularse suponiendo que el modelo es en realidad de primer orden. Tz = 325. Con base en la información que se tiene por la experimentación en esta región. Sin embargo.5x 2 +3. Los datos que se muestran en la siguiente tabla se recolectaron en un experimento para optimizar el crecimiento de un cristal como una función de tres variablesx¡. Compararla con la trayectoria que se encontró en el inciso a. Las variables están codificadas como -1::5 Xi ::5 1. Ajustar un modelo de segundo orden y analizar la superficie ajustada. ¿Bajo qué conjunto de condiciones se alcanza el crecimiento máximo? .5 y= 60+1. el ascenso más pronunciado que se determina ignorando la interacción seguirá produciendo por lo general buenos resultados. l1-S.4 22. Ajustar el modelo de primer orden y encontrar la trayectoria del ascenso más pronunciado. Verificar que el siguiente diseño es símplex. La región de experimentación de dos factores son la temperatura (100::5 T::5 300°F) y la velocidad de alimentación del catalizador (10 ::5 e ::5 30 lb/pulg). suponga que se ha ajustado el modelo b) utilizando variables codificadas (-1 ::5 Xi ::5 + 1).Sx 2 +2.5 19. obteniéndose el modelo siguiente: y= 2000 +125x¡ +40x 2 a) Encontrar la trayectoria del ascenso más pronunciado. a) Trazar la trayectoria del ascenso más pronunciado que se obtendría si se ignorara la interacción.5x¡-0. b) Trazar la trayectoria del ascenso más pronunciado que se obtendría incluyendo la interacción en el modelo. Un modelo de primer orden con las variables codificadas usuales ±1 se ha ajustado a la respuesta peso molecular. Ajustar un modelo de segundo orden.x¡ es la temperatura y X z es la presión. x¡ -1 -1 1 1 -1.414 1.682 O O O O O O O O 1 -1 1 -1 1 -1 1 O O O O -1.502 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA X¡ y -1 -1 -1 -1 -1 -1 -1 1 1 1 1 -1.682 1.414 1.414 O O O O O 54 45 32 47 50 53 47 51 41 39 44 42 40 a) ¿Qué condiciones de operación se recomendarían si el objetivo es minimizar el tiempo de filtración? b) ¿Qué condiciones de operación se recomendarían si el objetivo es operar el proceso con una velocidad de filtración media muy próxima a 46? 11-10.682 O O O O O O O O O O 1 1 -1 -1 1 1 O O -1. El diseño hexagonal que se presenta a continuación se usa en un experimento que tiene como objetivo ajustar un modelo de segundo orden: .682 1.682 1. La respuesta y es el tiempo de filtración. Un ingeniero químico recolectó los siguientes datos.682 O O O O O O 66 70 78 60 80 70 100 75 100 80 68 63 65 82 113 100 118 88 100 85 11-9.414 O O O O O O O Xz y -1 1 -1 1 O O -1. 5 0.Jo.75 -.11-8 PROBLEMAS Xl X2 503 y 1 0.75 O O O O O O O -0.J O. b) Efectuar el análisis canónico.5 5. ¿Qué tipo de superficie se ha encontrado? e) ¿Qué condiciones de operación para Xl y X 2 llevan al punto estacionario? d) ¿Dónde se correría este proceso si el objetivo eS obtener una respuesta que esté tan cerca de 65 como sea posible? 11-11.5 -1 .75 -.5 -0. Un experimentador corrió un diseño de Box-Behnken y obtuvo los siguientes resultados.Jo.J0.75 .5 O O O O O 68 74 65 60 63 70 58 60 57 55 69 a) Ajustar el modelo de segundo orden.0 7. b) Efectuar el análisis canónico.0 25 20 15 +1 O +1 O +1 O -1 -1 -1 Corrida Xl X2 X3 Yl 1 2 3 4 5 6 7 8 9 10 11 -1 +l -1 +1 -1 +1 -1 +1 O O O O O O O -1 -1 +1 +1 O O O O 12 13 -1 +1 -1 +1 O O O 14 15 535 580 596 563 -1 645 -1 458 +1 350 +1 600 -1 595 -1 648 +1 532 +1 656 O 653 O 599 O 620 O O O O a) Ajustar el modelo de segundo orden. donde la variable de respuesta es la viscosidad de un polímero: Nivel Alto Intermedio Bajo Temperatura Velocidad de agitación Presión Xl X2 X3 200 175 150 10. ¿Qué tipo de superficie se ha encontrado? . 000 0.000 0.5 :s.00 85.00 55. calculadas en las cuatro unidades.000 0. suponiendo que se quiere maximizar la conversión 0'1) con la actividad 0'2) entre 55 y 60.20 60.00 90. Considere el diseño central compuesto de tres variables que se muestra a continuación..000 0.000 1.90 60.000 -1. Analizar los datos y sacarconclusiones.000 1. y las respuestas son la media y la varianza del espesor.90 53.000 1.682 0.000 0.682 1.50 y la vida debe exceder 12 horas para que el producto sea competitivo.000 -1.00 80.000 1. 504 e) d) CAPÍTULO 11 MÉTODOS DE SUPERFiCiES DE RESPUESTA .000 -1.000 0.000 -1.000 -1.10 65.60 59.00 97.00 53. .90 11-13.000 74.000 1.000 0.000 0.40 59.000 -1.000 1.000 0. Un fabricante de herramientas de corte ha desarrollado dos ecuaciones empíricas para la vida de la herra~ mienta en horas 0'1) y para el costo de la herramienta en dólares 0'2)' Ambos modelos son funciones lineales de la dureza del acero (XI) y de la fecha de fabricación (x 2).000 0.000 Temperatura Catalizador (%) YI Actividad Y2 CC) -1.000 1.000 0.000 0.000 1.00 88.000 0.00 70.000 -1.000 (%) -1.000 0.000 0.80 58.000 0.000 0.682 1.40 63.000 -1.000 1.00 76.00 75.20 60.70 57. Xi :s. Las dos ecuaciones son j\ = lü+5x¡ +2x 2 Y2 = 23+ 3x¡ + 4x 2 y ambas ecuaciones son válidas en el rango -1.000 0.80 67.00 60. ¿Existe algún conjunto de condiciones de operación factible para este proceso? ¿Dónde se recomendaría correr este proceso? 11-14.60 57.000 0.20 62.000 -1.000 -1. Conversión Corrida 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 I Tiempo (min) -1.682 1.00 51.682 0.000 0.00 76.00 81.682 0.000 0. 1.5.000 0.00 97. El costo unitario de la herramienta debe estar abajo de $27.10 60.80 59.00 81.000 0.000 1.000 0.00 91.40 62.'~ ¿Qué condiciones de operación para XI' X 2 Y X 3 llevan al punto estacionario? ¿Qué condiciones de operación se recomendarían si es importante obtener una viscosidad que esté tan cerca de 600 como sea posible? 11-12.000 0. Se procesaron simultáneamente cuatro unidades experimentales en cada corrida del diseño.000 -1.000 -1.90 59.000 1.00 66. Se corre un diseño central compuesto eh un proceso de deposición química por vapor y se obtienen los datos experimentales que se muestran a continuación.00 71.00 83.000 0.00 79.000 1.000 0.30 67. 633 1.11-8 PROBLEMAS 505 Xl X2 -1 1 -1 1 1. ¿Puede encontrarse siempre un diseño rotable formado de bloques ortogonales? 11-20. 11-18.130 6.0 411.7 518.2.088 8..633 O O 11-19. .586 13. Encontrar un conjunto de condiciones de operación que consiga este objetivo y que al mismo tiempo minimice la varianza.414 -1.649 11.1 601.836 9.. 11-17. = 3L::=IX~XJ.6 530. El diseño central compuesto rotable.4 510.414 O O O O Y 360. e) Ajustar un modelo a ln(S2).230 7. Considere un diseño central compuesto para k = 4 varia- bles en dos bloques.306 7.633 1. Puede demostrarse que un diseño de segundo orden es rotable si L7t=IX:XJ" = Osi a o b (o ambas) son impares y si L::=IX~. e) Comentar los aspectos de la minimización de la varianza del inciso d.oo. ¿Se ha minimizado también la varianza total del proceso? Verificar que el diseño de primer orden ortogonal es también un diseño de primer orden rotable. b) Ajustar un modelo a la respuesta varianza.740 7.956 9.6 495.2 412.6 445.414 -1. Demostrar que aumentar un diseño 2k conn e puntos centrales no afecta las estimaciones de/3¡ (i = 1. ¿Este modelo es superior al que se encontró en el inciso b? Suponga que se quiere que el espesor medio esté en el intervalo 450 ± 25. 11-15.3 S2 6. 11-16.6 397.4 497. Analizar los residuales.2 487. donde /lF es el número de puntos en la porción factoriaL Verificar que el diseño central compuesto que se muestra abajo está separado en bloques ortogonales: d) Bloque 1 Xl X2 X3 Xl Bloque 2 X2 X3 Xl Bloque 3 X2 X3 O O 1 1 -1 -1 O O 1 -1 -1 1 O O 1 -1 1 -1 O O 1 1 -1 -1 O O 1 -1 1 -1 O O -1 1 1 -1 -1.633 O O O O O O O O -1. ¿Cómo puede correrse un diseño hexagonal en dos bloques ortogonales? . Demostrar que para el diseño central compuesto estas condiciones llevan a a = (/lF)1/4 para la rotabilidad.414 O O O O O O -1 -1 1 1 O O 1.633 O O O O O O O O -1. Formación de bloques del diseño central compuesto. pero que la estimación de la ordenada al origen /30 es el promedio de las 2k + n e observaciones.644 7. k).633 1. Analizar los residuales.689 14.127 a) Ajustar un modelo a la respuesta media. pp.2 62. Yse utiliza el diseño símplex del problema 11-3 para ajustar el modelo.9.8 59. 1 Y2 para representar los niveles bajo.506 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA 11-21. Se hacen dos réplicas de cada corrida del diseño.5 58. .0 64. d 2 = 2 Yk = 3. d) Si d¡ = 1. J.3 61.4. cuando la verdadera superficie está descrita por un modelo de orden d 2 > di. 1.5+4.6 62. En la tabla siguiente se muestra el rendimiento durante los cuatro primeros ciclos de un proceso químico. es decir. encontrar la estructura de los alias.5 (4) 64. Hunter ilustra algunos de los problemas asociados con los diseños factoriales fraccionados 3k -p.5 (2) 59. vol.0xi .S. Hacer el análisis utilizando métodos EVOP.0x¡x 2 es un modelo razonable para este experimento. e) Si d¡ = 1. d 2 = 2 Yk = 3.5 59. intermedio y alto de los factores. 11-23.E(y) = XJJ¡ + XJJ2' a) Demostrar que los coeficientes de regresión son sesgados.3 61. a) Verificar que el modelo de segundo orden y= 78.1 56. determinar la estructura de los alias y comparar los resultados con el inciso e. suponiendo que se usa un diseño 23-¡ para ajustar el modelo.1 11-22. En un artículo ("Conozcamos todos el cuadrado latino". en Quality Engineeling. Yse utiliza un diseño 2k completo para ajustar el modelo. El factor A es la cantidad de etanol agregada a un combustible estándar y el factor B representa la: relación aire/combustible. b) Si d¡ = 1 Yd2 = 2.7 59. OY + 1.2 64.5x¡ .0x 2 - 4. usar el resultado del inciso a para determinar la estructura de los alias. Las variables son el porcentaje de concentración (x¡) en los niveles 30.8 (3) 60. La variable de respuesta es la emisión de monóxido de carbono (CO) en g/m3 • El diseño se muestra abajo: Diseño A B X¡ X2 Observaciones y 66 78 90 72 80 75 68 66 60 62 81 94 67 81 78 66 69 58 O 1 2 O 1 2 O 1 2 O O O 1 1 1 2 2 2 -1 O +1 -1 O +1 -1 O +1 -1 -1 -1 O O O +1 +1 +1 Observe que se ha usado el sistema de notación de O.8 62.6 60. es decir.5x¡ -7. Suponga que se aproxima una superficie de respuesta con un modelo de orden di.0 (5) 57. Trazar los contornos de la concentración de CO en el espacio Xl' X 2. Condiciones Ciclo 1 2 3 4 (1) 60.31 Y32 Yla temperatura (x 2 ) en 140. Se ha usado también una "notación geométrica" de -1. 453-465). tal como y = XJJ¡ + 8.1 59. 142 Y 144°F.1 60. que E(JJ¡) = p¡ + AfJ2' donde A = (X'¡X¡)-¡X'¡X2 • Es común llamar a A la matriz alias. (/324 . d) El diseño del inciso b permite el ajuste del modelo y= /30 + Suponga que el verdadero modelo es L /3¡x¡ + L /3¡¡x. entonces E(/3o) = /30 - /313 ./314 .(/312 + (323) /2 E(~11) = /3 11 .(323)/2+/313 ¿Ayuda esto a explicar los efectos grandes de los factores eyD que se observaron gráficamente en el inciso c? .lil 1I 1 lil '1. B.(/323 + (324)/2 E(~2)= /32 -(/313 +/314 +(334)/2 E(~3)= /33 -(/312 +(324)/2 E(~ 4) = /3 4. +e i=1 i=1 4 4 y= /30 + L i=1 4 /3¡x¡ + L i=1 4 /3¡¡X¡2 + LL i<j /3ijx¡x j =e Demostrar que si las 13j representan las estimaciones de mínimos cuadrados de los coeficientes del modelo ajustado. ¿Los factores eyD parecen tener efectos grandes? ¿Estos factores tienen en realidad algún efecto sobre la emisión de CO? ¿Por qué su efecto aparente es grande? .(/323 . se usaron cuatro factores en un diseño factorial fraccionado 34-2 Yque se obtuvieron exactamente los mismos datos que en el inciso a. 1 1 11-8 PROBLEMAS 507 i il b) Suponga ahora que en lugar de sólo dos factores./334 E(~l) = /31 .(312)/2+ /314 E(~44)= /3 44 -(/312 . e yD.(324)/2 E(~22) = /322 +(/313 + /314 + (334)/2 E(~33 ) = /3 33 . El diseño sería el si- I guiente: Diseño A B o 1 2 o o 1 2 1 2 o o o 1 1 1 2 2 2 e o o 1 1 2 1 2 2 D Xl X2 X3 X4 Observaciones y o 1 2 1 2 -1 o o o +1 -1 +1 -1 +1 -1 -1 -1 -1 +1 +1 -1 o o o o o 2 o 1 o o o o +1 o +1 -1 +1 -1 -1 66 78 90 72 +1 +1 +1 +1 -1 o 80 75 68 66 60 62 81 94 67 81 78 66 69 58 Confirmar que este diseño es un arreglo ortogonal L 9• c) Calcular los promedios marginales de la respuesta CO en cada nivel de los cuatro factoresA. Construir gráficas de estos promedios marginales e interpretar los resultados. ¿Qué diseño sería preferible de acuerdo con el criterio V? e) Calcular la eficiencia V de cada diseño en comparación con el mejor diseño que se haya encontrado en el inciso d.5. 2. Están bajo consideración cuatro diseños experimentales. e) Encontrar la varianza de predicción escalada máxima para este diseño.0. 3 y 4. Suponga que es necesario diseñar un experimento para ajustar un modelo cuadrático en la región -1 ::.y = /30 + /31X + s. Establecer los siguientes diseños: a) Un modelo DCC "inscrito" con punto central en Xl = X 2 = O. Un experimentador quiere correr un experimento de una mezcla de tres componentes. e) Evaluar el criterio I(X'X)-l¡ para cada diseño. donde X es la concentración real. Piensa que una curva de calibración lineal será adecuada para modelar la concentración medida como una función de las concentraciones conocidas.508 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA 11-24. el proceso no funcionará adecuada_ mente.5 y 10. + 1. Un ingeniero químico desea ajustar una curva de calibración para un nuevo procedimiento utilizado para medir la concentración de un ingrediente particular de un producto fabricado en sus instalaciones.7 y 10.2:<:. X ::. ahora sólo pueden considerarse los diseños 2.25. Repetir el problema 11-25 utilizando un modelo de primer orden con las interacciones de dos factores.5. Usar n = 14 corridas. ¿Qué diseño sería preferible de acuerdo con el criterio D? e) Calcular la eficienciaD de cada diseño en comparación con el "mejor" diseño que se haya encontrado en el inciso b. es decir. 10. Xi ::. Resolver de nuevo el problema 11-27. El ingeniero quiere construir un modelo para las concentraciones medidas. El diseño 2 consta de cuatro corridas con las concentraciones 1. 1. d) Un diseño optimalD modificado que sea idéntico al del inciso e. 2.4. b) Trazar la región experimental. ¿Este diseño es optimal G? 11-26. pero con todas las réplicas de las corridas en el centro del diseño. No es posible hacer más de n = 12 corridas.0. con cuatro réplicas. Evidentemente. b) Un diseño factorial 32 "inscrito" con punto central en Xl = X 2 = -0. calcular la varianza de predicción promedio en el conjunto de puntos dado por X = 1. . 11-27. g) ¿Qué diseño preferiría el lector? ¿Por qué? 11-25. ¿Qué diseño sería preferible? b) Calcular el determinante de (X'X)-l para cada diseño. d) Para cada diseño. suponiendo que el modelo que el ingeniero quiere ajustar es cuadrático.4:<:. f) Evaluar la eficiencia D para cada diseño en comparación con el diseño optimal D del inciso c. a) Graficar la varianza de predicción escalada para los cuatro diseños en la misma gráfica en el rango de la concentración 1 ::. Usar el criterio D. oo. el diseño 4 consta de tres corridas con las concentraciones 1 y 10 Yseis corridas con la concentración 5. Por último.. a) Evaluar el criterio D I(X'X)-l¡ para este diseño. e) Un diseño optimal D. 10. b) Evaluar el criterio A tr(X'X)-1 para este diseño.5. 0.x z :<:. Xl :<:. 11-29.4 O. 5. Pueden prepararse 12 muestras. Si se viola la restricción. f) ¿Cuál es la eficiencia G de cada diseño? 11-28.3 O. cuya concentración es conocida. Considere un diseño 23 para ajustar un modelo de primer orden. El diseño 1 consta de seis corridas con la concentración conocida 1 y seis corridas con la concentración conocida 10. 1.2 sujeto a la restricción Xl + X 2 ::.l:<:.x z :<:. i = 1.7 a) Establecer un experimento para ajustar un modelo cuadrático para mezclas. El diseño 3 consta de tres corridas con las concentraciones 1. Las restricciones sobre las proporciones de los componentes son las siguientes: 0. 5.6 Presión -1.3 23.000 -1. == 1 en unidades codificadas). 11-32.23.4 42. Considere el experimento del problema 11-12. suponiendo que tres de estas corridas son réplicas. No hay restricciones sobre las proporciones de la mezcla.000 1.7 86.000 -1. tación (A) es una variable de ruido (en unidades codificadas a) Ajustar el modelo de respuesta a estos datos.000 -1. ¿Se trata de un problema de diseño robusto con respecto a ambas respuestas? Encontrar un conjunto de condiciones que maximicen la conversión con la actividad entre 55 y 60 y que minimice la variabilidad transmitida por la temperatura.5 24. Suponga que la temperatura es una variable de ruido (a.8. ¿Se trata de un problema de diseño robusto? b) Encontrar el modelo de la media y el modelo de la varianza o bien la POE.000 0.2 27.24.000 0.1 24.4 16. ¿Qué mezcla se recomendaría para maximizar las millas por galón? 11-31.2 23.000 -1. Ajustar modelos de respuesta para las dos respuestas. Myers y Montgomery [85a] describen un experimento con una mezcla de gasolina en el que intervienen tres componentes de la mezcla.000 0. 11-33.6 340.000 0.000 ~1. y se usó el siguiente diseño con 10 corridas: Punto del diseño 1 2 3 4 5 6 7 8 9 10 Xl 1 O O "2 1 "2 1 X2 X3 O 1 O "2 1 O O 1 O "2 1 "2 1 3" "6 "6 1 1 1 O "2 1 3" "6 "6 1 1 1 O 3" 2 3" "6 "6 1 1 1 3" 2 3" 2 y.23.000 -1.000 Desviación estándar Y2 12.7 a) ¿Qué tipo de diseño utilizaron los experimentadores? b) Ajustar un modelo cuadrático para mezclas a los datos. d) Comentar los dos diseños que se encontraron.25.000 -1.8.9 23. e) Encontrar un conjunto de condiciones que resulten en una desviación del llenado promedio tan próxima a cero como sea posible con varianza transmitida mínima. Considere el experimento del llenado de las botellas del ejemplo 6-1.1 24.3 213. 11-30. ¿Es adecuado este modelo? e) Graficar los contornos de la superficie de respuesta. Después se obtuvo la mediaYl yla desviación estándarY2 de la medición del espesor.6 25. Se ha corrido un experimento en un proceso que aplica un material de recubrimiento a una oblea. Media Corrida 1 2 3 4 5 6 7 Velocidad -1.5 80.000 ~1.000 0.000 1. En cada corrida del experimento se fabricó una oblea y se midió varias veces el espesor del recubrimiento en varios sitios de la misma. Suponga que el porcentaje de carbona== 1).000 -1.7 112.8 3.000 Yl 24. mi/gal 24.5 8.0 136.3 .0 120.7.000 ~1. Los datos (adaptados de Box y Draper [16b]) se muestran en la tabla siguiente: a.11-8 PROBLEMAS 509 e) Establecer un experimento para ajustar un modelo cuadrático para mezclas con Il == 12 corridas. Usar el criterio D.9 22.000 1.000 Distancia -1.1 24. ¿Hasta qué punto son similares las dos respuestas? .45 75.25 73.000 1.000 0.6 0.6 23.5 18.000 -1.0 171.000 1. e) Encontrar un conjunto de condiciones óptimas que resulten en una media tan grande como sea posible con la desviación estándar menor que 60.5 138.7 422.0 17.000 -1.000 0.000 0.000 -1.000 1.9 15. Una variación del ejemplo 6-2.000 0.000 1.000 0.000 1.000 Presión 1.3 372..0 199.000 0.000 0.000 1.000 -1.4 a) ¿Qué tipo de diseñó utilizaron los experimentadores? ¿Es ésta una buena elección del diseño para ajustar un modelo cuadrático? b) Construir los modelos para ambas respuestas.000 -1. d) Comparar los resultados obtenidos con los del ejemplo 11-6.67 134.3 673.000 0.7 357.000 1.000 1.000 1.0 501. 104 86.5 63.000 0.65 60. en el que se aplicó el enfoque de la transmisión del error.3 271.25 1124.000 1.0 101.9 142. Velocidad 0.000 1.000 0.000 1.48 68.000 0.92 + - + + + Suponer que e y D son factores controlables y que A es una variable de ruido.000 1.7 81.96 121.000 0.000 0.7 220.19 72.000 0. b) Ajustar un modelo para la respuesta In (S2).75 68.000 1. e) Encontrar las condiciones de operación que resulten en la respuesta de rapidez de filtración media que exceda 75 con varianza mínima.000 -1.000 0.000 -1.0 427.5 29.65 100. En el ejemplo 6-2 se encontró que una de las variables del proceso (B = presión) no era importante.0 485.000 1. Al eliminar esta variable se producen dos réplicas de un diseño 23.0 730.000 1.000 1. Los datos se muestran enseguida: e - D A (+) A (-) Y 57.75 S2 - 45.7 264.000 1.000 0. a) Ajustar un modelo para la respuesta media.000 -1.2 55.4 44.7 501.7 176. 11-34.0 1010.000 -1.000 Distancia -1.6 21.0 92.80 43.0 0.000 1.000 1.000 Yi 256.000 -1.000 1.000 1.000 0.1 133. 70 71.000 1.510 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA Media Corrida 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 Desviación estánd.7 32.5 88.000 0.000 -1.00 81.000 0.000 0.000 -1.0 Y2 4.8 23.000 0.000 -1.7 239.7 158. En algunas situaciones experimentales. los niveles de los factores usados por el experimentador son los niveles de interés específico. Varios ejemplos de esto se presentaron en los capítulos 5 al 9. que las inferencias estadísticas que se hacen acerca de estos factores se restringen a los niveles específicos estudiados. En general. así como en otros tipos de experimentos. Es decir. Puesto que los niveles del factor utilizados realmente en el experimento se eligieron al azar. es decir. un experimento con un solo factor en el que el factor es aleatorio y se usa esto para introducir el modelo de efectos aleatorios para el análisis de varianza y los componentes de la varianza. En el capítulo 13 se presentarán los diseños anidados y de parcelas subdivididas. Los factores aleatorios ocurren también normalmente en experimentos factoriales. se dice que el espacio inferencial del experimento es el conjunto específico de los niveles de los factores investigados.Se supone que la población de los niveles del factor es de tamaño infinito o bien lo suficientemen- 511 . cuando se trabaja con un efecto fijo. Este capítulo se enfoca en los métodos para el diseño y análisis de experimentos factoriales con factores aleatorios. Se empieza con una situación simple. 12~1 MODELO CON EFECTOS ALEATORIOS Es común que un experimentador esté interesado en un factor que tiene un gran número de posibles niveles. En esta situación se dice que se trata de un factor aleatorio. con frecuencia se usa un modelo de regresión que relaciona la respuesta con los factores para predecir la respuesta en la región que abarcan los niveles de los factores usados en el diseño experimental. si se investigan tres tipos de materiales.Experimentos con factores aleatorios A lo largo de gran parte de este libro se ha supuesto que los factores de un experimento son factores fijos. desde luego. y el experimentador quiere sacar conclusiones acerca de la población completa de los niveles. Una variante de esto ocurre cuando el factor o factores son cuantitativos. La implicación de esto es. no sólo de los que se usaron en el diseño experimental. los niveles de los factores se eligen al azar de una población más grande de niveles posibles. como en el experimento de la vida de la batería del ejemplo 5-1. se hacen inferencias acerca de la población completa de los niveles del factor. En estas situaciones. Cuando el experimentador selecciona aleatoriamente a de estos niveles de la población de los niveles del factor. dos situaciones en las que es frecuente encontrar factores aleatorios en la práctica. entonces se dice que el factor es aleatorio. las conclusiones sólo son válidas para esos tipos específicos de materiales. Considere E( MSTratamientos ) = a .. SSE/a2 se distribuye como ji-cuadrada con N . SSTratamientoJa2 se distribuye como ji-cuadrada con a . SSTratamientos F. Para probar hipótesis en este modelo se requiere que las {e¡j.} sean NlD(O. = 0. l] L --. o. Sin embargo.--.= 1.-=l'-----_ = MS Tratamieatos 0- SSE N-a MS E (12-4) se distribuye como F con a . el cociente o. que las {r¡} sean NlD(O. Además. 11 i = 1..N 1=1 1 la =---::-E a 1 n i=l [ L (L f-l+r¡+eij )2. 1 La suma de cuadrados identidad SST o.a grados de libertad y. 2. por lo que en su lugar se prueban hipótesis acerca del componente de la varianza (12-3) :0.. ). Ambas variables aleatorias son independientes.' '1 512 CAPÍTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS te grande para considerarla infinita.. . Referirse a Bennett y Franklin [9] y Searle y Fawcett [101] para una revisión del caso de una población finita. .1 E 1 1 [a y. y que r¡ y eij sean independientes.. > 0. 02)._--'a::. : Como anteriormente. +0 2 A las varianzas y 02 se les llama los componentes de la varianza. se hace la partición de la variabilidad total en las observaciones en un componente que mide la variación entre los tratamientos (SS'Itat~mientos) y un componente que mide la variación dentro de los tratamientos (SSE)' Probar hipótesis acerca de los efectos de tratamientos individuales no tiene sentido. Ho:o. todos los tratamientos son idénticos.a grados de libertad. Por lo tanto. . oo. es necesario examinar los cuadrados medios esperados para tener la descripción completa del procedimiento de prueba. >0 Si o. . Si r¡ tiene varianza o. Es decir. se observa que los términos que incluyen a r: son reemplazados por o. pero si o. como E(r¡) = O. No es frecuente encontrar situaciones en las que la población de los niveles del factor sea lo suficientemente pequeña para emplear el enfoque de una población finita.1 YN .1 E( SSTratamientos ) = a . = SSTratamientos + SSE (12-2) sigue siendo válida. los términos que in1 El supuesto de que las {r J son variables aleatorias independientes implica que el supuesto usual de que ~~=1 r i = Odel modelo de efectos fijos no se aplica al modelo de efectos aleatorios. bajo la hipótesis nula = 0. El modelo estadístico lineal es Y¡j = f-l+r¡ +eij { J. 2.1 grados de libertad. y al modelo (ecuación 12-1) se le llama modelo de efectos aleatorios o de los componentes de la varianza. y es independiente de eij' la varianza de cualquier observación es V(Yij) = o..(LL f-l+ri+e¡j )2] j=l N j=l 11 n 1 a ¡=1 Cuando se eleva al cuadrado y se toma la función esperanza de las cantidades entre corchetes. a (12-1) donde tanto r¡ como eij son variables aleatorias. bajo la hipótesis nula.. = H1 ° o. existe variabilidad entre los tratamientos. 'a "n 2 1 d ? ? ? 2 duyen a Si... por lo que H o se rechaza si Fo > Fa. ya que hace uso de las líneas de la tabla del análisis de varianza. mientras que bajo H 1 el valor esperado del numerador es mayor que el valor esperado del denominador. i=l":" j=l T i son reemp aza os por neT. se le llama método del análisis de varianza. puede demostrarse que (12-5) (12-6) Por los cuadrados medios esperados. Por otra parte. aneT y an-a respect' ¡vament e.N.. de todas las funciones cuadráticas insesgadas de las observaciones. +aa 2 . Esto lleva a E(MSTratamientos)= _1-[N. las conclusiones son muy diferentes. . 513 2 2 . ya que se aplican a la población completa de los tratamientos. " _ 1. se obtiene 2 MSTratnmientos = a +na.u2 . Produce estimadores de if y que son los mejores estimadores cuadráticos insesgados (es decir.:.12-1 MODELO CON EFECTOS ALEATORIOS T . Al igualar los cuadrados medios observados con los esperados en el modelo de efectos aleatorios con un solo factor. Por lo general habrá interés en estimar los componentes de la varianza (if ya. los estimadores de los componentes de la varianza son a = MS 2 E (12-7) y A? a - = MSTratamientos n _~==""-_----. Al procedimiento que se usa para estimar if ya. Por lo tanto..na.u2 + Na. El procedimiento consiste en igualar los cuadrados medios esperados con sus valores observados en la tabla del análisis de varianza y despejar los componentes de la varianza.. se observa que bajo H o tanto el numerador como el denominador del estadístico de prueba (ecuación 12-4) son estimadores insesgados de if.:e." n·---a-1 LJ' a i=l " LJ ni i=l L n " 2 i=l' ] (12-9) En el método del análisis de varianza para estimar los componentes de la varianza no se requiere el supuesto de normalidad.a 2 ] a-1 o E( MS Tratamientos) = a 2 + na. todos los productos cruzados que incluyen a Ti y sij tienen valor esperado cero. y. H o deberá rechazarse para los valores de F o que sean muy grandes. y MS E =a 2 Por lo tanto. Esto implica una región crítica de una cola superior. MS E T (12-8) Para tamaños de las muestras desiguales.. estos estimadores tienen mínima varianza). ' S . N _"' El procedimiento de cálculo y el análisis de la tabla de varianza del modelo de efectos aleatorios son idénticos a lasque se utilizaron en el caso de efectos fijos. . De manera similar. se reemplaza n en la ecuación 12-8 con 1" no = .) del modelo. a. Sin embargo. Casella y McCullogh [100] y Burdick y Graybill [22]. Un curso de acción es aceptar la estimación y usarla como evidencia de que el verdadero valor del componente de la varianza es cero. Esto tiene un atractivo intuitivo. Se realiza el análisis de varianza. Por ejemplo.96= 8. Los componentes de la varianza se estiman con a2 = 1. Por el análisis de varianza se concluye que los telares de la planta difieren significativamente. además de la variación usual de la resistencia dentro de las muestras del tejido del mismo telar.90+6. . = a2 +a. = 29. La mayor parte de esta variabilidad es atribuible a las diferencias entre los telares. suponiendo que la variación muestralllevó a la estimación negativa.. Una compañía textil fabrica un tejido en un gran número de telares. El tratamiento completo de la estimación de los componentes de la varianza se ofrece en Searle [99a. Este ejemplo ilustra un uso importante de los componentes de la varianza: la separación de las diferentes fuentes de variabilidad que afectan un producto o sistema. Para investigar esta posibilidad. pero adolece de algunas dificultades teóricas. = 1. y en muchas ocasiones es difícil aislar las Tabla 12-1 Thlares Datos de la resistencia del ejemplo 12-1 Observaciones 1 2 3 4 1 98 91 96 95 2 97 90 95 96 3 99 93 97 99 4 Yi.90 = 6. Searle. Evidentemente. El ingeniero del proceso sospecha que.86. Este experimento se corre de manera aleatoria. b]. Una alternativa más es considerar la estimación negativa como evidencia de que el modelo lineal supuesto es incorrecto y examinar de nuevo el problema. El problema de la variabilidad de un producto se presenta con frecuencia en el control de calidad.73-1. el método del análisis de varianza produce una estimación negativa de uno de los componentes de la varianza. la varianza de cualquier observación de la resistencia se estima con a. y los datos obtenidos se muestran en la tabla 12-1. 96 92 95 98 390 366 383 388 1527 = Y. usar cero en lugar de la estimación negativa puede alterar las propiedades estadísticas de otras estimaciones. Le gustaría que los telares fueran homogéneos a fin de obtener un tejido de resistencia uniforme.90 Y a. EJEMPLO 12~1 .96 4 Por lo tanto. Otra alternativa es volver a estimar el componente de la varianza negativa utilizando un método que produzca siempre estimaciones no negativas. el cual se muestra en la tabla 12-2.l!l!i 11 514 CAPÍTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS Ocasionalmente. puede haber también variaciones significativas en la resistencia entre un telar y otro. er ingeniero selecciona cuatro telares al azar y hace cuatro determinaciones de la resistencia del tejido fabricado en cada telar. por lo que la estimación negativa de un componente de la varianza se considera con cierta preocupación. los componentes de la varianza son por definición no negativos. 90. una supervisión ineficaz. reelaborarse o degradarse a un producto de menor calidad.) Las especificaciones superior e inferior de la resistencia se muestran también en la figura 12-1a.2 Análisis de varianza de los datos de la resistencia Fuente de variación Telares Error Total Suma de cuadrados 89.90 Fo 15. (Ésta es la estimación de la varianza de cualquier observación de la resistencia del ejemplo 12-1. quizá hasta f¡~ = 1. como se ilustra en la figura 12-1a. El ingeniero del proceso debe intentar ahora aislar las causas específicas de la diferencia en el desempeño de los telares. La respuesta es que la mayor parte de la variabilidad de la resistencia del producto es el resultado de las diferencias entre los telares. En la figura 12-1b se muestra la distribución normal de la resistencia de la fibra con f¡~ = 1.86. Si pudiera identificar y eliminar estas fuentes de variabilidad entre los telares. El desempeño irregular de los telares podría ser el resultado de una instalación incorrecta.68 Valor P <0. operadores sin la capacitación suficiente. . es claro que una reducción significativa en este componente de la varianza incrementaría sensiblemente la calidad de la fibra producida. Figura 12-1 Salida del proceso en el problema de la resistencia de la fibra. El ingeniero del proceso se ha preguntado por qué es tan grande la cantidad de tejido defectuoso que debe desecharse. fibra de entrada defectuosa.75 111. En esta gráfica se presenta la salida del proceso (resistencia del tejido) modelado como una distribución normal con varianza f¡ ~ = 8. sería posible reducir considerablemente la varianza de la salida del proceso.12-1 MODELO CON EFECTOS ALEATORIOS 515 Tabla 12. etcétera. Observe que la proporción del producto defectuoso en la salida se ha reducido radicalmente. un mantenimiento deficiente. Aun cuando es improbable que pueda eliminarse toda la variabilidad entre los telares. este estudio puede haber sido motivado por una gran variabilidad en la resistencia del tejido. LS (especificación inferior) US (especificación superior) b l Variabilidad de la salida del proceso si C1: =0.73 1. y es relativamente inmediato ver que una proporción bastante grande de la salida del proceso se sale de las especificaciones (las áreas sombreadas de las colas de la figura 12-1a).90. LS (especificación inferior) US (especificación superior) al Variabilidad de la salida del proceso.001 fuentes de la variabilidad.19 22. la estimación del componente de la varianza dentro del telar (error) en el ejemplo 12-1.94 Grados de libertad 3 12 15 Cuadrado medio 29. Por ejemplo. N-a 2 (N . además.a donde L=l. Ver también la sección 12-7.a )MSE :5 a2 2 ] :5 X a/2. /(a. observe que MSnatamientos y MS E son variables aleatorias independientes y. +a?? 2 -:5 Fa/2 a-I N-a = 1. El estimador puntual de a.-l' y (N .MS E = ---'-'==::::""'--"n La variable aleatoria (a -l)MSnatamientn'/(o2 + na. por ejemplo donde u 1 2 2 = a +na .- n(a-1) y u =---2 n(N-a) a2 Desafortunadamente. es una combinación lineal de dos variables aleatorias ji-cuadrada.) se distribuye como X.N-a = 1.. no es posible construir un intervalo de confianza exacto para En Graybill [50] y Searle [99a] se presentan procedimientos aproximados. +a MSJi / a 2 2 ) _ F a-l..N-a Por lo tanto. ( F < l-a/2.a) por ciento para 02 es (N-a)MS E < 2 < (N-a)MS E ? X~/2. la distribución de probabilidad de (j. puede obtenerse la siguiente expresión: P(L:5 :~ :5 U) = 1. entonces (N -a)MSE /o2 se distribuye como X~-a' Por lo tanto. Es sencillo encontrar una expresión exacta para un intervalo de confianza del cociente a. Por lo tanto. Se trata de un cociente con significado. es . a.N-a 1 1) (12-13a) .a y un intervalo de confianza de 100(1 . ~"'S E a na.N-a Considere ahora el componente de la varianza A? a- a.(MSTratamienlOS (12-12) n MS E Fa/2 . MSTratamienlos / (na.a)MSE /a2 se distribuye como X~-a' Por lo tanto.N-a - MSTralamientos lY1. que puede demostrarse que a. + 02).- MSTratamienlns .516 CAPÍTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS Es sencillo encontrar un intervalo de confianza para el componente de la varianza 02.a-I. ya que refleja laproporción de la varianza de una observación [recuerde que V(Yij) = + 02] que es el resultado de las diferencias entre los tratamientos. no puede obtenerse una expresión predeterminada para la distribución de esta combinación lineal de variables aleatorias ji-cuadrada.N-a _a - 2 (12-10) XI-(a/2). Si las observa_ ciones siguen una distribución normal e independiente.a " ) (12-11) Al reordenar la ecuación 12-11. Para desarrollar este intervalo de confianza en el caso de un diseño balanceado.a-I. P [ X 1-(a/2). a. + a2) para los datos de la resistencia del ejemplo 12-1. Y que ambos tienen un gran número de niveles de interés (como en la sección anterior. 12~2 DISEÑO FACTORIAL DE DOS FACTORES ALEATORIOS Suponga que se tienen dos factores.883 <-1. Por lo tanto. + if) es --< 0. Si el experimento se hace con lZ réplicas. 2. es evidente que la variabilidad entre los telares (a.625 54.070 y por la ecuación 12-12. se supondrá que el número de niveles es infinito).3 = 1/14.f3j. Sin embargo.90 0. lZ =4. Este intervalo de confianza es relativamente ancho debido al tamaño pequeño de la muestra que se usó en el experimento.a.N-a 1 1) (12-13b) Observe que L y U son los límites de confianza inferior y superior del intervalo 100(1. Se escogerán al azar a niveles del factor A y b niveles del factor B. + if) es --< a2 U ' <-l+L .34 = 0. +a 2 . A y B./if.a) por ciento para a. un intervalo de confianza de 100(1 .12 = 1/Foo025. Por lo tanto.98 a./(a.Foo025.47 U =1. +a 2 -l+U L (12-14) Para ilustrar este procedimiento. 2.a) por ciento. las observaciones pueden representarse con el modelo lineal i = 1. [(29. a = 4. (MSTralamicnlos lZ MS E F1.73)(_1_)_1]= 54.) no es insignificante.3.oo.39:5 2' a2 ? :50. por las ecuaciones 12-13a y b. lZ OO" (12-15) donde todos los parámetros del modelo.12-2 OlSEÑO FACTORIAL DE DOS FACTORES ALEATORIOS 517 y U = 1. o 0./(a.2. +a- Se concluye que la variabilidad entre los telares explica entre 39 y 98% de la varianza en la resistencia observada del tejido producido.90 4. se encontrará un intervalo de confianza de 95% de a. el intervalo de confianza de 95% para a. respectivamente.oo.73)(_1)-1]= 0. MSE = 1.883 a. a j= 1.12.883 4 1./(a. y estos niveles de los factores se incluirán en un diseño experimental factorial.73.625 .a/2 .55.070. . (tf3)¡j YSijk' son variables aleatorias independientes.a-l. del cociente a. (tf3)¡j Ys¡po siguen una distribución normal con media cero y . [(29. .90.625 4 1.3. Recuerde que MSTratamientos = 29. También se supondrá que las variables aleatorias Ti' f3 j.12 = 4.47 YFOo975. t¡. b { k = 1. L=1. a~ . es decir. Los cuadrados medios esperados se usan siempre como guía para construir los estadísticos de prueba. Los componentes de la varianza pueden estimarse con el método del análisis de varianza.ab(n -1)' De manera similar. = -AB (12-18) o MS E ya que bajoHo tanto el numerador como el denominador deFotienen valor esperado y sólo siHo es falsaE(MSAB) es mayor que E(MSE). (a _ l)(b _ 1)' er. Puede demostrarse que ° E(MSA) = a. El cociente F o se distribuye como F(a -l).¡¡ ya2 son los componentes de la varianza. Por lo tanto. = O se usaría MS F. V[(r.p = O.B o MS AB = O el estadístico es (12-20) que se distribuye como F b . Observe la similitud con el modelo de efectos aleatorios de un solo factor. Se obtiene así (12-21) . deben examinarse los cuadrados medios esperados. es MS F. SSB' SSAB' SSr y SSE se calculan como en el caso de efectos fijos.p r ? ? b ? (12-17) y E(MS E ) =a2 Por los cuadrados medios esperados se observa que el estadístico apropiado para probar la hipótesis de que no hay interacción.1. Y para probar Ho:a~ MS F. = . Sin embargo. la varianza de cual? ? ? ? V( Yijk ) = a.p y V(C¡jk) = er. En muchos experimentos que incluyen factores aleatorios existe al menos interés tanto en estimar los componentes de la varianza como en la prueba de las hipótesis.A (12-19) o MS AB que se distribuye como Fa _ 1.¡¡ + na.+na. igualando los cuadrados medios observados de las líneas de la tabla del análisis de varianza con sus valores esperados y resolviendo para los componentes de la varianza.B)ij] = a. = .a. Observe que estos estadísticos de prueba no son los mismos que se usarían si ambos factoresA y B fuesen fijos. (a-1)(b -1)' Todas estas pruebas son de una sola cola superior. E(MS B ) = a 2 +na. SSA. para probar Ho:a.. Las hipótesis que quieren probarse son Ho:a.p = O. es decir. . +a¡¡ +a.¡¡ +a- (12 -16) ya. Los cálculos numéricos del análisis de varianza se mantienen sin cambios. Ho:a~ = y Ho:a. V(f3j) = a~.518 CAPÍTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS varianzas dadas por V(r¡) quier observación es = a.p +ana~ 2 E(MSJB)=a 2 +na . para formar los estadísticos de prueba. Ho:a. = 0. Se usa un instrumento o calibrador para medir una dimensión crítica de una pieza. rianza de las piezas. Estudio de capacidad o aptitud de sistemas de medición Con frecuencia se usan experimentos diseñados estadísticamente para investigar las fuentes de variabilidad que afectan a un sistema. a. Es válida la identidad del componente de la varianza de la ecuación 12-15.2 . a~ es el componente de la varianza de los operadores. por lo que se trata de un experimento factorial de dos factores en el que los factores del diseño son las piezas y los operadores. ya que éstos son los componentes de la variabilidad de interés. Las piezas y los operadores son factores aleatorios. Una aplicación industrial común es usar un experimento diseñado para estudiar los componentes de la variabilidad en un sistema de medición. El orden en que se hacen las mediciones está completamente aleatorizado. Tabla 12-3 El experimento de la capacidad o aptitud del sistema de medición del ejemplo 12-2 Número de Operador 1 Operador 2 Operador 3 la pieza 20 1 21 20 19 21 20 24 23 24 24 23 24 2 20 21 19 21 20 22 3 27 28 26 27 28 4 27 18 5 19 18 19 18 21 23 21 24 21 23 22 6 22 22 21 22 24 20 7 18 20 19 8 19 17 18 24 23 25 23 24 24 9 25 23 26 25 24 25 10 21 11 21 20 20 20 20 17 19 18 19 12 18 19 23 25 25 25 25 25 13 14 24 24 23 25 24 25 31 15 29 30 30 28 30 25 26 25 27 16 26 26 20 19 20 20 20 17 20 18 19 21 19 19 21 23 25 19 25 26 25 24 25 19 17 20 19 19 18 17 . 2 ay 2 = a . y tres operadores escogidos al azar miden dos veces cada pieza con este calibrador. es decir.f3 es el componente de la va- a.2 +a 2f3 +a 'f3 +a 2 donde a ~ es la variabilidad total (que incluye la variabilidad debida a las diferentes piezas. Se han seleccionado 20 piezas del proceso de producción. En la sección 12-7 se revisarán otros métodos para obtener estimaciones puntuales de los componentes de la varianza y los procedimientos para construir intervalos de confianza. con dos réplicas.12-2 DISEÑO FACTORIAL DE DOS FACTORES ALEATORIOS 519 como las estimaciones puntuales de los componentes de la varianza en el modelo de efectos aleatorios de dos factores. En la tabla 12-3 se muestra un experimento R&R de instrumentos de medición típico (de Montgomery [80aD. EJEMPLO 12. la variabilidad es el componente de la vadebida a los diferentes operadores y la variabilidad debida al calibrador). Estos estudios se conocen comúnmente como estudios de capacidad o aptitud de instrumentos de medición (calibradores) o estudios de repetibilidad y reproductibilidad (R&R) de instrumentos de medición (calibradores). 0. De manera típica. no negativas. Por último. con los números entre paréntesis representando los componentes de la varianza [(4) representa a2. y 0 2 es el error experimental aleatorio. dejando sin cambios las demás estimaciones.14 2 y f¡2 = 0. ya que puede considerarse que 0 2 refleja la variación obtenida cuando la misma pieza es medida por el mismo operador. La ecuación 12-21 puede usarse para estimar los componentes de la varianza de la siguiente manera: f¡2 = r 62.015 = 0. junto con el término del error que se utilizó para probar ese componente de la varianza en el análisis de varianza.71 = 0. Otro enfoque es estimar los componentes de la varianza con un método que asegure estimaciones no negativas (este enfoque se revisará brevemente en la sección 12-7).99 La parte inferior de la salida de Minitab de la tabla 12-4 contiene los cuadrados medios esperados del modelo aleatorio. ya que por definición las varianzas son no negativas.28 (3)(2) (20)(2) f¡2 fJ f¡2 rfJ = 1. Una posibilidad es suponer que la estimación negativa significa que el componente de la varianza en realidad es cero y simplemente se hace cero.]. Se presentan también las estimaciones de los componentes de la varianza.39. tomar esto como evidencia de que o ~fJ es en realidad cero (es decir. Estos experimentos . ya que refleja la variabilidad adicional en el sistema de medición que resulta del uso del instrumento por parte del operador. esto no tiene sentido. Los cálculos se realizaron utilizando la rutina Balanced ANOVA (análisis de varianza balanceado) de Minitab. Observe que la estimación de uno de los componentes de la varianza.1 520 CAPÍTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS rianza que representa la interacción entre las piezas y los operadores. Éste es un enfoque relativamente sencillo y que con frecuencia funciona casi tan bien como los métodos más elaborados.71 = 10. (3) representa o. Más adelante se estudiará la terminología modelo no restringido.71. y es común llamar a la reproductibilidad del instrumento de medición (calibrador).fJ' es negativa. pueden obtenerse estimaciones negativas de los componentes de la varianza cuando se usa el método de estimación del análisis de varianza (lo cual se considera una de sus desventajas). que los operadores quizá tengan un efecto pequeño y que no hay ninguna interacción significativa pieza-operador. se concluye que el efecto de las piezas es grande. ésta no tiene relevancia en los modelos aleatorios. podría observarse que el valor P del término de interacción de la tabla 12-4 es muy grande. Con base en los valores P. que no hay efecto de interacción) y ajustar un modelo reducido de la forma Yijk = /l+r:¡ +(3j +8ijk que no incluye el término de interacción. Desde luego. . al componente de la varianza a2 se le llama la repetibilidad del instrumento de medición (calibrador). Desafortunadamente. f¡.99 = -0.31. suelen realizarse con el objetivo de estimar los componentes de la varianza. En la tabla 12-4 se muestra el análisis de varianza de este experimento.fJ' etc. Existen varias maneras de abordar esta situación.0.0. 65 1 ..500 1274.0149 3 part*operator -0.Tabla 12-4 Análisis de varianza balanceado (Balanced ANOYA de Minitab) del ejemplo 12-2 Análisis de varianza (diseños balanceados) Factor part Type Levels Values random 20 1 8 2 9 3 4 5 6 7 'l!I 15 operator random 3 1 16 2 10 17 3 11 18 12 19 13 20 14 Analys.9917 Expected Mean Square for Each Term (us.050 59.s of Var. .592 MS 62.cted model) (4) + 2(3) + 6(1) (4) + 2(3) + 40(2) (4) + 2(3) (4 ) U1 N .861 Var.992 Error term 3 3 4 F p 87.ance component 1 part 10.391 1.72 0..712 0.2798 2 operator 0.617 27.1399 4 Error 0..000 0.173 0.84 0..ng unrestr.308 0.ance for y Source part operator part*operator Error Total Source DF 19 2 38 60 119 SS 1185..425 2. está fijo y el otro. la varianza del calibrador podría estimarse como la suma de las estimaciones de los componentes de la varianza {j2 y {j~ como .550 1274.b { k= 1.2513 0.883 Error term 3 3 F P 70.8908 La variabilidad del calibrador parece ser pequeña en comparación con la variabilidad del producto. El modelo estadístico lineal es i = 1.64 1 . .000 0.425 2. 2.88+0.88 (20)(2) 0.88 _ {j2 +{j2 Por último.88 = 10.8832 MS 62. 12. Se le llama análisis de varianza del modelo mixto.522 Tabla 12-5 CAPÍTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS Análisis de varianza del modelo reducido. B.2.592 Variance component 10.39.617 86.232 Expected Mean Square for Each Term (using unrestricted modeL) (3) + 6( 1) (3) + 40(2) (3) En la tabla 12-5 se muestra el análisis de varianza del modelo reducido.0.31.48 0.2. . (3)(2) {j2 {3 = 1.A. los dos efectos principales se prueban contra el término del error. Puesto que no hay término de interacción.0108 {j2 = 0.25 . es aleatorio. Se trata generalmente de una situación deseable.0108 = 0.3 MODELO MIXTO CON DOS FACTORES Se considera ahora la situación en que uno de los factores.11 .0. {j2 calibrador - {3 = 0. .0106 0.a (12-22) Yijk = fl+T¡ +f3 j +(Tf3)ij +t:ijk j= 1.308 0. ejemplo 12-2 Análisis de varianza (diseños balanceados) Type Levels Values 2 1 random 20 9 8 16 15 1 2 3 operator random Analysis of Variance for y Source part operator Error TotaL Source 1 part 2 operator 3 Error Factor part 3 10 17 3 4 11 18 5 12 19 6 13 20 7 14 DF 19 2 98 119 SS 1185. . la cual implica que el calibrador tiene la capacidad de distinguir entre las diferentes gradaciones del producto. y las estimaciones de los componentes de la varianza son {j2 = 62.391 1. Es decir. sin embargo.. ! (T(J)ij = (T(J). = Y. i = 1. . (Jj es un efecto aleatorio.. De hecho.p l' . .(T(3) ¡}]=-~a. ... El efecto de la interacción. el estadístico de prueba es MS B F =-a MS E con la distribución de referencia Ha: a. aben _ 1)' En el modelo mixto es posible estimar los efectos del factor fijo como p. es MS F = -A a MS AB que tiene la distribución de referenciaFa _ 1.j se define como [(a -l)/a]a.b ¡=1 Esta restricción implica que algunos elementos de la interacción en diferentes niveles del factor fijo no son independientes.. = O.. En este modelo la varianza de (T(J).=1 a E(MS B )= a 2 +ana~ E(MSAB ) = a 2 + na..p en vez de como a.f. (a-1)(b-1)' Para probar Ha: a~. o Ha:r:. Puesto que la suma de los efectos de la interacción en los niveles del factor fijo es igual a cero.f. se usaría F b _ 1. El supuesto (T(J)j = Otambién tiene un efecto sobre los cuadrados medios esperados.. 02).2.p para simplificar los cuadrados medios esperados. i¡ = y. a~). 2.p = O.p y E(MS E )= a 2 Por lo tanto. puede demostrarse (ver el problema 12-25) que e ov[ ((3) 1? T ¡j. j' es cero. el estadístico de prueba apropiado para probar que las medias de los efectos del factor fijo son iguales. y el error aleatorio &.Y.. la operación suma del componente de la interacción en el rango del factor fijo es igual a cero. Se supone también que las {T) son efectos fijos tales que L ~=1 Ti = OYque (Jj es una variable aleatoria NID(O.p. (T(J)¡j' es una variable aleatoria normal con media Oy varianza [(a -1 )/a]a.. aben _ 1)' Por último. a esta versión del modelo mixto con frecuencia se le llama modelo restringido. . a-1 (12-23) . i I 'La covarianza entre (T(J)ij y (T(J)ij' paraj . los cuales puede demostrarse que son E(MS )= a 2 +na 2 + A TP bnL T. .jk es NID(O. se supone que la interacción (T(J)¡j es un efecto aleatorio y &ijk es un error aleatorio.a (12-24) .12-3 MODELO MIXTO CON DOS FACTORES 523 Aquí T¡ es un efecto fijo. para probar la hipótesis de la interacción F = -AB a MS MS E que tiene la distribución de referencia F(a _ l)(b _ 1).j = O j= 1. .... el experimentador puede tener interés en probar hipótesis o en construir intervalos de confianza para las medias de tratamientos individuales del factor fijo... ~' I 524 CAPÍTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS --..p ya 2 pueden estimarse aplicando el método del análisis de varianza. cuyas soluciones son (12-25) y {}2 = MS E Este enfoque general puede emplearse para estimar los componentes de la varianza en cualquier modelo mixto... de tal modo que los operadores son un factor fijo...... Al eliminar la primera ecuación de las ecuaciones 12-23 quedan tres ecuaciones con tres incógnitas.- ~ MS AB Observe que esto es simplemente el error estándar que se usaría si éste fuera un modelo con efectos fijos. En la salida de Minitab..99 Estos resultados también se muestran en la salida de Minitab..... ' "j-- :....'. Es decir. De nueva cuenta.. Después de eliminar los cuadrados medios que contienen factores fijos. Al utilizar estos procedimientos. deberá tenerse cuidado de usar el error estándar apropiado de la media de los tratamientos.•.:I¡... El error estándar de la media de los tratamientos del efecto fijo es Cuadrado medio para probar el efecto fijo ]1/2 [ Número de observaciones en la media de cada tratamiento =---.0. Los cálculos se realizaron utilizando la rutina Balanced ANOVA (análisis de varianza balanceado) de Minitab..•.. Q[2] = L ~=1f3~ / (b -1).. a...14 2 = MS E = 0.. Las conclusiones son similares al ejemplo 12-2. Sin embargo.. .. se trata ahora de un experimento con un modelo mixto.23 an = (3)(2) - A? a Piezas X operadores {}2 MSPiezns x operadores n MS E = 0. Se especificó el uso del modelo restringido en el análisis de Minitab.39-0.......99 = -0. siempre quedará un sistema de ecuaciones que puede resolverse para los componentes de la varianza. Retomando el experimento de la capacidad o aptitud del sistema de medición Considere de nuevo el experimento R&R del calibrador descrito en el ejemplo 12-2... la ca)ltidad Q[2] indica una expresión cuadrática que incluye aloperador del efecto de factor fijo........ Un curso de acción apropiado sería ajustar un ..... I '1' '1". Suponga ahora que sólo tres operadores usan este calibrador.71..... El análisis de varianza del modelo mixto se muestra en la tabla 12-6. puesto que las piezas se eligen al azar. Los componentes de la varianza pueden estimarse con la ecuación 12-25 como {}2 PIezas = MSPiezas -MSE = 62.. resulta una estimación negativa del componente de la varianza de la interacción.-:1\ ~:v Los componentes de la varianza a~. EJEMPLO 12~3 . salvo porqueMSE se ha reemplazado con el cuadrado medio que se usó en la prueba de la hipótesis. En los modelos mixtos...99 = 10... el cual generó también los cuadrados medios esperados para este modelo. ng restr.992 Error term 4 3 4 F 62.~:'~.~$"=\.cted model) (4 ) + 6 (1 ) (4) + 2(3) + 4oQ[2J (4) + 2(3) (4 ) lJ1 N lJ1 .ance component 10.050 59.6 Análisis de varianza (Minitab) del modelo mixto del ejemplo 12).84 0.308 0.861 1 2 3 4 part operator part*operator Error -0.425 2.173 0.391 1.xed 3 1 2 Factor part Analys.y ii±- SiR" -"i:Wit5"r"é"íY&t¡e'-'".1399 0.72 P 0.9917 Expected Mean Square for Each Term (us.92 1 .712 0.617 27.592 Var.¡~~IA Tabla 12.000 0.ance for y Source part operator part*operator Error Total Source DF 19 2 38 60 119 SS 1185.500 1274.s of Var. Se supone el modelo restringido Análisis de varianza (diseños balanceados) Type Levels Values random 20 1 2 8 9 16 15 operator f.2332 "1 3 10 17 3 4 11 18 5 12 19 6 13 20 7 14 MS 62. En el caso de un modelo mixto con dos factores....... 2 _ 2 . y V(Cijk) = er. Modelos mixtos alternativos Sehan propuesto varias versiones diferentes del modelo mixto.. hay otras diferencias debido a las definiciones diferentes de la varianza del efecto de la interacción en los dos modelos... a) son efectos fijos tales que L~=la¡ = 0YYj' (aY)¡j y Cijk son variables aleatorias no correlacionadas que tienen media cero y varianzas V(Yj) = o~........ se observa que la única diferencia evidente es la presencia del componente de la varianza o~ en el cuadrado medio esperado del efecto aleatorio.. ... Es posible demostrar que los cuadrados medios esperados para este modelo son (referirse al material suplementario del texto de este capítulo) a E(MS A) = 0 2 +noa¡2..j =Op+-Oay a 2 1 2 y O..........526 CAPÍTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS modelo reducido.. ..... A continuación se revisa brevemente uno de estos modelos alternativos... V[(aY)ij] = o~. 2 = (aY)ij +(aY).... Estos modelos difieren de la versión restringida del modelo mixto estudiado anteriormente en los supuestos establecidos acerca de los componentes aleatorios.. La prueba deberá ser más conservadora cuando se emplee este modelo porque por lo general MSAB será mayor que MS E • Los parámetros de los dos modelos guardan una relación cercana......... (En realidad. De hecho.) Por consiguiente........... Observe que aquí no se usa la restricción impuesta anteriormente sobre el efecto de la interacción. esto lleva a los mismos resultados del ejemplo 12-2....p . Considere el modelo Yijk = ¡...... + E( MS B ) E(MS AB )= 0 2 +no~ y bnL a¡ a-1 (12-26) ¡=1 = 0 2 + no ~ + ano ~ Al comparar estos cuadrados medios esperados con los de la ecuación 12-23..j (rf3)ij 0 1.. como se hizo en el ejemplo 12-2.. a esta versión del modelo mixto se le llama con frecuencia modelo mixto no restringido.. se probaría la hipótesis de que el componente de la varianza del efecto aleatorio es igual a cero (Ho:o~ = O) usando el estadístico B F=-- o MS MS AB en contraste con probar H o : o~ con Fo = MSB/MSE en el modelo restringido.. por consiguiente.....2. . puede demostrarse que f3 j =yj+(aY)..0a¡.+a¡ +y j +(aY)ij +cijk donde a¡ (i = 1. .a .... Si la estructura correlativa de los componentes aleatorios no es grande..... Sin embargo. ..2.. La estructura de m. . d]. ..) =O j= 1... Cuando se haga referencia más adelante a los modelos mixtos. se encuentra que el único cambio de las ecuaciones 12-25 es que d MS B -MS AB a .. . Minitab soporta tanto el modelo restringido como el no restringido..... .....4 .12-3 MODELO MIXTO CON DOS FACTORES 527 Puede usarse el método del análisis de varianza para estimar los componentes de la varianza.....= --=-----'=-(12-27) y an Estos dos modelos son casos especiales del modelo mixto propuesto por Scheffé [98b.j es mij = fl+7:. El artículo de Hocking [56] es un resumen claro de diferentes modelos mixtos.b Las varianzas y covarianzas de bj y cij se expresan a través de las covarianzas de las mijo Además......... los parámetros de los efectos aleatorios en otras formulaciones del modelo mixto pueden relacionarse con bj y cijo El análisis estadístico del modelo de Scheffé es idéntico al del modelo restringido tratado aquí...... La elección del modelo deberá ser siempre dictada por los datos. En la tabla 12-7 se muestra la salida de Minitab para el experimento del ejemplo 12-3 utilizando el modelo no restringido.. El modelo restringido es en realidad un poco más general que el no restringido... y sólo hay diferencias menores entre ellos.=0 . y las estimaciones de los componentes de la varianza son muy similares. A la luz de esta multiplicidad de modelos mixtos.. . . una pregunta lógica es: ¿qué modelo deberá usarse? La mayoría de los especialistas en estadística prefieren el modelo restringido. mientras que en el segundo esta covarianza sólo puede ser positiva.j y cijk son variables aleatorias independientes. entonces quizá deba emplearse el modelo de Scheffé. si hay correlaciones grandes en los datos... 2......... +b j +cij E(mij ) = fl + 7:... EJEMPLO 12. ..... . .. ya que en el primero la covarianza entre dos observaciones del mismo nivel del factor aleatorio puede ser positiva o negativa.. Las conclusiones son idénticas a las del análisis del modelo restringido.. ! y 7:. Con referencia a los cuadrados medios esperados. mismo que se encuentra con mayor frecuencia en la literatura del tema. salvo porque. En este modelo se supone que las observaciones pueden representarse con i Yijk =mij+cijk = 1.b ..=1 C.. entonces cualquiera de los dos modelos mixtos es apropiado. El modelo no restringido Algunos paquetes de software de computadora tienen soporte para un solo modelo mixto. Observe que los cuadrados medios esperados concuerdan con los de la ecuación 12-26. 2... se supondrá la estructura del modelo r~stringido... k donde m.. el estadístico MSA/MSAB no siempre se distribuye como F cuando Ha: 7:i = Oes verdadera. aun cuando la selección por omisión es el modelo no restringido. = 1.2.lZ { j=1. .. en general. 500 1274.1399 0.861 -0. 84 0.308 0.\Jl N 00 Tabla 12-7 Análisis del experimento del ejemplo 12-3 utilizando el modelo restringido Análisis de varianza (diseños balanceados) Type Levels Values 1 random 20 8 15 operator fixed 3 1 Factor part Analysis of Variance for y Source part operator part*operator Error' Total Source 1 2 3 4 part operator pa rt*ope ra to r Error DF 2 9 16 2 3 10 17 3 4 5 6 7 11 18 12 19 13 20 14 19 2 38 60 119 SS 1185.712 0.617 27.000 0.9917 Expected Mean Square for Each Term (using unrestricted model) (4) + 2(3) + 6(1) (4) + 2(3) + Q[2J (4) + 2(3) (4 ) .425 2.65 1.173 0.391 1.592 Variance component 10.050 59.72 0.2798 MS 62.992 Error term 3 3 4 F p 87. definir el valor de a.íl.~d Por la curva de operación característica con a -1 = 4. . Puede demostrarse que siH1 es verdadera (a. Sin embargo.) .1 Y N .íl incluye dos parámetros desconocidos. . Si los tratamientos son homogéneos. de los grados de libertad del denominador y a de 0. a 2 y a./a2.íl = 1+ ' 2 lla 2 a (12-29) Observe que. la distribución de Fa esF central con a . tl. a = o. En estas curvas se grafica la probabilidad del error tipo II contra el parámetro .f \Q4.. y quiere determinarse la potencia de la prueba cuando a. También puede usarse el incremento porcentual en la desviación estándar de un método de observación para determinar el tamaño de la muestra.P{Fa > Fa a-1 N-a la. de los grados de libertad del numerador.~~! Suponga que se han seleccionado cinco tratamientos al azar con seis observaciones por tratamiento y 'W~ r. la desviación estándar de una observación elegida al azar es Ja +a.J. es igual a a • Puesto que a = 2 °'2 I~ }~ . 2 .-. donde . es más simple determinar la sensibilidad de la prueba mediante el uso de las curvas de operación característica.t.o~. Quizá pueda estimarse a..' \ 0~ ¡g: !ii S'G(~i. si se tiene una idea acerca de cuánta variabilidad de la población de tratamientos es importante detectar. se encuentra que {3=0. En la parte IV del apéndice se presenta una serie de estas curvas para varios valores .r¡ Cr' a. La probabilidad del error tipo II para el modelo de efectos aleatorios es {3 = 1. Puede escogerse una estimación de 02 recurriendo a la experiencia previa o discrecionalmente.~1 I~~ __ J j = 0-. Puesto que la probabilidad del error tipo II del modelo de efectos aleatorios se basa en la distribución F central usual.~t!}:.05 y 0.". si los tratamientos son diferentes. podrían usarse las tablas de la distribución F del apéndice para evaluar la ecuación 12-28. > O).'1'} 12-4 DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA CON EFECTOS ALEATORIOS 529 12~4 DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA CON EFECTOS ALEATORIOS Pueden usarse las curvas de operación característica del apéndice para determinar el tamaño de la muestra en experimentos con factores aleatorios. I PrT1 . ~.20 Ypor lo tanto la potencia es de aproximadamente 0..: Q. Se empieza con el modelo de efectos aleatorios con un solo factor de la sección 12-1.~. > O} (12-28) De nueva cuenta se requiere la distribución del estadístico de prueba Fa = MSTratamientoJMSE bajo la hipótesis alternativa.05.5 --'" tG' r-.a grados de libertad.íl=.P{Rechazar Ha IHa es falsa} = 1. : l7''''~~' ":·'~¡:"'~~J~.~~ C: ll '0"i . Sin embargo.1:::-. En ocasiones es úttJ' . .J1+6(1) = 2..01. '- EJEMPLO 12.' ·8 . entonces la desviación estándar de una observación seleccionada al azar es a. puede calcularse .646 . que quiere detectarse en términos del cociente a. N-a = 25 grados de libertad y a = 0..80. . utilizando la ecuación 12-29.p 0 a- o (a-1)(b-1) . 1+- na. Para el modelo mixto deben usarse las partes V y VI del apéndice.530 CAPÍTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS Si P es el incremento porcentual fijo en la desviación estándar de una observación más allá del cual se desea rechazar la hipótesis nula.ü1P o -+ = (1 + 0. El parámetro íl. los grados de libertad del numerador y los grados de libertad del denominador se muestran en la mitad superior de la tabla 12-8. También pueden usarse las curvas de operación característica para determinar el tamaño de la muestra del modelo de efectos aleatorios con dos factores y del modelo mixto. Los valores apropiados de ep2 y íl se muestran en la mitad inferior de la tabla 12-8.01P)2 -1 aPor lo tanto. __ 11. Se utiliza la parte VI del apéndice para el modelo de efectos aleatorios. Tabla 12-8 Parámetros de las curvas de operación característica de las tablas V y VI del apéndice para los modelos con dos factores de efectos aleatotios y mixto Factor A Ji 1+ El modelo de efectos aleatorios Grados de libertad del numerador o Grados de libertad del denominador bna.p o a-1 b-1 (a-1)(b-1) El modelo mixto Grados de libertad del numerador (a-1)(b-1) B AB (a-1)(b-1) ab(n -1) Factor A (fijo) Parámetro Grados de libertad del denominador Parte del apéndice a-1 (a-1)(b-1) v VI VI B (aleatorio) AB b-1 ab(n -1) ab(n -1) . se encuentra que (12-30) o a- Para unaP dada pueden usarse las curvas de operación característica de la parte VI del apéndice para encontrar el tamaño de la muestra deseado. entonces 1+0. (r+na. Si existen todas las interacciones posibles entre los k factores. y en 8(ij)b k es un subíndice vivo. para construir los estadísticos de prueba apropiados.m . el modelo contiene todos los efectos principales y las interacciones cuya existencia supone el experimentador. (. Regla 3. deben determinarse los cuadrados medios esperados. particularmente las que incluyen modelos aleatorios o mixtos. i y j son subíndices vivos y k es un subíndice ausente.. Después. 1 interacción de k factores. esta regla implica que 8 ijk se convierte en 8 (ij)k' Regla 2. (Observe que los arreglos parcialmente balanceados. Regla 1. Cuando se aplican a un modelo mixto. entonces no hay interacción entre ese factor y los demás factores de ese término. )m. 2 Los diseños anidados se estudian en el capítulo 13. mediante la aplicación directa del operador valor esperado. Este método de fuerza bruta. En situaciones de diseño complejas. entonces hay (. en ('r:(3)ij. Las reglas que se presentan a continuación producen siempre los cuadrados medios esperados sin recurrir al enfoque de fuerza bruta y. . Siempre es posible determinar los cuadrados medios esperados de cualquier modelo como se hizo en el capítulo 3. . Mediante el examen de los cuadrados medios esperados puede desarrollarse el estadístico apropiado para probar hipótesis acerca de cualquier parámetro del modelo.. ) interacciones de dos factores. Por lo tanto. 8 ij . de tal modo que el valor esperado del cuadrado medio del numerador difiere del valor esperado del cuadrado medio del denominador únicamente por el componente de la varianza o el factor fijo en el que se tiene interés. se escribe como 8(ij. Si uno de los factores de un término aparece entre paréntesis. estas reglas producen cuadrados medios esperados que son consistentes con los supuestos del modelo mixto restringido de la sección 12-3.oo.12-5 REGLAS PARA LOS CUADRADOS MEDIOS ESPERADOS 531 12~5 REGLAS PARA LOS CUADRADOS MEDIOS ESPERADOS Una parte importante de cualquier problema de diseño experimental es la realización del análisis de varianza. mientras que i y j son subíndices muertos. Cornfield y Tukey [34] YSearle [99a. b].. El estadístico de prueba es el cociente de los cuadrados medios que se elige. Para cada término del modelo. con la práctica. se excluyen explícitamente. Esto implica determinar la suma de cuadrados de cada componente del modelo y el número de grados de libertad asociados con cada suma de cuadrados. b) muertos: aquellos que están presentes en el término y están entre paréntesis.) Estas reglas son estudiadas por varios autores..]. Bennett y Franklin [9]. ) interacciones de tres factores. con frecuencia es útil contar con un procedimiento formal para este proceso. Se presentará un conjunto de reglas para anotar los cuadrados medios esperados en cualquier experimento factorial balanceado.. su uso se vuelve relativamente simple. incluyendo Scheffé [98d]. es decir. los subíndices se dividen en tres clases: a) vivos: aquellos que están presentes en el término y no están entre paréntesis. y e) ausentes: aquellos subíndices que están presentes en el modelo pero no en ese término particular. como los cuadrados latinos y los diseños de bloques incompletos. Las reglas se ilustran utilizando el modelo factorial de efectos fijos con dos factores. donde el subíndice m denota el subíndice de la réplica. El término del error del modelo. Para el modelo con dos factores.. anidado: o factorial anidado. puede ser muy laborioso. )n. como suele llamársele. Además de una media global (P) y un término del error [8(ij. Hay un renglón para cada componente (cuadrado medio) del modelo y una columna para cada subíndice. en un modelo mixto de dos factores con el factor A fijo y el factor B aleatorio. Las réplicas siempre se consideran aleatorias. El número de grados de libertad de cualquier término del modelo es el producto del número de niveles asociados con cada subíndice muerto y el número de niveles asociados con cada subíndice vivo menos lo Por ejemplo. el efecto de A es Regla 5. el componente de la varianza de B es a~. Si una interacción contiene al menos un efecto aleatorio. Arriba de cada subíndice se escribe el número de niveles del factor asociados con ese subíndice y si el factor es fijo (F) o aleatorio (R).532 CAPÍTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS Regla 4. Por 10 tanto. a) En cada renglón se escribe 1 si uno de los subíndices muertos en el componente del renglón coin- Regla 6. Y el número de grados de libertad asociados con 8 (ij)k es ab(n . se elabora la tabla siguiente. cide con el subíndice de la columna: F F b j a Factor i R n k 1 1 b) En cada renglón. y el componente de la varianza deAB es a. Grados de libertad. si cualquiera de los subíndices del componente del mismo coincide con el sub- índice de la columna. Cuadrados medios esperados. Cada término del modelo tiene asociado con él un componente de la varianza (efecto aleatorio) o bien un factor fijo (efecto fijo).1). Un componente de la varianza tiene letras griegas como subíndices para identificar el efecto aleatorio particular. En el ejemplo tratado aquí. el número de grados de libertad asociados con (rf3)ij es (a -1 )(b -1).fJ' Un efecto fijo se representa siempre por la suma de cuadrados de los componentes del modelo asociados con ese factor dividida por sus grados de libertad. i=1 a-1 Para obtener los cuadrados medios esperados. la interacción completa se considera aleatoria. se escribe Osi el encabezado de la columna es un factor fijo y 1 si es un factor aleatorio: Factor F a i F b j R n k Ti f3j O O 1 O O 1 (Tf3)¡j c(ij)k 1 . para encontrar E(MSA). e niveles del factor e y n réplicas. se cubre la columna i. el cuadrado medio esperado es bn E(MSA)=a2 + 2: 7:. respectivamente. Por lo tanto. b niveles del factor B. Observe que se ha supuesto la versión restringida del modelo mixto para producir los cuadrados medios esperados. Por ejemplo. suponiendo que todos los factores son de efectos Tabla 12-9 Derivación de los cuadrados medios esperados. La suma de estas cantidades es el cuadrado medio esperado del componente del modelo bajo consideración. El producto de los números visibles en los renglones que contienen al menos el subíndice i sonbn (renglón 1). Observe que i no está presente en el renglón 2.12-5 REGLAS PARA LOS CUADRADOS MEDIOS ESPERADOS 533 e) En las posiciones del renglón que quedan vacías se escribe el número de niveles que aparecen indicados arriba del encabezado de la columna: F F R 11 Factor r:i a i b j le 11 11 11 f3j (r:f3)ij c(ij)k O a O 1 b O O 1 1 d) Para obtener los cuadrados medios esperados de cualquier componente del modelo. El análisis de este diseño. primero se cubren todas las columnas cuyos encabezados sean subíndices vivos de ese componente. i=l a a-1 En la tabla 12-9 se presenta la tabla completa de los cuadrados medios esperados para este diseño. se toma el producto de los números visibles y se multiplica por el factor fijo o aleatorio apropiado de la regla 1. En las tablas 12-10 y 12-11 se muestran las derivaciones de los cuadrados medios esperados para los modelos con dos factores. en cada renglón que contiene al menos los mismos subíndices que los del componente bajo consideración. Después. modelo de efectos fijos con dos factores F F R 11 Factor r:¡ a i b j le 11 Cuadrado medio esperado O a b a-+-? ? bl1"Lr:. O(renglón 3) y 1 (renglón 4). En el ejemplo siguiente se considera un diseño factorial con tres factores. EJEMPLO 12~6 . Considere un experimento factorial de tres factores con a niveles del factor A. aleatorio y mixto. a-1 f3j (r:f3)¡j C(ij)k O O 1 11 a-+ b -1 a-+ a? ? al1"Lf3~ O 1 11 11"L"L(r:f3)¡' ~ (a-1)(b -1) 1 . + nu. modelo de efectos aleatorios con dos factores R a R b R n Factor T¡ f3i (Tf3)ij C(¡j)k i j b k n n n Cuadrado medio esperado u u u 2 2 2 ? 1 a + nu.py + enu.py + IW~.. + anu P1' + nu.p + bnu.+ nu.p + anu~l' + nu. + nu. modelo mixto con dos factores F a R b j b R n k n n n Factor T¡ f3i (Tf3)y C(ij)k i O a Cuadrado medio esperado ? ? bn"LT u.p + bnu~.+ IW~.p ? u- ¡ i i I Tabla 12-12 Derivación de los cuadrados medios esperados.+ .py + a nu.534 CAPÍTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS Tabla 12-10 Derivación de los cuadrados medios esperados. 2 u + nu.Pl' + alW~y 2 u + nu.py ? ? ? ? ? ? u- 1 .' rp a-l 2 1 1 u 2 2 + anu~ O 1 1 1 u + nu.p b u. 2 u + nU. + enu. modelo de efectos aleatorios con tres factores R a R b R e k e e R n Factor T¡ f3i Yk (Tf3)¡i (ry)¡k (f3Y)ik (Tf3Y)¡ik cijkl i 1 a a j b 1 n n n n n n n u u 2 2 Cuadrado medio esperado 1 b 1 e 1 1 a 1 b 1 1 1 1 1 1 1 1 1 + enu. 2 +nurp + anu 2 p 2 + IW rp 1 1 1 1 1 1 u- Tabla 12-11 Derivación de los cuadrados medios esperados.Pl' + aenu~ ?b? b? u.py + benu. . Una variante de esta idea es agrupar ciertos cuadrados medios en el análisis de varianza para obtener una estimación del error con más grados de libertad.. Ahora se determinan los cuadrados medios esperados suponiendo que todos los factores son aleatorios.. PRUEBAS F APROXIMADAS 12... Un procedimiento defendido por algunos experimentadores es probar primero las interacciones...... Observe que efectivamente existen las pruebas apropiadas para las interacciones de dos y tres factores. B y e son factores aleatorios. ¿cómo deberán probarse los efectos principales? Este problema se considera en la siguiente sección.. El modelo estadístico apropiado es Yijkl = p. para después suponer que estas interacciones son cero cuando se prueben otros efectos en el mismo experimento. El mismo fenómeno ocurre para los efectos principales de B y C.. En general. es posible que las pruebas de los efectos principales sean de importancia básica para el experimentador.12-6 PRUEBAS F APROXIMADAS 535 fijos. no es posible formar un cociente de dos cuadrados medios esperados tal que el único término del numerador que no está en el denominador sea bcna..+7:¡ +f3 j +Yk +(7:f3)ij +(7:Y)ik +(f3Y)jk +(7:f3Y)ijk +Eijkl Utilizando las reglas descritas antes.. Para ilustrar...1) grados de libertad del MSE original. no es sencillo establecer este supuesto... Es decir.. Se observa.... no exista un estadístico de prueba exacto para ciertos efectos de los modelos. en la tabla 12-12 se derivan los cuadrados medios esperados. este procedimiento puede ser riesgoso. si se quiere probar la hipótesis = 0../3Y = no se rechaza..6 Es frecuente que en experimentos factoriales con tres o más factores incluidos en un modelo aleatorio o mixto.. Una posible solución a este dilema es suponer que ciertas interacciones son insignificantes.. El experimentador podría considerar la agrupación o combinación de MSABC Y MSE de acuerdo con ° MS . es necesario señalar que debe haber algo en la naturaleza del proceso -o algún conocimiento previo sólido... obteniéndose así un nuevo cuadrado medio residual ... El riesgo de agrupar es que puede incurrirse en un error tipo H y combinar con el error el cuadrado medio de un factor que en realidad es significativo..) = cJl. No deberán eliminarse ciertas interacciones del modelo sin evidencia concluyente de que es apropiado hacerlo. ....... en comparación con los abc(n .... suponga que en el ejemplo 12-6 no fue significativo el estadístico de prueba Fo = MSABc/MSE • Por lo tanto.que permita suponer que una o más de las interacciones son insignificantes. después fijar en cero aquellas interacciones que se hayan encontrado no significativas...... y sería posible conducir pruebas de los efectos principales. entonces no existe ninguna prueba exacta para los efectos principales.. y tampoco deberá hacerse a la ligera.... y tanto MSABC como MS E estiman la varianza del error cJl. .... a. Aun cuando parece tratarse de una posibilidad atractiva... Sin embargo... Por ejemplo. que siA.. Observe queMSE' tiene abc(n -1) + (a -l)(b -l)(c -1) grados de libertad. ya que cualquier decisión respecto a una interacción está sujeta tanto al error tipo 1 como al error tipo H... entonces podría hacerse a. = abc(n-1)MS E +(a-1)(b-1)(c-1)MSABC E abc(n-1 )+(a -1)(b-1)(c-1) de tal modo queE(MSE .. Por lo tanto./3 = a~ = a~y = 0... Aun cuando en ocasiones se aplica en la práctica... así como en otros diseños más complejos.. al examinar los cuadrados medios esperados de la tabla 12-12. se presenta en la sección 5-4..... H o:a.... si fuera razonable suponer que todas las interacciones de dos factores del ejemplo 12-6 son insignificantes. por ejemplo... Si el cuadrado medio del error original tiene seis o más grados de libertad. por lo que puede ser necesario hacer una interpolación en las tablas de la distribuciónFo Por ejemplo. ya que podría conseguirse así un incremento potencialmente considerable de la precisión de pruebas posteriores.u + . si el cuadrado medio del error original tiene un número muy pequeño de grados de libertad (por ejemplo. con MS'= MS A +MS ABC y MS"= MS AB + MS AC Los grados de libertad de F se calcularían con las ecuaciones 12-34 y 12-35.. el experimentador quizá tenga mucho que ganar al hacer la agrupación. Un procedimiento razonablemente práctico es el siguiente. Cuando no es posible suponer que ciertas interacciones son insignificantes y sigue siendo necesario hacer inferencias acerca de los efectos para los que no existen pruebas exactas.r y . q' donde p= MS r2 /!. = O sería F = MS' /MS". es el número de grados de libertad asociados con el cuadrado medio MS¡o No existe la seguridad de que p y q sean enteros. Si el cuadrado medio del error original tiene menos de seis grados de libertad../. + MS V (12-31) (12-32) MS" = MS 11 donde los cuadrados medios de las ecuaciones 12-31 y 12-32 se seleccionan de tal modo que E(MS') E(MS") sea igual a un múltiplo del efecto (el parámetro del modelo o el componente de la varianza) considerado en la hipótesis nula.v (12-35) En p y q . menos de seis). La teoría subyacente de esta prueba es que tanto el numerador como el denominador del estadístico de prueba (ecuación 12-33) se distribuyen aproximadamente como múltiplos de variables aleatorias . hacer la agrupación sólo si el estadístico F del cuadrado medio que se agrupará no es significativo para un valor grande de a. I I . en el modelo de efectos aleatorios con tres factores (tabla 12-12). + . Por otra parte. no hacer la agrupación. tal como a = 0. MS'= MS r y + . El método de Satterthwaite utiliza combinaciones lineales de cuadrados medios.. Esto hará que sea más difícil detectar otros efectos significativos..00 +MSv2 /!.25.) que es muy grande. es relativamente sencillo ver que un estadístico de prueba apropiado para Ho:a.536 CAPÍTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS (MS E . puede emplearse un procedimiento atribuido a Satterthwaite [97]. Entonces el estadístico de prueba sería F=-- MS' MS" (12-33) que se distribuye aproximadamente como Fp . +MSS2 /fS (12-34) 2 q= MS u /!. +MSs + . Por la columna Cuadrados medios esperados. .12-6 PRUEBAS F APROXIMADAS 537 ji-cuadrada. Por lo tanto. Operador (B) (C) 1 2 3 1 -2 -3 2 O 3 -6 4 -1 -2 -9 -S -1 -4 -1 -8 -8 -2 O 4 4 4 -3 -8 -7 -7 -2 4 1 14 14 22 24 20 16 2 6 O 3 8 6 2 O 1 2 6 2 3 O 4 -7 6 -S 2 -S -1 1 -8 -8 -8 3 -2 -1 2 -2 20 1 -7 -1 -2 3 -1 -2 -9 -8 -4 4 -2 1 -8 3 1 3 -7 .!2. y puesto que no aparece ningún cuadrado medio en el numerador o el denominador de la ecuación 12-33. o H o:7:. q' Satterthwaite hace hincapié en que deberá prestarse atención al aplicar el procedimiento cuando algunos de los cuadrados medios de MS' y MS" aparezcan con signos negativos. El ingeniero de diseño considera que las variables importantes que influyen en las lecturas de la caída de la presión son la temperatura del gas en la admisión (A). podría usarse el estadístico MS' F= MS" 'labIa 12-13 Datos codificados de la caída de la presión para el experimento de la turbina Temperatura del gas (A) 60 P 0 7SoP Operador (B) 90 P 0 Manómetro Operador (B) .!2. entonces la aproximación de Satterthwaite tiene una validez razonable si __ 1 2 MS >F xF MS O. El modelo lineal de este diseño es donde 7:. el numerador y el denominador son independientes. En la tabla 12-13 se muestran los datos codificados de dos réplicas.!2 Y si 11 :5 100 Y 12 2:: N2.!j O. = O. en la ecuación 12-33.025. se observa que existen pruebas exactas para todos los efectos esperados salvo el efecto principalA. El análisis de varianza se muestra en la tabla 12-14. con la temperatura del gas fija y el operador y el manómetro aleatorios. Gaylory Hopper [48] reportan que siMS' = MS 1 -MS 2. Se ha agregado la columna titulada "Cuadrados medios esperados" a esta tabla. f3j es el efecto del operador (B) y Yk es el efecto del manómetro (C). el operador (B) y el manómetro específico que utiliza el operador (C). es el efecto de la temperatura del gas (A). Estos tres factores se incluyen en un diseño factorial. F se distribuye aproximadamente como Fp . EJEMPLO 12~7 Se estudia la caída de la presión medida en una válvula de expansión de una turbina. Para probar el efecto de la temperatura del gas. y las entradas de esta columna se derivan por los métodos estudiados en la sección 12-5. En la tabla 12-14 se muestran los resultados de estas pruebas.SO. :~--:~=~:-=~- \J1 l.27 3.84 .p)' + bn~'1' (J2 + an(J~y (J2 + n(J.10 0. 21.90 <0.49 1.79 + bn(J'1' + cn(Jrp + n(Jrpy + .60 202.B Manómetro. C (J2 + an(J~y + acn(J~ (J2 + an(J~y + abn(J~ (J2 + n(J.J.py (J- AB AC BC ABC Error Total .17 0.63 0.65 Valor P 0. .jJ illilJ .32 Grados de libertad 2 3 2 6 4 6 12 36 71 (J 2 Cuadrados medios esperados Cuadrado medio 511.~-' .7:¡ Operador. A Suma de cuadrados 1023.97 137.a-1 2 2 2 bcn2:.p (J2 + n(J.10 14.82 7.47 166..01 0.07 0..59 2.36 423.50 3950.05 0.py + cn(J.91 13.68 141.22 4.11 770.l 00 Tabla 12-14 Análisis de varianza de los datos de la caída de la presión Fuente de variación Temperatura.89 209.19 1211.47 34.40 Fo 2.17 0.00 34. se calculan MS'= MS A +MS ABC = 511.47= 236.84)2 /12 y (MS AB +MS AC )2 q = MS AB 2 / 6 + MS 2 / 4 AC = (236. Observe que las entradas de la tabla del análisis de varianza .11=2 (511. o temperatura-operador.2. indica que el efecto de la temperatura puede ser grande cuando se usan el operador 1 y el manómetro 3.47 y F = MS' = 525.52 MS"= MS AB + MS AC = 202.68)2 /2+(13.68+ 13. es grande. Se ha especificado el modelo restringido.47 Los grados de libertad de este estadístico se encuentran con las ecuaciones 12-34 y 12-35 de la siguiente manera: (MS A + MS ABC )2 2 2 p= MS A /2+MS ABC /12 (525. La interacciónAB.52)2 = 2.00)2 /6+(34.2 MS"= MS AB ya que E(MS')-E(MS")= a-1 ¡ Para determinar el estadístico de prueba para Ha:'í¡ = O. Q[l] representa el efecto fijo de la presión del gas. 8 = 4. y hay ciertos indicios de una interacciónAC o temperatura-manómetro.47)2 /4 Al comparar F = 2.84 = 525.22 MS" 236.22 con Fa.00+34.17. no puede rechazarse Ha.47)2 = 7.52 = 2. El análisis gráfico de las interaccionesAB yAC.46. parece posible que los efectos principales de la temperatura y el operador estén enmascarados por la interacción AB grande.12-6 PRUEBAS F APROXIMADAS 539 donde MS'=MS A y + MS ABC + MS AC bcn2::¡.a5 . ilustrado en la figura 12-2. El valor P aproximado esP = 0. En la tabla 12-15 se presenta la salida de la rutina Balanced ANOVA (análisis de varianza balanceado) de Minitab para el experimento del ejemplo 12-7. Por lo tanto.88=8 (202. La diferencia principal con el modelo restringido es que ahora los valores esperados de los cuadrados medios de los tres efectos principales son tales que no existe ninguna prueba exacta. Sin embargo.'i·l 'I ¡ji ji 11 1I 540 125 100 I:Q ~ CAPÍTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS 100 75 CJ x 75 Iu D " 'ro " x 50 25 B~2 ~ 50 25 O . pero ahora el cuadrado medio esperado deB incluye aa. En el modelo restringido. I I 1 + MS AC -MS ABC cuyo valor esperado es E[(4)+(5)-(7)]= a 2 +na. suponiendo el modelo no restringido.py y aa. Minitab indica que la prueba no es exacta (lo que se ve por los cuadrados medios esperados).p. . Las conclusiones generales no son radicalmente diferentes del análisis del modelo restringido. pero usa. los dos efectos aleatorios promedio podrían probarse contra su interacción. Esto es una muy buena ilustración de que puede haber más de una manera de construir los cuadrados medios sintéticos usados en el procedimiento de Satterthwaite. ya que no incluye ningún cuadrado medio con signo negativo en las combinaciones lineales. en lugar de la que eligió Minitab. El análisis del ejemplo 12-7. De nueva cuenta.!!! O B ~4 -25 -50 B~ 1 B~3 o 1-25 -50 " '" ro 60 75 A 90 60 Figura 12-2 Interacciones en el experimento de la caída de la presión.!!! QJ '" QJ ID " u 'ro " '" QJ QJ " '" ~ ro .yel cuadrado medio esperado de Cincluye aa. El modelo no restringido produce una estimación negativa de a ~ .py 2 +bna 'l' 2 (a 2 +na . La Prueba Sintetizada construida por Minitab es en realidad el procedimiento de Satterthwaite. por la salida de Minitab.py y aa~.py +cna. se presenta en la tabla 12-16. Observe que. Puesto que el factor manómetro no es significativo en ninguno de los dos análisis.py +cna . se preferiría en general la combinación lineal de los cuadrados medios que se seleccionaron. además del cambio grande en la estimación del componente de la varianza del operador.~.p +a 2 +na. el cuadrado medio del error para probar el factor A es (4)+(5)-7= MS AB .p +bna 'l' que es un cuadrado medio del error apropiado para probar el efecto promedio deA.un estadístico de prueba diferente del que se utilizó aquí. es posible que sea pertinente alguna reducción del modelo. salvo por la pruebaF de la temperatura del gas (factorA). concuerdan en general con las de la tabla 12-14.py ) 2 2 2 = a 2 +na . Minitab construye cuadrados medios sintéticos y prueba estos efectos con el procedimiento de Satterthwaite. 167 0.32 MS 511..59 2. Error Terms for Synthesized Tests ~ lJ1 .904 0.91 13..11 770.069 0.- t roo &'"rmét¿tt"t..788 "1l Variance Error Expected Mean Square for Each Term component term (using restricted model) * 6 6 7 5.63 0.305 31.36 423.909 -1.10 14.19 1211. Source 1 GasT Error DF 6. Source 1 2 3 4 5 6 7 8 GasT Operator Gauge GasT*Operator GasT*Gauge Operator*Gauge GasT*Operator*Gauge Error DF 2 3 2 6 4 6 12 36 71 75 2 2 90 3 3 4 SS 1023.60 202.27 3.00 34.68 141.000 0. Tabla 12-15 Análiss de varianza balanceado de Minitab (Balanced AN avA) del ejemplo 12-7.05 0.50 3950.65 P 0.63 Synthesis of Error MS (4) + (5) .171 x 0.30 4.49 1.403 (8) (8) (8) (8) 7 8 8 + 2(7) + 6(6) + 6(6) + 2(7) (8) + 2(7) (8) + 6(6) (8) + 2(7) + 8(5) + 6(4) + 24Q[1J + 18(2) + 24(3) + 6(4) + 8(5) (8) * Synthesized Test.252 -3.780 21.579 2.89 209. 40 F 2.:Zl'.47 34.84 21.97 137.359 2.47 166.97 Error MS 222.. modelo restringido Análisis de varianza (diseños balanceados) Factor Type Levels Values GasT fixed 3 60 Operator random 4 1 Gauge random 3 1 Analysis of Variance for Drop Source GasT Operator Gauge GasT*Operator GasT*Gauge Operator*Gauge GasT*Operator*Gauge Error Total x Not an exact F-test.·.82 7.(7) ~ .099 0. 65 P 0.82 7.89 209.____ .359 7 (8) + 2(7) + 8(5) GasT*Gauge 2. Source 1 2 3 4 5 6 7 8 DF 2 3 2 6 4 6 12 36 71 75 2 2 90 3 3 4 SS 1023.579 7 (8) + 2(7) + 6(6) Operator*Gauge 3.97 7.__ =---~ =--=~:'~--C::S3I ~ U1 N Tabla 12-16 Análisis de varianza balanceado de Minjtab (Balanced ANOVA) del ejemplo 12-7.171 x 0.98 Error MS 222.47 34.59 2.49 2.164 7 (8) + 2(7) + 6(4) GasT*Operator 31.36 423.54 Synthesis of Error MS (4) (4) (S) + + + (5) (6) (6) - (7) (7) (7) .081 0.512 8 (8) + 2(7) GasT*Operator*Gauge -3.11 770.91 13.40 F 2.63 223.06 55.60 202.52 0.09 5.50 3950.84 21 .30 0.97 137. modelo no restringido Análisis de varianza (diseños balanceados) Factor Type Levels Values GasT fixed 3 60 Operator random 4 1 Gauge random 3 1 Analysis of Variance for Drop Source GasT Operator Gauge GasT*Operator GasT*Gauge Operator*Gauge GasT*Operator*Gauge Error Total x Not an exact F-test.000 0.788 Variance Error Expected Mean Square for Each Term component term (using unrestricted model) * (8) + 2(7) + 8(5) + 6(4) + Q[1J GasT * (8) + 2(7) + 6(6) + 6(4) + 18(2) Operator -4.616 x 0.47 166.403 * Synthesized Test.06 14.19 1211.68 141.938 x 0.63 0. Error Terms for Synthesized Tests Source' 1 GasT 2 Operator 3 Gauge Error DF 6.099 0.32 MS 511 .780 (8) Error 21.544 * (8) + 2(7) + 6(6) + 8(5) + 24(3) Gauge -2.27 3.00 34. . este estadístico F puede usarse en una prueba de significación aproximada del parámetro o del componente de la varianza de interés. . Recuerde que el método de Satterthwaite utiliza dos combinaciones lineales de cuadrados medios MS' = MS r + ... se presentaron intervalos de confianza exactos de 100(1-a) por ciento paraerypara otras funciones de los componentes de la varianza en ese diseño experimental simple.. 12. +MS v con el estadístico de prueba MS' F=MS" que tiene una distribuciónF aproximada. y se ilustra asimismo cómo encontrar estimaciones de máxima verosimilitud de los componentes de la varianza.1 Intervalos de confianza aproximados para los componentes de la varianza Cuando se introdujo el modelo de efectos aleatorios en la sección 12-1. La atención se centra en los procedimientos para encontrar intervalos de confianza para los componentes de la varianza. Por ejemplo.12-7 ALGUNOS TEMAS ADICIONALES SOBRE LA ESTIMACIÓN DE LOS COMPONENTES DE LA VARIANZA 543 12. pueden emplearse para construir intervalos de confianza aproximados de los componentes de la varianza para los que no se cuenta con ningún intervalo de confianza exacto. er. El método de máxima verosimilitud puede ser una alternativa útil cuando el método del análisis de varianza produce estimaciones negativas. los conceptos fundamentales de las "pseudo" pruebas F aproximadas de Satterthwaite. introducidos en la sección 12-6.. considere el cuadrado medio del error.7 ALGUNOS TEMAS ADICIONALES SOBRE LA ESTIMACIÓN DE LOS COMPONENTES DE LA VARIANZA Como se señaló anteriormente. + MS s y MS" = MS u + . ya que estas varianzas no son el valor esperado de un solo cuadrado medio del análisis de varianza. Al utilizar los grados de libertad apropiados paraMS' y MS". Siempre es posible encontrar un intervalo de confianza exacto para cualquier función de los componentes de la varianza que es el valor esperado de uno de los cuadrados medios del análisis de varianza. El intervalo de confianza exacto de 100(1-a) por ciento es (12-36) Desafortunadamente. la estimación de los componentes de la varianza en un modelo aleatorio o mixto reviste con frecuencia considerable importancia para el experimentador. en experimentos más complejos en los que intervienen varios factores del diseño no es posible por lo general encontrar intervalos de confianza exactos para los componentes de la varianza de interés.7.. definidos en las ecuaciones 12-34 y 12-35. En esta sección se presentan algunos resultados y técnicas adicionales que son útiles para estimar los componentes de la varianza. Sin embargo. Puesto que E(MSE ) = siempre es posible encontrar un intervalo de confianza exacto para ya que la cantidad 2 2 tEMSE / a = tEo2 / a er. tiene una distribución ji-cuadrada cantE grados de libertad. . las dos combinaciones lineales.Xa/2. Graybill [50] establece un resultado general para r.PI' 'i1l 111..r Por lo tanto... considere nuevamente el experimento del ejemplo 12-7.r. fu Il . 11 . por lo general será necesario hacer una interpolación de las tablas ji-cuadrada... La estimación del componente de la varianza... MS.. donde se usó un modelo mixto con tres factores en un estudio de la caída de la presión en una válvula de expansión de una turbina. +-fr fs f. y rf¡ ~ la ~ sigue una distribución ji-cuadrada aproximada con r grados de libertad. un intervalo de confianza aproximado de 100(1 ... f¡~.. -1 2 - 1~2 < <_o 2 } __ a y rf¡2 rf¡2 } 0_<a2 < o =l-a P { __ 2 0? Xa/2.r . MS k u (12-38) Los cuadrados medios (MS¡) de la ecuación 12-38 son independientes. MS _.. (12-37) La ecuación 12-37 proporciona una base para una estimación puntual de a~: MS'-MS" f¡2 . MS + .!. +.r X1-a/2..E(MS") k . --+ ..a) por ciento para a~ es __ 0_<a2 < o 2 o2 Xa/2.E(MS") = ka~ o 2 _ ao - E(MS'). se eligen de tal modo que la diferencia en sus valores esperados sea igual a un múltiplo del componente. donde lasf..r rf¡2 rf¡2 (12-40) EJEMPLO 12~8 . El modelo es Yijkl = fl+r¡ +f3 j +Yk +("íf3)ij +(rY)¡k +(f3Y)jk +(rf3Y)¡jk +cijkl .MS/a¡ = SS/a¡ tienen distribuciones ji-cuadrada con/. Como r no será un entero en la mayoría de los casos. grados de libertad. por ejemplo a~.~ MS. I.i milI i i 544 CAPÍTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS Para probar la significación de un componente de la varianza... p { X1-a/2. MS k r k sk . puesto que rf¡ ~ laZ tiene una distribución ji-cuadrada aproximada con r grados de libertad. I (12-39) '! Este resultado sólo puede usarse si f¡~ > O. MS' y MS".a~ . -MSv )2 MS.. donde r = ni ( f¡2 )2 2:-2-' k h ¡=1 1 MS~ o ( MS r +···+MSs -MS .ok = . +--+--+ .!..r Xl-a/2. por ejemplo E(MS')..!.. Para ilustrar este procedimiento.. Ahora bien. MS. es una combinación lineal de múltiplos de los cuadrados medios..!. .61 7.91)2 (2)(3) + (19..2 .8 0.3----'6)'-'-(1_9_.MS ABC)2 r = ----'---------'-=--------'=-'------MS~ MS~c ------'-"''------+ --_----=.28) 2 ( .cna ..12-7 ALGUNOS TEMAS ADICIONALES SOBRE LA ESTIMACIÓN DE LOS COMPONENTES DE LA VARIANZA 545 donde 7:¡ es un efecto fijo y todos los demás efectos son aleatorios.26:5 a. Al utilizar los cuadrados medios esperados de la tabla 12-14..8 es 2 _ MS AB . 12~7. y cuando todas las constantes c¡ de la ecuación 12-41 son positivas.r (4.a) por ciento de una muestra grande para a~ es A2 a o- 2: G¡2 ¡MS¡2 :5 a~ :5 a~ + 2: C ¡=1 i=l Q Q (12-42) .36)(19.8 se encuentra entonces con la ecuación 12-40 de la siguiente manera: :5 a .. a.. se observa que la diferencia en los valores esperados de los cuadrados medios para el efecto de la interacción de dos factores AB y el efecto de interacción de tres factores ABe es un múltiplo del componente de la varianza de interés.975.8' .8 cn A _ 2 = 134...8 .. que puede ser una alternativa muy útil del método de Satterthwaite.26)2 (134. entonces el intervalo de confianza modificado de 100(1 .58 .r X 0... por ejemplo a~ = 2: c¡MS¡ ¡=1 Q (12-41) El método de Satterthwaite funciona bien cuando los grados de libertad de cada cuadrado medio MS¡ son relativamente grandes.4_.2 Método de grandes muestras modificado El método de Satterthwaite de la sección anterior es una forma relativamente simple de encontrar un intervalo de confianza aproximado para un componente de la varianza que puede expresarse como una combinación lineal de cuadrados medios.26)2 (2)(3)(2) 4..X O..28~) -'---------'---'-------'.28 y (MS AB . ? 2 ra..8 :5137. Se encontrará un intervalo de confianza aproximado para a.36 El intervalo de confianza aproximado de 95% paraa.8 Por lo tanto..025.:=-=---(a-1)(b-1) (a-1)(b-1)(c-1) (134.MS ABC a .26 (3)(2) 19.8 . Si todas las constantes c¡ de la ecuación 12-41 son positivas.. la estimación puntual de a. en ocasiones algunas de las c¡ son negativas. Graybill y Wang [51] propusieron un procedimiento llamado método de grandes muestras modificado.< a < 11.8 :5 ..81 -2-- ra. Sin embargo.91-19.91-19.8 "'? Este resultado es consistente con los resultados de la prueba F exacta para a.8' en que hay evidencia sólida de que este componente de la varianza es diferente de cero.. P (12-44) donde VL = 2: 0¡2 ¡=1 P C.28 (3)(2) .Ji. J = IJ Fl-a.. Para una relación completa de estos métodos.fj 2 J a.fj a= II 2 1 Fa. MS¡2 + 2: Hfcf MSf + 2: 2: 0Jc¡cjMS¡MS j=P+1 ¡=1 Q Q j j=P+l + 1 2: 2: G¿c¡c¡MS¡MS¡ i=l P-1 P t>i G.. considere nuevamente el modelo mixto con tres factores del ejemplo 12-7.f¡.f¡.f. Se encontrará un intervalo de confianza inferior aproximado de 95% para 0.1 1 Fa..- 1 Fa.13 es 02 .26 = 19.lXl H.13. donde las constantes C¡ no tienen restricciones sobre el signo.F l-a.f¡.f. EJEMPLO 12~9 . Recuerde que la estimación puntual de 0. referirse al excelente libro de Burdick y Graybill [22].. = 1 . etal [110].f¡.2: ¡=1 P Q C j MS j .13 = MS AB - MS ABe cn = 134.f'] (P-1).J¡.jf7. = 1 .lXl 1 Observe que una variable aleatoria F con un número infinito de grados de libertad en el denominador es equivalente a una variable aleatoria ji-cuadrada dividida por sus grados de libertad.CCJ 1 1 O . 2 h h si P > 1 y O~ = o si P = 1 Estos resultados también pueden extenderse para incluir intervalos de confianza aproximados para cocientes de componentes de la varianza. = ( Fa.546 donde CAPÍTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS G.fj _1)2 F 1[( 0 2F 2 1 _ H a. Considere ahora el caso más general de la ecuación 12-41. dan un intervalo de confianza inferior aproximado de 100(1-a) por ciento paraa~ como L= o~ -. Esto puede escribirse como o~ = 2: c¡MS¡ .ee y 1 H ---¡.+f" oo ) (h + h ) j¡h 2 _ ¡J_i¡ _ _ 1 J_II 02. Para ilustrar el método de grandes muestras modificado.f' 0 . (12-43) j=P+l Ting.91-19. 00)2 . el método tiene ciertas desventajas. La revisión completa del método de máxima verosimilitud sale del alcance de este libro.p a. el método del análisis de varianza es en realidad un método de estimador de momentos.91)2 +(1. Y 1 = FO.91)(19.p es -JV: = 19.(1.054)(1/ 6)(1/ 6)(134.05.6. en particular para el modelo de un diseño experimental.524)2 (3. pero la idea general puede ilustrarse con suma facilidad.12 F 0.J152.12. A la técnica de estimación de parámetros preferida se le llama método de máxima verosimilitud.524 2. una técnica que los especialistas en estadística matemática prefieren en general no usar para estimar parámetros.(0.12 - 1=---1=1. Sin embargo. debido a que resulta con frecuencia en estimaciones de parámetros que no tienen buenas propiedades estadísticas. MS~ + H~ c~ MS~e + G 12 c1c 2 MS AH MS ABe = (0.6.~ G 12 = ( F0.05.fI 12-7 ALGUNOS TEMAS ADICIONALES SOBRE LA ESTIMACIÓN DE LOS COMPONENTES DE LA VARlANZA 547 Por lo tanto.6. 12~7. Soponga quex es una variable aleatoria con una distribución .28-.~ 1 1-~= 0.054 Por la ecuación 12-44 VL = G 12 c.3 Estimación de máxima verosimilitud de componentes de la varianza En este capítulo se ha subrayado el método del análisis de varianza para estimar los componentes de la varianza debido a que es relativamente directo y hace uso de cantidades familiares: los cuadrados medios de la tabla del análisis de varianza.26)2 +(-0. incluyendo la molesta tendencia a producir en ocasiones estimaciones negativas.30 0. pero en cierto sentido el método de máxima verosimilitud selecciona estimaciones de los parámetros que.6.94 Este resultado es consistente con los resultados de la prueba F exacta para este efecto.524)2 (1 / 6)2 (134.3)2 3. para un modelo y una distribución del error especificados.(G)2 p2 1 0.36 Así.1 1 H? = - FO. en la notación de la ecuación 12-43.435 1)2 . La implementación de este método puede ser un tanto complicada.95.05. Una descripción general muy adecuada del método de máxima verosimilitud aplicado a modelos de diseños experimentales se ofrece en Milliken y Johnson [79].36 = 6.12 - (H 2 )2 (3.05. G = 11 C1 = C2 = 1/6. maximiza la probabilidad de ocurrencia de los resultados muestrales.00-1)2 .26) = 152.3)2 (1 /6)2 (19.00 -0. un límite de confianza inferior aproximado de 95% para L= a. Además. 1:22 .. La varianza de cualquier observación es 2 2 2 2 V( Yijk ) =a 2 y =a r +a(3+a r(3+a y las covarianzas son eov(Yijk' Y¡'j'k')= a r +a (3 +a r(3 2 2 2 =a. . Para ilustrar cómo se aplica esto en el modelo de un diseño experimental con efectos aleatorios.. Sea Xl' X 2. i -:1= i'. considere un modelo de dos factores con a = b = n = 2. 548 CAPÍTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS i. es decir.(3 a r2 a r2 ? ? 2 a. El modelo es Yijk = fl+7:¡ +{3j +(7:{3)ij +cijk con i = 1. 2 Y k = 1. 2. j j = j'. -:1= k -:1= k' (12-45) j' j = j' j -:1= j' X Es conveniente considerar las observaciones como un vector 8 1. Entonces la función de verosimilitud de la muestra es I I Observe que ahora la función de verosimilitud es una función únicamente del parámetro desconocido 8. donde 8 es un parámetro desconocido. 8). .11 ~.a (3 =0 i = i'. X n una muestra aleatoria de n observaciones. i -:1= i'. 1:12 Y 1:21 [1: 11 1: 12 ] 1: 21 1: 22 = 1:' 12 son matrices 2 ay 2 2 a r +a (3 +a r(3 = a r2 a r2 2 2 4 x 4 definidas de la siguiente manera: 2 2 1: 11 = 1: 22 a r +a (3 +a r (3 ? aya r2 a r2 a r2 a r2 a2 y 2 2 ? a r +a (3 +a. 2 . i = i'. El estimador de máxima verosimilitud de 8 es el valor de 8 que maximiza la función de verosimilitudL(8). +af¡ +a r (3 2 ay 2 O O a2 a (3 (3 ? 2 O O aa (3 (3 1: 12 = O O a2 a2 (3 (3 2 O O a (3 a 2 (3 . 2.1 de probabilidad/ex. Ym Yll2 Y211 y= Y212 Yl21 Y122 Y221 Y222 y las varianzas y covarianzas pueden expresarse como una matriz de covarianza 8 x 8 1: = donde 1:11 .! 1 . j = 1. Identifica los parámetros del modelo: a. a~/l y aZ. En la tabla 12-17 se presenta la salida de la rutina PROC MIXED de SAS para el experimento del ejemplo 12-2. por sus siglas en inglés). a. La estructura de un modelo aleatorio en el que todas las variables aleatorias son mutuamente independientes es (12-46) donde las 1 son matrices identidad. (La estructura de la covarianza de un modelo puede especificarse en la rutina PROC MIXED con la opción TYPE= stnlcture en el enunciado RANDOM. Estimaciones de los componentes de la varianza y la salida relacionada. Las estimaciones negativas de los componentes de la varianza pueden evitarse en la rutina PROC MIXED especificando el uso del método de máxima verosimilitud restringida (o residual) (REML. Se trata del modelo de un diseño factorial de efectos aleatorios con dos factores. 3.ú' 12-7 ALGUNOS TEMAS ADICIONALES SOBRE LA ESTIMACIÓN DE LOS COMPONENTES DE LA VARlANZA Y}. Estimaciones de los parámetros. Se especificó el método de estimación REML de los componentes de la varianza. Considere primero el ejemplo 12-2. La salida se ha anotado con números para facilitar la descripción que se presenta a continuación: 1. la REML restringe las estimaciones de los componentes de la varianza a valores no negativos.. En esencia. entonces la función de verosimilitud del modelo aleatorio queda como donde jN es un vector N x 1 compuesto de unos. Las estimaciones de máxima verosimilitud de /-l. o~/l y 0 • Observe que la estimación REML de o. que especifica la estructura simple de la covarianza para los parámetros del modelo dados en la ecuación 12-46. También sería deseable restringir las estimaciones de los componentes de la varianza a valores no negativos. a. Parámetro covarianza. 2.12' Entonces cada observación sigue una distribución normal con varianza a ~.21 549 es sólo la transpuesta de }. a~. Son las estimaciones REML de los componentes de la varianza 2 o~.. La estimación de los componentes de la varianza por el método de máxima verosimilitud requiere software de computadora especializado. o./l es cero. El sistema SAS calcula estimaciones de máxima verosimilitud de los componentes de la varianza de modelos aleatorios o mixtos con la rutina SAS PROC MIXED. .. y si se supone que todas las N = abn observaciones tienen una distribución normal conjunta. Por lo tanto. en la práctica la función de verosimilitud se maximizaría sujeta a esta restricción. Se ilustrará el uso de la rutina PROC MIXED aplicándola al modelo factorial de dos factores introducido en los ejemplos 12-2 y 12-3. Algunos paquetes de software de estadística general cuentan con esta capacidad.) La estructura de la covarianza del modelo del ejemplo 12-2 se especifica como TYPE = SIM (el valor por omisión de PROC MIXED). La rutina PROC MIXED del sistema SAS requiere como entrada la matriz de covarianza de los parámetros del modelo. a~./l yaZ son los valores de estos parámetros que maximizan la función de verosimilitud. El método del análisis de varianza ha producido una estimación negativa del componente de la varianza de la interacción. Cociente de la varianza estimada del efecto y la varianza estimada del error residual: 0 2 /0 2 1 4. 696 Akaike's Information Criterion -208.00000000 Estimate 0.00039795 PART 0.7463 0.05 0._~~ .00006632 0.00 0.8637 0.00000000 -0.696 Schwarz's Bayesian Criterion -214.__ ~ ~ .ici\t" .25126446 -0.00000000 -0.~O"'=~ .00039795 -0.'~ ~ ".37376878 0.01062922 10.00000000 0.00000000 0..12616620 rn []] Z Pr [I] > Iz I 0.8832 Standard Deviation Estimate 0.88316339 GJ Std Errors 0.04 7.0000 Variance Estimate 0.38231579 0.03286000 3.6359 1.6388 16.254 -2 REML Log Likelihood 409.00265287 PART*OPERATOR 0.""ª' lJ1 lJ1 o Tabla 12-17 Salida de PROC MIXED del sistema SAS del análisis del estudio de repetibilidad y reproductibilidad de instrumentcis de medición (calibradores) ddJ:.9398 REML Log Likelihood -204.00000000 Residual -0.00107978 0.00000000 -0.05 [Q] Asymptotic Covariance Matrix of Estimates Cov Parm OPERATOR PART PART*OPERATOR Residual OPERATOR 0.00000000 0.60743820 -0.00000000 1.01203539 11.01591791 [j] Model Fitting Information for VALUE Description Value Observations 120.0024 0.00000000 0.0750 3.00006632 11. .00265287 -0.05 0.0000 Alpha W @] Lower Upper -0.i~IDPJo_l)-2 !ltili~ªndo la estimación REML de los componentes de varianza The MIXED Procedure Class Level Information Levels Values 20 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 OPERATOR 3 1 2 3 REPLICAT 2 1 2 Class PART Covariance Parameter Estimates (REML) W [I] Cov Parm OPERATOR PART PART*OPERATOR Residual [I] Ratio 0.3913 .1304 0.0538 0..32 3. 04 7.mate REML Log Likelihood Akaike's lnformat.00000000 1.05 Lower Upper . Tabla 12-18 Salida de PROC MlXED del sistema SAS del análisis del estudio de repetibilidad y reproductibilidad de instrumentos de medición (calibradores) con el operador como efecto fijo utilizando la estimación REML de los componentes de la vatianza The MIXED Procedure Covariance Parameter Estimates (REMU Cov Parm PART PART*OPERATOR Residual Ratio 11.00000000 -0.:::~ 3.6388 16.1304 Asymptotic Covariance Matrix of Estimates Cov Parm PART PART*OPERATOR Residual PART 11.05 0.88316337 Std Error 3.38231693 0.6359 1.8832 0.48 Pr > F 0.00000000 Residual -0.q---= n----____ "7 =e"'"5'O' '"'M':cr.ter.872 409.9398 -204.00000000 Estimate 10.¡:.12616620 Z Pr > Iz I Alpha 0.25126472 0.37376895 0.00000000 0.0024 0.00000000 -0.00000000 0.01591791 Model Fitting lnformation for VALUE Description Observations Variance Estimate Standard Dev.d~".00 0.on -2 REML Log Likelihood Tests of F.00265287 -0.0000 0.729 -211.2401 .729 -207.8637 0.xed Effects Source OPERATOR U1 U1 t-' Value 120.00265287 PART*OPERATOR 0.00000000 0.4572 NDF 2 DDF 38 Type 111 F 1.0000 3.60743876 0.on Criterion Schwarz's Bayesian Cr.on Est.at. 8 14.7 14. Además. Es la matriz de la covarianza para muestras grandes de las estimaciones de los componentes de la varianza.8 13.0 13. el modelo mixto no restringido). Para investigar este supuesto. En el ejemplo 12-3 se consideró el mismo experimento.0 14.0 14.9 14.552 CAPÍTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS 5. la salida incluye una prueba F para el efecto fijo. es 2 COV(Yijk' Yi)'k') = a~ +a. La estimación del componente de la varianza para el factor "pieza" es muy similar a la estimación que se obtuvo utilizando el modelo aleatorio. pero se supuso que los operadores eran un factor fijo. Error estándar de la estimación. j = j' =0 j. k. 9.8 13.a) por ciento para los componentes de la varianza: L= a¡ .é i'. Valor P del estadístico Z calculado.9 14.Za/2se(a¡) U = a¡ +Za/2se(a¡) 10.1 14. La rutina PROC MIXED de SAS puede emplearse para estimar los componentes de la varianza para esta situación.2 14. k = k' =a~+a.t:k' (12-47) = a~ i .8 13. Se obtienen los siguientes datos: Telar 1 2 3 4 5 14.2 13. se eligen cinco telares al azar y se registra su producción en tiempos diferentes. Límites inferior y superior de un intervalo de confianza de la teoría normal para muestras grandes de 100(1 . Se supone que cada telar produce la misma cantidad de tela por minuto. Es el error estándar (se) para muestras grandes de la estimación del parámetro: se(a¡) = ~V( a¡ ). Observe que los resultados de la rutina PROC MIXED de SAS coinciden muy de cerca con los valores presentados en el ejemplo 12-2 cuando el modelo reducido (sin el término de la interacción) se ajustó a los datos. j=j'. suponiendo que todas las variables aleatorias son mutuamente independientes (es decir. La estimación de la varianza del error residual también es similar.t:j' La matriz de la covarianza de los parámetros del modelo es G = [a~I a~I] (12-48) (Esto se especifica en el enunciado TYPE = SIM en la entrada de la rutina PROC MIXED.p +a i = i'.0 Producción (lb/min) 14. Medidas del ajuste del modelo para comparar el ajuste de modelos alternativos.6 13.9 13. lo cual llevó a un modelo mixto.9 13. Matriz asintótica de la covarianza de las estimaciones. S. La estructura de la covarianza de las observaciones. 11. 7. 6.9 13.1 14. j = j'.1 13.6 13. De nueva cuenta se seleccionó el método REML.p i=i'.) En la tabla 12-18 se muestra la salida de la rutina PROC MIXED de SAS para la forma no restringida del modelo mixto del ejemplo 12-3. Nivel alfa usado para calcular el intervalo de confianza.0 . El estadístico Z asociado con la varianza estimada: Z=a¡ /se(a¡). 12~8 PROBLEMAS 12-1. Una fábrica textil tiene un gran número de telares.1 13.0 14.0 14. 80 493.65 a) ¿Existe una variación significativa de la temperatura entre los hornos? Utilizar a = 0. b) Estimar la variabilidad entre los telares.48 23.05.35 488.38 a) ¿Existe una variación significativa en el contenido de calcio de un lote a otro? Utilizar a = 0. e) Analizar los residuales de este experimento y sacar conclusiones acerca de la adecuación del modelo. 524-532) se describe un experimento para investigar la deposición de vapor a baja presión del polisilicio. Texas.65 484. El experimento se llevó a cabo en el reactor de alta capacidad de Sematech en Austin.46 23.52 23.46 23.46 23.29 23.46 23.37 23. El reactor tiene varias posiciones para las obleas.43 2.40 Lote 2 23.34 0. ¿Se satisfacen los supuestos del análisis de varianza? 12-3. e) Estimar.97 1. Se hicieron tres réplicas del experimento y se obtuvieron los siguientes datos: Posición de la oblea 1 2 3 4 2. no. En una fábrica metalúrgica se usan varios hornos para calentar ejemplares de metal.50 479.49 23.59 23.00 491.05.90 477. y se seleccionan al azar cuatro de estas posiciones.36 4.50 Lote 3 23.56 23.19 1. ¿Considera el lector que se satisfacen los supuestos del análisis de varianza? 12-2.64 23. Un fabricante sospecha que los lotes de materia prima suministrados por su proveedor difieren de manera significativa en el contenido de calcio. e) Encontrar un intervalo de confianza de 95 % para a. Se seleccionan al azar tres hornos y se registran sus temperaturas en cargas sucesivas.10 498.39 Lote 5 23.32 23.10 493. b) Estimar los componentes de la varianza de este modelo. + a2 } e) Analizar los residuales de este experimento.25 473.94 Uniformidad 5. + a 2 } d) Analizar los residuales de este experimento.60 471. aunque se sospecha que quizá no sea éste el caso.76 1. La variable de respuesta es la uniformidad del espesor de la película.12-8 PROBLEMAS 553 a) Explicar por qué este experimento es de efectos aleatorios. 2.65 .85 478.05. pp.30 484.42 23. / (a.40 23. ¿Todos los telares tienen la misma producción? Utilizar a = 0. b) Estimar los componentes de la varianza.28 23. d) Encontrar un intervalo de confianza de 95% para a. la varianza del error experimental. 139.37 23. Se supone que todos los hornos operan a la misma temperatura. Se seleccionan cinco de ellos para hacer un estudio.70 1.49 Lote 4 23. En un artículo de Joumal ofthe Electrochemical Society (vol.49 2. Hay un gran número de lotes actualmente en el almacén. Un químico hace cinco determinaciones en cada lote y obtiene los siguientes datos: Lote 1 23.67 1. / (a. Los datos recabados son los siguientes: Horno 1 2 3 Thmperatura 498.39 23.50 490. 12-4.51 23.50 488.47 1.46 23. no.001 Brillantez de la pulpa 74. 12-8. 12-7. b) ¿Qué parte de la variabilidad total de la respuesta uniformidad se debe a la diferencia entre las posiciones en el reactor? e) ¿Hasta qué nivel podría reducirse la variabilidad de la respuesta uniformidad si pudiera eliminarse la variabilidad entre una posición y otra en el reactor? ¿Considera el lector que ésta es una reducción significativa? 12-6. b) Estimar la variabilidad debida al tipo de sustancias químicas. Considere el experimento de la deposición de vapor del problema 12-4. 12-5.05. 111-114) se describe un experimento para investigar los efectos de cuatro sustancias químicas blanqueadoras sobre la brillantez de la pulpa. 13.385 80. b) Estimar la variabilidad debida a las posiciones de las obleas.017 91. a) Estimar la variabilidad total de la respuesta uniformidad. pp. balanceado. + a2 ). Referirse al problema 12-1. Se seleccionaron diez piezas al azar. ¿Qué tamaño de la muestra deberá usarse? 12-9.554 CAPÍTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS a) ¿Hay alguna diferencia en las posiciones de las obleas? Utilizar a = 0.364 82.417 78. d) Analizar los residuales de este experimento y comentar la adecuación del modelo.05.914 80. 2.199 80.208 79. es 4 veces la varianza del error a2 ? b) Si la diferencia entre los telares es lo suficientemente grande para incrementar la desviación estándar de una observación en 20%.522 79.358 77. Se llevó a cabo un experimento para investigar la capacidad o aptitud de un sistema de medición.802 78. y dos operadores escogidos aleatoriamente midieron tres veces cada pieza. En un artículo de Joumal ofQuality Technology (vol. e) Estimar la variabilidad debida al error aleatorio. Los datos son los siguientes: Sustancia química 1 2 3 4 77.596 80.386 a) ¿Existe alguna diferencia en los tipos de sustancias químicas? Utilizar a = 0. a) ¿Cuál es la probabilidad de aceptar Ha si a.346 78.544 77.466 92.306 81.a) por ciento para a2/(a. e) Estimar el componente del error aleatorio. quiere detectarse esto con una probabilidad de al menos 0. d) Analizar los residuales de este experimento y comentar la adecuación del modelo. Desarrollar un procedimiento para encontrar un intervalo de confianza de 100(1 .746 76.80. Considere el modelo de efectos aleatorios.626 77. Las pruebas se hicieron en orden aleatorio y se obtuvieron los siguientes datos: Mediciones del operador 1 2 49 52 50 51 49 50 51 50 51 46 Mediciones del operador 2 3 50 51 50 50 48 50 51 49 50 49 1 50 51 54 48 48 52 51 53 51 46 2 48 51 52 50 49 50 50 48 48 47 3 51 51 51 51 48 50 50 50 49 48 Número de pieza 1 2 3 4 5 6 7 8 9 10 1 50 52 53 49 48 52 51 52 50 47 . Estas cuatro sustancias químicas se seleccionaron al azar de una población grande de agentes blanqueadores potenciales. en una variable.876 73. 2. Usar los supuestos del modelo restringido. Analizar de nuevo el experimento de los sistemas de medición del problema 12-9.. el factor B tiene b niveles. Estimar los componentes apropiados del modelo. Proponer los estadísticos de prueba apropiados para todos los efectos. e y D son aleatorios. Estimar los componentes de la varianza. e y D son factores fijos. Analizar los datos para el caso en queA. ¿Existen pruebas exactas para todos los efectos? Si no es así. incluyendo los cuadrados medios esperados. Suponga que en el problema 5-11 las posiciones en el horno se seleccionaron aleatoriamente. a) Analizar los datos de este experimento. Analizar los datos bajo estas condiciones y sacar conclusiones. desarrollar los cuadrados medios esperados del modelo factorial mixto con dos factores. b) A. los grados de libertad y los cuadrados medios esperados para los siguientes casos. a) ¿Qué tipo de modelo es apropiado? b) Efectuar el análisis y estimar los componentes del modelo. suponga que sólo hay cuatro máquinas de interés. 2. J -1. 12-19.fI 12-8 PROBLEMAS 555 12-10. dando como resultado un experimento con un modelo mixto. B. e) A. e y D son factores aleatorios. Mediante la aplicación del operador valor esperado. d y e del problema 12-19. b) Encontrar estimaciones puntuales de los componentes de la varianza utilizando el método del análisis de varianza. 12-21. las máquinas y los operadores. 12-18. B y e son aleatorios. 12-11. Obtener los cuadrados medios esperados suponiendo un modelo no restringido. Considere el diseño factorial de tres factores del ejemplo 12-6. Estimar los componentes apropiados del modelo. Comparar los resultados obtenidos con los del modelo restringido. :.e Suponiendo que los tres factores son aleatorios. suponga que los tres operadores se seleccionaron al azar. 12-13.b . proponer estadísticos de prueba para los efectos que no puedan probarse directamente. a) A. Suponga que ambos factores son aleatorios. d) A y B son fijos y e y D son aleatorios. Considere nuevamente los datos del problema 5-13. el factor e tiene e niveles. Analizar de nuevo los datos de este experimento bajo este nuevo supuesto. suponiendo que los operadores son un factor fijo. a) Analizar los datos de este experimento. Proponer los estadísticos de prueba apropiados para todos los efectos principales y las interacciones. 12-16. Considere nuevamente los datos del problema 5-6. desarrollar la tabla del análisis de varianza. En el problema 5-17. 12-22. .a . Considere nuevamente los incisos e. e) A es fijo y B. { k= 1. se eligen al azar. Anotar las sumas de cuadrados. B Y e son fijos y D es aleatorio. Puede usarse un paquete de computadora como Minitab. el factor D tiene d niveles y hay n réplicas. B. 12-15. En el problema 5-6. Repetir para el caso en: que A y B son fijos y e es aleatorio. b) Encontrar estimaciones puntuales de los componentes de la varianza utilizando el método del análisis de varianza. pero los operadores se seleccionaron aleatoriamente. 1. Verificar los resultados con los cuadrados medios esperados de la tabla 12-11 para constatar que concuerdan.2. Considere el modelo factorial de tres factores i. Considere un experimento factorial de cuatro factores donde el factor A tiene a niveles. 12-17. Suponga que ambos factores. Considere el experimento del ejemplo 12-7. Puede usarse un paquete de computadora como Minitab. . b) Estimar los componentes de la varianza. Deducir los cuadrados medios esperados de la tabla 12-14. a) Analizar los datos de este experimento. Suponer el modelo restringido para todos los modelos mixtos. 12-12. 12-14. 12-20. Demostrar que el error estándar de la media del factor fijo (por ejemplo. Analizar los datos del problema 12-9. Utilizando este resultado. Invocando los supuestos de normalidad usuales. 12-33. A) es [MSAB/bn]1/2. Comentar la utilidad de este enunciado de probabilidad. 12-26. Encontrar un intervalo de confianza exacto del 95% para aZ.2. ¿puede probarse alguno de los efectos? Si las interacciones de tres facto. Resolver de nuevo el problema 12-32 utilizando el método de grandes muestras modificado que se describe en la sección 12-7. Si todos los factores son aleatorios. Determinar la potencia de la prueba para detectar un efecto de la máquina tal que a~ = aZ. Usar el experimento descrito en el problema 5-6 y suponer que ambos factores son aleatorios. b) Encontrar intervalos de confianza aproximados del 95 % para los otros componentes de la varianza utilizando el método de Satterthwaite. donde a~ es el componente de la varianza del factor máquina. Construir intervalos de confianza aproximados del 95% para los otros componentes de la varianza utilizando el método de Satterlhwaite. Considere el experimento de tres factores del problema 5-17 y suponga que los operadores se seleccionaron al azar. ¿Son suficientes dos réplicas? En el análisis de varianza del modelo mixto de dos factores.. 12-31. 12-25. a) Encontrar un intervalo de confianza exacto del 95% para aZ.p para i . Resolver de nuevo el problema 12-30 utilizando el método de grandes muestras modificado que se describe en la sección 12-7. &. Considere el modelo mixto de dos factores. suponga que tanto las máquinas como los operadores se escogieron al azar. (r"f3)j]l = -(l/a) a. res y (r:f3h no existen. 12-29. Encontrar un intervalo de confianza aproximado del 95 % para el componente de la varianza del operador. escribir un enunciado para la probabilidad de que < Oen un análisis de varianza de un factor. Considere los componentes de la varianza del modelo aleatorio del problema 12-9. Comparar las dos series de intervalos de confianza obtenidas y comentarlas. suponiendo que los operadores son fijos y utilizando tanto la forma no restringida como la restringida de los modelos mixtos. Comparar los resultados que se obtienen con los dos modelos. Demostrar que el método del análisis de varianza siempre produce estimaciones puntuales insesgadas de los componentes de la varianza en cualquier modelo aleatorio o mixto. Comparar este intervalo de confianza con el que se obtuvo anteriormente y comentarlo.t+r: i +f3¡ +Yk +(r:f3)ij +(f3Y)¡k +(r:Y)ik +(r:f3Y)ijk +8ijk 12-24.: i'.2. 12-30. . 12-27.556 CAPÍTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS 12-23. El modelo factorial de tres factores para una sola réplica es Yijk = ¡. demostrar que Cov[(r:f3)jj. 12-28. ¿es posible probar todos los demás efectos? En el problema 5-6. 12-34. 12-32. encontrar una expresión para la probabilidad de obtener una estimación negativa de un componente de la varianza por el método del análisis de varianza. los niveles de uno de los factores (por ejemplo el factor B) son similares pero no idénticos a los diferentes niveles de otro factor (por ejemplo A). entonces el lote 1 se referiría siempre al mismo lote.Diseños anidados y de parcelas subdivididas En este capítulo se introducen dos importantes tipos de diseños experimentales: el diseño anidado y el diseño de parcelas subdivididas. 3 y 4 para el proveedor 1. el lote 2 del proveedor 1 no tiene relación con el lote 2 de cualquier otro proveedor. Para subrayar el hecho de que los lotes de cada proveedor son diferentes.1 DISEÑO ANIDADO DE DOS ETAPAS En algunos experimentos con factores múltiples. y 9. Por ejemplo. Si los niveles del factor pueden numerarse arbitrariamente como en la figura 13-2. 7 Y8 para el proveedor 2. Estos dos diseños encuentran una aplicación razonablemente generalizada en el uso industrial de los experimentos diseñados. 13. no es éste el caso. 6. se pueden numerar como 1. y se harán tres determinaciones de la pureza en cada lote. considere una compañía que compra su materia prima a tres proveedores diferentes. etcétera. por lo que algunos de los conceptos introducidos en el capítulo 12 tendrán cabida aquí. ya que los lotes de cada proveedor son únicos para ese proveedor particular. A primera vista se podría preguntar por qué no es un experimento factorial. como se muestra en la figura 13-2. con los lotes anidados bajo los proveedores. En ocasiones quizá no se sepa si un factor está cruzado en un arreglo factorial o anidado. Se trata de un diseño anidado de dos etapas. el lote 1 del proveedor 1 no tiene relación con el lote 1 de cualquier otro proveedor.10. 2. el lote 2 se referiría siempre al mismo lote. Es decir. La situación se describe en la figura 13-1.. etcétera. Evidentemente. Hay cuatro lotes de materia prima disponibles de cada proveedor. La compañía quiere determinar si la pureza de la materia prima de cada proveedor es la misma. A un arreglo como éste se le llama diseño anidado o jerárquico. Con frecuencia incluyen también uno o más factores aleatorios. 5. 557 . con los niveles del factor B anidados bajo los niveles del factorA.11 Y12 para el proveedor 3. entonces el factor está anidado. Si fuera un experimento factorial. y una suma de cuadrados debida al error. Si los errores son NID(O. .Yi.Y.=1 a b n a b n (13-2) Al desarrollar el miembro derecho de la ecuación 13-2. Simbólicamente. . ya que hay el mismo número de niveles de B con cada nivel deA y el mismo número de réplicas.=1 i=1 i=1 abn a ah abn (13-3) ya que los tres términos con productos cruzados son cero.. Observe que abn -1 = (a -1) + a(b -1) + aben -1). se usa el subíndice (ij)k para el término del error. .. ci).. . )2 + 2:2:2: (Yijk . )+(Yij. . 2. . n (13-1) Es decir.... una suma de cuadrados debida al factor B bajo los niveles deA. Se trata de un diseño anidado balanceado. La suma de cuadrados total corregida puede escribirse como 2:2:2: (Yijk .. 2. )+(Yijk . . b . La ecuación 13-3 indica que puede hacerse la partición de la suma de cuadrados total en una suma de cuadrados debida al factor A. 13~ 1.Yij.+{3j(i)+S(ij)k j=l.y. por lo tanto. {k = 1. El subíndicej(i) indica que el nivelj-ésimo del factor B está anidado bajo el nivel i-ésimo del factorA. Puesto que no todos los niveles del factor B aparecen dentro de todos los niveles del factor A.Y.. )]2 j=1 k=1 j=1 k=1 i=1 .1 Análisis estadístico El modelo estadístico lineal para el diseño anidado de dos etapas es i = 1.Yij. 2. a Yijk=¡t+'i.558 CAPÍTULO 13 Proveedores Lotes DISEÑOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS Observaciones {Y'" Y121 Yl3l Y132 Y141 Y 211 ~ ~ Y221 Y231 Y241 Y311 Y321 Y331 Y341 Y222 Y232 Y242 Y312 Y322 Y332 Y342 Y223 Y 233 Y243 Y313 Y323 Y333 Y343 y 112 Y122 Y142 Y 212 Y 213 Y 113 Y123 Y133 Y143 Figura 13·1 Diseño anidado de dos etapas. a -1 grados de libertad para SSA' a(b -1) grados de libertad para SSB(A) y aben -1) grados de libertad para el error.)2 j=1 k=1 j=1 j=1 k=1 i=1 .. Resulta conveniente considerar que las réplicas están anidadas dentro de la combinación de los nivelesdeA y B. )2 + n 2:2: (Yij. se obtiene 2:2:2: (Yijk .y'. )2 = 2:2:2: [(Yi. la ecuación 13-3 puede escribirse como SST = SS A + SSB(A) + SSE (13-4) Hay abn -1 grados de libertad para SSr.. . no puede haber interacción entre A y B. y n réplicas. cada una de las sumas de cuadrados del miembro derecho de la ecuación 13-4 Proveedores Lotes Figura 13·2 Disposición alternativa del diseño anidado de dos etapas. )2 = bn 2: (Yi.. haya niveles del factor A.. b niveles del factor B anidados bajo cada nivel deA.y. estos cuadrados medios esperados suponen la forma restringida del modelo del capítulo 12. -Yi. ·Ho:a. En la tabla 13-1 se muestran los cuadrados medios esperados para estas situaciones.y.) y que f3j(i) es NID(O. a.f .. De manera alternativa.. = Ose prueba con MSA/MS E y H o:f3j(. se supone que ~.=1 j=l k=l a b 11 Tabla 13-2 Tabla del análisis de varianza para el diseño anidado de dos etapas Fuente de variación Suma de cuadrados Grados de libertad Cuadrado medio A B dentro deA Error Total bn¿ e Y.." -Y. y la suma de los efectos del tratamiento B es cero dentro de cada nivel deA.~k .. .=1 Ti = Oy ~~=1 f3j(1) = O(i = 1.abn 2 . La tabla 13-1 indica que si los niveles deAy B son fijos. _bn LJ y¡. Para el modelo mixto.f 2:2:2: (Yijk -YijY 2:2:2: (Yijk . n . A 1=1 1=1 J=l /l SS 1 =_" 2_~ ~ Yi.=1 j=l 2 SST = Y. Ho:T. Los cuadrados medios esperados pueden determinarse aplicando directamente las reglas del capítulo 12..) = O se prueba con MSB(A/MSE • Si A es un factor fijo y B es aleatorio. se supone que T¡ es NID(O. como se muestra en la tabla 13-2.=1 j=l k=l a b 1 a .. = Ose prueba con MSA/MSB(A) y Ho:a~ = Ocon MSB(A/MSE • El procedimiento de prueba se resume en la tabla del análisis de varianza. f a-l a(b -1) ab(n-l) abn-l n¿2: (Yij. 2:2:2: Yijk . siA y B son aleatorios. También es frecuente encontrar modelos mixtos conA fijo y B aleatorio. Las fórmulas para calcular las sumas de cuadrados se obtienen desarrollando las cantidades de la ecuación 13-3 y simplificando.2..2:2: Y~. a~). la suma de los efectos del tratamiento A es cero. Los estadísticos apropiados para probar los efectos de los factores A y B dependen de siA y B son fijos o aleatorios. Éstas son abn 1 a l a b 2 'SS B(A) = _ _ " 2 n" LJ " ~ yij. si tantoA comoB son factores aleatorios... entonces Ho:T¡ = O se prueba con MSA/MSB(A) y Ho:a~ = Ose prueba con MSB(A/MSE • Por último.. a 2 bn (13-5) (13-6) (13-7) (13-8) 1=1 b SSE = 2:2:2: Y.¡J 13-1 DISEÑO ANIDADO DE DOS ETAPAS 559 Tabla 13-1 E(MS) Cuadrados medios esperados en el diseño anidado de dos etapas A fijo B fijo A fijo B aleatorio A aleatorio B aleatorio puede dividirse por sus grados de libertad para obtener cuadrados medios con una distribución independiente tales que el cociente de dos cuadrados medios cualesquiera se distribuye como F. Es decir. a). Si los factoresAy B son fijos. 69= 15. 2 -2 -3 --4 -9 3 -2 O 1 -1 4 1 4 O 5 1 1 -2 -3 2 O 4 2 6 3 -1 O -2 -3 4 4 1 2 4 O 6 O 3 2 2 -2 O 2 --4 5 O 14 3 1 -1 2 2 4 3 2 1 6 Yi. sumados en todos los niveles de A.(13)2 (4)(3) 36 = 19.75 y SSE = 2:2:2: i=l j=l k=l abn? 1ab n i=l j=l = 153.75-4. 2: Y~.. Las sumas de cuadrados se calculan de la siguiente manera: SST = 2:2:2: i=l j=l k=l a b n 2 Yijk - Y.00. lo cual ocasiona problemas en la manufactura del producto terminado. desde luego.92 ~ [(0)2 +(_9)2 +(_1)2 + . y se hacen tres determinaciones de la pureza en cada lote. abn 2 = 153..31 36 1 a 2 SS =_ ~ y2_~ A bn~ . La pureza de esta materia prima varía considerablemente.89. Se trata.33 Yijk .00.06 SS B(A) 1~~ =_ 1=1 J=l a b n LJ LJ 2 __ Yij... abn 1=1 = _1_[(_5)2 +(4)2 +(14)2].~ Esto expresa la idea de que SSB(A) es la suma de cuadrados entre los niveles de B para cada nivel deA.93) Proveedor 3 Proveedor 2 1 1 -1 O O Totales de los lotes Totales de los proveedores Yij. Los datos.jk Proveedor 1 Lotes pureza .67 = 63. = Tabla 13-3 Datos codificados de la pureza del ejemplo 13-1 (Codificación: Y. Considere una compañía que compra materia prima en lotes de tres proveedores diferentes..i Se observa que la ecuación 13-6 para puede escribirse como SSB(A) = 2: [1 -.. después de codificarlos restando 93. a b 1=1 J=l l] . 560 CAPÍTULO 13 DISEÑOS ANIDADOS Y DE PARCELAS SUBDMDIDAS SSB(A) .. 1 a ~ bn LJ 1=1 2 Yi. se muestran en la tabla 13-3.75= 69. de un diseño anidado de dos etapas. Se seleccionan al azar cuatro lotes de materia prima de cada proveedor. -5 . Quiere determinarse si la variabilidad de la pureza es atribuible a las diferencias entre los proveedores..67-19.(13)2 = 148. EJEMPLO 13~1 ..- 2:2: Y~. +(2)2 +(6)2 ]-19. = 3 = 89. 42 0. Sin embargo.53 8. puede calcularse una suma de cuadrados debida a los lotes y una suma de cuadrados de interacción.02 En la tabla 13-4 se resume el análisis de varianza. pero su efecto está enmascarado por la interacción significativa. por lo que los cuadrados medios esperados se obtienen de la columna de en medio de la tabla 13-1 y se repiten por conveniencia en la tabla 13-4. Por ejemplo.77 2.64 1.13-1 DISEÑO ANlDADO DE DOS ETAPAS 561 Tabla 13-4 Análisis de varianza de los datos del ejemplo 13-1 Fuente de variación Proveedores Lotes (dentro de los proveedores) Error Total Suma de cuadrados 15. lotes aleatorios) Fuente de variación Proveedores (S) Lotes (B) Interacción S x B Error Total Suma de cuadrados 15. se concluiría que no hay ningún efecto significativo sobre la pureza debido a los proveedores.03 .64 Cuadrado medio esperado a + 3a~ + a2 .02 3.94 Valor P 0.64 44. -2 y 16.28 63. Observe lo que habría pasado si se hubiera hecho un análisis incorrecto de este diseño como un experimento factorial de dos factores.97 2. Si ésta es resultado de las diferencias entre los proveedores.04 0. Sin embargo. El objetivo del experimentador es encontrar la fuente de la variabilidad en la pureza de la materia prima. esa solución no es aplicable aquí porque la principal fuente de variabilidad es la variación de la pureza de un lote a otro dentro de los proveedores.53 7.31 Grados de libertad 2 3 6 24 35 Cuadrado medio 7. pero la pureza de los lotes de materia prima del mismo proveedor difieren significativamente. -3. el problema debe atacarse trabajando con los proveedores para reducir su variabilidad de un lote a otro. Por lo tanto. Esto puede implicar modificaciones en los procesos de producción de los proveedores o en su sistema interno de control de calidad. El análisis de varianza factorial completo se muestra en la tabla 13-5.80 Valor P 0. suponiendo un modelo mixto.33 148. es difícil ofrecer una interpretación práctica de la interacción lotes x proveedores.06 25. Por el examen de los valores P.55 7.42 0. se obtienen los totales de los lotes de 2.92 63.06 69. + 3a~ a2 6¿ . Este análisis indica que los lotes difieren significativamente y que hay una interacción significativa entre los lotes y los proveedores. la interacción significativa aunada al efecto no significativo del proveedor podría llevar al analista a concluir que los proveedores en realidad difieren.31 Grados de libertad 2 9 24 35 Cuadrado medio 7.33 148. ¿esta interacción significativa quiere decir que el efecto del proveedor no es constante de un lote a otro? Además.24 2. Si se considera que los lotes están cruzados con los proveedores. Tabla 13-5 Análisis de varianza incorrecto del diseño anidado de dos etapas del ejemplo 13-1 como un diseño factorial (proveedores fijos. Las implicaciones prácticas de este experimento y del análisis son muy importantes. Los proveedores son fijos y los lotes aleatorios. el problema puede resolverse seleccionando al "mejor" proveedor. donde cada celda lote x proveedores contiene tres réplicas. Por lo tanto.38 2.-¡ Fo 0. 97 2. por lo que en la notación que se usa aquí.94 0. Recuerde que el símbolo Q[1] es un término cuadrático que representa el efecto fijo de los proveedores. En ocasiones no se cuenta con un programa de computadora especializado para analizar diseños anidados.. Los grados de libertad poseen una propiedad similar. En la tabla 13-6 se presenta la salida del procedimiento Balanced ANOVA (análisis de varianza balanceado) de Minitab (utilizando el modelo restringido).28= 69.=1 resultado que concuerda con el que se presenta en el algoritmo tabular de la tabla 13-4. SSB +SSSXB = 25.528 7. Tabla 13-6 Salida de Minitab (Balanced ANOVA) [análisis de varianza balanceado] para el ejemplo 13-1 Análisis de varianza (diseños balanceados) Factor Type Levels Values Supplier fixed 3 1 Batch(Supplier) random 4 1 Analysis of Variance for Purity Source Supplier Batch(Supplier) Error Total Source' 2 2 3 3 4 DF 2 9 24 35 SS 15. a-1 Por lo tanto. es decir.64+44. Q[1]=~ ! ~. / T.917 63.=l (3-1) = 6L. al comparar las tablas 13-4 y 13-5. --+-------3 6 Lotes Lotes x Proveedores Lotes dentro de los proveedores 9 Por lo tanto. Sin embargo. el término del efecto fijo en el cuadrado medio esperado de Minitab para los proveedores 12Q[1] = 12L.562 Cálculos CAPÍTULO 13 DISEÑOS ANIDADOS Y DE PARCELAS SUBDMDIDAS Algunos paquetes de software de estadística realizarán el análisis de un diseño anidado. 71 O 3 (3) 3 Error 2. que T.92= SSB(S) Es decir.416 0.056 69.017 Variance Error Expected Mean Square for Each Term component term (using restricted model) (3) + 3(2) + 12Q[1J 1 Supplier 2 (3) + 3(2) 2 Batch(Supplier) 1.639 F P 0. observe.639 .333 148. la suma de cuadrados de los lotes dentro de los proveedores se compone de la suma de cuadrados de los lotes más la suma de cuadrados de la interacción lofes x proveedores. Minitab también reporta los cuadrados medios esperados en la parte inferior de la tabla 13-6. un programa de computadora para analizar diseños factoriales podría usarse también para analizar diseños anidados agrupando el "efecto principal" del factor anidado y las interacciones de ese factor con el factor bajo el que está anidado.306 MS 7. Los resultados numéricos concuerdan con los cálculos manuales reportados en la tabla 13-4.769 2. 00 -1.. son los promedios de los lotes individuales. __ = Yij.00 2.Y.33 -1.00 -3.67 -1. a). Por lo tanto. ..33 0. oo. ..00 -1.. .67 0.00 -3.00 -1..33 -0.67 1. Para el diseño anidado de dos etapas. - Yi.33 1.33 -0.00 -0.Yi.00 0.00 0.67 1. = Yi.67 1.00 0..00 0.00 1.00 -3.00 .67 -2.00 1.00 0.Y.67 1.33 -1.33 1.2 Verificación del diagnóstico La herramienta principal para verificar el diagnóstico es el análisis residual. A Y.00 -1..67 1.00 -1. el valor ajustado es Yij..00 1.00 0.00 2.. Las observaciones.00 -1..33 0.67 2.33 2.33 -1. i = 1.00 -1.00 -1. los residuales son El valor ajustado es Yijk = ¡l+f +13 j (i) i y si se establecen las restricciones usuales sobre los parámetros del modelo (2: i f i 2. · Por consiguiente.00 1.13·1 DISEÑO ANIDADO DE DOS ETAPAS 563 13~1.00 2. +(_ Yi.67 -1. los residuales del diseño anidado de dos etapas son (13-9) donde Yij. _ )+(_ _) = Yij..67 2. f i = Oy 2: j 13 j(i) = O. 0.67 2. entonces jl = Y.33 -0.33 -0. los valores ajustados y los residuales para los datos de la pureza del ejemplo 13-1 son: Valor observado Yijk 1 -1 O -2 -3 -4 -2 O 1 1 4 O 1 -2 -3 O 4 2 -1 O -2 O 3 2 2 Valor ajustado Yijk = Yij. ' y 13j(i) Yijk . 67 1.00 -2. incluyendo las gráficas de probabilidad normal. o I o o .00 -1. la verificación de puntos atípicos y la graficación de los residuales contra los valores ajustados. 2 Proveedor • 3 o bl Gráfica de los residuales contra el proveedor Figura 13-3 Gráficas de los residuales del ejemplo 13-1. 3 o o o o o o o o o o o o 2 .00 0. 2.33 1. .00 0.67 0. "O ~ o o o o o o o -1 o o • o o -2 -3 -2 -1 Valores predichos al Gráfica de los residuales contra los valores predichos 32- .~ c:: O o -11- o o o o - -21- I 1 . Como una ilustración.¡¡.00 0.67 2.!!! 1 ro :::l '" o • o .00 0.00 0.67 0. en la figura 13-3 se grafican los residuales contra los valores ajustados y contra los niveles del factor proveedor. • o o o - • ro :::l "O o ¡¡j1- o o o .564 CAPÍTULO 13 DISEÑOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS Valor observado Yijk 4 O -2 O 2 1 -1 2 3 2 1 Valor ajustado Yijk = 2..00 Pueden realizarse ahora las verificaciones de diagnóstico usuales.00 0.00 2.00 0.00 -2.00 2.00 2.00 2.33 -1.00 Yij. lla variabilidad dentro de los lotes es la misma para todos los proveedores? Se ha supuesto de hecho que éste es el caso. Por los cuadrados medios esperados de la última columna de la tabla 13-1. y si no es cierto desde luego que nos gustaría saberlo.. Por ejemplo. _ _ _ Y. el método del análisis de varianza puede usarse para estimar los componentes de la varianza a~ ya.77. La gráfica de los residuales contra los proveedores de la figura 13-3b es una manera simple pero eficaz de verificar este supuesto. Puesto que la dispersión de los residuales es aproximadamente la misma para los tres proveedores. ... Se obtiene así cr y f¡2 = MSB(A) . Éste es el caso para el problema descrito en el ejemplo 13-1.MS E = 7. Los efectos de los proveedores pueden estimarse con -5 13 -28 i 1 = Yi. se obtiene cr. se concluiría que la variabilidad en la pureza de un lote a otro es aproximadamente la misma para los tres proveedores.3 Componentes de la varianza Para el caso de efectos aleatorios. (13-10) a y ~2 f3 =--'---'---11 MSB(A) -MS E (13-11) ~? MS A -MSB(A) a-=----------'------' " bl1 (13-12) En muchas aplicaciones de diseños anidados interviene un modelo mixto. = 12 - _ Para estimar los componentes de la varianza y a~. se elimina la línea de la tabla del análisis de varianza relativo a los proveedores y se aplica el método de estimación del análisis de varianza a las dos líneas siguientes. = 12 . los proveedores (factorA) son fijos. con el efecto principal (A) fijo y el factor anidado (B) aleatorio. = 12 14 4 13 36 13 36 = 36 = 36 29 -1 ~ í 3 = h.Y. ya que tiene un impacto práctico considerable sobre la interpretación de los resultados del experimento. el análisis de varianza ha indicado que la pureza media de los tres proveedores no difiere pero que hay una variabilidad estadísticamente significativa de un lote a otro (es decir..64 = 1..2. . y los lotes de materia prima (factor B) son aleatorios. las gráficas de los residuales son particularmente útiles debido a la información de diagnóstico adicional que contienen. a~ > O).Y..71 3 f3 11 . 13~ 1.36 = 36 ~ í 2 = h. Pero.i] 13-1 DISEÑO ANIDADO DE DOS ETAPAS 565 En la situación de un problema como el que se describe en el ejemplo 13-1. 13~2 DISEÑO ANIDADO GENERAL DE m ETAPAS Los resultados de la sección 13-1 pueden extenderse fácilmente al caso de m factores completamente anidados. Se planea tomar cinco muestras por lote. se sabe que T:¡ no difiere significativamente de cero. Por lo tanto. Smith y Beverly [104] y Nelson [88a. mientras que el componl(nte de la varianza a~ es mayor que cero. se seleccionan dos lingotes al azar de cada hornada para probarlos. 40 grados de libertad para las muestras y 50 grados de libertad para las mediciones. y se hacen dos mediciones de la dureza en cada lingote. La situación se ilustra en la figura 13-5. Etapa 2 Etapa 3 Figura 13·4 Diseño anidado escalonado de dos etapas. una de ellas se mide dos veces. En la figura 13-4 se muestra un ejemplo de un diseño anidado escalonado. Observe que sólo se toman dos muestras de cada lote. b. puede terminarse con muchos grados de libertad (quizá demasiados) en las etapas inferiores. ver Bainbridge [5]. se trata de un diseño anidado de tres etapas con dos réplicas.4 Diseños anidados por etapas Un problema potencial en la aplicación de los diseños anidados es que en ocasiones para obtener un número razonable de grados de libertad en el nivel más alto. Esto resulta en 9 grados de libertad para los lotes. la etapa superior). suponga que se están investigando las diferencias potenciales en el análisis químico entre diferentes lotes de material. y cada muestra se medirá dos veces. entonces 10 lotes no sería una elección irrazonable. suponga que una fundición quiere investigar la dureza de dos formulaciones diferentes de una aleación de metal. y los lingotes están anidados bajo los niveles del factor hornada.. y todas las etapas inferiores tendrán exactamente a grados de libertad. 13~1. entonces habrá a -1 grados de libertad para los lotes (o.566 Etapa 1 CAPÍTULO 13 DISEÑOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS Lote 1 . En este experimento. . en general. Estos resultados se muestran también en la parte inferior de la salida de Minitab de la tabla 13-6. así como el material suplementario del texto de este capítulo.. Por el análisis del ejemplo 13-1. A este diseño se le llamaría diseño anidado de m etapas. Se preparan tres hornadas de cada formulación de la aleación. Como un ejemplo. las hornadas están anidadas bajo los niveles del factor formulación de la aleación. mientras que la otra una sola vez. Para más información sobre el uso y el análisis de estos diseños. c]. Para ilustrar. Si haya lotes. Si quiere estimarse un componente de la varianza para los lotes. Una manera de evitar esta situación es usar un tipo particular de diseño anidado no balanceado llamado diseño anidado por etapas. b e 11 (13-13) 000' Para el ejemplo tratado aquí. k { = 1. 000' a 000' o . T:i es el efecto de la formulación de la aleación i-ésima.. . . f3j (i) es el efecto de la hornadaj-ésima dentro de la aleación i-ésima.2. Yk(ij) es el efecto del lingote k-ésimo dentro de la hornada Variabilidad de la formulación de la aleación Variabilidad de una hornada a otra Variabilidad de la prueba analftica Dureza media Dureza observada Figura 13-6 Fuentes de variación en el ejemplo del diseño anidado de tres etapas. 1= 1. e"" Y1121 Y1211 Y'221 Y 1311 Y1321 Y1112 Y1122 Y1212 Y'222 Y 1312 Y'322 El modelo para el diseño anidado general de tres etapas es i=1' 2.2. j= 1.2.13-2 DISEÑO ANIDADO GENERAL DE m ETAPAS Formulación de la aleación 567 Hornadas Lingotes Observaciones Figura 13·5 Diseño anidado de tres etapas. . Por ejemplo. 02) usual. -y. j I a-1 a(b -1) ab(e -1) abe(n-1) aben -1 MSA MSB(A) MSC(B) MS E en 2:2: (h..TI II I I 568 CAPÍTULO 13 DISEÑOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS Tabla 13-7 Análisis de varianza del diseño anidado de tres etapas Fuente de variación Suma de cuadrados Grados de Cuadrado libertad medio A B (dentro deA) ben2: (511 . si el componente de la varianza de la formulación de la aleación es grande.. el análisis de varianza del diseño anidado de tres etapas se resume en la tabla 13-7. La extensión de este modelo a In factores es directa. El cálculo de las sumas de cuadrados y el análisis de varianza del diseño anidado de In etapas son similares al análisis presentado en la sección 13-1. Observe que son una extensión simple de las fórmulas para el diseño anidado de dos etapas. Tabla U-S Derivación de los cuadrados medios esperados para un diseño anidado de tres etapas con A y B fijos y e aleatorio F F R e k e e a Factor T¡ b j i R n l n n n 1 Cuadrado medio esperado O 1 1 1 b a-+na-+ y ? ? ben Ti a-1 2: f3 j(l) Yk(ij) c/U. Para determinar los estadísticos de prueba apropiados deben encontrarse los cuadrados medios esperados empleando los métodos del capítulo 12.y. Muchos paquetes de software de estadística realizarán los cálculos. Este ejemplo demuestra la manera en que se usa frecuentemente el diseño anidado en el análisis de procesos para identificar las principales fuentes de variabilidad en la salida. Observe que en el ejemplo anterior la variabilidad global de la dureza constó de tres componentes: uno que resultó de las formulaciones de las aleaciones. j j k (Yijk/ -Yijk. y E(ijk)/ es el término del error NID(O..f 2:2:2:2: i j k I 2:2:2:2: ¡ j (Yljkl -y. Estos componentes de la variabilidad en la dureza global se ilustran en la figura 13-6. entonces los cuadrados medios esperados pueden derivarse como se indica en la tabla 13-8.k) O 1 1 a 2+ nay 2+ en 2:2: f3~(i) a(b -1) 1 1 2 a 2 + naY a? .. En esta tabla se muestran también las definiciones de las sumas de cuadrados. -y. si los factores A y B son fijos y el factor e es aleatorio. Por ejemplo. j I j e (dentro de B) Error Total n2:2:2: ¡ (Yijk. j k I j-ésima y la aleación i-ésima. entonces esto implica que la variabilidad global de la dureza podría reducirse utilizando únicamente una de las formulaciones de la aleación.. otro que se generó de las hornadas y uno más que salió del error de la prueba analítica. Por ejemplo.. En esta tabla se indican los estadísticos de prueba apropiados para esta situación. los cuatro operadores escogidos para el arreglo 1 son diferentes de los cuatro para el arreglo 2. En este experimento. es difícil usar los mismos cuatro operadores para cada arreglo del sitio de trabajo. Asimismo.2. y los operadores se escogen al azar. (rY)¡kU) es la interacción dispositivo x operadores dentro del arreglo del sitio de trabajo. (rf3)ij es la interacción dispositivo x arreglo del sitio de trabajo. Se necesitan operadores para realizar el ensamblaje.. Los tiempos de ensamblaje se miden en segundos y se muestran en la tabla 13-9. tampoco puede haber ninguna interacción dispositivo x arreglo del sitio de trabajo x operador. f3j es el efecto del arreglo del sitio de trabajo j-ésimo.jk. se trata de un modelo mixto. YkU) es el efecto del operador k-ésimo dentro del nivelj-ésimo del arreglo del sitio de trabajo. los operadores están anidados dentro de los niveles de los arreglos del sitio de trabajo.2 (13-14) k=1. j Tabla 13-9 Operador Datos del tiempo de ensamblaje del ejemplo 13-2 Arreglo 1 1 22 24 30 27 25 21 149 2 23 24 29 28 24 22 150 619 3 28 29 30 32 27 25 171 4 25 23 27 25 26 23 149 1 26 28 29 28 27 25 163 Arreglo 2 2 27 25 30 27 26 24 159 633 3 28 25 24 23 24 27 151 4 24 23 28 30 28 27 160 1252 == y. algunos factores pueden estar incluidos en un arreglo factorial y otros estar anidados. 404 447 401 Dispositivos 1 Dispositivos 2 Dispositivos 3 Totales de los operadores.3. Un ingeniero industrial estudia la inserción manual de componentes electrónicos en tarjetas de circuitos impresos a fin de mejorar la rapidez de la operación de ensamblaje. Las combinaciones de tratamientos de este diseño se corren en orden aleatorio y se obtienen dos réplicas. Por lo tanto.3 j= 1. El estadístico de prueba apropiado para cualquier efecto o interacción puede encontrarse inspeccionando esta tabla.j. El análisis estadístico de un diseño así con tres factores se ilustra en el ejemplo siguiente. Ha diseñado tres dispositivos de ensamblaje y dos arreglos del sitio de trabajo que parecen prometedores. Esto produce el análisis de un modelo mixto restringido. EJEMPLO 13~2 . Y. y é(ijk)[es el término del error usual. mientras que los dispositivos y los arreglos del sitio de trabajo están incluidos en un factorial.2.13-3 DISEÑOS CON FACTORES ANIDADOS Y FACTORIALES 569 13~3 DISEÑOS CON FACTORES ANIDADOS Y FACTORIALES En experimentos con factores múltiples.... El modelo lineal para este diseño es i=1.. este diseño tiene factores anidados y factoriales. Totales de los arreglos. En ocasiones a estos diseños se les llama diseños factoriales-anidados. Y. y se decide seleccionar aleatoriamente cuatro operadores para cada combinación dispositivo-arreglo del sitio de trabajo.. debido a que los sitios de trabajo se encuentran en diferentes puntos dentro de la planta. Por lo tanto. Sin embargo.4 1= 1. En la tabla 13-10 se derivan los cuadrados medios esperados utilizando el algoritmo tabular del capítulo 12. Yi. Puesto que sólo hay tres dispositivos y dos arreglos del sitio de trabajo.2 donde r¡ es el efecto del dispositivo i-ésimo. . Observe que no puede existir ninguna interacción arreglo del sitio de trabajo x operador porque no todos los operadores usan todos los arreglos del sitio de trabajo. 58 <0.08 71.15 1.91 19. suponiendo la forma restringida del modelo mixto. Por lo tanto.33 Fa 7. análisis de varianza balanceado). O (L) Suma de cuadrados 82. Cálculos Hay varios paquetes de software de estadística que analizan con facilidad diseños factoriales-anidados. la atención debería centrarse en los dispositivos tipo 1 y 3.52 5.04 65. Los cuadrados medios esperados de la parte inferior de la tabla 13-12 concuerdan con los que se derivaron con el método tabular de la tabla 13-10.49 2.00 299. respectivamente.04 FL FO(L) Error Total . los dispositivos.36 Valor P 0.73 2.22 0.99 9. para el ejemplo 13-2. Q[3] YQ[4] son los efectos del factor fijo para los arreglos del sitio de trabajo.) Además.333 Tabla 13-11 Análisis de varianza del ejemplo 13-2 Fuente de variación Dispositivos (F) Arreglos (L) Operadores (dentro de los arreglos). (Observe que los totales de los dispositivos de la tabla 13-9 son menores para los tipos 1 y 3 que para el tipo 2.576 Error: a 2 = 2. En la tabla 13-12 se presenta la salida de Minitab (Balanced ANOVA. Está presente también una interacción significativa entre los dispositivos y los operadores dentro de los arreglos del sitio de trabajo.40 4. Las estimaciones de los componentes de la varianza son: Operador (arreglo): a~ = 1.609 Dispositivo x operador (arreglo): a~ = 1.09 11.01 0.570 CAPÍTULO 13 DISEÑOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS Tabla 13-10 Derivación del cuadrado medio esperado del ejemplo 13-2 F 3 F 2 j R 4 k 4 4 1 4 1 1 R 2 1 2 2 2 2 2 1 Cuadrado medio esperado 2 a 2 + 2a'1' + 8¿ 2 Factor 7:¡ f3j YkU) O 3 3 2 7: 1 2 (7:f3)ij (ry )ikU) c(ijk)¡ O O 1 O 1 O 1 1 a + 6a~ + 24¿ f3~ 2 a + 6a~ a + 2a~ + 4¿ ¿ 2 a + 2a~ a2 ? (7:f3)~ En la tabla 13-11 se muestra el análisis de varianza completo. Esta diferencia en las medias del tipo de dispositivo podría probarse formalmente utilizando comparaciones múltiples.34 5. para minimizar el tiempo de ensamblaje. Quizás estos efectos operador-dispositivo podrían aislarse y los operadores cuyo desempeño es menos eficiente podrían mejorar impartiéndoles capacitación adicional. incluyendo Minitab y SAS. y la interacción arreglo del sitio de trabajo x dispositivo. la interacción entre los operadores y los dispositivos implica que algunos operadores son más eficientes que otros al utilizar los mismos dispositivos.67 Grados de libertad 2 1 6 2 12 24 47 Cuadrado medio 41.54 0.80 4. indicando que los efectos de los diferentes dispositivos no son los mismos para todos los operadores. Se observa que los dispositivos de ensamblaje son significativos y que los operadores dentro de los arreglos del sitio de trabajo también difieren significativamente.84 56. Q[l].01 0. Los arreglos del sitio de trabajo parecen tener un efecto reducido sobre el tiempo de ensamblaje. 333 F P 0.14 7.¡'~t~liiiiI Tabla 13-12 Análisis Balanced ANOVA de Minitab del ejemplo 13-2 utiliz_ando el modelo restringido Análisis de varianza (diseños balanceados) Type Levels Values Factor 1 2 fixed Layout 1 4 Operator(Layout) random 1 3 fixed Fixture Analysis of Variance for Time Source Layout Operator(Layout) Fixture Layout*Fixture Fixture*Operator(Layout) Error Total Source 1 2 3 4 5 6 DF 2 2 2 3 3 4 "'" 1 6 2 2 12 24 47 SS 4."j'i.34 5.gg81..576 Fixture*Operator(Layout) (6) 2.¡.218 0.083 11 .55 1.083 71.:r.000 299. Mm f ' E"'--' ----''""7''0 t "'!I-$n-~'WMW!r:='te"'i'F\. .609 Operator(Layout) 5 (6) + 2(5) + 16Q[3J Fixture 5 (6) + 2(5) + 8Q[4J Layout*Fixture 6 (6) + 2(5) 1..008 0.833 56.986 41.333 Error lJl --.35 0.J 1-' U=.917 82..036 Variance Error Expected Mean Square for Each Term component term (using restricted model) 2 (6) + 6(2) + 24Q[1J Layout 6 (6) + 6(2) 1.396 9.""'. 74 2.486 2.667 MS 4.042 65.521 5..g±r2.792 19.581 0.._Y_HU 'P'" -m"~'~ .~.002 0. 333 .333 F 0. S76 (6) Error 2.Ul -.000 299.036 Variance Error Expected Mean Square for Each Term component term (using unrestricted model) 2 (6) + 2(5) + 6(2) + Q[1. 986 41.083 S (6) + 2(5) + Q[3.917 82.4J Fixture 5 (6) + 2(S) + Q[4J Layout*Fixture 6 (6) + 2(S) Fixture*Operator(Layout) 1.117 0.l N ThWa U-13 Análisis Balanced ANOVA de Minitab del ejemplo 13-2 utilizando el modelo no restringido Análisis de varianza (diseños balanceados) Type Levels Values Factor Layout fixed 2 1 Operator(Layout) random 4 1 Fixture fixed 3 1 Analysis of Variance for Time Source Layout Operator(Layout) Fixture Layout*Fixture Fixture*Operator(Layout) Error Total Source 1 2 3 4 S 6 DF 1 6 2 2 12 24 47 SS 4.008 0.083 11.4J Layout S (6) + 2(S) + 6(2) Operator(Layout) 1.042 65..3S P 0.833 56.083 71.486 2.18 7.S5 1.34 2. 74 2.S81 0.396 9..218 0.S21 5.792 19.667 2 2 2 3 3 4 MS 4. 002 en el análisis del modelo restringido). Cada réplica de un experimento factorial requiere 12 observaciones. las conclusiones prácticas de este experimento no son afectadas mucho por elegir la forma restringida o la no restringida del modelo mixto. Los cuadrados medios esperados de la parte inferior de esta tabla son ligeramente diferentes de los que se reportaron para el modelo restringido y. Las cantidades Q[l. Esto suele resultar en una generalización del diseño factorial llamada diseño de parcelas subdivididas. y el experimentador ha decidido correr tres réplicas.. considere un fabricante de papel que está interesado en tres métodos diferentes para preparar la pulpa y cuatro temperaturas de cocción diferentes de la pulpa y que desea estudiar el efecto de estos dos factores sobre la resistencia a la tensión del papel. puesto que está presente un efecto grande de los dispositivos y una interacción dispositivos x operador (arreglo) significativa. Sin embargo. con los dispositivos (F). 4] son términos cuadráticos del tipo fijo que contienen el efecto de interacción arreglos x dispositivos. y es la interacción arreglo x dispositivos en el modelo no restringido (2 grados de libertad para el error). la estimación del componente de la varianza a~ = 1. por lo tanto. Así. Entonces se agruparían ciertas sumas de cuadrados y ciertos grados de libertad para formar las cantidades apropiadas requeridas para el diseño con los factores anidados y factoriales de la siguiente manera: Análisis factorial Suma de cuadrados SSF SSL SSFL SSo SSw SSFO SSFOL SSE SST Análisis factorial-anidado Grados de libertad Suma de cuadrados SSF SSL SSFL SSO(L) = SSo Grados de libertad 2 1 2 3 3 6 6 2 1 2 + SSw + SSFOL 6 SSFO(L) = SSFO SSE SST 12 24 47 24 47 13. entonces puede usarse un programa para analizar experimentos factoriales con factores anidados y factoriales. el experimento del ejemplo 13-2 podría considerarse como un factorial de tres factores. Puesto que MSarreglo x dispositivos> MSdispositivos x operador (arreglo)' Ytiene menos grados de libertad. los operadores (O) y los arreglos (L) como los factores. Como un ejemplo.13-4 DISEÑO DE PARCELAS SUBDIVIDIDAS 573 En la tabla 13-13 se presenta el análisis de Minitab del ejemplo 13-2 utilizando la forma no restringida del modelo mixto.083 es menor.4 DISEÑO DE PARCELAS SUBDIVIDIDAS En algunos experimentos factoriales con factores múltiples quizá no sea posible la aleatorización completa del orden de las corridas. Específicamente. por lo tanto. 4] y Q[3. seguiría sospechándose que existe un efecto del operador y. la ca- . Si no se cuenta con un paquete de software especializado como SAS o Minitab. el denominador del cociente F de los operadores (arreglo) es la interacción dispositivos x operadores (arreglo) del modelo restringido (12 grados de libertad para el error). la construcción de los estadísticos de prueba será ligeramente diferente para el factor operadores (arreglo). se encuentra ahora que el operador dentro del efecto del arreglo sólo es significativo en el nivel aproximado de 12% (el valor Ptue 0. Sin embargo. Además. Puesto que los tratamientos de las parcelas completas de un diseño de parcelas subdivididas están confundidos con las parcelas completas y los tratamientos de las subparcelas no están confundidos. utilizando un lote de pulpa producido por el tercer método. Entonces se produce un segundo lote de pulpa utilizando otro de los tres métodos. El diseño de parcelas . entonces el orden de experimentación dentro de cada réplica o bloque debería ser completamente aleatorizado. entonces cualquier efecto de los factores fuera del diseño sobre la respuesta estará completamente confundido (o mezclado) con el efecto de los métodos para preparar la pulpa. esto podría considerarse un experimento factorial con tres niveles del método de preparación (factorA) y cuatro niveles de la temperatura (factor B) en un bloque aleatorizado. después debería seleccionarse aleatoriamente otra combinación de tratamientos y obtener una segunda observación. Cada parcela completa se divide en cuatro partes llamadas subparcelas (o parcelas subdivididas). de ser posible. y si estos factores no controlados varían cuando los métodos para preparar la pulpa se modifican. el experimentador no recabó los datos de esta manera. A la temperatura se le llama el tratamiento de la subparcela. el diseño de parcelas subdivididas ha dado como resultado una eficiencia experimental considerable. Los datos Se muestran en la tabla 13-14. Por consiguiente. Cada réplica o bloque del diseño de parcelas subdivididas se divide en tres partes llamadas parcelas completas. dentro de un bloque debería seleccionarse aleatoriamente una combinación de tratamientos (un método de preparación y una temperatura) y obtener una observación. los dos factores "se aplicaron" en tiempos diferentes. Si éste fuera el caso. y a los métodos de preparación se les llama tratamientos principales o de parcelas completas. Este segundo lote también se divide en cuatro muestras que se prueban con las cuatro temperaturas. en esencia.~1 I . y la cocción de cada muestra se hace con una de las cuatro temperaturas. Después este lote se divide en cuatro muestras. Inicialmente. Él hizo un lote de pulpa y obtuvo observaciones para las cuatro temperaturas de ese lote. Se produce un lote de pulpa con uno de los tres métodos bajo estudio. Después se repite el proceso. en este caso 9 lotes en total.subdivididas requiere sólo tres lotes de pulpa por bloque (réplica). Observe que si están presentes otros factores no controlados o fuera del diseño. Evidentemente. Este ejemplo es bastante típico de la forma en que se usan los diseños de parcelas subdivididas en un ambiente industrial. Debido a la economía para preparar los lotes y al tamaño de los lotes. y se asigna una temperatura a cada una de ellas. por lo que el experimentador decide correr una réplica en cada uno de tres días y considerar los días o las réplicas como bloques. ésta es la única manera factible de correr este experimento. y así sucesivamente hasta que se hayan tomado las 12 observaciones en el bloque. Un experimento factorial completamente aleatorizado requeriría 36 lotes de pulpa. Sin embargo. lo cual es totalmente irrealista. En un día lleva a cabo el experimento de la siguiente manera. El diseño utilizado en el ejemplo de la pulpa es de parcelas subdivididas. un diseño de parcelas subdivididas puede considerarse como dos experimentos "combina- Tabla 13-14 El experimento de la resistencia a la tensión del papel Método de preparación de la pulpa Temperatura (OP) 200 225 250 275 30 35 37 36 34 41 38 42 29 26 33 36 28 32 40 41 31 36 42 40 31 30 32 40 31 37 41 40 35 40 39 44 32 34 39 45 Réplica (o bloque) 1 1 2 3 1 Réplica (o bloque) 2 2 3 1 Réplica (o bloque)3 2 3 . Es decir. 574 CAPÍTULO 13 DISEÑOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS pacidad de la planta piloto sólo permite realizar 12 corridas por día. Observe que. es mejor asignar el factor en el que haya mayor interés a las subparcelas. py u 2 (no estimable) . Puesto que tanto los métodos de preparación como las temperaturas son fijos y las réplicas son aleatorias. son aplicables los cuadrados medios esperados de la tabla 13-15. mientras que el subtratamiento (B) se prueba contra la interacción réplicas (o bloques) x subtratamientas. Observe que el factor principal (A) de la parcela completa se prueba contra el error de la parcela completa. rb:¿ f3~ 2 u 2 + bu. se derivan en la tabla 13-15. El cuadrado medio de los métodos de preparación se compara con el cuadrado medio del error de la parcela completa. r +(f3Y)jk +(rf3Y)ijk +8ijk ] -1. b (13-15) donde r¡.p + a-1 } u 2 + bu2 . alas tratamientos principales (factorA) y al error de la parcela completa [réplicas (o bloques) x A). Observe que no hay pruebas para el efecto de la réplica (o bloque) (A) o la interacción réplica (o bloque) x subtratamiento (Ae). las réplicas (o bloques) x B y las interaccionesAB. oo. :: 1. oo. oo. a { k= 1. y el cuadra- Tabla 13-15 Derivación del cuadrado medio esperado del diseño de parcelas subdivididas r R Factor T¡ Parcela completa 1 r a F j a O O b F k b b b O O O O 1 1 R h 1 1 1 1 1 1 1 1 Cuadrado medio esperado f3j (Tf3)ij Yk (TY)ik 1 r u 2 + abu2 . y Yk> (rY)¡k' (f3Y)jk y (rf3Y)ijk representan la subparcela y corresponden respectivamente al tratamiento de la subparcela (factor B). con las réplicas o bloques aleatorios y los tratamientos principales y los tratamientos de subparcelas fijas. 2.2.py+ (a-1)(b-1) 1 1 u 2 + U.+r¡ + f3 j +(rf3)ij +n +(rY)ik i. El modelo lineal para el diseño de parcelas subdivididas es Yijk = p. Un "experimento" tiene el factor parcela completa aplicado a las unidades experimentales grandes (o es un factor cuyos niveles son difíciles de cambiar) y el otro "experimento" tiene el factor subparcela aplicado a las unidades experimentales más pequeñas (o es un factor cuyos niveles son fáciles de cambiar). 2.. f3j y (rf3)ij representan la parcela completa y corresponden respectivamente a los bloques (o réplicas)...13-4 DISEÑO DE PARCELAS SUBDMDIDAS 575 dos" o superpuestos entre sí.p 2 2 ra:¿ Y~ u +autJ'+ (b-1) a a O O 1 1 r u 2 + au 2 ? Subparcela (j3Y)jk (Tf3Y)ijk C(ijk)h 2 tJ' r:¿:¿ (f3Y)~k u +u. Observe que el error de la parcela completa es la interacción réplicas (o bloques) x A y que el error de la subparcela es la interacción de tres factores bloques x AB. Los cuadrados medios esperados del diseño de parcelas subdivididas. y al error de la subparcela (bloques x AB). La interacciónAB se prueba contra el error de la subparcela. El análisis de varianza de los datos de la resistencia a la tensión de la tabla 13-14 se resume en la tabla 13-16. Las sumas de cuadrados para estos factores se calculan como en el análisis de varianza de tres factores sin réplicas. (error de la subparcela) . Si la varianza del término del error Sijk de la subparcela se denota por a. pero las interacciones bloques x By bloques x AB en esencia se han agrupado con Sijk para formar el error de la subparcela.53 4. .08 20. 2.96 Valor P 0.01 0.p (error de la parcela completa) 2 ra y~ a. Algunos autores proponen un modelo estadístico un tanto diferente para el diseño de parcelas subdivididas. y se establecen los mismos supuestos que para el modelo (ecuación 13-15).05 <0. Por último. de ser posible.: { le = 1.08 41.07 144.24 Fa 7.94 2. rp f3i (A) rb L f3~ a-1 J a.24) es menor que el error de la parcela completa (9.05 do medio de las temperaturas se compara con el cuadrado medio de réplica (o bloque) x temperatura (Ae).2. Observe.+ (a-1)(b-1) a. J -1.07).576 CAPÍTULO 13 DISEÑOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS Tabla 13-16 Análisis de varianza del diseño de parcelas subdivididas utilizando los datos de la resistencia a la tensión de la tabla 13-14 Fuente de variación Réplicas (o bloques) Método de preparación (A) Error de la parcela completa [réplicas (o bloques) x A] Temperatura (B) Réplicas (o bloques) x B AB Error de la subparcela [réplicas (o bloques) x AB] Total Suma de cuadrados 77.45 12.55 128. a2+ba2 + . Éste es comúnmente el caso en los diseños de parcelas subdivididas porque las subparcelas por lo general son más homogéneas que las parcelas completas.83 822. Tanto los métodos de preparación como la temperatura tienen un efecto significativo sobre la resistencia.+aba. 1. Esto da como resultado dos estlUcturas diferentes del en'or del experimento.67 75. + ba.r .a .b (13-16) En este modelo (rf3)ij sigue siendo el error de la parcela completa. que el error de la subparcela (4. por la tabla 13-16.97 Grados de Cuadrado libertad medio 2 2 4 3 6 6 12 35 38.28 434. los cuadrados medios esperados quedan como Factor Ti E(MS) (réplicas o bloques) a. i.39 36.78 64. es preferible. asignar el tratamiento en el que haya mayor interés a las subparcelas.17 50.20 9.69 3. el cuadrado medio del método de preparación x temperatura se prueba contra el error de la subparcela.+ ab-1 L (j3Yh (AB) ? I'LL (f3Y)~k a. Puesto que la comparación de los tratamientos de las subparcelas se hace con mayor precisión. 2. diversas variedades de un cultivo podían sembrarse en diferentes campos (parcelas completas).1 13-4 DISEÑO DE PARCELAS SUBDIVIDIDAS 577 Observe que ahora tanto el tratamiento de la subparcela (B) como la interacciónAB se prueban contra el cuadrado medio del error de la subparcela. en ocasiones se encuentra que la aleatorización completa no es factible debido a que es más difícil cambiar los niveles de algunos factores que otros. el error representa en realidad la dispersión o ruido en el sistema más la habilidad del sujeto para reproducir el mismo tiempo de enfoque. y aspectos parecidos).2.1) grados de libertad. entonces el cuadrado medio "del error" del análisis de varianza proporciona una estimación del "error de reproductibilidad" a~ con aben -1) grados de libertad. el cuadrado medio del error en este segundo diseño es muy pequeño. por consiguiente. y cada subparcela podía tratarse con un tipo diferente de fertilizante. Generalmente estos componentes se combinan en un término del error global. como en el problema de la resistencia a la tensión descrito antes. entonces este modelo alternativo es del todo satisfactorio. En principio es necesario considerar con mucha atención la forma en que debe llevarse a cabo el experimento e incorporar todas las restricciones sobre la aleatorización en el análisis. Si la aleatorización se restringe como en el segundo diseño anterior. por ejemplo E ijk = r/Jijk + ()ijk' Suponga que V(Eijk) = el. pero no produce información acerca del "error experimental" a ~ . Después cada campo podía dividirse en. { k = 1. Suponga que sólo hay dos factores. b niveles de iluminación y n réplicas requeriría que las abn observaciones se hicieran de manera aleatoria.a . j = 1. y ningún . el fracaso para duplicar exactamente los mismos niveles de agudeza e iluminación en diferentes corridas. El modelo para el diseño factorial podría escribirse como i = 1.n (13-17) donde r/Jijk representa la dispersión o ruido en el sistema que resulta del "error experimental" (es decir. el cuadrado medio del error tiene un valor esperado el.= a~ + a~. por ejemplo. . en el aparato de prueba es bastante difícil ajustar estos dos factores en diferentes niveles. Este punto se ilustra utilizando una modificación del experimento del tiempo del enfoque del ojo del capítulo 6. la agudeza visual (A) y el nivel de iluminación (B). No obstante su base agrícola. por lo que el experimentador decide obtener las n réplicas ajustando el dispositivo para una de las a agudezas visuales y uno de los b niveles de iluminación y correr las n observaciones de una sola vez. y ()ijk representa el "error de reproductibilidad" del sujeto. Por lo tanto. este diseño es similar a uno de parcelas subdivididas con ab parcelas completas. Si el experimentador se encuentra razonablemente cómodo con el supuesto de que las interacciones réplicas (o bloques) X B Yréplicas (o bloques) xAB son insignificantes. Sin embargo. es usual encontrar que algunos factores requieren unidades experimentales grandes mientras que otros necesitan pequeñas. Como lo señaló John [61d]. cada uno dividido en n subparcelas. cuatro subparcelas. En estos ambientes experimentales. Los factores que son difíciles de variar forman las parcelas completas mientras que los factores que son fáciles de variar se corren en las subparcelas. en el diseño factorial. la variabilidad en las condiciones ambientales. con mucha frecuencia se rechazará incorrectamente la hipótesis nula. 2. De manera alternativa. 2. Un experimento factorial con a niveles de agudeza. El diseño de parcelas subdivididas tiene una herencia agrícola: las parcelas completas son áreas extensas de tierra y las subparcelas son áreas más pequeñas dentro de las extensas. con aben .b . En el diseño factorial. el diseño de parcelas subdivididas es útil en muchos experimentos científicos e industriales.= a~ + a~.. Ahora bien. Por ejemplo. una variedad por campo. Aquí las variedades del cultivo son los tratamientos principales y los diferentes fertilizantes son los subtratamientos. 2 j= 1. los datos no deberán analizarse como un factorial. dispuestos en una estructura factorial. donde las combinaciones de tratamientos de la subparcela se prueban en orden aleatorio. el flujo de gas (B). no hay pruebas para los efectos principales a menos que la interacción sea insignificante. como lo describe Ostle [92]. Hay cuatro factores del diseño: la temperatura (A). Como un ejemplo. entonces los efectos principales pueden probarse contra la interacciónAB. Observe que las dos réplicas del experimento están subdivididas en cuatro parcelas completas.+'i¡ +f3 j +Yk +(f3Y)jk +(}ijk +0 1 +A m+(OA)lm +(f3o)jl +(f3A)jm +(YO)kl +(OA)lm +(f3YO)jkl +(f3YA)jkm i=l. los factores A y B (la temperatura y el flujo de gas) son difíciles de cambiar. En general.5. entonces el factor fijo puede probarse contra la interacciónAB.578 CAPÍTULO 13 DISEÑOS ANIDADOS Y DE PARCELAS SUBDMDIDAS subtratamiento. Únicamente se hacen cuatro cambios de la temperatura y del flujo de gas en cada réplica. Puede haber restricciones sobre la aleatorización en el modelo que no se tomaron en cuenta en el análisis y. Si los dos factores son aleatorios.1) n LL ('if3) ~ (13-18) Por lo tanto.2 1 k=1. Si sólo uno de los factores es aleatorio.2 1= 1. por. los cuadrados medios esperados en este caso son E(MSA)= a~ +na: +----'=-'1' bnL 'i. mientras que Cy D (el tiempoyla posición de la oblea) son fáciles de modificar..5 13. E(MSE)=a~ + (a-1) (b .2 (13-19) . + 2 2 2 2 an L f3~ E(MSAB)=a B +na"..1 OTRAS VARIANTES DEL DISEÑO DE PARCELAS SUBDIVIDIDAS Diseño de parcelas subdivididas con más de dos factores En ocasiones se encuentra que la parcela completa o la subparcela contendrán dos o más factores. y se realiza un diseño factorial 22 en los factores tiempo y posición de la oblea. cada parcela completa se subdivide en cuatro subparcelas. si se analiza un diseño factorial y todos los efectos principales y las interacciones son significativos. 13. es Yijklm = p. Ahora bien. Esta situación también es similar a un submuestreo.2 m=1. entonces deberá examinarse con atención cómo se realizó realmente el experimento. a-1 b_ 1 E( MS B ) = a B + na". consiguiente. el tiempo (C) y la posición de la oblea en el horno (D). Suponiendo que A y B son fijos. Las variables de respuesta de interés son el espesor de la capa de óxido y la uniformidad de la capa. La situación es exactamente la de un análisis de varianza de dos factores con una observación por celda. considere un experimento conducido en-un horno para hacer crecer un óxido en una oblea de silicio. Un modelo para este experimento. mientras que los niveles del tiempo y la posición de la oblea están completamente aleatorizados. cada una de las cuales contiene una combinación de los ajustes de la temperatura y el flujo de gas. El experimentador planea correr un diseño factorial 24 con dos réplicas (32 ensayos). consistente con la ecuación 13-16. Esto lleva al diseño de parcelas subdivididas que se muestra en la figura 13-7. Una vez que se eligen estos niveles. +8a~+B SSA SSB SSAB SSwp SSc SSD SSCD SSAC SSBC SSAD SSBD SSABC SSABD SSACD SSBCD SSABCD SSsP SST AB Error de la parcela completa (eijk) C (o[) D (. m ) CD AC BC AD BD ABC ABD ACD BCD ABCD Error de la subparcela (C¡jk/m) Total 1 1 1 1 1 1 1 1 1 1 1 1 12 31 a.+ABCD a2 E . 01 y A m representan los efectos principales de la subparcela y sijklm es el error de la subparcela.1. {Jj y Yk los efectos principales de la parcela completa.13-5 OTRAS VARIANTES DEL DISEÑO DE PARCELAS SUBDMDIDAS Bloque 1 Bloque 2 579 Parcela completa ~u CJ CJ ++- Subparcela C:O:O:O:O:O:O"O:O +- U CJ UU CJ ! ! ! ! ! ! ! ! +. es la varianza de los efectos de los blores de la parcela completa y de la subparcela.+AD a..+D a.+ABD a.+AC a. En esta tabla. +++- + D D D D D D D D Figura 13-7 Diseño de parcelas subdivididas con cuatro factores del diseño.) A (f3j) B (Yk) Suma de cuadrados SSRépliCll5 Grados de libertad 1 1 1 1 3 Cuadrado medio esperado a.+ABC a.+BCD a.+I&r. respectivamente. suponiendo que las réplicas son aleatorias y que representan las varianzas de los errotodos los factores del diseño son efectos fijos. Tabla 13-17 y los factores Análisis abreviado de un diseño de parcelas subdivididas con los factores A y B en las parcelas completas y D en las subparcelas (referirse a la figura 13-7) e Fuente de variación Réplicas (1:. En la tabla 13-17 se presenta el análisis de varianza de este diseño. eijk es el error de la parcela completa.+ 8a~ a.+BD a.+ 8a~+ AB a.+CD a.+ACD a.+C a. a. a. dos en la parcela completa y dos en la subparcela. donde 7:¡ representa el efecto de la réplica.+8a~+A a. ya. Se han incluido todas las interacciones entre los cuatro factores del diseño..+BC a... a. En el ejemplo siguiente se ilustra este diseño. el experimento se realiza asignando una unidad· de antibiótico a un técnico que lleva a cabo el experimento con las tres concentraciones de la dosis y los cuatro espesores de la pared. por lo que quizá un experimento de 32 corridas no sea demasiado ilógico. Una vez que se ha formulado una concentración particular de la dosis. y (para simplificar) se han usado letras mayúsculas latinas para denotar los efectos de tipo fijo. en el caso del horno de oxidación. EJEMPLO 13. Los experimentos factoriales con tres o más factores en una estructura de parcelas subdivididas tienden a ser experimentos bastante grandes. se prueban los cuatro espesores de la pared con esa concentración.2 Diseño de parcelas con doble subdivisión El concepto de diseños de parcelas subdivididas puede extenderse a situaciones en las que pueden ocurrir restricciones sobre la aleatorización en cualquier número de niveles dentro del experimento. A los espesores de la pared suele llamárseles sub-subtratamientos. El experimentador se ha decidido por cuatro réplicas. Por último se prueba la tercera concentración de la dosis y los cuatro espesores de la pared. Después se selecciona otra concentración de la dosis y se prueban los cuatro espesores de la pared. En algunos casos no habrá ninguna prueba F exacta y deberá usarse el procedimiento de Satterthwaite (descrito en el capítulo 12). tres concentraciones de la dosis y cuatro espesores de la pared de la cápsula. . mientras que los factores de la subparcela y todas las demás interacciones se prueban contra el error de la subparcela. El orden en que se asignan los técnicos a las unidades de antibiótico se determina aleatoriamente. Observe que los días pueden considerarse como bloques. Las concentraciones de la dosis forman tres subparcelas. Hay tres técnicos. Un investigador estudia los tiempos de absorción de un tipo particular de cápsula de antibiótico. Puesto que hay dos restricciones sobre la aleatorización en el experimento (algunos autores dicen que hay dos "divisiones" en el diseño). La concentración de la dosis puede asignarse aleatoriamente a una subparcela. al diseño se le llama diseño de parcelas con doble subdivisión. 13. Por otra parte. otros dos técnicos del laboratorio también siguen el mismo plan. empezando cada uno con una unidad de antibiótico. Por último. Las parcelas completas corresponden al técnico.5. al arreglo se le llama diseño de parcelas con doble subdivisión. los experimentadores sólo tienen que cambiar ocho veces los factores que son difíciles de modificar (A y B). Por ejemplo. Mientras tanto. Si algunos de los factores del diseño son aleatorios. Dentro de una réplica (o un bloque) (día). Observe que hay dos restricciones sobre la aleatorización dentro de cada réplica (o bloque): el técnico y la concentración de la dosis. Los efectos principales y la interacción de la parcela completa se prueban contra el error de la parcela completa. formando cuatro sub-subparcelas. Es posible reducir el número de corridas utilizando un factorial fraccionado para los factores del diseño de interés. la estructura de parcelas subdivididas con frecuencia facilita la realización de un experimento grande.3 . Cada réplica de un experimento factorial requeriría 36 observaciones. dentro de una concentración particular de la dosis se prueban los cuatro espesores de la pared de la cápsula de manera aleatoria.580 CAPÍTULO 13 DISEÑOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS ques. y es necesario correr cada réplica en un día diferente. los estadísticos de prueba serán diferentes. Si hay dos niveles de restricciones sobre la aleatorización. En la figura 13-8 se ilustran las restricciones sobre la aleatorización y el arreglo experimental de este diseño. r . a los tratamientos principales (factor A) y al error de la parcela completa [réplicas (o bloques) x A)]. = 1. Un modelo estadístico lineal para el diseño de parcelas con doble subdivisión es Y¡jldl = f-t+7:¡ +{3j +(7:{3)ij +Yk +(7:Y)¡k +({3?/)jk +(7:{3?/)¡jk +Olz +(7:0)¡1z + ({30)]11 +(7:{30)ijlz +(YO)kll + (7:YO)¡kll +({3YO)jklz i j + ( f3 7: y o) ijkJ¡+cijklz le:l. 2. . 2.a donde 7:¡. respectiva- .13-5 OTRAS VARIANTES DEL DISEÑO DE PARCELAS SUBDIVIDIDAS Espesor de la pared 581 1 Antibiótico asignado a un técnico 2 Primera restricción sobre la aleatorización Segunda restricción sobre la aleatorización 3 Orden aleatorio 4 Técnico 2 Bloques Concentración de la dosis 3 3 2 2 3 2 3 1 2 3 1 Espesor de la pared 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 2 3 4 4 4 4 4 4 1 2 3 4 4 4 1 2 Espesor de la pared 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 2 3 4 4 4 4 4 4 4 4 4 1 3 Espesor de la pared 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 4 2 3 4 4 4 4 4 4 4 4 1 4 Espesor de la pared 1 2 3 4 1 2 3 4 1 2 1 2 3 4 1 2 1 2 1 2 3 1 2 3 2 3 4 3 4 3 4 3 4 4 4 Figura 13-8 Diseño de parcelas con doble subdivisión. {3j Y (7:{3h representan la parcela completa y corresponden a las réplicas o bloques. b .e (13-20) 2. 2. { h-l. . = 1. donde se manejaron cuatro réplicas. (j3yo)jkl. é/(ijkh) 1 r 1 1 O O 1 2 rb L L ({JO)~h a +ba. El número de grados de libertad de cada prueba se determina de la manera usual. los subtratamientos. a-+aa. El análisis estadístico de un diseño de parcelas con doble subdivisión es como el de una sola réplica de un factorial de cuatro factores. Las pruebas de los tratamientos principales. Observe que no existen pruebas para las réplicas o bloques ni para las interacciones en las que intervienen réplicas o bloques. Yal error de la subparcela. las interacciones de réplicas (o bloques) x B yAB.Pd+ (a-1)(c-1) 2 a + ba.582 CAPÍTULO 13 DISEÑOS ANIDADOS Y DE PARCELAS SUBDNIDIDAS mente.Y)ib (j3Y)jk y (rf3Y)¡jk representan la subparcela y corresponden al tratamiento de la subparcela (factor B). pueden derivarse los cuadrados medios esperados como se muestra en la tabla 13-18. (j30)jh (T{JO)ijh Sub-subparcela a a O O a a b b b b O O O O 1 O O O O O O O O 1 a 2+ aba 2 + Td rab L o~ (c-1) 1 r 1 r (yo)k1' (r'l'o)¡k1.pyd + (b -1)(c -1) ? ? ? ? ? a 2+ aba.d a + a.Pd raLL (1'0)1.+ a. y Yb ('¡. A la interacción de cuatro factores (rf3yO)¡jk" se le llama el error de la sub-subparcela. al tratamiento de la sub-subparcela (factor C) y a las interacciones restantes. tres técnicos. respectivamente.. respectivamente. y o" y los parámetros restantes corresponden a la sub-subparcela y representan.py o" (TO)i1. (T{JyO)ijkl. Se trata de un número relativamente pequeño de grados de libertad. en el ejemplo 13-3.'d+ (b-1)(c-1) 2 a + aa~d rLLL (j3YO)~k a. se tendrían sólo (r -l)(a -1) = (4 -1)(3 -1) = 6 grados de libertad del error de la parcela completa para probar a los técnicos. y el experimentador podría considerar el uso de réplicas adicioTabla 13-18 Derivación del cuadrado medio esperado para el diseño de parcelas con doble subdivisión r c 1 a b R R F F F Cuadrado medio esperado Factor h l k j a 2+ abcda 2 1 c a b Ti 1 .bcL {J2 c r O b a 2+a2 + } {Jj Parcela completa 1 TP (a-1) 2 1 b c (T{J)ij O 1 a 2+ bcaTP Yk Subparcela r a a O O O O O O c c c c 1 1 1 1 1 1 1 1 1 1 1 1 1 a 2+ aca 2 + '1' rac L Y~ (b -1) (ry)ik (j3Y)jk (T{JY)ijk 1 r a 2+ aca2 1 r 2 2'1' rCLL ({JY)~h a +caTpy + (a-1)(b-1) a 2+ ca. los sub-subtratamientos y sus interacciones son obvias al inspeccionar esta tabla. tres concentraciones de la dosis y cuatro espesores de la pared. Para ilustrar.pYd a 2 (no estimable) 2 . Suponiendo que las réplicas (bloques) son aleatorias y que los demás factores del diseño son fijos. Por lo tanto.1) grados de libertad para el error de la parcela completa.B z A~z Figura 13-9 Una réplica (bloque) de un diseño de parcelas subdivididas en franjas. etcétera. Después el factor B se aplica a franjas (que son en realidad sólo otro conjunto de parTabla 13-19 Análisis de varianza abreviado de un diseño de parcelas subdivididas en franjas Fuente de variación Réplicas (o bloques) A Suma de cuadrados SSRéplicas Grados de libertad Cuadrado medio esperado r-1 a-1 (r-1)(a-1) b-1 (r-1)(b -1) (a-1)(b-1) (r-1)(a -l)(b -1) rab -1 a. cinco réplicas producirán 2(5 -1) = 8 grados de libertad.+ (a-1)(b -1) ? LL Errar de la subparcela Total . es probable que el experimentador no quiera correr menos de cuatro réplicas. El factorA se aplica a las parcelas completas como en el diseño de parcelas subdivididas estándar. SSA SSwPA SSB SSwPB SSAB SSsP SST ErrarA de la parcela completa B ErrarB de la parcela completa AB r (rf3)~k a. En el caso más simple. 13~5.+aba. se tienen dos factores A y B. Si los recursos lo permiten.3 Diseño de parcelas subdivididas en franjas El diseño de parcelas subdivididas en franjas ha tenido una amplia aplicación en las ciencias agrícolas. B. Por consiguiente. siete réplicas producirán 2(7 -1) = 12 grados de libertad. se tendrán 2(r . al pasar de cinco a seis réplicas. la precisión de la prueba podría incrementarse en un tercio (de seis a ocho grados de libertad).rJ 13-5 OTRAS VARIANTES DEL DISEÑO DE PARCELAS SUBDNIDIDAS Parcelas completas 583 f Az A~. pero sólo ocasionalmente encuentra un uso en la experimentación industrial. nales para incrementar la precisión de la prueba. ya que se producirían así sólo cuatro grados de libertad.B. seis réplicas producü:án 2(6 -1) = 10 grados de libertad. A3 A. el experimentador deberá correr cinco o seis réplicas. hay 25% de ganancia adicional en la precisión. A. A~. Además. A~3 A. Cada réplica adicional permite ganar dos grados de libertad para el error. Si haya réplicas.B3 A~3 Parcelas en franjas ~ A~z A. Si se cuenta con recursos para correr cinco réplicas. y que los niveles del factor B están confundidos con las franjas (las cuales pueden considerarse como un segundo conjunto de parcelas completas). 2.:: 1. suponiendo que las máquinas y los mandriles son factores fijos. Debido a la ubicación de las máquinas. Observe que los niveles del factor A están confundidos (o mezclados) con las parcelas completas. Analizar los datos y sacar conclusiones. En la tabla 13-19 se muestra un análisis de varianza abreviado. Los datos se muestran en la tabla siguiente. b J -1. Se estudia el acabado superficial de piezas metálicas fabricadas en cuatro máquinas. Un ingeniero de manufactura está estudiando la variabilidad dimensional de un componente particular que se produce en tres máquinas. y Bijk es el error "de la subparcela" usado para probar la interacciónAB. oo. Máquina 1 Operador Máquina 2 Máquina 3 123 88 75 53 56 46 57 76 68 36 53 Máquina 4 123 40 56 62 47 1 79 62 2 94 74 3 46 57 123 92 99 85 79 13-3. Los resultados se presentan a continuación. . Proceso 1 Lote 1 25 30 26 2 19 28 20 3 15 17 14 4 15 16 13 1 19 17 14 Proceso 2 2 23 24 21 3 18 21 17 4 35 27 25 1 14 15 20 Proceso 3 2 3 38 54 50 4 25 29 33 35 21 24 13-2. Analizar los datos y sacar conclusiones. . El fabricante de la carga propulsora de una turbina está estudiando la rapidez de combustión del propulsor obtenido de tres procesos de producción. suponiendo queA y B son factores fijos y que las réplicas son aleatorias. donde (rf3)ij y ('íY)ik son los errores de la parcela completa de los factores A y B. Los resultados se presentan a continuación. y los operadores se eligen al azar. Se seleccionan al azar cuatro lotes del propulsor de la salida de cada proceso y se hacen tres determinaciones de la rapidez de combustión de cada lote.584 CAPÍTULO 13 DISEÑOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS celas completas) que son ortogonales a las parcelas completas originales utilizadas para el factorA. En ocasiones las réplicas se ~onsideran como bloques. 13. En la figura 13-9 se ilustra una situación en la que los dos factores A y B tienen tres niveles..6 PROBLEMAS 13-1.. Se conduce un experimento en el que cada máquina es operada por tres operadores diferentes y se colectan y prueban dos ejemplares de cada operador. y se seleccionan al azar cuatro componentes de cada mandril. 2. se usan operadores diferentes en cada máquina. a r { k= 1.2. Un modelo para el diseño de parcelas subdivididas en franjas de la figura 13-9. respectivamente. . suponiendo y réplicas. es i. a niveles del factor A y b niveles del factor B. Analizar los datos. Cada máquina tiene dos mandriles. 6 162. .9 161. Derivar los cuadrados medios esperados para el diseño anidado balanceado de tres etapas.7 158. Comentar las diferencias entre el análisis y las conclusiones del modelo restringido y el no restringido. un ingeniero industrial está estudiando la posibilidad de asignar un tiempo estándar a una clase particular de tareas. Cada operador completa dos veces la tarea en momentos diferentes durante la semana.7 162.1 157.0 156.5 160. Para ver si esta simplificación es posible. Utilizando los datos que se presentan a continuación.6 156. Puede usarse un paquete de software de computadora. Repetir el problema 13-7 suponiendo la forma no restringida del modelo mixto.7 161.3 Operador 2 159.3 158. Química de la aleación Hornadas 1 Lingotes 1 40 63 2 27 30 1 95 67 1 2 2 69 47 1 65 54 3 2 78 45 1 22 10 1 2 23 39 1 83 62 2 2 2 75 64 1 61 77 3 2 35 42 13-6.5 161. Suponer la forma restringida del modelo mixto.5 156. Comentar las diferencias que se observan entre los resultados del modelo restringido y el no restringido. Usar la forma restringida del modelo mixto. 13-7.7 159.8 1 2 3 4 5 6 13-5.3 159. Analizar nuevamente el experimento del problema 13-5 utilizando la forma no restringida del modelo mixto.3 163.9 154.5 158.3 154. se seleccionan seis tareas al azar.9 158.8 156. Derivar los cuadrados medios esperados para el diseño anidado balanceado de tres etapas si los tres factores son aleatorios.5 158. y se obtienen los resultados siguientes. suponiendo que la química de la aleación y las hornadas son factores fijos y que los lingotes son aleatorios. Obtener las fórmulas para estimar los componentes de la varianza. 13-9. Para simplificar la programación de la producción.3 162.8 160. Cada tarea se encarga a un grupo diferente de tres operadores. analizar el diseño. Obtener las fórmulas para estimar los componentes de la varianza. Considere el diseño anidado de tres etapas que se muestra en la figura 13-5 para investigar la dureza de una aleación.9 162. 13-8.0 159. Puede usarse un paquete de software de computadora para hacerlo.13-6 PROBLEMAS 585 Mandril Máquina 1 1 2 12 8 9 9 11 10 12 8 Máquina 2 Máquina 3 1 14 15 13 14 2 12 10 11 13 1 14 10 12 11 2 16 15 15 14 13-4.0 157.9 156.9 160.1 161. ¿Qué conclusiones pueden sacarse acerca del uso del tiempo estándar común para todas las tareas de esta clase? ¿Qué valor se usaría para el estándar? Threa Operador 1 158. con la creencia de que las diferencias entre las tareas son insignificantes.6 158.4 154.8 158. suponiendo que A es fijo y que B y e son aleatorios.6 Operador 3 157.2 157. Analizar este experimento. Cada máquina puede operarse con dos ajustes de la potencia. a) Anotar las ecuaciones normales de mínimos cuadrados para esta situación. donde A Y B son factores aleatorios. Considere un diseño anidado de dos etapas no balanceado con b¡ niveles de B bajo el nivel i-ésimo de A y nij réplicas en la celda ij-ésima.a . Las corridas se hacen en orden aleatorio. Se conduce un experimento en el que cada máquina se prueba con ambos ajustes de la potencia. y se toman tres observaciones del rendimiento de cada estación. y los resultados se presentan a continuación. . utilizando los resultados del inciso b. Un ingeniero de procesos está probando el rendilniento de un producto manufacturado en tres máquinas. 1 a-1 a l. Resolver las ecuaciones normales. Verificar los cuadrados medios esperados que se dan en la tabla 13-lo 13-11. e) Analizar los datos siguientes. Diseños anidados no balanceados. j= 1. Además.b . 2. b) Construir la tabla del análisis de varianza para el diseño anidado no balanceado de dos etapas. Considere el modelo i = 1.586 CAPÍTULO 13 DISEÑOS ANIDADOS Y DE PARCELAS SUBDMDIDAS 13-10. Demostrar que .). 2. Componentes de la varianza en el diseño anidado no balanceado de dos etapas. Factor A Factor B 1 6 4 8 1 2 1 2 2 2 4 3 1 O -3 1 5 7 9 6 3 -3 13-12.tn. { . suponiendo que los tres factores son fijos. 2.t~ ni IN N e2 = a-1 13-13. una máquina tiene tres estaciones en las que se fabrica el producto. k = 1.. l1ij donde e o = ----'-------------'-b-a N- t (~ ni In.=1 t (~n. e 1 =---'--------'------N-2: 11~ . Obtener los cuadrados medios esperados para esta situación suponiendo la forma restringida del modelo mixto y hacer las modificaciones apropiadas al análisis anterior. Los datos de la resistencia resultantes se presentan a continuación.346 1. Cada fabricante entrega dos ejemplares de prueba de cada tamaño de las barras de tres hornadas.9 33.320 1. Fabricante 1 Hornada Tamaño de la barra: 1 pulgada 1tpulgadas 2 pulgadas 1 1.3 26.9 1 32.3 Máquina 2 2 33.346 1.268 1.6 32.1 34. Comentar cualquier diferencia entre el análisis y las conclusiones del modelo restringido y el no restringido. Analizar nuevamente el experimento del problema 13-14 suponiendo la forma no restringida del modelo mixto.215 1.9 3 32.8 37.324 1.230 1.1 33.8 Máquina 1 Estación Ajuste de la potencia 1 Ajuste de la potencia 2 1 34.0 28.0 26.342 Fabricante 3 1 1.273 1.1 25.247 1.316 1.265 1.8 33. 13-16. 13-18.1 27.235 1.323 13-17.1 34.362 1.2 26.3 Máquina 3 2 33.275 1.287 1.0 13-14.1 30.268 1.262 2 1.329 1.292 2 1.215 Fabricante 2 2 1 3 1.1 29.384 1.7 24.346 1.8 23.274 1. 13-15.0 pulgadas. Además.250 1.0 24. Suponga que en el problema 13-16 las barras pueden adquirirse en muchos tamaños y que los tres tamaños que realmente se utilizaron en el experimento fueron seleccionados al azar. La normalización del acero se hace calentándolo arriba de la temperatura crítica.6 3 36.206 1.0 27.1 25. Este proceso incrementa la resistencia del acero.1 25.8 31.0 33.336 1.271 3 1.9 24.1 23.9 1 31.296 1. recalentándolo y después enfriándolo con aire.280 1. Puede usarse un paquete de software de computadora para hacerlo. las barras se forjan de lingotes fabricados en hornadas diferentes.260 1. refina el grano y homogeneiza la estructura.315 1.382 3 1. Usar la forma restringida del modelo mixto.239 1.0 24.273 1. 13-19. El procesamiento de los diferentes tamaños de las barras a partir de un lingote común implica técnicas diferentes de forjado.2 36. Resolver de nuevo el problema 13-16 utilizando la forma no restringida del modelo mixto.319 1.400 1.6 24.4 32. por lo que este factor puede ser importante.300 1.301 1.7 22.5 34.5 o 2. Suponga que en el problema 13-13 podrían emplearse un gran número de ajustes de la potencia y que los dos que se seleccionaron para el experimento se escogieron al azar.0.8 35.247 1.rl 13-6 PROBLEMAS 587 3 33.3 31.346 1.301 1.364 1.3 26.263 1.7 33. Cada fabricante entrega la aleación en barras de tamaño estándar de 1. Puede usarse un paquete de software de computadora para hacerlo.3 27.264 1. 1.2 27.259 1.328 1.392 1.1 24. Comentar las diferencias entre el análisis y las conclusiones del modelo restringido y el no restringido.1 2 33.315 1. Obtener los cuadrados medios esperados para esta situación y hacer las modificaciones apropiadas al análisis anterior. Usar la forma restringida del modelo mixto.7 34. Analizar los datos.1 24. Se seleccionan dos temperaturas y tres dura- . Un ingeniero de estructuras está estudiando la resistencia de una aleación de aluminio adquirida de tres fabricantes. Se lleva a cabo un experimento para determinar el efecto de la temperatura y de la duración del tratamiento térmico sobre la resistencia del acero normalizado.3 28.7 26.362 1.4 28.1 25.375 1.9 35. suponiendo que los fabricantes y el tamaño de las barras son fijos y las hornadas son aleatorias.392 1.357 1. 7 68.3 69.588 CAPÍTULO 13 DISEÑOS ANIDADOS Y DE PARCELAS SUBDNIDIDAS ciones. minutos 10 20 30 10 20 30 10 20 30 10 2 3 4 20 30 1500 63 54 61 50 52 59 48 74 71 54 48 59 1600 89 91 62 80 72 69 73 81 69 88 92 64 13-20.4 74.5 73. por rocío y con rodillo). suponiendo que ambos factores son fijos.0 75.8 79. suponiendo que las mezclas y los métodos de aplicación son fijos.5 68.6 72.1 66.2 69.3 74. Día 1 Método de aplicación 1 2 3 1 2 3 1 2 3 2 3 1 64.8 73.5 72. Analizar los datos y sacar conclusiones.8 68. Se estudian cuatro mezclas diferentes de un pigmento particular. Después de 10 minutos se retira uno de ellos.3 65.0 70. Se necesitan tres días para correr el experimento.5 72. El procedimiento consiste en preparar una mezcla particular y en aplicarla después a un panel utilizando tres métodos (con brocha.3 74. El experimento se realiza calentando el horno a una temperatura seleccionada aleatoriamente e insertando tres ejemplares de prueba. La respuesta medida es el porcentaje de reflectancia (coeficiente de reflexión) del pigmento.0 73. Considere el diseño de parcelas con doble subdivisión del ejemplo 13-3. Analizar los datos y sacar conclusiones.1 69.5 70. Se requieren cuatro corrimientos para recabar los datos.2 69. y los datos obtenidos se presentan a continuación. 13-22. . después de 20 minutos se retira un segundo ejemplar y después de 30 minutos se retira el último. Entonces se corre la temperatura al otro nivel y se repite el proceso.0 72.2 80. Se diseña un experimento para estudiar la dispersión de los pigmentos de una pintura. los cuales se muestran abajo.3 64.5 67.3 71.1 4 66.4 13-21.8 Mezcla 2 3 66.1 78. Repetir el problema 13-20.2 66. Analizar los datos y sacar conclusiones. °F Corrimiento 1 Tiempo. Suponga que este experimento se conduce como se describe y que se obtienen los datos que se muestran en la siguiente tabla. suponiendo que las mezclas son aleatorias y que los métodos de aplicación son fijos.2 71. Temperatura.8 70.3 70.0 65. Resolver nuevamente el problema 13-22. Considere el experimento que se describe en el ejemplo 13-3.¡} 13-6 PROBLEMAS 589 Réplicas (o bloques) 1 2 3 4 Concentración de las dosis Espesor de la pared 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 1 95 104 101 108 95 106 103 109 96 105 106 113 90 100 102 114 2 71 82 85 85 3 108 115 117 116 110 109 116 110 107 106 112 117 109 112 115 118 1 96 99 95 97 100 101 99 112 94 100 104 121 98 102 100 118 Técnico 2 2 3 70 84 83 85 72 79 80 86 66 84 87 90 68 81 85 85 108 100 105 109 104 102 108 109 100 101 109 117 106 103 110 116 1 95 102 105 107 92 100 101 108 90 97 100 110 98 102 105 110 3 2 70 81 84 87 69 76 80 86 73 75 82 91 72 78 80 95 3 100 106 113 115 101 104 109 113 98 100 104 112 101 105 110 120 78 84 86 84 70 81 88 90 68 84 85 88 13-23. suponiendo que los técnicos se eligen al azar. Usar la forma restringida del modelo mixto. Suponga que en el problema 13-22 se usaron cuatro técnicos. Suponiendo que todos los factores son fijos. ¿cuántos bloques deberán correrse para obtener un número adecuado de grados de libertad para probar las diferencias entre los técnicos? 13-25. . Demostrar cómo se determinaría el orden en que se corren la combinaciones de tratamientos si este experimento se realizara como a) una parcela con doble subdivisión. 13-24. c) un diseño factorial en un bloque aleatorizado y d) un diseño factorial completamente aleatorizado. b) una parcela subdividida. las transformaciones se usan para tres propósitos: estabilizar la varianza de la respuesta. y se señaló que se trata de una desviación de los supuestos del análisis de varianza estándar. En este capítulo se presenta un panorama general de varios tópicos más que el experimentador puede encontrar potencialmente útiles. los experimentos con mezclas. la estimación de los componentes de la varianza y los diseños óptimos. Este problema de la desigualdad de la varianza ocurre con relativa frecuencia en la práctica.1. Se introdujo la transformación de la variable de respuesta como un método apropiado para estabilizar la varianza de la respuesta. 14. y selecciona la que produce la gráfica más agradable o satisfactoria de los residuales contra la respuesta ajustada. Por ejemplo. En general. como la metodología de superficies de respuesta. Se revisaron dos métodos para seleccionar la forma de la transformación. hacer que la distribución de la variable de respuesta esté más cerca de la distribución normal y mejorar el ajuste del modelo a los datos. los datos de proporciones. como el rendimiento o la proporción de productos defectuosos. Este último objetivo podría incluir la simplificación del modelo.Cox En la sección 3-4. muchas veces en conjunción con una variable de respuesta no normal. Algunos ejemplos incluirían el conteo de defectos o partículas.1 14. aunque en algunos casos sólo se ha podido presentar un panorama general. o una variable de respuesta que sigue alguna distribución sesgada (una "cola" de la distribución de la respuesta es más larga que la otra).1 RESPUESTAS Y TRANSFORMACIONES NO NORMALES Selección de una transformación: el método de Box. una técnica gráfica empírica y un procedimiento esencialmente de ensayo y error en el que el experimentador simplemente intenta una o más transformaciones.3 se estudió el problema de una varianza no constante de la variable de respuestay en un experimento diseñado.Otros tópicos de diseño y análisis El tema de los experimentos diseñados estadísticamente es muy amplio. En los capítulos previos se ha ofrecido una presentación introductoria de muchos de los conceptos y métodos básicos. hay exposiciones que ocupan un libro sobre tópicos. por ejem- 590 . a menos desde luego que A = O. cuando A tiende a cero. Si este intervalo de confianza incluye el valor A = 1. En ocasiones. el análisis de varianza estándar de y(A) = A)/-1 ji In y j l-1 A :¡t:. los valores de Apróximos a la unidad sugerirían que no es necesaria ninguna transformación. y graficando una recta paralela al ejeA a la altura SS* sobre la gráfica de SSE(A) contraA. En general. a saber. son suficientes entre 10 y 20 valores de Apara estimar el valor óptimo. cuando A = O.58 sea pequeña. allocalizarlos puntos sobre el ejeA donde SS* corta la curva SSE(A). ya que es probable que la diferencia práctica entre A = 0. Al utilizar el método de Box-Cox. (y" . El procedimiento de cálculo real consiste en efectuar. pueden leerse directamente en la gráfica los límites de confianza paraA.a) por ciento para Acalculando (14-2) donde 11 es el número de grados de libertad. para varios valores de A. aun cuando las estimaciones de los parámetros del modelo tendrán una diferencia de escala y un corrimiento del origen en comparación con los resultados obtenidos cuando se usa ¡ (o In y). Es posible encontrar un intervalo de confianza aproximado de 100(1 . por ejemplo SSE(A). se recomienda que el experimentador use elecciones simples de A. Es perfectamente aceptable utilizar y(A) como la respuesta real. eliminando términos de interacción. . La teoría fundamental en su procedimiento utiliza el método de máxima verosimilitud. ya que para cada valor de Ala suma de cuadrados del error se mide en una escala diferente. Box y Cox [15] han indicado cómo puede estimarse el parámetro de la transformación Aal mismo tiempo que los demás parámetros del modelo (la media global y los efectos de los tratamientos). Entonces. ¡ tiende a la unidad. El componente (i -1 )/A de la ecuación 14-1 alivia este problema porque cuando Atiende a cero.1 de la ecuación 14-1 reescala las respuestas para que las sumas de cuadrados del error sean comparables directamente. pero la transformación de la raíz cuadrada (A = 0. donde Aes el parámetro de la transformación que habrá de determinarse (por ejemplo A = t significa usar la raíz cuadrada de la respuesta original).5) es mucho más fácil de interpretar. Si se necesita una estimación más precisa de A. Es decir.5 y A = 0. podría realizarse una segunda iteración utilizando un número mayor de valores. Una vez que se ha seleccionado un valor de Apor el método de Box-Cox. Observe que no es posible seleccionar el valor de Acomparando directamente las sumas de cuadrados del error obtenidas en los análisis de varianza de yA. surge un problema con y cuando A = O.14-1 RESPUESTAS y TRANSFORMACIONES NO NORMALES 591 plo.1 )/A tiende a un límite de In y. Este valor de Ase encuentra generalmente construyendo una gráfica de SSE(A) contra Ay leyendo después en la gráfica el valor de Aque minimiza SSE(A). Obviamente. El componente del divisor )/ . todos los valores de la respuesta son una constante. es un mínimo. O (14-1) A=O donde y = ln-1[(1/n) L lny] es la media geométrica de las observaciones. una transformación será razonablemente eficaz para conseguir de manera simultánea más de uno de estos objetivos. Además. en cuyo caso se usa In y. La estimación de máxima verosimilitud dd es el valor para el que la suma de cuadrados del error. el experimentador puede analizar los datos utilizando ¡ como la respuesta. Se ha señalado ya que la familia de potencias de las transformacionesy* =¡ es muy útil. esto implica (como se señaló antes) que los datos no soportan la necesidad de una transformación. 50 SSE(A) 7922. Puesto que estos límites de confianza no incluyen el valor 1.11 687.96 46.10 232.52 91.25 1. se obtienen los límites de confianza inferior y superior deA deA.50) que se usó en realidad se justifica con facilidad. Observe que la escala vertical de la gráfica de la figura 14-2 es ln[SSe(A)]. Los resultados concuerdan en gran medida con los cálculos manuales resumidos en el ejemplo 14-1.25 0. .1.25 0.= 0.61 62.50 0. en la que se observa que A =0. 592 CAPÍTULO 14 14~ OTROS TÓPICOS DE DISEÑO Y ANÁLISIS EJEMPLO 1 . Un intervalo de confianza aproximado de 95% paraA se encuentra calculando la cantidad SS* de la ecuación 14-2 de la siguiente manera: SS· = SSE(A) (1+ t~.61 Al representar SS* en la gráfica de la figura 14-1 y al leer los puntos de la escala A donde esta recta interseca la curva.82 208. y la transformación de la raíz cuadrada (A = 0.75 1. Recuerde que se trata de un experimento con un solo factor (ver la tabla 3-7 para los datos originales).99 35.12 En la figura 14-1 se muestra una gr~fica de los valores próximos al mínimo. El procedimiento de Box-Cox se ilustrará utilizando los datos de la descarga pico presentados originalmente en el ejemplo 3-5.in .00 0..08 109.00 [1 + (2.77. Algunos programas de computadora incluyen el procedimiento de Box-Cox para seleccionar una transformación de la familia de potencias.00.42 40.27y A+ = 0.00 -0. En la figura 14-2 se presenta la salida de este procedimiento como se implementa en Design-Expel1 para los datos de la descarga pico.~~6)2 ] = 42. es correcto el uso de una transformación. Utilizando la ecuación 14-1 se calcularon los valores de SSE(A) para varios valores de A: A -1.52 produce un valor mínimo de aproximadamente SSE(A) = 35.50 -0.~20 ) = 35.00 1. . 0.. Figura 14-1 14-1.5) 20.58 -3 -2 -1 o Lambda 2 3 Figura 14·2 Salida de Design-Expel't para el procedimiento de Box-Cox.14 ::J 'O 'iij ro ~ --' ~ 11. Gráfica de SSE(A) contra A para el ejemplo Gráfica de Box-Cox transformaciones de potencias Gráfica de DESIGN-EXPERT Descarga pico Lambda Corriente=1 Mejor = 0.95 c: 7.00 1.291092 Intervalo de confianza alto = 0.25 /. 0.50 0. ..25 /.14-1 RESPUESTAS Y TRANSFORMACIONES NO NORMALES 593 110 100 90 80 70 ~ 60 50 40 30 20 10 O 0.27 0.541377 Intervalo de confianza bajo = 0.00 0.75 /.32 16.77 1.-.791662 Transformación recomendada Raíz cuadrada (Lambda = 0.76 3.+. En un modelo lineal generalizado. Sin embargo. Por último. McCullagh y Nelder [76] ofrecen un completo estudio de los modelos lineales generalizados y Myers y Montgomery [85b] proporcionan un tutorial. Un problema más serio es que una transformación puede resultar en un valor sin sentido para la variable de respuesta en alguna porción del espacio de los factores del diseño que es de interés para el experimentador. el modelo del experimento ha producido una predicción evidentemente no confiable justo en la región donde sería deseable que este modelo tuviera un buen desempeño predictivo. el experimentador se interesa en el número de defectos. de Poisson. El modelo lineal generalizado contiene la ecuación 14-3 como un caso especial. Es probable que esto suceda en situaciones en las que el número real de defectos observados es pequeño.2 CAPÍTULO 14 OTROS TÓPICOS DE DISEÑO Y ANÁLISIS Modelo lineal generalizado Con frecuencia las transformaciones de datos son una forma muy eficaz de abordar el problema de las respuestas no normales y de la desigualdad asociada de la varianza. Se trata de un enfoque desarrollado por Nelder y Wedderburn [87] que en esencia unifica modelos lineales y no lineales con respuestas normales y no normales. Como se ha visto en la sección anterior. Es decir. También se presentan detalles adicionales en el material suplementario del texto de este capítulo. está constituido por un componente aleatorio (lo que se ha llamado generalmente el término del error) y una función de los factores del diseño (las x) y algunos parámetros desconocidos (las f3). puede haber problemas asociados con el uso de una transformación de datos. inducir la normalidad y simplificar el modelo. Un modelo lineal generalizado es básicamente un modelo de regresión (el modelo de un diseño experimental también es un modelo de regresión). los experimentadores adoptarán por lo general con rapidez la nueva métrica. bi· . Una alternativa del enfoque típico de la transformación de datos seguida del análisis estándar de mínimos cuadrados de la respuesta transformada es usar el modelo lineal generalizado. suponga que se ha usado la transformación de la raíz cuadrada en un experimento que incluye el número de defectos observados en obleas de semiconductores. y para alguna porción de la región de interés la raíz cuadrada predicha del conteo de defectos es negativa. y la media de la variable de respuesta y es (14-4) A la parte x'p de la ecuación 14-4 se le llama predictor lineal. Se ofrecerá un panorama general de los conceptos y se ilustrarán con dos ejemplos breves. la variable de respuesta puede tener cualquier distribución que sea un miembro de la familia exponencial. el método de Box-Cox es una forma sencilla y eficaz de seleccionar la forma de la transformación. Como todos los modelos de regresión. Por otra parte. Por ejemplo. En un modelo de regresión lineal de la teoría normal estándar se escribe (14-3) donde se supone que el término del error e tiene una distribución normal con media cero y varianza constante. No existe la seguridad de que una transformación conseguirá eficazmente todos estos objetivos al mismo tiempo. no en la raíz cuadrada del número de defectos. Un problema es que el experimentador puede sentirse incómodo al trabajar con la respuesta en la escala transformada.1. si una transformación en realidad tiene éxito y mejora el análisis y el modelo asociado de la respuesta. Por consiguiente.1. Esta familia incluye las distribuciones normal. o en la resistividad en lugar del logaritmo de la resistividad. es frecuente el uso de transformaciones a fin de estabilizar la varianza.594 14. como se señaló en la sección 14-1. . . . pueden hacerse inferencias y la verificación de diagnósticos para un modelo lineal generalizado. . . . . . . . •. . el experimentador debe especificar una distribución de la respuesta y una función de enlace. . la relación entre la media de la respuesta f-l y el predictor lineal x'P se determina por una función de enlace. Después se hace el ajuste del modelo o la estimación de los parámetros por el método de máxima verosimilitud. esto se reduce a los mínimos cuadrados estándares. . Observe asimismo que en un modelo lineal generalizado. . . . . . . Bisgaard y Fuller realizaron un interesante y útil análisis de estos datos para ilustrar el valor de la transformación de datos en un experimento . por lo que la familia exponencial es una colección rica y flexible de distribuciones aplicables en muchas situaciones experimentales. . Utilizando un enfoque que es análogo al análisis de varianza de datos de la teoría normal. g(f-l) = x 'fJ El modelo de regresión que representa la respuesta media está dado entonces por (14-5) E(y) = f-l = g-l(x'fJ) (14-6) Por ejemplo. la varianza de la variable de respuesta no tiene que ser una constante. •. Además. Como otro ejemplo. . . Otra función de enlace importante que se usa con datos binomiales es el enlace logit lo (1 f-l) = x'fJ Esta elección de la función de enlace lleva al modelo 1 f-l = 1 +ex'P ~ (14-9) (14-10) Hay muchas elecciones posibles de la función de enlace. . . . la varianza de la respuesta es exactamente igual a la media. El experimento de los defectos en las rejillas En el problema 8-29 se introdujo un experimento para estudiar los efectos de nueve factores sobre los defectos en rejillas de planchas moldeadas de recuadros abiertos. . pero debe ser siempre monótona y diferenciable. . . •. el enlace log (logarítmico) 1o(f-l) = x'fJ produce el modelo (14-7) f-l = ex'P (14-8) El enlace logarítmico se usa con frecuencia con datos de conteos (respuesta de Poisson) y con respuestas continuas que presentan una distribución que tiene una cola larga a la derecha (la distribución exponencial o gamma). . Por ejemplo. .14-1 RESPUESTAS Y TRANSFORMACIONES NO NORMALES 595 nomial. . Referirse a Myers y Montgomery [85b] para los detalles y ejemplos. . . . Dos paquetes de software que soportan el modelo lineal generalizado son SAS (PROC GENMOD) Y S-PLUS. exponencial y gamma. . . . si la respuesta es de Poisson. . a la función de enlace que lleva al modelo de regresión lineal ordinario en la ecuación 14-3 se le llama enlace identidad. . puede ser una función de la media (y de las variables predictoras a través de la función de enlace). . . Para los modelos de regresión lineal o de diseños experimentales ordinarios con una varia1?le de respuesta normal. Para usar un modelo lineal generalizado en la práctica. el cual para la familia exponencial resulta ser una versión iterativa de los mínimos cuadrados ponderados. ya que¡l = g-\x'P) = x'p. EJEMPLO 14~ 2 . \JI \O 01 Tabla 14-1 Análisis de mínimos cuadrados y del modelo lineal generalizado para el experimento rejilla de recuadros abiertos Utilizando métodos de mínimos cuadrados con la transformación de los datos de la raíz cuadrada modificada de Freeman y Tukey Transformados Valor predicho 5.14.45 8.62.14.71.31) (2. enlace log (logarítmico)] Valor predicho 51.87. 0.08) (2.5.3.71 * 3.62.61.42.36 11.7.84 8.23.76 21.0. 0.47 Intervalo de confianza de 95% (4.86) (-0.78) (2.71 * Intervalo de confianza de 95% (16.69.56) (0.98) (0.04) (16.. 0.46.84 8.42.52 3.6.78) (2.80 1. 4.42) (4.13 0.09 16.2.45 18.16.96 8.70 15.60.46.3.59 29.14 7.2. 19.08 -0.87.98) (1.43) (-1.45 19.39 6.¡J .78 3.31) (2.36) (0. 2.29 Observación 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 "i~ .45.45 1.10) (0.76 21.36) Modelo lineal generalizado [respuesta de Poisson.89) (0. 10.07 5.96 3.17.91 1.15.14.08) (2.50 1. 3.47 1.74 0.41) (6.14.04.36 11.86) (0.60.17.61.97 * * GLM (modelo lineal generalizado) 19. 7.13.26 11.29 2.85) (2.5.89) No transformados Valor predicho 29. 16.39 * * 10.94) (0.45.65.14 7.08 -0.12 4.74 1.32) (42.19 1.31) (0.52 3.41) (*.65) (*. 3.25.09 16.56) (0.45 8.88 1.94) (0.5.28.09. .10) (*.42) (0.65. 2.96 8.13 0.85) (2.60.23.49) (4. 1.41) (*. 8.45 18.90) (8.88) (1.32) (0.09.50 1.35 1.38) (1.30) (5.78 0. 4.45.82.54 0. 19.25.47 5.0.82.59 6.6.4. 27. 27.61. 1.2.07 1.15.04) (1. 8.54 1.81 0.65) (1.71.45.16.31) (-0. 16.30) (5.90) (8.19 Intervalo de confianza de 95% (42.0. 61.96 10.43) (-1.88 51.96 3.26 11.38) Longitud del intervalo de confianza del 95% Mínimos cuadrados 29. 12.04.47 5.95 1.49) (4. 2.4.69.81 0.95 1.60.28.70 15.50 3. 10.41) (6.91 29.88) (1. 12.12 0.12 1.50 3.12 4.35 2.5.80 1.13. Bajo el encabezado "Transformados". Un valor predicho negativo es claramente ilógico. el modelo puede ser no confiable. los autores utilizaron una modificación de la transformación de la raíz cuadrada que llevó al modelo (. la primera columna contiene la respuesta predicha. las x representan los factores del diseño codificados.Jy+ 1) /2= 2. La predicción no fue una de las metas originales. Esto produce el modelo y = e (L128-0. ••••••••••• • . La respuesta es el número de ciclos hasta una falla. Esto no deberá tomarse como una crítica del experimento original ni del análisis de Bisgaard y Fuller. 772x 2 x 7 donde. En la última sección de la tabla se comparan las longitudes de los intervalos de confianza de 95% para la respuesta no transformada y el modelo lineal generalizado (GLM).L176x 6 -o. Observe que hay dos valores predichos negativos.14-1 RESPUESTAS Y TRANSFORMACIONES NO NORMALES 597 diseñado.21x 6 - O. y tampoco fue el objetivo del análisis realizado por Bisgaard y Fuller. Se encuentra que el logaritmo de los datos . Esto es un sólido indicio de que el enfoque del modelo lineal generalizado ha explicado la variabilidad y ha producido un modelo superior en comparación con el enfoque de la transformación.513. si hubiera sido importante obtener un modelo de predicción. Los datos se analizaron inicialmente utilizando el enfoque estándar (mínimos cuadrados). Observe que esto ocurre donde los conteos observados fueron pequeños. . los datos de confiabilidad como éstos son no negativos y continuos. 737 x. y la transformación de datos fue necesaria para estabilizar la varianza. El experimento del hilado de estambre En la tabla 14-2 se presenta un diseño factorial 33 que se realizó para investigar el desempeño de un hilado de estambre bajo ciclos de carga repetida.) La tercera sección de la tabla 14-1 contiene los valores predichos de este modelo y los intervalos de confianza de 95% para la respuesta media en cada punto del diseño (obtenida con el procedimiento PROC GENMOD de SAS). Sin embargo. no fue posible calcular los valores de todas las entradas de esta sección de la tabla. No hay valores predichos negativos (lo cual se asegura con la elección de la función de enlace) ni límites de confianza inferiores negativos. Como se señaló en el inciso f del problema 8-29. Observe que los intervalos de confianza del modelo lineal generalizado son uniformemente más C01toS que sus contrapartes de mínimos cuadrados. así como límites de confianza inferiores negativos. Fue un experimento de exploración en extremo exitoso que definió con toda claridad las variables importantes del proceso.••••••• 11 ••••••••••••••••••••••••••••••••••••••••••••••••••••• EJEMPLO 14~3 . Esta transformación hace un excelente trabajo para estabilizar la varianza del número de defectos.O.896x. Puesto que hubo algunos valores predichos negativos. El encabezado "No transformados" presenta los valores predichos no transformados. Si es importante usar el modelo para predecir el desempeño en esta región. El experimento se describe completo en Box y Draper [16b].x. Myers y Montgomery usan un enlace lag (logarítmico) (ecuación 14-7) y una respuesta de Poisson para ajustar exactamente el mismo predictor lineal dado por Bisgaard y Fuller. En las dos primeras secciones de la tabla 14-1 se presenta parte de la información acerca de este modelo. y con frecuencia tienen una distribución con una cola derecha alargada. como de costumbre.JY +. probablemente un modelo lineal generalizado habría sido una buena alternativa para el enfoque de la transformación. De manera típica.996x ~ 4 -1. La respuesta es en esencia una raíz cuadrada del conteo de los defectos. junto con los intervalos de confianza de 95% para la respuesta media en cada uno de los 16 puntos del diseño. El modelo es logy= 2 751+0.3617x1 .5 3.598 CAPÍTULO 14 OTROS TÓPICOS DE DISEÑO Y ANÁLISIS Tabla 14-2 El experimento del hilado de estambre Ciclos hasta una falla 674 370 292 338 266 210 170 118 90 1414 1198 634 1022 620 438 442 332 220 3636 3184 2000 1568 1070 566 1140 884 360 Logaritmo de los ciclos hasta una falla 2. junto con los intervalos de confianza de 9i% para la respuesta media de cada uno de los 27 .15 3. El modelo que resultó es y = e6.34 3.83 2.07 1.03 2. 6313x2 -0.Z739x2 -0.8 3.1711x 3 o en términos de la respuesta original.01 2.47 253 2.19 3.64 2.8425x¡ -O.56 Corrida 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 Xl X2 X3 -1 -1 -1 -1 -1 -1 -1 -1 -1 O O O O O O O O O 1 1 1 1 1 1 1 1 1 -1 -1 -1 O O O 1 1 1 -1 -1 -1 O O O 1 1 1 -1 -1 -1 O O O 1 1 1 -1 O 1 -1 O 1 -1 O 1 -1 O 1 -1 O 1 -1 O 1 -1 O 1 -1 O 1 -1 O 1 de los ciclos hasta una falla produce un modelo adecuado en términos del ajuste global del modelo.1711x3 • Este experimento se analizó también utilizando el modelo lineal generalizado.65 2.95 3. así como gráficas satisfactorias de los residuales.56 3.08 2.79 2.3 3. -0.52 2.3617.75 3.95 2.23 2. Se usó exactamente la misma forma del modelo encontrada por el análisis de mínimos cuadrados de la respuesta con la transformación logarítmica.2739xz .06 2.O.O.57 2.3489+0. y= 10Z' 751+0.3851x3 • En la tabla 14-3 se presentan los valores predichos del modelo de mínimos cuadrados y del modelo lineal generalizado.42 2.32 2. seleccionando la distribución gamma para la respuesta y el enlace lag (logarítmico).<. ciclos hasta una falla. 74) (859.77.52 130.35.00 512. 4292.00) (1200.47) (162.58 162.99 131. '-j • ~'-.33.67.91.39 72.1215.827.49 2.!.93) (112.190. "r·~·~··· .86) (523.23 1089.88 1641. 930.92.421.35) (3.00) (894.11 2. 336.00.37) (3034.49) (317.93. 2215. 2.2.10) (165. 1189.84 444.34 480. 2226.50.11 2433.15.19.49.52.99.560. 533.20 3.88 1295.15) Longitud del intervalo de confianza del 95% GLM (modelo Mínimos lineal cuadrados generalizado) 237.78) (2. 3.00) (1462.91) (594.29.45 464. 2.97.99.10 204.17 206.12 1.94 3.28 3. 2.92 211.64) (1656.08) (2.81 722.14.43.44) (759.13.2.94 3..07 304.29) (3.56 2.54) (1353.01.FSHi=Et7F.74 61.00 1328. 606.48 186.234.70 78.811.51) (393. 2821.25 244. ~M .2.104.00 495.37) (3.22) (407.81. 1470. 2833.50 840.515.33 130. 3.62) (2.65..64) (76.14 259.00 2497.229.64.08) (2. 3. 1797.18) (1. 803.00 270. 1455.97) (383.45) (3.. 2.95 1257.43) (412.52) (397.37 48.2.42.02 2.28 1058. 191.3.00 1699.76.24.96 42.46.28 713.50.00.79 57.46) (260.83 2.54 571.01 2.00 216.83.799..27) (3165.34.3.80.13. 938. 3.25 379.21 571.15) (73.97) (2.2. 1012.75.85 2.71) (2.26 167.87.87.426.26) (2.66.70..09 107.03.526.40) (2099.43.04) (536.69. 609.38) (351.22 356.1189.48 2.336.84 2.41 563.42.15 53.58. """'"1 . 2. '".38 87.93.66 2.65 2.2. 2. 3.4 Tabla 14-3 Análisis del modelo de mínimos cuadrados y del modelo lineal generalizado para el experimento del hilado de estambre Métodos de mínimos cuadrados con la transformación logarítmica de los datos Transformados Intervalo de confianza de 95% (2.60. 2.87.00 1075. 1951.53) (2.31 3.00 235.64) (271.63) (1380. 151.36) (2.06.01 361. 148.26 310.507.59 94.67.22 26.58 2.56 3.44) (2.38 363.00) (2200.29 2.21 182.75 2.28) (941.830.45 407.00.91) (2.67 Valor predicho 682.00 94.63) (2.74) No transformados Intervalo de confianza de 95% (573.02) (3.67.87 389.50 460.28) (390.35 1920.94.2.:.08 447.00.223.34 247.72.00) (620. 365.75.77 195..60) (615.86 0.67 835.2. 1205..37) (743.42 58.54) (275.92 2.39 2.92) (2.00 633.38 38.70) (115. 2..53.07.85 202.57) (2.53. 2. 275.28) (2.88.97 67.98) (174.412. 272..63) (3.59.85 310.55.21.44 147.24..79) (753.22 88.98 89.92 1569.59.98 303.05.90) (2.15.00) (644. 369.32) (1390.93." Observación 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 \.28) (182.235.430.1l Valor predicho 2.00) (972.62 465.04 209.09 170.96 246.82 70.35 689.94 \ Valor predicho 680.55 192.12 1580..00 731.00 315.58 49.16 3609.33) (222. 103.53.00) (793.39 873.20 193.63 299.00.79.90) (1152.2.00 706.01 33. 1974.06) (313.39 119. 3.57 \O \O \ .51) (147.00.30) (142.23 59.95 3670.16) (2.39 3.55.00) (1720. 552.32.79.52 463.97) Modelo lineal generalizado Intervalo de confianza de 95% (583.87 113.51 1038.00 1952. 4254.96 165.42.69 30. 3.05.98.57 569. 1029.35) (266.67 136.67 83.11) (217.45 108.73) (2. 1819.01) (2.46) (337.22 3.60.48.57 1022.00 903.22..22 2.81. 793. l. IJ =-II ll. La propiedad de ortogonalidad de los efectos principales y las interacciones. se trata del caso de los datos proporcionales. pero debido a problemas imprevistos cuando se corre el experimento. Por consiguiente. = L~=l L~=l nij el número total de observaciones. los cuales resultan en la pérdida de algunas observaciones. = L~=l llij el número de observaciones en el renglón i-ésimo (el nivel i-ésimo del factor A). Suponga que el número de observaciones en la celda ij-ésima es nij' Además. el número de observaciones en la celda ij-ésima es ll . encontrará una aplicación más amplia en el ámbito de la investigación y el desarrollo industrial general. los casos en que en cada celda hay el mismo número II de observaciones. (14-11) Esta condición implica que el número de observaciones en dos renglones o columnas cualesquiera es proporcional. centrando la atención en el caso del modelo de efectos fijos con dos factores. Sólo . el análisis de factoriales no balanceados es mucho más difícil que el de los diseños balanceados. Conforme más paquetes de software incluyan esta capacidad. II . De manera alternativa. Cuando ocurren datos proporcionales. puede emplearse el análisis de varianza estándar.. termina trabajando con datos no balanceados. ••••••••••••••••••••••••••••••••••••••••••••••••••••••• o ••••••••••••••••• Los modelos lineales generalizados han encontrado amplia aplicación en la investigación y el desarrollo biomédico y farmacéutico. Estos diseños factoriales no balanceados ocurren por varias razones. La comparación de las longitudes de los intervalos de confianza revela que es posible que el modeÍo lineal generalizado sea un mejor predictor que el modelo de mínimos cuadrados. Por ejemplo. Por otra parte. ciertas combinaciones de tratamientos pueden ser más costosas o más difíciles de correr que otras. algunas combinaciones de tratamientos pueden ser de mayor interés para el experimentador debido a que representan condiciones nuevas o no exploradas. es común encomrar situaciones en las que el número de observaciones en las celdas son desiguales. Datos proporcionales: un caso sencillo Una de las situaciones que incluye datos no balanceados presenta escasa dificultad para el análisis. 14~2. por lo que puede optar por obtener réplicas adicionales de dichas celdas. Por ejemplo. por lo que pueden hacerse menos observaciones en esas celdas. no es válida en el caso no balanceado. algunos experimentos no balanceados se diseñan expresamente de este modo. 14~2 DATOS NO BALANCEADOS EN UN DISEÑO FACTORIAL El centro de atención principal de este libro ha sido el análisis de diseños factoriales balanceados. sea lli. es decir. En esta sección se ofrece un breve panorama general de los métodos para abordar los factoriales no balanceados..1 . Es decir. Esto significa que las técnicas del análisis de varianza usual no son aplicables. Sin embargo. presente en los datos balanceados.600 CAPÍTULO 14 OTROS TÓPICOS DE DISEÑO Y ANÁLISIS puntos del diseño.). sea II J = L ~=1 llij el número de observaciones de la columnaj-ésima (el nivelj-ésimo del factor B) y seall. el experimentador puede haber diseñado inicialmente un experimento balanceado. . --ll i . . Esto Tabla 14-4 Tipo de material Experimento del diseño de la batería con datos proporcionales Temperatura. i=1 j=1 ij Como un ejemplo de datos proporcionales. Y. = 10 40 75 115 139 70 /1']3 Y1.1 se tienen _ 111 n 1 _ 10(8) _ 4 1111 11 20 observaciones.~ nj 11 SS ~ = L.2.:: = 2160 . = 5 Y2.. 14~2.2 Métodos aproximados Cuando los datos no balanceados no se apartan demasiado del caso balanceado. Tanto el tipo de material como la temperatura son significativos.. los datos son proporcionales..Y.2 = 8 Y. = 581 /1 3. - SSE = SST - SS A SSB - SS ~ = ~±~ i=1 j=1 k=1 Y~k. considere el experimento del diseño de la batería del ejemplo 5-1..~ -SS A -SSB llij 11.Y. = 1122 n3 = 4 Y. = 769 = 1 96 /1.. lo cual concuerda con el análisis del conjunto completo de datos del ejemplo 5-1.~.~± ~~.J ~~ i=1 j=1 Y~. las cuales quedan como SST = 2:2:2: i=1 j=1 k=1 a b nij SS A SSB ~ = L.JL. . 1 8 Y.14-2 DATOS NO BALANCEADOS EN UN DISEÑO FACTORIAL 601 es necesario hacer modificaciones menores en las fórmulas del cálculo manual de las sumas de cuadrados.3. = 269 = 20 Y. Desde luego. 11 2 2 = 2: j=1 b Y. En la tabla 14-4 se muestra una versión modificada de los datos originales. en la celda 1. °F 15 /1 11 70 /1 12 125 /1 13 1 2 3 =4 130 74 155 180 126 160 = 4 34 80 = 2 58 /11. la interacciónque se observó en el ejemplo 5-1 no está presente. en ocasiones es posible usar procedimientos aproximados que convierten el problema no balanceado en uno balanceado.1. = 683 /1 /1 31 /132 /1 33 150 /1. Los resultados que se obtienen al aplicar el análisis de varianza usual a estos datos se presentan en la tabla 14-5. = 5 Y3.J i=l a Yi.. Sin embargo. por ejemplo. /1 21 = 2 159 = 2 138 = /1 22 = 2 136 = 2 = 1 45 = 896 /1 2. es necesario decidir cuándo los datos no son lo suficientemente diferentes del caso balanceado para hacer que el grado de aproximación introducido sea relativamente de escasa importancia. En la práctica.875 5.085. la estimación del valor faltante en la celda ij-ésima que minimiza la suma de cuadrados del error es Yij' Es decir.85 1.44 1. Una alternativa es apartar una de las observaciones de la celda 2. pero el análisis de datos balanceados es tan sencillo que con frecuencia el experimentador se ve tentado a usarlo. Por ejemplo. Evidentemente.907. La observación que se aparte deberá elegirse al azar.:. para obtener así un diseño balanceado con 11 = 4 réplicas. El valor estimado se trata como un dato real. podría reintegrarse al diseño. un procedimiento razonable es estimar los valores faltantes. el valor faltante se estima tomando el promedio de las observaciones que están disponibles en esa celda. que el análisis sea tan sólo aproximado. Se supone que todas las celdas contienen al menos una observación (es decir.1 '¡I ji 602 CAPÍTULO 14 OTROS TÓPICOS DE DISEÑO Y ANÁLISIS 11 11 ¡¡ Tabla 14-5 Fuente de variación )1 Análisis de varianza de los datos del diseño de la batería de la tabla 14-4 Suma de cuadrados 8.2 sólo tiene una observación más que las otras. en lugar de descartar completamente la observación. A continuación se describen brevemente algunos de estos métodos aproximados.150.090. estimar el único valor faltante de la celda 2. considere el diseño no balanceado de la tabla 14-6. Apartado de datos Considere los datos de la tabla 14-7.045.20 8.2.18 hace.000 39. Por ejemplo. se usarían 26 grados de libertad en lugar de 27. si se estima el valor faltante en la celda 2.170. 11ij 2': 1). Observe que la celda 2. después elegir al azar otra observación para apartarla y re- Tabla 14-6 Los valores nij para un diseño no balanceado Columnas 1 4 4 4 2 4 3 4 3 4 4 4 Renglones 1 2 3 .000 Grados de libertad 2 2 4 11 19 Cuadrado medio 4.725 8.400 16.2 de la tabla 14-6. Estimar los valores faltantes de las ocho celdas restantes quizá no sea una buena idea en este caso.981.2 es un enfoque razonable. Estimación de observaciones faltantes Si sólo unas cuantas 11ij son diferentes. desde luego. La única modificación del análisis de varianza es reducir los grados de libertad del error en el número de observaciones faltantes que se han estimado.93 816.45 :11 1'1 '[ . Para un modelo con interacción. Además. Tipos de material Temperatura Interacción Error Total Fo 5.[ .00 9.476. ya que esto resultaría en estimaciones equivalentes a cerca de 18% de los datos finales. se esperaría. las columnas y la interacción no se distribuyen como una variable aleatoria ji-cuadrada..)= i=l j=l ah = ~ LL ah i=l j=l 2 a b 1 11ij (14-13) Utilizando MSE de la ecuación 14-12 para estimar er en la ecuación 14-13.. -ah grados de libertad) que se usará en el análisis de varianza. V(Yij. Y. Si lo hacen.. propuesto también por Yates [113a].14-2 DATOS NO BALANCEADOS EN UN DISEÑO FACTORIAL 603 Tabla 14-7 Los valores n. ver Searle [99a] y Speed. La ventaja principal del método parece ser la simplicidad de los cálculos. así como Hocking y Hackney [106]. El cuadrado medio del error se encuentra como a b nij MS E = _i=_l.)2 _ -ah (14-12) Entonces. .j para un diseño no balanceado Columnas Renglones 1 2 3 1 4 4 4 2 4 5 4 3 4 4 4 petir el análisis. Sin embargo. los promedios de las celdas se tratan como si fueran datos y son objeto de un análisis de datos balanceados estándar para obtener las sumas de cuadrados de los renglones. Cuando las 11ij no difieren de manera radical. El método de las medias no ponderadas es un procedimiento aproximado porque las sumas de cuadrados de los renglones. se obtiene MS~=MSE!± ~ ah i=l j=l 11ij (14-14) como el cuadrado medio del error (con 11. y como la varianza del promedio de la celda ij-ésima es er/11ij' el cuadrado medio del error que se usa en realidad en el análisis de varianza deberá ser una estimación de la varianza promedio de las Yij. una observación individual. pero los términos de las sumas de cuadrados se ponderan en proporción inversa a sus varianzas. En la práctica es improbable que ocurra esta confusión cuando sólo se aparta un número reducido de observaciones y la variabilidad dentro de las celdas es pequeña. el método de las medias no ponderadas funciona con frecuencia razonablemente bien. se ha realizado un análisis de varianza de los promedios de las celdas. Método de las medias no ponderadas En este enfoque. Esta técnica se basa también en las sumas de cuadrados de las medias de las celdas. estos dos análisis no llevarán a interpretaciones antagónicas de los datos. por ejemplo a b 2 " " a LJLJ /11 IJ .:j_=l_k_·=_l 11 LLL(Yijk . la varianza de Yijk. MS E estima er. se sospecha que la observación que se apartó es un valor atípico o disparatado y deberá manejarse en consecuencia. las columnas y la interacción.. Una técnica relacionada es el método de los cuadrados ponderados de las medias. introducido por Yates [IBa]. Para mayores detalles de este procedimiento..Yij. Speed. suponga quex no puede ser controlada por el experimentador. El software de estadística SAS proporciona un excelente enfoque del análisis de datos no balanceados a través del procedimiento PROC GLM. La prueba t pareada fue el procedimiento ilustrado en el capítulo 2. y Milliken y Johnson [79]. Hocking y Speed [58]. . por ejemplo x. Sin embargo. las hipótesis que se están probando no siempre son análogos directos de las del caso balanceado. El enfoque utilizado para desarrollar las sumas de cuadrados para probar los efectos principales y las interacciones consiste en representar el modelo del análisis de varianza como un modelo de regresión. y que y se relaCiona linealmente conx. pero puede observarse junto con y. Además. como cuando ocurren celdas vacías (algunas ll ij = O) o cuando las llij presentan diferencias radicales. el procedimiento es una combinación del análisis de varianza y del análisis de regresión. ajustar ese modelo a los datos y usar el enfoque de la prueba general de significación de la regresión. El análisis de covarianza implica ajustar la variable de respuesta observada para el efecto de la variable concomitante.3 CAPÍTULO 14 OTROS TÓPICOS DE DISEÑO Y ANÁLISIS Método exacto En situaciones en que los métodos aproximados no son apropiados. Hackney y Speed [57]. el experimentador debe usar un análisis exacto. y su interpretación tampoco es siempre sencilla. Por lo tanto. Speed y Hocking [105]. Si no se hace este ajuste. y estos métodos pueden producir valores diferentes para las sumas de cuadrados. 14~3 ANÁLISIS DE COYARIANZA En los capítulos 2 y 4 se introdujo el uso del principio de la formación de bloques para mejorar la precisión con la que se hacen comparaciones entre tratamientos. Searle. ver el material suplementario del texto de este capítulo. la variable concomitante podría inflar el cuadrado medio del error y hacer que sean más difíciles de detectar las verdaderas diferencias en la respuesta debidas a los tratamientos. A la variable x se le llama variable con· comitante o covariable. Como se verá. Hocking. En general.604 14~2. Para mayor información al respecto. Otras buenas referencias son Searle [99a]. Searle [99c]. Además. el principio de la formación de bloques puede usarse para eliminar el efecto de los factores perturbadores controlables. El análisis de covarianza es otra técnica que en ocasiones es útil para mejorar la precisión de un experimento. Speed y Henderson [102]. mientras que en el capítulo 4 se presentó el diseño de bloques aleatorizados. Suponga que en un experimento con una variable de respuesta y existe otra variable. existen varias formas en que puede hacerse esto. Como un ejemplo de un experimento en ef que puede emplearse el análisis de covarianza. el análisis de covarianza es un método de ajuste para los efectos de una variable perturbadora no controlable. considere el estudio realizado para determinar si existe una diferencia en la resistencia de una fibra de monofilaTabla 14-8 Datos de la resistencia a la ruptura (y = diámetro en 10-3 pulgadas) = resistencia en libras Máquina 3 yx Máquina 1 y x Máquina 2 y x y x 36 41 39 42 49 207 20 25 24 25 32 126 40 48 39 45 44 216 22 28 22 30 28 130 35 37 42 34 32 180 21 23 26 21 15 106 . Hocking y Hackney [106]. [3 es el coeficiente de regresión lineal que indica la dependencia de Y¡¡ dexij y Sij es un componente del error aleatorio. x Figura 14-3 Resistencia a la ruptura (y) contra el diámetro de la fibra ~"l:). Suponiendo que existe una relación lineal entre la respuesta y la covariable. que la pendiente [3 :.. j -x )+s 1) .~ r :! 14-3 ANÁLISIS DE COVARIANZA 605 50 45 '" ~ 15. que la suma de los efectos de los tratamientos es cero (L~=l 'ti = O) Yque la variable concomitantex¡¡ no se afecta por los tratamientos.1 Descripción del procedimiento A continuación se describe el procedimiento básico para el análisis de covarianza. Los datos de este experimento se muestran en la tabla 14-8.) x. { j= 1. La variable concomitante de la ecuación 14-15 se expresa como (xij -x. Observe. se tienen efectos de los tratamientos {'tJ. . fl es la media global. = fl+'t·t +[3(x i . ilustrándolo para un experimento de un solo factor con una covariable. Se supone que los errores Sij son NID(O. . if). 40 2 .!!l ro ro c: ::l '" '¡¡. En la figura 14-3 se presenta un diagrama de dispersión de la resistencia (y) contra el diámetro (o grosor) de la muestra. 35 tí ID c: ID 30 O 10 20 30 40 Diámetro.. por consiguiente. El análisis de covarianza podría usarse para eliminar el efecto del grosor (x) sobre la resistencia (y) cuando se prueban las diferencias en la resistencia entre las máquinas. EJ donde Yij es la observaciónj-ésima de la variable de respuesta tomada bajo el tratamiento o nivel i-ésimo del único factor. . 2. como en un análisis de varianza de un solo factor. un modelo estadístico apropiado es i = 1. la corrida ij-ésima). y un coeficiente de regresión [3. una fibra más gruesa será por lo general más resistente que una delgada.a (14-15) y. mento producida por tres máquinas diferentes. 'ti es el efecto del tratamiento i-ésimo.n .x¡¡ es la medición hecha de la covariable o variable concomitante correspondiente aY¡¡ (es decir.é OYque la verdadera relación entre Yij y xii es lineal. la resistencia de la fibra también se afecta por su grosor. como en una ecuación de regresión. que los coeficientes de regresión de cada tratamiento son idénticos.. es la media de los valoresx¡¡. 14~3. que el modelo del análisis de covarianza es una combinación de los modelos lineales empleados en el análisis de varianza y regresión. Evidentemente.. 2. Es decir.. por la ecuación 14-15.. .: donde f-i es una constante diferente de la media global.Yi. a (14-16) ] .1) . SSE a(n-1)-1 (14-27) con a(n .TJ' E¡y Eu: E. ). .l = ~! i=l j=l j=l j=l (Yij . )= LL XijYij j=l i=l j=l 1 T¡y = n"'" LJ (y .-'I: (14-26) La suma de cuadrados del error en este modelo es SSE = E¡y _(ETJ')2 / Erx.)= S~y -T.) an (14-19) (14-20) (14-21) (14-22) (14-23) (14-24) (14-25) i=l a a 2 2 i. )2 _ = ~LJ ""'"'" X~ ..~~." an 1=1 _ J=l lj S~y = LL (Xij -x. . S = T + E.. )= 1:. donde los símbolos S. Ty E se usan para denotar las sumas de cuadrados y los productos cruzados del total... "íi Yf3 son íl = Ji. Para describir el análisis.TJ' Observe que. .Yi.t). i.606 CAPÍTULO 14 OTROS TÓPICOS DE DISEÑO Y ANÁLISIS en lugar dexij. = n"'" LJ i=1 a (X i.. )2 = LL Y~ i=l j=l j=l i=l a a n n a n a n y2 a.2. ri = Yi.Y. )2 ="'" n LJ 1=1 1 a 2 __ Xi. sin embargo. an 'o X2 = n~ (Xi.. La varianza del error experimental se estima con MS _ E - . T. en general.Y )2 = -"'" n LJ y L an 11 a (X.Y.2..y.Y.x... )(Yij .)2 (Xij -xif = S¡y -T¡y = S. Es más común encontrar la ecuación 14-15 en la literatura sobre el tema. respectivamente. se introduce la siguiente notación: I I S¡y = LL (yij . ..)(y. ) i=l n i".. . = ~! i=l = ~! i=l (Xij -Xi.. )(Yi. los tratamientos y el error. -x.(X. n {i. para que el parámetro f-i se preserve como la media global.). El modelo pudo haberse escrito como 1. )(Yi.u: = LJLJ ""'"'" i=l j=l a 11 (x"IJ .z x2 (14-17) (14-18) S. - 1=1 1=1 Trx. A continuación se indica la forma en que el análisis de covarianza ajusta la variable de respuesta para el efecto de la covariable. Los estimadores de mínimos cuadrados de f-i.~(Xi. que para este modelo es f-i + (Ji. ~ (Xi.1. y f3 = - ~ Exy E.... -X. . Las sumas de cuadrados dexyy deben ser no negativas. las sumas de los productos cruzados (xy) pueden ser negativas.-'I: -Trx.1 grados de libertad.. Considere el modelo completo (ecuación 14-15).X. .. )(Yij . . la diferencia entre SS~ y SSe. a _ 1.2 grados de libertad.. Por consiguiente.. Es instructivo examinar la presentación de la tabla 14-9. proporciona una suma de cuadrados con a -1 grados de libertad para probar la hipótesis de que no hay ningún efecto de los tratamientos.. La fuente de variación "regresión" tiene la suma de cuadrados (Sxy?/Sxx con un grado de libertad. En la ecuación 14-29. (14-28) y puede demostrarse que los estimadores de mínimos cuadrados de Jl y (3 son fl de cuadrados del error en este modelo reducido es = y. observe que SSE es menor que SS~ [ya que el modelo (ecuación 14-15) contiene los parámetros adicionales {r¡}] y que la cantidad SS~ SSE es una reducción en la suma de cuadrados debida alas {r¡}. Parlo tanto. se distribuye como Fa -1. SS~ . para probar Ho:r¡ = O. . Además. a(n -1) -1' Por lo tanto. a(n _ 1) _ l' También podría usarse el enfoque del valor P..~ _-_S_SE"-.. debido a la presencia de la variable concomitante. Se emplea esta presentación porque resume de manera conveniente todas las sumas de cuadrados y los productos cruzados requeridos..( S_S. como se muestra en la trbla 14-9. i = 1. y jJ = Sxy/Sxx. Esta media de los tratamientos ajustada es el estimador de mínimos cuadrados de Jl + r¡.a donde (14-31) jJ= Exy / E xx . se tendría Sxy = Srx.:.E yy = Tyy .) o SSE /[a(n-1)-1] (14-30) F que. si la hipótesis nula es verdadera. ... El error estándar de cualquier media ajustada de los tratamientos es (14-32) . con frecuencia esta tabla se encuentra útil en la interpretación de los datos para presentar las medias de los tratamientos ajustadas.. El modelo (ecuación 14-15) sería entonces Y1). = Jl+(3(x l . Sin embargo.2. En ella el análisis de covarianza se ha presentado como un análisis de varianza "ajustado".:::.oo. la cantidad (Sxy)2/Sxx es la reducción de la suma de cuadrados de y obtenida a través de la regresión lineal de y sobre x.14-3 ANÁLISIS DE COVARIANZA 607 Suponga ahora que no hay ningún efecto de los tratamientos. En la columna de la fuente de variación.. Syy y E yy deben"ajustarse" para la regresión de y sobre x.. Además de utilizarla para probar la hipótesis de que no hay diferencias en los efectos de los tratamientos. (a_-_1-'. se calcula F.:)c-/--'. = Exy = E xx = O. a. en el modelo (ecuación 14-15)..2..1 grados de libertad.SSE. La suma (14-29) con an . Ho:r¡ = Ose rechaza si o > Fa. Entonces la suma de cuadrados del error sería simplementeEyy y la suma de cuadrados de los tratamientos sería Syy . es decir. =. . la variabilidad total se mide por SYY' con an . La suma de cuadrados del error ajustada tiene a(n -1) -1 grados de libertad en lugar de a(n 1) grados de libertad debido a que se ajusta un parámetro adicional (la pendiente (3) a los datos. Si no hubiera ninguna variable concomitante.. Estas medias ajustadas se calculan de acuerdo con T i=1. J -x )+8 lJ. Los cálculos suelen presentarse en una tabla del análisis de covarianza como la tabla 14-10. así como las sumas de cuadrados para probar las hipótesis acerca de los efectos de los tratamientos. cr -[Eyy -(Exy? / E.cr SS~ -SSE =Syy _(Sx¡. SYJ' Error Total Tratamientos ajustados SSE SS~ SS~ = Eyy -(Exy? / E.cr Syy SSE MSE = a(n -1)-1 Tabla 14-10 Análisis de covarianza de un experimento de un solo factor con una covariable Fuente de variación Tratamientos Sumas de cuadrados y productos Grados de libertad x xy Txy Exy Sxy y y Ajustados para la regresión Grados de libertad Cuadrado medio a-1 a(n -1) an-1 T.cr] a-1 a(n -1)-1 an-1 -SSE a-1 -SSE)/(a-1) MSE Error Total SSE = E yy _(Exy)2 / E.cr E.cr = Syy -(S')j / S.)2 / S.cr S.cr Tyy EYJ .cr -SSE a(n -1)-1 an-2 SSE MSE = a(n -1)-1 a-1 SS~ -SSE a-1 :/J .0\ o 00 Tabla 14-9 El análisis de covarianza como un análisis de varianza "ajustado" Fuente de variación Regresión Tratamientos Suma de cuadrados Grados de libertad 1 Cuadrado medio SS~ Fa (SS~ (Sxy?/S. ~ 11 14-3 ANÁLISIS DE COVARIANZA 609 Por último.. más resistentes que las más delgadas. Se selecciona una muestra aleatoria de cinco ejemplares de prueba de fibra de cada máquina. y parece apropiado eliminar el efecto del diámetro sobre la resistencia mediante un análisis de covarianza. a(n -1) _ l' Por lo tanto.60 (362)(603) (3)(5) T ..(603)2 = 140. en general. cabe recordar que se ha supuesto que el coeficiente de regresión {3 del modelo (ecuación 14-15) es diferente de cero.1) -1' = Ose rechaza si Fa > Fa .2. El ingeniero del proceso tiene interés en determinar si existe alguna diferencia en la resistencia a la ruptura de la fibra producida por las tres máquinas. El diagrama de dispersión de la resistencia a la ruptura contra el diámetro de la fibra (figura 14-3) indica una clara tendencia a una relación lineal entre la resistencia a la ruptura y el diámetro. = ![(207)2 +(216)2 +(180)2]. + {3(x . Tres máquinas producen una fibra de monofilamento en una fábrica textil. - =~ ± 1=1 i=l (3)(5) (362)2 . el modelo es " Yl) = j1.~~.13 an 5 (3)(5) an x2 (x. Tu = n T<y 2: x 3 2 l. EJEMPLO 14~4 . . Sin embargo..2'00.-oY / E MS E xx (14-33) que bajo la hipótesis nula se distribuye como F 1.[(126)2 +(130)2 +(106)2]. con las fibras más gruesas." = . 1 l)..= 66. +(15)2 .Yi. +(15)(32) 282..) ~[(126)(207)+(130)(216)+(106)(184)] _ (362)(603) = 96.l.= 261. En la tabla 14-8 se muestra la resistencia de la fibra (y) y el diámetro correspondiente (x) de cada ejemplar.. - ~~. Utilizando las ecuaciones 14-17 a 14-25. La hipótesis H o:{3 = Opuede probarse utilizando el estadístico de prueba F a = (E.40 5 1 X¡.73 (362)2 Sxy = ±± 1=1 )=1 i=l j=l (3)(5) xijYij - (x.40 2:2: ~~1 Su = 2:2: X~ 3 5 oo' x2 --" an an (~(~ = (20)2 +(25)2 + .. Suponiendo que la relación lineal entre la resistencia a la ruptura y el diámetro es apropiada.. ) = (20)(36)+(25)(41)+ oo. -x )+8 lJ. YJ = 1:. Considere el experimento descrito al principio de la sección 14-3.. la resistencia de una fibra se relaciona con su diámetro.+r:.00 (3)(5) . siendo éstas... n 1 ±l_l i=l l..= 346.5 . pueden calcularse 3 5 2 (603)2 SJY = Y~ -~= (36)2 +(41)2 + +(32)2 .3 { j= 1. H o:{3 a(n .. i = 1.. El valor P de este estadístico de la prueba es P = 0.54 70.60 X)' X)' Por la ecuación 14-29 se encuentra SS~ = Syy - (SX)')2 / Sxx = 346.27 con an .1 = 3 .2 = (3)(5) .1) . no hay evidencia sólida de que las fibras producidas por las tres máquinas difieran en la resistencia a la ruptura. 1.61 Al comparar este valor con F O.13= 195.28 con a .60.60 EX).9540 195.60 o MS E 2. La suma de cuadrados para probar H O:7: l = 7:2 = 7:3 = O es SS~-SSE =41.08 y puesto que F O.40 = 206. y el ajuste proporcionado por el análisis de covarianza fue necesario.65.(186.00 = 186.1 = 11 grados de libertad.66.TX -Txx = 261. Por lo tanto.1) .1181. Estos cálculos se resumen en la tabla 14-11.lO .60)2 /195. La estimación del coeficiente de regresión se calcula con la ecuación 14-26 como l3 = EX)' E xx = 186.99 con a(n . = S T = 282. .40 .00 E xx = S.60 = 0. se rechaza la hipótesis de que f3 = O. El estadístico de prueba es F= (EX)')2 / E xx = (186. 73 = 41. Por lo tanto.140.2 = 13 grados de libertad.99/11 = 6. es decir.Tyy = 346. H o:7:¡ = O. por la ecuación 14-30 el estadístico de la prueba se calcula como F o = (SS~-SSE)/(a-1) SSE /[a(n-1)-1] = 13.96.28/2 27.Ol .1 = 2 grados de libertad.00.60 La hipótesis H o:f3 = O puede probarse usando la ecuación 14-33.99 = 13.(186.54 2. Para probar la hipótesis de que las máquinas difieren en la resistencia a la ruptura de la fibra producida. 2.27-27.11 = 2.60)2 1195.86.73.40.610 CAPÍTULO 14 OTROS TÓPICOS DE DISEÑO Y ANÁLISIS E yy = S yy .60 = 27.1 = 3(5 .60)2 /261. 11 = 9.64 = 2. y por la ecuación 14-27 se encuentra SSE = E yy -(EX)')2 / E xx = 206. se encuentra que no puede rechazarse la hipótesis nula. existe una relación lineal entre la resistencia a la ruptura y el diámetro. 28 Grados de libertad 11 13 2 Cuadrado medio 2.13 195..27 13.60 282. Tabla 14-11 Análisis de covarianza de los datos de la resistencia a la ruptura Ajustados para la región Fuente de variación Máquinas Error Total Máquinas ajustadas Grados de libertad 2 12 14 Sumas de cuadrados y productos x y xy 66.99 41.64 Fa Valor P 2.00 186.73 96.60 140.60 261.54 6.40 206.1181 0\ t-' t-' .40 y 27.""id.61 0.--~ .00 346.. .38 Y2.~(X2. -y_(3A(X.4392 .).80 Al comparar las medias ajustadas con las medias no ajustadas de los tratamientos (las)!. entonces el análisis de covarianza elimina parte del efecto de los tratamientos.20.~(X3. ajustada = Y3.00.+(3A(x . los residuales son donde los valores ajustados son A. .x..40.' Sin embargo.12 = 2. se debe en parte a los tratamientos.. -x)] tj 1 1].l .81. = t.9540)(25. lJ l..20.) = 36. .13/2 o 195.(0.Yi. mientras que en otros puede ser más dudoso. Cochran y Cox [26] sugieren la posible utilidad de un análisis de varianza de los valoresxij para determinar la validez de este supuesto..(0. ) lJ •• .41. deberá tenerse una seguridad razonable de que los tratamientos no afectan los valoresxij • En algunos experimentos esto puede ser obvio a partir de la naturaleza de la covariable.l . se observa que las medias ajustadas se encuentran mucho más próximas entre sí. Un supuesto básico en el análisis de covarianza es que los tratamientos no influyen en la covariablex. Para el problema tratado aquí. - x. .2. En el ejemplo tratado aquí puede haber una diferencia en el diámetro de la fibra (xij ) entre las tres máquinas. .(0. La verificación del diagnóstico del modelo de covarianza se basa en el análisis residual.(0.03 16.9540)(26.~(Xl .. (14-34) Para ilustrar el uso de la ecuación 14-34. una indicación más de que el análisis de covarianza fue necesario. +[y-.24.10. ya que la técnica elimina el efecto de las variaciones en las Xi..13) = 41. por lo que no hay razón para creer que las máquinas producen fibras con diámetros diferentes.42 Y3. íl+f.~(Xn .60/12 33. F.. si la variabilidad en las Xi. . Estas medias ajustadas son Yl ajustada = Yl .36.07 = 2.20. ) = 41.30 que es menor que F O. En tales casos. -x )=y-_.13) = 38.24. Por lo tanto.x. .9540)(21. el residual de la primera observación de la primera máquina del ejemplo 14-4 es en = Yn . l.2) = 36 . . ) = 43.13) = 40.25. Y + (3A(X .612 CAPÍTULO 14 OTROS TÓPICOS DE DISEÑO Y ANÁLISIS Las medias de los tratamientos ajustadas pueden calcularse con la ecuación 14-31.. = 66..X ) = y-o +(3A(X..00. ajustada = Y2. con este procedimiento se obtiene ..9540)(20. Para el modelo de covarianza.4392 = -0. y x. Por lo tanto.4.24.Xl) = 36.. 14-3 ANÁLISISDECOVARIANZA 613 En la tabla siguiente se presenta una lista completa de las observaciones.9148 Los residuales se grafican contra los valores ajustados 5\¡ en la figura 14-4.4392 -0.1129 0. Estas gráficas no revelan ninguna desviación importante de los supuestos.7908 1.1079 -0..8092 -0.0159 45.1079 39. con base en este análisis..' -_ _.2552 0.3840 47. En la figura 14-7 se muestra la gráfica de probabilidad normal de los residuales.8871 39. En la tabla 14-12 se muestra el análisis de varianza de los datos de la resistencia a la ruptura.' 40 50 Figura 14·4 Gráfica de los residuales contra los valores ajustados del ejemplo 14-4..2092 47. .7171 1.3840 -2.3840 45.L_ _--l. Se concluiría.-_ _. los valores ajustados y los residuales: Valor observado Yi¡ 36 41 39 42 49 40 48 39 45 44 35 37 42 34 32 Valor ajustado Yi. que las máquinas difieren significativamente en la resistencia de la fibra producida.4209 -1.1079 35.8092 1..8921 -0.6160 2.0159 -1.8092 37.4392 41.2092 40.2092 -1.2552 41.-_ _. contra la covariablexij en la figura 14-5 y contra las máquinas en la figura 14-6.8092 30.0852 Residual ei¡ = Yi¡ -Yi¡ -0. es decir. .l. por lo quese concluye que el modelo de covarianza (ecuación 14-15) es apropiado para los datos de la resistencia a la ruptura.5791 35. Es interesante observar 10 que habría ocurrido en este experimento si no se hubiera realizado el análisis de covarianza. 36.7171 40. Es exactamente la conclusión +4 • +2 • • •• • 25 30 35 • • •• • • • • 45 • -2 -4L. si los datos de la resistencia a la ruptura (y) se hubieran analizado como un experimento de un solo factor en el que se ignorara la covariablex. . en este problema las máquinas no difieren en la resistencia de la fibra producida después de que se elimina el efecto lineal del diámetro. 14~3._ _ -4 O 2 Máquina 3 Figura 14-6 Gráfica de los residuales contra las máquinas.1.614 4 CAPÍTULO 14 OTROS TÓPICOS DE DISEÑO Y ANÁLISIS • 2 • . entonces se intentaría igualar la resistencia producida por las tres máquinas. . Sin embargo. ya que con esto probablemente se reduciría la variabilidad de la resistencia de la fibra.L-_ _--l-_ _---l 10 20 30 40 50 Figura 14-5 Gráfica de los residuales contra el diámetro x de la fibra en el ejemplo 14-4.:... Sería conveniente reducir la variabilidad del diámetro de la fibra dentro de las máquinas. opuesta del análisis de covarianza.2 Solución por computadora Se cuenta con varios paquetes de software que pueden realizar el análisis de covarianza. O .l...1-. :. • • • . Si se sospechara que las máquinas difieren significativamente en su efecto sobre la resistencia de la fibra. -4l-_ _--l-_ _-. En la tabla 14-13 se muestra la salida del procedimiento General Linear Models (modelos lineales generales) de Minitab 4 • 2 • • • • • -2 • e • • 11 • 1 -_ _-1-_ _-. O -2 •• • • • • • • • • . 40 206. y que SS(Diámetro IMáquina) es la suma de cuadrados corregida que deberá usarse para probar la hipótesis de que f3 = O. es decir.g ro e -4 -2 o Residuales. para los datos del ejemplo 14-4. "SS Seq" corresponde a la partición "secuencial" de la suma de cuadrados del modelo global. 28 y SS(Diámetro IMáquina) = 178.17 Fo 4.13+ 13. eij 2 4 Figura 14-7 Gráfica de probabilidad normal de los residuales del ejemplo 14-4. SS (Modelo) = SS (Diámetro) + SS(Máquina IDiámetro) = 305.28 = 318.01 Observe que SS(Máquina IDiámetro) es la suma de cuadrados que deberá usarse para probar que no hay ningún efecto de la máquina. SS(Máquina IDiámetro) = 13. Esta salida es muy similar a las que se presentaron anteriormente.14-3 ANÁLI515DECOVARIANZA 615 99 95 90 a ~ 80 70 60 50 40 30 20 10 5 ro "O x E O c: :c ro . Los estadísticos de la prueba de la tabla 14-13 difieren ligeramente de los que se calcularon manualmente debido al redondeo. Tabla 14-12 Análisis incorrecto de los datos de la resistencia a la ruptura como un experimento de un solo factor Fuente de variación Máquinas Error Total Suma de cuadrados 140.00 346. es decir.40 Grados de libertad 2 12 14 Cuadrado medio 70.0442 .09 Valor P 0. En la sección de la salida bajo el encabezado "Análisis de varianza" ("Analysis ofvariance"). .c c..20 17.41 mientras que "SS ajustada" corresponde a la suma de cuadrados "extra" para cada factor. 40 StDev 2.. =fl.28 27.99 346...38 41.6201 Adj SS 178..···. Considere la estimación de los parámetros del modelo (ecuación 14-15) por mínimos cuadrados. .17 8.+f3(x. .01 13.22.36 0.765 0.=1 j=l (14-36) .000 0.80 StDev 0.fl.177 0. .616 CAPÍTULO 14 OTROS TÓPICOS DE DISEÑO Y ANÁLISIS Tabla 14·13 Salida de Minitab (análisis de covarianza) del ejemplo 14-4 Modelo lineal general Factor Machine Type Levels Values fixed 3 1 2 3 Analysis of Variance for Strength.42 38.a J .f3(xij -X.54 P F 69. El programa comparará asimismo todos los pares de medias de tratamientos utilizando losprocedimientas de comparación múltiple por pares estudiados en el capítulo 3.7444 0.7236 0.783 0. 14. n (14-35) utilizando la prueba general de significación de la regresión.Jf .2192 Seq SS 305.:1 .97 2.31 1.64 2.7879 El programa calcula también las medias de los tratamientos ajustadas con la ecuación 14-31 (Minitab hace referencia a éstas como las medias de mínimos cuadrados en la salida muestral) y los errores estándar. using Adjusted SS for Tests Source Diameter Machine Error Total Term Constant Diameter Machine 1 2 DF 1 2 11 14 Coef 17.13 13.61 P 0.118 0.3.1824 1. La función de mínimos cuadrados es L= !! [Yij . IJ {i.13 StDev 4.99 T 6...075 Means for Covariates Covariate Diameter Mean 24..28 27.9540 0.324 Least Squares Means for Strength Machine 1 2 3 Mean 40.000 0. -X )+8. 97 Adj MS 178.-7:.1140 0.+7:.01 6.3 Desarrollo mediante la prueba general de significación de la regresión Es posible desarrollar formalmente el procedimiento para probar H o:7:.5950 0. = Oen el modelo de covarianza y..1.000 0. 9 ¡ IJ. Sxy) i=1 = Y~ / an+Tyy +(Exy? / Ex:< .. . i = 1. -x. )]Yi.Y . +f3h .=1 i=l = Y~ /an+! (Yi. ) a n (14-38b) La ecuación 14-37c puede reescribirse como ~ (Y-1. )~ L... fi = Y.)+~Sx:< = Sxy Al sumar las a ecuaciones de la ecuación 14-37b. -X. LJ (x ij -x.u = Y. ¡t: an..... -f3(xi .. -(Exy / Ex:<)! = Y~ / an+Tyy -(Exy / E.J i=l a l. (x .u+ n! i=l 1 1 se obtienen las ecuaciones normales (14-37a) l.)Yi..14-3 ANÁLlS1SDECOVARIANZA 617 y a partir de aL/a¡t = aL/ar:i = aL/af3 = O.. de la ecuación 14-37a se obtiene (14-38a) .) = O. -y- •• )~ L". la solución de la ecuación 14-37c es Sxy -Txy Exy f3= =Sx:<-Tx:< Ex:< h • que fue el resultado dado anteriormente en la sección 14-3.J ~ (x lJ.. -x )= T xy I} •• n j=l y ~ (X. por lo que existe una dependencia lineal en las ecuaciones normales.xx L.. .r.• )~ -x )+f3hS . L. )_f3h~ ¿.=1 + ~S xy (Exy / Ex:< )(xi.:níi+nf. )= y.uY. ... + ! f i Yi. -x. es necesario aumentar las ecuaciones 14-37 con una ecuación linealmente independiente para obtener una solución. f3) = .J L". t''' f3:! f i i=l (14-37b) (14-37c) ! (Xi)' j=l -X. . Una condición lógica es L:=l f i = O.)(Txy .. r:..a j=l r:. y de la ecuación 14-37b fi a n = Y-i .J (x i j . .. se obtiene la ecuación 14-37a porque L:=lL. Por lo tanto. + L [Yi.1 en la ecuación 14-26. (X lJ l..X.L. . Al utilizar esta condición. .. -X•• )=T. -Y-.. 2. a . -:Y.xx = S xy L". )Y.=l (xijx. +(Exy / Ex:< )Sxy (Xi.. +(Exy / Ex:<)Sxy =(Y. -Y-x .)Yi. La reducción en la suma de cuadrados total debida al ajuste del modelo (ecuación 14-15) puede expresarse como R(¡t. •• a n i=l j=l Por lo tanto. -X)~ ... i=l j=l i=l j=l después de sustituir para fi' Pero se observa que ~ (y-. (x i. [3) = p.. Considere ahora el modelo restringido a la hipótesis nula.. )Y. Este modelo reducido es y.. -x lJ 1]... y las ecuaciones normales de mínimos cuadrados para este modelo son anp.. . +( S.1. se ha justificado el desarrollo heurístico del análisis de covarianza de la sección 14-3. [3) = Ta = Opuede encontrarse como (14-43) = y~ I an + Tyy +(E')' ) 2 lE. 2. Por lo tanto. = Ta = O...(S.')')2 lE. = Y .y lan-Tyy _(E"y)2 lE.. )+s l}... a H o:T 1 = T2 = . Esta cantidad se obtuvo anteriormente como la ecuación 14-27. es decir. = SxyIS.2... { j= 1.\y)2 I Sn . (14-41a) (14-41b) Las soluciones de estas ecuaciones son p.y~ I an ...Eyy .. R( TI ¡l.618 a CAPÍTULO 14 OTROS TÓPICOS DE DISEÑO Y ANÁLISIS Esta suma de cuadrados tiene a + 1 grados de libertad porque el rango de las ecuaciones normales es + 1. [3) = R(¡l.1. = Y.')' I S.( S_S".-~ -_SS--=E. . utilizando la prueba general de significación de la regresión.\.a . [3) . La suma de cuadrados apropiada para probar H o:T 1 = T2 = . el estadístico de prueba para Ho:T i = O es F. [3) tiene a + 1.(a + 1) = a(n -1) -1 grados de libertad.-SSE en la sección 14-3.:... = /-l+[3(x . (14-42) Esta suma de cuadrados tiene dos grados de libertad. 2 =Syy-Tyy -(Exy)2 lEn = E yy _(E.n (14-40) Se trata de un modelo de regresión lineal simple...)I---.(_a------'-1) o SSE l[a(n-1)-1] SSE l[a(n-1)-1] (14-44) expresión que se dio anteriormente como la ecuación 14-30.n )S.. i = 1. y jJ debida al ajuste del modelo reducido es R(/-l.. [3) I (a .( S')' ) 2 I Sn = Syy .')' = y~ I an + (S')' )2 I S..y.[E yy . (14-39) con an .:. y la reducción en la suma de cuadrados total + jJS xy = (Y.1) = .. T. Por lo tanto.. = R( TI /-l.. [3) . La suma de cuadrados del error de este modelo es SSE = í! y~ = í! y~ i=l j=l i=l j=l -R(/-l... T.2 = a -1 grados de libertad y que es idéntica a la suma de cuadrados dada por SSl...(E..R(/-l.. .. Observe que R(T l/-l.\y)2 lEn] utilizando Tyy = Syy . Para un factorial 22 con n réplicas. Una desventaja de este supuesto es que si varios niveles de los tratamientos interactúan con la covariable. Esto permite usar parte de los grados de libertad para estimar el error. Estas "réplicas ocultas" liberan grados de libertad para la estimación de parámetros. el efecto promedio de la covariable en todos los tratamientos seguirá incrementando la precisión de la estimación y la prueba de los efectos de los tratamientos. es decir. se necesitan al menos tres réplicas para un análisis de covarianza completo. Considere un arreglo factorial 23 • Se necesita un mínimo de dos réplicas para evaluar todas las combinaciones de tratamientos con una covariable separada para cada combinación de tratamientos (una covariable por interacción de tratamientos). Si la covariable. los factoriales 2k • Al establecer el supuesto de que la covariable afecta a la variable de respuesta de manera idéntica para todas las combinaciones de tratamientos. Por lo tanto. - . Una tercera elección sería suponer que algunos de los factores (como algunas interacciones de dos factores y de órdenes superiores) no son significativos. Con este modelo saturado. Siempre que existan datos suficientes para cada combinación de tratamientos. Este problema se agudiza cuando se incrementa el número de celdas distintas del diseño (combinaciones de tratamientos) y las covariables. y:. SSAB' El número de réplicas es un aspecto clave cuando se amplía la estructura de los tratamientos del diseño. Con dos observaciones por celda. si se elimina el factor de uno de los tratamientos. y el otro se usa para estimar la pendiente (el efecto de la covariable). Sin embargo. podría construirse una tabla del análisis de covarianza similar al procedimiento dado en la sección 14-3. ya que la estimación del error será relativamente imprecisa a menos que se le asignen suficientes grados de libertad. Esto es equivalente a ajustar un modelo de regresión simple a cada combinación de tratamientos o celda del diseño. Aun cuando este supuesto sea incorrecto. pero no deberán usarse como réplicas para estimar el error puro porque la ejecución del diseño original quizá no se haya aleatorizado para ello.1. Esta cantidad es la suma de las sumas de cuadrados de los factores A. Entonces podría hacerse la partición de la suma de cuadrados ajustada de los tratamientos en componentes de los efectos individuales. Otra elección es suponer que no hay ningún tratamiento por interacción de la covariable. Con dos réplicas. si se estima solo sin ninguna interacción.=l L~=l y'~/(2)(2)n. El supuesto que se establecerá deberá ser dictado por la situación experimental y por el riesgo que el experimentador esté dispuesto a correr. un grado de libertad se usa para estimar la ordenada al origen (el efecto del tratamiento). y los modelos subsecuentes deberán evaluarse a profundidad.4 Experimentos factoriales con covariables El análisis de covarianza puede aplicarse a estructuras de tratamientos más complejas. incorrectamente. este curso de acción deberá emprenderse con cuidado. la suma de cuadrados de los efectos principales ajustados SSA y SSB' y una suma de cuadrados de la interacción. Cabe hacer notar que en la estrategia de construcción del modelo de los efectos. entonces las dos "réplicas" resultantes de cada factorial 23 original no son en realidad réplicas. puede resultar no significativo. cada uno de estos supuestos liberará algunos grados de libertad para estimar el error y permitirá realizar pruebas de hipótesis útiles. los diferentes términos pueden cancelarse entre sí y el término de la covariable. El supuesto más simple (y típicamente el peor) que puede hacerse es que la covariable no tiene ningún efecto. deja de tomarse en consideración. suponiendo el caso más general. A continuación se indica cómo podría usarse el análisis de covarianza en la familia más común de diseños factoriales utilizados en la experimentación industrial. no se cuenta con ningún grado de libertad para estimar el error. La única diferencia sería la suma de cuadrados de los tratamientos. B y la interacciónAB.14-3 ANÁLISISDECOVARIANZA 619 14~3. la suma de cuadrados de los tratamientos (Ty'y) sería (1/n) L. Si el número de réplicas está limitado. pueden hacerse varios supuestos para permitir un análisis útil. el análisis completo y las conclusiones subsecuentes podrían tener graves errores. como los diseños factoriales. prácticamente cualquier estructura de tratamientos compleja puede analizarse mediante el enfoque del análisis de covarianza. Incluso cuando unos cuantos términos son individualmente significativos en el nivel a = 0.10 11. resulta el siguiente modelo: y= 25. que las pendientes son comunes con ningún tratamiento por interacción de la covariable.63 4. Se supone que no son significativas las interacciones de tres factores (tantoABC comoABCx) y se usan los grados de libertad asociados con ellas para estimar el error en el modelo de los efectos más general que pueda ajustarse.48 13.57 Para ilustrar algunas de estas ideas.30 -26.03+11.13 -30. Con un modelo casi saturado.07 39. Por último.54 66.94 103. Debido a que el aspecto de los efectos de los tratamientos del modelo es de mayor interés.20 -26. El análisis residual no indica problemas con este modelo.94 73.20A+18. el sentido general es que este modelo es mejor que losdos escenarios previos (basados enR 2 y el cuadrado medio del error).39 54. Las interacciones de tres factores son porlo general insignificantes en la mayoría de los ambientes experimentales.44 3. por lo que se usa PROC GLM de SAS.58 44.05 0.72 15. Las sumas de cuadrados tipo III son las sumas de cuadrados ajustadas que se necesitan.92 2. se eliminan de manera secuencial términos de la porción de la covariable del modelo a fin de agregar grados de libertad para esti- .38 8.72 16. podria considerarse un tercer curso de acción.24C-18.73 9.620 CAPÍTULO 14 OTROS TÓPICOS DE DISEÑO Y ANÁLISIS Tabla 14-14 Datos de la respuesta y la covariable para un: diseño 23 con: 2 réplicas A x e y B -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 -1 -1 1 1 1 1 -1 -1 -1 -1 1 1 1 1 4.82. Si la variable de respuesta y se analiza sin tomar en cuenta la covariable. suponiendo que ciertos términos de interacción son insignificantes.80AC El modelo global es significativo en el nivel de a = 0. En la tabla 14-17 se presentan los resultados de SAS para este modelo.01 con R 2 = 0. Este modelo reducido proporciona un MS E todavía menor que el modelo completo con la covariable de la tabla 14-15.64 -0.46 10.36 5.06 15. Éste es con frecuencia un supuesto práctico. pueden estimarse el modelo de los efectos completo y el efecto de la covariable. Si se elige el segundo supuesto.67 5.91AB+ 14.05.53 2. considere el diseño factorial 23 con dos réplicas y una covariable que se muestra en la tabla 14-14. La salida de Minitab (de la rutina General Linear Models) se muestra en la tabla 14-15. la estimación del error será bastante imprecisa.89 38.44 -8.786 y MSE = 470.01 es inusual.01 20.05B+7. excepto porque la observación con y = 103. La versión actual de Minitab no puede modelar covariables queinteractúan con los tratamientos.96 5. El análisis final resultante después de eliminar de manera secuencial cada interacción no significativa y el efecto principal C se muestra en la tabla 14-16. Se considera el modelo completo que permite pendientes diferentes entre los tratamientos y la interacción tratamiento por covariable.58 1. Observe que MSE se ha reducido considerablemente al tomar en consideración la covariable.03 1. En la tabla 14-18 se muestra el modelo final después de eliminar secuencialmente ex.37 P 0.5 763.9245 0.2 628.7 3754.9 1320.-- Factor B C Type Levels Values f.1 8.s of Var. us.2 33.3 10.5 763.8 4066.2 5.10 15.ng Adjusted SS for Tests Source x A B C A*B A*C B*C A*B*C Error Total Term Constant x DF 1 1 1 1 1 1 1 1 7 15 Seq SS 12155.562 Coef -1.92 40.0 StDev 3.93 Adj MS 8287.30 Adj MS 2521.2 82.7 3997.05 54.0 1.4 33.1 T -O .001 0.7 3788.454 0.8 4066.64 45. suponiendo una pendiente com!Ín Modelo lineal general 14.7 P F 28.s of Var.9 1404. Este ejemplo destaca la necesidad de contar con grados de libertad para estimar el error experimental a fin de incrementar la precisión de las pruebas de hipótesis asociadas con los términos individuales del modelo.858 0.4 33.19 5.58 10.769 0. el MSE decrece a 0.878 5.4 P F 119.10 P 0.14-3 ANÁLISIS DE COVARIANZA 621 Tabla 14-15 Análisis de covarianza de Minitab para el experimento de la tabla 14-14.31 0.005 0.6 52.7336 y varios términos no son significativos.7 3997.016 4.0876 0. modelo reducido parad experimento de la tabla 14-14 Modelo lineal general Factor A B Type Levels Values f.09 0.000 .370 0. us.913 0.6 1403.xed 2 -1 1 fixed 2 -1 1 Analys.0 StDev 5.000 0.572 0.7 4097.ance for y.1 8.xed 2 -1 1 f.3 3641.9 1404.4655 Adj SS 8287. AC y Be.001 mar el error.7 4097.000 0. Este proceso deberá hacerse de manera secuencial para evitar la eliminación de términos significativos enmascarados por una estimación pobre del error.6 1403.ng Adjusted SS for Tests Source x A B A*B Error Total Term Constant x DF 1 1 1 1 11 15 Seq SS 12155.000 Coef -1.24 59.3 T -0.000 0.xed 1 2 -1 Analys.2 628.58 0.0 1 .001 0.2 82.2 89.ance for y. Si se elimina secuencialmente el término ACx seguido de BCx.43 20.3 21992.01 0.xed 2 -1 1 f. Tabla 14-16 Análisis de covarianza de Minitab.9290 Adj SS 2521.7 3754.000 0.1 21992.9 1320.225 0.3 3641.5 69.6 3754. 1283784 336.0277472 0.1283784 336.7747490 0.6599694 13.97 12.02 0.9732676 0.9024288 95.999872 Source A B C Sum of Squares 21989.0525319 35.0390 0.4437474 49.7747490 0.6599694 13.0525319 35.0020997 0.20 0.14 24.0273 0.18 68.40203 Root MSE 1.8470 J .9010 0.0731 0.09 240.32 9.0927 0.20828 2.0087994 17.01234 C.184074 Mean Square 4.05 Pr > F 0.2099 0.9726 0.31 24.47756 1.02895 F Value AB AC BC X AX BX CX ABX ACX BCX DF 1 1 1 1 1 1 1 1 1 1 1 1 1 3.: covarianza) de SAS para el experimento de la tabla 14-14 Dependent Variable: Y Source Model Error Corrected Total DF 13 2 15 R-Square 0.730820 Type III SS 4. 4.9024288 95.00 0.32 35.0378 0.4437474 49.1013635 0.2741287 33.0041 0.45 Pr > F 0.6304 0.80406 21992.0020997 0.V.0672386 Mean Square 1691.9732676 0.7908 0.31 0.0277472 0.2741287 33.0\ N N libIa 14-17 Salida de PROC GLM (análisis d.0087994 17 .0008 y Mean 25.35 0.1 013635 0.0143 0.0672386 F Value 1206. 0004 0.D342229 T for HO: Parameter=O 18.8726525 233.61 Pr > F 0..7850330 3.11732045 0'1 N W ..05 -25.86 IT I 0.999742 Source A 8 C DF 3.0317496 232._.0340997 -3.33674 5.11647826 0.86 678.12160595 0.0018 0.97 26.63 46.29209 0.0001 0.0001 0.0002 0.1597158 38.7635098 240.0001 Ol\ R-Square 0.81080 Root MSE 0.0317496 232.3934567 550.3268940 y Mean 25.3636850 2.91 286.32237858 0.2435668 31.0002 0.900444 Mean Square 19.67560 21992.85 16.'>7 .7635098 240.3934567 550.597611 Type 111 SS 19.0001 0.0018 0.01234 C. modelo reducido Dependent Vari~ble: y [H Source Model Error Corrected Total 8 7 15 Sum of Squares 21986.2435668 31.26 17.0632049 3.8726525 233.0001 AX BX ABX Estimate 10.2438830 2.88 Pr > F 0.53 668.57291820 0.4560862 -3..6596279 5.54659908 0.0001 0.0001 Std Error of Estimate 0..24 16.3268940 Pr > F Value 3389. V. · · H '.0001 0.11877417 0.08 287. .1530561 542.._.0471937 2.0001 0.74 4.44 39.0001 0.'MI!!! Tabla 14-18 Salida de PROC GLM de SAS para el experimento de la tabla 14-14.02895 F Value 1 1 AB X AX BX ABX Parameter 1ntercept A S C AS X 1 1 1 1 1 1 23.92 -6.0004 0.0001 0.86 6. Mean Square 2748.53741264 0.53434356 0.18 297.1597158 38. ".0001 0.1530561 542. la covarianza entre Yij YY¡'j no Tabla 14-19 Datos de un diseño de mediciones repetidas con un solo factor Sujeto Tratamiento 1 2 a Totales de los sujetos 1 2 n y~ Totales de los tratamientos Yn Y?l Yal Y. Y. Se supone que los tratamientos son fijos (de donde L~=l'í ¡ = O) Yque los sujetos empleados son una muestra aleatoria de alguna población más grande de individuos potenciales. quizá sea mejor establecer ese supuesto desde el principio del análisis. se observa que cada método mejora de manera sucesiva el ajuste del modelo en este ejemplo.l Yl2 Y?2 Ya2 Y.. 14~4 MEDICIONES REPETIDAS En el trabajo experimental de las ciencias sociales y el comportamiento. en algunas situaciones experimentales las diferencias en las respuestas de distintas personas al mismo tratamiento pueden ser muy grandes. Aun cuando los paquetes de software para diseños experimentales quizá sólo tengan capacidad para modelar covariables que no interactúan con los tratamientos. El modelo que se utiliza para este diseño es (14-45) donde 'í¡ es el efecto del tratamiento i-ésimo y f3j es un parámetro asociado con el sujetoj-ésimo. A éste se le llama diseño de mediciones repetidas.624 CAPÍTULO 14 OTROS TÓPICOS DE DISEÑO Y ANÁLISIS Al revisar los resultados obtenidos de los tres enfoques. Por lo tanto. así como en algunos aspectos de la ingeniería y las ciencias físicas. por lo que se supone que la media de f3j es cero y que la varianza de f3j es a ~ .2 Y211 Yan Y. las unidades experimentales son con frecuencia personas. y en algunos casos inflará significativamente el cuadrado medio del error.lI YL Y2' Ya. Si hay una razón fundada para creer que la covariable no interactúa con los factores. Esta opción también puede ser dictada por el software. . esta variabilidad entre las personas se convertirá en parte del error experimental. Se observa asimismo que las pruebas usuales de la adecuación del modelo siguen siendo apropiadas y se recomiendan enérgicamente como parte del proceso de construcción del modelo del análisis de covarianzaANCOVA. Los datos aparecerían como en la tabla 14-19. incluso si hay alguna covariable por interacción de tratamientos. A menos que esté controlada. Es posible controlar esta variabilidad entre las personas utilizando un diseño en el que cada uno de los a tratamientos se usa en cada persona (o "sujeto"). Debido a las discrepancias en experiencia. Puesto que el término f3j es común a todas las a mediciones del mismo sujeto. el analista puede tener una oportunidad razonable de identificar los factores principales que influyen en el proceso. colectivamente los sujetos representan un efecto aleatorio. haciendo más difícil detectar las diferencias reales entre los tratamientos. Vea que la observación Yij representa la respuesta del sujeto j al tratamiento i y que sólo se usan n sujetos. En esta sección se ofrece una breve introducción a los experimentos de mediciones repetidas con un solo factor. capacitación o formación. Suponga que un experimento incluye a tratamientos y que cada tratamiento se va a usar exactamente una sola vez en cada uno de n sujetos. SS Dentro de los sujetos = SSTratamientos + SSE con los grados de libertad dados por n(a-1)= (a-1)+(a-1)(n-1) respectivamente. SST = SSEntrelossujetos + SSDentro de los sujetos Las sumas de cuadrados SSEntre los sujetos YSSDentro de los sujetos son estadísticamente independientes.. _ Y.. . H o: í 1 = í 2 = . donde los sujetos se consideran como los bloques.Yi. es decir. a-l.14-4 MEDICIONES REPETIDAS 625 es. H o: í i = O.1)(n"""" 1) MS E (14-48) Si los errores del modelo siguen una distribución normal.j _ Y. .t: O O se usaría el cociente F. Por lo tanto. o = SSTratamientos / (a-1) = MSTratamientos SSE / (a . donde se presentan también fórmulas convenientes de cálculo para las sumas de cuadrados. )2 +! ~ (Yij _ y. )2 i=1 j=1 i=1 i=1 j=1 (14-47) El primer término del miembro derecho de la ecuación 14-47 mide la contribución de la diferencia entre las medias de los tratamientos a SSDentro de los sujetoS' Yel segundo término es la variación residual debida al error. entonces bajo la hipótesis nula.Y.. con grados de libertad an-1 = (n-1)+n(a-1) Las diferencias dentro de los sujetos depende.j + Y. Por lo tanto.Y. = í a = H 1 : Al menos una í i :. el estadísticoFosigue una distribución Fa _ 1. El lector deberá identificar el análisis de varianza de un diseño de un solo factor con mediciones repetidas como el equivalente del análisis de un diseño de bloques completos aleatorizados.n tanto de las diferencias en los efectos de los tratamientos como de la variabilidad no controlada (ruido o error). por ejemplo ! ~ (Yij _ y.. Ambos componentes de SSDentro de los sujetos son independientes. Es decir. Considere una partición en el análisis de varianza de la suma de cuadrados total. en general. )2 = ~ (Y.(a-1)(n-l)' En la tabla 14-20 se resume el procedimiento del análisis de varianza. (a-1)(n-1)' La hipótesis nula se rechazaría siFo > Fa.. la suma de cuadrados resultante de las diferencias dentro de los sujetos puede descomponerse de la siguiente manera: ! ~ (Yij . Para probar la hipótesis de que no hay ningún efecto de los tratamientos.. )2 +! ~ (Yij . cero. y el segundo término es una suma de cuadrados de las diferencias dentro de los sujetos.j)2 = n! (Yi. Se acostumbra suponer que la covarianza entre Yij YYi'j es constante a lo largo de todos los tratamientos y los sujetos. j )2 a i=1 j=1 j=1 (14-46) i=1 j=1 El primer término del miembro derecho de la ecuación 14-46 puede considerarse como una suma de cuadrados que resulta de las diferencias entre los sujetos. Dentro de los sujetos 3. (Error) 5.·o "c-z::~~~= __ 0'1 0'1 N Tabla 14-20 Análisis de varianza del diseño de mediciones repetidas con un solo factor Fuente de variación 1.. Total Sustracción: línea (2) -línea (3) SSE MSE = (a-1)(n -1) 2:2: Yíj .2 .j a 2 n(a-1) a-1 (a-1)(n -1) an-1 S STrntamientos MSTrntamienlos j~l ~ y2 2 LJ ----'-'-_L j~l n an MSTratamientos = a -1 MSE 4. _~~ j=l n-1 11 2.an i=l j=l a n ? y._~. Entre los sujetos Suma de cuadrados Grados de libertad Fa Cuadrado medio }: Y. (Tratamientos) 2:2:y~-2: i=l j~l a n Y. 14-3. Se han desarrollado tres tipos diferentes de carretillas. Terminar el análisis y sacar las conclusiones apropiadas. En el problema 8-24 se usó un diseño factorial fraccionado con réplicas para estudiar el abombamiento o combadura del sustrato en la fabricación de semiconductores. donde se usó un diseño factorial fraccionado 26 . Usar el método de Box-Cox para investigar la utilidad de las transformaciones para esta respuesta. Un distribuidor de bebidas gaseosas está estudiando la efectividad de los métodos de descarga. sin embargo. En el experimento defectos en la rejilla del problema 8-29 se empleó una variante de la transformación de la raíz cuadrada en el análisis de los datos. la media y la varianza del espesor del óxido. el tiempo de descarga también guarda una estrecha relación con el volumen de las cajas descargadas (x).3 para estudiar el peso del material de empaque que se adhiere a ánodos de carbono después de la cocción. Se hicieron tres réplicas de las ocho corridas del diseño. Analizar estos datos y sacar las conclusiones apropiadas. ¿Existe algún indicio de que se necesite una transformación para cualquiera de las dos respuestas? 14-4. Usar el método de Box-Cox para investigar la utilidad potencial de una transformación para estas dos respuestas. Tipo de carretilla 1 Y 27 44 33 41 2 3 x 24 40 35 40 Y 25 35 46 26 x 26 32 42 25 Y 40 22 53 18 x 38 26 50 20 14-11. 14-2. una de las respuestas es la desviación estándar.05. y el peso promedio y el rango de los pesos de cada combinación de prueba se trataron como las variables de respuesta. 14-12. Considere nuevamente el experimento del recubrimiento fotoprotector del problema 8-25. ¿Existe algún indicio de que se necesite una transformación? 14-6. La variable de interés es el tiempo de descarga en minutos (y). Considere de nuevo el experimento del proceso de fundición del problema 8-23.05. En el diseño central compuesto del problema 11-14 se obtuvieron dos respuestas. Utilizar a = 0.. ¿Es apropiada la transformación logarítmica sugerida en el inciso e de ese problema? 1. ¿Existe algún indicio de que se necesite una transformación para cualquiera de las dos respuestas? 14-5. y se lleva a cabo un experimento en el laboratorio de ingeniería de métodos de la compañía. 14-7. ¿Cambiaría su contestación si se usara la varianza como la respuesta? 14-9. Se usaron como variables de respuesta tanto la media como la desviación estándar de las mediciones de la combadura. Usar el procedimiento de Box-Cox para determinar si es apropiada (o útil) una transformación de la respuesta para analizar los datos de este experimento. es apropiada una transformación? 14-10. Usar el procedimiento de Box-Cox para demostrar que se trata de una transformación de datos apropiada. Cada carretilla se usó cuatro veces y se obtuvieron los datos siguientes. . Usar el método de Box-Cox para determinar si ésta es la transformación apropiada.4-8. En el diseño factorial 33 del problema 11-33. En el ejemplo 6-3 se seleccionó una transformación logarítmica para la respuesta velocidad de avance de una perforadora. En el problema 11-34 se sugiere usar ln(S2) como la respuesta (referirse al inciso b). Calcular las medias ajustadas de los tratamientos y los errores estándar de éstas para los datos del problema 14-10. A continuación se presentan las sumas de cuadrados y los productos de un análisis de covarianza de un solo factor. Usar la varianza del espesor del recubrimiento en cada combinación de prueba como la variable de respuesta. Utilizar a = 0. ¿El método de Box-Cox indica que. f 14-5 PROBLEMAS 627 14~5 PROBLEMAS 14-1. Considere nuevamente el problema 5-22. Encontrar los errores estándar de las medias ajustadas de los tratamientos del ejemplo 14-4.y )fZ .9 49. Se están probando cuatro formulaciones diferentes de un adhesivo industrial.1 48.7 49. - ~(Xi.a) por ciento para la media ajustada del tratamiento i-ésimo es Yi.6 x 16 15 10 12 11 14-15.01 pulgadas para cada formulación. Calcular las medias ajustadas de los tratamientos y sus errores estándar utilizando los datos del problema 14-14.05.9 48. 14-16. Utilizar a = 0.3 44.7 43. Analizar los datos usando un análisis de covarianza. 14-14.2 50. Analizar estos datos y sacar las conclusiones apropiadas. el índice de metal eliminado se relaciona también con la dureza del ejemplar de prueba.0 51. La resistencia a la tensión del adhesivo cuando se aplica para unir piezas se relaciona también con el espesor de la aplicación.:. un intervalo de confianza de 100(1 .)±ta/z .0 50.1 44.3 48.3 47. Formulación del adhesivo 1 Y 2 x 13 14 12 12 14 Y 3 x 12 10 11 12 14 Y 4 x 15 14 11 11 10 Y 46. Se obtienen cinco observaciones de la resistencia (y) en libras y del espesor (x) en 0. Los datos se muestran en la siguiente tabla.8 46.1 48. Se hacen cinco observaciones de cada rapidez de corte.628 CAPÍTULO 14 OTROS TÓPICOS DE DISEÑO Y ANÁLISIS Fuente de variación Tratamiento Error Total Grados de libertad 3 12 15 Sumas de cuadrados y productos x 1500 6000 7500 xy 1000 1200 2200 y 650 550 1200 14-13. Un ingeniero estudia el efecto de la rapidez de corte sobre el índice de metal eliminado en una operación de maquinado. Demostrar que en un análisis de covarianza de un solo factor con una sola covariable. 1000 Y Rapidez de corte (rpm) 1200 x Y 1400 Y x x 68 90 98 77 88 120 140 150 125 136 112 94 65 74 85 165 140 120 125 133 118 82 73 92 80 175 132 124 141 130 14-17.0 48. La cantidad de metal eliminado (y) y la dureza del ejemplar (x) se muestran en la tabla siguiente..a(Il-1l-1[MS E (~+ (xi. Sin embargo.2 46. -x.5 45.5 45.1 48. ~. j~. . el error estándar de la diferencia entre dos medias ajustadas de los tratamientos cualesquiera es S". Comentar la forma en que pueden usarse las curvas de operación característica para el análisis de varianza en el análisis de covarianza.j__ ..~ ~ [MSE(~+ex. calcular un intervalo de confianza de 95% para la media ajustada de la máquina 1 del ejemplo 14-4. Demostrar que en un análisis de covarianza de un solo factor con una sola covariable..14-5 PROBLEMAS 629 Usando esta fórmula. 14-18. .~¡)' JI" 14-19. Effect of Inequality of Variance and of Correlation of Errors in the 1Wo-Way Classification".] "Sorne Theorems on Quadratic Forms Applied in the Study of Analysis of Variance Problems: 11. 25. Prentice-Hall. Y.] Outliers in Statistieal Data. edición. en 1eehnometries. 5.] "Staggered. Addelman. Box. Addelman. [12b. [9. 12-20. Bowker. N.E.L. Nueva York. vol. Iowa State University Press. en Quality Engineeling. en Annals of Mathematieal Statisties. Dekker. en Joumal oftheAmeriean Statistieal Association. V.] StatistiealAnalysis in Chemistly and the Chemicallndustly.] Topies in Intennediate Statistieal Methods. [lc. en Technometries. Franklin.R.] "The Examination andAnalysis ofResiduals". [3. C.E. Anscombe. 290-302. pp. [8. pp. T. vol. Nested Designs for Estimating Variance Components". vol. Englewood Cliffs. en Teehnometries. AH. 22. 630 . Effect of Inequality of Variance in the One-Way Classification".E. Bennett. Box. en Biometries. 81-101. Iowa. 123-147. 25.] "011hogonal Main Effect Plans for Asymmetric Factorial Experiments". [12d.A McLean. [10. 3. [11. 484-498. vol. [4. pp.] "Techniques for Constructing Fractional Replicate Plans".] "The Use of Transformations".S. Anderson. Nueva York. S. pp. 3. pp.] "Evolutionary Operation: A Method for Increasing Industrial Productivity". Bartlett. Bisgaard. Anscombe. Ames.] "Signal-to-Noise Ratios. 3a. M. Lieberman. y R. S. 39-52. G. vol.] "Conditional Inference Chart for Small Unreplicated Two-Level Factorial Experiments". 21-46. [5.L. y T. [lb. 479-496. [7. enAnnals ofMathematieal Statisties . 141-160. [2. y G. vol. enApplied Statisties. S.] Engineeling Statistics.] "Some Theorems on Quadratic FormsApplied in the Study of Analysis of Variance Problems: 1. Lewis.] "Irregular Fractions of the 2n Factorial Experiments". T.P.P. EJ. [12a. vol. pp. pp. and Transformation". Bancroft. G. 1-40.W Tukey. edición. pp.] "Rejection of Outliers". 267-271. vol.A y N. 30.P.J. vol. Wiley. Box. pp. EJ. 58. en Teehnometlies. Wiley. y J. 2. 4.A [6.Bibliografía Addelman. Nueva York. Performance Criteria.P.E. en Technometlies. G. [12c.] Design ofExperiments: A RealistieApproach. en Industlial Quality Contl'ol. vol. G. Bainbridge. pp. S. 45-71. 2a. pp.J. Box. vol. vol. [la. pp. 11. Barnett. 6. P. Conover. 311-352. 35. pp. y RD. Box. enJournal oftheAmerican StatisticalAssociation. pp. pp.p Fractional Factorial Designs. 123-131. en Technometrics. D.] Confidence Intervals on Variance Components.E. Box. Box. no. Part 1". Wiley. [17b. Hunter. Box. WJ. en BiometJics. D. Byrne.P. en Quality Progl'ess. [23. pp. [17c. G. Nueva York. [12f. Draper. G.] "On the Experimental Attainment of Optimum Conditions". [13.] "The 2k . [29.S.] Empirical Model Building and Response Swfaces. 68. Montgomery.E. y M. y J. AS. 321-330.11 BIBLIOGRAFÍA 631 Box. WJ. Nueva York. Box. [25a.E.] Evolutionary Operation. 16-29. Washington. Hunter. Box.] "On Sorne Alternative Procedures Using Ranks for the Analysis of Experimental Designs". [25b. G.. 455-476. 2a. vol.P. Fung. [26.E.C. Meyer. [19. Graybill. D. Cochran. G. y D.] R. edición. Wiley.E. y M.] Experimental Designs. 449-458. [30a. vol. no. 261-281.] Fractional Factorial Expelimental Designs fol' Factors at Three Levels. Wilson.] '~alysis of Covariance: Its Nature and Uses". en Quality and Reliability Engineering International. 3. pp. Fisher: The Life of a Scientist. pp. [12e. WG. y G.P. pp. Connor WS. Iman. G. y D. G. G. pp. 195-242. 19-26. vol.] "Evaluation of Ten Pairwise Multiple Comparison Procedures by Monte Carlo Methods". pp.E.R Draper. 22-38. Nueva York.E. Zelen. Carmer. 31. Applied Mathematics Series. B. RK. [24. 54. y EA. Cox. B. en Technometrics. Cochran. pp.P. WG.E. [18. [16a. 13. 66-74.E.] "Sequential Experimentation and Sequential Assembly of Designs". 28.E. Box. Nueva York. y K. WG. 3.W Behnken. [20.] ''A Systematic Approach to Planning for a Designed Industrial Experiment" (con comentarios). y J. pp. Box. 2a.p Fractional Factorial Designs. 314. en Journal of Quality Technology. National Bureau of Standards. vol.M. en TechnometJics. Wiley. [27.. vol. Box. y J. WG. Coleman. vol.P.P. en Quality Engineering.S. pp. pp. vol. Box.] "Sorne New Three Level Designs for the Study of Quantitative Variables".E.R. en Annals of Mathematical Statistics. G. J. no..P.A. G. [14. Wiley.E. vol. 2. S.] "Multifactor Experimental Designs for Exploring Response Surfaces".E. Hunter y J. G.] '~ Explanation and Critique of Taguchi's Contributions to Quality Engineering". Bisgaard y C. S.P. Hunter. [16b.] "Statistics as a Catalyst to Learning by Scientific Method Part lI-A Discussion" (con comentarios).S. G. Part lI". 1-45. vol. no.M. 3. vol. 26.] "Sorne Consequences when the Assumptions for the Analysis of Variance Are Not Satisfied". Conover. Nueva York.G. 5.R Swanson. vol. [17a. . y S.P. 1-27. pp. en Biometrics.] Practical Nonparametric Statistics. 1349-1368. Box. 28. y RL.] Statistics for Experimenters. vol. [15. Wiley.S.C. 2. Wiley. Burdick. [28. Nueva York.P. vol. Nueva York. 4.P. G. y D.R Cox. vol.] "The Taguchi Approach to Parameter Design". y N.] '~Analysis of Unreplicated Fractional Factorials".E. pp. Cochran. 3. Taguchi. Box. [22. enJournal of the Royal Statistical Society. en TechnometJics. G.] '~Analysis of Transformations".] "The 2k . edición. vol. Dekker. en Communications in Statistics. y N. 211-243.G. Hunter.A.P. 13. en Journal ofthe Royal Statistical Society. pp. 11-18.E [21. en Technometrics. Box. Nueva York. y R Suich. Dunnett.] "Combining Interblock and Intrablock Information in Balanced Incomplete Blocks". Weeks.] StatisticalMethodsforResearch Workers.] "MinimumAberration 2k -p Designs".] "Use of Half-Normal Plots in Interpreting Factorial Two Level Experiments".] An Introduction to Linear Statistical Models.W Tukey. M. WJ.] "Estimating the Degrees of Freedom for Linear Combinations ofMean Squares by Satterthwaite's Formula".13ava edición. C. Daniel. [36.] Statistical Tables for Biological.B. 601-608.R [32b. Graybill. D. 351-361.E. Cook.] "SimuItaneous Optimization of Several Response Variables". Cook. 2a. vol. 19. 11. en Annals of Mathematical Statistics. vol.] Design andAnalysis ofIndustrial Expeliments. N. 214-219. vol.] "MuItiple Range and MuItiple F Tests".R [32a. 169-174. C. and Medical Research. vol. pp. Cornfield. McGraw-Hill. Homewood. vol. vol. Hopper. vol.W y T. Edimburgo. Gaylor.W [42. 23-40. D. Fisher. G. with Applications to the Outer Continental Shelf Bidding Data". en Technometrics. Duncan. C. pp.] The Design ofExperiments. Edimburgo. edic}ón. en Technometrics. [39. vol. 22.] "Detection of Influential Observations in Linear Regression".] ''Average Value of Mean Squares in Factorials". RA [44a. 124-133. pp. vol.R y WG. 3. edición. 11. 15-18. pp. 427-430. enAnnals ofMathematical Statistics.] "The Assumptions Underlying the Analysis of Variance".] Quality Control and Industrial Statistics. [43. [35b. Daniel. Hunter. C. 1-42.] "New Tables for Multiple Comparisons with a Control". 25.] Experiments with Mixtures: Designs. 4.] ''A Quick Method for Choosing a Transformation".] "Influential Observations in Linear Regression". pp. [48. Fisher. Gaylor. Comell. [35a. 1lI. D. Graybill. Fisher. vol. EA y D.] Applications of Statistics to Industlial Expelimentation. 11. AJ. en Technometrics. 35. no. [46. 2a. en Technometrics.. 799-805. Eisenhart.] "Rank Transformations as a Bridge Between Parametric and Nonparametric Statistics" (con comentarios). Duncan.A [33. edición. Hafner Publishing Company. 482-491. 1.W y EN. Wiley. 4a. vol. y RL. Draper. Irwin. pp. and the Analysis of Mixture Data. en The American Statistician. A y WG. vol. Richard D. EA [50. en Biometrics. [34. Agricultural.] "Transformations: Sorne Examples Revisited". en Technometlics.L. 27. en Joumal oftheAmelican Statistical Association. Nueva York. 23. [37. [45. Oliver & Boyd. [40. WJ. . 8a. [41. Nueva York. 5a. RA [44b. 311-342. pp. en Biometrics. 317-326. vol.M. pp. vol. pp. pp. J. [49. pp. Johnson. Wiley. Iman. en Joumal of Quality Technology. edición. pp. Derringer. Hafner Publishing Company. Conover. 907-949. 74. J. Hunter. en Technometrics. vol. en Biometrics. [47. pp. 12. en Biometrics. 20. Models.--632 BIBLIOGRAFÍA Conover. D. [30b. RA y E Yates. Dolby.D. Fries. Hartwell.] "Expected Mean Squares for Nested Classifications". 1-21. pp. O. 1. [31. J. pp. 30.L. Oliver & Boyd. Johnson y M. D.L. Nueva York. Vol. Nueva York. edición. y J.] ''A Comparative Study of Tests for Homogeneity of Variances. en Technometrics. 5. pp. Davies. [38. vol. 699-706. Dekker. Nueva York. vol.] "Three-Quarter Replicates of 2n Designs". Montgomery. pp. [61b. vol. y c. edición.] "Use of Ranks on One Criterion Variance Analysis". Hines. J. [60. 3.] "Critical Values of a Test to Detect Outliers in Factorial Experiments". 210-221. Hill. pp. y J. O. M. [64.M. RR [56. Macmillan.M. pp. [59a. vol.WM. 48. WG. pp. Speed. 371-376. en Statistica Sinica. John. 2a. pp.] "The Three-Quarter Replicates of 24 and 25 Designs".A David (ed. Nueva York. [65b. [61c. en Joumal of the American Statistical Association. 75.] '~Full RankAnalysis of Sorne Linear Model Problems".] "Optimum Designs in Regression Problems". 1. pp.F.] "Optimum Experimental Designs". J.] "Statistical Design Applied to Product Design". en Joumal ofthe American StatisticalAssociation. pp.] ''Analysis ofDesigned Experiments with ComplexAliasing". Kempthome.WM. Hunter. Wolfowitz. vol. vol. y WG. M. [53. Balakrishnan. vol. [67. H. [63. 27. 17. Hocking. 148-152. pp. P. RN. y N.C. Kruskal. en Contributions to Survey Sampling and Applied Statistics.] "The Analysis of Linear Models with Unbalanced Data". [51. 112-122. vol. 24. [68. 8. 21. [54. vol. 907-911).] Response SUlfaces: Designs andAnalyses.A Comell. en Biometrics.WM. vol. WH. 32.S.íf 1 BIBLIOGRAFÍA 633 Graybill.] ''Analyzing Unreplicated Factorial Experiments: A Review with Sorne New Proposals" (con comentarios). en Joumal of Quality Technology. John. [55. en Technometrics. Kiefer. vol. vol. RR. Wiley. 6. 271-294. P. [61a. Nueva York. pp. Speed. John. John. J. y J. [61d. pp. Keuls. Hamada. pp. en Joumal of the American Statistical Association. 1-41. 176-188. Kiefer. [52. Kackar.] '~Review of Response Surface Methodology: A Literature Survey". John. Hunter. pp. pp. 47. Kiefer. no. en Quality Engineering. 3a.] Probability and Statistics in Engineering and Management Science. Khuri. 869-873.] "Blocking a 3(2n . en Technometrics. 8. [59b. [66. en Joumal of Quality Technology. vol. J. Wu. J. . y WA Wallis. 453-465. Wang. Prescott. en Annals of Mathematical Statistics.P. [58. M.A y P. Hocking.] "Optimum Designs in Regression Problems". pp. vol. WW y D. O.] Statistical Design and Analysis of Experiments. 319-321. pp.S.M. en The American Statistician. Al. 1. [62. 30. 17. 56-59. Hocking. 24. 272-304. vol. P. en Applied Statistics. vol. pp.] "Off-Line Quality Control.J. 583-621 (las correcciones aparecen en el vol. F. RR y F. pp. Parameter Design. Hunter. 130-137. Academic Press. en Joumal ofQuality Technology.A y C. and the Taguchi Method". Wiley.] "The Use ofthe Studentized Range in Connection with anAnalysis ofVariance". Nueva York. Hamada. P.] The Design and Analysis of Experiments.] '~Discussion of the Two-Way MUed Model".). en Joumal ofthe Royal Statistical Society B. 4. 298-325. J.k) Design". pp. no. 706-712. edición.] "Confidence Intervals on Nonnegative Linear Combinations ofVariances".WM. 70. enEuphytica. [57. enAnnals ofMathematical Statistics. en Biometrics. vol. Nueva York. 18. 17.] "Let's AH Beware the Latin Square". vol. 571-590. Hackney y F. [65a. vol. 171-184. pp. A. Springer-Verlag.M. en Quality Engineering. [84. en Quality Engineering. pp. en Jou171al ofQuality Technology. 779-788. PNS-Kent. pp. pp. 3a. [74. 371-381. Wiley. Levene.] "Use of Replication in Almost Unreplicated Factorials". Borror y J..] Generalized LinearModels. y D.] "A Permutation Test for Effects in an Unreplicated Factorial Design". Runger.C. 159-177. Runger.] "Quick and Easy Analysis of Unreplicated Factorials". vol.E. vol. 446-450. en Contributions to Probability and Statistics.c. vol. vol. Johnson. 39.C.634 BIBLIOGRAFÍA Larntz. Stanford University Press.] "Foldovers of2k .H. pp. C. [85a. [82. 6. D. y D. Montgomery. [83a. 11. en Joumal oftheAmerican Statistical Association. 30.. RH. Montgomery. 6. D. B. Lenth.] "Robust Test~ for Equality of Variance". [83d. Noble. D.c. 1. México. Myers. [69. en Joumal ofQuality Technology. ed. 2a. . vol. edición.C. vol. pp. [85b. Vol.] Analysis ofMessy Data. 10. Kackar. [72. Nelder. Peck. Jr.M. en Joumal of Quality Technology. [75b. vol.] Introduction to Statistical Quality Control..C. vol. Wiley. edición. [73. vol. [75a. vol. Stanley. Montgomery. Nueva York. y E. ponencia presentada en la Conferencia Técnica de Otoño. 2a. Myers. P. T. 72. Van Nostrand Reinhold. pp. Shoemaker y RN. en Joumal of the Royal Statistical Society. edición.] "Performance Measures Independent of Adjustment". Montgomery. 180-190. [80a. C. pp. Loughin. Chapman & Hall.C.H. pp. y G. H. vol. 31. Part 1: Basic Methods".p Resolution IV Designs". 48.] "Experimental Design for Product and Process Design and Development".] Introduction to Linear RegressionAnalysis. RH. vol. 431-444. y G. 469-473. Limusa-Wiley.A. RG. 171-175. Y D. K. 24. Miller.A. edición. 278-292. Montgomery.] "Gauge Capability Analysis and Designed Experiments. RH. 289-305. Montgomery. Myers. Nueva York. 2a. CA. 253-265.C. [83b. y W.C.] "Gauge Capability Analysis and Designed Experiments.C. [71. Whitcomb. [83c. Miller. [77. Runger. 29. Nueva York. pp. Leon. Montgomery. Nueva York. 1966-1976". [79. edición. D. 115-135. [80b. Nueva York. y G. y J. pp. B. Nueva York.] Simultaneous Statistical Inference. pp. D. Runger.] Probabilidad y estadística aplicadas para ingenieros. Margolin. Boston. pp. [76.] "Calibration of the Lenth Test for Unreplicated Factorial Designs".D. Wiley. Part II: Experimental Design Models and Variance Component Estimation".] "Systematic Methods of Analyzing 2n 3m Factorial Experiments with Applications". 9. en Technometdcs. pp. 274-291. [81. D. YP. Loughin. Milliken.C. 2a. en Technometrics. RG. O1kin. Palo Alto.A.M. 29. en Technometrics. N. Montgomery. en Quality Engineering. pp.C. en Technometrics. R V. Margolin.C. Z.c.] '~ Tutorial on Generalized Linear Models". McCullagh.] "Developments in Multiple Comparisons. Montgomery.] Classical and Mode171 Regression with Applications. en Technometrics. y G. 245-260. RV [70.] "Results on Factorial Designs of Resolution IV for the 2" and 2"3 m Series". Montgomery. D. [78.] "Sorne Cautions in the Use of Plackett-Burman Designs". Corning. D. D. G. vol.Y. T.] Response SU/tace Methodology: Process and Product Optimization Using Designed Experiments. L. vol.] Statistics in Research. G. en Journal ofthe Royal Statistical Society.R. S. pp. [98e. [96. Nueva York. vol. 20-30. 2. MeCulloch.W. Pearson. 370-384. y J.S. en Journal ofQuality Technology. J. E. M. pp.R [9ge. pp.S. S. Newman. [91. en Biometrics.] The Analysis of Variance.J. Quenouille. en Journal of Quality Technology. 2. pp. Nelson. Wetherill. vol. B. Nelson. H. Nelson. H. Searle. Seheffé. Vol. O'Neill. enAnnals ofMathematical Statistics. pp.BIBLIOGRAFÍA 635 Nair.. 127-161. Seheffé. ER [89. 26. 243-254.E Burman. Cambridge University Press.] '~ternative Models for the Analysis of Varianee".] "Top Ten Triumphs and Tragedies of Genichi Thguehi". 232-241. vol. Nueva York.] "The Design of Optimum Multifaetorial Experiments".] Biometrika Tables for Statisticians. 27. Expressed in Terms of an Independent Estirnate of Standard Deviation". [97. [98b. 3. Ames. [98a.] "Generalized Linear Models". Ramberg. A. No. Cambridge University Press.] "Expeeted Mean Squares in Varianee Component Models Having Finite Populations". no.] Biometrika Tables for Statisticians. en Journal of Quality Technology. pp. pp. 33. Nueva York. 110-112. Hartley. J. [100.] 40. Searle. [95. 2. Londres. D. Seheffé. vol. edición. enAnnals ofMathematical Statistics. H.] "The Distribution of the Range in Samples from a Normal Population. y R.] "The Present State ofMultiple Comparison Methods". 4.] '~ 'Mixed Model' for the Analysis of Varianee". Wedderburn. vol. 211-225. Seheffé. et al. Wiley.M. [93a. 195-198.] "Multiple Comparison ofMeans Using Simultaneous Confidenee Intervals".) [86.] ''An Approximate Distribution of Estimates of Varianee Components". Jr. R y G. Cambridge. Searle. Vol. y H. vol. Ostle. [92. Searle.] Variance Components. Nueva York. [90. 27. Pearson. [98d. Faweett. 305-325. vol.] "Using Nested Designs II: Confidenee Limits for Standard Deviations". Wiley. 15. [88a.] Linear Models.] "Thguchi's Parameter Design: A Panel Discussion". en Journal ofthe Royal Statistical Society.] "Topies in Varianee Component Estimation".B. en Biometrics. pp.] The Design andAnalysis ofExperiments.R y RF. pp. Iowa. E.S. L.] "Varianee Estimation Using Staggered. 251-271. vol. 218-241. Cambridge. vol. F. 135. S. vol.R [99a.] Linear Models for Unbalanced Data.O. no. vol. Satterthwaite. y J. 4. pp. pp.E. H. [94.R [99b. B.. Plaekett. RL. Charles Griffin & Company. [88b. 265-267. 27. Hartley.S. Nelson. 23-36. [93b. Y:N. pp. en Quality Engineering. vol. L. en Biometrika. S. vol. pp. [88e. en Biometrics Bull. 3a. - . S.H. vol. 34. Iowa State Press.S. [87. O. en Biometrika. enJournal of Quality Technology. Nelder. 33. Wiley.E. en Biometrika.] "Using Nested Designs 1: Estimation of Standard Deviations". pp. Searle. vol. (eds. pp. edición. Nested Designs". 27. Casella y G. 87-104. 169-171. 21.S. Wiley. 1-76. 2a. y H. [101. en Technometrics. pp. '~Method for Judging AH Contrasts in the Analysis of Varianee". 1.A. Pignatiello. 31. 27. vol. [114.] "Comparing Individual Means in the Analysis ofVariance". Stefansky. J. vol.] "Sorne Computational and Model Equivalences in Analyses of Variance of Unequal-Subclass-Numbers Data". 10. G. en Biomehics. 3. pp. notas inéditas.636 BIBLIOGRAFÍA Searle. [106. 105-112. pp. vol.P. pp.] "The Use andAnalysis of Staggered Nested Factorial Designs". Tukey. en Joumal of the Amelican Statistical Association. 35. American Society for Quality Control.] "Methods of Analysis of Linear Models with Unbalanced Data". Part 11. en Joumal of Quality Technology. Hamada.] "Critical Values of the Lenth Method for Unreplicated Factorial Designs".. 73.· Engineering Methods to Optimize Quality and Minimize Costo UNIPUB.R. Taguchi. Nueva York. E [l13c. E [l13b. G. 99-114.W [111c. 57-66.] "Rejecting Outliers in Factorial Designs". EM. en Joumal of Statistical Computation and Simulation. S. pp. Ye.. Taguchi. 14. [112. [110.W [lIla.] "Interpretations of Adjusted Treatment Means and Regressions in Analysis of Covariance". White Plains. Speed y H. W [107. Tukey. en The American Statistician. vol. Imperial Bureau of Soil Sciences.-E C. 30. pp. vol. . Yates.W [l11b. G. 469-479. [108a. 29. Princeton University. 166-173. EM. pp. Yates. 13. en Annals of Eugenics. en Proceedings ofthe FifthAnnual Convention. J.W [111d. Lu. K. EA. 135-143. Taguchi. [105. J. vol. EM. Jeyaratnam y T. 189-197.. vol. Tukey.R. vol. vol. Simple Analysis for Standard Designs". edición. en Biometrics. vol. [104. 35.Y: Henderson. [108b. E [IBa. Speed. Japón. Nagoya. J. pp.] "Confidence Intervals on Linear Combinations of Variance Components That Are Unrestricted in Sign". 16-33.] "The Analysis of Multiple Classifications with Unequal Numbers in the Different Classes". [109. en Technomehics. Comunicado técnico No.] Introduction to Off-Line Quality Control. y RR Hocking. No. Winer. Ting. Yates. S. UNIPUB. Londres. Central Japan Quality Control Association. J.E [103. H. McGraw-Hill. Burdick.] Inh'oduction to Quality Engineering. vol. 232-242. Graybill.] System ofExpelimental Design.] "The Recovery of Interblock Information in Balanced Incomplete Block Designs".] "One Degree ofFreedom for Non-Additivity". Tukey.] "The Use ofthe R( )-Notation with Unbalanced Data". RJ.] "Quick and Dirty Methods in Statistics. Smith.] "The Problem of Multiple Comparisons".] Statistical Principles in Experimental Design. 52-66. enJournal of Quality Technology. Nueva York. 282-308.M. y Y. Smith. en Joumal of the American Statistical Association. en Biomehics. 35. Beverly. 13. RK. RR Hocldng y O. White Plains.] Design andAnalysis ofFactorial Experiments. Nueva York. 30-33. pp. en TheAmerican Statistician. 317-325. 5. Asian Productivity Organization. pp. [102.2a. pp. Speed. Hackney. pp. N. pp. pp. vol. y J. 5. WU. 32. y M. Apéndice I II III Distribución normal estándar acumulada Puntos porcentuales de la distribución t Puntos porcentuales de la distribución X2 Puntos porcentuales de la distribución F Curvas de operación característica para el análisis de varianza del modelo con efectos fijos Curvas de operación característica para el análisis de varianza del modelo con efectos aleatorios Rangos significativos para la prueba del rango múltiple de Duncan Puntos porcentuales del estadístico del rango studentizado Valores críticos para la prueba de Dunnett para comparar tratamientos con un control Coeficientes de polinomios ortogonales Números aleatorios Relaciones de alias para diseños factoriales fraccionados 2k Glosario para el uso de Design Expert .P IV V VI VII VIII IX X XI XII XIII con k S 15 Y n S 64 637 . 7 2.:.3 3.5 2.87285 .99674 .63307 .1 2.99984 .3 .50000 .4 .1 3.7 1.04 .58706 .99985 .94738 .99940 .7 1.58317 .93319 .6 2.99980 .86433 .65910 .94630 .76730 .99878 .3 1.2 3.99744 .99986 .99993 .57926 .81859 .94845 .6 .99970 .99996 .99978 .84613 . Wiley.2 2.99916 .0 3.7 3.8 .67003 .99936 .98645 .99952 .97725 .95728 .95543 .98679 .91924 .6 3.3 3.5 . z .70540 ..62930 .8 .99202 .76115 .2 .99968 .99825 .99430 .66276 .4 2.61791 .99986 .99978 .97932 .92219 .99931 .99996 .99994 .76424 . Hines y D.78814 .96637 .9 3.98713 .93448 .99036 .84375 .98341 .97128 .4 3.72575 .97831 .93699 .0 1.55567 .99683 .99993 .4 1.98983 .5 3.90320 .8 1.82639 .99995 .79389 .1 1.9 "Reproducida con permiso de Probability alld Statistics ill Ellgilleerillg alld Mallagemellt Sciellce.86864 .99977 .66640 .99653 .70194 .69146 .88686 .99906 .99913 .8 2.1 3.0 3.9 1.99969 .99869 .99224 .69497 .55172 .93822 .99819 .99693 .99938 .93882 .98257 .82121 .94950 .99446 .99991 .00 .98956 .99180 .0 1.99882 .02 .95637 .4 2.88493 .3 .82381 .96407 .73565 .50399 .96711 .6 1.9 2.7 .54776 .96485 .2 1.53983 . ed.62172 .59483 .8 1.79954 .6 3.3 2.du .79103 .87076 .8 3.62551 .97193 .73237 .8 3.84849 .93574 .w.4 3.1 .8 2.94520 .4 .99767 .99958 .1 1.9 1.99990 .90988 .9 .99752 . Distribución normal estándar acumulada" cI>(z) = f -1 - -00 Vfir "/ 7 e-U' .99957 .77035 .0 2.89251 .98610 .99990 .98928 .99245 .99534 . 3a.95907 .1 2.99547 .7 .65542 .99413 .2 .98300 .86650 .5 2.99760 .01 .99979 .99573 .99993 .7 3.50798 .99585 .99379 .99985 .54379 .51595 .95818 . Montgomery.99989 .51197 .69847 .75803 .0 2.99813 .4 1.73891 .96562 .92073 .9 2.99010 .97381 .6 1.97257 .2 1.89065 .90824 .99990 .59095 .7 2.88877 .99266 .90490 .5 1. Nueva York .9 3.72907 .90658 .92506 .99903 .99396 .0 .99560 .03 .99955 .84134 .85083 .97778 .99966 .99953 .C.6 2.3 2.2 2.6 .92364 . w.98214 .99836 .98745 .5 .99910 .3 1.97320 .99934 .99994 .1 .99831 .79673 .5 3.5 1.97882 .99774 .99996 O .99995 .99971 .81594 .99865 .2 3.99664 .99874 .638 APÉNDICE l. 0 1.99361 .99983 .99982 .99994 .99111 .99477 .81327 .99975 .5 3.99992 .4 3.89616 .5 1.99946 .7 2.96926 .52392 .85314 .8 1.4 3.98124 .09 .99086 .1 1.7 .99598 .98870 .88100 .99962 .99995 .92647 .99305 .99061 .99988 .80785 .94179 .5 2.60257 .91149 .65173 .7 1.99989 .55962 .99981 .99609 .4 2.99643 .8 2.6 2.3 3.98809 .99728 .97500 .99918 .91621 .99324 .99987 .7 2.99520 .99506 .99889 .71566 .99286 .78230 .6 2.56356 .99924 .99996 .77637 .Ii'l d APÉNDICE 639 l.87900 .99981 .0 .4 1.83646 .99994 .51994 .97615 .7 3.98778 .98574 .83397 .74537 .99492 .64058 .89973 .74215 .61409 .96080 .95154 .99886 .0 .91773 .64431 .99997 z .57534 .75175 _ .99621 . z .99851 .95994 .99991 .95254 .99964 .97558 .3 2.68082 .9 2.98169 .8 2.93189 .2 3.2 1.99944 .67364 .8 3.90462 .53586 .9 2.99897 .05 .70884 .99134 .99781 .4 .6 .74857 .98537 .68793 .99976 .99950 .8 .95352 .6 1.7 3.6 3.0 3.92922 .78523 .96856 .77935 .3 .4 2.75490 .99861 .9 3.99961 .2 1.99965 .80234 .9 3.91308 .60642 .5 .1 1.95448 .85543 .96995 .68438 .2 .94408 .96164 .2 .0 2.86214 .4 .99720 .06 .99996 .99632 .99926 .99921 .99711 .1 3.99795 .80510 .81057 .71904 .99972 .99929 .92785 .3 .97441 .97670 .99992 .99996 .99992 .91465 .95053 .5 3.98030 .8 1.99158 .93056 .97062 .94295 .1 2.97982 .99995 .99343 .96246 .99736 .98840 .99948 .53188 .83891 .9 .6 3.99841 .98077 .71226 .99846 .9 .8 3.83147 .77337 .5 2.64803 .5 .1 .1 2.99974 .99702 .96327 .99992 .99960 .99973 .7 1.90147 .85993 .59871 .99856 .99987 .3 1.98500 .3 1.99893 . Distribución normal estándar acumulada (continuación) cI>(z) = -~ r _1_ e-u'/l du yr:¡.57142 .56749 .07 .61026 .2 3.89796 .3 3.9 1.63683 .99995 .99900 .3 2.98461 .87493 .99942 .82894 .52790 .6 1.89435 .93943 .72240 .9 1.0 1.99983 .5 1.6 .99988 .2 2.67724 .1 3.98422 .2 2.7 .99997 .1 .87697 .99461 .98899 .8 .85769 .99788 .99807 .08 .0 3.99801 .0 2.4 1.96784 .88297 .. 341 1.120 2.845 2.492 2.624 2.257 .310 1.160 3.110 2.333 1.000 .750 2.258 .228 2.345 1. Pearson y H.258 .831 2.787 2.617 2.041 4.638 1.385 3.796 1.869 5.528 2.741 .717 1.089 7.541 3.057 3.695 .256 .701 1.860 2.686 .684 .10 3.767 3.254 .397 1.143 2.771 2.674 .686 3.326 .328 1.25 1.659 3.060 2.000 1.093 2.691 .313 1.476 1.921 2.32 14.714 1.255 .706 .358 2.182 2.363 1.289 1.718 2.895 1.943 1.773 4.032 3.435 3.012 2.706 1.797 2.0005 636.771 1.819 3.145 2.260 .727 .850 3.337 1. Hartley.173 5.729 1.980 1.776 2.745 3.711 1.257 .297 4.047 3.650 2.31 23.437 4.746 1.527 3.604 4.S.657 9.271 .415 1.005 63.256 .688 . 3a.685 .317 4.025 3.833 1.256 .571 2.683 .725 3.807 .262 .508 2.690 3.684 1.920 2.533 1. Adaptada con permiso de Biometrika Tables fol' Statisticians.408 3.256 .930 3.753 1.893 5.303 1.707 3.267 .373 3.747 3.733 3.787 3.080 2.208 4.119 3.265 .998 2.699 1.602 2.977 2.104 3.318 1.761 1.015 3.679 .500 2.821 2.671 1.610 6.306 2.460 3.62 31.740 1.704 2.319 1.886 1.423 2.015 1.539 2.765 .896 2.314 2.40 . .321 1.764 2..289 .683 .690 3.325 1.674 3.681 . ed.965 4.042 2.256 . 1.256 .861 2.296 1.807 2.232 3.505 3.707 3.971 2.690 .257 .677 .518 2.030 2.256 .153 3.792 3.201 2.0025 127.467 2.763 2.078 1.05 6.372 3.965 3.697 .725 1.924 8.365 3.257 .779 2.497 3.681 2.473 2.091 3.727 .263 .254 .140 4.645 .551 3.700 .684 .467 3.579 3.353 2.821 6.052 2.640 APÉNDICE Sa 1 2 3 4 5 6 7 8 9 n.685 .841 4.262 2. Cambridge .256 .318 4.383 1.001 318.598 4.372 1.160 2.408 5.01 31.256 .915 2.833 3.286 3.878 2.684 .785 4.323 1.222 3.756 2.587 4.947 2. Cambridge University Press.925 5.396 3.721 1. E.073 4.O.250 3.325 .261 .860 1.259 .045 2.457 2.311 1.734 1.697 1.090 .174 3.356 1.816 .781 4.501 4.303 3.252 3.581 3.694 .499 3.291 1"0 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 00 11 a = grados de libertad.610 3.703 1.064 2.350 1.852 3.253 .326 3.812 1.257 .583 2.315 1.355 3.479 2.078 3.179 2.101 2.019 3.782 1.213 7.307 3.131 2.197 3.056 2.683 .038 3.646 3.258 .703 .135 3.576 .687 .330 1.144 4.706 4.316 1.552 3.277 .048 2.428 3.692 .922 3.658 1.106 3.485 3.069 2.552 2.450 3.086 2.711 .314 1.021 2.689 .074 2.326 10.390 2.447 2.421 3.819 2.598 12.567 2.025 12.260 . vol.462 2.883 3.365 2.259 .067 3.959 5.646 3.686 .282 Puntos porcentuales de la distribución ta .485 2.898 2.440 1.132 2.169 3.708 1.660 2.221 4.055 3.960 .453 5.688 . 28 51.85 30. Pearson y H.75 70.58 32.18 2.17 2.34 19.14 124.500 .69 2.28 15.14 5.31 50.63 8.75 18.79 24. Cambridge University Press.08 90.26 11.34 13.24 1.36 40.12 27.39 2.38 9.88 113.49 91.02 20.00 0.S.48 48.35 6.86 16.27 35.34 16.35 5.33 59.64 2.32 32.73 3.05 3.82 31.93 + 0.14 30.35 11.43 10.17 40.87 1.19 51.050 3.48 0.950 .41 0.35 7.09 16.65 43.93 53.71 37.19 37.34 18.69 29.79 20. .26 6.34 1.40 5.33 89.65 2.59 25.48 21.71 27.01 17.01 0.07 3.28 21.96 8.34 9.34 39.70 3.00 0.33 69.92 23.99 1.995 0.23 5.34 49. ed.63 9.005 7.13 77.45 16.34 13.22 116.33 79.36 23.41 34.30 0.76 28.33 .07 12.025 5.53 32. E.38 . vol.09 2.16 29.19 26.95 22.81 36.17 59.56 8.42 83.54 61.39 10.57 44.34 12.65 74.33 1OQ.12 16..07 0.91 7.22 + 0.59 28.52 13.59 13.990 .68 0.96 23.01 5.39 69.63 6.34 15.10 0.02 0.71 1.53 101.53 19.34 .22 0.88 10.68 21. 3a.34 24.60 12.45 1.00 26.07 15.30 140.41 7.89 6.34 24.57 4.34 10.77 55.99 35.19 31.37 3.57 7.65 46.11 0.16 2.15 65.55 20.03 22.26 7.32 128.38 14. Cambridge .15 88.48 20.O.14 124.51 34.81 v = grados de libertad aAdaptada con permiso de Biometlika Tables for Statisticians.81 6.44 53.33 118. Hartley.010 6.68 25.84 14.82 4.76 57.17 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 40 50 60 70 80 90 100 + 0.00 0.83 1.49 26.30 29.58 40.23 8.67 66.91 9.01 7.99 7.77 79.33 99.74 60.14 31.20 67.53 43.09 21.21 11.21 0.85 34.34 8.33 3.81 9.25 3.02 7.16 38.21 24.48 45.36 4.59 14.15 1.34 11.30 .60 5.27 6.52 14.80 34.06 + 0.56 3.87 30.85 14.34 17.00 33.34 71.49 11.30 27.57 5.31 19.05 0.12 10.22 27.63 /112.55 0.41 37.92 18.51 16.74 26.975 Puntos porcentuales de la distribución XZ a a 11 .~ APÉNDICE 641 ID.34 14.72 26.35 0.76 43.67 9.61 18.02 106.95 104.66 5.72 37.73 2.84 7.00 46.11 4.94 4.69 76.49 28.56 135.57 4.43 32.07 4.70 6.14 12.50 79.23 5.42 95.24 1.60 3.34 29.98 59.00 0.67 23.89 63. 1.84 5.12 129.76 67.81 18. 35 1.70 1.31 1.58 1.49 1.39 2.34 1.41 1.57 2.51 1.26 1.45 1.48 1.34 1.44 1.35 1.72 1.40 1.39 1.39 1. Rartley.39 1.08 1.76 1.28 1.35 1.39 1.26 1.45 1.56 1.45 1.36 1.55 1.45 2.44 1.33 1.44.38 1.28 1.48 1.43 2.71 1. Iv.59 1.27 1.49 1.42 1.38 1.08 1.50 1.85 1.30 1.35 2.47 1.57 1.46 1.37 1.42 1.19 1.35 1.27 1.40 1.49 1.43 1.34 2.30 1.52 1.38 1.60 1.30 1.27 1.65 1.37 1..39 1.37 4 8.35 1.28 1.54 1.46 1.51 1. E.41 1.38 1..28 1.32 1.35 1.35 1.41 1.59 1.39 1.35 1.85 3.25 1.32 1.44 1.45 1.41 2.24 1.61 1.41 1.62 1.48 1.62 1.38 1.41 1.71 3.58 1.42 1.29 1.50 [.31 1.57 1.40 1.52 1.53 1.46 1.29 1.37 1.37 1.23 2.43 1.41 1.45 1.47 1.75 1.72 1.15 2.37 1.39 1.40 1.48 1.87 1.74 1.43 1.59 1.49 1.61 1.30 1.38 1.40 1.40 1.27 10 9.68 1.43 2.38 1.32 1.27 1.74 1.65 1.56 1.36 1.53 1.24 1.41 1.37 2.55 1.33 1.83 2.38 1.19 3.35 1.34 1.39 1.26 1.42 1.54 1.08 1.31 1.87 1.00 2.08 1.49 1.80 3.29 1.28 1.43 1.29 1.27 1.33 1.30 1.41 1.46 1.31 1.47 2.48 1.31 1.49 1.89 1.54 1.54 1.77 1.38 1.40 1.38 1.30 1.39 1.44 2.28 1.46 2.48 2.49 1.08 1.53 1.55 1.66 1.63 1.89 1.50 1.41 1.44 1.41 1.58 1.37 1.45 1.39 2.33 1.58 1.37 1.43 1.62 1.46 2.39 3 8.62 1.O.45 1.46 1.39 1.19 1.47 2.59 1.27 1.49 1.19 24 9.48 1.51 1.25 1.36 1.26 1.70 1.40 1.45 1.29 1.53 1.47 1.35 1.38 1.32 3.28 1.56 1.43 1.70 1.10 1.28 1.53 1.76 1.06 1.51 1.43 1.37 1.89 1.81 1.50 1.59 1.31 1.88 1.44 1.24 1.07 1.28 1.41 1.41 2.24 1.36 1.45 1.47 1.42 1.56 1.33 6 8.08 1.75 1.52 1.43 1.19 1.38 1.37 1:35 5 8.38 1.41 1.44 1.78 1.39 1.28 9 9.34 1.32 1.44 2.42 1.29 1.32 1.44 1.42 1.89 1.18 1.46 1.39 1.63 1.78 1.57 1.08 1.43 [.53 1.60 1.5 [ 1.43 1.32 1.47 1.13 1.35 1.63 3.40 1.5 [ 1. Cambridge .35 1.43 1.40 1.54 1.35 1. 1.0\ -\:>.55 1.40 1.71 1.39 1.37 1.30 1.45 1.24 1.52 1.25 1.41 1.34 1.16 1.50 1.44 1.26 1.78 1.34 1.47 1.22 1.58 3.45 1.20 3.38 1.47 1.34 1.42 1.78 1.21 1.29 1.65 1.60 1.31 1.39 1.46 1.88 1.76 1.36 1.47 2.49 3.42 1.48 1.37 1.39 1.34 1.22 1.37 1.47 1.42 1. 2.25 1.28 1.46 1.45 1.69 1.34 1.44 1.42 2.53 1.74 1.47 2.44 1.00 1.51 1.46 2.46 1.29 1.39 1.67 3.52 1.40 1.44 1.31 1.21 1.22 20 9.37 1.43 1.70 1.44 1.28 2.64 1.18 30 9.23 1.45 1.98 3..47 1.45 1.56 1.26 1.08 1.89 1.45 1.40 1.37 1.46 2.47 1.47 1.45 1.. ed.40 1.41 1.42 1.50 3.89 1.00 5.26 1.41 3.49 1.29 8 9.08 1.36 1.41 1.49 1.33 1.43 1.52 1.28 1.05 1. Pearson y R.47 1.49 1.88 1.41 1.38 1.41 1.15 1.46 1.V¡ a N Grados de libertad del numerador (Vl) 1 2 7.33 1.51 1.37 1.43 1.66 1.69 1.79 1.33 1.47 2.89 1.42 1.57 1.65 1.40 1.46 1.36 1.S.77 1.23 1.28 2.36 1.36 2.38 2.40 1.52 1.46 1.66 1.55 1.32 1.38 1.60 1.50 1.88 1.52 1.48 1.37 1.44 1.39 1.48 1.40 1.48 1.24 1.55 1.34 1.30 1.46 1.35 1.49 1.79 1.31 1.43 1. Cambridge University Press.47 1.33 1.34 1.41 1.38 1.66 1.50 1.42 1.51 1.44 1.67 1.33 1.39 1.08 1.32 1.30 1.40 1. 3a.41 1.68 1.32 1.67 1.08 1.40 1.42 1.56 1.51 1.64 1.08 1.31 2.45 1.33 1.46 1.60 1.53 1.29 1.62 1.10 3.63 1.43 1.22 1.31 7 9.32 1.27 1.49 1.42 1.31 1.34 1.35 1.75 1.53 1.25 1.40 1.47 1.25'VI .54 1.36 1.31 1.33 1.58 3.42 1.41 1.58 1.42 1.30 1.14 60 9.44 1.08 1.46 1.36 1.89 1.34 1.47 2.41 1. vol.40 1.35 1.56 1.67 1.36 1.02 1.38 1.47 1.39 1.38 1.36 1.31 1.43 2.12 120 9.66 1.88 1.08 9.32 1.50 1.34 1.37 1.30 1.44 2.49 1.26 3.30 1.38 1.48 1.82 3.32 1.17 1.77 1.33 1.63 1.41 1.33 1.58 1.39 1.34 1.32 V! '" 2 3 4 5 6 7 8 9 10 11 12 13 14 ¿ N .25 1.47 1.36 1.25 12 9.76 3.45 1.39 1.60 1.33 1.24 15 9.46 1.36 1.89 1.30 1.42 1.42 1.29 1.43 1.31 1.46 [.21 1.36 1.08 1.45 2.45 1.44 1.37 1.87 1.37 1.51 1.44 1.32 1.38 1.48 1.38 1.51 1.59 1. o '" 'o" ·s '" " 'O 'O 'O 'O 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 " '" t: 'O ª " o "' 'O " c''" 5 v = grados de libertad aAdaptada con permiso de Biametrika Tables far Statisticians.44 1.16 40 9. VI Puntos porcentuales de la distribución F FO. 12 2.73 1.36 3.00 2.46 4.86 8.61 2.01 1.27 2.48 5.90 1.89 1.72 1.61 2.81 2..55 15 61.16 2.71 1.79 2.46 2.91 1.86 1.81 1.62 1.13 2.54 1.--.66 1.88 1.94 1.15 2.94 1.27 2.17 2.57 1.92 2._-~.96 2.27 3.03 1.07 2.57 1.17 2.21 2.86 1.28 2.51 2.60 1.32 3.85 1.78 3.92 1.30 60 62.72 1.90 1.44 2.30 2.90 1.69 1.62 1.39 236 233 2.12 2.99 1.69 1.65 1.61 2.86 1.77 1.99 2.96 1.95 1.44 2.40 3.57 1.29 3.48 1.63 1.29 2.53 5.69 1.29 2.94 1.00 1.42 2.09 2.51 1.56 2.13 2.23 2.87 3.06 9.66 1.72 1.61 1.72 1.18 3.67 1.08 4 55.79 1.62 1.73 1.72 1.84 1.85 6 58.84 1.00 1.53 1.69 1.05 2.08 2.79 1.79 1.83 1.22 9.09 2.01 2.91 1.---~-~_.73 2.78 1.64 2.13 2.86 1.04 2.50 1.76 1.06 3.17 2.87· 1.64 1.39 2.71 1.06 2.37 5.19 .55 1.42 24 62.27 2.37 1.08 2.22 3.93 1.01 1.80 2.16 2.48 2.24 120 63.39 2.67 1.63 2.82 1.10 3.38 5.18 2.86 9.68 1.57 2.17 3.52 1.54 4.44 2.67 2.32 1.41 2.92 1.59 1.40 2.96 1.75 2.61 1.57 1.89 1.v.88 1.91 1.24 2.72 2.47 2.00 '" v.24 3.18 2.01 2.13 2.28 2.67 2.14 3.38 2.24 5.65 1.70 1.lo.32 2.28 2..58 1.45 5.83 1.67 1.08 2.75 1.96 1.18 2.39 2.65 1.15 3.59 2.29 1.84 2.10 2.:S .82 2.68 1.28 2.50 2.69 2.30 3 53.68 1.54 2.77 1.89 1.05 2.50 2.80 1.62 2.59 1..21 2.47 1.14 2.70 2.79 1.24 9.46 3.18 2. Grados de libertad del numerador (VI) 7 58.47 5.18 2.96 2.34.79 3.31 2.76 1.81 1.76 2.46 1.42 2.2.45 1.52 2.95 1.83 3.93 1.01 2.89 1.78 1.67 1.99 1.90 1.57 1..37 3.72 2.49 2.72 1.09 2.51 2.32 2.19 2.00 9.89 1.'\.64 1.78 2.30 2.35 1.96 1.15 2.49 1.14 2. '" .82 1.66 1.99 1.23 2.17 2.71 1..87 2.33 9.89 1._.58 2.85 1.87 1.23 2.06 2.84 1.45 3..83 1.58 1.16 3.27 2.10 2.28 4.11 2.98 2.16 2:06 1.26 3.90 2.56 2.11 3. Puntos porcentuales de la distribución F (continuación) Fo.05 3.84 2.88 2.26 1.98 3.96 1.36 2.01 2.91 1. ~ ~ . ..48 1.74 1.70 1.89 2.96 2.92 2.75 1.52 2.75 1.93 1.46 3.94 2.78 1.89 1.91 9.03 2.59 1.66 2.10 2.94 2.59 3..21 2.71 9.07 2.87 1.82 1.51 2.03 2.18 2.48 1.61 1.20 2.02 2.49 5.54 2.19 2.85 1.77 1.83 9.09 2.06 2.42 2.33 2.26 9.56 2.54 1.87 1.88 1.38 2.19 2.75 1.23 2.51 1.73 2.20 2.21 2.74 9.04 1.35 2.90 1.79 9.98 1.95 3.82 3.97 2.96 1.29 5.05 1.71 2 49.59 9.54 2.01 1.33 2.38 1.96 1.76 1..00 1.78 1.45 2.66 1.42 1.85 1.84 1.92 1.21 2.28 2._. _.87 1.03 3.60 12 60.97 1.68 1.25 2.55 2.31 2.11 2.02 2.~ .66 1.33 5.32 2.74 1.61 2.87 1.44 5.01 3.22 2.19 3.03 2.31 2.38 2.77 1.24 2.81 1.24 2.75 1.93 2.94 3.00 5.20 9.16 2.34 2.83 1.99 1.35 5.97 1.98 1.73 1.88 2.80 1.18 3.81 2.08 2.74 1.93 1.49 20 61.54 2.81 2. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 C10 1 39.53 2.16 2.55 1.67 1.64 1.08 2.93 1.40 1.25 3.49 2.34 2.81 1.84 1.95 1.34 2.14 2.74 2.16 5.•.39 5.05 2.06 2.95 2.60 1.39 4.74 1.34 4..98 1.90 1.31 4.06 2.15 2.20 3.49 2.00 1.75 2. 2.10 2.73 1.46 2.93 1.53 1.44 9.50 2.06 2.15 2.04 2.96 1.43 2.-~.87 1.64 1.72 8 59.50 1.86 2.24 2.66 1.34 2.53 9.29 2.55 1.52 1.86 1.76 1.59 2.99 1.92 1.94 5 57.56 1.92 3.13 3.72 1.38 30 62.72 1.62 3.56 1.91 1.70 1.62 2.02 1.77 1.70 2.67 2.83 2.79 1.12 2.18 2.02 2.40 2.56 2. --.04 1.63 1.61 1.61 1.36 2.04 2.54 1.93 1.-_.11 3.20 2.29 3.70 1.97 1.35 2.59 1.11 2.35 2.92 2.84 3.78 3.83 1.18 3.86 1.82 1.19 1.76 2.52 2.28 2.30 2.80 3.47 1.54 4.94 1.06 2.25 2.12 2.46 2.06 2.24 2. .00 1.14 2.51 1.41 5.63 10 60.80 1.52 3.10 2.81 1. .91 2.47 2.41 1.16 2.82 1.30 2.76 1.59 2.38 2.50 9.69 1.73 2.35 2.90 2.64 1.07 3.v.71 1.76 3.22 2.88 1.55 2.25 2.94 1.63 1.16 2.78 1.89 2.17 63.77 o:::.42 5.81 1.66 1.05 2.10 2.78 2.98 1.00 1.60 1.44 1.84 1.47 5.97 1.23 3.01 1.34 40 62.98 1.67 9 59.05 3..~~ Iv.98 1.19 9.21 2.46 5.54 1.11 2.10 2.78 1.09 2.§ 'O 'O 'O 'O ~ o o '" " 03 1:: Q) 'O 'O '" ª " ¡s '" d ~ 0\ W .78 3.90 3.32 2.93 1.87 1.60 1.69 1.14 3.13 2.23 3. 68 2.35 2.99 .34 2.30 3.9 19.85 2.68 3.15 2.97 2.62 2.39 5.40 2.67 20 248.10 3.95 4.66 2.32 2.55 2.89 3.77 2.01 2.20 3.86 3.95 2.80 1.37 3.34 2.74 3.18 3.84 3.85 2.00 1.84 1.71 1.26 4.29 2.99 2.21 6 234.81 1.55 2_11 2.94 1.70 2.87 2.90 1.79 5.76 2.53 2.11 3.78 1.43 3.51 10.00 3.39 3.54 2.85 2.01 2.73 2.49 2.12 2.93 1.35 4.50 3.60 2.58 2.54 2.15 2.96 1.62 1.07 3.39 2.65 2.45 2.13 2.32 2.75 1.07 3.63 3.26 3.11 2.24 12 243.33 3.99 1.01 1.88 1. 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 1 161.57 2.12 2.95 2.l 19.32 5.24 2.37 2.96 4.88 10 241.13 2.68 2.52 3.10 2M 2.25 2.51 2.34 3.57 5.41 8.97 1.35 2.28 2.57 2.46 2.18 2.35 2.90 2.95 1.1 19.03 3.12 3.96 2.37 2.79 1.49 3.33 3.75 4.9 19.36 2.79 2.53 1.27 2.83 .59 3.74 1.04 2.25 2.37 2.81 3.67 4.71 2.09 2.34 3.36 3.39 3.06 2.34 2.27 2.11 2.32 4.26 5.59 1.47 3.42 2.06 2.01 1.87 3.54 2.0 19.92 1.93 1..73 3.61 5.20 2.94 1.47 1.49 2.1.Vz Grados de libertad del numerador (1'1) 7 8 238.48 3.98 1.98 1.24 4.57 3.84 1.94 1.9 19.08 1.79 3. '\.85 2.84 1.74 2.97 3.28 6.25 2.22 3.77 4.5 19.15 2.66 4.01 ¿ N 2.21 3.25 2.82 1.25 2.87 1.74 2.90 2.19 2.44 3.12 2.43 2.92 2.51 1.33 2.81 1.60 4 224.52 30 250.os .38 2.83 1.45 8.35 3.36 3.82 1.59 2.84 1.91 1.59 5.77 3.61 2.08 2.00 3 215.23 2.04 2.17 2.66 2.45 8.70 2.31 2.69 3.39 1.01 2.74 4.62 2.91 1.92 2.69 4.27 2.04 4.84 4.12 6.29 3.72 2.54 2.08 4.01 2.14 2.38 3.77 4.58 2.84 1.66 2.32 2.12 2.86 2.60 4.42 2.50 3.58 1.02 1.20 2.84 1.48 2.15 3.38 8. o 01 -o " ·s o " -o OJ "i:i -o -o t:: 01 OJ := OJ -o 01 .4 18.46 2.91 4.01 1.30 2.22 2.09 4.91 1.18 2.21 4.66 2.20 4.71 2.19 2.28 3.75 1.73 1.84 3.80 2.53 2.10 2.28 2.41 3.22 254.71 6.94 2.32 3.28 4.6 19.84 2.33 8.82 4.59 3.10 3.23 2.55 3.14 4.94 9 240.97 1.90 1.42 3.37 5 230.35 2.43 2.55 2.09 3.00 2.45 2.93 1.61 2.46 2.80 2.16 2.85 6.40 8.49 4.71 2.8 19.92 1.71 3.45 4.16 2.75 4.75 15 245.77 1.01 1.68 1.91 2.76 4.19 2.29 2.60 2.1 19.28 2.37 3.1.94 3.29 2.71 1.79 1.01 1.99 5.57 24 249.81 2.11 2.78 2.48 3.62 3.70 1.59 2.96 1.86 4.15 3.44 3.39 2.92 1.89 1.41 4.35 3.63 3.46 8.37 2.29 3.74 2.63 4.07 2.31 2.16 2.46 4.28 3.49 3.15 2.27 2.62 5.49 2.39 2.48 2.36 2.39 60 252.5 19.59 5.70 5.13 3.23 4.18 2.38 2.82 2.04 2.27 2.02 2.59 2..34 2.46 40 251.3 19.53 2.90 2.53 5.40 2.18 4.38 2.75 2.45 2.11 2.74 2.67 2.30 4.38 4.86 1.83 2.58 3.74 5.98 1.18 2.34 3.10 3.40 3.12 4.06 3.35 1.9 19.28 2.40 2.70 3.68 3..95 1.76 2.60 2.45 2.79 5.92 1.20 3.74 1.54 4.88 1.89 1.76 1.96 4.81 3.56 2.07 2.20 2.71 2.51 2.79 2.64 3.04 1.59 5.07 2.16 3.85 1.40 2.01 2.65 2.64 2.22 2.45 2.77 2. VI Puntos porcentuales de la distribución F (continuación) Fo.96 1.25 9.30 2.40 3.90 1.61 1.96 1.16 4.35 8.69 2.79 2.07 2.42 2.96 2.2 19.46 2.06 3.07 2.23 2.25 2.24 2.53 2.92 1.19 2.41 3.32 .84 2 199.41 4.37 8.56 3.69 2.23 3.67 1.74 3.30 2.03 2.64 1.91 2.53 3.07 2.63 2.55 5.75 1.44 2.96 1.16 2.46 3.64 1.00 9.01 6.70 1.55 6.99 1.09 2.27 2.17 4.31 2.05 3.64 2.70 2..10 2.25 1.90 2.94 6.03 2.23 2.51 2.18 3.23 3.55 1.93 2.26 4.68 4.D -o :B d 2.84 1.69 1.25 2.96 1.38 2.35 4.70 2.17 2.15 2.10 236.61 2.05 4.13 2.42 2.30 120 253.92 3.13 7.30 9.03 1.84 2.15 2.48 8.79 1.80 4.42 2.03 2.66 1.57 2.83 2.00 3.85 1.53 4.11 2.60 2.! .55 1.54 2.47 8.51 3.02 1.64 5.76 2.49 2.24 3.00 4.89 1.65 1.93 2.47 2.43 8.53 2.73 1.11 3.72 4.2 19.7 19.43 1.49 2.65 1.87 1.88 4.31 2.06 2.50 8.34 2.67 3.34 2.79 1.03 2.87 3.33 2.21 2.47 2.94 5.05 2.0 19.69 1.22 3.07 3.20 2.21 2.96 2.53 2.45 2.22 2.18 2.74 4.~ ~ 0\ Iv.05 2.16 9.75 1.10 2.75 2.93 2.98 2.44 3.81 1.85 2.77 2.00 1'.42 2.41 2.77 1.62 2.89 6.98 3.81 6.71 2.01 1.87 1.98 2.08 2.46 2.14 3.19 4.49 8.06 2.66 5.3 19.39 3. 47 2.51 17. o " ~ "C "C "C "C '" ª '" '" :g '" O 2.09 3.72 2.12 2.01 8.42 3.71 5.17 8.08 2.05 2.37 2.77 2.76 3.51 2.57 4.94 1.• =.14 3.01 1.26 2.05 1. 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 30 1001 39.79 5 921.25 2.88 2.79 2.92 2.01 4.46 6.28 4.37 14.29 2..95 2.78 2.25 3.25 3.94 1.5 39.20 2.14 2.52 5.57 7.49 2.48 13.13 3.72 3.19 2.00 16.06 3.41 6.47 8.22 3.07 2..76 4.75 6.38 3.75 3.60 5.98 2.94 1.70 2.59 2.38 3.45 14.20 3.98 6.62 5.20 3.63 2.95 3.12 4.41 2.20 6.67 3.84 6.12 4.34 8.22 4.89 2.94 1.65 2.03 2.84 2.46 5.56 6.46 3.11 10 968._ ••~ IV.55 2.88 1.18 3.35 4.57 2.07 4.33 3.28 2.00 2.88 2.30 14.23 2.63 1.88 3.83 1.14 2.36 3.05 12 976.95 2.65 2.13 3.00 3.05 2.25 3.67 1.05 2.3 39.46 4..08 8.92 5.24 4.43 5.94 15 984.51 3.56 2.68 5.52 3.48 4.61 3.41 2.24 4.22 120 1014 39..12 3.87 2.15 4.62 2.47 2.30 2.33 3.75 2.90 4.63 2.89 1.59 5.80 1.28 3.94 2.76 6.27 2.45 2.72 6.90 2.52 2.67 2.05 4.87 2.29 3.04 5.68 2.04 2.52 4.93 1.95 8.43 3.36 7.06 3.43 7.33 5.16 3.01 2.61 2.26 6.v¡ .57 6 937.96 2.2 39.76 2.39 2.42 3.25 15.47 14.50 3.71 24 997.77 2..31 3.60 2.29 3.61 3.64 2.39 3.84 2.51 2.95 3.32 4.69 3 864.01 3.77 3.10 3.21 2.20 6.32 2.77 4.33 2.13 2.74 2.10 3.99 2.07 1.72 3.97 1.23 3.79 5.65 4.79 1.02 2.72 5.43 2.56 3.41 2.1 39.34 3.08 3.27 2.89 2.59 2.48 3.44 12.45 2.33 3.20 2.19 9 963.25 2.02 2 799.45 2.26 6.05 3.44 3.68 2.94 1.69 4.89 2.38 4.70 4.8 39.00 1.53 2.87 1.51 3.49 13.39 2.85 4.90 6.39 2.86 2.40 14.50 2.00 3.39 2.21 2.63 5.18 2.60 7.7 39.OZ5 .51 2.56 4.08 2.69 5.20 3.31 6.87 5.89 5.15 5.51 6.78 3.6 39. Puntos porcentuales de la distribución F FO.73 2.46 4.23 5.99 4.13 2.23 3.41 2.15 5.67 2.02 2.11 2.63 2.37 3.55 2.80 2.".59 2.36 2.29 3.66 3.36 2.07 6.47 4.57 2.44 2.50 13.42 2.39 14.03 2.50 2.18 4.29 4.05 3.43 1.25 8..70 2.73 2.38 3. VI Grados de libertad del numerador (1'1) 1 647.67 2.61 2.88 2.46 14.12 8.~~~-~.18 5.89 3.04 8.78 3.12 3.27 4.57 5.96 2.2 39.32 2.31 3.95 1.25 3.04 2.42 5.16 2.10 3.43 14.07 3.65 3.61 3.¡::.53 2.04 10.44 2.18 2.16 2.72 1.69 2.12 4 899.99 8.57 40 1006 39.36 14.99 5.83 5.11 2.91 1.57 2.17 4.30 2.73 3.76 2.08 4.64 2.10 9.41 6.58 3.66 2.50 2.46 14.43 4.48 3.61 3.97 4.82 2.06 5.42 8.64 1.29 4.87 2.60 2.60 3.48 1.44 3.79 2.93 2.50 3.15 2.62 4.05 2.18 2.39 3.19 2.54 8.17 15.04 3.62 2.44 9.67 4.21 3.72 2.02 4.17 2.56 2.29 3.30 6.76 2.16 2.32 2.1 39.56 3.37 4.80 3.78 2.74 1.14 2.31 2.28 3.46 2.18 2.22 10.57 2.77 3.82 1.24 2.97 2.00 1.12 6.42 4.32 4.38 2.72 4.09 2.45 2.54 2.96 1.67 3.41 3.90 4.09 2.84 3.68 2.24 4.53 1.55 6.91 2.51 3.2 39.80 2.88 1.29 5.13 3..57 2.31 2.90 8.87 3.75 2._.90 3.64 2.88 9.86 4.26 3.33 2.33 2.9 39.98 1.27 2.22 3.15 3.51 4.82 4.38 2.07 7.44 2.29 2.1'Z (continuación) .67 3.05 2.75 5.06 2.76 5..47 4.27 3.17 2.89 3.73 9.39 2.67 2.98 5.15 3.20 4.91 1.39 2.53 3.30 3.82 2.67 2.59 3.98 1.62 3.99 2.04 3.42 5.63 4.96 3.83 20 993.62 9.58 1.34 2.27 4.83 4.90 2.26 5.97 2.33 14.51 2.20 3.36 4.6 39.44 3.84 2.00 -":0 ¿ N '" ·s o ¡:: ¡:: "C "C .69 3.87 2.37 3.94 6..01 1.82 5.64 .30 2.85 1.12 4.35 3.89 3.73 3.21 6.81 2.53 4..35 2.82 3.12 4.01 2.98 7.24 2.93 3.31 3.01 2.66 3.23 5.96 2.85 3.10 3.07 1.54 6.59 3.45 3.27 1018 39.78 2.29 8 956.22 3.7 39.85 2.22 2.41 14.36 6.88 1.39 6.86 3.73 2.95 3.17 3.96 4.72 2.60 4.07 2.73 3.66 3.66 5.98 5.92 2.32 2.18 3.61 2.82 2.52 2.81 8.21 2.85 2.10 4.53 2.79 2.06 1.65 8.20 3.82 4.69 1.41 7 948.15 3.46 2.07 4.78 3.61 5.70 2.90 2.72 2.31 1.81 1.31 3.66 6.17 3.79 2.93 2.91 2.09 2.8 38.94 2.51 2.52 5.34 3.28 5.62 2.03 2.38 2.03 3.71 2. \JI 0'1 .08 2.82 1.48 60 1010 39.35 4.11 2.33 3.25 2.76 1.85 5.22 \.40 2.27 2.49 2.73 2.33 2.47 4.01 1.41 3.15 2.08 4.05 3.80 3.61 1.84 2..06 2.12 2. ¡¡ o " " "'Cl al 4.13 2.56 2.76 1.33 4.01 4.13 3.60 4..84 2.14 4.86 3.75 2.37 4.59 3.68 4.47 7.02 "'Cl "'Cl t: ro ª " "'Cl "'Cl " o "' tJ E! J .21 3.20 2.84 9.54 2.02 9.12 4.45 2.5 99.78 3.11 1.62 2.83 2.56 9.31 3.71 4.10 3.32 4.50 26.80 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 00 5928 99.78 2.73 3.26 2.52 4.36 27.96 2.21 3.06 5.93 3.88 24 6235 99.41 2.55 6.17 3.59 3.66 2.35 2.98 2.77 3.59 60 6313 99.70 3.36 3.17 2.39 2.47 3.23 5.29 3.62 2.98 11.00 13.34 2.37 3.54 2.29 7.52 3.84 2.61 5.50 2.66 2.54 4.25 3.12 2.42 .93 2.76 3.67 2.56 4.45 5.00 JI:! '\.88 7.86 2.00 3.83 3.31 3.57 5.63 2.45 3.89 3.79 30 6261 99.66 10.89 4.18 3.42 5.50 34.82 18.92 2.80 3.46 16.32 3.03 1.32 6366 99.15 7.94 3.03 5.43 4.95 5.72 7.¡::.82 4.00 2.30 4.34 3.62 4.29 8.64 7.10 4.75 2.94 3.72 6.63 4.78 2.80 3.39 3.70 3.08 3.25 4.47 2.93 2.37 3.49 5.21 2.10 4.47 120 6339 99.18 5.97 5.55 8.12 21.26 3.50 3.55 2.99 5.09 3.55 2.52 3.43 3.17 3.10 2.89 2..20 9.78 8.40 8.12 2.20 4.20 2.70 40 6287 99.85 6.14 4.44 4.13 3.46 6.39 9.93 2.33 3.26 13.60 3.64 4.53 1..12 1.20 7.87 2.61 3 5403 99.10 3.26 4.29 3.58 4.72 7.75 2.27 10.16 5.03 2.56 3.79 2.44 4.27 2.49 26.70 3.75 7.36 4.47 2.36 3.18 15 6157 99.66 5.84 3.37 2.86 4.98 6.30 4.56 7.02 6.51 3.94 4.65 8.59 3.05 2.69 12.64 ~------ ¿ 01 "'Cl .72 5.43 3.57 4.46 26.94 4.87 2.98 10.73 1.75 9.03 2.23 3.60 3.99 2.21 5.89 3.62 5.46 3.29 8.26 2.66 2. 0'1 Jll 0'1 Iv.36 3.02 1.26 3.75 12.46 3.55 7.64 4.35 3.16 7.58 2.11 6.06 9.85 2.67 5.68 3.06 3.06 2.98 4.81 2.07 4.03 3.90 3.49 2.34 4.56 7.52 2.91 5.95 1.80 10.59 3.25 28.67 4.51 3.82 4.31 2.72 5.87 6.01 5.51 3.26 3.50 2.75 3.89 4.45 26.64 2. 5.06 4.79 4.47 2.60 1.69 14.39 4.94 2.78 2.40 4.41 13.18 8.80 2.43 26.18 3.41 3.29 2.57 2.31 2.34 3.79 3.35 3.73 2.10 6.52 2.26 10.76 2.07 8.00 2.65 2.75 2.92 9.69 6 5859 99.72 2.11 6.33 2.00 2.63 2 4999.95 4.95 7.04 20 6209 99.20 2.32 5.91 3.23 14.35 4.70 6.38 7.91 15.84 1.00 13.57 2.46 3.29 2.74 2.17 2.67 8.56 10.00 2.84 2.96 2.40 2.07 4. Puntos porcentuales de la distribución F (continuación) FO.84 2. 4.20 4.11 1.19 6.16 3.37 27.01 1.02 7.42 27.63 6.31 4.07 2.49 2.31 4.54 .61 5.47 26.55 10.36 2.02 2.78 3.93 9.82 3.71 3.07 3.48 26.33 27.46 4.86 3.32 5 5764 99.99 5.82 3.23 3.65 9.01 6.97 8.46 9.31 7.78 3.51 3.66 3.51 9 6022 99.09 2.11 4.26 3.03 2.77 4.14 2.38 1.66 2.86 4.49 14.53 8.85 5.18 3.30 3.96 2.74 4.29 5.89 2.30 2.06 4.86 1.08 3.05 14.16 3.82 7.56 6.08 3.81 4.23 2.21 6.06 5.55 2.13 3.47 26.17 4.91 5.44 2.25 3.56 5. 1 4052 98.37 5.89 7.67 3.57 4.48 3.72 4.64 3.78 3.53 5.17 2.56 3.52 2.10 3.15 3.15 3.68 7.09 3.22 5.09 5.29 3.23 3.56 4.93 5.13 13.00 30.14 5.26 6.10 8.19 2.42 3.87 3.04 9.63 2..58 2.59 6.66 1.39 5.85 4.33 2.11 4.17 3.92 2.24 15.76 4.93 6.17 29.88 5.96 4.22 13..43 3.46 8.58 2.03 1.02 7.99 3.40 3.92 2.30 3.14 4.70 2.42 2.60 7.40 4.37 3.74 4.94 1.50 3.65 4.39 27.40 6.02 3. o ro .63 3.31 3.31 5.67 14.32 13.77 7..50 2.23 6.66 2.69 3.25 4.47 5.54 3.12 3.81 3.45 2.08 6.85 7.51 3.18 4.45 3.47 5.63 3.78 4 5625 99.17 3.34 2.42 2.87 14.41 5.37 9.58 2.54 3.09 3.03 3.03 3.41 3.90 2.85 3.50 4.80 1.84 6.40 2.00 2.30 3.41 4.41 10 6056 99.04 4.07 5.17 3.65 4.88 2.70 2.01 3.51 4.19 4.71 15.64 5.72 2.26 4.00 3.55 3.82 2.94 3.02 3.35 14.40 27.48 4.65 9.71 3.35 2.94 3.04 3.66 3.67 2.74 5.05 7.01 •v ¡ .20 16.82 5.92 1.47 7.18 5.27 3.25 11.49 2.87 4.42 5.81 5.95 3.50 13.Vz Grados de libertad del numerador (Jl 1) 7 8 5982 99.99 6.96 3.65 3.01 3.80 5.38 2.70 2.18 4.78 5.75 2.36 2.67 3.53 3.23 2.03 4.73 4.99 6.28 4.98 2.83 2.50 4.99 2.32 12 6106 99.22 4.86 8.20 4.39 5.31 6.22 3.30 28.04 4.21 10.61 2.68 8.45 7.20 3.60 2.36 6.28 4.80 2.67 5.21 2.33 9.46 2.51 6.69 2.62 3.69 3.95 2.52 10.12 3. a " Q) 10 10 Q) 'O 'O ~ :5 10 . :2 . Hartley.50 .60 .80 .O.10 .10 .05) 2 3 4 5 v.40 en .04 . v2 = grados de libertad del denominador. Q) :Q a.00 .05 . :2 en .01)~ 3 2 3.20 en .70 . a. vol.08 .03 .g "- :5 10 . Cambridge University Press.30 .01)_ 1 .02 .60 .04 .!!! en a Q) Q) 10 " 10 10 'O 'O .08 .07 .30 .5 ~ <1> (para a = .05) 345 1.¡¡.40 .06 .01 1.00 .c "- 10 e .05 .¡¡.5 <1>(paraa=.03 .c e .70 . aAdaptada con permiso de Biometl'ika Tables fol' Statisticial1s.01 3 ~ <1> (para a= .50 .!!! ~ '0 .06 . Pearson y R. Cambridge .5 2 2. = grados de libertad del numerador. Curvas de operación característica para el análisis de varianza del modelo con efectos fijosa 1.07 .80 . 2.20.APÉNDICE 647 V.S.el . E.02 1 2 l!> (para a= . ----_r----_r----.05 1------+\+\c\-\-M1~r\!--1H-+-'t-\-l-\--\-+_+-'+_-t-+-'------j----j c..-'-.r------.10 1-----W\W~tBr­ :c ro .01 L- -l-_---'-~ ..201----\' '" ro 15...-'-.30 ... ...00 ...70 .04 I------+lo\-\-+-\-\-\--\-\..60 ...--t'\...\¡W\W~~ :..----Jr+--\-----j----j .------t------j .....g .08 .60 ..!-I..el ro ..05) 2 3 4 5 .--------'l-\--\-1r\--\--\-'H..<1> (para a = .01) ~ '--.~l-\.. " '" ...201--- :c U) ~ 15..---~::--___....50 '¡..05 1------\-lli-\-\\\'\-\--\-f-1r\-\-1r-\--'l-+_\_'\--\--+'~----j----j . '0 Q.---\-+-\--\--\--\-+\-_\_-\-'_\_-\--I--+------j----j .=o\"T-TT~rt-\--\-'1¡-\--Tt-----t---j ..'--.07 I------M'ffi~¡\-\--\"\ .30 .._---k----+---j e c..04 1-------H\-\\+\-\\\-\-I\.l..------.'-'-'. "tJ "tJ ro '-' " ro " ..01 '-1 <p(para a= .03 1-------t\-WI++\-\-\--H+-'-\-+-'HrlH-1r-\--\---\l--+-'-----j----j .l-'_'_'--__>.06 1---------t-1I\T\-V~rT--\-l-\+'H-\-_\t_\_'~~.---'. I---'----+~ .L.--------j----j ..01)~ 2 1 3 .02 1-------t----\-\:\T\+1rH-\-\----\--\-\-\---\--\--\-\-\+-\--\----j----j ._--.. "tJ "tJ 'ro -' " " . " .. _ '_ _____' 1 (1)(paraa=..l--L. .08 I----.--'--l-I-'--'---'----'----'---L...L--'--.-'L...-------r------¡------....05) 2 3 4 5 1.00 .40 :c ~ '0 Q.<1> (para a = . Curvas de operación característica para el análisis de varianza del modelo con efectos fijos (continuación) 1..!...80 .-----...40 .03 1-------t---\\\-\-\-\-\\-\-lI-\--+1r-\--\+Hnc-\--\--\---\----j-----j .07 .¡....50 .10 1-------\M'ffiWr\Jo1r I------~MWM.70 .06 1------t-\M1'"'""""'rWl++-\---\--\-'\-\---\-1\--\-'rl.02 1------HrH-\-\-+'<+'<+--\--Hrl---\-+--\---\---\---\----t-'r--1. U) ._ _ _ _ > .....80 ..el ~ ro .648 APÉNDICE V.--'---''----'L-__'_ _ __' 2 1 3 ..-'\ 1-----\-1ñ-\-+\-\-\-'r\--\-=--!-\-\--\-\-\~__I't__\__\_+_-'\+_----_¡_--__I :c ro .. e .----. L-...L.. Ql ro " Ql ro ~ "C "C . .50 <J) .l.. ......1-J..08 ~=~~~~~tt~~~~+~=1====1===1 .L.--\-_\__\_+--\t-----+---l ..071.rSoF .. .......l.80 ....+..-. .40 '¡ji Ql ·15 c.Jt.....OS) 2 3 4 5 1._ 2 3 <I>(paraa=..L._.03 1----+\""""':"b'I"\-'~++-----_t\__\_+_r_+__\_I__\__lr__+_+_+..60 ..... ..06 I-----++\-Wr\-\'"'~I¡C. . .I¡~'\t=.. .03 .____--____cI__--+H__I\__\_'\_\-T-T_~_...10 1---\c-\-\-\-\'H't\-lbll7-'''?'''iF . .____---t----_j . 0 0 .2 15...APÉNDICE 649 V.08 1---\.00 .70 ..06 1----\+\-I\\-'Wt\-lHrl~+HI"'1.L.L...50 .:...--1.L:!-L.r .>..-...s!S'---___1~~r... . ... ...10 1-----+'\-\-lAAW\_\~-__\_I_H+_\:ot~"""~"""'t""7'~-_+----____t--__t ........ ... . Curvas de operación característica para el análisis de varianza del modelo con efectos fijos (continuación) 1 ..40 .tft:t_:'t\....60 .80 c---'-----R'\ ......J.05 ..70 .01) _ _ 1 3 ~ <I> (para a= ...c .-.L.L..' 1 2 <I> (para a= .. .-\-\W\-\\-V'\. .07 1----+Jl-+1r*-1r-\-\*-'lr"IO""'-7!'= . ...J= .20 :c <J) I'~~~--I-~~\\\~~~--II l---\-\-\-\1M~~.01 L- J.L...1. ...04 1----t\--\t\-fl>t\...05 1----+++++~~7"F"'i1:= . ... .. .OS) 2 3 4 ...\::.30 .01) _ _ 1 ~ <I> (para a = ..L-. ..02 . ..-......"_f\.04 ....g :c ro ro ~ . ..._----''---'-_ _.. . . .10 1---+'t-\--lr\-1l--\\:\-\----\:r':7"'l:= .....70 .60 .:~\'M~~~----\. Curvas de operación característica para el análisis de varianza del modelo con efectos fijos (continuación) 1.20 ~-'----I----~~IIIS!I .....¡¡. ....g :c ro oC ro "- e 2 3 ~<l>(paraa=.f+J~=_+_+..00 ..08 .g :c ro oC "- e 2 3 <l>(paraa=..05) <l>(paraa=...04 .40 .02 1-----\-+Jbf'bt'T-\c\-\-t\-----+++-+-\--\t-++-+----\:-j---'\--l "tJ "tJ ...04 r---..03 ..650 APÉNDICE V.071...~~'<_~I_----_I_--_1 l---\-wt\-\~l_\_'\_----/----\--\4r+_\_Jr\__\_J~'t-I-~---+----l ~ Q) ro " ro Q) ..\.01) _ _ 1 2 3 4 ..!!! en ·15 o- 1-*"''''' ":T'k-----+----4+'M--\l-'.05 1_---H:+-1kt\-\-\-~..01) _ _ 1 ~ <l> (para a= .40 ..J+_~~+__I_~61--l ... Q) ro " Q) ..05) 2 3 4 1...~ en 1: .!!! 15.60 .80 .07 . ..30 ..70 .10 .80 ..\"'-*"'-h...06 ..30 . .06 1_--+TH+-Ir\-\c\>'If-:7'b"''"f=..50 .ittttl:1~~1= .¡ ..50 .03 1----~\-j.20 en ..02 "tJ "tJ .08 t-:=~~m~\':4Z1~ .: : .... Q) ·15 o1: en ro ~ ..00 r .05 . . 40 .02 1-.30 .lo ~ t.10 .80 ...70 . 2a. NJ.00 .06 .60 . 1 1l :c . A.10 .80 .50 .~ Q.o "~ :s! ro v 10 A(para a= .l. .01)~1 7 3 9 11 13 15 57911 17 13 19 15 21 17 "Reproducida con permiso de Enginee/'ing Statistics.03 .01 l--_I-----l_-.70 .r ~ ¡:.06 .04 .00 . Englewood Cliffs.20 .05) 190 en .40 ..J.60 .05 .H. Bowker y G._--L_-'-_.~ !. ..¡¡.y ~ 50 30 70 50 90 70 110 90 130 110 150 130 170 150 190~ ~ 6 v2 8 10 30 ~10 170 A (paraa=.04 . 1.> ro .05 ..50 .. Prentiee-Hall.¡¡.> ro ~ -.08 .03 . al '0 C.07 .30 .01 Curvas de operación característica para el análisis de varianza del modelo con efectos aleatorios" en .02 '"C '"C al :B ro .01) 1.. al """V.L.. Ine. Lieberrnan.. . en • 1l ~ I a al c.----l_ 1 3 5 A(paraa=. '"C '"C al :a ro .APÉNDICE 651 VI..07 . ed.o "~ :s! ro .!!! ~ '0 c.!!! :c en a al lo c.20 11 6 10 20 ~ 1-::// ~~ -.08 . ..._.20 6 = v2 7 Ql :.l..05 I--+----f--'-~ .L-~~'_"'....80 .=.. 1-'I~1--1---+­ Ul ..:..20 ~---'r-:---'-"""'.o "~ "O .0sl--1-- ..07 ..40 ..05 .. (para u= ..40 .(parau=.50 ....:l'_"'_""_~ .l'o.J 123 11.---..~~..60 .01) __ 1 4 2 5 3 6 4 7 5 S 6 9 7 10 S 11 9 -+-1I.. 1I.05) 10 11 12 13 1.04 ..---..!!! Ul '0 c.00 Curvas de operación característica para el análisis de varianza del modelo con efectos aleatorios (continuación) Ul .. ~ o..(parau=.o "~ .. :-.05) 5 6 7 8 9 10 11 12 ._::...70 .OS .....__'__"'.. Ql :.03 I--+---j---f-' ..SO . (para u= ....50 ..01 I----'I---l_--L_---L_-l._-L_~.: .::.:~_...¡¡.10 .l'o.. " <O Ql Ql -g ..l:>o.~.652 APÉNDICE VI... " Ql <O "O "O <O Ql ..04 I--I---ll-'-.¡¡..!!! Ul '0 C...----.: .. -5.::..---.~..01) __ 1 5 2 6 3 7 4 S .~:s:>.06 1---1--+. .101--1--' .. 1.01 1-_1---l_--L_---L~~~~u..g :c <O <O ..03 .30 ...r--r---.70 ..30 .00 ...J 1 2 3 4 11.g :c <O .06 ..r---.02 9 10 12 15 20 30 60 8 .60 .--r---.07 1--+----1--' ...--. .... 7 8 9 12345 "-(pafau=.80 ....ICU._..01 L--_L-----JL..041--1....10 .051--+.r ..UJlU-:L....40 ...70 .00 ..¡ ._-'-_-'-_.u. Curvas de operación característica para el análisis de varianza del modelo con efectos aleatorios (continuación) 1....--_o:c--r----.y .....061--+-.SO .._.-----.SO ...40 .-.041--+--+ ..L......---.y .101--1..Il'-L..70 ..~..30 .---..01) 3 4 5 6 .----.....03 I--+--+. ..00 IE"""-r--r-::----r---.80 f-l ".y .30 .......I..... ......y ...08 .--.031--1-- ..05)~ 1 S 2 7'-"-(parau=.20 ..50 ....02 I--+--+--- 2 3 4 "-(parau=..... ....J>..----r---.... ..20 .¡ ..L_....--..=t=~==t=+ ...071--t-.---. .r ...---.OSI--+-.07 ..50 .081--t-..Ol)~ 5 1 6 2 7 ~ "-(para u= .¡.05) 3 4 5 S 7 8 9 10 1.--.....APÉNDICE 653 VI...051--1-.. .-.70 .30 ...(para u= .40 ..(para u= ..08 .05 ¡---i-ftt' .20 .07 ..00 C--..03 .--.654 APÉNDICE VI.g ro a.02 ¡---i------1n\+\-i 2 3 4 5 .70 .30 .00 .c .¡.--T""::"-..08 .80 .. ro " Ql Ql Cil '0 o. C.(para u= .06 .---..::--.---¡---. e 234 5 .40 .50 .---.50 .05) __ 1 6 __ .60 ..01) __ 1 6 _ _ .03 ¡---t--\t\-\\' .--¡----. ..04 ¡---t-o\\\.(para u= .--.04 .05) 2 3 4 5 6 7 8 1.80 "rlr---'-j--t--j-l .01) 2 3 4 5 6 7 8 .02 "O "O :a ro ..20 Cil .06 . Curvas de operación característica para el análisis de varianza del modelo con efectos aleatorios (continuación) 1..05 . Ql :c .60 ..10 .10 .--.!!! i¡. .07 . 41 4.47 3.17 3.14 3.17 4.22 4.65 4.37 3.65 4.39 4.94 4.30 4.24 4.40 5.66 4.64 3.39 3.52 3.9 7.12 3.22 3.97 2. vol. 1.64 4.52 3.32 5.41 3.88 5.02 3.47 3.89 4.55 5.42 4.15 3.0 9.50 4.27 3.61 100 18.23 3.20 3.32 4.50 4.43 3.03 3.67 4.10 3.0 14.02 3.07 5.52 3.47 3.3 7.47 3.40 3.50 4.47 3.64 4.0 14.48 3.47 3.82 4.29 4.81 5.31 3.25 5.5 6.48 3.B.60 4.34 3.10 4.39 3.69 4.89 3.41 4.02 4.17 4.8 5.29 20 18.47 3.22 3.33 3.50 4.13 4.15 5.04 3.0 7.0 6.50 4.92 3.83 3.05 3.47 3.40 3.47 3.69 4.18 3.12 3.88 4.73 5.56 3.86 2.92 4 18. pp.96 2.0 14.45 4.02 3.61 3.3 6.0 9.00 4.35 3.43 3.65 5.50 3.36 3.0 14.27 3.22 3.68 3. 1.37 3.06 3.99 4.61 3.27 3.09 4.12 4.42 3.83 3.72 4.70 5.48 4.30 3.0 8.39 5.53 3.07 5.96 4.09 4.02 3.83 3.50 4.38 3.15 3.83 3.62 4.08 3.30 3.26 3.47 3.53 3.64 3.09 4.79 3.48 3.41 3.33 3.50 4.98 3.68 3.35 3.58 3.0 6.41 3.21 4.94 4.25 3.5 5.52 3.99 3.6 6.09 4.40 4.47 3.39 3.41 3.75 4.54 3.0 8.47 3.11 3.37 3.48 3.34 3.0 5.74 4.48 3.0 14.14 4.47 3.0 14.51 5.93 3.24 3.02 3.26 5.04 7 90.48 4.88 4.46 3.41 50 90.56 3.52 3.52 3.09 4.76 4.51 5.50 4. no.98 6 90.83 3.98 4.48 3.45 3.15 5.73 4.02 3.44 3.23 3.36 5.06 3.14 9 90.8 6.31 4.08 3.47 3.51 5. f) p f 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 30 40 60 100 00 2 90.50 4.68 f = grados de libertad Reproducida con permiso de "Multiple Range and Multiple F Tests".77 4.68 4.0 6.09 4.38 3.61 4.33 3.7 7.27 4.33 3.61 4.26 5.65 4.53 4.0 14.47 3.26 5.17 10 90.42 3. Duncan.38 3.33 3.7 5.86 3.48 3.0 5.3 6.89 4.25 4.73 5.40 3. f) p f 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 30 40 60 100 00 2 18.82 4.46 3.47 3.47 3.35 3.47 3.05 4.50 4.70 4.89 2.12 3.47 3.61 3.15 5.95 5.15 5. Biometrics.44 6.47 3.43 3.71 4.32 4.48 3.37 3.45 5.23 9 18.36 3.55 3.07 5.47 3.29 3.8 5.64 4.67 4.61 3.42 3.0 6.0 14.10 3.78 4.18 3.47 3.48 4.2 6.02 3.43 4.47 3.71 4.00 2.23 4.64 3 90.0 7.81 4.71 4.95 4.77 3 18.85 4.0 6.76 4.86 4.06 4.0 6.17 4.27 3.58 4.0 14. i APÉNDICE 655 Vil.44 3.69 4.0 8.30 4.32 3.08 4.23 5.74 4.26 4.92 4.3 6.47 3.37 3.11 5.64 4.83 3.47 3.45 4.17 '4.0 14.37 4.46 3.02 3.09 4.33 4.8 5.3 7.5 6.90 5 90.68 3.42 3.9 6.0 6.25 3.47 50 18.21 4.35 3.8 5.28 3.68 3.73 4.77 4.59 4.58 4.83 3.35 3.0 6.89 4.8 7.85 4.56 3.0 9.72 4.52 3.83 2.8 6.25 3.83 4.18 3.39 3.30 3.80 4 90.20 5.11 4.95 2.50 4.95 2.47 3.42 3.50 3.20 3.1 6.52 3.35 3.9 7.15 7 18.10 4.28 3.33 5.0 6.02 5 18.50 4.20 20 90.22 4.01 3.55 5.02 3.29 3.0 14.34 4.44 3.68 3.86 4.30 3.61 3.60 4.41 4.47 3.5 6.02 3.85 4.56 4.38 3.31 3.79 4.1 6.47 3.96 4.09 4.60 3.01 3.0 6.00 4.34 4.98 2.13 5.0 14.35 3.36 3.01 4.71 3.36 4.5 6.2 6.13 3.32 3.43 3.18 5.67 .44 3.26 6.47 4.47 3.0 9.46 3.0 8.63 4.56 3.26 5.48 3.41 3.28 5.32 5.68 3.54 4.94 4.7 5.47 3.27 4.36 3.58 3.0 8.56 3.16 3.68 3.53 4.06 4.30 3.66 4.74 3.11 3.39 3.07 4.69 5.31 3.98 2.38 4.09 4.79 4.47 3.61 3.00 5.53 5.80 2.32 3.0 8.68 3.07 4.39 5.83 3.56 3. 1-42 r O•05 (p.47 3.47 3.0 5.03 3.0 6.22 5.0 6.00 4.48 3.68 4.79 4.34 4.53 4.47 3.19 3.79 4.94 4.47 5.26 3.40 3.41 3.24 4.0 6.09 4. D.46 3.37 4.37 5.17 5.01 2.26 3.0 5.40 5.94 4.4 5.47 3.09 8 90.61 3.39 3.16 4.47 3.47 3.44 3.3 6.34 3.39 5..0 8.02 3.76 3.60 100 90.0 9.24 4.45 3.55 4.68 3.21 3.82 3.3 7.91 4.21 3.96 5.68 4.63 4.83 3.56 3.55 4.09 6 18.47 3.84 4.87 4.63 4.55 5.09 4.5 6.8 6.84 4.59 4.50 4.24 5.82 4.19 8 18.37 3.84 4.7 5.8 5.48 3.61 5.12 5.56 4.35 4.00 4. Rangos significativos para la prueba del rango múltiple de Duncana lO.46 4.48 4.09 4.26 10 18.20 3.50 4.47 3.OI (P.06 3. 17 7.96 4.90 6.44 6.28 4.76 3.41 8.21 5.15 6.73 5.23 9.08 6.35 8.14 5.08 5.68 7.1 17.93 5.85 5.76 8.21 6.21 4.12 7.93 4.74 6.33 6.93 5.85 8.11 5.21 9.25 6.23 7.02 4.99 4.22 7.1 14.40 9.54 6.44 5.63 5.8 19.01 5.16 6.40 7.26 6.35 6.71 8.56 6.32 9.05 6.26 6.51 6.45 6.71 6.06 6.89 6.45 10.05 4.81 7.36 6.89 11.0 28.32 9.61 7.70 4.9 7.14 6.79 5.14 5.55 5.96 5.61 6.56 5.5 19.39 5.91 6.99 5.45 5.39 6.46 8.44 8. pp.5 14.68 7.77 5.5 18.89 5.70 6.27 5.53 5.10 6.26 6.37 5.66 6.73 7.65 9.48 6.19 6.42 9.95 7.0 135 246 253 266 272 272 286 290 294 164 186 216 227 237 36.67 6.6 13.17 4.08 6.07 6. "Extended and Corrected Thb1es of tbe Upper Percentage Points of the Studentized Range".1 13.02 5.09 5.03 6.08 9.97 8.43 5.12 9.25 5.78 6.1 3 8.51 6.18 7.76 5.81 5.91 4.08 11.73 5.9 2 14.94 6.61 10.96 6.17 7.54 9. 39.75 5.25 6.65 f = grados de libertad "De J.66 5.6 32.79 5.22 6.99 8.49 10.55 11.94 8.82 6.55 8.49 8.6 16.66 5.89 5.24 4.60 5.07 4.35 6.89 3.33 5.10 8.55 8.10 4.27 7.7 13.56 5.27 6.07 7.99 7.32 7.19 6.48 7.84 5.7 12.65 6.52 6.02 5.51 6.65 7.49 8.29 6.32 4.13 5.19 6.95 4.89 4.76 6.8 13.87 8.9 14.12 7.91 9.80 4.60 4.66 8.84 6.93 5 5.13 4.81 7.37 6.44 7.25 5.88 8.40 11.48 6.88 5.94 6.67 11.4 34.14 5.36 7.36 7.M.88 7.37 7.20 5.0 37.17 5.59 7.37 4.67 6.30 8.57 6.0 22.84 5.90 5.69 5.70 4.26 7.4 36.4 31.11 4.52 7.45 6.00 6.72 6.3 13.0 37.32 5.71 5.50 5.83 4.1 11.02 5.20 6.2 29.97 6.25 7.30 5.95 9.60 5.48 4.73 7.73 5.01 4.87 7.79 6.80 5.05 6.48 7.13 7.50 6.2 12.41 6.33 7.05 5.41 6.50 4.01 6.31 6.70 10.66 6.54 10.97 5.Ol (p.72 6.85 5.12 8.53 6. vol.12 4.05 6.79 5.50 5.77 5.24 5.51 5.73 6.01 5.67 6.21 6.74 4.43 6.72 5.03 7.36 5.17 5.19 5.14 7. May.87 6.82 4.43 6.01 6.35 9.71 4.46 6.82 6.71 7.16 9.47 7.96 3.15 7.66 6.58 6.54 5.91 7.84 5.6 11.92 5.29 5.60 4.90 6.77 6.85 6.48 10.09 7.65 6.60 7.87 6.39 7.83 5.05 4. Biometrika.76 8.54 5. 192-193.60 5.37 6.38 5.00 6.68 11.69 5.43 5.97 7.66 7.38 5.49 7.80 8.62 5.6 13.3 16.17 9.64 4.63 5.20 7.92 5.45 4.26 4.69 5.84 6.3 15.98 5.2 14.5 19.56 7.08 5.0\ iJl 0\ VIll.8 35.74 4.55 7.27 5.07 5.91 7.2 17.02 5.57 8.34 7.79 6.82 3.36 7.39 4.26 7.4 11.59 6.8 19.24 11.54 4.32 6.0 15.55 8.31 6.43 9.56 6.5 30.80 6.96 6.81 9.2 4 6.24 8.87 4.04 4.91 6.14 5.51 8.40 5.96 6.03 8.10 5.20 7.65 5.9 18.2 18.37 6. Reproducida con permiso de los fideicomisarios de Biometlika .99 6.93 6.64 6.57 10.31 6.65 8.3 12.7 31.20 4.33 5.29 9. f) --p f 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 260 282 298 202 1 90.19 7.13 6.31 7.20 6.70 3.41 6.40 5.03 6.12 5.66 6.76 6.97 10.96 5.81 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 24 30 40 60 120 00 5.61 5.81 6.66 6.84 6.24 6.38 6.42 7.02 3.32 7.97 5.7 26.13 6.27 7.5 12.84 5.92 5.3 24.87 6.65 7.08 9.94 5.65 6.54 6.63 6.67 4.26 10.5 37.51 5.98 5.15 7.49 5.94 7.67 5.55 6.24 10.46 7.5 19.78 4.67 6.56 7.00 8.09 5.34 6.58 6.03 7. Puntos porcentuales del estadístico del rango studentizado" qO.6 33.60 7.7 17.78 7.96 10.32 7.86 8. 46 4.17 5.40 3.32 5.84 8.8 16.19 6.99 6.59 4.71 5.0 16.81 4.85 5.17 6.91 10.49 5.03 8.03 7.92 6.12 7.] U1 .27 6.4 15.27 5.44 5.35 5.10 5.31 4.73 3.37 7.51 5.58 4.96 4.96 3.90 5.65 6.96 5.77 11.79 6.52 4.43 5.04 4.39 5.61 3.27 5.74 3.79 5.26 4.7 8.27 5.11 5.15 5.17 8 45.86 4.47 4.1 13.69 5.51 6.50 4 3.62 3.05 4.64 3 26.58 6.4 13.92 5.32 6.60 5.31 5.18 5.88 4.2 10.71 5.86 5.57 11.14 10.65 6.79 5.09 6.06 4.54 4.61 5.73 6.71 4.8 9.43 5.77 ~L- 6.90 3.56 5.74 4.48 3.40 5.79 3.28 4.94 4.39 6.53 5.84 6.05(P.62 4.89 5.44 3.50 5.32 5.58 6.35 8.48 5.75 5.57 5.20 5.55 4.99 4.68 4.66 5.68 5.47 5.50 5.80 2.59 5.98 3.43 5.04 3.37 4.90 4.21 5.34 3.00 2.47 ~:: 57.70 4.13 5. Puntos porcentuales del estadístico del rango studentizado (continuación) QO.41 6.03 4.06 3.12 5.08 10.98 5.21 5.2 16.04 3.44 4.1 12.15 3.15 4.94 4.07 5.72 5.64 5.23 4.38 10.71 5.90 5.04 6.34 6.80 6.29 6..56 5.24 4.14 8.45 4.67 4.76 5.61 5.33 4.35 5.63 4.00 5.52 8.24 6.68 14 54.15 6.83 4.06 5.19 5.57 6.20 5.11 5.95 5.72 4.18 7.75 9.10 4.59 3.77 4.03 5.67 7.39 5.00 4.47 7.74 5.61 5.93 5 3.79 5.09 5.60 7.53 3.55 5.79 4.65 5.50 5.15 5.80 5.47 11 50.88 4.27 5.60 4.17 4.84 5.01 3.72 5.36 5.89 7.77 3.88 5.55 12 51.95 3.31 5.87 5.74 5.98 9.87 6.34 4.70 3.33 6.92 2.39 10 49.98 5.VIII.28 5.72 8.39 4.02 5.17 5.64 4.30 4.12 5.23 5.43 7.63 5.25 5.11 5.90 4.64 4.12 9.31 4.83 2.97 2.24 8.26 3.15 5.90 4.36 6.82 3.63 5.14 6.30 5.38 5.92 3.49 4.13 5.63 5.37 4.68 4.66 5.96 2.28 6.89 2.42 4. f) p f 2 1 18.80 7.08 4.16 8.12 5.09 4.93 19 58.70 5.11 4.91 4.99 9.33 5.31 5.36 5.34 4.83 7.00 4.08 6.34 6.77 5.20 4.33 5.26 5.40 5.72 5.3 15.46 7.82 4.11 3.1 2 6.81 5.83 5.9 14.84 4.32 5.98 2.92 7.20 6.24 9.79 5.95 8.56 4.62 13 53.03 7 43.01 6.39 9.65 3.75 4.32 5.05 4.93 7.90 4.83 6.31 5.93 5.52 4.92 4.60 6.98 5.98 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 24 30 40 60 120 00 3.89 4.03 7.46 4.36 3.57 5.80 6.76 4.93 5.04 6.85 7.03 5.5 11.56 4.04 5.32 4 32.20 5.46 5.46 5.74 15 55.65 6.05 5.29 9 47.81 4.14 6.01 4.98 4.99 4.78 4.73 6.36 4.08 4.73 5.00 3.75 6.11 5.79 5.35 5.11 4.03 4.55 5.6 14.79 5.60 4.21 7.32 5.27 6.08 3.65 6.3 15.91 5.95 2.20 6.22 5.6 16.71 5.49 6.84 5.43 8.21 7.43 5.74 4.02 4.86 2.06 4.92 5.80 6.92 4.03 3.53 4.18 5.16 4.78 4.28 5.83 5.01 4.03 8.46 3.41 4.44 5.2 15.58 3.44 6.65 4.08 5.99 5.05 4.51 6.65 10.88 5.52 5.83 4.98 3.95 4.51 4.12 5.17 5.59 5.01 0'\ -.36 10.26 4.51 7.84 17 18 58.60 5.14 5.80 16 56.65 5.03 5.38 5.84 3.64 4.24 4.40 5.80 5.47 6.25 5.60 5.02 4.88 3.69 3.42 6.63 5 37.22 4.67 5.86 5.15 5.73 4.16 4.52 7.53 5.00 4.35 5.72 7.90 4.61 5.46 5.09 3 4.73 8.29 6.54 6.95 4.69 8.43 5.93 6.54 9.06 5.49 5.83 4.00 4.97 20 59.82 4.59 5.35 6.47 4.67 3.21 6.92 4.48 6.11 6.59 5.66 4.3 13.20 3.74 5.36 5.06 6.24 5.69 4.16 6.24 5.59 7.86 6 40.20 5. 26 3.54 2.81 2.57 3.24 2.91 2.62 2.89 2.97 2.69 f = grados de libertad aReproducida co~permiso de c.87 2.26 3.73 3. vol.99 2.20 2.22 3.94 2.45 2.55 2.09 2.26 2.12 3.29 2.38 2.29 3.02 2.90 2.27 2.20 3.13 3.53 3.61 2.95 2.72 2.92 2.94 2.85 2.95 2.39 2.09 3.42 2.10 2.10 3.32 3.07 3.14 3.96 2 3.82 2.Joumal oftheAmerican StatisticalAssociation.57 2.29 3.51 6 3.41 3. f) Comparaciones de dos colas a -1 = número demedias de tratamientos (sin incluir el control) f 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 24 30 40 60 120 00 1 2.86 2.95 2.86 2.58 2.69 2.57 2.70 2.46 2.65 2.44 2.10 2.72 2.81 2.39 3.86 2.84 2.61 2.63 2.14 3.21 3 3.41 2.76 2.83 2.61 8 3.81 2.59 2.75 2.os(a -1.33 3.90 2.57 7 3.76 2.04 3.36 2. Biometrics. vol.44 5 3.03 2.38 2.97 2.89 2.58 2.47 2. Dunnett.08 3.97 2.73 2.68 2.69 2.65 2.50 2.77 2.00 2.00 2. SO .90 3.82 2.56 2.53 2.02 3.88 2.31 2.98 1.47 3.81 2.65 9 3.60 2.12 2.06 3.80 2.76 2.67 2.18 2.49 3.66 2.89 2.96 2. 20.73 2.64 3.24 3.86 2.w.19 3.51 2.32 2. Valores críticos para la prueba de Dunnett para comparar tratamientos con un controla do.98 2.71 2.81 2.00 1.35 2.658 APÉNDICE IX.65 2.75 2.07 3.58 2.90 2.66 2.40 2.00 2.02 2.73 2.11 2.44 2.90 2.75 2.24 3.61 2.35 3.54 2.19 3. y de C.02 3.w.13 2.80 2.04 3.51 2.95 2.35 4 3.77 2.87 2.41 2. no.09 2. 3.47 2.05 2.77 2.04 2.87 2.73 2.78 2.23 2.98 2.14 2.94 2.48 3.62 3.78 2.68 2. '1\ Multip1e Comparison Procedure for Comparing Severa! 1Teatments with a Control".82 3.06 2. Dunnett.97 3.69 2.02 2.16 2.14 3. "New Thbles for Multip1e Comparison with a Control".41 3.64 2.84 2.48 2.14 3.92 2.71 3.55 2.68 2.73 2. 36 3.39 2.42 2.15 2.92 2.63 3.57 2.21 3.47 2.01 2.50 3.07 3.03 2.85 2.55 2.71 4.16 3.29 3.32 2.41 2.72 2.89 5.27 2.34 2.64 2.39 2.02 3.17 3. Valores críticos para la prueba de Dunnett para comparar tratamientos con un controla do .66 1.53 3.31 2.98 3.53 3.60 3.51 2.25 3.90 2.51 2.53 2.82 3.68 2.16 4.44 3.09 2.54 2.53 2.62 2.46 2.23 2.42 f 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 24 30 40 60 120 00 2 2.89 1.35 2.44 2.18 3.07 2.39 3.47 2.19 3.87 2.18 2.53 2.71 2.28 2.74 2.94 3.57 2.22 4.67 1.23 6 3.41 2.03 3.58 2.98 2.31 2.75 2.48 4.72 3.58 3.19 3.83 2.69 2.34 8 3.62 4.07 2.59 2.01 (a -1.00 2.39 3.76 1.83 3.86 1.70 2.77 3.os (a -1.30 3.02 1.69 3.25 2.29 3.75 1.81 2.33 3.39 4.00 5 5.71 3.16 5 2.01 2.13 2.31 2.67 2.47 3.86 2.95 2.65 3.96 3.34 2.88 3.06 4 2.15 3.06 6 5.52 3.27 2.08 2.18 2.59 3.1 = número de medias de tratamientos (sin incluir el control) f 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 24 30 40 60 120 00 2 4.13 3.04 2.57 3.37 2.99 3.57 3.66 3.33 3.78 3.76 3.39 2.29 4.44 2.85 3.09 3.60 2.08 3.ti APÉNDICE 659 IX.01 3.93 3.97 1.17 3.89 3.78 1.83 3.79 3.97 2.52 3.77 2.31 3.10 2.47 3.64 4.21 2.81 3.29 3.73 2.03 2.89 3.68 1.85 2.26 2.43 2.61 3.42 2.19 2.95 2.81 2.69 3.63 4.44 3.28 2.17 4.61 2.11 7 5.49 3.88 3.80 5.53 4.64 2.75 2.34 2.62 2.12 3.43 2.79 3.12 3.81 2.43 3. f) Comparaciones de dos colas (continuación) a .05 3.99 3.38 9 3.23 2.89 4.22 4.44 2.29 7 3.49 2.15 2.47 3.71 2.66 2.56 2.21 4.33 3.74 2.87 4.52 2.32 3.56 5.36 2.88 2. f) Comparaciones de una cola a -1 = número de medias de tratamientos (sin incluir el control) 3 2.22 do.20 4.82 2.25 3.55 2.68 2.12 3.11 4.50 3.60 2.45 2.78 3.56 4.19 3.74 3.40 2.57 2.37 3.17 2.63 3. 3.82 4.22 3.33 3.73 1.54 2.33 2.95 1.15 3.69 5.51 3.79 3 4.08 2.51 2.03 2.81 1.45 2.58 2.94 1.50 2.98 2.37 4.64 2.06 .33 2.73 1.56 2.28 4.00 4.65 2.12 3.15 8 5.62 2.71 3.60 2.48 2.48 2.41 2.61 2.37 2.92 4 5.63 3.93 1.28 4.41 4.16 4.48 2.95 3.74 3.32 3.24 2.41 3.80 2.40 4.89 2.55 3.53 2.65 3.19 9 5.36 3.25 2.95 2.64 2.89 3.42 3.22 3.37 2.69 3.64 2.05 3.56 2.10 4.29 2.50 2.01 1.45 3.74 1.52 3.73 3.29 3.46 2.90 2.47 2.71 3.86 2.36 2.42 2.92 2.56 3.62 2.70 2.74 3.56 2.51 4.67 3.08 2.13 2.11 3.22 4.00 3.85 2.39 3.30 2.61 2.76 2.66 2.32 2.40 2.43 4.44 3.44 2.77 1.05 2.20 2.26 3.37 2.48 2.75 3.30 4.07 3.71 3.75 1.22 2.24 3.50 2.71 1.59 2.98 4.22 2.67 2.48 3.64 3.01 2.21 2.40 3.48 2.37 3.55 3.11 2.25 3.83 1.72 1.65 3.60 3.92 .92 2.58 4.68 3.80 1.88 3.25 3.40 3.22 3.26 3.99 1.69 2.83 3.06 2.50 2.66 2.74 4.70 1.60 3. 08 3.33 4.14 ~.56 3.84 2.43 4.30 3.10 3.40 3.72 2.34 3.61 3.94 3.59 4.26 3.21 3.21 3. f) Comparaciones de una cola (continuación) a -1 = número de medias de tratamientos (sin incluir el control) 3 4.17 3.20 3.55 2.15 3.27 3.61 3.90 3.49 2.32 3.89 3.37 3.78 3.99 2.58 2.42 3.50 3.01 2.94 2.08 3.03 3.12 3.60 2.07 3.29 3.14 3.08 3.05 3.66 3.91 2.11 3.97 2.97 2. Valores críticos para la prueba de Dunnett para comparar tratamientos con un control d o.36 3.56 .27 3.09 3.51 3.90 2.14 3.56 3.94 4.83 3.36 3.10 3.99 2.47 3.03 2.06 3.30 4.51 3.04 2.23 3.51 4.93 8 4.05 2.42 3.62 3.21 3.33 3.73 4.96 3.OO 2.92 2.45 3.69 3.21 3.73 2.15 3.11 3.78 2.37 3.72 2.29 3.25 3.42 3.00 f 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 24 30 40 .660 APÉNDICE IX.57 2.82 2.74 3.75 3.84 6 4.38 3.68 2.29 3.39 2.79 3.55 3.24 3.39 3.40 3.56 3.23 4.82 2.96 3.65 2.60 2.86 2.43 4.31 3.12 3.36 3.00 2.06 3.18 3.97 2.32 3.87 2.05 3.18 3.33 3.68 2.97 9 5.67 3.85 4.22 3.31 3.17 3.23 3.44 3.77 5 4.83 2.19 3.19 3.81 2.48 3.71 3.83 3.17 3.77 2.41 3.56 3.07 3.88 2.46 2.82 2.53 2.16 3.03 2.62 2.ol (a -1.89 7 4.01 2.46 3.40 3.25 3.87 2.52 3.60 4.27 3.88 3.48 3.23 3.38 3.94 2.45 3.11 3.11 3.33 3.76 2.82 3.66 3.99 2.64 2.92 2.56 3.03 3.42 3.54 2.44 3.51 3.89 2. 60 120 00 2 3.38 3.36 2.67 3.03 4.94 2.88 3.63 3.42 2.31 3.68 4 4.64 3. ed. Cambridge 0\ 0\ ~ . Xj 1 2 3 4 5 6 7 8 9 10 PI -7 -5 -3 -1 1 3 5 7 P2 7 1 -3 -5 -5 -3 1 7 P3 -7 5 7 3 -3 -7 -5 7 P4 7 -13 -3 9 9 -3 -13 7 Ps -7 23 -17 -15 15 17 -23 7 P6 1 -5 9 -5 -5 9 -5 1 PI P2 28 7 -8 -17 -20 -17 -8 7 28 2772 3 P3 -14 7 13 9 O P4 14 -21 -11 Ps -4 11 P6 4 -17 22 1 -20 1 22 -17 4 1980 60 11 PI P2 6 2 -1 -3 -4 -4 -3 -1 2 6 132 2 I P3 -42 14 35 31 12 -12 -31 -35 -14 42 8580 3 S P'I 18 -22 -17 3 18 18 3 -17 -22 18 Ps -6 14 -1 -11 P6 3 -11 10 -4 -3 -2 -1 O 1 2 3 4 60 1 -9 -13 -7 14 990 (. 70 2 n=9 "3 1 12 (. 3a.. Pearson y H.O. Cambridge University Press. 9 18 9 -11 -4 -9 O 9 4 -11 -21 14 2002 12 7 4 468 W 3 -9 -7 -5 -3 -1 1 3 5 7 9 330 2 -6 6 11 6 -8 -8 6 10 1 -14 6 -11 3 660 11 2: j~1 " {P¡(X)}2 A 168 2 168 1 264 1 616 12 7 2184 Tü 7 264 60 11 2860 ·780 12 S 3 s TO I í40 "Adaptada con penniso de Biometrika Tables for Statisticians. 1 1 3 5 70 i2 35 -5 1 252 Tü 21 1 2 3 28 1 -3 -4 -3 O 5 84 1 n = 10 -1 -1 1 6 1 5 -4 1 84 20 7 2: j~1 " {p¡(XjW A 2 1 6 3 20 2 n= 8 4 1 20 10 10 14 1 10 S (. n=3 n=4 Coeficientes de polinomios ortogonales" n=5 n=6 n=7 Xj 1 2 3 4 5 6 7 PI -1 O P2 1 -2 1 PI -3 -1 1 3 P2 1 -1 -1 1 P3 -1 3 -3 1 PI -2 1 O P2 2 -1 -2 -1 2 P3 -1 2 O P4 PI P2 5 -1 -4 -4 -1 5 84 2 3 P3 -5 7 4 -4 -7 5 180 3 S P4 1 -3 2 2 -3 1 28 7 Ps -1 5 -10 10 PI -3 -2 -1 O P2 5 O P3 -1 1 1 O P4 3 -7 1 6 1 -7 3 154 T2 7 Ps -1 4 -5 O P6 1 -6 15 -20 15 '" -:.:6 1 924 60 77 1 1 2 -2 1 -5 1 -3 -4 -1 6 -4 .S. 1. E. Hartley.X. vol. 662 APÉNDICE XI. Números aleatoriosa 10480 22368 24130 42167 37570 77921 99562 96301 89579 85475 28918 63553 09429 10365 07119 51085 02368 01011 52162 07056 48663 54164 32639 29334 02488 81525 29676 00742 05366 91921 00582 00725 69011 25976 09763 91567 17955 46503 92157 14577 15011 46573 48360 93093 39975 06907 72905 91977 14342 36857 69578 40961 93969 61129 97336 12765 21382 54092 53916 97628 91245 58492 32363 27001 33062 72295 20591 57392 04213 26418 04711 69884 65795 57948 83473 42595 56349 18584 89634 62765 01536 25595 22527 06243 81837 11008 56420 05463 63661 53342 88231 48235 52636 87529 71048 51821 52404 33362 46369 33787 85828 22421 05597 87637 28834 04839 68086 39064 25669 64117 87917 62797 95876 29888 73577 27958 90999 18845 94824 35605 02011 85393 97265 61680 16656 42751 69994 07972 10281 53988 33276 03427 92737 85689 08178 51259 60268 94904 58586 09998 14346 74103 24200 87308 07351 96423 26432 66432 26422 94305 77341 56170 55293 88604 12908 30134 49127 49618 78171 81263 87647 30995 76393 07856 06121 27756 98872 18876 17453 53060 70997 49626 88974 48237 77233 77452 89368 31273 23216 42698 09172 47070 13363 58731 19731 24878 46901 84673 44407 26766 42206 86324 18988 67917 30883 04024 20044 02304 84610 39667 91646 89198 64809 16376 91782 53498 31016 20922 18103 59533 79936 69445 33488 52267 13976 16308 19885 04146 14513 06691 30168 25306 38005 00256 92420 82651 20849 40027 44048 25940 35126 88072 27354 48708 18317 86385 59931 51038 82834 47358 69179 27982 15179 39440 60468 18602 71194 94595 57740 38867 56865 18663 36320 67689 47564 60756 55322 18594 83149 76988 90229 76468 94342 45834 60952 66566 89768 32832 37937 39972 74087 76222 26575 18912 28290 29880 06115 20655 09922 56873 14194 53402 24830 53537 81305 70659 18738 56869 84378 62300 05859 72695 17617 93394 81056 92144 44819 29852 98736 13602 04734 26384 28728 15398 61280 14778 81536 61362 63904 22209 99547 36086 08625 82271 35797 99730 20542 58727 25417 56307 62590 93965 49340 71341 49684 90655 44013 69014 25331 08158 90106 52180 30015 01511 97735 49442 01188 71585 23495 51851 59193 58151 35806 46557 50001 76797 86645 98947 45766 71500 81817 84637 40801 65424 05998 55536 18059 28168 44137 67607 aReproducida con permiso de Probability and Statistics in Engineering and Management Science.w. Wiley. 3a. .. ed. Hines y D. Nueva York w. Montgomery.C. 2. fracción 1/2 de 4 factores en 8 corridas Resolución IV Generadores del diseño D=ABC Relación de definición: 1 = ABCD Alias A = BCD B=ACD C=ABD D=ABC AB=CD AC=BD AD=BC Diseños con 5 factores e) 25.1 5 factores en 16 corridas Resolución V Generadores del diseño E=ABCD Relación de definición: 1 = ABCDE Alias Cada efecto principal es alias de una sola interacción de 4 factores AB=CDE AC=BDE AD=BCE AE=BCD BC=ADE BD=ACE BE=ACD CD=ABE CE=ABD DE=ABC 2 bloques de 8: . fracción 1/2 de d) 25. Relaciones de alias para diseños factoriales fraccionados 2k -p con k :5 15 Yn :5 64 Diseños con 3 factores Resolución ID a) 23. fracción 1/2 de 3 factores en 4 corridas Generadores del diseño C=AB Relación de definición: Alias 1 = ABC A=BC B=AC C=AB Diseños con 4 factores b) 24-1.1. fracción 1/4 de 5 factores en 8 corridas Resolución 111 Generadores del diseño D=AB E=AC Relación de definición: 1 = ABD Alias = ACE = BCDE A=BD=CE B=AD=CDE C=AE=BDE D=AB=BCE E=AC=BCD BC = DE = ACD = ABE CD = BE = ABC = ADE .1 APÉNDICE 663 XlI. . Resolución ID f) 26-2.¡::.0\ 0\ . fracción 1/8 de 6 factores en 8 corridas Generadores del diseño D=AB E=AC F=BC Relación de definición: 1 = ABD = ACE = BCDE = BCF = ACDF = ABEF = DEF Alias A = BD = CE = CDF = BEF E = AC = DF = BCD = ABF B = AD = CF = CDE = AEF F = BC = DE = ACD = ABE C = AE = BF = BDE = ADF CD = BE = AF = ABC = ADE = BDF = CEF D = AB = EF = BCE = ACF Xll. Relaciones de alias para diseños factoriales fraccionados 2'<-P con k :5 15 Yn :5 64 (continuación) Diseños con 6 factores e) 26-3.. fracción 1/4 de 6 factores en 16 corridas Generadores del diseño E=ABC F=BCD Relación de definición: 1 = ABCE = BCDF = ADEF Alias A=BCE=DEF AB=CE B=ACE=CDF AC=BE C=ABE=BDF AD=EF AE=BC=DF D=BCF=AEF E=ABC=ADF AF=DE BD=CF F=BCD=ADE ABD = CDE = ACF = BEF BF=CD ACD = BDE = ABF = CEF 2 bloques de 8: ABD = CDE = ACF = BEF Resolución IV ... g) 26-1. Cada interacción de 2 factores es alias de una sola interacción de 4 factores ABC = DEF ACE = BDF ABD = CEF ACF = BDE ABE = CDF ADE = BCF ABF = CDE ADF = BCE ACD = BEF AEF = BCD 2 bloques de 16:ABC = DEF 4 bloques de 8: AB = CDEF ACD=BEF AEF=BCD Diseños con 7 factores h) 27-4. fracción 1/16 de 7 factores en 16 corridas Resolución VI <l\ Resolución ID Relación de definición: Generadores del diseño D=AB E=AC F=BC G=ABC 1 = ABD = ACE = BCDE = BCF = ACDF = ABEF = DEF = ABCG = CDG = BEG = ADEG = AFG = BDFG = CEFG = ABCDEFG Alias A=BD=CE=FG E=AC=DF=BG B=AD=CF=EG F=BC=DE=AG C=AE=BF=DG G=CD=BE=AF D=AB=EF=CG 0\ 0\ \JI . fracción 1/2 de 6 factores en 32 corridas Generadores del diseño F=ABCDE Relación de definición: 1 = ABCDEF Alias Cada efecto principal es alias de una sola interacción de 5 factores. 3.2. fracción 1/4 de 7 factores en 32 corridas Generadores del diseño F=ABCD G=ABDE Relación de definición: 1 = ABCDF = ABDEG = CEFG Alias A= AB=CDF=DEG BC=ADF CE=FG ACE=AFG B= AC=BDF BD=ACF=AEG CF=ABD=EG ACG=AEF C=EFG AD=BCF=BEG BE=ADG CG=EF BCE = BFG D= AE=BDG BF=ACD DE=ABG BCG=BEF E=CFG AF = BCD BG=ADE DF=ABC CDE=DFG F=CEG AG=BDE CD=ABF DG=ABE CDG=DEF G=CEF 2 bloques de 16:ACE =AFG 4 bloques de 8:ACE =AFG BCE=BFG AB = CDF=DEG Resolución IV Resolución IV .=ABC F=BCD G=ACD Relación de definición: 1 = ABCE = BCDF = ADEF = ACDG = BDEG = ABFG = CEFG Alias A = BCE = DEF = CDG = BFG AB = CE = FG E = ABC = ADF = BDG = CFG AF=DE=BG B = ACE = CDF = DEG = AFG AC = BE = DG F = BCD = ADE = ABG = CEG AG=CD=BF C=ABE=BDF=ADG=EFG AD=EF=CG G=ACD=BDE=ABF=CEF BD=CF=EG D = BCF = AEF = ACG = BEG AE = BC = DF ABD = CDE = ACF = BEF = BCG = AEG = DFG 2 bloques de 8: ABD = CDE = ACF = BEF = BCG = AEG = DFG . j) 27. en 16 corridas Relaciones de alias para diseños factoriales fraccionados 2k-p con k :5 15 Yn :5 64 (continuación) i) 27. fracción 1/8 de 7 factores Generadores del diseño E.0\ 0\ 0\ xn. fracción 1/16 de 8 factores en 16 corridas Generadores del diseño E=BCD F=ACD G=ABC H=ABD 1 = BCDE = ACDF = ABEF = ABCG = ADEG = BDFG = CEFG = ABDH = ACEH = BCFH = DEFH = CDGH = BEGH = AFGH = ABCDEFGH Resolución IV Relación de definición: Alias A = CDF = BEF = BCG = DEG = BDH = CEH = FGH B = CDE = AEF = ACG = DFG = ADH = CFH = EGH C = BDE = ADF = ABG = EFG = AEH = BFH = DGH D = BCE = ACF = AEG = BFG = ABH = EFH = CGH E = BCD = ABF = ADG = CFG = ACH = DFH = BGH F = ACD = ABE = BDG = CEG = BCH = DEH = AGH G=ABC=ADE=~F=crF=rnH=~H=AFH H = ABD = ACE = BCF = DEF = CDG = BEG = AFG 2 bloques de 8: AB = EF = CG = DH AB=EF=CG=DH AC=DF=BG=EH AD=CF=EG=BH AE=BF=DG=CH AF=CD=BE=GH AG=BC=DE=FH AH =BD=CE=FG ---:t 0\ 0\ . fracción 1/2 de 7 factores Resolución VD en 64 corridas Generadores del diseño G=ABCDEF Relación de definición: 1 = ABCDEFG Alias Cada efecto principal es alias de una sola interacción de 6 factores Cada interacción de 2 factores es alias de una sola interacción de 5 factores Cada interacción de 3 factores es alias de una sola interacción de4 factores 4 bloques de 16: ABC 2 bloques de 32: ABC CEF CDG Diseños con 8 factores ~ 1) 28-4.1.k) 27. fracción 1/8 de 8 factores en 32 corridas Generadores del diseño F=ABC G=ABD H=BCDE Relación de definición: 1 = ABCF = ABDG = CDFG = BCDEH = ADEFH = ACEGH = BEFGH Alias A=BCF=BDG AE=DFH=CGH DE=BCH=AFH B=ACF=ADG AF=BC=DEH DH=BCE=AEF C=ABF=DFG AG=BD=CEH EF=ADH=BGH D=ABG=CFG AH = DEF = CEG EG=ACH=BFH E= BE=CDH=FGH EH = BCD = ADF = ACG = BFG F=ABC=CDG BH =CDE=EFG FH=ADE=BEG G=ABD=CDF CD=FG=BEH GH=ACE=BEF H= CE=BDH=AGH ABE = CEF = DEG AB=CF=DG CG=DF=AEH ABH = CFH = DGH AC=BF=EGH CH=BDE=AEG ACD = BDF = BCG = AFG AD=BG=EFH 2 bloques de 16:ABE = CEF = DEG 4 bloques de 8: ABE = CEF = DEG ABH = CFH = DGH EH = BCD =ADF =ACG = BFG . Relaciones de alias para diseños factoriales fraccionados 2"-P con k :5 15 Y n :5 64 (continuación) Resolución IV In) 28-3.0\ 0\ 00 XII. ~ n) 28-2. fracción 1/4 de 8 factores en 64 corridas Resolución V Generadores del diseño G=ABCD H=ABEF Relación de definición: 1 = ABCDG = ABEFH = CDEFGH Alias AB=CDG=EFH BG=ACD EF=ABH ADH= BFG= AC=BDG BH=AEF EG= AEG= BGH= AD = BCG CD = ABG EH = ABF AFG = CDE = FGH AE=BFH CE= FG= AGH= CDF=EGH AF=BEH CF= FH=ABE BCE= CDH=EFG AG=BCD CG=ABD GH= BCF= CEF=DGH AH=BEF CH= ACE= BCH= CEG=DFH BC=ADG DE= ACF= BDE= CEH=DFG BD=ACG DF= ACH= BDF= CFG=DEH BE = AFH DG = ABC ADE = BDH = CFH = DEG BF=AEH DH= ADF= BEG= CGH=DEF 2 bloques de 32: CDE 'Il\ = FGH 4 bloques de 16: CDE = FGH ACF BDH 0\ 0\ \O . . con k :5 15 Yn :5 64 (continuación) Diseños con 9 factores o) 29-5.0'1 -..l o xn. fracción 1/32 de 9 factores Resolución ID Generadores del diseño E=ABC F=BCD G=ACD H=ABD J=ABCD Relación de definición: 1 = ABCE = BCDF = ADEF = ACDG = BDEG = ABFG = CEFG = ABDH = CDEH = ACFH = BEFH = BCGH = AEGH = DFGH = ABCDEFGH = ABCDJ = DEl = AFJ = BCEFJ = BGJ = ACEGJ = CDFGJ = ABDEFGJ = CHJ = ABEHJ = BDFHJ = ABCDEFHJ = ADGHJ = BCDEFGHJ = ABCFGHJ = EFGHJ Alias A=FJ B=GJ C=HJ D=El E=DJ F=AJ G=BJ H=CJ J=DE=AF=BG=CH AB=CE=FG=DH AC=BE=DG=FH AD=EF=CG=BH AE=BC=DF=GH AG=CD=BF=EH AH=BD=CF=EG 2 bloques de 8: AB = CE = FG = DH .¡. en 16 corridas Relaciones de alias para diseños factoriales fraccionados 2k.. fracción 1/16 de 9 factores en 32 corridas Generadores del diseño F=BCDE G=ACDE H=ABDE J=ABCE Relación de definición: 1 = BCDEF = ACDEG = ABFG = ABDEH = ACFH = BCGH = DEFGH = ADFJ = BDGJ = CEFGJ = CDHJ = BEFHJ = AEGHJ = ABCDFGHJ Alias A = BFG = CFH = DFJ B=AFG=CGH =DGJ C = AFH = BGH = DHJ D = AFJ = BGJ = CHJ E= F = ABG = ACH = ADJ G = ABF = BCH = BDJ H = ACF = BCG = CDJ J = ADF = BDG = CDH AB = FG = DEH = CEl AC = DEG = FH = BEl AD = CEG = BEH = FJ AE = CDG = BDH = BCJ = GHJ AF=BG =CH =DJ AG=CDE=BF=EHJ AH = BDE = CF = EGJ AJ=BCE=DF=EGH BC = DEF = GH = AEJ BD = CEF = AEH = GJ BE = CDF = ADH = ACJ = FHJ BH = ADE = CG = EFJ BJ=ACE=DG=EFH CD = BEF = AEG = HJ CE = BDF = ADG = ABJ = FGJ CJ = ABE = EFG = DH DE = BCF = ACG = ABH = FGH EF = BCD = DGH = CGJ = BHJ EG = ACD = DFH = CFJ = AHJ EH = ABD = DFG = BFJ = AGJ El = ABC = CFG = BFH = AGH AEF = BEG = CEH = DEl Resolución IV = ABCEl 'ilt 2 bloques de 16:AEF = BEG = CEH = DEJ 4 bloques de 8: AEF = BEG = CEH = DEl AB = FG = DEH = CEl CD =BEF=AEG =HJ -J 0'1 1-' .-J p) 29-4. ) 0\ N xn. 9.--.3 . Relaciones de alias para diseños factoriales fraccionados 2k-l' con k ~ 15 y n ~ 64 (continuación) q) 2 fracción 1/8 de 9 factores en 64 corridas Resolución IV Generadores del diseño G=ABCD H=ACEF J=CDEF Relación de definición: I = ABCDG = ACEFH = BDEFGH = CDEFJ = ABEFGJ = ADHJ = BCGHJ Alias A=DHJ AC=BDG=EFH BF= B= AD=BCG=HJ BG=ACD=CHJ AE=CFH C= BH=CGJ D=AHJ AF=CEH BJ=CGH AG=BCD E= CD=ABG=EFJ F= AH=CEF=DJ CE=AFH=DFJ AJ=DH G= CF=AEH=DEJ H=ADJ BC=ADG=GHJ CG= ABD = BHJ J=ADH BD=ACG CH=AEF=BGJ AB=CDG BE= CJ=DEF=BGH DE=CFJ GJ=BCH AFJ = BEG = DFH DF=CEJ ABE=FGJ AGH=DGJ DG=ABC ABF=EGJ AGJ = BEF = DGH EF=ACH=CDJ ABH=BDJ BCE= EG= ABJ = EFG = BDH BCF= EH=ACF ACJ = CDH BDE = FGH EJ=CDF ADE = EHJ BDF = EGH FG= ADF=FHJ BEH=DFG FH=ACE AEG=BFJ BFG=DEG FJ=CDE AEJ = BFG = DEH CEG= GH=BCJ AFG=BEJ CFG= 2 bloques de 32: CFG 4 bloques de 16: CFG AGJ = BEF = DGH ADE=EHJ .. .j Diseños con 10 factores r) 2 0-6. fracción 1/64 de 10 factores 1 Resolución ID en 16 corridas Generadores del diseño E=ABC F=BCD G=ACD H=ABD J=ABCD K=AB Relación de definición: 1 = ABCE = BCDF = ADEF = ACDG = BDEG = ABFG = CEFG = ABDH = CDEH = ACFH = BEFH = BCGH = AEGH = DFGH = ABCDEFGH = ABCDJ = DEl = AFJ = BCEFJ = BGJ = ACEGJ = CDFGI = ABDEFGJ = CHJ = ABEHJ = BDFHJ = ACDEFHJ = ADGHJ = BCDEGHJ = ABCFGHJ = EFGHJ = ABK = CEK = ACDFK = BDEFK = BCDGK = ADEGK = FGK = ABCEFGK = DHK = ABCDEHK = BCFHK = AEFHK = ACGKH = BEGHK = ABDFGHK = CDEFGHK = CDJK = ABDElK = BFJK = ACEFJK = AGJK = BCEGJK = ABCDFGJK = DEFGJK = ABCHJK = EHJK = ADFHJK = BCDEFHJK = BDGHJK = ACDEGHJK = CFGHJK = ABEFGHJK .J 0'\ (.¡J . A=FJ=BK B=GJ=AK C=HJ=EK D=El=HK E=DJ=CK F=AJ=GK G=BJ=FK H=CJ=DK Alias J = DE = AF = BG = CH K = AB = CE = FG = DH AC=BE=DG=FH AD=EF=CG=BH AE=BC=DF=GH AG = CD = BF = EH = JK AH=BD=CF=EG 2 bloques de 8: AG = CD = BF = EH = JK --. --. :5 15 Yn :5 64 (continuación) Resolución IV F=ABCD G=ABCE H=ABDE J=ACDE K=BCDE Relación de definición: 1 = ABCDF = ABCEG = DEFG = ABDEH = CEFH = CDGH = ABFGH = ACDE! = BEFJ = BDGJ = ACFGJ = BCHJ = ADFHJ = AEGHJ = BCDEFGHJ = BCDEK = AEFK = ADGK = BCFGK = ACHK = BDFHK = BEGHK = ACDEFGHK = ABJK = CDFJK = CEGJK = ABDEFGJK = DEHJK = ABCEFHJK = ABCDGHJK = FGHJK Alia's AH = BDE = BFG = DFJ = EGJ = CK A = EFK = DGK = CHK = BJK Al = CDE = CFG = DFH = EGH = BK B = EFJ = DGJ = CHJ = AlK C = EFH = DGH = BHJ = AHK AK = EF = DG = CH = BJ D = EFG = CGH = BGJ = AGK BC = ADF = AEG = HJ = DEK = FGK E=DFG=CFH =BFJ=AFK BD = ACF = AEH = GJ = CEK = FHK F = DEG = CEH = BE! = AEK BE = ACG = ADH = FJ = CDK = GHK G = DEF = CDH = BDJ = ADK BF = ACD = AGH = E! = CGK = DHK H = CEF = CDG = BCJ = ACK BG = ACE = AFH = DJ = CFK = EHK J = BEF = BDG = BCH = ABK BH = ADE = AFG = CJ = DFK = EGK K = AEF = ADG = ACH = ABJ CD = ABF = GH = AET = BEK = FJK CE = ABG = FH = ADJ = BDK = GJK AB = CDF = CEG = DEH = FGH = JK CF = ABD = EH = AGJ = BGK = DJK AC = BDF = BEG = DE! = FGJ = HK CG=ABE=DH =AFJ =BFK =ElK AD = BCF = BEH = CE! = FHJ = GK AE = BCG = BDH = CDJ = GHJ = FK DE = FG = ABH = ACJ = BCK = HlK AF = BCD = BGH = CGJ = DHJ = EK DF = ABC = EG = AHl = BHK = CJK AG = BCE = BFH = CFJ = EHJ = DK 2 bloques de 16: AK = EF = DG = CH = Bl 4 bloques de 8:AK = EF = DG = CH = Bl Al = CDE = CFG = DFH = EGH = BK AB = CDF = CEG = DEH = FGH = lK .] 0\ XII. Relaciones de alias para diseños factoriales fraccionados 2k-p con k s) fracción 1132 de 10 factores en 32 corridas Generadores del diseño 2 10-5....¡::.. .) 0\ U1 . fracción 1/16 de 10 factores en 64 corridas Generadores del diseño G=BCDF H=ACDF J=ABDE K=ABCE Relación de definición: 1 = BCDFG = ACDFH = ABGH = ABDEl = ACEFGJ = BCEFHJ = DEGHJ = ABCEK = ADEFGK = BDEFHK = CEGHK = CDJK = BFGJK = AFHJK = ABCDGHJK A=BGH B=AGH C=DJK D=CJK E= F= G=ABH H=ABG J=CDK K=CDJ AB=GH=DEJ=CEK AC=DFH=BEK EF= EG = DHJ = CHK EH = DGJ = CGK El = ABD = DGH EK = ABC = CGH FG = BCD = BJK FH = ACD = AJK FJ = BGK = AHK FK = BGJ = AHJ Resolución IV Alias AD=CFH=BEl AE=BDJ=BCK AF=CDH=HJK AG=BH AH=CDF=BG=FJK AJ=BDE=FHK AK=BCE=FHJ BC=DFG=AEK BD=CFG=AEJ BE=ADJ=ACK BF=CDG=GJK BJ=ADE=FGK GJ=DEH=BFK GK = CEH = BFJ HJ = DEG = AFK HK = CEG = AFJ ABF = FGH ACG = BCH = EFJ ACJ = EFG = ADK ADG = BDH = EFK AEF = CGJ = DGK BK=ACE=FGJ CD=BFG=AFH=JK CE=ABK=GHK CF=BDG=ADH CG = BDF = EHK CH=ADF=EGK CJ=DK CK = ABE = EGH =DJ DE=ABJ=GHJ DF=BCG=ACH DG=BCF=EHJ DH=ACF=EGJ AEG=BEH=CFJ=DFK AEH = BEG AFG = BFH = CEl = DEK AGJ = CEF = BHJ AGK = DEF = BHK BCJ = EFH = BDK BEF = CHJ = DHK CDE = ElK CFK = DFJ . 2 bloques de 32:AGJ = CEF = BHJ 4 bloques de 16:AGJ = CEF = BHJ AGK = DEF = BHK CD =BFG =AFH=JK --..t) 210-4.. fracción 1/128 de 11 factores en 16 corridas Generadores del diseño E=ABC F=BCD G=ACD H=ABD J=ABCD K=AB L=AC Relación de definición: 1= ABCE = BCDF = ADEF= ACDG = BDEG = ABFG = CEFG = ABDH = CDEH = ACFH = BEFH = BCGH = AEGH = DFGH = ABCDEFGH = ABCDJ = DEl = AFJ = BCEFJ = BGJ = ACEGJ = CDFGJ = ABDEFGJ = CHJ = ABEHJ = BDFHJ = ACDEFHJ = ADGHJ = BCDEGHJ = ABCFGHJ = EFGHJ = ABK = CEK = ACDFK = BDEFK = BCDGK = ADEGK = FGK = ABCEFGK = DHK = ABCDEHK = BCFHK = AEFHK = ACGHK = BEGHK = ABDFGHK = CDEFGHK = CDJK = ABDElK = BFJK = ACEFJK = AGJK = BCEGJK = ABCDFGJK = DEFGJK = ABCHJK = EHJK = ADFHJK = BCDEFHJK = BDGHJK = ACDEGHJK = CFGHJK = ABEFGHJK = ACL = BEL = ABDFL = CDEFL = DGL = ABCDEGL= BCFGL = AEFGL = BCDHL .. Relaciones de alias para diseños factoriales fraccionados 2t(p con k :5 15 Yn :5 64 (continuación) Diseños con 11 factores Resolución ID u) 211.-.= ADEHL = FHL = ABCEFHL = ABGHL = CEGHL = ACDFGHL = BDEFGHL = BDJL = ACDElL = CFJL = ABEFJL =ABCGJL = EGJL = ADFGJL = BCDEFGJL = AHJL = BCEHJL = ABCDFHJL = DEFHJL = CDGHJL = ABDEGHJL = BFGHJL = ACEFGHJL = BCKL = AEKL = DFKL = ABCDEFKL = ABDGKL = CDEGKL = ACFGKL = BEFGKL = ACDHKL = BDEHKL = ABFHKL = CEFHKL = GHKL = ABCEGHKL = BCDFGHKL = ADEFGHKL = ADJKL = BCDElKL = ABCFJKL = EFJKL = CGJKL = ABEGJKL = BDFGJKL = ACDEFGJKL = BHJKL = ACEHJKL = CDFHJKL = ABDEFHJKL = ABCDGHJKL = DEGHJKL = AFGHJKL = BCEFGHJKL A=FJ=BK =CL B=GJ=AK=EL C=HJ=EK=AL D=El=HK=GL E=DJ=CK=BL F=AJ=GK=HL G=BJ=FK=DL H=CJ=DK=FL 2 bloques de 8:AE Alias J=DE=AF=BG=CH K = AB = CE = FG = DH L=AC=BE=DG=FH AD=EF=CG=BH AE = BC = DF = GH = KL AG = CD = BF = EH = JK AH = BD = CF = EG = JL = BC = DF = GH = KL .J 0'1 0'1 XII.7.. .JK = DHJK == ABCDFHJK = BCGHJK = AFGHJK = BDEL = ACDEFL = CEGL == ABEFGL = BCHL = AFHL = DGHL = ABCDFGHL = ABCEJL = EFJL = ADEGJL = BCDEFGJL = ABDHJL = CDFHJL = ACGHJL = BFGHJL = ABKL = CFKL = ACDGKL = BDFGKL = ABCDEHKL = DEFHKL = AEGHKL = BCEFGHKL = BCDJKL = ADFJKL = GJKL = ABCFGJKL = BEHJKL = ACEFHJKL = CDEGHJKL = ABDEFGHJKL Alias A = BCF = DFG = CDJ = BGJ = EHJ = DEK = CHK = FHL = BKL B = ACF = CDG = EGH = DFJ == AGJ = FHK = DEL = CHL = AKL C = ABF = BDG == DEH = ADJ = FGJ = AHK = ElK = EGL = BHL = FKL D =BCG = AFG = CEH = ACJ = BFJ = AEK = HJK = BEL = GHL E = CDH = BGH = AHJ = ADK = FGK = CJK = BDL = CGL = FJL F = ABC = ADG = BDJ == CGJ = EGK = BHK = AHL = ElL = CKL G = BCD = ADF = BEH = ABJ = CFJ = EFK = CEL = DHL = JKL H = CDE = BEG = AEJ = ACK = BFK = DJK = BCL = AFL = DGL J = ACD= BDF = ABG = CFG = AEH = CEK = DHK = EFL = GKL K = ADE = EFG = ACH = BFH = CEl = DHJ = ABL = CFL = GJL L = BDE = CEG = BCH = AFH = DGH = EPJ = ABK = CFK = GJK AB=cr=W=KL AE=m=~ AH=El=IT=R ~=m=H ~=m=a=H ~=M=lli=~ AF=OC=OO=& N=m=OO=ffl ~=oo=FJ=a cr=~=~==~ AD=FG=CJ=EK AG=DF=BJ AK =DE=CH =BL BE=GH =DL EF=GK =JL ABD = CDF = ACG = BFG == EFH = BCJ =AFJ = DGJ = BEK = G~ = AEL = HJL = DKL ABE = CEF = DFH = AGH = EGJ = BH! = BDK = CGK = F~ = ADL = FGL = CJL = EKL ABH = DEF = AEG = CFH = BEJ = GHJ = BCK = AFK = DGK = ACL = BFL = DJL = HKL ACE = BEF = ADH = FGH = DEl = CHJ = CDK = BGK = EHK = ~ = DFL = AGL = BJL AEF = BCE = DEG = BDH = CGn = FHJ = DFK = AGK = BJK = CDL = BGL = EHL = NL 2 bloques de16: AB = CF = GJ = KL 4 bloques de 8: AB = CF = GJ = KL AD = FG = CJ = EK BD = CG =FJ=EL .. fracción 1/64 de 11 factores en 32 corridas Resolución IV Generadores del diseño F=ABC G=BCD H=CDE J=ACD K=ADE L=BDE Relación de definición: 1 = ABCF = BCDG = ADFG = CDEH = ABDEFH = BEGH = ACEFGH = ACDJ = BDFJ == ABGJ = CFGJ =AEHJ=BCEFHJ=ABCDEGHJ=DEFGHJ=ADEK=BCDEFK=ABCiGK=EFGK=ACHK=BFHK = ABDGHK = CDFGHK = CElK = ABEFJK = BDEGJK = ACDEFG. 0'1 -. -..].] .j v) 211--{j.. 678 APÉNDICE XII. 64 (continuación) Diseños con 12 factores w) 2 -8.9 . 12 Relaciones de alias para diseños factoriales fraccionados 2"-P con k :s. fracción 1/256 de 12 factores en 16 corridas Resolución ID Generadores del diseño E=ABC F=ABD G=ACD H=BCD l=ABCD K=AB L=AC M=AD Alias A = Hl = BK = CL = DM B = Gl = AK = EL = FM C = Fl = EK = AL = GM D = El = FK = GL = AM E = Dl = CK = BL = HM F = CJ = DK = HL = BM G = Bl = HK = DL = CM H = Al = GK = FL = EM l=DE=CF=BG=AH K = AB = CE = DF = GH L=AC=BE=DG=FH M=AD=BF=CG=EH AE = BC = FG = DH = KL = 1M AF = BD = EG = CH = lL = KM AG= EF = CD = BH = lK = LM 2 bloques de 8:AE = BC = FG = DH = KL = 1M Diseños con 13 factores x) 2 13. 15 Yn :s. fracción 1/512 de 13 factores en 16 corridas Generadores del diseño E=ABC F=ABD G=ACD H=BCD l=ABCD K=AB L=AC M=AD N=BC Alias A = Hl = BK = CL = DM = EN B= Gl = AK = EL = FM = CN C = FJ = EK = AL = GM = BN D=El=FK =GL =AM =HN E = Dl = CK = BL = HM = AN F = CJ = DK = HL = BM = GN G = Bl = HK = DL = CM = FN H = Al = GK = FL = EM = DN 1 = DE = CF = BG = AH = MN K = AB = CE = DF = GH = LN L=AC=BE=DG=FH =KN M = AD = BF = CG = EH = JN N = BC = AE = FG = DH = KL = 1M AF = BD = EG = CH = lL = KM AG = EF = CD = BH = lK = LM 2 bloques de 8:AF = BD = EG = CH = lL = KM Resolución ID . fracción 1/1024 de 14 factores en 16 corridas Generadores del diseño E=ABC F=ABD G=ACD H=BCD l=ABCD K=AB L=AC M=AD N=BC O=BD Alias A = Hl = BK = CL = DM = EN = FO B = Gl = AK = EL = FM = CN = DO C = Fl = EK = AL = GM = BN = HO D = El = FK = GL = AM = HN = BO E = Dl = CK = BL == HM = AN = GO F = CJ = DK = HL = BM = GN = AO G = Bl = HK = DL = CM = FN = EO H = Al = GK = FL = EM = DN = CO 1 = DE = CF = BG = AH = MN = LO K = AB = CE = DF = GH = LN = MO L = AC = BE = DG = FH = KN = JO M = AD = BF = CG = EH = lN = KO N = BC = AE = FG = DH = KL = 1M 0= BD = AF = EG = CH = lL = KM AG = EF = CD = BH = JK = LM = NO 2 bloques de8:AG =EF = CD =BH=lK=LM=NO Diseños con 15 factores fracción 1/2048 de 15 z) 2 factores en 16 corridas 15 . Resolución ID Resolución ID Generadores del diseño E=ABC F=ABD G=ACD H=BCD l=ABCD K=AB L=AC M=AD N=BC O=BD P=CD Alias A = Hl = BK = CL = DM = EN = FO = GP B = Gl .11 . AK = EL = FM = CN = DO = HP C = Fl = EK = AL = GM = BN = HO = DP D = El = FK = GL = AM = HN =BO = CP E = Dl = CK = BL = HM = AN = GO = FP F = CJ = DK = HL = BM = GN = AO = EP G = Bl = HK = DL = CM = FN = EO = AP H = Al = GK = FL = EM = DN = CO = BP 1 = DE = CF = BG = AH = MN = LO = KP K = AB = CE = DF = GH = LN = MO = JP L = AC = BE = DG = FH = KN = JO = MP M =AD = BF = CG = EH = JN = KO = LP N = BC = AE = FG = DH = KL = 1M = OP 0= BD = AF = EG = CH = lL = KM = NP P = CD = EF = AG = BH = lK = LM = NO .APÉNDICE 679 Xli..10 .. Relaciones de alias para diseños factoriales fraccionados 2k-p con k :5 15 Yn < 64 (continuación) Diseños con 14 factores y) 214 . of difference (standm:d e/ror of difference) Error estándard de la diferencia Error· estándar de la estimación Std. cuadrada predicha· Pred 13.y (coefficient of vqriation) Cl (confidence interval) Cook's distance COl' total (cOlTected fotal) .e Design Expert Valor real Precisión adecuada Cuadrado medio ajustado E. del' numerador NDF (numerator degrees of freedom) Operador fijo. (standard deviation) Desviación estándar Error estándar. de libertad. Deben evitarse valores cercanos a.1' of squares) Analysis of vanance Coefficient estimate c.! denominador Diagnostic case statistics Estadí!¡ticos de diagnóstico del caso Término del error E/Tor teml Media estimada Estimated mean Expected mean. e/ror of estimation SE mean. por la media. of squares) Suma de cuadrados secuencial' Std: Dev.Glosario. corregidos."squared Adj SS (adjusted SUI1. Operatorfixed' Operator' random. (standarde/ror ofthe mean) Error estándar de la media Standard order Orden estándar Residual.oot MSE (root mean square enw) Raíz cuadrada del cuadrado medio del: errar Seq. SS (sequential SlP11 . Potencial de lln punto del Leverage diseño para influir en los coeficientes del: ajuste del modelo. t 13. llama com:únInente !¡uma de cuadI'ados totales DF (degrees.. Operador aleatorio Outlier t Punto atípico.-squared 13. cuadrada ajustada Suma de cuadrados ajustada (SS ajustada) Análisis de varianza Estimación del coeficiente Coeficiente de variación Intervalo de confianza Distancia de Cook Total corregido. . square Cuadrado medio esperado Lack offit Falta de ajuste Least squares means. uno Mean Media Mean difference Diferencia media Mean square Cuadrado medio Medias de las covariables Means for covl1liates Grados. para el uso d. Se. for strength Medias de mínimos cuadrados de la resistencia Acción de palanca.-squared Predicted value Valor predicho PRESS (Prediction enw sum of squares) Suma de cuadrados del error de predicción Pure en"Dr Brrorpuro R cuadrada 13.. Suma de los valores de respuesta. Standard enw (SE) SE. de Student Student residual Suma de cuadrados Sum of squares Villiance component Componente de la varianza Tabla XTIl. of freedom) Grados de libertad' DDF (denominator degrees of freedom) Grados de libertad de. ActuaI value Adi3q precision Adj MS (adjusted mean square) Adj 13. 307. 288 cuatro bloques. 297 Confusión en el diseño 3k . 42: (i. 372 Componente X de una interacción. 127 Bloques incompletos. 326 Aditividad del modelo. análisis: de· varian:. 95 Comparación de tratamientos con un control. 136. interbloques. 511. 318. evoluti~ va. 299 Confusión en el diseño 2k . 126. 373. Bloq)les. 290 Cordillera creciente. 488 Carácter iterativo de. de los datos en· un. 26· Crite<rio. 88. 231 Contl'astes. 303. 92 Contraste ortogonal" 93. Ver también S. 64 Análisis de varianza simple Q. 154 Cálc)llos. parcial. 177 Análisis: de varianza de un solo factor. 366 Componente J de una interacción. 315. 416. 224. 148 AlgoriJmo de análisis. 104 Coeficientes. 161 Arreglo exterior. 79. 436 Conexión entre análisis de varianza y regresión. de dos. varianza. 133. prOlmnciad(). (EV0P). 478 Covariable. 72' Cambio.. 378 nueve bloques. 221. 12. 89 Comparaciones múltiples. 372 Componente Z de una interacción.oeficiente' de variación. para el diseño 2~. 162 Combinación de los cuadrados medios para estimar el error. 66 Análisis de varianza. en'. 366 Componente W de una interacción. de predicción adecuada. de.306. 377 tres bloques. 430. una variable. 297. 64 Análisis. 435 Aumento del diseño.eparación de alias en las interacciones y Contl'acción de diseños facto" riales fraccionados. 535 Comparación de medias por pares. 185. 379c 381 Contracción completa:. 484. 448' Cordillera estacionaria.:a. 373 más de nueve bloques. 469 Alias. de bloques aleatorizados.ccionar un diseño. 512. 455 681 . en." Indice Aberración. 565 Componentes de una interacción. 204. 344. 427. 65. 372 Componentes de la varianza. la operación evolutiva. de cuatro bloques. Ver también Prueba de interacciones (no aditividad) Aleatorización. 221. completos. Ven tmnbiéll\ Experimentación secuencial] Ciclo. 484'. de regresión. 339. 49:1. 103 Comparación gráfica de medias. 90. 161 Análisis intrabloq»es. 380. 430. 11. 604 Análisis de residuales. Ascenso más. del modelo de superficie de respuesta de sewndo orden. factores. (EVOP). 365. 231. 289 más. 296 dos bloques. en. 393 Combinación de fra¡::cione<s para estimar efectos. 563 Análisis de varianza. 337!. el: efecto· de la media en. 72 CoeficieJlte· de c. 349 Contraste estandarizado. 93. Bloque principal. 429.. 20. d· análisis de. 13. 304 Alias parciales.. 348 Combinación de información interbloques e intrabloques. 96-104 Comparación de todos los contrastes. 440 AnáliSis de covarianza. una operación. Codificación. 340 Contracción parciaI. 518. 63. 182 Componente 1 de una interacción. 104 Criterio para sele. 126. 60. 70. 227. 61.onfianza. 76. 112 Confusión completa. la experimentación. 242 Algoritmo de intercambio. 291. 347. 604 Covarianza:. 491 Arreglo interiOl:. 409. 366 Condiciones óptimas. 373 Confusión parcial. 383 Análisis canónico. 448 Corridas axiales"274. 400. 15. 299 Construcción de diseños factoriales fraccionados. 372 Componente Y de una interacción. 35 Distribución F. 33. 457 Diseños generados por computadora. 364. 317 Diseños 2k. Ver también Estudios de robustez de procesos Diseño rotable. 347 Diseños de resolución V. 296.207 Diseño experimental y diseño de productos. 317. 246 Diseño factorial 2k . 475 Diseños símplex de retícula para mezclas. 144. 347. Ver Diseños anidados Diseño no balanceado. 456 Diseños 2k-1. 343 Diseños optimales. 461 Diseño jerárquico. 23 Distribución de probabilidad continua. 429 Diseños en parcelas con doble subdivisión. 461 Diseños esféricos.p . 7. 600 Diseño hexagonal. 290. 24 Distribución de probabilidad discreta. 529 Curva Oc. 32 Distribución ji-cuadrada. 343-347 'Diseños saturados. 150 Diseños anidados. 306. 307. 492. 468-469 Diseños ortogonales. 347 Diseños no geométricos. 488. 339. 569 Diseño factorial no balanceado. 456 Diseños de superficie de respuesta. 151. 455 Cuadrado latino estándar. 139. 11. 461 Diseños cuboidales. 363. 474 Distribución de muestreo.Z. 11 Diseño factorial 22. 75. 326 Diseño de arreglo combinado. 578 Diseño en parcelas subdivididas en franjas. 6. 662 Diagrama de puntos. 600 Datos proporcionales en un diseño factoríal no balanceado. 458 Diseño de comparaciones pareadas. 68. 29 Distribución sesgada. 7. 23. 148 Cuadrados latinos ortogonales. 8. 5. 383 Diseños de puntos frontera. 468 Diseño optimal D. 600 Definición de contrastes. 275. 209. 557 Diseño anidado de m etapas. 566 Diseño anidado de tres etapas. 365 Diseño en parcelas subdivididas. 40. 468 Diseño optimal V. 580 Diseños equirradiales. 478 Diseños de resolución ID. 107-110. 151. 29 Distribución normal estándar. 461 Diseños mínimos de resolución Iv. 94 Curva de operación característica.529 Diagrama de caja. 348. 459 Curioseo o sondeo d~ datos. 373 Desviación estándar muestral. 382 Diseños alternados o entrecruzados. 381 Diseño central compuesto. 340. 189. 461 Diseño robusto. 179 Cubo con centros en las caras. 326 Diseños 3k. 155 Diseños símplex de centroide para mezclas. 566 Diseño balanceado. 228 Diseño factorial 24. 11. 148. 379 Diseños 3k-p. 154 Diseño de Box-Behnken. 218. 558. 207 bloques completos. de dispersión. 50. 557. 468 Diseños optimales alfabéticos.432 D de Cook. 24 Distribución de referencia. 337 Diseños simétricos. 450 Diseños de bloques incompletos balanceados. 600 Diseño no replicado. 306. 337 Diseños de resolución Iv. 307. 154 Diseños de cuadrados grecolatinos. 21. 154. Ver Curva de operación característica Curvatura. 174. 455 Diseños Plackett-Burman.272. 27 Determinación analítica de una transformación.682 ÍNDICE Criterios de diseño. 47. 404. 144. 176. 566 Diseños centrales compuestos pequeños. 242 Diseño factorial anidado. 274. 600 Diseño básico. 468 Diseño optimal G. 466. 347 Diseños de segundo orden. 573. Ver Ascenso más pronunciado Diseño anidado de dos etapas. 30 Distribución t.139. 40. 409. 557-568 Diseños anidados por etapas. 372 Diseño 3k-1. 189. Ver también Separación de alias en las interacciones . 64. 456 Diseño de aberración mínima. 127 bloques incompletos. 75. 491 Diseño de bloques aleatorizados. 50 Diseño del cuadrado latino. 231. 457 Diseño símplex para el modelo de primer orden. 365 Cuadrados medios. 441. 494 Diseño de arreglo cruzado. 30 Distribución normal. Ver Réplica única Diseño optimal A. 219 Diseño factorial 23 . escalonados. 126. 420 Datos no balanceados en el análisis de varianza. 62 Diagrama. 29 Distribución de probabilidad. 365. 468 Diseño pentagonal. 455 Diseños para modelos de primer orden. 479 Diseños híbridos. 31 Doblez de diseños factoriales fraccionados. 583 Diseño experimental completamente aleatorizado. 304-317 Diseños 2k . 22 Dirección del ascenso más pronunciado. 107. 590 Determinación del tamaño de la muestra. 111. 303 Experimento factorial. 188. 88. 3 Estudios de capacidad o aptitud de los instrumentos de medición. 241 Error estándar de un coeficiente de regresión. 547 método de máxima verosimilitud con restricciones. 4. 221 Efectos cuadráticos. 21. 64 Error intrabloques. 287. 84. 130. 513 máxima verosimílitud.20. 172 Espacio inferencial de un experimento. 412 Error estándar de los efectos en un diseño 2k . 97. 209. 3.456 Experimentador. 114. 411. 11. 462-466 Fracción alterna. ~r Ecuaciones normales de mínimos cuadrados Efecto del tratamíento. 591 Família exponencial de distribuciones. 112. 540. 303. 315. 27 Estimador de la varianza mínima. 127. 524 Estudios de robustez de procesos. 394 Estimación de valores faltantes. 2. 2 Experimento aleatorizado. 576. 526. 272. 10. 303. 523. 547. 10. 429. 15. 489. 141. 22. 22 Error de la parcela completa. 524 Estimación de los parámetros del modelo en el análisis de varianza. 74. 7. 365. 260. 218 en bloques. 14 Falta de ajuste. 472 Experimentos de seguimíento. 157. 27 Estimación· de los componentes de la varianza. 289. 579. 201. 549 método del análisis de varianza. 30. 231 Enfoque de grupo en el diseño de experimentos. 186. 318 Grados de libertad. 88. 573 Forma restringida del modelo mixto. 220 Efecto total de un factor. 594 Familia factorial fraccionada. 287 en parcelas subdivididas. 575. 29. 60 Factores controlables. 298. 163 Error puro. ~r también R2 Estimación. 18 Experimentos no planeados. 331. 220 Efectos de los tratamíentos ajustados. 186-187. liér Factores no controlables Factores no controlables. 50. 31 Gráfica de contorno. 13. 304. 18. 379 Experimentos con un factor a la vez. 64 Efecto principal. 21 Experimento con mediciones repetidas. 579. ~r Fracción alterna Fracción irregular. 493 Factores cualitativos. 204. 201. ~r también Experimento de tamízado Experimento de tamízado. 239. 578 Experimento factorial fraccionado. 275. 170. 584 Error de la subparcela. 218. 579. 319 Fracción complementaria. 580. 5. 8. 513. 150 Eficiencia relativa de los diseños factoriales. 27 Estrategia de experimentación. 12. 171. 204 . 305 Fracción un medio. 484 Forma no restringida del modelo mixto. 595 Funciones con condición de deseables. 6. 547 Estimador insesgado. 1. 239. 395 Ecuaciones normales. 86. 1. 3 Enfoque no paramétrico del análisis de varianza. 221. 412 Error experimental. 34. 575. 462. 363. 440 Eigenvectores (vectores propios). 4 Experimentos de mezclas. 272. 220 magnitud y dirección. liér Generador de diseños factoriales fraccionados Generador de diseños factoriales fraccionados.ÍNDICE 683 Ecuaciones normales de mínimos cuadrados. 207. 549. 604 Formación de bloques de diseños de superficie de respuesta. 170. 189 Generador de diseños. 174 Eigenvalores (valores propios). 64. 12. 511 Factores de ruido. 15. 306 Fase en una operación evolutiva (EVOP). 574. 139. 14. 148. 531. 7. 392 Factor cruzado. 624 Experimento de caracterización. 151. 559. 305. 488 Experimentación secuencial. 602 Estimaciones de efectos. 170. 296. 519. 451-454 Funciones estimables. 432 Efectos cúbicos. 2. 15. 159. 27 Estimador de momentos. 185 Estimación de máxima verosimílitud. 104. 368 Factores cuantitativos. 584 Error estadístico. 518. 431 Familia de potencias de transformaciones. 15. 595 Estimación de mínimos cuadrados de parámetros. 14 Enfoque de la mejor conjetura para la experimentación. 86. 368. 260. 110. 1. 221 Estimador. 511 Estadístico del rango studentizado. 539. 9. 126. 373. 112. 2. 304 Fuerza de una transformación. 17. 323 Efectos de localización. 159. 113. 5. ~r también' Experimento factorial Factores. 127. 112. 569 Formación de bloques. 161 Efectos ortogonales. 315. 84 Función de enlace. 446 Elemento identidad. 239 Escala codificada. 264. 346 Fracción principal. 241. 116 Error. 489 Factores que se mantienen constantes. 5. 323 Efectos de los factores. 102 Estadístico R2 ajustada. 88 Efectos de dispersión. 231 Efectos residuales de tratamíentos. ~r Pruebas de confirmación Experimentos industriales y experimentos agrícolas. 14. 176. 207. Ver Diseño experimental completamente aleatorizado Experimento comparativo. 145. 595 Mitad de gráfica normal de los efectos. 432 Modelos con mezclas. 603 Método de medias no ponderadas. 87. 177 Modelo de los efectos. 226. 246. 64. 416 Intervalos de confianza aproximados para los componentes de la varianza. 543 Intervalos de confianza para los componentes de la varianza. 492. como en la tendencia central. 299. 19 Índice de error en el modo del experimento. 204. 474 Mínimos cuadrados esperados. 476 Mezclado sinérgico en mezclas. 64. 429. 455 Modelo de regresión. 235. 581. 300 Interacción. 116. 526 modelo con restricciones. 472 Mezclas de verificación. 578. 17. 223. 413. 17. 172. 174 Interacción entre tratamientos y bloques. 543 método de grandes muestras modificado. 557 Modelo con efectos fijos. 491 intervalos aproximados tipo Satterthwaite. 128. 526. 171. 476 . 34 Hipótesis alternativa de una cola. 603 Método de mínimos cuadrados. 142. 377 Intervalo de confianza. ~r Pruebas F aproximadas Método del ascenso más pronunciado. 523 modelo sin restricciones.492 Modelo de las medias. 516. 115. 392. 264 Graficación de residuales.604 Modelo de regresión lineal múltiple. 511. 392 Modelo estadístico. 75 Intervalo de predicción. 179 reglas para. 547 Método de Satterthwaite. 427. 605.100 Intervalo de confianza para la respuesta promedio en el modelo de regresión. 48. 12. 42 Localización. 74. 590 Método de grandes muestras modificado. 76-86 Gráficas de probabilidad normal. 65. 4. 11. 154 Hipótesis alternativa. 35 Hipótesis nula. 27 Medias ajustadas de los tratamientos en análisis de covarianza. ~r también Modelo estadístico Modelo lineal generalizado. 42 Intervalo de confianza para la media de un tratamiento. 436. 12. 558. 567. 26. 137 Interacción generalizada. 476 Mezclas binarias. 524 formas alternativas. 552 Intervalos de confianza simultáneos. 128. 569. 512. 427 Métodos de medias no ponderadas en el análisis de varianza. 34 Histograma. 594 Modelo mixto. 191. 190 Modelo jerárquico. 253 Gráfica de probabilidad normal de los efectos. 5126 Modelo reducido. 594. 177 Modelo de primer orden. 177. 203. 210. 34. 143. 296. 75 Jerarquía del modelo. 265 Método de Bonferroni de intervalos de confianza simultáneos. 190. 38. ~r Ascenso más pronunciado Metodología de superficies de respuesta (MSR). 116. 545 Método de la diferencia significativa mínima (LSD) para comparar medias. 207. 427. 135. 603 Mezclado lineal. 87. 23 Importancia de los conocimientos no estadísticos. 511 Modelo de la respuesta o de reacción de un diseño robusto. 397 Matriz del diseño. 559. 522. 68. 22 Matriz de covarianza. 286 Modelo lineal. 254 Método de los cuadrados de las medias ponderados. 576. 569 error estándar de la media con efectos fijos. 203. 607 Mediciones duplicadas en la respuesta. 75. 584. 420 Información relativa para efectos confundidos. 201. 417 Media. 364. 75 Método de Box-Cox. 575. 177. 194. 64. 253 Modelo completo. 517. 242. 137. 34 Hipótesis alternativa de dos colas. 393. 476. 531 Mínimos cuadrados ponderados. 286 Límites de confianza. 145. 64. 543 intervalos exactos. 476 Mezclas antagónicas en mezclas. 419. 18 Hipercuadrados. 95 Intervalos de confianza uno a la vez. 64 Media muestral. 416 Intervalo de confianza simultáneo. 545 procedimientos de máxima verosimilitud. 75 Influencia y acción de palanca.684 ÍNDICE Gráfica de cubo. 228 Matriz gorro. 75. 65. 493. 429 Modelo empírico. 155. 520 Modelos aditivos. 99 Método de Lenth para diseños sin réplicas. 393 Modelo de superficie de respuesta de segundo orden. 72 Herencia de la agricultura. 512. 516. 25 Media global. 262 Gráfica de inferencia condicional para diseños factoriales no replicados. ~r Estimación de mínimos cuadrados de parámetros Método de momentos. 522. 478 Mezclas puras. 87. 413 Modelo con efectos aleatorios. 624 Modelo factorial sin interacciones. 524 estimación de los componentes de la varianza. 128. 26 Reglas para los cuadrados medios esperados. 308 Resolución de un diseño factorial fraccionado. 574. 34 Predictor lineal. 242 Ortogonalidad. 436. 81 Prueba de Dunnett. 223. Ver Prueba de Levene Prueba de Levene para la igualdad de la varianza. 33. 303. 436. 427 Orden de Yates. 418 Residuales studentizados. 209 Restricción sobre la aleátorización. 231 Palabras en la relación de definición. 539. 221. Predicción de suma de cuadrados de error). 102 Prueba de Scheffé. 14. 331 Proyección del diseño. 12. 224. 304. 130. Ver Resolución del diseño Respuestas múltiples. 1. 203. 365. 116 Prueba de Levene modificada. 245 Niveles de los factores naturales. 303 Principio jerárquico en la constlllcción de modelos. 34 Región de rechazo. 5. 21. 310 Proyectividad. 81. 132-133 Propiedades de los estimadores de mínimos cuadrados. 420. 439 Puntos atípicos. 25 Operador del valor esperado. 191. Ver Pruebas F aproximadas Punto de respuesta máxima. Ver también Una observación por celda Réplicas de cuadrados latinos. 73 Pruebas de confirmación. 84 . 626 Prueba t combinada. 40. 318 Relación señal a ruido. 95 Prueba de significación. 417 Puntos centrales. Ver Prueba de hipótesis Prueba de significación de una regresión. 405 Niveles mixtos de los factores en un diseño factorial. 540 Pseudocomponentes. 139 Observaciones faltantes en un diseño de cuadrado latino. 519 Residuales escalados. 436. 244. 114. 49 Pruebas de aleatorización.ÍNDICE 685 Muestreo aleatorio. 247 Región crítica. 493 Planeación previa al experimento. 226. 37 Niveles de los factores. 431. 594 PRESS (Prediction Error Sum of Squares. 17. 245. 247. 96 Prueba del rango múltiple de Duncan. 21. 104 Principio de efectos esparcidos.~ Propiedad de reducción de ruido con la formación dé bloques. Ver Prueba t de dos muestras Prueba t de dos muestras. 418 Resolución del diseño. 148 Observaciones faltantes en un diseño factorial 2k . 440 Punto silla. 491 Repetibilidad. 25 Optimización de un proceso. Ver Orden estándar Orden estándar. 419 Realización de réplicas. 44 Prueba t pareada. 16 Potencia. 100 Prueba F parcial. 207. 145. Ver también Estudios de robustez de procesos Programación no lineal. Ver Restricción sobre la aleatorización. 579. 13 Pendiente de la superficie de respuesta. 583 Pautas generales para el diseño de experimentos. 531 Relación de definición para un diseño factorial fraccionado. 104. 307. 228 Observaciones faltantes en un diseño de bloques aleatorizados. 519 Réplica oculta. 438 Punto estacionario. 103 Prueba de hipótesis. 437 Punto de respuesta mínima. 419 Selección empírica de una transformación. 345 Prueba de Bartlett para la igualdad de varianzas. 436. 451 Propagación del error. 141. 318. 286 Procesos robustos. 461 Puntos de acción de palanca. 26 Navaja de Ockham. 448 Restricción sobre la aleatorización. 310 Nivel de significación. 413 Prueba general de la significación de la regresión. 271. 317 Pruebas F aproximadas. 78. 60. 9. 318 Parcelas completas. 148 Reproducibilidad. 417 Residuales estandarizados. 479 Pseudopruebas F. 14. 397 Proyección de diseños factoriales. 34. 104. 404 Operación evolutiva (EVOP). 409 Prueba de Tukey. 78. 51. 379 Relación generadora. 303. 82 Prueba de Newman-Keuls. 35 varianzas diferentes. 417 Residuales PRESS. ver también Formación de bloqiles R-Student. Ver Región crítica Reglas para expectativas. 411. 484-488 Operador de la varianza. 458. 246. 535. 192 Prueba de Kruskal-Wallis. 228. 409 Prueba de interacciones (no aditividad). Ver también Influencia y acción de palanca R2. 619 Réplica única. 16. 247. 60. Ver también Estadístico R2 ajustada R2 para predicción. 431 Niveles imprecisos de los factores del diseño. 93. 495 .· 383 Notación geométrica para experimentos factoriales. o más pronunciado. Transformación de rangos. 185. 135. 60 .P. 21.F.22 'eta." 9 SEP 20l~ a ales a los bloques. W ~\"JI:iJ\S\m~0 •. BALOERAS 95.' o (lj}f. central. 224. 22 Teorema de Cochran. 38-40. 79. 77 Tendencia central. 412 Sumas de cuadrados tipo nI. 40. COL. 2. 69 Teorema del límite central. 126 ependientes. 173 393.e Il '{J) .126 un tratamiento. 191 13. 14.574. 257.¡aleS oh . 117. Ver también Doblez cionados Significación práctica vs signifi( Sistemas de cordilleras. 84-86. 590 Transformaciones para estabilizal 257 'fransmisión del error. 107 604 392 l."\> \¡¡¡!W.~~~~18.. D. 578 Subparcelas. . 06040 2218770000104658DP9200IE e\\ . 495 Tratamiento de control. 81. 223. 'BU:"'\. COMPOSICiÓN. 455.. 38. Supuesto de independencia en 1 varianza.. f. Superficie de respuesta. .i!r Ascenso más celda. 242. 66 tratamientos. 10. 76-86. 81. 66 inua. Transformación de datos. DI~EÑO E IMPRESiÓN DE ESTA OBRA FUERON RE"1LIZAOOS BAJO LA SUPERVISION DE GRUPO NORIEGA EDITORES. 579 Suma de cuadrados corregida. 26 72.J 9 'NOV. EL LECTOR SE OBLIGA A r" .\\\I"r. 30 Totales de los tratamientos ajust. 80 38. . lljl'." Fac\l\\(I. 6. 79 Supuesto de normalidad en las J varianza...64.. 493. MEXICO.r .1:. 2005 o ( HOJA DE DEVOLUCION 686 ÍNDICE :J 2 AGO 2e Separación de alias en las inteJ 407. CENTRO.. VUELTO DENTRO DE UN TÉRMINO s.l\~. 447 Submuestreo.1·fI~ { ' s\y~lG EDICiÓN... 44. i\. ESTE LIBRO DEBERÁFSEEC~~~ARCADA POR EL ÚLTIMO SELLO. 392 192 392 13. 15. 'e '..L 7 -J. . 11Ml\. 103 'fratamientos. 22 . . ~.431 D3 In como criterio de diseño. J Transformación para corregir la ' 40. 427 Supuesto de desigualdad de la . 139 ..." . C.\l \. Suma de cuadrados de los resid Sumas de cuadrados extras. POR CADA OlA DE DEMORA.. QUE EXPIRA EN LA ~AGAR $ DE NO SER ASI. \. . Documents Similar To DISEÑO Y ANALISIS DE EXPERIMENTOSSkip carouselcarousel previouscarousel nextLibro_Com..Ejercicios Doe115019590-Informe-DBCALibro de Diseño y Análisis de Experimentos-MontgomeryUn ingeniero está interesado en los efectos de la velocidad de corteEXAMEN DISEÑO DE EXPERIMENTOStarea 2.docxDiseño de ExperimentosDiseño de Experimentos - MontgomeryDiseño experimental para ingenieria de alimentosDISEÑO DE EXPERIMENTOSEstadistica ExperimentalEl tiempo para reparar un instrumento electrónico es una variable aleatoria medida en horas que sigue una distribución normallibro analisis y diseño de experimentos montgomeryInforme ANVAANALISIS Y DISEÑO DE EXPERIMENTOS-CAP. 1Y2Diseño de ExperimentosCap III. Montgomery1. Solución ejecicios Cap 25.3 diseños factoriales 2k y 3kTrabajo Col 2 Act 10 Cesar NeiraEjercicio de Diseno53951479 Estadistica ExperimentalTar3 Laura Elena Puentes PradoProbabilidad y Estadística Aplicadas a la Ingeniería (Montgomery - Runger) - 2º Edición [Cap 1 - 8]Unidad IIIDeber de Diseño 32941240193Diseño factorial 3KExperimentos_comparativos_simplesMore From Iván SerranoSkip carouselcarousel previouscarousel nextmetalurgia fisica pdf notas.pdf01 BENTONITE.pdfCurso práctico de Inglés - Guía del viajeroCalendario 2013 UgDiagramas de fases.pdfUGTO calendario semestralKpsMateriales 3Materiales 1Arsenopirita y Au3estructuracristalina-120314224401-phpapp01Menú del pie de páginaVolver arribaAcerca deAcerca de ScribdPrensaNuestro blog¡Únase a nuestro equipo!ContáctenosRegístrese hoyInvitar amigosObsequiosLegalTérminosPrivacidadCopyrightAsistenciaAyuda / Preguntas frecuentesAccesibilidadAyuda de compraAdChoicesEditoresRedes socialesCopyright © 2018 Scribd Inc. .Buscar libros.Directorio del sitio.Idioma del sitio: English中文EspañolالعربيةPortuguês日本語DeutschFrançaisTurkceРусский языкTiếng việtJęzyk polskiBahasa indonesiaSign up to vote on this titleUsefulNot usefulUsted está leyendo una previsualización gratuita.DescargarCerrar diálogo¿Está seguro?This action might not be possible to undo. Are you sure you want to continue?CANCELARAceptar
Copyright © 2025 DOKUMEN.SITE Inc.