1UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA ESCUELA DE CIENCIAS BASICAS TECNOLOGIA E INGENIERIA PROGRAMA DE INGENIERIA DE ALIMENTOS 30156 – DISEÑO EXPERIMENTAL CAMPO ELIAS RIAÑO LUNA (Director Nacional) FREDY JARAMILLO Acreditador BOGOTÁ Diciembre de 2011 2 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO ASPECTOS DE PROPIEDAD INTELECTUAL Y VERSIONAMIENTO Aspectos de Propiedad intelectual El contenido didáctico del curso académico ``Diseño Experimental``, fue diseñado inicialmente en el año 2004 por el Ing. Químico. MSc. Campo Elías Riaño Luna, docente de la UNAD, ubicado en la sede José Celestino Mutis. Profesional que se ha desempeñado como docente y tutor de la UNAD a partir del 2003, anteriormente trabajo como investigador científico II en CENICAFE. De allí que el módulo trae ejemplos de trabajos de investigación realizados por estudiantes, docentes y el autor. Esta es la segunda actualización del módulo, el cual se ofrece con carácter estrictamente educativo. Razón por la cual se ha recurrido a los conocimientos y experiencias de varios autores de textos regulares sobre las temáticas expuestas para tratar los temas más relevantes en este primer contacto con la investigación programada. Se seleccionaron las temáticas que se consideraron importantes (amplio uso) para adelantar trabajos de investigación en ciencias agrarias, básicas e ingeniería y les sirvan de punto de partida para tu aprendizaje autónomo y profundizar en las temáticas. La versión del contenido didáctico que actualmente se presenta tiene como características: 1) Reorganización de los contenidos relacionados con las dos unidades y las lecciones. 2) Repaso y verificación de los conceptos teóricos tratados. Las temáticas pueden ser actualizadas acorde con el desarrollo del curso. De acontecer esto se informara oportunamente. 3 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO INTRODUCCIÓN En la UNAD se viene adelantando a través del rediseño curricular un plan estratégico para la formación y capacitación en investigación disciplinar y formativa, con el fin de continuar con el refuerzo de los procesos de acreditación de los programas. Condición que exige entre otras la formación integral de talento humano en ciencia y tecnología, capaz de investigar y transformar su entorno regional haciendo uso racional de los recursos disponibles, mediante la modalidad de educación abierta y a distancia. Con este objeto se propone como curso obligatorio el diseño experimental cuyo contenido induce a los estudiantes a la aplicación de los principios estadísticos en la investigación. Curso complementario a los dos (2) primeros módulos sobre cultura investigativa que se ofrecen en la UNAD, para todos los programas.; el contenido de este dará los lineamientos para una de las etapas importantes en todo proceso de investigación como es la planificación de la experimentación y la comprobación de hipótesis. El material ha sido organizado de forma que el estudiante repase los conceptos y procedimientos estadísticos vistos en semestres anteriores y los aplique a la resolución de problemas específicos de cada profesión-con una planificación previa. La forma de resolver los diseños experimentales de más amplio uso, se presentan en los apéndices con ejemplos atinentes a la unidad 1 y 2. Estos apéndices se irán incrementando acorde con el desarrollo del curso. Igualmente estudiantes y tutores deben consultar las OVAS presentadas para cada unidad en la página principal del curso. Pero siempre teniendo en cuenta que: El enfoque-objetivo del diseño de experimentos es determinar cuáles variables están influenciando la respuesta de interés. Una vez que dichas variables son identificadas, se obtiene un estimado aproximado de la superficie de respuesta por medio de modelos factoriales especiales. Además en los trabajos colaborativos se incentiva a los estudiantes y docentes sobre la forma y la importancia de obtener información rápida, de utilidad, con ventajas económicas para el desarrollo de los trabajos de grado y proyectos de investigación en la UNAD. 4 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Para la solución numérica con software (es) estadísticos se ha programado el plan de trabajo siguiente. Plan de trabajos prácticos con el paquete estadístico Stat Graphics y/o SPSS Laboratorio práctico 1.- Manejo de datos: organización, almacenamiento y tratamiento. Laboratorio práctico 2.- Estadística descriptiva Laboratorio práctico 3.- ANOVA. De una sola vía, -diseño en bloque aleatorizado, diseño de dos factores-diseño de tres factores- (cuadrados latinos) Laboratorio práctico 4. Diseños factoriales 2 k y 3 k Laboratorio práctico 5. Análisis de Regresión. Key Word: ANOVA con Stat Graphics 1- http://e-stadistica.bio.ucm.es/disexp/guia_rapida_statgraphics.html 5 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO INDICE DE CONTENIDO El contenido programático para el curso de diseño experimental está en la tabla 1. Tabla 1. Contenidos temáticos para el curso de diseño de experimental UNIDADES DIDÁCTICAS CAPITULOS LECCIONES UNIDAD UNO: UTILIZACIÓN DE LOS MÉTODOS ESTADÍSTICOS DE CONTRASTE EN LA EXPERIMENTACIÓN. CAPÍTULO 1. Introducción Al Diseño De Experimentos Lección 1: Conceptos básicos del diseño experimental Lección 2: Tipos de tratamientos y errores experimentales Lección 3: Principios básicos en el diseño de experimentos Lección 4: Las técnicas utilizadas en el diseño de experimentos Lección 5: Control local, aleatorización y procedimiento para el diseño experimental CAPÍTULO 2. Contraste de hipótesis comparaciones simples Lección 1: Comprobación de hipótesis Lección 2: Prueba de t Lección 3: Análisis de varianza- ANDEVA Lección 4: Prueba de diferencia significativa mínima (DSM) de Fisher Lección 5: Modelo estadístico CAPÍTULO 3. Tipos de diseño experimentales Lección 1: El uso de las computadoras y software especializado Lección 2: Diseños unifactoriales Lección 3: Diseños de bloques completos al azar Lección 4: Diseño de cuadro latino Lección 5: Diseño de cuadro Greco Latino UNIDAD DOS: DISEÑOS FACTORIALES y 2 K Capítulo 4. Diseños Factoriales Generales Lección 1: Definiciones básicas diseño factorial. Lección 2: Experimento factorial o mover un factor a la vez Lección 3: Diseño factorial con dos 6 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO factores A X B Lección 4: Ventajas y desventajas de los Experimentos Factoriales Lección 5: Ejemplo de un diseño factorial solucionado con Stat Graphics Capítulo 2. Diseños Factoriales 2 k Lección 1: Codificación de variables Lección 2: Diseño Factorial 2 k Lección 3: Diseños factoriales 2 3 Lección 4. Solución de un diseño factorial 2 3 con Stat Graphics Lección 5: Otros diseños experimentales. Capítulo 3. Regresión lineal y superficies de respuesta Lección 1: Introducción y el significado de la regresión y suposiciones básicas Lección 2: Coeficientes de correlación. Lección 3: Transformación de datos Lección 4: Correlación múltiple y ANCOVA Lección 5: Superficies de respuesta 7 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Listado de figuras y tablas Figura 1. Ronald Fisher Figura 2. Mapa conceptual del diseño experimental Figura 3. El proceso del diseño experimental Figura 4. Portada del programa Statgraphics Figura 5.Representaciòn de un experimento factorial Figura 6.Un experimento factorial Tabla 1. Contenidos temáticos para el curso de diseño de experimental Tabla 2. Ejemplo de un reporte del análisis de varianza Tabla 3. Tratamientos de experimento sobre fertilización Tabla 4. Procedimiento estadístico para la comprobación de hipótesis Tabla 5. Análisis de varianza para los tratamientos con un solo factor, en un diseño totalmente aleatorizado o completamente al azar. Tabla 6. Recopilación y presentación de los resultados de los tratamientos, en un diseño totalmente aleatorizado o completamente al azar. Tabla 7. Recopilación y presentación de los resultados de los tratamientos, en un diseño de bloques completos al azar. Tabla 8. Recopilación y presentación de los resultados de los tratamientos, en cuadro latino. Tabla 9. Arreglo de los resultados de los tratamientos, en cuadro latino. Tabla 10. Arreglo de los resultados de los tratamientos, en cuadro Greco-Latino. Tabla 11. ANOVA para el diseño de cuadro greco latino* Tabla 12. ANOVA para el diseño factorial a x b Tabla 13. Resultados del ensayo NOVA para el diseño factorial a x b Tabla 14. ANOVA para el ejemplo de diseño factorial a x b Tabla 15. Signos algebraicos para calcular los efectos en un diseño 2 2 Tabla 16. ANOVA para un diseño factorial 2 2 Tabla 17. Respuestas para el ejemplo de diseño factorial 2 2 Tabla 18. Matriz para el ejemplo de diseño factorial 2 2 Tabla 19. Análisis de varianza para el ejemplo de diseño factorial 2 2 Tabla 20. Combinación de los tratamientos para un diseño 2 3 Tabla 21. Signos algebraicos para calcular los efectos en un diseño 2 3 Tabla 22. Calculo del Análisis de varianza para un diseño factorial 2 3 Tabla 23. Datos de la viscosidad de la bebida desarrollada. Tabla 24. Promedio y factores calculados para el ejemplo de la viscosidad Tabla 25. Análisis de la varianza para la viscosidad de la bebida desarrollada. Tabla 26. Resultados estimados para los datos de viscosidad con la ecuación de regresión encontrada para el ejemplo anterior, utilizando el programa Stat Graphics. Tabla 27. Ecuaciones para el estimativo de una regresión lineal simple Tabla 28. Grado de asociación de los coeficientes de correlación para un conjunto de datos. Tabla 29. Modelos de regresión lineal simple Tabla 30. Transformaciones usadas para datos 8 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO El proceso del diseño experimental El Diseño de Experimentos tuvo su inicio teórico a partir de 1935 por Sir Ronald A. Fisher, quién sentó la base de la teoría del Diseño Experimental y que a la fecha se encuentra bastante desarrollada y ampliada. Actualmente las aplicaciones son múltiples, especialmente en la investigación de las ciencias naturales, ingeniería, laboratorios y casi todas las ramas de las ciencias sociales. La experimentación proporciona los datos experimentales, en contraste con los datos de la observación; los datos de la observación se representan como su nombre indica por observaciones de las unidades elementales de una población o de una muestra, y no deben ser cambiados ni modificados por ningún intento de parte de un investigador en el curso de la observación. Figura 1. Ronald Fisher 9 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Red Semántica-Diseño Experimental Figura 2. Mapa conceptual del diseño experimental 10 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Contenidos Unidad 1 Nombre de la Unidad UTILIZACIÓN DE LOS MÉTODOS ESTADÍSTICOS DE CONTRASTE EN LA EXPERIMENTACIÓN Introducción La experimentación juega un papel fundamental en todos los campos de la investigación y el desarrollo. El objetivo de la experimentación es obtener información de calidad y confiable. Información que debe permitir el desarrollo de nuevos productos y procesos, comprender mejor un sistema y tomar decisiones sobre como optimizarlo además el de comprobar hipótesis científicas, etc. Obviamente la experimentación se debe planificar (diseñar) cuidadosamente para que proporcione la información buscada. Dicha planificación debe considerar dos aspectos importantes relacionados con toda experimentación. El diseño de un experimento es la secuencia completa de los pasos que se deben tomar de antemano, para planear y asegurar la obtención de toda la información relevante y adecuada al problema bajo investigación, la cual será analizada estadísticamente para obtener conclusiones válidas y objetivas con respecto a los objetivos planteados. Un Diseño Experimental es una prueba o serie de pruebas en las cuales existen cambios deliberados en las variables de entrada de un proceso o sistema, de tal manera que sea posible observar e identificar las causas de los cambios que se producen en la respuesta de salida. Justificación Para responder al reto que le plantea su proyecto académico, la Universidad, desde la perspectiva de ser abierta y a distancia, se ha propuesto crear las condiciones que le permitan consolidar científicamente los currículos, con este propósito se ofrece el modulo de diseño experimental de aplicación a todas los programas de la UNAD, con el fin de aprender a planificar de una manera razonable los trabajos de grado y las diferentes investigaciones que se propongan, reconfirmando las técnicas necesarias para realizar con éxito dicha labor y sustentar objetivamente los resultados a través de la investigación planificada. Intencionalidades Formativas Se pretende con este modulo y guía proporcionar y suministrar los elementos, los conceptos y la información necesaria para el desarrollo de las actividades a tener presentes para la planificación y el desarrollo de un proyecto de investigación, con el fin de inducir a los docentes y estudiantes en la aplicación de estrategias que conduzcan al correcto planteamiento, desarrollo y formulación de actividades propias de la investigación con racionalización de los recursos asignados. 11 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO CAPITULO 1: LA INVESTIGACIÓN Y EL DISEÑO EXPERIMENTAL La experimentación juega un papel fundamental en todos los campos de la investigación y el desarrollo. El objetivo de la experimentación es obtener información de calidad y confiable. Información que debe permitir el desarrollo de nuevos productos y procesos, comprender mejor un sistema y tomar decisiones sobre como optimizarlo además el de comprobar hipótesis científicas, etc. Obviamente la experimentación se debe planificar (diseñar) cuidadosamente para que proporcione la información buscada. Dicha planificación debe considerar dos aspectos importantes relacionados con toda experimentación. El diseño de un experimento es la secuencia completa de los pasos que se deben tomar de antemano, para planear y asegurar la obtención de toda la información relevante y adecuada al problema bajo investigación, la cual será analizada estadísticamente para obtener conclusiones válidas y objetivas con respecto a los objetivos planteados. Un Diseño Experimental es una prueba o serie de pruebas en las cuales existen cambios deliberados en las variables de entrada de un proceso o sistema, de tal manera que sea posible observar e identificar las causas de los cambios que se producen en la respuesta de salida. Esquema de un proceso o sistema experimental: Figura 3. El proceso del diseño experimental Revisemos el enlace: La estadística, instrumento de investigación científica. Tomado de Tomado de: portalsej.jalisco.gob.mx/unidades- upn.../antonio_ramirez_ramirez.pdf. Con fines netamente educativos. 12 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Lecciones-C_1-U_1 Lección 1: Conceptos básicos del diseño experimental Los siguientes conceptos que se definen a continuación se utilizarán en el desarrollo de las unidades posteriores; los cuales fueron retomados de Montgomery (1991) y de Kuehl (2001). Definiciones Diseño: Consiste en planificar la forma de hacer el experimento, materiales y métodos a usar, etc. Experimento. Conjunto de reglas usadas para obtener una muestra de la población y al concluir el ensayo obtener información acerca de la población. Un experimento es un procedimiento mediante el cual se trata de comprobar (confirmar o verificar) una o varias hipótesis relacionadas con un determinado fenómeno, mediante la observación y medición de las variables que influyen en el mismo. Por ejemplo todas las pruebas de laboratorio y las pruebas de campo que realices para desarrollar tu trabajo de grado. Es un cambio en las condiciones de operación de un sistema o proceso para obtener una muestra de la población y al concluir el ensayo obtener información acerca de la población o del producto obtenido. Por ejemplo variar las condiciones de operación (temperatura, presión, velocidad de agitación de un proceso, las raciones para semovientes, dosis de agroquímicos). O la utilización de diferentes proporciones de materias primas y aditivos para mejorar la condición de un producto de consumo masivo. La experimentación constituye uno de los pasos del método científico. Ejemplos de sistemas experimentales son: - Una reacción química y/o bioquímica, cuyo rendimiento (Y) puede ser función, entre otros, del tiempo de reacción (t1), la temperatura de la reacción (T2) y el tipo de microorganismo (Mo1) utilizado. Otras variables que pueden influir son, por ejemplo, la presentación de los sustratos, la velocidad de agitación,.... 13 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Experimento aleatorio. Actividad que tiene como resultado o que produce un evento. Prueba donde existen dos o más resultados posibles, y no se pude anticipar cuál de ellos va a ocurrir. Tratamiento: Es un conjunto particular de condiciones experimentales definidas por el investigador. Son el conjunto de circunstancias creadas por el experimento, en respuesta a la hipótesis de investigación y son el centro de la misma. Factor: Es un grupo específico de tratamientos. (Ejemplo, Temperatura, humedad, tipos de suelos, etc.). Niveles Del Factor: Son diversas categorías de un factor. (Por ejemplo, los niveles de temperatura son 20°C, 30°C, etc.). Un factor Cuantitativo tiene niveles asociados con puntos ordenados en alguna escala de medición, como temperatura; mientras que los niveles de un factor cualitativo representan distintas categorías o clasificaciones, como tipo de suelo, que no se puede acomodar conforme a alguna magnitud. Réplica: Son las repeticiones que se realizan del experimento básico. Unidad Experimental: Es el material experimental unitario que recibe la aplicación de un tratamiento. Es la entidad física o el sujeto expuesto al tratamiento independientemente de las otras unidades. La unidad experimental una vez expuesta al tratamiento constituye una sola réplica del tratamiento. Es el objeto o espacio al cual se aplica el tratamiento y donde se mide y analiza la variable que se investiga. Es el elemento que se está estudiando. Unidad muestral: Es una fracción de la unidad experimental que se utiliza para medir el efecto de un tratamiento. Error experimental: Es una medida de variación que existe entre dos o más unidades experimentales, que han recibido la aplicación de un mismo tratamiento de manera idéntica e independiente. Factores Controlables: Son aquellos parámetros o características del producto o proceso, para los cuales se prueban distintas variables o valores con el fin de estudiar cómo influyen sobre los resultados. 14 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Factores Incontrolables: Son aquellos parámetros o características del producto o proceso, que es imposible de controlar al momento de desarrollar el experimento. Variabilidad Natural: es la variación entre las unidades experimentales, que el experimentador no puede controlar ni eliminar. Variable Dependiente: es la variable que se desea examinar o estudiar en un experimento. (Variable Respuesta). Lección 2: Tipos de tratamientos y errores experimentales Los siguientes conceptos que se definen a continuación se utilizarán en el desarrollo de las unidades posteriores; los cuales fueron retomados de Montgomery (1991), Padrón (1996) y de Kuehl (2001). A continuación se presentan ejemplos de tratamientos en algunas áreas, tales como: Experimentaciones Agrícolas, un tratamiento puede referirse a: ♦ Marca de Fertilizante. ♦ Cantidad de Fertilizante. ♦ Profundidad del Sembrado. ♦ Variedad de Semilla. ♦ Combinación de Cantidad de Fertilizante y Profundidad de Sembrado; esto es una combinación de tratamientos. ♦ etc. Experimentaciones de Nutrición Animal, un tratamiento puede referirse a: ♦ Cría de Ganado Lanar ♦ Sexo de los Animales ♦ Padre del Animal Experimental ♦ Tipo de Alimento 15 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO ♦ Ración Particular de Alimento de un Animal. ♦ Raza del Animal ♦ etc. Error Experimental: Es una medida de variación que existe entre dos o más unidades experimentales, que han recibido la aplicación de un mismo tratamiento de manera idéntica e independiente. Factores Controlables: Son aquellos parámetros o características del producto o proceso, para los cuales se prueban distintas variables o valores con el fin de estudiar cómo influyen sobre los resultados. Factores Incontrolables: Son aquellos parámetros o características del producto o proceso, que es imposible de controlar al momento de desarrollar el experimento. Variabilidad Natural: es la variación entre las unidades experimentales, que el experimentador no puede controlar ni eliminar. Variable Dependiente: es la variable que se desea examinar o estudiar en un experimento. (Variable Respuesta). Lección 3: Principios básicos en el diseño de experimentos Acorde con Cochran & Cox (2001) los tres principios básicos del Diseño de un experimento son: 1. Replicación (Obtención de Réplicas). Este principio se refiere al número de veces que se aplica un tratamiento a las unidades experimentales. El cual tiene dos propiedades importantes, la primera permite al experimentador obtener la estimación del error experimental; esta estimación se convierte en la unidad básica para determinar si las diferencias observadas en los datos son estadísticamente significativas o para determinar la amplitud de un intervalo de confianza, y la segunda permite al experimentador calcular una estimación más precisa del efecto medio de cualquier factor en el experimento, si se usa la media de la muestra, como una estimación de dicho efecto. Lo que significa que la varianza de la media de la muestra se define como σ 2 y = σ/ n; donde σ 2 es la varianza de los datos y n el número de réplicas. 16 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO La implicación práctica de esto es que si el número de réplicas es pequeña (n=1) probablemente no se podría obtener inferencias satisfactorias con respecto al efecto del tratamiento; es decir, que la diferencia observada podría ser resultado, exclusivamente, del error experimental. El número de réplicas afecta la precisión de las estimaciones de las medias de tratamientos y la potencia de las pruebas estadísticas para detectar las diferencias entre las medias de los grupos en los tratamientos. Pero puede ser muy costosa económicamente la incorporación de una réplica en el Experimento. Lección 4: Las técnicas utilizadas en el diseño de experimentos Igualmente Cochran & Cox (2001) describen que las técnicas que se deben utilizar en un Diseño de experimento son: El Bloqueo El bloqueo proporciona control local del ambiente para reducir la variabilidad natural. Las unidades experimentales se distribuyen en grupos de unidades similares, con base en un factor o factores que se espera o se sabe que tienen alguna relación con la variable respuesta o con la medición que se supone responde de manera diferente a los diversos tratamientos. Es decir, que consiste en la distribución de las unidades experimentales en bloques de tal manera que las unidades dentro de un bloque sean relativamente homogéneas; ya que unidades experimentales heterogéneas producen valores grandes en la varianza del error experimental, es así que la mayor parte de la variación predecible entre las unidades queda confundida con el efecto de los bloques. Los cuatro criterios que se usan con más frecuencia para llevar a cabo el bloque en las unidades experimentales son: 1) Proximidad (parcelas vecinas). 2) Características Físicas (edad o peso). 3) Tiempo (Tiempo de desarrollo). 4) Administración de tareas en el experimento. Balanceo: Es el bloqueo y la asignación de los tratamientos a las unidades experimentales de modo que resulte una configuración balanceada. La comparación precisa entre los tratamientos requiere la selección de unidades experimentales uniformes para reducir el error experimental. La naturaleza del 17 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO experimento señala el equilibrio entre la variedad de las condiciones y la uniformidad de las unidades experimentales. Por ejemplo, si se trata de un experimento con vacas lecheras, la uniformidad de las unidades experimentales requiere elegir vacas de la misma cría, en la misma etapa de lactancia y con un número similar de lactancia. Agrupamiento: Es la colocación de un conjunto de unidades experimentales homogéneas en grupos, de modo que los diferentes grupos puedan sujetarse a distintos tratamientos. Estos grupos pueden constar de diferente número de unidades experimentales. En los tres principios analizados anteriormente el objetivo principal es disminuir en gran medida la Variabilidad Natural o error experimental, a continuación se presenta un ejemplo en el cual se evidencia este objetivo. Ejemplo Se hace una investigación sobre el efecto de administrar 10 mg. de vitamina B12 por libra de ración a cerdos en crecimiento, se tomaron ocho lotes de seis cerdos, cada uno tratados por pares. Los lotes se separaron por la administración de diferentes niveles de aureomicina. Se mide el aumento diario promedio del peso de tres cerdos (libras). Tratamientos Sin B12 Con B12 Unidades experimentales Cerdos Variable Respuesta Aumento de peso Para llevar a cabo este experimento se deben agrupar los cerdos de la misma raza, edad y sexo, de forma aleatoria; ya que estas tres situaciones afectan significativamente en el peso de los cerdos. Y es así como se obtiene una muestra lo más homogénea posible, y que en el experimento sólo intervenga la variabilidad natural, reduciendo así el error experimental. Lección 5: Control local, aleatorizaciòn y procedimiento para el diseño experimental Bicking (s.f), Cochran & Cox (2001) describen que la aleatorización es realizada cuando las unidades se han agrupado y los tratamientos han sido asignados al azar a las unidades dentro de cada grupo. Ejemplo: Se llevó a cabo un experimento para determinar la eficacia de 6 fertilizantes de nitrógeno para una cierta variedad de maíz. Se contaba con 24 parcelas experimentales. 18 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Considerando que puede existir mucha variabilidad entre las parcelas experimentales, se decidió usar un diseño de experimento que pudiera tener la capacidad de controlar esta variabilidad. Cada uno de los seis fertilizantes fue aplicado a cuatro parcelas experimentales, siguiendo el método de aleatorización del diseño utilizado y cada parcela experimental tenía cinco surcos de plantas de maíz. Luego se obtuvo la cosecha de plantas, de cada una de las parcelas se tomaron solamente tres surcos y fueron los centrales. Las plantas cosechadas se llevaron al laboratorio para determinar el rendimiento por medio del peso de las semillas, haciendo esto separadamente para cada una de las parcelas. En el ejemplo planteado se puede observar: • Hay seis tratamientos que son los seis fertilizantes. • Hay veinticuatro unidades experimentales, que son las parcelas experimentales. • La unidad muestral no es la totalidad de la unidad experimental sino una parte de ella (las 4 parcelas). • El investigador toma la decisión de cosechar tres surcos centrales en cada unidad experimental; ya que considera que de esta manera se puede evitar cualquier efecto del fertilizante que se aplica a una parcela y que pueda influir el resultado de las parcelas vecinas. • El número de réplicas es igual a cuatro por cada tratamiento. • Existe un control local ya que el investigador habrá usado un diseño (por ejemplo: El Diseño de Bloques Aleatorios; el cual se estudiara en el detalle en la siguiente unidad programática), que controla la variabilidad entre las parcelas en el campo experimental. • La variable respuesta en este experimento es el rendimiento. Forma de aleatorizar un experimento 1) Asignar números a cada una de las parcelas experimentales de 1 a 24. 2) Elaborar cuadrados de papel con los mismos números de las parcelas (1 a 24) y luego colocarlos en un recipiente. 3) Sacar al azar una por una las tarjetas del recipiente. 4) Existen 6 tratamientos, que son los seis fertilizantes y como el número de réplicas es igual a cuatro entonces los primeros cuatro números 19 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO sacados que corresponden a las primeras cuatro parcelas serán asignadas al fertilizante número uno. 5) Los segundos cuatro números sacados que corresponden a las segundas cuatro parcelas serán asignadas al fertilizante número dos. 6) Y así sucesivamente hasta obtener los últimos cuatro números que corresponden a las cuatro parcelas que serán asignadas al fertilizante número seis. En general, un experimento de este tipo puede tener simultáneamente otras variables respuestas como por ejemplo: altura de plantas, grosor de las plantas, determinación del contenido de humedad de los granos, etc. Pero en el análisis del experimento el rendimiento es la variable de interés para el investigador. A pesar de haber tomado todas las precauciones necesarias en la conducción del experimento, se podrá decir que siempre existirá el Error Experimental en cualquier experimento, no importa que tan bien sea planteado y conducido el experimento. Basta con observar y comparar los valores del rendimiento para dos ó más parcelas que han recibido la aplicación de un mismo fertilizante. Estos valores no serán iguales y por lo tanto el error experimental no es nulo y existe. Algunas de las razones por las cuales puede surgir el Error Experimental en este experimento son las siguientes: 1) Las parcelas experimentales en el campo deben tener variación en la fertilidad del suelo, textura del suelo, pH del suelo, pendiente, la cantidad de luz solar que puede recibir cada planta, etc. 2) El número total de plantas por cada parcela podría no ser igual. Esto puede ocurrir por defectos en la calidad de las semillas y el método de siembra utilizado. 3) Puede existir pérdida del material experimental cosechado que se lleva al laboratorio para determinar el peso. 4) Puede existir limitación y defectos en la máquina que se usa para determinar el peso del material que se ha cosechado. 5) Puede existir variación de criterios y técnicas que usan diferentes personas que han trabajado en la conducción del experimento. Control Local: Consiste en el uso de técnicas de bloqueo, balanceo y agrupamiento de las unidades experimentales para asegurar que el diseño usado sea eficiente; ya que los objetivos de la mayoría de los experimentos son las comparaciones claras y exactas entre los tratamientos a través de un conjunto apropiado de condiciones. Estos objetivos requieren estimaciones precisas de las 20 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO medias y poderosas pruebas estadísticas, lo cual se puede obtener reduciendo la varianza del error experimental. El uso adecuado del control local describe las acciones que emplea un investigador para reducir o controlar la magnitud de la estimación del error experimental; incrementando la exactitud de las observaciones y estableciendo la base de la inferencia del estudio. 21 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO CAPITULO 2-U_1 CONTRASTE DE HIPÓTESIS COMPARACIONES SIMPLES. Etimológicamente Hipótesis es la suposición de una verdad que debe ser verificada o rechazada. Es una explicación que al comienzo de una investigación se le da a un hecho, es una conjetura a la realidad. Y sirve para orientar al investigador en el encuentro de una verdad.(Ver modulo de trabajo de grado ciclo tecnológico y ciclo profesional del mismo compilador) Una hipótesis estadística es una afirmación sobre los valores de los parámetros de una población o proceso, que es susceptible de probarse a partir de la información contenida en una muestra representativa obtenida de una población. Por ejemplo, la afirmación "este proceso produce menos del 6% de defectuosos" se puede plantear estadísticamente, en términos de, proporción p desconocida de artículos defectuosos que genera el proceso. Ho : p =0.06 (la proporción de defectuosos es 0.06) HA: p < 0.06 (la proporción es menor a 0.06) Lecciones - C_2-U_1 Lección 1: Comprobación de hipótesis Para las siguiente lección se tomaron como referente a Bavaresco (1979), Bunge (1980) y Berenson, Levine & Krehbiel (2001). Formulación y prueba de hipótesis Una hipótesis es una afirmación acerca de algo. En estadística, puede ser una suposición acerca del valor de un parámetro desconocido. La prueba es el medio de verificación para saber si algo es verdadero o falso y hasta qué grado podemos decir que sea verdadero o falso. Pasos en la prueba de hipótesis: - - -hipótesis. - 22 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO - - Calcular una estadística de muestra. - Recomendación se debe hablar de "no rechazar" una hipótesis en lugar de "aceptar", ya que las pruebas no son concluyentes. Estadístico de prueba. Una vez planteada la hipótesis, se toma una muestra aleatoria (o se obtienen datos mediante un experimento planeado de acuerdo a la hipótesis de la población en estudio). El estadístico de prueba es un número calculado a partir de los datos y la hipótesis nula, cuya magnitud permite discernir si se rechaza o se acepta la hipótesis nula Ho Al conjunto de posibles valores del estadístico de prueba que llevan a rechazar Ho,se le llama región o intervalo de rechazo para la prueba, y a los posibles valores donde no se rechaza Hl les llama región o intervalo de aceptación. Por ejemplo, para las hipótesis planteadas el estadístico de prueba está dado por 0.08 Zo = vlO.08 (1- 0.08) / n' Ecuación 1 Análisis de datos. (2, 3, 7 y varios autores) El análisis depende del nivel de medición de las variables, de la manera como se hayan formulado las hipótesis, el interés del investigador en el problema que esté investigando. Podemos usar una serie de números conocidos como estadística sumaria para describir las características del conjunto de datos. Dos de estas características son de particular importancia para los responsables de tomar decisiones: la de tendencia central y la de dispersión, entre los cuales tenemos la mediana, la moda, medidas de tendencia central, desviación media, la dispersión, sesgo en curvas y graficas, curtosis, la media aritmética, la mediana, la moda, la dispersión, distribución de frecuencias, histogramas, la varianza de una población, puntuaciones Z, razones y tazas, análisis de varianza. Ppruebas de hipótesis. En general una prueba de hipótesis comienza con una teoría o aseveración relativa a cierto parámetro de una población para lo cual se definen dos hipótesis conocidas como: - La Hipótesis nula H o la cual es la hipótesis que se prueba siempre. 23 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO - Y la Hipótesis alternativa H 1 que se establece como el opuesto a la hipótesis nula y representa la conclusión que se apoya si la hipótesis nula se rechaza. En lo que se conoce como metodología de prueba de hipótesis clásica, se recomiendan los siguientes puntos a tener en cuenta: - La Hipótesis nula H o siempre se refiere a un valor especifico del parámetro de población (como ) , no al estadístico maestral ( como ) A partir de este numeral se deben consultar las tablas que se encuentran e textos de estadística como las tablas t-Student, de distribución F, comparación de medias de Duncan, etc. Ejemplo y procedimiento a desarrollar para una prueba de hipótesis propiamente dicha. Una organización de consumidores esta interesada en determinar si existe diferencia en el peso entre diferentes marcas de cajas de 500 gramos de cereales para el desayuno, para lo cual acepta una varianza de 10 gramos. Para el efecto el estudiante (de ser posible) recopilara 25 datos, los almacenara en una tabla y los analizara; se aconseja trabajar con una significancia del 5%. Los pasos a seguir para la prueba de hipótesis son los siguientes: 1. Establezca la hipótesis nula H o . Ésta debe expresarse en términos estadísticos. Por ejemplo: Al probar si la cantidad promedio de llenado es 500 gramos, la hipótesis nula asegura que ( ) es igual a 500gramos. 2. Establezca la hipótesis alternativa H 1 . También debe expresarse en términos estadísticos. Al probar si la cantidad promedio de llenado es de 500 gramos, la hipótesis alternativa asegura que ( ) es inferior a 500 gramos. 3. Elija el nivel de significancia. Éste se determina después de tomar en cuenta los riesgos especificados de cometer errores tipo I y tipo II en una situación particular. La compañía eligió = 0.05. 4. Elija el tamaño de la muestra n. Éste se determina después de tomar en cuenta los riesgos especificados de cometer errores tipo I y tipo II (es decir, los niveles 24 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO seleccionados de a y de considerar las restricciones de presupuesto al realizar el estudio. En este caso se pesaron 25 cajas de cereal seleccionadas al azar. 5. Determine la técnica estadística adecuada y la estadística de prueba correspondiente que se usará. Dado que si se conoce por que la compañía especificó que eran 15 gramos, se eligió una prueba Z. 6. Establezca los valores críticos que dividen las regiones de rechazo y no rechazo. Una vez especificadas las hipótesis nula y alternativa y determinados el nivel de significancia y el tamaño de la muestra, se pueden encontrar los valores críticos para la distribución estadística adecuada, de manera que se puedan indicar las regiones de rechazo y no rechazo. Para el caso se utilizaran los valores + 1.96 Y - 1 .96 para definir las regiones porque el estadístico Z se refiere a la distribución normal estándar. 7. Recopile los datos y calcule el valor muestral del estadístico de prueba adecuado. Realice una toma de datos (determinación) y calcule la X media = ....... gramos, entonces y obtenga el valor Z = + ........... 8. Determine si el estadístico de prueba está en la región de rechazo o de no rechazo. El valor calculado del estadístico de prueba se compara con los valores críticos de la distribución muestral apropiada para determinar en qué región se encuentra. En este caso, Z= +...... está en la región de rechazo o no rechazo porque - 1.96 < Z == +.... < + 1 .96. 9. Tome una decisión estadística. Si el estadístico dé prueba está en la región de no rechazo, la hipótesis nula, Ho no se puede rechazar; si el estadístico de prueba está en la región de rechazo, la hipótesis nula se rechaza. 10. Exprese la decisión estadística en términos de una situación particular. De ser afirmativa la diferencia entre las cantidades, que acción correctiva propondrías y aplicarías? Error experimental En todo proceso experimental se presentan dos clases de variaciones: la variación inherente al material experimental, al que se aplican los tratamientos y la que proviene de la falta de uniformidad en la realización física del experimento o 25 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO variaciones externas a la experimentación (como las ambientales, etc) que tienden a enmascarar el efecto de los tratamientos. Para expresar estas variaciones ajenas a los tratamientos los estadísticos aplican el término error experimental; término que no quiere decir equivocación, sino que incluye todo tipo de variación externa ajena al material experimental. Este error experimental es la medida de variación que existe entre las observaciones de unidades experimentales en el mismo tratamiento, es decir, la variación no proveniente de los tratamientos. Para los fines de cálculo en las ecuaciones se expresa con la letra c Errores tipo I y tipo II. (8) Cuando se contrastan o se prueban las hipótesis se pueden cometer dos tipos de errores por los siguientes motivos: - La prueba de hipótesis comienza con una suposición, llamada hipótesis, que hacemos con respecto a un parámetro de población. - Después recolectamos y clasificamos los datos, aplicamos la estadística seleccionada a las muestras y usamos esta información para decidir qué tan probable es que sea correcto nuestro parámetro de población acerca del cual hicimos la hipótesis. - Debemos establecer el valor supuesto (hipotetizado) del parámetro de población antes de comenzar a tomar la muestra. - La suposición que deseamos probar se conoce como hipótesis nula, y se simboliza por H 0 . - Siempre que rechazamos la hipótesis, la conclusión que sí aceptamos se llama hipótesis alternativa y se simboliza por H 1 . *** El rechazo de una hipótesis nula cuando es cierta se denomina error de tipo I, y su probabilidad (que es también el nivel de significancia) se simboliza como o . *** *** El hecho de aceptar una hipótesis nula cuando es falsa se denomina error de tipo II, y su probabilidad se simboliza como | . *** - La probabilidad de cometer un tipo de error puede reducirse sólo si deseamos incrementar la probabilidad de cometer el otro tipo de error. Con el propósito de obtener una (probabilidad) | baja, tendremos que tolerar una probabilidad o alta; sin embargo el nivel de significancia adecuado se debe decidir acorde con los costos y desventajas vinculadas con ambos tipos de errores. 26 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Las modalidades más recomendadas para disminuir el error son: En toda marcha experimental que se realice se debe a) Utilizar unidades experimentales muy uniformes, como materias primas homogéneas, procesos, densidad de muestras, etcétera. b) Tamaño adecuado de la unidad experimental. e) Eliminación de la competencia entre tratamientos. d) Distribución adecuada de los tratamientos mediante sorteos (azar). e) Usar el número adecuado de repeticiones para cada tratamiento. f) Poner todos los tratamientos en igualdad de condiciones, de manera que si alguno es superior a los demás, se pueda probar. Lección 2: Prueba de t Para Christensen (1990), Dawson & Trapp (2002) y Cochran & Cox (2001) la prueba de t es conocida a veces como prueba de t de Student, por recibir el nombre de la persona que la estudió primero, en 1890. Student en realidad era un matemático llamado William Gosset, empleado por la Cervecería Guiness, quien se vio obligado a usar el pseudónimo de Student, debido a que por política de la compañía se tenía prohibido a los empleados publicar sus investigaciones. Gosset descubrió que cuando una observación procede de una distribución normal, las medias se distribuyen de manera normal, sólo sí se conoce la verdadera desviación estándar de la población. La prueba de t se emplea mucho en todas las áreas de la ciencia. La distribución de t, es similar a la distribución de z la cual se explicó en numeral anterior y, uno de sus mayores usos, es responder a interrogantes de investigación sobre medias y cuando se desconoce la verdadera desviación estándar. 27 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Ecuaciónes 2 y 3 S, es la desviación estándar Para usar una prueba t con una muestra, se supone que los datos numéricos se obtienen de una manera independiente y representan una muestra aleatoria de una población que sigue una distribución normal. En la práctica, se ha encontrado que siempre que la muestra no es muy pequeña y la población no tenga un sesgo grande, la distribución t proporciona una aproximación a la distribución muestral de la media cuando (sigma) no se conoce. Prueba de t para la diferencia entre dos medias El cálculo de la prueba de t para la diferencia entre dos medias se realiza con Ecuaciónes 4 y 5 S 2 p = varianza combinada X 1,2 = medias de la muestra tomadas de las poblaciones respectivamente S 1,2 = varianzas de la muestra tomadas de las poblaciones respectivamente Ver ejercicio resuelto- en el apéndice 1. 28 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Lección 3: Análisis de varianza-ANDEVA Para Christensen (1990), Dawson & Trapp (2002) y Cochran & Cox (2001) el análisis de varianza fue ideado por Sir Ronald Fisher en 1925, de gran aplicación cuando en una investigación se tiene el propósito de corrobar por medio del análisis estadístico los efectos de uno o más factores sobre el comportamiento de una característica o variable dependiente. El ANAVA (Analysis of variance) o Anova; es una técnica estadística que sirve para analizar la variación total de los resultados experimentales de un diseño en particular, descomponiéndolo en fuentes de variación independientes atribuibles a cada uno de los efectos en que constituye el diseño experimental, compara dos o más medias. Esta técnica tiene como objetivo identificar la importancia de los diferentes factores ó tratamientos en estudio y determinar cómo interactúan entre sí. El ANOVA es una prueba semejante a la prueba t de Student, en cuanto a la práctica, pero la comparación entre grupos no es a través de la media y su desviación estándar, sino a través de la varianza de la variable numérica “y”, en cada grupo de la variable categórica “x”. Básicamente el análisis de Varianza, se utiliza para corroborar si la significación de diferencias entre medias de dos o más grupos, son o no debidas al azar. La cifra estadística obtenida con el ANOVA es la razón F. F= Estimación entre los tratamientos / Estimación dentro de los tratamientos. Suponiendo que se analizan 2 grupos, el ANAVA o el ANOVA, analiza las variaciones entre los dos grupos (inter-grupal) y la compara con la variación dentro de cada grupo (intra-grupal), para obtener mediante una suma de cuadrados el valor de F. Si las diferencias de varianza entre cada grupo son mayores que las intra- grupales, seguramente existen diferencias significativas entre los grupos que no son debidas al azar. Los grupos se definen como en la prueba t eligiendo una variable categórica. La variable a analizar debe ser numérica y de distribución simétrica. Bases del análisis de la varianza. Los supuestos que validan el análisis varianza son: a. Los errores son independientes 29 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO b. Los errores están normalmente distribuidos con media cero y varianza constante c. Existe homogeneidad de varianza entre los tratamientos. Supónganse k muestras aleatorias independientes, de tamaño n, extraídas de una única población normal. A partir de ellas existen dos maneras independientes de estimar la varianza de la población (S 2 ) 1) Una varianza dentro de los grupos (ya que sólo contribuye a ella la varianza dentro de las muestras), o varianza de error, o cuadrados medios del error, y habitualmente representada por SC Error (Mean Square Error) que se calcula como la media de las k varianzas muestrales (cada varianza muestral es un estimador centrado de S 2 y la media de k estimadores centrados es también un estimador centrado y más eficiente que todos ellos). SC Error es un cociente: al numerador se le llama suma de cuadrados del error y se representa por SC E y al denominador grados de libertad por ser los términos independientes de la suma de cuadrados. 2) Otra llamada varianza entre grupos (sólo contribuye a ella la varianza entre las distintas muestras), o varianza de los tratamientos, o cuadrados medios de los tratamientos y representada por SC trat o MSB (Mean Square Between). Se calcula a partir de la varianza de las medias muestrales y es también un cociente; al numerador se le llama suma de cuadrados de los tratamientos (se le representa por SC trat ) y al denominador (k-1) grados de libertad. SC trat y SC Error , estiman la varianza poblacional en la hipótesis de que las k muestras provengan de la misma población. La distribución muestral del cociente de dos estimaciones independientes de la varianza de una población normal es una razón con distribución F con los grados de libertad correspondientes al numerador y denominador respectivamente, por lo tanto se puede contrastar dicha hipótesis usando esa distribución. Variación total = Variación dentro de los tratamientos+ Variación entre los tratamientos Suma de cuadrados total = Suma de cuadrados dentro+Suma de cuadrados entre Variación total = Tabla 2. Ejemplo de un reporte del análisis de varianza 30 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Fuente de variación Grados de Libertad SC Suma de cuadrados CM Cuadrados medios F 0 Razón F p-valor Entre Tratamientos k-1 SC tratamient SC trat /(K-1) SC trat / SCM E P (F>F 0 ) Dentro del Error N-k SC E SC E /(N-K) Total N-1 SC T SC Total / (KN - 1) K= Numero de tratamientos o niveles o grupos del factor de interés N= Número total datos reportados n = Número total de datos por grupo Ejemplos de resolución de ANAVAS o ANOVAS se realizaran en capítulos siguientes y apéndices al final del mòdulo. Los grados de libertad son uno menos que el número de observaciones para cada fuente de variación. Lección 4: Prueba de diferencia significativa mínima (DSM) de Fisher Diferencia mínima significativa (LSD). Es la diferencia mínima que debe haber entre dos medias muéstrales para poder considerar que dos tratamientos son diferentes. Discusión Cuando para un diseño experimental se rechaza la hipótesis de igualdad entre los tratamientos el investigador se pregunta cual(es) de ellos son diferentes entre sí. Para averiguarlo se emplean los métodos de comparación de medias, uno de estos métodos (formulas) es el LSD o (DMS) o diferencia minina significativa. Esta debe ser utilizada solo para comparar medias adyacentes en un arreglo ordenado, aunque también se puede emplear para comparar las medias con un testigo o tratamiento estándar. La DMS es una prueba de t de Student que utiliza la varianza combinada. 31 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Ecuación 6 …………..t= Ecuación 7………….S d r = Número de repeticiones CME = Cuadrado medio del error El valor de t se toma de la tabla de los apéndices con los grados de libertad del error. Usualmente la significancia es considerada entre 1% y 5%. Ejemplo En un experimento desarrollados por un grupo de profesionales se determino el efecto de tres tratamientos de fertilización en la altura de arboles de una especie forrajera, obteniéndose los siguientes resultados. Tabla 3. Tratamientos de experimento sobre fertilización Tratamiento IBIOM (cm3) Media CV (%) T1 1064 a * 93 T2 1838 a * 60 T3 1886 a * 61 Diferencia Mínima Significativa DMS 962 cm3 Los valores acompañados por igual letra no presentan diferencias estadísticamente significativas al 95% de confianza. X 1 X 2 X 3 X 1 - 1064 - 1838 1064-1886 X 2 - - 1838-1886 X 3 - - - 32 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Lección 5: Modelo estadístico La finalidad de una serie de experimentos es determinar un modelo estadístico que refleje la creencia respecto a la relación entre los tratamientos y las observaciones. Cada resultado del experimento si este se repite n veces, está determinado por la media general y el efecto del tratamiento. La identificación de este fenómeno y la comprobación de las suposiciones se hacen en el momento de proponerlo basándose en el siguiente modelo matemático: Ecuación 8 Modelo matemático Ecuación 9 En donde i= 1,……., k numero de tratamientos j=1,…., r número de repeticiones u= promedio de todas las unidades experimentales del experimento = o según el caso. i t = la diferencia entre el promedio ( µ i) y el resultado cuando se tiene la combinación de factores determinada por el tratamiento i. Como hay variaciones no controlables, la inexactitud de las mediciones, conforman un factor llamado error experimental ( c ). El modelo finalmente se expresa como: Ecuación del Modelo estadístico 9 33 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Análisis de Covarianza. Lo que se busca en cada, experimento es la veracidad de una hipótesis. Cuando la hipótesis se refiere a los parámetros del fenómeno se convierte entonces en hipótesis estadística como la variabilidad del clima, de una temperatura en un proceso así se disponga de métodos de medida con bastante precisión y exactitud, sin olvidar que el resultado de todo experimento tiene un componente llamado error, generalmente debido al azar. Este efecto aleatorio obliga al investigador a recurrir a la estadística para minimizarlo y probar las hipótesis con un grado importante de certeza. El análisis de covarianza es un procedimiento muy importante en experimentación para la verificación de las hipótesis, pero lamentablemente no se usa con frecuencia. El análisis de covarianza permite realizar ajustes con las respuestas de las unidades experimentales en las que se varía un factor medible, con la respuesta que se hubiese obtenido, si todas las unidades experimentales hubiesen tenido, el valor promedio del factor variable, para eliminar así el efecto de ese factor. El análisis de covarianza entre muchas utilidades, se puede,utilizar también para ajustar las respuestas de las unidades de experimentación de promedios de dos o mas factores variables denominadas covariables. Utiliza el análisis de varianza y el de regresión para eliminar la variabilidad que existe en la variable independiente X; también ajusta medias de tratamiento y así estima mucho mejor el efecto de la variable independiente X sobre la variable dependiente Y. La variable independiente X es una observación hecha en cada unidad experimental antes de aplicar los tratamientos, e indica hasta cierto grado la respuesta final Y de la unidad experimental. Por ejemplo en una granja asistida por la UNAD se realizo un experimento con el fin estudiar la conveniencia de raciones alimenticias en la ganancia de peso de los anteriores para lo cual se les determinaron los pesos iniciales X y el consumo de alimento Y; si los investigadores utilizan diferentes raciones las diferencias fisicas y efectos que presentan los semovientes pueden ser o no ser significativas, por la calidad de las raciones. Por lo tanto se deben preguntar si: ¿Al existir variación en los pesos iniciales de los semovientes, la diferencia que se presentan en los pesos finales es debido a las propiedades de alguna de las raciones? O que en un alto porcentaje se deban a las diferencias de los pesos iniciales? 34 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Por medio del análisis de covarianza, se puede calcular el efecto de la bondad de las raciones, eliminando la parte correspondiente a los pesos iniciales. Recomendaciones - Al plantear un estudio estadístico, definir claramente la población objeto de análisis. - Si se trabaja con muestras, definir las condiciones que deben reunir antes de extraerlas. - Especificar qué se va a medir, las unidades a usar y la forma de registro. Ecuación de Modelo estadístico 9 Análisis de Covarianza. Lo que se busca en cada, experimento es la veracidad de una hipótesis. Cuando la hipótesis se refiere a los parámetros del fenómeno se convierte entonces en hipótesis estadística como la variabilidad del clima, de una temperatura en un proceso así se disponga de métodos de medida con bastante precisión y exactitud, sin olvidar que el resultado de todo experimento tiene un componente llamado error, generalmente debido al azar. Este efecto aleatorio obliga al investigador a recurrir a la estadística para minimizarlo y probar las hipótesis con un grado importante de certeza. El análisis de covarianza es un procedimiento muy importante en experimentación para la verificación de las hipótesis, pero lamentablemente no se usa con frecuencia. El análisis de covarianza permite realizar ajustes con las respuestas de las unidades experimentales en las que se varía un factor medible, con la respuesta que se hubiese obtenido, si todas las unidades experimentales hubiesen tenido, el valor promedio del factor variable, para eliminar así el efecto de ese factor. El análisis de covarianza entre muchas utilidades, se puede ,utilizar también para ajustar las respuestas de las unidades de experimentación de promedios de dos o mas factores variables denominadas covariables. 35 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Utiliza el análisis de varianza y el de regresión para eliminar la variabilidad que existe en la variable independiente X; también ajusta medias de tratamiento y así estima mucho mejor el efecto de la variable independiente X sobre la variable dependiente Y. La variable independiente X es una observación hecha en cada unidad experimental antes de aplicar los tratamientos, e indica hasta cierto grado la respuesta final Y de la unidad experimental. Por ejemplo en una granja asistida por la UNAD se realizo un experimento con el fin estudiar la conveniencia de raciones alimenticias en la ganancia de peso de los anteriores para lo cual se les determinaron los pesos iniciales X y el consumo de alimento Y; si los investigadores utilizan diferentes raciones las diferencias fisicas y efectos que presentan los semovientes pueden ser o no ser significativas, por la calidad de las raciones. Por lo tanto se deben preguntar si: ¿Al existir variación en los pesos iniciales de los semovientes, la diferencia que se presentan en los pesos finales es debido a las propiedades de alguna de las raciones? O que en un alto porcentaje se deban a las diferencias de los pesos iniciales? Por medio del análisis de covarianza, se puede calcular el efecto de la bondad de las raciones, eliminando la parte correspondiente a los pesos iniciales. Recomendaciones - Al plantear un estudio estadístico, definir claramente la población objeto de análisis. - Si se trabaja con muestras, definir las condiciones que deben reunir antes de extraerlas. - Especificar qué se va a medir, las unidades a usar y la forma de registro. CAPITULO 3-U_1 CAPITULO 3: TIPOS DE DISEÑO EXPERIMENTALES Para dar solución al gran número de situaciones y problemas teóricos prácticos que se presentan en la ingeniería y en otras actividades profesionales se han propuesto un buen numero de diseños experimentales cantidad que hacen necesario saber elegir el más adecuado para la situación que se quiere resolver, de allí que es conveniente conocer su clasificación de acuerdo a su alcance dentro del objetivo en propuesto. Definiciones Clasificación: de acuerdo con su objetivo y su utilización, sin pretender ser exhaustivo, los diseños se pueden clasificar como: 36 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO 1. Diseños para comparar dos o más tratamientos. 2. Diseños para estudiar el efecto de varios factores sobre la(s) respuesta(s). 3. Diseños para determinar el punto óptimo de operación de un proceso. 4. Diseños para la optimización de una mezcla. 5. Diseños para hacer el producto insensible a factores no controlables. Ejemplos de los anteriores son los que se van a tratar en este curso como los citados a continuación: Diseño Completo al Azar, Diseño de Bloques Completos al azar, diseño de Cuadro Latino, diseño de Cuadro Greco Latino, diseño factorial 2 K , diseños factoriales 3 K LECCIONES-C_3-U_1 Lección 1: El uso de las computadoras y software especializado El uso de las computadoras y software especializado Los primeros usos del software estadístico en la enseñanza de la estadística han sido la presentación de "output" impresos a los alumnos para interpretar resultados. La simulación es un ejemplo de cómo utilizar el computador en la estadística aplicada. Existen software que simulan sistemas físicos, sociales o empresariales. Uno de las más sencillos y conocidos trata de simular la toma de decisiones en diversos escenarios y analizar sus resultados en un entorno competitivo. El alumno debe manejar varias variables en procura de maximizar las ganancias de su empresa. Las áreas de análisis multivariado fueron las más beneficiadas por el uso de la computadora. Las técnicas a utilizar no se ven limitadas a pesar de que el número de variables sea considerable, ya que los problemas de cálculo se minimizan. Tampoco los gráficos resultan un escollo. Algunos profesores, en ausencia de impedimentos de cálculos, le piden al alumno que aplique tales o cuales métodos, incentivando de esta forma la destreza en el uso del software (y el conocimiento de muchas de sus variantes). Sin embargo, no hay una enseñanza orientada a la resolución de problemas (porque no se ha planteado un problema) sino a la aplicación de técnicas estadística sin un claro objetivo. 37 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Paradójicamente, el uso de la computadora ha generado nuevos problemas. Uno de ellos es que se corre el riesgo de desarrollar análisis que constituyen sólo un ejercicio de uso de software, sin dedicar el suficiente tiempo a analizar la coherencia y lógica detrás de los mismos. Algunos ejemplos son: - Determinar medias y desviaciones estándar de variables con escala nominal, debido a que en la tabla de datos figuran códigos numéricos de las distintas categorías. - Calcular la media y el desvío estándar de los números que identifican cada formulario. - Asignar un número a cada individuo según el orden que ocupa, y concluir que su distribución es simétrica. Cuando los cálculos llevaban mucho tiempo, se debía pensar si era necesario realizar tal operación. Ahora que los cálculos no son obstáculo, muchas veces no se piensa qué es lo que se está haciendo. El momento de reflexión se realiza después de la etapa de cálculo y no antes. Ahora se dedica tiempo y esfuerzo en descartar análisis e indicadores sin sentido. Los Software estadísticos que facilitan una variedad de técnicas estadísticas descriptiva e inferencial, poco a poco, están cambiando la enseñanza de esta disciplina. Ya no es necesario concentrarse mucho en el manejo de fórmulas engorrosas. Esto puede conducir, a pretender el mismo objetivo que antes pero demorando menos o a usar la computadora para potenciar las posibilidades de la enseñanza de estadística. Nuestra opinión es que si bien las opciones anteriores no son excluyentes, se debe insistir más en el sentido de las técnicas, en su aplicación apropiada y en la buena interpretación de los resultados. Un uso de la planilla electrónica que recomendamos especialmente es su aplicación para comprender la relación entre el coeficiente de correlación lineal de Pearson y el diagrama de dispersión. La planilla electrónica permite observar en forma simultánea los efectos que provoca la modificación de algún dato en el diagrama de dispersión y en el coeficiente de correlación. La enseñanza de la práctica de la estadística debería basarse en la resolución de estudios de casos. El software adecuado podría apoyar cursos basados en el estudio de casos, para presentar problemas prácticos que requieren: 1. La formulación de hipótesis 2. La recolección de datos 3. La comprobación de hipótesis 4. La comunicación de resultados e ideas 38 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Además, ayudan a cambiar el énfasis de los tradicionales "problemas de planteo" a "estudios de casos". En el desarrollo de "estudios de casos", el uso de la computadora implica dar mayor importancia a temas que antes no se priorizaban. Cuando se fomenta a los alumnos que desarrollen una investigación donde deban recolectar datos, se plantea el problema de cómo organizar luego la tabla de datos. Proponemos incluir en los cursos un capitulo dedicado a la creación de estas tablas. De los programas adecuados para el manejo, el procesamiento y análisis de datos citamos los siguientes: EXCELL, SPS, MINITAB, SAS, STATISTICAL, STATGRAPHICS, CURVE EXPERT; etc. sin embargo con la utilización de una calculadora también es posible la realización de la gran mayoría de las operaciones involucradas en el procesamiento de los datos. Figura 4. Portada del programa Statgraphics * Se le asigna el nombre de hoja de cálculo a un hoja que esta divida en renglones y columnas, al cruce de ellos se le denomina celdas sobre las cuales se almacena información (letras o números) que podemos usar para realizar operaciones, tales como sumas, restas, multiplicaciones, divisiones, cálculos financieros, estadísticos, de ingeniería, amortizaciones, etc. - Revisar los enlaces de Apendices 1_Repaso a la estadistica en la página del curso. 39 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Lección 2: Diseños unifactoriales De Montgomery (1991) y Cochran & Cox (2001) extractanos que: Los experimentos de una variable se realizan para averiguar cómo una variable experimental afecta una o más variables de respuesta. En este tipo de experimentos, los tratamientos son simplemente niveles seleccionados de la variable experimental. Dependiendo de la variable experimental seleccionada, los tratamientos pueden diferir ya sea cualitativa o cuantitativamente. Diseñó de experimentos sin bloquear. A estos experimentos algunos autores (Montgomery, 1991 y Cochran & Cox, 2001) los denominan diseño totalmente aleatorizado o completamente al azar, es el diseño más simple y se usa cuando las unidades experimentales son homogéneas, tienen las mismas posibilidades de recibir cualquier tratamiento y la variación entre ellas es muy pequeña. Como en los experimentos de laboratorio, de invernadero en experimentos en donde las condiciones ambientales son controladas, en algunos casos este diseño necesita solo una replica con un solo criterio de clasificación. Por lo tanto: 1. Es fácil de planear. 2. Es flexible en cuanto al número de tratamientos y repeticiones, el límite está dado por el número de unidades experimentales en general. 3. No es necesario que el número de tratamientos sea igual al número de repeticiones. 4. No se estiman unidades o muestras perdidas. 5. El número de grados de libertad para el error aumenta por no tener muchas restricciones. Las desventajas del diseño completamente al azar son: - No es eficiente con material experimental heterogéneo. - Puesto que no existen restricciones en cuanto a la aleatoriedad, el error experimental incluye la variación total entre unidades experimentales. 40 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO - El análisis de varianza para el diseño completamente al azar se muestra en las tablas 25 y 26. Procedimiento estadístico para la comprobación de hipótesis en un diseño al azar. El procedimiento a seguir es común y debe ser acorde con lo planteado en la siguiente tabla. Tabla 4. Procedimiento estadístico para la comprobación de hipótesis INFORMACION RECOPILADA SOBRE LA RESPUESTA A LOS TRATAMIENTOS OPERACIONES ARITMETICAS A DESARROLLAR PARA EL CALCULO DEL ANAVA OBSERVACIONES A B C 1. = suma de cuadrados de todas las observaciones 2. Suma de los datos 3. Número total de mediciones 4. Media de los datos 5. Efecto del método = Y observada - Y media F1A1 F1B1 F1C1 F2A1 F2B1 F2C1 F3A1 F3B1 F3C1 Total por tratamiento Numero de datos por tratamiento n N n Media por tratamiento Gran media Suma de cuadrados totales SC T Suma de cuadrados de los tratamientos SCt Y el ANAVA en la siguiente tabla Tabla 5. Análisis de varianza para los tratamientos con un solo factor, en un diseño totalmente aleatorizado o completamente al azar. Fuente de variación Grados de Libertad SC Suma de CM Cuadrados F 0 Razón p-valor 41 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO cuadrados medios Tratamientos k-1 SC trat SC trat /(k-1) SC trat / CM E P (F>F 0 ) Error N-k SC E SC E /(N-k) Total N-1 SC T SC MT / (kn -1) k= Numero de tratamientos o niveles o grupos del factor de interés N= Número total de datos reportados n = Numero total por grupo El procedimiento consiste en calcular la suma del cuadrado de los tratamientos, la suma de los cuadrados totales y por diferencia la suma de cuadrados del error. Tabla 6. Recopilación y presentación de los resultados de los tratamientos, en un diseño totalmente aleatorizado o completamente al azar. NIVEL 1 2 3 A F1A1 F2A1 F3A1 B F1B1 F2B1 F3B1 C F1C1 F2C1 F3C1 D F1D1 F2D1 F3D1 E F1A1 F2A1 FjeA J F1A1 hasta FJEAJ son los análisis o las muestras recolectadas o tomadas Para aclarar el concepto del procedimiento que se sigue revisemos el apéndice 2. Lección 3: Diseños de bloques completos al azar El objetivo del diseño de bloques completos al azar (DBCA) es reunir las unidades experimentales a las cuales se aplicaran los tratamientos, en bloques de cierto tamaño, de tal modo que los tratamientos se efectúen dentro de cada bloque, la variabilidad entre unidades experimentales de bloques diferentes será mayor que entre unidades del mismo bloque, como consecuencia, las diferencias encontradas entre unidades se deben principalmente a la discrepancia entre tratamientos. La disparidad que no se deba tratamiento, se elimina por el diseño y forma parte del error experimental. De acuerdo con esto, es fácil observar que la variabilidad entre bloques no afecta las diferencias entre medias de tratamientos, 42 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO porque en cada bloque aparece una vez por tratamiento y así los bloques y tratamientos son ortogonales. En este diseño el material experimental es dividido en grupos de unidades experimentales (UE) lo más homogéneas posible. Cada uno de los grupos es una sola prueba o repetición. El objeto en todas las etapas del experimento es de mantener el error experimental dentro de cada grupo tan pequeño como sea posible en la práctica. Los conjuntos o grupos son llamados bloques. Dentro de cada bloque las (UE) son asignadas aleatoriamente, cada tratamiento ocurre exactamente una vez en un bloque. Fuentes de variabilidad. En este diseño (DBCA) se consideran tres fuentes de variabilidad: el factor de tratamientos, el factor de bloques y el error aleatorio es decir, se tienen tres posibles responsables de la variabilidad que presenten los datos obtenidos. Se denominan completos porque en cada bloque se prueban todos los tratamientos, es decir, que los bloques están completos Ventajas Las principales ventajas de bloques al azar son las siguientes: 1. Por medio de la agrupación comúnmente se obtienen resultados más exactos que cuando se usan diseños completamente al azar. 2. Puede incluirse cualquier numero de repeticiones. El análisis estadístico es el acostumbrado. 3. Si la varianza del error experimental es mayor para algunos tratamientos que para otros aun puede obtenerse un error insesgado para probar cualquier combinación específica de las medias de los tratamientos. 4. Ningún otro diseño se usa tan frecuentemente como los bloques al azar. Aleatorización. La aleatorización es realizada cuando las unidades se han agrupado y los tratamientos han sido asignados al azar a las unidades dentro de cada grupo. El nombre de bloques completos al azar es debido a que en cada bloque (por ejemplo un operador, un semoviente, una parcela) se prueban todos los tratamientos (completo) en orden aleatorio. 43 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Procedimiento estadístico para la comprobación de hipótesis en un diseño de bloques completos al azar. El procedimiento a seguir es común y debe ser acorde con lo planteado en la siguiente tabla. Tabla 7. Recopilación y presentación de los resultados de los tratamientos, en un diseño de bloques completos al azar. BLOQUES Tratam B1 B2 B3 B4 Y i. r 1 X T1B1 X T1B2 X T1B3 X T1B4 r 2 X T2B1 X T2B2 X T2B3 X T2B4 r 3 X T3B1 X T3B2 X T3B3 X T3B4 r 4 X T4B1 X T4B2 X T4B3 X T4B4 Y.j B1 B2 B3 B4 ANOVA para un diseño en bloques completos al azar (DBCA) (Varios autores) La metodología de análisis a emplear es el ANOVA a dos criterios de clasificación. En este caso, el análisis de varianza particiona la variabilidad total de la información en tres componentes: una primera debida al efecto de los tratamientos (Suma de Cuadrados Entre Tratamientos), la segunda a efecto de los bloques (Suma de Cuadrados de Bloques), y finalmente el Error Experimental (Suma de Cuadrados del Error = S.C. del error). En la misma forma se particionan los grados de libertad. El rechazo o no de la hipótesis nula depende del valor del estadístico F: F = (S. C. de Tratamientos / t - 1) / (S. C. del Error / (t - 1) (r - 1)) Ecuación 10 Comparación de medias de tratamiento en el diseño de bloques completos al azar (BCA) Cuando para este diseño se rechaza la hipótesis de igualdad entre los tratamientos el investigador se pregunta cual(es) de ellos son diferentes entre sí. Para averiguarlo se emplean los métodos de comparación de medias, uno de estos métodos (formulas) es el LSD diferencia mínima significativa (Ecuación 9) en donde se sustituye el numero de replicas por el numero de bloques, y también se deben cambiar los grados de libertad del error en el caso de bloques esta dado por (b-1)(tratam-1). Para K tratamientos se tienen un total de k(k-1)/2 pares de medias. 44 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO K=tratamientos b= bloques N = Total de experiencias n= numero de observaciones para cada tratamiento. Ecuación 11 El valor de t se toma de las tablas de la distribución T de Student con N-K grados de libertad del error. Ejemplo de bloques completos al azar (BCA) (Varios autores). Revisemos el apéndice 2. Lección 4: Diseño de cuadro latino El nombre de cuadrado Latino se debe a R.A. Fisher [The Arrangement of Field Experiments, J. Ministry Agric., 33: 503-513 (1926)]. Las primeras Aplicaciones fueron en el campo agronómico, especialmente en los casos de suelos con tendencias en fertilidad en dos direcciones. Diseño que contempla el control de dos factores de bloque, además del factor de tratamientos y los tres factores tienen la misma cantidad de niveles. Considerándose cuatro fuentes de variabilidad que vienen siendo los dos factores de bloque, el tratamiento y el error aleatorizado. El primer factor de bloqueo se representa en los renglones o filas, el segundo factor de bloqueo se representa en las columnas y los tratamientos se representan por letras latinas y se distribuyen en forma tal que cada tratamiento aparece sólo una vez en cada fila y una sola vez en cada columna (Latin square design). El interés se centra en un solo factor, los tratamientos, pero se imponen dos restricciones a la aleatorización en un cuadro como el ejemplo de la tabla del siguiente numeral. Formación y tabulación de los datos experimentales en un cuadrado latino. Suponga 4 tratamientos A, B, C y D, con estos tratamientos se pueden formar 4 cuadros diferentes llamadas típicas o estandar (en la primera fila y en la primera columna se tiene la misma distribución). Tabla 8. Recopilación y presentación de los resultados de los tratamientos, en cuadro latino. A B C D A B C D A B C D A B C D B A D C B C D A B D A C B A D C C D B A C D A B C A D B C D A B 45 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO D C A B D A B C D C B A D C B A De cada cuadro se obtienen 144 formas diferentes, en total se tienen 576 cuadros diferentes. Un diseño de este tipo sólo es posible cuando el número de niveles de ambas restricciones sea igual al número de niveles del tratamiento. Por ejemplo, en una granja experimental si administramos tres medicamentos (tratamientos) a tres cabras con diferentes . El orden en el que los caprinos reciben los tratamientos puede ser completamente aleatorizado (diseño por bloques) o aleatorizado bajo la condición de “equilibrio” requerida para un cuadrado latino. Designemos los tratamientos por T1 ,T2 y T 3 . Una asignación equilibrada respecto al orden de administración puede ser Arreglo de los datos en un diseño de Cuadro latino. Para facilitar el entendimiento de este diseño se debe seguir como ejemplo el recomendado por varios autores y presentado en la siguiente tabla: Tabla 9. Arreglo de los resultados de los tratamientos, en cuadro latino. BLOQUES II 1 2 3 4 … J Yi.. BLOQUES I 1 2 3 4 . . f A=Y l1l B=Y 212 C=Y 313 D=Y 414 ….. ..... F=Y f1f B=Y 221 C=Y 322 D=Y4 23 F =Y 524 A=Y 12f C=Y 331 D=Y 432 A =Y 533 F=Y 634 B=Y 23f D=Y 4411 E=Y 442 B =Y 443 A=Y 544 C=Y 34f … …. … .. …. … F=Y jJ1 A=Y 1j2 B=Y 2j3 C=Y 3j4 … … J=Y Jjf Yi..1 Yi..2 Yi..3 Yi..4 Yi..,, Yi..f Yj.. Y1.. Y2.. Yj.. Yj.. Ynj.. Yj.. <!--[if !supportMisalignedColumns]- -> La elección del cuadro latino se realiza antes de la obtención de los datos. 46 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Procedimiento estadístico para la comprobación de hipótesis en un diseño de bloques en cuadro latino. Ver apéndice 3. Lección5. Diseño en cuadro greco latino Cuando se tiene un cuarto factor de bloque a controlar activamente en el diseño de cuadro latino como por ejemplo si en el ejercicio del numeral 1.19.5 se decide considerar el sitio de realización del experimento o la procedencia de un ingrediente para el producto considerado. Este diseño se denomina cuadro greco latino (DCGL), en el cual los niveles de el nuevo factor se denotan por las letras griegas a; representándose los tratamiento con las letras latinas A, B, C y D. En el diseño en cuadrado greco-latino se superponen dos cuadrados latinos, resultando el siguiente modelo matemático: ijl k l j i ijl Y c | o ¸ t µ + + + + + = Ecuación 12 i= 1,……., l numero de tratamientos j=1,…., b numero de bloques i t = efecto debido al bloque 1 j ¸ = efecto debido al bloque 2 l o = efecto debido al tratamiento = l q cto debido al tratamiento 2 { } e 0 | o , , , l El inconveniente de este modelo es que su utilización es muy restrictiva. Además pueden no existir cuadrados greco latinos de determinadas condiciones. Formación y tabulación de los datos experimentales en un cuadrado greco latino. Tabla 10. Arreglo de los resultados de los tratamientos, en cuadro Greco-Latino. BLOQUES II Y ..k 47 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO 1 2 3 4 Yi… BLOQUES I Y i.. 1 2 3 4 . . f o A=Y l1l | B=Y 21 2 0 C=Y 313 e D=Y 41 4 | B=Y 2 2 0 C=Y 3 22 e D=Y 4 2 o A=Y 1 2f 0 C=Y 331 e D=Y 43 2 o A =Y 533 | B=Y 23f e D=Y 44 11 | B =Y 443 o A=Y 54 4 0 C=Y 34f F=Y jJ1 A=Y 1j2 B=Y 2j3 C=Y 3j4 … … J=Y Jjf Y…l Procedimiento estadístico para la comprobación de hipótesis en un diseño de bloques en cuadro greco latino. El procedimiento a seguir esta planteado en el apéndice 4. ANAVA para el diseño grecolatino. Tabla 11. ANOVA para el diseño de cuadro greco latino* FUENTES DE VARIABILIDAD SUMA DE CUADRADOS GRADOS DE LIBERTAD CUADRADOS MEDIOS Fo P-value Tratamientos Letra latin SC tratlatin k-1 CM tratalatin F tralat = CM tratlatin / CM Er P (F > Fa) Renglones SC renglo k-1 CM renglo F re = CM renglol /CM Er P(F > Fa) Columnas SC column k-1 CM column F colmn = CM column /CM P(F > Fa) 48 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Er Tratamientos Letra griega SC tratgiega k-1 CM taratgriega F tratlgrieg =CM taratgriega P (F > Fa Error SCE (k - 2)(k -1) CM Err Total SCT k 2 - 1 *Tomado de Gutierrez, H, et all. Análisis de experimentos. Capítulo Cuatro 132 SC T = SC trat + SC Bl + SC B2 + S CE Ecuación 13 y los grados de libertad correspondientes son k 2 -1 = (k -1) + (k -1) + (k -1) + (k - 2)(k -1) Ecuación 14 49 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO UNIDAD DOS: DISEÑOS FACTORIALES y 2 K Capítulo 4. Diseños Factoriales Generales En ingeniería muchos de los experimentos se llevan a cabo para estudiar los efectos producidos por dos o más factores. El desplazamiento de estos dentro de un dominio experimental es costoso además las limitaciones de tiempo obligan al experimentador a ejecutar sólo los experimentos imprescindibles. Razón por la cual los experimentadores y matemáticos idearon los diesños experimentales factoriales. Lección 1: Definiciones básicas diseño factorial. Los diseños experimentales permiten variar simultáneamente varios factores pero evitándose que se vaya en la misma dirección. Y se complementan de tal modo que la información buscada se obtiene combinando las respuestas de todos ellos. El efecto de un factor se define como el cambio en respuesta producido por un cambio en el nivel del factor. En algunos experimentos podemos encontrar que la diferencia en respuesta entre los niveles de un factor no es la misma en todos los niveles del otro factor. Cuando esto ocurre se dice que hay iteración entre los factores. En un experimento factorial se analizan todas las posibles combinaciones de los niveles de los factores en cada réplica del experimento. Por ejemplo, si el factor A tiene a niveles y el factor B tiene b niveles entonces cada replica tiene ab combinaciones posibles como muestra la figura 1. Arreglo factorial El conjunto de experimentos individuales o tratamientos que se forman al considerar las posibilidades de combinación para este diseño factorial es el mostrado en las figuras QQQQ: Lección 2: Experimento factorial o mover un factor a la vez Investigadores de todos los campos llevan a cabo experimentos con la finalidad 50 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO de descubrir algo acerca de un proceso o sistema particular.- un experimento es una prueba. El diseño experimental se define como una prueba o una serie de pruebas en las que se hacen cambios deliberados en las variables de entrada de un proceso o sistema para observar e identificar las razones de los cambios que pudieran observarse en la respuesta de salida (Montgomery, 2003). El más sencillo de los enfoques experimentales es cuando se investiga sobre un solo factor- este evalúa el efecto de un parámetro mientras lo demás se mantiene constantes-cuando hay varios factores. Este enfoque requiere de amplios conocimientos técnicos sobre lo que se va a analizar además de tener experiencia práctica. En este método tradicional solo se varia un factor cada vez -no es lo mejor pues implica más experimentos de los necesarios y se obtiene información parcial pues no muestran la interacción entre los factores; las interacciones en un experimento son corrientes y son los efectos más importantes para comprender el comportamiento de muchos sistemas. Consiste en seleccionar un punto de partida de cada factor, luego, se va moviendo el nivel de un solo factor, manteniendo los demás fijos. Posteriormente se mueve el nivel del siguiente factor y sucesivamente se va cambiando el nivel de cada factor. Esta estrategia tiene límites en el momento de evaluar la información de los efectos de los factores. De 10 datos sólo dos se usan para comparar con los otros dos. Desventajas: -La desventaja de un factor a la vez es que no se pueden observar interacciones entre factores (Montgomery, 2003). -Inicialmente se determina una combinación, y si no resulta, se cambia por otra según la experiencia. Esto puede continuar por mucho tiempo hasta llegar a una solución. -Seguidamente cuando se obtiene un resultado con beneficio en la primera prueba, ya no se realizan más pruebas para buscar una solución que dé mejores resultados (Montgomery, 2003). Observación atener en cuenta: Hay interacción cuando uno de los factores no produce el mismo efecto en la respuesta con niveles diferentes de otro factor (Montgomery, 2003). 51 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Lección 3: Diseño factorial con dos factores A X B Existe otro enfoque para trabajar con varios factores por medio de experimentación factorial. Esta estrategia consiste en variar los factores en conjunto, en lugar de uno a la vez. En el diseño se usan todas las combinaciones de los niveles de los factores. Por ejemplo, un diseño factorial AxB es un diseño de dos factores, cada uno con dos niveles (Montgomery,2003). Ver figura Q Figura 5.Representaciòn de un experimento factorial Figura 6.Un experimento factorial 52 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Hipótesis a probar H 0 : Efecto A = 0 Ha: Efecto A # 0 H 0 : Efecto B = 0 Ha: Efecto B # 0 H 0 : Efecto AB = 0 Ha: Efecto AB # 0 Si efecto A= Si efecto B= Las hipótesis también se pueden plantear de la siguiente manera: H 0 : = 0 H A : para algún i H 0 : = 0 H B : H 0 : H AB : para algún ij Hipótesis que se prueban con la técnica de análisis de varianza (conocida). Procedimiento estadístico para la comprobación de una hipótesis en un diseño factorial El análisis de varianza se calcula de una manera similar a los primeros numerales del presente capitulo. La ecuación fundamental de ANOVA está dada por la suma de los cuadrados y se expresa de la siguiente manera teniendo el factor A con a niveles y el factor B con b niveles: 53 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Calculo de la suma de cuadrados del error. SSC T = SSC A + SSC B + SSC AB + SSC E Ecuación 15 Calculo de la suma de cuadrados del error SSC E = SSC T - SSC A -SSC B - SSC AB Ecuación 16 Suma de cuadrados totales: Ecuaciones 17 a 19 Es conveniente obtener la suma de los cuadrados de la interacción, SS AB , en dos fases. Primero, se calcula la suma de cuadrados entre los totales de las celdas ab que se conoce como la suma de cuadrados debido a "subtotales": Ecuación 20 Esta suma de cuadrados también contiene SSC A y SSC B . Por lo tanto, el segundo paso es calcular la suma de cuadrados de la interacción como sigue: SSC AB = SSC Subtotales - SSC A -SSC B Ecuación 21 o SSC E = SSC T - SS Subtotales ANOVA para el diseño factorial (a x b) o de dos factores Tabla 12. ANOVA para el diseño factorial a x b 54 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Suma de cuadrados Grados de libertad Cuadrados medios Fo p-valor EFECTO A SC A a-1 CM A Fo = CM TRAT / C ME P(F > Fo) EFECTO B SC B b-1 CM B Fo = CM B / C ME P(F > Fo) EFECTO AB SC AB (a -l)(b -1) CM TRAT Error SC E ab(n-1) CM E Total SC T abn-1 CM TRAT Modelo estadístico para un diseño factorial Cualquier observación en el diseño factorial se puede representar por el modelo; Ecuación 22 i= 1,……., a numero de tratamientos j=1,…., b numero de bloques k= 1,2,..n = media general, también denominada = efecto debido al i-esimo nivel del factor A, también denominada = efecto debido al j-esimo nivel del factor B, también denominada . = representa al efecto de interacción en la combinación ij, también denominada . = es el error aleatorio que supone una distribución con media cero y varianza constante Estando el modelo de regresión descrito por : Ecuación 23 Lección 4. Ventajas y desventajas de los Experimentos Factoriales Podemos resaltar entre varias las siguientes: 55 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO 1. Economía en el material experimental pues se obtiene información sobre varios factores sin incrementar el tamaño del experimento. 2. Permiten el estudio de la interacción, o sea determinan el grado y la forma en la cual se modifica el efecto de un factor por los niveles de otro factor Desventajas de los diseños factoriales Una desventaja de los experimentos factoriales es que requieren un gran número de tratamientos, especialmente cuando se tienen muchos factores o muchos niveles de un mismo factor. Este hecho tiene los siguientes efectos: 1. Si se desea usar bloques completos es difícil encontrar grupos de unidades experimentales homogéneas para aplicar todos los tratamientos. 2. Se aumenta el costo del experimento al tener muchas unidades experimentales; esto se minimiza usando factoriales fraccionados donde se prueba una sola parte de todo el conjunto de tratamientos. Los experimentos factoriales se pueden ejecutar bajo cualquier tipo de diseño de control de error o un sub muestreo o con covariables. En este modulo sólo se presentaran análisis de experimentos factoriales de dos factores bajo un DCA y o DBCA. Lección 5. Ejemplo de un diseño factorial solucionado con Stat Graphics Se corre un diseño factorial 3x2 con 2 replicas para investigar el encogimiento de un producto después del proceso de estandarizado. Los factores investigados son. A: Temperatura de la bodega de almacenamiento ( tres niveles, T1, T2 y T3) y contenido del preservante (material de curado) a dos niveles, B1 y B2. Los datos obtenidos se muestran en la tabla siguiente: - Hipótesis de investigación: la temperatura y los aditamentos influyen en el tamaño final del producto. - Diseño del experimento: una masa bien homogénea para la confección del producto se dividen en seis porciones iguales y a cada una de ellas se les mezcla el porcentaje del ingrediente seleccionado. Tabla 13. Resultados del ensayo NOVA para el diseño factorial a x b Temperatura T 1 T 2 T 3 56 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Empaque B 1 3,9 4,2 4,3 3.81 3.72 3.84 4 3,8 3,4 B 2 3,5 3,8 4,0 3.37 3.50 3,6 3,9 4,1 4,3 ** Elabore el ANAVA para este proceso y socialícelo con los compañeros en el grupo de curso. Stat Graphics Diligenciamos la tabla QQQ zamos la suma por fila y por columnas para facilidad de los cálculos. Calculando la suma de cuadrados de los efectos SSC T , SSC A, , SSC B , SSC AB Tabla 14. ANOVA para el ejemplo de diseño factorial a x b Suma de cuadrados Ecuac Grados de libertad Ecuac Cuadrados medios Ecuac Fo Ecuac p-value EFECTO A EFECTO B EFECTO AB Error Total * Que conclusiones sacarías? 57 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO U-2- Capitulo dos: Diseños Factoriales 2 K Lección 1: Codificación de variables La codificación consiste en asignar valores numéricos o alfanuméricos (códigos) a cada una de las variables con el fin de facilitar el tratamiento de los datos. Los niveles de los factores para el diseño factorial se pueden codificar con los símbolos +1 ( nivel superior) y -1 ( nivel inferior); para proporcionar un marco de trabajo uniforme y apropiado para investigar los efectos de los factores (variables) en cualquier región experimental en la que los valores reales de los factores dependen de la diferencia entre los valores altos y bajos. Ecuación 24 D iferencia = ½ (X M – X n ) Ecuación 65 (X M – X n ) = diferencia entre los valores máximo y mínimo. = el valor en el experimento = el valor medio en el experimento Lección 2: Diseño factorial 2 K Definiciones Los diseños factoriales 2 k son diseños en los que se trabaja con k factores, todos ellos con dos niveles (se suelen denotar + y -). Estos diseños son adecuados para tratar el tipo de problemas descritos porque permiten trabajar con un número elevado de factores y son válidos para estrategias secuenciales. En este diseño se consideran solo dos factores, A y B, cada uno con dos niveles. Se acostumbra denominar el nivel inferior de los factores como -1 o también A 1 58 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Y el nivel inferior por 1 o también A 2 . Es la estrategia más adecuada para conocer simultáneamente qué efecto tienen k factores sobre una respuesta y descubrir si interaccionan entre ellos. Para la notación utilizada k = numero de factores. Y 2 (báse) es el número de niveles seleccionados. Las interacciones suelen ser muy corrientes y a veces son los efectos más importantes, por lo que conocerlas es imprescindible para comprender el comportamiento de muchos sistemas. Éste describe los experimentos más adecuados para conocer simultáneamente qué efecto tienen k factores sobre una respuesta y descubrir si interaccionan entre ellos. Al no haber factores correlacionados se evitan experimentos redundantes. Además, los experimentos se complementan de tal modo que la información buscada se obtiene combinando las respuestas de todos ellos. Efecto de un factor en un diseño 2 2 La influencia que tiene un factor sobre la variable de respuesta como el cambio en la respuesta cuando un factor cambia de su nivel inferior a su nivel superior, promediado sobre los demás factores. Procedimiento Calculo del efecto de un factor en un diseño 2 2 La influencia que tiene un factor sobre la variable de respuesta como el cambio en la respuesta cuando un factor cambia de su nivel inferior a su nivel superior, promediado sobre los demás factores Tabla 15. Signos algebraicos para calcular los efectos en un diseño 2 2 PRUEBA A B AXB Combinación de los tratamientos REPETICIONES PROMEDIO Y 1 Y 2 Y .. Y n 1 - - + (1) 2 + - - a 3 - + - b 59 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO 4 + + + ab a) El efecto promedio de A es definido como: A = 1/2n {[ab-b]+[a-(1)]} A = 1/2n [ab + a – b -(1)] Ecuación 25 b) El efecto promedio de B es definido como: B = 1/2n {[ab-a]+[b-(1)]} B = 1/2n {[ab + b – a - (1)]} Ecuación 26 c) El efecto de interacción de AB es definido como: AB = 1/2n {[ab-b]-[a-(1)]} AB = 1/2n [ab + (1)-a-b] Ecuación 27 n = número de repeticiones o replicas d) la suma de cuadrados de los efectos se calcula a partir de los contrastes y se definen como: SS= [Efecto] 2 [2 k-2 ]n Ecuación 28 También puede ser calculada d 1 ) Para el factor A este se calcula con: Ecuación 29 d2. De B Ecuación 30 d3. De AB Ecuación 31 d4. Calculo de la suma de cuadrados totales 60 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Ecuación 32 N = número de pruebas d5. Calculo de la suma de cuadrados del error SC E = SC T -SC A -SC B -SC AB Ecuación 33 ANOVA para un diseño factorial 2 2 Con los productos de las ecuaciones del numeral anterior debemos construir la siguiente tabla. Tabla 16. ANOVA para un diseño factorial 2 2 Suma de cuadrados Grados de libertad Cuadrados medios Fo p-value EFECTO A SC A 1 CM A Fo = CM A / C ME P(F > Fo) EFECTO B SC B 1 CM B Fo = CM B / C ME P(F > Fo) EFECTO AB SC AB 1 CM AB Fo = CM AB/ C ME P(F > Fo) Error SC E 4(n-1) CM E Total SC T n2 2 -1 Ejemplo de un diseño experimental factorial 2 2 Los pasos a seguir en la resolución de un ejercicio o situación de ingeniería en donde se aplique un diseño experimental son los siguientes: 1- Planteamiento del problema Se quiere comprobar el rendimiento de una reacción con un nuevo catalizador. Por tanto, se pretende determinar en qué grado la temperatura y el tiempo influyen en el rendimiento de reacción y cómo este se puede variar para mejorarlo. 2- Factores y dominio experimental Para lo cual acorde con la experiencia previa, la revisión bibliografía o las necesidades de la experimentación (criterios de rentabilidad, limitaciones 61 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO experimentales), se debe escoger qué factores interesa estudiar y qué valores pueden tomar (el dominio experimental). La tabla 35 muestra los dos factores escogidos. Como ambos factores son continuos, su dominio experimental se expresa con los valores máximo y mínimo que pueden tomar. Para lo cual se acordó que el tiempo de reacción no debería ser inferior a 8 horas para que el proceso fuera rentable, y superior a 6 horas para asegurar un buen rendimiento; además el rango de temperatura de trabajo debe ser superior a los (40ºC) pero sin exceder los 80ºC. La tabla 35 también muestra la notación codificada más habitual para factores continuos: se asigna el valor –1 al extremo inferior del dominio experimental y el valor +1 al extremo superior 2. Para simplificar a menudo sólo se indican – y +. Es necesario definir la correspondencia entre variables reales y codificadas porque el diseño de experimentos describe la experimentación óptima empleando variables codificadas (X1, X2,...) sin dimensión. De este modo las herramientas matemáticas y estadísticas son generales y se pueden aplicar a cada problema concreto. La experimentación más económica (mínimo número de experimentos) es aquella en la que cada factor toma sólo dos valores (niveles). Y la que proporcionará la información con menor incertidumbre es aquella en la que estos valores son los extremos del dominio experimental, –1 y +1. Esta misma tabla 17 muestra la matriz de experimentos que se obtiene combinando los dos niveles de los dos factores. Cada fila es un experimento y cada columna es un factor estudiado. Tabla 17. Respuestas para el ejemplo de diseño factorial 2 2 Matriz de experimentos Plan de experimentación Respuesta (% rendimiento) x1 x2 Tiempo (h) Temperatura(ºC) Corrida 1 Corrida 2 Corrida 2 1 - - 6 40 49 48 49 2 + - 8 40 54 58 55 3 - + 6 60 70 72 73 4 + + 8 60 78 55 56 62 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Tabla 18. Matriz para el ejemplo de diseño factorial 2 2 PRUEBA A x1 B x2 AXB x1 x2 Combinación de los tratamientos Repeticiones Y PROMEDIO Y 1 Y 2 Y 3 1 - - + (1) 49 48 49 48,66666667 2 + - - a 54 58 55 55,66666667 3 - + - b 70 72 73 71,66666667 4 + + + ab 78 55 56 63 Pasos a seguir a) El efecto promedio de A es definido como: A = 1/2n[ ab+a – b -(1)] A = 1/2n[ ab+a – b -(1)] A= 7,666 b) El efecto promedio de B es definido como: B = 1/2n{[ ab + b – a - (1)]} B = 13 c) El efecto de interacción de AB es definido como: AB = 1/2n{[ ab-b]-[a-(1)]} AB = 1/2n[ ab+(1)-a-b] = AB = -9 n = número de repeticiones o replicas Tabla 19. Análisis de varianza para el ejemplo de diseño factorial 2 2 Suma de cuadrados Grados de libertad Cuadrados medios Fo p-value EFECTO A 176,3333333 176,3333333 0,032713984 P(F > Fo) 63 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO EFECTO B 507 1 507 0,094060433 P(F > Fo) EFECTO AB 264,4533907 1 264,4533907 0,049062328 P(F > Fo) Error 43121,21328 8 5390,151659 Total SC T 11 Lección 3: Diseños factoriales 2 3 Definiciones Diseño factorial de tres factores con dos niveles cada uno. Un diseño factorial de 2 3 involucra a tres factores A,B,C, todos con dos niveles sus combinaciones se muestran en la tabla siguiente. Si tenemos un factorial con 3 factores cada uno con 2 niveles, las posibles combinaciones de este experimento forman los vértices de un cubo como se muestra en la figura 5. Al variar un factor a la vez solo se pueden explorar la mitad de las posibles combinaciones. En la figura 4 podemos notar los espacios vacíos de las combinaciones sin explorar. Efecto de un factor en un diseño 2 3 Es la influencia que tiene un factor sobre la variable de respuesta (cambio en la respuesta) cuando un factor cambia de su nivel inferior a su nivel superior, promediado sobre los demás factores. Discusión El efecto de un factor en un diseño 2 3 , se calcula como se explica en las tablas siguientes: Tabla 20. Combinación de los tratamientos para un diseño 2 3 CORRIDA A B C AXB AXC BXC AXBXC COMBINACIÓN DE TRATAMIENTOS 1 - - - + + + - (1) 64 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO 2 + - - - - + + a 3 - + - - + - + b 4 + + + + - - - ab 5 - - + + - - + c 6 + - + - + - - ac 7 - + + - - + - bc 8 + + + + + + + abc Tabla 21. Signos algebraicos para calcular los efectos en un diseño 2 3 COMBINACIÓN DE LOS TRATAMIENTOS EFECTO FACTORIAL I A B C AXB AXC BXC AXBXC (1) + - - - + + + - a + + - - - - + + b + - + - - + - + ab + + + - + - - - c + - - + + - - + ac + + - + - + - - bc + - + + - - + - abc + + + + + + + + a) El efecto promedio de A es definido como: a b ab c ac bc abc A = 1/2n{[-(1)+a -b+ab-c+ac-bc+abc]} Ecuación 34 A = 1/2n[ a+ab+abc – b - bc -(1)] Ecuación 35 b) El efecto promedio de B es definido como: B = 1/2n{[-(1)-a+b+ab-c-ac+bc+abc]} B = 1/2n{[ ab + b+bc+abc – a-c-ac - (1)]} Ecuación 36 c) El efecto de interaccion de AB es definido como: AB = 1/2n{[(1)-a-b+ab+c-ac-bc+abc]} 65 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO AB = 1/2n{[(1) +abc+ab+c -a-b-ac-bc]} Ecuación 37 n = numero de repeticiones o replicas d) El efecto de interaccion de AC es definido como: AC = 1/2n{[(1)-a+b-ab-c+ac-bc+abc]} AC = 1/2n{[(1) +b+ac+abc – a -ab-c-bc]} Ecuación 38 n = numero de repeticiones o replicas e) El efecto de interaccion de ABC es definido como: ABC = 1/2n{[(-1)+a+b-ab+c-ac-bc+abc]} ABC = 1/2n{[ a +b+c+abc – (1) -ab-ac-bc]} Ecuación 39 n = numero de repeticiones o replicas f) la suma de cuadrados es definida como: SS= [Efecto] 2 [2 k-2 ]n Ecuación 40 También pueden ser calculados. Calculo de la suma de cuadrados totales Ecuación 98.1 g) Calculo de la suma de cuadrados del error. SS E = SS T -SS A -SS B -SS AB Ecuación 41 h) Analisis de residuos Ecuación 42 Análisis de varianza para un diseño factorial 2 3 Tabla 22. Calculo del Análisis de varianza para un diseño factorial 2 3 66 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Suma de cuadrados Grados de libertad Cuadrados medios Fo p-valor EFECTO A SC A 1 CM A Fo = CM A / C ME P(F > Fo) EFECTO B SC B 1 CM B Fo = CM B / C ME P(F > Fo) EFECTO C SC C 1 CM C Fo = CM C / C ME P(F > Fo) EFECTO AB SC AB 1 CM AB Fo = CM AB/ C ME P(F > Fo) EFECTO AC SC AC 1 CM AC Fo = CM AC / C ME P(F > Fo) EFECTO BC SC BC 1 CM BC Fo = CM BC / C ME P(F > Fo) EFECTO ABC SC ABC 1 CM ABC Fo = CM ABC / C ME P(F > Fo) Error SC E 2 3 (n-1) CM E Total SC T n2 3 -1 Coeficientes de determinación Estos coeficientes miden la proporción o el coeficiente de variabilidad en los datos experimentales que es explicada por el modelo considerado. Ecuación 43 Ecuación 44 Lección 4. Solución de un diseño factorial 2 3 con Stat Graphics En una empresa productora de bebidas achocolatadas ha tenido problemas con la viscosidad de cierta bebida de chocolate. Se cree que tres ingredientes que se agregan en pequeñas cantidades son con los que se puede resolver este 67 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO problema, por lo que es necesario explorar la situación; para ello se corre un experimento 2 3 con dos réplicas. Con los resultados obtenidos: Tabla 23. Datos de la viscosidad de la bebida desarrollada. INGREDIENTE A INGREDIENTE B INGREDIENTE C VISCOSIDAD y 1 y 2 Y m -1 -1 -1 13,3 13,7 13,4985184 +1 -1 -1 14,7 14,4 14,5492268 -1 +1 -1 14,6 14,5 14,5499141 +1 +1 -1 14,3 14,1 14,1996479 -1 -1 +1 16,9 17,2 17,0493402 +1 -1 +1 15,5 15,4 15,4499191 -1 +1 +1 17,0 17,1 17,0499267 +1 +1 +1 18,9 19,0 18,949934 Tabla 24. Promedio y factores calculados para el ejemplo de la viscosidad Promedio 15,6621 +/- 0,61255 Factor A 0,250257 +/- 1,2251 Factor B 1,0506 +/- 1,2251 Factor C 2,92545 +/- 1,2251 Factor AB 0,524613 +/- 1,2251 Factor AC -0,099964 +/- 1,2251 Factor BC 0,699696 +/- 1,2251 Tabla 25. Análisis de la varianza para la viscosidad de la bebida desarrollada. Suma de cuadrados Grados de libertad Cuadrados medios F p Factor_A 0,125257 1 0,125257 0,04 0,8717 Factor_B 2,20754 1 2,20754 0,74 0,5487 Factor_C 17,1166 1 17,1166 5,70 0,2525 AB 0,550439 1 0,550439 0,18 0,7424 AC 0,0199856 1 0,0199856 0,01 0,9482 BC 0,979149 1 0,979149 0,33 0,6696 68 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Total error 3,00174 1 3,00174 Total (corr.) 24,0007 1 Para este caso hay cero efectos que sean de valor p menor que 0,05, lo cual nos indica que son significativamente diferentes de cero al nivel de confidencia del 95%. Tabla 44. Coeficientes de regresión de la ecuación de los datos de viscosidad de la bebida desarrollada en el ejemplo anterior. Constante = 15,6621 Factor_A = 0,125129 Factor_B = 0,525302 Factor_C = 1,46273 AB = 0,262307 AC = -0,049982 BC = 0,349848 R 2 = 87,4931 La ecuación ajustada para el modelo es VISCOSIDAD = 15,6621 + 0,125129*Factor_A + 0,525302*Factor_B + 1,46273*Factor_C + 0,262307*Factor_A*Factor_B - Estando los valores de las variables especificados en su forma original. 0,049982*Factor_A*Factor_C + 0,349848*Factor_B*Factor_C. Ecuación 37. R-cuadrado (ajustado para los grados de libertad) = 12,4516 porciento Error estandar = 1,73255 Media absoluta del error = 0,61255 Tabla 45. Valores para el r 2 , el error estándar para el ejemplo de la viscosidad de la bebida desarrollada. El valor estadístico de R 2 indica que el modelo ajustado explica el 87,4931% de la variabilidad de la viscosidad, es mas apropiado para comparar modelos con diferente numero de variables independientes es de 12,455% El estimativo del error estándar muestra que la desviación estándar del error de los residuos es de 1,73255. 69 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO La media absoluta de error (MAE) fue de 0,61255 el cual es el valor promedio de los residuos. Tabla 26. Resultados estimados para los datos de viscosidad con la ecuación de regresión encontrada para el ejemplo anterior, utilizando el programa Stat Graphics. Datos Valor observado Valor fijado Lower 95,0% CL for Mean Upper 95,0% CL 1 13,4985 14,1111 -6,48132 34,7035 2 14,5492 13,9367 -6,65571 34,5291 3 14,5499 13,9374 -6,65502 34,5298 4 14,1996 14,8122 -5,78019 35,4046 5 17,0493 16,4368 -4,1556 37,0292 6 15,4499 16,0625 -4,52992 36,6549 7 17,0499 17,6625 -2,92991 38,2549 8 18,9499 18,3374 -2,255 38,9298 Presentación de resultados. La interpretación de los resultados sugerimos realizarlos en el siguiente orden y las siguientes recomendaciones: 1) Valor medio 2) Efectos principales 3) Efectos de interacción de dos factores 4) No olvidar que existe interacción cuando el efecto de un factor es diferente a distintos niveles de otro(s) factor(es). Esto se puede comprender fácilmente si evaluamos el efecto de cada factor por pares de experimentos. 5) Efecto de interacción de tres factores Por ejemplo para el ejercicio de la viscosidad se deberían presentar las siguientes graficas. Figura 16. Efectos medios para el ejemplo de la viscosidad. 70 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Lección 5. Otros diseños experimentales y diseño de parcelas divididas Para la temática se consultaron a Padrón, 1996; Montgomery, 2000 y Gil, 2001. El diseño experimental de parcelas divididas es un factorial conducido de tal manera que la unidad experimental con respecto a uno o más factores es una subunidad de la unidad experimental con respecto a otros factores. Los experimentos con parcelas divididas son frecuentemente usados por necesidad cuando un factor debe ser aplicado a una unidad experimental extensa, mientras que otros factores son más apropiados aplicarlos a las subunidades-provenientes de la primera. También este diseño es utilizado por la conveniencia o facilidad de aplicar diferentes factores a diferentes unidades con tamaños distintos. El diseño de parcelas divididas también puede ser usado para incrementar la precisión del efecto estimado por la aplicación de un factor a las subunidades. En este diseño se utilizan bloques, un mismo conjunto de tratamientos entran en cada bloque, y ese conjunto da origen a otro conjunto de tratamientos. El primer conjunto se le denomina tratamientos principales o parcelas completas o parcelas principales, el segundo conjunto se le denomina tratamientos secundarios o subparcelas o parcelas divididas. Es un diseño comúnmente utilizado cuando se tienen partes grandes de cierta materia prima (parcela principal) y cada parte grande se divide en partes pequeñas (subparcelas). El término tiene antecedentes agrícolas porque las parcelas grandes eran grandes extensiones de tierra y las parcelas pequeñas eran pequeñas áreas de tierra. Los bloques generalmente corresponden a repeticiones del experimento o a distintos entornos para llevarlo a cabo. Este estudio requiere de modelos de análisis de varianza con dos o más tipos de errores experimentales y modelos de regresión. En muchos casos, estos procedimientos modificados producen los resultados apropiados. Sin embargo, estos métodos son frecuentemente incómodos y confusos de utilizar. En algunos casos, y más importante, estos procedimientos para modelos de efectos fijos no pueden ser modificados para producir la estadística apropiada para los objetivos de la investigación (Littell et al., 1991). Error experimental: variación en respuesta bajo las mismas condiciones de prueba. También se denomina error residual. CAPÍTULO 3. Regresión lineal y superficies de respuesta Lección 1. Introducción y el significado de la regresión y suposiciones básicas 71 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO El análisis de regresión es útil para averiguar la forma probable de la relación entre las variables y cuando se utiliza éste método, el objetivo final generalmente consiste en predecir o estimar el valor de una variable que corresponde a un valor determinado de otra. Con base a los resultados obtenidos a partir de los análisis realizados a la muestra representativa, extraída de una población determinada, el investigador estará en capacidad de comprender y conocer minuciosamente la naturaleza y comportamiento de la población en la que se encuentra interesado. Regresión lineal simple. (2, 3, 7 y varios autores) El análisis de regresión es útil para averiguar la forma probable de la relación entre las variables y cuando se utiliza éste método, el objetivo final generalmente consiste en predecir o estimar el valor de una variable que corresponde a un valor determinado de otra. Por otro lado, el análisis de correlación, se refiere a la medición de la intensidad existente entre las relaciones de las variables. Cuando se calculan los coeficientes de correlación de un conjunto de datos, el interés se centra en el grado de compatibilidad existente entre las variables que integran el problema. Tabla 27. Ecuaciones para el estimativo de una regresión lineal simple bX a Y + = Ecuación 45 ] [ ]} [ { 2 2 n X X n Y X XY b ¿ ¿ ¿ ¿ ¿ ÷ ÷ = Ecuación 46 n X b Y a ¿ ¿ ÷ = Ecuación 47 | ) || n Y Y n X X n Y X XY r ¿ ¿ ¿ ¿ ¿ ¿ ¿ ÷ ÷ ÷ = 2 2 [ ]} [ { Ecuación 48 También es representada como c | | + + = X Y 1 0 Ecuación 49 En donde cion er a sec int 0 = = | pendiente b = = 1 | aleatoria Variable error el en cambio . = c 72 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Lección 2. Coeficientes de correlación. Una correlación es el grado de relación entre dos o más variables que busca determinar en que medida una línea u otra ecuación describe o explica dicha relación. Se encuentran dentro de un rango que va desde -1 hasta 1 rango que explica el alcance y la valoración de dicho coeficiente y la dirección de la correlación. Tabla 49. Tabla 28. Grado de asociación de los coeficientes de correlación para un conjunto de datos. (varios autores) COEFICIENTE DE CORRELACIÓN INTERPRETACIÓN -1.00 Correlación negativa perfecta - 0.95 Correlación negativa fuerte - 0.50 Correlación negativa moderada - 0.10 Correlación negativa débil 0.0 No existe ninguna correlación + 0.10 Correlación positiva débil + 0.50 Correlación positiva moderada + 0.95 Correlación positiva fuerte + 1.00 Correlación positiva perfecta El grado de asociación, mientras más cerca este de la unidad, en una u otra dirección, mayor es la correlación. Generalmente en la mayoría de los trabajos de investigación se busca establecer una correlación lineal, ya sea positiva o negativa, no se puede considerar que todas las relaciones entre dos variables (X y Y) forman una línea recta. (ver capitulo siguiente). Existen muchas correlaciones de carácter curvilíneo que indican que una variable aumenta a medida que la otra se incrementa hasta que la relación misma se invierte, de tal manera que una variable decrece finalmente mientras que la otra sigue en aumento, es decir, que la relación entre X y Y que en un principio es positiva se convierte en negativa, o aquella que, en un comienzo es negativa se convierte en positiva; por ejemplo en una reacción química o en una reacción bioquímica. Lección 3. Transformación de datos 73 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Regresión lineal múltiple. El análisis de regresión lineal múltiple consiste en generar modelos de regresión con más de una variable independiente (X1, X2, X3…..); el modelo de regresión lineal múltiple es representado por: c | | | | + + + + + = k k X X X Y ........ 2 2 1 1 0 Ecuación 50 k = numero de variables (Xs) Tabla 29. Modelos de regresión lineal simple ECUACIÓN MODELO bX a e Y + = Exponencial Ecuación 51 ) ( 1 bX a Y + = El reciproco Ecuación 52 ) b aX Y = Multiplicativo Ecuación 53 ) ln(X b a Y + = Logarítmico Ecuación 54 ) (X b a Y + = Reciproco Ecuación 55 Transformación de datos. (3, 7, 8, 27 y varios autores) En la práctica muchos de los procesos experimentales no siguen una distribución normal con varianza constante y aunque el procedimiento de ANOVA es robusto y admite desviaciones moderadas al realizar un análisis estadístico con resultados que no cumplen con los supuestos acerca del modelo estadístico, se puede llegar a una conclusión y decisión errónea. Para lo cual mediante una transformación adecuada puede conseguirse que una variable que no se distribuye normalmente pase a tener una distribución casi normal; por ejemplo un cambio de escala puede variar la media y la varianza de la variable así como su relación con respecto a otras variables al igual que la forma de la distribución de una variable cambia con la escala. Las poblaciones con varianzas desiguales pueden convertirse en varianzas homogéneas mediante una transformación apropiada. Las transformaciones más usadas se presentan en la tabla siguiente: Tabla 30. Transformaciones usadas para datos 74 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Transformación apropiada Tipo de transformación ) ( log ) ln( 10 ' ' Y Y O Y Y = = Ecuac 56 Transformación logarítmica 2 / 1 ' ÷ = Y Y Ecuación 57 Transformación de la raíz cuadrada 1 ' ÷ = Y Y Ecuación 58 Transformación del reciproco Lección 4. Correlación múltiple y ANCOVA Si en la ecuación anterior es necesaria más de una variable independiente(X1, X 2 ...) se aplica el término de "correlación múltiple". Los cálculos para este tipo de correlación son más dispendiosos y la interpretación de sus resultados más complejo. La inclusión de variables adicionales incrementa los datos necesarios y puede también adicionarse un considerable costo al estudio. Las razones principales para cambiar el análisis de una á dos o más variables independientes son: Existe una relación lógica, y una sola variable independiente no proporciona un coeficiente de correlación suficientemente satisfactorio. El coeficiente de correlación múltiple representa la proporción de variación en Y que explica el conjunto de variables explicativas seleccionadas. (3, 7, 8, 27 y varios autores) Análisis de Covarianza-ANCOVA El análisis de covarianza es un procedimiento muy importante en experimentación, pero lamentablemente no se usa con frecuencia. Utiliza el análisis de varianza y el de regresión para eliminar la variabilidad que existe en la variable independiente X; también ajusta medias de tratamiento y así estima mucho mejor el efecto de la variable independiente X sobre la variable dependiente Y. La variable independiente X es una observación hecha en cada unidad experimental antes de aplicar los tratamientos, e indica hasta cierto grado la respuesta final y de la unidad experimental. Los objetivos del análisis de covarianza son: 75 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO a) Disminuir el error experimental con el respectivo aumento en precisión del experimento. b) Ajustar los promedios de los tratamientos. c) Interpretar mejor los resultados en el experimento, especialmente en lo relacionado con la naturaleza de los efectos de los tratamientos. d) Estimar el valor de las unidades perdidas en los experimentos. Lección 5. Superficies de respuesta Los diseños factoriales son útiles para el tamizado de factores- para identificar los factores más importantes que afectan el desempeño de un proceso o caracterización del proceso (Montgomery, 2004). Una vez que se ha identificado el subconjunto adecuado de variables del proceso, generalmente el paso siguiente es la optimización del proceso, que implica encontrar el conjunto de condiciones de operación de las variables del proceso que producen el mejor desempeño del mismo (Cochran & Cox, 2001). Puede resultar útil ajustar una curva de respuesta a los niveles de un factor cuantitativo para que el investigador cuente con una ecuación que relacione la respuesta con el factor. Esta ecuación pude utilizarse para hacer interpolaciones, es decir, para predecir la respuesta en niveles intermedios entre los factores, respecto de los que se utilizaron realmente en el experimento. Cuando al menos dos de los factores son cuantitativos, puede ajustarse una superficie de respuesta para predecir con varias combinaciones de los factores de diseño (Christensen, 1990). En este sentido cabe destacar la metodología de superficies de respuesta (RSM), como el enfoque de optimización más exitoso y generalizado. En general, se usan métodos de regresión lineal para ajustar estos modelos a los datos experimentales (Cox, 1978). Además, los efectos de los factores cuantitativos pueden representarse con efectos polinomiales con un solo grado de libertad. De manera similar, es posible hacer la partición de las interacciones de factores cuantitativos en componentes de interacción con un solo grado de libertad. La superficie de respuesta se usa como guía para variar gradualmente los factores controlables que afectan la respuesta de manera tal que se mejore el valor de la respuesta. Una vez que el cambio de los factores controlables no origine una mejora predecible en la variable de la respuesta, se puede aplicar un método de 76 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO experimentación más sofisticado para encontrar la superficie de respuesta operativa final del proceso de interés. Supongamos que un investigador desea encontrar los niveles de la variable x1 y de x2 que maximicen el rendimiento Y de un proceso. El rendimiento del proceso es una función de los niveles de la variable x1 y x2: Y=f(x1,x2)+épsilon Donde epsilon representa el ruido o error observado en la respuesta Y. Si el valor de la respuesta se denota por E(Y)=f(x1,x2) entonces la superficie representada por E(Y)=f(x1,x2)se llama superficie de respuesta. Método de Superficie de respuesta (RSM): es la gráfica de la respuesta del sistema vs los factores del sistema. RSM emplea el diseño experimental para descubrir la forma de la superficie de respuesta y aprovecha los conceptos geométricos Variable de respuesta: Variable que muestra los resultados observados de un tratamiento experimental, es la variable dependiente Modelo de Superficie de Respuesta para un diseño 2 k Un aspecto interesante de los diseños factoriales 2 k es que si se codifican las variables al intervalo [-1,1] entonces, se puede obtener el modelo de regresión correspondiente con relativa facilidad (Montgomery & Vining, 2002). Consideremos por ejemplo el diseño 2 2 . En este diseño se tienen dos efectos principales, A y B y la interacción AB. El modelo de regresión correspondiste es: 2 1 12 2 2 1 1 0 x x x x y | | | | + + + = 59 Donde x 1 representa el factor A, x 2 representa el factor B, y el producto entre x 1 y x 2 representa la interacción entre A y B. Los parámetros del modelo de regresión, | 1 , | 2 , | 12 se pueden demostrar que son iguales a la mitad de las estimaciones de los efectos correspondientes, mientras que | 0 es igual a la gran media. En general, se tiene que: 2 ANOVA en Efecto Regresión de modelo el en Parámetro Cualquier = 60 Y nes observacio las todas de promedio promedio gran 0 = = | ¡Error! No hay texto con el estilo especificado en el documento.1 Se debe recordar que los valores de las variables en el modelo de regresión están codificadas al intervalo [-1, 1]. Esto quiere decir que si se quiere expresar el modelo en las unidades en las que realmente se mide la variable se debe hacer la 77 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO transformación correspondiste. Esta transformación se ilustra en la figura siguiente: Figura 7. Transformación usada para encontrar el modelo de regresión en un diseño 2 k Esto nos lleva a la ecuación de transformación- revisemos numeral anterior: Bajo Alto Alto Bajo x x real cod ÷ ÷ ÷ = 2 . 62 La cual se puede utilizar para obtener el modelo de regresión en las unidades originales en las que se miden los factores de interés. Esto transforma la ecuación ¡Error! No se encuentra el origen de la referencia. en el modelo: | | . | \ | ÷ ÷ ÷ | | . | \ | ÷ ÷ ÷ + + | | . | \ | ÷ ÷ ÷ + | | . | \ | ÷ ÷ ÷ + = Bajo Alto Alto Bajo B Bajo Alto Alto Bajo A Bajo Alto Alto Bajo B Bajo Alto Alto Bajo A B B B B x A A A A x B B B B x A A A A x y 2 2 2 2 12 2 1 0 | | | | 63 Sin embargo, siempre se prefiere trabajar el modelo con las variables codificadas (en el intervalo [-1,1]) Si los factores son cuantitativos, el modelo de regresión, se puede utilizar, con toda confianza, para predecir el valor de la variable respuesta para cualquier punto entre -1 y 1 (si el factor o variable está codificado) o desde el valor bajo al alto si la variable o factor no está codificado. Es decir, el modelo de regresión se puede Factor en escala real Bajo Alto +1 -1 Factor en escala normalizada 78 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO utilizar para interpolar cualquier valor intermedio de la variable respuesta sin problemas pero no se debe utilizar para extrapolar. Adición de puntos centrales en un diseño 2 k Un aspecto muy importante en el empleo de diseños factoriales de dos niveles es la hipótesis de linealidad en los efectos de los factores. Claro está que la linealidad perfecta es innecesaria, y el sistema 2 k trabaja muy bien aun cuando la suposición de linealidad es sólo aproximada. Sin embargo, existe un método para replicar ciertos puntos en el diseño 2 k factorial que proporciona protección contra la curvatura y permite una estimación independiente del error que ha de obtenerse. El método consiste en añadir puntos centrales al diseño 2 k . Éstos coinciden de n C réplicas de las corridas en el punto x i = 0 (i= 1, 2,…, k). Una razón importante para añadir réplicas de las corridas en el centro del diseño es que los puntos centrales no tienen impacto en las estimaciones usuales de los efectos en un diseño 2 k . Se supone que los k factores son cuantitativos. Figura 8. Representación geométrica del diseño 2 2 con corridas centrales o puntos centrales Para ilustrar este enfoque, considérese un diseño 2 2 con una observación en cada uno de los puntos factoriales (-, -), (+, -), (-, +) y (+, +), y n C observaciones en los puntos centrales (0, 0). La Figura 8. ilustra esta situación. Sean F y y C y los promedios de las cuatro corridas en los cuatro puntos factoriales y el promedio de las n C corridas en el punto central, respectivamente. Si la diferencia F y - C y es pequeña, entonces los puntos centrales se encuentran sobre el plano que pasa por todos los puntos factoriales, o cerca de él, y no hay curvatura. Por otra parte, si F y - C y es grande, entonces la curvatura está presente. Una suma de cuadrados de un grado de libertad para la curvatura está dada por: ( ) 2 C F C F C F Curvatura n n y y n n SS + ÷ = 64 donde, en general, n F es el número de puntos en el diseño factorial. Esta cantidad puede ser comparada con el error cuadrático medio para probar la curvatura. De (1) a b ab Bajo (-) Bajo (-) Alto (+) Alto (+) Medio Medio Corrida Central 79 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO manera más específica, cuando se añaden puntos al centro del diseño 2 k , entonces el modelo que se considera es ¿ ¿¿ ¿ = < < = + + + + = k j j i j i k j jj j i ij j j x x x x Y 1 1 2 0 c | | | | 65 donde las β jj son efectos cuadráticos puros. La prueba de curvatura consiste, en realidad, de la prueba de las hipótesis 0 : 0 : 1 1 1 0 = = ¿ ¿ = = k j jj k j jj H H | | 66 Por otra parte, si los puntos factoriales en el diseño no están replicados, entonces pueden emplearse los n C puntos centrales para construir una estimación del error con n C -1 grados de libertad. Grafica 9. Ejemplo de una superficie de respuesta Revisar ejemplos de los apéndices 1 0 -1 B 80 85 90 95 0 Res -1 1 A Surface Plot of Res 80 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Apéndices En los siguientes apéndices-ejemplos resueltos de diseños experimentales encontraras cuatro ejercicios para analizarlos y tenerlos de guías para los trabajos colaborativos a realizar. 81 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Apéndice 1 Repaso de la estadística aprendida en cursos anteriores Recientemente un instituto de certificación de normas técnicas realizo una investigación sobre la composición bromatológica de alimentos. Estudio en donde se pretende lograr una confiabilidad del 98%, una probabilidad esperada del 55% y no cometer un error superior al 2 %. Los interesados tomaron muestras del producto vegetal directamente de los árboles, en tres épocas de cosecha diferente pero consecutiva, procesaron el material y determinaron algunas propiedades físico-químicas, reportada en la tabla 1. Tabla 1. Composición química de harinas de plátano, de ocho localidades diferentes (%)** Característica/procede ncia Humedad Ceniza grasa Proteína Almidón Fibra Harina de platano-1 10 2,5 1 7,12 60-72 1 Harina de platano-2 7,5 2,1 0,1 12,8 23 Harina de platano-3 14 8 12 13 Harina de platano-4 14 11 1 21 Harina de platano-5 13.1 3,6 1.2 21,3 60,8 3,9 Harina de platano-6 12.2 2 1.5 8 73 4 Harina de platano-7 12.1 3,5 18 78,5 4,5 Harina de platano-8 14 6 3 11,5 11 Solución Verifiquemos el desarrollo numérico del ejercicio Características/pro cedencia Humedad ceniza grasa proteína Almidón fibra total Media Harina de platano- 5 13.1 3,6 1.2 21,3 60,8 3,9 103,9 17,31 Harina de platano- 6 12.2 2 1.5 8 73 4 100,7 16,78 Harina de platano- 7 12.1 3,5 18 78,5 4,5 116,6 19,43 TOTAL 37,4 GRAN MEDIA 12,5 82 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO a) Describa detalladamente el diseño del experimento que programaron los profesionales a cargo del proyecto. Se deben identificar los elementos que intervienen en el estudio experimental. Rta: Es un diseño completamente al azar. Se trata de un experimento de una variable (en este caso la localización). En el cual se pretenda medir su efecto sobre el contenido químico (bromatológico) de las muestras tomadas (tres por cada localidad) y partir de los resultados generados y que se presentan en la tabla 1, realizar los análisis respetivos. Los elementos que intervienen en el diseño experimental son: Las ocho localidades (variables), las unidades de análisis u observación objeto de la evaluación (planta de plátano) las personas que toman los datos, el laboratorio donde se hace los análisis y quien organiza, procesa y e interpreta los datos. b) Se podría asociar un modelo matemático a la experimentación desarrollada? No; no se hablo de tratamiento. Ho: *= Ha: al menos una humedad es diferente de las demás. C) El número de muestras fue apropiado? Justifique su respuesta atreves de una formula. Para obtener el tamaño de la muestra de una población determinada se requiere tomar en cuenta los siguientes factores: 1- El tiempo y los recursos disponibles. 2- Las técnicas de muestreo. 3- Las técnicas de análisis de datos. 4- La estimación de la varianza. 5- El margen de error máximo posible. 6- El nivel de confianza. Esta fórmula se utiliza cuando se desconoce el tamaño de la población. n = n = tamaño de la muestra. Z= intervalo de confianza. E= error de muestreo aceptable. =desviación estándar. Entonces tenemos:-intervalo de confianza=98% Error de muestreo aceptable=2% Desviación estándar= para calcular. 83 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Calculo de desviación estándar: La desviación estándar corresponde a la raíz cuadrada de la variación(S). *Cálculo del número de muestras: Utilizando los tres valores correspondientes al resultado de la humedad (13,1-12,2-12,1) VARIANZA: = Desviación estándar: S= =0,54 Aplicamos la fórmula para calcular el número de muestras, tenemos: n = *Calculando el numero de muestras utilizando los ocho valores correspondientes a los resultados de la humedad (10; 7.1; 14; 13; 1; 12.2; 12.1; 14) de la tabla. VARIANZA: = DESVIACION ESTANDAR: S= =2,3 Aplicando la fórmula para obtener el número de muestra tenemos: n = = 84 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO d) ¿Qué tipo de información grafica se podría construir con los datos tomados? -Podríamos generar un diagrama de columna agrupada para representar cada característica Bromatológica de las tres harinas de plátano que elegimos. - también podemos representar la gran media de las tres harinas en sus características bromatológicas atreves de un diagrama circular. e) Determine el intervalo de confianza para la proporción de varianza de una de las propiedades determinadas 85 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Tabla de valores de Z de los diferentes niveles de confianza Nivel de Confianza 99.73% 99% 98% 96% 95.45% 95% 90% 80% 68.27% 50% Valores de Z 3.00 2.58 2.33 2.05 2.00 1.96 1.645 1.28 1.00 0.6745 El nivel de confianza aquí es de 98% y si nos fijamos en la tabla podemos ver que es de 2.33 f) ¿Se podría concluir que existen diferencias significativas entre la harina proveniente de las diferentes localidades? Sustente sus conclusiones utilizando un método estadístico de comparación apropiado por ejemplo Duncan y Tukey. PRUEBA DE TUKEY: Se realizan comparaciones múltiples que son posibles con t tratamientos. Para esto se procede a aplicar la siguiente ecuación: DMS= EE. DONDE q es el valor que se encuentra en las tablas de Tukey con el número de tratamientos, los grados de libertad del error y el nivel de significancia deseado. El método es hallar todas las comparaciones posibles con t tratamientos que son t(t-1)/2 poniendo las medias en orden creciente y decreciente y restando de la media mayor todas las medias, después a la siguiente mayor le restamos las demás medias y así sucesivamente hasta que se termine, si esta diferencias de medias superan la DMS , se dice que las medias son significativas, en caso contrario no son significativas o estadísticamente . 1) Ordenamos la media de mayor a menor HP7 HP5 HP6 19,43 17,316 16,7833 2) Hallamos el valor de DMS = = (4,18) (3,83)=16,0094 3) Se busca la diferencia entre todas las medias para lo cual se implementa la siguiente Tabulación. HP7 HP5 HP6 19,43 17,31 16,78 86 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO HP6 16,78 2,65 0,53 0,0 HP5 17,31 2,12 0,0 HP7 19,43 0,0 DMS=16,0094 4) HP7 HP5 HP6 19,43 17,31 16,78 CONCLUSIÓN: Las Harinas no tienen mayor diferencia entre HP5 Y HP6, si hay diferencia significativa entre HP7 y HP6, las medias de todas estas con respeto DMS son significativas. 87 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Apéndice 2 Aplicación práctica Experimentos sin bloquear - Diseño totalmente aleatorizado o completamente al azar Ejemplo Se quiere mejorar las propiedades de transportabilidad, manejo y presentación de las rosquillas elaboradas por una panificadora, para tal efecto de determinara el efecto que sobre la dureza de estas tiene la incorporación de tres aditivos en la misma proporción; los aditivos se incorporaran individualmente en la masa elaborada (amasijo). Figura 12. Diagrama de flujo para la producción de rosquillas a partir de una masa estandarizada. Para el estudio los investigadores emplearon un diseño de experimentos completo al azar o sin bloquear-simple y balanceado por que todos los tratamientos tienen el mismo número de datos. Hipótesis de investigación: La hipótesis planteada es que al menos uno de los tres ingredientes mejorara la dureza final de las rosquillas. H 0 : U 1 =U 2 =U 3 Rosquillas Diseño experimental totalmente aleatorizado 3 8 5 4 2 7 Ingrediente A Ingrediente B Ingrediente B Ingrediente C 1 9 6 88 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Y la hipótesis alterna H A : U 1 # U 2 # U 3 Diseño del experimento: una masa bien homogénea para la confección de las rosquillas se divide en seis porciones iguales y a cada dos de ellas se les mezcla el ingrediente seleccionado. El primer paso es aleatorizar asignándole una secuencia de números aleatorios a las unidades experimentales, utilizando una de las tablas de permutación de donde se toma una permutación aleatoria por ejemplo: 318594267, asignar el primer tratamiento a las tres porciones del tratamiento A, los dos siguientes al tratamiento B y finalmente los otros dos restantes al tratamiento C En la tabla siguiente se resume la aleatorización hecha. Tabla 12. De aleatorización para el ejemplo de las rosquillas 3 1 8 5 9 4 2 6 7 Tratamiento o aditivo A A A B B B C C C La dureza se evalúa después de seis días de almacenamiento a 10*C. Tabla 13. Datos obtenidos en la determinación de la dureza para el ejemplo de las rosquillas. Tratamientos Dureza o variable de respuesta Determinación (U nd / cmt) Total Media c/trata miento Secuencia de experimentación 3 7 1 Aditivo A 7 9 5 21 7 Secuencia de experimentación 5 8 4 89 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Aditivo B 10 8 9 27 9 Secuencia de experimentación 2 9 6 Aditivo C 10 9 12 31 10.33 Gran media 79 8.77 Solución: con los datos de la tabla desarrollamos las siguientes operaciones: 1- Sumamos todos los resultados individuales (determinaciones de la dureza) o sumatoria total. = = ¿ = n j ij y Yij 1 7+9 +5+10+8+9+10+9+12 = 79 2- Podemos calcular la media por tratamiento y la gran media. a= número de tratamientos. r=repeticiones de haberse realizado. N= total de mediciones-datos (N= anr). r=1 solo una medida por tratamiento. n Yij ij Y = 1 7+9 +5= 21 21/ 3 = 7 10+8+9= 27 27/3 = 9 10+9+12= 31 31/3= 10.33 Gran media 79/ 9 = 8.77 79 = - - Y Obsérvese que es igual a ¿ = = n j ij y Yij 1 3- Elevamos al cuadrado cada uno de los datos u observaciones registradas. Cada observación de cada tratamiento se eleva al cuadrado. ( ) ¿ ¿ = = n j ij a i y 1 2 1 = {(7) 2 + (9) 2 + (5) 2 + (10) 2 + (8) 2 + (9) 2 + (10) 2 + (9) 2 + (12) 2 } = 90 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO (49)+ 81+25+100+64+81+100+81+144= 725 3.1. Calculamos | | N Y 2 .. = {(79) 2 /3x3} = 693.4444 Conocido también como factor de corrección 4- Elevamos al cuadrado la suma horizontal de los tratamientos (hallados en 2) estos valores (cuadrados) para cada tratamiento se suman. Aplicamos la fórmula para calcular la suma de cuadrados por tratamiento= SCt. SC tratamientos = [{(21) 2 + (27) 2 + (31) 2 }]/3 -- {(79) 2 /3x3} = SC tratamientos = {441 + 749+ 961}/ 3 – 693.44444= 717- 693.4444= 23.5555 5- Todos los valores-determinaciones (producto cuadrado) se suman, con esta calculamos la suma total de cuadrados. ( ) | | N Y y SC n j ij a i Total 2 1 2 1 .. ÷ = ¿ ¿ = = SC Total = {(7) 2 + (9) 2 + (5) 2 +(10) 2 + (8) 2 + (9) 2 + (10) 2 +(9) 2 + (12) 2 }- {(79) 2 /3x3 }= SC Total = 725 – 693.4444= 31.5556 SC T =SC E +SCt SC T – SCt = SC E SC E = 31.5556 - 23.5555= 8.0 6- Calculo de los grados de libertad 6.1. ° Libertad de los tratamientos= 3-1 = 2 6.2. ° Libertad total= 9-1= 8 6.3. ° Libertad total - ° Libertad de los tratamientos = 8-2 = 6 7. Calculo de los cuadrados medios 7.1 . Cuadrado medio de los tratamientos CMtratamient = SCtrata/ ° libertad tratamieno CMtratamient = 23.5555/ 2 = 11.77775 91 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO 7.2 . Cuadrado medio del error CMerror = SCerror/ ° libertad error CMerror = 8 / 6 = 1.3333 7.3. Cuadrado medio total CMtotal = SCtotal/ ° libertad total CMtotal =31.5556 / 8 = 3.9445 Tabla 14. Análisis de varianza para evaluar el efecto de los aditivos en la elaboración de rosquillas. Fuente de variación Grados de Libertad Ecuac SC Suma de cuadrados Ecuac CM Cuadrados medios Ecuac F 0 Razon Ecuac p-valor Tratamientos 3-1=2 23.5555 11.77775 8.83 0,1004 Error 6 8 1.3333 Total (9-1)=8 31.5556 SS Totales / (kn -1) Como la razón de varianza calculada-8.83 para los tratamientos es menor que la reportada-propuesta en la tablas de valores criticos de distribución F -19.3 para 2 grados de libertad en el numerador (tratamientos) y 6 en el denominador (error) para una significancia-alfa de 5%, concluimos que al menos un tratamiento es diferente. Entonces la pregunta del investigador es: ¿ Cuál de ellos?. U establecer específicamente cuáles son las medias que difieren entre sí en forma significativa. Para el efecto utilizamos los llamados métodos de comparaciones múltiples como la mínima diferencia significativa (LSD), el método de Tuckey y el método de Dunnett. La Diferencia Mínima Significativa (DMS) esta es la diferencia entre dos medias, basadas en la prueba t de Student, empleando el valor de la varianza del error. El valor de la LSD se encuentra referido a la distribución de t por la siguiente relación: - Media del tratamiento B = Sd (t) 92 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO -k ½ N-K = grados de libertad del error = 6 2 / n) ) ½ es el error típico de la media n= 3- número de muestras en experimentación por tratamiento. -k 1.3333/ 3) ½ S = t -k (0.888888) ½ S = t (0.9428) t = 2.44 extractado de las tablas de puntos críticos para la distribución T de Student con los grados de libertad del error. S = 2.44 (0.9428) S= 2.3 Las diferencias entre las medias son A - B = -2 A - C = -3 B - C = 1,33 Si la diferencia entre dos promedios seguidos excede el valor de 2.3, se la declara significativa al nivel del 5%. En este ejemplo, la LSD indica que no hay diferencias significativas entre tratamientos adyacentes, pero la F de la ANALISIS DE LA VARIANZA indica que sí existen diferencias si se comparan medias no adyacentes, en este caso, el investigador podría optar por otro tipo de prueba de rango múltiple. Por ejemplo si utilizamos además la prueba de rango múltiple para las rosquillas: 95% LSD, obtenemos los siguientes resultados: Tabla 15. Análisis de homogeneidad y contraste de las rosquillas. Tratamiento Muestras Media Homogeneidad del grupo Contraste (Diferencia) A 3 7 X A-B ( -2) 93 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO B 3 9 XX B-C (-3.33)* C 3 10.33 X B-C (-1,33) * Indica diferencia estadísticamente significativa Comprobando que el tratamiento seleccionado es el que presenta mejores condiciones para ser aplicado a la rosquilla. Solución por computadora Hay muchos paquetes de software de estadística que cuentan con la capacidad para probar hipótesis estadísticas. SPSS- EXCELL- 94 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Apéndice 3 Un grupo de profesionales-del que Ud hace parte, desarrollo un proyecto de investigación el cual tenía como meta estudiar la composición de amino ácidos de una alga cultivada en superficie en cuatro sustratos diferentes. Obteniéndose los siguientes resultados: Tabla 6. Composición Bromatológica (% Bs) De La Harina De un alga desconocida. Según Los Sustratos Alimenticios/ ** Sustrato MatSec ProtC ProtV ProS Grasa Tot EB AcGrasS AGI AGP FDN FDI S1 19.9 57.29 51.16 90.26 4.81 19.74 3.12 1.32 1.43 2.82 8.12 S2 20.1 56.67 50.91 91.00 5.75 20.08 3.89 1.87 1.85 2.91 7.96 S3 21.6 53.98 48.62 88.78 4.37 18.91 3.01 1.98 1.85 3.13 8.86 S4 19.9 56.59 49.96 91.78 5.75 18.09 3.10 1.79 1.37 2.82 8.58 S5 16.13 39.23 46.96 85.76 4.07 12.54 3.17 1.10 1.21 2.21 6.42 Datos tomados con fines educativos Identifique con toda precisión: las unidades experimentales, los factores, los tratamientos, las variables y demás características que intervienen en el estudio que realizo tu equipo de trabajo. Igualmente te solicitamos que de respuesta a las siguientes preguntas: a) ¿Qué tipo de diseño siguieron los profesionales a cargo del estudio? b) Plantee el modelo matemático, justificando su respuesta. c) Establezca las suposiciones necesarias para el análisis de varianza de los datos. Realice el análisis de varianza. d) Pruebe la hipótesis que no hay diferencias entre las medias de los tratamientos con la prueba de F a un nivel de significancia de 0,05. e) ¿Se puede decir que hay diferencias entre los distintos sustratos? f) Y, en que otro tipo de situación experimental para su trabajo disciplinar, se podría presentar este tipo de análisis. Describa el ejemplo Desarrollo -Los factores: El alga cultiva en superficie. 95 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO -Las unidades experimentales del presente ejercicio son: composición de aminoácidos de un alga. -Los tratamientos: los cinco sustratos diferentes. -Variables: resultados de la composición de aminoácidos. a) Tipo de diseño: después de analizado este ejercicio parece ser que presenta el nivel descriptivo ya que describe las características de la composición de aminoácidos del alga y su comportamiento en los cinco sustratos. b) El modelo matemático: se va a utilizar el análisis de varianza (Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los valores respecto a su punto central (Media ) (ANOVA), esta se utiliza para determinar una razón de las diferencias observadas, el nivel de margen de error y así mismo para comprobar la hipótesis que se presenta mas adelante. c) Análisis de varianza: Para este ejercicio se trabajara con los siguientes sustratos: Composición Bromatológica (% Bs) De La Harina De un alga desconocida. Según dos Sustratos Alimenticios. Aminoácidos S1 X X 2 S2 X X 2 MatSec 19.9 396.01 20.1 404.01 ProtC 57.29 3282.144 56.67 3211.488 ProtV 51.16 2617.345 50.91 2591.828 ProS 90.26 8146.867 91.00 8281 GrasaTot 4.81 23.136 5.75 33.0625 EB 19.74 389.667 20.08 403.2064 AcGrasS 3.12 9.7344 3.89 15.1321 AGI 1.32 1.7424 1.87 3.4969 AGP 1.43 2.0449 1.85 3.4225 FDN 2.82 7.9524 2.91 8.4681 FDI 8.12 65.9344 7.96 63.3616 TOTAL 259,97 14942,54 262,99 15018,46 Sustrato 1: S1 (total)/ 11(sustratos total) 96 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO ẋ = 259,97/11 (sustratos) = 23.633 Sustrato 2: S2 ẋ = 262,99/11 = 23,908 Media total entre los dos sustratos: S1 + S2 /22 522,96/22 = 23,770 Suma total de los cuadrados: Σ xt 2 = ΣX 2 - (ΣX) 2 = 29961 – (522,96) 2 = 29961 – 12431,23 ------- ------------ N 22 = 17529,77 Suma de los cuadrados entre los dos sustratos: Σ xb 2 = (ΣX1) 2 + Σ(X2) 2 + ....- (ΣX) 2 ------- -------- ---------= n1 n2 N = (259,97) 2 /11 + (262,99) 2 /11 – (522,96) 2 /22 = 0,41 Entonces Suma de los cuadrados dentro de los sustratos: Esta se puede calcular restando la suma de los cuadrados entre los grupos y la suma total de los cuadrados. Σ xb 2 = 17529,77 – 0,41 = 17529,36 Sacamos luego un resumen de las varianzas respecto de los dos sustratos S1 y S2. 97 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Fuente de varianza SS df MS F Nivel de signo Suma de los cuadrados entre dos sustratos 0,41 1 0.41 0,0004677 0,05 Suma de los cuadrados dentro de los sustratos 17529,36 20 876,468 TOTAL 17529,77 21 df: son los grados de libertad asociado a cada fuente de varianza, el numero de grados de libertad de la varianza entre grupos (G-1) es 2-1 = 1 y los grados de libertad de la varianza dentro de los grupos es: 11 – 1 +11 – 1 = 20. MS: cuadrado de la media entre los grupos y el cuadrado de la media dentro de los grupos. Se obtienen dividiendo la suma de los cuadrados así: 0,41/1 = 0,41 y 17529,36/20 = 876,468. d) Hipótesis: no existe diferencias entre las medias de los tratamientos. Para hallar el producto final, o sea la razón F, se divide el cuadrado de la media entre los grupos y el cuadrado de la media dentro de los grupos previamente obtenidos: F = 0,41/876,468 = 0,0004677 e) ¿Se puede decir que hay diferencias entre los distintos sustratos? mirar la tabla de la razón F3, con el fin de determinar si esta tiene significancia estadística. Localizando los grados de libertad entre grupos (numerador) y el número de grados de libertad dentro de los grupos (denominador), encontramos: los grados de libertad son 1 y 20, lo cual establece una razón de F de 4,3513. F calculada en el ejemplo anterior resulta menor que el valor anterior, no es significativa en el nivel 0,05, ya que si se hubiera obtenido la razón F igual o mayor que la encontrada en la tabla, entonces la diferencia hubiera sido significativa y se rechazaría la hipótesis nula. f) Y, en que otro tipo de situación experimental para su trabajo disciplinar, se podría presentar este tipo de análisis: Existen muchas situaciones en la Ingeniería 98 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO de Alimentos, donde se presentan estos ejemplos de análisis, por ejemplo: análisis de porciones con cierta muestras de alimentos, experimentos acerca del empleo de químicos para alguna prueba de laboratorio, hay mucho ejemplos lo que se debe tener en cuenta y es muy importante tomar el análisis correcto. 99 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Apéndice 4 Un equipo de ingenieros de alimentos y zootecnistas realizó un experimento, con el fin de mejorar las condiciones de una dieta para semovientes, agregado dos complementos alimenticios diferentes a sus ingredientes básicos (cinco porcentajes diferentes). Las distintas calidades del primero se indican con las letras latinas y las del segundo por las letras griegas. Se suministra la dieta a los animales clasificados de acuerdo con cinco pesos iníciales (W1, W2, W3, W4, W5) y cinco razas diferentes (R1,R2, R3, R4, R5). Los incrementos de peso logrado por el tiempo del experimento se muestran en la tabla dada a continuación, especifique si es correcto el diseño seguido, de respuesta a las siguientes inquietudes, realizando y desarrollando los cálculos según el caso. a. Qué tipo de diseño experimental siguieron los proyectantes? ¿Por qué? El diseño que siguieron los proyectantes fue el cuadro Greco latino, el cual tiene las siguientes características: v Es un diseño con cuatro factores a k niveles v Se asume que no hay interacciones v Requiere k2 observaciones v El diseño factorial completo requiere k4 v Cada nivel de un factor aparece una vez con cada nivel de los otros factores v Es una superposición de dos cuadrados latinos Cada letra griega aparece una vez en cada fila, en cada columna y una con cada letra latina 100 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO En los arreglos por bloques, se pueden analizar 4 factores, introduciendo un cuarto factor o bloque en un diseño cuadrado latino, siguiendo las mismas reglas utilizadas para introducir un tercer factor en un diseño cuadrado de dos factores. A este cuarto factor o bloque se le denomina Componente GRIEGO, ya que se utilizan letras griegas para identificar sus niveles, a la adición de un diseño cuadrado latino y un cuarto factor, se le llama Diseño Cuadrado Greco-Latino. b. Defina la variable, los tratamientos, elige una significancia apropiada. TRATAMIENTOS: Las diferentes dietas VARIABLES: El peso de los animales c. Calcule el ANOVA. 101 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO FACTOR DE CORRECCION FC: (X…)2 / 25 FC: 185761/ 25 FC: 7430,44 SUMA DE LOS CUADRADOS TOTAL SCTotal: 7881-7430,44 SCTotal: 450,56 SCHileras: 13,36 SCColumnas: 22,16 SCTratamientos: 350,56 SC4° Factor: 10,16 SCError: 54,32 Ft FUENTES GRADOS DE SC CM Fo 5% 1% 102 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO LIBERTAD TRATAMIENTOS 4 350,56 87,64 12,90722 3,84 7,01 COLUMNAS 4 22,16 5,54 0,815906 3,84 7,01 4° Factor 4 10,16 2,54 0,37408 3,84 7,01 HILERAS 4 13,36 3,34 0,4919 3,84 7,01 ERROR 8 54,32 6,79 TOTAL 24 450,56 SẊ=√6,79/5 = 0.521. Sd=√2(6,79)/5 = 1,648. Existe una confiabilidad de 15 %. Para F 0.05, 4, 8 = 3.84, entonces tenemos: Raza: Como la Fo (0,50) < F 0.05, 4, 8 = 3.84, entonces se Acepta Ho, la raza no es fuente de variación para la respuesta. Peso: Como la Fo (0,82) < F 0.05, 4, 8 = 3.84, entonces se Acepta Ho, el peso no es fuente de variación para la respuesta. Como la Fo (12,9) > F 0.05, 4, 8 = 3. 84, Ho. Se rechaza, el primer complemento alimenticio es el que causa variación. Como la Fo (0,38) < F 0.05, 4, 8 = 3.84, Ho. Se acepta, el segundo complemento no es fuente de variación. a. ¿Se podrían realizar comparaciones entre medias? Justifique su respuesta. La hipótesis nula H 0 : m 1 - m 2 = d 0 Generalmente d 0 =0 Hay 3 situaciones distintas: 1º conocidos (poco frecuente). 103 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO 2º desconocidos pero iguales. 3º desconocidos pero distintos. Los estadísticos son distintos (z en 1 y t en 2 y 3) pero el procedimiento es el mismo. En los 3 casos se supone que las muestras son independientes; si no lo fueran hay otro estadístico (t pareada). Todos asumen normalidad. Si no se cumpliera hay que usar los llamados test no paramétricos. e. En caso afirmativo determine la mejor de ellas Nº efectivo de replicación = 5 COMPARACIÓN DIFERENCIA 1 PROMEDIO 2 PROMEDIO DMS CONCLUSIÓN A-E 10.8 23.6 12.8 5.4781 sig. A-D 8.4 23.6 15.2 5.4781 Sig. A-C 8.0 23.6 15.6 5.4781 Sig. A-B 4.6 23.6 19.0 5.4781 No sig. C-E 6.2 19.0 12.8 5.4781 Sig. C-D 3.8 19.0 15.2 5.4781 No sig. C-B 3.4 19.0 15.6 5.4781 No sig. B-E 2.8 15.6 12.8 5.4781 No sig. B-D 0.4 15.6 15.2 5.4781 No sig. D-E 2.4 15.6 12.8 5.4781 No sig. e) ¿Consideras que los datos tomados son suficientes? ¿O habría que tomar datos adicionales? Si porque con estos datos se pudo identificar diferencias significativas, y determinar cuál tratamiento causa variación. 104 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Apéndice 5 Diseño factorial Un ingeniero está interesado en el efecto de la velocidad de corte (A) en la dureza de una pierna de bovino (tejido muscular y hueso) congelada instantáneamente por IQF (B) y el ángulo de corte (C) sobre la duración del dispositivo utilizado- sierra. Para lo cual el equipo de trabajo eligió dos niveles para cada factor y corrió dos réplicas en un diseño factorial 23. La tabla siguiente presenta los datos de tiempo de duración (en horas) de la herramienta. a. Represente gráficamente los datos y calcule los efectos correspondientes y las interacciones de cada uno de los factores. b. Determine cuáles de estos efectos son importantes usando la tabla de análisis de varianza. c. Determine los residuos. d. Ajuste un modelo estadístico para estos datos e. Reporte las conclusiones obtenidas. Nota: Representar los datos. Interpretar los resultados enunciando las hipótesis. Solución al ejercicio Geométricamente las combinaciones de tratamientos que se encuentran en la tabla anterior, se representan de la siguiente forma: 105 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO COMBINACION DE TRATAMIENTOS REPLICA TOTAL I II (1) 221 311 532 a 325 435 760 b 354 348 702 ab 552 472 1024 c 440 453 893 ac 406 377 783 bc 605 500 1105 abc 392 419 811 6610 Modelo estadístico Donde, µ: efecto medio general li: efecto del i-ésimo nivel del factor A βj: efecto del j-ésimo nivel del factor B γk: efecto del k ésimo nivel del factor C 106 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO : Efecto de la interacción entre el i-ésimo nivel de A y el j-ésimo nivel de B : Efecto de la interacción entre el i-ésimo nivel de A y el k-ésimo nivel de C : Efecto de la interacción entre el j-ésimo nivel de B y el k-ésimo nivel de C : Efecto de la interacción entre el i-ésimo nivel de A, j-ésimo nivel de B y el K-ésimo nivel de C : Componente del error aleatorio (error natural) Tabla de hipótesis Forma verbal de las Hipótesis a probar: a) H0: La velocidad de corte no influye significativamente en la duración del dispositivo utilizado-sierra H1: La velocidad de corte influye significativamente en la duración del dispositivo utilizado-sierra 107 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO b) H0: La congelación IQF no influye significativamente en la duración del dispositivo utilizado-sierra H1: La congelación IQF influye significativamente en la duración del dispositivo utilizado-sierra c) H0: El ángulo de corte no influye significativamente en la duración del dispositivo utilizado-sierra H1: El ángulo de corte influye significativamente en la duración del dispositivo utilizado-sierra d) H0: La velocidad de corte y la congelación IQF no influyen significativamente H1: La velocidad de corte y la congelación IQF influyen significativamente en la duración del dispositivo utilizado-sierra e) H0: La velocidad de corte y el ángulo de corte no influyen significativamente en la duración del dispositivo utilizado-sierra H1: La velocidad de corte y el ángulo de corte influyen significativamente la duración del dispositivo utilizado-sierra f) H0: La congelación IQF y el ángulo de corte no influyen significativamente en la duración del dispositivo utilizado-sierra H1: La congelación IQF y el ángulo de corte influyen significativamente en la duración del dispositivo utilizado-sierra g) H0: La velocidad de corte, la congelación IQF y el ángulo de corte no influyen significativamente en la duración del dispositivo utilizado-sierra H1: La velocidad de corte, la congelación IQF y el ángulo de corte influyen significativamente en la duración del dispositivo utilizado-sierra a=2 , b=2 , c=2 , n=2 , i=1,2 , j=1,2 , k=1,2 Estimación de los efectos promedios de los factores principales e interacciones Efecto A: velocidad de corte Efecto B: congelación IQF Efecto C: ángulo de corte 108 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Efecto velocidad de corte A= 1 [a- (1) + ab – b + ac – c + abc - bc] 4n A= 1 [760-532+1024-702+783-893+811-1105] 4(2) A= 1 [3378-3232] 8 A = 18.25 Efecto congelación IQF B= 1 [b+ab+bc+abc-(1)-a-c-ac] 4n B= 1 [702+1024+1105+811-532-760-893-783] 4(2) B = 1 [3642-2968] 8 B= 84.25 Efecto ángulo de corte C= 1 [c+ac+bc+abc-(1)-a-b-ab] 4n C= 1 [893+783+1105+811-532-760-702-1024] 4(2) C= 1 [3592-3018] 8 C= 71.75 Efecto promedio de AB AB= 1 [(1)-a-b+ab+c-ac-bc+abc] 4n 109 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO AB= 1 [532-760-702+1024+893-783-1105+811] 4(2) AB= 1 [3260-3350] 8 AB= -11.25 Efecto promedio AC AC= 1 [(1)-a+b-ab-c+ac-bc+abc] 4n AC= 1 [532-760+702-1024-893+783-1105+811] 4(2) AC= 1 [2828-3782] 8 AC= -119.25 Efecto promedio BC BC= 1 [(1)+a-b-ab-c-ac+bc+abc] 4n BC= 1 [532+760-702-1024-893-783+1105+811] 4(2) BC= 1 [3208-3402] 8 BC=-24.25 Efecto promedio de ABC ABC= 1 [abc-bc-ac+c-ab+b+a-(1)] 4n ABC= 1 [811-1105-783+893-1024+702+760-532] 4(2) ABC= 1 [3166-3447] 8 110 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO ABC= -35.13 Los valores encontrados para cada uno de los efectos significan: - El efecto de la velocidad de corte es positivo e igual a 18.25; significa que se espera un aumento de 18.25 en la duración del dispositivo utilizado- sierra - El efecto de la congelación IQF es positivo e igual a 84.25; significa que se espera un aumento de 84.25 en la duración del dispositivo utilizado-sierra - El efecto de del ángulo de corte es positivo e igual a 71.75; significa que se espera un aumento de 71.75 en la duración del dispositivo utilizado-sierra - El efecto de la velocidad de corte y la congelación IQF es negativo (-11.25); significa que la combinación de ambos no afecta en la duración del dispositivo utilizado-sierra - El efecto de la velocidad de corte y el ángulo de corte es negativo (-119.25); significa que la combinación de ambos no afecta en la duración del dispositivo utilizado-sierra - El efecto de la congelación IQF y el ángulo de corte es negativo (-24.25); significa que la combinación de ambos no afecta en la duración del dispositivo utilizado-sierra - El efecto de la velocidad de corte, la congelación IQF y el ángulo de corte es negativo (-35.13); significa que la combinación de los tres no afecta en la duración del dispositivo utilizado-sierra Contrastes para los efectos principales e interacciones: Los contrastes son el resultado de lo que se encuentra entre paréntesis de los efectos Contraste A = 146 Contraste B= 674 Contraste C= 574 Contraste AB= -90 111 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Contraste AC= -954 Contraste BC= -194 Contraste ABC= -281 Suma De Cuadrados SS A = (contraste A) 2 8n SS A = (146) 2 16 SSA = 1332.25 SS B = (contraste B)2 8n SS B = (674) 2 16 SSB = 28392.25 SS C = (contraste C) 2 8n SS C = (574) 2 16 SS C = 20592.25 SS AB = (contraste AB) 2 8n SS AB = (-90) 2 16 SS AB =506.25 112 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO SS AC = (contraste AC) 2 8n SS AC = (-954) 2 16 SS AC = 56882.25 SS BC = (contraste BC) 2 8n SS BC = (-194) 2 16 SS BC =2352.25 SS ABC = (contraste ABC) 2 8n SS ABC = (-281) 2 16 SS ABC = 4935.06 SUMA DE CUADRATOS TOTAL SST = [(221) 2 +(311) 2 +(325) 2 +(435) 2 +(354) 2 +(348) 2 +(552) 2 +(472) 2 +(440) 2 +(453) 2 +(406) 2 +(377) 2 +(605) 2 +(500) 2 +(392) 2 +(419) 2 ] – (6610) 2 16 SST = 2865344 – 2730756.25 SST = 134587.75 Suma De Cuadrados Del Error SSE = SST - SSA – SSB – SSC – SSAB – SSAC – SSBC –SSABC 113 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO SsE= 134587.75 – 1332.25 – 28392.25 – 20592.25 – 506.25 – 56882.25 – 2352.25 – 4935.06 SSE = 19595.19 SSE: Tiene 8(n -1) grados de libertad; porque cada suma de los efectos principales e interacciones tienen un grado de libertad cada una. Media de cuadrados MS A = SS A = 1332.25 = 1332.25 a-1 2 – 1 MS B = SS B = 1332.25 = 28392.25 b-1 2 – 1 MS C = SS A = 1332.25 = 20592.25 c-1 2 – 1 MS AB = SS A = 1332.25 = 506.25 (a-1)(b-1) 1 x 1 MS AC = SS A = 1332.25 = 56882.25 (a-1)(c-1) 1 x 1 MS BC = SS A = 1332.25 = 2352.25 (b-1)(c-1) 1 x 1 MS ABC = SS A = 1332.25 = 4935.06 (a-1)(b-1)(c-1) 1 x 1 x 1 MS E = SS A = 1332.25 = 2449.39875 abc(n-1) 2x2x2(1) Fo = MS A = 1332.25 = 0.54 MS E 2449.39 Fo = MS B = 28392.25 = 11.59 MS E 2449.39 Fo = MS C = 20592.25 = 8.40 MS E 2449.39 114 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Fo = MS AB = 506.25 = 0.20 MS E 2449.39 Fo = MS AC = 56882.25 = 23.2 MS E 2449.39 Fo = MS BC = 2352.25 = 0.96 MS E 2449.39 Fo = MA ABC = 4935.06 = 2.01 MS E 2449.39 Tabla Análisis De Varianza FUENTES DE VARIACION GRADOS DE LIBERTAD SUMA DE CUADRADOS CUADRADOS MEDIOS VALOR DE F F CRÍTICA (1,8,0.05) A 1 1332.25 1332.25 0.54 5.32 B 1 28392.25 28392.25 11.59 C 1 20592.25 20592.25 8.40 115 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO AB 1 506.25 506.25 0.20 AC 1 56882.25 56882.25 23.2 BC 1 2352.25 2352.25 0.96 ABC 1 4935.06 4935.06 2.01 ERROR 8 19595.19 2449.39875 TOTAL 15 134587.75 Tomando α= 0.05 para obtener el F de tablas con un grado de libertad del numerador y 8(n-1)= 8(2-1) = 8 en el denominador, se tiene que: F α, 1,8(n-1 ) = F 0.05, 1,8 = 5.32 Conclusiones Revisémoslas, analicémoslas y fijemos nuestra posición acorde con criterios estadísticos. a) Para el caso del factor A (velocidad de corte) el F0 < F Tablas (0.54<5.32); por lo tanto, se acepta H0 y se rechaza H1; es decir, que velocidad de corte no influye significativamente en la duración del dispositivo utilizado-sierra b) Para el caso del factor B (congelación IQF) el F0 > F Tablas (11.59 >5.32); por lo tanto, se rechaza H0 y se acepta H1; es decir, que la congelación IQF influye significativamente en la duración del dispositivo utilizado-sierra c) Para el caso del factor C (ángulo de corte) el F0 > F Tablas (8.40>5.32); por lo tanto, se rechaza H0 y se acepta H1; es decir, que el ángulo de corte influye significativamente en la duración del dispositivo utilizado-sierra d) Para el caso de la interacción del Factor A y el factor B (velocidad de corte y congelación IQF) el F0 < F Tablas (0.20<5.32); por lo tanto, se acepta H0 y se rechaza H1; es decir, que la velocidad de corte y la congelación IQF no influyen significativamente en la duración del dispositivo utilizado-sierra e) Para el caso de la interacción del Factor A y el factor C (velocidad de corte y el ángulo de corte) el F0 >F Tablas (23.2>5.32); por lo tanto, se rechaza H0; es decir, que la velocidad de corte y el ángulo de corte influyen significativamente en la duración del dispositivo utilizado-sierra. f) Para el caso de la interacción del Factor B y el factor C (congelación IQF y ángulo de corte ) el F0 < F Tablas (0.96<5.32); por lo tanto, se acepta H0 y se rechaza H1; es decir, que la congelación IQF y el ángulo de corte no influyen significativamente en la duración del dispositivo utilizado-sierra. 116 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO g) Para el caso de la interacción del Factor A, factor B y el factor C (velocidad de corte, congelación IQF y ángulo de corte) el F0 < F Tablas (2.01<5.32); por lo tanto, se acepta H0 y se rechaza H1; es decir, que la velocidad de corte, congelación IQF y ángulo de corte no influyen significativamente en la duración del dispositivo utilizado-sierra. 117 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO GLOSARIO Análisis de varianza: Es una técnica estadística que sirve para analizar la variación total de los resultados experimentales de un diseño en particular, descomponiéndolo en fuentes de variación independientes atribuibles a cada uno de los efectos en que constituye el diseño experimental. Análisis multivariante: Cualquier técnica estadística diseñada para medir la influencia de varias variables independientes actuando simultáneamente en más de una variable dependiente. Bloque: conjunto de unidades experimentales lo más homogénea posible, en el cual, aparecen todos los tratamientos una sola vez. Diseño al azar: se usa cuando las unidades experimentales son homogéneas, y la variación entre ellas es muy pequeña. Diseño de bloques: se presenta cuando se reúnen las unidades experimentales a las cuales se les aplicaran los tratamientos, en bloques de cierto tamaño, de tal forma que los tratamientos se efectúen dentro de cada bloque. Diseño experimental: Plan general del procedimiento para llevar a cabo un experimento en función de unos datos específicos deseados. Diseño factorial. Diseño experimental que incorpora uno o más niveles de dos o más variables independientes. Desarrollo Experimental: Trabajo sistemático sobre el conocimiento ya existente, adquirido a través de investigaciones o experiencias prácticas, que se dirige a producir nuevos materiales, productos, sistemas o métodos; instalar nuevos procedimientos, sistemas o servicios; o mejorar sustancialmente los producidos instalados. Error experimental: medida de la variación que existe entre las observaciones de unidades experimentales en el mismo tratamiento. Estadística: Subdisciplina de las Matemáticas que reúne y evalúa datos numéricos y los trata de tal manera que la relación entre esos datos se muestra claramente. Innovación: se entiende por innovación tecnológica la transformación de una idea en un producto nuevo o mejorado que se introduce en el mercado. 118 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Interacción: Una interacción ocurre cuando el efecto de un factor de entrada en la salida depende del nivel de otro factor de entrada. A veces se pierden con los diseños factoriales fraccionales. Sin interacción Interacción Interacción Interacción moderada fuerte fuerte Investigación básica: es la investigación original, teórica o experimental, llevada a cabo principalmente con objeto de adquirir nuevos conocimientos o una mayor comprensión de los fenómenos y observaciones en estudio, sin el propósito de ninguna aplicación particular. Investigación aplicada: es también investigación original llevada a cabo para adquirir nuevos conocimientos. Sin embargo, va dirigida principalmente hacia objetivos específicos eminentemente prácticos. Sus resultados son válidos para un único o limitado número de productos, operaciones, métodos o sistemas. El conocimiento o información derivado de ella es, con frecuencia, patentado o bien, guardado como secreto. Metodología: Término utilizado en sentido amplio que generalmente se refiere a estrategias, técnicas o procedimientos usados en estudios experimentales, descriptivos o aplicados. Prototipo o modelo: Primer ejemplar construido industrialmente, de una máquina, vehículo, aparato, etc., y destinado a experimentar en funcionamiento sus cualidades y características, con vistas a la construcción en serie. Proyecto de investigación. Se entiende el proceso de indagación sistemática y planificada sobre un determinado problema temático, inscrito dentro de una línea de investigación, y en el marco global de un programa investigativo, tendiente a indagar por una de las temáticas particulares denotadas en la línea. Repetición. El número de veces que un tratamiento aparece en el experimento. 119 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Testigo: Es el tratamiento de comparación adicional, que no debe faltar en un experimento. Tratamiento: es una de las formas que en cantidad o calidad, el factor a estudiar toma durante el experimento. Unidad experimental: Es el objeto o espacio al cual se aplica el tratamiento y donde se mide y analiza la variable que se investiga. En los experimentos pecuarios la unidad. Variable independiente es una observación hecha en cada unidad experimental antes de aplicar los tratamientos, e indica hasta cierto grado la respuesta final de la unidad experimental. 120 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO Referencias 1. Bavaresco, A. (1979). Las técnicas de la investigación. Edit. Scott, Foresman & Co. 4ª edición. Gienview, Illinois, USA. (1ª Edición: 1974). 2. Berenson, M., Levine, D. & Krehbiel, T. (2001). Estadística para administración. Edit, Pearson, 2a Edición, México, 734p 3. Bicking, A.(s.f). Some Uses of statistics en the Planning of Experiments. Industrial Quality Control, Vol. 10 No. 4. 4. Bunge, M. (1980). Ciencia y desarrollo. Edit. Siglo Veinte. Buenos Aires, Argentina. 5. Christensen, H. (1990). Estadística paso a paso. Edit Trillas. 5ª Edic, México. 682 p. 6. Cochran, W. & Cox, G. (2001). Diseños experimentales. Edit, Trillas, 5 reimpresion. Mexico, 661p. 7. Cox, D. (1978). Planning of Experiments. John Wiley and Sons, Inc. New York, 700p. 8. Dawson, B. & Trapp, R. (2002). Bioestadística médica. Edit, manual moderno. 3 Edición. Mexco, 435p. 9. Hernández, R. (2003). Metodología de la investigación. Edit Mac Graw hill. Mexico, 692 p. 10. Hinkelmann, K. (1994). Design and analysis of experiments. Vol I, edit. John Wiley & sons, inc.495 p. 11. Howard, B. (2004). Estadística paso a paso. Edit, Trillas, 3 edicion.Mexico, 682p. 12. Kempthorne O. (1952). The Design and Analysis of Experiments. John Wiley and Sons. New York, 420 p. 13. Kuehl, O. (2000). Diseño de experimentos. Thompson Learning, .2da edición. México. 14. Méndez I. (1980). Lineamientos Generales para la planeación de Experimentos. Monografía No. 15, Vol. 15 IIMAS. 15. Montgomery, D. (1991). Diseño y análisis de experimentos. Grupo editorial Iberoamérica. 589 p. 121 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES CONTENIDO DIDÁCTICO DEL CUSO: 90001 – METODOLOGÍA DE TRABAJO ACADÉMICO 16. Padrón, E. (1996). Diseños experimentales con aplicación a la agricultura. Editorial trillas. Mexico, 320 p. 17. Ostle B. (1975). Estadística Aplicada. Limusa-Wiley, México, 420 p. 18. Montgomery, Douglas. Diseño y análisis de experimentos. Grupo Editorial ibero América, 1a Edición, México, 589 p. Direcciones de las páginas Web. www.virtual.unal.edu.co/cursos/ciencias/2000352/ - www.fao.org/docrep/T0848S/t0848s03.htm.pci204.cindoc.csic.es/tesauros/Tes_Psi c/HTML/PSI_D6.HTM http://www.sas.com/software/index.html www.educarchile.cl/eduteca/estadistica/esc_medic.htm es.wikipedia.org/wiki