Manual Principal

March 16, 2018 | Author: Antonio Lopez | Category: Computer File, Window (Computing), Histogram, Point And Click, Computer Program


Comments



Description

STATPOINT, Inc.STATGRAPHICS® Centurion XV Manual del Usuario STATGRAPHICS ® CENTURION XV MANUAL DEL USUARIO © 2006 by StatPoint, Inc. www.statgraphics.com Todos los derechos reservados. No está permitido la reproducción total o parcial de esta obra, ni su tratamiento o transmisión por cualquier medio o método, sin la autorización escrita o consentimiento de StatPoint, Inc. Título en Inglés: STATGRAPHICS® Centurion XV User Manual STATGRAPHICS es una marca registrada. STATGRAPHICS Centurion XV, StatPoint, StatFolio, StatGallery, StatReporter, StatPublish, StatWizard, StatLink y SnapStats son marcas regsitradas. Todos los productos o servicios mencionados en este libro son marcas registradas de sus respectivos dueños. Impreso en los Estados Unidos de Norteamérica. Contenido Contenido ...........................................................................................................................iii Prefacio.............................................................................................................................. vii Comenzando a Usar el Statgraphics ................................................................................... 1 1.1 Instalación.......................................................................................................................................... 1 1.2 Ejecutando el Programa .................................................................................................................. 6 1.3 Captura de Datos............................................................................................................................11 1.4 Leer un Archivo de Datos Guardaro........................................................................................... 17 1.5 Analizando los Datos.....................................................................................................................19 1.6 Usando la Barra de Herramientas de Análisis ............................................................................23 1.7 Diseminando los Resultados.........................................................................................................29 1.8 Guardando su Trabajo...................................................................................................................30 Manejo de Datos ................................................................................................................31 2.1 El Libro de Datos...........................................................................................................................32 2.2 Acceso a los datos ..........................................................................................................................35 2.2.1 Leyendo Datos de un Archivo STATGRAPHICS Centurion..........................................35 2.2.2 Leyendo Datos de un Archivo Excel, ASCII, XML o Externo .......................................37 2.2.3 Transferir Datos usando Copiar y Pegar..............................................................................39 2.2.4 Consultando una Base de Datos ODBC..............................................................................40 2.3 Manipulando los Datos..................................................................................................................40 2.3.1 Copiando y Pegando Datos ................................................................................................... 41 2.3.2 Creando Nuevas Variables desde Columnas Existentes....................................................41 2.3.3 Transformando Datos ............................................................................................................45 2.3.4 Ordenando Datos....................................................................................................................49 2.3.5 Recodificando Datos...............................................................................................................50 2.3.6 Combinando Varias Columnas..............................................................................................51 2.4 Generación de Datos .....................................................................................................................56 2.4.1 Generando Patrones de Datos ..............................................................................................56 2.4.2 Generando Números Aleatorios ...........................................................................................59 2.5 Propiedades del Libro de Datos...................................................................................................60 Elaborando Análisis Estadísticos ..................................................................................... 62 3.1 Cuadros de Diálogo para Captura de Datos...............................................................................64 3.2 Ventana de Análisis ........................................................................................................................66 3.2.1 Ícono Captura de Datos .........................................................................................................67 iii / Contenido 3.2.2 Ícono de Tablas ....................................................................................................................... 68 3.2.3 Ícono de Gráficas .................................................................................................................... 69 3.2.4 Ícono para Guardar Resultados............................................................................................. 70 3.2.5 Ícono de Opciones de Análisis.............................................................................................. 72 3.2.6 Ícono de Opciones de Ventana............................................................................................. 73 3.2.7 Íconos de Opciones Gráficas ................................................................................................ 75 3.2.8 Ícono de Excluir ...................................................................................................................... 76 3.3 Imprimiendo Resultados ............................................................................................................... 77 3.4 Publicando Resultados................................................................................................................... 80 Gráficas...............................................................................................................................81 4.1 Modificando Gráficas .................................................................................................................... 82 4.1.1 Opciones de Diseño................................................................................................................ 83 4.1.2 Opciones de Mallas ................................................................................................................. 85 4.1.3 Opciones de Líneas ................................................................................................................. 87 4.1.4 Opciones de Puntos................................................................................................................ 89 4.1.5 Opciones del Título Principal................................................................................................ 91 4.1.6 Opciones de Escalas de los Ejes ........................................................................................... 93 4.1.7 Opciones de Relleno ............................................................................................................... 95 4.1.8 Opciones de Texto, Etiquetas y Leyendas........................................................................... 96 4.1.9 Añadir Texto Nuevo ............................................................................................................... 96 4.2 Separando Puntos en un Gráfico de Dispersión ....................................................................... 98 4.3 Resaltando Puntos en un Gráfico de Dispersión ...................................................................... 99 4.4 Suavizando un Gráfico de Dispersión ......................................................................................102 4.5 Identificando Puntos.................................................................................................................... 103 4.6 Copiando Gráficas a otras Aplicaciones ................................................................................... 107 4.7 Guardando Gráficas como Archivos de Imágen.....................................................................108 StatFolios.......................................................................................................................... 110 5.1 Guardando su Sesión de Trabajo............................................................................................... 110 5.2 Rutinas del StatFolio .................................................................................................................... 112 5.3 Actualizando Datos Vinculados................................................................................................. 115 5.4 Publicando Datos en Formato HTML .....................................................................................116 Usando el StatGallery....................................................................................................... 119 6.1 Configurando una página del StatGallery .................................................................................119 6.2 Copiando Gráficas al StatGallery............................................................................................... 121 6.3 Sobreponiendo Gráficas.............................................................................................................. 122 6.4 Modificando una Gráfica dentro del StatGallery.....................................................................123 6.4.1 Añadiendo Detalles Gráficos............................................................................................... 123 6.4.2 Modificando Detalles Gráficos ...........................................................................................124 6.4.3 Eliminando Detalles Gráficos .............................................................................................124 iv / Contenido 6.5 Imprimiendo el StatGallery.........................................................................................................125 Usando el StatReporter ....................................................................................................126 7.1 La Ventana StatReporter ............................................................................................................126 7.2 Copiando la Salida al StatReporter.............................................................................................127 7.3 Modificando la Salida del StatReporter .....................................................................................128 7.4 Guardando el StatReporter .........................................................................................................128 Usando el StatWizard .......................................................................................................129 8.1 Accesando Datos o Creando un Nuevo Estudio ....................................................................130 8.2 Seleccionando un Análisis para sus Datos ................................................................................134 8.3 Buscando por Pruebas y Estadísticas Deseadas.......................................................................139 Preferencias del Sistema...................................................................................................142 9.1 Funcionalidad General del Sistema............................................................................................142 9.2 Imprimiendo..................................................................................................................................145 9.3 Gráficas ..........................................................................................................................................146 Tutorial #1: Analizando una Muestra ..............................................................................148 10.1 Ejecutando el Procedimiento Análisis de Una Variable .......................................................149 10.2 Resumen Estadístico..................................................................................................................151 10.3 Gráfico de Caja y Bigotes..........................................................................................................155 10.4 Evaluando Datos Aberrantes ...................................................................................................157 10.5 Histograma ..................................................................................................................................161 10.6 Gráfico de Cuantiles y Percentiles ...........................................................................................165 10.7 Intervalos de Confianza.............................................................................................................166 10.9 Límites de Tolerancia.................................................................................................................170 Tutorial #2: Comparando Dos Muestras.........................................................................173 11.1 Ejecutando el Procedimiento de Comparación de dos Muestras........................................173 11.2 Resumen Estadístico..................................................................................................................175 11.3 Histograma Dual ........................................................................................................................176 11.4 Gráfico Dual de Caja y Bigotes ................................................................................................177 11.5 Comparando Desviaciones Estándar ......................................................................................179 11.6 Comparando Medias..................................................................................................................180 11.7 Comparando Medianas..............................................................................................................181 11.8 Gráfico de Cuantiles ..................................................................................................................182 11.9 Prueba de Kolmogorov-Smirnov.............................................................................................183 11.10 Gráfico Cuantil-Cuantil ...........................................................................................................184 Tutorial #3: Comparando más de Dos Muestras ............................................................185 12.1 Ejecutando Comparación de Varias Muestras .......................................................................186 12.2 Análisis de Varianza ...................................................................................................................190 12.3 Comparando Medias..................................................................................................................192 12.4 Comparando Medianas..............................................................................................................194 v / Contenido ....................................................... 235 Tutorial #6: Análisis Capabilidad de Procesos ............................................................................................................................................................ 200 13...............................1 Graficando los Datos................................................... 262 16..............................................................................................5 Regresión Múltiple ......................4 Graficando el Modelo Ajustado.................................................................6 Gráficos de Residuos...............7 Gráfico Análisis de Medias (ANOM)...............................................237 15...........................................................................4 Índices de Capabilidad.. 225 14.............................................. 221 14....................................................................................................4 Comparando Dos o Más Muestras.........................................................................................5 Comparando Desviaciones Estándar .........................196 12.......................5 Optimizando la Respuesta ...........1 Resumir Datos Categóricos .........................5 Tablas de Contingencia .. 281 16...........................................287 vi / Contenido ..........................3 Ajustando un Modelo No Lineal .....................2 Análisis de Pareto ......................................................................................................................................................................................................... 251 15................................... 204 13...............................................................................................................................................................................................................................................................................................................................................258 16................1 Análisis de Correlación................................................................................................ 222 14.......4 Examinando los Residuos......................................................................................220 14...............6 Experimentación Adicional .... 282 Lecturas Recomendadas..................................12..........................................................................................................................2 Regresión Simple.........................................3 Analizando los Resultados ............................................................................................................................................................................................................................................................. 209 13..............................257 16................................... 211 Tutorial #5: Analizando Datos Categóricos ..............................3 Trabajando con Datos No-Normales ..........207 13.........................................................................................................................................................................................................................3 Tabulación Cruzada .................2 Creando el Diseño...........5 Calculadora Seis Sigma ............................. 196 12..........198 Tutorial #4: Análisis de Regresión .....1 Seleccionando Diseños de Cribado .................................................... 238 15...231 14............................... 269 16.......... 199 13.... 254 Tutorial #7: Diseño de Experimentos ..........................243 15......286 Indice............................................................................................................................. 277 16.......2 Procedimiento Análisis de Capabilidad.................................285 Archivos de Datos ................240 15........................................................................................................................................................ incluyendo la instalación. Aunque posiblemente ud. NOTA: una copia de este manual en formato PDF se incluye en el CD del programa y puede ser accesado desde el menú de Ayuda. pudiera ingeniárselas para entender la mayoría de este material al estar usando el programa por su cuenta. StatPoint. este se enfoca en explicar las características más importantes del programa. 2. Se recomienda revisar los tutoriales. El menú de Ayuda incluído en el STATGRAPHICS Centurion XV dá acceso a una extensa cantidad de información adicional. Los archivos de datos y los StatFolios referenciados en el manual también se incluyen en el programa. Ofrece una visión general del sistema. el leer estos capítulos le ayudarán a lograrlo más rápidamente además de asegurarse no pasar por alto ciertas características de vital importancia. la creación de análisis estadísticos y la impresión y publicación de resultados. En el documento PDF. Introducir al usuario con algunos de los análisis estadísticos más comunes. Debido a que la intención del libro es agilizar el aprendizaje del programa.Prefacio Este manual está diseñado para enseñar a los usuarios del STATGRAPHICS Centurion XV la operación básica del programa y su uso en el análisis de datos. July. Los últimos siete capítulos incluyen tutoriales cuyo propósito es: 1. incluyendo archivos PDF independientes para cada uno de los aproximadamente 150 procedimientos estadísticos existentes. 2006 vii / Prefacio . Ilustrar como las características exclusivas del STATGRAPHICS Centurion facilitan el proceso del análisis de datos. debido a que le pueden proporcionar una buena idea de optimizer el uso del STATGRAPHICS Centurion para analizar sus datos. todas las gráficas están a color. Inc. Los primeros nueve capítulos comprenden el uso básico del programa. el manejo de datos. más que en abarcar hasta el más mínimo detalle del mismo. viii / Prefacio . 1. La primera le dá la bienvenida al STATGRAPHICS Centurion. la instalación es muy sencilla: Paso 1: Si recibió el programa en un CD. 1/ Comenzando . inserte el CD en el manejador del CD-ROM. este debe ser instalado en el disco duro. se iniciará automáticamente el programa de instalación. En caso contrario. Después de unos segundos. Si descargó el programa desde Internet. o como un conjunto de archivos en un CDROM.iniciando el programa y creando un archivo de datos básico. abra el Explorador de Windows y ejecute el archivo setup.1 Instalación STATGRAPHICS Centurion se distribuye de dos maneras: desde Internet. bajando un solo archivo que debe descargarse en su computadora.exe en el directorio raíz correspondiente al CD-ROM. Solo pulse el botón Siguiente. Paso 2: Sucesivas ventanas de diálogo aparecerán en la pantalla. Para ejecutar el programa. encuentre el archivo descargado y haga doble-clic sobre el mismo para iniciar el proceso de instalación.Capítulo Comenzando a Usar el Statgraphics 1 Instalación del STATGRAPHICS Centurion XV. Como en la mayoría de los programas de Windows. Paso 3: La segunda ventana muestra el contrato de licencia del sofware: Figura 1-1. 2/ Comenzando . Si acepta los terminos del mismo. haga clic en la opción indicada y presione Siguiente para continuar. Si no aceptó las condiciones del contrato. presione Cancelar. Aceptación del Contrato de Licencia Lea este contrato con cuidado. entonces no podrá hacer uso del programa. Si no esta de acuerdo. Ventana de Información del Usuario Capture la información solicitada. Si aún no ha comprado el programa. Después de los 30 días. 3/ Comenzando . deje los espacios del número de serie en blanco. Una vez que la licencia de evaluación vence. debe comprar la licencia del producto para poder seguir usando el programa.Paso 4: La siguiente ventana le solicitará la información sus datos personales y el número de serie que le fué asignado al comprar el programa: Figura 1-2. solo el administrador de la licencia aparecerá. El programa automáticamente se ejecutará en modo de evaluación por 30 días desde que lo instala por primera vez en su computadora. Carpeta de Instalación En forma predeterminada.statgraphics. Si está instalando el programa en un servidor de red. el STATGRAPHICS Centurion se instala en el subdirectorio STATGRAPHICS Centurion XV de Archivos de Programas. No es necesario que los usuarios tengan privilegios de escritura. Consulte la página de Support en www.Paso 5: La siguiente ventana indica el directorio en donde el programa será instalado: Figura 1-3. 4/ Comenzando .com para obtener las instrucciones completas para instalar el programa en redes. instálelo en cualquier lugar en donde los usuarios potenciales tengan privilegios de lectura. Tipo de Instalación Seleccione una de las siguientes opciones: Típica – instala el programa. pero no tendrá acceso a la documentación en-línea y a los archivos muestra de datos incluídos. Esto requiere aproximadamente de 25MB de espacio en su disco duro. Personalizada – instala solo los componentes que ud. los archivos de ayuda. decida. 5/ Comenzando . Esto requiere un poco más de 50MB de espacio en su disco duro. la documentación y archivos muestra de datos. Puede ahorrarse espacio en el disco duro seleccionando una instalación mínima.Paso 6: La siguiente ventana de diálogo le permite especificar el tipo de instalación a efectuar: Figura 1-4. Mínima – solo instala el programa y los archivos de ayuda. 1. 6/ Comenzando . o presione el botón de Inicio ubicado en la esquina inferior izquierda de su monitor y haga clic sobre el ícono de Statgraphics.Paso 7: Siga las instrucciones que faltan para terminar la instalación. Cuando esta sea terminada aparecerá una última ventana: Figura 1-5.2 Ejecutando el Programa Como parte del proceso de instalación se agregará un ícono de Acceso Directo del STATGRAPHICS Centurion en el menu de Inicio de Windows así como al Escritorio.STATGRAPHICS Centurion XV y hacer clic en el ícono de la aplicación sgwin para ejecutar el programa. Para ejecutar el programa: Paso 1: Haga Clic sobre el ícono de acceso directo que se encuentra en el Escritorio. Final de la Instalación Haga Clic en Terminar para concluir la instalación.Statgraphics . También puede seleccionar en el Explorador de Windows la carpeta de Archivos de Programas . Paso 2: Cuando el STATGRAPHICS Centurion se cargue. debe contactar a StatPoint. Administrador de la Licencia Dentro de los primeros 30 días después de haber recibido su número de serie. Para registrar su licencia y obtener un código de activación. pulse el botón de Obtener Código: 7/ Comenzando . De otra forma. se abrirá una nueva ventana. el programa dejará de funcionar temporalmente. primera vez que ejecute el programa la ventana con la información de su licencia aparecerá: La Figura 1-6. Para obtener un código de activación. Inc. Pulse el botón Enviar por Fax para enviar por fax la información impresa. 3.Figura 1-7. Llamar al teléfono mencionado. Tenga a mano tanto el número de Número de Serie como la Llave del Producto que se muestran en la ventana de Registro. 2. 8/ Comenzando . Registro de la Licencia Capture la información requerida y después contáctese con StatPoint por cualquiera de las siguientes formas: 1. Pulse el botón de Enviar por e-mail para enviar la información por Internet. Paso 3: La primera vez que ejecute el programa. el cuál organiza los procedimientos estadísticos con encabezados tales como Gráficos.Cualquier método que utilize. StatPoint verificará la información provista y mandará de regreso un código de activación. Comparar. Paso 4: Se creará la ventana principal del STATGRAPHICS. Pronosticar. el cuál organiza los procedimientos con encabezados Definir. solo que la organización es diferente. capture el código en el campo de Código de Activación en la ventana del Administrador de la Licencia y pulse el botón de Actualizar. Ambos menús contienen los mismos procedimientos. La primera vez que ejecute el progama. A partir de este momento. Puede cambiar su decisión inicial en cualquier momento seleccionando la opción de Preferencias dentro del menú Editar en el programa. o el menú Seis Sigma. Controlar y Pronosticar. Ud. Describir. Relacionar. también deberá elegir el tipo de menú de sistema que desea usar: Figura 1-8. CEP y DE. Medir. una ventana de diálogo adicional aparecerá con la información del StatWizard: 9/ Comenzando . la ventana del Administrador de la Licencia dejará de aparecer . La próxima vez que ejecute el programa. Analizar. después del cual debe salirse del programa para que el cambio tenga efecto. Selección del Menú Puede elegir entre el menú clásico del STATGRAPHICS. Mejorar. Las sesiones que siguen usan el StatWizard para crear un archivo de datos conteniendo los datos del censo de los Estados Unidos del año 2000.Figura 1-9. Si no quiere que aparezca la ventana del StatWizard cada vez que inicie el STATGRAPHICS Centurion. 10/ Comenzando . Puede seguir las instrucciones del StatWizard o hacer clic en Cancelar para suspender el StatWizard. inhabilite la opción de “Mostrar el StatWizard al Inicio” antes de que abandone esta ventana de diálogo. Ventana Inicial del StatWizard El StatWizard está diseñado para auxiliar a nuevos usuarios a crear rápidamente un archivo de datos y comenzar a analizar su contenido. supongamos que desea usar el STATGRAPHICS Centurion para analizar datos del censo de los EUA del año 2000. caso u observación. cada una conteniendo un arreglo rectangular de filas y columnas: Figura 1-10. Por ejemplo. El Libro de Datos del STATGRAPHICS En una hoja de datos típica. El Libro de Datos consiste de 10 hojas de datos. Una pequeña porción de los resultados de ese censo se muestran abajo: 11/ Comenzando . cada fila contiene información de una muestra individual. estos deben ser colocados en el Libro de Datos del STATGRAPHICS. referenciadas por las letras A hasta la J.3 Captura de Datos Para poder analizar datos en el STATGRAPHICS Centurion. mientras que cada columna representa una variable.1. 8 32.632 2. tiene dos opciones: 1. además de usar el StatWizard para configurar la hoja de datos. indique que desea capturar sus datos usando el teclado: 12/ Comenzando . Escribir los datos directamente en el Libro de Datos del STATGRAPHICS Centurion. puede iniciarlo nuevamente pulsando el ícono del sombrero de hechicero barra principal).447. Se crearán cinco columnas para almacenar los nombres de los estados y los datos censales. En esta sesión.819 $22. la información de cada estado se colocará en una fila diferente.904 $22.2 36. acepte la selección predeterminada (“Capturar Nuevos Datos o Importarlos desde una Fuente Externa”) y pulse Aceptar.1 51.871.301.648 4.2 49. (Nota: Si se salió del en la StatWizard. utilizaremos la primera opción.261 Median Age (Edad Promedio) 35.0 33.049 Figura 1-11.932 5. Datos del Censo de EUA del año 2000 Cuando se capturan estos datos en una hoja de datos del STATGRAPHICS Centurion.130.3 34. Cuando la ventana del StatWizard aparezca.3 Percent Female (% Mujeres) 51. En la segunda ventana.3 50.7 48.711 $24.2 50.4 34.673.275 $16. 2.100 626.400 33. Capturar los datos en otro programa como puede ser Excel y después leerlos o copiarlos en el STATGRAPHICS Centurion.State (Estado) Alabama Alaska Arizona Arkansas California Colorado Population (Población) 4.660 $20.6 Per Capita Income (Ingreso per Capita) $18. Para capturar datos como los mostrados arriba en el STATGRAPHICS Centurion. Especificación de localización de los datos en el StatWizard Se presentarán entonces una serie de ventanas para identificar la información a ser capturada en cada columna de la hoja de trabajo: 13/ Comenzando .Figura 1-12. los nombres no pueden iniciar con un dígito numérico. Definición de Columnas Cada columna en una hoja de trabajo del STATGRAPHICS Centurion tiene un nombre. Los nombres pueden contener cualquier caracter excepto aquellos utilizados epara indicar operaciones aritméticas. no son sensibles a las mayúsculas y minúsculas y los espacios son permitidos. Cuando escriba un nombre inválido el programa desplegará un mensaje de error. También sirven como etiquetas predeterminadas en la mayoría de las gráficas. En el ejemplo del censo. como + o . Sin embargo. la primera columna que contiene los nombres de los estados debe definirse como • • 14/ Comenzando .Figura 1-13. Estos nombres son utilizados por el programa para identificar las variables que serán analizadas al seleccionar un procedimiento estadístico. Los comentarios pueden tener hasta 64 caracteres y son opcionales. un comentario y una clase asociada a ella: • Nombre– Asigne a cada columna un nombre único que contenga de 1 a 32 caracteres. Comentario – Capture un comentario que identifique los datos en la columna. Tipo – Especifique el tipo de datos que serán capturados en la columna.. Después de haber definido cada columna. Las otras columnas pueden definirse como Numérica o como Enteros o Decimales Fijos si desea restringir el tipo de datos a capturar. Se desplegará una Hoja de Datos vacía mostrando las columnas que acaba de crear: Figura 1-14. Hoja de Datos STATGRAPHICS Centurion con los Nombres de las Columnas Ahora capture los datos como lo haría en cualquier hoja de cálculo. Cuando haya terminado. Para mayor información acerca de la lista completa de los tipos de columnas. la Hoja de Datos debe tener la siguiente apariencia: 15/ Comenzando . Cuando las cinco columnas hayan sido definidas. pulse Aceptar. NO usar comas al capturar números grandes. pulse Cancelar.Caracteres. utilizando las flechas del teclado para moverse de celda a celda. ver el Capítulo 2. Seleccione Archivo – Guardar – Guardar Datos del menú principal. Escoja el nombre del archivo para guardar los datos: 16/ Comenzando . Hoja de Datos STATGRAPHICS Centurion después de la Captura de 6 registros de Datos Finalmente. debe guardar el archivo de datos.Figura 1-15. usted puede cambiar las propiedades en el campo Guardar Tipo Como a un formato diferente para que otros programas puedan leerlo. sin embargo. estos están listos para su análisis.Figura 1-16. Los Archivos de Datos en el STATGRAPHICS Centurion son guardados en su disco duro automáticamente con la extensión “. Ventana de Diálogo para Guardar Archivo de Datos Es recomendable que asigne un nombre significativo a cada archivo de datos.sf6. Para abrir este archivo de 17/ Comenzando . vamos a retomar el caso del censo para todos los 50 estados y el Distrito de Columbia.sf6” y se pueden leer exclusivamente por el STATGRAPHICS. que viene incluído en el paquete STATGRAPHICS Centurion en un archivo llamado census2000. Tome nota que los archivos guardados en otros formatos pueden tardarse más en ser leídos por el STATGRAPHICS que los datos guardados como archivos SF6. Para hacer el ejemplo más interesante. 1.4 Leer un Archivo de Datos Guardaro Una vez que los datos han sido capturados en una hoja de datos. Cuando guarde el archivo. seleccione el nombre del archivo que contiene los datos: Figura 1-18. Ahora. seleccione Archivo – Abrir – Abrir Datos desde el menú principal. Ventana de Diálogo para Abrir el Archivo de Datos 18/ Comenzando . Ventana de Diálogo para Especificar Origen de los Datos La selección predeterminada en este caso es la correcta.datos. Se le pedirá entonces que especifique el origen de los datos a los quiere tener acceso: Figura 1-17. Hoja de Datos mostrando el contenido del Archivo Census2000. Empezemos resumiendo la variabilidad del ingreso per capita entre los diferentes estados. Seleccionando el procedimiento deseado del menú principal.sf6 1. Al abrir el archivo se cargan las 51 filas completas de datos en su hoja de trabajo: Figura 1-19.El archivo muestra se localiza en el directorio para Archivos de Datos predeterminado (generalmente c:\Archivos de Programas\Statgraphics\STATGRAPHICS Centurion XV\Data).5 Analizando los Datos Una vez que los datos han sido cargados en el Libro de Datos del STATGRAPHICS Centurion. estos pueden ser analizados por cualquiera de los más de 150 procedimientos estadísticos de las siguientes maneras: 1. El mejor procedimiento para resumir una sola columna de datos numéricos es el Análisis de Una 19/ Comenzando . 2. Pulsando cualquiera de los botones de acceso directo en la Barra de Herramientas. Evocando el StatWizard al pulsar el ícono con el sombrero de hechicero en la Barra de Herramientas. 3. Este procedimiento calcula un resúmen de estadísticas tales como la media de la muestra y la desviación estándar.Variable. Para analizar los datos en la columna de Ingreso Per Capita. haga clic en su nombre y luego haga clic en el botón con la flecha negra al lado del campo de Datos. Menú Clásico: Seleccionar Describir – Datos Numéricos – Análisis de Una Variable. 2. Ventana de Diálogo en Análisis de Una Variable para Captura de Datos El cuadro del lado izquierdo enlista los nombres de todas las columnas en las hojas de datos abiertas que contengan datos. una nueva ventana de análisis será creada: 20/ Comenzando . Cuando pulse Aceptar. Deje el campo de Seleccionar en blanco (se usa solamente cuando desea analizar un subconjunto de filas de la hoja de datos en lugar de todas las filas). el Análisis de Una Variable inicia desplegando una ventana de diálogo para captura de datos: Figura 1-20. Esto coloca el nombre de la columna en el espacio del campo de Datos. La ubicación del procedimiento Análisis de Una Variable va a depender del menú que este utilizando: 1. Menú Seis Sigma: Seleccionar Analizar – Datos Contínuos – Análisis de Una Variable. incluyendo un histograma y el gráfico de caja y bigotes. También crea varios gráficos. Como todos los procedimientos estadísticos. mientras que los de la derecha despliegan salidas gráficas.Figura 1-21. Los paneles en la izquierda despliegan salidas tabulares. divididos por barras divisoras movibles. Si da doble clic en el panel superior izquierdo. la tabla con el resúmen estadístico será maximizado: 21/ Comenzando . Ventana de Análisis del Análisis de Una Variable La ventana contiene varios “paneles”. ambos estadísticos están dentro del rango. el cuál nos ofrece una interpretación básica de los resultados. el ingreso per capita oscila entre $15.853 y $28. Dando doble clic nuevamente en el panel del resúmen de estadísticas se restaura la vista original de los diferentes paneles. Como lo explica el StatAdvisor. De los n = 51 estados además del D. que miden la simetría y la kurtosis en los datos. Dando doble clic en el panel superior derecho se maximize el Gráfico de Caja y Bigotes: 22/ Comenzando . datos que provengan de una distribución normal o Gaussiana deberían arrojar valores con un sesgo y una kurtosis estandarizada entre –2 y +2. lo que nos indica que una curva normal en forma de campana es un modelo razonable para estas observaciones. En este caso. En este caso. Por debajo de la tabla se encuentra el texto generado por el StatAdvisor.934.C.766..Figura 1-22. aunque el sesgo está muy cerca de ser estadísticamente significativo.50. el StatAdvisor se concentra en los dos estadísticos mostrados en rojo. El promedio del ingreso per capita es de $20. Panel Maximizado con el Resúmen Estadístico Diferentes estadísticos interesantes se mencionan en la tabla. y que la media sea relativamente más grande que la mediana. La caja central abarca la mitad de los datos. mientras que el signo de (+) muestra la ubicación de la media muestral. ofrece un resúmen de 5-números de una muestra de datos. Las líneas que se extienden en los extremos inferior y superior de la caja (los bigotes) muestran la ubicación del valor más grande y más pequeño de la muestra. la cuál se muestra inmediatamente por arriba del título del análisis: Figura 1-24. Panel Maximizado del Gráfico de Caja y Bigotes El gráfico de Caja y Bigotes. inventado por John Tukey. La línea vertical del interior de la caja corresponde al valor de la mediana. extendiéndose desde el cuartil inferior hasta el cuartel superior. significa un sesgo positivo en los datos. solo se incluyen algunas de las tables y gráficas disponibles. Para desplegar resultados adicionales.6 Usando la Barra de Herramientas de Análisis Cuando la ventana de análisis tal como Análisis de Una Vairable se despliega por primera vez. El hecho de que el bigote superior sea levemente más largo que el inferior. debe pulsar el ícono adecuado en la Barra de Herramientas de Análisis. 1. La Barra de Herramientas de Análisis 23/ Comenzando .Figura 1-23. Muestra lista completa de Gráficos de Salida disponibles para ese procedimiento estadístico. Íconos de Mayor Importancia en la Barra de Herramientas de Análisis Íconos adicionales a la derecha de la Barra le permiten efectuar otras acciones cuando una gráfica es maximizada. Por ejemplo. un cuadro de diálogo aparece enlistando la lista completa de los gráficos disponibles para el procedimiento de Análisis de Una Variable: 24/ Comenzando . Permite cambiar títulos. de manera que la(s) columna(s) seleccionada(s) pueda(n) cambiarse. Permite guardar las estadísticas calculadas en columnas de la hoja de datos. Muestra lista completa de tablas de salida disponibles para ese procedimiento estadístico. escalas y otras características de la gráfica maximizada. como se explica en el Capítulo 5. Selecciona diferentes opciones a aplicarse solo en la tabla o gráfica maximizada. Selecciona diferentes opciones a aplicarse en todas las tablas y gráficas del procedimiento actual. Las acciones de cada uno de los primeros siete íconos empezando por la izquierda se mencionan a continuación: Nombre Captura Tablas Gráficos Guardar resultados Opciones de Análisis Opciones de Ventana Opciones Gráficas Función Presenta el cuadro para la captura de datos. Figura 1-25.Los íconos en la Barra de Herramientas de Análisis son muy importantes. si el ícono de Gráficos se presiona. Listado de Gráficos Disponibles Seleccionando la opción de Histograma y pulsando Aceptar se agrega un tercer panel al lado derecho de la ventana de análisis: Figura 1-27. Panel de Histograma agregado a la Veantana de Análisis del Análisis de Una Variable 25/ Comenzando .Figura 1-26. esto es una característica de datos sesgados postiviamente. Opciones de Ventana para el Histograma Usando el cuadro de opciones. puede modificar el número de barras en el histograma. el histograma reflejará los cambios seleccionados: 26/ Comenzando . Si da doble-clic en el histograma para maximizarlo y después pulsa el ícono de Opciones de Ventana.Note que las barras en el histograma se extienden un poco más por arriba del pico que por abajo. Si el Número de Clases se establece en 15 y luego se presiona el botón de Aceptar. así como el rango que abarcan. se muestra un cuadro de diálogo con opciones específicas para el histograma: Figura 1-28. Figura 1-29. En este se presenta un cuadro de diálogo con diferentes pestañas que le permiten modificar la mayoría de las características de la gráfica. se desplegará lo siguiente: 27/ Comenzando . Si hace clic en la pestaña de Relleno. Histograma de Frecuencias después de Cambiar el Número de Clases Puede también cambiar el tipo de relleno y/o el color de las barras en el histograma pulsando el ícono de Opciones Gráficas. Figura 1-30. 28/ Comenzando . Esto presenta un menú de las operaciones disponibles. NOTA: Las operaciones de la mayoría de los íconos de la barra de herramientas de análisis también se puede tener acceso a ellas pulsando el botón secundario del ratón en el panel que contenga la tabla o la gráfica. Cuadro de Opciones Gráficas Haciendo clic en el botón circular #1 y después seleccionando un Nuevo Tipo de Relleno o Color cambiará el aspecto de las barras en el histograma. El StatReporter. o haga clic en un panel específico con el botón secundario del ratón y seleccione Imprimir del menú desplegado para imprimir una tabla o una gráfica única. los resultados pueden ser diseminados de diferentes formas. Pulse Clic en la tabla o la gráfica que desea copiar y seleccione Copiar del menú de Editar. descrito en el Capítulo 7. 29/ Comenzando .1. Publicar los resultados para ser Seleccionar StatPublish desde el menu vistos en la red de internet. Guardar una gráfica en un archivo Maximizar la gráfica que será de imagen. Archivo. Estos incluyen: Acción Imprimir los resultados. Ahora seleccione Guardar Gráficos del menú Archivo.7 Diseminando los Resultados Una vez que el análisis ha sido efectuado. Método Pulse el botón de imprimir en la barra de herramientas principal para imprimir todas las tables y gráficas. Métodos de Diseminación de los Resultados del Análisis Cada una de las operaciones mencionadas se describen a detalle en capítulos posteriores. Se mostrará un cuadro de diálogo en donde especificará la ubicación a donde quiere guardar la salida con formato HTML. puede ser guardado como archivo con formato RTF para exportarlo en procesadores de palabras tales como Microsoft Word.. Guardar el análisis en un reporte. Pulse el botón secundario del ratón y seleccione Copiar Análisis al StatReporter. Copiar el resultado a otra aplicación. Luego active la otra aplicación y seleccione Editar – Pegar. guardada. Figura 1-31. 30/ Comenzando . asegúrese de mover los archivos de datos también. NOTA #2: Los datos y el StatFolio son guardados en archivos diferentes. automáticamente leerá las variables de datos y recalculará el análisis. Cualquiera de las opciones utilizadas para ese análisis serán conservadas. Si uno abre un StatFolio en una fecha posterior.1.8 Guardando su Trabajo Puede guardar la sesión de trabajo actual en cualquier momento seleccionando Guardar StatFolio desde el menú de Archivo y capturando un nombre de archivo: Figura 1-32. incluyendo los apuntadores a los archivos o bases de datos que contienen los datos que queremos analizar. Sin necesita mover un StatFolio de una computadora a otra. los análisis cambiarán reflejando los nuevos valores. NOTA #1: Si el archivo de datos se actualiza entre el momento que se genera un Statfolio y cuando se vuelve a abrir. Guardando un StatFolio Un StatFolio consiste en el conjunto de instrucciones que uno efectúa para crear los diferentes análisis en una sesión de trabajo. Esto ofrece un método muy sencillo para efectuar corridas repetitivas de análisis que necesiten ser calculados de manera periódica sin tener que crearlos cada vez. Cada fila representa un caso o una observación. Por ejemplo. Figura 2-1. Cada columna en la hoja de datos representa una variable. Una hoja de datos es un arreglo rectangular de filas y columnas.Capítulo Manejo de Datos 2 Accesando datos desde archivos y bases de datos. transformando valores de los datos y generando series de datos. la hoja de datos inferior contiene información sobre distintas marcas y modelos de automóviles. Una Hoja de Datos 31/ Manejo de Datos . El Libro de Datos es una ventana etiquetada. estos deben colocarse primero en el Libro de Datos STATGRAPHICS Centurion. que consiste de 10 hojas de datos. Para analizar datos en el STATGRAPHICS Centurion. Este Capítulo describe toda la información que necesita saber acerca de los datos en el STATGRAPHICS Centurion. existe una columna identificando la marca de cada automóvil. una columna identificando su tipo. Cada columna tiene un nombre y un tipo asociado a la misma. El nombre se usa para identificar los datos a utilizar en un análisis estadístico. Por ejemplo. 2.1 El Libro de Datos Cada columna en la hoja de datos STATGRAPHICS Centurion representa una variable diferente. El tipo afecta la manera en que serán analizados. dar doble clic en el nombre de la columna para mostrar el cuadro de diálogo Modificar Columna: 32/ Manejo de Datos . incluyendo cómo accesarlos. También asociado a cada columna existe un comentario opcional. Las variables normalmente son atributos ó medidas asociadas con los conceptos que definen las filas de la hoja de datos.amstat. columnas conteniendo las millas recorridas por galón manejando en ciudad ó carretera. y cómo usarlos en un análisis estadístico.html) y su uso ha sido autorizado. Nota: los datos fueron obtenidos del Journal of Statistical Education Data Archive (www. en la hoja de datos 93cars. columnas conteniendo el largo. el cual se usa para proveer información adicional sobre el contenido de una columna. ancho y alto del automóvil e información similar. Para mostrar o cambiar las propiedades de cualquier columna en una hoja de datos. manipularlos.org/publications/jse/jse_data_archive. Figura 2-2. Cuadro de Diálogo Utilizado para modificar las Propiedades de una Columna Usted deberá especificar: 1. Cuando realice análisis estadísticos. Se permiten espacios en los nombres de variables. Los nombres no son sensibles a las mayúsculas.. los nombres no deben empezar con números.><~!&. Cada columna en la hoja de datos debe tener un nombre único. aunque otras columnas en distintas hojas de datos pueden tener uno similar. Nombre: de 1 a 32 caracteres. Los nombres pueden incluir cualquier caracter exceptuando los siguientes 19: ‘“. las columnas son identificadas usando estos nombres.+-*/^=|( ) Los caracteres restringidos son aquellos que se necesitan cuando se usan expresiones algebraicas tales como: 100*(MPG en Ciudad/MPG en Carretera) Adicionalmente. 33/ Manejo de Datos . ya sea años de 4 dígitos (4/30/2005) ó uno de 2 dígitos (4/30/05). Tipos de Columna Contenido Cualquier número válido. STATGRAPHICS Centurion distingue las configuraciones actuales de Windows para: 1. Cuando capture datos. minuto y segundo Mes. 34/ Manejo de Datos . si intenta escribir un nombre en una columna numérica este será rechazado. día.14 Chevrolet 105 4/30/05 4/05 T2/05 3:15 3:15:53 4/30/05 3:15 Mes.10 MPG_C / MPG_H Calculada de otras columnas Cuando capture sus datos en una hoja de datos. día y año Mes y año Trimestre y año Hora y minuto Hora. Cuando capture una fecha. año. minuto y 4/30/05 3:15:53 segundo Número con hasta 9 decimales 34.Preferencias. Tipo: clase de dato permitido en la columna.2. día. el formato de los mismos también deben coincidir con su configuración actual de Windows. hora y minuto Ejemplo 3. año. 3. proveyendo información adicional del contenido de la columna. Comentario: de 0 a 64 caracteres. deberá usar el formato especificado en el cuadro de diálogo de Editar. hora. Separador de decimales para valores numéricos 2. estos deben coincidir con el tipo de columna en donde son capturados. Particularmente. Formato de fecha corto y separador para fechas Para ver las configuraciones de su computadora entre al Panel de Control de Windows. Formato de tiempo y separador de tiempo para horarios 3. Si se usa un año de 2 dígitos se asume que puede ir desde 1950 hasta 2049. Por ejemplo. Los siguientes tipos deben especificarse: Tipo Numérico Caracter Entero Fecha Mes Trimestre Horario (HH:MM) Horario (HH:MM:SS) Fecha-Horario (HH:MM) Date-Horario (HH:MM:SS) Decimales Fijos Fórmula Figura 2-3. Un condición alfanumérica Un número entero Mes. Efectuando una consulta SQL para obtener los datos desde una base de datos: Si los datos residen en una base de datos ODBC. Copiar y pegar usando el portapapeles de Windows: Si usted tiene los datos cargados en un programa como Excel. seleccione cualquiera de las 10 hojas de datos en el Libro de Datos dando clic en su etiqueta.Más información sobre las columnas de fórmula será tratada posteriormente en la sección Manipulando los Datos de éste mismo Capítulo. 3.1 Leyendo Datos de un Archivo STATGRAPHICS Centurion Para leer datos que ya han sido guardados en un archivo STATGRAPHICS Centurion. 2. Luego seleccione Archivo – Abrir – Abrir Datos y especifique Archivo de Datos STATGRAPHICS en el cuadro de diálogo que se muestra a continuación: 35/ Manejo de Datos .2. Más comúnmente. . los usuarios accesarán datos que ya existen en otros archivos o aplicaciones. archivos de texto ASCII delimitados. como Oracle o Microsoft Access. archivos XML y archivos STATGRAPHICS. estos pueden ser recuperados seleccionando Archivo – Abrir Datos y luego Búsqueda ODBC. usted puede copiarlos en la hoja de datos seleccionando Archivo – Abrir – Abrir Datos y luego Archivo de Datos Externo. Leer un archivo de datos existente: Si los datos han sido previamente capturados en un archivo. 2. incluyendo Excel XLS. Hay 3 formas básicas de poner datos existentes en una hoja de datos del STATGRAPHICS Centurion: 1. Esto le permite leer datos guardados en archivos de diferentes formatos. 2. usted puede copiarlos fácilmente al portapapeles de Windows y luego pegarlos en el STATGRAPHICS Centurion seleccionando Editar– Pegar.2 Acceso a los datos El Capítulo 1 muestra cómo los datos pueden ser capturados a una hoja de datos manualmente. 36/ Manejo de Datos . Seleccionando un Archivo de Datos STATGRAPHICS. Usted puede leer archivos del STATGRAPHICS Centurion ó de cualquier versión previa del STATGRAPHICS.Figura 2-4. Origen de los Datos Después de pulsar Aceptar. incluyendo el STATGRAPHICS Plus. Los datos en el archivo reemplazarán a los que actualmente contiene la hoja de datos seleccionada. seleccione el archivo STATGRAPHICS deseado: Figura 2-5. ASCII. seleccione el archivo deseado: Figura 2-7. XML o Externo Para leer datos que han sido guardados en un archivo creado por otra aplicación. seleccione cualquiera de las 10 hojas de datos en el Libro de Datos dando clic en su etiqueta. Seleccionando un Archivo de Datos Excel 37/ Manejo de Datos .2. Seleccione Archivo – Abrir – Abrir Datos y especifique Archivo de Datos Externo en el cuadro de diálogo mostrado a continuación: Figura 2-6.2 Leyendo Datos de un Archivo Excel.2. Origen de los Datos Después de pulsar Aceptar. 38/ Manejo de Datos .dat) – lee un archivo de texto ASCII que contenga datos delimitados o datos arreglados en columnas uniformes. el cuadro de diálogo será como el que se nuestra a continuación: Figura 2-8. 2. Encabezado de la Columna – información contenida en las 2 primeras filas del rango especificado.xls) – lee una hoja seleccionada de un libro de Microsoft Excel. Las opciones más comunes son: 1.csv. 2. Número de Hoja – número de la hoja de cálculo en el libro de trabajo de Excel que será leída. Si no se contienen nombres en la hoja de cálculo de Excel. 3. Archivos Excel (*.Utilice la lista del Tipo de archivo para especificar el formato del archivo a leer.txt.*. Las dos filas inmediatamente arriba de los datos a leer deben contener nombres de columna y/o comentarios. Opciones para un Archivo de Datos Excel Especifique: 1. Las hojas sólo podrán ser leídas de una en una.*. se mostrará un cuadro de diálogo para obtener información adicional de los datos en el archivo. Archivos de Texto (*.xml) – lee datos de un archivo en formato XML Despúes de seleccionar el nombre del archivo. entonces se generarán nombres predeterminados. XML (*. Si el archivo seleccionado es un libro de trabajo Excel. En el lado de STATGRAPHICS Centurion. como NA. los nombres de columna y comentarios también pueden ser transferidos. si los datos residen en un archivo de Excel. 4. Cada columna será escaneada y se le asignará el tipo de columna apropiado. Cuando los datos son pegados en una columna de una hoja de datos.3. los datos están listos para ser analizados. La información hasta arriba del portapapeles será entonces pegada en el(los) renglón(es) del encabezado. seleccionar los datos a copiar. en caso de que estén presentes. En caso de encontrar un nombre de columna inválido. Valor Faltante – cualquier símbolo especial usado en la hoja de cálculo de Excel para indicar datos faltantes. 39/ Manejo de Datos .2. Las celdas que contengan el valor especificado serán convertidas en celdas vacías cuando se coloquen en la hoja de datos STATGRAPHICS Centurion. Nota: si el archivo de Excel contiene nombres de columna pero no comentarios. Ahora sí. Al regresar al STATGRAPHICS. Por ejemplo. haga clic en el renglón de encabezado de la hoja de datos del STATGRAPHICS Centurion antes de seleccionar Pegar.3 Transferir Datos usando Copiar y Pegar El modo más fácil de transferir datos de otra aplicación a STATGRAPHICS Centurion usualmente es vía el portapapeles de Windows. Fila Inicial y Final – el rango de filas de la hoja de cálculo que serán leídas. 2. los datos serán pegados directamente en una hoja de datos del STATGRAPHICS seleccionando Pegar del menú Editar del STATGRAPHICS. se deberá correr Excel. Incluya los nombres de columna y los comentarios en Excel cuando copie datos al portapapeles. Cuando pulse Aceptar. la información será copiada al portapapeles. Cuando se copien y peguen datos. seleccione Editar – Propiedades del Libro de Datos del menú de STATGRAPHICS Centurion y deshabilite la opción Mostrar comentarios de las variables antes de pegar los datos. la información del archivo Excel se leerá en el STATGRAPHICS Centurion. STATGRAPHICS Centurion automáticamente escanea los datos y selecciona el tipo adecuado para la columna. Este rango debe incluir los nombres de las variables y sus comentarios. los símbolos reservados serán subrayados. ir al menú Editar y dar clic en Copiar. primero seleccione Archivo – Abrir – Origen de los Datos. Especificará un filtro para limitar los registros recuperados. 40/ Manejo de Datos .2. Especificará un modo de ordenar los resultados.3 Manipulando los Datos Una vez que los datos han sido colocados en una hoja de datos del STATGRAPHICS Centurion. 2. Una consulta SQL es entonces construida y los resultados son colocados en la hoja de datos activa en STATGRAPHICS. 3. Para acceder datos de una base de datos. Columnas adicionales pueden ser creadas desde columnas existentes. Cuadro de Diálogo Origen de los Datos Una secuencia de cuadros de diálogo adicionales será mostrada en las cuales usted: 1. Los datos pueden ser copiados y pegados en otras locaciones. Información detalláda sobre como elaborar consultas ODBC puede ser encontrada en el archivo PDF titulado Archivos de Datos y StatLink.2. Luego seleccione Consultar Base de Datos del cuadro de diálogo inicial: Figura 2-9. 4. estos pueden ser manipulados de importantes y diversas formas: 1. Seleccionará los campos a transferir. Seleccionará el nombre de la base de datos a leer. 2. ú otra usando ODBC.4 Consultando una Base de Datos ODBC STATGRAPHICS Centurion también le permite leer datos de una base de datos Oracle. Access. 2. 3. Datos pueden ser transformados usando una expresión algebraica o una función matemática. 4. La hoja de datos puede ser ordenada de acuerdo a una o más columnas. 5. Los valores de los datos pueden ser recodificados para formar grupos o por otras razones. 6. Los datos extendidos sobre varias columnas pueden ser reorganizados en una sola columna si un procedimiento estadístico lo requiere. Estas operaciones básicas se describen a continuación. 2.3.1 Copiando y Pegando Datos La hoja de datos STATGRAPHICS Centurion soporta muchas operaciones normales de una hoja de cálculo, incluyendo cortar, copiar, pegar, insertar y eliminar. El factor importante a recordar cuando se usen estas operaciones es que cada columna tiene un tipo específico. Si usted pega inadvertidamente caracteres de datos en una columna numérica, STATGRAPHICS Centurion cambiará el tipo de esa columna para acomodar los nuevos datos. Siempre que usted tenga una duda sobre el tipo de columna, haga clic en el encabezado de la columna para mostrar el cuadro de diálogo Modificar Columna. Usted puede cambiar el tipo de columna utilizando ese cuadro de diálogo. 2.3.2 Creando Nuevas Variables desde Columnas Existentes STATGRAPHICS Centurion tiene una amplia gama de operadores para asistir en la ejecución de cálculos matemáticos. Uno de los usos más importantes de estos operadores en el análisis de datos es para crear nuevas variables basadas en columnas existentes. En el STATGRAPHICS Centurion, nuevas variables pueden ser creadas: 1. “Al vuelo” directamente dentro de los campos de captura de datos en los cuadros de diálogo, sin guardar la variable en la hoja de datos. 2. Creando una nueva columna en cualquiera de las 10 hojas de datos en el Libro de Datos. Por ejemplo, suponga que se desea información sobre la razón calculada de las millas por galón manejando en ciudad vs las millas por galón manejando en carretera de cada automóvil en el 41/ Manejo de Datos archivo 93cars. Dicho archivo contiene 2 columnas separadas, una nombrada MPG City y otra nombrada MPG Highway. Para resumir la distribución de las razones, usted puede seleccionar el procedimiento Análisis de una Variable y especificar la razón directamente en el campo de datos en el Cuadro de Diálogo: Figura 2-10. Creando una Transformación “Al Vuelo” Cuando se pulse ACEPTAR, se generará un análisis de la razón matemática multiplicada por 100, sin cambiar los datos en la hoja de datos: 42/ Manejo de Datos Figura 2-11. Análisis de una Variable de Datos Transformados La razón promedio es aproximadamente 76.3%, con rango de un mínimo de 64% a un máximo de 93.9%. La posibilidad de realizar análisis sin modificar la hoja de datos es muy importante para facilitar la exploración de los datos. Si se desea, una nueva columna puede ser creada en la hoja de datos conteniendo los valores transformados. Por ejemplo, usted puede regresar a la ventana que contiene los datos de 93cars dando doble clic en la columna con el encabezado etiquetado Col_27. El cuadro de diálogo Modificar Columna puede ser entonces utilizado para definir una nueva variable de tipo fórmula con la transformación deseada: 43/ Manejo de Datos Figura 2-12. Creando una Columna de Fórmula Esto creará una nueva variable cuyos valores son calculados de las dos columnas originales que contienen los datos de las millas por galón. Las columnas de Fórmula se muestran en la hoja de datos usando una escala gris, desde que son automáticamente calculadas de otras columnas: 44/ Manejo de Datos Figura 2-13. Apariencia de una Columna de Fórmula en la Hoja de Datos Si los valores en la columna MPG City o MPG Highway cambian, MPG Ratio será automáticamente recalculada para reflejar esos cambios. NOTA: el recalculo de una columna fórmula normalmente no ocurre hasta que los datos en esas columnas son necesarios para un cálculo, o se guarda o imprime. Usted puede forzar un recalculo inmediatamente seleccionando Actualizar Fórmulas del menú Editar. 2.3.3 Transformando Datos STATGRAPHICS Centurion también contiene un gran número de funciones matemáticas que pueden ser usadas para transformar datos existentes. Así como al crear nuevas variables, las transformaciones se pueden hacer ya sea dentro de los campos de datos en los cuadros de diálogo ó creando nuevas columnas en la hoja de datos. Por ejemplo, suponga que se desea graficar las millas por galón que obtuvo un vehículo vs el logaritmo natural de su peso. Seleccionamos el procedimiento Gráfico X-Y del menú principal se mostrará el siguiente cuadro de diálogo para capturar datos: 45/ Manejo de Datos usted deberá teclear una expresión del STATGRAPHICS Centurion. como se describe en el documento PDF Operadores STATGRAPHICS. Transformando Datos en un Cuadro de Diálogo de Captura de Datos En lugar de teclear el nombre de una columna en el campo de datos. Una amplia variedad de operadores están disponibles. La tabla siguiente muestra los operadores comúnmente usados: Operador + / * ^ ABS AVG DIFF EXP LAG LN LOG MAX MIN 46/ Manejo de Datos Uso Suma Resta División Multiplicación Exponencial Valor Absoluto Promedio Diferencias Sucesivas Función Exponencial Retraso por k periodos Logaritmo Natural Logaritmo base 10 Máximo Mínimo Ejemplo X+100 X-100 X/100 X*100 X^2 ABS(X) AVG(X) DIFF(X) EXP(10) LAG(X. Las expresiones del STATGRAPHICS Centurion son fórmulas que operan en los datos usando símbolos algebraicos y operadores especiales.k) LN(X) LOG(X) MAX(X) MIN(X) .Figura 2-14. Las expresiones no son sensibles a las mayúsculas y tampoco es relevante la inclusión de espacios en blanco.MIN(Weight) ) Los paréntesis son necesarios para asegurar que las restas sean efectuadas antes que los cocientes. Cuadro de Diálogo mostrado al usar el botón Transformar 47/ Manejo de Datos .SD Desviación Estándar SQRT Raíz Cuadrada STANDARDIZE Conversión a valores Z SD(X) SQRT(X) STANDARDIZE(X) Figura 2-15. Operadores STATGRAPHICS Normalmente Usados Cuando se elabora una expresión STATGRAPHICS Centurion . las siguientes expresiones convierten cada valor en la columna Weight en una fracción igual a la distancia entre los valores máximos y mínimos. se pueden combinar diferentes operadores usando reglas algebraicas básicas de precedencia. Por ejemplo. como en la Figura 2-14. un cuadro de diálogo similar al que se muestra abajo aparecerá: Figura 2-16. entre todos los automóviles: ( Weight – MIN(Weight) ) / ( MAX(Weight) . Cada cuadro de diálogo de captura de datos incluye un botón etiquetado como Transformar. Si usted coloca el cursor en un campo de datos y luego presiona Transformar. en caso de que no recuerde que operadores usar. Este botón puede ser usado para ayudar a crear una expresión STATGRAPHICS Centurion. Después de remplazar los signos de interrogación por nombres de columnas ó números. dicha transformación será usada cuando el procedimiento se corra: Figura 2-17. similares a la ilustración en la sesión anterior. con una indicación del número de argumentos que deben ser proporcionados.En la parte derecha hay una lista de todos los operadores STATGRAPHICS Centurion. 48/ Manejo de Datos . como en la Figura 2-14. usted puede pulsar el botón Mostrar para ver los primeros valores generados por la expresión u pulsar el botón de ACEPTAR para tener la expresión capturada en el cuadro de diálogo de captura de datos. Dando clic en el nombre del operador lo coloca en el campo Expresión. Procedimiento Gráfico X-Y usando valores Transformados de Weight Los operadores STATGRAPHICS Centurion también pueden ser utilizados al crear nuevas columnas fórmula. Una vez que una transformación se ha especificado en el cuadro de diálogo de captura de datos. NOTA: No necesita utilizar el botón Transformar si usted prefiere teclear la expresión directamente en el cuadro de diálogo de captura de datos. para ordenar los datos en el archivo 93cars de acuerdo a las millas por galón. Ordenando primero por MPG City y luego por MPG Highway los datos se ordenan primero tomando los valores de la columna de mpg en la ciudad y después las mpg en carretera para automóviles con el mismo valor de MPG City: 49/ Manejo de Datos .4 Ordenando Datos El Contenido de una hoja de datos puede ser ordenado resaltando la columna o columnas a usar para definir el orden y luego seleccionando Ordenar Archivo del menú Editar. Cuadro de Diálogo de Opciones de Ordenamiento Usted puede establecer tanto una o dos columnas en las cuales basar el ordenamiento. así como también el tipo de ordenamiento. El siguiente cuadro de diálogo se mostrará: Figura 2-18. Por ejemplo.3. resalte las columnas nombradas MPG City y MPG Highway y luego seleccione Ordenar Archivo.2. luego seleccione Recodificar Datos del menú Editar. El ordenamiento sólo cambia la manera en que se muestran los renglones en la hoja de datos.5 Recodificando Datos En algunas ocasiones es conveniente recodificar los datos.sf6 después del ordenamiento NOTA: Los procedimientos estadísticos no requieren que se ordenen los datos antes de usarlos. Aparecerá el siguiente cuadro de diálogo: 50/ Manejo de Datos . el archivo en el disco no cambia al realizar un ordenamiento salvo que vuelva a guardar los datos.Figura 2-19. A su vez. ya sea agrupándolos en grupos similares o asignándoles nuevas etiquetas. estos lo hacen automáticamente en caso necesario. Archivo 93cars. haga clic en el encabezado de la columna a recodificar.3. Para recodificar una columna de datos. 2. Figura 2-20. Cuadro de Diálogo para Recodificar Datos Por ejemplo en la columna llamada Domestic en el archivo 93cars contiene un 1 para cada coche fabricado en los E.U.A. y un 0 para los otros autos. Para cambiar todos los 0 en la columna por “Foreign” y todos los 1 por “U.S.”, el cuadro de diálogo superior puede usarse. Hasta 7 rangos de valor pueden especificarse al mismo tiempo para recodificación. El Documento PDF titulado Menú de Edición contiene una discusión detalláda de 2 ejemplos de recodificación. 2.3.6 Combinando Varias Columnas Muchos procedimientos estadísticos en STATGRAPHICS Centurion esperan que los datos a analizar estén en una sola columna. A veces los datos no se encuentran en tal formato. Como simple ejemplo, suponga que tiene una muestra de 12 observaciones, arregladas en 4 columnas como sigue: 51/ Manejo de Datos Figura 2-21. Muestra de Datos en Diferentes Columnas Para colocar estos datos en una sola columna se podrían realizar operaciones contínuas de copiar y pegar. Pero una solución más simple es usar el procedimiento Estadísticas por Filas , que se encuentra bajo Describir-Datos Numéricos si esta usando el menú clásico y debajo de Analizar-Datos Contínuos-Comparación de Varias Muestras si esta utilizando el menú Seis Sigma. Este procedimiento presenta primero un cuadro de diálogo de captura de datos solicitando los nombres de las columnas que contienen los datos: 52/ Manejo de Datos Figura 2-22. Cuadro de diálogo para captura de datos para Estadísticas por Filas Luego muestra estadísticas para cada fila de datos: 53/ Manejo de Datos Figura 2-23. Ventana de Análisis de las Estadísticas por Filas La línea de Total en el recuadro del Resúmen Estadístico muestra estadísticas para los datos combinados. Si usted ahora presiona el botón Guardar Resultados en la barra de herramientas de análisis, puede guardar la muestra combinada en una hoja de datos de una sola columna: 54/ Manejo de Datos Figura 2-24. Cuadro de Diálogo para Guardar Resultados en Estadísticas por Filas Cada resultado que usted indique será guardado en una columna diferente, asignándole el nombre correspondiente a las Variables Destino. Guardar tanto la Columna de Datos como la Columna de Códigos crea la siguiente estructura de datos: 55/ Manejo de Datos 2.1 Generando Patrones de Datos Varios procedimientos en el STATGRAPHICS Centurion. Esta sección describe dos ejemplos importantes: 1. 2. Generación de datos con secuencias simples. junto con una o más columnas de códigos identificando los factores explicativos.Figura 2-25. 2. Por ejemplo. Nuevas Columnas Creadas al usar Estadísticas por Filas Los 12 datos ahora se encuentran en una sola columna y listos para usarse en otros procedimientos estadísticos. considere los datos en la siguiente tabla de dos vías: 56/ Manejo de Datos .4. esperan que los datos a analizar se encuentren en una sola columna de una hoja de datos. Generación de números aleatorios. particularmente aquellos que realizan un análisis de varianza.4 Generación de Datos STATGRAPHICS Centurion tiene la capacidad de generar datos y colocarlos en columnas de la hoja de datos. La tercera columna contiene todas las observaciones. Para crear tal archivo. es necesario que sean colocados en una hoja de datos con el siguiente formato: Figura 2-26. Por ejemplo.Mezcla 1 2 3 4 Tratamiento 1 75 78 77 75 Tratamiento 2 82 85 84 85 Tratamiento 3 91 93 92 96 Para analizar estos datos usando el procedimiento ANOVA Multifactorial . los números de la mezcla pueden ser generados dando clic en el encabezado de la columnas #1 y luego 57/ Manejo de Datos . Sin embargo. debido a que las columnas siguen secuencias simples. Estructura de Datos Deseada Las dos primeras columnas indican los niveles de los factores correspondientes a cada valor de los datos. la solución más fácil es capturar manualmente las dos primeras columnas. usted puede generarlas usando operadores especiales del STATGRAPHICS Centurion. En la expresión mostrada anterriormente. seleccionando Generar Datos del menú Editar.4. y capturando lo siguiente: 58/ Manejo de Datos . En este caso. hasta. en el cual se ha capturado una expresión: Figura 2-27. Esto muestra el siguiente cuadro de diálogo. se utilizan dos operadores importantes: COUNT(desde. REP(X. en intervalos iguales a por. por) – genera valores comenzando en desde y terminando en hasta. Generando Números de la variable Blend La opción Generar Datos evalúa la expresión del STATGRAPHICS Centurion y coloca el resultado en la columna seleccionada. y 4.seleccionando Generar Datos del menú Editar. Por lo tanto COUNT(1. Los valores de los Tratamientos pueden ser generados de manera similar dando clic en el encabezado de la columna #2.1) genera los enteros 1. 3. 2. cada entero entre 1 y 4 es repetido 3 veces. repeticiones) – repite en grupos cada valor contenido en X tantas veces como el número en repeticiones. lognormal. los números aleatorios deben ser generados desde el procedimiento Distribuciones de Probabilidad. En este caso la secuencia 1. normal. estos pueden ser generados dentro de una hoja de datos dando clic en un encabezado de columna. Generando los Códigos de los Tratamientos Esta expresión utiliza un operador adicional: RESHAPE(X. Este generador de secuencias puede ser muy útil cuando el archivo de datos a crear es grande. 59/ Manejo de Datos . 2. Para otras distribuciones.4. 2. Si los números provienen de una distribución exponencial. y capturar la expresión correspondiente del STATGRAPHICS. 3 es repetida 4 veces. uniforme o Weibull.2 Generando Números Aleatorios Los números aleatorios pueden generarse de dos formas en el STATGRAPHICS Centurion: 1.Figura 2-28. gamma. 2. seleccionando Generar Datos del menú Editar. tamaño) – repite los valores en X en forma circular hasta haber generado el número de datos en tamaño. Particularmente.Como ejemplo. Generando Números Aleatorios de una Distribución Normal La sintaxis del operador RNORMAL es: RNORMAL(n. Luego seleccione Generar Datos del menú Editar y complete el cuadro de diálogo como se muestra a continuación: Figura 2-29. sigma) – genera n números pseudo-aleatorios de una distribución normal con una media mu y una desviación estándar sigma. nos ha enseñado cómo leer datos de archivos y . Haga clic en el encabezado de una columna vacía en cualquier hoja de datos para seleccionar esa columna.5 Propiedades del Libro de Datos 60/ Manejo de Datos Este Capítulo ha descrito numerosos aspectos importantes del manejo de datos en el STATGRAPHICS Centurion. La sintaxis de los otros generadores de números aleatorios esta contenida en el documento PDF titulado Operadores STATGRAPHICS Centurion. 2. Pulse ACEPTAR para generar los números aleatorios y colocándolos en la columna seleccionada. mu. suponga que 100 números aleatorios son deseados de una distribución normal con una media de 20 y una desviación estándar igual a 2. el estado de las hojas de datos puede ser mostrado activando la ventana del Libro de Datos y seleccionado Propiedades del Libro de Datos del menú Editar o seleccionando StatLink del menú Archivo: Figura 2-30. En cualquier momento. Estas importantes características son descritas en el Capítulo 5.bases de datos y cómo manipular esos datos una vez que se encuentran en una hoja de datos del STATGRAPHICS Centurion. 61/ Manejo de Datos . Es también posible definir una lectura de los datos a intervalos regulares y tener los procedimientos estadísticos actualizados automáticamente. Cuadro de Diálogo de Propiedades del Libro de Datos Este cuadro de diálogo muestra el origen de los datos en cada hoja de datos. las hojas de datos pueden ser restringidas a sólo de lectura por lo que los datos en ellas no pueden ser cambiados inadvertidamente. Si se desea. Los campos en este cuadro de diálogo se utilizan para especificar las variables a analizar. el título predeterminado. Para modificar tablas o gráficas de forma individual. cambiando datos de captura y guardando resultados. etc. seleccionando opciones. 3 Existen más de 150 selecciones estadísticas en el menú principal del STATGRAPHICS Centurion. se maximiza el panel correspondiente y se selecciona Opciones de Ventana en la barra de herramientas de análisis. 5. los valores predeterminados se consideran para todas las opciones en el análisis. 2. 6. tablas o gráficas adicionales pueden solicitarse pulsando los botones de Tablas ó Gráficas en la barra de herramientas de análisis.Capítulo Elaborando Análisis Estadísticos Generando un análisis. Si se desean. se muestra un cuadro de diálogo de captura de datos. Cuando se corre por primera vez. Cada selección accede a un procedimiento estadístico diferente. 62/ Elaborando Análisis Estadísticos . pueden modificarse dando doble clic en la gráfica para maximizarla y luego seleccionando Opciones Gráficas en la barra de herramientas de análisis. 3. Sin embargo todos los procedimientos trabajan de la misma forma básica: 1. obteniendo como respuesta que todas las tablas y gráficas en la ventana de análisis sean actualizadas. Cuando un análisis es seleccionado del menú. 4. tipos de puntos. la escala. Los datos especificados entonces son leídos y analizados. Estas opciones pueden ser modificadas usando el botón Opciones de Análisis en la barra de herramientas de análisis. fuentes. una nueva ventana de análisis es creada con un conjunto de análisis tabulares y gráficos predeterminados. Para las gráficas. seleccionando tablas y gráficas adicionales. publicadas como archivos HTML. y por lo menos un punto parece ser un potencial dato aberrante. Es evidente una no-linealidad en la relación. La finalidad del análisis es construir un modelo estadístico que relacione las millas por galón conseguidas manejando en ciudad con su peso para los n = 93 automóviles en el archivo 93cars. Un gráfico de dispersión de los datos se muestra a continuación: Gráfico de MPG City vs Weight 55 45 MPG City 35 25 15 1600 2100 2600 3100 Weight 3600 4100 4600 Figura 3-1. o guardadas en el StatReporter. copiadas a otras aplicaciones cómo Microsoft PowerPoint. Las tablas y gráficas pueden ser impresas. El modelo más simple para relacionar una variable dependiente Y con una variable independiente X es la forma lineal 63/ Elaborando Análisis Estadísticos . 9. En este capítulo.7. Gráfico X-Y de Millas por Galón Manejando en Ciudad vs Peso en Libras Como era de esperarse. las millas por galón están negativamente correlacionadas con el peso del vehículo. 8. Los resultados numéricos pueden ser guardados en columnas de cualquier hoja de datos usando el botón Guardar Resultados de la barra de herramientas de análisis.sf6. para su uso posterior. se describe a detalle un análisis típico. El análisis completo puede ser guardado en disco cómo un StatFolio. El procedimiento básico para ajustar un modelo estadístico relacionando dos variables en el STATGRAPHICS Centurion es el procedimiento de Regresión Simple. Dicho procedimiento se ajusta a modelos lineales y no lineales. bajo Mejorar – Análisis de Regresión – Un Factor.Y=a+bX Donde b equivale a la pendiente de la línea y a equivale a la intersección en Y. Cuadro de Diálogo de Captura de Datos de Regresión Simple Los dos primeros campos son requeridos: 64/ Elaborando Análisis Estadísticos . bajo Relacionar – Un Factor. Modelos 3. Si se utiliza el menú clásico. Curvilíneos tales como el modelo exponencial Y = exp(a + b X) pueden usarse si la relación es no lineal.1 Cuadros de Diálogo para Captura de Datos El procedimiento Regresión Simple se localiza en el menú principal: 1. 2. Si se utiliza el menú Seis Sigma. Comienza mostrando un típico cuadro de diálogo de captura de datos: Figura 3-2. Selecciona solo filas que cumplan con ambas condiciones. Selecciona filas cuyo valor en la columna binaria no sea igual a 0. Selecciona solo filas cuya columna es menor al valor. Por ejemplo. usted puede capturar ya sea el nombre de la columna (como MPG City) o una expresión STATGRAPHICS Centurion (cómo LOG(MPG City). la hoja de datos deseada. Selecciona solo filas que cumplan al menos con una condición. Selecciona un conjunto aleatorio de k filas. Selecciona solo filas cuya columna es igual al valor.Weight El campo Seleccionar puede ser usado para seleccionar un subconjunto de las filas en la hoja de datos. Selecciona solo filas cuya columna es mayor o igual al valor. = “Ford” Domestic Figura 3-3. usted deberá capturar el nombre como A. incluyendo.Y: La variable dependiente o de respuesta.fin) RANDOM(k) Columna < valor Columna <= valor Columna > valor Columna >= valor columna= valor columna <> valor condición1 & condición2 condición1 | condición2 columna binaria Uso Selecciona los primeros k filas. Selecciona los últimos k filas. X: La variable independiente o predecible. Selecciona solo filas cuya columna es mayor al valor. En los campos de captura de datos. Selecciona solo filas cuya columna es menor o igual al valor. Selecciona solo filas cuya columna es desigual al valor.) Si más de una hoja de datos contiene una columna con el nombre indicado. Los comandos típicos utilizados en el campo Seleccionar son: Entrada FIRST(k) LAST(k) ROW (inicio. Ejemplo FIRST(50) LAST(50) ROW (21. Selecciona filas entre inicio y fin.70) RANDOM(50) Pasajeros < 5 Pasajeros <= 5 Pasajeros > 5 Pasajeros >= 5 Cilindros = 6 Cilindros <> 4 Cilindros = 6 & Fabric. = “Ford” Cilindros = 6 | Fabric. usted debe indicar antes del nombre. Por ejemplo. solo los primeros 50 filas de esa hoja de datos serán utilizados. si usted captura un comando cómo FIRST(50) en ese campo. si ambas hojas de datos A y B contienen una columna llamada Weight y desea usar la columna en la hoja de datos A. Comandos aceptados para el campo Seleccionar 65/ Elaborando Análisis Estadísticos . 2 Ventana de Análisis Una vez que los datos han sido especificados. Condiciones múltiples pueden ser combinadas usando los símbolos condicionales “Y” (&) u “O” (|). donde el 0 representa FALSO y el 1 representa VERDADERO. Ventana de Análisis de una Regresión Simple Esta ventana consiste de varios paneles divididos por barras de desplazamiento. en cuyo caso abarcará la ventana completa: 66/ Elaborando Análisis Estadísticos . el resultado es la selección de todas las filas cuya condición es VERDADERA y la exclusión de todos las filas cuya condición sea FALSA.Cuando se especifique una condición que involucre variables no-númericas. Las Tablas se encuentran en el lado izquierdo de la ventana y los gráficos en el lado derecho. el valor debe colocarse con doble paréntesis además de ser sensible a las mayúsculas. Usted puede maximizar la tabla o la gráfica de cualquier panel dando doble clic sobre el mismo. 3. Cada uno de los comandos aceptados en el campo Seleccionar genera una secuencia booleana de 0’s y 1´s. se crea una nueva ventana de análisis: Figura 3-4. Cuando se usa en el campo Seleccionar del cuadro de diálogo de captura de datos. 3.1 Ícono Captura de Datos Cuando es presionado. este botón muestra el cuadro de diálogo de captura de datos originalmente usado para especificar las variables de los datos . La barra de herramientas de análisis aparece como se muestra a continuación: Cada ícono de esta barra de herramientas realiza una operación importante.2. como se muestra en la Figura 3-2.Figura 3-5. 67/ Elaborando Análisis Estadísticos . Si usted cambia las variables de los datos y presiona ACEPTAR. una segunda barra de herramientas se activa directamente debajo de la barra de herramientas principal del STATGRAPHICS Centurion. el análisis cambiará para reflejar las nuevas selecciones. Ventana de Análisis de Regresión Simple con un Panel Maximizado Dando doble clic en el panel maximizado restaura la ventana en varios paneles. Cuando se muestra una ventana de análisis. Esto le permite probar diferentes combinaciones de datos sin tener que empezar un nuevo análisis. 2.2 Ícono de Tablas Este botón muestra una lista de análisis tabulares adicionales que pueden agregarse a la ventana de análisis. las tablas disponibles son: Figura 3-6. Para Regresión Simple. si usted elige agregar tablas mostrando un comparativo de modelos alternos y residuos atípicos. nuevos paneles de texto se agregarán a la ventana de análisis: 68/ Elaborando Análisis Estadísticos . Cuadro de Diálogo de las Tablas para Regresión Simple Por ejemplo.3. 2. Cuadro de Diálogo de Gráficos de Regresión Simple 69/ Elaborando Análisis Estadísticos . Ventana de Análisis de Regresión Simple con las Tablas Agregadas 3.Figura 3-7.3 Ícono de Gráficas Dando clic en este ícono se muestra una lista de gráficos adicionales que pueden ser creadas: Figura 3-8. Para el análisis de Regresión Simple.Agregar un gráfico de residuos sitúa una gráfica adicional en la ventana de análisis: Figura 3-9. Ventana de Análisis de Regresión Simple con un Gráfico Agregada 3.4 Ícono para Guardar Resultados Este ícono le permite guardar los resultados numéricos calculados por el análisis estadístico en las columnas de la hoja de datos. se muestran las siguientes opciones: 70/ Elaborando Análisis Estadísticos .2. Figura 3-10. Cuadro de Diálogo para Guardar Resultados de una Regresión Simple Para guardar la información. Para cada objeto a guardar. Cuando se combina con la capacidad de realizar rutinas. indique los objetos de interés en el campo Guardar. La opción de Autoguardar es usado para guardar automáticamente el objeto seleccionado si y cuando el análisis es vuelto a correr. descrita en el Capítulo 5. Si desea guardar un comentario junto con los datos. usted puede configurar un StatFolio para que calcule y guarde automáticamente las estadísticas deseadas. 71/ Elaborando Análisis Estadísticos . indíquelo en la opción de Guardar comentarios. Revisando el recuadro Autoguardar. asigne un nombre de columna debajo de las Variables Destino e indique la hoja de datos deseada. esto le permite automatizar muchas de las tareas. Esto resulta útil si usted intenta guardar el análisis en un StatFolio. ya que los análisis son vueltos a correr siempre que se carga un StatFolio. 5 Ícono de Opciones de Análisis Casi todos los análisis tienen opciones múltiples. el análisis completo cambiará para reflejar el nuevo modelo. Sin embargo. al pulsar el ícono de Opciones de Análisis en cualquier procedimiento permitirá que estas configuraciones básicas puedan cambiarse. Cuando se corre por primera vez. Al final de la lista se encuentra el modelo Curva-S. puede notar que en la tabla de modelos alternativos hay muchos modelos curvilíneos que dan un valor R-cuadrado más alto que el modelo lineal. y regularmente son suficientes. el cuadro de diálogo de Opciones de Análisis especifica el tipo de modelo a ajustar y el método para estimar los coeficientes desconocidos del modelo: Figura 3-11. los valores predeterminados son seleccionados para estas opciones. Cuadro de Diálogo de Opciones de Análisis de Regresión Simple Si usted examina la salida en la Figura 3-7. Para la Regresión Simple. una Curva-S captura la curvatura en los datos bastante bien: 72/ Elaborando Análisis Estadísticos .3. Como puede verse examinando en la gráfica del modelo ajustado. Si se selecciona este modelo en el cuadro de diálogo de Opciones de Análisis y se presiona ACEPTAR.2. 2. las Opciones de Ventana son: 73/ Elaborando Análisis Estadísticos . muchas tablas y gráficas individuales cuentan con opciones que solo aplican para ellas. Para un Gráfico de Modelo Ajustado.Figura 3-12. Modelo Curva-Se Ajustado 3.6 Ícono de Opciones de Ventana Adicionalmente a las opciones aplicables a la ventana de análisis completa. Estas opciones pueden accesarse maximizando primero la tabla o gráfica seleccionada y luego pulsando Opciones de Ventana. Cuadro d Diálogo de Opciones de Ventana para un Gráfico de Modelo Ajustado Por ejemplo.Figura 3-13. eliminar las marcas a lo largo de los Límites de Confianza y presionado ACEPTAR se regraficará sin los límites interiores: 74/ Elaborando Análisis Estadísticos . escala de ejes. varios botones adicionales son activados. Estos botones incluyen: Opciones Gráficas – muestra un cuadro de diálogo usado para cambiar colores. 75/ Elaborando Análisis Estadísticos . Separar puntos – usado para compensar puntos aleatoriamente en la dirección horizontal ó vertical para prevenir que se sobrepongan unos a otros.7 Íconos de Opciones Gráficas Siempre que una gráfica es maximizada en la ventana de análisiss. Agregar texto – usado para añadir texto adicional a la gráfica.2. etiquetas.Figura 3-14. Resaltar – colorea los puntos en un plano de dispersión de acuerdo al valor de la variable seleccionada. Gráfico de Modelo Ajustado sin Límites de Confidencia 3. y otras características similares. 8 Ícono de Excluir Algunos procedimientos estadísticos permiten eliminar iteractivamente datos aberrantes sospechosos de un análisis maximizando una gráfica. 3. o rota un plano de 3 dimensiones. Cada uno de estos íconos se describe a detalle en el Capítulo 4. Localizar por nombre – resalta en color rojo cualesquiera puntos con valores iguales a aquel capturado en el campo Localizar (usado en conjunto con el botón Identificar). Por ejemplo. el gráfico en la Figura 3-14 muestra un punto que se encuentra bastante lejos de los limites de predicción. Localizar por fila – resalta en color rojo cualquier punto correspondiente al número de fila capturado en el campo Fila. indicando con una X cual o cuales puntos han sido eliminados: 76/ Elaborando Análisis Estadísticos . Identificar – muestra una etiqueta identificando un punto cuando se da clic sobre él con el ratón. El gráfico del modelo ajustado muestra el nuevo modelo.Suavizar/Rotar – suaviza un plano de 2 dimensiones.2. dando clic en el punto sospechosos. Dando clic en ese punto y pulsando el ícono Excluir provoca que el modelo sea reajustado sin el punto. y pulsando este ícono. se mostrará el siguiente cuadro de diálogo: 77/ Elaborando Análisis Estadísticos . pulse el botón de Imprimir en la barra de herramientas de análisis o seleccione Imprimir en el menú Archivo. Para imprimir una sola tabla o gráfica. haga clic en su panel con el botón derecho del mouse y seleccione imprimir del menú que se muestra. Modelo Curva-S Ajustado después de excluir un dato aberrante sospechoso Todas las tablas y gráficas restantes en la ventana de análisis también cambiarán reflejando el nuevo modelo. Dando clic en un punto que ha sido eliminado lo integrará al modelo. 2. 3.3 Imprimiendo Resultados Para imprimir los resultados de un análisis estadístico. Diferentes puntos pueden excluirse de un modelo dando clic sobre ellos y pulsando el ícono Excluir de uno en uno. hay dos opciones disponibles: 1.Figura 3-15. Cuando imprime el análisis completo. Para imprimir todas las tablas y gráficas en una ventana de análisis. Opciones adicionales utilizadas para imprimir están contenidas en el cuadro de diálogo al que se puede acceder seleccionando Configurar Página del menú Archivo: 78/ Elaborando Análisis Estadísticos . Cuadro de Diálogo para Imprimir un Análisis Debajo de Rango de Impresión.Figura 3-16. Usted podrá imprimir simultáneamente la salida en otras ventanas de análisis seleccionando Todos los Análisis. especifique los paneles a imprimir. Especificar márgenes para las hojas a imprimir.Figura 3-17. Elegir la impresión en blanco y negro. o si desea colocar diferentes paneles en una sola página ajustada. Indicar posibles encabezados a imprimir en la parte superior de cada página. usted puede: 1. Especificar el tamaño relativo de las gráficas como un porcentaje de las dimensiones de la página completa. 79/ Elaborando Análisis Estadísticos . 2. Indicar si cada panel (tabla o gráfico) debe ser mostrado en páginas separadas. 3. aún cuando su impresora tenga capacidades de hacerlo a color. Cuadro de Diálogo Configurar Página En este cuadro de diálogo. 5. 4. 6. Imprimir el color del fondo de sus gráficas (si es que existe). Trazar líneas anchas usando 2 pixeles en lugar de 1. seleccionando StatPublish del menú Archivo. Usted puede también copiar el análisis al StatReporter. StatPublish se describe en el Capítulo 5. como imprimir la salida en modo de retrato o paisaje. Esto le permite hacer que la salida este disponible para todos dentro de su organización. 80/ Elaborando Análisis Estadísticos . 3. que accesa al cuadro de diálogo proporcionado por el driver de su impresora. el cual le permite hacer anotaciones a la salida y posteriormente guardarla en un Archivo RTF (formato de texto enriquecido). pueden elegirse seleccionando Configurar Impresión en el menú Archivo. Esta opción puede hacer que las gráficas aparezcan mucho más gruesas en una impresora de alta resolución. El uso del StatReporter se describe en el Capítulo 6.4 Publicando Resultados La salida de un análisis estadístico puede ser publicado en formato HTML para su vista dentro de un sitio en la web. Otras opciones. para luego ser leído directamente en programas como Microsoft Word. tengan o no tengan el STATGRAPHICS Centurion en sus computadoras.7. Globalmente. tal vez usted vea un punto interesante y desea saber más sobre el mismo. Pero cuando se requiere publicar los resultados finales. Por ejemplo. Le muestra como prepararlas para su publicación. También le muestra cómo interactuar con las gráficas. Para facilitar el proceso del análisis de los datos. O tal vez quiera rotar un plano de 3D para percibir cualquier relación que pueda existir entre las variables representadas en los ejes X. los nombres. consideraremos de nuevo los datos en el archivo 93cars. el gráfico del modelo ajustado relacionando las millas por galón manejando en la ciudad y el peso del vehículo servirá para ilustrar algunas de las operaciones gráficas importantes. Como ejemplo. interactuando con las gráficas. Y y Z.Capítulo Gráficas 4 Modificando gráficas. Para empezar.sf6. los predeterminados son suficientes. Para propósitos del análisis. guardando gráficas en archivos de imágen y copiando gráficas a otras aplicaciones. Le muestra como copiarlas a aplicaciones como Microsoft Word y PowerPoint. escalas y otros atributos son seleccionados de forma predeterminada cuando una nueva gráfica es creada. los 150 procedimientos estadísticos en el STATGRAPHICS Centurion crean cientos de diferentes tipos de gráficas. guardando preferencias de las gráficas. Este Capítulo describe todo lo que necesita saber para trabajar con gráficas en el STATGRAPHICS Centurion. diseñar una gráfica de calidad es importante. 81/ Gráficas . los puntos y tipos de líneas.1328 + 2799. un modelo de Curva-S ofrece un buen ajuste a la relación entre los datos de MPG City y los datos de Weight en el archivo 93cars. los colores y otros atributos gráficos son automáticamente generados.07/Weight) 55 45 MPG City 35 25 15 1600 2100 2600 3100 Weight 3600 4100 4600 Figura 4-1.sf6. Cuando se crea por primera vez. 82/ Gráficas .4. las escalas. Gráfico del Modelo Ajustado con la Escala y Títulos Predeterinados Los títulos. una gráfica del modelo ajustado de Curva-S se ilustra como sigue: Gráfico del Modelo Ajustado MPG City = exp(2. Como se ilustra en el último capítulo.1 Modificando Gráficas El procedimiento de Regresión Simple es comúnmente usado para ajustar curvas relacionando una variable de respuesta Y con una variable conocida X. El separador Diseño en el cuadro de diálogo Opciones Gráficas es usado para cambiar algunas de las características básicas de la gráfica: Figura 4-2. Separador de Diseño en el Cuadro de Diálogo Opciones Gráficas 83/ Gráficas .1 Opciones de Diseño Para modificar una gráfica una vez que ha sido creada.4. que corresponden a los distintos elementos gráficos. Se mostrará un cuadro de diálogo con diferentes separadores. Luego haga clic en el ícono Opciones Gráficas localizado en la barra de herramientas de análisis.1. primero haga doble clic sobre ella para que así ocupe totalmente la ventana de análisis. el grueso de los ejes.1328 + 2799.07/Weight) 55 45 MPG City 35 25 15 1600 2100 2600 3100 Weight 3600 4100 4600 Figura 4-3.Esto incluye la orientación de las marcas de los ejes. y el color del fondo de la gráfica y sus bordes. Gráfica después de Modificar el Fondo y seleccionar Efectos 3D 84/ Gráficas . Por ejemplo. cambiando el color del Fondos a amarillo y añadiendo Efectos 3D modifica la gráfica como se muestra a continuación: Gráfico del Modelo Ajustado MPG City = exp(2. 4.1. Separador Malla en el Cuadro de Diálogo Opciones Gráficas Añadir una malla gris de líneas punteadas en Ambas direcciones produce la siguiente gráfica: 85/ Gráficas .2 Opciones de Mallas El separador Mallas se utiliza para añadir una malla al plano: Figura 4-4. 07/Weight) 55 45 MPG City 35 25 15 1600 2100 2600 3100 Weight 3600 4100 4600 Figura 4-5.Gráfico del Modelo Ajustado MPG City = exp(2.1328 + 2799. Gráfica después de Añadir una Malla Punteada 86/ Gráficas . 3 Opciones de Líneas El separador Líneas es usado para especificar el tipo. Separador Líneas en el Cuadro de Diálogo Opciones Gráficas Una Gráfica tal como la del modelo ajustado tiene tres líneas diferentes: la línea de mejor ajuste.1.4. los límites de confianza internos y los límites de predicción externos. color y grueso de las líneas en la gráfica: Figura 4-6. haga clic en su botón correspondiente (número del 1 al 20) y luego seleccione los atributos deseados. Para cambiar cualquiera de estas líneas. Incrementando el grosor de la línea central y cambiando otros tipos de línea resultará en: 87/ Gráficas . Gráfico del Modelo Ajustado MPG City = exp(2. Gráfica después de Modificar las Líneas Nota: solo se puede cambiar el grueso de las líneas sólidas. 88/ Gráficas .07/Weight) 55 45 MPG City 35 25 15 1600 2100 2600 3100 Weight 3600 4100 4600 Figura 4-7.1328 + 2799. En el ejemplo actual. color y tamaño de los puntos en la gráfica: Figura 4-8.1. Cuadro de Diálogo del Separador Puntos en Opciones Gráficas El botón #1 controla los atributos del primer conjunto de puntos en una gráfica. existe solo un conjunto. Cambiando los puntos a diamantes sólidos creará la siguiente Gráfica: 89/ Gráficas .4 Opciones de Puntos El separador Puntos se usa para especificar el tipo.4. 07/Weight) 55 45 MPG City 35 25 15 1600 2100 2600 3100 Weight 3600 4100 4600 Figura 4-9.Gráfico del Modelo Ajustado MPG City = exp(2. Gráfica después de Modificar el Tipo de Puntos 90/ Gráficas .1328 + 2799. 4. Usted puede cambiar cualquier título. Separador Título Principal en el Cuadro de Diálogo Opciones Gráficas Las gráficas tienen hasta 2 líneas por título. También puede arrastrar el título a un nuevo lugar con el ratón: 91/ Gráficas . conteniendo usualmente nombres de variables o estadísticos calculados.1. incluyendo aquellos que son automáticamente creados.5 Opciones del Título Principal El separador Título Principal se utiliza para especificar el tipo de texto y fuente para la información mostrada por encima de la la gráfica: Figura 4-10. Una entrada como “{3}” en un campo de título indica que el texto es automáticamente generado por el procedimiento del análisis. 07/Weight) 55 45 MPG City 35 25 15 1600 2100 2600 3100 Weight 3600 4100 4600 Figura 4-11. Gráfica después de Modificar el Título Principal 92/ Gráficas .1328 + 2799.Fitted S-Curve from 93cars File MPG City = exp(2. Hasta. Desde. Separador Eje-X en el Cuadro de Diálogo Opciones Gráficas Existen varios campos importantes en este cuadro de diálogo: 1. Por y Omitir: configura la escala de las marcas. Título: título desplegado a lo largo del eje.4.6 Opciones de Escalas de los Ejes El cuadro de diálogo Opciones Gráficas también contiene separadores que le permiten modificar los títulos de los ejes y su escala: Figura 4-12. un valor de 1 en el campo Omitir desplegará las marcas saltándose una a la vez. El valor en Omitir se utiliza para evitar mostrar ciertas marcas si estas se juntan entre sí. 2.1. Por ejemplo. 93/ Gráficas . los ejes reajustan su escala al momento en que los datos cambian. Gráfica después de Modificar la Escala y los Títulos de los Ejes 94/ Gráficas . 7. 4. Rotar Etiquetas del Eje. Mantener: congela la escala del eje y evita que pueda ser modificada. La salida generada por los cambios en el cuadro de diálogo superior se muestra a continuación: Fitted S-Curve from 93cars File MPG City = exp(2. tamaño. 6.X: despliega verticalmente las etiquetas de las marcas del eje X.3.07/Weight) 55 MPG in city driving 45 35 25 15 1500 2000 2500 3000 3500 4000 4500 Weight in lbs. Figura 4-13. Fuentes: pulse este botón para cambiar el color.1328 + 2799. Normalmente. Sin Potencias: suprime mostrar números pequeños o grandes usando etiquetas como (X 1000). Log: traza el eje usando una escala logarítmica de base 10. ó estilo del título y de las marcas. 5. Separador Rellenos en el Cuadro de Diálogo Opciones Gráficas El botón #1 controla el primer tipo de relleno en una gráfica. El separador Rellenos en el cuadro de diálogo Opciones Gráficas controla el color y el tipo de relleno de las barras.1. todas las barras utilizan el primer tipo de relleno. En esos casos.4. los botones del #2 al #20 controlan los otros tipos de relleno. contienen áreas sólidas. En un histograma. polígonos y áreas en un Diagrama de Sectores: Figura 4-14.7 Opciones de Relleno Algunos Gráficas. se utiliza más de un tipo de relleno. 95/ Gráficas . como los histogramas. como en los diagramas de sectores. En algunas gráficas. Para gráficas como los histogramas. Histograma con Tipo de Relleno Modificado 4.8 Opciones de Texto. fijar un tipo de relleno no-sólido resulta una buena idea cuando se imprimen los resultados en blanco y negro: Histograma 24 20 frecuencia 16 12 8 4 0 1500 2000 2500 3000 Weight 3500 4000 4500 Figura 4-15.9 Añadir Texto Nuevo en la barra Puede agregar texto adicional a cualquier gráfica pulsando el ícono Añadir texto de herramientas de análisis.1. 4. Se generará un nuevo cuadro de diálogo donde puede capturar el texto: 96/ Gráficas . se incluyen separadores en el cuadro de diálogo Opciones Gráficas que le permiten cambiar los textos y las fuentes.1. Etiquetas y Leyendas Para las gráficas que contienen leyendas o etiquetas adicionales. Figura 4-17.07/Weight) 55 MPG in city driving 45 < outlier 35 25 15 1500 2000 2500 3000 3500 4000 4500 Weight in lbs.Figura 4-16. pero puede ser arrastrada a cualquier parte mediante el ratón: Fitted S-Curve from 93cars File MPG City = exp(2. Cuadro de Diálogo para Añadir un Nuevo Texto La línea de texto será inicialmente posicionada bajo el título principal. Gráfica después de Añadir una Nueva Línea de Texto Si necesita hacer cambios después de agregar el texto.1328 + 2799. 97/ Gráficas . haga clic sobre el mismo y luego pulse el botón Opciones Gráficas. considere la siguiente gráfica del archivo de datos 93cars. una o ambas variables son discretas. existen muchos menos de 93 puntos en la gráfica.sf6 : Gráfico de MPG City vs Cylinders 55 45 MPG City 35 25 15 2 3 4 5 6 Cylinders 7 8 9 Figura 4-18. La barra de herramientas de análisis tiene un ícono Separar que soluciona este problema al separar puntos de forma aleatoria en dirección horizontal y/o vertical. aparecerá un cuadro de diálogo que le permitirá agregar una pequeña separación (aleatoria) a los puntos: Figura 4-19.4. Cuadro de Diálogo de Separación de Puntos 98/ Gráficas . Por ejemplo. la posibilidad de que haya puntos exactamente en la misma posición y obstruyéndose entre sí puede ser muy factible. Gráfico de Dispersión de Millas por Galón vs Cilindros A pesar de que existen 93 casos en la hoja de datos.2 Separando Puntos en un Gráfico de Dispersión Cuando en un gráfico de dispersión. Si presiona el botón Separar. En este caso. añadir una pequeña separación de puntos horizontalmente le otorga una mejor visión de la ubicación de los puntos: Gráfico de MPG City vs Cylinders 55 45 MPG City 35 25 15 2 3 4 5 6 Cylinders 7 8 9 Figura 4-20. mas no tiene efecto alguno sobre los datos de la hoja de datos o en los cálculos realizados con ellos.sf6: 99/ Gráficas .3 Resaltando Puntos en un Gráfico de Dispersión Un interesante método de visualizar las relaciones entre variables es coloreando los puntos de un gráfico de dispersión de acuerdo al valor de otra variable. 4. Por ejemplo. Separar los puntos de una gráfica solo afecta la manera en que se muestra. Gráfico de Dispersión después de la Separación Horizontal de Puntos Cada punto ha sido separado un poco y de forma aleatoria a lo largo del eje horizontal. considere el siguiente Gráfico de Matriz para variables seleccionadas del archivo 93cars. Suponga que usted deseaba visualizar cómo el caballaje de los automóviles se relaciona con las 5 variables graficadas. Si presiona el ícono Resaltar mostrará el siguiente cuadro de diálogo: en la barra de herramientas de análisis.MPG City MPG Highway Length Weight Width Figura 4-21. se Figura 4-22. Cuadro de Diálogo para Seleccionar la Variable a Resaltar 100/ Gráficas . Gráfico de Matriz para algunos Datos del Archivo 93cars El gráfico de dispersión en cada celda de la matriz muestra los valores de las variables correspondientes a sus identificadores de fila y columna. Gráfico de Matriz después de Resaltar los Puntos Es evidente en la gráfica superior que el Caballaje está fuertemente correlacionado con las otras variables. Por ejemplo.0 y 121. un cuadro de diálogo emergente aparecerá: Figura 4-23.Seleccione una variable numérica a usar para codificar los puntos. Cuadro de Diálogo Emergente para Seleccionar el Intervalo del Resaltado Las dos barras de desplazamiento se utilizan para especificar los límites superiores e inferiores para la variable. en el gráfica inferior. 101/ Gráficas . Todos los puntos en el gráfico de dispersión son coloreados con azul claro si caen dentro del intervalo especificado.15 son coloreados de azul claro: MPG City MPG Highway Length Weight Width Figura 4-24. Después de seleccionar la variable a resaltar. todos los automóviles con caballaje entre 55. Esto mostrará el siguiente cuadro de diálogo: en Figura 4-25.4. puede aplicarse un suavizamiento. generalmente usando una fracción suavizadora entre 40% y 60%. Para suavizar un gráfico de dispersión. El resultado de suavizar el Gráfico de Matriz con los datos de los automóviles se muestra a continuación: 102/ Gráficas . Uno de los mejores métodos para suavizar se denomina LOWESS (Suavización de Dispersión Localmente Ponderada). Cuadro de Diálogo Suavizando un Gráfico de Dispersión Para suavizar un gráfico de dispersión se selecciona un conjunto de locaciones a lo largo del ejeX para que en una se grafica el promedio ponderado de la fracción específica de los puntos más cercanos a esa locación.4 Suavizando un Gráfico de Dispersión Para ayudar a visualizar la relación entre las variables en un gráfico de dispersión. pulse el ícono Suavizar/Rotar la barra de herramientas de análisis. Aparecerá un pequeño cuadro en la esquina superior derecha de la gráfica. usted debe pulsar el botón izquierdo del ratón sobre el punto.5 Identificando Puntos Para mostrar el número de fila y las coordenadas correspondientes de cualquier punto en la gráfica. 4. mostrando el número de fila y las coordenadas del punto: 103/ Gráficas . Gráfico de Matriz Suavizado usando Lowess con una Fracción Suavizadora del 50% Suavizar ayuda a ilustrar el tipo de relaciones entre las variables.MPG City MPG Highway Length Weight Width Figura 4-26. Figura 4-27. el número de fila del punto será colocado en el campo Fila en la barra de herramientas de análisis: Figura 4-28. Barra de herramientas de análisis mostrando el Número de Fila del Punto Seleccionado Información adicional sobre el punto puede ser obtenida pulsando el ícono Identificar seleccionando una columna del Libro de Datos: y 104/ Gráficas . Mostrando Información sobre el Punto Seleccionado Al mismo tiempo. Cuadro de Diálogo Identificación de un Punto Después de seleccionar una variable. Por ejemplo. la gráfica inferior colorea de azul claro los puntos de todos los Hondas: 105/ Gráficas . Barra de herramientas de análisis mostrando el Fabricante del Punto Seleccionado El ícono de binoculares los a la derecha de los campos Etiqueta y Fila pueden usarse para localizar puntos en una gráfica.Figura 4-29. Si usted captura un valor en cualesquiera de los campos de edición y luego presiona el botón Localizar correspondiente. todos los puntos en la gráfica que coincidan con el valor capturado serán resaltados. haciendo clic en cualquier punto aparecerá el contenido de esa variable en el campo Etiqueta de la barra de herramientas de análisis: Figura 4-30. Figura 4-31. Gráfica Resaltando todos los Hondas Esta técnica es también bastante efectiva en un Gráfico de Matriz. todos 106/ Gráficas . los puntos correspondientes a la fila #42 han sido resaltados: En la siguiente gráfica. las gráficas son pegadas en formato de “Imágen”. 107/ Gráficas . puede seleccionar Pegado Especial en lugar del común Pegar. que corresponde a un meta-archivo de Windows. Seleccionando Pegar estando en la otra aplicación. accesible desde el menú Editar 4. puede ser fácilmente copiada a otros programas como Microsoft Word o PowerPoint haciendo lo siguiente: 2.MPG City MPG Highway Length Weight Width Figura 4-32. Maximizando el panel que contiene la gráfica. Nota: el color usado para resaltar los puntos se determina en el separador Gráficas del cuadro de diálogo Preferencias. En los casos em que usted deseé pegar la gráfica en algún otro formato. 3.6 Copiando Gráficas a otras Aplicaciones 1. Una vez que una gráfica ha sido creada en el STATGRAPHICS Centurion. De manera predeterminada. Gráfico de Matriz Resaltando lal Fila #42 Localizar un punto en el Gráfico de Matriz puede ayudar a identificar si es un dato aberrante con respecto a más de una variable. Seleccionando Copiar del menú Editar del STATGRAPHICS Centurion. Para copiar tanto la gráfica como la ventana que la contiene. como en la Figura 4-31 arriba.com.techsmith.Para copiar un análisis completo en otra aplicación. Entonces así podrá pegar imágenes directamente a cualquier documento. le recomendamos que fije la opción Input a “Window” y la opción Output a “Clipboard”. Esta técnica es explicada en el Capítulo 7. una herramienta de captura de ventana externa se recomienda. Cuadro de Diálogo para Seleccionar Archivo a guardar en un Archivo Imágen 108/ Gráficas . se ha utilizado un programa llamado SnagIt. el cual está disponible para su compra en www. Si usa el SnagIt. 4.7 Guardando Gráficas como Archivos de Imágen Gráficas Individuales también pueden ser guardadas en archivos imágen maximizando una gráfica y luego seleccionando Guardar Gráficos del menú Archivo. primero copie el análisis al StatReporter usando el menú emergente al pulsar el botón derecho del ratón y luego copie el StatReporter a la otra aplicación. En la producción de éste manual. Un cuadro de diálogo se presentará en el cual debe especificar el nombre de un archivo y el formato de imágen: Figura 4-33. incluyendo todas las tablas y gráficas. Si la gráfica es para ser mostrada en una página web. debe guardar la gráfica como un meta-archivo de Windows lo que otorga una mayor flexibilidad. se recomienda guardarla como un archivo JPEG.Para guardar las gráficas que serán leídas en Word o PowerPoint. 109/ Gráficas . 5 Cada vez que usted selecciona un análisis estadístico del menú del STATGRAPHICS Centurion. publicando resultados en formato HTML. Al guardar un StatFolio y reabrirlo después. Los StatFolios proveen un método simple para repetir posteriormente los análisis usando diferentes datos. Capture un nombre para el StatFolio en el cuadro de diálogo que se muestra a continuación: 110/ StatFolios . y automatizando análisis usando rutinas ejecutables. los datos asociados son releídos y todo el análisis es recalculado. Cuando se guarda una sesión en un StatFolio. A su vez también puede crear una rutina que se ejecute siempre que un StatFolio sea cargado. Detalles de ésta y otras características de los StatFolios se describen en éste Capítulo.Capítulo StatFolios Guardando su sesión de trabajo. El StatFolio es un archivo que contiene la definición de todos los análisis estadísticos que han sido creados. Cuando se reabre un StatFolio.1 Guardando su Sesión de Trabajo Para guardar el estado actual de su sesión de trabajo en el STATGRAPHICS Centurion. seleccione Archivo – Guardar – Guardar StatFolio en el menú principal. 5. la estructura del análisis es lo que se guarda y no los resultados. se crea una nueva ventana de análisis. Usted puede guardar todas las ventanas de análisis en cualquier momento creando un StatFolio. usted guarda y recupera eficientemente su sesión de trabajo actual del STATGRAPHICS Centurion. con apuntadores a los datos utilizados en los mismos. incluyendo las variables usadas. 2. Estos contienen: 1. Una definición de todos los análisis creados. Si los datos cambian entre el tiempo en que un StatFolio es guardado y cuando es reabierto. 111/ StatFolios . El programa le pedirá que provea los nombres para el StatGallery y el StatReporter cuando se guarde el StatFolio. etc. Vínculos a los archivos de StatGallery y StatReporter. configuraciones de todas las opciones elegidas. cambios hechos a las gráficas. en caso de que se haya colocado material en ellos antes de que el StatFolio sea guardado. 3. las tablas y las gráficas.sgp. Los vínculos a las fuentes de datos contenidos en el Libro de Datos. Cuadro de Diálogo de Selección de Archivo para Guardar un StatFolio Los StatFolios son guardados en archivos con la extensión . la ventana de análisis reflejará los cambios. los análisis son recalculados y se actualizan todas las tablas y gráficas.Figura 5-1. Cuando un StatFolio es reabierto. Una Rutina de Inicio Básica de un StatFolio Las operaciones deseadas son especificadas en el orden en el que deben ejecutarse. Las operaciones disponibles son: 112/ StatFolios .5. Entonces STATGRAPHICS Centurion busca encontrar si una Rutina de Inicio ha sido guardada con el StatFolio y la ejecuta si la encuentra. todas las ventanas de análisis son restauradas a su condición previa.2 Rutinas del StatFolio Cuando se carga por primera vez un StatFolio. Se mostrará un cuadro de diálogo con campos para definir una secuencia de acciones a realizar: Figura 5-2. Una rutina puede ser creada seleccionando Rutina de Inicio del Statfolio del menú Editar. que son asignados a una nueva variable llamada PERROR. Corre StatPublish para publicar los contenidos del StatFolio en formato HTML. se asume que Guardar Resultados ha sido programado para guardar los residuos del modelo ajustado en una columna llamada RESIDUALS. después del cual los resultados de ambos análisis son impresos. una Regresión Simple es elaborada. Hace una pausa por el tiempo especificado Especifica el StatFolio a cargar al momento en que la rutina se corra. accesible desde el menú Editar: 113/ StatFolios . Los residuos son entonces divididos por los valores originales de los datos y luego multiplicados por 100 para crear los porcentajes de error. de Evalúa la expresión y la asigna a la columna indicada. Argumento Genera que Windows ejecute del Comando un comando. Imprime el contenido de las ventanas indicadas. También puede salirse automáticamente del STATGRAPHICS Centurion usando el operador SALIR. Salir del STATGRAPHICS Centurion En el ejemplo mostrado en la Figura 5-2. Esto permite que los StatFolios se ejecuten en cadena. Note que los StatFolios pueden encadenarse utilizando en una línea el operador CARGAR para cargar y empezar la ejecución en otro StatFolio. Los valores en PERROR son entonces resumidos usando el procedimiento Análisis de Una Variable. NOTA: Usted puede suprimir la ejecución de rutinas seleccionando Inhabilitar Rutinas de Inicio en el separador General del cuadro de diálogo Preferencias. Operadores de la Rutina de Inicio Descripción Actualiza el análisis indicado. Dentro de ese análisis.Operación Ejecutar Asignar Imprimir Publicar Cápsula Retrasar Cargar Argumento Objetivo Título del Análisis Expresión STATGRAPHICS Nombre Centurión Columna Ventana(s) a imprimir Comando Windows a ejecutar Número de Segundos Nombre del StatFolio Salir Figura 5-3. Inhabilitando Rutinas de Inicio 114/ StatFolios .Figura 5-4. 4. Especifique la frecuencia para releer los datos. los datos pueden ser releídos en intervalos de tiempo fijos originando la actualización del análisis. 115/ Statfolios . 3. Habilite a Encendido en el cuadro de opción Actualizando.5. Esto se obtiene usando el cuadro de diálogo Propiedades del Libro de Datos en el menú Editar.3 Actualizando Datos Vinculados Una vez que un StatFolio ha sido creado conteniendo diferentes. Coloque una paloma en la opción de Actualizar para cada fuente de datos a releer. Cuadro de Diálogo Propiedades del Libro de Datos para Actualizar con Datos Vinculados Para consultar las fuentes de los datos repetidamente: 1. o seleccionando StatLink en el menú Archivo: Figura 5-5. 2. Seleccione Ejecutar Rutina si desea correr la rutina de inicio del StatFolio cada vez que los datos sean leídos. con el 116/ Statfolios . usted puede hacer que STATGRAPHICS Centurion guarde automáticamente los resultados en un servidor de red. es colocado en el mismo directorio que el propio StatFolio. Se muestra un cuadro de diálogo para indicar que resultados se publican y donde deben colocarse: Figura 5-6.4 Publicando Datos en Formato HTML La salida de un StatFolio puede ser publicada en un formato que sea visible usando un navegador de red básico. Cuadro de Diálogo StatPublish para crear una salida HTML Los campos en este cuadro de diálogo se usan para especificar: • Archivo HTML en un directorio local: Este es el nombre del archivo HTML que mantendrá el contenido del StatFolio. Enlistará el contenido del StatFolio y proveerá vínculos a otros archivos HTML correspondientes a cada ventana en el StatFolio. 5. seleccionando StatPublish del menú Archivo.Al incluir el operador Publicar en algún paso de la rutina de inicio. De manera predeterminada. Normalmente este es un directorio de un servidor. Mientras en el navegador. FTP Clave de acceso: clave de acceso para el acceso FTP al URL indicado.mismo nombre que el StatFolio pero con la extensión .htm en lugar de . todos los archivos también serán subidos a la dirección referida por el URL. FTP Nombre de Usuario: nombre de usuario para el acceso FTP al URL indicado.sgz. • • • • • 117/ Statfolios . como se describe en el archivo PDF titulado Procesamiento y Análisis Dinámico de Datos. 3. lo cual tal vez deba ser programado por el administrador de la red. Incluir: Revisa todos las ventanas del StatFolio que deben publicarse. Esto incluye archivos HTML . Nota: no todas las gráficas serán publicadas apropiadamente usando ésta opción. la gráfica será actualizada en la frecuencia indicada leyendo un archivo auxiliar con un nombre similar a ejemplo_análisis_gráfica. Si se captura un sitio en el campo FTP Sitio URL. JPEG – imágenes estáticas guardadas en formato JPEG. Si una ó más gráficas no se muestran correctamente en la salida publicada. 2. Para visualizar un StatFolio publicado. Los archivos son creados con nombres como ejemplo_análisis_gráfica. Ancho y Altura de la Gráfica en Pixeles: el tamaño de las gráficas cuando se introduzcan en los archivos HTML. Formato de Imágen: Las gráficas pueden ser agregadas en archivos HTML en una de las siguientes tres formas: 1. Esta opción está diseñada para utilizarse en conjunto con la actualización de datos en tiempo real usando el STATLink. Java Applets – salidas dinámicas que pueden ser actualizadas mientras son vistas por el navegador.sgp. archivos de imágen conteniendo las gráficas y otros archivos de soporte. • FTP sitio URL: Toda los resultados publicados son primeramente colocados en el directorio local arriba indicado. Note que usted deberá tener acceso FTP para escribir en el URL indicado.png. normalmente un navegador será direccionado a abrir este archivo. Los archivos son creados con nombres similarea a ejemplo_análisis_gráfica. PNG – imágenes estáticas guardadas en formato PNG. seleccione una opción diferente.jpg. inicie cualquier navegador de red y use su ícono de Archivo para abrir el archivo especificado en el campo superior de la Figura 5-6. el seleccionar esta característica le permite al usuario ver información acerca de los valores de los datos dando clic en un punto mientras se encuentre en el navegador de la red. 118/ Statfolios . Mientras esté en el navegador de red. Usted puede también visualizar la salida seleccionando Ver Resultados Publicados del menú Archivo en STATGRAPHICS Centurion. Estos archivos entonces pueden ser agregados a su propia página web si así lo desea. Después de completar los campos de captura. NOTA: Las tablas y gráficas son guardadas en los archivos de salida HTML con nombres automáticamente generados por StatPublish. pulse ACEPTAR para publicar el StatFolio. podrá ver el código de la fuente HTML y determinar fácilmente los nombres de los archivo. Para ver un StatFolio publicado.• Agregue interactividad a los applets: Para las gráficas publicadas como applets. Capítulo Usando el StatGallery Mostrando gráficas en varios planos y sobreponiendo gráficas. 6. dos modelos estadísticos ó dos niveles de un gráfico de contorno. como se muestra a continuación: 119/Usando el Statgallery . De manera predeterminada. un puntero al archivo StatGallery será guardado en el StatFolio presente. cada una capaz de mostrar hasta 9 gráficas. cada página de la galería esta configurada para mostrar 4 gráficas. Sobreponiendo las gráficas crea presentaciones únicas que no se pueden producir en ningún otro lugar del programa. automáticamente se cargará el StatGallery asociada. Consiste de una ó más páginas.1 Configurando una página del StatGallery El StatGallery está contenido en una ventana diferente que es creada cuando el STATGRAPHICS Centurion es cargado por primera vez. Cuando el StatFolio es reabierto posteriormente. Las gráficas del StatGallery se guardan en archivos con extensión . Si usted coloca la salida en StatGallery. 6 StatGallery es una ventana especial dentro del STATGRAPHICS Centurion donde las gráficas creadas en otros procedimientos pueden pegarse en forma adjunta ó encima una de otra.sgg. Visualizando una gráfica al lado de otra. consiste en una herramienta muy poderosa para comparar dos conjuntos de datos. La ventana del StatGallery Los botones en la parte superior de la ventana le permiten navegar a otras páginas en la galería. Si usted requiere cambiar el número de gráficas mostradas en una página. pulse el botón derecho del ratón y seleccione Organizar Ventanas. Para una sola página pueden seleccionarse arreglos conteniendo hasta 9 gráficas: Figura 6-2.Figura 6-1. Configuraciones Alternativas para una Página del StatGallery 120/Usando el Statgallery .. 3. primero debe copiarla desde la ventana de análisis donde fue creada al portapapeles de Windows. Los pasos a seguir son: 1. Hacer clic con el botón derecho del ratón en el panel extremo izquierdo y seleccionar Pegar para colocar el gráfico de contorno en el StatGallery. Esto colocará el segundo gráfico de contorno a un lado del primero en el StatGallery. suponga que desea mostrar gráficos de contorno creados en el procedimiento DDE-Analizar Diseño a dos niveles diferentes de un factor experimental seleccionado. Hacer clic con el botón derecho del ratón en el panel extremo derecho y seleccionar Pegar . 4. Activar la ventana del StatGallery. Usted puede también utilizar las barras de desplazamiento en la ventana del StatGallery para acomodar los paneles como lo desee. La opción Por Columnas le permite crear un arreglo con diferentes números de filas en cada una de las 3 columnas. 2. Por ejemplo. Configurar una página seleccionada del StatGallery para mostrar gráficos en un formato Izquierda y Derecha.Cada uno de los siete arreglos a la izquierda corresponden a un conjunto rectangular de filas y columnas. Copiarlo al portapapeles de Windows. 6. 5. Regresar a la ventana Analizar Diseño y genere un segundo gráfico de contorno en un nivel diferente del factor experimental. Generar un gráfico de contorno dentro de Analizar Diseño para un nivel del factor experimental y copiarlo al portapapeles de Windows.2 Copiando Gráficas al StatGallery Para colocar una gráfica en el StatGallery. La desplegado resultante es similar al que se muestra a continuación: 121/Usando el Statgallery . Regresar a la ventana del StatGallery. Con pegar vínculo. Gráficas Adjuntas en el StatGallery En el plano superior. en lugar de usar Pegar debe seleccionar Pegar Vínculo en el menú emergente al pulsar el botón derecho del ratón. la gráfica en la galería es vinculada inmediatamente a la ventana de análisis en donde originalmente fue creada y se cambiará en el StatGallery siempre que cambie en la ventana de análisis original. Sobreponer una gráfica en otra puede ser útil.3 Sobreponiendo Gráficas 122/Usando el Statgallery . Cuando pegue una gráfica en el StatGallery. la progresión de los colores de una gráfica a la otra muestran un decremento en la fuerza mientras un incremento en el polietileno.Figura 6-3. se tienen la opción de reemplazar la gráfica que se encuentra ahí o sobreponer la nueva gráfica por encima de la existente. Cuando una gráfica es pegada en el StatGallery dentro de un panel que ya contiene otra gráfica. como cuando se ajustan dos modelos estadísticos diferentes: 6. 1 Añadiendo Detalles Gráficos Para añadir un detalle gráfico: 123/Usando el Statgallery . solo el contenido dentro de los ejes de la segunda gráfica se despliegan.Figura 6-4. 6. la segunda gráfica será ajustada para que concuerde con la primera.4. Note: Si la escala de la segunda gráfica es diferente al de la primera.4 Modificando una Gráfica dentro del StatGallery Ciertos aspectos de una gráfica pueden ser modificados después de ser pegada en el StatGallery. Sobreponiendo Gráficas en el StatGallery Cuando una gráfica es sobrepuesta en otra que ya se encontraba en el StatGallery. 6. El texto de la segunda gráfica NO se incluye. 2. en el cual se realizan los cambios deseados.4. Seleccione el tipo de objeto que desea añadir al gráfico. 124/Usando el Statgallery .1. Los 5 primeros botones en el cuadro de diálogo de la Figura 6-5 funcionan manteniendo pulsando el botón del ratón y desplazando la línea o la figura hasta que se rellene el área deseada.3 Eliminando Detalles Gráficos Para eliminar un detalle gráfico en el StatGallery: 1. Pequeños bloques rectangulares aparecerán alrededor del objeto que ha sido marcado. 2. Cuadro de Diálogo para Agregar Objeto 3.2 Modificando Detalles Gráficos Para modificar un detalle gráfico en el StatGallery: 1. Hacer clic sobre el objeto a cambiar para indicarlo. El texto agregado puede entonces ser desplazado al sitio deseado. Pulse el botón derecho del ratón y seleccione Agregar Objeto del menú. 3. Haga clic con el ratón sobre el objeto a borrar para indicarlo. Haga doble clic en la gráfica deseada para maximizarla. El cuadro de diálogo emergente aparecerá: Figura 6-5. 6. Haga doble clic en la gráfica deseada para maximizarla. un cuadro de diálogo de captura de texto se mostrará.4. Haga doble clic en la gráfica deseada para maximizarla. Pulse el botón derecho del ratón y elija Modificar Objeto del menú que se muestra. El último botón activa el modo de texto de manera que la próxima vez que haga clic en la gráfica. Se mostrará un cuadro de diálogo correspondiente al tipo de objeto señalado. 2. 6. Pulse el botón derecho del ratón y elija Borrar Objeto del menú que se muestra. 125/Usando el Statgallery . Usted puede imprimir todas las páginas o un conjunto seleccionado de las mismas. 6. Pulse el ícono Imprimir en la barra de herramientas principal. Active la ventana del StatGallery dando clic sobre la misma con el ratón.3.5 Imprimiendo el StatGallery Para imprimir los objetos en el StatGallery: 1. u pulse el botón derecho del ratón y elija Imprimir del menú que se muestra. 2. Esto puede ser muy útil donde los recursos son limitados. sin la necesidad de usar otra aplicación. junto con una barra de herramientas: 126/ Usando el StatReporter . 2. Es una versión básica del WordPad. Crear un reporte completo en el STATGRAPHICS. que corre desde el STATGRAPHICS Centurion.Capítulo Usando el StatReporter Copiando análisis al StatReporter. 7 El StatReporter es una ventana donde los reportes de salida de los diferentes procedimientos estadísticos pueden ser integrados en un reporte más formal. creada automáticamente cuando se carga el programa. El StatReporter le permite: 1. 7. como en un área de producción. haciendo notaciones a los reportes y guardando los resultados en un Archivo RTF para importarlos a Microsoft Word. que puede ser leído directamente en programas como Microsoft Word. Consiste de un exclusivo control de edición enriquecido. Guardar el contenido del StatReporter en un archivo con formato RTF (Rich Text Format).1 La Ventana StatReporter El StatReporter consiste de una ventana separada dentro del STATGRAPHICS Centurion. maximize el panel que contiene la tabla o la gráfica a mover dando doble clic sobre el mismo. Copiar una sola tabla o gráfica al StatReporter. Alternativamente. entonces seleccione Editar – Pegar. 127/ Usando el StatReporter . primero cópiela al portapapeles de Windows maximizando el panel correspondiente y luego seleccione Copiar del menú Editar.2 Copiando la Salida al StatReporter STATGRAPHICS Centurion ofrece tres métodos para copiar la salida al StatReporter: 1. La ventana del StatReporter Usted puede teclear texto dentro de la ventana o pegar el reporte de salida creado en cualquier otra parte dentro del STATGRAPHICS. 2. Luego pulse el botón derecho del ratón y seleccione Copiar Ventana al StatReporter del menú que se muestra. Esto automáticamente pega la tabla o gráfica donde quiera que se encuentre el cursor en el StatReporter. Posteriormente entre a la ventana del StatReporter y coloque el cursor en el sitio deseado.Figura 7-1. 7. Todas las tablas y gráficas en la ventana de análisis serán pegadas en el StatReporter. 7. Para copiar todos los reportes de salida de una ventana de análisis.rtf. El contenido del StatReporter es guardado en archivos de tipo . Usted puede también insertar la fecha y hora actual pulsando el botón Fecha/Hora. que pueden ser leídos directamente en programas como Microsoft Word.3. 7.3 Modificando la Salida del StatReporter La barra de herramientas del StatReporter le permite modificar los reportes de salida una vez que han sido colocados en la ventana. en el sentido de que cambiará automáticamente cuando el reporte de salida cambie en la ventana de análisis de la cual la tabla o gráfica fueron copiadas. seleccione el texto a cambiar y pulse cualquier botón de la barra de herramientas del StatReporter. seleccione Archivo – Guardar – Guardar StatReporter del menú principal y capture un nombre para identificar el archivo a guardar.4 Guardando el StatReporter Para guardar el reporte de salida del StatReporter. pulse el botón derecho del ratón y elija Copiar Análisis al StatReporter del menú que se muestra. Usted puede también abrir un StatReporter independientemente usando el menú Archivo – Abrir. Cada una de éstas operaciones realiza un pegado estático (los reportes de salida en el StatReporter nunca cambiarán). Siempre que se abre un StatFolio. La tabla o gráfica pegada en el StatReporter será entonces “iteractiva”. Usted puede vincular una tabla o gráfica a su fuente de origen usando el método #1 arriba mencionado pero seleccionando Pegar Vínculo en lugar de Pegar. Para cambiar el texto. 128/ Usando el StatReporter . éste automáticamente carga el StatReporter que estaba presente cuando el StatFolio fue guardado. 3. 2.Capítulo Usando el StatWizard 8 Seleccionando el análisis estadístico adecuado. 5. El asesor puede también invocarse en cualquier momento pulsando el ícono del StatWizard en la barra de herramientas principal. Puede ayudarlo a crear una nueva hoja de datos o leer una fuente de datos existente. Puede ayudar en la definición de las transformaciones de los datos o en la selección de un subconjunto de datos. Puede repetir análisis deseados para cada valor específico de una columna de datos. a menos de que usted elija suprimir esta opción. El StatWizard es una herramienta exclusiva del STATGRAPHICS Centurion diseñada para ayudarle a usted de muchas maneras: 1. Puede buscar estadísticos o pruebas deseadas y dirigirlo a los procedimientos de análisis que los calcularon. 129/ Usando el StatWizard . 4. buscando las estadísticas y pruebas deseados y generando múltiples ventanas en base a diferentes factores. El StatWizard aparece siempre que usted carga el STATGRAPHICS Centurion. Puede sugerir análisis basados en el tipo de datos a analizar. 1 Accesando Datos o Creando un Nuevo Estudio Si el Libro de Datos se encuentra vacío cuando se activa el StatWizard. 130/ Usando StatWizard .8. Cuadro de Diálogo del StatWizard para Requerimiento en la Captura de Datos Existen 3 opciones: 1. como se describió en capítulos anteriores de éste manual. éste muestra un cuadro de diálogo cuestionándole sobre sus requerimientos de datos: Figura 8-1. Usted desea cargar nuevos datos en el Libro de Datos del STATGRAPHICS Centurion. El asesor entonces lo guiará a traves de una secuencia de cuadros de diálogo adicionales con la finalidad de definir las columnas de una hoja de datos o seleccionar una fuente de datos. Cuadro de Diálogo del StatWizard para Establecer un Estudio 131/ Usando StatWizard . En este caso. el asesor le pedirá que especifique el tipo de estudio a crear y lo guía a traves de una secuencia de cuadros de diálogo en los cuales se definirá el estudio a crearse. 3. En este caso. suponga que desea establecer un nuevo estudio para un instrumento de medición con la finalidad de estimar su repetibilidad y reproducibilidad. Por ejemplo.2. Usted desea crear un nuevo estudio antes de recolectar datos. le pedirá que seleccione uno y luego lo llevará inmediatamente a dicho análisis. el asesor enlistará todos esos análisis. Usted desea ejecutar un análisis que no requiera datos. Seleccionando el segundo botón en la Figura 8-1 y pulsando Aceptar se muestran las siguientes opciones: Figura 8-2. evaluadores o laboratorios que estarán realizando las mediciones: 132/ Usando StatWizard . Un último cuadro de diálogo solicitará los nombres de los operadores. Usted deberá determinar un encabezado para el estudio.y pulse Aceptar para mostrar un tercer cuadro de diálogo solicitando información sobre el estudio: Figura 8-3. capture el número de operadores que serán involucrados en el estudio.. Cuadro de Diálogo StatWizard para configurar el Estudio de Calibrador En el cuadro de diálogo.. el número de partes que serán medidas y el número de ocasiones en que cada operador medirá cada una de las partes.Seleccione Establecer un Estudio R&R de Calibrador. Figura 8-4. Estudio Calibración Creado por el StatWizard 133/ Usando StatWizard . Cuadro de Diálogo para Determinar los Nombres de los Operadores El StatWizard crea el estudio deseado y lo sitúa en la hoja de datos en el Libro de Datos: Figura 8-5. Seleccionar Análisis Basado en el Tipo de Datos: Muestra cuadros de diálogo adicionales solicitando información sobre los datos a analizar. El StatWizard puede entonces ser invocado nuevamente para seleccionar el procedimiento de análisis (o puede ir directamente a los análisis relacionados en el menú principal). 8. haciendo clic en el ícono del StatWizard se muestra un cuadro de diálogo de donde se pueden seleccionar uno ó más análisis a efectuar: Figura 8-6.El estudio será entonces elaborado y las mediciones capturadas en la hoja de datos. 134/ Usando StatWizard . para después presentar una lista de procedimientos relacionados.2 Seleccionando un Análisis para sus Datos Si los datos ya han sido leídos al Libro de Datos. Cuadro de Diálogo StatWizard para Seleccionar Análisis Existen cinco opciones: 1. 4. Por ejemplo. gráficas y otras salidas que pueden ser creadas en el STATGRAPHICS Centurion. Los SnapStats son análisis concisos que producen una sola página de salida pre-formateada. Seleccionar un SnapStat: Le permite seleccionar un SnapStat. el cuadro de diálogo tomará la siguiente forma: 135/ Usando StatWizard . 3. Seleccionado un objeto de la lista cambiará lo mostrado en el campo Seleccionar Análisis por Nombre .2.sf6 es leído al Libro de Datos. Tienen menos opciones que otros análisis pero son muy fáciles de crear. Seleccionar Análisis por Nombre: Muestra todos los análisis disponibles en orden alfabético. Seleccionando de las Siguientes Elecciones Rápidas: Enlista algunos de los análisis más comúnmente utilizado. 5. Seleccionando un análisis por nombre y pulsando ACEPTAR lo lleva directamente al cuadro de diálogo de captura de datos para ese análisis. enlistando solo aquellos análisis que calculan el objeto deseado. si el archivo 93cars. pruebas. Si elije la opción #1. evitando pasar por menús intermedios. el StatWizard enseguida mostrará un cuadro de diálogo en el cual se deben indicar los datos a analizar. Al seleccionar un análisis y pulsando ACEPTAR lo llevará directamente al cuadro de diálogo de captura de datos para ese análisis. Buscar: Muestra una lista de estadísticas. Figura 8-7. Los análisis mostrados en los cuadros de diálogo subsecuentes dependen de esta elección. Cuadro de Diálogo StatWizard de Selección de Datos Los campos en este cuadro de diálogo son: • Datos o Variables de Respuesta (Y): una o más variables de respuesta que contenga los valores a analizar. En un ANOVA. los factores explicativos van aquí. las variables independientes van aquí. esta debe ser capturada en este campo. • • • 136/ Usando StatWizard . Si solo una columna contiene datos a analizar. En una regresión. Factores Categóricos Explicativos (X): cualquier facor no cuantificable usado para predecir las variables de respuesta. Tipo: el tipo de datos contenidos en la(s) variable(s) de respuesta. Factores Explicativos Cuantitativos (X): cualquier factor cuantificable usado para predecir las variables de respuesta. una para cada valor específico contenido en la columna 137/ Usando StatWizard . Los procedimientos presentados en los cuadros de diálogo subsecuentes dependen de la captura de datos hecha en la Figura 8-7. El siguiente cuadro de diálogo le solicita cuales filas del archivo desea analizar: Figura 8-8. Cuadro de Diálogo StatWizard para Selección de Filas Las primeras seis opciones asumen que usted desea crear un solo análisis. La última opción creará varias ventanas de análisis.• Etiquetas del Caso: una columna que contenga las etiquetas de identificación para cada una de las observaciones (filas). Si usted contesta afirmativamente. Por ejemplo. 138/ Usando StatWizard .indicada. Cuadro de Diálogo StatWizard para Transformación de Variables Usted puede seleccionar una transformación para una o más variables. Al solicitar una transformación entonces se creará la expresión adecuada. Este es un modo sencillo de determinar una variable “CONDICIONADA” para un conjunto de análisis. Enseguida se le preguntará si desea transformar cualquiera de las variables indicadas. se mostrará el siguiente cuadro de diálogo: Figura 8-9. al solicitar una raíz cuadrada para MPG City se creará la expresión SQRT(MPG City) y será usada en los procedimientos de análisis. 3 Buscando por Pruebas y Estadísticas Deseadas Si usted desea calcular una estadística o prueba en particular sin estar seguro de que análisis es el que lo calcula. entonces después de capturar sus datos en una hoja de datos. 8. pulse el ícono del StatWizard en la barra de herramientas principal. Cuadro de Diálogo StatWizard de Selección de Análisis Seleccione uno ó más análisis de la lista. En el cuadro de diálogo inicial del 139/ Usando StatWizard . Cuando pulse ACEPTAR una ventana de análisis será creada para cada análisis seleccionado.Al final se mostrará un cuadro de diálogo enlistando todos los análisis adecuados para el tipo de datos que se han determinado: Figura 8-10. La lista de todas las estadísticas. Usando las Opciones de Búsqueda del StatWizard Al elejir un objeto de la lista.StatWizard. todos los análisis que calculan o generan ese objeto serán mostrados en el campo Seleccionar Análisis por Nombre: 140/ Usando StatWizard . elija Buscar y recorra la lista hacia abajo. pruebas y otros cálculos ejecutados por el STATGRAPHICS Centurion serán mostrados: Figura 8-11. Se pasará directamente al cuadro de diálogo de captura de datos para el análisis seleccionado. 141/ Usando StatWizard . Resaltar el nombre del análisis.Lista de Todos los Análisis que Coinciden con la Opción de Búsqueda Ahora para correr el análisis deseado de esta lista: 1. 3. 2. Haga clic en la opción de Seleccionar Análisis por Nombre. Pulsar ACEPTAR.Figura 8-12. evitando pasar por la manera común del uso de los menús. del menú Editar. se pueden configurar nuevos valores predeterminados para la mayoría de estas opciones.1 Funcionalidad General del Sistema Los valores predeterminados para el funcionamiento general del sistema y de los procedimientos estadísticos seleccionados pueden ser modificados seleccionando PreferenciasError! Bookmark not defined. Las Gráficas: se configuran seleccionando Opciones Gráficas al maximizar cualquier gráfica. En el programa existen 3 aspectos principales para realizar esto: 1. El separador Perfil en el cuadro de diálogo Opciones Gráficas le permite guardar varios conjuntos de atributos para las gráficas. Funcionalidad General del Sistema: se configura en el cuadro de diálogo Preferencias accesible desde el menú Editar.Capítulo Preferencias del Sistema Configurando las preferencias del funcionamiento del sistema. cada una tiene un valor predeterminado que ha sido seleccionado para satisfacer las necesidades de la mayoría de los usuarios. Opciones de Impresión: se configura en el cuadro de diálogo Configurar Página desde el menú Archivo. 2. Esto muestra un cuadro de diálogo con varios separadores. 9 El STATGRAPHICS Centurion contiene cientos de opciones. 3. Si lo desea. incluyendo el separador General que define el comportamiento global del sistema y otros separadores que contienen los valores predeterminados para los análisis estadísticos: 142/ Preferencias del Sistema . 9. Opciones del Sistema: opciones que aplican a todo el sistema. límites de predicción. El campo adicional indica el número de dígitos con los que se guardan los resultados numéricos de regreso en la hoja de datos. Dígitos Significativos: número de dígitos significativos usados para mostrar resultados numéricos. • 143/ Preferencias del Sistema . Cuadro de Diálogo de Preferencias Algunas de las opciones mas importantes que pueden ser configuradas son: • • Nivel de Confianza: porcentaje predeterminado para usarse en los límites de confianza.Figura 9-1. pruebas de hipótesis e interpretaciones del Valor-P por el StatAdvisor. Controlar). • Gráficas: opciones que aplican a todas las gráficas.o Usar Menú Seis Sigma: muestra el menú principal bajo los encabezados correspondientes al modelo Seis Sigma DMAMC (Definir. Mejorar. Los cambios en esta opción tendrán efecto hasta que el programa se reinicie. Normalmente. 144/ Preferencias del Sistema . Si se habilita esta opción y la computadora o el programa tienen algún imperfecto. o Suprimir Potencias en los Ejes: suprimir la notación especial al mostrar valores pequeños o grandes en las marcas de los ejes. con la excepción de que están arregladas bajo diferentes encabezados del menú principal. De forma predeterminada se asume que los años de 2 dígitos como 2/1/05 representan fechas entre 1950-2049. algunos puntos simbólicos pueden caer directamente en los ejes. Medir. Las mismas selecciones están disponibles con el menú clásico. o Mantener la Razón de Apariencia 1:1: mostrar los ejes verticales y horizontales con la misma longitud. Normalmente el eje horizontal es más largo que el vertical. Analizar. o Actualizar Vínculos para Cada Valor: recalcular todas las estadísticas siempre que el valor de un dato cambie. las estadísticas no son recalculadas hasta que un análisis recibe la indicación. o Habilitar Autoguardar: guardar el StatFolio y los archivos de datos de manera automática y definir el tiempo entre cada acción de guardar. o Siempre Blanco y Negro: mostrar gráficas en blanco y negro. o Año de 4 dígitos: mostrar fechas con años de 4 dígitos en lugar de 2 dígitos. se tiene la opción de reestablecer el estado del StatFolio y de la hoja de datos cuando se reinicie el programa. Si se suprime el espacio. es impreso. o Ordenar Nombres de Variables: enlistar los nombres de las columnas en orden alfabético dentro de los cuadros de diálogo de captura de datos. los nombres de las columnas serán enlistados en el mismo orden que en la hoja de trabajo. De otra forma. anulando cualquier otra configuración de colores. usualmente se usan notaciones como (X1000). publicado o el StatFolio es guardado. o Suprimir el espacio entre las marcas de los ejes: suprimir el espacio normal entre la intersección del eje vertical y horizontal y la primera marca de los ejes. o Resaltar Referencias en Rojo: resaltar con rojo en las ventanas de texto. los encabezados y otras opciones. o Añadir a Paneles de Texto: añadir automáticamente el informe del StatAdvisor al final de las ventanas de texto. 2. ya que reduce el número de instrucciones a la misma para guardar archivos. El informe del StatAdvisor siempre disponible pulsando el ícono del birrete en el menú principal. 145/ Preferencias del Sistema .2 Imprimiendo Existen dos alternativas en el menú Archivo que controlan los reportes impresos: 1. los archivos de datos y otros archivos serán colocados primero en este directorio. los valores referidos por el StatAdvisor. También se puede configurar la fuente del texto. 9. • • • Encabezados de los Análisis: usar una fuente azul para mostrar el título del análisis en la parte superior del panel del Resumen del Análisis. antes de ser copiados a su destino final. Directorio de Archivos Temporal: Si se especifica. Al determinar un manejador local.o Número de Decimales para Etiquetas: número predeterminado de decimales a usar en las leyendas mostradas a lo largo del márgen derecho de las gráficas. La descripción de las otras opciones las puede encontrar en el documento PDF Preferencias. StatFolios: seleccione Inhabilitar Rutinas de Inicio para evitar que las rutinas de inicio se ejecuten al momento de cargar un StatFolio. Configurar Impresión: da acceso al cuadro de diálogo de opciones de una impresión estándar que incluye el manejador de su impresora. Este cuadro de diálogo típicamente configura el tamaño y orientación de la hoja impresa. • StatAdvisor: configura el comportamiento predeterminado del StatAdvisor. los StatFolios. Configurar Página: cuadro de diálogo en el STATGRAPHICS Centurion que configura los márgenes. Este cuadro fué descrito en la sección 3. esto ayuda a incrementar enormemente la velocidad en algunas redes.3. se activa Opciones Gráficas en la barra de herramientas de análisis. Dentro del cuadro de diálogo hay un separador llamado Perfil. Separador Perfil en el Cuadro de Diálogo Opciones Gráficas Para cambiar los valores predeterminados del sistema: 146/ Preferencias del Sistema .9. Esta opción muestra un cuadro de diálogo con separadores que le permitirán cambiar la apariencia de la gráfica.3 Gráficas Al maximizar un panel que contenga una gráfica dentro de una ventana de análisis. como se describe en el Capítulo 4. en donde le permite guardar atributos gráficos para diferentes usuarios y cambiar el perfil predeterminado usado al crear una nueva gráfica: Figura 9-2. Seleccionar Opciones Gráficas en la barra de herramientas de análisis y posicionándose en el separador Perfil. La siguiente gráfica creada usará los atributos del Perfil recién guardado. Modifique las características de una gráfica en cualquier ventana de análisis. 2.) en un nuevo perfil. Capturar un nombre para identificar el perfil al guardarlo: Figura 9-3. etc. Defina colores. Seleccione Opciones Gráficas de la barra de herramientas de análisis y vaya al separador Perfil. 147/ Preferencias del Sistema . estilos de punto y líneas. También puede aplicar otros perfiles guardados a una nueva gráfica. Elija cualquiera de los 12 perfiles de usuario y pulse el botón Guardar como (los archivos de perfil son solo de lectura). Elejir cualquiera de los 15 perfiles y pulsar el botón Cargar. 5.1. fuentes y otras opciones que desea ver reflejadas en futuras gráficas. fuentes. 2. 4. Habilite la opción de Establecer Predeterminado. creándola con la configuración predeterminada y posteriormente: 1. 3. La gráfica será automáticamente actualizada reflejando la configuración del perfil seleccionado. Pulse ACEPTAR para guardar la configuración de los atributos de las gráficas (colores. Cuadro de Diálogo Guardar Perfil 6. 4 98.4 98.2 Capítulo Los datos fueron obtenidos del Journal of Statistical Education Data Archive (www.8 98.8 99 97.7 98 98.6 98.4 98.5 98 97.2 97.2 97.4 98.2 99.8 99.7 98.1 97.8 97.2 98.1 96.9 98.9 99.7 98.7 98.1 97.9 97.4 98. gráfico de caja y bigotes.2 97.6 98.6 97.4 98.2 98.3 98.6 98.5 98.9 97.8 98 98 98. Por ejemplo.4 97.7 97.8 98.4 99.html) y son usados bajo permiso.3 98.8 99 98 97.1 97.1 99.4 98.2 98.4 99.4 97.6 98.4 98.6 100 98.8 97.7 98.9 98.2 98 96.6 99.2 99.6 98.8 97.9 97.2 98.6 99.2 97. intervalos de confianza y pruebas de hipótesis.8 98.1 98 99 96.1 97.3 99. considere las siguientes temperaturas corporales tomadas de n = 130 individuos: 98.3 98. histograma.7 98.8 98.1 98.5 98 98.2 97.4 97.5 98.3 98.3 99 98.9 98.4 98 100.8 98.8 98.8 98.9 98.2 98.2 97.6 99 98.5 98.7 97 97.10 Tutorial #1: Muestra Analizando una Resumen estadístico.8 96.7 98 97.7 97.7 97.3 98.6 97.6 98. Estos han 148/ Análisis de una Muestra .6 97.4 98.6 98.amstat.1 99.4 98.9 98.8 99.7 97.3 97.3 98. Un problema muy común en estadística es el de analizar una muestra de n observaciones tomadas de una población única.5 96.4 98.8 98.7 96.8 98 98.org/publications/jse/jse_data_archive.8 98.2 97. primero cargue el archivo bodytemp. El procedimiento principal en el STATGRAPHICS Centurion para consolidar una muestra tomada de una población es el Análisis de una Variable. 3.sf3 en una hoja de datos. Seleccione bodytemp. El procedimiento de Análisis de una Variable resume los datos tanto de forma numérica como gráfica y realiza la prueba de hipótesis sobre la media. una fila por cada persona en el estudio. Para obtener esto: 1. Hoja de Datos con Datos de la Temperatura Corporal 149/ Análisis de una Muestra . la mediana y la desviación estándar de la población.1 Ejecutando el Procedimiento Análisis de Una Variable Para analizar los datos de la temperatura corporal. 2. 10. Seleccione Archivo – Abrir – Abrir Datos del menú principal.sido colocados en un archivo llamado bodytemp.sf3 de la lista de archivos del cuadro de diálogo Abrir Archivo de Datos.sf3. Los datos deben aparecer como se muestra a continuación: Figura 10-1. indique que desea abrir un archivo de datos STATGRAPHICS. En el cuadro de diálogo Abrir Datos. en una columna llamada Temperature que contiene 130 filas. 2.Las temperaturas corporales medidas en grados Farenheit están en la columna extrema izquierda. Si utiliza el menú Seis Sigma. Cuadro del Diálogo de Captura de Datos en el Análisis de una Variable Deje el campo Seleccionar en blanco para analizar las 130 filas. Una ventana de análisis con cuatro paneles aparecerá: Pulse ACEPTAR. En el cuadro de diálogo de captura de datos. elija Describir – Datos Numéricos – Análisis Univariado. El procedimiento Análisis Univariado puede invocarse del menú principal como sigue: 1. indique la columna a ser analizada: Figura 10-2. Si utiliza el menú Clásico. 150/ Análisis de una Muestra . elija Analizar – Datos Contínuos – Análisis Univariado. adelgazándose en ambos extremos. que se describen a continuación.8 grados. El panel superior derecho muestra un gráfico de dispersión.2 Resumen Estadístico La tabla en el panel inferior izquierdo muestra varios estadísticos de la muestra. Este comportamiento es típico de datos poblacionales cuya distribución cuenta con un pico central bien definido. 10. Note que los puntos son más densos entre los 98 y 99 grados.Figura 10-3. Ventana Análisis de una Variable El panel superior izquierdo indica que la muestra contiene n = 130 valores que van desde los 96. Se pueden añadir estadísticos adicionales maximizando este panel (haga doble clic con el botón izquierdo del ratón) y seleccione Opciones de Ventana en el menú emergente: 151/ Análisis de una Muestra .3 hasta los 100. Los paneles inferiores muestran un resumen estadístico y un gráfico de caja y bigotes. con los puntos dispersados aleatoriamente en dirección vertical. 8 Rango 4.25 . i.3 Máximo 100.733183 Coeficiente de variación 0.3 Desviación Estándar 0.746248% Mínimo 96. los cuartiles y el rango intercuartil de la muestra resulta en: Resumen Estadístico para Temperature Recuento 130 Promedio 98. Los datos de una distribución normal son completamente descritos por dos estadísticos: 1. Tabla de Resumen Estadístico Una suposición común para medir los datos es que estos vienen de una distribución Normal o de Gauss.Figura 10-4. ∑x i =1 n i n = 98.5 Cuartil Inferior 97.0205699 Curtosis Estándar 1. la cual estima el centro de la 152/ Análisis de una Muestra .81642 Figura 10-5.2492 Mediana 98. de una curva tipo campana.8 Cuartil Superior 98. La media o promedio de la muestra x = distribución.e. Cuadro de Diálogo de las Opciones del Resumen Estadístico Añadiendo la mediana.7 Rango intercuartílico 0.9 Sesgo Estándar -0. 8 Estos cinco números dividen la muestra en cuartiles y forman la base de su gráfico de caja y bigotes. Dos estadísticos que pueden ser usados para revisar esta suposición son el sesgo estandarizado y la curtosis estandarizada. descrita en la siguiente sección. aproximadamente el 68% de todos los valores caerán dentro de una desviación estándar de la media poblacional. tanto la asimetría estandarizada como la curtosis estandarizada deben encontrarse dentro del rango de -2 a +2.3 Cuartil Inferior (25° percentil) = 97.8 Mediana (50° percentil) = 98. Otros estadísticos muy útiles son estos cinco valores de John Tukey: Mínimo (valor mínimo de los datos) = 96.2. tienen un sesgo positivo. Si los datos provienen de una distribución normal. La desviación estándar de la muestra s = dispersión de la distribución. En el caso que nos compete. Una distribución más aplanada tiene curtosis negativa. Una distribución simétrica como la normal tiene una nula asimetría.7 Máximo (valor máximo de los datos) = 100. Estas medidas estadísticas dan forma a: 1.73% dentro de tres desviaciones estándar. que se relaciona con la Para una distribución normal. 2.733 . 153/ Análisis de una Muestra . Una curva normal o de campana tiene cero curtosis. Curtosis mide la forma de una distribución simétrica. Sesgo mide el grado de simetría o la falta de esta. Las distribuciones cuyos valores tienden a caer más por encima del pico que por abajo de éste. ∑ (x i =1 n i − x) 2 n −1 = 0. La media y la desviación estándar de una muestra la describen completamente solo si viene de una distribución normal.3 Cuartil Superior (75° percentil) = 98. Una distribución con un pico mayor alrededor de la media que la normal tiene curtosis positiva. aproximadamente el 95% dentro de dos desviaciones estándar y aproximadamente el 99. parece que la distribución normal es un modelo razonable para los datos. Las distribuciones cuyos valores tienden a caer más por debajo del pico tienen un sesgo negativo. Cuadro de Diálogo de Preferencias Utilizado para Seleccionar Estadísticos Predeterminados 154/ Análisis de una Muestra .Nota: El seleccionar estadísticos adicionales usando Opciones de Ventana es solo aplicable para el análisis actual. Para cambiar los estadísticos predeterminados para futuros análisis. vaya al menú Editar y elija Preferencias. El separador Estadísticos en ese cuadro de diálogo le permitirá cambiar los estadísticoss calculados de forma predeterminada cuando el Análisis Univariado es ejecutado (así como muchos otros procedimientos que contienen un resumen estadístico): Figura 10-6. es el gráfico de caja y bigotes mostrado en la esquina inferior derecha en la Figura 10-3 y agrandado a continuación: Gráfico de Caja y Bigotes 96 97 98 99 Temperature 100 101 Figura 10-7.10. Gráfico de Caja y Bigotes para Temperaturas Corporales El gráfico de caja y bigotes se elabora: 1. Trazando los bigotes desde cada cuartil hasta las observaciones más pequeñas y más grandes en la muestra. Trazando una línea vertical en la posición de la mediana.3 Gráfico de Caja y Bigotes Un gráfico bastante útil para analizar y resumir un conjunto de datos creado por John Tukey. a menos de que algunos valores se encuentren lo bastante lejos de 155/ Análisis de una Muestra . El 50% del total de los datos son aquellos comprendidos dentro de la caja. Trazando un signo de más en el sitio de la media de la muestra. esta línea debe encontrarse cerca del centro de la caja. Dibujando una caja que se extiende desde el cuartil inferior hasta el cuartil superior. Si los datos vienen de una distribución normal. que divide los datos a la mitad. 4. Cualquier diferencia substancial entre la mediana y la media indica ya sea la presencia de un dato aberrante (un valor que no proviene de la misma población que el resto) o una distribución asimétrica. En el caso de una distribución asimétrica. 3. la media será empujada en la dirección de la cola más larga. 2. la posibilidad de observar 1 ó 2 puntos externos en una muestra de n = 100 observaciones es del 50% y no necesariamente indica la presencia de un dato aberrante real. El gráfico de caja y bigotes en la Figura 10-7 es razonablemente simétrico. Puntos “externos” – puntos 1. STATGRAPHICS Centurion coincide con Tukey para identificar dos clases de puntos atípicos: a. los puntos muy lejanos son usualmente indicadores de datos aberrantes reales (o de una distribución no normal). Incluso cuando los datos provienen de una distribución normal. Los puntos externos son denotados mediante un símbolo pero sin el signo de más sobreimpuesto. Los bigotes tienen la misma longitud y la media y mediana son similares y cercanas al centro de la caja.la caja para ser clasificados como “puntos externos”. equivalente al ancho de la caja). Los puntos muy lejanos son denotados mediante un símbolo (usualmente un cuadro pequeño) con un signo de más sobreimpuesto. Puntos “muy lejanos” – puntos 3 veces mayores al rango intercuartil por arriba ó abajo de los límites de la caja. Si selecciona Opciones de Ventana de la barra de herramientas de análisis. Estos puntos deben solo ser considerados para un análisis más detallado. Si los datos provienen de una distribución normal y el tamaño de la muestra es como en el ejemplo. A menos de que haya miles de observaciones en la muestra. pero no los puntos muy lejanos. (Nota: el rango intercuartil es la distancia entre los cuartiles.5 veces mayores al rango intercaurtil por arriba ó abajo de los límites de la caja. en cuyo caso los bigotes se extenderán hasta los puntos extremos no clasificados como “externos”. Tres puntos externos son señalados. Dando clic en el dato atípico en el extremo derecho nos indica que corresponde a la fila #15 del Archivo. la probabilidad de que cualquier punto se encuentre lo suficientemente lejos de la caja para ser clasificado como punto muy lejano es de solo 1 en 300. b. puede añadir una muesca a la altura de la mediana del gráfico: 156/ Análisis de una Muestra . 4 Evaluando Datos Aberrantes Antes de estimar cualquier estadístico adicional. Si usa el menú Seis Sigma. 2. elija Analizar – Datos Continuos – Identificación de Valores Atípicos.1567. el error muestral es apróximadamente de 0. La prueba esta disponible en el menú principal seleccionando: 1. mostrada en el panel izquierdo. usando el nivel de confidencia predeterminado del sistema (usualmente 95%). 10. Muestra el margen de error al estimar la mediana de la temperatura de la población desde donde se tomó la muestra. Especificando Temperature en el campo de Datos se genera una amplia tabla estadística. Si usa el menú clásico. 98. es importante tomar un momento para analizar si la fila #15 debe ser considerado un dato aberrante real y potencialmente eliminarlo del conjunto de datos. De interés particular es la tabla que muestra los 5 valores más pequeños y los 5 valores más grandes de la muestra: 157/ Análisis de una Muestra .4433] 96 97 98 99 Temperature 100 101 Figura 10-8.Gráfico de Caja y Bigotes Intervalos de confianza del 95% para la mediana: [98. elija Describir – Datos Numéricos – Identificación de Valores Atípicos. Gráfico de Caja y Bigotes con una Muesca en la Mediana al 95% Esto añade una muesca a la muestra abarcando un intervalo de confianza aproximado para la mediana poblacional. Una muestra más amplia dará como resultado un márgen de error menor. En este caso. El STATGRAPHICS Centurion incluye un procedimiento que realiza una prueba formal para determinar si una observación puede razonablemente provenir de una distribución normal.15 grados en ambas direcciones. 01521 1.698 -2. Los Valores Estudentizados con Eliminación indican cuantas desviaciones estándar cada observación se encuentra de la media de la muestra.70594 97 99.7 -2.7323 2.3879 15 100.8 3. Hipótesis alternativa: El valor extremo más lejano no proviene de la misma distribución normal que las otras observaciones.30628 2.7 -2.67021 Modificados Valor-Z MAD -2.47903 Prueba de Grubbs' (asume normalidad) Estadístico de prueba = 3.47903 Valor-P = 0.3 -2.67 desviaciones estándar.479 desviaciones estándar por encima de la media de la muestra.56955 13 99.59096 1.25151 120 100. cuando esa observación no se incluye en el cálculo.11302 30 96..4 1.0484379 Valores Estudentizados Con Supresión -2.45231 3..97663 . Tabla Seleccionada del Procedimiento de Identificación de Datos Atípicos El valor más inusual es el de la fila #15. 158/ Análisis de una Muestra .5 1.0 2.15912 -2. Los valores estudentizados se calculan de: zi = xi − x s Un valor de 3.6188 2. cuando la observación se incluye en el cálculo de x y s. Las observaciones a más de 3 desviaciones estándar de la muestra son inusuales. Si no se incluye en el cálculo. a menos que el tamaño n de la muestra sea muy grande ó que la distribución no sea normal.0235 1.8 -1.1584 -2.4839 1.2933 3. 99 99.3725 Figura 10-9. que es resaltado en rojo.52219 23 96.1584 2.5631 -2. Una prueba formal puede hacerse de las siguientes hipótesis: Hipótesis nula: El valor extremo más lejano proviene de la misma distribución normal que las otras observaciones.479.65859 55 96.479 indica que una observación está 3.74567 -2.4 -2.9 2.15912 -2.11302 73 96.Valores Ordenados Valores Estudentizados Fila Valor Sin Supresión 95 96.1584 -2. Este tiene un Valor Estudentizado sin Eliminación de 3. la fila #15 se encuentra alejada en 3.59723 -2. En general. Debido a que el valor-P es menor a 0. también conocida como la prueba de Desviación Estudentizada Extrema. “Suficientemente pequeño” se define como menor a 0.479. el valor-P cuantifica la probabilidad de obtener un estadístico tan ó más inusual que el observado en la muestra. La salida modificada de la Identificación de Datos Aberrantes es: 159/ Análisis de una Muestra .0484. El valor-P es igual a 0. entonces con la expresión usada en el campo Seleccionar . el estadístico de prueba es similar al Valor Estudentizado sin Eliminación. se rechaza la hipótesis nula. 3. Puede ahora eliminar la fila #15 pulsando el ícono de Captura de Datos en la barra de herramientas de análisis e introducir una expresión en el campo Seleccionar como se muestra abajo: Figura 10-10. Si existe una probabilidad menor al 5% de que la muestra tenga un resultado que indique que la hipótesis nula fué verdadera. Cuadro de Diálogo de Identificación de Datos Aberrantes con Eliminación de estos Datos Debido a que la fila #15 es la única observación que excede los 100 grados. Si el valor-P es suficientemente pequeño. solo se seleccionarán las otras n= 129 filas. ya que la muestra habrá sido un evento extremadamente raro. la hipótesis nula puede ser rechazada.Una prueba usada para estas hipótesis es la prueba de Grubbs.05 y es conocido como el “nivel de significancia” de la prueba.05. En el ejemplo. si la hipótesis nula es cierta. concluyendo que la fila #15 es un dato aberrante comparado con el resto de la muestra. El STATGRAPHICS Centurion realiza esta prueba y genera un Valor-P. entonces la hipótesis nula es rechazada. 4 -2.23455 -2.4 1.0 Rango 3.05.5631 -2.08332 1. y entonces el resumen estadístico se mostrará así: Resumen Estadístico para Temperature Recuento 129 Promedio 98.0235 1.6188 2.40217 Curtosis estandarizada 0.6956 -2. Debido a que el valor-P para la prueba de Grubb está muy por encima de 0. de variación 0.5 1.4 1.3852 120 100.1584 2.04097 .70038 Coef.7 Rango inercuartílico 0.6713 99 99.3 Máximo 100.18375 73 96.18375 30 96.81408 97 99. Resumen Estadístico después de Eliminar la fila #15 160/ Análisis de una Muestra .84516 2.713004% Mínimo 96.Valores Ordenados Valores Estudentizados Fila Valor Sin Supresión 95 96.75487 55 96.44992 2.7 Cuartil inferior 97.7 -2.2295 Mediana 98.75487 Valor-P = 0.4839 1.9 Sesgo estandarizado -1.69652 1.9 2.3 Desviación estándar 0.7 -2.676064 Valores Estudentizados Con Supresión -2.60411 Modificados Valor-Z MAD -2. Modificaremos el cuadro de diálogo de captura de datos para el Análisis Univariado de la misma forma que en la Figura 10-10.52798 Prueba de Grubbs' (asume normalidad) Estadístico de prueba = 2. se puede deducir que todas las observaciones restantes provienen de la misma población.6713 13 99. 119 99..1584 -2.61209 23 96.1584 -2.2933 Figura 10-11.4839 1. es que uno regrese al estudio original y tratara de encontrar una causa asignable al valor anormal para el caso #15. Como ahora ya no es posible hacerlo.0 2.23455 -2.3 -2. Salida de Identificación de Datos Aberrantes después de eliminar la fila #15 El valor extremo más alejado entre las observaciones restantes es ahora la fila #95..698 -2.257075 Figura 10-12. Lo ideal.69652 1. aceptaremos los resultados de la prueba de Grubb y eliminaremos a la fila #15 de todos los cálculos subsecuentes.85205 -2.8 Cuartil superior 98.8 -2. 10. Volviendo al procedimiento de Análisis Univariado. . predeterminado es el siguiente: El histograma Histograma 40 30 frecuencia 20 10 0 96 97 98 99 Temperature 100 101 Figura 10-13. un histograma puede crearse pulsando el ícono de Gráficas en la barra de herramientas de análisis y seleccionando Histograma.5 Histograma Otra gráfica muy común que ilustra una muestra de mediciones es el histograma. El número de barras y su grosor se predeterminan basándose en el tamaño de la muestra n. sin importar que regla fue seleccionada en el separador AED (Análisis Exploratorio de Datos) del cuadro de diálogo Editar .Preferencias : 161/ Análisis de una Muestra . Histograma con Clases Predeterminadas La altura de cada barra en el histograma representa el número de observaciones que caen dentro del intervalo de temperature abarcado por la barra. Otras reglas. como la regla 10log10(n).Figura 10-14. tienden a producir más barras de forma predeterminada y son preferibles en caso de trabajar con conjuntos de datos grandes. Separador AED en el Cuadro de Diálogo Preferencias Usando la regla de Sturges. Para cambiar temporalmente la configuración del histograma creado dar doble clic en el histograma para maximizarlo y seleccionar Opciones de Ventana: 162/ Análisis de una Muestra .322log10(n)). el número de barras se basa en el mínimo entero que no sea menor a (1+3. cada uno abarcando un intervalo de 0. De esta forma. El gráfico siguiente muestra 25 intervalos entre 96 y 101 grados. Por ejemplo. cada barra abarcará el mismo número de medidas posibles.2 grados: Histograma 18 15 frecuencia 12 9 6 3 0 96 97 98 99 Temperature 100 101 Figura 10-16. Opciones de Ventana para el Histograma Al establecer las clases. Histograma con Clases Reestablecidas 163/ Análisis de una Muestra . El ancho de los intervalos abarcados por las barras deben ser entonces un entero múltiplo de 0.1. se debe tomar en consideración el número de dígitos significativos en los datos.1 de grado más cercano. las mediciones de las temperaturas corporales fueron redondeadas al 0.Figura 10-15. 2713 0.0 96.0000 Tabla de Frecuencias para Temperature Límite Límite Clase Inferior Superior Punto Medio menor o igual 96.7054 0.0000 0.3 23 100.4 100.2 97.0465 0.6 97.0000 0.9 16 99.2 98.0000 0.2 96.0155 0.1 17 99. 0.0 99.0155 0.6 99.9 6 97.6 96.0233 0.5 24 100. se evidencian más los detalles.1473 0.8 101.8 100.8 99.4 99.0543 0.4961 0.0000 1.3 8 97.6 98.0000 0.9457 0.0000 0.8 99.8450 0.4 96.7 10 97.0000 0.0000 0.6 98.0000 0.6 100.4 100.0000 1.1 7 97.0 100.0 Media = 98.1008 0.5 14 98.0 97.9845 0.0155 0.6 99.0000 0. Los datos mostrados en el histograma pueden exhibirse en forma tabular pulsando el ícono Tablas en la barra de herramientas de análisis y seleccionando Tabulación de Frecuencias: Frecuencia Relativa 0.0388 0.1938 0.70038 Frecuencia 0 0 2 0 3 2 6 6 6 10 16 13 14 13 18 7 6 4 1 0 2 0 0 0 0 0 0 Figura 10-17.0078 0.6047 0.4 98.4 97.2 96. La forma general de la distribución es similar a la de una curva normal de campana.1 2 96.1 22 100.2 100. Acum.0000 1.0000 1.8 100.8 98.8 98.0465 0.8 97.1395 0.0775 0.9 11 98.2 99.1240 0.2 99.7 20 99.2295 Desviación Estándar = 0.0155 0.4 98.8992 0.3 18 99.0000 0.7 5 96.6 97.6 96.1 12 98.8 97.0543 0.1008 0.9767 0.7 15 98.3 13 98.2 98.8 96.0 98.4 99.9 mayor de 101.0000 Frecuencia Acumulada 0 0 2 2 5 7 13 19 25 35 51 64 78 91 109 116 122 126 127 127 129 129 129 129 129 129 129 Frecuencia Rel.3953 0.1008 0.2 97.7 25 100.0465 0.4 97.0155 0.5 4 96.0 98.0 99.0000 1.0 96.5 9 97.Entre más número de clases existan.0465 0.0 97.0 1 96.0310 0. 164/ Análisis de una Muestra .2 100.9 21 100.3 3 96.0000 0. Tabulación de Frecuencia Note que las observaciones son contadas cuando caen dentro de un intervalo si son mayores al límite inferior del intervalo y menores o iguales al límite superior.1085 0.0 100.4 96.9845 1.0000 1.5 19 99.6 100. 165/ Análisis de una Muestra . Por ejemplo. ya que muestra la probabilidad acumulada de que un individuo caiga dentro de una clase seleccionada o clases anteriores. Gráfico de Cuantilest En este gráfico. el 89. La Figura 10-18 también muestra un cursor de coordenadas.2 0 96 97 98 Tem perature 99 100 Figura 10-18. Como la columna extrema derecha en la tabla de frecuencias.6 0.92% de todos los valores son iguales o menores a 99.La columna de la extrema derecha es también de considerable interés. Ahora entonces puede usar el ratón para desplazar el cursor a cualquier sitio. El valor j o mayor es entonces graficado en Y = (j+0. En el gráfico anterior.8 proporción 0.0 grados. 10.4 0. los datos son primero ordenados de menor a mayor. Los números pequeños cercanos al cursos indican su posición. el cursor ha sido utilizado para localizar la mediana o el 50o percentil. Estos son creados pulsando el botón derecho del ratón mientras se observa la gráfica y seleccionando Localizar del menú emergente.6 Gráfico de Cuantiles y Percentiles Otro modo de mostrar probabilidades acumuladas es seleccionando Gráfico de Cuantiles de la lista de Gráficas en el procedimiento Análisis Univariado: Gráfico Cuantil 1 0.1 grados más cercanos. Ya que los datos de la temperatura fueron medidos solamente a los 0.5)/n. Esto estima la proporción de la población en ó debajo de la temperatura observada. la curva representa la probabilidad acumulada de que un individuo tenga menor o igual temperatura a aquella mostrada en el eje horizontal. existen saltos verticales en la gráfica anterior.5. que es el valor de temperature en el cual la proporción mostrada en el eje vertical es igual a 0. 3508 98.8 97.0% 99. dado el tamaño limitado de la muestra.4 96.2 97.0% de límites de confianza Normal.3 99. con 95% de confianza.31 grados. 10. basándonos en la suposición de que la muestra proviene de una distribución normal.2295 +/.9761 95.1538 25. Seleccionando Intervalos de Confianza del cuadro de diálogo Tablas aparecerá: Intervalos de Confianza para Temperature Intervalos de confianza del 95.0% 97.2473 97. La mejor estimación de ese percentil basada en la muestra de datos es de 99.3051 99.624081.0% 98.6479 Límite Superior 96.6152 50. Por ejemplo. 98. Intervalos de Confianza del 95% para la Media y la Desviación Estándar Los intervalos de confianza ofrecen un límite en el error potencial al estimar la media y la desviación estándar de la población. el 90o percentil puede caer en cualquier lugar entre 98.8727 10. el 90o percentil es el valor de temperatura excedido solo por el 10% de los individuos en la población.0% 99.34 5.3 98.2116 99. podemos asegurar con 95% de confianza que la media de la temperatura de la población se localiza en 166/ Análisis de una Muestra .1 grados.798114] Figura 10-20.1082 75. Figura 10-19.1 98.8437 99.0.811 97.98 y 99.0% 96. 0.5862 100.0% 99.0% 97. Dadas las restantes n = 129 observaciones.119 El informe incluye 95. No obstante. podemos proceder a establecer las estimaciones finales para los parámetros de la distribución de la que provienen los datos. Las Opciones de Ventana se utilizan para añadir límites de confianza del 95% a esos percentiles.7 Intervalos de Confianza Habiendo eliminado el dato aberrante de la muestra.0% para la media: 98.0 96.4829 97.122015 [98.Una tabla de percentiles puede crearse seleccionando Percentiles de la lista de Tablas: Percentiles para Temperature Percentiles Límite Inferior 1.7 98.0% 98. Tabla de Percentiles El po percentil estima el valor de temperatura debajo del cual el p% de la población se encuentra.0% para la desviación estándar: [0.5743 90.3515] Intervalos de confianza del 95.8846 98.1074.9 99.0% 97. 167/ Análisis de una Muestra . ya que los datos no tienen una asimetría o curtosis representativa. En su lugar.798 grados. Cuadro de Diálogo de Opciones de Intervalos de Confianza Los intervalos bootstrap. contrario a los intervalos de la Figura 10-20. 98. La tabla inferior muestra intervalos bootstrap para la media. muestras aleatorias de las n = 129 observaciones son tomadas de los datos. pueden solicitarse intervalos de confianza adicionales usando el método bootstrap: Figura 10-21.798114] Intervalos Bootstrap Media: [98.1074. Igualmente.610521. Esto no es inesperado.3515] Intervalos de confianza del 95.algún punto entre los 98.4] Figura 10-22.2295 +/.1. muestreando con réplica (las mismas observaciones pueden ser seleccionadas más de una vez). Esto se repite 500 veces. Seleccionando Opciones de Ventana. 98.0% para la desviación estándar: [0. no se apoyan en la suposición de que la población sigue una distribución normal.624081.624 y 0. 0.3504] Desviación Estándar: [0.780949] Mediana: [98. Intervalos Bootstrap de Confianza de 95% Los intervalos anteriores que fueron calculados usando la distribución t de Student y la distribución chi-cuadrada.11 y 98. la desviación estándar de la población se localiza en algún punto entre los 0.35 grados. son emparejados lo más cerca posible por los intervalos bootstrap. 0.122015 [98.0% para la media: 98. 98. la desviación estándar y la mediana de la población: Intervalos de Confianza para Temperature Intervalos de confianza del 95. las estadísticas de la muestra son calculadas y el 95% de los resultados más cercanos al centro son usados para calcular los intervalos de confianza.0.1085. 6 grados Fahrenheit. Por ejemplo. elija Opciones de Ventana y especifique los atributos de la prueba deseada: Figura 10-23. Bajo la Hipótesis Alt. Antes de examinar los resultados. Para probar si los datos actuales provienen ó no de una distribución normal con dicha media. elija Pruebas de Hipótesis de la lista de Tablas.10.6 grados Hipótesis Alternativa: μ ≠ 98.. puede seleccionar cualquiera de las tres hipótesis alternativas: 168/ Análisis de una Muestra .8 Pruebas de Hipótesis También pueden realizarse pruebas de hipótesis. se efectúa una prueba de hipótesis para probar entre: Hipótesis nula: μ = 98. Opciones de Ventana para Pruebas de Hipotésis El valor capturado para la Media representa la hipótesis nula. a menudo es acertado pensar que la temperatura humana normal es de 98.6 grados Para ejecutar la prueba dentro del procedimiento Análisis Univariado. 07771 (aplicada la corrección por continuidad) Valor-P = 3.6 Aunque la muestra sugiere una temperatura media inferior.1. una alternativa bilateral se ha seleccionado.70038 Prueba t Hipótesis Nula: media = 98.6 Alternativa: no igual Estadístico t = -6.81264E-8 Se rechaza la hipótesis nula para alpha = 0. basada en los rangos de distancia de cada observación de la mediana hipotetizada.3 Desviación Estnd.7099 Rango medio de valores mayors a la mediana hipotética: 43. 169/ Análisis de una Muestra . de la muestra = 0. que supone que los datos provienen de una distribución normal (no obstante ésta no es excesivamente sensible al incumplimiento de esta suposición). Mayor que: μ > 98. Prueba de rangos con signo Hipótesis Nula: mediana = 98.6 grados sería considerado en este momento como una “intromisión de datos”. No igual: μ ≠ 98.00896 Valor-P = 1.6 Alternativa: no igual Rango medio de valores menores a la mediana hipotética: 67. Esta prueba no asume normalidad y es menos sensible a los datos Aberrantes que la prueba t.6 3. Figura 10-24. Resultados de la Prueba de Hipotésis Los resultados de dos pruebas se muestran: 1. Menor que: μ < 98.05.5658 Estadístico para Grandes Muestras = 5. Crear una prueba unilateral con una hipótesis alternativa de μ < 98. 2.82663E-7 Se rechaza la hipótesis nula para alpha = 0. Una prueba no paramétrica de Wilcoxon para muestras apareadas.05. Una prueba t estándar.2295 Mediana Muestral = 98. Los resultados de la prueba se muestran a continuación: Prueba de Hipótesis para Temperature Media Muestral = 98. ya que estaríamos formulando la hipótesis después de haber visto los datos.6 2. Usando los resultados en la Figura 10-12. Este crea límites de tolerancia normal.8. Si usa el menú Seis Sigma menu. rechazando a fondo la hipótesis de que la muestra proviene de una población con una media de 98.0000000181264. la media y la desviación estándar de la muestra.En ambos casos.9 Límites de Tolerancia Un análisis adicional resulta útil para los datos de la temperatura corporal. Si usa el menú clásico. el valor-P está muy por debajo de 0. la captura apropiada es: 170/ Análisis de una Muestra . Debe notarse que el intervalo de confianza para la media. El valor-P mostrado como 1.05. dado en la Sección 10. Los límites de tolerancia están disponibles en el menú principal seleccionando: 1. 10. elija Analizar – Datos Continuos – Límites de Tolerancia Estadística El procedimiento inicia mostrando un cuadro de diálogo dentro del cual se captura el tamaño n. Cualquier valor fuera del intervalo de confianza sería rechazado por la prueba t considerada aquí.6 grados. NOTA: la notación E-8 después de un número significa que el número debe ser multiplicado por 10-8. que son límites dentro de los cuales un porcentaje seleccionado de la población es estimado para caer con un nivel de confianza dado. no incluye el valor 98.6. Puede pensarse entonces que el intervalo de confianza contiene todos los valores posibles para la población sustentada con la muestra de datos. elija Describir –Datos Numéricos – Límites de Tolerancia Estadística 2.81264E-8 equivale a 0. Este intervalo se calcula tomando la media de los datos +/-2. También creado por el procedimiento Límites de Tolerancia Estadística esta el Gráfico de Tolerancia.2093 El StatAdvisor Asumiendo que los datos provienen de una distribución normal.88436 sigma Superior: 100.70038 Intervalos de tolerancia del 95. El nivel de confianza y el porcentaje de la población que está limitada puede cambiarse usando Opciones de Ventana.2295 Desviación estándar de la muestra = 0.25.2.0% de la población Xbarra +/.0% de la distribución se encuentra entre 96. Cuadro de Diálogo para Límites de Tolerancia Estadística La salida resultante se muestra a continuación: Límites de Tolerancia Estadístico Tamaño de muestra = 129 Media de la muestra = 98. que muestra los límites de tolerancia: 171/ Análisis de una Muestra . Figura 10-26. Resumen del Análisis para Límites de Tolerancia Estadística La interpretación del StatAdvisor resume los resultados de forma concisa.88436 veces por la desviación estándar. los límites de tolerancia establecen que se puede estar 95.0% (intervalo) de tolerancia para 99.Figura 10-25.2093 y 100.0% confiados en que el 99.25 Inferior: 96. 6 LIT: 96.sigma=0. es probable que caiga fuera de los límites calculados. 172/ Análisis de una Muestra . Gráfico de Tolerancia No más de un individuo de cada 100.25 Nvl.3 0.2 0.4 f(x) 0.0% 0.5 Prop. pob.Límites de Tolerancia Normal n=129. Conf.2295.70038 0.media=98.: 99.1 0 95 97 99 x 101 103 LST: 100.: 95.0% Figura 10-27.21 0. En éste tutorial. 2. invocado desde el menú principal como sigue: 173/ Comparando Dos Muestras . Por lo regular.11 Tutorial #2: Comparando Dos Muestras Comparaciones Gráficas y pruebas de hipótesis. compararemos los datos correspondientes a las mujeres con aquellos de los hombres. los datos que se van a analizar consisten de dos muestras que posiblemente sean de poblaciones diferentes. Abrir el archivo de datos bodytemp. 65 eran mujeres y 65 hombres. Presentar los datos de tal forma que permita comparaciones visuales. De estas personas. Capítulo 11.sf3 usando Abrir Datos en el menú Archivo – Abrir. se analizaron las temperaturas corporales tomadas a 130 personas.1 Ejecutando el Procedimiento de Comparación de dos Muestras El procedimiento principal para comparar datos de dos muestras es el procedimiento Comparación de Dos Muestras. Para analizar los datos con las temperaturas corporales. En el capítulo anterior Tutorial #1. Probar hipótesis que determinen si existen ó no diferencias estadísticamente significativas entre las muestras. Para estos casos. resulta muy útil: 1. Cuadro de Diálogo de Comparación de Dos Muestras El campo Captura indica cómo los datos de las dos muestras fueron capturados: 1. El archivo bodytemp.sf3 contiene el segundo tipo de estructura. El cuadro de díalogo de captura de datos para este procedimiento es el siguiente: Figura 11-1. Dos Columnas de Datos – los datos para cada muestra están en diferentes columnas. 2. Columnas Código y de Datos – los datos para ambas muestras están en la misma columna y una segunda columna contiene los códigos que diferencían a ambas muestras. se incluye una 174/ Comparando Dos Muestras . elija Analizar – Datos Continuos – Comparación de Dos Muestras – Muestras Independientes.1. En el campo Seleccionar. Si usa el menú Clásico. Si usa el menú Seis Sigma. elija Comparar – Dos Muestrass – Muestras Independientes. mientras una segunda columna Gender contiene la descipción de “Mujer” y “Hombre”. 2. con todas las n = 130 observaciones en una misma columna llamada Temperature. 2 Resumen Estadístico La tabla Resumen Estadístico presenta estadísticas calculadas para cada muestra: 175/ Comparando Dos Muestras . existen n1 = 64 observaciones para mujeres en un rango de 96. 11. un histograma dual. un resumen estadístico por grupo y un gráfico de caja y bigotes dual.0 grados y n2 = 65 observaciones para hombres en un rango de 96.4 hasta 100.expresión para tomar en cuenta solo las filas cuya Temperature sea menor o igual a 100.3 hasta 99. Ventana de Análisis Comparación de Dos Muestras Al eliminar el dato aberrante.5 grados. la cual se determinó en el Capítulo 10 como un dato aberrante. Figura 11-2. La ventana inicial del análisis contiene 4 paneles. Esto excluye la fila #15. que incluyen un resumen de los datos. 3.0 Rango 3.695697% Mínimo 96. La desviación estándar de las mujeres es levemente menor que la de los hombres.6 1. Si la aparente diferencia entre las mujeres y los hombres es ó no estadísticamente significante.702297 -0.610877 Figura 11-3.698756 0.1046 98.6 Cuartil Inferior 98.3562 Mediana 98. La temperatura media de las mujeres es 0. Además la diferencia entre las medianas es de 0. Como se explicó en el Capítulo 10.5 3.2 97.3 Histograma Dual El histograma dual ofrece una comparación espalda con espalda de las dos muestras.1 0.Resumen Estadístico para Temperature Gender=Female Recuento 64 Promedio 98. Ambas muestras tienen valores de asimetría y curtosis estandarizada dentro del rango de -2 a 2.4 Desviación Estándar 0.8 Sesgo Estándar -1.35246 Curtosis Estándar 1.49635 Gender=Male 65 98.8 Rango intercuartílico 0.30 grados. 2. 11. está todavía por determinarse. Al usar Opciones de Ventana para reescalar los intervalos de clasificación de manera que existan 25 intervalos entre los 96 y 101 grados se genera la siguiente gráfica: 176/ Comparando Dos Muestras . los valores dentro de ese rango son consistentes con la hipótesis de que los datos vienen de una distribución normal.712256% 96. Resumen Estadístico por Muestra Existen varios factores que son de interés especial: 1.4 Máximo 100. implicando que la temperatura corporal de las mujeres puede ser menos variable que la de los hombres.3 99.684262 Coeficiente de variación 0.0 -0.0 Cuartil Superior 98.25 grados superior al de los hombres.6 98. La mediana se indica con el trazo de una línea vertical. es particularmente útil agregar muescas a la mediana accesando Opciones de Ventana. Como se explica en el Capítulo 10. mientras que el histograma de los hombres está invertido y está por debajo de la línea. Los bigotes se extienden al valor más pequeño y más grande de cada muestra. En éste caso. asi como signos de + indican el sitio de las medias de cada muestra. las cajas centrales abarcan la mitad de los datos de cada muestra. 11. excepto por aquellos puntos que estén extermadamente lejos de las cajas. La gráfica resultante se muestra a continuación: 177/ Comparando Dos Muestras .Female 17 12 frecuencia 7 2 3 8 13 96 97 98 Male 99 100 101 Figura 11-4.4 Gráfico Dual de Caja y Bigotes La ventana de análisis también presneta gráficos de caja y bigotes para las dos muestras. Las formas de distribución son similares. con un posible repunte a la derecha en la distribución de las mujeres. Histograma Dual La gráfica muestra el histograma correspondiente a las mujeres sobre la línea horizontal. tomando en cuenta el nivel de significancia predeterminado por el sistema (que actualmente es de 5%). El rango cubierto por las mujeres es más amplio que el rango cubierto por los hombres. Tanto la media y la mediana de las muestras observan una diferencia similar. 3. 178/ Comparando Dos Muestras . Una aparente separación del centro de la distribución de las mujeres hacia la derecha de la distribución de los hombres. parece haber una diferencia en el centro de las dos muestras. Basado en este gráfico. pero solo si se incluye el punto extremo más bajo. Gráfico Dual de Caja y Bigotes con Muescas en la Mediana Es evidente en la gráfica: 1. Una comparación más detallada se describe en una sección más adelante. uno puede suponer que las dos medianas son significativamente diferentes. Las muescas son trazadas de tal modo que si las dos muescas no se sobreponen. no obstante la significancia estadística de esta diferencia permanece en duda. La muesca de la mediana para las mujeres se sobrepone levemente a la de los hombres.Gráfico Caja y Bigotes Female Male 96 97 98 Temperature 99 100 Figura 11-5. 2. 57609] Prueba-F para comparar Desviaciones Estándar Hipótesis Nula: sigma1 = sigma2 Hipótesis Alt. Medida de variabilidad calculada al elevar al cuadrado la desviación estándar.48826 Gl 63 64 Razón de Varianzas= 0.: sigma1 <> sigma2 F = 0. Para realizar la prueba.) 179/ Comparando Dos Muestras . pulse el ícono de Tablas en la barra de herramientas de análisis y seleccione Comparación de Desviaciones Estándar.684262 0.958945 valor-P = 0.828723] Desviación Estándar de Gender=Male: [0. 1.584028.468214 0. Figura 11-6. Varianza.958945 Intervalos de confianza del 95.582853. σ12. 0.05. debido a que las primeras tienen propiedades matemáticas más atractivas. El resultado se muestra a continuación: Comparación de Desviaciones Estándar para Temperature Gender=Female Gender=Male Desviación Estándar 0. o si está dentro del rango de variabilidad normal aleatoria para muestras de su tamaño actual. Comparación de Desviaciones Estándar de Dos Muestras La información más importante en esta tabla está resaltada en rojo: 1.0% Intervalos de Confianza Desviación Estándar de Gender=Female: [0. de las cuales provienen los datos. Razón de Varianzas: Muestra un intervalo de confianza del 95% para la razón de varianza de la población femenina. son iguales contra la hipótesis de que son diferentes: Hipótesis Nula: σ1 = σ2 Hipótesis Alternativa: σ1 ≠ σ2 Esto nos permitirá determinar si la aparente diferencia entre la variabilidad de los hombres y las mujeres es estadísticamente significantiva. 0.11.698756 Varianza 0.5 Comparando Desviaciones Estándar La primera comparación a detalle entre las dos muestras es probar la hipótesis de que las desviaciones estándar (σ) de las poblaciones. dividido entre la varianza de la población masculina.844885] Razones de Varianzas: [0.595887.8684 No se rechaza la hipótesis nula para alpha = 0. σ22. (Nota: las comparaciones de variabilidad entre varias muestras están generalmente basadas más en varianzas que en desviaciones estándar. Ya que P está muy por arriba de 0. 98. El valor-P asociado con la prueba F de la hipótesis estipulada arriba.05.0% intervalo de confianza para la diferencia de medias suponiendo varianzas iguales: 0.5272] Intervalos de confianza del 95. Los resultados son: Comparación de Medias para Temperature Intervalos de confianza del 95.9315. 3.: media1 <> media2 suponiendo varianzas iguales: t = 2.58. Esta falta de precisión es muy típica cuando se intenta comparar la variabilidad de muestras poblacionales relativamente pequeñas.0% intervalo de confianza para la media de Gender=Male: 98. 11. 98.0% intervalo de confianza para la media de Gender=Female: 98.58 hasta 1.492632] Prueba t para comparar medias Hipótesis nula: media1 = media2 Hipótesis Alt.2. pulse nuevamente el ícono Tablas y seleccione Comparación de Medias. Un valor-P menor a 0. Figura 11-7. Por lo tanto no existe una clara evidencia por la cual concluir que la variabilidad de las temperaturas corporales de las mujeres es diferente a la variabilidad de la de los hombres. Esto indica que la varianza de las mujeres puede estar en cualquier punto entre aproximadamente el 58% de la varianza de los hombres hasta el 158% de su varianza.170924 [98.05.251635 +/.2778] Intervalos de confianza del 95.173144 [97. 0. no existe evidencia por la cual rechazar la hipótesis de varianzas iguales (y a su vez de desviaciones estándar iguales).1853.05 indicará una diferencia estadísticamente significativa entre la varianza de las mujeres y la varianza de los hombres al 5% del nivel de significancia. El intervalo para σ12 / σ22 va desde 0.0. Debe notar que esta prueba es sumamente sensible a la suposición de que las muestras vienen de poblaciones de una distribución normal. Comparación de Medias de Dos Muestras 180/ Comparando Dos Muestras .0.0.1046 +/.040846 Se rechaza la hipótesis nula para alpha = 0.240998 [0.0106371. una suposición que había sido considerada como razonable basada en los valores de asimetría y curtosis estandarizados.6 Comparando Medias La segunda comparación entre las dos muestras prueba la hipótesis de que las medias (μ) de las dos poblaciones son iguales: Hipótesis Nula: μ1 = μ2 Hipótesis Alternativa: μ1 ≠ μ2 Para realizar esta prueba.3562 +/.06616 valor-P = 0. 2. Una prueba no paramétrica no supone que los datos provienen de una distribución normal y tiende a ser afectada de menor manera en caso de que se presenten datos aberrantes. lo cual fue validado por la prueba F en la sección previa.μ2 va desde 0. Habiendo sido mostrado que las varianzas son significativamente diferentes.49. El intervalo para μ1 . El valor-P asociado con la prueba t de la hipótesis arriba estipulada. Los datos combinados se ordenan desde el 1 hasta n1+n2 y los valores originales de los datos son reemplazados por sus respectivos rangos. 11.01 hasta 0. Entonces se prepara la prueba estadística W comparando los rangos promedio de las observaciones en las dos muestras: 181/ Comparando Dos Muestras . las dos muestras son primero combinadas. Diferencia entre las Medias (suponiendo varianzas iguales): presenta un intervalo de confianza del 95% para la media poblacional femenina. una prueba t de aproximción puede solicitarse al accesar Opciones de Ventana y deshabilitar la opción descrita como Suponer Sigmas Iguales. una prueba no paramétrica puede realizarse para comparar las medianas en lugar de las medias.05. menos la media poblacional masculina. Note que ésta prueba fue hecha suponiendo que las varianzas de las dos poblaciones son iguales.7 Comparando Medianas Si se sospecha que los datos pueden contener observaciones aberrantes. indicando que la media de la temperatura de las mujeres se encuentra entre los 0.La información más importante en esta tabla nuevamente está resaltada en rojo: 1. Al seleccionar Comparación de Muestras del cuadro de diálogo Tablas se genera la prueba W de Mann-Whitney (Wilcoxon). Así es que parece que las mujeres provienen de una población con una temperatura media más elevada que la de los hombres.49 grados por arriba que la media de la temperatura de los hombres.01 y 0. Debido a que P es menor a 0. existe evidencia suficiente por la cual rechazar la hipótesis de medias iguales y así declarar que las dos medias poblaciones son significativamente diferentes al nivel de significancia del 5%. En esta prueba. 4 Mediana de muestra 2: 98.Comparación de Medianas para Temperature Mediana de muestra 1: 98.6 0.2 0 96 97 98 Temperature 99 100 Gender Female Male Figura 11-9.0368312 Se rechaza la hipótesis nula para alpha = 0. de cada muestra.: mediana1 <> mediana2 Rango Promedio de muestra 1: 71.4 0. donde con un valor-P pequeño se llega a la conclusión de que las medianas de las dos poblaciones son significativamente diferentes.8 Gráfico de Cuantiles Para ilustrar la diferencia entre las dos distribuciones. Gráfico de Cuantiles Bilateral 182/ Comparando Dos Muestras . los gráficos de cuantiles bilaterales. se pueden mostrar seleccionando Gráfico de Cuantiles del cuadro de diálogo Gráficas: Gráfico Cuantil 1 0.8 proporción 0.1846 W = -443. Figura 11-8.1 Prueba W de Mann-Whitney (Wilcoxon)para comparar medianas Hipótesis Nula: mediana1 = mediana2 Hipótesis Alt.0 valor-P = 0. Comparación de Medianas de Dos Muestras La interpretación de la prueba Mann-Whitney (Wilcoxon) se asemeja a la prueba t descrita en la última sección. 11.9219 Rango Promedio de muestra 2: 58.05. 9 Prueba de Kolmogorov-Smirnov Una prueba no paramétrica adicional que puede realizarse si la suposición de distribuciones normales no es acertada es la prueba de dos muestras de Kolmogorov-Smirnov. Esta prueba está basada en calcular la máxima distancia vertical entre las funciones de distribución acumuladas de las dos muestras. denotada por DN. El valor-P es usado para determinar si las distribuciones son o no son significativamente diferentes una de otra. Una diferencia en la pendiente de las curvas indica una diferencia entre las desviaciones estándar. Ya que el valor-P para los datos de las muestras es menor a 0. Cuando sea posible. Sin embargo las pendientes de ambas. 11.0449985 Figura 11-10.24 para los datos de la temperatura corporal. En el gráfico superior. que a su vez es aproximadamente la distancia máxima entre los dos gráficos de cuantiles en la Figura 11-9. como una función de X.37737 Valor P aproximado = 0.El gráfico de cuantiles ilustra la proporción de los datos de cada muestra que está por debajo de un valor dado de X. es bastante evidente que la distribución de las mujeres está movida a la derecha de los hombres. Prueba de Kolmogorov-Smirnov La distancia máxima vertical. es igual aproximadamente a 0. esta prueba puede no ser confiable ya que la CDF puede brincarlos en pasos grandes. Al seleccionar Prueba Kolmogorov-Smirnov del cuadro de diálogo Tablas se muestra lo siguiente: Prueba de Kolmogorov-Smirnov para Temperature Estadístico DN estimado = 0. Cualquier separación de un gráfico a la derecha o izquierda del otro indica una diferencia entre sus medias. entonces las dos muestras se pueden declarar provenientes de poblaciones significativamente diferentes. hay una diferencia significativa entre las distribuciones femenina y masculina en un 5% de nivel de significancia.05. los gráficos de cuantiles deben ser muy cercanos. Si la distancia máxima es suficientemente amplia. Advertencia: Si los datos son redondeados excesivamente. Si las muestras provienen de la misma población.242548 Estadístico K-S bilateral para muestras grandes = 1. son similares. es 183/ Comparando Dos Muestras . Un valor-P pequeño lleva a la conclusión de que hay una diferencia significativa. Los puntos divergentes de la línea en una pendiente diferente a la de la línea diagonal indican una diferencia significativa en la varianza. los puntos deben caer cerca de la línea diagonal. la desviación estándar y la mediana. Un cambio constante a la derecha o izquierda indica que hay una diferencia significativa entre los centros de las dos distribuciones. 184/ Comparando Dos Muestras . Gráfico C-C de Datos de Temperatura Corporal Existe un punto en esta gráfica que corresponde a cada observación menor de las dos muestras. Un último gráfico.10 Gráfico Cuantil-Cuantil Gráfico Cuantil-Cuantil para Temperature 100 99 Gender=Male 98 97 96 96 97 98 Gender=Female 99 100 Figura 11-11. Trazado en el otro eje está el cuantil estimado de la muestra mayor. ya que los puntos están más cerca de la línea en temperaturas altas y bajas que lo que están de las temperaturas centrales. Parece que la distribución de las temperaturas para las mujeres está más concentrada en el centro que la distribución de los hombres. grafica los cuantiles estimados de una muestra contra los cuantiles de la otra: 11. la diferencia entre las poblaciones puede ser un poco más complicada que un simple cambio en la media.mejor confiar en una comparación de parámetros como la media. disponible al seleccionar Gráfico Cuantil-Cuantil del cuadro de diálogo Gráficas. Si las muestras provienen de poblaciones idénticas. En este caso. 1 61.0 63. suponga que desea comparar la fuerza de un artículo fabricado con 4 materiales distintos.4 61.8 60.8 64.1 60.7 61.6 Material B 60.3 56.6 Material C 58.9 63.6 60.6 59.5 62.9 60.6 Material D 60.8 58. En un experimento básico.4 60.5 60.9 65.0 62. Por ejemplo.8 67.8 63. Los siguientes datos representan los resultados de tal experimento: Material A 64.3 60.5 60. es necesario emplear técnicas diferentes a las utilizadas en el capítulo anterior.3 65.1 62.6 64.4 61.0 64.9 63.7 64.2 58.0 61.4 61.12 Tutorial #3: Comparando más de Dos Muestras Comparando medias y desviaciones estándar.3 62.8 60.0 Capítulo 185/ Comparando Más de Dos Muestras . ANOM y métodos gráficos. podría hacer 12 artículos usando diferentes cantidades de cada uno de los cuatro materiales con la finalidad de compararlos.2 59.4 58. ANOVA simple.8 66.9 63. Cuando los datos se encuentran en más de dos grupos.3 62.3 61.6 59.6 61.0 60.3 64. 12. 2. seleccione Analizar – Datos Continuos – Comparaciónes de Varias Muestras – Comparación de Varias Muestras. Usando una sola columna para todos los datos y una segunda columna con los códigos que identifican la muestra de la que proviene cada observación. así como también que materiales son significativamente diferentes de los otros. se ha elegido usar la primera opción. los datos han sido colocados en diferentes columnas de la hoja de datos. 1. determinar cuál de los materiales produce los artículos más fuertes.Es de considerable interés. El cuadro de diálogo inicial se usa para indicar la estructura de los datos: Figura 12-1.Abrir Datos del menú Archivo. Si usa el menú Seis Sigma. Para este ejemplo.sf6. 2. Existen dos formas para capturar datos de varias muestras en una hoja de datos: 1. el cual se puede abrir seleccionando Abrir . Los datos para los doce artículos han sido colocados en cuatro columnas de un archivo llamado widgets.Cuadro de Diálogo Inicial de Comparación de Varias Muestras En este caso.1 Ejecutando Comparación de Varias Muestras El procedimiento Comparación de Varias Muestras está disponible en el menú principal bajo. Usando una columna para cada muestra. Si usa el menú Clásico seleccione: Comparar – Comparación de Varias Muestras – Comparación de Varias Muestras . El segundo cuadro de diálogo solicita los nombres de las columnas que contienen los datos: 186/ Comparando Más de Dos Muestras . ésta tendrá cuatro paneles: 187/ Comparando Más de Dos Muestras . las observaciones han sido colocadas en cuatro columnas llamadas A. C y D. B.Figura 12-2. Cuando se presenta la ventana de análisis. Cuadro de Diálogo de Captura de Datos para Comparar Varias Muestras En el archivo de datos. Ventana de Análisis de Comparación de Varias Muestras El panel superior izquierdo resume el tamaño y el rango de cada muestra. que a continuación ampliaremos: 188/ Comparando Más de Dos Muestras .Figura 12-3. El panel superior derecho muestra un gráfico de dispersión de los datos. haga doble clic en el panel de la gráfica para maximizarla y luego pulse el botón Separar Puntos en la barra de herramientas de análisis y agregue una pequeña separación horizontal moviendo el dial superior levemente hacia la derecha: Figura 12-5.Dispersión según Muestra 68 66 respuesta 64 62 60 58 56 A B C D Figura 12-4. haciendo que los puntos sean más fáciles de ver: 189/ Comparando Más de Dos Muestras . Para solucionar este problema. Gráfico de Dispersión de Fuerza vs Material Note que muchas de las observaciones están encimadas. Cuadro de Diálogo de Separación de Puntos Esto separa levemente de forma aleatoria cada punto de manera horizontal. Gráfico de Dispersión después de Separar Puntos La separación de puntos solo afecta el gráfico actual.Dispersión según Muestra 68 66 respuesta 64 62 60 58 56 A B C D Figura 12-6. El rechazo de la hipótesis nula indica que las muestras vienen de poblaciones cuyas medias no son todas idénticas. seleccionando entre las dos hipótesis siguientes: Hipótesis Nula: μA = μB = μC = μD Hipótesis Alternativa: las medias no son todas iguales Donde μj representa la media poblacional de donde la muestra j fue tomada. 12. La información resultante del ANOVA está contenida en la tabla ANOVA. no los datos ni los cálculos hechos de ellos. que es mostrada inicialmente en el panel inferior izquierdo de la ventana de análisis: 190/ Comparando Más de Dos Muestras . por lo regular es realizar un análisis de varianza (ANOVA).2 Análisis de Varianza El primer paso cuando se comparan varias muestras. El ANOVA es usado para probar la hipótesis de medias poblacionales iguales. Tabla ANOVA Fuente Suma de Cuadrados Entre grupos 157. ANOVA Gráfico 191/ Comparando Más de Dos Muestras . En la última edición del Statistics for Experimenters por Box. existe una pequeña duda de que las medias sean significativamente diferentes. Tabla de Análisis de Varianza El análisis de varianza descompone la variabilidad de los datos observados en dos componentes: un componente entre-grupos.728 Total (Corr.31201 Valor-P 0. La cantidad clave en la Figura 12-7 es el Valor-P. En el ejemplo actual. es evidente que las medias de los grupos no son iguales. que cuantifica las diferencias entre los artículos hechos con los diferentes materiales y un componente inter-grupal.05 si se opera en un nivel de significancia de 5%) nos llevan al rechazo de la hipótesis de medias iguales. se presenta una nuevo diagrama diseñado para mostrar los resultados de un ANOVA en formato gráfico.882 Intra grupos 101. El ANOVA Gráfico es mostrado en el panel inferior derecho: ANOVA Gráfico para A Grupos D C B A P = 0.) 259. que cuantifica las diferencias entre los artículos hechos del mismo material. Si la variabilidad estimada entre-grupos es significativamente más grande que la variabilidad estimada inter-grupal. Valores-P pequeños (menores a 0.76 2.0000 Residuos -8 -4 0 4 8 12 Figura 12-8. 2005).61 Gl 3 44 47 Media Cuadrada Razón-F 52.6272 22. Hunter and Hunter (John Wiley and Sons.0000 Figura 12-7. 3 Comparando Medias Si el Valor-P en la tabla ANOVA es pequeño. disponible en el cuadro de diálogo Gráficas: Medias y 95. Estas desviaciones se gradúan de manera que su variabilidad puede compararse con la de los residuos. En la Figura 12-8.0 Porcentaje Intervalos Tukey HSD 67 65 Media 63 61 59 A B C D Figura 12-9. En el ejemplo actual. Graficadas sobre la línea central están las desviaciones a escala entre las medias del grupo y la media total de todas las n = 48 observaciones. La separación de las otras tres medias es menos clara. entonces las medias muestrales deberían ser examinadas para determinar cuáles medias son significativamente diferentes de las otras. claramente corresponden a poblaciones diferentes. Cualquiera de los grupos cuyos puntos estén muy apartados que fácilmente vengan de una distribución con una dispersión similar a la de los residuos. 12.A lo largo de la parte inferior del gráfico hay un diagrama de puntos de los residuos del modelo. Una comparación más a detalle de las cuatro medias muestrales se describe en la siguiente sección. los residuos son iguales a la diferencia entre cada observación y la media de todas las observaciones en su grupo. Gráfico de Medias 192/ Comparando Más de Dos Muestras . Un gráfico útil para este propósito es el Gráfico de Medias. En el ANOVA simple. la variabilidad observada en los residuos es indicativa de la variabilidad natural entre los artículos hechos del mismo material. el grupo A parece estar muy separado de los otros grupos. Los intervalos en la Figura 12-9 usan el método de Tukey.65755 A-D * 4. Los intervalos se construyen con el fin de controlar la tasa de error del tratamiento en un 5%. Intervalos HSD (Honesta Diferencia Significativa) de Tukey.65755 B-D * 2. Pruebas de Rangos Múltiples 193/ Comparando Más de Dos Muestras . Diferencia +/. Figura 12-10.05833 1. no se declara erroneamente algún par de medias como significativamente diferente. junto con un intervalo de incertidumbre a su alrededor. El análisis puede mostrarse en una tabla eligiendo Pruebas de Rangos Múltiples en el cuadro de diálogo Tablas: Contraste Múltiple de Rango Método: 95.65755 * indica una diferencia significativa. ya que ésto a lo más se presenta en un 5% de los análisis que usted realice. Sin embargo. que puede ser cambiado usando Opciones de Ventana. la media de la muestra A es significativamente diferente de las otras 3 muestras. C no es significativamente diferente de B ni D.65755 A-C * 3.65755 C-D 1. por la misma razón. La muestra B también es significativamente diferente de la muestra D.Límites A-B * 2. haciendo que las comparaciones entre muchos pares de medias resulten erróneas en al menos un par con una probabilidad muy alta. La interpretación de los intervalos depende del tipo de intervalo elegido.7 Contraste Sig.8417 XX C 12 60.00833 1.85 1.0 porcentaje Tukey HSD Casos Media Grupos Homogéneos X D 12 59.9083 X A 12 64.85833 1. Debido a que el intervalo para la muestra A no traslapa ningún otro intervalo.85 X B 12 61.06667 1. Los intervalos más comúnmente usados son: 1. 2. Usando el método de Tukey.79167 1.El gráfico de medias muestra la media de cada muestra. La posibilidad de declarar incorrectamente que dos muestras son diferentes con éste método está ajustada a un 5%. Intervalos LSD (Menor Diferencia Significativa) de Fisher: Estos intervalos se construyen de tal manera que uno puede escoger un solo par de muestras y declarar que sus medias son significativamente diferentes si los intervalos no se traslapan en dirección vertical.65755 B-C 1. Estas pruebas comparan las medianas en lugar de las medias: Hipótesis nula: todas las medianas son iguales Hipótesis alternativa: no todas las medianas son iguales El tipo de prueba puede seleccionarse usando Opciones de Ventana. como la Prueba Kruskal-Wallis y la Prueba de Friedman encontradas en Tablas. En cuyo caso. puede usar de forma alterna al análisis de varianza estándar. uno con B y otro con D. En el ejemplo actual. Variables típicas de bloqueo son: día de la semana. Existen dos tipos de pruebas: 1. la muestra A está en un grupo por sí sola. Cualquier par cuyo valor absoluto de la diferencia exceda el límite es estadísticamente significativo en el nivel seleccionado de significancia y se indica con un * en la columna Sig. el nivel de alguna otra variable.4 Comparando Medianas Si se sospecha que existen datos aberrantes. En el ejemplo. la fila no tienen significado por lo tanto la prueba Kruskal-Wallis es la adecuada: 194/ Comparando Más de Dos Muestras . La muestra C cae dentro de dos grupos. cuatro de los seis pares de medias muestran diferencias significativas. i. Prueba Kruskal-Wallis– es apropiada cuando cada columna contiene una muestra aleatoria de la población. ya que es significativamente diferente a las demás. La columna Diferencia presenta la diferencia de medias de la primera y segunda muestras. En este caso. un procedimiento no paramétrico. 2. En la parte superior de la tabla se acomodan las muestras en grupos homogéneos.En la parte inferior de la tabla se muestra cada par de medias. turno o lugar de fabricación. Se requerirán más datos para distinguir realmente a que grupo pertenece C.. La columna +/.e. Prueba de Friedman – apropiada cuando cada fila representa un bloque. las filas no tienen un significado intrínseco. 12.Límites muestra un intervalo de incertidumbre para la diferencia. mostrados como columnas de X. Un grupo homogéneo es un grupo en el que no hay diferencias significativas. 195/ Comparando Más de Dos Muestras . Pares de medianas pueden ser además comparadas eligiendo Gráfico de Caja y Bigotes del cuadro de diálogo Gráficas y usando Opciones de Ventana para añadir muescas en las medianas: Gráfico Caja y Bigotes A B C D 56 58 60 62 respuesta 64 66 68 Figura 12-12. Las muescas son construídas de tal modo que cualesquiera dos muestras cuyas muescas no se traslapen. En la gráfica.3735 Valor-P = 0.1667 Estadístico = 27. Ya que el Valor-P es pequeño (menor a 0.7917 B 12 25.05).Kruskal-Wallis Test Tamaño de Muestra Rango Promedio A 12 40.7917 C 12 19. pueden declararse que tienen medianas significativamente diferentes en el nivel de significancia predeterminado en el sistema (usualmente 5%).25 D 12 12. Prueba de Varias RangosMultiple Range Pruebas La entrada importante en la tabla es valor-P. Gráfico de Caja y Bigotes con Muescas en las Medianas El rango de cada muesca muestra la incertidumbre asociada con el estimado de la mediana de ese grupo.00000491592 Figura 12-11. las muescas de las muestras B. la hipótesis de medianas iguales es rechazada. C y D se traslapan. pero la mediana para la muestra A es significativamente más alta que la de las otras 3 muestras. la variabilidad entre los artículos hechos del mismo material es casi igual para los cuatro materiales.05 nos lleva al rechazo de la hipótesis de sigmas iguales al 5% del niivel de significancia. parece que la fuerza promedio es diferente para los distintos materiales. En este caso. incluyendo la prueba de Levene. es importante examinar los residuos del modelo ajustado. Siempre que un modelo estadístico es ajustado a los datos. Un valor-P menor a 0. Dependiendo de la selección en Opciones de Ventana. puede graficar los 196/ Comparando Más de Dos Muestras 12. El cuadro de diálogo Gráficas contiene un campo para generar gráficos de residuos automáticamente. Tres de las pruebas disponibles.Nota: el comportamiento de doblado hacia atrás observado en la Figura 12-12 ocurre cuando una muesca se extiende más allá del límite de la caja. En resumen. hay un residuo correspondiente a cada uno de los n = 48 artículos. dependiendo de la configuración en las Opciones de Ventana. muestra valores-P. las desviaciones estándar no son significativamente diferentes entre ellas. definido como la diferencia entre la fuerza de un artículo y la fuerza promedio de todos los artículos hechos del mismo material. En este análisis. No obstante.05. ya que el valor-P está muy por encima de 0. 12.933432 Figura 12-13.6 Gráficos de Residuos .143286 0. Comparación de Varianzas de las Muestras Una de las cuatro pruebas se mostrará.5 Comparando Desviaciones Estándar También es posible probar la hipótesis de desviaciones estándar iguales: Hipótesis nula: σA = σB = σC = σD Hipótesis alternativa: no todas las desviaciones estándar son iguales Esto se hace seleccionando Verificación de la Varianza en el cuadro de diálogo Tablas: Contraste de Varianza Prueba Valor-P Levene's 0. residuos por grupo vs valores predichos. El gráfico inferior muestra los residuos graficados vs la fuerza predicha: Gráfico de Residuos 4.5 59 60 61 62 63 valor predicho 64 65 Figura 12-14. Procedimientos como Pruebas de Rangos Múltiples no trabajarán adecuadamente cuando la variabilidad dentro del grupo difiera significativamente entre los grupos. Esta condición típicamente resulta en una apariencia de embudo en el gráfico y puede necesitar una transformación de las observaciones originales considerando los logaritmos de los datos antes de realizar el análisis. los residuos pueden guardarse en una columna de cualquier hoja de datos pulsando el ícono Guardar Resultados en la barra de herramientas de análisis. se deben buscar: 1. o en el orden como se encuentra la fila en la hoja de datos. Puntos Aberrantes – residuos aislados muy alejados de todos los demás. Gráfico de Residuos vs Fuerza Predicha En este tipo de gráficos.5 -3.5 -1.5 residuos 0. 197/ Comparando Más de Dos Muestras .5 2. Si se desea. Heterosedasticidad – un cambio sistemático en la varianza de acuerdo al incremento o decremento de los valores predichos. Dichos puntos necesitarán investigarse más detalladamente para determinar si existe una causa asignable que explique su comportamiento inusual. 2. 7 Gráfico Análisis de Medias (ANOM) Otro modo diferente para comparar varias medias es usando un Gráfico de Análisis de Medias. 198/ Comparando Más de Dos Muestras . mientras que los artículos de las muestras C y D son significativamente más debiles que el promedio. Cualquiera de las medias que caiga fuera de los límites puede ser declarada como significativamente diferente de la gran media. este gráfico muestra la media de cada muestra junto con una línea vertical dibujada en la gran media de todas las observaciones. la interpretación es que los artículos de la muestra A son significativamente más fuertes que el promedio. también disponible en el cuadro de diálogo Gráficas: Gráfico de Análisis de Media Con 95% Límites de Decisión 65 64 63 Media 62 61 60 59 A B C D UDL=62. Los límites de decisión son incluídos por arriba y abajo de la gran media. En este caso. Análisis de Gráfico de Medias Diseñado para tener similitud con un gráfico de control. Este tipo de interpretación puede ser muy útil algunas veces.12.85 Figura 12-15.83 LDL=60.80 CTR=61. las β son los coeficientes desconocidos del modelo y la ε es una desviación aleatoria que normalmente se asume proviene de una distribución normal con media 0 y desviación estándar σ. la función es lineal en los coeficientes desconocidos.i + εi Donde el subíndice i representa la observación i-ésima en la muestra de datos. La consideración anterior es a veces referida como parsimonia. En un modelo de regresión. la variable de respuesta Y es expresada como una función de una ó más variables prestablecidas de X.i + … + βkXk. 2. Una de las secciones más usadas en el STATGRAPHICS Centurion es el conjunto de procedimientos que se ajustan a un modelo de regresión estadístico. Dado un conjunto de datos con una variable de respuesta Y y una o más variables conocidas. seleccionando el mejor modelo.i + β3X3. de tal forma que permita que Y sea bien predicha. 199/ Análisis de Regresión Capítulo . así que el modelo puede expresarse como: Yi = β0 + β1X1.13 Tutorial #4: Análisis de Regresión Ajustando modelos lineales y no lineales. No contenga más variables X que las necesarias para generar una buena predicción. Describa las relaciones existentes entre las variables.i + β2x2. los modelos que involucran un conjunto bien seleccionado de predictores se desempeñan mejor en la práctica. el objetivo del análisis de regresión es construir un modelo que: 1. graficando residuos y presentando resultados. dados los valores conocidos de las X. más el ruido. En muchos (pero no todos) los casos. Típicamente. Este capítulo considera muchos tipos de modelos de regresión. Como ejemplo, el rendimiento de millas por galón en la ciudad, en el archivo 93cars.sf6, será usada como la variable de respuesta Y. El objetivo es construir un modelo con las otras columnas del archivo que pueda predecir satisfactoriamente las millas por galón de un automóvil. 13.1 Análisis de Correlación Un procedimiento muy útil para iniciar a construir un modelo de regresión es el de Análisis de Múltiples Variables. Este análisis puede encontrarse en el menú principal bajo: 1. Si usa el menú Clásico, seleccione Describir – Datos Numéricos – Análisis de Múltiples Variables. 2. Si usa el menú Seis Sigma, elija Analizar – Datos Continuos – Métodos Multivariados – Análisis de Múltiples Variables. El análisis comienza mostrando el siguiente cuadro de diálogo para la captura de datos: Figura 13-1. Cuadro de Diálogo de Captura de Datos para Análisis de Múltiples Variables 200/ Análisis de Regresión Adicionalmente a MPG City se han seleccionado seis variables como predictores. Estos posibles predictores son: X1: Engine Size (Tamaño del Motor) (litros) X2: Horsepower (Caballos de Fuerza) (máximo) X3: Length (Longitud) (pulgadas) X4: Weight (Peso) (libras) X5: Wheelbase (Ejes) (pulgadas) X6: Width (Ancho) (pulgadas) Pulsando ACEPTAR se presenta la ventana de análisis: Figura 13-2. Ventana de Análisis de Múltiples Variables El panel superior izquierdo enlista las variables de captura, mientras que el panel central izquierdo muestra el resumen estadístico. Hay un total de 93 filas en el archivo de datos que tienen información completa de todas las diferentes variables a analizar. El gráfico mátriz a la derecha muestra gráficos X-Y para cada par de variables: 201/ Análisis de Regresión MPG City Engine Size Horsepower Length Weight Wheelbase Width Figura 13-3. Gráfico de Matriz Suavizado Para interpretar el gráfico, localice la descripción de una variable, como por ejemplo MPG City. La variable indicada se muestra en el eje vertical de cada gráfica en ese renglón y en el eje horizontal de cada gráfico en esa columna. Cada par de variable es entonces presentado dos veces, una sobre la diagonal y otra por debajo. Se han añadido a la gráfica, suavizadores estimados (LOWESS), al maximizar el panel y eligiendo el ícono Suavizar/Rotar en la barra de herramientas de análisis. De mayor interés es la fila superior del gráfico, que muestra el comportamiento de MPG City vs cada una de las otras 6 variables. Todas las variables están claramente correlacionadas con las millas por galón, algunas de una forma no lineal. También existe una amplia multicolinealidad presente (correlación entre las variables conocidas), lo cual sugiere que muchas combinaciones diferentes de variables pueden ser igualmente adecuadas para predecir Y. En el fondo a la izquierda de la tabla se muestra una matriz de los coeficientes de correlación estimados para cada par de variables en el análisis: 202/ Análisis de Regresión Correlaciones MPG City MPG City Engine Size -0.7100 (93) 0.0000 Horsepower -0.6726 (93) 0.0000 0.7321 (93) 0.0000 Length -0.6662 (93) 0.0000 0.7803 (93) 0.0000 0.5509 (93) 0.0000 Weight -0.8431 (93) 0.0000 0.8451 (93) 0.0000 0.7388 (93) 0.0000 0.8063 (93) 0.0000 Wheelbase -0.6671 (93) 0.0000 0.7325 (93) 0.0000 0.4869 (93) 0.0000 0.8237 (93) 0.0000 0.8719 (93) 0.0000 Width -0.720 (93) 0.0000 0.8671 (93) 0.0000 0.6444 (93) 0.0000 0.8221 (93) 0.0000 0.8750 (93) 0.0000 0.8072 (93) 0.0000 Engine Size Horsepower Length Weight Wheelbase Width -0.7100 (93) 0.0000 -0.6726 (93) 0.0000 -0.6662 (93) 0.0000 -0.8431 (93) 0.0000 -0.6671 (93) 0.0000 -0.7205 (93) 0.0000 0.7321 (93) 0.0000 0.7803 (93) 0.0000 0.8451 (93) 0.0000 0.7325 (93) 0.0000 0.8671 (93) 0.0000 0.5509 (93) 0.0000 0.7388 (93) 0.0000 0.4869 (93) 0.0000 0.6444 (93) 0.0000 0.8063 (93) 0.0000 0.8237 (93) 0.0000 0.8221 (93) 0.0000 0.8719 (93) 0.0000 0.8750 (93) 0.0000 0.8072 (93) 0.0000 Correlación (Tamaño de Muestra) Valor-P Figura 13-4. Matriz de Correlación La tabla presenta el coeficiente de correlación para cada par de variables, el número de observaciones usado para obtener el estimado y un valor-P. Un coeficiente de correlación r es un número entre -1 y +1, que mide la fuerza de la relación lineal entre dos variables. Entre más cercana sea la correlación a -1 ó +1, más fuerte será la relación. El signo de la correlación indica la dirección de la relación. Un valor positivo significa que Y va hacia arriba cuando X va hacia arriba. Un valor negativo significa que Y va hacia abajo cuando X va hacia abajo. Para determinar si dos variables están ó no están relacionadas entre sí, se calcula un Valor-P para cada coeficiente de correlación. Cualquier par de variables cuyo Valor-P sea menor a 0.05 exhibe una correlación lineal estadísticamente significativa en un nivel de significancia del 5%. El renglón superior muetsra la correlación entre MPG City y los 6 predictores. La correlación más fuerte es con Weight, en -0.8431. El signo negativo implica que cuando se incrementa Weight, MPG City decrece, lo cual no es ninguna sorpresa. 203/ Análisis de Regresión 13.2 Regresión Simple El primer modelo estadístico que será ajustado es una línea recta de la forma: MPG City = β0 + β1Weight + ε En la ecuación superior, β1 es la pendiente de la línea en unidades de millas por galón por libra, mientras que βo es la Y-intercepta. Para ajustar este modelo: 1. Si usa el menú Clásico, elija Relacionar – Un Factor – Regresión Simple. 2. Si usa el menú Seis Sigma, elija Mejorar – Análisis de Regresión – Un Factor– Regresión Simple. El cuadro de diálogo de captura de datos debe llenarse como se muestra a continuación: Figura 13-5. Cuadro de Diálogo de Captura de datos de Regresión Simple La ventana de análisis inicial contiene 4 paneles que presentan información sobre el modelo ajustado y los residuos: 204/ Análisis de Regresión Ventana de Análisis de Regresión Simple El Resumen del Análisis en el panel superior izquierdo resume el ajuste: 205/ Análisis de Regresión .Figura 13-6. Un Valor-P abajo de 0. Coeficientes: los coeficientes del modelo estimado.) = 70.0883 porciento R-cuadrado (ajustado para g.9583 Valor-P 0.23133 Valor-P 0. las siguientes son las más importantes: 1.) 2905.000536985 T Estadístico 28. = 3. indica que Weight es un predictor muy útil de MPG City.0.00803239Weight 2.176433 Figura 13-7.0484 .52 Residuo 840. Resumen del Análisis de Regresión Simple De las muchas estadísticas en la tabla superior.05.0064 -14.0484 -0.67991 0. 3. R-cuadrado: es el porcentaje de la variabilidad en Y que ha sido expuesto por el modelo.0000 Coeficiente de Correlación = -0.1% de la variabilidad en MPG City. El gráfico en el panel superior derecho muestra el modelo ajustado: 206/ Análisis de Regresión .MPG City vs. Valor-P del modelo: prueba la hipótesis nula de que el modelo ajustado no es mejor que un modelo que no incluya Weight.75 9.Regresión Simple .843139 R-cuadrada = 71.0405) Autocorrelación de residuos en Retraso 1 = 0.7705 porciento Error Estándar Est.52 223.00803239 Estándar Error 1. En este caso.57 Gl 1 91 92 Cuadrado Medio Razón-F 2065. como en el ejemplo actual.03831 Error Absoluto medio = 1. Weight Variable dependiente: MPG City (miles per gallon in city driving) Variable independiente: Weight (pounds) Lineal: Y = a + b*X Coeficientes Parámetro Intercepto Pendiente Mínimos Cuadrados Estimado 47.0000 0. una regresión lineal contra Weight explica el 71. El modelo ajustado que será utilizado para hacer predicciones es: MPG City = 47.051 Total (Corr.0000 Análisis de Varianza Fuente Suma de Cuadrados Modelo 2065.l.64586 (P=0.99274 Estadístico Durbin-Watson = 1. Es adecuado tomar nota que 3 observaciones en valores bajos de Weight caen mucho más allá de los límites predictivos del 95%. Esto indica que tan bien ha sido estimada la posición de la línea.0484 . Esto ajustará todos los modelos posibles y los enlistará en un orden decreciente de R-cuadrada: 207/ Análisis de Regresión .3 Ajustando un Modelo No Lineal El procedimiento de Regresión Simple incluye la posibilidad de ajustar una amplia variedad de modelos no lineales. elija Comparación de Modelos Alternativos del cuadro de diálogo Tablas.0. Para determinar la mejora relativa que varios modelos pueden hacer. 13. caerán dentro de esos límites. más estrechos serán los límites.Gráfico del Modelo Ajustado MPG City = 47. Gráfico del Modelo Lineal Ajustado El gráfico muestra la línea de regresión de mínimos cuadrados y dos grupos de límites. Los límites internos proveen intervalos de confianza del 95% para el valor de la media de Y en cualquier X seleccionada. Se estima que el 95% de las observaciones adicionales. Esto puede ser indicativo de datos aberrantes o de una falla del modelo en tomar en cuenta la no linealidad de la relación actual entre MPG City y Weight. dado que la relación es lineal. Las líneas externas son los límites de predicción del 95% para las nuevas observaciones.00803239*Weight 55 45 MPG City 35 25 15 1600 2100 2600 3100 Weight 3600 4100 4600 Figura 13-8. Entre más grande sea la muestra. similares a las de la muestra. 35% 78.83% 78.8431 Raíz Cuadrada-X Cuadrado-X -0. Este modelo toma la forma: 1 = β0 + β1Weight + ε MPGCity 208/ Análisis de Regresión .29% 80.77% 71.78% 80.78% 75.8668 Logaritmo-Y Cuadrado-X -0.8988 Multiplicativa -0.44% 66.90% 80.35% 65.8611 Raíz Cuadrada deX -0. En el ejemplo actual.56% 71.9016 Inversa-Y Raíz Cuadrada-X 0.15% 73.54% 79.8784 Logaritmo de X -0. Modelos Alternos No Lineales Los modelos en la parte superior de la lista explican el porcentaje más grande de la variación en la variable de respuesta.7758 Cuadrado Doble -0.8969 Logarítmico-Y Raíz Cuadrada-X -0.92% 80.8995 Raíz Cuadrada-Y Inversa de X 0.96% Figura 13-9.Comparación de Modelos Alternos Modelo Correlación Curva S 0.8896 Inversa de X 0.8472 Lineal -0. La R-cuadrada es solo un criterio que puede usarse para ayudar a escoger un modelo.8705 Raíz Cuadrada de Y -0.65% 80.8146 Cuadrado de X -0.7346 Logístico <sin ajuste> Log probit <sin ajuste> R-Cuadrada 81.8833 Raíz Cuadrada Doble -0.8106 Cuadrado-Y Raíz Cuadrada-X -0.71% 63.8888 Raíz Cuadrada-Y Logaritmo-X -0.14% 74. un atractivo modelo cercano al principio de la lista es el modelo Y-Recíproco.8879 Inversa-Y Cuadrado-X 0.18% 53.7957 Cuadrado de Y -0.09% 70.03% 77.14% 79.8393 Cuadrado-Y Logaritmo-X -0.44% 79.16% 75.8852 Exponencial -0.31% 60.8919 Doble Recíproco -0.8981 Inversa de Y 0.8995 Inversa-Y Logaritmo-X 0. Los modelos con cualesquiera valores de R-cuadrada menores al primer modelo de la lista son preferibles si tienen más sentido en el contexto de los datos.00% 78.8577 Cuadrado-Y Inversa de X 0. Y o ambas. Note también que los límites de predicción para Weight se volvieron más grandes conforme los valores predichos se hicieron más grandes.En él. Modelo Y-Recíproco Ajustado Siendo lineal en el recíproco de MPG City. el modelo es no lineal en la medición original. Es algo común que las transformaciones de X. El resultado del ajuste se muestra abajo: Gráfico del Modelo Ajustado MPG City = 1/(0.0000146623*Weight) 55 45 MPG City 35 25 15 1600 2100 2600 3100 Weight 3600 4100 4600 Figura 13-10. 13. En general. un residuo puede pensarse como la diferencia entre el valor Y observado y el valor predicho por el modelo: Residuo = Y observada – Y predicha El análisis Regresión Simple gráfica automáticamente los residuos vs la variable X: 209/ Análisis de Regresión .00193667 + 0. los residuos del ajuste deben ser examinados. el recíproco de millas por galón (galones por milla) se expresa como una función lineal de weight. ya que implica que hay más variabilidad entre los autos más ligeros que entre los autos mas pesados.4 Examinando los Residuos Una vez que un modelo razonable se haya ajustado. Para ajustar un modelo Y-Recíproco. Esto tiene sentido en el contexto de los datos. puedan llevarnos a mejores modelos. pulse el ícono de Opciones de Análisis y elija Y-Reciproco en el cuadro de diálogo. 00193667 + 0. Esto evita que los datos aberrantes tengan un gran impacto en el modelo cuando su residuo es calculado. indica cuantos errores estándar del valor del dato. La selección Residuos Inusuales en el cuadro de diálogo Tablas enlista todos los residuos estudentizados mayores a 2 en valor absoluto: 210/ Análisis de Regresión .7 1600 2100 2600 3100 Weight 3600 4100 4600 Figura 13-11.Gráfico de Residuos MPG City = 1/(0.Gráfico de Residuos Estudentizados Usando Opciones de Ventana.3 0. Un residuo Estudentizado así. Los residuos estudentizados reexpresan los residuos ordinarios definidos arriba dividiéndolos entre sus errores estándar estimados. son del modelo ajustado.7 -3. se puede elegir entre graficar residuos simples ó residuos Estudentizados.3 -1. reajustando el modelo y determinando el número de errores estándar que la observación retenida arroja desde el nuevo modelo ajustado. STATGRAPHICS Centurion actualmente calcula residuos eliminados estudentizados. Los residuos eliminados son calculados reteniendo una observación a la vez.3 Rediduo Estudentizado 2.0000146623*Weight) 4. 63658 14.0 Y 22.6366 27. como la fila #57.4778 22. elija Mejorar – Análisis de Regresión – Varios Factores – Regresión Múltiples.0 17.5222 -5. Debido a que en la siguiente sección se añaden variables adicionales al modelo.0 3735.0 2810.0 2350.38 2. Esto se logra más fácilmente usando el análisis de Regresión Múltiple. 2. Si usa el menú Clásico. Tabla de Residuos Inusuales Los residuos estudentizados mayores a 3. 13.5 mpg. a pesar de que el modelo predijo 22.0 Predicciones Y 18. son aberrantes potenciales que no parecen pertenecer al resto de los datos. que pudieran ayudar a mejorar su capacidad predictiva para tales autos deportivos. La Fila #57 corresponde al Mazda RX-7 que sé registró con un rendimiento de solo 17 millas por galón.5 Regresión Múltiple Para mejorar el modelo. no obstante se le debe prestar cuidadosa atención.18157 Residuos Studentizados -2. que puede encontrarse en el menú principal bajo: 1. El cuadro de diálogo de captura de datos toma la siguiente forma: 211/ Análisis de Regresión .04 Figura 13-12. la fila #57 no será excluida del ajuste.1816 Residuos 3.41 -3.11 3.Residuos Atípicos Fila 5 36 42 57 91 X 3640. elija Relacionar – Varios Factores – Regresión Múltiple.53064 -5.60 3. Si usa el menú Seis Sigma.0808 17.0 42.5306 23.91924 -2.0 18. es necesario añadir otros predictores.0 15.0 2895. equivalente a galones por milla.Figura 13-13. Cuadro de Diálogo de Captura de Datos de Regresión Múltiple De inicio. los 6 predictores considerados en el Análisis de Varias Variables discutido anteriormente se considerarán como variables independientes. La variable dependiente es la recíproca de MPG City. El resumen del análisis se muestra abajo: 212/ Análisis de Regresión . 001496 Total (Corr.) = 81.0%.000163073 0.0000173954 Razón-F 67. Como sea.3762 0.000148122 0.0.00072849*Engine Size + 0.000101355*Length + 0.00072849 0.0000132632 -0.0000 0.4595 0.0996 0.000101355 0. el modelo es innecesariamente complicado.0155897 0.00855567 Gl 6 86 92 Cuadrada Media 0. existe una relación estadísticamente significativa entre las variables con un nivel de confianza del 95.5%.66468 6.0. = 0.000223526*Width Puesto que el valor-P en la tabla ANOVA es menor que 0.64 Valor-P 0.00417077 Error Absoluto medio = 0.) 0.05.0306) Autocorrelación de residuos en Retraso 1 = 0.000980504 0.0000 R-cuadrada = 82.0000608857 0.889485 -1.1/MPG City Variable dependiente: 1/MPG City Variables independientes: Engine Size (liters) Horsepower (maximum) Length (inches) Weight (pounds) Wheelbase (inches) Width (inches) Error Estándar 0.3811 0.0000149727*Weight . La ecuación del modelo ajustado es 1/MPG City = 0.880334 0.00000242804 0.742974 0. dado que 213/ Análisis de Regresión .000014911 0.0000149727 -0.3662 0. Resumen del Análisis de Regresión Múltiple con 6 Variables Conocidas Note que el estadístico R-cuadrada ha crecido hasta un 82.908321 0.186005 El StatAdvisor La salida muestra los resultados de ajustar un modelo de regresión lineal múltiple para describir la relación entre 1/MPG City y 6 variables independientes.l.Regresión Múltiple .00304978 Estadístico Durbin-Watson = 1.4424 Análisis de Varianza Fuente Suma de Cuadrados Modelo 0.1666 -0.00028967 Estadístico T 0. Estos Valores-P prueban la hipótesis de que el coeficiente de una variable al azar es igual a 0. Cerca de la parte superior hay una columna de Valores-P.0155897 + 0.2946 porciento Error Estándar Est.0000132632*Horsepower .00705967 Residuo 0.000223526 Valor-P 0.000148122*Wheelbase + 0.771658 Parámetro CONSTANTE Engine Size Horsepower Length Weight Wheelbase Width Estimación 0.5145 porciento R-cuadrado (ajustado para g.6264 (P=0.0177088 0.00117661 0. Figura 13-14. todos los valores-P pueden cambiar drásticamente incluso si una variable es eliminada del modelo.05 indican que una variable no contribuye significativamente al ajuste. La regresión por pasos esta disponible en el cuadro de diálogo Opciones de Análisis: Figura 13-15.05. Un método útil para simplificar el modelo es realizar una regresión por pasos . Esto implica que al menos uno de esos predictores puede ser eliminado sin afectar al modelo significativamente. las variables son añadidas o eliminadas del modelo de regresión una a la vez. Valores-P mayores a 0. Nota: Sería un error en este punto asumir que las 5 valores conocidas con Valores-P > 0. con el objeto de obtener un modelo que contenga solo predictores significativos pero sin excluir variables útiles.todas las otras variables permanecen en el modelo. Exceptuando por Weight.05 pueden ser eliminadas. En esta. Debido a la alta multicolinearidad en los datos. en la presencia de todas las otras variables. todos los predictores tienen valores-P > 0. Cuadro de Diálogo de Opciones de Análisis de Regresión Múltiple Existgen dos opciones para una Regresión por Pasos: 214/ Análisis de Regresión . l.0338) Autocorrelación de residuos en Retraso 1 = 0.41325 2. Resumen Estadístico de Regresión Múltiple después de la Selección Hacia Atrás.0034427 + 0.184113 El StatAdvisor La salida muestra los resultados de ajustar un modelo de regresión lineal múltiple para describir la relación entre 1/MPG City y 6 variables independientes.00421009 Error Absoluto medio = 0.00855567 Gl 2 90 92 Cuadrada Media 0.0388 0. Selección Hacia Atrás – inicia el modelo incluyendo todas las variables y las va eliminando una a la vez.) 0.0000 Análisis de Varianza Fuente Suma de Cuadrados Modelo 0.0000124356 0. = 0. 2.0000260839 0.35 Valor-P 0. En ambos métodos.7302 Valor-P 0. Al ejecutar una selección hacia atrás nos dá como resultado el siguiente modelo: Regresión Múltiple .0000 R-cuadrada = 81.0000260839*Horsepower + 0. hasta que las variables restantes sean estadísticamente significativas.09752 11.1/MPG City Variable dependiente: 1/MPG City Variables independientes: Engine Size (liters) Horsepower (maximum) Length (inches) Weight (pounds) Wheelbase (inches) Width (inches) Parámetro CONSTANTE Horsepower Weight Estimación 0.62892 (P=0.9403 porciento Error Estándar Est.1610 0.1.00159524 Total (Corr.00348022 0.3546 porciento R-cuadrado (ajustado para g.0000129513 Error Estándar 0. La ecuación del modelo ajustado es 1/MPG City = 0.) = 80.0000011041 Estadístico T 1. 215/ Análisis de Regresión .00696044 Residuo 0. o que las variables previamente integradas pueden ser eliminadas más tarde si dejan de ser significativas.0000129513*Weight Figura 13-16.0034427 0. las variables eliminadas pueden ser reintegradas más tarde si estas parecen ser predictores útiles. Selección Hacia Adelante – inicia el modelo conteniendo solo una constante y va incluyendo variables cuando estas mejoran el ajuste significativamente.00313061 Estadístico Durbin-Watson = 1.00243602 0.0000177249 Razón-F 196. Solo dos variables permanecen en el modelo: Horsepower y Weight. Ambas variables tienen valores-P menores a 0.05. Una vez que se ha encontrado una ecuación matemática, se puede interpretar mejor graficando esa ecuación. Cuando el modelo contiene 2 predictores, la ecuación representa una superficie en 3 dimensiones, normlamente conocida superficie de respuesta. En este caso, la ecuación ajustada corresponde a un plano, debido a que Horsepower y Weight se integran al modelo de forma lineal. Para graficar el modelo, puede también: 1. Usar el procedimiento Modelos Lineales Generales, que automáticamente graficará un modelo de regresión con respecto a dos variables conocidas. (Nota: el procedimiento MLG solo está disponible en la Edición Profesional del STATGRAPHICS Centurion). 2. Usar el procedimiento Gráficos de Superficie y de Contorno. Este procedimiento está disponible en todas las ediciones, aunque requiere que se copie la función a graficarse y que se definan sus propios títulos y escalas. Tomando la segunda alternativa: 1. Si usa el menú Clásico, elija Gráficar – Gráficos de Superficie y de Contorno. 2. Si usa el menú Seis Sigma, elija Herramientas – Gráficos de Superficie y de Contorno. En el cuadro de diálogo de captura de datos, capture el modelo, expresando las dos variables conocidas como X y Y. El modo más fácil para hacer esto es pegando la ecuación generada por el procedimiento de Regresión Múltiple, y cambiando Horsepower por la X y Weight por la Y: 216/ Análisis de Regresión Figura 13-17 Cuadro de Diálogo de Captura de datos para Gráfico de Superficie Respuesta y de Contorno La escala de X y Y también debe ser cambiada para que sea representativa de los datos usados al ajustar el modelo. Cuando pulse ACEPTAR, se generará un gráfico de superficie. El gráfico inicial toma la forma de una superficie de malla de alambre: 217/ Análisis de Regresión 0.0034427+0.0000260839*X+0.0000129513*Y (X 0.001) 72 62 Función 52 42 32 22 0 50 100 150 X 4500 4000 3500 3000 2500 2000 200 250 300 1500 Y Figura 13-18. Gráfico de Superficie con Etiquetas y Escalamiento Predeterminado Ud. puede mejorar su gráfico considerablemente.: Seleccionando Opciones Gráficas de la barra de herramientas del análisis y cambiando las etiquetas y la escala en los separadores: Título Principal, Eje-X, Eje-Y y Eje-Z. En particular: • • • • Cambie el título del eje-X a Horsepower. Cambie el título del eje-Y a Weight.. Cambie la escala del eje-Y que vaya de 1500 a 4500 cada 1000. Cambie el título del eje-Z a 1/MPG City. Seleccionando Opciones de Ventana y cambiando el tipo de gráfico presetnado: 218/ Análisis de Regresión Figura 13-19. Opciones de Ventana del Gráfico de Superficie En el cuadro de diálogo, Tipo ha sido ajustado a Contorno y el campo de Contorno a Continuo. El gráfico actualizado se muestra abajo: 0.0034427+0.0000260839*X+0.0000129513*Y Función 0.02 0.03 0.04 0.05 0.06 0.07 4500 4000 3500 3000 2500 2000 200 250 300 1500 Y (X 0.001) 72 62 Función 52 42 32 22 0 50 100 150 X Figura 13-20. Gráfico del Modelo Ajustado Los autos que consumen más gasolina están en la esquina posterior derecha del gráfico. 219/ Análisis de Regresión 14 Tutorial #5: Analizando Datos Categóricos Tabulación, tablas de contingencia y Análisis de Pareto. Cada uno de los cuatro primeros tutoriales trata con datos continuos, en donde las observaciones son representadas numéricamente a lo largo de una escala contínua. Este tutorial examina un conjunto de datos categóricos, en los cuales cada observación representa un atributo clasificado, en lugar de una medición. Como ejemplo, considere los datos contenidos en el archivo defects.sf6. Una porción de este archivo se muestra abajo: Defect (Defecto) Desalineado Contaminado Contaminado Contaminado Partes Faltantes Desalineado Contaminado Derrame Dañado Contaminado Facility (Fábrica) Virginia Texas Virginia Texas Texas Virginia Texas Texas Virginia Texas Capítulo 220/ Analizando Datos Categóricos elija Analizar – Datos Categóricos – Un Factor . cada uno corresponde a un defecto observado en un producto fabricado. Luego presenta una ventana de análisis similar a la que se muestra abajo: 221/ Analizando Datos Categóricos . 2.1 Resumir Datos Categóricos Ignorando por un momento la fábrica en la que se produjo cada artículo. Si usa el menú Seis Sigma. El archivo también indica el tipo de defecto y la fábrica en la que se produjo el artículo. elija Describir – Datos Categóricos – Tabulación. 14. Cuadro de Diálogo de Captura de datos para una Tabulación El procedimiento escanea la columna. Los datos categóricos a capturar en el cuadro de diálogo deben estar contenidos en una sola columna: Figura 14-1. Si usa el menú Clásico. los datos del tipo de defecto pueden resumirse en: 1.Los datos consisten de n = 120 filas.Tabulación. identificando cada valor único. 2. Si usa el menú Clásico. Ventana de Análisis de una Tabulación El panel superior izquierdo muestra los 9 valores únicos encontrados en las n = 120 filas. Para ordenarlos de mayor a menor frecuencía. El análisis de Pareto es accesado mediante: 1. también tabulados en la ventana inferior izquierda. debe usar el procedimiento Análisis de Pareto. El cuadro de diálogo para la captura de datos debe llenarse como se muestra a continuación: 222/ Analizando Datos Categóricos . que representa alrededor del 44% de todos los defectos. Si usa el menú Seis Sigma. El tipo de defecto más común es “Contaminated”. elija Analizar – Datos Categóricos – Un Factor – Análisis de Pareto.Figura 14-2. elija CEP – Evaluación de Calidad – Análisis de Pareto.2 Análisis de Pareto El procedimiento Tabulación ordena los tipos de defectos de forma alfabética. El diagrama de barras y de sectores a la derecha ilustran la frecuencia observada para cada tipo de defecto. 14. 2. como en el ejemplo actual. La ventana de análisis presenta una tabla resumen y un gráfico de Pareto: 223/ Analizando Datos Categóricos . Cuadro de Diálogo para Captura de Datos del Análisis de Pareto El Análisis de Pareto acepta la captura de datos en dos formatos diferentes: 1. Datos no tabulados que necesitan ser contabilizados. Esto es aplicable si se tienen dos columnas. una que identifique los tipos de defecto y una segunda que contenga el número de ocurrencias para cada tipo de defecto. Cantidades para datos que ya han sido agrupados por tipo de defecto.Figura 14-3. 224/ Analizando Datos Categóricos . Ventana de Análisis de Pareto Resulta de interés especial el gráfico de Pareto a la derecha. que grafica cada tipo de defecto de mayor a menor frecuencia. Cuando haya terminado.Figura 14-4. Haga doble clic dentro de la ventana de análisis para maximizar el panel. Después de salir del cuadro de diálogo Opciones Gráficas. posicione el puntero en la esquina del eje-X para reducir el tamaño de los ejes. las etiquetas en el eje se traslapan debido al número de defectos y a la longitud de su descripción. 2. el gráfico de Pareto debe lucir como el que se muestra a continuación. mantenga presionado el botón secundario del ratón en el cuerpo de la gráfica y desplácela hacia arriba ó. dando clic en el separador eje-X y habilitar la opción Rotar Etiquetas del Eje-X. En este caso. las etiquetas puede que no se ajusten completamente en la pantalla. Pulse el botón de Opciones Gráficas en la barra de herramientas del análisis. Inicialmente. Esto se puede solucionar haciendo lo siguiente: 1. 3. Si usa el menú Clásico.00 91. Gráfico de Pareto Editado Las longitud de las barras en el gráfico de Pareto son proporcionales a la cantidad de ocurrencias que cada tipo de defecto tiene.67 94. elija Describir – Datos Categóricos – Tabulación Cruzada. iniciando con el de mayor ocurrencia a la izquierda. La línea trazada sobre las barras describe un conteo acumulado de izquierda a derecha.17 Figura 14-5.Gráfica de Pareto para Defect 120 87. elija Analizar – Datos Categóricos – Varios Factores – Tabulación Cruzada.83 96.17 67.50 100 frecuencia 80 60 40 20 0 Missing parts Misaligned Damaged Contaminated Wrong size Rusted Misshapen Poor color Leaking 44.67 99. El principio básico de Pareto establece que la gran mayoría de los defectos suceden en un pequeño número de causas posibles. Para consolidar los datos tanto por tipo de defecto como por fábrica: 1. 2. Si usa el menú Seis Sigma. una que define las filas de la tabla de frecuencias de dos vías ó tabla de contingencia y otra que define las columnas: 225/ Analizando Datos Categóricos . los 3 tipos de defectos más frecuentes contemplan el 80% de todos los posibles defectos. En el cuadro de diálogo para la captura de datos se emplean dos columnas. 14. En este ejemplo se muestra el porcentaje acumulado de los defectos. En este caso.sf6 también la identificación de la fábrica de donde se produjo cada artículo defectuoso.17 100.3 Tabulación Cruzada El archivo defects.50 80. Ventana de Análisis de una Tabulación Cruzada 226/ Analizando Datos Categóricos .Figura 14-6. Cuadro de Diálogo para Captura de Datos de Tabulación Cruzada Al capturar los datos como se muestra arriba aparecerá la siguiente ventana de análisis: Figura 14-7. 67% 0.17% Damaged 10 6 16 8. Con Opciones de Ventana puede seleccionar otros conceptos a mostrarse en cada celda: 227/ Analizando Datos Categóricos .00% 0.33% Misshapen 0 3 3 0.83% 2.00% 2.67% 16.00% Contenido de las celdas: Frecuencia Observada Porcentaje de la tabla Figura 14-8 Tabla de dos vías con Porcentajes respecto a la Tabla Completa Como se presentó desde un inicio.67% 0. cada celda de la tabla muestra el número de filas correspondientes a una combinación particular de fila por columnas.00% 14.33% Leaking 2 1 3 1.83% Total por Columna 67 53 120 55.50% Misaligned 8 20 28 6.00% 13.50% Missing parts 2 1 3 1.La tabla en el panel inferior izquierdo agrupa los datos por tipo de defecto y fábrica: Tabla de Frecuencias para Defect por Facility Texas Virginia Total por Fila Contaminated 36 17 53 30.83% 44.67% 6.17% Wrong size 1 0 1 0. También se muestra el porcentaje de cada celda con respecto a la tabla completa.67% 2. representando el 30 por ciento de todos los artículos defectuosos en la muestra.83% 0.17% 100.67% Rusted 2 3 5 1.00% 1.50% Poor color 6 2 8 5.17% 44. Por ejemplo.83% 2.67% 23. había 36 artículos contaminados en la fábrica de Texas.50% 4.50% 2.33% 5. 00% 0.17% 1 0.83% 120 100.50% Leaking 2 1 66.17% Contenido de las celdas: Frecuencia Observada Porcentaje de la fila Total por Fila 53 44.33% 3 2.33% Poor color 6 2 75.33% 3 2.67% 33.67% 5 4.50% 37.50% 8 6.00% 25.00% Figura 14-10 Tabla de dos vías con Porcentajes respecto a cada Fila 228/ Analizando Datos Categóricos .83% 44.00% Rusted 2 3 40.57% 71.43% Misshapen 0 3 0.00% Total por Columna 67 53 55.00% 60.00% Wrong size 1 0 100.17% 16 13.Figura 14-9 Cuadro de Diálogo de Opciones de Ventana para Tabulación Cruzada Una opción interesante en el ejemplo es mostrar Porcentajes por Fila en vez de Porcentajes por Tabla: Tabla de Frecuencias para Defect por Facility Texas Virginia Contaminated 36 17 67.92% 32.50% 3 2.50% 28 23.33% Misaligned 8 20 28.67% 33.08% Damaged 10 6 62.00% 100.00% Missing parts 2 1 66. mientras que el 71. Esto sugiere que algunos tipos de defecto ocurran frecuentemente en unas fábricas más que en otras. Diagrama de Barras Agrupado La diferencia entre las dos fábricas es bastante explícito. es también bastante ilustrativo: 229/ Analizando Datos Categóricos .El porcentaje ahora indica el porcentaje de cada celda con respecto al total de su fila. Un gráfico adicional. llamado Gráfico de Mosaico. Por ejemplo. Por ejemplo. una hipótesis que será probada formalmente en la siguiente sección. Otras gráficas también pueden ser muy útiles.43% de todos los artículos desalineados fueron producidos en Virginia. el diagrama de barras muestra los datos tanto por defecto como por fábrica: Diagrama de Barras para Defect según Facility Contaminated Damaged Leaking Defect Misaligned Misshapen Missing parts Poor color Rusted Wrong size 0 10 20 frecuencia 30 40 Facility Texas Virginia Figura 14-11.92% de todos los artículos contaminados fueron producidos en Texas. 67. Gráfico de Mosaico para Defect segúnFacility Facility Texas Virginia Contaminated Damaged Leaking Misaligned Misshapen Missing parts Poor color Rusted Wrong size Figura 14-12. Consecuentemente. el área total de cada rectángulo es proporcional a la frecuencia correspondiente de cada celda en la tabla de dos vías. las frecuencias de cada celda pueden mostrarse en tres dimensiones seleccionando el Gráfico de Rascacielos desde el cuadro de diálogo Gráficas: 230/ Analizando Datos Categóricos . Si así lo desea. El ancho de las barras es proporcional al porcentaje relativo de cada tipo de defecto en cada locación. Gráfico de Mosaico En esta gráfica. la altura de cada barra es proporcional al número total de defectos de cada tipo. el procedimiento presenta los resultados de una prueba chi-cuadrada: Pruebas de Independencia Prueba Estadístico Gl Valor-P Chi-Cuadrada 18. Figura 14-14. Gráfico de Rascacielos Tridimensional En un Gráfico de Rascacielos.Gráfico Rascacielos para Defect según Facility 40 frecuencia 30 20 10 Virginia Contaminated Damaged Leaking 0 Misaligned Misshapen Missing parts Poor color Texas Rusted Wrong size Facility Defect Figura 14-13. la altura de cada barra representa la frecuencia de una celda en la tabla de contingencia. 14.0182 Advertencia: algunas celdas contienen menos de 5 casos.438 8 0. 231/ Analizando Datos Categóricos . Prueba de Independecia Chi-Cuadrada La prueba chi-cuadrada se utiliza para decidir entre dos hipótesis: Hipótesis Nula: las clasificaciones de las filas y de las columnas son independientes. elija Pruebas de Independencia del cuadro de diálogo Tablas. Hipótesis alternativa: las clasificaciones no son independientes.4 Comparando Dos o Más Muestras Para determinar si las aparentes diferencias entre las fábricas de Texas y Virginia son estadísticamente significativas. La independencia implicará que el tipo de defecto encontrado en un artículo no tiene nada que ver con la fábrica en la que fue manufacturado. Para una tabla de este tamaño. asumiendo que la hipótesis nula es verdadera). Sin embargo. el valor-P puede ser desconfiable. Con celdas de sumas pequeñas. Regresar a la hoja de datos y dar clic en el encabezado de la columna de Defect para seleccionarla. la advertencia ocurre siempre que la suma esperada de cualquier celda sea menor a 5. 3. Esto puede hacerse fácilmente en STATGRAPHICS Centurion del modo siguiente: 1. indicando al nivel de significancia del 5% que la distribución de los tipos de defectos es diferente en la fábrica de Texas que en la de Virginia. 2. En este caso. (Técnicamente.Para la prueba chi-cuadrada. un valor-P pequeño indica que las clasificaciones de las filas y las columnas no son independientes. también se muestra una advertencia. el valor-P es menor a 0.05. Una solución a este problema es agrupar todos los tipos de defecto poco frecuentes en una sola clase y reiniciar el análisis. Llenar el cuadro de diálogo Recodificar Datos como se muestra en la siguiente página para combinar los tipos de defecto menos comunes en una sola columna descrita como “Other”: 232/ Analizando Datos Categóricos . debido a que las sumas de algunas celdas en la tabla de dos vías son menores a 5. Pulse el botón derecho del ratón y elija Recodificar Datos del menú que se presenta. como se muestra en el Gráfico de Mosaico: 233/ Analizando Datos Categóricos . Recodificando los Tipos de Defectos Menos Frecuentes Las anotaciones en el cuadro de diálogo Recodificar Datos instruyen al programa para que busque valores en la columna Defect que coincidan con cada intervalo definido. Como respuesta al cambio en la hoja de datos.Figura 14-15. La nueva clase Other tiene ahora una frecuencia razonable. regrese a la ventana de análisis de Tabulación Cruzada. el análisis será automáticamente actualizado. Cualquier etiqueta de una fila dada que coincida alfabéticamente entre los límites mostrados. Después de realizar la recodificación. es recodificada al valor descrito en la columna Nuevo Valor. Debe tomarse en cuenta que la prueba compara la distribución de tipos de defecto entre las dos fábricas. o no. Prueba Chi-cuadrada Después de Recodificar Datos Por lo que parece que el tipo de defecto está ciertamente relacionado con la fábrica en donde el artículo fue producido. el valor observado de Defect para un caso en particular.0%. se puede rechazar la hipótesis de que filas y columnas son independientes con un nivel de confianza del 95. está relacionado con su valor en Facility.0078 El StatAdvisor Esta tabla muestra los resultados de la prueba de hipótesis ejecutada para determinar si se rechaza. como se explica en la siguiente sección. la idea de que las clasificaciones de fila y columna son independientes. Gráfico de Mosaico para Datos Recodificados Después de recodificar. La prueba chi-cuadrada todavía muestra una diferencia estadísticamente significativa entre las fábricas de Texas y Virginia: Pruebas de Independencia Prueba Estadístico Chi-Cuadrada 11. Por lo tanto.05. 234/ Analizando Datos Categóricos .Gráfico de Mosaico para Defect segúnFacility Facility Texas Virginia Contaminated Damaged Misaligned Other Figura 14-16. Figura 14-17. Puesto que el valor-P es menor que 0.874 Gl 3 Valor-P 0. Tal comparación requiere una prueba diferente. No compara los números o porcentajes de los artículos defectuosos en cada locación. 343 Hagamos que θ1 sea la proporción de artículos defectuosos producidos en Texas y que θ2 sea la proporción de artículos defectuosos producidos en Virginia.0072 7343 Basándonos en estos datos. 235/ Analizando Datos Categóricos Luego seleccione Capture: . Las proporciones estimadas están dadas por: θˆ1 = 67 = 0.237 7. Hoja de Datos para Comparar Dos Proporciones Las filas contienen la suma de los artículos defectuosos y no defectuosos. necesitamos conocer la producción total de cada fábrica.5 Tablas de Contingencia Para determinar si una fábrica produce más artículos defectuosos que la otra. Haremos la suposición que la siguiente información describe la producción de un mes: Fábrica Texas Virginia Número Defectos 67 53 de Número de Artículos Producidos 6. Para determinar si la aparente diferencia es estadísticamente significativa. Tablas de Contingencia del mismo menú donde se encuentra Tabulación Cruzada. parece que el porcentaje de artículos defectuosos producidos en Texas puede ser myor que el porcentaje de artículos defectuosos producidos en Virginia. vamos a crear una hoja de datos como la que se muestra a continuación: Figura 14-18.0107 6237 θˆ2 = 53 = 0.14. Por lo que podemos concluir.783 Gl 1 Valor-P 0. no tenga algo que ver con la fábrica en donde se produjo. En este caso. la independencia implicará el que un artículo sin importar si es defectuoso. la hipótesis de independencia es rechazada en el nivel de significancia del 5%.05. 236/ Analizando Datos Categóricos . Debido a que el valor-P en la tabla es inferior a 0. Cuadro de Diálogo de Captura de Datos de Tablas de Contingencia Este análisis mostrará una prueba chi-cuadrada de la tabla de 2 por 2: Pruebas de Independencia Prueba Estadístico Chi-Cuadrada 4. Prueba chi-cuadrado de la tabla de 2 por 2 Hay que recordar que la prueba chi-cuadrada determina si las clasificaciones de las columnas y filas son independientes.Figura 14-19. que las proporciones de defectos en las dos fábricas son significativamente diferentes.0287 Figura 14-20. Los resultados en este tipo de análisis de capabilidad es un estimado de la capacidad y habilidad del proceso en lograr esas especificaciones.8 200.8 197.0 198.6 203.8 197.0 197.9 215.0 200.5 192.1 204.9 195.9 200.1 197.1 200.4 205.5 195.9 197.9 211.0 203.0 205.9 201.5 205.5 199.9 200.0 200.1 208.3 215.8 211.3 197.0 202.3 200.4 defectos por cada millón de oportunidades. Una actividad común es la de recolectar datos de un proceso y compararlos con límites de especificación establecidos.8 203.7 201.6 207.5 191.0 197.5 201. tiene como objetivo conseguir una tasa de defectuosos de 3.8 200. considere un producto cuya fuerza debe estar entre 190 y 230 psi.5 207.4 209.9 202. cuyos valores son: 213.5 199.7 209.2 195.0 206.8 205.2 213.7 196.0 203.15 Tutorial #6: Análisis Capabilidad de Procesos Determinando los DPM o el porcentaje más allá de los límites de especificación El STATGRAPHICS Centurion es ampliamente utilizado por personal involucrado en áreas cuya tarea es la de asegurar que los productos y servicios que ofrecen sean de óptima calidad.6 195.6 201. ampliamente usado a nivel mundial.6 201.4 Capítulo 237/ Análisis de Capacidad del Proceso .5 200.6 211.3 218.2 210.3 199. Ahora suponga que son tomadas n = 100 mediciones de fuerza.8 200.7 205.3 207.4 198. Como ejemplo.1 201.8 207.7 201.5 200.8 201. El método Seis Sigma.3 199.3 197.0 229.3 194.3 194.7 195.0 197.0 202.1 199.1 206.6 206.6 201.2 196.8 201.9 201.3 202.5 216.5 203.1 202.4 202.7 214.1 199.4 202.4 200.0 195.4 201.6 211.5 199.2 208.0 205.6 193.4 208.8 199. sf6. el Análisis de Una Variable descrito en el Capítulo 10 ofrece diferentes herramientas muy útiles. Todos los datos apenas caen dentro de los límites de especificación. en un rango de 191.Este capítulo describe cómo realizar un análisis de capabilidad típico para datos contínuos. Ejecutar el procedimiento Análisis de Una Variable usando la columna llamada Strength. La ventana de análisis de inicio se muestra abajo: Figura 15-1. 2. Ventana de Análisis de Una Variable Diferentes factores de interés especial se hacen evidentes inmediatamente: 1.5 238/ Análisis de Capacidad del Proceso .3 hasta 229.1 Graficando los Datos El primer paso para examinar cualquier conjunto nuevo de datos es graficarlo. Para analizar estos datos debemos de: 1. 15. Abrir el Archivo llamado items. Para un conjunto de datos como el mostrado arriba. 81. pulsando el ícono de Gráficas en la barra de herramientas de análisis y seleccionando Histograma en el cuadro de diálogo Gráficas: Histograma 24 20 frecuencia 16 12 8 4 0 180 190 200 210 Strength 220 230 240 Figura 15-2. Si maximiza el panel Resumen Estadístico. Datos no-normales como los del ejemplo son muy comúnes de encontrar. Tales puntos son usualmente considerados como aberrantes. Histograma Los datos claramente parecen tener un sesgo positivo. el valor debería estar entre -2 y +2. verá que el sesgo estandarizado es igual a 4. sin embargo. si el resto de los datos aparentemente proceden de una distribución normal. aún eliminando el aparente aberrante. En este caso. siendo amenudo una mala estimación del porcentaje de productos que están más allá de los límites de especificación. el ignorar la no-normalidad puede originar resultados incorrectos. Como se verá en este tutorial. También podemos mostrar un histograma. Si los datos procedieran de una distribución normal. extendiéndose más a la derecha del pico que a la izquierda. El bigote superior es más largo que el bigote inferior y la caja se extiende mucho más por arriba de la mediana (la línea vertical dentro de la caja) que por abajo. el sesgo estandarizado solo se reduce a 2.2. El gráfico de caja y bigotes muestra un punto muy lejano (un pequeño cuadro con un signo rojo de + dentro). Una acción típica para tratar estos datos. la forma de la caja no es muy simétrica. es simplemente ignorar la no-normalidad y calcular índices como Cpk usando fórmulas diseñadas para datos de distribución normal. 239/ Análisis de Capacidad del Proceso . Aún eliminando el valor más grande de los datos. 3.94. 2 Procedimiento Análisis de Capabilidad STATGRAPHICS contiene procedimientos para realizar el análisis de capabilidad de datos. elija CEP – Análisis de Capabilidad – Variables – Valores Individuales. Cuadro de Captura del Análisis de Capabilidad de Proceso Los límites de especificación superior e inferior también se han capturado. 240/ Análisis de Capacidad del Proceso .sf6: Figura 15-3. el Análisis de Capabilidad puede efectuarse: 1. Si usa el menú Clásico. Los datos del ejemplo se encuentran en una columna llamada Strength en el archivo items.15. El cuadro de captura de datos solicita el nombre de la columna que contenga los datos. elija Analizar – Datos Continuos– Análisis de Capabilidad de Proceso. Si usa el menú Seis Sigma. ya sea uno a la vez (individuales) o en subgrupos (como 5 observaciones cada hora).Valores Individuales. así como el valor nominal o valor objetivo. 2. Asumiendo que los datos son individuales. Ventana de Análisis de Capabilidad de Proceso Cuando se corre por primera vez el análisis de capabilidad.La ventana de análisis de inicio presenta un resumen de los datos. una tabla de los índices de capabilidad y un gráfico de capabilidad: Figura 15-4. los datos se ajustan a una distribución normal. El Gráfico de Capabilidad muestra un histograma. junto con la distribución normal que mejor se ajuste: 241/ Análisis de Capacidad del Proceso . Capacidad de Proceso para Strength LIE = 190. 4.68 K = -0.74 Ppk = 0.16 Pp = 1. El Resumen del Análisis en el panel superior izquierdo cuantifica el ajuste: 242/ Análisis de Capacidad del Proceso . La distribución normal ajustada no concuerda muy bien con los datos. están movidas a la izquierda.07 Cpk = 0. Es de interés particular en la gráfica superior el que: 1.=6.Gráfico de Capabilidad con Distribución Normal Las líneas verticales largas muestran los límites de especificación y el valor nominal.8.36 Figura 15-5. Nominal = 210. A pesar de que ninguna de las observaciones es menor al límite de especificación inferior. Las líneas verticales cortas están situadas a más y menos 3 desviaciones estándar de la media de la muestra. 2. el sesgo en los datos hace que la curva no logre emparejarse adecuadamente con las barras del histograma. Est.0. 3. Sin embargo.0 24 20 frecuencia 16 12 8 4 0 180 190 200 210 Strength 220 230 240 Normal Media=202. Aunque la curva normal tiene la misma media y desviación estándar que los datos.23781 Cp = 1. La media de la muestra es 202.0. que es considerablemente menor que el valor nominal de 210. LSE = 230. una amplia porción de la cola inferior de la distribución normal está por debajo de ese límite.809 Desv. Las líneas ubicadas en más y menos 3 sigma están pegadas suficientemente para ajustarse dentro de las especificaciones. 23781 6. se basan considerablemente en la suposición de que los datos provienen de una distribución normal.54 20014.0 sigma = 184. Basándonos en la distribución normal ajustada.002119% Defectos Por Millón 6.931784 Valor-P 0.000654% 2. Pruebas de Normalidad Dependiendo de sus preferencias en el sistema.Strength Datos/Variable: Strength (specs are 190-230) Transformación: ninguna Distribución: Normal tamaño de muestra = 100 media = 202.65 20021.Análisis de Capabilidad de Proceso(Individuales) . 0.000000% 0. Una revisión formal de esa hipótesis puede efectuarse seleccionando Pruebas de Normalidad del cuadro de diálogo Tablas: Pruebas de Normalidad para Strength Prueba Estadístico Estadístico W de Shapiro-Wilk 0. una o más pruebas de normalidad serán presentadas.0000321356 Figura 15-7.36 1.19 Especificaciones LSE = 230. el porcentaje estimado de producto fuera de los límites de especificación es alrededor del 2%. 0.0 Nominal = 210.000000% Estimados Fuera Especs.096 Observados Fuera Especs.021 defectos por millón (DPM). 15. 243/ Análisis de Capacidad del Proceso .05 Figura 15-6. presenta el porcentaje de producto que puede estar fuera de especificaciones.0 LIE = 190. Cada una de las pruebas disponibles está basada en las siguientes hipótesis: Hipótesis Nula: los datos provienen de una distribución normal. equivalente a 20. Resumen del Análisis de Capabilidad La tabla inferior.0 Límites Sigma +3.15 -2.0 Total Valor-Z 4.522 media = 202.3 Trabajando con Datos No-Normales Los DPM estimados que fueron calculados arriba.0 sigma = 221.001465% 2. = 6.000000% 0.809 desv.809 -3. est. Para auxiliar en la selección de una distribución diferente.226 -798.138628 0. cualquier valor estimado de DPM o índices de capabilidad basados en la suposición de normalidad son inválidos.13213 0. Usando la selección predeterminada de distribuciones nos presenta los siguientes resultados: Comparación de Distribuciones Alternas Distribución Parámetros Est.002 -351.177886 0.0920985 0. accesando Opciones del Análisis: 244/ Análisis de Capacidad del Proceso . En este caso.628084 Figura 15-8. el STATGRAPHICS Centurion ofrece una opción llamada Comparación de Modelos Alternativos en el cuadro de diálogo Tablas.05 conduce al rechazo de la hipótesis de normalidad en el nivel de significancia del 5%.763 -323. Transforme los datos para que sigan una distribución normal en la métrica transformada.457 -348. Esta opción ajusta varias distribuciones y las enlista en orden de su calidad de ajuste.271 -321. cualquiera de estas dos propuestas debe ser considerada: 1. Seleccione una distribución distinta a la normal. Entonces. 2. en la cual basar el análisis. el cual mide la distancia máxima entre la distribución acumulada de los datos y la de la distribución ajustada. Distribuciones Ajustadas en Orden de su Calidad de Ajuste Las distribuciones han sido enlistadas conforme al valor del estadístico Kolmogorov-Smirnov de bondad de ajuste.65 -320.Hipótesis Alternativa: los datos no provienen de una distribución normal. En la tabla superior.236 -322.134136 0. Cuando los datos son no-normales. Valor Extremo Superior 2 Laplace 2 Loglogística 2 Logística 2 Lognormal 2 Gamma 2 Normal 2 Weibull 2 Valor Extremo Inferior 2 Exponencial 1 Pareto 1 Log Verosimilitud -314.055 -320. Un Valor-P debajo de 0.0675422 0. la distribución que mejor se ajusta es la del mayor valor extremo.782 -631.0913779 0.189989 0.61064 0.306 -324.174 KS D 0. la prueba Shapiro-Wilks claramente rechaza la hipótesis de que los datos provienen de una distribución normal. Puede cambiarse a la distribución del mayor valor extremo.0941708 0. Opciones de Análisis de Capabilidad de Proceso El ajuste resultante se muestra abajo: 245/ Análisis de Capacidad del Proceso .Figura 15-9. límites donde se encuentra el mismo 99. LSE = 230. comparado con el anterior.Capacidad de Proceso para Strength LIE = 190. usando una distribución normal ajustada: 246/ Análisis de Capacidad del Proceso . Las líneas verticales pequeñas están ubicadas en los límites “equivalentes” de 3 sigma. como en el caso de la media ± 3 sigma para una distribución normal. coincidiendo mucho mejor con los datos observados que la distribución normal.05 Cpk = 0. En el Resumen del Análisis se detecta una diferencia considerable en el porcentaje estimado del producto con tendencia a quedar fuera de especificaciones.0 24 20 frecuencia 16 12 8 4 0 180 190 200 210 Strength 220 230 240 Valor Extremo Superior Modo=200. debido a su sesgo positivo.26 Figura 15-10.08 Pp = 1.80179 Cp = 1. i.73%.0..96 K = -0.036 Escala=4.99 Ppk = 0.0. Distribución Ajustada del Mayor Valor Extremo Note que la distribución esta sesgada a la derecha. Note que los límites no están simétricamente espaciados con respecto al pico de la distribución.e. Nominal = 210. 194758% 0.42 Figura 15-11.000000% Estimados Fuera Especs. Nota: Dependiendo de los límites de especificación y de la distribución verdadera.000000% 0.796 0.19 -3. puede hacer que el proceso parezca significativamente mejor o peor que cuando se usa la distribución apropiada.036 escala = 4.134996 percentile = 190.Análisis de Capabilidad de Proceso(Individuales) . El cuadro de Opciones de Análisis ofrece numerosas opciones para seleccionar una Transformación de Datos: 247/ Análisis de Capacidad del Proceso .0 LIE = 190.Strength Datos/Variable: Strength (specs are 190-230) Transformación: ninguna Distribución: Valor Extremo Superior tamaño de muestra = 100 modo = 200.761 mediana = 201.0 Nominal = 210.58 308. el asumir incorrectamente una distribución normal hizo que el proceso se viera mucho peor de lo que realmente es. En este ejemplo.865 percentil = 231.23 por ciento ó 2.030805% 0. el asumir incorrectamente la normalidad.15853) Equivalente 6. una décima parte de lo estimado por la distribución normal.000000% 0.969 Observados Fuera Especs. Una alternativa para seleccionar una distribución diferente es transformar los datos.89 1.80179 (media = 202. Resumen del Análisis después de Ajustar con la Distribución del Mayor Valor Extremo El porcentaje estimado fuera de especificaciones ahora es solamente del 0.63 Especificaciones LSE = 230.808) (sigma = 6.05 2255. 0.0 Total Valor-Z 2.0 Límites Sigma 99.225563% Defectos Por Millón 1947.256 DPM. 0. Si se selecciona una transformación. elevar cada valor a una potencia específica. una distribución normal es ajustada a los datos transformados.Figura 15-12. Esta última aproximación considera una variedad de transformaciones de la forma Yp usando los métodos de Box y Cox para seleccionar un valor óptimo de p. Cuadro Opciones de Análisis para Seleccionar una Transformación Se incluyen opciones como el logaritmo natural. o seleccionar una transformación de acuerdo a los métodos de Box y Cox. El gráfico abajo presenta los resultados del planteamiento de Box-Cox: 248/ Análisis de Capacidad del Proceso . Para comparar los dos planteamientos.31 Figura 15-13.. Gráfico de Capabilidad después de la Transformación Box-Cox En este gráfico se aplicó una transformación inversa para mostrar el ajuste en la métrica original. La transformación ha tenido un efecto similar en el aspecto de la distribución.93 Ppk = 0. LSE = 230. Los DPM estimados son 4. pero aún mucho menor que cuando se asumió una distribución normal.=4.52152E-15 Cp = 1.0 24 20 frecuencia 16 12 8 4 0 180 190 200 210 220 Strength 230 240 Normal (después de transformar) Media=2.353.99 Cpk = 0.02 Pp = 0.0. lo cual es casi el doble que al usar la distribución del mayor valor extremo.75169E-14 Desv. Est.0.90 K = 0. Nominal = 210. el Gráfico de Probabilidad puede ser seleccionado dentro del cuadro de Gráficas para cada planteamiento y pegarse uno al lado del otro en el StatGallery: 249/ Análisis de Capacidad del Proceso .Capacidad de Proceso para Strength LIE = 190. STATGRAPHICS automáticamente regresa todo a su estado original. sin embargo no tan pronunciado como al asumir una distribución del mayor valor extremo. Nota: la media y la desviación estándar mostradas en el gráfico corresponden a los datos transformados y en lo general no son de mucha utilidad. es básico establecer un protocolo para manipular una variable en particular (como Strength) y aplicar el mismo protocolo cada vez que esos datos sean analizados. 250/ Análisis de Capacidad del Proceso . dificultando la elección por uno de ellos. Sería un error hacer el análisis exploratorio de datos descrito en este Capítulo. Gráfico de Probabilidad en el StatGallery Si la distribución asumida es la correcta. este tipo de análisis debería usarse solo para determinar la forma a tratar la variable seleccionada y luego aplicar uno de los plantemientos siempre que se vaya a analizar dicha variable. Sin importar que método sea usado. En lugar de eso.Figura 15-14. los puntos deben caer a lo largo de la línea diagonal como se muestra en este gráfico. cada vez que un conjunto de datos similares sea recolectado. Ambos métodos parecen haber manejado la no-normalidad correctamente. El Nivel de Calidad Sigma incluye un drift de 1.0 Nom = 210.55332 Con base en límites 6.2 Nivel de Calidad Sigma 3.75525 1. Para resumir la capabilidad del proceso.72559 3. dividido entre 3 veces el sigma estimado del proceso.864129 Ppk 0.684481 Cpk/Ppk (superior) 1.0 sigma.35955 DPM 13020.5 sigma en la media. El indice más ampliamente conocido es el Cpk. Intervalos de confianza del 95.920008 1.741874 1.57485 0.997149 1.0 LIE = 190. El procedimiento Análisis de Capabilidad de Proceso en STATGRAPHICS presenta los índices de capabilidad en el Gráfico de Capabilidad y también en la tabla de Índices de Capabilidad. defectos por millón).800059 Corto Plazo Capabilidad 5.741874 Figura 15-15. Tabla de los Índices de Capabilidad 251/ Análisis Capabilidad de Procesos .4 Índices de Capabilidad La esencia de un análisis de capabilidad reside en la estimación del porcentaje de producto que cae fuera de los límites de especificación (o su equivalente DPM.06875 Cpk/Ppk 0.45302 Cpk/Ppk (inferior) 0.23781 Cp/Pp 1. ⎟ ˆ ˆ 3σ 3σ ⎠ ⎝ De manera breve.15.568904 0. los índices de corto y largo plazo serán calculados: Índices de Capabilidad para Strength Especificaciones LSE = 230. La sigma de corto plazo se estimó a partir del rango móvil promedio.0% Intervalos de Confianza Índice Límite Inferior Límite Superior Cp 0.619618 0.21725 Cpk 0.684481 K -0. Al asumir una distribución normal. Cpk es la distancia mínima desde la media estimada del proceso hasta cualquiera de los límites de especificación.31931 Pp 0. los usuarios también basan su criterio en varios índices de capabilidad.9 20021.15836 0.0 Largo Plazo Desempeño Sigma 6. definido como: ˆ ˆ ⎛ μ − LSL USL − μ ⎞ C pk = min⎜ . Preferencias del Sistema para los Índices de Capabilidad 252/ Análisis Capabilidad de Procesos . De forma predeterminada. describen el comportamiento real del proceso. calculados usando un estimado del sigma obtenido de las observaciones ocurridas en tiempos cercanos. especifica que índices serán calculados de forma predeterminada. Un proceso fuera de control en el que la media se ha movido durante el periódo de la recolección de datos puede mostrar un comportamiento mucho peor al que sería capaz de realizar si se hubiera efectuado bajo control. el STATGRAPHICS Centurion etiqueta los índices de capabilidad usando la letra “C” y los índices de comportamiento usando la letra “P”.Los índices de corto plazo. Los índices de largo plazo. así como también otras opciones de interés especial: Figura 15-16. calculados usando un estimado del sigma obtenido de la variabilidad total entre las observaciones a traves del periódo de muestreo. encontrado bajo Editar en el menú principal del STATGRAPHICS. describen la “capabilidad” del proceso en caso de que la media se mantenga constante. El separador Capabilidad dentro del cuadro de Preferencias. 3. Adicionalmente a Cpk.86.En el lado izquierdo del cuadro se enlistan los posibles índices a ser calculados. Esto indica que el verdadero Cpk en el proceso del cual los datos fueron muestreados.74. K – medida de que tan alejado del centro se encuentra el proceso. cuya fórmula es Cp = USL − LSL ˆ 6σ Este índice mide la distancia entre los límites de especificación con relación a la distancia abarcada por 6 desviaciones estándar. Una diferencia substancial entre los dos índices implica que el proceso no esta bien centrado. los valores-Z miden el número de desviaciones estándar entre la media del proceso y un límite de especificación y está directamente relacionado a la probabilidad de que 253/ Análisis Capabilidad de Procesos . Los intervalos de confianza al 95% comprenden de 0. Un valor de K cercano a 0 es indicativo de un proceso bien centrado.62 y 0.15 contiene los intervalos de confianza que muestran el margen de error al estimar esos índices.4 defectos por millón. Un Nivel de Calidad Sigma de 6 es generalmente asociado con el parámetro de 3.62 a 0. la tabla en la Figura 15. La opción predeterminada en el cuadro de Preferencias calcula índices no-normales. Cuando los datos no siguen una distribución normal. en la tabla se muestra un Cpk de 0.86. Cp siempre será mayor o igual a Cpk. primero calculando los valores-Z equivalentes para la distribución no-normal ajustada. . puede estar en cualquier lugar dentro del rango de 0. K se calcula así K= ˆ μ − NOM (USL − LSL ) / 2 Donde NOM es el valor nominal o valor objetivo. Por ejemplo. En el cuadro de Preferencias también se indica que índices serán mostrados en el Gráfico de Capabilidad y su descripción. 2. Cp – índice de capabilidad bilateral. Una explicación detallada de los diferentes índices los puede encontrar en el documento PDF titulado Análisis de Capabilidad – Datos Continuos. se incluyen índices como: 1. es necesario modificar los índices de capabilidad. Nivel de Calidad Sigma – índice utilizado en la metodología Seis Sigma para indicar el nivel de calidad asociado con un proceso. Para una distribución normal. Adicionalmente a los índices de capabilidad. un valor-Z equivalente se calcula primero determinando la probabilidad de exceder el límite y luego encontrando el valor-Z que corresponde a esa probabilidad. Valores-Z equivalentes sean utilizados para calcular los índices. Para una distribución no-normal.5 Calculadora Seis Sigma Así como el índice Cpk es un indicador muy útil de la capabilidad del proceso.una observación esté más allá de ese límite. 2. con la condición de que: 1. El menú Herramientas del STATGRAPHICS Centurion contiene una Calculadora Seis Sigma que permite la conversión entre ambos indicadores. La Calculadora Seis Sigma se muestra a continuación: 254/ Análisis Capabilidad de Procesos . Los datos provienen de una distribución normal. Después de calcular los valores-Z equivalentes para ambos límites de especificación. entonces este puede relacionarse con los DPM. Z usl ) /3 Nota: A pesar de que el cuadro de Preferencias proporciona la opción de calcular índices de capabilidad a partir de percentiles en lugar de valores-Z equivalentes. el Cpk puede calcularse de la siguiente forma C pk = min (Z lsl . Considerando que se haya calculado apropiadamente. 15. al hacerlo se rompe la relación entre los índices de capabilidad y los DPM. 5 sigmas. 2. En la metodología Seis Sigma. Calculadora Seis Sigma Para usar la calculadora: 1. 3. deshabilite la opción bilateral. oscilará alrededor de su valor a largo plazo en 1. Indique el valor que desea sea asumido para el cambio a largo plazo en la media del proceso. a menudo se supone que la media del proceso. Si desea hacer el cálculo basado únicamente en el límite de especificación más cercano. Seleccione cualquiera de las opciones de captura e introduzca el valor del estadístico correspondiente. 255/ Análisis Capabilidad de Procesos .Figura 15-17. 256/ Análisis Capabilidad de Procesos .33 equivale a cerca de 33 defectos por millón fuera de la especificación más cercana. Pulse el botón Calcular para mostrar los valores asociados de los otros estadísticos en el cuadro de Resultados. un Cpk de 1.4. Si asumimos que la media del proceso no cambia. velocidad de flujo. Consideremos el caso de un ingeniero que desea determinar cuál de las muchas variables de un proceso es la que tiene mayor impacto en el producto final. para determinar su efecto en ese expermiento. cada vez que corre un experimento. existen varios planteamientos para tratar el problema. En la práctica. Usar un diseño de experimentos estadístico: estableciendo una serie de experimentos que generen la mayor información acerca de los factores y su interacción entre ellos. Este tutorial describirá cómo se construye un diseño de experimentos usando el tercer planteamiento. un pequeño estudio bien planeado ofrece más información que uno grande erróneamente diseñado. en el menor número de experimentos como sea posible. Experimentar con un factor a la vez: considerando solo un factor constante. 3. incluyendo: 1. concentración. Prueba y error: seleccionando arbitrariamente una combinación diferente de los factores. velocidad de agitación y porcentaje del catalizador. Este último tutorial examina algunas de las capacidades del STATGRAPHICS Centurion para crear y analizar diseños de experimentos. Todos los datos son creados de manera diferente.16 Tutorial #7: Diseño de Experimentos Diseñando un experimento para ayudar a mejorar un proceso. Capítulo 257/ Diseño de Experimentos . y como serán analizados los resultados. Dicho planteamiento raramente ofrece información útil. Este planteamiento es extremadamente ineficiente y puede llevarnos a conclusiones incorrectas en caso de que cualquiera de los factores interactúe. 2. Intentará investigar el impacto de estos 5 factores: temperatura de entrada. A menudo. Si usa el menú Clásico. en un mínimo de corridas experimentales.1 Seleccionando Diseños de Cribado El objetivo de un experimento de cribado es encontrar. elija DDE – Crear Diseño – Selección de Diseños de Cribado. que variables del proceso tienen el mayor impacto en el producto final. Cuadro Inicial de Selección de un Diseño de Cribado 258/ Diseño de Experimentos . Si usa el menú Seis Sigma. En el primer cuadro de diálogo se solicita la información básica sobre el experimento: Figura 16-1. elija Mejorar – Crear Diseños de Experimentos – Selección de Diseños de Cribado. 2.16. el primer paso al diseñar un experimento de cribado es determinar qué tipo de diseño se correrá y cuántas corridas son necesarias. En el STATGRAPHICS Centurion. La sección DDE contiene un procedimiento que puede ayudarnos en este tema: 1. requiriendo para su interpretación adecuada que no se presenten interacciones. como podría ser tres octavos de las corridas. En este ejemplo. el ingeniero desea estudiar 5 factores. Fracciones Irregulares – corridas hechas en un subconjunto del factorial completo. y los demás son corridos en 2. El STATGRAPHICS Centurion intentará encontrar el diseño óptimo para cada tipo especificado que cumpla con los requerimientos. 3. Diseños Plackett-Burman – diseños de dos niveles donde el número de corridas no es una potencia de 2. Mínimo de Puntos Centrales por Bloque: especifica el menor número de puntos centrales deseados en cada bloque. • Corridas Máximas por Bloque: Al hacer el experimento. el ingeniero se percató que no podía hacer mas de 10 corridas con un mismo lote de la materia prima. Debido a que los lotes pueden ser diferentes entre sí. un octavo y así en adelante. estima todos los efectos principales. o Rresolución III. 5. Diseños a Considerar: los tipos de diseño a evaluar. 2. 4. Factoriales – corridas de combinaciones posibles entre los niveles de cada factor. pero algunas interacciones de dos factores están confundidas con otras interacciones o efectos de bloque. Los diseños son clasificados de acuerdo a su resolución: o Resolución V. Factoriales Fraccionados – corridas hechas en un subconjunto del factorial completo. las corridas experimentales necesitan ser agrupadas en bloques de no más de 10 corridas cada uno. Los diseños existentes son: 1. donde el subconjunto es igual a la mitad.La llenado que se requiere es: • • Número de Factores: el número de factores experimentales (X) a ser incluídos durante el experimento. un cuarto. pero la fracción es irregular. Factoriales de Niveles Mixtos – corre un factor a 3 niveles. estima todos los efectos principales e interacciones entre dos factores. Los puntos centrales son corridas experimentales en el centro de la región experimental y usualmente son utilizados para crear réplicas de las cuales estimar el • 259/ Diseño de Experimentos . o Resolución IV. estima solo los efectos principales. Cuando se pulsa ACEPTAR. En este caso. En detalle. Esta es la desviación estándar que se observará para corridas repetidas con un mismo conjunto de condiciones experimentales.error experimental.5 para rendimiento. En estudios previos. Cualquier efecto menor a esto sería desechado para 260/ Diseño de Experimentos . operando con el nivel de significancia inferido en el campo Nivel de Confianza. • Sigma del error experimental: la desviación estándar del proceso experimental. En este caso. Segundo Cuadro de Diálogo para el Diseño de Cribado En este cuadro se determina la potencia requerida del experimento. el programa presentará este segundo cuadro de diálogo: Figura 16-2. el ingeniero permite al programa determinar el número necesario de puntos centrales. que fue considerado como el parámetro más importante. es la probabilidad de obtener un valor-P significativo en la tabla inicial ANOVA cuando el efecto real iguala al especificado en el campo Efecto a Detectar. el ingeniero consideró un 90% de probabilidad para detectar un efecto igual a 3 veces el sigma del error experimental. se pensó que este valor estaría alrededor de 0. “Potencia” es la probabilidad que un factor con un efecto de magnitud específica se declare estadísticamente significativo una vez que el experimento concluya y los datos sean analizados. 1 1 Bloques 4 2 Power (%) 99. al menos. Un diseño factorial 25 completo que consiste de todas las combinaciones a 2 niveles de cada uno de los 5 factores experimentales. 2.0% de probabilidades de detectar un efecto de magnitud 1.0% Meta Efecto 1.4379 El StatAdvisor La tabla muestra 2 diseños experimentales que tienen. V* IV* Puntos Esquina 32 16 Puntos Centrales 0 4 G. un valor-P significativo será aquel que sea menor a 0. c. Un cálculo rápido revela que dados 5 factores. los efectos de un interés práctico son: a.L. Debido a que el nivel de confianza se estableció en un 95%. Una media fracción en 2 bloques de 10 corridas cada uno. El diseño es de resolución IV pudiendo estimar todos los efectos principales y algunas interacciones entre dos factores.05. Cada bloque consiste de 8 factoriales o puntos esquinados y 2 puntos centrales. b. Tiene mucho más potencial que el solicitado. Diseños de Cribado Seleccionados Se sugieren dos diseños: 1. Figura 16-3.5.tomarlo en cuenta como de interés práctico. 1 media global 5 efectos principales 10 interacciones de dos factores 1 efecto de bloque 261/ Diseño de Experimentos .9987 98. 0. por Bloque 10 Sigma Error Exp. Error 13 4 Reps.0% Diseños Selecionados Diseño Factoriales en 4 bloques 2^5 Media fracción en 2 bloques Corridas 32 20 Resol.5 Nivel de Confianza 95. se presenta una ventana de análisis enlistando los diseños experimentales más pequeños de cada tipo que cumplan con los requerimientos definidos: Selección Diseños de Cribado Entrada Número de Factores 5 Puntos Centrales Min. por Bloque 0 Corridas Max. Al pulsar ACEPTAR una vez más.5 Deseada Potencia 90. un 90. Este es un diseño relativamente grande con 8 corridas en cada uno de los 4 bloques. Ninguno de los diseños tienen más de 10 corridas en cada bloque. d. elija DDE – Crear Diseño – Diseño Nuevo. Se presentará una serie de cuadros de diálogo en los cuales podremos configurar el diseño. elija Mejorar – Crear Diseños de Experimentos – Nuevo Diseño. el número de variables de respuesta y el número de factores experimentales: Figura 16-4. Si usa el menú Seis Sigma. solo se sacrificaría una interacción de dos factores en los efectos de bloque. debido a que 16 corridas factoriales son suficientes para estimar la media y los otros 15 efectos. puede regresar al menú principal y: 1. Si usa el menú Clásico.2 Creando el Diseño Una vez que se ha seleccionado un diseño. El primer cuadro de diálogo solicita el tipo de diseño. el diseño sería de resolución V. 2. 16. el ingeniero lo seleccionó. Debido a que el segundo diseño es más pequeño que el primero. Cuadro Inicial para la Creación de un Diseño 262/ Diseño de Experimentos . Si se elige este diseño.Sin el efecto de bloque. En el siguiente cuadro se establecen las variables de respuesta: 263/ Diseño de Experimentos . Capture la siguiente información para los cinco factores del experimento actual: Factor A B C D E Nombre temperatura velocidad de flujo concentración tasa de agitación catalizador Min 150 10 5 125 1 Max 180 12 8 150 1. El segundo cuadro de diálogo es utilizado para determinar los factores experimentales y el rango sobre el cual variarán: Figura 16-5.Continuando con el ejemplo de la sección anterior. de uno en uno.5 Unidades Grados C litros/min % rpm % Continuos si si si si si Estos límites fueron establecidos para abarcar un rango de operación razonable en el proceso. Estableciendo los Factores Experimentales Para determinar la información de los 5 factores. establecer el experimento significa involucrar 2 variables de respuesta y 5 factores experimentales. habilite los botones del A hasta el E. Figura 16-6. Definición de las Variables de Respuesta Los datos a capturar para las dos respuestas son: Nombre rendimiento fuerza Unidades gramos psi El cuarto cuadro de diálogo es utlizado para elegir el diseño: 264/ Diseño de Experimentos . Tamaño del Bloque: el número de corridas en el bloque más grande. G. se debe contar con al menos 3 grados de libertad.: el número de grados de libertad disponibles para estimar el error experimental. Corridas: el número de corridas en el diseño base. La lista muestra: 1. pulse la flecha para ir recorriendo la lista. 2. el ingeniero seleccionó una fracción media en dos bloques de 8 corridas cada uno.del Error.Figura 16-7. así también con el número total de corridas en el experimento. Resolución: la resolución del diseño. 3. aunque se recomiendan más.L. 265/ Diseño de Experimentos . En este caso. Selección del Diseño Para ver la lista de los posibles diseños de cribado para cinco factores. En general. 5. antes de que se agreguen puntos centrales o corridas repetidas. 4. El potencial de las pruebas estadísticas está relacionado con el número de grados de libertad. Nombre: el nombre de cada diseño disponible. llevando el diseño final hasta las 20 corridas. Opciones de Diseño Los campos de captura establecen: 1. También se solicitó que el diseño se realice en orden aleatorio. Aleatorizar: si las corridas deben enlistarse en orden aleatorio. Repetir el diseño completo de esta manera incrementa muy rápidamente el número de corridas a realizar. 4. se solicitaron cuatro puntos centrales. La aleatoriedad debe hacerse siempre que sea posible para prevenir que variables externas no consideradas (como cambios en el proceso a traves del tiempo) puedan influir en los resultados. es una buena forma de agregar grados de libertad al el error experimental. Para el experimento del ejemplo. 266/ Diseño de Experimentos . que significa que el orden de las 10 corridas dentro de cada bloque será generado aleatoriamente. 3. Puntos Centrales: el número de corridas a realizar en el centro del experimento.El cuadro de diálogo final es usado para agregar los puntos centrales o corridas repetidas: Figura 16-8. Repetir Diseño: el número de veces adicionales que cada conjunto de condiciones experimentales debe ejecutarse. Posicionamiento: la posición de los puntos centrales. 2. que separa los puntos centrales uniformemente a traves del diseño. Las opciones más comunes son Aleatorio. que dispersa los puntos centrales aleatoriamente a traves de las otras corridas y Espaciado. Agregando puntos centrales. el diseño se carga en el separador A del Libro de Datos del STATGRAPHICS Centurion: 267/ Diseño de Experimentos . aparece una ventana con los atributos del diseño: Figura 16-9. Ventana de Atributos del Diseño Esta información se usa para verificar que el diseño fue creado correctamente. Al mismo tiempo.Después del cuadro de diálogo final. guárdelo seleccionando Archivo – Guardar Como – Guardar Archivo de Diseño en el menú principal. Antes de realizar el experimento. 5 columnas con los datos de los factores experimentales y 2 columnas para capturar las respuestas una vez que se han realizado las corridas experimentales. es muy útil seleccionar la Estructura de Alias en la barra de herramientas de análisis en la ventana Atributos del Diseño de Cribado.Figura 16-10. Diseño Final La hoja de datos contiene una columna con los números de bloque. que muestra lo siguiente: 268/ Diseño de Experimentos . Después de crear el diseño. los efectos principales estarán libres de las interacciones de dos factores. en el cual la interacción CD aparece junto con el efecto del bloque. Esto implica que el diseño puede estimar la combinación de la interacción CD además de cualquier diferencia entre los bloques 1 y 2. al menos una interacción de dos factores estará confundida con otra interacción de dos factores ó con el efecto de bloques. debe cambiar el orden de las variables. Un concepto como “A” indica que el efecto principal del factor A puede estimarse libre de cualequier otro efecto. Verifique la tabla para determinar cuales interacciones están confundidas. de manera que C y D correspondan a dos variables que no parezcan interactuar. No obstante. que también está libre de los otros efectos. “AB” se refiere a la interacción entre los factores A y B. pero sin poder separar esos dos efectos. Luego reinició el programa y capturó las mediciones de rendimiento y fuerza en la hoja de datos del experimento. Puesto que este diseño de resolución IV. que son la concentración y la velocidad de agitación. . El único contraste que muestra confusión entre los dos efectos es el número 13. 16.Estructura de Alias Contraste Estimados 1 A 2 B 3 C 4 D 5 E 6 AB 7 AC 8 AD 9 AE 10 BC 11 BD 12 BE 13 CD+bloque 14 CE 15 DE El StatAdvisor La estructura alias muestra que efectos principales e interacciones están confundidos unos con otras. Figura 16-11. Estructura de Alias del Diseño Seleccionado Cada línea de la tabla indica una cantidad que puede estimarse por el experimento seleccionado. Si esta es una interacción que el ingeniero cree ser importante.3 Analizando los Resultados 269/ Diseño de Experimentos Después de diseñar el experimento. el ingeniero realizó las 20 corridas indicadas. Note que el diseño ha sacrificado arbitrariamente la capacidad de estimar la interacción entre los factores C y D. No será capaz de estimar estas interacciones. seleccionando Abrir Datos en el menú Archivo.sfx del mismo modo en que lo haría para cualquier archivo de datos STATGRAPHICS. Después de cargar la variable de datos: 1. Si usa el menú Clásico. La ventana de análisis para Rendimiento de inicio muestra la siguiente información: 270/ Diseño de Experimentos . El cuadro de diálogo de captura de datos muestra las dos variables de respuesta: Figura 16-12. Si usa el menú Seis Sigma. debe cargar el archivo tutorial7. 2. elija DDE – Análizar Diseño – Analizar Diseño. Cuadro de Captura de datos para Analizar un Diseño Se construirán modelos independientes para cada uno.Para repetir este análisis. elija Mejorar – Análisis de Diseños de Experimentos – Analizar Diseño. Figura 16-13. 2. Gráfico de Efectos Principales: grafica el cambio estimado en la respuesta cuando cada uno de los factores es movido desde su nivel inferior hasta su nivel superior. Ventana de Análisis Analizar Diseño La ventana muestra cuatro paneles: 1. Gráfico de Pareto Estandarizado: muestra los efectos en orden de significancia decreciente. El gráfico de Pareto estandarizado en la esquina superior derecha puede usarse para fácilmente determinar que efectos son los más importantes: 271/ Diseño de Experimentos . Resumen del Análisis: enlista los efectos principales estimados y las interacciones. 4. 3. con una línea para determinar que efectos son estadísticamente significativos. Tabla ANOVA: contiene los valores-P que pueden usarse después para probar la significancia estadística de cada efecto. En este caso. concentración y catalizador. hay 3 efectos principales significativos: temperatura. Cualquier barra más allá de la línea vertical es estadísticamente significativa en el nivel de significancia seleccionado. Gráfico de Pareto Estandarizado La longitud de cada barra es proporcional al valor del estadístico-t calculado para el efecto correspondiente. También hay una interacción significativa entre temperatura y velocidad de flujo.Carta de Pareto Estandarizada para yield A:temperature AB C:concentration E:catalyst AC AE D:agitation rate B:flow rate DE AD BD BE BC CE CD+bloque 0 4 8 Efecto estandarizado 12 16 + - Figura 16-14. establecido de forma predeterminada en 5%. El Gráfico de Efectos Principales en el panel inferior derecho muestra cómo cada factor afecta el rendimiento: 272/ Diseño de Experimentos . Por ejemplo.Gráfica de Efectos Principales para yield 86 85 yield 84 83 82 temperature flow rate concentration catalyst agitation rate Figura 16-15. Note que los tres factores con efectos principales significativos tienen un mayor impacto en la respuesta que los otros. el rendimiento promedio a temperatura baja es aproximadamente 82. primero elija Gráfico de Interacciones en el cuadro Gráficas.4. manteniendo constante todos los demás factores con un valor a la mitad de sus respectivos niveles. La diferencia de 3. Para graficar la interacción entre temperatura y velocidad de flujo.4 es llamada “efecto principal” de la temperatura. mientras que el rendimiento promedio a temperatura alta es aproximadamente 85. Luego use Opciones de Ventana para seleccionar solo esos dos factores: 273/ Diseño de Experimentos . Gráfico de Efectos Principales Las líneas indican el cambio estimado en el rendimiento conforme cada factor es movido de su nivel inferior a su nivel superior. para cada nivel de velocidad de flujo: Gráfica de Interacción para yield 88 flow rate=12.0 temperature 180.0 flow rate=10.0 86 yield 84 flow rate=10. Cuadro Opciones de Ventana para Gráfico de Interacciones El gráfico resultante muestra el rendimiento promedio conforme la temperatura es cambiada.0 80 150. Gráfico de Interacción entre Velocidad de flujo y Temperatura 274/ Diseño de Experimentos .0 Figura 16-17.Figura 16-16.0 82 flow rate=12. la temperatura es un factor muy importante. Para eliminar estos efectos: 1. Pulse el ícono de Opciones de Análisis en la barra de herramientas de análisis. 3. Cuadro para Excluir Efectos Las reglas básicas que se deben seguir para excluir efectos es: 1. En el cuadro Opciones para Excluir Efectos. Efectos no significativos que no estén involucrados en interacciones significativas. 2. A una alta velocidad de flujo. Cualquier interacción de dos factores que no sea significativa. es importante eliminar los efectos no significativos. Pulse el ícono Excluir en el cuadro Opciones de Análisis. Antes de utilizar el modelo estadístico que soporta a este análisis. 2. dar doble clic en cualquiera de los efectos que deseé excluir y lo arrastra de la columna Incluir a la columna Excluir: Figura 16-18. la temperatura tiene poco ó nulo efecto.Note que a menor velocidad de flujo. 275/ Diseño de Experimentos . Gráfico de Pareto Estandarizado después de Eliminar Efectos Excepto por el efecto principal del factor B. de regresión para yield . el Gráfico de Pareto aparece como se muestra a continuación: Carta de Pareto Estandarizada para yield A:temperature AB C:concentration E:catalyst B:flow rate 0 3 6 9 Efecto estandarizado 12 15 + - Figura 16-19.106625 El StatAdvisor Esta ventan despliega la ecuación de regresión que se ha ajustado a los datos.Tutorial #7 Coeficiente Estimado constante 250. El modelo final se verá seleccionando Coeficientes de Regresión del cuadro Tablas: Coef.0595 B:flow rate -17.17. La ecuación del modelo ajustado es yield = 250.0595*temperature .En este caso.4475 C:concentration 0.074 .555417*concentration + 2.106625*temperature*flow rate Figura 16-20.074 A:temperature -1.6175*catalyst + 0. Modelo de Regresión Ajustado 276/ Diseño de Experimentos . excepto el efecto principal de B.1. Habiendo eliminado los efectos.4475*flow rate + 0.555417 E:catalyst 2. Dicho efecto principal se mantiene porque esta involucrado en una interacción significativa con el factor A. significa eliminar todo lo que no sea significativo en el Gráfico de Pareto.6175 AB 0. todos los efectos restantes son estadísticamente significativos. con los otros tres factores permaneciendo constantes en sus valores medios.catalyst=1. mientras que la interacción de dos factores está representada por un producto cruzado entre temperatura y velocidad de flujo. Gráfico de Superficie de Respuesta En este gráfico.4 Graficando el Modelo Ajustado Para entender completamente el modelo ajustado.agitation rate=137.5.5. El tipo de gráfico y los factores con los que se grafica la superficie de respuesta pueden ser cambiados usando Opciones de Ventana: 277/ Diseño de Experimentos . 16. lo mejor es graficarlo. De forma predeterminada.2 10. Cada efecto principal retenido es incluido por si solo en el modelo. una superficie de malla es mostrada : Superficie de Respuesta Estimada concentration=6.8 10.Note que el modelo subyacente toma la forma de un modelo de regresión lineal múltiple. Mejores rendimientos se obtienen en temperaturas y velocidad de flujo altas.6 11. la altura de la superficie representa el valor predicho del rendimiento a travez del espacio de temperatura y velocidad de flujo.4 10 flow rate 155 160 165 170 175 180 temperature Figura 16-21. Diferentes tipos de gráficos pueden crearse al seleccionar Gráficos de Respuesta en el cuadro Gráficas.25 88 86 yield 84 82 80 150 12 11. Contornos Abajo incluye contornos en la cara inferior de la gráfica. Contorno: crea un gráfico de contorno de 2-D con respecto a cualesquiera 2 factores experimentales.Figura 16-22. Superficie: grafica la ecuación ajustada como una superficie 3-D con respecto a cualesquiera 2 factores experimentales. 278/ Diseño de Experimentos . o usando una rampa de color contínuo. La superficie puede ser una malla. Cuadrado: grafica la región experimental para cualesquiera 2 factores experimentales y muestra la respuesta predicha en cada esquina del cuadrado. o niveles de contorno para la respuesta. 3. un color sólido. 2. como regiones coloreadas. Opciones de Ventana para Gráficos de Respuesta Los tipos de gráfico que pueden crearse son: 1. como en un mapa topográfico. Los contornos pueden mostrarse como líneas. y donde los contornos van en una escala del 81 a 86 de uno en uno: 279/ Diseño de Experimentos . El ícono Factores se utiliza para seleccionar los factores que definen los ejes de los gráficos y los valores constantes que conservan los otros factores : Figura 16-23. Para crear este gráfico. se estableció la opción de coloreado para el campo de Contornos. Cúbico: grafica la región experimental para cualesquiera 3 factores experimentales y muestra la respuesta predicha en cada esquina del cubo. primero debe pulsar el botón Factores y seleccionar un tercer factor. Factores de Gráficos de Respuesta Para crear el gráfico de la siguiente página. como Sólido el color de la Superficie con Contornos Abajo.4. 8 10.agitation rate=137.6 flow rate 11.0 83.5.4 10 150 155 160 165 temperature 170 175 180 yield 81.0 85.0 82.8 10.5.0 84.2 10.catalyst=1.0 86.0 82.4 10 flow rate yield 81. Gráfico de Contorno de la Superficie Respuesta Altos valores del rendimiento son detectados en la esquina superior derecha. 280/ Diseño de Experimentos .25 88 86 yield 84 82 80 150 12 11.0 83.agitation rate=137.Superficie de Respuesta Estimada concentration=6.6 11.0 Figura 16-25.0 155 160 165 170 175 180 temperature Figura 16-24.5.2 10.0 84.catalyst=1.25 12 11. Gráfico de Superficie de Respuesta con Contornos Abajo El mismo gráfico puede mostrarse como uno de contorno en lugar de un gráfico de superficie: Contornos de la Superficie de Respuesta Estimada concentration=6.5.0 86.0 85. se pueden seleccionar otras metas usando Opciones de Ventana: 281/ Diseño de Experimentos . Si la maximización no era el objetivo.0 10.5 Optimizando la Respuesta Para determinar los valores de los factores experimentales donde se obtienen los mejores rendimientos. Diseño Optimizado La tabla anterior estima que el máximo rendimiento posible dentro de la región experimental es aproximadamente 88.0 150.0 8.7 gramos.0 Alto 180. elija Optimizar en el cuadro Tablas.0 12.0 150.0 1.5 Óptimo 180.16.0 1. Esto presentará la siguiente salida: Optimizar Respuesta Meta: maximizar yield Valor óptimo = 88.6736 Factor temperature flow rate concentration agitation rate catalyst Bajo 150.0 12. considerando los factores establecidos mostrados en la columna extrema derecha.0 1.0 5.5 Figura 16-26.0 125.0 8. Los campos Bajo y Alto a la derecha de cada factor establecen la región sobre la cual se realizará la optimización. el STATGRAPHICS Centurion puede ayudar de dos formas: 1.6 Experimentación Adicional Si desea hacer más experimentos. el minimizarla. Además también se pueden establecer varios puntos de inicio desde donde comenzar la búsqueda de las condiciones óptimas. Si elige Aumentar Diseño en el menú principal. Opciones de Ventana para la Optimización Ud. o mantenerla en un valor específico. puede elegir el maximizar la respuesta.Figura 16-27. 16. Esto le permitirá un mejor 282/ Diseño de Experimentos . buscar desde diferentes puntos de inicio puede ayudar a encontrar el óptimo global. puede añadir corridas adicionales al experimento actual con nuevos niveles de los factores. Para funciones de respuesta complicadas. 2. la cantidad a incrementar y el número de pasos: Figura 16-28. La Ruta de Máxima Pendiente es el trayecto que comienza en el centro de la región experimental y se mueve en dirección al mayor cambio de la respuesta estimada. El cuadro Opciones de Ventana controla el sitio donde se generan los puntos. así como la predcción del posible rendimiento: 283/ Diseño de Experimentos . elija el factor a escalar. se seleccionó el factor temperatura y se establecieron que los incrementos serán de 5 grados cada uno. STATGRAPHICS Centurion entonces determina los valores de los otros factores que siguen la Ruta de Máxima Pendiente. En el cuadro de diálogo. Puede generar puntos a lo largo de la Ruta de Máxima Pendiente en un intento de acercarnos rápidamente a regiones de mejor rendimiento. Siguiendo este trayecto resulta ser muy efectivo para obtener mejoras dramáticas rápidamente. para los cambios más pequeños de los factores experimentales. Los puntos a lo largo de la Ruta de Máxima Pendiente se generan al seleccionar Ruta de Máxima Pendiente en el menú Tablas.refinamiento al estimado de la superficie de respuesta al agregar parámetros secundarios como la temperatura2 y la (velocidad de flujo)2. Cuadro Ruta de Máxima Pendiente En el cuadro de diálogo anterior. 75068 7.0 215.4247 1.83454 7.40152 1.0 flow rate (liters/min) 11.35439 1.3093 1.38782 1.55283 7.0 195.5 137.0 205.7405 84.935 104.Camino de Máximo Ascenso para yield temperature (degrees C) 165.3439 90. nadie sabe que pasará realmente cuando uno se mueve fuera de la región experimental.0 200.43467 Predicción para yield (grams) 83.5 137.2036 13.7358 100.73825 6.0 190.2974 7.8813 97.95299 7.5817 12.9882 12.5 137. 284/ Diseño de Experimentos .5 6.711 11.2385 11.91067 agitation rate (rpm) 137.5206 concentration (%) 6.0 185.5 137. pero la Ruta de Máxima Pendiente sugiere el mejor trayecto a seguir.0 210.5 catalyst (%) 1.0 180.13861 7.0775 11.3682 94.5 137.65747 7.28119 1.5 137.5739 85.8902 13.57 86. Valores Predichos en la Ruta de Máxima Pendiente Por supuesto.0 11.0 175.481 Figura 16-29.5 137.1917 92.5 137.3336 1.434 7.0 170.28 12.5 137.37227 1.8115 88.41372 1.25 1.5 137.4566 11. Control Estadístico de Proceso: Introduction to Statistical Quality Control. por Douglas C. Hunter y J. por Sanford Weisberg (2005). John Wiley and Sons. Innovation and Discovery. Christopher J. Montgomery y George C. 285/ Lecturas Recomendadas . Stuart Hunter (2005). Runger (2003). John Wiley and Sons. John Wiley and Sons.Lecturas Recomendadas Los siguientes libros son excelentes fuentes de información sobre las técnicas estadísticas descritas en este manual: Estadísticas básicas: Applied Statistics and Probability for Engineers. Análisis de varianza: Applied Linear Statistical Models. por Michael H. McGraw Hill. 3a Edición. John Wiley and Sons. William G. New York. Box. Montgomery (2005). Nachtsheim y John Neter (2004). New York. 5a Edición. por Douglas C. Diseño de Experimentos: Statistics for Experimenters: Design. 3a Edición. 5a Edición. Kutner. 2a Edición por George E. Análisis de Regresión: Applied Linear Regression. New York. New York. P. Sitio web con Archivos de Datos del Journal of Statistical Education (JSE): http://www.sf3 Estos datos también fueron tomados del Archivo de Datos del Journal of Statistical Education (JSE). S. Levine.org/publications/jse/jse_data_archive. A. 268. Volúmen 1. Un artículo asociado con el archivo de datos aparece en el Journal of Statistics Education. S. Volúmen 4. Mackowiak. Número 1 (Julio 1993). vol. pp. and Other Legacies of Carl Reinhold August Wunderlich" por P.amstat.Archivos de Datos 93cars. Wasserman.sf6 Estos datos fueron tomados del Archivo de Datos del Journal of Statistical Education (JSE). the Upper Limit of the Normal Body Temperature. Los datos se derivna de un artículo en el Journal of the American Medical Association (1992.htm 286/Archivos de Datos . Lawrence y son utilizados con su previa autorización. Un artículo asociado con el archivo de datos aparece en el Journal of Statistics Education. Fueron recopilados por Robin Lock del Departamento de Matemáticas de la Universidad de St. y M.6 Degrees F. M. bodytemp. Fueron recopilados por Allen Shoemaker del Departamento de Psicología en Calvin College y son usados con su previa autorización. 1578-1580) titulado "A Critical Appraisal of 98. Número 2 (Julio 1996). 61 Archivos Excel. 190 Analizar Diseño. 238 análisis de varianza. 200 análisis de medias. 144 AVG. 23. 190 ANOVA Gráfico. 46 barra de herramientas de análisis. 40 contrato de la licencia. 64. 144 administrador de la licencia. 259 bondad de ajuste. 251 cuadro de diálogo captura de datos. 253 Cpk. 37 asimetría (sesgo). 198 Análisis de Pareto.Indice ABS. 186 condicionadas variables. 34 nombre. 152 curtosis. 254 campo de selección. 14. 67 287/ Indice bloques. 7 aleatorizar. 71. 240 análisis de capabilidad de proceso. 139 Calculadora Seis Sigma. 65 código de activación. 199 Análisis de Una Variable. 153 Atributos del Diseño de Cribado. 37 Archivos de Datos lecturas en intervalos. 11 combinar columnas. 116 Archivos XML. 270 AND. 51 copiar. 149. 45 actualizar vínculos. 244 buscando pruebas y estadísticas. 145 Configurar Página. 276 columnas de datos comentario. 138 Configurar Impresión. 269 consultas ODBC. 222 análisis de regresión. 34 Comparación de Dos Muestras. 198 ANOVA. 14. 7 coeficientes de regresión. 66 ANOM. 2 COUNT. 67 cuartiles. 266 Análisis de Capabilidad. 58 Cp. 35 solo lectura. 33 tipo. 41 . 14. 61 leyendo. 35 archivos. 20. 41 cortar. 237 análisis de correlación. 191 Archivos ASCII. 17 captura. 46 Actualizar Fórmulas. 267 Aumentar Diseño. 153 datos acceso. 282 Autoguardar. 37. 39 Archivos HTML. 78 confusión. 173 Comparación de Varias Muestras. 65 fórmulas conversión a valores-Z. 144 efectos 3D. 76 excluir efectos. 46 máximo. 56 pegar. 69 gráfico identificando puntos. 94 modificando. 56 hoja de datos. 46 promedio. 46 función exponential. 257 diseños de cribado. 143 directorio de archivos temporal. 184 gráfico cúbicos. 259 diseños factoriales fraccionados. 144 manteniendo cambios en las escala. 41 ordenando. 244 distribución normal. 46 fechas. 46 dígitos significativos establecer predeterminados. 232 transformando. 251 encabezados de los análisis. 84 funetes. 47 diferencias sucesivas. 94 íconos de la barra de herramientas. 94 etiquetas. 48. 41 generando. 132 Excluir. 146 rotando etiquetas de los ejes. 258 diseños factoriales. 197 datos categóricos. 222 DIFF. 259 distribución acumulada. 242 DPM. 247. 46 FTP. 82 modificar apariencia predeterminada. 103 rotando. 157. 275 EXP. 96 blanco y negro. 41 recodificar. 45 datos aberrantes. 47 restraso por k periodos. 93 escala de potencia en los ejes. 46 logaritmo base 10. 46 mínimo. 49 patrones. 11 insertar. 220 desviación estándar. 229 diagrama de sectores. 84 escala de los ejes. 102 gráfico cuantil-cuantil. 145 excluyendo puntos. 46 logaritmo natural. 259 diseños Plackett-Burman. 47 288/ Indice desviación estándar. 93 Gráficas. 164 distribución del mayor valor extremo. 58 gráficas agregando texto. 144 mantenar razón de apariencia. 52 estudios R&R. 76 fondo. 278 .eliminar. 145 diseñado de experimentos. 117 Generación de Datos. 41 nuevas variables. 153 diagrama de barras. 46 raíz cuadrada. 94 titulo de los ejes. 153. 144 FIRST. 46 valor absoluto. 222. 144 escala logaritmica. 50. 145 Estadísticas por Filas. 75 mantenar espacio en las marcas de los ejes. 182 gráfico de efectos principales. 23. 273 gráfico de matriz. 202 matriz de correlación. 43 modo de evaluación. 170 límites de tolerencia. 31 Límites de Tolerancia Estadística. 73 Opciones Gráficas. 46 LAST. 230 gráfico de superficie respuesta. 152 mediana. 171 gráficos copiando a otras apliaciones. 194 prueba Kolmogorov-Smirnov. 79 indices de capabilidad. 161. 1 intervalos bootstrap. 144 menús del sistema. 166 mediana. 272 gráfico de interacciones. 165. 167 intervalos de confianza desviación estándar. 192 gráfico de mosaico. 194 prueba Mann-Whitney (Wilcoxon). 177. 80 encabezado. 26. 271 gráfico de probabilidad normal. 249 gráfico de rascacielos. 181 prueba para muestras apareadas. 210 Gráficos de Superficie y de Contorno. 197 histograma. 251 gráfico de contorno.gráfico cudrados. 167 intervalos HSD. 201 gráfico de medias. 203 MAX. 193 289/ Indice K. 239 imprimiendo análisis. 278 gráfico de caja y bigotes. 79 márgenes. 46 máximo. 251 iniciando el programa. 229 gráfico de Pareto estandarizado. 79 fondo. 27 . 153 media. 108 gráficos de residuos. 183. 244 prueba Kruskal-Wallis. 216 Guardar Resultados. 46 mínimo. 193 intervalos LSD. 107 guardando en Archivos de Imágen. 278 gráfico de cuantiles. 106. 6 instalación. 59 Opciones de Análisis. 9. 241. 72 Opciones de Ventana. 46 LOG10. 153 menú Seis Sigma. 153 modelo de regresión lineal. 9 métodos no-paramétricos prueba Friedman. 176. 143 número de serie. 65 lectura de datos actualización a intervalos constantes. 166 media. 207 Modificar Columna. 170 MIN. 170 LOG. 207 modelo de regresión no lineal. 3 numeros aleatorios. 3 muesca de la mediana. 115 Libro de Datos. 26. 70 heteroscedasticidad. 253 LAG. 253 niveles de confianza estableciendo predeterminado. 156 Nivel de Calidad Sigma. 196. 278 gráfico de tolerancia. 11. 46 LOWESS. 195 gráfico de capabilidad. 155. 77 ancho de lineas. 159 prueba de Levene. 146 puntos. 179 prueba Kolmogorov-Smirnov. 208 Recodificar Datos. 196 prueba de rangos múltiples. 180 comparando proporciones. 144 paneles. 63. 179 comparando distribuciones. 154 promedio. 142 AED. 236 prueba de Friedman. 231. 113. 260 Preferencias. 170 prueba Shapiro-Wilks. 183. 180 pruebas de hipótesis aberrantes. 203 comparando desviaciones estándar. 196 comparando varias medianas. 151. 152 Propiedades del Libro de Datos. 49 ordenar nombres de variables. 66 parsimonia. 168 mediana. 46 suma. 159 coeficiente de correlación. 181 comparando medias. 193 prueba desviación estudentizada extrema. 66 Ordenar Datos. 50 referencias. 281 OR. 266 puntos externos. 243 prueba t. 91 operadores algebraicos división. etiquetas y leyendas. 83 ejes. 46 resta. 99 RESHAPE. 252 estadísticos.diseño. 59 residuos. 159 prueba F. 87 mallas. 46 multiplicación. 162 Regresión Múltiple. 46 exponencial. 196 residuos estudentizados. 89 rellenos. 168 normalidad. 183 comparando medianas. 206. 199 percentiles. 211 regresión por pasos. 190 media. 285 regla de Sturges. 175. 194 290/ Indice prueba Mann-Whitney (Wilcoxon). 194 comparando varias medias. 58 resaltando un gráfico de dispersión. 259 Resumen Estadístico. 204 REP. 156 RANDOM. 210 resolución. 46 optimizar. 181 prueba para muestras apareadas. 214 Regresión Simple. 93 lineas. 206 tabla de dos vías. 61 prueba chi-cuadrada. 236 comparando varias desviaciones estándar. 239 RNORMAL. 161 capabilidad. 194 prueba de Grubbs. 95 texto. 96 titulo principal. 60 . 22. 231 puntos centrales. 65 R-cuadrada. 153. 166 potencia. 85 perfil. 244 prueba Kruskal-Wallis. 243 regresión. 21 291/ Indice . 126 copiando salidas a. 116 rutinas iniciales. 134 separando un gráfico de dispersión.exe. 47 STANDARDIZE. 271 tabla de contingencia. 102 suavización LOWESS. 225 Tabulación de Frecuencias. 47 StatAdvisor predeterminados. 191 StatLink. 98. 66 Seis Sigma. 127 guardando. 227 Tabulación. 128 StatWizard. 115 StatPublish. 128 modificando. 1 SQRT. 145 StatFolios guardando. 145 StatGallery. 119 copiando gráficas a. 65 ruta de máxima pendiente. 235 tablas de dos vías. 189 setup. 30. 283 SD. 225 Tablas.ROWS. 248 transformaciónes. 12. 61. 121 imprimiendo. 115. 129 suavización de gráfico de dispersión. 158 valores-P. 237 seleccionando análisis. 123 sobreponiendo gráficas. 164 transformación Box-Cox. 112. 68 tablas de contingencia. 9. 122 Statistics for Experimenters. 249 configurando. 221 Tabulación Cruzada. 116 StatReporter. 102 tabla ANOVA. 47 secuencia Booleana. 159 valores-Z. 125 modificando gráficas. 110 publicando. 254 ventana de análisis. 138 valores estudentizados.
Copyright © 2024 DOKUMEN.SITE Inc.