Pronostico en Los Negocios - Hanke Reitsch

\N E. HANKE ARTHUR C. REITSCH Pronósticos en negocios los negocios Pronósticos en Pronósficos los negocios negocios Quinta edición Quintci JOHN E. HANKE JOHN. E. HANKE ARTHUR G. ARTHUR G. REITSH Eastem University Eastern Washington University Traducción: Tradiicción. SERGIO KOURCHENKO BARRENA Traductor Revisor técnico: JUAN ANTONIO TORRE MARINA ANTONIO Ingeniero Mecánico Electricista Universidad Anáhuac -----PEARSON Educación ® Costa Mexico •Argentina • Brasil • Colombia • Costa Rica • Chile • Ecuador México Argentina España Guatemala Panamá Perú Puerto Rico Uruguay •Venezuela España • Guatemala• Panama•Peru • Puerto Rico •Uruguay Venezuela Edición en inglés: en inglés: Editorial Production Supervision: Maryland Composition Editorial I Production Supervision: Maryland Composition Acquisition Editor: Richard Wohi Richard Wohl Cover Designer: Wendy Ailing Judy Designer: Alling Production Coordinator: Marie McNamara Marie McNamara PRON()Sl1COS EN LOS NEGOCIOS 51E HANKE: PRONOSTICOS EN LOS NEGOC'JOS 5/E del inglés de la obra: Business Forecasting Traducido dci inglés (Ic là ohia: l3usiiiess Forecasting AIl Rights Reserved. Authorized translation from English langu:tie All Rights Reserved. Authorized translation from English languaje edition publishcd Prentice Hall lnc. published by Prentice Hail inc. los Derechos rescrvados. Traducción autorizada de la edición en Todos los l)ereclios reservados. TraducciOn autoriz1Hla de Ia edición en inglés publicada por Hall lnc. puhi icada por Prentice Hall Inc. All rights reserved. No part of this hook may be reproduced or transmitted in AIl reserved. boo\.; be reproduced or transmitted fonn or by any means, electronic or mechanical, including photocopyng any form or by any means, electronic or mechanical, including photocopyng recording or by any information storage retrieval system, without permission in by any information storage retrieval system, without pennission in from the publisher. writing from the puhl isher. Prohibida la reproducción total parcial de esta obra, Prohibida Ia reproduccion total o parcial (IC esta obra, por cualquier medio ó medio ó metodo sin autorización pot escrito del editor. método sin aiilorizacion por escrito dcl editor. Derechos reservados <0 1996 respecto a Ia primera ediciôn en español publicada Dcrcchos reservados © 1996 la primera edición en español publicada Atlacomulco Niim. 500-5° Piso Núm. Col. Industrial Atoto 53519, Naucalpan de Juárez, Edo. de México Naucalpan de Juárez, Edo. Mexico ISBN 96N-NNO-6Nl-l ISBN 968-8O-6Ki-1 Original English Languaje Edition Published by Prentice Hall Inc. Original Fnglish Languaje Editioll Published by Prentice Hall Inc. Copyright K" MCMXCV Copyright © MCMXCV All Rights Rcscrvcd AII Rights Reserved ISBN 0-205-16005-0 ISBN Impreso en Mexico I Printed in Mexico México Printed in Mexico Inipreso Dedicado a: Dedicado Harry, Geny, [rene fJaniy, Gerry, Jack e Irene (quienes no /1 ecesitan leerlo); no necesitan Ieer1o,; Judy y Judy Jl((I)) 3) J1I(/y (quien /0 leeró y ('quien lo leerá y probablemente deseará leerlo, respectivamente); no (leseara leerlo, respectiva in en Jill, Anzy, Julie, Katrina y Kevin Amy, Julie, y Kevin (qi lienes podrían leerlo,,); podrIan leerlo); (quienes a todos los estudiantes y a todos los estudiantes (que i;iás vale que lo lean,). que lo lean). (que más Contenido Prefacio xv 1 1 INTRODUCCION A LOS PRONOSTICOS A LOS PRONÓSTICOS 1 1 Actividad I los pronósticos 1 Historia de los pronósticos de pronosticar 2 La necesidad de pronosticar pronóstico 4 Tipos de pronóstico macroeconómico 4 Pronóstico rnacroeconómico Selección del método de pronóstico 5 Selección del 5 6 seguir en el pronóstico Pasos a seguir en el pronóstico de pronóstico 7 Administración del proceso de pronóstico 7 cómputo pronóstico 8 Paquetes de córnputo para pronóstico 11 Resumen 11 Resuinen estudio 1.1: Mr. Tux 11 Caso de estudio 1.1: Mr. Tux estudio 1.2: Consumer Credit Counseling Caso de estudio 1.2: Consumer Credit Counseling Versión Forecast Plus 13 Version estudiantil de Forecast Plus de cálculo 14 Pronóstico mediante hojas de cálculo paquete de cómputo Introducción al paquete de córnputo MINITAB paquete de cómputo SAS 18 Introducción al paquete de cómputo SAS 18 Bibliografía 20 Bibliografia 1 1 12 16 REVISiÓN DE CONCEPTOS ESTADíSTICOS BÁSICOS 2 REVISION DE CONCEPTOS ESTADISTICOS BASICOS 22 Actividad Estadística descliptiva 22 Estadistica descriptiva 26 probabilidad Distribuciones de probabilidad muestrales 30 Distribuciones niuestrales 31 31 Estimación hipótesis 33 Prueba de hipótesis la bondad de ajuste Prueba de Ia bondad de ajuste 37 de cOlTelación 39 Análisis de colTelación 22 viii Contenido Diagramas de dispersion dispersión 39 Coeficiente de correlación 43 47 Aplicación en Ia adrninistraciOn la administración AplicaciOn 48 Glosario Fónnulas clave Fórimilas dave 49 Problemas 50 Caso de estudio 2.1: Alcam Electronics 2.1: Alcam Electronics Caso de estudio 2.2: Mr. Thx Tux 57 Paquete de cOmputo MINITAB cómputo 58 Bibliografia 60 Bibliograt1a 55 3 FUENTES DE DATOS FUENTES DE DATOS 61 Introducción IntroducciOn 61 62 Tipos de datos datos Tipos Fuentes de datos datos 63 Fuentes secundarias de datos secund31ias 64 Fuentes extemas externas 64 Datos propios 66 Fuentes primarias de datos 67 Aplicación en Ia administraciOn en la administración 73 Glosario 75 Problemas 75 Caso de estudio 3.1: Argyl Food Products Food Products 76 3.2: Jewehy Caso de estudio 3.2: Solomon's Jeweliy 79 Tux 80 Caso de estudio 3.3: Mr. Tt,x de estudio 3.4: Caso (IC estudio 3.4: Consumer Credit Counseling 80 de Estudio t~lctibilidad mercado Caso dc estudio 3.5: Estudio de factibilidad de mercado Versión estudiantil Forecast Plus Version estijdiantil de Forecast Plus 89 Pronóstico mcdiante hojas de calculo PronOstico iiiediaiitc hojas cálculo 94 Paqucte de cOmputo MINITAB 95 Paquctc de cómputo MIN 11'AB Bibliografía Bibliografia 96 82 EXPLORACiÓN DE LOS PATRONES DE DATOS SELECCiÓN 4 EXPLORACION DE LOS PATRONES DE DATOS YYSELECCIÔN DE LA TECNICA DE PRONÔSTICO TÉCN ICA PRONÓSTICO 97 DE Actividad 97 Componentes de series 98 Componcn-tcs (IC series de tiempo dc patrones de datQs mcdiante análisis de autocOlTelación 100 Exploración de patrones de datos mediante análisis de autocorrelación 100 Selección de una técnica de pronóslico pronóstico 114 Selección de 1 14 pronóstico para datos estacionarios Técnicas de pronostico para datos estacionarios 11 5 115 Técnicas de pronóstico para datos con una tendencia pronóstico una tendencia 116 Técnicas de pronóstico Técnicas de pronostico para datos con estacionalidad con estacionalidad 116 Contenido ix Técnicas de pronóstico para series ciclicas cíclicas 117 Técnicas Otros factores por considerar al elegir una considerar al Otros factores técnica de pronóstico 117 técnica Medición del error en el pronóstico el pronóstico Medición 119 Determinación de lo adecuado de una técnica de pronóstico técnica de pronóstico Determinación de Aplicación en Ia administración en la administración 124 Glosario 125 Fónnulas dave Formulas clave 125 126 Problemas estudio 4.1: Murphy Brothers Furniture 131 Caso de estudio 4.1: Murphy Brothers Furniture Tux 134 Caso de estudio 4.2: Mr. Tux 136 estudio 4.3: Conswller Credit Counseling Caso de estudio 4.3: Consumer Credit Counseling Versión estudiantil de Forecast Plus Forecast 136 Version Pronóstico mediante hojas de cálculo cálculo 139 PronOstico mediante hojas El problema 139 La soluciOn mediante hoja de cálculo solución mediante hoja 139 Paquete de cómputo MINITAB cómputo MINITAS 141 Paquetes de cOmputo SAS cómputo 143 Paqiietes 122 5 PROMEDIOS MÔVILES Y METODOS DE ATENUACIÔN PROMEDIOS MÓVILES Y MÉTODOS DE ATENUACiÓN Actividad 146 151 formales Modelos no formales 151 promedio Modelos de promedio simples 151 Promedios simples 152 Promedios móviles 154 Promedios móvil doble de atenuación exponencial 158 Métodos de atenuación exponencial 158 161 Rastreo doble Atenuación exponencial doble 163 Atenuación exponcncial ajustada a la tendencia: Método de Atenuación exponencial ajustada a la tendencia: Método de Holt Atenuación exponencial ajustada a Ia tendencia y a Ia variacion estacional: exponencial ajustada la la valiacion estacional: Modelo de Winter 172 Modelo Aplicacion en Ia administración la administración 176 Glos3lio 177 Glosario 1 78 Fórmulas clave 178 Fórnmlas dave Problemas 179 Caso Caso de estudio 5.1: The Solar Alternative Company Solar Company 184 Caso de estudio 5.2: Mr. Tux Caso 185 Caso de estudio 5.3: Consumer Credit Counseling 5.3: Consumer Credit Counseling 186 Caso Caso de estudio 5.4: Proyección de ingreso quinquenal para Proyección quinquenal Downtown Radiology 187 Versión Forecast Plus 196 Version estudiantil de Forecast Plus 1 96 Pronóstico mediante hojas de cólculo de cálculo 199 Pronóstico 1 99 Bibliogratla 202 Bibliografia 146 168 x Contenido 6 ANALISIS DE REGRESIÔN ANÁLISIS DE REGRESiÓN 203 Línea 205 LInea de regresión Error estándar de Ia estirnación de la estimación 208 Y 209 Predicción de Y 213 determinación Coeficiente de determinación 217 Residuos 220 hipótesis Prueba de hipótesis 223 Salida de cómputo Transfonnación 226 Transforrnación de variables en la administración 230 Aplicación en Ia adrninistración 232 Glosario Fónnulas clave 232 Formulas dave 233 Problemas Caso de estudio 6.1: Tiger Transports 239 Caso estuJio 6.1: Caso de estudio 6.2: Butcher Products, Inc. 6.2: Butcher Products, Inc. 241 Caso estudio 6.3: Departamento Caso de estudio 6.3: Departarnento de Personal de Ace estudio 6.4: Mr Tux 244 Caso de estudio 6.4: Mr Tux Caso de estudio 6.5: Consumer Credit Counseling 245 6.5: Caso Versión de Forecast Plus 246 Version estudiantil de Forecast Plus 249 Pronóstico mediante hojas PronOstico mediante hojas de cálculo de cómputo MINITAB 250 Paquete de cOmputo MINITAB 252 Paquete Paquete de cômputo SAS cómputo Bibliografía 254 BibliografIa 243 7 REGRESiÓN MÚLTIPLE REGRESION MULTIPLE 255 255 Actividades Variables de predicciOn de predicción 255 Matriz de correlaciOn correlación 256 Ecuación de regresión múltiple 257 EcuaciOn de regresiOn miItiple 260 Coeficientes de regresión Coeficientes Inferencia estadIstica en Ia regresiOn multiple estadística la regresión múltiple 261 Residuos En"or estándar de Ia estimaciOn de la estimación Error 263 Salida de cómputo 264 Salida Variables ficticias 266 Validación del modelo 271 ValidaciOn del Heteroscedasticidad 271 Colinealidad 272 SelecciOn de Ia Selección de la mejor ecuación de regresiOn de regresión Todas las regresiones posibles regresiones 277 Regresión por pasos 279 RegresiOn Notas finales sobre Ia regresión por pasos la regresión Notas finales 261 274 283 Contenido xi 284 Uso de Ia regresión para pronosticar datos estacionales la regresión para pronosticar datos estacionales Pronósticos econornétricos econométricos 287 289 Sobreajuste Aplicación en la adrninistración la administración 289 Glosario 291 Formulas dave Fórmulas clave 291 292 Problemas Problernas Caso de estudio 7.1: El Mercado de Valores Mercado de Valores 299 Caso de estudio 7.2: Ventas de restaurante restaurante 302 Caso de estudio 7.3: Mr. Tax estudio 7.3: Mr. Tux 305 Caso de estudio 7.4: Consunier Credit Counseling Consumer 307 308 Version estudiantil de Forecast Plus Versión estudiantil de Forecast Plus Pronóstico mediante hojas de cálculo cálculo 312 Paquete de cómputo MINITAB cómputo MINITAB 314 de cómputo 315 Paquete de cOmputo SAS 3 15 BibliografIa Bibliograt1a 317 3 17 289 ANÁLISIS DE SERIES DE TIEMPO 8 ANALISIS DE SERIES DE TIEMPO 318 318 Actividades 319 Descomposición 319 Índice precios 320 Indice de precios Tendencia 322 Tendencia no lineal lineal 327 cíclica 330 Variación cIclica 338 estacional Variación estacional estacional 342 Tendencia estacional fonna estacional Datos ajustados en forma estacional 346 347 COlio plazo cíclica e irregular Variaciones de corto plazo cIclica e irregular 349 estacional Pronóstico estacional método de descomposición Census II 350 El método de descomposición Census II en la administración 351 Aplicación en Ia administración 353 Glosario Fórmulas dave 353 Formulas clave Problemas 353 Prohleiiias 358 estudio 8.1: The Small Engine Doctor Caso de estudio 8.1: The Small Engine Doctor 360 estudio 8.2: Mr. Tux Caso de estudio 8.2: Mr. Tux 365 estudio 8.3: Consumer Credit Counseling Caso de estudio 8.3: Consumer Credit Counseling Versión estudiantil de Forecast Plus 366 Version estudiantil Pronóstico mediante hojas cálculo 367 PronOstico mediante hojas de cãlculo 371 Paquete de cómputo MINITAB MINIT AB Bibliografía Bibliogratia 373 xii Contenido 9 REGRESION DE DATOS DE SERIES DE TIEMPO REGRESION DE DATOS DE SERIES DE 374 Actividad 374 la regresión El problema de heterosedasticidad durante Ia regresión El selies de tiempo 374 de series de tiempo El problerna de correlación serial durante Ia regresión cOIl"elación serial la El problema de datos de series de tiempo series de tiempo 377 Prueba Prueba de Durbin-Watson para correlación serial Durbin- Watson correlación 380 Soluciones problemas Soluciones a probiemas de correlación serial correlación serial 383 EITor especificación el modelo (omisión de Error de especiflcación en ci modelo (ornision de una variable) 384 Regresión Regresión de cambios porcentuales 387 392 autorregresivos Modelos autorregresivos Mínimos 393 MInimos cuadrados generalizados diferenciación 396 Primera di fcrenciación El enfoque iterativo El 398 Aplicación en Ia administración 400 Aplicación la administración Giosario Glosario 401 Fóriimlas clave Fórmulas dave 401 Problcmas Problemas 402 Caso de estudio 9.1: La conipafIa de su elección compaiiía de su elección 408 Caso Caso de estudio 9.2: Indice de actividad empresarial del condado de Spokane Índice empresarial del Caso de estudio 9.3: Mr. Tux Caso 9.3: 415 Caso de esludio 9.4: Consumer Credit Counseling estudio 9.4: Consumer Credit Counseling 416 Caso Version estudiantil Versión estudiantil de Forecast Plus 417 Pronóstico mediante hoja de cálculo céllculo 421 Pronóstico mediante hoja Paquete de cómputo MINITAB MIN ITAB 424 Paquete de cómputo SAS 426 Paquete 428 de TSP Ejemplo de TS1 [3ihliografIa 430 Bibliograf1a 409 10 LA METODOLOGIA BOX-JENKINS (ARIMA) LA METODOLOGíA BOX-JENKIN5 (ARIMA) 431 Actividad 431 Técnica de I3ox-Jenkins de Box-Jenkins 43 431I 436 parciales Autocorrelaciones parciales 436 Modelo autorregresivo Modelos de promedio mOvil de promedio móvil 439 Modelos autorregresivos de promedio móvil 438 móvil Modelos autorregresivos AplicaciOn de la metodología Aplicación de Ia metodologia 439 1: Identificación del modelo Etapa 1: IdentifIcación del modeio 439 Etapa 2: Estimación dcl modelo adecuación Etapa 2: Estimación del modelo y prueba de su adecuación Etapa 3: Pronóstico con ci modelo el modelo Etapa 3: 441 465 Un análisis estacional Un anéllisis estacional 440 Contenido Aplicación en Ia administración la administración Aplicación 478 480 Glosario Fórmulas clave 480 Formulas dave Problemas 480 Caso de estudio 10.1: Ventas de restaurante 10.1: Ventas de restaurante 487 488 Caso de estudio 10.2: Mr. Tux 10.2: Caso de estudio 10.3: Consumer Credit Counseling 10.3: Consumer Credit Counseling 490 Caso de estudio 10.4: Lydia E. Pinkharn Medicine Company 10.4: Lydia E. Pinkham Medicine Company 491 Caso de estudio 10.5: Demanda diaria de permisos para pesca de Caso 10.5: Demanda diana permisos pesca de trucha 495 Versión estudiantil de Forecast Plus 507 Version estudiantil 511 cómputo MINITAB Paquete de cómputo MINITAB de cómputo SAS 514 Paquete de cOmputo SAS Bibliogratia 519 Bibliografla xiii 11 Ii ELEMENTOS DE JUICIO EN LOS PRONOSTICOS ELEMENTOS DE JUICUO EN LOS PRONÓSTICOS 520 Actividad Pronóstico juicio 520 PronOstico de juicio de crecimiento Curvas de crecimiento 522 método Delphi 523 El método Delphi Formulación de escenarios FormulaciOn de 523 Combinación pronósticos 524 Comhinación de pronósticos Los pronOsticos y las redes neurales Los pronósticos y las redes 525 527 de la pronóstico de juicio Resumen de Ia pronOstico de juicio elementos de juicio en los pronósticos 528 Otros elementos de juicio en los pronOsticos Administración dcl proceso 533 AdrninistraciOn del proceso de pronóstico de pronóstico 533 El proceso de pronóstico de los pronósticos Monitoreo de los pronOslicos 536 Revisión los pasos de pronóstico Revision de los pasos dc pronOstico 539 en los pronósticos 540 La responsabilidad en los pronósticos de los pronósticos 541 Costo de los pronOsticos los pronósticos 542 Administración en los pronósticos pronósticos y ci información administraiva Los pronOsticos y el sistema de información administraiva 542 El los pronósticos 543 El futuro de los pronosticos 544 Glosario 544 FOrmula clave Fórmula dave 544 estudio 11.1: Electronics Caso de estudio 11 .1: Boundary Electronics Caso de estudio 11.2: Golden Gardens Restaurant 11.2: Golden Gardens Restaurant 545 Caso de cstudio 11.3: Busby Associates estudio 11.3: Busby Associates 545 Caso de estudio 11.4: Mr. Tux 11.4: 550 Caso de estudio 11.5: Consumer Credit Counseling 11.5: Consumer Credit Counseling 552 Caso de estudio 11 .6: Nueva visita a Lydia E. Pinkham Medicine 11.6: Nueva visita a Lydia E. Company 552 Bibliograf1a Bibliografia 555 520 xiv Contenido APÉNDICES APENDICES 557 A B C C D E E 559 DERIVACIONES GRÁFICAS DE PROPORCIÔN O SEMILOGARíTMICAS GRAFICAS DE PROPORCiÓN 0 SEMILOGAR1TMICAS TABLAS 567 PARA EL CASO DE ESTUDIO 7.1 580 DATOS PARA EL CASO DE ESTUDIO 7.1 CONJUNTOS DE DATOS Y BASE DE DATOS DE DATOS Y BASE DE DATOS 583 598 562 íNDICE INDUCE Prefacio continúa siendo el mismo que El objetivo de la quinta edición de Pronóstico Empresarial, continua siendo el mismo que en las ediciones anteriores: presentar las técnicas estadIsticas básicas para que las empresas, estadísticas las empresas, de manera individual, elaboren pronósticos y planes a largo plazo. El libro se escribió en individual, elaboren pronósticos y planes a largo plazo. libro se escribió en un estilo directo y utiliza en forma arnplia ejempios prácticos de algunas empresas. Con el utiliza fonna amplia ejemplos Con el fin proporcionar estudiante el enlace necesario entre conceptos teóricos las fin de proporcionar al estudiante ci enlace necesario entre los conceptos teóricos y las aplicaciones en la vida real, al final de cada uno de los capItulos, se incluyen casos de los capítulos, incluyen casos de aplicaciones en Ia vida real, al final de cada uno estudio, los cuales forman lill total de cuarenta y tres. Se hace énfasis en la aplicación cuarenta tres. Se hace énfasis en la aplicación estudio, los cuales forman un total gerencial de las técnicas, para Ia torna de decisiones. Se supone que los estudiantes poseen la toma de decisiones. Se supone que gerencial infonnación adquirida en cursos introductorios tanto de estadIstica como de computación. introductorios tanto estadística inforrnación adquirida en ORGANIZACIÓN ORGANIZACIÔN Todos los capItulos se revisaron para mejorar la claridad del texto e incrernentar la Todos los capítulos se revisaron para mejorar Ia claridad del texto incrementar efectividad de Ia ensefianza-aprendizaje. El contenido está organizado en seis secciones. efectividad la enseñanza-aprendizaje. El contenido está organizado en seis secciones. La primera sección (capItulos 1 y 2) presenta material que se necesita para estudiar sección (capítulos 1 y material necesita estudiar pronósticos. La naturaleza de los pronósticos y un breve repaso de los conceptos estadísticos de los estadisticos establecen la etapa para la cobertura de las técnicas, que comienzan en básicos establecen Ia etapa para Ia cobertura de las técnicas, que comienzan en la segunda sección. En la segunda sección (capItulos 3 y 4) se enfatizan los métodos de recopilación de sección (capítulos 3 y la exploración patrones selección una técnica de pronóstico. datos, Ia exploración de patrones de datos y la selección de una técnica de pronóstico. (capítulo atenuación. La tercera sección (capitulo 5) cubre las técnicas de promedio y atenuación. la cuarta sección (capítulos 7) se abarcan las técnicas de pronóstico causal, En la cuarta sección (capitulos 6 y 7) se abarcan las técnicas de pronóstico causal, la correlación, análisis de regresión múltiple. tales como la correlaciOn, regresión y análisis de regresión multiple. (capítulos 10) comprende al La quinta sección (capitulos 8 a 10) comprende las técnicas que involucran a! análisis de tiempo. de series de tiempo. capítulo final del libro (capítulo 11) estudian pronóstico de El capItulo final del libro (capItulo 11) se estudian las técnicas de pronóstico y de con lilla exposición de la administración y monitoreo del proceso de pronóstico. juicio, junto con ma exposición de Ia adrninistración y monitoreo del proceso de pronóstico. CAMBIOS EN LA QUINTA EDICION CAMBIOS EN LA QUINTA EDICIÓN la se incorporaron los siguientes aspectos: En Ia presente edición, se incorporaron los siguientes aspectos: Como Corno parte del paquete del libro de texto, se puede adquirir un paquete de pronóstico del del texto, para microcomputadora denominado Forecast Plus, de Walonick Associates. Al final microcomputadora denominado Forecast Plus, de Walonick Associates. Al final xvi Prefacio de cómo utilizar este paquete para de cada capItulo se incluye una demostración de córno utilizar este paquete para capítulo incluye una demostración problemas de pronóstico. resolver problernas de pronóstico. Al final de cada capItulo, se incluye también un ejemplo de córno usar el paquete cada capítulo, incluye también un ejemplo de cómo usar paquete Al final MINITAB en situaciones de pronóstico. MIITITAB en la utilización del final de los capítulos 1, 4, 6, 7, 9 y 10 se Al final de los capItulos 1, 4, 6, 7, 9 y lOse presentan ejemplos de Ia utilización del SAS para resolver problemas de pronóstico. paquete SAS para resolver problemas de pronóstico. También, se muestran ejemplos del uso de Lotus 1-2-3 para la solución de problemas de problemas Tarnbién, 1-2-3 de pronóstico, al final de cada capItulo. final de cada capítulo. Mediante una solicitud, se encuentra disponible, un nuevo disco de datos, el cual Mediante una solicitud, se encuentra disponible, un nuevo disco de datos, el cual su utilización en prácticas estudiantiles. contiene numerosos conjuntos de datos para su utilización en prácticas estudiantiles. numerosos y casos nuevos de estudio. Se incorporaron además diversos ejercicios y casos nuevos de estudio. se Se agregaron dos casos globales se desarrollan en los capítulos 1 Se agregaron dos casos globales que se desarrollan en los capItulos 1 al 3 y se 3 resuelven al final de cada uno de los capItulos sucesivos. En el capItulo 11 se incluyó de los capítulos sucesivos. el capítulo 11 se incluyó redes neuronales. una breve exposición de las redes neuronales. EL PAPEL DE LA COMPUTADORA EL PAPEL DE LA COMPUTADORA primeras la En las prirneras cuatro ediciones, se reconoció que Ia computadora constituye una poderosa herrarnienta en los pronósticos. Hoy en dia, herramienta en los pronósticos. Hoy en dia, con gerentes modernos que aprovechan la gerentes modernos aprovechan disponibilidad efectuare través de microcomputafacilidad y disponibilidad para efectuare pronósticos complejos a través de microcomputaescritorio, la computadora es aím más importante. doras de escritorio, la computadora es a(m más importante. Como resultado de las muchas horas de insomnio que pasaron tratando de decidir qué Corno resultado de las muchas horas de insornnio que pasaron tratando de decidir qué hacer con respecto a la computadora, los autores condujeron un estudio a nivel nacional (en EVA) todas las instituciones miembros AACSB, determinar qué que EUA) de todas las instituciones miembros de la AACSB, para determinar qué era lo que hacían cuerpos docentes respecto al de las computadoras la enseñanza los haclan los cuerpos docentes respecto al uso de las computadoras en la enseflanza de los lo siguiente: resultados pronósticos. Los resultados mostraron lo siguiente: l. La mayoría de los cuerpos docentes asignados a pronóstico (94.2%) intenta proporcionar mayorIa de los cuerpos docentes asignados a pronóstico (94.2%) experiencia al estudiante en el uso de la computadora. 2. En la encuesta se mencionan diversos paquetes estadísticos para macrocomputadoras y mencionan diversos paquetes estadisticos para macrocomputadoras y específicos paquetes especIficos de pronóstico para computadoras personales. Los paquetes mencionados con mayor frecuencia fueron: MINITAB, SAS, micro TSP y LOTUS 1-2-3. fi'ecuencia y LOTVS 1-2-3. Los autores decidieron emplear los siguientes enfoques para ayudar a cuerpos Los autores decidieron emplear los siguientes enfoques para ayudar cuerpos docentes y estudiantes a utilizar la computadora con fines de pronóstico: fines docentes estudiantes l. Es posible adquirir, jlmto con el libro de texto, el paquete de pronóstico para microcommicrocomjunto putadora Forecast Plus, de Walonick Associates. 2. Al final de cada capItulo y a lo largo de los capítulos relevantes del libro, se presentan capítulo capItulos relevantes del libro, se presentan instrucciones para utilizar el paquete MINITAB. 3. Al final de cada capitulo, se incluyen instrucciones de Lotus 1-2-3. capítulo, de 1-2-3. Prefacio xvii 4. Casi al final del capItulo 1, se incluyó una breve lista general de los paquetes de Casi al final del capítulo 1, incluyó una breve lista general de los paquetes de pronóstico. 5. A to largo del texto se insertaron diferentes ejemplos de salidas de computadora. lo AGRADECIMIENTOS AGRADECIM IENTOS alrededor Los autores están en deuda con los diversos instructores airededor del mundo que utilizaron cuatro primeras ediciones y proporcionaron sugerencias invaluables mejorar el las cuatro prirneras ediciones y proporcionaron sugerencias invaluables para mejorar el libro. Agradecemos en especialmente at Profr. Frank Frost (Marquette Univesity); a! Profr. en especialmente al Profr. Frank Frost (Marquette Univesity); al Profr. William Darrow (Towson State University); al Profr. William C. Struning (Seton Hall William Darrow (Towson State University); al Profr. William C. Struning (Seton Hall (N0I1hwestern University); a Susan Winters (Northwestern State University); al Profi-. Mark Craze (Eastem a! Profr. Mark Craze (Eastern Washington University); a! Profr. Shik Chun Young (Eastern Washington University); a Washington University); al Profi". Shik Chun Young (Eastern Washington University); a a Dorothy Mercer por su aportación de casos de estudio y a Jennifer Dahl Judy Johnson y a Dorothy Mercer por su aportación dc casos de estudio y a Jennifer Dahl el índice. por elaborar el Indice. autores aprecian sinceramente el tiempo dedicado 1. Scott Annstrong, Los autores aprecian sinceramente el tiempo dedicado por J. Scott Armstrong, Judy Essam Johnson y Essani Muhoud, quienes aportaron valiosos materiales. También, partes del texto, particular varios conjuntos de datos, son adaptaciones los que aparecieron en la en particular varios conjuntos de datos, son adaptaciones de los que aparecieron en La segunda edición de nuestro libro Understanding Business Statistics, publicado por Richard segunda edición de Statistics, publicado Itwin, Inc., a quien damos aquí credito por su reutilización. D. Irwin, Inc., a quien damos aquI credito por su reutilización. Agradecemos además los revisores Jeffery (University South Alabama); Agradecemos ademãs a los revisores Arthur B. Jeffery (University South Alabama); Bany Laiss (California State UniversityFresno); Leo P. Mahoney (Bryant College); Bariy P. Laiss (California State University-Fresno);Leo P. Mahoney (Bryant College); Nelson (Brigham Young Univesity); William C. Struning (Seton Hall University); Ray Nelson (Brigham Young Univesity); William C. Struning (Seton Hall University); & University) College Marietta Tretter (Texas A & M University) y a Theodore Tsukahara (Saint Mary's College ofCalifomia), sus constructivos comentarios en la revisión del libro. Si hubiésemos of California), por sus muy constructivos comentarios en Ia revision del libro. Si hubiésemos el tenido et talento suficiente para concretar todo lo que sugirieron nuestros revisores, el libro todo nuestros revisores, el 100%. Tal como está, realizamos mejor habría mejorado se habrIa mejorado en un 100%. Tat como está, realizamos nuestro mcjor esfuerzo. Por ültimo, agradecemos a nuestras computadoras y nos preguntamos cómo fue que último, nuestras computadoras nos preguntamos cómo fue que escribimos un libro de texto sin una. Cualquier error es atrihuible a nosotros, no a las escribimos un libro de texto sin una. Cualquier error es atribuible nosotros, no las computadoras. comput a doras. CAPíTULO CAP1TULO Introducción a los pronósticos lntroducción a los pronósticos 1 ACTIVIDAD este libro se centra en el proceso del pronóstico empresarial. Lo cual incluye El interés de este libro se centra en ci proceso del pronóstico empresarial. Lo cual inciuye el estudio de datos históricos para descubrir sus patrones y tendencias fundamentales. Este datos históricos para descubrir sus patrones y tendencias fundamentales. Este ci conocimiento se utiliza para proyectar los datos a periodos futuros como pronósticos. La pronósticos. conocirniento se utiliza para proyectar los datos a penodos futuros modificación de resultados numéricos, mediante un juicio acertado también representa un numéricos, mediante también representa un modificación componente clave de pronóstico efectivo. Al hacerse más complejo el mundo de los pronóstico efectivo. Al hacerse más complejo el mundo los componente dave negocios, aumentado racional, el futuro; negocios, ha aunientado la necesidad de asegurar, sobre cierta base racional, el futuro; por lo que el proceso de pronóstico ha adquirido una posición prominente en ci proceso de lo que el pioccso de pronóstico ha adquirido una posición prominente en el proceso de administración de empresas. adrninistración HISTORIA DE LOS PRONOSTICOS IIISTORIA DE LOS PRONÓSTICOS Muchas de las técnicas de pronóstico que se utilizan actualmente y que se exponen en este técnicas Muchas de pronóstico que se utilizan actualmente y que se exponen en este regresión. En libro se desarroliaron en ci siglo XIX; un ejemplo de ello son los análisis de regresión. En libro desatTollaron en el contraste, sólo recientemente fue que algunos de los temas de este libro se desarroliaron y desarrollaron y contraste, sOlo recienternente fue que aigunos de los temas de atención. En esta categorla Box-Jenkins. recibieron atenciOn. En esta categoría se encuentra el procedimiento de Box-Jenkins. Con el desarrollo de técnicas de pronóstico más complejas, junto con ci advenimiento el ci desan'ollo compiejas, años las computadoras, los pronósticos recibieron más y más atención durante de las computadoras, lOs pronósticos recibieron más y más atención durante los aflos recientes, Este desarroilo es en especial cierto desde Ia proliferación de Ia pequefia especial cierto desde la proliferación de la pequeña recientes. Este desarrollo es utilizar computadora personal. Ahora, todos los administradores poseen la capacidad computadora personal. Ahora, todos los administradores poseen la capacidad de utilizar técnicas análisis de datos muy complejas para fines de pronóstico, y una comprensión técnicas de análisis de datos muy complejas para fines de pronóstico, y una cornprensión técnicas es esencial hoy en día para los administradores de empresas. de dichas técuicas es esencial hoy en dia para los administradores de empresas. Al crecer la preocupación los administradores por proceso de pronóstico, se Al crecer Ia preocupación de los administradores por el proceso de pronóstico, se continúan desarrollando nuevas técnicas de pronóstico. Esta atención se enfoca de continiian desarrollando nuevas técnicas de pronóstico. Esta atención se enfoca de manera particular en los errores, que son parte inherente de cualquier procedimiento de particular en los errores, que son parte inherente de cualquier procedimiento de pronóstico. Es raro los pronósticos coincidan al pie de el futuro, una vez pronóstico. Es raro que ios pronósticos coincidan al pie de la letra con ci futuro, una vez llegado sólo los inevitables errores sean tan liegado éste; quienes pronostican solo pueden intentar que los inevitables errores sean tan pequeños coino pequeflos como sea posible. 2 Introducción a los pronOsticos lntroducciOn pronósticos CapItulo 1 Capítulo 1 LA NECESIDAD DE PRONOSTICAR En vista de las imprecisiones inherentes al proceso, ¿por qué es necesario pronosticar? imprecisiones inherentes al proceso, por qué es necesario pronosticar? En vista La todas las organizaciones operan en una atmósfera de incertidumbre La respuesta es que todas las organizaciones operan en una atmósfera de incertidumbre y que, a pesar de este hecho, se deben tomar decisiones que afectan el futuro de Ia que, a pesar de este hecho, se deben tomar decisiones afectan futuro de la organización. Para los gerentes de organizaciones, las conjeturas académicas son más de organizaciones, las conjeturas académicas son más organización. Para valiosas que las no acadérnicas. Este libro expone varias formas de realizar pronOsticos, académicas. expone varias formas de realizar pronósticos, en métodos lógicos de manipulación de datos que se generaron por sucesos que se basan en métodos lógicos de rnanipulación de datos que se generaron por sucesos históricos. quiere decir que el pronóstico intuitivo sea malo. Al contrario, los Lo anterior no quiere decir que el pronóstico intuitivo sea malo. Al contrario, los sentimientos quienes administran organizaciones, con frecuencia proporsentirnientos instintivos de quienes administran organizaciones, con frecuencia proporcionan el mejor pronóstico disponible. Este libro expone las técnicas de pronóstico que cionan mejor pronóstico disponible. Este libro expone las técnicas de pronóstico que pueden emplearse para complementar el sentido común y la capacidad administrativa de pueden emplearse para cornpiementar ci sentido cornün y la capacidad administrativa de los que toman decisiones; en el capítulo 11 se abordan los elementos de juicio en el proceso decisiones; en ci capItulo 11 se abordan los elementos dejuicio en el proceso los de pronóstico. En nuestra opinion, quienes toman decisiones lo harán mejor si a partir de partir de de pronóstico. En nuestra opinión, quienes toman decisiones lo harán mejor la cornprensión de las técnicas de pronóstico, Ia comprensión de las técnicas de pronóstico, tanto cualitativas como cuantitativas, las utilizan de manera adecuada, en vcz de forzados planear el futuro sin el utilizan de manera adecuada, en vez de que se vean forzados a planear el futuro sin el beneficio de esta valiosa informaciOn compiementaria. esta valiosa información complementaria. beneficlo En los iltimos años, ci papel dci pronOstico con base en el juicio ha cambiado. Antes últimos años, el papel del pronóstico la llegada las técnicas modernas de pronóstico las computadoras, de Ia llcgada de las técnicas modernas dc pronóstico y del poder de las computadoras, el juicio del administrador la única herramienta pronóstico disponible. No existe juicio del administrador era Ia iinica herramienta de pronóstico disponibie. No existe pronósticos basados solo enjuicios no sean tan evidencia de quc los pronOsticosbasados sólo en juicios no sean tan precisos como aquellos como aquellos la cabal aplicación cuantitativas: que emplean Ia cabal aplicaciOn de técnicas cuantitativas: humano posee conocimiento único infom1ación interior que no están disponibles en El ser huniano iiosec un coiiocimicnto iinico e información interior que no están disponibles en sorprendente, empíricos los métodos cuantitativos. Sin embargo, de manera sorprendente, estudios empIricos y experimentos de laboratorio han demostrado que sus pronósticos no son más prccisos que los de los laboratorio pronósticos son más precisos que los de los métodos cuantitativos. El ser humano tiende a ser optirnista y subestimar la incertidumbre del optimista métodos citantitativos. El ser huniano tiende futuro. Además, el costo dcl pronOstico con métodos de juicio Cs a menudo considerablemente del pronóstico con métodos dcjuicio es a menudo futuro. más alto que se utilizan cuantitativos. rnIs alto que cuando se utilizan métodos cuantitativos)1 Creemos que quicn pronostica de manera rnás efectiva es capaz de formular una hãbil quien más cfectiva es hábil dc fom1Ular mezcla de huen juicio y técnicas de pronOstico cuantitativas, así como el cvitar ci caso y técnicas de pronóstico cuantitativas, asI corno ci evitar el caso mezcia de buen extremo de la total dependencia en alguno de ellos. En un extremo encontramos al ejecutivo extrerno de Ia total dependencia en alguno de cilos. un que por ignorancia y miedo a las técnicas cuantitativas y a las computadoras, se basa solo las técnicas cuantitativas a las computadoras, se basa sólo que en la intuición y ci sentir. En ci otro extrerno está el pronosticador capacitado en las últimas el el extremo estã ci en capacitado en las iltimas técnicas de nianipulaciónde datos, quc no cs capaz o no desea rclacionar ci proceso de técnicas de manipulación dc datos, que no es capaz no desea relacionar el proceso pronóstico con las necesidades de Ia organizción y con quienes toman decisiones ésta. pronóstico con las necesidades dc la organización y con quienes tornan decisiones en ésta. las técnicas de pronóstico cuantitativo que sc exponen en libro sólo ci Opinamos que las técnicas de pronOstico cuantitativo que se exponen en este iibro son sOlo el 1 S. Makridakis, "The Art and Science of Forecasting" Inlernational Jaurnal aJ Forecasting, Vol. 2 s Makridakis, "The Art and Sciencc of Forecasting" International Journal of Farecasling, Vol. (J98ú), p. 17. (1')ô), p. 17. I La necesidad de pronosticar La necesidad de pronosticar 3 3 en el pronóstico efectivo resultados importantes organización: punto de partida en ci pronóstico efectivo de resultados importantes para la organización: el análisis, los juicios, ci sentido cornñn y la experiencia empresarial deben aplicarse en el empresarial deben aplicarse el sentido común estas técnicas importantes generado sus resultados. punto donde estas técnicas irnportantes han generado sus resultados. siempre ha sido cambiante el que operan las organizacioDebido a que siempre ha sido cambiante el mundo en el que operan las organizaciones, siempre existido la necesidad de hacer pronósticos. embargo, los últimos nes, siempre ha existido la necesidad de hacer pronósticos. Sin embargo, en los ültimos incrementado la confianza en las técnicas que abarcan manipulaaños se aflos se ha incrernentado la confianza en las técnicas que abarcan una compleja manipulación datos. Una nueva tecnología y nuevas disciplinas aparecieron de la noche la ción de datos. Una nueva tecnoiogIa y nuevas disciplinas aparecieron de la noche a la mañana; la actividad gubernarnental se intensificó en todos los niveles; Ia competencia gubernamental se intensificó los niveles; la competencia mañana; cerrada muchas áreas; casi las industrias implantó el comercio se hizo más cerrada en muchas areas; en casi todas las industrias se impiantó ci cornercio internacional; crecieron crearon agencias ayuda y servicios. Estos factores internacional; crecieron y se crearon nuevas agencias de ayuda y servicios. Estos factores organizacional que es más compiejo, con una dinámica se combinaron para crear un clima organizacional que es más complejo, con una dinámica más rápida y rnás competitiva que mmca. Las organizaciones que no puedan reaccionar con más que nunca. Las organizaciones que no puedan rapidez a las condiciones cambiantes y prever ci futuro con alg(in grado de precision, están condiciones cambiantes prever el futuro con algún de precisión, están condenadas a la extinción. extinción. Las computadoras, junto con las técnicas cuantitativas que hacen posible, se han técnicas cuantitativas que hacen posible, han Las computadoras, junto con vuelto más que recomendables en las organizaciones modernas: se han vuelto esenciales. recomendables las organizaciones modernas: vuelto esenciales. vuelto más Las dificultades antes expuestas generan una enorme cantidad de datos y una trernenda tremenda Las dificultades antes expuestas generan una enorme cantidad de datos y necesidad de extraer inforrnación útil de estos datos. Las herramientas modernas de necesidad de extraer infonnación ütil de estos datos. Las herramientas modernas de pronóstico, junto con Ia capacidad de la computadora se han hecho indispensables para las la capacidad las pronóstico, junto organizaciones que operan en el mtmdo moderno. el mlmdo organizaciones Quién requiere ¿Quién requiere hacer pronósticos? Casi cualquier organización, grande y pequefla, pronósticos? Casi cualquier organización, grande pequeña, explícito implícito, que casi todas pública privada, utiliza el pronóstico pñblica y privada, utiliza el pronOstico ya sea explIcito o impilcito, debido a que casi todas las organizaciones deben planear cOrnoenfrentar las condiciones futuras de las cuales tiene cómo enfrentar las condiciones futuras de las cuales tiene las conocimiento imperfecto. Además, la necesidad de hacer pronósticos cruza todas un conociniiento imperfecto. Además, la necesidad de hacer pronósticos cruza todas las lIneas funcionales lo líneas funcionales lo mismo que todo tipo de organizaciones. Se requiere hacer pronósticos en las areas de finanzas, cornercialización, personal y de producción, tanto en organizacioáreas finanzas, comercialización, personal y de producción, tanto en gubernamentales búsqueda de ganancias, corno en pequenos clubes sociales nes gubernarnentales y de biisqueda de ganancias, como en pequeños clubes sociales y en los p31tidos políticos nacionales. Considere las siguientes preguntas que sugieren la los partidos politicos nacionales. Considere las siguientes preguntas que sugieren la algunos procedimientos de pronóstico: necesidad de algunos procedirnientos de pronóstico: • Si incrementamos nuestro presupuesto de publicidad en un 10%, ¿cómo afectará a las Si incrernentamos nuestro presupuesto de publicidad en un 10%, cOmo a las ventas? Qué ingresos en rentas públicas puede esperar el gobierno del estado durante • ¿Qué ingresos en rentas pñblicas puede esperar el gobierno del estado durante los próximos dos aflos? años? próxirnos • ¿Cuántas unidades deberernos vender para recuperar nuestra inversiOn fija en equipo de deberemos recuperar nuestra inversión Cuántas producción? • ¿Qué factores podemos identificar que ayuden a explicar Ia variabilidad de las ventas la las ventas Qué factores podernos mensuales unitarias? • ¿Cuál es ci pronOstico año por aflo del saldo total de préstamos de nuestro banco en los año del nuestro banco en los Cuál el pronóstico diez años? próximos diez aflos? ,Habrá • ¿Habrá una recesión? Si es asI, ¿cuándo empezará?, ¿qué tan severa será? y ¿cuándo así, cuándo empezará?, qué será? y ,cuándo terminará? terrninará? 4 Introducción pronósticos Introducción a los pronOsticos Capítulo 1 Capitulo 1 TIPOS DE PRONÓSTICO TIPOS DE PRONOSTICO organizaciones tomar decisiones Cuando los gerentes de organizaciones se enfrentan con la necesidad de tomar decisiones ¿qué tipos de pronóstico tienen disponibles? En primer en una atmósfera de incertidumbre, ,qué tipos de pronóstico tienen disponibles? En primer se deben clasificar los procedimientos pronóstico o corto plazos. Los término, se deben clasificar los procedimientos de pronóstico de largo o corto plazos. Los a largo plazo son necesarios para establecer el curso general de la organización pronósticos a largo plazo son necesanos para establecer el curso general de la organización para un largo periodo; de ahI que conviertan en enfoque particular de alta para un largo periodo; de ahí que se conviertan en el enfoque particular de la alta dirección. corto plazo se utilizan para diseñar estrategias inmediatas dirección. Los pronósticos a corto plazo se utilizan para diseflar estrategias inmediatas que usan los administradores rango medio de primera línea enfrentar y que usan los administradores de rango medio y de primera lInea para enfrentar las necesidades del futuro inmedi ato. del futuro inmediato. También se podria clasificar a los pronósticos en términos de su posición en el entorno podría el micro-macro, es decir, segün el grado en que intervienen pequeflos detalles vs. grandes micro-macro, es decir, según el grado en que intervienen pequeños detalles vs. grandes valores resumidos. Por ejemplo, el gerente de una planta pudiera estar interesado valores resumidos. Por ejemplo, el gerente de una planta pudiera estar interesado en el número de trabajadores que requerirá en los próximos meses (un micropropronosticar ci nimero de trabajadores que requerirá en los próximos meses (un inicropronóstico), mientras que ci gobiemo federal está pronosticando el nñmero total de personas federal pronosticando número de personas nóstico), mientras que el macropronóstico). De nuevo, diferentes niveles empleadas en toda Ia nación (un macropronóstico). De nuevo, los diferentes niveles de empleadas en toda la nación administración en tilla organización tienden a enfocar diferentes niveles del entorno administración en uria organización tienden a enfocar diferentes niveles del entorno micro-macro. Por ejemplo, Ia alta dirección estaría interesada en pronosticar las ventas de ejemplo, la alta dirección estarla interesada en micro-macro. toda la compañIa, en tanto que los vendedores individuales estarlan mucho más interesados compañía, estarían más interesados en pronosticar su propio volumen de ventas. en Los procedimientos de pronóstico pueden también clasificarse de acuerdo con también de acuerdo con Los procedimientos su tendencia a ser más cuantitativos o cualitativos. En uno de los extremos, una los extremos, una su tendencia ser más cuantitativos cualitativos. En uno técnica puramentecualitativa es aquella que no requiere de una abierta manipulación técnicapuramente cualitativa es aquella que no requiere de una abierta manipulación de datos, solo se utiliza el "juicio" de quien pronostica. Desde luego, incluso aqul, sólo se utiliza el "juicio" de quien pronostica. Desde luego, incluso aquí, de del pronosticador es en realidad el resultado de la manipulación mental el "juicio" del pronosticador es en realidad el resultado de Ia manipuiación mental de datos históricos pasados. En ci otro extremo, las técnicaspuramente de datos históricos pasados. En el otro extremo, las técnicas puramente cuantitativas no requieren de elementos de juicio; son procedimientos mecánicos que producen no requieren de elementos de juicio; son procedimientos mecánicos que producen resultados cuantitativos. supuesto, ciertos procesos cuantitativos requieren de resultados cuantitativos. Por supuesto, ciertos procesos cuantitativos requieren de una manipulación de datos mucho más compleja que otros. Este libro hace una manipuiaciOn de datosmucho más compleja que otros. Este libro hace hincapi é en las técn icas pronóstico cuantitativas, ya que es necesario un mayor hincapié en las técnicas dede pronóstico cuantitativas,ya que es necesario un mayor entendimiento de estos ütiles procedimientos en la administración efectiva de las entendimientode estos útiles procedimientos en la administración efectiva de las organizaciones modernas. No obstante, debemos enfatizar de con los organizaciones modernas. No obstante, debemos enfatizar de nuevo que junto con los mecánicos manipulación deben emplear elementos de procedimientos rnecánicos y de rnanipulación de datos, se deben emplear elementos de juicio y sentido común. Sólo en esta forma se puede llevar a cabo un pronóstico juicio y sentido comiin. SOlo en esta forma se puede lievar a cabo un pronóstico inteligente. PRONÓSTICO MACROECONÓMICO PRONÔSTICO MACROECONOMICO Por 10 regular pensamos en los pronósticos en términos de pronosticar variables importantes lo importantes para una compaia individual ooquizã para una parte de una compafiIa. Ejemplos de ello para compañía individual quizá para una parte de una compañía. Ejemplos de ello son ventas mensuales de la empresa, las ventas unitarias de una las tiendas de la son las ventas mensuales de Ia empresa, las ventas unitarias de una de las tiendas de la compafíía y las horas de ausencia por empleado y mes en una fábrica. compaiIa y las horas de ausencia por empleado y mes en una fábrica. del método de pronóstico Selección del método de pronOstico 5 En contraste, existe 1m creciente interés en el pronóstico de importantes variables para un interés el pronóstico de importantes variables para nación. Se ha realizado gran trabajo la evaluación de este tipo la economla de una nación. Se ha realizado un gran trabajo en la evaluación de este tipo economía económico global, denominado macroeconómico. de pronóstico econórnico global, denominado pronóstico macroeconóniico. Ejemplos que EVA índice desempleo, el interesan a! gobierno federal de EUA son el Indice de desempleo, el producto nacional bruto al gobiemo y la tasa lIder de interés. tasa líder de interés. la política económica se basa en proyecciones de importantes indicadores En parte, la poiltica económica se basa en proyecciones de importantes indicadores económicos, como los tres mencionados anteriormente. Por este motivo, hay un gran interés gran interés en mejorar los métodos de pronóstico que enfocan tales mediciones globales del compormétodos de pronóstico que enfocan tales mediciones globales del comportamiento económico de un pals. En la actualidad, los métodos de pronóstico se pueden la actualidad, los métodos de pronóstico se pueden tamiento económico de un país. enfoques tradicionales dividir en forma genérica en dos enfoques; 1) métodos que usan los enfoques tradicionales de análisis de series de tiempo y 2) métodos menos estructurados que se enfocan en las análisis series de tiempo y 2) métodos menos estructurados se enfocan en las estadísticas las mediciones describen en este propiedades estadIsticas de las mediciones históricas. Ambos enfoques se describen en este libro. Una de las principales dificultades para el desalTollo de pronósticos precisos de la las principales dificultades para desalTollo de pronósticos precisos de la Una actividad econórnica global, consiste en cambios significativos en algün factor econórnico económica global, significativos en algún factor económico clave. Entre tales factores se encuentran los cambios significativos en los precios del dave. Entre tales factores se encuentran los cambios significativos en los precios del súbitas de la inflación, los cambios de política global en el gobierno petróleo, variaciones sübitas de la inflación, y los cambios de polItica global en el gobierno de otro pals que afectan la economla propia. país afectan la economía de La posibilidad de dichos cambios significativos en el escenario económico ha La posibilidad de dichos cambios significativos en el escenario económico ha pregunta clave en el pronóstico macroeconómico: ¿deberían modificarse los generado una pregunta dave en el pronóstico macroeconórnico: 4,deberIan modificarse los pronósticos generados mediante el procedimiento de pronóstico utilizando el juicio de quien procedirniento de pronóstico utilizando eljuicio los produce? Esta pregunta aparece a menudo en el trabajo que se realiza en la actualidad los produce? Esta pregunta aparece a menudo en el trabajo que se realiza sobre la metodologla de pronóstico. pronóstico. sobre metodología En materia de pronóstico rnacroeconórnico se sigue desarrollando 1m gran esfiierzo tanto matelia macroeconómico esfilerzo un teótico como ejemplar del 01 Forecasting núm. teórico corno práctico. Un ejemplar del International Journal of Forecasting (Vol. 6, nüm. 3, octubre de 1990), está dedicado a este terna. Considerando la importancia de un pronóstico este tema. de un pronóstico económico preciso para la forrnulación de la polItica nacional, se puede esperar una econórnico preciso para la formulación de la política nacional, se puede esperar una contínua tipo de pronóstico en el futuro. continua atención sobre este tipo de pronóstico en el futuro. SELECCIÓN DEL MÉTODO DE PRONÓSTICO SELECCION DEL METODO DE PRONÔSTICO La exposición anterior sugiere varios factores a considerar en la selección de un método Se debe contemplar el nivel de detalle. ¿Se requiere de un pronóstico de pronóstico. Se debe contemplar el nivel de detalle. ,Se requiere de un pronóstico detalles especIficos (un micropronóstico)? O se necesita conocer el estado futuro de de detalles específicos (1m micropronóstico)? ¿ü se necesita conocer el estado futuro de algún factor global general (un macropronóstico)? ,Se precisa el pronóstico algún algün factor global o general (un macropronóstico)? ¿Se precisa el pronóstico de algin el futuro punto en el futuro cercano (un pronóstico aa corto plazo), oo para un punto en el futuro punto en futuro cercano (un pronóstico corto plazo), para un punto distante (un pronóstico a largo plazo)? y, ¿hasta qué grado son apropiados los métodos pronóstico largo plazo)? distante hasta qué grado son apropiados los métodos cualitativos (de juicio) y cuantitativos (de manipulación de datos)? cuantitativos manipulación de cualitativos (de La consideración que se impone en Ia selección de un método de pronóstico es la de consideración impone la selección de un método que los resultados deben facilitar el proceso de toma de decisiones de los administradores facilitar el proceso de toma de decisiones de los administradores de Ia organización. Por lo tanto, el requerimiento esencial no es que el método de pronóstico la proceso matemático complicado o que sea lo .iItimo en complejidad. En vez comprenda un proceso matemático complicado o que sea lo último en complejidad. En vez de ello, el método elegido deberá producir un pronóstico que sea preciso y comprensible método elegido pronóstico que comprensible para los administradores, de modo que pueda ayudar aaproducir mejores decisiones. los administradores, de modo que pueda ayudar producir mejores decisiones. para 6 a los pronósticos Introducción a los pronOsticos Capítulo 1 CapItulo 1 Además, utilización del procedimiento pronóstico producir un beneficio Además, la utilización del procedirniento de pronóstico debe producir un benef'icio que exceda al costo asociado con su uso. exceda PASOS A SEGUIR EN EL PRONÓSTICO EL PRONÔSTICO PASOS A Todos los procedimientos formales de pronóstico comprenden la extension de las experienfonnales extensión ahí Ia suposición de que las cias del pasado al futuro incierto. De ahI la suposición de que las condiciones que generaron del los datos anteriores son indistinguibles de las condiciones futuras, con excepción de aquellas las condiciones futuras, con excepción aquellas variables reconocidas de manera explícita por el modelo de pronóstico. Por ejemplo, si se pronóstico. se variables reconocidas de manera explIcita por el modelo está pronosticando el índice de desempeilo de los empleados en el trabajo, usando solo está pronosticando ci Indice de desempeño de los empleados en el trabajo, usando sólo como pronóstico la calificación del examen de admisión, se asume que el indice de corno pronóstico Ia caliticaciOn del examen de admisión, se asume que el índice desernpeo en el trabajo de cada persona se afecta sólo por dicho examen. Considerando desempeño en el trabajo de cada persona se afecta solo por dicho examen. Considerando que la suposición de pasado y futuro indistinguibles no se cumple, resultarán pronósticos suposición de pasado y futuro indistinguibles no se cumple, resultarán pronósticos imprecisos, a menos que se modifiquen a juicio de quien pronostica. modifiquen de quien pronostica. imprecisos, menos La aceptación de que las técnicas de pronóstico funcionan sobre datos generados en aceptación pronóstico funcionan sobre datos generados en sucesos históricos pasados conduce a Ia identificación de cuatro pasos en el proceso del sucesos históricos pasados conduce a la identificación de cuatro pasos en el proceso del pronóstico: pronOstico: l. RecopiiaciOn de datos. Recopilación 2. Reducción o condensación de datos. 3. Construcciôn del modelo. Construcción modelo. 4. Extrapolación dci modelo (ci pronóstico en si). del (el en sí). El paso I sugiere Ia importancia de obtener los datos adecuados y asegurarse que son 1 sugiere la imp0l1ancia son El correctos. Con frecuencia este paso es el mayor reto de todo el proceso de pronóstico y el correctos. Con frecuencia este paso es ci mayor reto de todo el proceso de pronóstico y el efectúan más dificil de controlar, ya que los pasos siguientes se efectüan sobre los datos, sean o no relevantes para el problema en cuestiOn. Siempre que se hace necesario obtener datos percuestión. Siempre que se hace relevantes tinentes cii una organización, abundan los problernas de recopilación y control de calidad. en una organización, problemas de recopilación y control de calidad. El paso 2, Ia reducción de datos con frecuencia es necesaria ya que en el proceso de la reducción de datos con frecuencia es necesaria ya que en ci proceso de El pronóstico es posible tener muchos o muy pocos datos. Algunos datos pueden no ser pronóstico es posible tener muchos o muy pocos datos. Algunos datos pueden no ser pertinentes al problerna, por lo que reducirian Ia precision del pronóstico. Otros datos pertinentes al problema, por lo que reducirían la precisión del pronóstico. Otros datos pueden ser Los adecuados, pero sólo en ciertos periodos históricos. Por ejemplo, en el pueden ser los adecuados, pero solo en ciertos periodos históricos. Por ejemplo, en pronóstico de las ventas de automOviles compactos podría desearse emplear sólo datos de automóviles compactos podrIa desearse emplear solo datos de pronóstico ventas de automóviies a pat1ir del embargo petrolero de la década de 1970, en vez de datos ventas automóviles partir dcl embargo petrolero de Ia década de 1970, en vez de datos ai105. últimos de los ültirnos 50 años. El paso 3, Ia construcción del modelo, implica el ajustar los datos reunidos en un 3, la constmcción del modelo, implica el ajustar los datos reunidos en un El el adecuado minimizar el modelo de pronóstico que sea ci adecuad para minimizar el error en el pronóstico. Entre modelo más sencillo sea ci modelo, será rnejor para lograr la aceptación del proceso por parte de más sencillo sea el modelo, será mejor para lograr Ia aceptación del proceso por parte de los administradores que toman las decisiones en la empresa. Con frecuencia se debe los administradores que toman las decisiones en Ia empresa. Con frecuencia se debe establecer un balance entre un enfoque de pronóstico complejo que ofrezca ligeramente más ofrezca ligeramente más precisión y un enfoque sencillo que sea facil de entender y ganar el apoyo de quienes tornan toman precisiOn y un enfoque sencillo que sea thcil de y ci las decisiones, de manera lo utilicen efectivamente. Es obvio los elementos las decisiones, de manera que lo utilicen efectivamente. Es obvio que los elernentos de forman parte de este proceso de selección. Ya que el libro expone diversos modelos juicio forman parte de este proceso de selccción. Ya que ci libro expone diversos modelos del proceso de pronóstico Administración del proceso de pronOstico 7 su aplicabilidad, confiamos la de pronóstico y su aplicabilidad, confiarnos en Ia capacidad del lector para ejercitar el buen la elección y uso apropiado de los modelos de pronóstico, capacidad que juicio en la elección y uso apropiado de los modelos de pronóstico, capacidad que se incrernentará después de estudiar este material. incrementará estudiar este material. El paso 4 consiste en Ia extrapolación en si del modelo de pronóstico, lo cual ocurre consiste en la extrapolación sí modelo de pronóstico, lo cual ocurre una vez que se recolectaron y tal vez redujeron, los datos adecuados y que se seleccionó que se recolectaron tal vez redujeron, los datos adecuados que se seleccionó un modelo de pronóstico apropiado. Es comün que quien realizó el pronóstico revise la modelo de pronóstico apropiado. Es común realizó el pronóstico revise la precisión del proceso mediante el pronóstico de periodos recientes de los que se conocen proceso mediante pronóstico periodos recientes de se conocen precision históricos reales. Es entonces cuando se observan se los valores histOricos reales. Es entonces cuando se observan los errores de pronóstico y se algún CieIios procedirnientos resumen de algñn modo. Ciertos procedimientos de pronóstico suman los valores absolutos de los en-ores y pueden reportar esta suma, dividirla entre el número de intentos de de los errores y pueden reportar esta surna, o dividirla entre el nümero de intentos de pronóstico para obtener el error de pronOstico prornedio. Otros procedimientos obtienen la el error de pronóstico promedio. obtienen la suma los errores, que se compara luego con cifras similares de métodos surna de cuadrados de los errores, que se compara luego con cifras sirnilares de métodos de pronóstico alternativos. Algunos procedirnientos también rastrean y reportan la magnitud de los altemativos. procedimientos los pronóstico. los patrones error conduce ténninos de error sobre el periodo de pronóstico. El examen de los patrones de error conduce términos eITor analista la modificación del procedimiento de pronóstico, ci genera con frecuencia al analista a la modificación del procedirniento de pronóstico, el cual genera frecuencia después pronósticos más precisos. Los métodos específicos de medición de elTor en el después pronósticos rnás precisos. Los métodos especIficos de rnedición de error en pronóstico pronóstico se abordan al final del capItulo 4. capítulo ADMINISTRACIÓN DEL PROCESO DE PRONÓSTICO ADMINISTRACION DEL PROCESO DE PRONOSTICO La exposiciOn en este capítulo tiene como objeto subrayar nuestra creencia de que la La exposIclOn en este capItulo tiene como objeto subrayar nuestra creencia de que Ia capacidad administrativa y el sentido comIm deben fomlar palie del proceso de pronóstico. comím deben formar parte Se debe pensar en quien pronostica como en un asesor de la dirección, en vez del monitor pronostica corno en un asesor de Ia dirección, en vez del de un dispositivo automáticode toma de decisiones. Por desgracia, este ñltimo es el caso en autorntico de toma de decisiones. Por desgracia, este último es la práctica, en especial en el entorno de Ia computadora. De nueva cuenta, las técnicas en el Ia práctica, en especial en el entorno de la computadora. De nueva cuenta, las técnicas en el proceso de pronóstico utilizarían proceso de pronOstico deben ser vistas como lo que en realidad son, herramientas que utilizarlan corno los administradores para llegar a mejores decisiones. a mejores decisiones. los Se puede mejorar la utilidad de los pronósticos si los administradores adoptan una actitud más actitud más utilidad de los pronósticos silos administradores realista. No se debe ver al proceso corno un sustituto de la profecía, sino como la mejor forma de de profecIa, sino corno la mejor forma de como identificar y extrapolar patrones o relaciones establecidos con el fin de pronosticar. Si se admite relaciones establecidos con el fin de pronosticar. Si se admite tal actitud, se deben considerar inevitables los errores de pronóstico e investigar las circunstancias de pronóstico e investigar las circunstancias los generan. 2 que los generan.2 Dicho lo anterior, si el proceso de pronóstico se va a conducir de la manera adecuada, deben siempre surgir diversas preguntas clave. diversas preguntas dave. Por • ¿Por qué se requiere de los pronOsticos? requiere de los pronósticos? • ¿Quién utilizará los pronóSticos y cuáles son sus requerirnientos especIficos? sus requerimientos específicos? Quién utilizará los pronósticos Qué nivel adecuado en el • ¿Qué nivel de detalle o agregación se requiere y cual es el horizonte adecuado en el agregación se requiere y cual es tiempo? 2 2 Ibid., 33. p. 33. 8 Introducción a los pronOsticos pronósticos Capítulo 1 CapItulo 1 ,Que datos • ¿Qué datos hay disponibles? Lserán suficientes para generar el pronóstico que se disponibles? ¿serán suficientes para generar el pronóstico se requiere? Cuál del • ¿Cuál será el costo del pronóstico? Qué • ¿Qué tan preciso podemos esperar que sea el pronóstico? Se • ¿Se hará a tiempo el pronóstico para ayudar a! proceso de toma de decisiones? al • Quien pronostica, ¿tiene un claro entendimiento de cómo se usará el pronóstico en la claro entendimiento pronostica, ,tiene usarã organización? Hay disponible • ¿Hay disponible un proceso de retroa!imentación para evaluar el pronóstico una vez retroalimentación hecho y ajustar el proceso de acuerdo con ello? PAQUETES DE CÓMPUTO PARA PRONÓSTICO PAQUETES DE COMPUTO PARA PRONOSTICO En la década pasada el desarrollo que ha tcnido el mayor impacto en el pronóstico es el de desarrollo que ha tcnido el mayor impacto en el pronóstico es el de los paquetes de programas de cómputo diseflados especIficamente para tratar en forma los paquetes de programas de cómputo diseñados específicamente para tratar en directa diferentes métodos de pronóstico. Hay dos tipos de paquetes de cómputo de interés pronóstico. cómputo de interés diferentes para los pronosticadores: 1) paquetes estadIsticos que incluyen análisis de regresión y otras estadísticos regresión y otras técnicas que se utilizan con frecuencia en los pronósticos; y 2) paquetes de pronóstico frecuencia en los pronósticos; 2) paquetes de pronóstico técnicas que utilizan diseñados especIficamente tipo. diseflados específicamente para aplicaciones de este tipo. estadísticos macro Se han desarrollado cientos de paquetes estadIsticos y de pronóstico tanto para macro Se (o computadoras a las que con frecuencia se les llama como microcomputadoras (o computadoras personales, a las que con frecuencia se les llama PCs). administradores sobre sus escritorios y el conocimiento de técnicas de PCs). Los administradores con PCs sobre sus escritorios y ci conocimiento de técnicas de pronóstico, ya no dependen de un equipo de trabajo para realizar sus pronósticos. Los pronóstico, ya no dependen de un equipo de trabajo para realizar sus pronósticos. Los administradores modemos están aprovechando Ia la facilidad y disponibilidad administradores modernos están aprovechando la ventaja de Ia facilidad y disponibilidad de pronóstico que proporcionan las computadoras personales. de métodos complejos de pronóstico que proporcionan las computadoras personales. sección, se mencionan los paquetes de cómputo estadísticos y de En esta sección, se mencionan algunos de los paquetes de cómputo estadisticos y de pronóstico utilizados. frecuencia utilizan paquetes estadísticos funcionan pronóstico más utilizados. Con frecuencia se utilizan paquetes estadIsticos que funcionan . en macrocomputadoras ee incluyen partes que tratan directamente varios métodos de macrocomputadoras incluyen partes que tratan directamente varios métodos de pronóstico. los populares pronóstico. Tres de los paquetes más populares son: 1. Minitab: Véanse ejemplos de instrucciones y salidas a lo largo del texto y al final de Minitab: ejemplos de instrucciones y salidas a lo largo dci texto y cada capItulo. capítulo. Paquete estadístico para las ciencias 2. Statistical Package for the Social Sciences (SPSS). Paquete estadIstico para las ciencias sociales. estadístico. ejemplos de 3. Statistical Analysis System (SAS). Sistema de análisis estadIstico. Véanse ejemplos de Sistema salidas a! final de Ia mayorIa de los capItulos. al la mayoría los capítulos. Un ütil resurnen de 48 paquetes estadIsticos para macrocomputadoras fue compilado por 48 paquetes estadísticos para macrocomputadoras compilado por Un útil resumen Mahmoud, Rice, McGee y Beaumont (1 986). Desafortunadamente, estas subrutinas de Mahmoud, Rice, McGee Beaumont (1986).3 Desafortunadamente, estas subrutinas pronóstico requieren, para su aplicación, de un conocimiento total del paquete y de un pronóstico requieren, para su aplicación, de un conocimiento total del paquete y de analista altamente calificado. 3 E. Mahmoud, G. Rice, V. E. McGee y C. Beaumont, "Mainframe Multipurpose Forecasting Software: Rice, V. E. McGee y C. Beaumont, "Mainframe Multipurpose Forecasting Software: A Survey", JOlll7la/ of Forecasting, Vol. 5 (1986), pp. 127-137. (1986), 127-137. A Survey", Journal o/ Paquetes de cOmputo para pronóstico cómputo 9 años recientes, se desarrolló nuevo tipo de paquete de cómputo para macroEn años recientes, se desarrolló un nuevo tipo de paquete de cómputo para macrocomputadoras, dirigido específicamente computadoras, dirigido especIficamenteaa las necesidades de los administradores. las necesidades de los administradores. SibyI/Runner, propiedad de Applied Decisions Systems, que tarnbién proporciona asesorla, también asesoría, Sibyl/Runner, propiedad utilizado amplia aceptación la década de 1990. ha ganado una amplia aceptación al principio de la década de. 1990. Ha sido utilizado con éxito tanto por compañías como por instituciones académicas. Un paquete con éxito tanto por compañias como por instituciones académicas. Un paquete más FuturCast: Spyros reciente denominado FuturCast: The Total Forecasting System desarrollado por Spyros Makridakis y Robert Carbone, es otro buen ejemplo un paquete interactivo de Makridakis y Robert Carbone, es otro buen ejemplo de un paquete interactivo de para administradores. Este paquete lo com~rcializa Futurion Assopronóstico diseñado para administradores. Este paquete lo comercializa Futurion Associates, lnc. Otros dos paquetes que se usan ampliamente en el pronóstico económico ciates, Inc. Otros dos paquetes que se usan ampliamente en el pronóstico económico ejemplo salida al final del capítulo Shazam. útil resumen son TSP (véase el ejemplo de salida a! final del capItulo 9) y Shazam. Otro ütil resumen paquetes de pronóstico para macrocomputadora fue compilado por Mahmoud, Rice, de 37 paquetes de pronóstico para macrocomputadora fue compilado por Mahmoud, Rice, Beaumont (1986).4 McGee y Beaumont (1986). Minitab, SPSS, TSP (MicroTSP) y Sybil/Runner han creado recientemente versiones que funcionan en computadoras personales. Statpro, StatPac, Daisy, Decision nes que funcionan en computadoras personales. Statpro, StatPac, Daisy, Decision Support Modeling, VisiTrend/Plot, Graph Ca1c, Expert Choice, Nuametrics, Support Modeling, VisiTrend/Plot, Graph N' Calc, Expert Choice, Nuametrics, métodos SYSTAT y Xtrapolator son paquetes similares a Minitab, que contienen varios métodos utilizado de pronóstico y que pueden funcionar en computadoras personales. El muy utilizado de pronóstico que pueden funcionar en computadoras personales. El paquete de ajuste estacional Xl IARJMA/88, se encuentra disponible tanto para macroestacional X11ARIMA/88, para macropaquete computadoras como para PCs. para PCs. desarrollaron específicamente diseñados Se desarrollaron diversos paquetes especIficamente diseñados para funcionar en microcomputadoras. Por ejemplo, Walonick Associates ofrece Plus (véanse niicrocomputadoras. Por ejemplo, Walonick Associates ofrece Forecast Plus (véanse ejemplos de instrucciones y salidas al final de cada capitulo). Otros paquetes de final cada capítulo). Otros paquetes de ejemplos de instrucciones y salidas programas diseñados para microcomputadorasque se comercializan en la actualidad programas diseñados para microcomputadoras que se comercializan en actualidad son: • AutoBox 3.0 de Automatic Forecasting Systems, lnc. Inc. • Autocast II de Levenbach Associates Il Forecasting: de John Wiley • Business and Economic Forecasting: Decision Support System Software de John Wiley & Sons & • Easy Forecaster Plus 1 o II del Institute of Business Forecasting Forecaster Plus J JI lnstitute ofBusiness Forecasting • Economics Software Program (ESP) de Chase Econometrics Inc. • Express Easycast de Management Decisions Systems, lnc. Inc. • ET (Econometrics Toolkit) de Econometric Software, lnc. • Forecast Master de Scientific System, Inc. Master de Scientific System, lnc. • 4 Cast de Scientific Systems, Inc. de Scientific Systems, lnc. dc • Forecasting de Hewlett Packard • Forecast Pro de Business Forecast Systems, Inc. Systems, lnc. • Micranal de Gwilym Jenkins & Partners, Ltd Micranal & Partners, • Micro-BJ de Stratix '<1 E. Mahnioud, G. Rice, V. E. McGee yyC. Beaumont, "Mainframe Specific Purpose Forecasting E. Mahmoud, G. Rice, V. E. McGee C. Beaumont, "Mainframe Specific Purpose Forecasting Software: A Survey", Journal oI Forecasting, Vol. 5 (1986), pp. 75-83. Software: A Survey", JOllrnal of Forecasting, Vol. 5 (1986), pp. 75-83. 10 10 lntroducciOn Introducción a los pronOsticos pronósticos Capitulo 1 Capítulo 1 MICCROFIT3 • MlCCROFlT3 de Oxford University Press Series Program) • MTS (the Multiple Time. Series Program) de Automatic Forecasting Systems Systems • • • • • • • • • Pro*Cast de Fleming Software +Forecast de Computer Software Consultants, Inc. RATS de Var Econometrics Val' Econometrics Smartforecasts II de Smart Software, Inc. II Smart Software, lnc. SORITEC de Sorites Group SORlTEC Tirnestat Timestat de Timestat, Inc. lnc. SCA Statistical System de Scientific Computing Associates Corp. The Forecaster de Wadsworth Electronic Publishing Company Com¡)any ySTAT de Ming Telecomputing, Inc. lnc. muy útil de muchos de estos Se puede encontrar un análisis muy t'itil de muchos de estos paquetes en el ejemplar del 14 de marzo de 1989 de PC Magazine,5 Otro ütil resumen de 94 paquetes de del 14 de marzo de 1989 de pe Magazine. 5 Otro útil resumen de 94 paquetes de pronóstico para computadoras personales fue compilado por Beaumont, Mahmoud y pronóstico para computadoras personales fue compilado por Beaumont, Mahmoud y McGee (1985).6 (1985).6 1-2-3 (véanse ejemplos Se debe mencionar además que los paquetes integrados Lotus 1-2-3 (véanse ejemplos tinal capítulo), e instrucciones al final de cada capItulo), Excel, Quattro Pro, Framework, Symphony, Visi 717 Offíce On, Lisa 7/7 Office System y otros similares, se pueden usar para pronósticos. Ninguno de On, Lisa 717), realiza pronósticos estos paquetes intcgrados (con Ia posible excepción del Lisa 7/7), realiza pronósticos estos paquetes integrados (con la posible excepción sí mismo, pero uno puede modificarse con facilidad para realizarlas. completos por Si mismo, pero cada uno puede modificarse con facilidad para realizarlas. completos Algunas adaptaciones que se pueden hacer a Lotus 1-2-3 son: 1-2-3 Algunas adaptaciones que sc pueden hacer • • • • • • ForeCaic ForeCa1c de Business Forecast Systems Forecast! de Intex Solutions, Inc. lntex lnc. Forecast/DSS y Lotus-FORM AN, ambos de John Willey & Sons, Inc. Lotus-FORMAN, & Sons, lnc. Add a Stat y Multitit, ambos de Abacus Scientific Software Company Abacus Scientific Software Company STAT-PACKETS de Statpac, Inc. de Statpac, lnc. Spreadsheet Forecaster de Levenbach Associates. Associates. exposición Para una excelente exposición sobre las adaptaciones de pronóstico para Lotus 1-2-3, adaptaciones pronóstico consulte la sección de software de los ejemplares de marzo y junio de 1992 del International sección de software de los ejemplares de marzo yjunio de 1992 del International Journal 01 Forecasting. Journal of Forecasting.77 Para otra excelente exposición sobre los programas en general de pronóstico empreexcelente exposición programas general de pronóstico empresarial, consulte el artículo "Choosing and Using Business Forecasting Software" el sarial, consulte el artIculo "Choosing and Using Business Forecasting Software" en el de 1985 de Creative Computing. 8 ejemplar de enero de 1985 de Creative Computing.8 Forecasting", PC Magazine, 1989), pp. 225-241. 5 "Statistical Analysis Forecasting", PC Magazine, Vol. 8(5) (marzo, 1989), pp. 225-24 1. 6 C. Beaumont, F. Mahmoud y V. F. McGee, "Microcomputer Forecasting Software: A Survey", Jouma! 6 C. Beaumont, E. Mahmoud E. McGcc, Forecasting Software: A Survey", Journal ofForecastin& Vol. 4 (1985), pp. 305-311. ofForecastir-z&.Vol. 4 (1985), pp. 305-311. 7 L. Tashnian-y R. Whitycornhe, "Software Rcviews", lnternationa! Jouma! ofForecasting, Vol. 7 (1992), Tashman--y R. Whitycombe, "Software Reviews", International Journal of Forecasting, pp. Y Vol. 8 (1992), pp. "21·127. pp. 543-553 y Vol. 8 (1992), pp. 121-127. 8 K. Keating, "Choosing and Using Business Forecasting Software", Creative Computing, 11 (1) (enero, 8 K. Keating, "Choosing and Using Business Forecasting Software", Creative Computing, 11 (1) (enero, 1985), pp. 119-135. 119-135. 1985), Capítulo 1 CapItulo 1 Caso de estudio Caso de estudo 11 RESUMEN El propósito del pronóstico consiste en reducir el margen de incertidumbre dentro del que consiste El propósito se deben efectuar los juicios de la adrninistración. Este propósito sugiere dos reglas se deben efectuar los juicios de la administración. Este propósito sugiere dos reglas principales a las que debe adherirse el proceso de pronóstico: que debe adherirse el proceso de pronóstico: conecto l. El pronóstico debe ser técnicamente correcto y producir predicciones precisas. 2. El procedimiento de pronóstico y sus resultados deben ser presentados con efectividad a la adrninistración, de modo que los pronósticos se utilicen en ci proceso de toma de administración, de modo el decisiones en beneficio de la empresa; también los resultados deben ser justificados con Ia empresa; tarnbién los resultados deben serjustificados con su costo-beneficio. base en su costo-beneficio. última consideración a menudo se malinterpreta y puede frustrante los La ültirna consideración a menudo se malinterpreta y puede ser frustrante para los pronosticadores profesionales. Aun cuando los pronósticos se usen en beneficio de pronosticadores profesionales. Aun cuando los pronósticos se usen en beneficio de la empresa, deben ser utilizados por aquellos que tienen la autOlidad en la toma de decisiones. utilizados por aquellos que tienen Ia autoridad en la toma de decisiones. De este hecho surge la pregunta de lo que podrIa liamarse Ia "política" de los pronósticos. podría llamarse la "poiltica" pronósticos. Con frecuencia, los gastos sustanciales y en ocasiones mayores y la distribución de recursos fi-ecuencia, de recursos dentro de la empresa recaen sobre la vision de Ia administraciOn en los sucesos futuros. empresa recaen sobre la visión de la administración los sucesos futuros. dentro Corno el movirniento de recursos y ci poder dentro de la organización se basa menudo Como el movimiento de recursos y el poder dentro de la organización se basa a menudo en el rumbo que se percibe del futuro (pronósticos), no es de sorprender que haya una cierta haya una cierta cantidad intliga alrededor del proceso de pronóstico. Esta consideración subraya la cantidad de intriga airededor dcl proceso de pronóstico. Esta consideración subraya la importancia de la segunda regla primaria: los pronósticos generados dentro de Ia empresa primaria: pronósticos generados la empresa importancia de deben ser entendidos y apreciados por quienes toman las decisiones, de manera que deben ser entendidos y apreciados por quienes toman las decisiones, de manera que encuentren su via en Ia administración de la empresa. la administración la empresa. encuentren vía resto de este libro aborda varios modelos y procedimientos pronóstico. El resto de este libro aborda varios modelos y procedirnientos de pronóstico. En primer término se presenta un repaso de los conceptos estadisticos básicos, seguido de una repaso los conceptos estadísticos una exposición de los procedimientos de análisis de regresión. A continuación se expone el procedimientos de análisis de regresión. continuación expone el exposición de pronóstico con series de tiempo datos y en los siguientes capítulos, técnicas más pronóstico con series de tiempo de datos y en los siguientes capItulos, técnicas más avanzadas predicción. El capítulo final del libro trata sobre el pronóstico avanzadas de predicción. El capItulo final del libro trata sobre ci proceso de pronóstico y su relaciOn con quienes toman las decisiones en la enipresa. la empresa. su relación con quienes tornan las ESTUDIO 1.1 CASO DE ESTUDIO 1.1 MR. MR. TUX John 101m Mosby es propietario de varias tiendas Mr. Tux de renta de ropa de etiqueta, la mayorIa de ellas mayoría se ubican en las areas de Spokane y Seattle, Washington.9 Su tienda de Spokane también hace carnisas áreas y Washington. 9 hace camisas cuales distribuye a las tiendas de renta a lo largo del país. Ya que la actividad de renta de etiqueta, las cuales distribuye a las tiendas de renta a lo largo del pals. Ya que Ia actividad de renta varIa de tiempo en tiempo dcbido a graduaciones, reuniones y otras actividades, John sabe que su varía tiempo debido a graduaciones, reuniones otras actividades, 10hn sabe que su la es de temporada. A le gustarIa medir este efecto de temporada, tanto para ayudarle negocio es de temporada. A élél le gustaríamedir este efecto de temporada, tanto pam ayudarle en la adrninistración de su negocio como pam utilizarlo en la renegociación de pagos de su préstamo con el banco. Ia renegociación de pagos de su préstarno con ci banco. administración para 9 Estamos en deuda con John Mosby, propietario de las tiendas de renta de ropa Mr. Tux, por su ayuda Estarnos en deuda con John Mosby, propietario de las tiendas de renta de ropa Mr. Tux, en la preparación de este caso. John fue estudiante nuestro, y aunque años más tarde no recordó los detailes la preparación este caso. John fue estudiante nuestro, y aunque años más tarde no recordó los detalles específicos de las técnicas de pronóstico, sabia que con alguna ayuda podria desarroliar diversos modelos de especiticos de técnicas pronóstico, sabía que con ayuda podría desarrollar diversos modeios de pronóstico ayudaran. sensación latente dc que se podia extraer información itiI pronéstico que le ayudaran. Esta sensación latente de que se podía extraer información útil de datos sin procesar es, es, en nuestra opinlén, ci veidadcro valor de los estudios cuantitativos en ci curricu]o de administración. nuestra opinión, el verdadero valor de los estudios cuantitativos en el currículo administración. 12 Introducción pronósticos IntroducciOn a los pronOsticos Capítulo 1 Aún de mayor interés para John es encontrar una forma de pronosticar sus ventas mensuales. Su Aiin de interés para John es encontrar una forma de pronosticar sus ventas mensuales. Su continúa creciendo, lo que a su vez requiere de mayor capital y deuda a largo John tiene negocio continua creciendo, lo que a su vez requiere de mayor capital y deuda a largo plazo. John tiene fuentes para ambos tipos de financiamiento de su crecimiento, pero los inversionistas y los bancos están inversionistas y los bancos están f0n11a concreta de pronosticar ventas futuras. Aunque confían en John, su opinión interesados en una forma concreta de pronosticar ventas futuras. Aunque confian en John, su opinion de el de que el futuro del negocio "Se ve estupendo" no les convence del todo. dcl "se ye estupendo" Como primer paso en la eiaboración de un modelo de pronóstico, John se Como primer paso en Ia elaboración de un modelo de pronóstico, John se dirige a una de sus sus empleadas, Perot, últimos años. En los empleadas, Virginia Perot, para recopilar los datos de ventas mensuales de los ültimos años. En los capitulos que siguen, se utilizan varias técnicas de pronóstico con estos datos capítulos que siguen, se utilizan varias técnicas de pronóstico con estos datos para Mr. Tux. Los Tux. Los esfuerzos se concretan en ei capItulo 11 y John Mosby intenta elegir Ia técnica de pronóstico que mejor la se concretan en el capítulo 11 cubra sus necesidades. CASO DE ESTUDIO 1.2 1.2 CREDIT CONSUMER CREDIT COUNSELING Consumer Credit Counseling (CCC) (Consultoría dc crédito al consumidor), es una corporación privada (Consultorla de crédito al consumidor), es una corporación privada sin fines de lucro, fundada en 1982.10 Los objetivos de CCC eran proporcionar asistencia a los CCC eran proporcionar asistencia los sin fines de lucro, fundada en 1982. 10 Los objetivos consumidores en la plancación seguimiento de presupuestos, asistir a los consumidores en consumidores en Ia planeación y seguirniento de presupuestos, asistir a los consumidores en la aJTcglos morosas impartir cursos negociación de arreglos con los otorgantes de crédito para cubrir obligaciones morosas e impartir cursos sobre Ia administración de dinero. la adrninistración La consultoria financiera privada se proporcionaba sin costo a familias o individuos que tienen consultoría financiera privada se proporcionaba sm costo familias individuos que tienen querlan mcjorar hahilidad en ci manejo de dinero. Los programas educativos dificultades financicras o que querían mejorar su habilidad en cl manejo de dinero. Los programas educativos financieras impartlan escuelas, grupos comunitarios y empresas. ofrecia un programa de administración de dinero se impartían a escuelas, grupos comunitarios y empresas. Se ofrecía un programa uria altemativa a la bancarrota. A través de este programa, CCC negociaba con sobre manejo de deuda como una alternativa a la bancarrota. A través de este programa, CCC negociaba con a1Teglos especiales de Luego el cliente hacía un pago palic los acreedores por parte del cliente para obtener arreglos especiales de pago. Luego el cliente hacIa un pago global a CCC, y ésta a su vcz distribuIa este pago entre los acreedores. ésta a su vez distlibuía pago entre los acreedores. tenía CCC tenla una mezcla de personal pagado y voluntario; de hecho, el personal voluntario superaba niezcla voiuntario; el personal voiuntario superaba ino. Un grupo de siete empleados pagados cubría las necesidades de al pagado en proporción de tres a ,Uno. Un grupo de siete empleados pagados cubrIa las necesidades de consultorías. servicio administración y de oficina y certa de la mitad de las consultorlas. La otra mitad de este servicio era adrninistración y de oficina y cerca de mitad de por veintiún consultores cubierta por vei ntiuin consultores voluntarios. dependía principalmente de servicios. CCC dependia principalmente de los fondos corporativos para cubrir su operación y servicios. cubrir su El "Programa de distrihución equitativa de fondos" permitió que los acreedores que recibieron pagos distribución equitativa de fondos" permitió que los acreedores que recibieron pagos provenientes de los programas de administración de deuda, donaran a CCC una parte de los fondos que de deuda, donaran a CCC una parte de los fondos que programas. les fueron cubiertos a través de estos programas. Una gran parte dcl apoyo corporativo provenia de una utilidad local, Ia que proporcionaba fondos proporcionaba fondos palie del provenía de una utilidad local, la el puesto de un consultor de tiempo completo, asI como espacio de oficina para dar para sostener ci pllest() de 1m consultor de tiempo completo, así como espacio de oficina para dar consultoría las oficinas. consultorIa en todas las oficinas. Además, las cuotas de los clientes eran una fuente de fondos. Los clientes que participaron en la administración de deuda pagahan una cuota mensual de 15 dólares ayudar a cubrir el costo adrninistración de deuda pagaban una cuota mensual de 15 dólares para ayudar a cubrir ci costo administrativo dci programa. (Las cuotas se redujeron o se exentaron a los clientes que financieramente del no podIan cubrirlas.) podían Estos antecedentes se empierán en los capítulos sucesivos, al enfrentar CCC dificultades relacioemplerán capItulos al con el pronóstico estratégicas. nadas con ci pronOstico de variables estratégicas. 10 Estarnos en deuda con Mark Harnishfeger, Director Ejecutivo de Consumer Credit Counseling de 10 Estamos en deuda con Mark Hamishfeger, Director Ejecutivo de Consumer Credit Counseling Spokane y con Dorothy Mercer, Presidente de la Mesa Directiva, por su ayuda en Ia operación de este caso. la operación Spokane y con Dorothy Mercer, Presidente de la Mesa Directiva, por ayuda este caso. fue estudiante nuestra la maestría en administración de consultor de tiempo completo, así como Dorothy fue estudiante nuestra en Ia maestria en adrninistración de consultor de tiempo completo, asI como espacio de oficina para ilar consultorla en todas las oficinas. de oficina para dar consultorla en todas las oficinas. Versión estudiantil de Forecast PIus VersiOn estudiantil de Forecast Plus 13 VERSIÓN ESTUDIANTIL DE FORECAST PLUS VERSION ESTUDIANTIL DE FORECAST PLUS Forecast Plus es un paquete completo de pronóstico estadIstico que maneja todas las paquete completo pronóstico estadístico que maneja todas las Forecast Plus es fases del anáiisis de pronósticos. La version estudiantil contiene un disco de adminisanálisis de pronósticos. La versión estudiantil contiene un disco de adminisfases datos (Data Management (Main System tración de datos (Data Management Disk) y un disco del sistema principal (Main System Disk). El paquete se diseñó para minimizar Ia necesidad de intercambiar discos. El disco del la sistema principal contiene todos los programas de pronóstico. El disco de administración administración sisterna principal contiene todos los programas de pronóstico. El de datos contiene todos los programas necesarios para crear, modificar y manipular archiprogramas así conjunto completo de programas de exploración. vos de datos asI como un conjunto completo de programas de exploración. Si usted utiliza una unidad de disco duro, podrá copiar en él todos los programas y utiliza unidad disco duro, podrá los programas Si tendrá que intercambiar discos. no tendrá que intercambiar discos. Los Los pasos para ejecutar Forecast Plus son los siguientes: ejecutar Forecast Plus son los siguientes: l. Cree un archivo de datos. 2. Use ci paquete de expioración para desarrollar accesos a los datos. el exploración desalTollar 3. Seleccione una técnica de pronóstico apropiada. apropiada. 4. Utilice ci paquete de pronóstico para modelar los datos. el 5. Ejecute ci modelo de pronóstico hasta encontrar los mejores parãrnetros. el parámetros. paso en cualquier procedimiento pronóstico consiste en recopilar datos El primer paso en cuaiquier procedimiento de pronóstico consiste en recopilar datos la computadora. El de administración de permitirá crear, capturarlos y capturarlos en Ia computadora. El disco de administración de datos le permitirá crear, archivos de datos. contener ya sea una sola modificar y transformar archivos de datos. Dichos archivos pueden contener ya sea una sola variable múltiples variables. Los programas de administración de datos son al mismo variable o im'iltipies variables. Los programas de administración de datos son al mismo complejos fáciles de usar. tiempo compiejos y fáciles de usar. segundo es tener una comprensión los datos. Diferentes técnicas El segundo paso es tener una cornprensión general de los datos. Diferentes técnicas apropiadas di ferentes los datos (por ejemplo, de pronóstico son apropiadas para diferentes tipos de patrones en los datos (por ejemplo, estacionales). exploración (en el disco de administración vs. estacionales vs. no estacionales), El paquete de exploración (en ci disco de administración importante Forecast Plus, de datos) es una parte muy importante de Forecast Plus, ya que le ayuda a comprender los Ic ayuda los datos, modo que elegir de pronóstico adecuada. patrones en los datos, de modo que pueda usted eiegir una técnica de pronóstico adecuada. último paso consiste en modelar los datos con un procedimiento de pronóstico El ñltimo paso consiste en modelar los datos con un procedimiento de pronóstico elegir diferentes específico. El paquete de pronóstico Ic da a eiegir entre trece diferentes procedimientos de especIfico. El paquete pronóstico le pronóstico. varían complejidad, técnica aplicabilidad, dependiendo del conjunto pronóstico. Estos varlan en compiejidad, técnica y apiicabilidad, dependiendo del conjunto cuantitativo consiste en que se esté analizando. Con frecuencia, el de datos quc se esté analizando. Con frecuencia, ci pronóstico cuantitativo consiste en un método de prueba y error para encontrar buenas constantes de atenuación; asI que es posible así que requiera muchas veces procedimiento específico de pronóstico antes que requiera ejecutar muchas veces un procedimiento especIfico de pronóstico antes de descubtir modelo. descubrir el mejor modelo. Plus almacenados secuencial Todos los archivos de Forecast Pius están aimacenados en formato ASCII secuencial delimitado comas: de ahí que, si es usted delimitado por comas: de ahI que, si es usted un programador, podrá con facilidad leer los programador, podrá con facilidad leer los datos con su propio programa en BASIC. Tarnbién podrá utilizar los archivos creados con datos También podrá utilizar los archivos creados con cualquier archivo que esté otros programas. Forecast Plus tiene la capacidad de leer cualquier archivo que esté otros programas. Forecast Plus tiene ia capacidad de almacenado en f01111ato ASCn secuencial deiimitado por comas, como archivos aimacenado en fonnato ASCII secuencial delimitado por comas, como los archivos que dicho fonnato. dBase almacena en dicho formato. 14 Introducción a los pronósticos lntroducción Capítulo 1 CapItulo 1 Introducción inicializar Forecast Plus en sistema típico de dos unidades requiere Para inicializar Forecast Plus en un sisterna tIpico de dos unidades de disco, se requiere los siguientes pasos: seguir los siguientes pasos: 1. Inserte el disco del sistema operativo (DOS) en la unidad A y reinicialice Ia computadora. ci del sisterna operativo (DOS) en launidad A yreinicialice la 2. Jntroduzca Ia fecha y hora. (Forecast Plus utilizará esa fecha.) En Ia pantalla aparece el Introduzca la fecha y hora. la fecha.) indicador de comandos A. 3. Insetie el Data Management Disk de Forecast Plus en Ia unidad A. la Inserte ci 4. Inserte un dico formateado en la unidad B. 5. Teclee FP. 6. En Ia pantalla aparecer5 ci ment'i principal de Forecast Plus. la pantaila aparecerá el menú Plus. menú El menu principal Forecast Plus está dividido en cuatro componentes. El menú principal de seiección se ye Forecast Plus esti dividido en cuatro componentes. El menu principal de selección se ve la siguiente manera: de Ia siguiente manera: 1. Data Management (Administración de datos) Manngement 2. Expioratoiy Package (Paquete de expioración) ExploratOlY exploración) 3. Forecasting Analysis (Anáiisis de pronOsticos) Analysis (Análisis de pronósticos) 4. End of the Program (Fin del programa) ofthe Puede usted elegir cuaiquiera de las cuatro secciones tecleando ci niirnero corresponcualquiera el número corresponterminar el programa regresar al diente y presionando <Enter>. Si desea terminar ci programa Forecast Plus y regresar a! diente presionando <Enter>. Si sistema operativo (DOS), teclee ci rn'imero cuatro (4). Forecast Pius terminará y el sisterna teclee el número cuatro (4). Plus y el sistema sistenia regresará a DOS. regresará DOS. PRONÓSTICO MEDIANTE HOJAS DE CAL CULO PRONOSTICO MEDIANTE HOJAS DE CÁLCULO Los paquetes de hojas de cáiculo como Lotus 1-2-3, Excel y Quattro Pro se emplean en la cálculo 1-2-3, Excel emplean la Los paquetes solución de diversas aplicaciones en los negocios. Debido a que almacena gran solución de diversas aplicaciones en los negocios. Debido a que se almacena una gran cantidad de las hojas de cálculo, es necesario que aprendamos cómo usarlas de cantidad de datos en las hojas de cñlcuio, es necesario que aprendamos córno usarias de el proceso de pronóstico. manera eficiente en ci proceso de pronóstico. En muchos de nuestros ejempios usaremos Lotus 1-2-3, ya que Ia mayorIa de los nuestros ejemplos usaremos Lotus 1-2-3, ya la mayoría los En muchos archivos de Lotus se pueden leer en otros paquetes de pronóstico. La pantaila principal de otros paquetes de pronóstico. La pantalla principal de archivos 1-2-3 (que se muestra en Ia fig. 1 .1) contiene una hoja de cálcuio tabular que se utiliza para la fig. 1.1) contiene una cálculo se utiliza para 1-2-3 almacenar datos. aiiiiacenar y organizar datos. hoja de cálculo consiste en cuadrícula compuesta de columnas renglones La hoja de ca/cub consiste en una cuadrIcula compuesta de columnas y rengiones llenan etiquetas números. A Ia intersección de cada columna y renglón se que se Ilenan con etiquetas y nImieros. A la intersección de cada colwnna y renglón se le denomina ce/da. Cada celda respresenta una posición uinica para almacenar una purción de celda. respresenta posición única para aimacenar una porción de PronOstico mediante Pronóstico mediante hojas de cálculo modo Indicador de modo / 15 Menu principal Menú principal de 1-2-3 1-2-3 \ \ Apuntador Al: ---------------'-------------~ MENU: Al: MENU: de menu menú --,..... Worksheet Range Copy Move File Move File Print Graph Data System Add-In Data Quit Column Erase Titles ~ ~ Global Column Erase Window Status Insert Delete Window Status Page Leam Learn Cornandos Comandos -W BCD lE PO H B D F C F H G sublnenú .... del subrnenii Worksheet (hoja) (hoja) ~ 4 5 ./ ~ Sy 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 13-Aug-91 03:02 PM 13-Aug-91 03:02 Figura 1.1 Figura 1.1 Hoja de cálculo Lotus 1-2-3 Lotus 1-2-3 datos. Las celdas se identifican mediante la letra de la columna seguida del námero del identifican mediante la letra de columna seguida del número datos. Las celdas renglón. Por ejemplo, a la celda ubicada en la intersección de la columna A y el renglón 1 ubicada renglón. ejemplo, Ia intersección de la columna A y figura 1.1 que celda actual Al se le denomina A l. Observe en la figura 1.1 que la celda actual A1 está resaltada y que el denomina Al. Observe apuntador de celda está ubicado ahI. Además, en la primera Ilnea se indica que la dirección ahí. línea que la dirección de la celda actual es Al. actual es El panel de control es un area de tres ilneas en Ia parte superior de la pantalla, que control es un área de tres líneas en la parte superior pantalla, El presenta información sobre la celda actual y el menu principal. información sobre actual menú presione la (diagonal). menú principal de Para activar el mená principal, presione Ia tecla / (diagonal). El menu principal de Para activar menú 1-2-3, a partir del cual se introducen todos los comandos, se exhibirá en la segunda lInea introducen la segunda línea 1-2-3, a del (véase fig. 1.1). Una barra rectangular, denominada apuntador de rnená, aparece resaltando fig. rectangular, denominada apuntador menú, aparece resaltando al comando Worksheet (hoja). Los cornandos posibles son: Los comandos son: al Worksheet (Hoja) Range (Rango) Copy (Copiar) Move (Mover) File (Fichero) Print (Imprimir) Graph (Gráfico) Data (Datos) System (Sistema) Quit (Salir) la Comandos que afectan a toda Ia hoja Comandos que afectan partes especIficas de Ia hoja específicas la Copia una celda o Ufl rango de celdas 0 un Desplaza una celda o un rango de celdas Comandos que afectan a archivos almacenados o por almacenar en disco que afectan a archivos almacenados o por almacenar en disco Imprime una hoja de cálculo Comandos que exhiben en forma gráfica datos de la hoja de cálculo datos de la hoja de cálculo Comandos para manipulación especial de datos sistema (sólo en la versión 2) Regresa temporalmente al sisteina operativo (DOS) (solo en la version 2) Tennina Ia sesión de 1-2-3 y regresa al sistema principal Termina la La tercera lInea es un submenú que enlista los comandos disponibles para cualquiera línea es sub,nená los comandos disponibles cualquiera 1.1 de los comandos del menu principal que esté resaltado. La figura 1.1 muestra los comandos menú de submenü disponibles a través del comando principal Worksheet (Hoja). submenú disponibles principal Worksheet (Hoja). 16 lntroducciOn Introducción a los pronOsticos pronósticos Capítulo 1 CapItulo 1 Lotus utiliza Ia tecla de función Fl como tecla de ayuda. Siempre tenga dudas Lotus utiliza la tecla de función FI corno tecla de ayuda. Siempre que tenga dudas sobre un cornando, oprima FI. comando, FL La sección "Pronósticos mediante hojas de cálculo" al final del capitulo 3, muestra sección "Pronósticos mediante hojas de cálculo" al final capítulo 3, muestra cómo introducir datos en una hoja de cálculo. Las secciones al final de Ia mayorIa de los cálculo. Las secciones final de la mayoría de los cómo introducir datos capitulos capítulos muestran cómo utilizar las hojas de cálculo para pronosticar. las hojas de cálculo para pronosticar. INTRODUCCIÓNAL PAQUETE INTR9DUCCION AL PAQUETE DE CÓMPUTO MINITAB DE COMPUTO MINITAB Minitab es uno de los paquetes de software más populares que se utilizan para el análisis los paquetes de software más populares que se utilizan para el análisis Minitab estadístico. Este paquete, disponible tanto para macro como para microcomputadoras, es macro como para microcomputadoras, es estadIstico. Este paquete, disponible uno de los paquetes de cómputo a los que se hace referencia a lo largo del libro. Se supone Se supone que se ejecutó Minitab para cada ejemplo de Minitab que se presenta en el texto. Al tener Minitab cada ejemplo de Minitab que se presenta en ci texto. Al tener éxito una función, aparece en la pantalla el indicador de comandos MTB >. El tipo de comandos MTB >. tipo de éxito una función, aparece en pantalla indicador información que Minitab espera que usted teclee, le será solicitado por el información que Minitab espera que usted teclee, le será solicitado por ci indicador comandos en el extremo izquierdo de la pantalla. de cornandos que aparezca en el extrerno izquierdo de la pantalla. Minitab reconocido estructura comandos directos es lo que Minitab ha sido reconocido por su estructura de cornandos directos y esto es lo que lo largo del texto. No obstante, para mejorar facilidad Minitab se presentará a lo largo del texto. No obstante, para mejorar la facilidad de uso, Minitab tiene una nueva version para microcomputadoras denominada Release 9 (Version 9), la cual versión denominada Release 9 (Versión 9), la cual presenta rnenñs y cuadros de diálogo, manteniendo el lenguaje de comandos para agregar presenta menús cuadros diálogo, manteniendo el lenguaje de comandos para agregar velocidad. flexibilidad y velocidad. cálculo Minitab la clave para utilizar este programa. La comprensión de la hoja de cálculo Minitab es Ia dave para utilizar este programa. contiene columnas (variables) renglones (observaciones). columnas les La hoja contiene columnas (variables) y renglones (observaciones). A las coiurnnas se les nombra CI, C2, etc., se les puede asignar también nombres de variables como ventas, nombra Cl, C2, etc., yyse les puede asignar también nombres de variables como ventas, de comandos a discutir se referirán de cálculo típica precio o peso. Los ejemplos de comandos a discutir se referirán a una hoja de cálculo tipica EXAMPLE.X:XX, la manera siguiente: de nombre EXAMPLE.XXX, de la manera siguiente: CI Cl l COLUMNAS 0 VARIABLES COLUMNAS O VARIABLES C2 C3 C4 CS C5 C6 Renglones u observaciones 2 3 3 4 4 S 5 6 Introducción al de cómputo IntroducciOn al paquete de cOmputo Minitab 17 Como ejemplo, se presentan los comandos de Minitab para resolver el siguiente caso: considérense los siguientes valores de X- Y. considérense los siguientes valores de X- Y. x 5 5 y Y 4 4 9 9 8 8 7 7 3 3 O 0 5 5 3 3 10 10 2 2 9 9 1. Encontrar las siguientes surnas: LX; LY, LXY sumas: X, Y, Lk'Y 2 2. Mostrar que LX no es igual a (Lk)2 igual a (LXf MTB MTB DATA DATA MTB DATA DATA MTB MTB 'EXAMPLE.PRN' > > OUTFILE 'EXAMPLE.PRN' > C1 > SET Cl 2 > 5 7 3 o 10 2 >5 3 0 > END > END > SET > SET C2 > 4 9 8 5 3 9 >4 9 8 5 3 9 > END > END > LET C3 > LET C3 = C1*C2 > > PRINT C1-C3 7 C2 Fila Fila 1 1 Cl Cl 5 5 7 7 C2 4 4 9 9 C3 2 2 3 3 3 3 O 0 10 10 8 8 5 5 3 3 9 9 20 63 63 24 O 0 30 30 4 5 5 6 6 2 2 18 18 MTB MTB MTB MTB Ki K1 K2 K3 K3 MTB MTB K1 SUM (C1) > LET Ki = SUM(C1) > K2 SUM(C2) > LET K2 = SUM(C2) > > LET K3 = SUM(C3) K3 SUM(C3) > > PRINT K1-K3 > 27.0000 27 .0000 38.0000 155.000 EXAMPLE.DAT' C1-C3 > WRITE 'EXAMPLE.DAT' C1-C3 > > STOP > STOP 18 Introducción a los pronOsticos lntroducción a los pronósticos Capítulo 1 Capitulo 1 todos los • El comando OUTFILE se utiliza para almacenar todos los comandos y resultados que se muestran en la pantalla en el archivo especificado con el nombre EXAMPLE.PRN, con el nombre EXAMPLE.PRN, la hasta terminar Ia sesión de Minitab con el comando STOP. • El comando SET se emplea para introducir datos en la columna 1 (Cl) de la hoja de comando emplea introducir datos en Ia columna (CI) de la hoja de cálculo. datos, dejando por lo menos un espacio • El subcomando DATA se usa para introducir los datos, dej ando por lo menos un espacio entre los valores de los datos. • El subcomando END se utiliza para indicar que está completo el registro de datos para l. Ia la columna 1. El comando LET se emplea para realizar cálculos aritméticos mediante expresiones • comando LET se emplea para realizar cálculos aritméticos mediante expresiones y almacenar el resultado en C3. También se algebraicas corno multiplicar Cl por C2 y almacenar el resultado en C3. También se algebraicas como multiplicar Cl puede utilizar para modificar un archivo de datos. Por ejemplo, cambiar el valor del puede utilizar para modificar un archivo de datos. Por ejemplo, cambiar el valor del renglón 6, columna 2, de 9 a 64. 64. MTB MTB > LET C2 (6) = 64 64 > LET C2 • El comando PRiNT se usa para imprimir el contenido de las columnas 1 a 3. PRINT se imprimir el las 1 a 3. emplea para sumar (SUM) la columna CI el resultado • El comando LET se emplea para sumar (SUM) la columna Cl y almacenar el resultado en el renglón K 1. renglón Kl. • El cornando WRITE guarda los datos en una hoja de cálculo de nombre de cálculo de nombre El comando WRITE guarda los datos en una EXAMPLE.DAT. Para su uso futuro, la hoja podrá siempre accesarse mediante el siempre accesarse mediante EXAMPLE.DAT. Para su uso futuro, comando READ EXAMPLE.DAT Cl-C3. cornando C1-C3. INTRODUCCIÓN AL PAQUETE DE CÔMPUTO SAS INTRODUCCIÔN AL PAQUETE DE CÓMPUTO SAS Statistical Analysis System (SAS) (Sistema de Análisis EstadIstico) es uno El paquete Statistical Analysis System (SAS) (Sistema de Análisis Estadístico) es uno de negocios los paquetes de software más populares que se emplean en la industria y los negocios para más populares que se emplean en Ia industna estadístico. macro corno para microcomputadoras, éste es el análisis estadIstico. Disponible tanto para macro como para microcomputadoras, éste es paquetes cómputo los referiremos uno de los paquetes de córnputo a los que nos referiremos a lo largo del libro. un problema estadIstico con SAS, se deben primero Para resolver tin problema estadístico con SAS, se deben primero definir los datos y los procedimientos estadísticos Al ejecutar progradespués especificar los procedimientos estadIsticos (PROCS) a utilizar. Al ejecutar programas SAS se dehen observar ciertas reglas. Algunas de las reglas básicas de SAS son las mas SAS deben observar ciertas reglas. Algunas de las reglas básicas de SAS son siguientes: 1. Las declaraciones de SAS deben terminar siempre con un punto y coma (;). tenninar 2. Los nombres deben comenzar con una letra y tener ocho o menos caracteres. 3. Las declaraciones en SAS tenninan en la columna 72, las que excedan dicha columna declaraciones SAS terminan en columna 72, las que excedan dicha se deben continuar en la siguiente ilnea. línea. cómputo SAS Introducción al paquete de cómputo SAS 19 4. Se deben definir los datos antes de ejecutar un procedimiento. Las lIneas que contienen m procedimiento. Las líneas que contienen datos no terminan con un punto y coma, pero es recomendable incluir el punto y coma al final de la ültima imnea de datos. de la última línea 5. Se pueden realizar diversos procedimientos agregando declaraciones de procedimiento procedimiento mñltiple. múltiple. 6. Se debe incluir el punto decimal a! introducir datos con decimales (1.89). al decimales (1.89). 7. En un programa SAS se deben incluir declaraciones de tipo JCL (lenguaje de control declaraciones tipo trabajos, siglas inglés), cuales específicas para un sistema de trabajos, por sus siglas en ingles), las cuales son especIficas para un sistema en particular, ya que permiten que el programa SAS se ejecute correctamente. El siguiente ejemplo muestra el uso de cornandos SAS. Considérense los siguientes valores comandos de X-Y. deX-Y. x x 5 y Y 4 4 9 8 8 7 3 3 O 0 5 5 3 3 10 2 9 l. Encontrar las siguientes sumas: LX; L.Y, YXY EY, ITY. 2. Demostrar que Y.X2 no es igual aa(EX)2. Demostrar que LX2 igual (IXf L¡ 54 9 79 38 3 8 O 5 05 10 3 3 2 9 29 $ SAS $ SAS OPTIONS PAGESIZE=60 LINESIZE8O; OPTIONS PAGESIZE6O LINESIZE=80; TITLE "SAS SOLUTION TO EXAMPLE 0"; O"; TITLE "SAS DATA EXAMPLE; INPUT X Y; X Y; XYX*Y; Xy=x*y; CARDS; 5 7 PROC PRINT DATA=EXAMPLE; PROC PRINT DATAEXAMPLE; SUM X Y XY; X Y XY; ENDSAS; 20 Introducción a los pronOsticos a los pronósticos CapItulo I Capítulo 1 • La declaración OPTIONS indica que el tamaño de página de la salida será de 60 líneas OPTIONS el tamaño Ia salida será de 60 lineas y que cada lInea tendrá 80 espacios. cada línea espacios. • La declaración TITLE da nombre al programa SAS. • La declaración DATA proporciona el nombre del archivo de datos. datos. las • La declaración INPUT nombra las variables e indica el orden correcto de los distintos campos en las líneas variables (X y Y), y que se creará campos en las Ilneas de datos. Nótese que se leerán dos variables (Xy 1'), y que se creará Nótese que leerán una nueva variable multiplicando éstas (XY=X*Y). ima nueva variable multiplicando éstas (XY=X*Y). • La declaración CARDS indica a SAS que a continuación se presentan los datos de declaración CARDS indica que a continuación se presentan los datos de líneas datos. entrada. Las siguientes seis ilneas contienen los valores de los datos. declaración PROC PRINT produce un listado de los datos en archivo EXAMPLE. • La declaración PROC PRINT produce un listado de los datos en el archivo EXAMPLE. • La declaración SUM especifica las variables a totalizar. totalizar. primera línea es declaración de tipo JCL. resultado de la ejecución este La primera Ilnea es una declaración de tipo JCL. El resultado de la ejecución de este programa muestra la tabla 1.1. programa SAS se muestra en la tabla 1.1. 1.1 Tabla 1.1 üBS OBS 1 1 Salida ejemplo Salida de SAS para el ejemplo X X y Y XY 20 63 24 O 0 30 5 5 7 4 9 2 3 3 3 3 O 0 8 8 5 5 4 4 5 6 10 2 2 27 3 3 9 38 18 155 BIBLIOGRAFíA BIBLIOGRAFIA ADAMS, F. G.111C Business Forecasting Revolution. Nueva York: Oxford University Press, 1986. ADAMS, F. G. The Business Forecasting Revolution. Nueva York: Oxford University BEAUMONT. c., MAHMOUD, y y MCGEE, E. "Microcomputer Forecasting Software: a BEAUMONT, C.,MAHMOUD, E. E. MCGEE, V. V. E. "Microcomputer ForecastingSoftware: a Survey." Journal of Forecasting, 4(1985): 305-311. ofForecasting, 4 (1985): 305-311. GEORGOFF.D. M. y y MARDICK, R. G. "Manager's Guide of Forecasting." Harvard 1 GEORC;OFF.D. M. MARDICK, R. G. "Manager's Guide ofForecasting." Harvard Business Review, I 110-120. (1986): 110-120. HOGARTII, R. M. Y MAKRIDAKIS, S. S. "Forecasting and Planning: An Evaluation." Management Science, HOGARTI!, R. M. y MAKRIDAKIS,"Forecasting and Planning: An Evaluation." Management Sóence, 27(2)(1981): 115-138. 27 (2) (1981): 115-138. KEATING, K. "Choosing and Using Business Forecasting Software." Creative 'omputing, 11 (1) (1985): KEATING, K. "Choosing and Using Business Forccasting Software." Creative Computing, 11(1) 119-135. MAK,RlDAKIS, S. "Thc Art and Science ofForecasting". International Journal ofForecasting, 2 (1986): MAKRIDAKIS, S. "The Art and Science of Forecasting". Intern ational Journal ofForecasting, 2 (1986): 15-39. BIBLIOGRAFIA BIBLIOGRAFíA 21 MAKRlDAKIS, S. "Forecasting in the 21 st Century." International Journal ofForecasting, 7 (2) (1991): MAKRIDAKIS, S. "Forecasting in the 21St Century." International JournalofForecasting, 7 (2) (1991): 123-126. MAHMüUD, E., RICE, G., McGEE, V. E. y BEAUMüNT, C. "Mainframe Multipurpose Forecasting MAHMOUD, E.,RICE, G., McGEE, V. E. y BEAUMONT, C. "Mainframe Multipurpose Forecasting Software: ofForecasting, 5 (1986): 127-137. Software: A Survey." Journal ofForecasting, 5 (1986): 127-137. MAHMOUD, E., RICE, G., McGEE,V. E. y BEAUMONT, C. "Mainframe SpecificPurpose Forecasting MAHMüUD, E., RICE, G., McGEE, V. E. y BEAUMüNT, C. "Mainframe Specific Purpose Forecasting Software: A Survey." Journal ofForecasting, 5 (1986): 75-83. Software: Survey." Journal ofForecasting, 5 (1986): 75-83. REID,R.A. "The Forecasting Process: Guidelines for the MIS Manager." Journal ofSystems ManageREm,R. A. "The Forecasting Process: Guidelines for the MIS Manager." Journal of Systems Management (noviembre, 1986): 33-37. ment(noviernbre, 1986): 33-37. WRlGHT, G. y AYTüN, P. eds. Judgemental Forecasting. Nueva York: John Wiley & Sons, 1987. WRIGHT, G. y AYTON, P. eds. Judgemental Forecasting. Nueva York:John Wiley & Sons, 1987. CAPíTULO CAP1TULO Revisión de conceptos Revision estadIsticos estadísticos básicos 2 ACTIVIDAD A CT! VIDAD mayoría las técnicas de pronóstico se basa en conceptos estadísticos fundamentales La mayoria de las técnicas de pronóstico se basa en conceptos estadisticos fundamentales tema estadística así que constituyen el terna de textos sobre estadIstica en los negocios, asI como de cursos de introducción introducción a la estadIstica. En este capítulo se revisan algunos de los conceptos básicos estadística. En este capitulo revisan algunos de que servirán de fundamento para gran parte del material del resto del texto. fundamento material resto del texto. La mayorIa de los procesos estadIsticos hacen inferencias sobre los elementos de mayoría los procesos estadísticos inferencias sobre elementos de interés denominadospoblación, después de seleccionar yy medir un subgrupo de estos estos interés denominados población, después de seleccionar medir un subgrupo elementos llamado muestra. El cuidado en la selección de una muestra representativa y la elementos liamado muestra. El cuidado en Ia selección de una muestra representativa y la importantamaño de muestra lo suficientemente grande, utilización de un tamaño de muestra lo suficientemente grande, son componentes importanun proceso de inferencia estadística con un grado de riesgo aceptablemente bajo. tes de un proceso de inferencia estadistica con un grado de riesgo aceptablemente bajo. Junto con Ia inferencia estadIstica, la estadIstica descriptiva constituye la otra gran la inferencia estadística, estadística descriptiva constituye gran Junto subdivisión de la estadistica. Los procedimientos de estadIstica descriptiva se emplean para estadística. estadística subdivision resumir datos, de manera que sus componentes resumir o describir en forma breve conjuntos de datos, de manera que sus componentes forma breve conjuntos esenciales se hagan obvios y se puedan utilizar en el proceso de toma de decisiones. utilizar proceso decisiones. esenciales se hagan obvios ESTADíSTICA DESCRIPTIVA ESTADISTICA La finalidad de los procedimientos de estadistica descriptiva consiste en describir brevefinalidad los procedimientos estadística descriptiva consiste describir brevemente un gran conjunto de mediciones con unos cuantos valores clave resumidos. La forma mediciones con unos cuantos valores dave resumidos. forma más común lograr esto es promediando los valores. En estadística, el proceso de más cornñn de lograr esto es promediando los valores. En estadIstica, el proceso de promediar se lleva a cabo regularmente mediante el cálculo de Ia media, lo que comprende la sumar todos los valores y dividir entre el número de valores. Debido a que tanto la población el námero tanto como la muestra que se extrae de ella poseen una media, existen dos fOrmulas para calcular ella media, existen dos fórmulas ésta. ésta. La fOrmula apropiada depende de que los valores reunidos constituyan todos los fónnula apropiada depende de que los valores reunidos constituyan todos los interés (la población) o un conjunto parcial de ellos (una muestra). valores de interés (la población) o un conjunto parcial de ellos (una muestra). Las estadística descriptiva comprende Ia descripción de conjuntos de datos por la por estadIstica medio de algunos valores clave resumidos. medio alglillos valores dave resumidos. Estadística descriptiva Estadistica 23 Por lo regular, los valores de la población o parámetros se identifican utilizando letras Ia población o parámetros se identifican utilizando letras griegas. símbolo elegido para la población es la letra griega u (mu). La formula para la griegas. El sImbolo elegido para la población es la letra griega f.1 (mu). La fórmula para la la población es media de la población es J.L = N ~x (2.1 ) (2.1) en donde donde LX = la suma de todos los valores de la población = = el tamaño la población N = el tamaflo de la población se calcula símbolo para media de la muestra (media muestral) es X (X-barra) El sImbolo para la media de la muestra (media muestral) es X (X-barra) y se calcula ecuación 2.2: utilizando la ecuación 2.2: ~X x=n en donde LX = la suma de todos los valores de la muestra muestra EX = n = el tamaflo de la muestra tamaño (2.2) Además de medir la tendencia central· de un grupo de valores mediante el cálculo de tendencia central de grupo Además de lo regular es de interés el grado en el que los valores se encuentran dispersos la media, por lo regular es de interés el grado en el que los valores se encuentran dispersos desviación estándar alrededor de media. propósito se puede calcular airededor de la media. Para este propósito se puede calcular la desviación estándar de cualquiera de ambos grupos. Se puede pensar en la desviación estándar como en la cualquiera de ambos grupos. Se puede pensar en Ia desviación estándar como en la diferencia típica fórmulas siguientes diferencia tIpica o estándar entre los valores de un grupo y su media. Las formulas siguientes la desviación estándar poblacional (o-) y corresponden a Ia desviación estándar poblacional (cr) Y muestral (s): = (X )2 N 2 (X)2 N (2.3) (X)2 n s = ni - X)2 (2.4 ) (2.4) en donde los numeradores representan la suma de las diferencias cuadradas entre los valores de las diferencias cuadraths sus medias. medidos y sus medias. Por último, muchos procedimientos estadísticos hacen uso de la varianza poblacional poblacional ültirno, procedimientos estadIsticos hacen uso de de la varianza muestra1. La varianza de un conjunto de mediciones es la desviación o de la varianza muestral. La varianza de un conjunto de mediciones es la desviación De ahí que la (d) y de la muestral (S2) estándar estándar al cuadrado. De ahi que la varianza poblacional (&) y de la muestral (s2) se calculen como: 24 Revisión de conceptos estadIsticos básicos estadísticos Revision Capítulo 2 Capitulo 2 ¡X 2 _ ()2 (Ix)2 N N N (2.5) (X-X)2 n-i (X)2 ¡X 2 _ (¡X)2 n nn-i1 (2.6) Ejemplo 2.1 el conjunto de edades de personas, en donde se considera que los valores Considérese el siguiente conjunto de edades de personas, en donde se considera que los valores son una muestra de Ia población, en vez de Ia población misma: la de la población misma: son 23,38,42,25,60,55,50,42,32,35 23, 38, 42, 25, 60, 55, 50, 42, 32, 35 Para esta muestra, muestra, x= IX = 402 = 40.2 402 =40.2 n n 10 Corno 2.1, Ia media muestral es 40.2 aflos, la varianza muestral es Como se muestra en Ia tabla 2.1, la media muestral es 40.2 años, la varianza muestral es 148.84 la muestral y Ia desviación estándar muestral es 12.2 años. Si el conjunto de datos originales Se hubiera la años. Si el conjunto de datos originales se hubiera identificado corno una población en vez de una muestra, los cálculos habrIan sido los mismos, como de una muestra, los cálculos habrían sido los mismos, desviación estándar, que sería excepto por el denomüiador en el cálculo de la varianza y la desviación estándar, que serla excepto por ci denominador en el cálculo de varianza 10(N) en lugar de 9(n-1). Al término n-I se le conoce como grados lOeN) en lugar de 9(n-l). Al ténnino n-l se le conoce como grados de libertad. libertad. El término grados de libertad se utiliza para indicar el nñmero de elernentos de datos libertad se utiliza para indicar el número de elementos de datos El término que son libres de otros en el sentido de que no pueden deducirse de otros, y por tanto, libres sentido de que no pueden deducirse de otros, y por tanto, que TABLA 2.1 TABLA 2.1 (5< =40.2) CALCULO DE S (X = 40.2) x 23 38 38 42 42 25 25 X-X x-x -17.2 -2.2 1.8 -15.2 19.8 19.8 14.8 14.8 9.8 1.8 1.8 -8.2 -5.2 (X-X)2 295.84 4.84 3.24 3.24 231.04 392.04 219.04 96.04 3.24 67.24 27.04 60 55 50 42 32 35 s2 = - 1,339.6 10 - 1 ¡ex - X)2 = X)2 = = 148.84 = 148.84 1,339.60 1,339.60 s = \/148.84 = 12.2 = V148.84 = 12.2 Estadística descriptiva EstadIstica 25 constituyenpiezas ilnicas de información. Por ejemplo, suponga que se hacen las siguientes constituyenpiezas únicas de información. Por se hacen las siguientes declaraciones: número 5. Pienso en número 7. números en que Pienso en el nthnero 5. Pienso en el námero 7. La suma de los dos nü,neros en que suma de pensé es 12. es 12. A primera vista, se presentan tres piezas de información. No obstante, si se conocen dos de información. No obstante, si declaraciones, deducirse. podría las tres declaraciones estas declaraciones, la otra puede deducirse. Se podrIa decir que en las tres declaraciones sólo hay dos piezas ünicas de información o, para usar el término estadIstico, que solo hay únicas estadístico, sólo solo de libertad. dos grados de libertad. el ejemplo que se presenta en la tabla 2.1, las edades de las diez personas En el ejemplo que se presenta en la tabla 2.1, las edades de las diez personas podría constituyen una muestra con diez grados de libertad. Cualquier edad podrIa haberse incluido la muestra, ahí de las edades sea libre de variar. Al calcular la media, en Ia muestra, de ahi que cada una de las edades sea libre de variar. Al calcular la media, las diez edades para contabilizar edad media total de 40.2 años. se usan las diez edades para contabilizar una edad media total de 40.2 años. la desviación estándar muestral, cálculo difiere. Al calcular la desviación En la desviación estándar muestral, el cálculo difiere. Al calcular la desviación muestral, estándar muestral, se utiliza una estimación de la media de la población (la media muestral X). Se introduce un sesgo debido a que el valor l:(X- X)2 es un valorminimo para cualquier ). Se introduce un sesgo debido a que el valor (X)2 es un valor mínimo para distribuciOndada. Si a cada elemento de la distribución se hubiera restado cualquier otro distribución dada. Si a cada elemento de Ia distribuciôn se hubiera restado cualquier otro valor distinto de 40.2 y estas diferencias se elevaran al cuadrado y se sumaran, la suma valor distinto de 40.2 estas diferencias se elevaran al cuadrado y sumaran, Ia suma sería total de cuadrados serla mayor de 1 339.6. Al utilizar en el cálculo la media muestral como muestral como una estimaciOn de la media poblacional, por lo regular se obtendrá una desviación estándar estimación de la media poblacional, por lo menor que la desviación estándar poblacional. Sin embargo, este sesgo se puede corregir desviación estándar poblacional. Sin embargo, este sesgo se puede corregir )2 dividiendo número adecuado de grados de libertad. dividiendo el valor de l:(X -- X)2 entre el nilimero adecuado de grados de libertad. Ya que (X muestral estimación de la media poblacional en el cálculo de la media muestral se usó como una estimaciOn de la media poblacional en el cálculo de la de variar. Si se conocen desviación estándar muestral, sólo nueve de las edades son libres de variar. Si se conocen muestral, solo nueve nueve edades, se puede contabilizar la décima, ya que que (X) debe ser igual aacero. Solo nueve edades, se puede contabilizar la décima, ya 1:(X - X) debe ser igual cero. Sólo nueve edades para contabilizar totalidad de la información. general, se requiere de nueve edades para contabilizar la totalidad de Ia información. En general, siempre un cálculo estadístico muestra como siempre que se utilice en un cálculo un estadIstico de la muestra corno una estimación de un parárnetro de Ia población, se pierde un grado de libertad (véase tabla 2.2.). parámetro de la población, se pierde un grado nümero elementos libertad en un conjunto Los grados de libertad en un conjunto de datos indican el número de elementos de datos que son independientes de los otros y que se constituyen como piezas independientes otros y que se constituyen como piezas únicas de información. información. iinicas TABLA 2.2 2.2 CARACTERíSTICAS DE LA POBLACION POBLACiÓN CARACTERISTICAS DE LA MUESTRA Y DE LA MUESTRA CARACTERíSTICA CARACTERISTICA Media Media Varianza Desviación estándar POBLACiÓN POBLACION MUESTRA X 52 S2 S Ii fL (T 0 2 rr 26 Revisión de conceptos estadísticos básicos RevisiOn de conceptos estadIsticos Capítulo 2 Cap Itulo DISTRIBUCIONES DE PROBABILIDAD DE PROBABILIDAD Se denomina variable aleatoria a aquella cantidad que puede tomar diferentes valores entre a aquella Se denomina variable valores entre otra de un experimento, el resultado exacto de una oportunidad o evento una prueba y otra de un experimento, el resultado exacto de una oportunidad o evento aleatorio. Si sólo son posibles ciertos valores específicos, la variable aleatoria se denomina aleatorio. Si solo especIficos, la variable aleatoria se denomina variable discreta. Ejemplos de ello son el niimero de habitaciones de una casa, el nümero Ejemplos de ello son el número de habitaciones casa, el número llegan la hora número de personas que Ilegan a Ia caja de un supermercado a cierta horn y el nümero de unidades defectuosas en un lote de partes electrOnicas. Si es posible que la variable aleatoria tome partes electrónicas. Si es posible defectuosas en dentro cualquier valor dentro de cierto rango, se le denomina variable continua. Ejemplos de este cierto rango, se denomina la manufacturada y el tipo de variable son los pesos de las personas, Ia longitud de una pieza manufacturada y el de llegadas caseta de cobro. tiempo entre ilegadas de automóviles a una caseta de cobro. Una variable aleatoria discreta puede suponer solo ciertos valores especIficos, aleatoria discreta puede suponer sólo ciertos valores específicos, aleatoria continua puede suponer cualquier enteros; por lo regular enteros; un variable aleatoria continua puede suponer cualquier . valor numérico dentro de algún rango. dentro de algtn rango. Si se considera una variable aleatoria, su distribución de probabilidad enlista todos variable aleatoria, su distribución de enlista Si puede tomar, con la probabilidad cada uno. los valores posibles que puede tomar, junto con Ia probabilidad de cada uno. Ejemplo 2.2 El nürnero de días El número de dIas sin yenta de un vendedor durante un mes se podrIa describir mediante venta vendedor durante un mes se podría describir mediante la distribución de probabilidad que se muestra en la tabla 2.3. Estos valores se basan en la Ia distribución de probabilidad que se muestra en la tabla 2.3. Estos valores se basan en la experiencia pasada del vendedor y se usarán para pronosticar la actividad de ventas en el futuro. Ia actividad de ventas en el futuro. (días venta) la columna La columna X enlista todos los valores (dIas sin yenta) posibles, mientras que la columna P(X) enlista las probabilidades correspondientes. Nótese que ya que se enlistan todos los valores valores enlista las probabilidades correspondientes. Nótese que ya que se enlistan posibles de X, las probabilidades suman 1.00 o 100%. Esto es correcto para todas las posibles de X, las probabilidades surnan 1.00 o 100%. Esto correcto para todas las distribuciones de probabilidad, ignorando los errores de redondeo. redondeo. distribuciones de probabilidad, ignorando El valor esperado de una variable aleatoria es el valor promedio que supone la variable de una variable aleatoria el valor promedio El esperado variable la distribución de después numerosas pruebas. El después de numerosas pruebas. El valor esperado de una variable con la distnbución de TABLA 2.3 2.3 DISTRIBUCiÓN DE LA DISTRIBUCION DE PROBABILIDAD X x P(X) 1 1 2 3 3 4 5 .10 .20 .25 .15 .30 ¡ P(X)c = 1.00 1.00 probabilidad Distribuciones de probabilidad 27 probabilidad multiplicando cada posible X probabilidad discreta se puede encontrar multiplicando cada posible valor de X por su probabilidad y sumando después estos productos. La ecuación 2.7 muestra este cálculo: muestra este cálculo: E(X) = E(X) = I[x·p(X)] [XP(X)] (2.7) Para la distribución de probabilidad dada en la Tabla 2.3, el valor esperado es Pam distribución de probabilidad dada en la Tabla 2.3, el valor esperado es E(X) = (l)(.1O) + (2)(.20) + (3)(.25) + (4)(.15) + (5)(.30) E(X) = (1)(.10) (4)(.15) + (5)(.30) 3.35 = 3.35 tanto, si se observó a este vendedor por un periodo largo de meses y se registraron Por lo tanto, si se observó a este vendedor por un periodo largo de meses y se registraron los dIas sin ventas, el promedio serIa 3.35. días promedio sería 3.35. valor esperado de una variable aleatoria es el valor promedio de la variable El valor esperado de una variable aleatoria es ci valor promedio de La variable en muchas pruebas u observaciones. u observaciones. Para una distribución continua la probabilidad de obtener un valor especifico se distribución continua la probabilidad de obtener un valor específico se Pam aproxima a cero. ejemplo, probabilidfad de que alguien pese 68 se podría aproxima a cero. Por ejemplo, la probabilidfadde que alguien pese 68 kg se podrIa esto significaría que este peso es exactamente 68.000, sin considerar cero, ya que esto significaria que este peso es exactamente 68.000, Sin importar que tan precisa sea la escala utilizada. Las distribuciones continuas se manejan mediante la continuas localización de Ia probabilidad de que un valor quede en alguin intervalo al extraerlo en localización de la probabilidad un valor quede en algún intervalo al extraerlo en aleatoria de distribución. Por ejemplo, se podrIa calcular la probabilidad de que el forma aleatoria de la distribución. Por ejemplo, se podría calcular la probabilidad de que el peso de una persona quedara en el intervalo de 63 a 68 kg. persona intervalo 63 Algunas distribuciones teóricas suceden una y otra vez en aplicaciones estadísticas estadisticas razón importante propiedades aplicaciones. prácticas, y por esta razón es importante examinar sus propiedades y aplicaciones. Una distribuciones importantes es distribución binomial, frecuencia se de estas distribuciones importantes es la distribución binomial, que con frecuencia se usa para representar una variable aleatoria discreta. Los requisitos pam un experimento representar una variable aleatoria discreta. Los requisitos para un experimento binomial son: l. Existen n pruebas idénticas, que tienen solo uno de dos resultados posibles. sólo 2. La probabilidad de éxito de cada resultado permanece fija entre prueba y prueba. 3. Las pruebas sOl)'independientes. soi independientes. ocurrencias n pruebas, en El interés está en encontrar la probabilidad de x ocurrencias exitosas en las n pruebas, en encontrar la probabilidad manera arbitraria dos resultados posibles. donde una ocurrencia se define de manera arbitmria como uno de dos resultados posibles. Los diversos valores de x, junto con sus probabilidades, forman Ia distribución binomial. x, con sus probabilidades, forman la distribución binomial. Estas probabilidades se pueden obtener por medio de la siguiente formula binomial: probabilidades fórmula binomial: obtener medio P(x) = Ci(l - 7T)n_x para x = 0,1,2, oo., parax = 0, 1, 2, ..., n (2.8) 28 Revisión de conceptos estadísticos básicos Revision conceptos estadisticos Capitulo Capítulo 2 en donde e';==elel número de combinaciones de n objetos tomados x a Ia vez la C nOmero de combinaciones de n objetos tomados ;re = Ia probabilidad de éxito en cada prueba ir = la probabilidad de x = ci nümero particular de éxitos de interés = el número n = ci nñmero de pruebas el número de pruebas fácil de obtener probabilidades binomiales consiste en referencia Una forma más fácil de obtener probabilidades binomiales consiste en hacer referencia a de distribución binomial, como la que se encuentra en el Apéndice e, tabla C.l. una tabla de distribución binomial, como Ia que se encuentra en el Apéndice C, tabia C. 1. columnas con probabilidades están agrupadas en bloques que representan a n Las probabilidades están agrupadas en bloques que representan a n y tiene columnas con (o ;re) como encabezado y renglones p (o ir) como encabezado y rengiones indicados con x. Suponga que se extraen ocho elementos de una linea de producciOn de la que se sabe produce línea producción de la que se sabe partes defectuosas el partes defectuosas el 5% del tiempo. LCuál es Ia probabilidad de obtener exactamente cero tiempo. ¿Cuál la probabilidad obtener exactamente elementos defectuosos? La respuesta, aa partir de la tabla binomial del Apéndice C es .6634 .6634 elernentos defectuosos? La respuesta, partir de Ia tabia binomial del Apendice (aquí n = 8, r==.05,x=O). (aquIn=8, Jr .05, x = O). Ejemplo 2.3 normal es una importante distribución continua, que por medio de ella, La distribución normal es una importante distribución continua, ya que por medio de ella, se pueden aproximar muchas pobiaciones ütiles. Para identificar la distribución normal se poblaciones útiles. distribución se requiere conocer la media la desviación estándar. Una curva normal es simétrica y requiere conocer la media y la desviaciOn estándar. Una curva normal es simétrica y en forma muestra en la figura 2.1. Esta distribución representa forma de campana, como Ia que se muestra en Ia figura 2.1. Esta distribución representa campana, como la muchas variables de vida real escala continua. muchas variables de la vida real que se miden en una escaia continua. Las probabiiidades de que los valores extraldos de una distribución normal queden en probabilidades extraídos queden en estándar varios intervalos, se encuentra convirtiendo primero todos los intervalos a unidades estándar denominadas valores estandarizados. El valor estandarizado de cualquier valor de X es denominadas valores estandarizados. El valor estandarizado de cualquier valor de X es el número de desviaciones estándar desde el valor central de la curva (J1) a ese valor. De ahi ahí nOmero de desviaciones estándar desde ci valor central de Ia curva (ji) a ese valor. que la fOrmula sea: la fónnula sea: z= X-¡..L z= X;1tt (T (2.9) 1 Figura 2.1 nonnal Figura 2.1 Distribución normal Distribuciones de probabilidad probabilidad 29 en donde X = el valor del interés X= el valor del interés = J1 = la media (J = Ia desviación estándar a la desviación Después de calcular el valor estandarizado, se puede consultar Ia tabla de la curva normal estandarizado, la la curva normal Después 1m área curva, (jl) y el valor de interés X para encontrar un area bajo la curva, entre el centro de la curva (a) y ci valor de interés X. Ejemplo 2.4 Una población formada con los pesos de piezas que elabora cierta máquina, tiene una elabora cierta máquina, tiene una Una población formada con los pesos de piezas distribución normal con una media de 10 libras y una desviación estándar de 2 libras. ¿Cuál distribución normal con una media de 10 libras y una desviación estándar de 2 libras. ,Cuál es Ia probabilidad de que una pieza elegida al azar pese entre 9 y 12 libras? En la figura 2.2 la probabilidad de que una pieza elegida al azar pese entre 9 y 12 libras? En la figura 2.2 se muestra Ia curva normal con el area correspondiente sombreada. la normal con el área correspondiente sombreada. Ya que las tablas de curvas normales están disefiadas para dar áreas desde el centro de la curva diseñadas para dar areas desde el centro Ia hasta cierto punto, se deben localizar dos áreas separadas: una a cada lado de Ia media y hasta cierto punto, se deben localizar dos areas separadas: una a cada lado la media y sumarlas juntas. Este proceso producirá la probabilidad de que un valor quede en este intervalo. Ia Los dos valores estandarizados son: estandarizados son: ZI = --- = 10 9 - 10 2 2 -.50 --.50 Z? 2 = 12 10 = 1.00 z = 12 -- 10 1.00 - 2 2 Se ignora el signo negativo del primer valor estandarizado, ya que simplemente indica signo negativo del primer valor estandarizado, ya que simplemente indica que interés X, es menor que la media de la (10). que el valor de interés de X, (9) es merior que Ia media de Ia curva (10). Estos dos valores estandarizados se llevan a la tabla de curva normal del Apéndice C, tabla C2, para encontrar estandarizados se llevan a Ia tabla de curva normal del Apéndice C, tabla C2, encontrar las suman las dos areas, niismas que se suman áreas, mismas ZI = -.50~ 1915 .50 1915 ~ Z2 = = 1.00 \.00 .3413 3413 .5328 Se concluye que existe una posibilidad de alrededor del 53%, de que una pieza elegida al azar posibilidad de alrededor del 53%, de población entre 9 y 12 libras. en esta población pese entre 9 y 12 libras. / Población de peso de de las piezas de las piezas 9 12 11= 10 != 10 n= 2 cr= 2 Figura 2.2 Area de Ia curva normal Área la curva nonnal 30 Revisión de conceptos estadIsticos básicos estadísticos Revision Capítulo 2 CapItulo Por ültimo, la distribución t se utiliza con frecuencia en pruebas estadIsticas cuando último, se utiliza con frecuencia en pruebas estadísticas cuando se emplea una muestra pequeña y cuando se puede suponer que la población que se investiga se puede que la población que se investiga Apéndice tomados de la tiene una distribución normal. La tabla C.3 del Apéndice C, muestra valores tomados de la distribución sólo se requiere especificar un valor antes de consultar la tabla, distribución t. Nótese que solo se requiere especificar un valor antes de consultar la tabla, a saber, los grados de libertad [abreviado df(degrees of freedom). Una vez conocidos los gra[abreviado df(degrees offreedom). dos libertad, pueden encontrar los valores de que excluyen la curva los pordos de libertad, se pueden encontrar los valores de t que excluyen de la curva los porcentajes deseados. 14 de libertad, centajes deseados. Por ejemplo, si la distribución tt de interés tiene 14 grados de libertad, ejemplo, si distribución un valor de 2.145 cada lado del centro de la curva comprenderá al 95% de ésta, un valor t de 2.145 aa cada lado del centro de la curva comprenderá a! 95% de ésta, restante. adelante en este capítulo se presentará un ejemplo del uso excluyendo el 5% restante. Más adelante en este capItulo se presentará un ejemplo del uso distribución t. de la distribución t. DISTRIBUCIONES MUESTRALES DISTRIBUCIONES MUESTRALES mayoría estadísticas población que se investiga, una En la mayorIa de las aplicaciones estadIsticas se toma de la población que se investiga, una muestra se formulan muestra aleatoria, se calcula un estadistico de los datos de muestra aleatoria, se calcula un estadístico de los datos de la muestra y se formulan conclusiones para población con base muestra. conclusiones para la población con base en esta muestra. Una distribución muestral es la distribución distribución de todos posibles valores estadístico la muestra, que se pueden distribución de todos los posibles valores del estadIstico de la muestra, que se pueden la población para un determinado tamaño de muestra., Por ejemplo, se podría obtener de la población para un determinado tamafio de muestra., Por ejemplo, se podrIa tomar una población muestra aleatoria 100 personas y pesarlas para calcular tornar de una población una muestra aleatoria de 100 personas y pesarlas pam calcular X, como si se hubieran después la media de su peso. Se puede pensar en esta media muestral ~ como si se hubieran extraído para muestras de tamaño extraldo de la distribución de todas las medias muestrales posibles, para muestras de tamaño forma similar, estadístico 100 que pudieran tomarse de la población. En forma similar, cada estadIstico muestral que calculado, partir de datos muestrales, considerarse como que sido pueda ser calculado, a partir de datos muestrales, puede considerarse como que ha sido extraído de una distribución muestral. distribución extraldo Una distribución muestral es el arreglo de todas los estadIsticos posibles de de todas los estadísticos posibles distribución la muestra que pueden extraerse de una población, para un tamafio de muestra de una población, para un tamaño dado. El teorenza del lImite central establece que, al hacerse más grande la muestra, Ia muestra, la El teorema del límite central establece que, a! hacerse más grande distribución de muestreo de las medias de la muestra tiende hacia la distribución normal, la muestra tiende hacia la distribución normal, distribución de muestreo de la media de esta distribución normal es la media de la población y que la desviación y que la media de esta distribución normal es ,, la media de la población y que la desviaciOn estándar es d'T (a este valor le conoce como error estándar de la distribución estándar es aI~ (a este valor se le conoce como error estándar de la distribución forma de muestra!). Esta distribución muestral tenderá hacia la normalidad, sin importar la forma de inuestral). la distribución de la poblaciOn de la que se extrajeron los elementos de la muestra. La figura población de la que se extrajeron los elementos de la muestra. muestra cómo luciría dicha distribución muestral. 2.3 muestra cómo lucirla dicha distribuciOn muestral. El teorema del limite central es de particular importancia en las estadIsticas, ya que límite de particular importancia en las estadísticas, que El analista calcular la probabilidad diversos resultados muestras a través del permite al analista calcular la probabilidad de diversos resultados de muestras a través del conocimiento probabilidades la curva normal. conocirniento de las probabilidades de la curva normal. Estimación 31 = Media = Ji. 2.3 Distribución muestral de Figura 2.3 Distribución muestral de X Ejemplo 2.5 ¿Cual es Laprobabilidad de que la media de una muestra aleatoria de 100 pesos, extraIdos de 100 pes(;s, extraídos de ,Cual la probabilidad de que Ia media de una una población, se encuentre en un margen de dos libras de la media real del peso de Ia población, se encuentre en un margen de dos libras de Ia media real del peso de la población, si Ia desviación estándar de la población se estima en 15 libras? La figura 2.4 población, si la desviación estándar de Ia población se estima en libras? figura 2.4 la distribución apropiada. muestra Ia distribución apropiada. El error estándar af..¡n l5hTiöö = 1.5.1.5. Luego= 2/1.5 = = 1.33, con 10 quese obtiene error estándar df= = 15/-JIOO = Luego z z = 2/1.5 1.33, con lo que se obtiene área de .4082 en la tabla de la curva normal. Duplicando esta área para contabilizar ambos un area de .4082 en Ia tabla de Ia curva normal. Duplicando esta area para contabilizar ambos de la media, da por resultado un área de .8164. lados de Ia media, da por resultado un area de .8 164. la media probabilidades de que la media muestral esté en un margen Las probabilidades de que Ia media muestral esté en un margen de 2 libras de la media real, es de alrededor del 82%, reflejando un tamafio de muestra de 100 y Ia variabilidad real, de alrededor del 82%, reflejando tamaño muestra 100 Y la variabilidad población a = 15. Como se verá, esta capacidad para calcular probabilidades estimada estimada de la población a = 15. Como se vera, esta capacidad para calcular probabilidades de resultados de muestras permitirá al analista liegar a titiIes resultados en Ia estimación y en muestras llegar útiles la en la prueba hipótesis. Ia priieba de hipótesis. II Figura 2.4 Área de Ia distribución muestral 2.4 Area la ESTIMACiÓN ESTIMACIÔN estimado parámetro población, valor individual Un punto estirnado de un parámetro de una población, es un valor individual calculado a datos de la muestra, que estima el desconocido de la población. La tabla 2.4 partir de datos de Ia muestra, que estima el valor desconocido de la población. La tabla 2.4 contiene una lista de varios parárnetros poblacionales y los estadIsticos de Ta muestra que de varios parámetros poblacionales los estadísticos de la muestra contiene de estimación correspondientes. proporcionan puntos de estimación correspondientes. Un intervalo de esti,nación o un intervalo de confianza es un intervalo dentro del cual estimación de es un intervalo dentro del cual se ubique el parámetro de interés de la población. Se encuentra formando es probable que se ubique el parámetro de interés de Ia población. Se encuentra formando estimación un intervalo alrededor del punto de estimación y se calcula ya sea mediante la distribución nonnal t. ocasiones normal o la distribución t. En ocasiones se utilizan el punto de estimación y el intervalo de utilizan el punto estimación 32 Revisión de conceptos estadísticos básicos Revision de conceptos estadisticos TABLA 2.4 VALORES POBLACIONALES y MUESTRALES TABLA 2.4 VALORES POBLACIONALES Y MUESTRALES PARAMETROS DE LA POBLACION PARAMÉTROS POBLACIÓN Media (j.J) Media (p) Desviación estándar (a) Desviación estándar (a) Varianza (2) Varianza (d) Proporción (it) Proporción (1l) Capítulo 2 CapItulo ESTADÍSTICO DE LA MUESTRA (ESTIMACION) (ESTIMACIÓN) ESTADISTICO DE X, muestra! X, media muestral s, desviación estándar muestral muestra! s2, varianza muestral muestra! s2, proporción !a muestra p, proporción de la muestra estimación como estimaciones aproximadas de valores importantes. (Véase el de estimación como estimaciones aproximadas de valores importantes. (Véase el caso de estudio Mr. Tux al final de este capItulo.) estudio Mr. final de este capítulo.) Ejemplo 2.6 Se desea obtener un intervalo de estimación de la media de una población. El tamaflo de la intervalo estimación media de una población. El tamaño la muestra es 400, la media muestral (el punto de estimación o) es de 105 libras y la desviación muestral (el punto estimación de 105 libras y la desviación estándar muestral (una estimación de ) es de 10 libras. j,En qué intervalo es un 92% probable muestral (una estimación de) de 10 libras. ¿En qué intervalo es un 95% probable que u se ubique? Se puede encontrar formando un intervalo alrededor de X, utilizando que f.1 se ubique? Se puede encontrar formando un intervals> alrededor de X, utilizando estándar 1.96 la desviaciones estándar de 1.96 en Ia distribución de muestreo de X (a 1.96 desviaciones estáridar X(a 1.96 desviaciones estándar lado de la media de cualquier curva normal abarcará aproximadamente el a cada lado de la media de cualquier curva normal abarcará aproximadamente el 95% de los valores). Los cálculos son cálculos son X±Z ~ X± Z 105 ± 1.96 105 ± 1.96 (2.10) ~ v406 \/400 105 ± .98 105 ± .98 104.02 104.02 a 105.98 Así, es 95% probable que la media muestral fuera elegida de una distribución muestral tal que AsI, es 95% probable media muestral fuera elegida de una distribución muestral tal que la media real de la población se encuentre en el intervalo de 104.02 a 105.98. 104.02 105.98. Ia media real de población se encuentre en ci irtervalo En fom1a similar, se pueden formar intervalos de confianza alrededor de puntos de En forma similar, se pueden formar intervalos de confianza alrededor de puntos de estimación de la proporción de la población, utilizando la siguiente formula utilizando siguiente fórmula estimación de P +- jz IT(1IT) 7T(l n- 7T) n (2.11) En Ia práctica Ia proporción de Ia poblaciOn, iz se estima por lo regular con p, Ia la En la práctica la proporción de la población, 1r, se estima por regular con proporción de Ia muestra, en el cálculo de Ia desviación estándar de Ia distribución muestral cálculo de la desviación estándar la distribución proporción de la muestra, (error estándar de la proporción). la proporción). Ejemplo Ej emplo 2.7 Un intervalo de confianza del 99% para ci porcentaje real it de la población, que sea familiar el porcentaje Jr de la población, que sea familiar se puede formar alrededor del punto de estimación Jr = .23 con n = 150. con un producto, se puede formar alrededor del punto de estimación IV= .23 con n = 150. .23 ± 2.58 .23 ± 2.58 .23 ± .089 .23 ± .089 .141 to .319 .141 (.23)(.77) 150 Prueba de hipótesis hipótesis 33 En este ejemplo el punto de estirnación de iC es .23. Dado un tamaño de muestra de 150, es ejemplo estimación de Jr es .23. Dado un tamano de muestra de 99% probable que la muestra fuera extraída de tal forma que el valor real de ir se encuentra 99% probable que Ia muestra fuera extralda de tal forma que ci valor real de iC en el intervalo de .141 aa.3 19. intervalo de .141 .3 19. Un puilto de estirnación es una estimación valuada individualmente de un punto de estimación es una estimación valuada individualmente un estimación es parámetro de la población; un intervalo de estirnación es un intervalo numérico intervalo numérico dentro del cual es probable que se ubique el parámetro de la población. ubique el parámetro de la población. dentro del PRUEBA DE HIPÓTESIS PRUEBA DE HIPOTESIS En muchas situaciones estadísticas el interés se centra alguna afinnación sobre la En muchas situaciones estadIsticasel interés se centra en alguna afinriación sobre la población, en vez de en la estimación de aigunos de sus parámetros. A este procedimiento la estimación algunos sus parámetros. este procedimiento población, en se le denomina prueba de hipótesis y comprende los siguientes pasos: denomina de hipótesis y comprende los siguientes pasos: Paso 1 Paso 1 Establezca la hipótesis que se desea probar (llamada la hipótesis nula con el sImbolo símbolo Ha) y establezca la hipótesis alterna (a Ia que se llega en conclusion si se descarta H0) Y establezca la hipótesis alterna (a la que se llega en conclusión si se descarta H0, ci símbolo es H 1). Ha, el sImbolo es H1). Paso 2 Suponga que Ia hipótesis nula es cierta y consulte la distribución muestral de Ia cual Suponga que la hipótesis nula es cierta y consulte la distribución muestral de la cual las estadísticas de la muestra bajo esta suposición. se extrajeron las estadIsticas de la muestra bajo esta suposiciOn. Paso 3 Reina una muestra aleatoria de elementos de la población, mIdalos y calcule las la población, mídalos y calcule las Paso Reúna una muestra aleatoria de elementos estadisticas correspondientes a Ia muestra. estadísticas la muestra. Calcule la probabilidad de que tal estadística de muestra pudiera haber sido extraída Paso 4 Calcule Ia probabilidad de que tal estadIstica de muestra pudiera haber sido extralda distribución muestra!. de esta distribución muestral. Paso 5 Si esta probabilidad es alta, no rechace Ia hipótesis nula; si esta probabilidad es 5 Si esta probabilidad es alta, no rechace la hipótesis nula; si esta probabilidad es baja, baja, se puede rechazar Ia hipótesis nula con una baja probabilidad de error. la hipótesis probabilidad error. 2.5 TABLA 2.5 RESULTADOS DE LA PRUEBA DE HIPOTESIS PRUEBA DE HIPÓTESIS RESULTADOS No No rechazar H0 JIo Ho H0 verdadera Estado de la Ja naturaleza H o falsa H0 falsa Rechazar l/o "0 Decisión Decision COlTecta correcta ElTor tipo I, ElTor tipo 1, probabilidad: a probabilidad: a Error tipo II, ElTor tipo 11, probabilidad: /3 f3 Decision Decisión correcta COlTecta Al seguir estos pasos, pueden presentarse dos tipos de error, como se muestra en Ia pasos, pueden presentarse dos tipos de error, como se la tabla 2.5. Siempre se espera alcanzar Ia decision correcta con respecto a la hipótesis nula, Siempre se espera alcanzar la decisión correcta con respecto después de exarninar La evidencia de la muestra, pero siempre existe Ia posibilidad de examinar la evidencia de Ia muestra, pero siempre la posibilidad de después rechazar una H0 verdadera y de no rechazar una H0 falsa. Las probabilidades de estos rechazar una Ha verdadera y no rechazar una Ha falsa. Las probabilidades de estos como y beta (13), respectivamente. También se conoce eventos se conocen corno alfa (a) y beta (/3), respectivarnente. Tarnbién se conoce a alfa nivel de signIcancia de la prueba. como el nivel de significanciade Ia prueba. 34 Revisión Revision de conceptos estadísticos básicos conceptos estadisticos báscos CapItulo Capítulo 2 Ejemplo 2.8 el peso promedio de las piezas que produce cierta máquina Se desea probar la hipótesis de que el peso promedio de las piezas que produce cierta máquina se mantiene en 50 libras, que es el peso promedio de las piezas en los ültimos años. Se toma mantiene libras, últimos las una muestra aleatoria de 100 piezas. Se supone que la desviación estándar del peso de las muestra aleatoria de 100 piezas. Se supone que desviación estándar del peso piezas es de 5 libras sin importar Ia media del peso, ya que este valor ha permanecido constante la constante en estudios pasados. Si Se asume que la hipótesis nula es correcta (la hipótesis nula establece pasados. se asume que Ia hipótesis nula es correcta (Ia hipótesis nula establece de las piezas es de 50 libras), la distribución de muestreo apropiada es que Ia media del peso de las piezas es de 50 libras), la distribución de muestreo apropiada es la la distribución normal, de acuerdo con el teorema del límite central. La prueba se demuestra Ia distribución normal, de acuerdo con el del lImite central. La prueba se demuestra en Ia figura 2.5. la figura 2.5. La regla de decision de esta prueba es: decisión esta prueba es: del peso de entre 49.02 libras y 50.98 libras, no se rechaza Si la media del peso de la muestra está entre 49.02 libras y 50.98 libras, no se rechaza la hipótesis nula. Si está fuera de este intervalo, se rechaza. intervalo, Ia hipOtesis nula. Si está fuera de H0: J.l = 50 libras (Ia hipótesis nula) H o: p = 50 (la H1: J.l 50 libras (la hipótesis alterna) libras (Ia hipótesis altema) 50 H¡: p * Rechazar H0 Rechazar Ho 4 No rec iazar 1E0 rechazar lÍo Rechazar H o Rechazar H0 4 S {La distribución muestral tLa distribución suponiendo supornendo que H0 es verdadera Ho .025 .025 2=-1.96 z-1.96 a a z = 196 z= 1.96 J.l=SO O" S a 5 ..[Ti = {fOO = .S b a yb: 50 ± 1.96 (.5) y b: 50 ± 1.96 (.5) 49.02 y 50.98 Y 50.98 Figura 2.5 Figura 2.5 a=.OS a =05 (El nivel de (El sigrnficancia elegido) significancia elegido) Prueba de hipótesis -- ejemplo 2.8 hipótesis ejemplo 2.8 Al establecer de esta forma Ia regla de decision, Ia probabilidad de rechazar la fonna la regla de decisión, la probabilidad de rechazar la Al establecer de hipótesis nula cuando es verdadera, es decir, cometer un error de Tipo es de 5% (a = hipótesis nula cuando es verdadera, es decir, cometer un error de Tipo 1,I, esde 5% (a = tin area de .025 .05). la .05). Esto puede apreciarse en la curva de Ia figura 2.5, que muestra un área de .025 a cada extremo de Ia distribución de muestreo. la muestreo. Para completar ejemplo 2.8, si resulta que media muestral es 50.4, no Para completar el ejemplo 2.8, Si resulta que la media muestral es 50.4, no rechazarlamos Ia hipótesis nula y se concluiria que población aün conserva rechazaríamos la hipótesis nula y se concluiría que la población aún conserva una media en el peso de 50 libras. Por otra parte, si la media muestral resultara de 48,1 libras, se 48.1 libras, se en peso de 50 libras. Por otra parte, si la media muestral resultara contluiría que Ia media de la población ha caIdo por debajo de las 50 libras. la caído de las 50 libras. concluirla Prueba de hipótesis de hipótesis 35 tabla 2.6 resume las cuatro pruebas hipótesis más utilizadas. En La tabla 2.6 resume las cuatro pruebas de hipótesis más utilizadas. En cada una de estas pruebas se calcula ci estadIstico de la muestra que se indica, se consulta la distribución consulta la distribución se calcula el estadístico después de suponer que la hipótesis nula es correcta, se forma la regla muestral apropiada después de suponer que Ia hipótesis nula es correcta, se forma La regla decisión límite estadístico de decision que especifica el ilmite donde es más probable que se ubique el estadIstico y llega a una decisión de rechazar o no la hipótesis nula. se ilega a una decision de rechazar o no Ia hipótesis nula. TABLA 2.6 RESUMEN DE PRUEBAS DE HIPOTESIS 2.6 RESUMEN DE PRUEBAS DE HIPÓTESIS ESTADISTICO DE ESTADíSTICO LA MUESTRA DISTRIBUCION DISTRIBUCIÓN MUESTRAL Nonnal o/ Normal 01 LA PARÁMETROS PARAMETROS DE LA DISTRIBUCIÓN DISTRIBUCION MUESTRAL and J.tand (T CT H0 Ha = 50' J.t = 50* X ,1 VII = .30* 71' = .30 L J.t, - IL = O J.tz 0 P p Nonnal Normal 71' and an (I-7I') (l d~ ) 11 XX2 X, -Xz p -P 2 P, p2 Nonnal o I Nonnalot /L1_/L2and_!. + nI /11.2 CT2 n2 71', - 71'2 = O - Normal Nonnal + (1 71'I - 71'Z and )71'0 - 71')(-.L + -.L) 11, I/z \n1 h121 ·Valores de ejemplo. *Valores Ejemplo 2.9 Por varios años, el 30% de la población ha tenido una impresión favorable de nuestro Por varios años, ci 30% de La población ha tenido una impresión favorable de nuestro producto. conducen a sospechar que este porcentaje pudiera haber disminuido. Eventos recientes nos conducen a sospechar que este porcentaje pudiera haber disminuido. Para probar Ia hipôtesis de que ci porcentaje aün es del Para probar la hipótesis de que el porcentaje aún es del 30%, se toma una muestra de 50 toma una muestra de 50 H o: lt = .30 Ho: it .30 H1: ir< .30 Resultados de la muestra: n = 50 50 Resultados de Ia muestra: p=.27 p =27 a=.02 = .02 Distribución muestral Ho suponiendo que H0 es verdadera .02 z=-2.05 Rechazar Ho H0 a No rechazar Ho H0 it = lt= .30 Jit(l - it) J I lt(l -lt) = I n (.3 x .7) (.3 X .7) 50 = .065 - .065 a = .30 -2.05(.065) .30 -.13 = .17 a=.30-2.05(.065) = .30.13.17 2.6 Figura 2.6 hipótesis - ejemplo 2.9 Prueba de hipótesis - ejemplo 2.9 36 Revisión de conceptos estadIsticos básicos RevisiOn de conceptos estadísticos básicos Capítulo 2 Cap itulo personas y se encuentra que ci 27% de ellas tiene una buena impresión de nuestro producto. se encuentra el 27% de ellas tiene una buena impresión de nuestro producto. conclusión? Con base en Ia evidencia que se muestra en la figura 2.6, ¿cuál es la conclusion? la evidencia que se muestra en figura 2.6, cuãl Con Regla de decision. decisión. Regia Si p < .17, rechazar H0 Si p .17, rechazar H o Conclusión. Ya que p = .27, no se rechaza H0. Con base en la evidencia de esta muestra, la rechaza H o. Con base Conclusion. Ya que p = Ia evidencia de muestra, Ia hipótesis de que la proporción de Ia poblaciOn es .30 no puede rechazarse a un nivel de hipótesis de la proporción la población es .30 no rechazarse un nivel de 2%. No evidencia en muestra para decir que ha disminuido significancia del 2%. No existe suficiente evidencia en la muestra para decir que ha disminuído la proporción de personas que favorecen nuestro producto. personas que favorecen nuestro producto. Ej emplo Ejemplo 2.10 Considérese una prueba dc hipOtesis en donde ci tamaflo de la muestra es pequeño y cuya Considérese una prueba de hipótesis en donde el tamaño de la muestra es pequeflo y cuya distribución muestral apropiada es la distribuciOn t. Suponga que se desea probar la hipótesis distribución 1. Suponga que se desea distribución muestral de que Ia media de la calificaciOn obtenida por estudiantes en un examen a nivel nacional es la media de la calificación obtenida es estudiantes en tin 500, contra la hipótesis alterna de quc es menor de 500. Se toma de Ia población una muestra 500. Se toma de la población una muestra 500, altema que 15 estudiantes, arroja una media de 475. La desviación estándar poblacional aleatoria de 15 estudiantes, que arroja una media de 475. La desviación estándar pobiacional aieatoria se cstima mediante la desviación estándar de los 15 elementos de Ia muestra, que es 35. Se los 15 elementos de la muestra, que es 35. se estima mediante la desviación estndar supone que Ia población de calificaciones de exámenes siguc una distribuciOn normal. la calificaciones de exámenes sigue una distribución normal. La distribución t es Ia distribución muestral apropiada cuando n es pequeña (como regla de distribución I la distribución muestral apropiada cuando n es pequefla (como regia de oro, mcnor oro, menor de 30), se desconoce a (y se estima mediante s), y se puede suponer que la 30), se desconoce (J' (y estima mediante s), y puede suponer la población tiene aproximadarnente una distribuciOn normal. El mimero correcto poblaciOn tiene aproximadamente una distribución normal. El número correcto de grados de grados de libertad (d/) para esta prueba es ii - 1. La estadIstica de prueba es (X - p)/(s/\f7). La prueba prueba es (X - j.i)/(s/-rñ). La prueba n 1. La estadística libertad (dJ para esta se muestra en Ia figura 2.7, suponiendo un nivel de significancia de .05. la figura suponiendo nivel de significancia de .05. Regla de decision. Si t < -1.761,rechazar H0 decisión. Si 1.761, rechazar H o Conclusion. Ya que t = -2.77,Se rechaza H0.. La evidencia de la muestra apoya ci rechazo Conclusión. Ya que = 2.77, se rechaza H o La evidencia la muestra apoya el rechazo la la pobIación es 500 a un nivel de significancia del 5%. Se de Ia hipótesis de que Ia media de Ia población es 500 a un nivel de significancia del 5%. Se la hipótesis de concluye que la media dc Ia ealificaciOn obtenida por estudiantes en ci exarnen nacional ha la media de la calificación obtenida estudiantes el examen nacional ha concluye disninuido. disminuido. H o:¡.t=500 H0:p.= 500 t Distribución I Resultados la muestra: Resultados de ia muestra: n = 15 15 H¡: ¡.t < 500 H1: t <500 df= 14 = 475 X =475 s =35 = 35 a= .05 a=.05 Distribución de muestreo de (x(x - p)/(s/'R) DistribuciOn de muestreo de - f.J)/(sl{;) supomendo que H0 es verdadera suponiendo que Ho es verdadera y que la poblacion presenta una distribución normal nonnal a=.05 a =05 t=-1.761 RechazarH o ..------1 Rechazar H0 ( t (de Ia tabla t con la f I a=.05 y df=n- 1=14) u=.05 = 1.761 df=n 475-500 =-2.77 x-¡.t = 475-500 - 2.77 sl{n - 35/ffi 35/ Prueba de hipótesis - ejemplo 2.10 - ejemplo 2.10 Prueba Figura 2.7 Prueba de Ia bondad de ajuste la 37 PRUEBA DE LA BONDAD DE AJUSTE BONDAD DE AJUSTE PRUEBA DE A menudo resulta de interés determinar si los datos de la muestra se ajustan a una A menudo resulta de interés determinar si los datos de la muestra se ajustan una distribución conocida, sospechada teórica. Se extrae ima muestra de población de distribución conocida, sospechada oo teórica. Se extrae una muestra de la población de interés y se observan las categorias en las que se ubican estos elementos. Si las frecuencias categorías frecuencias interés y las estos elementos. observadas se encuentran rnuy cerca de lo que teOricamente se veria bajo la distribución vería bajo la distribución observadas encuentran muy de lo que teóricamente hipotética de la población, se acepta la formulación hipotética de la población; si se hipotética de población, se acepta la formulación hipotética de población; se observan grandes diferencias, esta formulación se rechaza. esta formulación rechaza. Ejemplo 2.11 que la gente no tiene preferencia con respecto a las cuatro marcas de leche que puede comprar el supermercado. esta hipótesis entonces compradores en el supermercado. Si esta hipótesis es verdadera, entonces en una muestra de compradores podria esperarse que exactamente la cuarta parte de ellos, en promedio, elegiria cada una de podría exactamente Ia cuarta parte ellos, promedio, elegiría de marcas. 100 esperaría las cuatro marcas. Si se elige al azar una muestra de 100 compradores, se esperarla que 25 de las cuatro Suponga se tomó la muestra que ellos comprara cada una de las cuatro marcas. Suponga que ya se tomó La muestra y que ésta revela la información de preferencia que se presenta en Ia tabla 2.7. información preferencia la 2.7. Resulta obvio que una cuarta parte de Ia población no eiigió cada marca, sin embargo, solo cuarta la eligió embargo, sólo pequeña de compradores. Surge Ia pregunta ,hay se examinó una muestra pequefia de compradores. Surge la pregunta ¿hay suficiente evidencia la muestra para rechazar la hipótesis La hipótesis es en Ia mtiestra para rechazar Ia hipOtesis nula? La hipOtesis bajo prueba es H0: La población de Ia que Se extrajo la muestra está distribuida de manera uniforme. Ro: La la se extrajo Ia muestra uniforme. Bajo esta hipótesis, un nOmero igual de personas de la población prefiere cada marca. La marca. hipótesis, número igual de personas de Ia población prefiere la ser 10 suficientemente concepto. evidencia de Ia muestra puede o no ser lo suficientemente fuerte para rechazar este concepto. A partir de la evidencia, no resulta aparente si existe preferencia por una u otra marca en Ia la evidencia, resulta preferencia por otra marca en la o si las diferencias que se observan en la muestra se deben a un error en el muestreo población, 0 silas diferencias que se observan en Ia muestra se deben a un error en ci muestreo aleatorio. TABLA 2.7 2.7 PREFERENCIAS DE MARCAS -- EJEMPLO 2.11 PREFERENCIAS DE MARCAS EJEMPLO 2.11 A B e C 18 D D TOTAL 100 lOO Suponga la Suponga la hipótesis de hipótesis Número de compradores Nümero de compradores 20 35 27 Suponga que las observaciones reales están dispuestas de acuerdo con las frecuencias que las observaciones reales están dispuestas de acuerdo con las frecuencias esperadas si Ia hipótesis nula fuera verdadera, como se muestra en la figura 2.8. Ahora se esperadas la hipótesis fuera verdadera, como se muestra en figura 2.8. ajuste las frecuencias esperadas. Se puede puede apreciar la bondad de ajuste entre las frecuencias observadas y esperadas. Se puede estadístico a partir de comparaciones de tabla 2.8; le conoce como la calcular un estadIstico a partir de las comparaciones de la tabla 2.8; se le conoce como Ia distribución ji-cuadrada. La ecuaciOn 2.12 muestra ei cálculo: La ecuación el cálculo: (fa - 1e)2 x2 = todas las categorias todas categorlas fofe2 fe fe (2.12) en donde fa = frecuencia observada = le = frecuencia esperada = 38 TABLA 2.8 2.8 Revisión de conceptos estadIsticos RevisiOn de conceptos estadísticos básicos PREFERENCIAS DE MARCAS-HIPÓTESISNULA CORRECTA PREFERENCIAS DE MARCASHIPOTESIS NULA CORRECTA A A B C Capítulo 2 CapItulo e D 27 25 TOTAL 100 lOO lOO 100 Real Real (observado) (esperado) Teórico (esperado) 20 25 35 25 18 25 25 Se puede emplear la ecuación 2.12 pam calcular el estadIstico de ji-cuadrada para el para estadístico la ejemplo 2.11. En Ia tabla 2.9 se muestran los cálculos que dan por resultado una estadística resultado estadistica de ji-cuadrada de 7.12. 7.12. deji-cuadrada Ahora, el valor de ji-cuadrada, calculado con la ecuación 2.12, se compara con el Ahora, de ji-cuadrada, calculado con ecuación 2.12, compara la tabla de ji-cuadrada correspondiente. Si el valor de la tabla de ji-cuadrada correspondiente. Si el valor calculado es menor que el de calculado es menor que el la tabla, indica un buen ajuste y no se rechaza Ia hipótesis nula sobre la población en estudio. la el la tabla, indica mal ajuste y la hipótesis nula Si ci valor calculado es mayor que el de Ia tabla, indica un mal ajuste y Ia hipótesis nula se rechaza. Para obtener un valor tabulado de la tabla de ji-cuadrada, es necesario conocer el tabulado de tabla de ji-cuadrada, necesario conocer el Pam obtener un libertad, número de libertad (df>. nümero de grados de libertad (dJ). Para el ejemplo 2.11, se pierde un grado de libertad, ya 2.11, que las frecuencias esperadas deben sumar 100, que es el nümero original de datos. De este el número de datos. De este modo, df= k -1 = 4 - 1 = 3 (k es el niimero de categorlas). De la tabla de ji-cuadrada, 1 = 3 (k es el número de categorías). De la tabla de modo, df= x205 = X~05 = 7.81473 X~025 x025 = 9.34840 para di = 3 para df 3 x1 ==11.3449 X .~I 11.3449 valor calculado (7.12) menor que cualquiera de los Debido a que el valor calculado (7.12) de ji-cuadrada es menor que cualquiera de los la valores tabulados, incluso al nivel de significancia de .05, no es posible rechazar Ia hipótesis niveles. común las pruebas estadísticas, resultado nula a estos niveles. Como es comün en las pruebas estadIsticas, este resultado no prueba que la hipótesis nula sea correcta; simplemente establece que no hay evidencia suficiente hipótesis nula sea correcta; simplemente hay evidencia suficiente para rechazarla. Se concluye que la muestra indica que no hay marca de preferencia en Ia rechazarla. la concluye que muestra indica que población, utilizando cualquiera de los niveles de significancia indicados. niveles de significancia indicados. En resumen, se pueden comparar las distribuciones observadas con las distribuciones teóricas, mediante la prueba de la bondad de ajuste. Se debe calcular y comparar con los ajuste. comparar teóricas, mediante la prueba de la distribución frecuencias esperadas de Ia población teórica, si existen mismos valores Ia distribución de frecuencias esperadas de la población teórica, si existen grandes diferencias entre categorlas, resultarla un valor grande de ji-cuadrada y se grandes diferencias entre categorías, resultaría un valor grande de ji-cuadrada y se TABLA 2.9 CALCULOS DE 2.9 CÁLCULOS DE i U;, - f)2 (ffe 25 100 49 4 fa fo le fe 25 25 25 25 f o -fe fofe (f, (f - fe)2"fee fY/f 1.00 l.oo 20 35 18 27 5 10 -7 7 -5 10 4.00 2 X 2 = 7.12 x2= 7.12 l.96 1.96 .16 2 Análisis de correlación 39 rechazaría rechazaria la hipótesis con respecto a la población. Si las frecuencias reales están muy cerca población. frecuencias reales de los valores esperados entre las categorlas, resultará un valor pequeño de ji-cuadrada y categorías, resultará un valor pequeno de ji-cuadrada y no podrá rechazarse la hipótesis relativa a Ia población. la hipótesis relativa a la población. de la bondad de ajuste determina si se puede suponer que los La prueba de la bondad de ajuste determina si se puede suponer que los elementos de una muestra hayan sido extraídos de una población que sigue una elementos hayan sido extraldos de una población que sigue una distribución especIfica. específica. bondad de ajuste se pueden formular muy diversas hipótesis En una prueba de bondad de ajuste se pueden formular muy diversas hipótesis de prueba distribución de la población. A menudo Ia prueba se realiza para una distribución normal la distribución distribución de población. de la población, ya que muchas pruebas estadIsticas suponen tal distribución de la de la población, ya que muchas pruebas estadísticas suponen tal distribución de la una población. Las pruebas de bondad se utilizan también determinar poblaciôn. Las pruebas de bondad de ajuste se utilizan también para determinar si una variable es de Poisson o está distribuida en forma exponencial. En el capItulo 10 se usará distribuida exponencial. En capítulo lOse variable es Box-Jenvariante de esta prueba para determinar si son adecuados una variante de esta prueba para determinar Si SOfl adecuados los modelos de Box-Jende se la distribución kins. La bondad de ajuste se usa además para probar datos actuales contra la distribución registrada en periodos anteriores, contra una norma de la industria, o contra valores registrada en periodos anteriores, contra una norma de industria, o contra valores precisión de objetivos deseados. Por último, se utiliza la bondad de ajuste para probar la precision de objetivos deseados. Por ültimo, se utiliza la bondad de ajuste importe ventas mensuales). los valores de pronóstico con los valores reales (como el importe de ventas mensuales). ANÁLISIS DE CORRELACIÓN ANALISIS DE CORRELACION Un objetivo comán en las aplicaciones de pronóstico consiste en examinar la relaciOn entre común en las aplicaciones de pronóstico consiste en examinar la relación dos variables. Este tema se aborda aqui, mientras que su extensiOn, el análisis de regresiOn se aborda aquí, mientras que su extensión, el análisis de regresión Además, capítulos y se expone en los capItulos 6 y 7. Adernás, Los capItulos 9 y 10 consideran casos especiales capítulos de correlaciOn y regresión. correlación y la conelación El énfasis en Ia correlación y la regresión se justifica en virtud del amplio uso de estas sejustifica en virtud del amplio técnicas todo tipo de aplicaciones estadísticas, incluyendo pronósticos. Además, técnicas en todo tipo de aplicaciones estadIsticas, incluyendo los pronósticos. Además, la ampliación de los conceptos básicos de correlaciOn y regresión en áreas más complejas se correlación y regresiOn en areas más ampliaciOn de los conceptos básicos muchos otros procedimientos de pronóstico. consideran en muchos otros procedimientos de pronOstico. Se supone que las variables bajo investigación son mediciones numéricas, es decir, las variables bajo investigación son mediciones numéricas, es decir, miden mediante dispositivo procedimiento que genera nimeros reales que se miden mediante un dispositivo o procedimiento que genera números reales en vez categorías datos de intervalos escala proporcional). de categorlas (se utilizan datos de intervalos o escala proporcional). dispersión Diagramas de dispersion relación variables de la relación Un estudio de la relación de variables comienza con el caso más sencillo, el de la relación variables. Suponga que se toman dos mediciones existente entre dos variables. Suponga que se toman dos mediciones a cada uno de varios entre determinar medibles denominada Y, objetos. Un analista desea determinar cuál de estas variables medibles denominada Y, tiende varía. a aumentar o disminuir mientras que la otra variable, llamadaX, varIa. Por ejemplo, suponga variable, edad el ingreso de varios individuos, la que se miden la edad y el ingreso de varios individuos, como se muestra en Ia figura 2.10. ¿Qué decir acerca de la relación entre X y Y? j,Que se puede decir acerca de la relaciOn entre X y 1'? 40 TABLA 2.10 2.10 Revisión de conceptos estadIsticos básicos estadísticos básicos Revision MEDIC IONES DE INGRESO MEDICIONES DE INGRESO Y EDAD Capítulo CapItulo 2 PERSONA NUMERO NÚMERO 1 y ($) Y INGRESO ($) 7,800 8,500 10,000 15,000 16,400 X EDAD (A14OS) (AÑOS) 1 22 23 26 27 35 2 3 4 5 A partir de Ia tabla 2.10 resulta aparente que Y y X tienen uria relación definida. Al la tabla 2.10 resulta aparente que Y X una relación definida. Al muestra de cinco personas aumentar X, Y tiende también a aumentar. Al observar esta muestra de cinco personas aumentar X, Y tiende también a aumentar. Al observar persona ingresos tendrá. Desde pudiera ser tentador el concluir que entre mayor sea pudiera ser tentador ci concluir que entre mayor sea una persona más ingresos tendrá. Desde luego, es peligroso liegar a conciusiones con base en un tamaño de muestra inadecuado, un llegar conclusiones en un tamaño de muestra inadecuado, un = 5), aparentemente tema a tratar más adelante. Aun asI, con base en las observaciones (n = 5), aparentemente adelante. asÍ, en las observaciones existe una relación definida entre X y Y. relación definida entre X y Y. Estos cinco puntos se pueden graficar en una escala de dos dimensiones, con los Estos cinco puntos pueden graficar una escala de dos dimensiones, con los horizontal los valores Y en el eje vertical. A gráfica valores de X en el eje horizontal y los valores de Y en el eje vertical. A esta gráfica se le valores de X en denomina diagraina dispersión aparece la figura 2.8. denomina diagrama de dispersion y aparece en la figura 2.8. Un diagrarna de dispersiOn grafica los puntos de datos X- Y en una gráfica diagrama de dispersión grafica los puntos de datos X-Yen una gráfica bidimensional. Un diagrama de dispersión ayuda a ilustrar lo que sugiere la intuición, al observar por diagrarna de dispersion ayuda a io que sugiere al los datos sin procesar, digamos, la apariencia una relación lineal entre X y primera vez los datos sin procesar, digamos, Ia apariencia de una relación lineal entre X y Y. A esta relación al incrementarse incrementa Y. Y. A esta relación se le llama positiva ya que al incrementarse X también se incrementa Y. y Y $20,000 0 o j 0 ~ $10,000 o 0 :...,. >; 0 o 0 o o 0 $0 '---_ _----l'---_ _----l $0 30 20 30 ---L ----'-_ _ x x 40 X, Edad Figura 2.8 Diagrama de dispersion de edad e ingreso Figura 2.8 dispersión de edad e ingreso Análisis de correlación Análisis de correlaciOn 41 otras situaciones que comprenden a dos variables, pueden surgir diferentes En otras situaciones que comprenden a dos variables, pueden surgir diferentes dispersión. Considérense las gráficas patrones de diagramas de dispersion. Considérense las gráficas de la figura 2.9. figura sugiere que se llama una relación lineal positiva El diagrama (a) de la figura 2.9 sugiere lo que se llama una relación lineal positiva perfecta. Al aumentar.x, aumenta también Y y en una forma perfectamente predecible. Esto perfecta. Al aumentarX, aumenta también Yy en una forma perfectamente predecible. Esto es, que los puntos X y Y aparentemente se ubican sobre una lInea recta. El diagrama (b) los puntos X y Y aparentemente línea recta. El diagrama (b) es, sugiere lineal negativa perfecta. Al aumentar X, Y una forma sugiere una relación lineal negativa perfecta. Al aumentar X, Y disminuye en una forma predecible. Las figuras 2.9(c) y (d) ilustran relaciones lineales imperfectas positiva y negativa. imperfectas y negativa. Las figuras Al aumentar X en estos diagramas de dispersion, Y aumenta (c) o disminuye (d), pero no diagramas dispersión, Y aumenta (c) o disminuye (d), X de manera perfectamente predecible. De ahí que Y pudiera ser ligeramente mayor o menor predecible. ahI pudiera ser ligeramente línea que "lo esperado". Esto es, los puntos X-Y no se ubican sobre una linea recta. esperado". Esto es, los puntos X- y no y Y y o 0 o 0 o 0 o 0 0 o 0 o 0 o 0 o o 0 o 0 (a) Lineal, positiva, perfecta y Y x (b) (h) Lineal, negativa, perfecta y X x O 0 O 0 0 O 0 O O 0 O 0 O 0 O 0 O 0 O 0 O 00 O O 3( ~ (c) Lineal, positiva, imperfecta y y x X (d) Lineal, negativa, imperfecta O 0 O 0 O 0 0 O O 0 O 0 O 0 0 O O 0 O 0 0 O O O 0 O O 0 0 O 0 O 0 O (e) Curva '-------------X x Sin relación (f) Sin relación X x Figura 2.9 2.9 Patrones para las gráficas de datos X-Y. gráficas de datos X-Y. 42 Revisión de conceptos estadísticos básicos Revision de conceptos estadisticos Capítulo Capitulo 2 diagramas de dispersion en las figuras 2.9(a) a la ilustran conoce Los diagramas de dispersión en las figuras 2.9(a) a la (d) ilustran lo que se conoce como relación lineal. La relaciOn X- y, sea perfecta o imperfecta, se puede resumir mediante relación lineal. La relación X-Y, sea perfecta o imperfecta, se puede resumir mediante una ilnea recta. En comparación, en el diagrama (e) aparece una relación curva. línea comparación, diagrama (e) aparece una relación curva. último, diagrama (f) de la figura 2.9 sugiere que no Por ültimo, el diagrama (t) de la figura 2.9 sugiere que no existe relación de ninguna clase entre las variables X y 1'. Al aumentar X, Yno parece aumentar o disminuir en forma entre las variables Xy Y. Al aumentarX, Y no en forma predecible alguna. evidencia la muestra que aparece en el diagrama (f), predecibie alguna. Con base en la evidencia de Ia muestra que aparece en el diagrama (f), se podria concluir que en el universo que contiene todos los puntos X y Y, no existe relación podría contiene todos los puntos Y, no otra, entre las variables X y Y. lineal u otra, entre las variables X y Y. Considérense ahora los dos diagramas de dispersion de Ia figura 2.10. Ambos Considérense ahora los dos diagramas de dispersión de la figura 2.10. Ambos diagramas de dispersion sugieren relaciones lineales positivas imperfectas entre Y y X La dispersión diagramas positivas imperfectas entre Y y X La diferencia consiste en que esta reiación parece ser más fuerte en Ia figura 2.10(a) ya que relación parece fuerte la figura 2.1O(a) ya que diferencia consiste en que de datos están muy cerca de la línea recta que pasa a través todos sus puntos de datos están muy cerca de la Imnea recta que pasa a través de ellos. En Ia figura 2.10(b) se sugiere una reiación más débil. Los puntos de datos están más alejados la figura 2.1 O(b) relación están más alejados de Ia Ilnea recta que los atraviesa, sugiriendo una relación lineal más débil. Más adelante la línea los atraviesa, sugiriendo relación débil. Más adelante en este capItulo se mostrará cómo medir la fuerza de Ia relación que existe entre dos capítulo mostrará cómo medir Ia fuerza de la relación existe dos en variables. Como sugieren los dos diagramas de dispersiOn de Ia figura 2.10, con frecuencia es los diagramas de dispersión la con frecuencia es deseable resumir la relación entre dos variables ajustando una línea recta a través de los deseable resurnir Ia relaciOn entre dos variables ajustando una lInea recta a través de los puntos Usted hacerlo adelante, el momento se puede puntos de datos. Usted aprenderá a hacerlo más adelante, pero por el momento se puede decir que se puede ajustar una Ilnea recta a los puntos del diagrama de dispersión, de modo línea recta los puntos del diagrama de dispersi6n, de modo que resulte un buen ajuste. La cuestión que se sugiere ahora es ¿qué tan rápido aumenta o resulte ajuste. cuestión que sugiere ahora es ,qué tan rápido aumenta disminuye la línea recta? disrninuye Ia pendiente de esta ilnea recta? y Y y Y 0 o 0 0 0 0 0 0 0 0000 o 0 0 o 0 0 o 0 o 0 o 0 0 0 0 o x '-------------x (a) Fuerte x '-------------x (b) Débil Figura 2.10 Graficación de relaciones fuerte y débil de datos X-Y. relaciones fuerte y débil de datos x-y. Figura 2.10 Responder esta pregunta requiere de pendiente línea. Responder esta pregunta requiere de calcular la pendiente de la Ilnea. La pendiente de cualquier Ilnea recta se define como el cambio en Y asociado con el cambio en X. La línea recta cambio Y asociado cambio en X línea la figura 2.11. pendiente de una Ilnea se muestra en Ia figura 2.11. figura 2.1 1(a), Y entre los puntos datos es 1, mientras que En la figura 2.11(a), el cambio en Yentre los dos puntos de datos es 1, mientras que el la ci cambio en X es 2; por lo que Ia pendiente de Ia lInea es 1/2. En Ia figura 2.l1(b) la iInea Xes 2; por 10 que la pendiente de la línea 112. 2.11(b) línea Análisis de correlación Análisis de correlaciOn Pendiente Pendiente = 43 t.y L,Y t.X 1 1 1 1 1 1 1 /~~]AH 1 1 1 I I I -------1 t.y = -1.2 EY= 1" --, I I I I 1 I ) j.( ~, t.X= 11 = Pendiente = (b) Pendiente = -1.2 t.X=2 AX=2 (a) Pendiente (a) Pendiente = = 4 = .5 = .5 + Figura 2.11 la recta. Fgura 2.11 Pendiente de Ia recta. negativa. incrementarse X en que la tiene una pendiente negativa. Al incrementarse X en 1, Y disminuye en 1.2, por lo que la disminuye en 1.2, pendiente es de -1.2. -1.2. Para la Pam resumir, en Ia investigación de una relación entre dos variables, primero se debe de relación entre dos variables, relación línea recta) o curva. Si es lineal, saber la saber saber si la relación es lineal (una linea recta) o curva. Si es lineal, se deseará saber si Ia relación es positiva o negativa y cuál es la inclinaciOn de la línea que se ajusta a los puntos y cuál es la inclinación Ia Ilnea que la relación, esto es, qué de datos. Por ültimo, se necesita el grado de Ia relación, esto es, qué tan cerca están los datos. último, se necesita el grado puntos de la lInea que mejor los ajusta. línea los ajusta. puntos Coeficiente de correlación Coeficiente Se necesita una forma de medir la cantidad de relación lineal que existe entre dos variables relación lineal que dos de interés. Para usar la terminología correcta, se desea una medición de la correlación que interés. Pam Ia terminologla correcta, se desea una medición de la correlación comúnmente relación existe entre dos variables. La medición que se utiliza comñnmente para esta relación es existe el coeficiente de correlación. el coejiciente de correlación. Dos variables con una relación negativa perfecta tienen un variables con una relación negativa perfecta tienen un variables con ma relación coeficiente de correlación igual 1. En el otro extremo, coeficiente de correlación igual a a-l. En el otro extremo, dos variables con una relación coeficiente de correlación igual a +1. que el coeficiente positiva perfecta tienen un coeficiente de correlación igual a + 1. Por lo que el coeficiente perfecta tienen de correlación varíe entre -1 y +11inclusive, dependiendo de la cantidad de correlación entre corrclación varIe entre 1 y + inclusive, dependiendo de la cantidad de correlación entre se midan. variables las dos variables que se midan. El coeficiente de correlación mide el grado al cual se relacionan en forma lineal de sí. dos variables entre si. 44 Revisión de conceptos estadísticos básicos Revision estadIsticos Capítulo 2 CapItulo dispersión figura 2.9 ilustra una situación que produciría El diagrama de dispersion (a) de la figura 2.9 ilustra una situación que producirla un coeficiente de correlación de +1, mientras que el diagrama de dispersión (b) tiene un coeficiente de correlación de +1, mientras que el diagrama de dispersion (b) tiene un coet1ciente de correlaciôn de 1. Los diagramas (e) y (f) grafican dos variables que no coeficiente de correlación de -1. Los diagramas (e) y (f) grafican dos variables que no relación lineal. Los coeficientes de correlación de estas relaciones son igual O, presentan relación lineal. Los coeficientes de correlación de estas relaciones son igual a 0, no existe relación lineal. es decir, no existe reiación lineal. También Tarnbién es importante distinguir entre los dos grupos de puntos de datos con los que importante distinguir entre los dos grupos de puntos de datos está interesado pronostica. la población que contiene todos los puntos X- y de está interesado quien pronostica. En la población que contiene todos los puntos X-Y de interés, existe un coeficiente de correlación cuyo símbolo es p (la letra griega rho). Si se interés, existe un coeficiente de correlación cuyo simbolo es p (Ia letra griega rho). Si lma de estos puntos de datos X-Y, coeficiente correlación de extrae una muestra de estos puntos de datos X-Y, al coeficiente de correlación de esta muestra de datos se le denomina En la tabla 2.11 se presenta un resumen las muestra de datos se le denomina r. En la tabla 2.11 se presenta un resumen de las características importantes de r. caracteristicas iniportantes de p y r. TABLA 2.11 TABLA 2.11 CORRELACiÓN LA POBLACION y DE LA MUESTRA CORRELACION DE LA POBLACION Y DE LA MUESTRA MUESTRA POBLACIÓN POBLACION Coeficiente de correlación: p (-1 1) Coeficiente de correlación: p (-1 " r" 1) Coeficiente de correlación: r (-1 " r" 1) 1) Coeficiente de cOlTelación: (-1 p = 1: correlación negativa perfecta = -1: correlación negativa perfecta r = -1: Correlación negativa perfecta r = 1: Correlación p = 0: sin correlación = o: sin correlación r = O: sin colTelación cOlTelación 0: p = 1: correlación positiva perfecta = 1: correlación positiva perfecta = 1: r = 1: correlación positiva perfecta perfecta correlación positiva Ejemplo 2.12 Considere un conjunto especifico de valores de X-Y y suponga que estos puntos constituyen Considere conjunto específico X-Y y suponga que constituyen la población completa de dichos puntos de datos. En la composición de los datos de la tabla población completa de dichos puntos de datos. En la composición de los datos de la tabla representa número cursos capacitación en ventas tomados y Y representa el 2.12, X representa el nñrnero de cursos de capacitación en ventas tomados y V representa ci número de días sin venta por mes, de los cinco vendedores del personal de la compañía. nimero de dIas sin yenta por mes, de los cinco vendedores del personal de la compafiIa. Aparentemente existe una relación Aparentemente existe una relación negativa en los datos ya que, mientras X se mueve en ya que, mientras X se mueve en una direcciôn (hacia abajo), Y se mueve precisamente en otra (hacia arriba). De ahí que para dirección abajo), Y se mueve precisamente en otra (hacia arriba). Dc ahi que para esta población de plmtos de datos se espera que sea aproxirnadarnente-1. esta población de puntos de datos se espera que sea aproximadamente 1. Con frecuencia, X y Y se miden en unidades diferentes, tales como libros y dóiares, miden en unidades diferentes, como libros y dólares, Con frecuencia, X y Y unidades vendidas y ventas en dólares, unidades vendidas y ventas en dóiares, tasa de desempleo y Producto Nacional Bruto en de desempleo y Producto Nacional Bruto en dólares. Haciendo a un lado estos diferentes métodos para medir X y Y sigue siendo importante dólares. Ilaciendo lado estos diferentes métodos para mcdirXy Y, el alcance de su relación entre si. Esta rnedición se hace convirtiendo primero las mediciones su relación sí. Esta medición hace convirtiendo ci de los datos de Ia muestra a unidades estándar. de la muestra unidades estándar. de X-y sc convierten estandarizados, se multiplican Las mediciones de X-Y se convierten a valores estandarizados, los cuales se multiplican para cada medición de X- y, obteniendo productos cruzados para cada niedición de X-Y, obteniendo productos cruzados para cada elemento o persona. cada elemento o persona. TABLA 2.12 DATOS EJEMPLO TABLA 2.12 DATOS PARA EL EJEMPLO 2.12: CURSOS y DIAS SIN VENTAS CURSOS Y DíAS DÍAS SIN VENTAS DfAS SIN VENTAS VENDEDOR A B (Y) CURSOS CURS OS (X) 3 4 C D E 5 6 7 7 6 5 5 4 3 Análisis de correlación Análisis de correlaciOn 45 45 Estos productos cruzados son de interés ya que la media Estos productos cruzados son de interés ya que la media de estos valores corresponde al estos valores corresponde al coeficiente de correlación. La ecuación 2.13 muestra que la media de los productos cruzados los productos cruzados coeficiente de correlación. ccuación 2.13 muestra que de los valores estandarizados para dos variables es el coeficiente de correlación. estandarizados para dos variables es correlación. p=-_.- Iz z x y N (2.13) de correlación El cálculo del coeficiente de correlación p mediante los productos cruzados de los valores los valores estandarizados siempre producirá el valor correcto, aunque en la mayoría de los casos existe estandarizados siempre producirá el valor correcto, aunque en Ia mayorIa de los casos existe una forma más fácil de realizar los cálculos. La ecuación 2.14 es equivalente a encontrar p de realizar los cálculos. equivalente mediante ci cáiculo de valores estandarizados. mediarite el cálculo de la media de los productos cruzados de los valores estandarizados. ~-Y_\ Izz N p= NIxy (X)(Y) NXY -- (IX)(IY) \/NIX2 - (X)2 VNY2 - (fl2 (2.14) una prueba de esta relación.) (Véase el apéndice A para una prueba de esta reiación.) tabla valores. Para el ejemplo calcular mediante Para caicular p mediante esta ecuación, se requiere una tabia de valores. Para ci ejemplo 2.12, los cálculos se ilustran ella tabla 2.13. cálcuios se ilustran ella tabla 2.12, Ahora, tenemos todos los elementos necesarios para resolver Ia ecuación 2.14; Ahora, tenemos todos los elementos necesarios para resolver la ecuación 2.14; la cálculos son sustitución y los cáiculos son p= = -Vr(=5)=(l~3=5)~-=25::::::2:-vr(5==)=(I=35=)=-===25:=:;2 \/(5)(135) - 252V(5)(l35) - 252 -50 v5()2 \/502 (5)(115) (25)(25) (5)(I 15) -- (25)(25) 575 - 625 575 - 625 - V5oV5o V56V56 50 = = -1 - 50 --1 -50 Al examinar un conjunto de puntos de datos, se debe emplear ianjuicio para decidir puntos datos, un juicio para decidir Al examinar un conjunto p es lo suficientemente grande para considerar que variables cuándo el valor de p es lo suficientemente grande pam considerar que las dos variables cuándo ci tienen una alta correlación lineal. Aunque en Ia mayoría de los casos comprende un conjunto la mayorIa de puntos X- y de una población, se puede usar Ia ecuación 2.15 para encontrar ci coeficiente la ecuaciOn 2.15 para el coeficiente X-Y de una población, de correlación que mida hasta qué grado las dos variables se mueven juntas en forma lineal. correiaciOn que mida hasta qué grado las dos variables se muevenjuntas en forma lineal. Es común el Es comñn ci caso que se haya extraIdo una muestra de puntos de datos de manera que se haya extraído puntos de datos de manera aleatoria, estudio. utiliza la ecuación 2.14 después aleatoria, de una población bajo estudio. En este caso, se utiliza la ecuación 2.14 después remplazar tamaño de Ia población, por n, el Así, fórmula de rempiazar N, el tamaflo de la población, por n, el tamaño de la muestra. AsI, la formula correlación se convierte en para obtener el coeficiente de correlación de la muestra se convierte en TABLA 2.13 2.13 CÁLCULOS NECESARIOS PARA UTILIZAR LA CALCULOS NECESARIOS ECUACION 2.14 PARA LOS DATOS DEL EJEMPLO 2.12 ECUACiÓN 2.14 PARA LOS DATOS DEL EJEMPLO 2.12 VENDEDOR A B B C e Y Y 3 3 4 5 5 6 X X 7 7 Y' 6 6 5 5 X' 49 36 XV XY 21 21 24 25 24 21 115 D E - 7 Sumas Surnas 25 4 3 3 25 ~ 9 16 25 36 49 135 ~ 25 16 9 9 135 46 Revisión de conceptos estadísticos básicos Revision estadIsticos CapItulo Capítulo 2 r = Ejemplo Ej emplo 2.13 nIXY (X)(,Y) nIXY - - (IX)(IY) VnX2 - (X)2 VnY2 - (Y)2 (2.15 ) (2.15) Si se estudia Ia reiación entre edad e ingreso (tabla 2.10), pudiera ser de interés el conocer el la relación interés el conocer el Si valor de rr para estos datos. Los cálculos requeridos aparecen en Ia tabla 2.14. para estos datos. Los cálculos requeridos aparecen en la tabla 2.14. En Ia tabla se puede apreciar que ci coeficiente de correlación confima lo que se observó En la tabla se puede apreciar que el coeficiente de correlación confirma lo que se observó la tabla en la figura 2.8. El valor de es positivo, sugiriendo una relación lineal en Ia labIa 2.10 y en Ia figura 2.8. El valor de rres positivo, sugiriendo una relación lineal positiva cntre cdad e ingreso. Además, en una escala del Oal 1, el valor de res aceptabiemente entre edad e ingreso. Además, en una escala del 0 all, r es aceptablemente alto (.89). Este resultado sugiere una fuerte relaciOn lineal y no una débil. La pregunta que Este resultado fuerte relación lineal y una débil. La pregunta que saber la combinación del tamaño de Ia muestra y ci coeficiente de correlación es lo resta es saber si Ia combinación del tamaño de la muestra y el coeficiente de correlación es lo suficientemente fuerte para hacer declaraciones significativas respecto a la pobiación de la que población la que suficientcmente fuerte se extrajo Ia muestra. cxtn~jo la Ahora, al abordar la correlación, se deben sefialar dos p.mtos importantes. Ahora, la correlación, se deben señalar dos puntos importantes. Primero, siempre debe tenerse presente que se está midiendo la correlación y no la Prirnero, siempre debe tenerse presente que se está midiendo Ia correlación y causalidad. Podria ser perfectamente válido que dos variables estuvieran correlacionadas Podría ser perfectamente válido que dos variables estuvieran correlacionadas con base en un coeficiente de correlación alto. Pero podría o no ser válido decir que una con base en lm coeficiente de correlación alto. Pero podrIa o no ser válido decir que una variable causa el movimiento de la otra; ésta es una cuestión para el juicio del analista. Por catesa ci rnovirniento de la otra; ésta es cuestión ci Por ejemplo, podría ser cierto que el volumen de ventas de una tienda rural en un area poco un área poco ejemplo, podria ser cierto que el volwnen de ventas poblada estuviera altamente relacionada con el precio promedio del mercado accionario de relacionada poblada Ia ciudad de Nueva York. Después de exarninar una muestra grande de estas dos variables, la ciudad de York. examinar grande se podria concluir que tal conelación alta existe. Probablemente sea falso que una de estas podría tal correlación alta existe. Probablemente estas dos variables esté causando el movimientode la otra. De hecho, es probable que ci dos variables esté causando ci movimiento de la otra. hecho, probable que el movimiento de cstas dos variables esté producido por una tercera, el estado general de la de la rnovirniento de estas dos variables esté producido una tercera, econornia. Es frecuente que políticos, publicistas y otras personas cometan error de economía. Es frecuente que politicos, publicistas y otras personas cometan el error de base en la correlación. suponer causalidad con base en Ia correiación. TABLA TABLA 2.14 CALCULOS PARA LA CORRELACION ENTRE EDAD CÁLCULOS LA CORRELACiÓN EDAD E INGRESO DEL EJEMPLO 2.14 2.14 INGRESO DEL PERSONA NUM. NÚM. 1 1 2 2 3 4 4 5 5 V Y X y2 y2 60,840,000 72,250,000 100,000,000 225,000,000 268,960,000 727,050,000 Xl x2 Xy xy 7,800 8,500 10,000 15,000 16,400 57,700 57,700 Sumas Surnas 22 22 23 23 26 27 27 35 133 484 529 529 676 729 729 1.225 1,225 3,643 3.643 171,600 171.600 195,500 260,000 260,eXlO 405,000 574,000 1,606,100 r = (5)(1,606.100) (133)(57,700) (5)(1,606,100) - (133)(57,700) (133)2 Y(5)(727.050,000) (57,700)' V(5)(3,643) -- (133)2 V(5)(727,050,000) --(577(X))2 8,030,500 - 7,674,100 8,030,500 - 7,674,100 (22.93)(17,491.71 ) (22.93)(17,491.71) 356,400 401,084.90 401.084.90 - .89 = .89 Aplicación en Ia administraciOn en la administración 47 Segundo, nótese que la correlación mide una relación lineal entre dos variables. Si Segundo, nótese que la correlación mide una relación lineal entre dos variables. Si fuera el caso de un coeficiente de correlación bajo, se podrIa concluir que las dos variables coeficiente de correlación podría variables no guardan una estrecha relación en forma lineal. PodrIa ser que si tuvieran una estrecha lineal. Podría ser tuvieran estrecha relación de manera curva o no lineal. De ahI que un coeficiente de correlación bajo no manera curva lineal. ahí que un coeficiente correlación bajo relación de signifique que correlación entre dos variables, solamente que no aparente signifique que no hay correlación entre dos variables, solamente que no es aparente que exista una relación lineal o recta. recta. APLICACIÓN EN LA ADMINISTRACIÓN APLICACIÔN ADMINISTRACION Muchos de los conceptos de este capItulo de repaso se podrIan considerar como material capítulo podrían considerar como material Muchos necesario para comprender las técnicas más avanzadas de pronóstico que se encuentran a comprender las técnicas avanzadas de encuentran a necesario lo largo del resto del texto. Sin embargo, los conceptos de este capItulo tienen también, resto del texto. embargo, este capítulo tienen también, sí mismos, valor en muchas aplicaciones estadísticas. Mientras que algunas por si mismos, valor en muchas aplicaciones estadIsticas. Mientras que algunas de estas aplicaciones pudieran no quedar bajo el tItulo de "pronósticos", abarcan sin embargo el uso título sin embargo el uso de datos reunidos para responder preguntas sobre la incertidumbre de la operación la operación de datos reunidos para responder preguntas sobre la incertidumbre empresarial, en especial a la incertidumbre de los resultados futuros. incertidumbre resultados futuros. empresarial, Los procedimientos estadística descriptiva mencionados con anterioridad se Los procedimientos de estadIstica descriptiva mencionados con anterioridad se ampliamente dondequiera que cantidades de datos, de utilizan ampliamente dondequiera que se deben describir grandes cantidades de datos, de manera que se puedan asimilar y utilizar en el proceso de toma de decisiones. SerIa casi asimilar y utilizar en proceso decisiones. Sería casi manera que imposible pensar en una sola area que comprenda mediciones numéricas, en la que no se área comprenda mediciones numéricas, en la que no se imposible pensar en resuman rutinariamente los conjuntos de datos mediante estadística descriptiva. Este hecho conjuntos mediante estadIstica descriptiva. Este hecho en menor se aplica en particular a la media, a Ia que comuinmente se llama "promedio" y, en menor particular a la media, a la que comúnmente se grado, a Ia desviación estándar. Cualquiera entiende el promedio de conjuntos de datos y datos y grado, la desviación estándar. Cualquiera entiende el promedio hecho durante muchos años para proporcionar medición central de arreglos de se ha hecho durante muchos años para proporcionar una medición central de arreglos de datos. Las mediciones de dispersion como Ia desviación estándar están ganando terreno al dispersión la desviación datos. más comprensibles tales mediciones. hacerse más comprensibles tales mediciones. Las distribuciones binomial y normal son buenos ejemplos de distribuciones teóricas distribuciones binomial y normal son buenos ejemplos de distribuciones teóricas representan buenos modelos muchas situaciones de real. Como tales, su que representan buenos modelos para muchas situaciones de la vida real. Como tales, su amplio en muchas aplicaciones, incluyendo pronóstico. Por ejemplo, el pronóstico uso es amplio en muchas aplicaciones, incluyendo el pronóstico. Por ejemplo, el pronóstico del porcentaje de partes defectuosas en un lote, se podrIa encontrar mediante la utilización defectuosas en lote, podría del mediante utilización una distribución binomial. de una distribución binomial. La estimación y las pruebas de hipótesis son los dos pilares de las aplicaciones pruebas hipótesis son dos pilares de las aplicaciones La estimación y estadísticas básicas. valores de una población de interés estadIsticas básicas. El pronóstico o estimación de los valores de una población de interés ampliamente difundido a través de la medición de ima muestra aleatoria, está ampliamente difundido en donde las de la medición de una muestra restricciones fuerzan la dependencia en resultados muestras restricciones de tiempo y dinero fuerzan Ia dependencia en resultados de muestras para la información para la decisiones. muestreo difundido en particular en el información para Ia toma de decisiones. El muestreo se ha difundido en particular en el la auditoría contable. prueba de hipótesis se usa ampliamente para comparar proceso de la auditorla contable. La prueba de hipótesis se usa ampliamente para comparar valores la población en periodos anteriores con valores actuales; para comparar los valores de la población en periodos anteriores con valores actuales; para comparar los valores parámetro de dos distintas ramas ubicaciones de negocio detectar valores del parárnetro de dos distintas ramas o ubicaciones de un negocio y para detectar cambios mediciones dave de procesos productivos. Esta última aplicación, los cambios en mediciones clave de procesos productivos. Esta ültima aplicación, conocida clave de los esfuerzos de como control de producción es, en muchos casos, el componente dave de los esfuerzos de una empresa para mejorar su calidad. em;Jresa mejorar calidad. La prueba de la bondad de ajuste se usa con frecuencia para verificar la validez de con frecuencia prueba suposiciones con respecto a distribuciones de población. Este proceso es especialmente suposiciones con respecto a distribuciones de población. Este proceso es especialmente 48 Revisión de conceptos estadísticos básicos Revisián estadIsticos Capítulo 2 Cap Itulo importante a! utilizar ciertos modelos de simulación que requieren, ejemplo, la importante al utilizar ciertos modelos de simulación que requieren, por ejemplo, Ia suposición Dichas suposicion de procesos de Poisson, para que los resultados del modelo sean válidos. Dichas simulaciones se emplean para modelar situaciones reales y, después de validarlas, para validarlas, para simulaciones se emplean para modelar situaciones reales y, después pronosticar los resultados de cambios en el sistema sobre resultados de salida. resultados sistema sobre resultados salida. La con'elación tiene un amplio uso en examen las relaciones pares de La correlación tiene un amplio uso en el examen de las relaciones de pares de variables numéricas. Como se verá variables numélicas. Como se vera en capItulos posteriores, estas relaciones son de gran capítulos posteriores, estas relaciones son gran importancia para los pronósticos, ya que el pronóstico de una variable a menudo comprende ya que el pronóstico de una variable a menudo comprende el intento de encontrar variables relacionadas, Tanto el análisis de regresión como el de intento encontrar variables relacionadas, Tanto el análisis regresión de regresión mñltiple se basan en la correlación en este proceso. regresión múltiple la correlación en este proceso. GLOSARIO Coeficiente de correlación Medición que indica hasta qué grado se relacionan linealmenMedición te dos variables numéricas entre si. numéricas sí. te de dispersión X-Yen espacio bidimensional. Diagrama de dispersion Una gráfica de puntos X-Y en un espacio bidimensional. DistribuciOn muestral Una distribución muestral es la disposición de todas las estadIstiDistribución las estadístimuestral cas posibles de Ia muestra, que se pueden extraer de una población, para un tarnaflo la muestra, que se pueden extraer de una población, para un tamaño de muestra dado. dado. EstadIstica Estadística descriptiva Métodos que se usan para describir conjuntos de datos con unos Métodos conjuntos cuantos valores de resurnen. resumen. Grados de lihertad Los grados de libertad en un conjunto de datos indican el rnimero de libertad Los número de elementos de datos independientes sí únicas elernentos de datos que son independientes entre Si y que representan piezas ünicas información. de información. Intervalo de estimación Un intervalo de estimación es un intervalo numérico, dentro del lntervaio de estimaciOn Un intervalo de estimación es un intervalo numérico, dentro del probable se ubique un parámetro de la población. cual es probable que se ubique un parárnetro de la población. de la de la se puede Prueba de Ia bondad de ajuste La prueba de Ia bondad de ajuste determina si se puede suponer muestra de elementos hayan extraídos una población que suponer que una muestra de elernentos hayan sido extraldos de una población que sigue una distribución especI fica. Si gue una distribución específica. Punto de estiniación Un punto de estirnación es una estirnación con un solo valor, de estimación estimación es estimación con un parámetro de la población. un parimetro de la población. esperado Valor esperado El valor esperado de una variable aleatoria corresponde al variable aleato El valor esperado de una valor la variable en muchos intentos u observaciones. promedio de la variable en muchos intentos u observaciones. Variable aleatoria continua Una variable aleatoria continua puede tomar cualquier Variable aleatoria continua Una variable aleatoria continua puede tomar cualquier valor numérico dentro de cierto intervalo. intervalo. numérico dentro Variable aleatoria discreta variable aleatoria discreta sólo puede tomar ciertos Variable aleatoria discreta Una variable aleatoria discreta solo puede tomar ciertos valores especIficos, por lo regular enteros. valores específicos, 2 CapItulo 2 Fórmulas clave FOrmulas dave 49 FÓRMULAS CLAVE FORMULAS CLAVE Media poblacional poblacional ¡.t = - IX N (2.1 ) (2.1) Media muestral X = s/n muestral X = sin - IX (2.2) Desviación estándar DesviaciOnestándar poblacional ()2 / V (X IL)2 N N (2.3) Desviación estándar muestral s = Desviacin muestral s = J N (X - Xl' I l(X - X)2 n - 1 = - / \J (X)2 N (2.4) ()2 Varianza poblacional poblacional o2 1x2 N (2.5) (X)2 n ¡(X - X)2 S2 Varianza muestral s 2 = n - 1 n- 1 n - 1 n- 1 (2.6) (2.7) Valor esperado Fórmula binomial Formula binomial E(X) = ¡[X'P(X)] E(X) = I[XP(X)] P(x) P(x) = C1Tx(1 -C~7Tx(l IT)n_x 7T)n-x (2.8) Fórmula para obtener valores estandarizados Formula para obtener valores estandarizados una media Intervalo de confianza para una media X ± Z X± Z X-u X /L Z = =---= (T (2.9) _s_ '\0i (2.10) Intervalo de confianza para una proporción p p±± Z Intervalo de confianza para una proporción z Formula de ji-cuadrada Fórmula x2 = todas las categorías calegorias ~ .J 2 ~ I ------;;-- - (2.11 ) (2.11) (2.12) (f - f o e 50 Revisión de conceptos estadIsticos básicos estadísticos básicos Revision Capítulo Cap itulo 2 Coeficiente de correlación para población Coeficiente de correlación para una población p=~ ¡z z zyzx N (2.13 ) (2.13) p= ¡Z y Z x zyzx N - NXY - (X)(Y) - \/NIX2 - (X)2 \/NIY2 - (Y)2 (2.14) Coeficiente de correlación para una muestra Coeficiente de correlación para r= r = nXY - (IX)(Y) VnX2 - (X)2VnIY2 - (Y)2 (2.15) PROBLEMAS 1. 1. Dick 1-loover, propietario de Modem Office Equipment, está preocupado por los costos de Hoover, propietario de Modern Office Equipment, está preocupado por los costos de transpol1e y de oficina en que incurren los pedidos pequefios. En un esfuerzo por reducir gastos incurren los pedidos pequeños. gastos transportc en esta area, decide introducir una polItica de descuento, en beneficio de los pedidos superiores área, política los pedidos superiores a $40, esperando que esto motive a los clientes a consolidar varios pedidos pequefios en otros esperando esto motive a los clientes a consolidar varios pedidos pequeños otros más grandes. Los datos siguientes muestran las cantidades por transacción de una muestra de 28 las cantidades por transacción de una muestra de 28 clientes: 10,15,20,25,15,17,41,50,5,9,12,14,35,18 10, 15, 20, 25, 15, 17,41,50,5,9, 12, 14, 35, 18 19,17,28,29,11,11,43,54,7,8,16,13,37,18 19,17,28,29,11,11,43,54,7,8,16,13,37,18 la media. Calcule Ia media. la desviación estándar. Calcule Ia desviaciOn estándar. la varianza. Calcule Ia varianza. la política ¿la media de la distribución aumentará, disminuirá permanecerá Si Ia poiltica tiene éxito, tla media de Ia distribuciOn aumentará, disminuirá o permanecerá sin cambio? cambio? c. Si Ia politica tiene éxito, tla desviaciOn estándar de la distribuciOn aumentará, disminuirá o ¿la desviación de la distribución aumentará, Si la política permanecerá permanecerã sin cambio? i f. Pronostique Ia cantidad de Ia transacción del prOximo cliente. la la transacción del próximo cliente. 2. Dc acuerdo con un manual no clasificado de una oficina de impuestos, no son solo los elementos De acuerdo con un manual no clasificado de una oficina de impuestos, no son sólo los elementos su declaración que pueden producir auditoría. ausencia ciertos que aparecen en su declaración los que pueden producir una auditorla. La ausencia de ciertos número (función de discnminación) su declaración elementos puede elevar el nilmero DIF (funciOn de discriminación) y hacer que su declaración sea señalada para revision. El nOniero DIF indica la probabilidad de que una auditoria dé por revisión. número DIF mdica probabilidad de auditoría dé por sea señalada resultado un impuesto adicional. También, el programa DIF muy efectivo para detectar resultado un impuesto adicional. También, el programa DIF es muy efectivo para detectar declaraciones mal lienadas. Solo airededor del 15% de las auditorías a contribuyentes la declaraciones mal llenadas. Sólo alrededor del 15% de las auditorlas a contribuyentes en la categoría de ingreso de $25 000 resultan cambio en cantidad impuesto categoria de ingreso de $25 000 a $50 000 resultan sin cambio en la cantidad de impuesto a pagar (Tax Guide lar College Teachers, 1992). for Callege Teachers, 1992). a. Pronostique la probabilidad de que si la oficina de impuestos audita a un contribuyente con contribuyente con Pronostique Ia probabilidad de que si ingresos de $45 000, no se produzca un cambio en Ia cantidad de impuesto a pagar. ingresos de $45 000, no produzca un cambio en la cantidad de impuesto a pagar. b. Pronostique Ia probabilidad de que si la oficina de impuestos audita a un contribuyente con la probabilidad de oficina de impuestos audita a un contribuyente con a. b. c. d. CapItulo 2 Capítulo Problemas Problemas 51 ingresos de $30 000, se produzca un cambio en Ia cantidad de impuesto a pagar. se produzca un cambio en la cantidad de impuesto a pagar. c. La oficina de impuestos realiza a! azar auditorlas a cuatro contribuyentes con ingresos entre La oficina de impuestos realiza al azar auditorías cuatro contribuyentes ingresos entre $50 000, pronostique probabilidad de que auditorías $25 000 y $50 000, pronostique la probabilidad de que dos o más auditorlas den por resulalgún cambio en la cantidad de impuesto a pagar. tado algán cambio en la cantidad de impuesto a pagar. 3. El hotel Barcellos' Tumn Turn Resort ileva un registro del nürnero de dias que permanece cada El hotel Barcellos' Tumn Tum Resort lleva un registro del número de días que permanece cada huésped. Descubren que huésped. Descubren que esta variable presenta una distribución normal con una media de siete variable presenta una distribución normal con una media de siete dIas días y una desviación estándar de dos. El pronóstico para el próximo mes indica que esperan desviación estándar El pronóstico el próximo mes indica que esperan 500 huéspedes. a. Pronostique cuántos huéspedes permanecerán menos de 5 dIas. 5 días. 15 días. b. Pronostique cuántos huéspedes permanecerán más de 15 dIas. y 12 días. c. Pronostique cuántos huéspedes permanecerán entre 6 y 12 dIas. La línea aérea New Horizons Airlines desea pronosticar la media de asientos desocupados por 4. La Ilnea aérea New Horizons Airlines desea pronosticar la media de asientos desocupados por año. desarrollar vuelo a Alemania durante el próximo ano. Para desarrollar este pronóstico, se seleccionaron en forma aleatoria de los archivos del año pasado, los registros de 49 vuelos y se tomó nota del forma aleatoria de los archivos del aflo pasado, los registros de 49 vuelos y se tomó número de asientos no ocupados en cada vuelo. La media muestral y la desviación estándar son cada vuelo. La media muestral y la desviación estándar son nümero 8.1 y 5.7, respectivamente. Desarrolle un punto e intervalo de estimación de 95% de la media 8.1 5.7, respectivamente. Desarrolle un punto e intervalo de estimación de 95% de la media de asientos no ocupados por vuelo durante el afio pasado. Pronostique la media de asientos no durante año pasado. Pronostique la media de asientos no ocupados por vuelo a Alemania en el próximo aflo. Explique la precision de este pronóstico. Alemania el próximo año. precisión pronóstico. S. Con base en experiencias anteriores, la California Power Company pronostica que enero 5. Con base en experiencias anteriores, la California Power Company pronostica que en enero electricidad residencial por casa será de 700 kwh. próximo, la media del uso de electricidad residencial por casa será de 700 kwh. En enero, la próximo, Ia media del uso 715 y una compañía selecciona una muestra aleatoria simple de 50 casas y calcula una media de 715 y una compaflIa selecciona una muestra aleatoria simple de 50 significancia de .05 para determinar si desviación estándar de 50. Pruebe a un nivel de significancia de .05 para determinar si el desviación estándar de 50. Pruebe a un nivel es razonable. pronóstico es razonable. De acuerdo con una encuesta sobre planes familiares 6. De acuerdo con una encuesta sobre planes familiares de viaje, realizada por el U.S. Travel Data Homes Gardens, el 49% de las familias vacacionistas que Center para Ia revista Better Homes and Gardens, el 49% de las farnilias vacacionistas que Center para la revista viajar este año con niños, pretenden viajar este año con nifios, planean visitar un parque temático (The Wall Street Journal, (The Wall Street Journal, abril 15, 1992). Brandon Kim, presidente de Wild Kingdom, está interesado en construir un Wild Kingdom, está interesado en construir un abril 15, 1992). Brandon Kim, presidente temático en Madison, Wisconsin. que tendrá éxito si puede pronosticar parque temático en Madison, Wisconsin. Brandon piensa que tendrá éxito si puede pronosticar que por lo menos el 49% de las farnilias de los airededores pretenden visitar un parque temático las familias alrededores en sus vacaciones, por lo que realiza una encuesta a 700 familias y encuentra que 325 de ellas vacaciones, familias de ellas indican en sus respuestas que planean visitar un parque temático. ¿Cuál sería la conclusion de respuestas que planean visitar un parque temático. ,Cuál serla conclusión indican en prueba con un nivel de significancia de .01? Brandon si prueba con un nivel de significancia de .01? 7. Expertos en población indican que ci tamaño de Ia familia se ha reducido en los ültimos aflos. Expertos en población indican que el tamaño de la familia se ha reducido en los últimos años. Hace diez años, el tamaflo promedio de una familia era de 2.9. Considere una población con los Hace tamaño promedio de una familia era de 2.9. Considere poblaciOn con los la P2.7. tamaños familias tarnaños de 200 familias que se presentan en Ia tabla P2.7. Seleccione de manera aleatoria una muestra de 30 elementos y pruebe Ia hipOtesis de que el tamaflo promedio de la familia no ha 30 elementos y pruebe la hipótesis de que tamaño promedio de Ia familia no en los últimos diez años. cambiado en los iiltimos diez aflos. Butter predice que los consumidores prefieren Bif a otras marcas de 8. La compafila Bif Peanut Butter predice que los consumidores prefieren Bif a otras marcas de 8. La compañía de cacahuate. La compañía compañía de investigación independiente mantequilla de cacahuate. La compafuIa contrata a una compañIa de investigaciOn independiente efectuar una encuesta telefónica en un área de prueba de mercado. La compañía investigapara efectuar una encuesta telefónica en un area de prueba de mercado. La compafiIa investigallama 400 amas de casa y obtiene las siguientes preferencias de marca: dora llama a 400 amas de casa y obtiene las siguientes preferencias de marca: la investigación para Bif, resumiendo Redacte una breve nota para Bif, resurniendo los resultados de Ia investigación MARCA MARCA A 75 BIF MARCA C MARCA D 65 E MARCA E MARCA D 90 82 88 52 TABLA P2.7 P2.7 (1) 3 (1)3 (2) 2 (3) 7 (4) 3 (5) 4 (6) 2 (7) 3 (7)3 (8) 1 1 (9) 5 (9)5 (10) 3 (10)3 (11) 2 (11)2 (12) 3 (12)3 (13) 4 (13)4 (14) 1 1 (15) 2 (15)2 (16) 2 (17) 4 (17)4 (18) 4 (18)4 (19) 3 (19)3 (20) 2 (21) 11 5 (22) 5 (23) 2 (23)2 (24) 11 (25) 4 (25)4 (26) 3 (26)3 2 (27) 2 (28) 3 (28)3 (29) 6 (29)6 (30) (30) 11 (31) 2 (31)2 (32) 4 (32)4 (33) 3 3 (34) 2 ~~ .---_.~-- Revisión de conceptos estadIsticos básicos RevisiOn de conceptos estad ísticos básicos Cap Itulo Capítulo 2 (35) 1 1 (36) 2 (36) (37) 4 (37) (38) 1 1 (39) 4 (39) (40) (40) 2 (41) 1 1 (42) 3 (43) 5 (43)5 (44)2 (44) 2 (45)1 (45) 1 (46) 4 (46)4 (47) 3 (47)3 (48) 5 (48)5 (49) 2 (49)2 (50) 4 (50) (51) 1 (51)1 (52)6 (52) 6 (53)2 (53) 2 (54) 5 5 4 (55) 4 1 (56) 1 (57) 2 (57)2 1 (58) 1 (59) 5 (59)5 (60) 2 (60)2 7 (61) 7 (62) (62)11 (63) 2 (63)2 (64) 6 (64)6 (65)4 (66) 1 1 (67) 2 (67) (68) 1 1 (69) 2 (69)2 (70) 4 (70) (71) 3 (71) (72) 7 (72) (73) 2 (74) 6 (75) 2 (75)2 (76) 7 (77) 3 (77)3 (78) 6 (78)6 (79) 4 (79)4 (80) 2 (80)2 (81) 3 (81)3 (82) 5 (82)5 (83) 2 (83)2 (84) 1 1 (85) 3 (85)3 (86) 3 (86)3 (87) 2 (87)2 (88) 4 (88)4 1 (89) 1 2 (90) 2 (91) 3 (91)3 (92) 3 (92)3 (93) 2 (93)2 (94) 4 (94)4 1 (95) 1 (96) 2 (96)2 (97) 4 (97)4 (98) 3 (98)3 (99) 2 (99)2 (100) 6 (100)6 (101) 4 (101)4 (102) 1 1 (103) 2 (103) (104) 5 (105) 3 3 (106) 2 (107) 1 1 (108) 2 (108)2 (109) 2 (110)1 (110) 1 (111) 4 (111)4 (112) 1 (112)1 (113) 1 (113)1 (114) 2 (114)2 (115)2 (115) 2 (116) 1 1 (117) 4 (118) 2 (118)2 (119) 1 1 (120) 3 (120)3 (121) 5 (121)5 (122) 11 2 (123) 2 (124) 3 (124)3 (125)4 (125) 4 (126) 3 (126)3 (127) 2 (127)2 (128) 11 (129) 6 (129)6 (130) 11 (131) 2 (131)2 (132) 5 (132)5 (133) 2 (133)2 (134) 1 1 (135) 5 (135)5 (136) 2 (137) 1 1 (138) 4 (138) (139) 2 (139) (140) 4 (140) (141) 1 1 (142) 2 (142) (143) 4 (143)4 (144) 1 1 (145) 2 (145)2 (146) 2 (146)2 (147)5 (147) 5 (148) 3 (148)3 (149) 1 1 (150) 2 (151) 6 (151)6 (152) 2 (152)2 (153) 5 (153)5 (154) 1 1 (155) 2 (156) 1 1 (157) 4 (157)4 (158) 2 (158)2 (159) 2 (159)2 (160) 7 (160)7 (161) 4 (161)4 (162) 2 (162)2 1 (163) 1 (164) 7 (164)7 (165) 2 (165)2 (166)7 (166) 7 (167) 4 (167)4 ~ - - - - (168) 6 (168)6 (169) 3 (169) (170) 2 (170) (171) 3 (171) (172) 4 (172) (173) 2 (173) (174)2 (175) 1 1 (176) 5 (176)5 (177) 3 (177)3 (178) 2 (178)2 (179) 4 (179)4 (1 ~W) 3 (180)3 (181) 5 (181)5 (182) 3 (182)3 (183) 1 1 (184) 2 (184)2 (185) 4 (185)4 (186) 3 (186)3 (187) 2 (187) (188) 5 (189) 3 (190) 4 (190)4 (191) 3 (191)3 (192) 2 (192)2 (193) 3 (193)3 2 (194) 2 (195) 5 (195)5 (196) 3 (196)3 (197) 3 (197)3 (198) 2 (198)2 (199) 5 (199)5 (200) 1 1 -- - --_ ..-._ ----------"._.. ------------------------ Authority, quiere determinar si 9. James Dobbins, supervisor de mantenimiento de Atlanta Transit Authority, quiere determinar si James Dobbins, supervisor de mantenimiento existe una relación positiva entre el costo anual de mantenimiento de un autobüs y SU edad. el costo anual de mantenimiento de un autobús y su edad. Si existe una relación, James piensa que puede un mejor trabajo de predicción del Si exiSte una relaciôn, James piensa que puede hacer un mejor trabajo de predicción del presupuesto anual de mantenimiento de autobuses. Para ello, reine los siguientes datos: presupuesto anual de mantenimiento de autobuses. Para ello, reúne los siguientes datos: COSTO DE MANTENIMIENTO ($) ($) COSTO AUTOBÚS AUTOBUS 1 1 2 3 3 4 5 5 6 6 7 7 8 9 Y Y EDAD (AÑOS) EDAD (AOS) x X 8 8 5 5 3 3 859 682 471 708 1094 1094 224 320 651 1049 1049 9 9 11 11 2 1 1 8 12 12 Capítulo 2 CapItulo Problemas 53 a. Grafique un diagrama de dispersion. de dispersión. b. j,Que tipo de relación existe entre estas dos variables? ¿Qué existe entre estas dos variables? c. Calcule el coeficiente de correlación. de correlación. 10. Anna Sheehan es gerente de la cadena de supermercados Spendwise. A ella le gustarla poder Sheehan cadena de supennercados Spendwise. A ella le gustaría poder 10. predecir las ventas predecir las ventas de los libros encuadernados en rústica (libros por semana) con base en la libros encuadernados en rüstica (libros por semana) con base en cantidad de espacio cantidad de espacio de repisas proporcionado (en pies). Anna reúne la información para una repisas proporcionado (en pies). Anna reline infonnación para 11 semanas: muestra de 11 semanas: NÚMERO DE LIBROS VENDIDOS NUMERO DE LIBROS VENDIDOS SEMANA y Y 275 275 142 168 168 REPISAS (EN PIES) ESPACIO EN REPISAS (EN PIES) X 1 1 6.8 3.3 2 2 3 3 4 5 5 6 7 7 8 8 9 9 10 11 11 197 215 188 188 241 295 125 266 200 4.1 4.2 4.8 3.9 4.9 7.7 3.1 5.9 5.0 a. Grafique un diagrarna de dispersion diagrama dispersión b. ¿Qué tipo de relaciOn existe entre estas dos variables? de relación existe Qué c. Calcule el coeficiente de correlaciOn. coeficiente de correlación. j,Deberia Anna usar el análisis de regresión para predecir las ventas d. ¿Debería Anna usar el análisis de regresión para predecir las ventas de libros en rlistica? rústica? 11. Un vendedor de pasta de dientes en Ia parte occidental de Estados Unidos de America desea vendedor pasta de dientes en la parte occidental de Estados Unidos de América desea 23%. Se incrementar su participación en el mercado, que actualmente se ubica en el incrementar su participación en el mercado, que actualmente se ubica en el nivel del 23%. Se instituye campaña de publicidad y después de prueba con esta campaña, instituye una nueva campafia de publicidad y después de un mes de prueba con esta campaña, se hace una selección aleatoria de compradores para determinar su marca de preferencia. La una selección aleatoria compradores detenninar su preferencia. La se agencia publicitaria señala con orgullo el hecho de que un 28% de una muestra de 1000 agencia publicitaria señala con orgullo el hecho de que un 28% de una muestra de 1000 compradores usa el producto de la compañía. ,Apoya la evidencia posición la agencia compradores usa el producto de Ia cornpañIa. ¿Apoya la evidencia la posición de Ia agencia publicitaria de que su campana incrementó la participación en el mercado? mercado? su campaña incrementó participación Una campaña de control 12. Una campaña de control de calidad se ha enfocado en reducir el porcentaje de automóviles calidad ha enfocado en reducir el porcentaje de automóviles nuevos vendidos gran fabricante, que reparaciones mayores. Antes de nuevos vendidos por un gran fabricante, que se regresan para reparaciones mayores. Antes de campaña 12%. seis meses de la campaña mejoramiento, esta campafia el porcentaje era del 12%. Después de seis meses de la campafia de mejoramiento, la compafiIa hace una selecciOn aleatoria entre varios de sus distribuidores y determina el nlimero compañía selección aleatoria y detennina el número número regresaron reparaciones Durante de automóviles vendidos y el nümero de los que regresaron para reparaciones mayores. Durante periodo de la muestra, los distribuidores entregaron ellos 542 automóviles 123 el periodo de Ia muestra, los distribuidores entregaron 1 542 automóviles yy 123 de ellos control de calidad tuvo éxito? regresaron. ¿Indica esta evidencia que la campaña regresaron. ,Indica esta evidencia que Ia campafia de control de calidad tuvo éxito? 13. Considere una población con las 200 observaciones semanales que se presentan en la tabla P2.13. que se presentan en la tabla P2.13. variable independiente la temperatura semanal promedio de Spokane, Washington. La La variable independiente X es la temperatura semanal promedio de Spokane, Washington. La variable dependiente V es el número de acciones de la empresa Sunshine Mining Stock variable dependiente Y es el nñmero de acciones de la empresa Sunshine Mining Stock negociadas la Bolsa de Spokane en una semana. Seleccione aleatoriamente los datos de 16 negociadas en Ia Bolsa de Spokane en una semana. Seleccione aleatoriamente los datos de 16 54 TABLA P2.13 P2.13 OBS. RevisiOn de conceptos estad ísticos básicos Revisión de conceptos estadIsticos CapItulo 2 Capítulo 2 y Y 50 90 46 47 12 23 65 37 87 83 87 39 28 97 69 87 87 52 52 52 52 15 15 85 41 82 98 98 99 23 77 42 60 22 91 68 36 22 92 34 34 63 30 31 84 56 48 0 O X 37 77 55 27 49 23 18 1 1 41 73 61 85 16 46 88 87 82 56 22 41} 49 44 33 77 87 54 8 64 24 29 40 35 37 28 56 33 82 89 78 24 53 61 18 45 4 23 68 79 66 80 99 OBS. y Y 54 76 55 12 5 2 77 6 67 30 3 6 70 33 13 10 21 56 74 47 34 38 75 O 0 51 47 63 7 6 68 72 95 82 91 83 27 13 6 76 55 13 50 60 61 73 20 36 85 49 83 X 86 48 48 15 70 9 52 71 38 69 13 63 65 87 18 4 29 21 9 8 18 18 84 64 81 8! 1}8 98 55 40 14 11 42 43 73 45 16 21 85 37 81} 76 71 53 13 12 30 57 66 27 41 20 66 OBS. y Y X 43 OBS. y Y 79 79 48 X 85 27 61 7 7 71} 79 41} (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11 ) (11) (12) (13) (14) (15) (16) (17) (18) (19) (20) (21) (22) (23) (24) (25) (26) (27) (28) (29) (30) (31) (3!) (32) (33) (34) (35) (36) (37) (3S) (38) (39) (40) (41) (42) (43) (44) (45) (46) (47) (48) (49) (50) (51 ) (51) (52) (53) (54) (55) (56) (57) (58) (59) (60) (61) (62) (63) (64) (65) (66) (67) (68) (69) (70) (71) (72) (73) (74) (75) (76) (77) (78) (79) (80) (81) (82) (83) (84) (85) (86) (87) (88) (89) (90) (1}1) (91) (1}2) (92) 58 27 78 78 72 21 73 (93) (94) (95) (96) (1}7) (97) (98) (99) (100) (101) 22 22 (102) 90 32 (103) 24 (104) 63 (105) 16 (106) 4 (107) 79 (108) 5 (109) 59 (110) 99 (111) 76 (112) 15 (113) 10 (114) 46 20 (115) 88 37 (116) 56 (117) 6 (118) 86 (119) 27 (120) 67 (121) 22 (122) 32 (123) 77 90 90 (124) 88 (125) 35 (126) 57 (127) 64 73 (128) 13 (129) 18 (130) 70 (131) 9 (132) 93 41 (133) (134) 17 (135) 10 (136) 69 (137) 89 5 (138) (l3S) 18 (139) 88 (140) 99 (141) 86 (142) 95 (143) 78 (144) 3 3 (145) 38 (146) 68 57 (147) 77 (148) 25 (149) 99 (150) 9 5 5 13 13 3 58 13 18 5 26 9 96 94 30 41 1 27 73 19 94 5 31 31 13 11 11 50 40 80 44 63 74 40 53 79 9 52 82 37 57 62 21 94 99 45 19 76 81 95 30 59 93 28 1 (151) (152) (153) (154) (155) (156) (157) (158) (159) (160) (161 (161)) (162) (163) (164) (165) (166) (167) (168) (169) (170) (171) (172) (173) (174) (175) (176) (177) (178) (179) (ISO) (180) (181) (182) (183) (184) (185) (186) (187) (188) (189) (190) (l1}1 ) (191) (192) (193) (194) (195) (196) (197) (198) (199) (200) 5 24 24 47 65 52 71 56 56 27 52 15 17 88 45 38 45 31 90 35 69 87 78 18 62 93 0 o 51 8 68 47 30 7 81 81 4S 48 30 51} 59 46 76 99 54 98 95 11 11 7 6 24 83 83 49 55 31} 41 39 14 16 24 13 13 36 31 62 44 11 77 11 32 60 12 82 7 85 7 6S 68 90 78 89 10 60 76 27 96 90 51 6 1} 9 62 93 78 61 22 99 5 51 88 45 27 44 34 86 28 47 44 49 Capítulo 2 CapItulo 2 Caso de estudio Caso de estudio 55 semanas y calcule el coeficiente de correlación. (Sugerencia: Asegúrese que su muestra sea coeficiente correlación. (Sugerencia: Asegürese que su muestra sea semanas y calcule extraída de la población en forma aleatoria. Consulte a su instmctor si flO sabe cómo extraer extralda de la población enforma aleatoria. Consulte a su instructor si no muestra aleatoria.) una muestra aleatoria.) CASO DE ESTUDIO 2.1 2.1 ALCAM ELECTRONICS ALCAM ELECTRONICS David Branch recibió recientemente su título en administración de empresas de una universidad pequeña tItulo en adrninistración de empresas de una universidad pequena e ingresó a trabajar en Alcam Electronics, un fabricante de diversos componentes electrónicos para la Electronics, un fabricante de diversos componentes electrónicos para industria. Después de varias semanas de trabajo, Ia gerente y propietaria de Alcam, Alice Cameron, lo la industria. llamó a su oficina y le pidió que investigara dos aspectos con respecto a cierto transistor fabricado por llarnó su le pidió que investigara dos aspectos con respecto a cierto transistor fabricado que una gran empresa de televisores estaba interesada en un pedido importante. Alcam, ya que una gran empresa de televisores estaba interesada en un pedido importante. Primero, Alice quería pronosticar el porcentaje de transistores defectuosos que pudiera comprar Prirnero, querIa pronosticar el porcentaje de transistores defectuosos que pudiera la empresa de televisores. Debido a que Ia campafIa de publicidad de Ia compafiIa enfatizaba la calidad Debido a que la campaña publicidad de la compañía enfatizaba la calidad naturalmente conocer la del producto, naturalmente deseaba conocer Ia calidad de los componentes y quería documentación que los componentes querla documentaciôn apoyara las declaraciones de Alcam. Alice y David estuvieron de acuerdo en que se podrIa obtener una las declaraciones de Alcam. Alice y David estuvieron de acuerdo en que se podría obtener una muestra de los transistores actualmente en inventario, para representar los que se enviarían en los meses muestra de los transistores actualmente en inventario, para representar los que se enviarIan en los meses siguientes a la cornpaflIa en prospecto, ya que el proceso de producción en el pasado reciente no se compañía en prospecto, ya que el proceso de producción en el pasado reciente modificarla en el futuro inmediato. modificaría el Segundo, Alice desea saber el tiempo promedio de vida de los transistores, otro aspecto de gran importancia para la compañía televisores. podrían importancia para la compaflIa de televisores. De nuevo, las unidades actualmente en existencia podrIan nuevo, las unidades las se producirían mientras contrato, si éste fuera aceptado. representar a las que se producirian mientras duraba el nuevo contrato, si éste fuera aceptado. David decidió tomar una muestra de los transistores en cuestión y formuló un plan para ilevar a para llevar a tarea. Nun1eró los compartimientos los transistores, seleccabo su tarea. Nurneró los compartirnientos de almacenamiento que contienen los transistores, selecnúmeros cionó rnirneros en forma aleatoria e hizo un muestreo de todos los transistores de los compartimientos rnuestreo elegidos para Ia muestra. Ya que cada compartimiento contenía alrededor de 20 transistores, seleccionó contenia alrededor de 20 transistores, seleccionó la muestra. 10 números aleatorios, que al final le dieron un tamaño de muestra de 205 transistores. Como selec10 nñrneros aleatorios, que al final Ic dieron un tamaño de muestra de 205 transistores. Como 10 los 55 compartimientos, tenía que podría cionó 10 de los 55 compartirnientos, supuso que tenla una buena muestra representativa y que podrIa esta muestra para la transistores inventario, así usar los resultados de esta niuestra para Ia totalidad de la población de transistores en inventario, asI como aún corno para las unidades ann por fabricar mediante el mismo proceso. continuación, sometió pruebas de laboratorio a A continuación, David sometió a pruebas de laboratorio a cada una de las 205 unidades, para determinar si funcionaban correctaniente. Una vez concluidos los resultados del laboratorio, se encontró determinar funcionaban correctamente. Una vez concluidos los resultados del laboratorio, se encontró con que seis de las unidades no funcionaban de acuerdo con las especificaciones. David utilizó un nivel las especificaciones. de confianza del 95% y realizó después los siguientes cálculos para llegar a un punto e intervalo de cálculos para llegar estimación del porcentaje defectuoso de todos los transistores fabricados en la planta: en la planta: 6 P = 205 205 .029 =029 .029 ± 1.96 .029 ::±: 1.96 (.029)(.971 ) (.029)(.97 1) 205 56 Revisión Revision de conceptos estadísticos básicos conceptos estadisticos Capítulo Cap Itulo 2 .029 ± .023 .029 .023 .006 * .052 .006 ~ .052 Con base en estos cálcuios, David pensó en incluir la siguiente información en su reporte final para cálculos, final Con información Alice: l. Se estima que aproximadamente el 3% de los transistores fabricados mediante el proceso actual I. Se estima que aproximadamente el 3% de los transistores fabricados son defectuosos. Existe un 95% de probabilidad de que la siguiente afirmación sea cierta: entre el .6% y el S.2% 2. Existe un 95% de probabilidad de que la siguiente afirmación sea cierta: entre el .6% y el 5.2% de los transistores son defectuosos. transistores son defectuosos. A continuación, David paso a la cuestión del tiempo promedio de vida de las unidades. Debido pasó a que las cxpcctativas de vida se podrIan extender a varios años, se dio cuenta de que ninguna de las expectativas podrían varios aflos, se dio cuenta de que ninguna de las unidades de la muestra se podrIa probar si se deseaba una respuesta en tiempo. unidades de Ia muestra se podría probar si se deseaba una respuesta en tiempo. De ahI que decidió ahí decidió contactar a diversos usuarios de este componente para determinar si habIa disponibles registros sobre había su duración. Por fortuna, encontró tres compafilas que utilizaron el transistor en el pasado y tenIan fortuna, compañías utilizaron en el pasado y tenían sii duración. registros limitados sobre la duración de componentes. En total, recibiO datos sobre 38 transistores de registros lirnitados sobre Ia duración recibió datos sobre conocía que los que se conocIa su fecha de falla. Ya que dichos transistores se fabricaron con el mismo proceso que falla. en Ia actualidad, razonó que los resultados de esta muestra se podrian inferir para las unidades en resultados de podrían las unidades en en la actualidad, razonó que inventario y las ain iii ventarioy las aún no fabricadas. Los resultados de los cálculos que realizO David sobre los datos de vida uitil de su muestra fueron de los cálculos que realizó útil de su muestra fueron los siguientes: n = 38 Tiempo promedio de vida = X = 4 805 horas promedio de vida =X= 4 805 horas Desviación estándar de vida Otil = s = 675 horas útil = s = 675 encontrarse con que el tiempo promedio de vida útil de la muestra era sólo de 4 80S horas, Después de encontrarse con que ci tiempo promedio de vida ütil de la muestra era sOlo de 4 805 horas, David se preocupó pues sabía que el proveedor actual de componentes estaba garantizando un tiempo David se preocupO pucs sabIa que el proveedor actual de componentes estaba garantizando promedio de vida de 5 000 horas. Aunque ci promedio de su muestra estaba sOlo un poco por debajo 5 000 horas. Aunque el promedio de su muestra estaba sólo por debajo de 5 000 horas, se dio cuenta de que ci tamaño de Ia muestra era sólo de 38 y que esto no constituía una sc el la muestra solo de 38 y que esto no constitula prueba positiva de que la calidad de Alcam fucra inferior a la del otro proveedor. DecidiO entonces la calidad de Alcam fuera inferior a la del otro proveedor. Decidió prueba positiva probar Ia hipótesis de que el tiempo de vida promedio de todos los transistores era de S 000 horas contra la hipOtesis de que ci tiempo de vida promedio de todos los transistores era de 5 000 horas contra la fuera menor. Los siguientes son los cálculos que realizó: Ia alternativa de que fuera menor. Los siguientes son los cálculos que realizO: Ha: l' = 5000 Ho:i5000 H¡: l' < 5000 Hi:,u <5000 dc la regla de decisión. S 000-2.33 Punto de Ia regla de decision. 5 000 - 2.33 675 dc dccisión. Si X 4744.9, rechazar Ha Regla de decisiOn. Si X 4 744.9, rechazar H0 a =.01 a=.01 s = 675 s=675 675_ 4,744.9 = ...¡ 38 'I38 que la (480S) no está por debajo del punto de la regla de decisión Considerando que la media muestral (4805) no cstá por debajo del punto de la regla de decision (4744.9) para rcchazar Ia hipótesis, David descartO el rechazar la hipótesis de que la media del tiempo rechazar la descartó ci rechazar la hipótesis de que Capítulo 2 CapItulo Caso de estudio 57 igual a 5 000 horas. Pensó que estas serian buenas noticias para de vida de todos los componentes era igual a 5 000 horas. Pensó que estas serían buenas noticias para componentes Alice CAmeron e incluyó un resumen de sus averiguaciones en su informe final. Pocos dIas después resumen sus averiguaciones en su infonne final. Pocos días después de que le presentó su informe escrito y verbal, A1ice lo llamó a su oficina para felicitarle por el trabajo infonne verbal, Alice lo llamó a su oficina para felicitarle por el trabajo compartir preocupación respecto a su informe. Le dijo: "Me preocupa el bajo nivel de y compartir con él una preocupación respecto a su infonne. Le dijo: "Me preocupa el bajo nivel de significancia de tu prueba de hipótesis. Tomaste sólo una probabilidad del 1% de rechazar la hipótesis hipótesis. solo del 1% contrato nula en caso de ser correcta. Esto me parece muy conservador y me preocupa que hagamos un contrato después descubramos que nuestro nivel de calidad no alcanza la especificación deseada de y después descubramos que nuestro nivel de calidad no alcanza Ia especificaciOn deseada de 5 000 horas". PREGUNTA ¿ Cómo responderIa al comentario de L,Cómorespondería al comentario de Alice Cameron? CASO DE ESTUDIO 2.2 2.2 MR. MR. TUX John Mosby, propietario de varias tiendas de renta de ropa de etiqueta Mr. Tux, se interesa en prode varias tiendas de renta de ropa de etiqueta Mr. Tux, se interesa en pronosticar su volumen de ventas mensual (véase el caso de estudio Mr. Tux al final del capItulo 1). del capítulo 1). Como primer paso, John reüne los datos de ventas por mes para los años de 1985 a 1992. reúne 1985 a 1992. 1985 1986 16,850 12,753 26,901 61,494 147,862 1987 15,395 30,826 1988 1989 1989 1990 1990 1991 1992 71,043 152,930 Ene. Feb. Mar. Abr. May. Jun. Jul. Ago. Sep. Oct. Nov. Dic. Die. 6,028 5,927 10,515 32,276 51,920 27,773 36,653 51,157 217,509 206,229 110,081 110,081 31,416 48,341 51,604 80,366 58,843 82,386 224,803 354,301 328,263 25,589 103,184 197,608 68,600 39,909 91,368 58,781 59,679 33,443 85,651 242,673 289,554 164,373 160,608 208,938 263,830 252,216 219,566 149,082 250,559 409,567 394,747 31,294 23,573 36,465 57,990 51,318 53,599 23,038 313,647 68,600 272,874 230,303 214,561 39,909 337,192 375,402 183,482 183,482 144,618 144,618 102,893 128,857 104,776 111,036 63,701 82,657 176,096 142,363 213,888 178,947 18,959 13,918 17,987 15,294 195,409 173,518 173,518 181,702 41,396 19,330 22,707 114,907 113,552 127,042 133,650 116,946 139,750 53,719 164,154 258,713 184,546 53,719 calcula valor de las para cada año (por ejemplo, suma los Después, John calcula el valor promedio de las ventas mensuales para cada año (por ejemplo, suma los valores 1985 calcula la estándar para los valores doce valores de 1985 y divide entre doce). También calcula Ia desviación estándar para los doce valores año. mensuales de cada afio. Los resultados son 58 Revisión de conceptos estadísticos básicos RevisiOn de conceptos estadIsticos PROMEDIO PROMEDIO (MEDIA) AÑO A1O 1985 1986 1987 1988 1989 1990 1991 1991 1992 DESVIACIÓN ESTÁNDAR DESVIACION ESTANDAR $ 13,165 35,290 47,216 57,197 70,625 63,376 96,387 99,153 CapItulo Capítulo 2 $ 22,013 44,603 64,842 103,610 141,381 141,381 169,432 169,432 213,866 247,231 Además, John decide construir un diagrama de dispersion como el que Se muestra en Ia figura 2.12. dispersión que se la Además, Grafica los valorcs de la media de ventas mensuales en el eje y y los años en el eje x. val ores de Ia media de ventas mensuales en el ejey $400,000 $400,000 $350,000 $300,000 " :> $250,000 E $250.000 $200,000 '" '" $150,000 $100,000 $50,000 - -- - I oL-_--L._----lL-_.....l.-_----I._ _...L-_-..L_ _L - _ - ' - _ - - - '_ _--'-_----' t I I I 1995 1996 1994 1993 1991 1992 1985 1988 1990 1989 1990 1987 1986 1985 I t I Figura 2.12 La media de ventas mensuales de Mr. Tux Figura 2.12 La media de ventas mensuales de Mr. Tux PREGUNTAS ,Qué ideJs Ia media de ventas mensuales 1. ¿Qué ideas de pronóstico se le ocurren al estudiar los valores de la media de ventas mensuales OCUlTen de John para los años de SOS datos? para los años de sus 2. Suponga que John decide dibujar una linea recta a través de su diagrama de dispersion de modo dibujar línea recta a través de su diagrama de dispersión de modo que se "ajuste bien", y que extiende después esta lInea hacia el futuro utilizando los puntos a y que extiende después esta línea lo largo de Ia lInea como su pronóstico mensual. ¿Qué tan precisos cree usted que serán estos mensual. j,Qué tan precisos cree usted que la línea Utilice los valores de desviación que John calculó responder esta pronósticos? Utilice los valores de desviaciOn estándar que John calculO para responder esta pregunta. 3. Con base en su propio análisis, ¿animaríaa John a seguir buscando un método de pronóstico más en so propio análisis, animaria a John a seguir preciso? preci so? PAQUETE DE CÓMPUTO MINITAB PAQUETE DE CÔMPUTO MINITAB El problema. el problema 1, Dick Hoover, propietario de Modero Office El problema. En el problema 1, Dick Hoover, propietario de Modern Office Equipment, está preocupado por los costos de transporte y Equipment, está preocupado por los costos de transporte y de oficina en que incurren los varianza. pequeños. la media, pedidos pequeños. Requiere calcular Ia media, la desviación estándar y la varianza. Paquete de cómputo Minitab Paquete de cómputo Minitab 59 Solución Minitab. Los comandos de MINITAB pam resolver el problema 1 son: So/udón para 1 son: MTB > SET Cl SET C1 DATA >> 10 15 20O25 15 17 41 50O55 9 12 14 35 18 19 17 28 29 11 11 43 54 DATA 10 15 2 25 15 17 41 5 9 12 14 35 18 19 17 28 29 11 11 43 54 DATA> 7 8 16 18 DATA > 7 8 16 13 37 18 DATA > END DESCRIBE C1 MTB > DESCRIBE Cl > > > C1 Cl N N 28 MEAN 21.32 MEDIAN 17.00 17.00 TRMEAN 20.69 Q3 28.75 STDEV 13.37 SEMEAN MEDIAN 2.53 Cl C1 MIN MIN MAX 5.00 54.00 5.00 54.00 > BOXPLOT Cl > BOXPLOT C1 Q1 Qi 11.25 11.25 2 MTB - - -1 + 20 1------------- - - - - -+- - - - -+- - - - -+- - - - -+- - - - -+- - - - - C1 MTB O 0 > STOP 10 30 40 50 • El comando SET se utiliza para introducir la cantidad por transacción de los 28 clientes. • El comando DESCRIBE se emplea para obtener estadIsticas descriptivas de la comando DESCRIBE se emplea para obtener estadísticas descriptivas la cantidad variable por transacción, ubicada en C l. Los resultados incluyen el tamaflo de transacción, ubicada en Cl. tamaño la muestra (N), la media (MEAN), una media de los valores restantes después de eliminar muestra (N), la media (MEAN), media los valores restantes eliminar e15% el 5% menor y e15% mayor (TRMEAN), la mediana (MEDIAN), la desviación estándar el 5% mayor (TRMEAN), la mediana (MEDIAN), Ia desviación estándar (STDEV), el error estándar de la media (SEMEAN), el número más pequeño (MIN), el Ia media nümero pequeflo (MIN), el número nümero más grande (MAX), el primer cuartil o 250. percentil (Q 1) y el tercer cuartil o cuartil 25o. percentil (Qi) y el tercer cuartil 750. percentil (Q3). 75o. • El comando BOXPLOT genera una gráfica de caja, que proporciona otra forma de comando BOXPLOT genera proporciona forma de observar un conjunto de datos a fin de determinar su tendencia central, variabilidad y la fin de determinar su tendencia central, variabilidad existencia de valores disparados. La gráfica de caja consta de mediciones de existencia de valores disparados. La gráfica de caja consta de cinco mediciones de la pequeña resumen, la mediana, el cuartil inferior, el cuartil superior, Ia observación más pequefia y la observación más grande. La caja rectangular representa la parte central de los datos, líneas guiones junto con ilneas de guiones que se extienden a cada lado, indicando la variabilidad de 17, (+) dentro los datos. El valor de la mediana, en este caso 17, aparece como una marca (+) dentro tercer de la caja. Los extremos izquierdo y derecho de la caja representan el primer y tercer cuartiles de datos. En este ejemplo, el primer cuartil es igual a 11.25 y el tercer cuartil cuartil es a 28.75. 60 Revisión de conceptos estadísticos básicos RevisiOn de conceptos estadIsticos Capítulo 2 BIBLIOGRAFíA BIBLIOGRAFIA CARPENTER, J., DELORIA, D. MORGANSTEIN, Software for Microcomputers." BYTE CARPENTER, 1., DELORIA, D. yy MORGANSTEIN, D. "Statistical Software for Microcomputers." BYTE (abril, 1984): 234-264. 1984): GROEBNER, D. y SHANNON, Business Statistics. Decision-Making ed. Columbus, GROEBNER, D.y SHANNON, P.P. Business Statistics. A Decision-Making Approach. 2a ed. Columbus, Ohio: Charles E. Merril Publishing Company, 1 985. E. Merril 1985. HANKE, J. y REITSCH, A. Understanding Business Statistics. Homewood, Ill.: HANKE,1. YREITSCH, A. Understanding Business Statistics. Homewood, Ill.: Richard D. Irwin, Inc., 1994. KEAT1NG, B. "Choosing and Using BusinessForecasting Software." Creative Computing (enero, 1985): KEATlNG, B. "Choosing and Using Business Forecasting Software." Creative Computing (enero, 1985): 119-135. 119-135. LACHENBRUCH, P. A. "Statistical Programs for Microcomputers", BYTE (Noviembre, 1983): LACHENBRUCH,P. A. "Statistical Programs for Microcomputers",BYTE (Noviembre, 1983): 560-570. MAIIMOUD,E. "Accuracy in Forecasting." Journal of Forecasting 140-159. MAIIMOUD,E. "Accuracy in Forecasting."Journal olForecasting 3 (2) (1984): 140-159. McCLAVE.1. y BENSON, P. P. Statistics Business and Economics. San Francisco: Dellen Publishing MCCLAVE, J. y BENSON, Statistics lorfor Business and Economics.San Francisco: DeBen Publishing Company, 1982. 1982. NEFFENDORF,H. "Statistical Packages for Microcomputers: A Listing." The American Statistician 37 NEFFENDORF,1-1. "Statistical Packages for Microcomputers: A Listing." The American Statistician 37 83-86. (1) (1983): 83-86. OLSON, C. y PiccoNi, M. Statistics for Business Decision Making. Glenview, Ill.: OLSON, C. yPICCONI. M. Statisticslor Business Decision Making. Glenview, Ill.: Scott Foresman and Company, 1983. 1983. SElTZ, N. Business Forecasting Concepts and Microcomputer Applications. Reston, Va.: Reston Microcomputer Applications. Reston, Reston SEITz, N. Business Forecasting Concepts Publishing Company, 1984. 1984. SINCICH, T. T. Business Statistics by Example. San Francisco: Dellen PublishingCompany, 1982. SIN CICH, Business Statistics by Example. San Francisco: DeBen Publishing Company, 1982. CAPíTULO CAP1TULO Fuentes de datos Fuentes de 3 INTRODUCCIÓN INTRODUCCION Una de las partes más dificiles que ocupa mayor tiempo en los pronósticos es Una de las partes rnás dificiles y que ocupa mayor tiempo en los pronósticos es la recolección de datos válidos y confiables. El personal de procesamiento de datos está datos válidos confiables. personal procesamiento de datos está recolección de familiarizado con Ia expresión "entra basura, sale basura" (GIGO: garbage in garbage gut). la garbage in garbage Qut). familiarizado Esta expresión se aplica también a los pronósticos. Un pronóstico no puede ser más preciso expresión se aplica también a los pronósticos. no puede ser más preciso que los datos en los que se basa. El modelo de pronóstico más complejo fallará si se aplica a datos no confiables. datos no confiables. advenimiento de la computadora ha ayudado a generar una increíble acumulación El advenimiento de Ia coniputadora ha ayudado a generar una increIble acumulación infonnación sobre todos temas. dificil tarea que enfrentan quienes pronostican de inforrnación sobre todos los temas. La dificil tarea que enfrentan quienes pronostican consiste en cOmo encontrar datos pertinentes que ayuden a resolver sus problemas consiste cómo encontrar datos pertinentes que ayuden resolver sus problemas específicos toma decisiones. especIficos de torna de decisiones. detenninar silos datos serán útiles, se pueden aplicar cuatro criterios: Para determinar si los datos serán ütiles, se pueden aplicar cuatro criterios: l. Los datos deben ser conjIables y precisos. Se debe tener un cuidado adecuado al confiables y precisos. Se tener un cuidado adecuado Los datos deben recolectar los datos, que sean de una fuente confiable y con la debida atención en su precisión. precision. 2. Los datos deben ser pertinentes. Deben ser representativos de las circunstancias para las serpertinentes. Deben las cuales serán utilizados. Los datos que supongan la representación de la actividad cuales serán utilizados. Los datos que supongan la representación de actividad económica deberán mostrar las alzas y bajas de acuerdo con las fluctuaciones cíclicas econórnica cIclicas en el pasado histórico de Ia empresa. de la 3. Los datos deben ser consistentes. Cuando se modifican las definiciones relacionadas consistentes. Cuando se modifican las definiciones relacionadas con la forma como se reünen los datos, se deben hacer ajustes para mantener la reúnen datos, deben ajustes mantener con fonna los históricos. consistencia en los patrones históricos. 4. Los datos deben ser periódicos. Los datos que se recolectan, y resumen y publican con serperiódicos. Los datos que se recolectan, y resumen y publican con una de base en una periodicidad serán de gran valor para el pronosticador. 62 Fuentes de datos Capítulo 3 Cap Itulo 3 TIPOS DE DATOS TIPOS DE DATOS En general, hay dos tipos de datos de interés para el pronosticador. Los primeros son los datos de interés para el pronosticador. tiempo, día, reúnen datos que se reünen en un solo punto en el tiempo, sea éste una hora, un dIa, una semana, un mes o un cuatrimestre. El objetivo consiste en examinar dichos datos y después un mes o un cuatrimestre. El objetivo consiste en examinar dichos datos después extrapolarlos relaciones reveladas ejemplo extrapolarlos o extender las relaciones reveladas hacia una población mayor. Un ejemplo sería archivos de personal para estudiar las circunstanserla extraer una muestra aleatoria de los archivos de personal para estudiar las circunstanlos empleados de una compañía. cias de los empleados de una compafiIa. En contraste, muchos valores de datos de interés para una empresa se recolectan cada contraste, muchos valores de datos de interés para una empresa se recolectan cada día, mes, trimestre o año. tales casos, reunido dIa, mes, trirnestre o año. En tales casos, se han reunido series de tiempo de datos. Las tiempo de datos. tiempo se analizan para descubrir patrones crecimiento cambio que series de tiempo se analizan pam descubrir patrones pasados de crecimiento y cambio que se puedan emplear para predecir patrones futuros junto con las necesidades para el se puedan emplear para predecir patrones futuros junto con las necesidades para el funcionamiento de la empresa. Un ejemplo sería el estudio de los montos de ventas funcionarniento de la empresa. Un ejemplo serla el estudio de los montos de ventas mensuales empresa. tiempo la mensuales de una empresa. El análisis de series de tiempo no proporciona Ia respuesta de lo que depara el futuro, pero resulta valioso en el proceso de pronósticos y ayuda a reducir futuro, pero resulta valioso en ci proceso de pronósticos y ayuda a reducir lo errores en ellos. errores Una serie de tiempo es una secuencia ordenada de observaciones sobre una de tiempo es una secuencia ordenada observaciones sobre una Una variable en particular. particular. Publicaciones como: Statistical Abstract of the United States, Survey Current Publicaciones como: Statistical Abstract of the United States, Survey of Current Business, Monthly Labor Review, Federal Reserve Bulletin y los informes anuales de Business, Monthly Labor Review, Federal Reserve Bulletin y los informes anuales de corporaciones, contienen series de tiempo de todo tipo. Por lo se corporaciones, contienen series de tiempo de todo tipo. Por lo regular los datos que se reportan en fonna mensual, trirnestral o anual que cubren aspectos de precios, proreportan en forrna mensual, trimestral o anual y que cubren aspectos de precios, producción, ventas, empleo, desempleo, horas trabajadas, combustible utilizado, energIa ducción, ventas, empleo, desempleo, horas trabajadas, combustible utilizado, energía producida, ingresos, etc., lienan páginas de éstas y otras publicaciones económico-emllenan páginas de éstas y otras publicaciones económico-emproducida, presariales. Por lo general, los pronósticos a largo plazo son predicciones a futuro de 5, 10 y hasta predicciones futuro 20 años. Estas predicciones son esenciales para permitir el tiempo suficiente los 20 años. Estas predicciones son esenciales para permitir el tiempo suficiente a los una compañía, departamentos de planeación, fabricación, ventas, finanzas departamentos de planeación, fabricación, ventas, finanzas y otros de una compafiIa, para financiamiento, desarrollo que desarrollen planes para probables nuevas plantas, de financiamiento, de desarrollo de nuevos productos y nuevos métodos de ensamble. Tales pronósticos son de particular interés ensamble. de particular interés los altos ejecutivos de una compañía. En contraste, los supervisores de primera línea para los altos ejecutivos de una compafila. En contraste, los supervisores de primera lmnea se interesan principalmente en los pronósticos a corto plazo, ya que sus responsabilidades principalmente en plazo, ya que sus responsabilidades ocurren al día, semana o mes siguientes. comprenden aspectos que ocurren al dIa, semana o mes siguientes. En los EUA las organizaciones de negocios deben pronosticar los niveles de ventas EUA las organizaciones negocios deben pronosticar niveles de ventas corto como a largo plazo. La competencia por obtener los dólares de los consutanto a corto como a largo plazo. La competencia por obtener los dólares de los consumidores y el deseo de alcanzar una cada vez mayor participación en el mercado, son algunas las principales fuerzas motivadoras negocios. ahí se considere necesaria de las principales fuerzas motivadoras en los negocios. De ahI que se considere necesaria una declaración de las expectativas de la administración, denominada pronóstico, para hacer expectativas de la administración, denominadapronóstico, que las materias primas, instalaciones productivas y grupo de personal disponible alcancen la demanda proyectada. proyectada. Fuentes de datos 63 Desde luego, existe la alternativa de no planear a futuro. Sin embargo, en un medio empresarial dinámico, esta falta de planeación pudiera ser desastrosa. Una compañIa planeación pudiera ser desastrosa. Una compañía empresarial dinámico, esta falta electrónica que hubiera ignorado la tendencia hacia la televisión a color y los circuitos ignorado la tendencia hacia Ia television a circuitos electrónica que de estado-sólido, habría perdido de estado-sóiido, habrIa perdido ya toda su participaciOn en el mercado. De modo que participación en el mercado. De importante los administradores comprendan el pasado los datos resulta importante que los administradores comprendan el pasado y utilicen los datos históricos el buen para hacer planes inteligentes cubran demandas históricos y el buen juicio para hacer planes inteligentes que cubran las demandas del futuro. Los pronósticos se elaboran para auxiliar a la administraciOn a determinar futuro. Los pronósticos se elaboran para auxiliar a la administración determinar alternativas. Las consideraciones subjetivas son en extrerno importantes en el análisis de las series extremo importantes las series debido a que aún se ha encontrado un enfoque de probabilidad satisfactorio de tiempo, debido a que akin no se ha encontrado un enfoque de probabilidad satisfactorio para dicho análisis. No obstante, las evaluaciones subjetivas serlan necesarias en la para dicho análisis. No obstante, las evaluaciones subjetivas serían necesarias en la formulación de pronOsticos,incluso si hubiera disponible un enfoque de probabilidad formulación de pronósticos, incluso si hubiera disponible un enfoque de probabilidad examina el pasado adaptable al series de tiempo. Siempre que adaptable al análisis de series de tiernpo. Siempre que se exarnina el pasado en busca futuro, éstas sólo son pertinentes medida las condiciones de pistas para el futuro, éstas solo son pertinentes en la medida en que las condiciones anterioridad, perrnanezcan en el periodo por venir. causales que estaban en efecto con anterioridad, permanezcan en el periodo por venir. En actividad económica empresatial, las condiciones causales rara vez permanecen la actividad econórnica y empresarial, las condiciones causales rara vez permanecen constantes, por lo que se debe reevaluar continuamente la conexión entre el pasado, el constantes, que se debe reevaluar continuamente la conexión entre el pasado, el futuro. presente y ci futuro. Aunque las técnicas de análisis de series de tiempo no elirninan las evaluaciones Aunque las técnicas de análisis de series de tiempo no eliminan las evaluaciones subjetivas, hacen una útil contribución, a! proporcionar un enfoque conceptual a los subjetivas, hacen una ñtii contribución, al proporcionar un enfoque conceptual a los procedimientos formales pronósticos. Estos se formulan con la ayuda de un conjunto pronOsticos. Éstos se f01111ulan con Ta ayuda de un conjunto de procedimientos formales específicos indican, de manera explícita, los elementos de juicio. especIficos y se indican, de manera explIcita, los elementos de juicio. FUENTES DE DATOS FUENTES DE datos se pueden clasificar en primarias y secundarias. Las fuentes secundaLas fuentes de datos se pueden clasificar en prirnarias y secundarias. Las fuentes secundaque el rias de datos son datos ya publicados, recolectados con fines diferentes de los que ci de datos son datos ya publicados, recolectados con fines diferentes de pronóstico o investigación específicos necesita tener a la mano. Este tipo de datos se puede especIficos necesita tener a la mano. Este tipo de datos se puede clasificar a su vez como provenientes de fuentes internas, originados dentro de clasificar a su vez corno provenientes de fuentes internas, originados dentro de la organización, o de fuentes externas, generados fuera de ella. Las publicaciones basadas en publicaciones basadas organizaciOn, o defuentes externas, generados fuera de ella. censos son buenos ejernplos de fuentes seClmdarias extemas. Con frecuencia, se utilizan los ejemplos de fuentes secundarias externas. frecuencia, registros de contabilidad como fuentes de datos secundarias internas. fuentes de datos seclmdarias intemas. registros Las fuentes secundarias de datos, son datos ya publicados, recolectados con Las fuentes secundarias de datos, son datos ya publicados, recolectados con fines diferentes de los que ci pronóstico o investigación especIficos necesita los que el pronóstico o investigación específicos necesita fines diferentes tener a la mano. mano. Las fuentes primarias datos comprenden todos métodos de la recolección Las fuentes primarias de datos coniprenden todos los métodos de la recolección datos originales. Es común datos se reúna mediante procedimientos de de datos originales. Es comi'in que este tipo de datos se reüna mediante procedirnientos de o de un censo completo de elementos de interés. Aun es más muestreo, encuestas de panel o de un censo conipleto de elernentos de interés. Aun es rnás común ci registro tIimestral variables clave de la compañía. corni'in el registro semanal, mensual, trirnestrai o anual de las variables dave de Ia cornpafiIa. 64 Fuentes de datos Capítulo 3 Cap Itulo 3 Tales variables de series de tiempo con frecuencia son el centro de atención por parte de Tales variables de series tiempo frecuencia son ci centro atención la administración. comprenden todos Las fuentes primarias de datos comprenden todos los métodos de la recolección fuentes primarias de datos originales. originales. Fuentes secundarias Fuentes secundarias de datos datos es significativa en el sentido La diferencia entre las fuentes primarias y secundarias de datos es significativa en el sentido de que es más probable que una fuente primaria contenga datos más completos y precisos más probable que una fuente primaria contenga datos más completos y precisos que los que pudieran encontrarse en irna fuente secundaria. Por otra parte, los datos que pudieran encontrarse una fuente secundaria. Por parte, los datos que ser más caros que los secundarios. primarios tienden a ser más caros que los secundarios. Fuentes Fuentes externas En recientes, ha incrementado en gran medida Ia cantidad de fuentes datos En años recientes, se ha incrementado en gran medida la cantidad de fuentes de datos publicados, disponibles para los pronosticadores. La proliferación de la computadora es publicados, disponibles para los pronosticadores. La proliferación de computadora parcialmente responsable de este aumento en la disponibilidad de datos. También ha parcialmente responsable de este aumento en disponibilidad de datos. También ha contribuido a este incremento ci hecho de que directores de empresa y de gobierno se dieran el de empresa y de gobierno se dieran cuenta que una mayor y mejor información eleva Ia efectividad de Ia planeaciOn y la torna mayor y mejor información eleva la efectividad de la planeación toma datos de decisiones. Las bibliotecas están llenas con miles de millones de piezas de datos de decisiones. Las bibliotecas están llenas con miles de millones de piezas imaginable. gubernamentales, históricos sobre cualquier tema imaginable. Las organizaciones gubernamentales, servicios computarizados y organizaciones no lucrativas, generan una enorme cantidad datos con'putarizados y organizaciones no lucrativas, generan una enorme cantidad de datos estadísticos de entrada para el proceso de pronósticos. estadIsticos que pueden emplearse como insumos de entrada para ci proceso de pronósticos. EVA el más grande editor recolector gobierno El gobiemo de EUA es el más grande editor y recolector de datos del mundo. Cada ciudad grande en EVA por lo menos una biblioteca designada como depósito del ciudad grande en EUA tiene por lo menos una biblioteca designada como depósito del gobierno. Estas bibliotecas poseen una amplia colección de datos acumulados el gobierno. Estas bibliotecas poseen una amplia colección de datos acumulados por el gobierno. Departamento Económico [Bureau Economic Analysis (BEA)], El Departamento de Análisis Económico [Bureau of Economic Analysis (BEA)], es fuente importante datos para las organizaciones que realizan planeación a largo una fuente importante de datos para las organizaciones que realizan planeación a largo plazo. departamento proporciona información básica en concerniente a inflación, plazo. Este departamento proporciona información básica en lo concemiente a inflación, crecimiento económico, desarrollo regional y el papel de la nación en la economIa mundial. economía Current Business, revista mensual que proporciona BEA publica la Survey El BEA publica Ia Survey of Current Business, una revista mensual que proporciona la estimaciones y análisis de Ia actividad económica de EVA. La revista consta además de dos EUA. secciones estadIsticas que presentan una composición de datos económicos fuentes secciones estadísticas que presentan una composición de datos económicos de fuentes tablas públicas sección de Indicadores Cíclicos püblicas y privadas. La sección de Indicadores CIclicos de los Negocios, consta de tablas alrededor 270 series y diagramas de aproximadamente 130 series que emplean de airededor de 270 series y diagramas de aproximadamente 130 series que se emplean ampliamente el análisis de los desarrollos cíclicos actuales. La sección de Estadísticas ampliamente en ci análisis de los desarrollos cIclicos actuales. La sección de EstadIsticas de los Negocios Actuales consta de tablas pam más de 1900 series que cubren actividades Actuales consta de tablas para más de 1900 series que cubren actividades empresariales en general e industrias especIficas. general e industrias específicas. Fuentes de datos Fuentesdedatos 65 datos gubernamentales que se el censo. Otra fuente de datos gubernarnentales que se emplea en los pronósticos, es ci censo. proporciona infonnación detallada área geográfica, diversas caracteCada censo proporciona inforrnaciôn detallada por area geográfica, para diversas características como sexo, edad, ingreso, estado civil y escolaridad. Estos datos rIsticas demográficas tales corno sexo, edad, ingreso, estado civil y escolaridad. Estos datos pueden ser en extremo valiosos para aquellas compafiIas realcionadas con ci pronOstico de en extremo valiosos para aquellas compañías realcionadas con el pronóstico series de tiempo que dependen de dichas caracterIsticas demográficas. Los datos del censo dependen de dichas características demográficas. factibilidad. resultan también valiosos para los pronosticadores que realizan estudios de factibilidad. Por ~jemplo ¿funcionará centro comercial propuesto un área geográfica?, ,el área ejemplo ,funcionará un centro comercial propuesto para un area geográfica?, ¿el area alrededor del centro comercial se interesará en un club atlético? Los datos del censo se airededor del centro comercial se interesará en un club atlético? Los datos del censo utilizan con frecuencia para responder este tipo de preguntas. frecuencia responder este tipo de preguntas. datos gubernamentales Otras fuentes importantes de datos gubernamentales son: • Statistical Abstractof the United States, una fuente general de estadIsticas sobre muchos estadísticas StatisticalAbstract ofthe United States, una fuente temas, cuya publicación es anual. es anual. • American Statistics Index, que proporciona una gula para las diversas fuentes estadIstiStatistics Index, que proporciona una guía para las diversas fuentes estadísticas del gobierno. • CIS/Index to Publications of the United States Government, que representa la lista CIS/Index to Publications United States Government, que lista peliódica rnás completa de publicaciones del Congreso de los EVA. periódica más conipleta de publicaciones del Congreso EUA. • County and City Data Book, que se publica cada cuatro aflos, proporciona datos County and City Book, que se publica cada cuatro años, proporciona datos estadísticos y de población divididos por ciudad y condado. y condado. estadIsticos • Economic Report of the President, que incluye un apéndice estadístico relativo a la Economic Report the President, que incluye un apéndice estadIstico relativo a la fuerza de trabajo, la inflación y la actividad económica. la y la actividad económica. • Employment and Earnings, que se publica mensualmente, representa una fuente primaEl1lploYl1lent que se representa una fuente primaria sobre fuerza de trabajo y desempleo. na sobre fuerza de trabajo y desernpleo. • Federal Reserve Bulletin, que contiene series estadisticas sobre bancos y mercados Reserve Bulletin, contiene estadísticas sobre bancos mercados financieros, asI como material incidental sobre Ia inflación y la actividad económica. así corno material la económica. datos históricos para muchas de las series • Handbook of Labor Statistics, que presenta datos históricos para muchas de las series of Statistics, que aparecen en Employment and Earnings. El1lploYl1lent and of Incol1le, Internal Revenue y contiene información • Statistics of Income, que publica el Internal Revenue Service y contiene información gasto. sobre categorias de ingreso y gasto.'l Es frecuente que organizaciones privadas produzcan pronósticos baratos de medicioorganizaciones plivadas mediciones dernográficas y económicas. Business Forecasting in the 1980s es una bibliografia nes demográficas y económicas. Business Forecasting in the 1980s es una bibliografia selecta comentada de los libros y artIculos que proporcionan pronósticos generales, asI como artículos así como fuentes de pronósticos específicos. 2 Ejeniplos de dichos servicios fuentes de datos de pronósticos especIficos.2 Ejemplos de dichos servicios son: • Forecasting Studies, que cubre tendencias e indicadores dave. Forecasting Studies, que cubre tendencias clave. 1 W. G. Zikrnund, Business Research Methods, 3a. ed. (Nueva York: The Dryden Press, 1991), pp. G. Zikmund, Business Research Methods, 3a. ed. (Nueva York: The Dryden Press, 1991), pp. 129-137. Bibliografia para fuentes adicionales de datos. datos. 129-137. Bibliografia para fuentes 2 Bibliografia seleccionada, anotada y compilada por Loma Daniells ofBaker LibraryLibrary at Harvard Business 2 Bibliografla seleccionada, y compilada por Lorna Daniells of Baker at Harvard Business School, School, Boston. 1 66 Fuentes de datos Fuentes Capítulo 3 Cap Itulo • Guide to Consumer Markets, que proporciona estadIsticas y gráficas sobre el comporque proporciona estadísticas y gráficas sobre el comportamiento del consurnidor en el mercado. consumidor • National and Regional Economic Projection Series, que analiza y hace proyecciones de and Regional Projection Series, que analiza población, ingreso personal y gastos personales de consumo a nivel nacional, estatal y personales de consumo a nivel nacional, estatal y por areas estadIsticas. áreas estadísticas. • Survey ofBuying Power, que contiene proyecciones a corto plazo y tasas de crecimiento ofBuying crecirniento para población, vivienda, poder de compra y ventas al menudeo a nivel estatal, de para población, vivienda, poder de compra y ventas al menudeo nivel estatal, de y por áreas estadísticas. 3 condado y por areas estadIsticas.3 También, organizaciones comerciales publican estadísticas que se pueden utilizar También, organizaciones comerciales publican estadisticas que se pueden como fuente datos en muchas aplicaciones de pronóstico. Datos financieros como corno fuente de datos en muchas aplicaciones de pronóstico. Datos financieros como rendimientos de bonos, porcentajes de utilidad de empresas, dividendos, precios de rendirnientos de bonos, porcentajes de utilidad de empresas, dividendos, precios de y volúmenes acciones y vohIrnenes de comercio, se pueden obtener de Dun and Bradstreet, Inc., Moody's cornercio, se pueden obtener de Dun and Bradstreet, Inc., Moody's Investors Service, Standard and Poor's Corporation Statistical Service, The Fortune Investors Service, Standard and Poor's Corporation Statistical Service, The Fortune de Time, Inc., Value Line Investment Survey de Arnold Berhard and ComDirectory de Time, Inc., yyVa/tie Line Investment Survey de Arnold Berhard and Cornpany.l,3 pany.'3 Muchos de estos tipos de datos pueden accesar a través bases de datos Muchos de estos tipos de datos se pueden accesar a través de bases de datos computarizadas como Compuserve, Inc., News Retrieval Service del Dow-Jones, Compucomputalizadas corno Compuserve, Inc., News Retrieval Service del Dow-Jones, Compustat de Standard and Poor's y The Source and Value Line. Line. stat de Standard and Poor's Diversas compañías de investigación de mercados venden datos con base en una Diversas cornpañIas de investigación de mercados venden datos con base en una suscripción. La mayor parte de investigación de mercado se basa en muestreos de suscripción. La mayor parte de esta investigación de mercado se basa en muestreos de la población. El uso de compai1ías plivadas que proporcionen datos de pronóstico las población. El uso de compañIas privadas que proporcionen datos de pronóstico a las organizaciones, puede contlibuir a que se distribuyan entre varias de estas ñltimas el costo distlibuyan valias estas últimas el costo organizaciones, puede contribuir la recolección los datos plimarios, una organización de la recolección de los datos primarios, de modo que a una organización individual se le proporcionen datos muy confiables bajo costo. Ejemplos de compañías prominentes proporcionen datos rnuy confiables a un bajo costo. Ejemplos de compañIas prominentes proporcionan datos auditorías tiendas menudeo y servicios de seguimiento que proporcionan datos para auditorlas de tiendas al menudeo y servicios de seguimiento de productos son A. C. Nielsen Company y Audits and Surveys, Inc. Empresas que de productos son A. C. Nielsen Company Audits and Surveys, Inc. Empresas que proporcionan datos paneles consumidores encuestas correo son Market proporcionan datos sobre paneles de consumidores y encuestas por correo son Market Facts, Inc., Market Research Corporation of America, National Family Opinion, NPD America, National Family Opinion, Facts, Inc., Market Research Corporation Research, Inc. y J. Walter Thompson Company. Otra fuente valiosa es Predicasts, Inc, que J. Walter Thompson Company. Otra fuente valiosa es Predicasts, mc, además de sus propios pronósticos, proporciona reslunenes y bibliografias de pronósticos pronósticos, proporciona resirnenes bibliografias pronósticos adernãs de elaborados por otros.4 por otros. 4 Propios Datos Pro pios Además de los datos recolectados de fuentes públicas, los pronosticadores requieren utilizar fuentes pñblicas, los pronosticadores requieren utilizar datos de fuentes internas dentro de sus organizaciones. En los ültirnos aos, ha habido un datos de fuentes internas dentro de sus organizaciones. En los últimos ai1os, ha habido un 3 R. P. Vichas, Complete Handbook of Profitable Marketing Research Techniques (Englewood Cliffs, P. Vichas, Complete Handbook of Profítable Marketing Research Techniques (Englewood Cliffs, N.J.: Prentice-Hall, 1982), pp. 36-45. NJ.: 1982), 36-45. 4 T.C. Kinnear y J. R. Taylor, Marketing Research: An Applied Approach (Nueva York: McGraw Hill, T.e. Kinnear y J. R. Taylor, Marketing Research: An Applied Approach York: McGraw Hill, 199f), pp. 115-117, pp, 146-156. 146-156. 1991), pp. 115-117, Fuentes de datos 67 gran incremento en establecimiento de bases de datos las empresas. Cuando una gran incrernento en el establecirniento de bases de datos en las empresas. Cuando una organización desarrolla una base de datos, reúnen datos diversas variables se organización desarrolla una base de datos, se reünen datos para diversas variables y se almacenan en un sistema computarizado de modo que estén disponibles cuando se necesiten. de cuando se necesiten. No obstante que los datos particulares en una base de datos varian de acuerdo a las No obstante que los datos particulares en una base de datos varían acuerdo las necesidades especIficas, existen lineamientos que deben seguirse para establecer cualquier necesidades específicas, lineamientos que establecer cualquier base de datos para pronósticos: para pronósticos: • Debe haber un plan de pronóstico y solo deben recolectarse los datos requeridos. (El sólo recolectarse los datos requeridos. (El lineamiento seguir este linearniento asegura que los datos necesarios estarán disponibles cuando se necesiten y evitar asI el gasto y Ia confusion de datos excesivos.) así la confusión excesivos.) pñblicos pueden • Siempre que sea posible, deberán usarse los datos públicos disponibles, ya que se pueden Siempre obtener de manera más rápida y econórnica. rápida y económica. Los datos deben almacenarse en su fonna original de modo que puedan serVIr • Los datos deben almacenarse en su forrna Oliginal de modo que puedan servir a diferentes propósitos. • Antes de comenzar a usarlos, los datos deben verificarse y documentarse. • Los sisternas de bases de datos deben disefiarse para permitir su crecirniento. sistemas diseñarse pennitir crecimiento. Fuentes prim arias Fuentes primarias de datos Datos de encuestas. Los encuestados son una gran fuente de información Datos de encuestas. Los encuestados son una gran fuente de infonnación una compañía. Estos pueden público general, o primaria para una compaflIa. Éstos pueden ser clientes, püblico en general, proveedores o empleados. La finalidad del esfuerzo de recolección de datos es saber qué es lo las empleados. La finalidad del esfuerzo de recolección de datos es saber qué es lo que las la administración. personas seleccionadas piensan sobre elementos clave de interés para la adrninistración. La piensan sobre elernentos dave podría de manera periódica recolección de datos podrIa ser un esfuerzo de una sola vez o repetirse de manera periódica para generar series de tiempo de las variables, las cuales se analizarán después y se para generar series de tiempo de las variables, las cuales se analizarán después y se futuro (pronóstico). proyectarán al flituro (pronóstico). Cuando investigadores enfrentan necesidad una extensa cantidad Cuando los investigadores enfrentan la necesidad de reunir una extensa cantidad de datos de un gran nümero de personas, adoptan alguna forma de encuesta. La prirnera un gran número de personas, adoptan fonna encuesta. primera fase este proceso consiste en detenninar qué método específico encuesta deberá fase en este proceso consiste en deterrninar qué método especIfico de encuesta deberá emplearse para reunir la informaciOn requerida. Los tres métodos más comunes son las infOlmación requerida. Los tres métodos más comunes son emplearse para entrevistas por correo, personales y telefónicas. con-ea, telefónicas. En cornparaciOncon los otros dos métodos, el cuestionario por correo tiene la ventaja comparación con los otros dos métodos, el cuestionario por correo tiene la ventaja de liegar a un arnplio nIimero de personas dispersas, con un costo menor por contacto. personas dispersas, con costo menor por contacto. de llegar a un amplio número Además, los analistas tienen la seguridad de que las preguntas se plantearon en La misma la seguridad de que las preguntas se plantearon en la misma Adernás, los fonna a todos los encuestados, reduciendo asi la predisposición. Más aOn, los encueslos encuestados, reduciendo así la predisposición. Más aún, los encuesforrna pueden responder preguntas en tiempo libre. último, cuestionario tados pueden responder las preguntas en su tiempo libre. Por ültimo, el cuestionario por correo puede ilegar a individuos difíciles de entrevistar como doctores y otros profesionales llegar dificiles de como doctores y otros profesionales que tienen horarios irregulares. irregulares. Por otra parte, debido a la lentitud del correo y a la tendencia de los encuestados lentitud a la tendencia de los encuestados postergar el llenado del cuestionario, las encuestas correo ocupan mucho más a postergar ci ilenado del cuestionario, las encuestas por correo ocupan mucho más 68 Fuentes de datos Capítulo 3 CapItulo o Así las tiempo que las encuestas telefónicas o personales. AsI que si se requiere de velocidad, las por correo son las menos convenientes. sólo una parte de las encuestas por correo son las menos convenientes. Además, de hecho solo una parte de las personas contactadas responde las encuestas por correo. Estudios pasados muestran que personas contactadas responde las encuestas por correo. Estudios pasados muestran que ellO Y el 50%, regresan las encuestas, dependiendo naturaleza estudio. entre el 10 y el 50%, regresan las encuestas, dependiendo de la naturaleza del estudio. Este factor podría sesgar los resultados, las personas que no respondieron el Este factor podrIa sesgar los resultados, si las personas que no respondieron el cuestionario difieren de los que si hicieron áreas importantes. Por iltimo, sólo cuestionario difieren de los que sí lo hicieron en areas importantes. Por último, solo pueden incluirse pocas preguntas en las encuestas por correo, debido a que las personas preguntas emplean mucho esfuerzo en las preguntas responderlas. ahí que aunque no emplean mucho esfuerzo en leer las preguntas y responderlas. De ahI que aunque esta técnica barata por contacto, resulta cara en cuanto a formas respondidas y esta técnica sea barata por contacto, resulta cara en cuanto a formas respondidas y tiempo ocupado. El enfoque de Ia entrevista personal ofrece la ventaja de asegurar buenas técnicas la personal ya que los entrevistadores pueden seleccionar con cuidado los encuestade muestreo, ya que los entrevistadores pueden seleccionar con cuidado aalos encuestados. Este método puede arrojar Ia mayor cantidad de información debido a que los dos. método puede arrojar la mayor cantidad de información debido que los encuestados tienden a ser más abiertos y dispuestos a invertir tiempo respondiendo a encuestados tienden a más abiertos dispuestos invertir tiempo respondiendo las preglmtas. Además, este enfoque ofrece Ia mayor flexibilidad debido a su naturaleza las preguntas. Adems, este enfoque ofrece la mayor flexibilidad debido su naturaleza las entrevistas tienen el potencial más alto de desviación personal. Sin embargo, las entrevistas personales tienen el potencial más alto de desviación del entrevistador, mayores costos por contacto y mayores problemas de control del equipo del entrevistador, rnayores costos por contacto y mayores problemas de control de personal. En años recientes, la entrevista telefónica ha ofrecido ventajas crecientes para el recientes, la entrevista telefónica ofrecido ventajas crecientes el En analista, como recolección datos. Aunque puede lograr una muestra analista, corno una técnica de recolección de datos. Aunque no puede lograr una muestra tienen completamente representativa de la población, debido a que algunas personas no tienen completamente representativa de la población, debido a que algunas personas teléfono se les puede localizar en detenninadas horas, acerca a ser representativa teléfono o no se les puede localizar en determinadas horas, se acerca a ser representativa para muchos proyectos. El costo por contacto es menor que el de la entrevista personal y para muchos proyectos. El costo por contacto es menor que el de la entrevista personal y los resultados se pueden obtener con rapidez. Adernás, este método permite un gran control Además, método La desventaja del teléfono que sólo pueden emplearse preguntas cortas, del entrevistador. La desventaja del teléfono es que solo pueden emplearse preguntas cortas, fáciles de responder. También, mucha gente considera este tipo de recolección de datos fáciles de responder. Tarnbién, rnucha gente considera este tipo de recolección de datos corno como una invasiOn a su privacía y no responde. Esta falta de respuesta introduce un sesgo invasión a su privacla y no responde. introduce sesgo en los resultados de la investigaciOn. resultados de la investigación. Diseño de encuestas de muestreo. Esta sección presenta un breve repaso de Diseño decisiones el pronosticador en la selección de encuestados o unidades las decisiones que debe hacer el pronosticador en la selección de encuestados o unidades de muestra, para incluir en el proceso de investigación. Al principio, el pronosticador debe investigación. principio, pronosticador debe responder las siguientes preguntas: siguientes preguntas: 1. ¿Quién deseo que responda a mi encuesta y por qué? Quién 2. ¿Cuántas personas debería incluir en la encuesta? (Tamaño de la muestra.) ,Cuántas deberla 3. ¿Cómo seleccionar a las personas a incluir en la encuesta? (Esta pregunta determina la ,Cómo las personas encuesta? (Esta determina confiabilidad.) primera siempre tan clara como podría La respuesta a la primera pregunta no siempre es tan clara como podrIa esperarse. Por ejemplo, considérese el caso en que un fabricante medio de cosméticos contacta 150 varones con el fin de determinar la compra y hábitos de uso de lociones para después de varones de determinar compra hábitos uso de lociones para después de la cuestión de determinar qué características se enfi.. entó afeitar. El fabricante se enfrentó con la cuestión de determinar qué caracterIsticas demográ- Fuentes de datos 69 ficas deberlan tener las personas incluir en la muestra. ,La unidad de la muestra deberla ficas deberían tener las personas aaincluir en la muestra. ¿La unidad de la muestra debería parientes, un grupo de específico, o una combinación de los ser esposos, esposas, parientes, un grupo de edad especIfico, o una combinación de los anteriores? El fabricante interrogó solo a varones cuando, hecho, debió incluir anteriores? El fabricante interrogó sólo a varones cuando, de hecho, debió incluir también a las mujeres, ya que en realidad ellas hacen en muchos casos las compras de mujeres, muchos casos también lociones para después de afeitar. Como otro ejemplo de las dificultades en la selección dificultades la selección lociones para después de afeitar. Como otro ejemplo de correcta de la unidad de la muestra, considérese la situación que a menudo enfrentan los la muestra, considérese situación menudo enfrentan correcta de investigadores industriales. ¿Deben contactar al comprador que es responsable de las investigadores industriales. Deben contactar al comprador que es responsable de adquisiciones, al ingeniero o gerente de producción que da las especificaciones y utiliza adquisiciones, al ingeniero o gerente de producción que da las especificaciones utiliza el producto, o al ejecutivo que es con frecuencia quien toma las decisiones? El punto ejecutivo que es con frecuencia quien toma las decisiones? El punto el producto, es es que cuando los usuarios, compradores y los que toman decisiones no son la misma cuando usuarios, compradores y los que toman decisiones no son la misma pronosticador determinar quién de ellos es probable persona, el pronosticador debe determinar quién de ellos es más probable que tenga la información deseada. informaciOn A continuación, el pronosticador o analista debe decidir el tamaño de la muestra. continuación, pronosticador la muestra. depende tipo de investigación que se lleva a cabo y de qué tan confiables deben Esto depende del tipo de investigación que se lieva a cabo y de qué tan confiables deben ser los resultados. Por ejemplo, en una investigación exploratoria en donde se buscan ideas resultados. ejemplo, en investigación exploratoria en donde se buscan ideas más que conclusiones, por lo regular, con tan pocas como 30 entrevistas a profundidad, lo regular, tan pocas como 30 entrevistas a profundidad, conclusiones, serán suficientes para cubrir la variedad de areas del problerna. Al mismo tiempo, al serán suficientes para cubrir la variedad de áreas del problema. Al mismo tiempo, al pronosticador no le interesa poder decir: "Tengo una confianza de que mis respuestas son no le interesa poder decir: "Tengo una confianza de que mis respuestas son 95% correctas con 95% correctas con un margen de rnás o menos 2%". Una investigación posterior en margen más menos 2%". áreas especIficas alcanzará esta meta con un tamaflo de muestra mayor. Está areas específicas alcanzará esta meta con un tamaño de muestra mayor. Está reconocido mayor precisión en mayor tamaño la reconocido que una mayor precisiOn en una encuesta significa un mayor tamaflo de la muestra, por ello un costo más elevado. Con frecuencia, el pronosticador elaborará muestra, y por ello un costo rnás elevado. Con frecuencia, el pronosticador elaborará una tabla compare diversas combinaciones de tarnaño de la muestra costo, contra el tabla que compare diversas combinaciones de tamaño de la muestra y costo, contra el resultados de la encuesta. Quien torna las decisiones podrá hacer margen de margen de error en los resultados de la encuesta. Quien toma las decisiones podrá hacer sustentado precisión en elección la entonces un balance sustentado entre costo y precisiOn en la elección del tamaño de la muestra. conducir una investigación concluyente encontrar respuestas específicas Al conducir una investigación concluyente para encontrar respuestas especIficas a preguntas específicas, se deben utilizar muestras grandes. Sin embargo, no necesario preguntas especIficas, se deben utilizar muestras grandes. Sin embargo, no es necesario muestrear a población incluso la mayor parte de ella para lograr resultados muestrear a toda la población o incluso a la mayor parte de ella para lograr resultados precisos. Tal como un catador de vino puede juzgar toda una botella a partir de la primera precisos. Ta! corno un catador de vino puede juzgar toda una botella prueba, un investigador puede analizar un gran mercado a partir de una pequefla muestra. investigador gran mercado a partir de una pequeña muestra. prueba, mucho De hecho, las muestras pequefias que se seleccionan /y miden con mucho cuidado pueden muestras pequeñas que se seleccionan miden más confiables que muestras mayores utilicen estándares menos exactos. ser más confiables que muestras mayores que utilicen estándares menos exactos. Una muestra grande que tenga sesgo, como en el ejemplo de los cosméticos, pueden conducir el ejemplo de los cosméticos, pueden conducir muestra grande a un extravIo mayor que una muestra pequefia, ya que los resultados errOneos de la muestra extravío una muestra pequeña, los resultados erróneos muestra mayor aparentan tener gran precision. precisión. En general, mientras que las muestras más grandes arrojan resultados más precisos general, mientras muestras grandes resultados precisos que que las muestras pequefias, cuestan más en térrninos de tiempo y dinero. Por ejemplo, muestras pequeñas, cuestan rnás ténninos de tiempo y dinero. Por ejemplo, duplicar el tamaño de la muestra podrIa requerir doblar el costo, asI como demorar el tiempo la muestra podría el así demorar el tiempo de decision. De ahI que el pronosticador deba evaluar el valor de más información contra decisión. Dc ahí pronosticador deba evaluar el infonnación mayor costo y tiempo de recolecciOn de datos. y tiempo de recolección de datos. Como dato interesante, el duplicar el tarnafio de una muestra no duplica su precisiOn tamaño duplica su precisión en algunos casos puede agregar muy poca infonnación. meta del muestreo consiste y en algunos casos puede agregar rnuy poca informaciOn. La meta del muestreo consiste de muestra mínimo proporcionar la infonnación en seleccionar el tamaño de muestra minimo necesario para proporcionar Ia información seleccionar una buena decisión, dadas las restricciones fiscales, de tiempo requerida para tomar una buena decisiOn, dadas las restricciones fiscales, de tiempo y el de precisión deseado. grado de precision deseado. 70 Fuentes de datos Capítulo 3 Cap Itulo 3 cuestión pronosticador, la detenninar un método La tercera cuestión que debe enfrentar el pronosticador, la de determinar un método recolección aborda en la siguiente sección. de recoiección de datos, se aborda en Ia siguiente sección. Muestreo Muestreo aleatorio simple. La iiitima pregunta a responder en ci diseflo del simple. última pregunta responder en el diseño del recolección de datos es córno seleccionar personas u objetos para la muestra? esfuerzo de recolección de datos es ¿cómoseleccionar personas u objetos para Ia muestra? De nueva cuenta, Ia respuesta a esta pregunta dependerá del tipo de investigación que se la respuesta dependerá del tipo investigación que desarrollando y objetivos. esté desalTollando y de sus objetivos. caso de una investigación exploratoria, la selección de la muestra no es crítica. En el caso de una investigación exploratoria, la selección de la muestra no es crItica. En la mayorIa de los casos ci pronosticador puede emplear ci buen juicio para seleccionar mayoría los casos el pronosticador puede emplear el buen para seleccionar la muestra, teniendo en cuenta las siguientes caracterIsticas: las personas de la muestra muestra, teniendo cuenta las siguientes características: las personas la muestra deberán tener un gran conocimiento respecto al problema, ser fáciles de contactar y entablar respecto al problema, ser fáciles de y entablar dispuestas conversación y estar dispuestas a discutir el problema. En las investigaciones concluyentes, si ci pronosticador desea precisar estimaciones investigaciones el pronosticador desea precisar estimaciones características de población usarlas para predecir futuro, deberá extraer una de caracteristicas de la población y usarlas para predecir el futuro, deberá extraer una aproximación desgracia, muestras aleatorias son por muestra aleatoria o una aproxirnación a ésta. Por desgracia, las muestras aleatorias son por lo regular más caras que las no aleatorias. Los gastos se derivan de 1) intentar encontrar aleatorias. Los gastos derivan de intentar encontrar lo regular más caras que todos los miembros la unidad de la muestra (por ejemplo, mujeres 18 una lista de todos los miembros de la unidad de Ia muestra (por ejemplo, mujeres entre 18 años), 2) seleccionar en fom1a aleatoria lista, 3) tener que enviar y 35 años), 2) seleccionar en forrna aleatoria una muestra de esta lista, 3) tener que enviar y,4) tener que entrevistadores o fonnas de encuestas a todas partes de una ciudad o estado y, 4) tener que entrevistadores o formas encuestas todas encuestados no estén disponibles al primer intento. En las muestras no contactar a los encuestados que no estén disponibles ai primer intento. En las muestras no aleatOlias no se incurre en Ia mayoria de estos costos. la mayoría costos. aleatorias no incun-e muestreo aleatorio aseguran que unidad población Las técnicas de muestreo aleaforio aseguran que cada unidad en la población Las técnicas interés tenga igual probabilidad ser incluida en la muestra. de interés tenga igual probabilidad de ser incluida en la muestra. ¿Cómo se selecciona realmente una muestra aieatoria? Una técnica que puede j,Cómo se selecciona realmente una muestra aleatoria? Una técnica que puede muestreo simple. emplearse es el inuestreo aleatorio simple. En este enfoque, el investigador debe tener una lista completa de todos los elernentos de la población (por ejemplo, nombres de personas). elementos ejemplo, de personas). lista generador de números Después, un generador de nürneros aleatorios de una computadora (véase la sección Minitab al final de este capItulo) o una tabla de números aleatorios (véase tabla C.5), se utiliza para capítulo) al final nñmeros aleatorios (véase tabla C.5), se seleccionar Ia muestra. la muestra. Por ejemplo, suponga que un mayorista lleva 9 000 elernentos y desea seleccionar 250 elementos seleccionar de ellos para monitorear la prueba de un nuevo sisterna de control de inventarios. Serla monitorear prueba nuevo sistema control inventarios. Sería de posible proceso asignar número a cada elemento, poner los números en posible utilizar el proceso de asignar un nñmero a cada elemento, poner los nilmeros en tarjetas, revolverlas y extraer 250 al azar. Sin embargo, este procedimiento es caro y ocupa tarjetas, revolverlas 250 azar. procedirniento es caro y tiempo. Un generador o una tabla de números aleatorios simplifica este procedimiento. tiempo. Un generador o una tabla de nürneros aleatorios simplifica este procedirniento. seguida, generan 250 Primero, se asigna a cada elemento un número del 1 al 9 000. En seguida, se generan 250 elemento un nñmero del ai 9000. Primero, se asigna números aleatorios de cinco dIgitos que sean menores un ni'imeros aleatorios de cinco dígitos que sean menores de 9 000, mediante im generador de números aleatorios de ima computadora o se seleccionan de una tabla de nümeros aleatorios una números nürneros (véase tabla C.5). Por ültimo, se incluyen en la muestra los 250 elementos que corresponden último, corresponden a los 250 nümeros aleatorios de cinco dIgitos. números aleatorios cinco dígitos. Fuentes de datos Fuentesdedatos 71 Por desgracia, en la mayorIa de los casos resulta dificil, costoso o incluso imposible la mayoría casos resulta dificil, costoso o incluso imposible seleccionar una muestra aleatoria simple, a menudo porque no disponible lista seleccionar una muestra aleatoria simple, a menudo porque no hay disponible una lista completa de la población. De modo que el investigador debe apoyarse en algún otro método. ci debe apoyarse en algñn otro método. los métodos comunes. siguiente se describen En la siguiente sección se describen varios de los métodos más comunes. muestreo Otras técnicas de muestreo aleatorio. Debido a las dificultades que implica la selección de una muestra aleatoria simple, investigadores y pronosticadores han desarromuestra aleatoria simple, investigadores pronosticadores han desarroilado otras técnicas de muestreo que se utilizan ampliarnente. Las más comunes son 1) 1) llado otras técnicas muestreo se utilizan ampliamente. Las más comunes muestreo sistemático, 2) muestreo estratificado y, 3) muestreo en bloque. Como en muestreo sistemático, 2) muestreo estratificado y, 3) muestreo en bloque. Como el muestreo aleatorio, éstas son verdaderas técnicas de muestreo aleatorio, y por ello el ci muestreo aleatorio, éstas son verdaderas técnicas de muestreo aleatorio, y por ello pronosticador puede usar técnicas estadIsticas establecidas en el análisis y proyección de técnicas estadísticas establecidas en el análisis proyección de pronosticador puede resultados. muestra sistemática es útil cuando analista tiene Una muestra sisteinática es muy ütil cuando el analista tiene una lista completa de la muestra y éstas se encuentran enlistadas de manera aleatoria. También las unidades de la muestra y éstas se encuentran enlistadas de manera aleatoria. También se puede utilizar la técnica con una población "infinita" en la que los elementos aparecen que los elementos aparecen el proceso en secuencia. Un ejemplo podrIa ser el proceso de lienado de boteilas. En esta técnica, el secuencia. podría llenado botellas. pronosticador selecciona un punto aleatorio de inicio en la lista. Después, se selecciona cada plmto lista. enésima unidad u objeto hasta alcanzar ci nilmero deseado. objeto hasta alcanzar el número deseado. Una variante común de esta técnica se utiliza para seleccionar nombres un Una variante comim de esta técnica se utiliza para seleccionar nombres de un primeras páginas del directorio telefónico. Primero, se extrae una página al azar de las primeras páginas del directorio telefónico. Prirnero, se extrae una página a! azar de esa página y, por último directOlio. A continuación, se selecciona al azar una columna de esa página y, por ültirno directorio. continuación, a! elige un nombre de la columna. Suponga, por ejemplo, que el analista necesita 200 se elige un nombre de la columna. Suponga, por ejemplo, que el analista necesita 200 nombres y que el directorio tiene 450 páginas. Suponga adernás, que el analista selecciona directorio tiene páginas. Suponga además, selecciona inicialmente la página 4, columna 2 y el séptirno nombre hacia abajo. Luego, el analista el séptimo nombre hacia abajo. Luego, el analista inicialmente la página 4, columna podrIa manera: podría proceder de la siguiente manera: elegir cualquier otra página y seleccionar el nombre de la columna 2 y ci renglón 7, hasta Ilegar a 200 nombres. Este procedimiento es mucho y el renglón 7, hasta llegar a 200 nombres. Este procedimiento es mucho más sencillo, rápido y barato que seleccionar una muestra aleatoria simple. barato que seleccionar una muestra aleatoria simple. más muestreo estratificado cuando el pronosticador sabe qué Las técnicas de muesireo estratUlcado se utilizan cuando ci pronosticador sabe qué Las subgrupos importantes (o estratos) se pueden identificar en la población, subgrupos que son pueden identificar en la poblaciôn, subgrupos que son homogéneos dentro del grupo, pero heterogéneos entre grupos. En esta situación una situación una hornogéneos dentro del grupo, pero heterogéneos entre grupos. En muestra estratificada es estadísticamente más eficiente barata que muestra aleatoria muestra estratificada es estadIsticamentemás eficiente yy barata que una muestra aleatoria subestrato se hace aleatoria; simple. La selección de unidades de cada subestrato se hace en forma aleatoria; la proporsimple. La selección de unidades de muestra representa cada estrato se determina mediante ci uso de técción del total de la muestra que representa cada estrato se detennina mediante el uso de técción estadísticas diseñadas la subestrato. nicas estadIsticas disefladas para reflejar ia importancia y variabilidad de cada subestrato. selección tiendas para probar nuevos Esta técnica se usa, por ejemplo, en la selección de diez tiendas para probar nuevos técnica ejemplo, productos. Un fabricante que desea probar un nuevo producto en tiendas de abarrotes, podría nuevo en tiendas de abarrotes, podrIa el hecho de que almque los grandes supennercados representan sólo alrededor del utilizar ci hecho de que aunque los grandes superrnercados representan solo airededor del 20% de todas las tiendas de abalTotes al menudeo, contabilizan el 80% de las ventas totales. abarrotes a! menudeo, contabilizan ci 80% de las ventas totales. De ahí la compaflIa podrIa elegir supermercados para abarcar entre ci 70 y Dc ahI que La compañía podría elegir supermercados para abarcar entre el 70 y 80% de las tiendas de prueba y solo del 20 al 30% de pequeñas tiendas. sólo del 20 al 30% de pequeñas tiendas. El inuesireo en bloque comprende ci agrupamiento en bloques de la poblaciOn y la muestreo bloque comprende el agrupamiento de la población la selección aleatoria posterior de bloques, o grupos, en vez de elernentos unitarios. Una de elementos unitarios. Una selección aleatoria posterior de bloques, o grupos, en variante particulannente útil de esta técnica es ci muestreo por area. Suponga que un variante particularrnente ütil de esta técnica es el muestreo área. Suponga que un pronosticador desea extraer una muestra aleatoria de la gente que vive en ciudad de pronosticador.desea extraer una muestra aleatoria de la gente que vive en la ciudad de Indianapolis. Ya que no existen directorios disponibies que enlisten a todas las personas Indianápolis. Ya existen directorios disponibles que todas las personas 72 Fuentes de datos Capítulo 3 Capituto que viven en esta ciudad (los directorios telefónicos no incluyen a todas las personas que ciudad (los directorios telefónicos incluyen personas que supuesto, tampoco incluyen a lo tienen), se requiere de tienen teléfono y, por supuesto, tampoco incluyen a los que no lo tienen), se requiere de tienen teléfono y, alguna otra técnica. De modo que se extrae una muestra por area seleccionando aleatoriatécnica. se extrae una muestra por área seleccionando aleatoriamente manzanas en un mapa de la ciudad. Después, en cada manzana se entrevista a un ciudad. Después, manzana entrevista mente manzanas en un número predetenninado de personas. Esta técnica es sencilla y económica. Se ahorran ahorran nñmero predeterrninado de personas. Esta técnica es sencilla y económica. costos, ya que se puede enviar a los entrevistadores a las manzanas de las personas se puede enviar a los entrevistadores las manzanas de las personas costos, ya seleccionadas, en vez de hacerlo a localidades por completo divergentes. hacerlo a localidades por completo divergentes. seleccionadas, Muestras no aleatorias. Cuando el analista y no Ia casualidad, determina qué Cuando no la casualidad, detennina Muestras no elementos se incluirán en la muestra, el proceso de selección es no aleatorio. La finalidad elementos se incluirán en Ia muestra, el proceso de selección es no aleatorio. La finalidad muestreos aleatorios consiste muestras rápidas, baratas y fáciles de los muestreos no aleatorios consiste en obtener muestras rápidas, baratas y fáciles de seleccionar; ser representativas de la población en estudio. seleccionar; sin embargo, éstas pueden o no ser representativas de la población en estudio. las técnicas no aleatorias más comunes que se utilizan son las muestras por cuota Dos de las técnicas no aleatorias más comunes que se utilizan son las muestras por cuota las muestras o conveniencia y las muestras a juicio. El único criterio principal que se emplea en la selección de muestras por conveniencia iinico criterio principal que se emplea en la selección de muestraspor conveniencia sería la estudiantes la facilidad es Ia facilidad de selección para el analista. Un ejemplo serla Ia utilización de estudiantes profesores para recolectar datos para sus proyectos de investigación. En fonna similar, por profesores para recolectar datos para sus proyectos de investigación. En forma similar, una compafiIa podría probar el sabor de un nuevo producto, colocándolo en un puesto en compañía podrIa probar el sabor de un nuevo producto, colocándolo en un centro comercial y pedir la gente que pruebe producto. método se un centro comercial y pedir a Ia gente que pruebe el producto. Este método se usa con frecuencia cuando se requieren estudios exploratorios rápidos y baratos, como en la prueba estudios exploratorios rápidos y baratos, como nuevo refresco. ocasiones, a este método se previa de un cuestionario o la prueba de un nuevo refresco. En ocasiones, a este método se que el muestreo continúa hasta alcanzar el tamaño de muestreo por le denomina rnuestreo por cuota, ya que el muestreo continña hasta alcanzar el tamaño de deseado. muestra deseado. muestreos seleccionan los analistas que usan criterios acerca de Los inuestreos a juicio las seleccionan los analistas que usan sus criterios acerca de incluir en la muestra. Algunos analistas argumentan que de hecho, pueden los elementos a incluir en la muestra. Algunos analistas argurnentan que de hecho, pueden reducir elTores muestreo mediante uso efectivo de técnicas de juicio para reducir errores de rnuestreo y costos mediante el uso efectivo de técnicas de juicio para unidades desviadas. procedimiento reducir unidades de muestra "extremas" o desviadas. Este procedimiento es aceptable en tanto el analista pueda desarrollar una muestra verdaderamente representativa de la tanto el analista pueda desarrollar una muestra verdaderamente representativa de la población. No obstante, no hay forma de probar estadIsticamente el grado hasta el cual población. obstante, estadísticamente el grado la muestra es representativa. Esta técnica se utiliza también principalmente en la investigarepresentativa. exploratoria. ción exploratoria. Mercados de prueba. El mercadeo de prueba está convirtiendo en una Mercados de prueba. El mercadeo de prueba se está convirtiendo en una herramienta administrativa común. El investigador de mercados o pronosticador dispone la comñn. de mercados colocación de un nuevo producto o marca en ciudades que piensa serán representativas del serán representativas colocación de la compañía, mercado geográfico objetivo de la compafiIa, y observa después, durante cierto periodo, el comportamiento de las ventas del producto mercado prueba. Con frecuencia, el comportamiento de las ventas del producto en el mercado de prueba. Con frecuencia, este comportamiento se compara con las ventas en los mercados controlados, en los que se comportarniento se compara con las ventas en mercados controlados, marca diferente. ofrece un producto o marca diferente. El objetivo consiste en observar las ventas del producto en un escenario de pequena escala y en la suposiciOn básica de que ese comportamiento en escenario de pequeña escala y en la suposición básica de que ese comportamiento en dicho escenario pronosticará el comportamiento en el mercado más amplio. amplio. Los resultados de las pruebas de mercado proporcionan a la administración los datos resultados proporcionan administración los datos que requiere para evaluar oportunidades potenciales de ganancia. Parte de la informaevaluar oportunidades potenciales ganancia. de la infonnaque mercado es siguiente: ción que se puede obtener en una buena prueba de mercado es la siguiente: ción Aplicación en a administración AplicaciOn en la administraciOn 73 Una participación potencial de mercado del nuevo producto ¿Quién compra el producto, con qué frecuencia y con qué fin? ,Quién qué qué fin? Por lo regular, ¿en dónde se realizan las compras? ,en dónde se realizan Los cambios de estrategia que haga la competencia El efecto del nuevo producto sobre marcas ya establecidas En resumen, uno de los aspectos más dificiles y que ocupan tiempo en los pronósticos dificiles que ocupan tiempo recolección confiables. capítulo abordó la dificil es la recolección de datos válidos y confiables. En este capItulo se abordó Ia dificil tarea que enfrentan la mayorIa de quienes pronostican, de cómo encontrar datos pertinentes que mayoría que pronostican, de cómo datos problemas de datos se les ayuden a resolver los problemas de sus aplicaciones. Las fuentes de datos se pueden clasificar ya sea como primarias o secundarias. Las fuentes de datos primarias comprenfuentes den todos los métodos de la recolección original de datos. Las fuentes de datos secundarias original de datos. Las fuentes de datos secundarias son datos ya publicados, reunidos con fines distintos a los que el pronosticador o son datos ya publicados, reunidos con fines distintos a los que el pronosticador o investigador necesita tener a la mano. La importancia para los pronosticadores de investigador necesita tener a mano. La importancia para los pronosticadores de distinguir entre fuentes primarias y secundarias abarca el hecho de que es más probable fuentes secundarias abarca el hecho que que una fuente primaria de datos contenga datos más completos y precisos que los que datos más completos precisos fuente secundaria. otra parte, los datos primarios son, pudieran encontrarse en una fuente secundaria. Por otra parte, los datos primarios son, por lo regular, más caros de obtener. 10 más caros de obtener. En afios recientes, ha habido un incremento sustancial en la cantidad de fuentes fuentes En años recientes, ha habido un incremento sustancial en de datos publicadas (datos secundarios) disponibles para los pronosticadores. Las de datos publicadas (datos secundarios) disponibles para los pronosticadores. Las bibliotecas, fuentes gubernamentales, servicios computarizados organizaciones no bibliotecas, fuentes gubernamentales, servicios computarizados y organizaciones no lucrativas proporcionan grandes cantidades de datos estadisticos que se pueden emplear estadísticos que se pueden emplear en los pronósticos. La recolección de datos primarios requiere de la selección de los elementos que se recolección de primarios requiere de selección los elementos que se incluirán en la muestra. En este capítulo se expusieron diversos métodos para ello: muestreo capitulo aleatorio simple, muestreo sistemático, muestreo por bloques y estratificado, muestreo a aleatorio simple, muestreo sistemático, muestreo por bloques estratificado, muestreo juicio y muestreo por cuota o conveniencia. Si los elementos seleccionados son personas, y muestreo por cuota o conveniencia. Si los elementos seleccionados son personas, de acercarse a ellas características hay muchas formas de acercarse a ellas para determinar sus caracterIsticas y opiniones. Los cuestionarios correo, encuestas telefónicas y entrevistas personales son cuestionarios por correo, encuestas telefónicas y las entrevistas personales son los princirecolección se abordaron en este capítulo. pales métodos de recolección de datos que se abordaron en este capitulo. APLICACIÓN EN ADMINISTRACIÓN APLICACIÔN EN LA ADMINISTRACIÔN Las decisiones que enfrentan los administradores en todas las organizaciones requieorganizaciones requieLas 10 regular, cierta manipulación análisis es necesario ren, por lo regular, cierta manipulación o análisis de datos. Para tales análisis es necesario disponibles apropiados, y capítulo se refiere la recolección que estén disponibles los datos apropiados, y este capItulo se refiere a la recolección de pertinentes. la mayoría importantes negocios dichos datos pertinentes. Ya que Ia mayorIa de las decisiones importantes en los negocios requieren análisis, resulta en extremo importante tener a la mano conjunto requieren de análisis, resulta en extremo importante tener a la mano el conjunto de datos para decisión. pertinentes pam esa decision. Se pueden efectuar muchas decisiones importantes en los negocios después de Se pueden efectuar muchas decisiones importantes en los negocios después examinar datos existentes, decir, con datos secundarios. Es importante que cada examinar datos ya existentes, es decir, con datos secundarios. Es importante que cada administrador esté familiarizado con las fuentes secundarias de datos, tanto dentro de administrador esté familiarizado con las fuentes secundarias de datos, tanto dentro de compañía como en agencias exteriores tales como gobierno, las bibliotecas y las la compafivacomo en agencias exteriores tales como gobierno, las bibliotecas y las universidades. Muchas situaciones de decisión se ven auxiliadas en gran medida por la situaciones de decision se yen auxiliadas en gran medida universidades. barata recolección de en las fuentes antes mencionadas. sencilla y barata recolecciOn de los datos existentes en las fuentes antes mencionadas. 74 Fuentes de datos Fuentes CapItulo Capítulo 3 aún más generalizada, en decisiones, necesidad reunir datos Es thin más generalizada, en la toma de decisiones, la necesidad de reunir datos específicamente diseñados para el problema en cuestión. La recolección de dichos datos especIficarnente diseñados para el problema en cuestión. La recolección de dichos datos primarios se aborda en este capItulo; los administradores de empresas necesitan primarios se aborda en este capítulo; los administradores de empresas necesitan familiarizarse con estas técnicas, diseñar sus propios estudios de investigafamiliarizarse con estas técnicas, tanto para diseñar sus propios estudios de investigación, como para evaluar en forrna efectiva los esfuerzos de otros. En cualquier situación fonna otros. datos reunieron analizaron de toma de decisiones es importante saber si los datos que se reunieron y analizaron decisiones importante saber si de toma resolver el problema y si representan los mejores datos posibles son los necesarios para resolver el problema y si representan los mej ores datos posibles para esta situación. situación. A continuación se presentan varias preguntas que podrIan formularse los administravarias preguntas que podrían los administradores de empresas en diversas circunstancias. La respuesta a cada pregunta implica la empresas en diversas circunstancias. La respuesta cada pregunta implica la dores un análisis recolección de datos, ya sean primarios o secundarios, y la realización de un análisis recolección de datos, ya sean primarios o secundarios, y realización adecuado mismos. del en este capítulo adecuado de los mismos. La comprensión del material que se presenta en este capItulo es esencial para cada una de estas preguntas, si se van aaidentificar oorecolectar datos de estas preguntas, se van identificar recolectar datos es esencial pertinentes. ,Se incrementado la participación en el mercado corno resultado de nuestra nueva • ¿Se ha incrernentado la participación en el mercado como resultado de nuestra nueva campaña publicitaria? carnpafa publicitaria? • ¿Cuál es la opinion de la audiencia sobre nuestro nuevo equipo ancla de noticias la opinión de la audiencia sobre nuestro nuevo equipo ancla de noticias Cuál televisivas? Cuá1 es el balance normal de compafilas sirnilares • ¿Cuál es el balance normal de efectivo para compañías similares a la nuestra? Qué piensan • ¿Qué piensan de nuestros servicios los miembros de nuestra unión de crédito? ¿Qué nuestros servicios los miembros de nuestra union de crédito? ,Qué mejoras pueden sugerir? Córno yen nuestros accionistas la efectividad del equipo • ¿Cómo ven nuestros accionistas la efectividad del equipo de administración de la administración de compañía? corn pa fíí a ? Qué • ¿Qué tendencias econOrnicas son evidentes en nuestra industria con base en los sucesos económicas son en los sucesos históricos? ,Cómo • ¿Cómo se relacionan nuestras ventas mensuales con los indicadores económicos regiolos económicos regionales importantes? ,Qué factores pueden identificar que afecten abstencionismo de • ¿Qué factores se pueden identificar que afecten el abstencionismo de nuestra fuerza fuerza laboral por tiempo? • ¿Cuál es la opinion de los compradores del area sobre nuestra tienda, en especial, compradores área sobre nuestra tienda, en especial, Cuá1 es la opinion comparada con nuestros principales competidores? Cuá1es son las actitudes de varios • ¿Cuáles son las actitudes de varios departamentos hacia el grupo de apoyo de cómputo cómputo de Ia compafila? la compañía? • ¿Qué efecto tiene, pam los compradores, la posición de los estantes para seleccionar los para Qué comestibles? cornestibles? Cuál • ¿Cuál es el mercado de cajas de velocidades manuales diseñadas para vehIculos de doble diseñadas para vehículos de doble tracción? CuáI es la opmlOn de los visitantes de nuestra ciudad con respecto a compras, • ¿Cuál es la opinion de los visitantes de nuestra ciudad con respecto a compras, restaurantes, hoteles, moteles y diversiones? Capítulo 3 CapItulo Problemas 75 GLOSARIO Fuentesprimarias dede datos. fuentes prirnarias de datos comprenden todos los Fuentes primarias datos. Las fuentes primarias de datos comprenden todos Las recolección de datos originales. métodos de recolección de datos originales. Fuentes secundarias de datos. Las fuentes secundarias de datos son datos ya publicados, de fuentes secundarias de datos publicados, reunidos para fines distintos los que el pronosticador investigador específico reunidos para fines distintos a los que el pronosticador ooinvestigador especIfico la mano. necesita tener a la mano. Muestreo aleatorio. Las técnicas de muestreo aleatorio aseguran que cada elernento en aleatorio. Las técnicas de muestreo aleatorio aseguran que elemento interés misma incluido en la muestra. la población de interés tenga la misma posibilidad de ser incluido en la muestra. PROBLEMAS PROBLEMAS 1. ¿Cuál es 1. LCual es el papel de los datos secundarios en el proceso de pronóstico? ¿Cuál el de los datos secundarios en el proceso de pronóstico? ,Cuál el de primarios? priniarios? 2. ¿Cuál es Ia ventaja de los datos primarios 2. L,Cuál es la ventaja de los datos primarios en relación con los secundarios? los secundarios? Sugiera algunos ejemplos de datos secundarios que sean útiles a los pronosticadores. 3. Sugiera algunos ejemplos de datos secundarios que sean i'itiles a los pronosticadores. 4. ¿Cuáles serían las ventajas de utilizar cada uno de los siguientes métodos para ilegar a los siguientes métodos para llegar los ,Cuáles serIan las ventajas de utilizar cada uno de universidad para realizar una encuesta? estudiantes de su universidad para realizar una encuesta? a. Correo b. Teléfono c. Entrevistas personales muestra aleatoria una no aleatoria? 5. ¿Cuál es la diferencia entre una muestra aleatoria y una no aleatoria? ,Cuál es 6. ¿Cuáles son las ventajas de cada una de las siguientes técnicas de muestreo? de las siguientes técnicas muestreo? ,Cuáles a. Muestra aleatoria simple simple b. Muestra en bloques c. Muestra por conveniencia d. Muestra al eatoria estrati ficada Muestra aleatoria estratificada e. Muestra sistemãtica sistemática f. Muestra a juicio A Julie Creston, administradora de la tienda depm1amental Bon Marche, le gustaría desarrollar 7. A Julie Creston, administradora de la tienda departarnental Bon Marche, le gustarla desarrollar un modelo para pronosticar cada mes el nivel de reducción del inventario, de modo que pudiera modelo cada mes el nivel de reducción del inventario, de modo que tomar las precauciones adecuadas para prevenir pérdidas. Julie sospecha que algunos robos han adecuadas para prevenir pérdidas. Julie sospecha que algunos robos reducido el inventario. Exponga los tipos de fuentes de datos requeridos para investigar este fuentes de datos requeridos para investigar este reducido el inventario. Exponga los tipos problema. problerna. 8. La Reservación India de Spokane está ubicada en Ia parte oriental de Washington, aproximadaLa Reservación India de Spokane está ubicada en la parte oriental de Washington, aproximadamente 80 kilómetros al noroeste de la ciudad de Spokane. Las fronteras al este yyal sur de la mente 80 kilórnetros al noroeste de Ia ciudad de Spokane. Las fronteras al este al sur de la comprendidas 58 kilómetros de la orilla del lago Roosevelt. reservación están comprendidas por 58 kilómetros de la orilla del lago Roosevelt. Durante Dmante los ñltimos dos años, Ia tribu ha investigado el potencial para un sitio de desarrollo últimos afios, la la confluencia el lago Roosevelt los lÍos Spokane y Columbia. Los vacacional en la confluencia que tienen en el lago Roosevelt los rIos Spokane y Columbia. Los 10 planes tentativos incluyen la posibilidad de contruir lo siguiente: un parque recreativo vehicular, un motel (con habitaciones y foros para reuniones), una marina (un muelle y veleros para renta), renta), una operación de renta de casas-flotantes, una tienda de abarrotes y aparejos de pesca, un una operación de renta de casas-flotantes, una tienda de abarrotes y aparejos de pesca, 76 Fuentes de datos Fuentes Capítulo 3 Cap Itulo 3 merendero, un área de playa y natación, un centro cultural con tienda de regalos y un casino. cultural con tienda de regalos casino. merendero, un area de playa natación, Además, existe también interés en desarrollar un campo de golf. La tribu Spokane ha solicitado también interés Además, desarrollar de golf. propuestas propuestas para un análisis de mercado y un estudio de factibilidad para estos negocios. Antes un estudio de factibilidad para estos negocios. Antes de preparar su propuesta, necesita usted responder las siguientes cuestiones: propuesta, necesita usted responder las siguientes cuestiones: a. Enliste las fuentes primarias de datos que se usarlan en el desarrollo del análisis de mercafuentes primarias de usarían desarrollo del análisis de mercaEnliste do. Explique cómo se utilizarIa en el estudio cada una de estas fuentes.5 utilizaría fuentes. 5 do. b. Enliste las fuentes secundarias de datos que se usarlan en el desarrollo del análisis de merEnliste fuentes secundarias de datos usarían desarrollo del análisis de mercado. Explique cómo se utilizarla en el estudio cada una de estas fuentes. utilizaría estas fuentes. cado. 9. Uptown Radiology está desarrollando un centro medico de imágenes más completo y tecnolóUptown Radiology está desarrollando centro médico de imágenes más completo y tecnológicamente avanzado que cualquier otro actualmente ubicado en el area de New England. Uptown área Radiology solicitó aa la empresa PMA Research que evaluara el mercado y realizara una Radiology solicitó la empresa PMA Research que evaluara el mercado y realizara una proyección de utilidades para cinco años. Algunos de los objetivos de este estudio serán: estudio serán: proyección utilidades para cinco años. • Identificar áreas de mercado para cada tipo de procedimiento ofrecido por las nuevas Identificar areas de mercado para cada de procedimiento ofrecido por nuevas instalaciones. • Reunir y analizar los datos que se tienen sobre los ingresos existentes en el área de Reunir y analizar los datos que tienen sobre los ingresos existentes en el area mercado las nuevas instalaciones. niercado para cada tipo de procedimiento que se ofrece en las nuevas instalaciones. • Identificar las tendencias en la rama de atención a la salud que afecten positiva o Identificar las tendencias en Ia rama de atención a salud que afecten positiva los procedimientos ofrecen las nuevas instalaciones. negativamente los ingresos por los procedimientos que ofrecen las nuevas instalaciones. ,Qué fuentes secundarias podrIan usarse para a. ¿Qué fuentes secundarias podrían usarse para elaborar este estudio? Qué fuentes b. ¿Qué fuentes primarias podrIan usarse para elaborar este estudio? podrían usarse estudio? 10. Localice en su biblioteca cada una de las siguientes publicaciones y registre una serie de tiempo su biblioteca de las siguientes publicaciones serie tiempo cada lUla durante varios periodos: Survey 01 Current Business, Statistical Abstract 01 the de cada una durante varios periodos: Survey of Current Business, Statistical Abstract of the United States, Standard and Poor's Statistical Service y Moody's Investors Service. Poor's Statistical Service y Moody's Investors Service. United States, Standard 11. Desarrolle un cuestionario para utilizar con estudiantes de su clase, para explorar sus actitudes Desarrolle cuestionario para utilizar con estudiantes de su clase, actitudes hacia los acontecimientos actuales en la nación y en el campus. Incluya también preguntas acontecimientos actuales en nación y en el campus. Incluya también preguntas hacia demográficas como sexo, edad, especialidad, etc. Haga una prueba previa de su cuestionario previa de su cuestionario deniográficas como sexo, edad, especialidad, etc. Haga solicitando comentarios aa sus compañeros de clase sobre puntos a mejorar. Suponga que las solicitando comentarios sus cornpaneros de clase sobre puntos a mejorar. Suponga que llenadas alimentarán cómputo y diseñe las preguntas pensando encuestas lienadas se alirnentarán en un programa de cómputo y diseñe las preguntas pensando en ello. CASO DE ESTUDIO 3.1 ESTUDIO 3.1 fOOD PRODUCTS ARGYL FOOD PRODUCTS6 6 economía ann no graduado del Premier State College, se entusiasmó Rob Arabicaf, un especialista en economIa aún no graduado del Premier State College, se entusiasmó al ser aceptado en lUl programa interno de verano en la Argyl Food Products Company. Recientemente, un Ia Argyl Food Products Company. Argyl absorbió a un competidor cuya lInea inclula diversos productos de café. Dichos productos se Argyl un competidor cuya línea incluía diversos Dichos productos se 5 "The Spokane Indian Tribe Feasibility Study, "Decision Science Institute Proceedings, New Orleans, Spokane Indian Tribe Feasibility Study, "Decision Science fnstitllte Proceedings, New Orleans, 1991. 6 6 This case was contributed by William C. Struning of the General Foods Corporation, Nueva York, contributed by William C. Struning the General Foods Corporation, Nueva York, This case Nueva York. Capítulo 3 Capitulo Caso de estudlo estudio 77 asignaron a la division de bebidas de Argyl, dirigida por Sue Maxwell. El café era nuevo para Argyl y división para Argyl proporcionaría a Sue pensó que necesitaba saber hacia dónde iba el mercado del café. Pensó que esto proporcionarla a Rob, el economista neófito de Argyl, un ütil proyecto. útil siquiera La solicitud de Sue para que Rob prestara sus servicios fue aprobada y éste, quien ni siquiera bebla bebía café se vio de pronto enfrentado a elaborar una predicción sobre la que Argyl basarIa una decision basaría decisión clave. Si se estaba extendiendo la demanda de café en los Estados Unidos, Sue colocarla fondos dave. Si se estaba extendiendo la demanda de café en los Estados Unidos, Sue colocaría fondos participación en el mercado. Pero, si parecla que el potencial del considerables para tener una mayor participación en el mercado. Pero, si parecía que el potencial del café se contraIa, Sue considerarIa colocar los productos de café de Argyl en una compañIa más contraía, consideraría colocar los productos de café de Argyl una compañía más café especializada en ese campo. Rob podría tener mejor oportunidad proporcionar un pronóstico realista y Rob pensó que podria tener una mejor oportunidad de proporcionar un pronóstico realista y confiable si aprendla un poco más acerca del café. Ya habIa tornado cursos que lo farniliarizaron con aprendía más acerca del café. Ya había tomado familiarizaron técnicas de formulación de pronósticos. Decidió elaborar un análisis preliminar o de Situación, de modo formulación de pronósticos. Decidió elaborar un análisis preliminar o de situación, de modo que su pronóstico final fuera más comprensible y ñtil a la administración. útil Rob contactó diversas personas dave en el grupo de café heredado por Argyl. Le fueron de gran clave en el grupo de café por ayuda, pues tenlan amplios antecedentes en los aspectos técnicos del café, pero en realidad no sabian tenían realidad no sabían mucho respecto patrones amplios de consumo de café. Asi, Rob se dio cuenta de que tendria mucho respecto a patrones amplios de consumo de café. Así, Rob se dio cuenta de que tendría que con su consumo en EUA. analizar publicaciones sobre el tema del café, en particular las relacionadas con su consumo en EUA. década, la búsqueda habría Hace más o menos una década, Ia büsqueda de literatura habria requerido de muchas horas de examinar índices de tarjetas de publicaciones en las bibliotecas, así como el buscar en gulas de guías de examinar Indices de tarjetas de publicaciones en las bibliotecas, asI como el buscar periódicas. Pero Rob recordó que en biblioteca de universidad podia efectuar una publicaciones periódicas. Pero Rob recordó que en la biblioteca de la universidad podía efectuar una búsqueda por computadora de publicaciones disponibles. El bibliotecario ayudó a Rob a conectarse a büsqueda un servicio denominado Dialog (Dialog Information Services, Inc.). Dialog es uno de muchos grandes servicios de información que ofrecen datos y textos vía computadora (en línea). Las ofertas de Dialog datos textos via computadora (en linea). Las ofertas de Dialog consisten consisten en más de 100 bancos de datos, cada uno creado, actualizado y mantenido por una organización cada uno creado, actualizado y mantenido per una organización especializada en información para ese campo en particular. A Rob le satisfizo aprender que podia tener especializada información para ese en aprender que podía tener aun esta la mantiene y da servicio acceso a una de las bases de datos de Dialog, Coffeline, ann cuando esta base la mantiene y da servicio Organización Internacional del Café Londres, Inglaterra. Cuando Rob creó un la Organización Internacional del Café en Londres, Inglaterra. Cuando Rob se conectó, se creó un tiempo conexión y volumen de información que conforman la base registro de su tiempo de conexión y volumen de información obtenida, datos que conforman la base para hacerle el cargo correspondiente. Rob se encontró con que había muchas opciones sobre consumo de café en EVA. Seleccionó una habla consumo café en EUA. Seleccionó una incluía impresión que inclula un breve resumen de cada artículo, así como su referencia bibliográfica. Para leer artIculo, asI como su referencia bibliográfica. Para leer origina!. Varias compañías que ci texto completo de un artIculo dado, habrIa tenido que obtener el texto original. Varias compauiIas que el artículo habría trabajan a través de Dialog proporcionan impresiones de textos completos. Por desgracia, este servicio disponible no está disponibie para Coffeline. No obstante, la lectura de los resúmenes le proporcionaron muchos Ia lectura de los resümenes le área interés pudo localizar completos varios artículos relacionados, acercamientos a su area de interés y pudo localizar textos completos de varios articulos relacionados, contactando directamente a los editores. a los A continuación, Rob decidió investigar si existia algün pronóstico previo publicado sobre el continuación, investigar existía algún pronóstico publicado EVA. Si había disponible tal estudio, podria utilizarlo sin ocupar tiempo otros consumo de café en EUA. Si habIa disponibie tal estudio, podría utilizarlo sin ocupar tiempo y otros recursos en elaborar su propio pronóstico. En esta ocasión seleccionó otra base de datos de Dialog, PTS base de datos de Dialog, PTS Forecasts creadores Forecasts Abstracts. Los creadores de esta base de datos, Predicasts, se especializan en resumir cualquier de datos, Predicasts, se especializan en resumir cualquier pronóstico que puedan encontrar en iiteratura impresa y en poner a disposición los resñmenes a los literatura impresa disposición los resúmenes a los pronóstico suscriptores de Dialog. Buscando en el tema de café en EVA, Rob encontró una proyección general de café en EUA, Rob encontró una proyección general de consumo que preparó y publicó originalmente una agencia del gobierno. Pero tendrIa que hacer de todos originalmente agencia tendría consumo modos su propio pronóstico, pues los datos que tenía a mano no presentaban subdivisiones (por edad, tenIa a mano no presentaban subdivisiones (por edad, sí proporcionaban buenos con los que podría ingreso, etc.), aunque 51 proporcionaban buenos parámetros de consumo agregado con los que podria comparar su propio trabajo. 78 Fuentes de datos Capítulo 3 CapItulo 3 Internacional del Café era A través de su uso de Dialog, Rob aprendió que la Organización Internacional del Café era la fuente mundial más importante de datos sobre café. Su solicitud aaesta organización se vio recompensada datos sobre café. Su solicitud estaorganización vio recompensada al recibir datos sobre el consumo de café en EUA. Para determinar qué modelo usar para su pronóstico, EUA. un paquete de software estadístico para realizar un análisis exploratorio. Una simple gráfica de usó un paquete de software estadistico para realizar un análisis exploratorio. Una simple gráfica de series de tiempo y un correlograrna (exhibición de autocorrelaciones para varios periodos [se abordan correlograma (exhibición de autocorrelaciones para varios periodos [se abordan en el cap. 4]), sugirieron que habla en los datos una suave tendencia a la baja y un patron estacional. había patrón estacional. Parecía también que había extremos", Parecia también que habia diversos "valores extrernos", v.gr. valores muy por afuera del nivel general. Rob tuvo entonces que decidir si hacia la predicción atenuando y extrapolando los datos en el futuro hacía denominado en el de negocios como análisis técnico), o si hacía inferencias (con frecuencia denominado en el mundo de los negocios como análisis técnico), 0 Si hacia inferencias a partir de las relaciones entre los datos de café y otras series de datos. Rob no estaba al tanto de que de datos. Rob no al existen modelos que conibinan estos dos enfoques. combinan estos dos enfoques. había podría De lo que habja aprendido hasta ahora, Rob pensó que la cantidad de café consumido se podrIa al menudeo o el ingreso personal explicar mediante influencias externas, corno el precio del explicar mediante influencias externas, como el precio del café al menudeo o el ingreso personal disponible. Si, por decir, el consumo de café y el ingreso estuvieran relacionados, serla posible consumo café y el ingreso estuvieran relacionados, sería posible disponible. Si, por decir, consumo estadística, pronosticar el consurno para varios niveles de ingreso. Recordó, de un curso básico de estadIstica, que podía consumo de podia medir y proyectar las relaciones de consurno de café y otras variables por medio de técnicas de correlación y regresión. De ahi que decidió explorar el enfoque de las relaciones. ahí decidió explorar el enfoque de las relaciones. computadora Realizar un análisis de regresión en una coniputadora es relativamente rápido y fácil, siempre relativamente rápido fácil, siempre los datos Rob se dio cuenta de que que se tengan disponibles y listos para utilizar todos los datos necesarios. Rob se dio cuenta de que ya que no tenía los datos a la mano, la mayor palie de su trabajo consistiría en localizar, copiar e introducir tenja los datos ala mano, Ia mayorparte trabajo consistirIa en localizar, copiar e introducir Por desgracia, Rob no tenía acceso a servicios como Data Services, Inc., datos en su computadora. Por desgracia, Rob no tenIa acceso a servicios como Data Services, Inc., 1. Wharton I. P. Sharpe o \Vharton Electronics, los cuales se especializan en mantener en línea series económicas especializan en linea series económicas directamente mediante un modern al espacio de trabajo de computadora. Pero Rob para cargar directamente mediante un módem al espacio de trabajo de una computadora. Pero Rob servicio, Information, Inc. (Cn), pone en línea estadísticas de precio y localizó un servicio, Commodity Information, lnc. (CII), que pone en Ilnea estadIsticas de precio y incluyendo café. cn también proporciona software para permitir volumen para diversos productos, incluyendo café. CII tarnbién proporciona software para permitir aa analizar los datos recibidos de ellos. Al tener disponible la información, Rob ejecutó sus clientes analizar los datos recibidos de ellos. Al tener disponible la inforrnación, Rob ejecutO múltiples diagramas y regresiones rniiltiples (véase cap. 6), para decidir qué variables independientes serían útiles cap. 6), para decidir qué variables independientes serian ñtiles para explicar el consurno de café. consumo Rob pensó que este análisis preliminar le había sido en extremo útil para el diseño de su proyecto pensO que este análisis prelirninar le habia sido en extremo i'itil para ci diseño de su proyecto fom1al tenía objetivo un conocimiento café y varias ideas formal de pronóstico. Ahora tenia un objetivo claro, un conocimiento básico del café y varias ideas sobre lo que producia los cambios en el consumo del café. Adernás, podia ahora presentarle a sujefa, producía los can1bios el consun10 del café. Además, podía su jefa, Sue Maxwell, Sue Maxwell, las estirnaciones de cuánto le llevarIa terminar su proyecto y cuánto costaria. De gran estimaciones de cuánto llevaría terminar proyecto costaría. estas estimaciones paquete de cómputo de administración proyectos que Sue ayuda para estas estimaciones fue un paquete de cômputo de adrninistración de proyectos que Sue compró para él, de que pudiera afinar sus planes y estimaciones, así como mantener un Maxwell cornpró para él, de modo que pudiera afinar sus planes y estimaciones, asI como mantener un control del avance del proyecto. PREGUNTAS 1. ¿Cuál es Ia finalidad de realizar un análisis preliminar? ¿Es siempre necesario? ¿Puede usted ,Cuál la finalidad de realizar un análisis prelirninar? ,Es siempre necesario? Puede usted justificar ci tienipo y costo de realizar un análisis de este tipo? este tipo? el tiempo Qué alternativas 2. ¿Qué otras altemativas pudo utilizar Rob al realizar ci análisis preliminar? el 3. ¿Qué otras bases de datos con infOlmación de café podría haber consultado Rob dentro de Dialog? Dialog? ,Que información podrIa Capítulo 3 CapItulo Caso de estudio 79 ¿Qué otros servicios de datos numéricos o estadísticos hubiera 4. ,Qué otros servicios de datos numéricos o estadIsticos pudo utilizar Rob, si hubiera las cuotas correspondientes? pagado las cuotas correspondientes? CASO DE ESTUDIO 3.2 SOLOMON'SJEWELRY SOLOMON'S JEWELRY Solomon's es una importantejoyerIa ubicada en uno de los más prestigiosos centros comerciales en importante joyería ubicada en uno de los más prestigiosos centros comerciales en años Houston. A lo largo de los afios ha desarrollado una excelente reputación de manejar productos finos, desarrollado una excelente reputación de manejar productos finos, presidenta la la seleccionados para atraer a Ia gente que desea productos de calidad. La Sra. Solomon, presidenta de la compañía, tienda tiene una clientela leal ingresos, que en su mayoría se muestran compaflia, piensa que su tienda tiene una clientela lea! de altos ingresos, que en su mayorIa se muestran satisfechos con el servicio que reciben en Solomon's. El único problema grave que Solomon observa que reciben en ilnico problema grave que Solomon observa en el horizonte cercano es que un nuevo e importante competidor planea abrir una tienda en el mismo mismo comercial dentro meses. Aunque cadena de centro comercial dentro de dos meses. Aunque su competidor es un comerciante de una cadena de No obstante, tiendas, tiende a enfatizar en mercancla de alta calidad. No obstante, la Sra. Solomon se siente segura mercancía de que su empresa puede competir efectivamente haciendo énfasis en Ia lmnea distintiva de los productos empresa puede competir efectivamente haciendo énfasis en la línea distintiva productos largo plazo con los clientes la alta calidad de su servicio. que maneja, su compromiso a largo plazo con los clientes y la alta calidad de su servicio. Mr. Wind, contratado recientemente como vicepresidente de comercialización, es el responsable vicepresidente de comercialización, es el responsable de velar porque los esfuerzos de comercialización se diseñen para complementar las prácticas de porque los esfuerzos de comercialización se diseñen complementar las prácticas de comercialización anteriores, así como contrarrestar los efectos de los esfuerzos comerciales del nuevo asi contrarrestar los efectos de los esfuerzos comerciales del nuevo competidor. Wind, quien fue profesor en la universidad local, asI como consultor durante mucho tiempo Wind, quien fue profesor en así para la industria de joyería al menudeo, está en general complacido con lo que ve en Solomon's. El plan joyerIa al menudeo, está en general complacido con lo que ye en Solomon's. El plan de comercialización está bien diseflado y coordinado, los productos son adecuados para el mercado comercialización está diseñado y coordinado, los productos son adecuados para el mercado objetivo, los precios son altos pero compatibles con la calidad del producto, los vendedores son compatibles con calidad producto, vendedores objetivo, los precios son altos conocedores y amables y los esfuerzos promocionales parecen efectivos. efectivos. Después de varias semanas en su nuevo empleo, Wind decide visitar las tiendas del nuevo nuevo empleo, tiendas del nuevo Después de varias semanas competidor existentes en Dallas, para tratar de juzgar el impacto que podrIa tener en las operaciones de DalIas, podría operaciones Solomon's. Una evaluación cuidadosa de Ia tienda del competidor parece indicar que está enfocada a evaluación la tienda del competidor parece indicar que está enfocada a clientela de ingresos superiores y que proporciona un servicio cortés y amistoso. Sin embargo, su línea servicio cortés y amistoso. Sin embargo, su lInea menos distintiva, también es aproximadamente un 20% más barata. de productos, aunque es un poco menos distintiva, también es aproximadamente un 20% más barata. A su regreso a Houston, Wind le sugiere a la Sra. Solomon elaborar una encuesta para saber a Sra. Solomon más sobre los problemas potenciales que su empresa pudiera enfrentar al abrirse la nueva tienda. más sobre los problemas potenciales que su empresa pudiera enfrentar al abrirse la nueva tienda. Ella está de acuerdo con este pl~n. Así, si usted fuera Wind, ¿cómo respondería a las siguientes Ella está de acuerdo con este plan. Asi, si usted fuera Wind, ,cómo responderia a las siguientes preguntas? PREGUNTAS l. ¿A quién deberia contactar? debería ,A j,Cómo 2. ¿Cómo se les deberIa contactar? debería 3. ¿Cuándo se les deberla contactar? debería Cuándo 4. ¿Qué preguntas se les deben hacer? Que 80 Fuentes de datos Capítulo 3 CapItulo 3 CASO DE ESTUDIO 3.3 ESTUDIO 3.3 MR. TUX MR. John Mosby, propietario de varias tiendas Mr. Tux, está comenzando a pronosticar la variable más Mosby, propietario de varias tiendas Mr. Tux, comenzando a pronosticar la variable más importante de su negocio, las ventas mensuales en dólares. (Véanse los casos de estudio Mr. Tux en los Perot, reunió los datos de ventas que se presentan en capítulos capItulos 1 y 2.) Una de sus empleadas, Virginia Perot, reunió los datos de ventas que se presentan en el caso del capítulo 2. Al pensar cómo hacer un pronóstico efectivo, siente curiosidad sobre la precisión capitulo Al córno hacer un pronóstico efectivo, siente curiosidad sobre precision de estos datos. conversación con Virgina, él aprendió que la recolección de datos no fue tan sencilla En una conversaciOn con Virgina, él aprendió que la recolecciOnde datos no fue tan sencilla corno pensaba al asignarle esta tarea. Ella encontró la mayor parte de las cifras de ventas en los libros tarea. encontró de las de libros como mayores de contabilidad, pero faltaban algunos. Con una sola excepción, pudo reconstruir los volúmenes una sola excepción, pudo reconstruir los volñmenes partir de otros registros con la asistencia de la compafiía de ventas a partir de otros registros contables y con la asistencia de Ia compaiiIa de contabilidad que lleva los libros de la empresa. de El valor faltante, el de marzo de 1986, no se pudo localizar. Después de estudiar los patrones de datos, Virginia decidió estimar este valor para completos los años de datos de ventas datos, Virginia decidió estimar este valor para tener completos los ocho años de datos de ventas mensuales. Ella razonó que era probable que su estimación estuviera cerca del valor real faltante y que faltante esfuerzo sería cualquier esfuerzo de pronóstico no serIa desechado. Después de observar los valores de ventas durante este periodo se decidiO por un valor de $26 901 para marzo de 1986 (este dato se muestra en el caso del de 1986 (este dato se muestra en el caso del se decidió capítulo 2). capItulo 2). Después de escuchar su historia, Jolm estuvo de acuerdo en que su enfoque era razonable historia, John estuvo que él efectuara no se verían afectados de manera adversa por la estimación que y que los pronósticos que él efectuara no se verIan afectados de manera adversa por la estimación que hizo ella. Al final de la reunion, Virginia preguntó a John qué pensaba acerca de realizar una encuesta a reunión, Virginia preguntó Al final lo ocupado que estaba Esta posibilidad no se le había Jolm, clientes de rentas anteriores. Esta posibilidad no se le habia ocurrido a John, con lo ocupado que estaba a administrando el negocio y concentrado en el desarrollo de algunos pronósticos. Cuando le preguntó a sugería Virginia por qué sugerIa una encuesta, ella dijo: cOmo estamos trabajando ante los ojos de nuestros clientes. A veces Creo que seria bueno saber cómo estamos trabajando ante los ojos de nuestros clientes. A veces he oIdo quejas sobre diferentes aspectos, pero no sé si se trata de incidentes aislados o si hay oído aspectos, pero se trata de incidentes aislados o si hay fomlas en que podamos mejorar sustancialmente la forma de conducir el negocio. formas en sustancialniente la forma de conducir el negocio. PREGUNTAS 1. ¿Cómo hubiera usted manejado el problema del dato faltante? ,Córno hubiera usted manejado el problema del dato faltante? ,Cuál 2. ¿Cuál es su opinion respecto a la idea de Virginia de realizar una encuesta? opinión realizar CASO DE ESTUDIO 3.4 3.4 CONSUMER CREDIT COUNSELING CREDIT COUNSELING Marv Hamishfeger, Director empresa descrita en el Mary Harnishfeger, Director Ejecutivo de Consumer Credit Counseling (CCC), empresa descrita en el capítulo 1 (caso de estudio 1.2), estaba explicando la operación aa Dorothy Mercer,recientemente elegida capItulo (caso de estudio 1.2), estaba explicando Ia operación Dorothy Mercer, recientemente elegida del Comité Marv le indicaba que le gustaría entender mejor tres mercados: Presidenta del Cornité Ejecutivo. Mary le indicaba que le gustaria entender mejor tres mercados: Capítulo CapItulo 3 Caso de estudio 81 1. El problema de administración de deudas: Un cliente enfrenta a menudo crisis financieras administración deudas: Un cliente enfrenta a menudo crisis financieras El problema (posible bancarrota) y CCC le proporciona un programa alternativo denominado programa de de de deudas, para evitar la bancarrota. administración de deudas, para evitar Ia bancarrota. 2. Educación: Educación secundaria, educación sobre compras racionales parael hogar, Planeación Educación: Educación secundaria, educación racionalespara el hogar, Planeación Corporativos. Financiera Básica, Educación sobre Presupuestos Corporativos. personas 3. Ayudafinanciera aamayores: Este es un nuevo programa de CCC diseflado para ayudar a personas Ayudafinanciera mayores: Éste es un nuevo programa de CCC diseñado mayores a consolidar sus chequeras, pagar cuentas, negociar con acreedores yymanejar problemas sus chequeras, pagar cuentas, negociar con acreedores manejarproblemas médicos. medicos. Mary Ic explicó a Dorothy que, en su opinión, CCC tenía un problema de crecimiento y que sentIa Dorothy opinion, tenIa Marv le crecimiento y que sentía la necesidad de planear de manera estratégica su mejor colocaciOn en los tres mercados durante los de manera estratégica colocación en los tres mercados durante los siguientes años. enlistar preguntas sobre el mercado siguientes tres afios. Dorothy estuvo de acuerdo y comenzó a enlistar varias preguntas sobre el mercado ella pensaba necesitaban responderse. Mary interrumpiO Dorothy a la una objetivo que ella pen saba necesitaban responderse. Marv interrumpió aa Dorothy a la mitad de una le Marv siguiente lista: oración y Ic pidió que escribiera su lista de preguntas. Dorothy entregó a Mary la siguiente lista: • • • • • • • • • • ,Quienes ¿Quiénes son nuestro mercado? ¿Está creciendo?, si es asI, ¿qué tan rápido? si es así, qué ,Está Dónde está el ¿Dónde está ci mejor mercado? mercado? Hacia ¿Hacia dónde nos deberIamos expandir? deberíamos ,Que ¿Qué tan rápido podemos esperar la expansion? esperar la expansión? ,Cómo ¿Cómo podemos determinar nuestra clientela básica en cada mercado? ,Cómo ¿Cómo podemos identificar nuestra penetraciOn actual? penetración ,Cómo ¿Cómo podemos determinar nuestro punto de saturaciOn? punto de saturación? ,CuáIes son los ¿Cuáles son los pronósticos para el uso de crédito? Cuál el estos pronósticos? ¿Cuál es ci pronóstico para estos pronOsticos? algunas de las preguntas de Dorothy, Marv le proporcionó el Para intentar responder algunas de las preguntas de Dorothy, Mary le proporcionO a Dorothy ci penetración del mercado, de la National Consurner siguiente documento, relativo a la penetraciOn del mercado, de la National Foundation for Consumer al Credit (Fundación Nacional para Crédito al Consumidor): 1992, Desde la aparición del informe de actividades de 1992, hemos recibido varias preguntas acerca del uso e interpretaciOn de los datos. Esta semana, queremos abordar la penetraciOn de mercado de e interpretación datos. Esta semana, queremos abordar la penetración mercado de nuestras actividades, para examinar si estamos ampliando el servicio a todos aquellos que lo necesitan. estamos ampliando ci servicio a todos aquellos que lo necesitan. Definida llanamente, la penetración de mercado es una medida de cómo una actividad cubre una actividad cubre una Definida ilanamente, la penetraciOn de mercado es una medida de cómo necesidad. digamos que se tienen un millón de personas que viven en su area de servicio. Por ejemplo, digamos que se tienen un milIOn de personas que viven en su área de servicio. Esto área (alrededor de 2.5 personas por familia). significa que hay probablemente 400 000 familias en su area (airededor de 2.5 personas por familia). mercado de las sesiones Si efectuó las primeras 1 000 sesiones de consultoría en 1992, su penetración de mercado de las sesiones efectuO las primeras 000 sesiones consultoria sería de serIa de 1 000 sesiones divididas entre 400 000 casas = .0025 sesiones por familia. Para trabajar con números más grandes, multiplicamos por 1 000 para obtener la penetración por cada mil casas, lo que nümeros multiplicamos por 000 para obtener la penetración por cada mu casas, lo resulta 2.5 sesiones por cada mu familias. mil familias. cómo se calcula la penetraciOn, las mejores preguntas son, qué Después de definir cOmo se calcula la penetración, las mejores preguntas son, ¿qué tan grande es nuestro mercado y cuál es una "buena" proporción de penetración de mercado? Para la primera parte Para primera de esta pregunta, los expertos opinan que las familias que actualmente requieren de nuestros servicios las famiiias que actualmente requieren de nuestros servicios varían entre un 3 y un 15%. Seamos conservadores y elijamos ci 5% de las familias como ci grupo actual un conservadores y elijamos el 5% familias como el grupo actual varlan de familias que necesitan nuestra ayuda. 82 Fuentes de datos Capítulo 3 CapItulo Usando el ejemplo de las sesiones de consultoría, esto significarla que de las 400000 familias en consultorla, 400 000 significaría área consultoría de inmediato. Para cubrir la demanda actual, nuestra area de servicio, 20 000 necesitan de consultorIa de inmediato. Para cubrir la demanda actual, requeriría proporción de penetración de mercado de 50.0, contra nuestra proporción de 2.5 se requerirIa de una proporción de penetración de mercado de 50.0, contra nuestra proporción de 2.5 sesiones por cada mil casas. Nuestra actividad de 2.5 sería de alrededor del 5% lo necesitaríamos sesiones por cada mu casas. Nuestra actividad de 2.5 serIa de airededor del 5% de to que necesitarIamos para cubrir a todos los que necesitan ayuda. los que necesitan ayuda. A nivel nacional, hay 92 millones de familias en nuestra área de servicio, de las cuales 4.6 millones hay area servicio, las cuales 4.6 millones inmediata. Realizamos cerca de 600 000 sesiones de consultoria necesitan ayuda inmediata. Realizarnos cerca de 600000 sesiones de consultoría o cerca del 13% de dcl los que tenemos ese grupo necesitado. Es obvio que tenernos por delante mucho trabajo si queremos atender a los que Es necesario que avancemos intentando lograr tasas de penetración de 50 por cada mil lo necesitan. Es necesario que avancernos intentando lograr tasas de penetración de 50 por cada mu familias queremos farnilias si querernos ser una asociación de servicio completo de costa a costa. Recuerde que aquellos a los que no atendemos son los principales candidatos para Ia quiebra, que no atendemos son los principales candidatos para la quiebra, Recuerde ser atendidos por otros servicios de consultoría lucrativos, por clínicas sin escrúpulos de para ser atendidos por otros servicios de consultorla no lucrativos, o por clinicas sin escrüpulos de "reparación de créditos". Si trabajamos en conjunto en coordinado, podemos estar "reparación de créditos". Si trabajamos en conjunto en un esfuerzo nacional coordinado, podemos eStar seguros de que vivimos para cumplir nuestra misión de ser un "servicio" para los necesitados. ser "servicio" para los necesitados. TAREA l. Enliste las fuentes primarias de datos necesarios para desarrollar un análisis de mercado. Explique Enliste la utilidad de cada fuente primaria. 2. Enliste las fuentes secundarias de datos necesarios para desarrollar un análisis de mercado. fuentes secundarias datos necesarios para desarrollar un análisis de mercado. Enliste Explique Ia utilidad de cada fuente secundaria. la 3. Escriba un mernorando para Mary que evali'ie el enfoque utilizado por la Fundación para evalúe ci enfoque utilizado por la Fundación para Escriba un memorando para Marv determinar la penetración en ci mercado. el CASO DE ESTUDIO 3.5 ESTUDIO 3.5 ESTUDIO DE FACTIBILIDAD DE MERCADO ESTUDIO DE DE compañía local La McMillian Development Corporation solicitó a una compaflIa local de investigación que realizara un estudio de factibilidad de mercado, para determinar los factores de mercado que afectarían el éxito factores de mercado que afectarian el éxito de un club atlético en el centro comercial de Northwood en Peyton, Wisconsin. La investigación abarca cornercial de Northwood en Peyton, Wisconsin. investigación el demográficos, et análisis de datos dernográficos, datos sobre flujo de tráfico, imagen percibida de los competidores y área potencial de crecimiento. concluirse Mark Craze, analista investigador de la compañía area potencial de crecirniento. Al concluirse el estudio, Mark Craze, analista investigador de Ia companIa preparó el siguiente inforn1e. de investigación, preparó el siguiente informe. OBJETIVOS de este estudio consisten en determinar: Los objetivos de este estudio consisten en determinar: Si la población (en especial entre 18 y 54 años) del area de Northwood es lo suficientemente 18 54 años) del área de Northwood es 10 suficientemente Si grande grande para aportar un ni:irnero satisfactorio de miembros para el nuevo club. número satisfactorio de miembros para el nuevo club. Si los residente1 del área están interesados en afiliarse a un club atlético. residente~ del area están interesados en afiliarse atlético. Si los residente del area pueden cubrir Ia afiliación al club atlético propuesto. residenteS del área cubrir la afiliación al club atlético propuesto. Si un club atlético con una atmósfera moderna tiene el potencial de atraer socios de las Si un club atlético con una atmósfera moderna tiene el potencial de atraer SOCIOS de las membresías de los ciubes existentes. clubes existentes. membresias Capítulo 3 Capitulo Caso de estudio 83 METODOLOGÍA METODOLOGfA metodologías para realizar este estudio son Las metodologIas utilizadas para realizar este estudio son Un análisis de información demográfica para el area principal de mercado de Northwood, información demográfica para ci área principal mercado Northwood, Un análisis incluyendo una investigación sobre crecimiento potencial. incluyendo Una comparación estadística de los datos demográficos del área principal de mercado de Una comparación estadIstica de los datos demográficos del area principal de mercado de Northwood con el area principal de mercado del Westwood Athletic Club de Cadott, mercado del Westwood Athletic Club Cadott, Northwood con ci área principal Wisconsin. Un análisis del flujo de tráfico en el area de Northwood, utilizando fuentes secundarias de análisis flujo de tráfico en el área de Northwood, utilizando fuentes secundarias de entrevistas personales. investigación y entrevistas personales. Investigación de Ia imagen percibida los competidores del área, mediante entrevistas Investigación de la imagen percibida de los competidores del area, mediante entrevistas personales con afihiados a Ia competencia. afiliados la Un análisis del sitio propuesto a través de una observación personal. través una observación personal. ANÁLISIS ANALISIS La ubicación El desarrollo propuesto se pretende ubicar en una superficie de 3 600 metros cuadrados en la parte desarrollo propuesto pretende ubicar en superficie de metros cuadrados se West Salnave Road al norte de suroeste del centro comercial de Northwood, mismo que se localiza en West Salnave Road al norte de límites los ilmites de la ciudad de Peyton, hacia el oeste de Main Street y ocupa casi una cuadra a través de ci oeste Main Street y ocupa casi una través Salnave Road desde la Northwest. Sainave Road desde La secundaria Northwest. El centro comercial de Northwood aproximadamente Accesibilidad. El centro comercial de Northwood está aproximadamente a 1.6 kilómetros de Main la la ciudad de Peyton usada con más frecuencia en dirección norte-sur. La Street, que es Ia arteria de Ia ciudad de Peyton usada con más frecuencia en dirección norte-sur. La a Peyton. mayoría de Ia población que vive al norte del centro, pasa cerca de Northwest en sus viajes a Peyton. mayorIa la fácil acceso para También, el centro comercial está bordeado por Walnut Street, que proporciona un fácii acceso para ci al los residentes que viven a! sur y suroeste. circundante. El centro comercial de Northwood consta de aproximadamente 11 200 metros Medio circundante. El centro comercial de Northwood consta de aproximadamente 11 200 metros cuadrados de espacio rentable, que actualmente ocupan 27 arrendatarios. Hay espacios disponibles para más de 900 automóviles. El centro se encuentra ubicado en un vecindario suburbano de gran afluencia al norte de la ciudad de vecindario suburbano de gran afluencia al norte de la ciudad de Peyton. sitio de compras disponible más cercano al vecindario está aproximadamente a cinco Peyton. El sitio de compras disponible más cercano al vecindario está aproximadamente a cinco kilómetros al sur de la calle Main o a 15 minutos al norte del centro de Dayton, Wisconsin. 15 minutos del de Dayton, Wisconsin. Desarrollo del área. Todo indica que continuará un patrón continuo de crecimiento norte de La ciudad Desarrollo del area. Todo indica que continuará un patron continuo de crecimiento alal norte de la ciudad edificios de la de Peyton. Se construyeron edificios de oficinas a lo largo de Ia calle Nlair. y el desarrollo de negocios Mair. y ci desarrollo a to largo de esta arteria principal norte-sur, continúa desplazánJose hacia el norte. Un inforine de lo largo de esta arteria principal norte-sur, continua desplazándose hacia ci forte. Un infol1ne investigación sobre bienes ralces en ci condado de Peyton, efectuado en ci otoño de 1993, indica lo investigaciOnsobre bienes raíces en el condado de Peyton, efectua::io en el otoño de 1993, indica lo siguiente: l. El número de registros de hipotecas en el Condado de Peyton en el segundo y tercer trimestre de nümero ci ci segundo y tercer trimestre de 1992. 1993, aumentó sustanciaimente con respecto al mismo periodo de 1992. sustancialmente 2. El número de nuevos lotes fue alto, tanto en la parte noroeste del condado como en Ia ciudad de la rn'imero de nuevos lotes fue alto, tanto en la parte noroeste del 1992 1993. Peyton en 1992 y 1993. 84 Fuentes de datos Capítulo 3 Cap Itulo 3 3. En 1993 se registraron un gran nUmero de unidades de condominios en la parte noreste del 1993 se registraron un gran número condominios en parte noreste del condado de Peyton. 4. Datos recientes muestran que el número de ventas de residencias en el condado de Peyton se muestran que el nümero de ventas de residencias en el condado de Peyton se incrementó en los dos últimostrimestres y que parece aumentar el precio promedio de venta en incrementó en los dos ltimos trimestres y que parece aumentar yenta en el tercer trimestre de 1993. 5. El desempleo en el condado de Peyton está disminuyendo sustancialmente. el condado de Peyton está disminuyendo sustancialmente. Flujo del tráfico. El flujo del tráfico en el área de Northwood parece correr, por to general, de norte lo de del area a sur. Una encuesta de comercialización realizada por estudiantes de mercadotecnia de Ia Universidad de comercialización realizada por estudiantes de mercadotecnia de la Universidad Whitewater, en Whitewater, en el centro comercial de Northwood, mostró que la mayoría de los clientes viene a comprar mayoria los clientes viene a comprar Safeway, Giant-T otros acuden a realizar actividades específicas. La mayoría de los a Safeway, algunos a Giant-T y otros acuden a realizar actividades especIficas. La mayorIa de los compradores proviene de las cercanías compradores proviene de las cercanIas y acude más por comodidad que por preferencia de alguna tienda. por comodidad que por preferencia de alguna tienda. la prefiere viajar al sur, hacia el centro de Peyton, para cubrir sus necesidades de Es evidente que la gente prefiere viajar al sur, hacia ci centro de Peyton, para cubrir sus necesidades de compras mayores. La competencia Northtown Racquet Club. Este club se ubica a un kilómetro y medio de la calle Metro sobre Ia calle la Main. tenis, cuatro de raquetball y una piscina exterior, un Main. Las instalaciones tienen seis canchas de tenis, cuatro de raquetball y una piscina exterior, un salón, un jacuzzi. El club tiene planeado para el próximo año convertir una de salon, saunas, un gimnasio y unjacuzzi. El club tiene planeado para el próximo afio convertir una de las canchas de tenis en una piscina cubierta. Tiene alrededor de 1 000 socios, 900 de los cuales provienen tenis en una piscina cubierta. alrededor 1 000 socios, 900 de los cuales provienen del área de mercado de Northwood. La cuota familiar inicial para elel club de tenis es de 300 dólares·, area mercado de Northwood. La cuota familiar inicial para club de tenis es de 300 dólares*, con cuotas mensuales de $30 dólares y una tarifa de 3 dólares por hora de uso de las canchas. La cuota individual inicial es de 200 dólares, con cuotas mensuales de 25 dólares y Ia misma tarifa de 3 dólares es 200 dólares, con cuotas mensuales de 25 dólares y la misma tarifa de 3 dólares de uso de las canchas. Aunque está establecida la tarifa hora de uso de las canchas, por hora de uso de las canchas. Aunque está establecida Ia tarifa por hora de uso de las canchas, entrevistas indican que bajado. Las ventajas desvcntajas de entrevistas con socios del club indican que las tarifas han bajado. Las ventajas y desventajas de este del club son las siguientes: Ventaj as Ventajas 1. El club está bien establecido y tiene una buena reputación por su tenis. una buena reputación por su tenis. 2. Está convenientemente ubicado en una arteria principal. ubicado en una arteria principal. 3. Hay gran disponibilidad de las canchas durante ci dia. las canchas durante el dia. Desventaj as Desventajas 1. El area de estacionamiento es inadecuada. área es inadecuada. 2. Tiene fama de estar ma! administrado. estar mal 3. El club posee una atmósfera agradable, aunque no particularmente atractiva para farnilias o club posee una atmósfera agradable, aunque no particularmente atractiva para fan1ilias o individuos de altos ingresos. Eagles Lodge. Este club está ubicado a tres cuadras al este de Ia calle Main, sobre la calle Metro. Las la instalaciones incluyen cinco canchas de raquetball, una piscina cubierta de 8 por 15 metros, salOn, un salón, un sauna, un jacuzzi y gimnasios para hombres y mujeres. El club tiene 10 800 socios varones, de los hombres mujeres. 10 varones, sauna, un jacuzzi gimnasios * Las cantidades anotadas en esta obra estári dadas en dólares de EUA y son ilustrativos. (N. del T.) '" Las cantidades anotadas en esta obra están dólares EVA y son ilustrativos. (N. del T.) Capítulo 3 CapItulo Caso de estudlo estudio 85 cuales, entre S 000 Y6 000 provienen del área norte de Peyton. Se estima que de estos socios entre 5 y 6 000 del area norte de Peyton. Se estima que de estos socios entre Y3 sao provienen del área de mercado de Northwood. mayoría las 2 000 y 3 500 provienen del area de mercado de Northwood. La mayorIa de la gente proviene de las áreas del censo, al este de la calle Main. Las cuotas de membresía son de 40 dólares al año y la tarifa areas del censo, al este de la calle Main. Las cuotas de membresla son de 40 dólares al afio y la tarifa para las canchas de raquetball es de 2 dólares por hora. Ventajas Ventaj as 1. El club está bien establecido y posee la reputación de ser el más grande de Ia cadena a nivel está bien establecido posee la reputación ser el más grande de la cadena a nivel nacional. 2. Tiene una ubicación conveniente sobre una arteria principal. ubicación conveniente sobre una arteria principal. 3. Proporciona instalaciones tanto sociales como de salud. instalaciones tanto sociales como de salud. 4. Es en extrerno económico. extremo S. Hay gran disponibilidad de las canchas durante el dia. disponibilidad de las durante el dia. Desventajas Desventaj as 1. Debido a lo económico de sus cuotas tiende a tener miembros de grupos de ingresos menores. de sus cuotas tiende a tener miembros de grupos de ingresos menores. 2. La atmósfera del club es agradable, pero no especialmente atractiva para familias o individuos familias y altos. de ingresos medios y altos. 3. En ocasiones, las instalaciones están demasiado concurridas por la tarde. están concurridas por la tarde. que podrIa afectar potencialmente esta situación Whitewater University Whitewater University Aquatic Center. Otro factor que podría afectar potencialmente esta situación es el centro acuático de la Universidad Whitewater. La primera etapa (piscina cubierta), estará concluida Ia Universidad Whitewater. La primera etapa (piscina cubierta), estará concluida y abrirá al püblico en el otoflo. Las etapas subsecuentes comprenden raquetball, gimnasio para damas, público otoño. damas, etapas etc. instalaciones no serán lujosas pero sí mejores que las de Eagles Lodge y es probable que etc. Las instalaciones no serán lujosas pero si mej oresque las de Eagles Lodge y es probable que las compitan con las de Northtown. Resumen de entrevistas con socios de Ia competencia. Los entrevistadores consideraron que el de entrevistas con socios de la competencia. Los entrevistadores consideraron mercado real está constituido por profesionales y empresarios. Indicaron que las instalaciones de constituido profesionales y empresarios. Indicaron que las instalaciones de mercado real Northtown estaban diseñadas en un nivel medio. Consideraron que el Northtown estaban diseñadas en un nivel medio. Consideraron que el Peyton Club tenIa mejores tenía mejores instalaciones. Las instalaciones de Eagles Lodge se consideraron de nivel bajo, orientadas a un segmento instalaciones consideraron nivel bajo, orientadas un segmento de menor ingreso de la población. Se opinó que si se ubicaban las instalaciones en la parte forte, ingreso población. opinó que ubicaban instalaciones en norte, probablemente solo atenderIan a gente de los alrededores del centro comercial y que esto constituirla sólo atenderían centro comercial y que esto constituiría una base de población inadecuada. inadecuada. Datos demográficos El área principal de mercado propuesta para el club atlético comprende las zonas del censo 103.01, 103.0 1,area 103.02, 105.01, 105.02, 106, 107, 108, 109, 110, 111, 112.01 y 112.O2ylazona8,queestádentro 103.02, 1OS.OI, 10S.02, 106, 107, 108, 109, 110, 111, 112.01 y 112.02 y la zona 8, que está dentro de los límites de la ciudad de Peyton. En la tabla 3.1 se presenta la población reportada en el Censo lImites de Ia ciudad de Peyton. En Ia tabla 3.1 se presenta la población reportada en el Censo de 1990 para cada zona del censo. Aproxirnadamente el 30% de la población del area principal de Aproximadamente área Ia población mercado vive al norte de Northwood. Un total de S 337 personas o el 11 % de la población vive en mercado vive a! forte de 5 337 personas o el 11% de la población vive en el area de Northwood (zona 105.01). El 59% restante de Ia población vive a! sur o a! sureste del IOS.01). S9% la al al del el área area área de Northwood. 86 TABLA 3.1 TABLA 3.1 POBLACiÓN EN ÁREA POBLACION EN EL AREA PRINCIPAL DE MERCADO MERCADO CENSO ZONA DEL CENSO 103.01 103.02 103.02 105.01 105.02 105.02 106 106 107 107 108 108 109 109 110 111 III 112.01 112.01 112.02 112.02 Zona 8 Total Fuentes de datos Cap Itulo 3 Capítulo POBLACION POBLACIÓN 2,568 6,742 5,337 4,830 4,104 804 3,815 1,141 4,129 4,848 2,465 2,966 5,139 48,888 En la tabla 3.2, se presenta un resunien de los datos demográficos del area principal de mercado. resumen del área principal de mercado. niuestran que el 64.5% Los datos muestran que el 64.5% de las personas empleadas son trabajadores de oficina. Una cuarta personas empleadas son trabajadores de oficina. Una cuarta las personas empleadas se clasificaron como directivos o profesionales. Casi el parte de las personas empleadas se clasificaron corno directivos o profesionales. Casi el 52% de la población tenía una edad que oscilaba entre 18 y 54 años. Más de Ia mitad de los hogares tuvieron años. la los hogares población tenla una edad que oscilaba entre 18 ingresos superiores a $2 5000. La mediana del ingreso por hogar fue de $22 689. Por último, la población superiores a $22 ültimo, Ia poblaciôn en el area de mercado se incrernentó en promedio 2% anual desde 1980, mientras que el número de área incrementó en promedio 2% anual desde 1980, mientras que el nñrncro de aproximadamente. hogares aumentó en promedio un 4% anual, aproxirnadamente. aurnentó TABLA 3.2 DEMOGRÁFICOS PARA EL AREA PRINCIPAL DEL DATOS DEMOGRAFICOS PARA EL ÁREA PRINCIPAL DEL MERCADO OBJETIVO OBJETIVO 54,999 1998 Proyección 1998 50,990 Estirnación 1993 Estimación 1993 48,888 1990 Censo 1990 38,862 1980 Censo 1980 25.8% Porcentaje de carnbio, 1980-1990 de cambio, 1980-1990 4.3% Porcentaje de carnbio, 1990-1993 de cambio, 1990-1993 31.4% 1.4% 0-17 26.5% 18-34 18-34 25.3% 3554 35-54 9.3% 55-64 7.5% 65+ 29.8 la en la población Mediana Mediana de Ia edad en Ia población total 40.7 Mediana de Ia edad en Ia población adulta Mediana la la población 5,447 Directivo/prof. 5,44 7 Tec.ladmvo. Tec./adrnvo. 4,581 Ventas 3,428 3,428 13,456 13,456 Total empleados oficina Total empleados Prod/mfra/reparación 2,091 Prodlrnfra!reparación Población Población por edad Población Ocupación Capítulo Capitulo 3 Caso de estudio (continuación) (con finuaciOn) 87 TABLA 3.2 3.2 Educación Hogares Población hogar* Ingreso por hogar* domicilio Unidades en domicilio Operadores maq. 729 Obreros/trans!etc. 1,771 Obreros/trans/etc. Total obreros Total Agrop/Forestal/Pesca Agrop/ForestallPesca Servicios Total empleados Total desempleados Fuerza total de trabajo trabajo Graduados de secundaria (solamente) Graduados Graduados universidad Mediana años cursados Proyección 1998 1998 1993 Estimación 1993 Censo 1990 1990 Censo 1980 1980 1980-1990 Porcentaje de cambio, 1980-1990 Porcentaje Porcentaje 1990-1993 Porcentaje de cambio, 1990-1993 Población hogares Hogares con menores de 18 Hogares con menores Hogares Hogares c/personas mayores de 65 65 Población familiar Población no familiar cuartos Agrupación por cuartos Tamaño promedio del hogar promedio del Tamaño proinedio de Ia familia promedio la familia Familiares familiares No familiares $ 0-$7,499 $ 7,500-$ 9,999 $ 7,500-$ 9,999 $10,000-$14,999 $15,000-$24,999 $ 15,000-$24,999 $25,000-34,999 $25,000 -34,999 $35,000-$49,999 $50,000-$74,999 $75,000+ Mediana del 1998) Mediana del ingreso por hogar (proy. 1998) Mediana del ingreso por hogar (est. 1993) Mediana del ingreso 1993) Mediana del ingreso 1990) Mediana del ingreso por hogar (censo 1990) Ingreso per capita (Censo 1990) cápita (Censo 1990) (Censo 1990) Ingreso promedio por hogar (Censo 1990) Casas Condominios Condom inios 1 unidad 2-5 unidarles unidades +5 unidades +5 Casas móviles casas Mediana del valor casas la mensual Mediana de Ia renta mensual Valor promedio condominio 4,591 279 2,529 20,855 1,706 22,561 64.0% 22.9% 12.93 18,272 16,510 15,517 10,456 48.4% 6.4% 46,242 7,436 2,543 41,790 4,452 1,040 2.98 3.34 12,512 3,005 8.9% 4.0% 7.7% 25.0% 24.2% 21.0% 6.9% 2.3% $33,207 $26,383 $22,245 $ 8,402 8,402 $25,036 17,182 1,097 $13,805 727 1,796 854 $61,536 $ 232 $ $67,711 * estimación 1993. 1993. 88 Fuentes de datos Capítulo 3 Cap Itulo la infornlación La tabla 3.3 pretende resumir Ia inforniación demográfica más relevante. La tabla 3.4 se diseñó para comparar el área principal de mercado con el area que atiende ci el area principal de mercado con el área que atiende el diseñó Westwood Athletic Club de Cadott, Wisconsin. Después de estudiar la mernbresIa de Westwood, se Cadott, estudiar membresía que alrededor del 95% de sus socios provienen de Cadott, Howard, Howard Lake o Rockford. concluyó que airededor del 95% de sus socios provienen de Cadott, Howard, Howard Lake o Rockford. ahí se compararan datos demográficos de estas áreas área principal de mercado De ahI que se compararan los datos demográficos de estas areas con el area principal de mercado objetivo. área de mercado de Northwood tiene una gran población, aproximadamente 41.4% El area de mercado de Northwood tiene una gran población, aproximadamente 41.4% más habitantes que en el area de Westwood. Tarnbién, el area de Northwood tiene 45.7% más población en el área de Westwood. También, el área de Northwood tiene 45.7% más población entre 18 y 54 años de edad. La mediana del ingreso por hogar resultó tarnbién ser 39.6% más alta en el del ingreso por hogar resultó también ser 39.6% más alta en el area área de Northwood. el Athletic Club, la fórmula Un estudio de factibilidad realizado para el Westwood Athletic Club, usó Ia siguiente formula factibilidad realizado deternlinar si área de Cadott apoyaría las nuevas instalaciones: para determinar si el area de Cadott apoyarla las nuevas instalaciones: Membresía Membresia activa (% Pob.(18-54 a?Ios Pob. del condado) Estudiantes universitarios (% Pob.(18-54 años xxPobo del condado) -- Estudiantes universitarios formula Considerando que Ia población del condado no es aplicable en Ia decisión de N0l1hwood, una fórmula la pobiación la decision de Northwood, más precisa seria: sería: Membresía activa Membresla Pobo del área de mercado (18-54 años) - Estudiantes universitarios Pob. del area de mercado (18-54 aflos) Estudiantes universitarios cuenta los valores membresía Se debe tener en cuenta que los valores de membresla activa son estimaciones estrictamente basadas mejor información. estimación para el area de mercado de Westwood se basó 1953 en la mejor información. La estimaciOnpara el área de mercado de Westwood se basó en 1953 mernbresIas para el Westwood Athletic Club y una estirnaciOn de 1 575 utilizada en 1992 para sus membresías para ci Westwood Athletic Club estimación de 575 utilizada en 1992 competidores. Es iniportante tornar en cuenta que muchas personas pudieran pe11enecer a ambos clubes pertenecer imp0l1ante tomar o que pudieran babcrsc cambiado a! Westwood Club. Por este motivo, Ia estirnaciOn para el area de haberse cambiado al Westwood Club. Por este motivo, la estimación para ci área mercado de Westwood se calcuió corno 1 953 + 1 575 -- 500 = 3 028. se calculó como 1 + 1 575 500 = 3 028. TABLA 3.3 TABLA 3.3 RESUMEN DE DATOS DEMOGRAFICOS RESUMEN DE DATOS DEMOGRÁFICOS POBLACION POBLACIÓN TOTAL 48,888 50,990 AÑO AIO 1990 1993 TOTAL HOGARES 15,517 16,510 16,510 POBLACION POBLACIÓN HOGARES 46,242 48,209 TAMAÑO TAMAO PROMEDIO PROMEDJO HOGAR 2.98 2.92 MEDIANA INGRESO POR HOGAR PORHOGAR $22,245 $26,383 TABLA 3.4 ÁREA PRINCIPAL DE MERCADO COMPARADA CON EL AREA DE MERCADO 3.4 AREA PRINCIPAL MERCADO COMPARADA CON ÁREA MERCADO DE WESTWOOD NORTHWOOD NORTH WOOD Población Población Población (18-54) Población (18-54) Hogares Familias Estudiantes universitarios Mediana del ingreso Mediana del ingreso por hogar Membresia Membresía en clubes modernos Membresía en clubes como % de población no universitaria entre población universitaria MernbresIa en clubes como 18 y 54 aflos de edad años 18 y 48,888 25,324 15,517 12,512 1,200 $22,245 3,250 13.5% WESTWOOD 28,649 13,751 11,227 7,609 1,600 $13,705 3,028 24.9% Versión estudiantil de Forecast PIus Plus VersiOn estudiantil 89 La estimación para Northwood se basa en 900 socios de Northtown, 2 500 de Eagles Lodge y Northtown, 2500 de Eagles Lodge y 100 de Peyton Club, que residen en el área de mercado. 100 de Peyton ci area niercado. CONCLUSIONES 1. La población base entre 18 y 54 años de edad en el área de mercado de Northwood pareciera ser pobiación aflos de edad en el area de mercado de Northwood pareciera ser suficientemente grande para apoyar al club atlético. 2. El gran número de directivos, profesionales y empleados de oficina pareciera ser un buen mercado pareciera ser mercado nürnero directivos, empleados para un club atlético moderno de clase aita. alta. prornedio 3. El ingreso promedio por hogar pareciera ser ser buen mercado para un club atlético moderno de clase alta. 4. El único competidor directo serla ci Northtown Racquet Club, que actualmente tiene1 000 socios. El ñnico competidordirecto sería el Racquet Club, queactualmentetiene 1 000 socios. 5. La rnayoria de las personas que compran en ci centro cornercial de Northwood proviene de los mayoría el comercial alrededores inmediatos. Se requeriría de una fuerte estrategia de mercadotecnia para ampliar el airededores inmediatos. requerirla de fuerte de ampliar el área fronteras tendría que area principal de mercado a las fronteras que se incluyen en este estudio. La gente tendrIa que estudio. viajar de ocho a trece kilómetros para participar en un club atlético moderno; no obstante, habría kiiórnetros en un club atlético moderno; no habria que venderics la idea. venderles la idca. PREGUNTAS ,Qué l. ¿Qué fuentes secundarias de datos usó Mark Craze para realizar este estudio? realizar estudio? 2. ¿Qué fuentes primarias de datos usó Mark Craze para realizar este estudio? dc Mark Craze para realizar este estudio? Que 3. ¿Qué otras fuentes de datos pudo haber utilizado para realizar esta investigación? ,Qué otras fuentes datos utiiizado 4. ¿Está usted de acuerdo con los resultados? dc los resultados? ,Está VERSIÓN ESTUDIANTIL DE FORECAST PLUS VERSION ESTUDIANTIL DE FORECAST PLUS Al final de cada capItulo, se presentará un ejempio del uso de Forecast Plus, utilizando los final capítulo, ejemplo Forecast Plus, utilizando los datos de Consumer Credit Counseling. Estos datos comprenderán el nümero de nuevos Consumer Credit Counseling. datos comprenderán número de nuevos datos atendidos por cee en el periodo de enero de 1985 a mayo de 1993. En esta sección clientes atendidos por CCC en ci periodo de enero de 1985 a mayo de 1993. En esta sección se rnostrará cómo utilizar los programas de administración de datos para establecer un programas administración de datos para establecer un se mostrará cómo utilizar archivo de datos. Los programas Los programas de adrninistración de datos se ejedutan seleccionando la opcion uno administración de datos ejecutan seleccionando opción uno (1) del menu principal de Forecast Plus. menú principal de Forecast Plus. (1) Los programas le permiten crear, modificar, transformar e imprimir archivos de datos. penniten transfonnar e implimir archivos de datos. vez reunidos los datos históricos, usted utilizará los programas de administración de Una vez reunidos los datos históricos, usted utiiizará los programas de administración de datos para introducir éstos en Ia computadora y almacenarlos en disco. De modo que es datos para introducir éstos en la computadora y almacenarlos en disco. De modo que los programas administración sean los primeros que utilice. probable que los programas de administración de datos sean los primeros que utilice. Todos los programas de adrninistración de datos se pueden ejecutar por separado programas administración de datos pueden ejecutar por separado Todos tecleando el número función el menú de administración datos: tecleando el nümero de la función deseada en el menu de adrninistración de datos: 90 Fuentes de datos Capítulo 3 Cap itulo Data file name: file name: (NONE) Data Data Management Menu * ** Menu *** l. 2. 3. 4. 5. 6. 7. 8. 9. Enter new data Enter Edit an existing data file Edit an Edit an existing labels file file Edit an Print a data file file Print a Transform a data file a data file adjustment Trading day adjustment data files Restructure/merge data files DIF format files Read/write DIF format files Change parameter table change parameter Batch editor editor Return to main menu la. 11. Which? 1: Captura de datos nuevos Programa 1: Captura de datos nuevos Después elegir Enter new data (Introducir datos nuevos), el programa le preguntará a Después de elegir Enter new data (Introducir datos nuevos), el prograrna le preguntará a qué archivo de datos desea agregarios. Para este ejemplo, liamaremos a nuestro archivo archivo de datos desea agregarlos. Para este ejemplo, llamaremos a nuestro archivo CREDIT. Teclee CREDIT. Si oprime <Ese>, la operación se anulará y el sistema regresará oprirne <Esc>, la operación se anulará y el sistema regresará menú de administración de datos. Si escribe la palabra dave FILES. mostrará al menu de adrninistración de datos. Si escribe la palabra clave FILES. se mostrará un disco. directorio del disco. Si escribe ci nombre de un archivo existente, el programa supondrá que desea agregar el el más datos al final de ese archivo. Si teclea ci nombre de un archivo nuevo, ci sistema le más final de ese archivo. teclea el nombre archivo nuevo, el sistema indicará que el archivo no existe rnediante ci mensaje: el archivo no existe mediante el mensaje: B:CREDIT does not existo The data file B:CREDIT does not exist. y le preguntará si desea crearlo mediante el mensaje: desea crearlo mediante mensaje: Do you want to create it (y/n)? it (y/n)? Do you want to L----- ~ ~ Oprima Y y <Enter> Y <Enter> archivo datos, en realidad archivos. contiene los Para cada archivo de datos, hay en realidad dos archivos. Uno contiene los datos reales el otro contiene información de etiquetado respecto a los datos. mientras que ci otro contiene inforrnación de etiquetado respecto a los datos. Por ejemplo, si crea un archivo llamado CREDIT, estará creando también un archivo de etiquetas si crea un archivo llamado CREDIT, estará creando también un archivo de etiquetas CREDIT.LBL. etiquetas siempre tienen la extensión .LBL. denominado CREDIT.LBL. Los archivos de etiquetas siempre tienen Ia extension .LBL. El nombre del archivo de datos puede contener opcionaimente la designación de la archivo datos puede contener opcionalmente la designación de El nombre unidad. El nombre sigue las mismas convenciones que en el sisterna operativo IBM DOS. unidad. las mismas convenciones el sistema operativo DOS. Versión estudiantil de Forecast PIus Forecast Plus Version 91 Un nombre Un nombre de archivo puede ser de hasta ocho caracteres; no debe haber espacios archivo puede ser de hasta ocho caracteres; no debe haber espacios intermedios. Si no se especifica la letra de la unidad, el programa utilizará la letra letra intermedios. Si no se especifica la letra de la unidad, el programa utilizará especificada en la tabla de parárnetros. La letra de la unidad se puede especificar agregando parámetros. La letra de la unidad se puedë agregando (v.gr. un prefijo al nombre del archivo (v.gr. B:). Un nombre de archivo puede también tener una extensión de urio a tres caracteres, B:CREDIT. uno tres caracteres, B:CREDIT. extension Si está creando un nuevo archivo de datos, será necesario introducir información de Si está creando archivo datos, será necesario introducir información de etiquetas, la cual se alrnacenará en el archivo .LBL. Su uso principal consiste en controlar almacenará en el archivo .LBL. etiquetas, la uso principal consiste las etiquetas en las impresiones. Ya que estamos creando un nuevo archivo de datos llamado impresiones. estarnos creando un nuevo archivo de datos liamado CREDIT nuestro disco de datos está en la unidad B:, el de etiquetas se denominará CREDIT y nuestro disco de datos está en la unidad B:, el archivo de etiquetas se denorninará la pantalla mostrará la siguiente información: B:CREDIT.LBL y la pantalla mostrará la siguiente información: *** Labels File Creation *** Labels Creating labels file B:CREDIT.LBL labels of variables: Number of variables: of labeling: Type of labeling: Starting label: label: Starting observation: observation: 1 YEAR 1 of observations between each label: Number of observations between each label: of the labels: 1 Increment of the labels: Esta es la inforrnación que se alrnacenará en el archivo .LBL. Nótese que dos de los Ésta la información almacenará en el archivo .LBL. Nótese que parámetros, etiqueta inicial (Starting labe!) y nürnero de observaciones entre cada etiqueta observaciones entre cada etiqueta parámetros, etiqueta inicial (Starting label) y número (Number olobservations between each labe!), no presentan valor por omisión. La creación (Number of observations between each label), no presentan valor omisión. de un archivo de etiquetas consiste solo en introducir Ia inforrnación para cada una de las archivo etiquetas consiste sólo en introducir la información una de las preguntas. Se pueden emplear las teclas de flecha hacia arriba y hacia abajo para mover el cursor. Si se presiona se anulará el procedimiento de registro de datos. se anulará el procedimiento de registro de datos. cursor. Si Número variables (Number variables). Este número corresponde Nómero de variables (Number of variables). Este nImero corresponde al número que habrá en el archivo de datos. valor por omisión es una variable. nñmero de variables que habrá en el archivo de datos. El valor por omisión es una variable. nuestro ejemplo, tenemos variable: número de clientes atendidos. Para nuestro ejemplo, tenernos una variable: nñmero de clientes atendidos. Tipo de etiquetas (Labeling Type). El valor por omisión de tipo de etiquetas es (Labeling Type). El valor por omisión de que maneja Forecast Plus son YEAR (año), MüNTH (mes), DAY (día) YEAR. Los tipos que maneja Forecast Plus son YEAR (año), MONTH (mes), DAY (dIa) NUMBERED (numerada). comprenderán todos requerimientos posibles y NUMBERED (numerada). Estos tipos cornprenderán todos los requerimientos posibles el se en la impresión. lo regular hay diversas opciones de etiquetado, que será ci que se use en la impresión. Por lo regular hay diversas opciones apropiadas de etiquetado para cualquier conjunto de datos dado. Por ejemplo, para los datos conjunto datos dado. ejemplo, los datos podemos escoger tres etiquetas posibles. mensuales de nuestro ejemplo, podernos escoger tres etiquetas posibles. Ya que eligiremos YEAR, queremos usar 12 observaciones entre cada etiqueta (cada observación YEAR, también queremos usar 12 observaciones entre cada etiqueta (cada observaciOn representará Si elegimos MüNTH, podríamos representará un mes). Si elegirnos MONTH, podrIarnos especificar una observación entre 92 Fuentes de datos Capítulo 3 CapItulo 3 cada etiqueta. DAY no serla una etiqueta adecuada, ya que no tenemos información diana. sería etiqueta adecuada, no tenemos infonnación diaria. NUMBERED pudiera ser una etiqueta apropiada; se podría poner el año NUMBERED pudiera ser una etiqueta apropiada; se podrIa poner el afio en el nümero inicial número 12 en el número de observaciones entre variables. y 12 en el nümero de observaciones entre variables. Etiqueta Etiqueta inicial (Starting label). Ésta sería Ia etiqueta real para el primer dato (Starting label). Esta serla la etiqueta real primer dato reunido. Ya que seleccionamos YEAR como el tipo de etiqueta, Ia etiqueta inicial podrIa reunido. seleccionamos tipo de etiqueta, la etiqueta inicial podría el año en el que se recolectaron nuestros primeros datos (v.gr., 1985). Si el ser ci año en el que se recolectaron nuestros primeros datos (v.gr., 1985). Si el tipo fuera MONTH, la etiqueta inicial podría ser del 11al 12 (v. gr., Ene. = 1, Feb. = 2, Mar. = 3, MONTH, Ia etiqueta inicial podrIa ser del al 12 (v. gr., Ene. = 1, Feb. = 2, Mar. etc.). tipo fuera la = 1, etc.). Si el tipo fuera DAY, Ia etiqueta inicial podría ser del 1 al 7 (v. gr., Dom = 1, Lun. inicial podrIa ser del 1 al 7 (v. gr., Mar. = 3, etc.). Si el tipo fuera NUMBERED, simplemente se registra el número de = 2, Mar. = 3, etc.). Si el tipo fuera NUMBERED, simplemente se registra el nümero de la etiqueta inicial. Nótese que la etiqueta inicial para los tipos MONTH y DAY contendrá etiqueta inicial para los tipos MONTH y DAY contendrá datos codificados, es decir, que no se puede registrar ENERO; en vez de ello se debe datos codificados, es decir, que no puede registrar ENERO; en ello se debe registrar el nñmero 1 para la etiqueta inicial. número 1 para la etiqueta inicial. Observación Observación inicial (Starting observation). La observación inicial se refiere a la la primera de infonnación reunida. En nuestro ejemplo, el primer punto para prirnera pieza de infornTlaciónreunida. En nuestro ejemplo, el primer punto de datos es para así l. el mes de enero, asi que usamos un 1. Si la información más antigua que pudimos encontrar pudirnos marzo de 1985, la etiqueta inicial sería 1985 y la observación inicial sería 3. fue de marzo de 1985, la etiqueta inicial serIa 1985 y la observación inicial serIa 3. Como no tenemos inforrnación para enero y febrero, nuestro conjunto de datos Corno no tenemos infonnación para enero y febrero, nuestro conjunto datos comienza marzo. cornienza con marzo. Número de observaciones entre coda etiqueta observaciones cada etiqueta NUmero of observations (Number of observations between each label). No existe valor por omisión para este nárnero, por lo que between each label). No existe valor por ornisión para este número, por lo que se tendrá valor en esta pregunta. En nuestro ejemplo, doce observaciones que asignar un valor en esta pregunta. En nuestro ejemplo, hay doce observaciones entre año. valor de 1 significa que cada etiqueta etiqueta, esto es, 12 meses cada etiqueta, esto es, 12 meses en cada año. Un valor de 1 significa que cada etiqueta representa un valor de datos valores datos etiqueta. Por representa un valor de datos y que no hay otros valores de datos entre cada etiqueta. Por ejemplo, si sus datos tienen etiqueta YEAR y especifica como el número de ejemplo, si 5US datos tienen la etiqueta YEAR y especifica 1 como ci nñmero de 1 observaciones entre etiqueta, se recolectó un elemento de infonnación observaciones entre cada etiqueta, significa que se recolectó un elernento de información cada aflo. año. etiquetas (Increment labels). incremento las Incremento de las etiquetas (Increment of the labels). El incremento de las etiquetas siempre tendrá un valor por omisión de 1, es decir, que cada vez que cambie una etiquetas siempre tendrá un valor por ornisión de 1, es decir, que cada vez que cambie una etiqueta en Ia irnpresión, se incrementará en uno. la impresión, La creación del archivo de etiquetas queda ahora de Ia siguiente manera: la siguiente of variables: Number of variables: of labeling: Type of labeling: 1 YEAR Starting label: label: 1985 1 Starting observation: 1 of observations between each label: 12 Number of observations between each label: 1 Increment of the labels: of the labels: 1 Press ENTER to accept: to accept: Press Versión estudiantil de Forecast PIus Plus VersiOn estudiantil 93 <Enter>, significa que satisfecho con etiquetas y Si presiona <Enter>, significa que está satisfecho con la información de etiquetas y ésta se alrnacenará en el archivo .LBL. Si presiona la tecla de flecha hacia arriba, podrá arriba, ésta almacenará en el archivo .LBL. Si presiona la tecla de modificar de nuevo la inforrnación. la información. Etiquetas de labels). la infonnación de Etiquetas de variables (Variable labels). Una vez concluida la inforrnación de etiquetas, se le solicitará que introduzca Ia etiqueta (LABEL), para cada una de las variables la (LABEL), para de en el archivo. Una etiqueta de variable puede tener hasta 20 caracteres de longitud y puede archivo. variable tener hasta 20 caracteres de incluir cualquier carácter del teclado, excepto la coma, incluyendo espacios, nümeros y incluir cualquier carácter dcl teclado, excepto la coma, incluyendo espacios, números caracteres especiales. Sin embargo, el primer carácter de la etiqueta de variable debe ser caracteres especiales. Sin embargo, el primer carácter de la etiqueta de variable debe trata simplemente de descripción de la variable que se incluirá en todas una letra. Se trata simplemente de una descripción de la variable que se incluirá en todas las salidas. Para nuestros ejemplos la etiqueta de la variable es: ejemplos etiqueta de la variable es: las NUMBER OF CLIENTS OF CLIENTS Después de terminar de introducir la(s) etiqueta(s) de la(s) variable(s), estará listo para introducir los datos. Dependiendo de si se trabajando con archivos de una varias introducir los datos. Dependiendo de si se está trabajando con archivos de una o varias variables, se seleccionará autornáticamente el programa apropiado de registro de datos. Para datos. automáticamente prograrna apropiado de primer registro es: nuestro ejemplo el primer registro es: Record 1: 1: 1985 (1) (1) > > < Una vez terrninada la captura de datos para la variable cliente, Ia pantalla mostrará lo tenninada captura datos para la variable cliente, la pantalla mostrará lo Una siguiente: Record Record 99: 100: 1993 (3) 1993 (3) 1993 (4) 1993 (4) 199 > > < Deberá presionar <Esc>, y el prograrna le preguntará si desea: 1. Almacenar los datos en Deberá presionar <Esc>, y programa le preguntará si desea: 1. Almacenar los datos disco, 2. regresar a la modalidad de capturaledición, o 3. Salir sin almacenar los cambios. la modalidad captura/edición, disco, 2. Salir sin almacenar los cambios. y finalmente la elección, ¿cuál?, ésta seria 1: sería 1: cuál?, Y finalmente you want to: Do you want to: l. Save the data on disk Save the data 2. Re-enter the entry/edit mode Re-enter the 3. Exit without saving the changes Exit without Which? 1 El disco de datos contiene ahora dos archivos: CREDIT y CREDIT.LBL. de datos contiene ahora dos archivos: CREDIT y CREDIT.LBL. 94 Fuentes de datos Capitulo 3 Capítulo Pronóstico mediante hojas de cálculo Pronóstico mediante hojas Esta sección le mostrará córno introducir etiquetas (encabezados y títulos), así como datos en cómo etiquetas (encabezados tItulos), asI como datos una hoja de cálculo de Lotus. Las etiquetas y datos a capturar corresponden al ejemplo 4.1. cálculo Lotus. etiquetas datos a capturar corresponden Captura de etiquetas etiquetas 1. Coloque ci apuntador de celda en Ia celda A 1y escriba VERNON' S MUSIC STORE. el apuntador la STORE. Al Yescriba VERNON'S <Enter>. Presione <Enter>. Nótese que lo que escribió aparece en la ilnea de captura del panel de control y no en en línea captura de control y no en la comienza con un Ia celda. Si cornienza con un carácter alfabético, el indicador de modalidad mostrará alfabético, el indicador de modalidad mostrará Si comienza con un número, el indicador de modalidad mostraLABEL (etiqueta). Si comienza con un nñmero, el indicador de modalidad mostra(valor). Lotus límites de flexibles que rá VALUE (valor). Lotus tiene Ilmites de celda flexibles que le permiten ingresar más el ancho de la celda. etiquetas rnás largas que el ancho de la celda. el 2. Coloque el apuntador de celda en A2 y escriba NUMBER OF VCR'S SOLD (nümero VCR'S SOLD (número <Enter>. de VCR [videocaseteras vendidas). Presione <Enter>. escriba MONTH (mes). Presione <Enter>. 3. Coloque el apuntador de celda en A4 y escriba MONTH (mes). Presione <Enter>. de en 4. Coloque el apuntador de celda en A5 y escriba JANUARY (enero). Presione <L> A5 y escriba JANUARY (enero). Presione <1> Coloque el apuntador Advierta que la tecla Advierta que la tecia de flecha hacia abajo mueve el apuntador de celda en esa dirección apuntador la tenninando a Ia siguiente celda, A6. Registre el resto de los meses terrninando con DECEMBER en la (diciembre) en ia celda A16. 5. Posicione ci apuntador de celda en la celda B4 y oprima una vez la barra espaciadora el apuntador celda la celda B4 y oprima una vez la espaciadora NUMBER (número). El espacio le centrar la etiqueta y escriba después NUMBER (nñmero). El espacio le permite centrar la etiqueta dentro de La celda. de la <L>. Continúe 6. Coloque el apuritador de celda en Ia celda 136 y escriba 123. Presione <1>. Continiie apuntador en la celda B6 y escriba capturando los hasta escribir 160 B 16. capturando los datos, hasta escribir 160 en la columna B16. La hoja de cálculo en este se ve como momento se ye corno se muestra en la fig. 3.1. 7. A continuaciOn necesitamos establecer el directorio actual con ci fin de poder grabar continuación necesitarnos estabiecer el el grabar actual archivo. Seleccione IFILE IFD. Usted seleccionó FILE del nuestro archivo. Seleccione /FILE DIRECTORY o /FD. Usted seleccionó FILE del submenú. solicitará el directorio menú plincipal DIRECTORY menu principal y DIRECTORY del subrnenü. La pantalla le solicitará ci directorio actual mediante: Enter current directory: A:! directory: A:/ del directorio por omisión A:/, indique entonces el Si el directorio actual es diferente del directorio por omisión A:!, indique entonces el directorio en el que desea almacenar el archivo. 8. Para grabar su archivo teclee /FILE/SAVE o /FS, que equivale a seleccionar FILE del /FILE/SAVE o seleccionar FILE del submenú. programa le solicitará, con siguiente menú principal y SAVE del subrnenü. El programa Ic solicitará, con el siguiente menu plincipal SAVE mensaje, ci nombre del archivo a grabar: el of file to save: A:/*.WKl Enter name of file to save: A:/*.WK1 Minitab Paquete de cómputo Minitab 95 Al: Worksheet Range Copy Insert Global Delete MENU: Graph Data System Add-In Quit Move File Move File Print Window Status Column Erase Titles Window Status Column Erase Insert Page Learn E F G 0 Add-In BCD • B C . . . VERNON'S MUSIC STORE VERNON'S 2 Of VCRS SOLO NUMBER OF VCRS SOLD 3 3 4 5 5 H A A D 6 7 8 9 10 II 11 Month January February March April May June July August September October November December Number 123 ? 12 13 14 15 16 17 18 19 20 13-Aug-91 03:02 PM 13-Aug-91 03:02 130 125 138 145 142 141 146 147 157 150 160 May 3.1 Figure 3.1 VCRl y presione <Enter> para almacenar su archivo como A:NCR1.WK1. Escriba VCRI y presione <Enter> para almacenar su archivo como A:/VCR1 .WKI. 9. Para imprimir una hoja de cálculo, seleccione (PRINT RANGE o /PR. Presione imprimir hoja de cálculo, seleccione IPRINT RANGE o /PR. Presione <Enter> para que aparezca el apuntador de rango. El rango siempre especifica un aparezca apuntador de rango. siempre <Enter> para rectángulo a imprimir, mediante las coordenadas de las celdas de las esquinas superior coordenadas superior izquierda e derecha. Cuando se le introduzca un izquierda e inferior derecha. Cuando se le pida que introduzca un rango de celdas, escriba directamente en la celda las coordenadas Al ..B16. Presione ahora <Align> directamente en A 1..B 16. Presione (alinear) para restablecer el contador de líneas. Para enviar la salida a impresión oprima restab1ecer contador ilneas. impresión la <Go>. Las opciones son PRfNTER o FILE. Si desea imprimir Ia hoja de cálculo, elija PRINTER de cálculo, PRINTER. Después de impreso un archivo, oprima Q de QUIT para salir del menú de oprirna de QUIT para salir del menu de impresión. 10. Para tenninar Ia sesión, escriba /QUIT o /Q. terminar la /Q. PAQUETE DE CÓMPUTO MINITAB PAQUETE DE COMPUTO MINITAB demostrar fácil es generar números aleatorios mediante un Se empleará Minitab para demostrar qué fácil es generar nümeros aleatorios mediante un paquete estadIstico de software. estadístico El problema. El problema. La tabla P2.7 para el problema 7 en el cap. 2, presenta una población población el 30 de 200 tamaños de farnilias y en este problema se le solicita seleccionar una muestra de 30 familias la tamaños y tamafios y probar la hipótesis de que el tamaño promedio de Ia familia no ha cambiado de 2.9 personas en los ültimos diez afios. los últimos diez años. Solución con Minitab. Solución con Minitab. Los comandos de Minitab para generar ni'imeros aleatorios de Minitab para generar números aleatorios son 96 MTB > RANDOM 30 Cl; > 30 C1; SUBC > INTEGER 1 200. > INTEGER 1 MTB > PRINT Cl > PRINT C1 C1 Cl 55 75 70 53 75 132 134 160 143 22 91 146 128 MTB > STOP > STOP Fuentes de datos Fuentes Capítulo 3 Cap Itulo 33 173 148 9 9 163 182 141 40 148 102 160 62 81 146 179 60 136 135 197 102 RANDOM los 30 nümeros aleatorios y colocarlos en • El comando RANDüM se usa para generar los 30 números aleatorios y colocarlos en e 1.Nótese que se coloca un punto y coma (;) al final de la línea para obtener un indicador Nótese que se coloca un punto y coma (;) al indicador Cl. ilnea obtener de subcomando. • El subcornando INTEGER indica que los niirneros aleatorios deberán ser enteros entre subcomando números aleatorios 200. 1 y 200. Nótese que se incluye un punto (.) al final de la lInea para indicar el fin de los línea subcornandos. subcomandos. el • El comando PRTNT se utiliza para exhibir el contenido de CI. PRINT se utiliza para el. BIBLIOGRAFíA BIBLIOGRAFIA ALRECK, P. L. Y SETTLE, R. B. The Survey ResearchHandbook. Homewood, Ill.: Richard Irwin, Inc., ALRECK, P. L. y SETTLE, R. B. The Survey ResearchHandbook. Hornewood,Ill.: Richard D. Irwin, Inc., 1985. DANIELLS, L. M. Business Forecasting for the 1980s-and Beyond. Boston; Library. Harvard DANJELLS, L. M. Business Forecasting forthe 1980s-and Beyond. Boston: Baker Library. Harvard School, 1980. Business School, 1980. DAVIDSON, T. A. Y AYERS, 1. J. "Selecting and Using External Data Sources." En Handbook of DAVIDSON, T. A. y AYERS, L. L. "Selecting and Using ExternalData Sources." En Handbook of Forecasting, S. Makridakis y S. C. Wheelwright, eds. Nueva Sons, 1982. Forecasting, S. Makridakis y S. C. Wheelwright, eds. Nueva York: John Willey & Sons, 1982. KINNEAR,T.I. C. y TAYLOR,R.Marketing Research: AnAppliedApproach. NuevaYork: McGraw-Hill, KINNEAR, C. yTAYLOR,J. J. R. Marketing Research: An Applied Approach. NuevaYork: McGraw-Hill, 1983. VICHAS, R. P.P. Complete Handbook of ProfitableMarketing Research Techniques. Englewood Cliffs, V1cHAS, R. Complete Handbook ofProfitable Marketing Research Techniques. Englewood Cliffs, N.1.: Prentice HaIl, 1982. Hall, 1982. N. J.: ZIKMUND, W. G.G. Exploring Marketing Research. NuevaYork: The Dlyden Press, 1986. ZIKMUND, W. Exploring Marketing Research. Nueva York: The Diyden ZIKMIJND,W. G. Business Research Methods, 3ra. ed. Nueva York: The ZIKMUND, W. G. Business Research Methods, 3ra. ed. Nueva York: The Dryden Press, 1991. 1991. CAPíTULO CAPITULO Exploración de los patrones Exploración los selección de datos y selección de Ia la técnica de pronóstico 4 ACTIVIDAD A CTIVIDAD La generación de un pronóstico preciso y ütil implica dos consideraciones básicas. La generación un pronóstico preciso y útil implica dos consideraciones básicas. La primera consiste en reunir datos que sean aplicables para la tarea de pronóstico y que prirnera consiste en reunir datos que sean aplicables para Ia tarea de pronóstico que contengan información que pueda producir pronósticos precisos. Esta importante tarea se contengan infonnación que pueda producir pronósticos precisos. Esta importante analiza ci segundo clave es seleccionar una técnica de pronóstico que analiza en el cap. 3. El segundo factor dave es seleccionar una técnica de pronóstico que utilice al rnáximo la infonnación contenida en los datos y los patrones que éstos presenten. máximo Ia información contenida en los datos y los patrones que presenten. El primer paso en la fonnulación de pronósticos, expuesto en cap. 1 fue la El primer paso en la formulación de pronósticos, expuesto en el cap. 1 fue Ia recolección de datos. Después de esto, el pronosticador debe revisar los intentos anteriores los intentos anteriores recolección para pronosticar Ia variable de interés. Una búsqueda de bibliografia y los comentarios con la variable interés. Una büsqueda de bibliografia y los colegas de la compañía pueden ayudar a evaluar los éxitos y/o fracasos anteriores colegas de Ia compañia pueden ayudar a evaluar los éxitos y/o fracasos anteriores de enfoques alternativos. Después de realizar la investigación inicial, el pronosticador se enfoques alternativos. Después de realizar la investigación inicial, el pronosticador se encuentra en una mejor posición para Ia reducción de datos (paso 2). la reducción encuentra Con buenos datos a Ia mann, un pronosticador puede empezar Ia importante tarea de la mano, la importante tarea explorar los patrones de datos. Este paso comprende Ia observación de los datos, la explorar los patrones de datos. Este paso comprende la observación de los datos, Ia cornprensión de lo que los datos sugieren y ci uso de varios métodos graficos obtener comprensión de lo que los datos sugieren y el uso de varios métodos gráficos para obtener una mejor vision en el proceso que generó los datos. Con frecuencia es ütil Ia elaboración visión proceso que generó los datos. Con frecuencia es útil la elaboración de una gráfica de Ia serie de tiempo de datos, si éstos se recopilaron a to largo del tiempo. la recopilaron lo largo del tiempo. La fig. 4.2 muestra un ejemplo de este tipo de gráiica. El examen de los datos conduce al fig. gráfica. examen de los datos conduce al paso 3 del proceso de pronOstico (selecciOn de una técnica de pronóstico). paso del proceso de pronóstico (selección de una técnica de pronóstico). Se pueden métodos básicos pronóstico. técnicas pronóstico Se pueden emplear dos métodos básicos de pronóstico. Las técnicas de pronóstico cualitativas se basan en el juicio humano y en Ia intuiciôn, más que en Ia manipulación de el la intuición, la cualilativas datos históricos anteriores. Las técnicas cualitativas comunes incluyen al método Delphi, técnicas cualitativas cornunes incIuyen at método Delphi, datos históricos anteriores. curvas de crecimiento, escritura de escenarios, investigación de mercado y grupos de curvas de crecimiento, escritura de escenarios, investigación de mercado grupos de enfoque. Con frecuencia, estas técnicas son importantes en el esquema general de pronóstico enfoque. frecuencia, técnicas son importantes en ci esquerna general de pronóstico y se abordan con cierto detalie en ci cap. 11. abordan detalle el 11. Las técnicas Las técnicas de pronóstico cuantitativas se utilizan cuando existen suficientes datos pronóstico utilizan cuando existen suficientes datos históricos disponibles y cuando se juzga que estos datos son representativos de un futuro estos datos son representativos de un futuro históricos disponibles y cuando desconocido. Esta apreciación es un paso importante en el proceso de pronóstico, ya que desconocido. Esta apreciación es un paso importante en el proceso de pronóstico, ya que 98 Exploración de los patrones de datos y selección de la técnica de pronóstico ExploraciOn de los patrones de datos y selección de Ia técnica de pronóstico Capítulo Capitulo 4 todas las técnicas cuantitativasse apoyan en la suposición de que el pasado puede todas técnicas cuantitativas se apoyan en la suposición de que el pasado puede extenderse hacia extenderse hacia el futuro de manera significativa para proporcionar pronósticos precisos. manera significativa para proporcionar Las técnicas cuantitativas se clasifican frecuentemente en dos categorlas: estadIsticas y técnicas cuantitativas se clasifican frecuentemente dos categorías: estadísticas y detenninísticas. determinIsticas. Las técnicas estadIsticas se enfocan completamente en patrones, cambios en los Las técnicas estadísticas se enfocan completamente en patrones, cambios en los aleatorias. perturbaciones patrones y perturbaciones causadas por influencias aleatorias. Este libro expone muchas de estas técnicas como los prornedios rnóviles y Ia atenuación exponencial (cap. 5), descompromedios móviles la atenuación exponencial (cap. estas posición de series de tiempo y proyecciones de tendencia (cap. 8) y la metodología posición de series de tiempo y proyecciones de tendencia (cap. 8) y Ia metodologla Box-Jenkins (cap. 10). BoxJenkins (cap. 10). Las técnicas estadIsticas de pronóstico emplean básicamente dos enfoques. Uno está estadísticas de pronóstico emplean básicamente dos enfoques. Uno la suposición que los datos se pueden descomponer en componentes basado en la suposición de que los datos se pueden descomponer en componentes como tendencia, ciclo, estacionalidad e irregularidad. Se realiza una predicción mediante tendencia, ciclo, estacionalidad e irregularidad. Se realiza una predicción mediante la combinación de las proyecciones de cada uno de estos componentes individuales. cornbinación de cada uno de estos componentes individuales. El segundo enfoque se asocia con las rnetodologIas de modelos econométricos de segundo enfoque se asocia con las metodologías de modelos econométricos de series tiempo Box-Jenkins. Los fundamentos teóricos se basan principalmente series de tiempo y de BoxJenkins. Los fundamentos teóricos se basan principairnente en componentes conceptos estadísticos y no los datos estén representados conceptos estadIsticos y no se supone que los datos estén representados por componentes separados. deterministicas (causales) comprenden la identificación y determinación Las técnicas determinIsticas (causales) comprenden la identificación y determinación otras variables de influencia. En estas relaciones entre valiable por pronosticar de relaciones entre la variable por pronosticar y otras variables de influencia. En estas incluyen los modelos de regresión y regresión múltiple, (caps. 6 y 7), indicadores técnicas se incluyen los modelos de regresión y regresión rntiltiple, (caps. 6 y 7), indicadores básicos (cap. modelos econométlicos (cap. 9) encuestas anticipadas modelos de básicos (cap. 8), modelos econométricos (cap. 9) y encuestas anticipadas y modelos de entrada-salida (que no se abordan en este libro). entradasalida (que no se abordan en este libro). Las dos secciones siguientes se refieren brevemente aa los elementos clave de los Las dos secciones siguientes se refieren brevemente los elernentos dave de los patrones de datos que son imp0l1antes para la comprensión de las técnicas de pronóstico patrones de dabs que son importantes para la comprensión de las técnicas de pronóstico ténnino se presentan en capítulos posteriores. que se presentan en capItulos posteriores. Se presenta en primer término una exposición de los componentes con frecuencia reconocidos explícitamente en las series de tiempo, selos componentes con frecuencia reconocidos explIcitamente en las series de tiempo, setilla introducción los elementos del análisis autocon'elación son guido de una introducción de los elementos básicos del análisis de autocorrelación que son la base de rnuchos procedimientos sofisticados de pronóstico. La siguiente sección se dedica muchos sofIsticados de pronóstico. La siguiente sección se dedica a una cuestión más importante: una vez identificados los patrones generales en los datos cuestión más importante: identificados patrones generales los datos histólicos, ¿qué técnica de pronóstico se debe elegir? El capItulo concluye con secciones pronóstico debe elegir? El capítulo concluye con secciones históricos, qué técnica sobre la medición del en-or en los pronósticos y Ia determinación de Ia suficiencia de una en-or en la detelminación la suficiencia de una sobre técnica de pronóstico. pronóstico. COMPONENTES DE SERIES DE COMPONENTES DE SERIES DE TIEMPO Como se expuso en el cap. 3, con frecuencia se realizan observaciones de datos a través Como el cap. 3, con frecuencia se realizan observaciones de datos del tiempo. Cualquier variable que conste de datos reunidos, registrados u observados sobre valiable incrementos sucesivos de tienipo se denornina serie de tiempo. tiempo se denomina serie de tiempo. Una serie de tieinpo consta de datos que se reinen, registran u observan sobre tiempo consta de datos que se reúnen, registran u observan sobre Una incrementos sucesivos incrementos sucesivos de tiempo. de series de tiempo Componentes de series de tiempo 99 inmediata consiste en intentar En el análisis de series de tiempo de datos, una tentación inmediata consiste en intentar el comportamiento inútiles, lo que explicar o contabilizar el comportarniento de las series. Para evitar esfuerzos inütiles, lo que es un enfoque sistemático series. La descomposición clásica es se necesita es un enfoque sisternático para analizar las series. La descomposición clásica es un método que se basa en la suposición de que se pueden descomponer en componentes método se basa en la suposición de que se pueden descomponer en componentes estacionalidad irregularidad. se hace mediante la como tendencia, ciclo, estacionalidad e irregularidad. Una predicción se hace mediante la combinación técnica de descompocornbinación de las proyecciones de cada componente individual. La técnica de descomposición clásica se aborda en el cap. 8. Otro enfoque, denominado análisis de autocorrelación, el cap. 8. Otro enfoque, denorninado análisis de autocorrelación, también identificar componentes y patrones técnica tarnbién se puede emplear para identificar componentes y patrones de datos. Esta técnica en secciones posteriores de este capítulo. se expone en secciones posteriores de este capitulo. Muchas variables macroeconómicas, como el Producto Nacional (PNB), el Muchas variables macroeconórnicas, como el Producto Nacional Bruto (PNB), el la producción fuerte tendencia. empleo y Ia producción industrial están dominadas por una fuerte tendencia. La tendencia dominadas selie de tiempo es el componente de largo plazo que representa el crecimiento o de una serie de tiempo es el componente de largo plazo que representa el crecimiento o sobre lID periodo amplio. fuerzas que ayudan a explicar disminución en la serie sobre un periodo amplio. Las fuerzas básicas que ayudan a explicar la tendencia de una serie son ci crecirniento de la población, la inflación de precios, el tendencia serie son el crecimiento de población, inflación de precios, los incrementos en productividad. cambio tecnológico y los incrementos en productividad. tendencia de una selie tiempo el componente de largo plazo La tendencia de una serie de tiempo es el componente de largo plazo que el crecimiento disminución en la serie sobre un periodo amplio. representa ci crecimiento o disminución en Ia serie sobre un periodo arnplio. componente cIclico es la fluctuación en fonna de alrededor tendencia, El componente cíclico es Ia fluctuación en forrna de onda airededor de la tendencia, afectada lo regular por las condiciones económicas generales. Los patrones cíclicos afectada por Jo regular por las condiciones econórnicas generales. Los patrones ciclicos en los datos aproximadamente o más años. Es común que tienden a repetirse en los datos aproxirnadarnente cada dos, tres o más afios. Es comi.in que fluctuaciones cíclicas influidas las fluctuaciones ciclicas estén influidas por cambios de expansión y contracción económicambios de expansion ca, a los que comúnmente se hace referencia como el ciclo de los negocios. los negocios. Ca, a los que cornünrnente se hace referencia como el cíclo El coniponente cíclico es la fluctuación en forma de onda alrededor de la alrededor la El componente cIclico es Ia fluctuación en forma de tendencia. El componente estacional se refiere a un patron de carnbio que se repite a sí mismo componente estacional se refiere a patrón cambio sí mismo año tras año. En el caso de las series mensuales, el componente estacional mide la aflo tras año. En el caso de las series mensuales, el componente estacional mide la variabilidad de series cada enero, febrero, En las series trimestrales hay cuatro variabilidad de las series cada enero, febrero, etc. En las series trirnestrales hay cuatro elementos estacionales, uno para cada trirnestre. La variación estacional puede reflejar variación estacional reflejar elernentos estacionales, uno para cada trimestre. clima, días festivos o la longitud de los meses calendario. condiciones de clirna, dIas festivos o Ia longitud de los meses calendario. patrón de carnbio que se repite a sj mismo año El componente estacional es un patrOn de cambio que se repite a sí mismo año componente tras año. El componente aleatorio mide la variabilidad de las series de tiempo después de que variabilidad de que El coinponente Contabiliza la variabilidad aleatoria en una serie de tiempo se retiran los otros componentes. Contabiliza Ia vanabilidad aleatoria en una serie de tiempo 100 100 Exploración de los patrones de datos y selección de la técnicade pronOstico ExploraciOn de los patrones de datos y selección Ia técrca de pronóstico Capítulo 4 Cap Itulo ocasionada por factores imprevistos y no recurrentes. La mayorIa de los componentes recurrentes. mayoría los componentes ocasionada por factores imprevistos y irregulares se conforrnan de variabilidad aleatoria. Sin embargo, ciertos sucesos a veces confonnan variabilidad aleatoria. embargo, ciertos veces impredecibles como huelgas, cambios de clima (sequlas, inundaciones o terremotos), impredecibles como hucigas, cambios de clima (sequías, inundaciones o terremotos), elecciones, conflictos annados oo la aprobación de asuntos legislativos, pueden causar elecciones, conflictos arrnados la aprobación de asuntos legislativos, pueden causar irregularidades en una variable. irregularidades El componenle aleatorio mide Ia variabilidad de las series de tiempo después componente aleatorio la variabilidad de las series después los otros componentes. de retirar los otros componentes. EXPLORACiÓN DE PATRONES DE MEDIANTE EXPLORACION DE PATRONES DE DATOS MEDIANTE ANALISIS DE AUTOCORRELACION ANÁLISIS DE AUTOCORRELACIÓN Cuando se mide una variable a través del tiempo, con frecuencia está correlacionada consigo del tiempo, con frecuencia está correlacionada consigo tma misma cuando se desfasa uno o más periodos. Esta correlación se mide mediante el misma cuando se desfasa o más periodos. Esta cOlTelación se mide mediante el coeficiente de autocorrelación. es la correlación existente entre una variable desfasada Autocorrelación Cs la correlaciOn existente entre una variable desfasada uno o la misma variable. más periodos y la misma variable. Los patrones de datos que incluyen componentes como tendencia, estacionalidad e Los patrones de datos que incluyen componentes como tendencia, estacionalidad e irregularidad se pueden estudiar usando el enfoque del análisis irregularidad se pueden estudiar usando el enfoque del análisis de autocorrelación. Los autocorrelación. Los coeficientes de autocOlTelación para diferentes desfases de tiempo de una variable coeficientes de autocolTelacion paradiferentes desfases de tiempo de una variable se emplean para identificar patrones en las series de tiempo de datos. identificar patrones en las emplean El concepto de autocorrelación se ilustra mediante los datos que se presentan en la autocorrelación se ilustra mediante los datos presentan la El concepto tabla 4.1. Nôtese que las variables 1', _1 Y Y,22son en realidad valores de Y que se han se han tabla 4.1. Nótese que las valiables l't y Y, _ son en realidad valores de Y desfasado uno y dos periodos, respectivamente. Los valores para el mes de marzo que se periodos, respectivamente. Los valores para el de marzo que se desfasado uno muestran en el renglón del periodo 3, son las ventas de marzo Y, = 125; las ventas de febrero, el renglon del penodo 3, son las ventas de marzoyr= ventas de febrero, Yti = 130; yY lasventas de enero,y,_2 = 123. Y,-l = 130; las ventas de enero, Y'-2 = 123. Comímmente se usa Ia ecuación 4.1 para Comiinrnente se usa la ecuación 4.1 para calcular el coeficiente de autocorrelación de el primer orden (r l ) o la correlación entre Y, yyY l . orden (r1) o la correlación entre Y, Y1. ,- n-! n1 I (Y r 1 - - Y)(Y,1 - Y) Y)(Y r - 1 - Y) (4.1 ) (4.1) r1 r1 I~ Exploración de patrones de datos mediante anâlisis de autocorrelaciOn análisis autocorrelación Exploraciôn 101 en donde r¡ = coeficiente de autocorrelación de primer orden = autocorrelación orden y = media de los valores de Ia serie media de los valores de la serie Y; observación periodo 1', == observación en el periodo t Y1 _ 1 = observación en un periodo anterior o en el periodo tt -- 1. = observación en un periodo anterior o en el periodo 1. La ecuación 4.2 es la formula para calcular el coeficiente de autocorrelación de orden kk (rk), la fónnula para calcular el coeficiente de autocorrelación de orden (rJ, entre observaciones separadas por kkperiodos: Y yy Y,-k. observaciones separadas por periodos: YI Ye_k. n-k I (Y I - rk rk = 1=1 - Y)(Y - I - k - Y) - Y) (4.2) en donde rk = coeficiente de autocon·elación para un desfase de k periodos coeficiente autocorrelación para un rk y = media de los valores de la serie = media los valores la serie Y; = observación en el pel;odo de tiempo t Y, = observación en el periodo \ Y;-k = observación en k periodos anteriores o en el penodo I -- k. = observación anteriores periodo t Ejemplo 4.1 Harry Vernon reunió datos sobre ci nOmero de videocaseteras (VCR's) que vendiO el año sobre el número videocaseteras (VCR's) vendió el año Harry Vemon reunió pasado para Vernon's Music Store. Los datos se presentan en la tabla 4.1. La tabla 4.2 muestra presentan en Ia tabla 4.1. La tabla 4.2 muestra al la 4.1. los cálculos que conducen a! uso de Ia ecuación 4.1. cálculos TABLA 4.1 TABLA 4.1 DATOS AUTOCORRELACIONADOS AUTOCORRELACIONADOS PERIODO, t DATOS ORIGINALES, MES Y, YDESFASADA y DESFASADA tiN PERIODO, UN PERJODO, Yt - I y DESFASADA YDESFASADA DOS PERIODOS, Y'-2 1 2 2 3 3 4 5 6 7 8 8 9 10 10 11 11 12 Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembrte Octubre Noviembre Diciembre 123 130 - - - ' 1 2 123 3 *- 123 125 130 - - - - - ' 1 2 3 130 138 125 130 125 130 145 125 138 138 142 145 145 138 141 142 142 145 146 141 141 142 147 146 146 141 157 147 147 146 150 150 157 147 160 160 157 150 102 Exploración de los patrones de datos y selecciOn de la técnica de pronóstico selección ExploraciOn de los patrones Ia técnica Capítulo 4 Capitulo TABLA 4.2 CALCULO DEL COEFICIENTE DE AUTOCORRELACION DE PRIMER ORDEN 4.2 CALCULO DEL COEFICIENTE DE AUTOCORRELACIÓN PRIMER ORDEN PARA LOS DATOS DE LA TABLA 4.1 LA TABLA 4.1 PERIODO t I 1', Y, Y,-I 1 123 123 130 125 2 2 3 3 4 4 5 6 6 7 7 8 8 5 9 10 10 II I1 12 12 Swnas Sumas 138 145 145 142 141 146 147 157 150 ISO 160 1.704 1,704 123 130 125 125 138 138 145 145 142 141 141 146 146 147 147 157 157 150 150 - (Y,- 1') Y) (YH -- Y) (Y,1 Y) -19 -12 -17 -4 3 3 0 O -19 -12 -17 - (Y, (Y, -- Y)2 (Y, - YXY, , - Y) (Y, Y)(Y, - Y) 361 361 144 289 16 16 9 0 O I 1 16 16 25 225 228 68 - 204 -4 3 3 -12 0 O 0 O ""-O 0 -1 4 5 5 15 15 8 8 18 -1 -I O 0 4 4 -4 20 75 120 144 843 843 5 5 15 15 64 8 8 -18 1,704 = 1,704 =142 - 142 324 324 1,474 1,474 Y Media Y I 12 1_I = 1,474 I =~= .572 - .572 843 El El coeficiente de autocorrelación de primer orden (r,), o Ia correlación entre Y, yyY,_1, se autocorrelación primer orden (r1), la correlación entre l'¡ l'¡-b calcula utilizando, en la ecuación 4.1, las sumas de Ia tabla 4.2. la calcula utilizando, en Ia ecuación 4.1, las sumas n-' r1 - I (Y1 (Y¡ - Y)(Yt-l - Y)(Y,1 (Y, - Y) - Y) t~1 - Y)2 1,474 = 1,474 = ~ = .572 Parece que existe alguna autocorrelación en esta serie de tiempo desfasada un periodo. La serie tiempo desfasada correlación entre Y, Y, o la autocorrelación para un desfase 1 es .572. Esto significa correlación entre Y, yyYt- b o la autocorrelación para un desfase de 1 es .572. Esto significa que las ventas sucesivas de videocaseteras están de algún modo correlacionadas una con otra. Esta videocaseteras están de algün modo correlacionadas una con otra. información puede proporcionar a Harry una valiosa vision interior de su serie de tiempo, información puede proporcionar a Harry una valiosa visión interior de su serie de tiempo, puede ayudarle a prepararse utilizar un método de predicción avanzado puede ayudarle a prepararse a utilizar un método de predicción avanzado y puede puede prevenirle del uso dcl análisis de regresión con estos datos. Esta i1tima situaciOn se prevenirle del uso del análisis de regresión con estos datos. Esta última situación se estudiará en el capitulo 9. estudiarO en el capítulo 9. coeficiente autocorrelación de segundo orden (r2), o de correlación El coeficiente de autocolTelaciOnde segundo orden (rz), o el coeficiente de correlación l'¡ Y,-z para los datos de con la ecuación 4.2 entre i'; y Y_2 para los datos de Harry, se calcula con Ia ecuación 4.2 n-2 r = r2 2 I ,~, (Y, - Y)(Yt n )(-2 Z - Y) I t= , (Y, y)2 (V, - Y)2 Exploración de patrones de datos mediante análisis de autocorrelacián autocorrelación ExploraciOn de patrones 103 682 = .463 682 = .463 1474 Parece ser que existe una autocorrelación moderada en esta serie de tiempo, desfasada dos Parece existe una autocorrelación moderada en esta serie tiempo, desfasada dos periodos. La correlación entre Yt y Y,_2,oola autocorrelación para un desfase de 2 es .463. la autocorrelación para un desfase de 2 es .463. periodos. La correlación entre Y Y Yt-2, Nótese que el coeficiente de autocorrelación en el desfase 2 (.463) es menor que el coeficiente coeficiente autocorrelación en el desfase 2 (.463) es menor que el coeficiente mismo en ambos autocorrelación en el desfasamiento 1 (.572). El denominador es de autocorrelación en el desfasarniento 1 (.572). El denoniinador es el niismo en ambos autocorrelación para cálculos; sin embargo, cuando se calcula la autocorrelaciôn para el segundo desfasamiento, se incluye un término menos el numerador. general, al incrementarse el número de incluye un término menos en ci nurnerador. En general, al incrementarse el námero de desfasamientos k, el valor de los coeficientes de autocorrelación disminuye. los coeficientes autocorrelación desfasamientos k, el Harry La fig. 4.1 muestra un correlograrna para los datos de HatTY Vernon empleados en ci fig. 4.1 correlograma para los datos el ejemplo 4.1. El correlogral71a es una ütil herramienta gráfica para exhibir autocorrelaciones 4.1. correlograina es una útil herramienta gráfica para exhibir autoconoelaciones vatios desfasamientos de una de tiempo. vertical izquierda para varios desfasarnientos de una serie de tiempo. La escala vertical en la parte izquierda muestra el número de periodos desfasados de interés. La escala la derecha muestra muestra el ni'uTlerode peliodos desfasados de interés. La escala vertical a Laderecha muestra los coeficientes de autocorrelación, las correlaciones entre Y, y Yt-lo para el número los coeficientes de autocorrelación, las correlaciones entre Yt Y Y,, para el nümero periodos desfasados que aparece a la izquierda. correspondiente de periodos desfasados que aparece a La izquierda. La escala horizontal en la parte inferior muestra el nivel posible del coeficiente de autocorrelación, -1 a +1. El inferior muestra el nivel posible del coeficiente de autocorrelación, + 1. El coeficiente de autocorrelación para un desfasarniento de tiempo en particular corresponde autoconoelación desfasamiento corresponde esta escala horizontal. Sobre el cero, a la correlograma, línea a esta escala horizontal. Sobre el cero, a La mitad del correlograma, se coloca una ilnea correlograma se usan para analizar patrones dave vertical. Los patrones en un correlograrna se usan para analizar patrones clave en los datos. concepto se demostrará en la siguiente sección. Este concepto se dernostrará en La siguiente sección. TIME LAG LAG 6 * * 1 5 4 3 2 1 1 *1 *1 1 * I * * 1 * I 1 1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1 +1 -1 O -1 0 I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I Figura 4.1 Figura 4.1 AUTOCORRELATI0N AUTOCORRELATION -0.10 -0.10 -0.03 -0.03 0.02 0.02 0.11 0 11 0.46 0.57 0.57 046 Correlograma de los datos de la tabla 4.1. tabla 4.1. Correlograma de los El correlograma es una herramienta gráfica que se emplea para exhibir las una helTamienta gráfica que se emplea para exhibir las El correlogral71a autoconoelaciones para varios desfases en una serie de tiempo. tiempo. autocorrelaciones para varios desfases Se puede usar el paquete de córnputo Minitab para calcular autocorrelaciones y Se puede usar el paquete de cómputo Minitab para calcular autocorrelaciones y correlogramas. 4.1 desarrollar correlograrnas. Los comandos de Minitab para resolver el ejemplo 4.1 son cornandos de Minitab para los siguientes: 104 Exploración de los y de la de pronóstico ExploraciOn de los patrones de datos y selección de Ia técnica de pronOstico Capítulo 4 Cap Itulo MTB MTB > SET Cl SET C1 DATA> > 123 130 125138 145 142 141 146 147 157 150 160 DATA 123 130 125 138 145 142 141 146 147 157 150 160 DATA > END DATA END > ACF Cl ACF C1 ACF of C1 ACF of Cl MTB MTB +- - - -++----+ - - -+- - - - -+- - - -+- - - -+- - - -+- - - -+- - - -+- - - -+- - --+ + +---+----+----+----+--+----+----+ xxxxxxxxxxxxxxx 0.572 XXXXXXXXXXXXXXX -1.0 -0.8 -0.6 -0.4 -0.2 1.0 0.8 0.6 0.4 0.2 0.0 0.0 0.2 0.4 0.4 0.6 0.6 0.8 0.8 1.0 1.0 1 1 2 2 3 3 4 4 0.463 0.111 0.016 -0.033 0.033 -0.102 0.102 -0.250 0.250 -0.328 0.328 -0.466 0.466 -0.250 0.250 -0.232 0.232 XXXXXXXXXXXXX XXXXXXXXXXXXX XXXX XXXX X x 5 5 6 7 7 8 9 10 11 XX xx XXXX XXXXXXX XXXXXXX XXXXXXXXX xxxxxxxxx XXXXXXXXXXXXX XXXXXXXXXXXXX XXXXXXX XXXXXXX XXXXXXX xxxxxxx MTB MTB > STOP > STOP • El cornando SET se usa para almacenar los datos en C l. comando almacenar los datos en Cl. • El comando END se emplea para indicar el fin de Ia captura de datos. la datos. • El comando ACF se utiliza para calcular coeficientes de autocorrelación para los datos en C 1. el. Nótese que correlograma de Minitab es diferente al de fig. La escala de Nótese que el correlograma de Minitab es diferente al de la fig. 4.1. La escala de autocorrelación se muestra en la parte superior de la gráfica en lugar de en la parte inferior. lugar de en la parte inferior. número sus coeficientes de autocorrelación, ambos aparecen a la izquierda. El niimero de desfases y sus coefIcientes de autocorrelación, ambos aparecen a la izquierda. Con esta gráfica, se pueden estudiar los patrones de datos, incluyendo tendencia, estaciográfica, se pueden estudiar los patrones de datos, incluyendo tendencia, estacionalidad e irregularidad, mediante el enfoque del análisis de autocorrelación. Los coeficientes de autocorrelación para diferentes periodos desfasados de una variable se pueden utilizar autocorrelación para diferentes periodos desfasados de se pueden utilizar en una serie de tiempo de datos para identificar lo siguiente: tiempo de datos para identificar lo siguiente: en l. ¿Los datos son aleatorios? Los 2. ¿Los datos tienen una tendencia (no estacionaria)? Los 3. ¿Los datos son estacionarios? ,Los 4. ¿Los datos son estacionales? ,Los Si serie es aleatoria, la correlación entre Yr y Y,... 1 es cercana a cero los valores Si una serie es aleatoria, la correlación entre Y, y Y,1 es cercana a cero y los valores la serie de tiempo no guardan relación entre sí. sucesivos de la serie de tiempo no guardan relación entre Si. típico Si una serie tiene una tendencia, Y. y Y,1 están altamente correlacionados y es tIpico tiene una tendencia, Yr Yr-I están altamente correlacionados y Si de autocorrelación sean diferentes de cero de manera significativa que los coeficientes de autocorrelación sean diferentes de cero de manera signif'icativa para varios los primeros periodos de desfasamiento caigan gradualmente hacia cero varios de los primeros periodos de desfasarniento y caigan gradualmente hacia cero al Exploración de patrones de datos mediante análisis de autocorrelaciOn patrones de datos mediante análisis de autocorrelación 105 incrementarse el número de periodos. El coeficiente de autocorrelación para el periodo de incrementarse el nijmero de periodos. El coeficiente de autocorrelación para el periodo de desfase 1 es por lo regular muy grande (cercano al). El coeficiente de autocorrelación para a 1). coeficiente de periodo de desfasamiento 2 será también grande. Sin embargo, no será tanto como el periodo de des fasamiento 2 será también grande. Sin embargo, no lo será tanto como periodo desfasamiento 1, ténnino menos para el periodo de desfasarniento 1, ya que se emplea un término menos para calcular su que numerador. nurnerador. Si una serie tiene un patron estacional, se presentará un coeficiente de autocorrelación patrón de autocorrelación significativo en el periodo de desfasarniento correspondiente: cuatro en los datos trimestraperiodo de desfasamiento correspondiente: cuatro en los datos trimestrales o doce en los datos mensuales. los datos mensuales. les La tabla 4.3 muestra una serie de tiempo de 30 nürneros aleatorios de tres dIgitos, muestra serie de tiempo de 30 números aleatorios tres dígitos, seleccionados de una tabla de nümeros aleatorios. La fig. 4.2 muestra una gráfica de la serie números la serie tiempo de datos. En teoría, las autocorrelaciones calculadas datos deberían de tiempo de datos. En teorla, las autocorrelaciones calculadas para estos datos deberlan luego, los valores de la tabla 4.3 solo conjunto ser iguales a cero. Desde luego, los 30 valores de la tabla 4.3 sólo son un conjunto de un número tamaño 30. gran nümero de posibles muestras de tarnaño 30. Cada muestra producirá autocorrelaciones mayoría producirá coeficientes diferentes. La rnayorIa de estas muestras producirã coefIcientes de autocorrelación cercanos a cero. No obstante, es posible que solo por azar, una muestra produzca un coeficiente de obstante, posible sólo lma coeficiente autocOlTelación diferente autocolTelacion significativamente di ferente de cero. ¿Qué hace un analista para determinar si un coeficiente de autocorrelación es ,Qué hace un analista para determinar si un coeficiente de autocorrelación es la Teóricamente, significativamente diferente de cero, para los datos de Ia tabla 4.3? Teóricarnente, se podría podrIa desarrollar una distribución muestral de coeficientes autocorrelación, tomando desarrollar una distribución muestral de coelicientes de autocorrelación, tomando un número muestras de 30 números aleatorios. nñmero infinito de muestras de 30 nñmeros aleatorios. Quenouille l y otros han demostrado que los coeficientes de autocorrelación de datos demostrado que coeficientes de autocorrelación de datos Q uenouille y aleatOlios aleatorios tienen una distribución que se E,!lede aproximar a una curva normal con una media puede a una curva normal con una media desviación estándar de 1i'In. Sabiendo lo anterior, el analista puede comparar de cero y una desviaciOn estándar de INn. Sabiendo lo anterior, el analista puede comparar autocorrelación muestra con esta distribución teórica de muestreo los coeficientes de autocorrelación de la muestra con esta distribución teórica de muestreo detenninar datos provienen periodos y determinar si los datos provienen de una población cuya media sea cero en periodos de particular. desfase en particular. TABLA 4.3 4.3 PERIODO t DE TIEMPO CON 30 NÚMEROS ALEATORIOS SERIE DE TIEMPO CON 30 NILJMEROS ALEATORIOS SELECCIONADOS PERIODO Y Yr, t 11 11 PERIODO Y Yr, t Y Yr, 1 1 2 2 3 3 4 5 5 6 6 7 8 9 10 646 477 560 12 12 13 13 14 15 16 16 17 17 Ig 18 19 20 6g8 688 892 386 386 747 533 127 54 707 709 39 164 30 708 379 458 590 766 21 22 23 24 25 26 27 28 29 30 173 145 674 533 67 296 838 242 717 196 1 M.H. Quenouille, "The Joint Distribution of Serial Correlation Coefficients", Annuals of Mathematical Joint Distribution of Serial Correlation 01 Mathematical 20 (1949), pp 561-571. Statistics, Vol. 20 (1949), pp 561-571. 106 Exploración de los patrones de datos y selecciOn do Ia técnica de pronOstico Exporación de los patrones de datos y selección de la pronóstico Capítulo 4 Cap itulo 900 900 800 700 - o 0 .¡:; 0 e; 500 " 0 400 e E 300 ''"" o 0 600 '" ." z Z 200 200 100 100 0 I I I I I! 15 IS Periodo Periodo I 5 5 10 10 20 25 30 Figura 4.2 4.2 GrMica de una serie aleatoria. Gráfica serie aleatoria. fonna En realidad, los coeficientes de autocorrelación se pueden probar en forina simultánea para todos periodos desfase. para todos los periodos de desfase. Si Ia serie es en efecto aleatoria, Ia mayorIa de los la serie es en efecto aleatoria, la mayoría de los un nivel especificado por O, más o coeficientes de autocorrelación debe ubicarse dentro de un nivel especificado por 0, rnas o menos número de errores estindar. específico confianza, menos un cierto niirnero de errores estándar. A un nivel especIlico de confianza, se puede puede considerar aleatoria una muestra los coeficientres de autocorrelación calculados considerar aleatoria una muestra si los coeficientres de autocorrelación calculados se encuentran todos dentro del intervalo producido por Ia ecuación 4.3. intervalo la ecuación 4.3. encuentran todos 1 0±Z O±Z en donde -v;; (4.3) Z = valor normal estándar para un nivel de confianza dado = nonnal un nivel de confianza dado n = nirnero de observaciones en La serie de datos n = número de observaciones en la serie Este procedimiento se ilustra en el ejemplo 4.2. procedirniento se ilustra en ci 4.2. Ejemplo Ej emplo 4.2 Se desarrolla una prueba de hipótesis para determinar si la serie presentada en la tabla 4.3 es prueba de hipótesis para determinar si Ia serie presentada en Ia tabla 4.3 es desarrolla aleatoria. Las hipótesis nula y alterna para probar silos coeficientes de autocorrelación para aleatoria. Las hipótesis nula y alterna para probar si loscoeficientes de autocorrelación para pal1icular son diferentes de cero de manera significativa son un periodo de desfase en particular son diferentes de cero de manera significativa son H o: = O H0: PPk° k H: Pk° H¡: P '* O k Ya que para esta serie aleatoria n = 30, el error estándar (desviaciónestándar de Ia distribución serie aleatoria n = 30, el error estándadesviación estándar de la distribución muestral coeficentes de autocorrelación), es i/'f 30 = .18. Si se prueba la hipótesis nula muestral de los coeficentes de autocorrelación), es 1/-{30 = .18. Si se prueba la hipótesis nula patrones de datos mediante análisis de autocorrelación Exploración de patrones de datos mediante análisis de autocorrelaciôn 107 al nivel de significancia de .05, el valor correcto normal estándar z es 1.96 y el valor crItico nivel de significancia .05, el valor correcto normal estándar es 1.96 y el valor crítico 1.96(.18) = .353. La regla de decisión es: es 1.96(.18) = .353. La regla de decision es: Si un coeficiente de autocorre1ación es menor que -.353 o mayor que .353, rechazar Ia hipótesis .353, la Si un coeficiente de autocorrelación es menor que .353 o mayor nula, en caso contrario, no rechazarla (rechazar H0 si rk < -.353 o rk > .353). caso contrario, no rechazarla (rechazar H o si r .353 0 rk> Los coeficientes de autocorrelación de los datos de la tabla 4.3 aparecen graficados en el 4.3 graficados en autocorrelación de los datos de la fig. líneas límites correlograma de la fig. 4.3. Las dos Ilneas de puntos paralelas al eje vertical son los lImites de paralelas al vertical confianza de 95% (.353 .353). Se verifican 15 periodos de desfase y todos los coeficientes confianza de 95% (-.353yY .353).Se verifican 15 periodos de desfase y todos los coeficientes autocorrelación se ubican dentro de límites. El analista concluye que serie es de autocorrelación se ubican dentro de estos lImites. El analista concluye que esta serie es que se generó mediante un proceso aleatorio. aleatoria, es decir, que se generó mediante un proceso aleatorio. emplear paquete de cómputo Minitab para resolver el ejemplo 4.2. También se puede emplear el paquete de cómputo Minitab para resolver el ejemplo 4.2. comandos Los cornandos de Minitab son: MTB > RANDOM 30 Cl; > 30 C1; SUBC> INTEGER 1 SUBC> INTEGER 1 999. > PRINT C1 MTB > PRINT Cl C1 Cl 646 709 674 477 39 533 560 164 67 688 30 296 892 708 838 386 379 242 747 458 717 533 590 196 127 766 54 173 707 145 MTB > ACE Cl > ACF C1 ACE of Cl ACF of C1 ~1.0 -0.8 -0.6 0.4 0.2 1.0 0.8 0.6 -0.4 ~0.2 0.2 0.4 0.6 0.8 1.0 0.0 0.2 +- - - - -+- - - - -+- - - - -+- - - - -+- - - -+- - - -+- - -+- - - -+- - - -+- - --+ + + + + + + + + XX xx + 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 11 12 13 14 14 15 MTB 027 0.027 ~0.217 0.217 -0.018 0.018 -0.284 0.284 -0.116 0.116 -0.156 0.156 ~O. XXXXXX X XXXXXXXX XXXX XXXXX 0.083 0.016 -0.070 0.070 -0.311 0.311 0.117 0.101 0.032 ~0.312 xxx XXX X xxx XXX XXXXXXXXX XXXX XXXX XX XXXXXXXXX XXXXXX 0.312 0.219 > STOP La serie se puede considerar aleatoria al nivel de confianza del 95%, ya que todos los serie se puede considerar aleatoria al nivel confianza 95%, ya que todos los coeficientes de autocorrelación calculados se encuentran entre el intervalo producido por la coeficientes de autocorrelación calculados se encuentran entre el intervalo producido por Ia ecuación 4.3 (.353 > r< .353). ecuación4.3 (-.353 > rk <.353). 10S 108 Exploración de datos y selección de la técnica de pronóstico ExploraciOn de los patrones de datos y selecciOn de Ia técnica de pronOstico Capítulo 4 CapItulo T1ME LAG TIME LAG 15 14 13 12 11 10 9 9 I 1 * * I 1 8 8 7 7 6 6 5 5 4 4 3 3 2 2 1 1 1* 1* * 1 * I * 1 * I * I 1 * I * 1 1* 1* * 1 * * 1 I * * 1 I * I 1 *1 *1 * 1 I *1 *1 1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1 I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I AUTOCORRELATION 022 0.22 -0.31 031 0.03 0 03 0.10 0 10 0 12 0.12 -0.31 -0.07 0 07 0.02 0 02 0.08 0 08 -0.16 0 16 -0.12 0 12 028 0.28 -0.02 0 02 -0.22 -0.03 0.03 031 022 -1 o 0 +1 4.3 Figura 4.3 Autocorrelaciones para los datos aleatorios de Ia tabla 4.3. aleatorios de la tabla 4.3. Si una serie tiene una tendencia, existe una relaciôn significativa entre los valores serie tiene una tendencia, existe una relación significativa entre los valores Si sucesivos de serie de tiempo. Es típico que los coeficientes de autocorrelación sean sucesivos de la serie de tiempo. Es tIpico que los coeficientes de autocorrclaciôn scan desfasamiento significativamente diferentes de cero para varios de los primeros periodos de desfasarniento después gradualmente incrementarse el número de periodos. y caigan después gradualmente hacia cero al incrementarse ci nirnero de periodos. pronóstico avanzados, como los modelos de BoxJenkins, están Algunos modelos de pronóstico avanzados, como los modelos de Box-Jenkins, están diseñados para utilizarse con series de tiempo estacionarias. Una serie estacionaria es diseñados para utilizarse con series de tiempo estacionarias. Una serie estacionaria aquella propiedades estadísticas básicas, corno la la varianza, permanecen aquelia cuyas propiedades estadIsticas básicas, como la media y Ia varianza, permanecen constantes en ci tiempo. Se dice que una serie que no presenta crecirniento oodeclinación constantes el tiempo. Se dice que una serie que no presenta crecimiento declinación estacionaria. Una serie que tiene una tendencia se dice que es no estacionaria. Los es estacionaria. Una serie que tiene una tendencia se dice que es no estacionaria. Los coeficientes autocorrelación de estacionarios cero después del segundo o coeficientes de autocorrelación de datos estacionarios caen a cero después del segundo o tercer periodo de desfasamiento, mientras que en las series no estacionarias son significade desfasamiento, mientras en las series no estacionarias son significativamente diferentes de cero durante varios periodos. En estas series, se quitar la tivarnente diferentes de cero durante varios periodos. En estas series, se debe quitar la de realizar cualquier análisis posterior, como su uso en los procedimientos tendencia antes de realizar cualquier análisis posterior, como su uso en los procedirnientos Box-Jenkins. de BoxJenkins. Una serie estacionaria es aquella cuyo valor prornedio no cambia a través dci es aquella cuyo valor promedio cambia través del Una tiempo. método denominado Para quitar la tendencia de una serie no estacionaria se utiliza un método denorninado diferenciación, se resta YY, de Y,-b Y 1-1 se resta de Y_2 y así sucesivarnente para crear una de Y,-2 y asI sucesivamente para se resta de Y,_1, Y procedimiento demuestra mediante ci paquete de cómputo Minitab. La nueva serie. Este procedirniento se dernuestra mediante el paquete de cómputo Minitab. La CI se transfonna en una nueva serie diferenciada esta nueva forma, la serie en Cl se transforrna en una nueva serie diferenciada en C2. En esta nueva forma, Ia la varianza pennanecen tiempo la serie es estacionaria. media y Ia varianza permanecen constantes a través del tiempo y Ia serie es estacionaria. Exploración de patrones de datos mediante análisis de autocorrelación Exploracián de patrones de datos mediante análisis de autocorrelaciOn 109 Los comandos de Minitab para diferenciar una serie de datos de ejemplo son: Minitab diferenciar una serie de Los > MTB > DATA> DATA> MTB > > SET C1 SET Cl 221 224 230 237 235 240 247 248 250 255 262 271 221 224 230 237 235 240 247 248 250 255 262 271 END END 1 FOR C1, STORE IN C2 DIFFERENCES 1 FOR Cl, STORE IN C2 MTB > PRINT C1~C2 MTB > PRINT C1C2 ROW 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 C1 Cl 221 224 230 237 235 240 247 248 250 255 262 271 C2 * 3 3 6 6 7 7 -2 5 5 7 7 1 1 2 2 5 5 7 7 9 9 9 9 10 11 11 12 12 MTB > STOP STOP • El cornando SET se usa para almacenar los datos en el. comando Cl. cornando DIFFERENCES calcula primera en Cl almacena • El comando DIFFERENCES calcula la prirnera diferencia de los datos en el y almacena en C2. estas diferencias en C2. • El comando PRINT se eniplea para mostrar lo que está almacenado en las columnas CI emplea que está almacenado en las Cl yC2. Ejemplo Ej empl o 4.3 Tlymane, una analista de Sears, se la pronosticar A Maggie Trymane, una analista de Sears, se le asigna Ia tarea de pronosticar las ventas de 1992. Ella reúne los datos de 1955 a 1991, que se muestran en la tabla 4.4. Estos datos se 1992. Ella reñne los datos de 1955 a 1991, que se muestran en Ia tabla 4.4. Estos datos se grafican en la serie de tiempo de la fig. 4.4. Primero, Maggie calcula un intervalo de confianza de confianza la fig. para los coeficientes de autocorrelación: del 95% para los coeficientes de autocorrelación: 0±1.96 b o ± 1.96 ~V37 v 37 1 o .322 0 ± .322 continuación, Maggie ejecuta los datos en Minitab (véanse instrucciones en A continuación, Maggie ejecuta los datos en Minitab (véanse las instrucciones en la sección "Paquete de Cómputo Minitab" al final de este capItulo), y produce un correlograma final de este capítulo), y produce un correlograma la fig. 4.5. Al examinarlo, que las autocorrelaciones los similar al que se muestra en la fig. 4.5. Al examinarlo, nota que las autocorrelaciones para los primeros siete periodos de desfasamiento son significativaniente diferentes de cero (.92, .83, desfasamiento significativamente diferentes (.92, .83, primeros .73, .64, .55, .46 y .37) y que esos valores gradualmente caen a cero. Maggie decide que los Maggie .73, .64, .55, .46 Y .37) Y que esos valores gradualmente caen datos tienen una tendencia. 110 110 Exploración de los patrones de datos y selecciOn de Ia técnica de pronOstico de datos y selección de la técnica de pronóstico ExploraciOn de Capítulo 4 CapItulo TABLA 4.4 VENTAS ANUALES VENTAS ANUALES TABLA 4.4 DE SEARS ROEBUCK CO., DE SEARS ROEBUCK & &CO., 1955-1991 VENTAS DE SEARS VENTAS A1O AÑO 1955 1955 1956 1957 1958 1959 1960 1960 1961 1962 1963 1963 1964 1965 1965 1966 1967 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 Yr Yr 3,307 3,556 3,601 3,721 4,036 4,134 4,268 4,578 5,093 5,716 6,357 6,769 7,296 8,178 8,844 9,251 10,006 10,991 12,306 13,101 13,639 14,950 17,224 17,946 17,514 17,514 25,195 27,357 30,020 35,883 38,828 40,715 44,282 48,440 50,251 53,794 55,972 57,242 Fuente: Industry Surveys, 1993. Fuente: Surveys, 1993. Maggie sabe que la serie debe diferenciarse para quitar la tendencia crear una serie Maggie sabe que la serie debe diferenciarse para quitar Ia tendencia y crear una serie estacionaria. Hace primero la diferenciación de los datos mediante Minitab (véase "Paquete de los datos mediante Minitab (véase "Paquete de Cómputo Minitab) desarrolla un con'elograma similar al de Ia fig. 4.6. En Cómputo Minitab) y desarrolla un correlograrna similar al de la fig. 4.6. En éste aprecia que el coeficiente de autocorrelación para el periodo de desfasarniento 3, .65, es significativamente desfasamiento .65, significativamente ci primeros coeficientes de autocorrelación y el cuarto están cerca diferente de cero y que los dos primeros coeficientes de autocon'elación y el CUaIto están cerca ExploraciOn de patrones de datos mediante análisis de autocorrelacián Exploración de patrones de datos mediante análisis de autocorrelación $60,000 111 $50,000 $40,000 ;'" > E C "3 '" $30,000 $20,000 $10,000 0 1955 lii ii I I I till! I till I 1975 1985 I lii 1990 1960 1965 1970 Anos Años Figura 4.4 Gráfica de una serie con tendencia: datos de Sears para el ejemplo 4.3. 4.4 Gráfica de una serie tendencia: datos de TIME LAG 15 15 AUTOCORRELATION 1 I * J * 1 *1 *1 * * 14 14 13 12 . * 11 11 10 9 9 I 1 1* 1* 1 * * * 8 8 7 7 6 5 5 4 3 3 2 1 1 1 1 I 1 I 1 1 I * * * * * * 1 I 1 1 I * -0.12 0.12 -0.08 0.08 -0.04 0.04 0.00 0.06 0.13 0.20 0.28 0.37 0.46 0.55 0.64 0.73 0.83 0.92 1. 1 , 1 . 1 .1.1.1.1.1.1.1.1.1.1.1.1.1.1. 1 . 1 . 1 I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I -1 O +1 0 1 Figura 4.5 Figura 4.5 Autocorrelaciones para los datos de ventas de Sears del ejemplo 4.3. Autocorrelaciones para los del ejemplo 4.3. de ser significativos. Después del periodo de desfasamiento 3, el patrón parece caer gradualsignificativos. Después del periodo de desfasaniiento 3, el patron parece caer gradualmente hacia cero. Maggi se pregunta si hay algñn patrOn en estos datos que se pudiera modelar se pregunta si hay algún patrón se pudiera modelar mediante alguna mediante alguna de las técnicas de prOnosticomás avanzadas que se exponen en el cap. 10. prónostico rnás avanzadas que se exponen en el cap. 10. Si una serie es estacional, un patron se repite a sI mismo en forma regular durante un patrón sí fonna intervalo particular (por lo regular un año), y se presentarán coeficientes de autocorrelaciOn lo regular un año), y se presentarán coeficientes de autocorrelación significativos en ci penodo de desfasamiento correspondiente. Si se analizan datos trimessignificativos el periodo de desfasamiento correspondiente. Si se analizan datos trimes- 112 Exploración de los selección de Ia técnica ExploraciOn de los patrones de datos y selecciOn de la técnica de pronóstico Cap ítulo 4 CapItulo TIME LAG 15 14 14 13 12 12 11 10 10 9 9 *1 * 1 *1 * 1 *1 *1 *1 *1 *1 *1 * AUTOCORRELATI0N AUTOCORRELATI ON -0. 1 0 -0.10 -0.10 -0.07 -0.03 -0.07 0.02 1 I * * * 8 8 7 7 6 6 5 5 4 3 3 2 2 1 1 1 I 1 I 1 I 1 I 1 1 * * * * * * 0.14 0.02 0.01 0.27 0.15 0.33 0.65 0.32 0.33 1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1 I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I -1 O +1 0 Figura 4.6 Autocorrelaciones datos Figura 4.6 Autocorrelaciones para la primera diferenciación de los datos ventas de Sears del ejemplo 4.3. de ventas de Sears del ejemplo 4.3. trales, aparecerá un coeficiente de autocorrelación significativo en el periodo de desfasacoeficiente de autocorrelación significativo en el periodo de desfasatrales, son mensuales, aparecerá un coeficiente de autocorrelación miento 4. Si los datos analizados son mensuales, aparecerá un coeficiente de autocorrelación significativo en el periodo de desfasarniento 12. Esto es, enero se correlacionará con otros desfasamiento 12. Esto es, enero se correlacionará con otros significativo en eneros, febrero febreros, ilustra serie estacional. eneros, febrero con otros febreros, etc. El ejemplo 4.4 ilustra una serie estacional. Ejemplo 4.4 Perkin Kendell es un analista de la Outboard Marine Corporation. Él siempre ha tenido la Perkin Kendell es un analista la Outboard Marine Corporation. El siempre ha tenido la impresión de qite ventas son estacionales, pero la adquisición de seis astilleros por su irnpresión de que las ventas son estacionales, pero Ia adquisición de seis astilleros por su 1988 le ha hecho cuestionarse esta suposición. Perkin reúne los datos compañía cornpania entre 1986 y 1988 le ha hecho cuestionarse esta suposición. Perkin rei'ine los datos que se niuestran en Ia tabla 4.5, para las ventas trirnestrales de la empresa de 1984 a 1993 y muestran la para las ventas trimestrales empresa 1984 a 1993 y grafica la serie de tiempo correspondiente, que se presenta en Ia fig. 4.7. Después, calcula un tiempo cOITespondiente, que la fig. intervalo de confianza de 95% para los coeuicientes de autocorrelación. los coeficientes autocorrclación. intervalo de confianza 0±1.96 ~ o ± 1.96 V4o 1 o ± .31 0 .31 de datos mediante análisis de autocorrelación Exploración de patrones de datos mediante análisis de autocorrelaciOn 113 TABLA 4.5 VENTAS POR TRIMESTRE DE OUTBOARD MARINE, 1984-1993 4.5 VENTAS POR TRIMESTRE DE OUTBOARD MARINE, 1984-1993 (EJEMPLO (EJEMPLO 4.4) AÑO FISCAL A11O FISCAL (a! término) (al ténnino) 1984 1984 1985 1985 1986 1986 1987 1987 1988 1988 1989 1989 1990 1990 1991 1991 1992 1992 1993 1993 DICIEMBRE 31 147.6 139.3 140.5 168.8 259.7 264.4 232.7 205.! 205.1 193.2 178.3 MARZO 31 JUNIO JUN10 30 273.1 260.2 298.8 393.5 464.6 411.3 310.7 285.4 292.5 295.4 SEPTIEMBRE 30 249.1 259.5 287.0 404.3 479.7 385.9 293.0 258.7 315.2 311.8 251.8 221.2 245.5 322.6 401.1 402.6 309.2 234.4 263.7 274.5 Fuenle: The Value Line Investment Survey (Nueva York: Value Line, 1988, 1992), p. 1768. Fuen/e: Tile Va/ue Line ¡nves/men/ SlIrvey York; 1988, 1992), p. 1768. 500 500 - 450 450 400 400 350 350 8 'JO § 300 300 " > ;: '" 250 200 150 100 10050 50 0 1984 I I I I I I II I I I I I I I I I I I I II I I I I I 1985 1986 1987 1988 1989 Tiempo 1990 1991 1992 1993 1990 Figura 4.7 Gráfica de una serie estacional para los datos de Outboard Marine del estacional Marine Gráfica ejemplo 4.4. A continuación, Perkin calcula los coeficientes de autocorreiación que se muestran en Ia continuación, autocorrelación la fig. 4.8. Nota que en ci periodo de desfasamiento 4, los coeficientes de autocorrelación son fig. 4.8. en el periodo de desfasamiento los coeficientes de autocorrelación significativamente diferentes de cero (.73> .31) y concluye que las ventas de Outboard Marine significativarnente diferentes de cero (.73 > .31) y concluye que las ventas de Outboard Marine son son estacionales en una base trirnestral. una base trimestral. 114 Exploración de los patrones de datos y selección de Ia técnica de pronOstico y de la técnica de pronóstico ExpIoracOn de los patrones Capítulo 4 CapItuio TIME LAG LAG 20 19 18 17 16 15 * 1 1 I 1 I 1 I 1 I 1 I I 1 I 1 * * 14 13 12 11 10 9 8 7 7 6 * * * * * 5 4 3 3 2 2 1 1 -1 Figura 4.8 4.8 1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1 O 0 +1 I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I 1* 1* 1 I 1 I 1 1 I *1 *1 * * 1 I I 1 I 1 1 I 1 1 I AUT000RRELATION AUTOCORRELATI0N 0.13 013 -0.22 -0.34 -0.34 -0.26 -0.26 0.01 -0.39 -0.51 -0.36 0.03 0 03 -0.35 -0.44 -022 -039 -051 -036 -035 -044 -O .19 -019 -0.12 -0 12 0.18 * 0.30 030 -0.05 -0 05 * * * *1 * 1 018 073 0.73 0.31 031 0.19 0.42 Autocorrelaciones para los datos de ventas de Outboard Marine, ejemplo 4.4. Autocorrelaciones para los datos de ventas de Outboard Marine, ejemplo 4.4. SELECCIÓN DE UNA TÉCNICA DE PRONÓSTICO SELECCION DE (JNA TECNICA DE PRONÔSTICO Este texto está dedicado su mayor parte a explicar diversas técnicas de pronóstico y Este texto estã dedicado en su mayor parte a explicar diversas técnicas de pronóstico y mostrar su utilidad. Pero se subraya el primer trabajo importante, que consiste en elegir Ia subraya el primer trabajo importante, elegir la mejor técnica de pronóstico. pronóstico. A continuación se presentan algunas de las preguntas que se deben considerar antes continuación algunas deben considerar antes sobre la técnica de pronóstico más adecuada para un problema en particular. de decidir sobre la técnica de pronóstico más adecuada para un problema en particular. Por • ¿Por qué se requiere un pronóstico? Quién • ¿Quién utilizará el pronóstico? • ¿Cuáles son las caracterIsticas de los datos disponibles? características Cuáles Qué • ¿Qué espacio de tiempo se pronosticará? LCuáles son los requerirnientos mInimos de • ¿Cuáles son los requerimientos mínimos de datos? Cuá1 es precision • ¿Cuál es la precisión deseada? ,Cuá1 será el costo del pronóstico? • ¿Cuál será el costo del pronóstico? Para una buena selección de la técnica de pronOstico adecuada, el pronosticador buena selección de la técnica de pronóstico adecuada, el pronosticador Para deberá poder hacer lo siguiente: hacer lo siguiente: • Definir la naturaleza del problema de pronóstico. • Explicar la naturaleza de los datos bajo investigaciOn. de los datos bajo investigación. SelecciOn de una técnica de pronOstico Selección técnica de pronóstico 115 • Describir las capacidades y limitaciones de las técnicas de pronóstico potencialmente limitaciones técnicas útiles. ütiles. • Desarrollar algunos criterios predeterminados sobre los cuales se pueda tomar la Desarrollar algunos criterios predeterminados sobre los cuales se pueda tomar la decisión la decision de Ia selección. principal que influye en la selección técnica de pronóstico Un factor principal que influye en la selecciOn de una técnica de pronOstico consiste en la identificación y comprensión de patrones históricos en los datos. se pueden en la identificaciOn y cornprensión de patrones históricos en los datos. Si se pueden cíclicos reconocer patrones de tendencia, ciclicos o estacionales, entonces se pueden seleccionar las la capacidad de utilizar eficazmente estos patrones. técnicas con la capacidad de utilizar eficazrnente estos patrones. Técnicas de pronóstico para datos estacionarios Técnicas de pronóstico datos estacionarios Como anterionnente, una es aquella cuyo valor promedio no Corno se definió anteriorrnente, una serie estacionaria es aquella cuyo valor prornedio no varla través del tiempo. Estas situaciones varía a través del tiempo. Estas situaciones se presentan cuando los patrones de demanda presentan patrones de demanda que influyen sobre la serie son relativamente estables. En su forma más simple, el pronóstico En su más simple, el pronóstico de series estacionarias comprende el uso de Ia histOlia disponible de las series para estimar comprende el uso la historia disponible de las su valor prornedio, el cual se convierte después en el pronOstico de valores futuros. Las promedio, cual se convielte después en el pronóstico de valores futuros. Las técnicas más sofisticadas comprenden la actualización de la estimación, al haber disponible disponible nueva infonnación. Estas técnicas son útiles cuando nueva inforrnación. Estas técnicas son ñtiles cuando no son confiables las estimaciones son confiables las estimaciones iniciales o cuando la estabilidad del prornedio es cuestionable. Adernás, las técnicas de técnicas de iniciales cuando la estabilidad del promedio es cuestionable. Además, actualización proporcionan cielto grado de tranquilidad con respecto a los cambios en la actualización proporcionan cierto grado de tranquilidad con respecto a los cambios en estructura subyacente de Ia serie. la selie. estructura pronóstico estacionalias emplean siempre que: Las técnicas de pronóstico estacionarias se emplean siempre que: Lasfuerzas que generan una seriese han estabilizado el medio en el que existe la serie • Lasfuerzas que generaii iiiia serie se han estabilizadoyyel medio en elque existe Ia serie permanece relalzva,nente sin cambios. Ejemplos de ello son las fallas por semana en pernianece relativamente sin cambios. Ejemplos de ello son las fallas una lInea de ensamble que tiene una tasa de producciOn uniforme., las ventas unitarias línea producción uniforme., las ventas unitarias de un producto o servicio en Ia etapa de maduración de su ciclo de vida y el nürnero de la vida y el número de ventas resultantes de un nivel constante de esfuerzo. Se requiere tin inodelo inuy sencillo debido Ia falta de datos o para facilitar su • Se requiere un modelo muy sencillo debido a ala falta de datos o para facilitar su explicación o iniplementación. Un ejemplo serIa cuando un negocio u organización es implementación. sería organización es nuevo y hay disponible muy poca inforrnación histórica. información histórica. Se puede iograr la estabilic/ad haciendo correcciones senciilas factores como creci• Se puede lograr Laestabilidad haciendo correcciones sencillas aafactores como creciiniento de Ia miento de la población e inJlación. Ejemplos de esto son modificar ci ingreso por el inflación. Ejemplos de esto son el ingreso el ingreso per capita, o las ventas en dólares por montos en dólares constantes. cápita, • La serie sepuede transforinar en uiia serie esiabie. Como ejemplo, está Ia transformase puede transformar en una serie estable. Como ejemplo, está la transfonnación de series mediante logaritmos, raíces cuadradas o diferencias. logaritmos, ralces pronóstico, de • La serie es un conjunto de en-ores de pronóstico, de una técnica de pronóstico que se es un conjunto errores considera adecuada. Véase el ejemplo 4.6. Véase el ejemplo V3lias técnicas podtían considerar al pronosticar en estacionarias Varias técnicas que se podrIan considerar a! pronosticar en series estacionarias son métodos fonnales, métodos promedio simple los métodos de promedios los métodos no forrnales, los rnétodos de prornedio simple y los métodos de promedios móviles, atenuación exponencial yyde Box-Jenkins. mOviles, atenuación exponencial de BoxJenkins. 116 116 Exploración de los patrones de datos y selección de la técnica de pronOstico pronóstico ExploraciOn de los patrones de Ia CapItulo 4 Capítulo Técnicas de pronóstico para tendencia Técnicas de pronóstico para datos con una tendencia Anterionnente definimos a una serie con tendencia como una serie de tiempo que contiene Anteriorrnente definirnos a una serie con tendencia corno una serie de tiempo que contiene un componente de largo plazo que representa el crecimiento o deciinación de la serie a un componente de largo plazo que representa el crecimiento o declinación de la serie través de un periodo amplio. En otras palabras, se dice que una serie de tiempo tiene una amplio. En otras palabras, se dice que una serie de tiempo tiene una través de tendencia Si su valor promedio varía aatravés del tiempo, de modo que se espera que aumente si SU valor promedio varia través del tiempo, de modo que se espera que aumente el el se desea el pronóstico. Es común que las series o disminuya durante ei periodo para ci que se desea el pronóstico. Es cornñn que las series económicas tendencia. econórnicas contengan una tendencia. pronóstico tendencia utilizan siempre que: Las técnicas de pronóstico para series con tendencia se utilizan siempre que: procluctividad creciente y Ia nueva tecnologIa conduceii a ci • Una productividad creciente y la nueva tecnología conducen a cambios en el estilo de vida. Como ejemplos se pueden citar la dernanda de componentes electrónicos, que se ejemplos se pueden citar la demanda de componentes electrónicos, que se incrementó con el advenirniento de la computadora; y el uso del ferrocarril que incrementó con el advenimiento de Ia computadora; y el uso del ferrocarril que disminuyó con ci advenirniento del avión. el advenimiento disrninuyó • El incremento en la pobiación provoca un incremento en La demanda de bienes y incremento en población un incremento la demanda de bienes y consumo, servicios. Ejemplos de esto son las utilidades por yenta de bienes servicios. Ejemplos de esto son las utilidades por venta de bienes de consumo, la demanda en el consumo de energía eléctlica y ci uso de materias primas. dernanda en ci consumo de energIa eléctica el primas. • Elpoder c/c compra del do/ar afecta las variables econóinicaspor causa de La inflaciOn. El poder de dólar afecta las variables económicas por causa de la inflación. Los ejemplos son salarios, costos de producción y precios. Ia aceptacion • Aumenta la aceptación en ci mercado. Un eijempio serIa ci periodo de crecimiento en el Un eljemplo sería el ci el ciclo de vida de un nuevo producto. Las técnicas a considerar al pronosticar series con tendencia son prornedio móvii Las técnicas considerar al pronosticar series con tendencia son promedio móvil lineal, atenuación exponencial lineal de Brown, atenuación exponencial lineal de Hoit, lineal, atenuación exponencial lineal de Brown, atenuación exponencial lineal de Holt, atenuación exponencial cuadrática de Brown, regresión simple, modelo de Gompertz, Gompetiz, atenuación exponencial ciiadrática de Brown, regresión simple, modelo curvas de crecimiento y modelos exponenciales. modelos exponenciales. curvas Técnicas de pronóstico para datos con estacionalidad Técnicas de pronóstico para datos con estacionalidad Aatelionnente definimos una serie estacional como una serie de tiempo con un patron de patrón de Ariteriormente definirnos una serie estacional como una serie de tiempo cambio que se repite a sj mismo año tras año. Por lo regular, ci desarrollo de una técnica afio. lo regular, el desarrollo de técnica camhio que se repite sí de pronóstico estacional comprende Ia seiección de uii método multiplicativo o uno de de pronóstico estacional comprende la selección de un método rnultipiicativoo uno de índices a partir de la historia de la selie. Estos índices adición y estimar después Indices estacionales a partir de la historia de Ia serie. Estos indices se usan posteriorrnente para incorporar Ia estacionalidad al pronóstico o para eliminar tales posterionnente la para eliminar tales efectos de los valores observados. A este iiltimo proceso se Ic conoce como ajuste estacional A este último proceso se le ajuste estacional de datos y se expone en ci cap. 8. expone el cap. 8. de Las técnicas de pronóstico para datos estacionales se usan siempre que: estacionales Las • El clima il?f1uenye en la variable de interés. Como ejemplos están el consumo de energía influenye en la variable de interés. Como ejemplos están ci consumo de energIa eléctrica, las actividades de verano e invierno (depOlies como el patinaje), el guardarropa (deportes corno ci patinaje), ci guardarropa y las estaciones de desarro]lo agrIcola. desalTollo aglÍcola. aio calendario ¡¡?fluye en la variable de interés. Ejemplos de ello son las ventas al • El aí10 calendario influye en la variable de inheres. Ejempios de eiio son las ventas ai menudeo influidas por días festivos, fines de semana de tres dIas y los calendarios tres días y los calendarios rnenudeo influidas por dias festivos, fines de semana escolares. Las técnicas a considerar al pronosticar series estacionales son descomposición Las técnicas a considerar al pronosticar series estacionales son descomposición clásica, Census II, atenuación exponenciai de Winter, regresión rniiltiple de series de tiempo exponencial múltiple de ciásica, y métodos de Box-Jenkins. métodos de BoxJenkins. Selección de una técnica de pronOstico de pronóstico SelecciOn de 117 117 Técnicas de pronóstico para series cIclicas series cíclicas Técnicas de pronóstico El efecto cIclico se definió anteriormente como la fluctuación en fonna de onda alrededor cíclico anterionnente como la fluctuación en forrna de El airededor de la tendencia. Los patrones cíclicos tienden aarepetirse en los datos cada dos, tres oomás de Ia tendencia. Los patrones cIclicos tienden repetirse en los datos cada dos, tres ms años. Es dificil establecer un modelo para estos patrones cíclicos, ya que no son estables. establecer modelo para estos patrones cIclicos, ya que no estables. años. la tendencia Las fluctuaciones en forma de onda hacia alTiba y hacia abajo airededor de la tendencia onda hacia aITiba y hacia abajo alrededor Las fluctuaciones en fonna rara vez se repiten en intervalos fijos de tiempo y también varla la magnitud de las rara vez se repiten en intervalos fijos de tiempo y también varía la magnitud de las fluctuaciones. Para analizar datos cIclicos se pueden ampliar los métodos de descomposidatos cíclicos se pueden ampliar los métodos de descomposifluctuaciones. ción (cap. 8). Sin embargo, debido al comportarniento irregular de los ciclos, el análisis de comportamiento irregular de los ciclos, ción (cap. componentes cíclicos de una serie requiere a menudo de encontrar indicadores económicos indicadores económicos componentes cIclicos o coincidentes. principales o coincidentes. Las técnicas de pronóstico para datos ciclicos se utilizan siempre que: de pronóstico cíclicos • El ciclo del negocio influye sobre Ia variable de interés. Corno ejemplos están los ciclo del negocio influye la variable de interés. Como ejemplos están los factores económicos de mercado y de competencia. mercado y de competencia. • Sepresentan canibios en el gusto popular. Ejemplos de ello son Ia moda, la mñsica y la Se presentan cambios en el gusto popular. Ejemplos de ello son la moda, música alimentación. • Se presentan cambios en Ia población. Podenios citar corno ejemplos las guerras, cambios en la población. Podemos citar como ejemplos las guerras, epidemias y desastres naturales. escasez, epidemias y desastres naturales. • Se presentan cambios en el ciclo de vida del producto. Ejemplos de ello son la Se presentan cambios en ciclo vida del producto. Ejemplos de ello son la introducción, crecimiento, maduración, saturación y declinación del mercado. rnaduración, saturación y declinación del mercado. Las técnicas a considerar al pronosticar series cíclicas son la descomposición clásica, técnicas series ciclicas son descomposición clásica, los indicadores económicos, los modelos econométricos, la regresión múltiple y los métodos los modelos econométricos, Ia regresión multiple y los métodos de Box-Jenkins. de BoxJenkins. Otros factores por considerar al elegir Otros factores por considerar al una técnica de pronóstico técnica de pronóstico tiempo para pronóstico relación El horizonte en el tiempo para un pronóstico tiene una rclación directa con la selección de aplicar una técnica de pronóstico. Para los pronósticos de corto y mediano plazos, se pueden aplicar diversas técnicas cuantitativas. Sin embargo, al aumentar el horizonte del pronóstico, diversas técnicas cuantitativas. Sin embargo, al aumentar horizonte del pronóstico, estas técnicas se hacen menos aplicables. Por ejemplo, los promedios móviles, algunas de estas técnicas se hacen menos aplicables. Por ejemplo, los promedios móviles, la atenuación exponencial y los modelos de Box-Jenkins no son muy buenos pronósticos la atenuación exponencia! y los modelos de BoxJenkins no son muy buenos pronósticos económicos modelos econométricos son más útiles de cambios econórnicos radicales, mientras que los modelos econométricos son más ütiles para este fin. Los modelos de regresión, son apropiados para los periodos corto, mediano fin. Los modelos de regresión, son apropiados para los periodos corto, mediano y largo. Las proyecciones de medias, promedios mOviles, descomposición clásica y y largo. Las proyecciones de medias, promedios móviles, descomposición clásica y tendencia son técnicas cuantitativas apropiadas para horizontes de corto y mediano plazos. apropiadas mediano plazos. Las técnicas más complejas de Box-Jenkins y los modelos econométricos resultan también técnicas rnás complejas de BoxJenkins y los modelos econométricos apropiados para pronósticos de corto y mediano plazos. Para horizontes mayores en el apropiados para pronósticos de corto y mediano plazos. Para horizontes mayores en el tiempo, se usan con frecuencia los métodos cualitativos (véase cap. 11). tiempo, frecuencia métodos cap. 11). general, la aplicabilidad de las técnicas de pronóstico es algo que el pronosticador En general, Ia aplicabilidad de las técnicas de pronóstico es algo que el pronosticador realiza con base en su experiencia. Es comi.'m que los administradores requieran de pronósticos base en su experiencia. Es común que los pronósticos tiempo relativamente COli0. en un tiempo relativamente corto. En esta situación, tienen ventaja los métodos de atenuación ventaja exponencial, proyección de tendencia, modelos de regresión y la descomposición clásica. exponencial, proyección de tendencia, modelos de regresión y la descomposición 118 118 Exploración de los patrones de datos y selecciOn de Ia técnica de pronOstico patrones de datos y selección de la técnica de pronóstico Capítulo 4 Capitulo En todo caso, un pronóstico se presentará a los ejecutivos de Ia administración para caso, pronóstico se presentará los ejecutivos de la administración aprobación y uso el proceso de toma de decisiones. De ahí que la facilidad de su aprobaciôn y uso en el proceso de torna de decisiones. De ahI que la facilidad de comprensión e interpretación de los resultados sea una consideración importante. Las una consideración importante. Las comprensión e interpretación de los resultados técnicas modelos de regresión, proyección de tendencias, descomposición clásica y técnicas de modelos de regresión, proyección de tendencias, descomposición clásica y criterio. atenuación exponencial, califican alto para este criterio. computadora ya parte significativa elección Los costos de computadora ya no son una parte significativa en la elección de una técnica. Las computadoras de escritorio (microcomputadoras) y los paquetes de progratécnica. (microcomputadoras) y los han convertido en algo común en muchas organizaciones. Debido mas de pronóstico se han convertido en algo comün en muchas organizaciones. Debido desarrollos es probable que, en el futuro, otros criterios ignoren las consideraciones a estos desarrollos es probable que, en ci futuro, otros criterios ignoren las consideraciones de computadora. de costo de computadora. Como parte final Como parte final de la selección, el pronosticador debe evaluar cada técnica en la selección, el pronosticador debe evaluar cada técnica en términos confiabilidad aplicabilidad para el problema le ocupa, su valor en tértérminos de confiabilidad y aplicabilidad para ci problema que le ocupa, su valor en térefectividad comparado de otras técnicas apropiadas, su nivel de precisión, minos de efectividad coniparado con el de otras técnicas apropiadas, su nivel de precision, su costo y aceptaciOn por parte de la adrninistración. La tabla 4.6 presenta un resumen de aceptación por parte de administración. La tabla 4.6 presenta un su las técnicas pronóstico las técnicas de pronóstico que deben ser usadas con determinados patrones de datos. detenninados TABLA 4.6 SELECCION DE UNA TECNICA DE PRONOSTICO TABLA 4.6 SELECCiÓN DE UNA TÉCNICA DE PRONÓSTICO REQUERIMIENTOS MfNIMOS MÍNIMOS DE DATOS DATOS NO PATRON HORIZONTE EN TIPO PATRÓN HORIZONTE EN TIPO BE EL TIEMPO MODELO ESTACIONALES ESTACIONALES DE DATOS S S S S S S S S S I I I S 1, L I, 1, L I, L I,L I, L I, 1, L S S S S S S S S I, 1, L MÉTODO METODO ESTACIONALES No formales fonnales ST, T,S ST. T, S Promedios simples ST Prornedios Promedios móviles ST Atenuación exponencial ST Atenuación exponencial T lineal Atenuación exponencial T cuadrática Atenuación exponencial S S estacional Filtración adaptiva S simple Regresión simple T Regresión multiple múltiple e, S C, Descomposición clásica S Modelos de exponencial Modelos de tendencia exponencial T Ajuste de curvaS Ajuste de curva-S T Gompertz Modelos de Gompertz T Curvas de crecinliento crecimiento T Census H II S S Box-Jenkins BoxJenkins ST,T,C,S ST. 1, C, S Indicadores principales e C Modelos econornétricos econométricos e C Regresión mñltiple de series múltiple series T, S T, de de tiempo TS TS TS TS TS TS TS TS C e C e TS TS TS TS TS TS TS C e C e e C 1 30 4-20 2 3 4 2*L 5*L 10 IO*V 10'V 5*L 5*L 10 10 10 10 10 10 24 24 30 6*L 3*L 6*L Parón de datos: SI, estacionarios; 1, con tendencia; S, estacionales; C, cIclicos. Patrón de datos: ST, estacionarios; T, con tendencia; S, estacionales; C, cíclicos. Horizonte en el tienipo: S, corto plazo (menos de 3 meses); I, mediano plazo; L, largo plazo. plazo (menos de 1, plazo; plazo. Horizonle en tiempo: Tipo de modelo: de tiempo; C, causal. Tipo de modelo: TS, serie de tiempo; C, causal. Estacion ales: L, Estacionales: L, longitud de Ia estacionalidad. la estacionalidad. Medición del pronóstico MediciOn del error en el pronOstico 119 MEDICIÓN DEL ERROR EN EL PRONÓSTICO MEDICION DEL ERROR EN EL PRONOSTICO Ya que las técnicas cuantitativas de pronóstico implican, por lo regular, series de tiempo técnicas cuantitativas pronóstico implican, por lo regular, series tiempo de datos, se desarrolló una notaciOn matemática para hacer referencia a cada periodo de datos, se desarrolló una notación matemática para hacer referencia a cada periodo específico. Se empleará la letra y para denotar una variable de serie de tiempo, a menos que especIfico. Se empleará la letray denotar una variable de serie de tiempo, a menos que exista más de una variable. El periodo asociado con una observación se muestra como una variable. El periodo asociado observación se muestra como exista más 1', se refiere al valor de la serie de tiempo en el periodo t. Los datos se refiere al valor de serie tiempo el periodo t. Los datos subíndice. AsI, .Yr subIndice. Así, trimestrales de Outboard Marine Corporation que se presentan en el ejemplo 4.4. se trimestrales de Outboard Marine Corporation que se presentan en el ejemplo 4.4. denotarian comoy1 = '47.6,Y2 = 26l.8,y3 = 273.1 denotarían como YI = 147.6, Y2 = 261.8, Y3 = 273.1 oo., Y40 = 311.8. También se desarrolló una notación matemática pam distinguir el valor real de También se desarrolló una notación matemática para distinguir el valor real de una serie de tiempo y el valor de pronóstico. Se empleará el sImbolo A (acento circunflejo) sobre valor pronóstico. Se empleará el símbolo acento valor, para indicar que se trata de un pronóstico. El valor de pronóstico para .Yr es Y un valor, para indicar que se trata de un pronóstico. El valor de pronóstico para Y es Vt.t . Con frecuencia, se juzga Ia precisión de una técnica de pronóstico mediante la comparación frecuencia, la precision de una técnica de pronóstico mediante la comparación serie de pronóstico Y¡, Y b de la serie original Y1,I ,Y2,, oo, con la serie de pronóstico Y1, Y2, • • • la serie original Y Y2 ... La notación básica de pronóstico se resume como: pronóstico se resume como: 1\ ( Notación Básica de Pronóstico Notación Yt ==valor de una serie de tiempo en el periodo t Y. valor de i.ma serie de tiempo en I Yt = valor del pronóstico para Y. pronóstico para Y, Y, = e, = Y. - Vtt = residual o error del pronOstico e = .Yr Y residual o error del pronóstico Se han ideado diversos métodos para resumir los errores generados por una técnica ideado diversos métodos errores generados por una técnica mayoría particular de pronóstico. La mayoria de estas mediciones implican promediar alguna función mediciones promediar función de Ia diferencia entre el valor real y su valor de pronóstico. A menudo se denominan de la diferencia entre el valor real su valor de pronóstico. A menudo se denominan residuales a estas diferencias entre valores observados y los valores de pronóstico. a estas diferencias entre valores observados los valores de pronóstico. la diferencia valor de pronóstico. Un residual es la diferencia entre un valor real y su valor de pronóstico. error o residual de cada periodo de pronóstico, se utiliza la ecuación 4.4. Para calcular el error o residual de cada periodo de pronóstico, se utiliza la ecuación 4.4. e, = Y , - Y, (4.4) en en donde et = error del pronóstico en el periodo t periodo e = error del pronóstico Y, = valor del pronóstico en el periodo t peliodo Vt .Yr = valor real en el periodo t periodo = 120 Exploración de los patrones de datos y selección de Ia técnica de pronóstico Exploración de los patrones de datos seleccián la técnica pronástico Capítulo Capitulo 4 Un método para evaluar una técnica de pronóstico consiste en obtener la suma de los técnica consiste en un errores absolutos. La Desviación Absoluta de la Media (DAM) mide la precision de un errores absolutos. La Desviación Absoluta de la Media (DAM) mide precisión pronóstico mediante ci promedio de la magnitud de errores de pronóstico (valores pronOsticomediante el promedio de la magnitud de los errores de pronóstico (valores absolutos de cada error). La DAM resulta de gran utilidad cuando el analista desea medir cuando ci absolutos de cada error). el error de pronOstico en las mismas unidades de la serie original. La ecuaciOn 4.5 muestra pronóstico en las mismas unidades ecuación 4.5 el cómo se calcula la DAM. cómo DAM 1=1 lYt n (4.5) Otro método para evaluar una técnica de pronóstico es el Error Medio Cuadrado pronóstico el Error Medio Cuadrado Otro método para evaluar tilla técnica (EMC). Cada error o residual se eleva al cuadrado; luego, estos valores se suman y se divide (EMC). al cuadrado; luego, surnan y se divide entre el mirnero de observaciones. Este enfoque penaliza los errores rnayores de pronóstico mayores ci número de observaciones. que eleva cada uno al cuadrado. Esto es importante pues en ocasiones pudiera ser ya que eleva cada uno al cuadrado. Esto es importante pues en ocasiones pudiera ser preferible una técnica que produzca errores nioderados a otra por lo regular tenga preferible una técnica que produzca errores moderados a otra que por lo regular tenga errores pequefios, pero que ocasionairnente arroje algunos en extremo grandes. La ecuación pequeños, ocasionalmente algtillos La ecuación 4.6 muestra el cálcWo del EMC. el cálculo EMe. EMC EMC t~ t=I1 L(Y¡ - Y)2 n >(, - r/ 11 (4.6) En ocasiones, resulta más iitil calcular los errores de pronóstico en ténninos de En ocasiones, resulta rnis útil calcular los errores de pronóstico en ténninos no en cantidades. El Porcentaje de Error Medio Absoluto (PEMA) se calcula porcentaje y no en cantidades. El Porcentaje de Error Medio Absoluto (PEMA) se calcula encontrando el error absoluto en cada periodo, dividiendo éste entre ci valor real observado el ci después promediando estos errores absolutos de porcentaje. Este enfoque para ese periodo y después promediando estos errores absolutos de porcentaje. Este enfoque es ñtil cuando el tarnaflo o magnitud de la variable de pronóstico es importante en la tamaño o magnitud de variable pronóstico es importante en es útil cuando evaluación de la precisiOn del pronóstico. El PEMA proporciona una indicaciOn de qué tan la precisión PEMA proporciona una indicación qué tan grandes son los errores de pronóstico comparados con los valores reales de la serie. También eITores comparados con los valores reales de la serie. También la precision se puede utilizar ci PEMA para comparar Ia precisión de la misma u otra técnica sobre dos el Ia misma u series compietarnente diferentes. La ecuación 4.7 muestra el cálculo del PEMA. cálculo del PEMA. series completamente diferentes. ?, IY,YI L IY - YI 11 ¡ 1 PEMA PEMA = 1=1 1', Y¡ n (4.7) A veces resulta necesario determinar si Un método de pronóstico está sesgado veces resulta necesario determinar si un método de pronóstico está sesgado (pronóstico consistentemente alto o bajo). En emplea el Procentaje Medio (pronóstico consistentemente alto o bajo). En estos casos, se emplea ci Procentaje Medio de Error (PME), que se calcula encontrando ci error en cada periodo, dividiendo esto entre calcula encontrando el en cada periodo, dividiendo esto entre Medición del error en el pronOstico el pronóstico Med ición del 121 el valor real de ese periodo y promediando después estos porcentajes de error. Si un enfoque prornediando después estos porcentajes de error. Si un enfoque de pronóstico no está sesgado, Ia ecuación 4.8 producirá un porcentaje cercano a cero. Si pronóstico no sesgado, la ecuación 4.8 producirá un porcentaje cercano a cero. el resultado es un porcentaje negativo grande, el método de pronóstico está sobrestimando un porcentaje negativo grande, el método de pronóstico está sobrestimando de manera consistente. Si el resultado es un porcentaje positivo grande, el método de un porcentaje positivo grande, método de de manera consistente. Si resultado pronóstico esta subestimando en forrna consistente. subestimando en forma consistente. L (Y n 1=1 - Y) I I PME YI n (4.8) Una palie la decisión para utilizar tma técnica de pronóstico en particular es Una parte de la decision para utilizar una técnica de pronóstico en particular es la determinación de si la técnica producirá errores de predicción que juzguen como deterrninaciOn de si la técnica producirá errores de predicción que se juzguen como suficientemente pequeños. Es en efecto realista esperar técnica produzca errores suficienternente pequeños. Es en efecto realista esperar que una técnica produzca errores relativamente bajos tma consistente. de pronóstico relativarnente bajos sobre una base consistente. mediciones de precisión pronóstico acabamos Las cuatro mediciones de precision de un pronóstico que acabarnos de describir se la siguiente manera: utilizan de Ia siguiente manera: comparación precisión diferentes. • La cornparación de la precision de dos técnicas diferentes. • La medición de la utilidad o confiabilidad de una técnica. la o confiabilidad de una técnica. • La bñsqueda de una técnica optima. búsqueda de técnica óptima. El ejemplo 4.5 ilustrará córno calcular cada una de estas mediciones de error. ilustrará cómo calcular cada una de estas mediciones de error. datos dcl nümero de clientes diarios que requieren trabajos de reparación Ejemplo I La tabla 4.7 presenta los datos dcl nlU11ero de clientes diarios que requieren trabajos de reparación prcscnta Ej emplo 4.5 Y1 un pronósticode estos datos Y/, en la Gary's Chevron Station. La técnica de pronóstico YI un pronóstico de estos datos i',, en Ia Chcvron Station. La técnica dc pronóstico 4.5 TABLA 4.7 CALCULOS PARA LOS METODOS DE EVALUACION DE PRONOSTICOS 4.7 CÁLCULOS PARA LOS MÉTODOS DE EVALUACiÓN DE PRONÓSTICOS DEL EJEMPLO 4.5 4.5 ERROR PERIODO DATOS DATOS, y Y, CLIENTES PRONOSTICO, PRONÓSTICO, Y1 Y/ e, Ie,I le,' e~ Ie,I/Y,, le,I/Y" % e,/Y" % 1 1 2 2 3 3 4 5 5 6 7 8 8 9 58 54 60 55 62 62 65 63 70 58 58 54 60 55 55 62 62 65 63 -4 6 -5 7 7 0 O 3 3 -2 7 7 4 5 2 - - 4 6 5 7 7 0 O 3 3 2 2 7 7 - 16 36 25 4<} 49 0 O 9 4 49 7.4 10.0 9.1 -7.4 7.4 10.0 -9.1 9.1 11.3 11.3 - 0.0 4.6 3.2 10.0 Sumas 12 34 188 55.6 -16.2 0.0 4.6 -3.2 3.2 10.0 122 Exploración de los patrones de datos y selecciOn de la técnica de pronóstico selección de Ia técnica de pronóstico Exploración CapItulo Capítulo 4 utiliza ci nümero de clientes atendidos en el periodo anterior, como ci pronóstico del periodo atendidos el utiliza el número actual. Esta sencilia técnica se expondrá en el cap. 5. Los cálcuios para evaluar este modelo sencilla técnica se expondrá en cap. 5. Los cálculos para evaluar este modelo actual. mediante DAM, EMC, PEMA y PME se demuestran en la tabia 4.7. tabla mediante DAM, EMC, PEMA n DAM= t=1 1=1 I IY ftl IYt -- YI n n = 34 = 4.3 ==4.3 8 8 TI n EMC= (=1 t=1 I (Yt - f)2 t n - 188 = 188 = 23.5 8 n (=1 PEMA= PEMA = I r=I n IYtI IY IYt -,- ftl Yt n = 55.6% = 6.95% 55.6% - 6.95% 8 PME = PME= t= 1 t=1 I (Yt - f t) 16.2% = 16.2% = 2.03% = 2.03% 8 Yt n La DAM indica que cada pronóstico está desviado en un promedio de 4.3 clientes. El EMC pronóstico está desviado en un prornedio de 4.3 clientes. El EMC el compararán de 23.5 y ci PEMA de 6.95% se cornpararán con el EMC y el PEMA de cualquier otro método empleado para pronosticar estos datos. Por Ultimo, un bajo PME de 2.03% indica que la técnica último, un bajo PME de 2.03% enipleado Ia técnica en no está desviada; ya que su valor es cercano a cero, la técnica no sobrestima ni subestima en desviada; ya técnica sobrestima fom1a consistente el número diario forrna consistente el nürnero diario de clientes atendidos. DETERMINACION DE LO ADECUADO DE UNA DETERMINACIÓN DE LO ADECUADO DE UNA TÉCNICA DE PRONÓSTICO TECNICA DE PRONOSTICO Antes de proceder a evaluar una técnica elegida, se debe evaluar qué tan adecuada es Ia técnica elegida, adecuada la Antes elección. a las siguientes preguntas: elección. El pronosticador deberá responder a las siguientes preguntas: Son indicativos de una serie aleatOlia los coeficientes de autocorrelación de los • ¿Son indicativos de una serie aleatoria los coeficientes de autocorrelaciôn de los examinando los coeficientes residuales? Esta pregunta se puede responder examinando los coeficientes de autocon'elación gráfica como la rrelacion en la grãfica de residuales, corno Ia que se muestra en el ejemplo 4.6. ci • ¿Presentan los residuales 1ma distribución aproximadamente normal? Esta pregunta se residuales una distribución aproximadarnente normal? Esta pregunta se Presentan los residuales. puede responder analizando un histograma de los residuales. • ¿Tienen proporciones significativas de tt todas las estimaciones de parárnetros? La ,Tienen proporciones significativas de todas estimaciones parámetros? distribución tt se expuso en el cap. 2 y la explicación de las proporciones de t se distribución se expuso en ci cap. y la explicación las proporciones de se demostrarán el dernostrarán en ci cap. 6. • ¿Es sencilla la técnica en su uso y fácil de entender por quienes toman las decisiones? ,Es sencilia Ia técnica en su uso fácil de quienes Determinación de lo adecuado de una técnica de pronOstico de lo adecuado de una técnica de pronóstico 123 123 requerimiento básico de el patrón datos aleatorio se verifica mediante El requerirniento básico de que ci patron de datos sea aleatorio se verifica mediante el análisis de los coeficientes de autocorrelaciónde los residuales. No debe haber análisis de los coeficientes de autocorre]ación de los residuales. No debe haber coeficientes de autocorrelación significativos. La ecuación 4.3 proporcionó un criterio para coeficientes autocorrelación significativos. La ecuación 4.3 proporcionó un criterio para significancia coeficientes de autocorrelación. En ci ejemplo 4.2 probar la significancia de los coeficientes de autocorrelación. En el ejemplo 4.2 se ilustró cómo si cómo usar un correlograma para determinar si una serie es aleatoria. El ejemplo 4.6 ilustra ilustra procedimiento. este procedirniento. Ejemplo 4.6 Kendell, Marine Corporation, se le solicitó pronosticar las ventas A Perkin Kendell, analista de Outboard Marine Corporation, se le solicitó pronosticar las ventas trimestrales de 1993. Los datos de 1984 a 1993 se presentan en la tabla 4.5. Ya que en trimestrales de 1993. Los datos de 1984 a 1993 se presentan en la tabla 4.5. Ya que en el ejemplo 4.4 Perkin determinó que los datos eran estacionales, prueba ahora una de las técnicas estacionales, pronóstico estacional disponibles en su computadora. En la fig. 4.9 muestran los de pronóstico estacional disponibles en su computadora. En la fig. 4.9 se muestran los coeficientes de autocOlTelación para la serie de residuales y las diferencias entre los valores coeficientes de autocorrelación para Ia serie de residuales las diferencias entre los valores los valores de pronóstico. Un examen reales y los valores de pronóstico. Un exarnen de estos coeficientes de autocorrelación indica que hay cuatro que son diferentes de cero en forrna significativa, r¡ = .39, r) = .40, r4 = que son diferentes de cero en forma significativa, r1 = que r r4 = .51 y 1'8 = .37. Los coeficientes dede autocon'elación significativos indican algün patron en = .37. Los coeficientes autocorrelación significativos indican algún patrón en .51 técnica pronóstico adecuada residuales. los requerimientos básicos de los residuales. Uno de los requerimientos básicos de una técnica de pronóstico adecuada es que proporcione un patrón de residuales que sea aleatorio. Perkin juzga que la técnica de que proporcione un patron de residuales que sea aleatorio. Perkin juzga que técnica de que generó residuales resulta inadecuada. pronóstico que generO estos residuales resulta inadecuada. Ahora, Perkin intenta una técnica de pronóstico diferente. En la fig. 4.10 se muestran los de pronóstico diferente. En la fig. 4.10 se muestran los de coeficientes de autocorrelación para Ia serie de residuales al utilizar esta nueva coeficientes de autocorrelaciOnpara la serie de residuales al utilizar esta nueva técnica de pronóstico. examen coeficientes autocorrelación indica que ninguno ellos pronóstico. Un exarnen de estos coeficientes de autocorrelación indica que ninguno de ellos de manera significativa. pronóstico es es diferente de cero de manera significativa. Parece ser que la nueva técnica de pronOstico es adecuada y Perkin decide utilizarla para pronosticar las próximas ventas trimestrales de adecuada Perkin decide utilizarla para pronosticar las próximas ventas trimestrales de Marine. Outboard Marine. TIME LAG 12 12 1]_ * I 1 * * 11 9 9 8 8 7 7 * 1 10 10 *1 *1 *1 6 6 5 5 4 4 3 3 I 1 1 I * 1 I * 1 I * 1 * I 1 1 I 1 I 1 I * * * 2 2 1 1 AUTOCORRELATI0N AUTOCORRELATION 0.10 0 10 -0.11 -0 11 -0.07 -0 07 0.27 0.37 -0.08 -008 0.16 0.12 0 12 051 0.51 0.40 040 0.22 022 0.39 1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1 +1 -1 O 0 1 Figura 4.9 Autocorrelación de los residuales de un modelo inadecuado 4.9 Autoconelación los residuales modelo inadecuado para los datos de Outboard Marine del ejemplo 4.6 Outboard 124 Exploración de de datos y selección de la técnica de pronóstico ExploraciOn de los patrones de datos y selecciOn de Ia técnica de pronOstico Capítulo 4 Cap Itulo TIME TIME LAG 12 11 10 * 9 9 8 8 7 7 6 5 5 4 4 3 3 2 2 1 1 *1 *1 I 1 *1 *1 * 1 * I 1 * I 1 * * 1 * 1 I 1* 1* I 1 * * * 1 1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1 I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I -1 O +1 0 +1 * AUTOCORRELAT10N AUTOCORRELATION 0.00 0 00 -0.05 0 05 -0.13 -0.06 0 06 0.13 013 -0.21 -0.14 -0.09 0 09 -0.17 0.04 0 04 0.11 0 11 0.18 013 021 014 017 1 Figura 4.10 Autocorrelación de los residuales de un modelo adecuado para los datos de Outboard Figura 4.10 Autocorrelación de los residuales de un modelo adecuado para los datos Marine del ejemplo 4.6. ejemplo 4.6. APLICACIÓN EN LA ADMINISTRACIÓN APLICACION ADMINISTRACION en este capítulo constituyen la base para la selección de Los conceptos en este capItulo constituyen Ia base para La selección de la técnica adecuada sihlación dada. En los capítulos siguientes, las más importantes en una situación dada. En los capItulos siguientes, muchas de las rnás importantes técnicas de pronóstico se exponen y se aplican a situaciones de pronóstico. pronóstico exponen aplican situaciones de pronóstico. Los siguientes son algunos ejemplos de situaciones que se presentan constantemente alglmos ejemplos de situaciones que se presentan constantemente Los en el mundo de los negocios, para los cuales una buena técnica de pronóstico ayudarIa al de los negocios, para los cuales una buena técnica de pronóstico ayudaría al proceso de torna de decisiones. El material de este capItulo, junto con lo expuesto sobre decisiones. matelial este capítulo, lo expuesto sobre proceso toma recolección de datos en el cap. 3, se aplican a estos ejemplos, ya que para cada uno están aplican estos ejemplos, que para cada uno están recolección de datos en cap. presentes los dos componentes vitales de tin pronóstico ütil: la recopilación de los datos componentes vitales un pronóstico útil: recopilación los datos presentes los apropiados y Ia selección del método conecto de pronóstico. apropiados la selección del método con-ecto de pronóstico. Una cornpafiIa de refrescos desea proyectar la demanda mensual de su producto su producto Una compañía de refrescos desea proyectar la demanda mensual plincipal, para los dos próximos años. próximos años. principal, Una gran compañIa en telecornunicaciones desea pronosticar los pagos de dividendos compañía telecomunicaciones desea trimestrales de su principal rival, para los próximos tres años. trirnestrales de su principal rival, para los próximos tres afos. Una universidad desea pronosticar las horas de créditos por estudiante por trimestre, universidad las trimestre, años, para los siguientes cuatro aflos, con el fin de desarrollar una proyección de presupuesto el fin para Ia legislatura local. la local. Unú compañía públicos facturación Una cornpañIa de contadores püblicos necesita pronósticos mensuales de facturación en dólares, para poder planear posiciones contables adicionales comenzar las en dólares, para poder planear posiciones contables adicionales y comenzar las contrataciones. AplicaciOn en a administración Aplicación en la administraciOn 125 El gerente de control de calidad de una fábrica de lingotes de aluminio, requiere de calidad de una fábrica de lingotes de aluminio, requiere de un pronóstico semanal de los defectos de producción, para los altos directivos de la pronóstico semanal defectos producción, compañía. compaiIa. Un banquero desea ver proyectada Ia utilidad mensual de un pequefio fabricante de banquero proyectada la utilidad mensual pequeño fabricante bicicletas que solicita un préstamo mayor pam triplicar su capacidad. para triplicar su capacidad. bicicletas Una agencia del gobierno federal necesita proyecciones anuales de kilómetros Una agencia del gobierno federal necesita proyecciones anuales de kilómctros promedio por litro en los automóviles americanos, para los próximos 10 aflos, a fin automóviles americanos, para los próximos años, promedio de elaborar recomendaciones de regulación. de regulación. Una compañIa de ahorro y préstamo requiere pronosticar los préstamos fraudulentos compañía préstamo requiere los préstamos fraudulentos durante los próximos dos afios, a efecto de evitar la quiebra. años, evitar la quiebra. Una compafila que fabrica microprocesadores necesita de un pronóstico industrial Una compañía que fabrica microprocesadores necesita de un pronóstico industrial sobre el nümero de computadoras personales vendidas durante los próximos cinco los próximos cinco sobre número de computadoras personales vendidas años, con el fin de planear su presupuesto de investigación y desarrollo, su presupuesto de investigación y desarrollo. aflos, con el fin GLOSARIO Autocorrelación. Es Ia correlación que existe entre una variable desfasada uno o más la correlación que existe entre una variable desfasada uno más Autocorrelación. la misma variable. periodos y Ia misma variable. Componente aleatorio. Este componente mide la variabilidad de la serie de tiempo después Componente aleatorlo. Este componente mide Ia variabilidad de Ia serie de tiempo despues de quitar otros componentes. componentes. Componente ciclico. Es Ia fluctuación en forma de onda alrededor de la tendencia. Componente cíclico. Es la fluctuación en forma de onda alrededor de la tendencia. Componente estacional. Es un patron de cambio que se repite a si mismo aflo tras año. estacional. Es un patrón de cambio se sí mismo año tras año. Correlograma. Es una herramienta gráfica para mostrar las autocorrelaciones de varios Correlograma. Es una herramienta gráfica para mostrar las autocorrelaciones varios periodos desfasados de una serie de tiempo. desfasados tiempo. Es la diferencia entre observado pronóstico. Residual. Es Ia diferencia entre el valor real observado y su valor de pronóstico. Serie estacionaria. Es aquella cuyo valor estacionario no cambia a través del tiempo. estacionaria. Es aquella cuyo valor estacionario no cambia a través del tiempo. de tiempo. Consiste en datos reunidos, registrados u observados en incrementos Serie de tiempo. Consiste en datos reunidos, registrados u observados en incrementos tiempo. sucesivos de tiempo. Tendencia. Es el componente de largo plazo que representa el crecimiento o declinación Es el componente de largo plazo que representa el crecimiento declinación serie tiempo en un periodo amplio. de la serie de tiempo en un periodo amplio. FÓRMULAS CLAVE FORMULAS CLAVE De primer orden De Coeficiente de autocorrelación Coeficiente de r1 n-I I t=1 (Y t n t I Y)(Y t - 1 - - Y) Y) (4.1 ) (4.1) - 126 Exploración de los patrones de datos y selección de Ia técnica de pronOstico de la pronóstico n-k n-k CapItulo 4 Capítulo De orden k-ésimo orden késimo Coeficiente Coeficiente de autocorrelación rk = rk= I (= 1 t= 1 (Yt - Y)(Y t- k -- Y) )(1-k - I n fl 1 (4.2) (Y t - y)2 (= Intervalos de confianza del confianza coeficiente de coeficiente de autocorrelación 0± Z O±Z Y = Y e t = V1t = Y,t (= t= 11 ~ 1 I (4.3) (4.3) Error de pronóstico o residual Error de pronóstico o residual (4.4) (4.4) IlYt n n Iyt - Ytl (4.5) (45) Desviación absoluta de la media Desviación absoluta Ia DAM = n I Error medio cuadrado Error medio EMe EMC- (= 1 t= 1 (Y t y)2 - Y)2 n n (4.6) (4.6) i error medio absoluto Porcentaje de error medio absoluto lY Yl IYt-Ytl PEMA PEMA - t=1 =1 n n Yt (4.7) i Porcentaje medio de error (Yt - Y) (4.8) PME PME t=1 =1 -J Yt V, n n PROBLEMAS 1. Explique las diferencias entre las técnicas de pronóstico cualitativas y cuantitativas. diferencias las técnicas de pronóstico cualitativas y cuantitativas. 2. ¿Qué es una serie de tiempo? tiempo? Que 3. Describa cada uno de los cuatro componentes de una serie de tiempo. los cuatro componentes una serie de tiempo. 4. j,Que es una autocorrelación? ¿Qué autocorrelación? 5. j,Que mide un coeficiente de autocorrelación? ¿Qué coeficiente autocorrelación? 6. Describa cómo se emplean los correlogramas para analizar autocorrelaciones pam varios desfaDescriba se emplean los correlogramas para analizar autocorrelaciones para varios desfauna serie de tiempo. samientos de una serie de tiempo. 7. Cada una de las siguientes declaraciones describe una serie ya sea estacionaria o no estacionaria. siguientes estacionaria. Indique cuál corresponde a cada una. 3. b. c. d. e. que tiene una tendencia. Una serie que tiene una tendencia. que no tiene una tendencia pero es muy cíclica. Una serie que no tiene una tendencia pero es muy cIclica. cuya media y varianza permanecen través del tiempo. Una serie cuya media y varianza permanecen constantes a través del tiempo. Una serie cuyo valor promedio cambia a través del tiempo. valor promedio través del tiempo. serie que no presenta crecimiento o disminución. Una serie que no presenta crecimiento o disminución. Capítulo 4 Capitulo4 Problemas 127 8. A continuación se presentan descripciones para diversos tipos de series: aleatoria, estacionaria, 8. A continuación se presentan descripciones para diversos tipos de series: aleatoria, estacionaria, tendencia o estacional. Identifique cada tipo de serie. con tendencia o estacional. Identifique cada tipo de serie. a. Una serie que tiene propiedades estadIsticas básicas como la media y la varianza que permaque tiene propiedades estadísticas básicas como la media necen constantes a través del tienipo. través del tiempo. b. Los valores sucesivos de una serie de tiempo no se relacionan entre si. serie de tiempo no se relacionan entre sí. c. Existe una elevada relación entre cada valor sucesivo de una serie. serie. el periodo de desfasamiento 4. d. Aparece un coeficiente de autocorrelación significativo en el periodo de desfasamiento 4. coeficiente de autocorrelación significativo e. Una serie que no presenta crecimiento o disrninución. serie que no presenta crecimiento o disminución. f. Los coeficientes de autocorrelación son diferentes de cero en forma significativa durante los autocorrelación son diferentes de cero forma significativa durante primeros desfasamiento y después caen a cero al incrementarse el número de prinieros periodos de desfasarniento y después caen a cero al incrementarse el nimero de periodos. 9. Enliste algunas de las técnicas de pronóstico a considerar al pronosticar una serie estacionaria. 9. Enliste algunas de las técnicas de pronóstico a considerar al pronosticar una serie estacionaria. ejemplos situaciones Dé ejernplos de situaciones en las que se puedan aplicar estas técnicas. Enliste algunas de las técnicas de pronóstico a considerar al pronosticar una serie con tendencia. 10. Enliste algunas de las técnicas de pronóstico a considerar al pronosticar una serie con tendencia. situaciones que se puedan aplicar estas técnicas. Dé ejemplos de situaciones en las que se puedan aplicar estas técnicas. 11. Enliste algunas de las técnicas de pronóstico a considerar a! pronosticar una serie estacional. Dé Enliste algunas de las técnicas de pronóstico a considerar al pronosticar una serie estacional. Dé ejemplos de situaciones en las que se puedan aplicar estas técnicas. puedan aplicar ejemplos situaciones Enliste algunas de las técnicas de pronóstico a considerar pronosticar cíclica. 12. Enliste algunas de las técnicas de pronóstico a considerar al pronosticar una serie ciclica. Dé ejemplos de situaciones en las que se puedan aplicar estas técnicas. ejemplos aplicar En la tabla siguiente se presenta el númcro de matrimonios en los Estados Unidos. Calcule las 13. En la tabla siguiente se presenta el ni'irnero de matrimonios en los Estados Unidos. Calcule las datos. primeras diferencias para estos datos. AÑO AIO MILES DE MATRIMONIOS MATRIMONIOS 2,425 2,400 2,421 2,389 2,404 1985 1986 1986 1987 1987 1988 1989 1989 Fuente: Statistieal Abstraet 01 the United States, Fuente: Statistical Abstract of the United States, 1988, 1988, 1989, 1991. 14. Calcule un intervalo de confianza de 95% para los coeficientes de autocorrelación de una serie intervalo confianza que contiene 80 términos. télminos. que 15. Calcule un intervalo de confianza de 90% para los coeficientes de autocorrelación de una serie intervalo confianza autocorrelación que contiene 60 térrninos. que conticne 60 témlinos. 16. ¿Cuál método de evaluación de Ia técnica de pronóstico deberIa emplearse en cada una de las pronóstico debería emplearse en las Cuál método de evaluación de la situaciones siguientes? siguientcs? 128 Exploración de los patrones de datos y setecciOn de Ia técnica de pronóstico de datos y selección la pronóstico Exploraciôn Capítulo 4 a. El analista desea determinar si el método de pronóstico tiene algún sesgo. pronóstico tiene algin sesgo. El desea determinar si método b. El analista piensa que el tamafio o magnitud de la variable por pronosticar es importante en analista tamaño la variable pronosticar importante la evaluación de la precision del pronóstico. precisión del pronóstico. c. El analista requiere penalizar los errores de pronóstico mayores. de pronóstico mayores. ,Cuá1es de las siguientes declaraciones son verdaderas, considerando los métodos empleados 17. ¿Cuáles de las siguientes declaraciones son verdaderas, considerando los métodos empleados evaluar pronósticos? para evaluar pronósticos? El a. El PEMA toma en cuenta Ia magnitud de los valores que se pronostican. la valores se pronostican. b. El EMC penaliza los errores mayores. EMC penaliza los errores mayores. c. El PME se usa para determinar Si mi modelo está pronosticando muy alto o muy bajo de PME se usa para determinar si un modelo pronosticando rnuy alto manera sistemática. manera Si stemática. d. La ventaja del método DAM consiste en que relaciona el tamaño del error con la observaerror con la observación real. 18. A Allie White, oficial en jefe de préstamos del Dominion Bank, le gustarla analizar la cartera gustaría analizar cartera 18. A Allie White, oficial en jefe de préstamos del Dominion préstamos banco para los años 1984 a 1989. Los datos son los siguientes: de préstamos del banco para los aflos de 1984 a 1989. Los datos son los siguientes: PRESTAMOS DEL DOMINION BANK POR TRIMESTRE, 1984-1989 PRESTAMOS DEL DOMINION BANK POR TRIMESTRE, (MILLONES DE DOLARES) (MILLONES CALENDARIO 1984 1985 1985 1986 1987 1988 1989 MAR. 31 31 2313 2860 3399 4458 5756 6369 JUN. 30 30 SEPT. 30 2609 3202 3545 5093 6158 6646 DIC. 31 Die. 31 2792 3161 3851 2495 3099 3471 4850 6013 6568 5318 6289 6861 Fuente: The Value Line Investment Survey (Nueva York: Value Line, 1990), p. 2018. The Va/ue Line Investment Survey (Nueva York: Value Line, 1990), p. 2018. Calcule las autocorrelaciones para los periodos de desfasamiento y 2. a. Calcule las autocorrelaciones para los periodos de desfasamiento 1 y 2. Haga pruebas para determinar si estos coeficientes de autocorrelación son significativamente diferentes de autocorrelación significativamente cero, al nivel de significancia de .05. de significancia de .05. b. Use un programa de cómputo para determinar si los datos son estacionarios. estacionarios. 19. Esta pregunta se refiere al problema 18. Obtenga la prirnera diferenciaciOn para los datos de 19. Esta pregunta se refiere al problema 18. Obtenga la primera diferenciación para los datos de préstamos trimestrales del Dominion Bank. préstarnos trirnestrales del a. Calcule el coeficiente de autocorrelación para el periodo de desfasamiento 1, utilizando los coeficiente de autocOlTelación para ci periodo de desfasamiento 1, utilizando los datos diferenciados. b. Use un programa de córnputo para determinar si estos datos diferenciados son estacionarios. programa de cómputo para determinar si estos datos diferenciados son estacionarios. 20. Analice los coeficientes de autocorrelación de las series que se muestran en las figs. 4.11 a 4.14. figs. Analice los coeficientes de autocorrelación Describa brevernente cada serie. brevemente serie. CapItuto Capítulo 4 Problemas 129 AUTOCORRELAT10N AUTOCORRELATION 0.04 0 04 -0.02 -0.09 -0 09 -0.04 -0 04 0.15 015 0 05 0.05 -0.11 -0 11 0.08 0 08 0.04 0 04 -O .13 -0 13 -0.01 -0 01 0.54 054 TIME LAG TIME 12 12 11 11 10 9 9 8 8 * * 1* 1* * I 1 *1 *1 1 1* 1* * * * 7 7 6 6 5 5 1 I 1 I 1* 1* * * 4 4 3 3 2 2 1 1 * 1 * I 1 * 1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1 I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I O +1 -1 0 Figura 4.11 Coeficientes de autocorrelación del problema 20. Figura 4.11 Coeficientes de autocorrelación del problema 20. 12 11 10 9 9 8 8 * 7 6 6 5 5 7 * 1 I 1 1 I 1 * * 1 I 1 I 1 * * * 0.32 032 0.16 -0.16 -016 0.08 0.44 044 0.16 016 -0.15 -015 0.02 0 02 0.51 051 -0.07 -0 07 0.12 0 12 0.21 * * 4 4 3 2 2 1 1 1 *1 *1 * 1 * * I 1 I 1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1 I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I -1 O 0 +1 . Figura 4.12 Coeficientes de autocorrelación del problerna 20. Figura 4.12 Coeficientes de autocorrelación del problema 20. TIME LAG T1ME 12 11 10 9 * * * 8 8 7 7 6 5 5 1 1 I * I * 1 I 1 * * 1 I * 4 4 3 3 2 2 1 1 * 1 * I * 1 * 1 * 1 I * 1 I * I 1 1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1 I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I -1 O 0 +1 AUTOCORRELAT10N AUTOCORRELATION -0.22 -0.16 -O 10 -0 .10 -O .13 -013 -0.09 -0 09 0.00 0.10 0.24 024 0.43 043 0.59 059 0.71 071 0.74 Figura 4.13 Coeficientes de autocorrelación Figura 4.13 Coeficientes de autocorrelación del problema 20. problema 20. 130 Exploración de los patrones de datos y selección do Ia técnica de pronOstico de la pronóstico ExploraciOn de los patrones do Capítulo 4 CapItulo 4 TIME LAG LAG 12 12 11 10 9 9 * 1* I* * I * I *1 *1 1 I 1* 1* * 8 8 7 7 * 6 6 * 1 5 5 4 4 3 3 2 2 * I * 1 * 1* 1* 1 I I 1 1 * -1 -1 I . I . I . 1 . I . I . I . I . I . I . I . 1 . I . I . I . I . 1. 1 . I . I . 1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1I O 0 +1 AUTOCORRELATION 0.04 0 04 -0.02 -0 02 -0.09 -0 09 -0.04 -0 04 0.15 015 0 05 0.05 -0.11 -0 11 0.08 0 08 0 04 0.04 -0.13 -0.01 -O .15 -0.15 Figura 4.14 Coeficientes de autocorrelación del problema 20 Figura 4.14 Coeficientes de autocolTelación del problema 21. Un analista desea determinar si existe un patron para las utilidades por acción de Price Company, desea patrón las de Price Company, en varios estados bajo el nombre de Price Club como una empresa de mayoreo/meque opera en varios estados bajo el nombre de Price Club como una empresa de mayoreo/mepago en efectivo. Los datos son los siguientes: nudeo de pago en efectivo. Los datos son los siguientes: UTILIDADES TRIMESTRALES POR ACCiÓN DE PRICE COMPANY, PRICE COMPANY, UTILIDADES TRIMESTRALES POR ACCION 1986-1993 PERIODO CALENDARIO 1986 1987 1988 1989 1990 1991 1992 1993 DICIEMBRE MARZO .29 .34 .43 .51 .51 .56 .42 .38 AGOSTO JUN10 JUNIODICIEMBRE .24 .30 .38 .42 .47 .50 .57 .37 .32 .39 .49 .61 .63 .63 .65 .65 .60 .57 .40 .47 .63 .76 .86 .94 .95 .93 Fuente: The Value Line hivestnzent Survey (Nueva York: Value Line, 1990), p. 1646. Tite Value Investment Survey (Nueva York: Value Line, 1990), p. 1646. patrón los datos. Describa cualquier patron existente en los datos. Club a. Encuentre el valor de pronóstico de las utilidades triniestrales por acción de Price Club a. Encuentre el valor de pronóstico de las utilidades trimestrales por acción de para cada trimestre, emnpleando el enfoque no formal (el pronóstico para junio de 1993 trimestre, emnpleando el formal de 1993 sido en marzo de 1993, .38). es cualquiera que haya sido en marzo de 1993, .38). Capítulo CapItulo 4 Caso de estudio Caso 131 b. c. d. e. f. Evalúe Evalüe mediante DAM Evalúe Evalüe mediante EMC Evalúe Evalüe mediante PEMA Evalúe Evalüe mediante PME memorando resumiendo sus observaciones. Redacte un memorando resumiendo sus observaciones. ESTUDIO 4.1 CASO DE ESTUDIO 4.1 MURPHY BROTHERS fURNITURE MURPHY BROTHERS FURNITURE En 1958, los hermanos Murphy establecieron una mueblería en el centro de DalIas. A través de los años mueblerla de Dallas. A través de los años considerable y extendieron su cobertura hacia el oeste y el medio oeste. Para 1994, alcanzaron un éxito considerable y extendieron su cobertura hacia ci oeste y ci medio oeste. Para 1994, su cadena de niueblerIas se encuentra bien establecida en 36 estados. mueblerías uno de los fundadores, terminó recientemente sus estudios de administraJulie Murphy, hija de uno de los fundadores, terrninó recientemente sus estudios de administraa la empresa. Su padre y su tío habían especializado el areas, ción y se unió a la empresa. Su padre y su tb se habIan especializado en muchas áreas, pero no en el area de las habiiidades cuantitativas. En particular, ambos pensaban que no podIan pronosticar con área las habilidades cuantitativas. En particular, ambos pensaban que no podían pronosticar con precision las ventas futuras de Murphy Brothers mediante técnicas modernas computarizadas. Por este precisión motivo acudieron a Julie para que los ayudara como parte de su nuevo trabajo. que los ayudara parte de su nuevo trabajo. había estudiado pronósticos en su programa de administración y ordenó un Julie habla estudiado pronOsticosen su programa de administración y ordenó un paquete de programas, junto Minitab, utilizarlos en computadora de programas, junto con Minitab, para utilizarlos en la computadora de su oficina. Consideró primero Murphy, pero utilizar como su variable las ventas en dólares de Murphy, pero se encontró con que faltaban varios y le respondió que, su momento, historial. preguntó a su padre al años del historiai. Le preguntó a su padre al respecto y éste le respondiO que, en su momento, "no pensó que fueran tan importantes". que relacionadas con las cifras de Julie pensó que era probable que las ventas de Murphy estuvieran relacionadas con las cifras de buscar una variable apropiada en alguna de las diversas publicaciones ventas nacionales y optó por buscar una variable apropiada en alguna de las diversas publicaciones TABLA 4.8 VENTAS MENSUALES DE TODAS LAS TIENDAS AL MENUDEO. 1983-1992 VENTAS MENSUALES DE TODAS LAS TIENDAS AL MENUDEO, 1983-1992 (MILES (MILES DE MILLONES DE DOLARES) DE DÓLARES) 1983 Ene. Feb. 1984 1984 93.1 1985 98.8 95.6 110.2 1986 105.6 99.7 114.2 115.7 125.4 120.4 120.7 124.1 124.4 123.8 121.4 152.1 1987 1988 1989 122.5 118.9 141.3 139.8 150.3 149.0 144.6 153.0 144.1 142.3 148.8 176.5 1990 132.6 127.3 148.3 114.2 145.0 154.1 120.3 153.5 148.9 115.5 157.4 124.1 145.6 113.8 151.5 123.8 156.1 179.7 1991 130.9 128.6 149.3 148.5 159.8 129.0 153.9 154.6 159.9 146.7 152.1 155.6 181.0 1992 140.2 141.5 153.0 157.3 163.8 162.7 164.2 164.3 158.8 166.8 164.7 200.2 113.6 115.0 130.9 150.3 81.3 78.9 93.8 93.8 97.8 100.6 99.4 93.7 Mar. Abr. May. Jun. Jun. Jul. Ago. Sep. Oct. Nov. Dic. 100.1 97.9 100.7 103.9 125.8 103.3 103.9 111.8 112.3 106.9 111.2 104.0 109.6 113.5 132.3 113.1 120.3 115.0 115.5 121.1 113.8 115.8 118.1 138.6 106.4 81.3113.6 105.8 115.0 120.4 131.6 125.4 130.9 129.1 136.0 129.0 137.5 129.3 134.1 131.5 138.7 124.5 131.9 128.3 133.8 109.6 126.9 140.2 157.2 171.0 140.2 171.0 Fuente: Survey 01 Current Business, varios años. años. Fuente: Survey of Current Business, 132 ExploraciOn de los patrones de datos selección de la técnica de Exploración de los patrones de datos y setección de Pa técnica de pronóstico Cap itulo Capítulo 4 $200 $200 ~ ·ª s .g en ., ., "' :: 0 $175 $150 $125 ], . ] :: ., ., "' sioo $75 $75 $50 E "' Q '" ., > $25 0 11111111 III 111111111111111111111111111111!]! 111111 llI 11111111 III 1111111 1111111111111111 1984 1985 1986 1987 1983 1989 1990 11111111 111111111111111 1991 1992 1988 Año Figura 4.15 Figura 4.15 Estimación de ventas mensuales de todas las tiendas al menudeo en EVA, 1983-1992. tiendas al menudeo EUA, TIME LAG 24 23 22 1 I 1 I 1 1 I I 1 I 1 I 1 1 I 1 I I 1 I 1 1 * * AUTOCORRELATION * * * * 21 21 20 19 19 18 17 17 16 16 15 15 14 13 12 * * * * * * * * . . I 1 1 11 10 9 9 I 1 1 I * * 8 7 7 6 5 5 4 3 3 2 2 1 1 -1 I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I.I +j O +1 1 0 * I 1 * . 1 * I 1 * I 1 * 1 * 1 * 1 I I 1 . . 1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1 0.53 0.34 0.28 0.34 0.38 0.42 0.42 0.45 0.45 0.44 0.42 0.50 0.73 0.52 0.47 0.54 0.58 0.62 0.63 0.66 0.66 0.66 0.65 0.73 Figura 4.16 Autocorrelaciones de los datos de ventas de las tiendas al menudeo en EVA, para el Figura 4.16 Autocorrelaciones de los datos de ventas de las tiendas al menudeo en EUA, para el caso de estudio 4.1. estudio 4.1. caso Capítulo CapItulo 4 Caso de estudio estudlo 133 Después de buscar en una copia de o/Current encontró el historial federales. Después de buscar en una copia reciente de Survey of Current Business, encontró el historial mensuales de todas las tiendas al menudeo EVA y decidió usar esta variable como de las ventas mensuales de todas las tiendas al menudeo en EUA y decidió usar esta variable como sustituto de su variable de interés, ventas en dólares de Murphy Brothers. Razonó que si podía establecer en dólares de Murphy Brothers. Razonó que si podia establecer pronósticos precisos nacionales, podria relacionar estos pronósticos con las propias pronósticos precisos para las ventas nacionales, podría relacionar estos pronósticos con las propias obtener el pronóstico deseado. ventas de Murphy y obtener el pronóstico deseado. presenta datos reunidos por Julie fig. 4.15 muestra una gráfica de datos La tabla 4.8 preSenta los datos reunidos por Julie y la fig. 4.15 muestra una grafica de datos obtenida programa de cómputo. Julie comenzó análisis empleando la computadora obtenida por su programa de cómputo. Julie comenzó su análisis empleando la computadora para de los coeficientes de autocorrelación. desarrollar una gráfica de los coeficientes de autocorrelación. Después de examinar el correlograma de la Después de examinar el correlograma de la fig. 4.16, le pareció obvio a Julie que sus datos tuvieran pareció Julie que sus datos tuvieran primeros coeficientes autocorrelación grandes y gradualmente caen una tendencia. Los primeros coeficientes de autocorrelación son muy grandes y gradualmente caen hacia cero al transcurrir el tiempo. Para hacer estacionaria Ia serie con el fin de considerar varios métodos hacia transcurrir estacionaria la el fin de considerar varios métodos de pronóstico, Julie decidió hacer una primera diferenciación de sus datos para ver si podIa quitar la si podía quitar la El correlograma para la se muestra en la fig. 4.17. tendencia. El correlograma para La primera diferenciación de datos se muestra en la fig. 4.17. T1ME LAG 24 23 22 21 20 19 18 18 17 16 16 15 14 13 13 * * 1 I 1 I I 1 1* 1* 1* 1* 1* *1 *1 1* 1* * * * * * 12 12 11 11 10 9 9 8 8 * * 1 I I 1 I 1 1 I 1 1* 1* 1* 1* 1* 1* *1 *1 1* 1* * * 7 7 6 6 5 5 4 3 3 2 2 1 1* 1* * * 1 I 1 1 I AUTOCORRELAT10N AUTOCORRELATION 0.76 076 -0.30 -0.21 -021 0.05 0 05 0.03 0 03 0.06 0 06 -0.06 -0 06 0.06 0 06 0.01 0 01 0.02 0 02 -0.19 -019 -0.31 088 0.88 -0.34 -0.23 0.05 0 05 0.03 0 03 0.06 0 06 -0.05 -O 05 0.06 0 06 0.02 0 02 0.03 0 03 -0.21 -0.34 1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1 1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1. I -1 O 0 +1 Figura 4.17 Autocorrelaciones de la primera diferenciación Figura 4.17 Autocorrelaciones de la prirnera diferenciación de los datos de ventas de las tiendas al EVA, para el caso de estudio 4.1. menudeo en los EUA, para el caso de estudio 4.1. 134 Exploración de los patrones de datos y selección de la técnica de pronóstico ExptoraciOn de los patrones de selecciOn de Ia técnica de pronóstico Cap [tub 4 Capítulo PREGUNTAS 1. 2. 3. 4. ¿A qué conclusion debe liegar Julie con respecto a las ventas a! menudeo? conclusión llegar las ventas al menudeo? ,Ha ¿Ha logrado Julie algOn progreso para encontrar una técnica de pronOstico? Julie algún encontrar una técnica de pronóstico? ¿Qué técnicas de pronOstico deberIa intentar Julie? Qué técnicas de pronóstico debería ¿Cómo sabrá Julie qué técnica funciona mejor? técnica funciona Cónio CASO DE ESTUDIO 4.2 ESTUDIO 4.2 MR. TUX MR. varias tiendas de renta Mr. Tux, comienza a pronosticar la variable más John Mosby, propietario de varias tiendas de renta Mr. Tux, cornienza a pronosticar la variable rnás impOltante de su negocio, ventas mensuales en dólares (véanse los casos de estudio Mr. Tux al final de iniportante de su negocio, ventas mensuales en dólares (véanse los casos de estudio Mr. Tux a! final de los caps. I y 2). Una de sus empleadas Virginia Perot, reunió los datos de ventas que se presentan en el caps. 1 datos de ventas que se presentan en el caso de estudio del cap. 2. del cap. 2. Jolm tiene un amigo con el que conversa sobre sus esfuerzos de pronóstico y éste le ofrece utilizar John el que conversa sobre sus esfuerzos de pronóstico éste le ofrece utilizar su programa de córnputo Sybil/Runner. John le echa un vistazo al programa y decide usarlo para cómputo Sybil/Runner. le vistazo programa decide usarlo para su pronosticar sus datos de ventas mensuales. Utiliza los 96 meses de reunidos pronosticar sus datos de ventas mensuales. Utiliza los 96 meses de datos reunidos y hace que el programa programa desarrolle el siguiente correlograma: I Ix x Ix x .51X I X X .5 lxx x x xx ix x x x X X I X 0.0 1 I xx ix xxx xxx xxx xxx x xx - x - xxxx x x ix xxx xxx xxx xxx x xxx xxx xxxxx ixxx -x- -x- -x- -x- -x- -x- xxx xx -x- -x- -x- -x- -x- -x- -x- -x- -x-x xxx xxx -x- -x- -x- -x- -x- xxx -x- -x- -x-xi-x-x--x--x--x--x--x-x--x-x--x--x--x--x--x--x--x--x--x--x--x--x--x--x x x X X X X X X X X X X X X X X X X X X X X X X xxxxxxx xxxxxxxxxxxxxxxx x x x x x x x x x x x x x x x x x X xx X X xxx x xxx x xx X X X xxX X x X I 1 I 1 I 1 I -.5 1 51 I 1 I 1 1 I 1 -+- -+- -+- -+- -+- -+- -+- -+I-+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+-+3 7 9 10 11 12 13 14 LAG= 1 2 4 5 6 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 16 17 18 19 20 21 22 23 24 LAG 1 8 COR 0.77 0.29 0.35 COR 0.77 0.48 0.31 0.29 0.35 0.57 0.51 0.28 0.17 0.13 0.14 0.34 0.51 0.57 0.45 0.27 0.37 0.41 0.70 0.36 0.26 0.12 0.17 0.19 0.40 0.12 VALUE 0.27 0.41 programa reporta que " ... hay algún tipo de patrón en los datos, es decir, los datos no presentan El programa reporta que "... hay algán tipo de patron en los datos, es decir, los datos no presentan distribución aleatoria, ya que una distribuciOn aleatoria, ya que hay 18 valores que se ubican fuera de los límites de control". Debido lImites de a que todos los coeficientes de autocorrelaciOn son positivos y se desvanecen. John concluye que sus los coeficientes de autocorrelación son positivos y se desvanecen. datos tienen una tendencia. tendencia. Capítulo CapItulo 4 Caso de estudio 135 solicita Entonces, solicita al programa la primera diferenciación de los datos y ejecuta un correlograma: I I I I I I x X x X X X I .5 I .51 I I I I I I I- x X x X -xX - - - xX X X - I I X X -xX XX xx - - . - X x X x -xx XX xx - xx - x X x X - 0.0 I-X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X0.0 I-X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X- lxxx I- I X X X X X X • X X I-X--X-X.-XX X X X - xxx xx - - - - X X X -X- xx • X X X X X- xxx X X - xx XX xx I I I I -.5 I -.51 I I I I I I I-+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+I-+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+LAG= 1 2 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 4 5 7 8 9 10 11 12 13 14 15 16 17 18 20 21 22 23 24 3 6 LAG 1 -.07 -.16 COR -.06 -.14 -.18 -.19 -.13 0.08 -.05 -.14 -.08 -.07 -.16 0.20 VALUE -.24 0.18 -.14 0.21 -.18 0.68 -.17 0.13 -.17 0.15 -.17 0.42 -.18 0.13 mensaje, excepto que solo cuatro coeficientes se ubican fuera de los Esta vez, recibe el mismo mensaje, excepto que sólo cuatro coeficientes se ubican fuera de los lImites de control. El programa establece que "....1os datos son estacionarios en la primera diferencialímites ".. los datos son estacionarios en ción". John coeficientes de autocorrelación en los periodos de ciOn". John advierte que se presentan coeficientes de autocorrelaciOn significativos en los periodos de 12 Y que sus son estacionales. desfasamiento 12 y 24 y concluye que sus datos mensuales son estacionales. PERIODO DE DESFASE COEFICIENTE PERIODO DE DESFASE COEFICIENTE 12 24 .68 .42 tem1ina El programa termina calculando el porcentaje de la varianza en los datos originales explicada por varianza en los datos originales explicada por los factores en el análisis: en el análisis: % FACTOR Datos Tendencia Estacionalidad Aleatorio EXPLICADO 100 6 45 49 TAREA 1. Resuma en un párrafo, dirigido a un directivo, no a un pronosticador, los resultados del análisis pán-afo, dirigido directivo, Resuma de John. 2. Describa los efectos de Ia tendencia y la estacionalidad que parecen estar presentes en las ventas la de Mr. Tux. 3. ¿Cómo explicaría la línea "aleatorio = 49%" que aparece al final de Ia impresión de salida del la salida del Córno explicaria Ia lInea "aleatorio = 49%" que aparece al final Sybil/Runner? programa Sybil/Runner? 4. Suponga que el periodo de desfasarniento 36 es significativo, ¿concluiría que la estacionalidad el periodo de desfasamiento 36 es significativo, concluirIa la estacionalidad tiene una tendencia? De ser asI, explique qué significa una tendencia en la estacionalidad. tendencia? así, explique qué significa una estacíonalidad. 136 Exploración de los patrones de datos y selección de Ia técnica de pronôstico la pronóstico ExploraciOn de los patrones de selecciôn Capítulo 4 Capltulo ESTUDIO 4.3 CASO DE ESTUDIO 4.3 CONSUMER CREDIT COUNSELING CREDIT de Consumer describió 1 (caso de estudio 1.2) La operación de Consumer Credit Counseling (CCC) se describió en los caps. 1 (caso de estudio 1.2) de estudio 3.4). y 3 (caso de estudio 3.4). A Mary Harnishfeger, Director Ejecutivo, le preocupa el tamaño y calendario del equipo de equipo de A Marv Hamishfeger, Director Ejecutivo, le preocupa el tamaño calendario personal para el resto de 1993. Mary explica el problema a Dorothy Mercer, recién electa presidenta resto de 1993. Marv explica el problema a Dorothy Mercer, recién electa presidenta del comité ejecutivo. Después de meditar el problema, Dorothy concluye que CCC necesita analizar el cornité ejecutivo. Después de meditar el problema, Dorothy concluye que CCC necesita analizar el número nuevos clientes nñmero de nuevos clientes adquiridos cada mes. Dorothy, quien trabajó en una empresa de servicio trabajó local, y está fan1iliarizada con diversas técnicas de exploración de datos, estuvo de acuerdo en analizar y farniliarizada con diversas técnicas de exploración de datos, estuvo de acuerdo en analizar el problema. Para ello, solicitó Marv los datos de nuevos clientes atendidos por mes. Marv le el problema. Para ello, solicitó a Mary los datos de nuevos clientes atendidos por mes. Mary le datos número proporcionó los datos mensuales del nñrnero de nuevos clientes atendidos por CCC en el periodo de atendidos enero de 1985 a marzo de 1993: 1993: 1985: 1985: 1986: 1986: 1987: 1987: 1988: 1989: 1990: 1990: 1991: 1992: 1992: 1993: 182 102 145 101 101 150 127 171 166 152 99 128 113 103 103 113 153 153 138 102 151 102 146 175 185 185 172 175 138 138 175 151 151 199 121 121 136 75 77 112 128 112 150 100 100 107 100 100 100 153 110 153 168 142 142 112 108 112 136 87 63 73 92 138 106 106 120 121 121 141 141 149 149 77 83 122 122 131 115 115 98 117 117 152 147 104 96 78 97 121 121 151 168 108 97 108 128 88 94 98 131 131 128 128 145 145 82 141 141 118 93 135 135 147 151 149 74 97 102 103 103 141 141 121 121 121 121 169 169 75 75 87 87 98 104 67 110 126 138 92 102 TAREA 1. Explique córno utilizó Dorothy el análisis de autoconelación para explorar el patron de datos Explique cómo utilizó Dorothy el análisis autocorrelación explorar el patrón de datos número de clientes atendidos por CCe. para el nürnero de clientes atendidos por CCC. 2. ¿Cuál fue Ia conclusion de Dorothy después de terminar el análisis? la conclusión Dorothy después de terminar el análisis? ,Cuál 3. ¿Qué tipo de técnica de pronóstico recomendó Dorothy para este conjunto de datos? ,Que VERSIÓN ESTUDIANTIL DE FORECAST PLUS VERSION ESTUDIANTIL DE FORECAST seleccionando la menú Se entra al paquete de exploración de datos seleccionando Ia opción 2 del menu principal. archivo con el mensaje: El sistema le preguntará el nombre del archivo de datos, con el mensaje: What is the name of the data file? of the data file? What is CREDIT menú seis técnicas de exploración. En la aparece: El menu le permite elegir entre seis diferentes técnicas de exploración. En Ia pantalla aparece: Data file name: name: Variable: B:CREDIT CLIENTS NUMBER OF CLIENTS ***Exploratory Package*** l. Plot 1. Time Plot Versión estudiantil de Forecast Plus Version estudiantil de Forecast PIus 2. 3. 4. 5. 6. 7. 4235 HT Robust Smoothing 4235 HT Robust Plot (trend/cycle variation) Box Plot (trend/cycle variation) Aggregate Box Plot (seasonal variation) Plot (seasonal variation) Spread vs Level Plot Plot Spread vs Autocorrelation function function Return to Main Menu Return to Which? 137 AUTOCORRELATION FUNCTION 99 Observations in the Working Series 99 Observations in the Mean of the Working Series = 122.15 Series = 122.15 Standard Deviation of the 30.043 Standard Deviation of the Working Series = 30.043 Lag Value 0.51 0.45 0.37 0.36 0.31 0.27 0.28 0.28 0.22 0.24 0.31 0.48 0.33 0.35 0.19 0.22 0.32 0.12 0.19 0.23 0.28 0.18 0.29 0.44 0.25 0.22 0.14 0.16 0.24 T-Value -1.0 Value -1.0 5.05 3.63 2.65 2.41 1. 99 1.99 1.67 1. 68 1.68 1.62 1.22 1.35 1. 70 1.70 2.56 1. 63 1.63 1.68 0.91 1.04 1.50 0.54 0.85 l. 01 1.01 1.26 1. 26 0.77 1.25 1. 25 1.89 1. 05 1.05 0.91 0.56 [ 0.0 : ****] ******** 5.05 ;*****J***** 3.63 :******]** 2.65 :******J** +1. O +1.0 1 2 3 3 4 4 5 5 1 2 [ : [ [ [ [ [ [ [ [ [ [ :*******] :*******) :*******) .******* 6 6 7 8 8 9 9 10 11 12 12 13 14 15 15 16 17 18 19 19 20 20 7 1.22 :********] : ********J *** .******** ] : [ [ :*********] [ [ ] 0.91 ] 1.04 ] ] ] ] ] ] ] : ***********] .****** [ [ 21 21 22 22 23 23 24 [ [ [ [ [ [ [ [ 25 25 26 26 27 27 28 28 29 29 30 30 31 31 32 33 : [ [ -0.07 0.09 -0.00 0.13 0.66 0.98 -0.26 0.37 -0.01 0.50 : - [ [ [ ·**** .****** ** -0.26 . 0.66] ] ] ·** ·*** --- [ [ --- ] ] 0.50 ] - - - - -- -- -- -- -- -- - - - - - - -- -- - - - - - - - - - - - - - - - -: = ] = Estimated Two-Standard Error Limits Error Limits Box-Pierce Chi-Square Statistic with 33 Degrees of Freedom 261.7 Box-Pierce Chi-Square Statistic with 33 Degrees of Freedom = 261.7 Figura 4.18 Número de clientes-Análisis exploratorio de los datos del caso de estudio 4.3. Figura 4.18 Nürnero de clientes-Análisis exploratorio de los datos del caso de estudio 4.3. 138 Exploración de los patrones de datos y selección de Ia técnica de pronOstico la pronóstico ExploraciOn de los patrones de AUTOCORRELATION FUNCTION in 98 98 Observations in the Working Series Series of the Working Series = .17 Mean of the Working Series = .17 Standard Deviation of the Working Series = 28.9831 of the Working Series 28.9831 Capítulo 4 Capitulo Lag 1 1 2 2 3 3 4 5 5 6 6 7 7 8 8 9 10 11 11 12 12 13 13 14 14 15 15 16 17 17 18 19 20 21 21 22 23 24 24 25 26 27 28 29 30 31 31 32 Value -1. O T-Value -1.0 0.0 ] ] ] +1.0 :---------------------------------------------------: -0.42 0.05 -0.04 0.01 0.02 -0.07 0.02 0.03 -0.06 0.00 -0.09 -0 09 0.22 0 22 -O .15 -0 15 0.13 0 13 -O .13 -0.13 -0.04 0.24 0 24 -0.21 0.01 -0.02 0 11 0.11 -O .14 -0.14 -0.04 0.24 0 24 -0.11 0.04 -0.07 0.00 0.26 0 26 -0.33 -0 33 0.23 0 23 -O .18 -0.18 -4.18 0.42 -0.34 0.10 0.19 -0.58 0.19 0.27 -0.54 0.04 -0.72 -0 72 1. 81 1 -1.22 -1 22 1. 02 1 -1.04 -0.35 1 1. 87 -1. 57 -1.57 0.11 -O .12 -0.12 0.78 0 78 -1.05 -0.29 1. 70 1 -0.76 0.29 -0.49 0.01 1. 81 1 -2.24 -2 24 1 1. 49 -1.11 : ******[****: : : : [ [ [ [ [ [ [ Ii [ [ ·* * . : ] ·* **:. ** : : ] : [ [ ·* [ ·* [ **: ** [-0.54 . [ II ] ] ] ] ] ] 0.19 : [ **. [ [ :*****] ****. [ ****. .*** [ ·*** ***: [ *** . *. [ [ :*****] [ [ [ [ [ [ *****: [ *****. [ [ .*** [ ·*** [ [ : [ [ [ [ [ [ [ [ [ ****: [ **** : * . [ [ :******) ***: [ -0.76 . *** [ 0.29 ·* **: ** [ -0.49 . [ [ :******) : *[******: .****** [ ] ****:. **** : ---------------------------------------------------: [ ] = Estimated Two-Standard Error Limits Two-Standard Error Limits Box-Pierce Chi-Square Statistic with 32 Degrees of Freedom = 76.4 32 of 76.4 Probabili ty = 0 O Probability Figura 4.19 Námero de clientes-Análisis exploratorio, primera diferenciación, para el 4.19 Número de clientes-Análisis exploratorio, primera diferenciación, caso de estudio 4.3. 4.3. El primer paso en cualquier análisis exploratorio debe ser una gráfica del periodo cualquier análisis exploratorio debe periodo El Plot). (Time Plot). Por lo regular, es mucho lo que se puede aprender al observar una gráfica de Para nuestro ejemplo, elegimos la función opción los datos sin procesar. Para nuestro ejemplo, elegirnos La función de autocorrelación, opción la pantalla aparece lo siguiente: 6. En la pantalla aparece lo siguiente: Pronôstico mediante hojas de cálculo Pronóstico hojas cálculo 139 Autocorrelation Function Transformation to original data series: data series: (l=Reciprocal. 21/Sqrt, 3=1/4th root, (lReciprocal, 2=1/Sqrt. 3=1/4th root. 4=Log. 5=4th root. 6=Sqrt. 7None) 4Log, 5=4th root, 6=Sqrt, 7=None) Degree of regular differencing: regular differencing: Degree of seasonal differencing: seasonal differencing: seasonality: Length of seasonality: Number of lags to print: lags to print: 7 7 o 0 o 0 12 A Press ENTER to accept: ENTER to accept: Para ejecutar un correlograrna para nuestros datos, podemos utilizar las opciones por correlograma para nuestros datos, podernos utilizar las opciones omisión ya provistas. Deseamos utilizar la serie de datos originales sin diferenciación y, ya ornisión provistas. Desearnos utilizar Ia serie de datos originales sin que los datos son mensuales, la estacionalidad es 12. El niirnero de periodos de desfase a mensuales, estacionalidad es 12. número de periodos de desfase que imprimir tomará, por omisión, el valor de autornático (mirnero de puntos de datos entre 3). automático (número de puntos 3). imprirnir tornará, omisión, presionar <Enter>, se imprime la infonnación de la fig. 4.18. Al presionar <Enter>, se imprirne la información de la fig. 4.18. Los coeficientes de autocorrelación muestran que los datos no son estacionarios Los coeficientes de autocorrelación muestran que los datos no son estacionarios (tienen tendencia). La diferenciación se emplea (tienen tendencia). La diferenciación se eniplea para elirninar la tendencia. Los datos se eliminar tendencia. datos se vuelven procesar usando la diferenciación regular de 1. La fig. 4.19 muestra el vuelven a procesar usando la diferenciación regular de l. La fig. 4.19 muestra el correlograma de los datos de la primera diferenciación. la primera diferenciación. correlograrna de los PRONÓSTICO MEDIANTE HOJAS DE CÁLCULO PRONOSTICO MEDIANTE HOJAS DE CAL CULO El El problema Vernon desea emplear Lotus 1-2-3 (versión 2.0) para calcular los coeficientes de Harry Vernon desea emplear Lotus 1-2-3 (version 2.0) para calcular los coeficientes de autocon'elación de primer orden para los datos que se presentan en tabla 4.1. Dichos autocorrelación de primer orden para los datos que se presentan en la tabla 4.1. Dichos muestran en la tabla 4.2. cálculos se muestran en Ia tabla 4.2. La solución mediante hoia de cálculo La solución mediante hoja de cálculo l. Cargue el archivo que guardó en el cap. 3. Escriba /FILE RETRIEVE o /FR. Esto guardó el cap. 3. Escriba /FILE RETRIEVE o /FR. Esto 1. Cargue archivo equivale a seleccionar FILE en el menu principal y RETRIEVE en el subrnenü. En Ia submenú. la en el menú principal aparecerá el mensaje: pantalla aparecerá el mensaje: of file to retrieve: A:/*.WK1 Name of file to retrieve: A:/*.WK1 140 Exploración de los patrones de selección de Ia técnica pronóstico ExploraciOnde los patrones de datos y selecciOn de la técnica de pronôstico Cap Itulo Capítulo 4 En la tercera ilnea aparece el nombre de Ia hoja de cálculo que guardó en el cap. 3, línea aparece la el cap. 3, En VCRl.WKl. Use las teclas de flechas para resaltar este archivo y oprima <Enter>. VCR1 .WK1. Use las teclas de flechas para resaltar este archivo y oprima <Enter>. En VCRl.WKl. la pantalla aparece la hoja de cálculo VCR1 .WKI. 2. Coloque el apuntador de celda en A4, teclee cinco espacios y luego Y,, oprima <--.,> y cinco espacios y luego Y" teclee cuatro espacios y después Y1. Oprima <Enter>. Y1-)' Oprima <Enter>. 3. Para crear la columna Y, oprima /COPY ooIC. Coloque el apuntador de celda en B5. columna Y,-b oprima ICOPY IC. Coloque el apuntador de celda Lotus le solicita el rango de celdas a copiar, con el mensaje: Enter range to copy FROM: range to copy FROM: B5... B5 B5 .B5 Presione Ia tecla de punto para anclar el resaltado comenzando en la celda B5. Presione la de el resaltado comenzando en Ia celda B5. Presione B 15. la tecla de flecha hacia abajo <.L> para extender el área resaltada hasta B15. Oprima flecha abajo <.1-> para extender el area resaltada <Enter>. Coloque ahora el apuntador de celda en C6 y presione <Enter> para copiar la <Enter>. el de C6 presione <Enter> para copiar la columna en Ia pantalla. En la fig. 4.20 se muestra el resultado. la se muestra el resultado. A A 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 11 11 12 12 13 14 14 15 15 16 17 18 19 20 20 21 21 22 23 23 24 B B C C D D E F G G FT H VERNON' S STORE VERNON'S MUSIC STORE NUMBER OF VCRS SOLD SOLD Month January February March April May June July August September October November December Yt 123 130 125 138 145 142 Yt-1 123 123 130 125 125 138 138 145 145 142 142 141 141 146 147 147 157 157 150 -19 - 12 -12 - 17 -17 -4 -4 3 3 4 4 5 5 15 8 8 18 141 146 147 157 150 160 1704 0 -1 -1 o - 19 - 12 - 17 -17 -4 -4 3 3 0 361 144 289 16 9 9 228 204 68 - 12 -12 0 o o 0 o O 0 -1 -1 4 4 5 5 15 15 8 8 -18 1 1 16 25 25 225 64 324 1474 O 0 -4 20 20 75 120 144 843 Mean = 142.00 0.571913 r r = Figura 4.20 Coeficiente de autocorrelación de primer orden para el nñmero de videonúmero Figura 4.20 Coeficiente de autocorrelación de primer caseteras vendidas por Vernon' s Music Store. caseteras vendidas Vernon's Music Store. Paquetede cOmputo Minitab Paquete de cómputo Minitab 141 la columna (Y,Y), calcule la media de la columna Y,. 4. Para crear la columna (Y, - Y),calcule la media de la columna Y. Coloque el apuntador de celda en B 19, escriba MEAN =. Presione <---7>. Ahora está ubicado en C19. Lotus está ubicado en C19. Lotus B19, =. Presione <-p>. 1-2-3 tiene una función integrada que le permite calcular la media aritmética de los tiene una función integrada catcular la media aritmética de los <Enter>. comprendidos @AVG(B5 ..B 16) valores comprendidos en un rango. Escriba @AVG(B5..B16) y oprima <Enter>. En C19 aparece una media de 142. Ahora colóquese en D5 y escriba la fórmula +B5-142. 142. Ahora colóquese en D5 y escriba la formula +B5-142. e19 El signo más (+) le indica al programa que se va a introducir una formula. Oprima (+) le indica al programa que se va a introducir una fórmula. Oprima <Enter> y en D5 aparece -19.Ahora presione /COPY para copiar la formula al resto de D5 aparece 19. Ahora presione /COPY para copiar la fórmula Oprima la tecla de flecha hacia abajo <L> la columna. Oprima la tecla de flecha hacia abajo <.1> y la tecla de punto para indicar ptmto pam el comienzo del resaltado en la celda D6. Oprima <.1> para ampliar el resaltado hasta del resaltado en la celda D6. Oprima <> para ampliar el resaltado hasta la fig. 4.20. D16. Oprima <Enter>. El resultado se muestra en Ia fig. 4.20. Nótese que si mueve el D 16 Y línea +B 16-142. indicador de celda a D16 y observa la ilnea superior, ésta mostrará +B16-142. 5. Para crear Ia columna (Y,_1 -Y), coloque el indicador de celda en E6, escriba Ia fOrmula crear la columna (Y,_I - Y), coloque el indicador de celda escriba la fórmula +C6-142 y cópiela al resto de la columna. +C6-142 y cOpiela at resto de Ia colunma. 6. Para crear la columna (Y,-- y)2, coloque el indicador de celda en F5, escriba la fórmula crear columna (Y, Y)2, coloque et indicador de celda en F5, escriba la formula y cópiela at +D5*D5 y cOpieta al resto de la columna. 7. Para crear la ñltima cotumna, coloque el indicador de celda en G6, escriba la fórmula última columna, coloque el indicador de cetda en G6, escriba ta formula cópiela al resto de la columna. +D6*E6 y cópieta at resto de la columna. Para sumar las columnas, coloque ci apuntador de cetda en Bl7 Y escriba 8. Para sumar las columnas, coloque el apuntador de celda en B 17 y escriba @SUM(B5..B16). Oprima <Enter> y en B17 aparecerá la suma 1704. NOtese que @SUM(B5 .. B16). Oprima <Enter> Bl7 la suma 1704. Nótese en Ia lInea uno en la parte superior de la pantalla aparece ta función de suma en la línea uno en la parte superior de la pantalla aparece la función de suma @SUM(B5 ..B16). Copie ahora la suma @SI1M(B5..Bl6). Copie ahora Ia surna de B17 en C17 hasta G17. 9. Por ültimo, catcule el coeficiente de autocorrelaciôn colocando el apuntador de celda último, calcule autocorrelación colocando el de B21 presionar <---7>, escriba la fórmula La en B21 y escribiendo r =. Después de presionar <-3>, escriba Ia fOrmula +G17/F17. La respuesta aparecerá en C21. en C21. PAQUETE DE CÓMPUTO MINITAB PAQUETE DE CÔMPUTO MINITAB El problema. En el ejempto 4.3, Maggie Trymane, una analista de Sears, desea Maggie Trymane, una analista En ejemplo El ventas para 1992. Ella requiere detenninar el patrón pronosticar las ventas para 1992. Ella requiere deterrninar el patrOn para los datos de ventas de los años 1955 a 1991. años 1955 a 1991. 142 Exploración de los patrones de datos y selecciOn de Ia técnica de pronOstico datos y selección de la técnica de pronóstico ExploraciOn de los Capítulo 4 Cap Itulo La solución con Minitab La solución con MTB > READ 'SEARS.DAT' INTO Cl > 'SEARS.DAT' INTO Cl 31 READ 31 ROWS READ Cl Cl 3307 MTB > ACF Cl > Cl ACF of Cl of Cl -1.0 -0.8 -0.6 -0.4 -0.2 1.0 0.8 0.6 0.4 0.2 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 11 11 12 12 13 13 14 14 15 15 3556 3601 3721 S S 0.0 0.2 0.4 0.6 0.8 1.0 0.6 0.8 1.0 0.2 --+ +- - - -+- - - -+- - - -+- - - -+- - - -+- - - -+- -- -- -+- - - -+- - -- -+- - -+- 0.865 0.725 0.725 0.591 0.591 0.477 0.477 0.371 0.371 0.271 0.271 0.220 0.220 0.158 0.158 0.094 0.094 0.041 0.041 XXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXX xxxxxxxxxxxxxxxx XXXXXXXXXXXXX xxxxxxxxxxxxx XXXXXXXXXX xxxxxxxxxx xxxxxxxx XXXXXXXX xxxxxxx XXXXXXX XXXXX xxxxx XXX xxx XX xx x X xx XX xxxx XXXX xxxx XXXX XXXXX xxxxx XXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXX 0.005 -0.005 -0.053 0.053 -0.100 0.100 -0.140 0.140 -0.174 0.174 MTB > DIFFERENCES 1 Cl, STORE C2 > DIFFERENCES 1 Cl, C2 > ACF C2 MTB > ACE C2 ACF of C2 of C2 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 1.0 0.8 0.6 0.4 0.2 0.0 0.2 0.4 0.6 0.8 1.0 +- - - -+- - - -+- - - -+- - - -+- -- - -+- -- - -+- -- -- -+- - - -+- - - -+- -- - -+--+ 0.275 XXXXXXXX 0.248 XXXXXXX 0.529 xxxxxxxxxxxxxx XXXXXXXXXXXXXX 0.177 xxxxx XXXXX 0.055 XX xx 0.069 XXX xxx 0.080 xxx XXX 0.024 xx XX 0.007 X x 0.020 -0.020 x X 1 1 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 2 cómputo Paquete de cOmputo SAS 143 11 11 -0.027 12 12 -0.025 13-0.072 13· -0.072 14 -0.087 15 -0.076 15 xx xx xxx xxx XX XX XXX XXX xxx XXX MTB > STOP > STOP El comando READ se usa para cargar en C1 el archivo de datos denominado • El comando READ se usa para cargar en Cl el archivo de datos denominado SEARS.DAT. cornando emplea para calcular los coeficientes de autocorrelación los datos • El comando ACF se emplea para calcular los coeficientes de autocorrelación de los datos de ventas de Sears. • El comando DIFFERENCES se utiliza para calcular la primera diferenciación de los DIFFERENCES se utiliza para calcular la primera diferenciación de los datos en C1 y almacenar estas diferencias en C2. Cl y almacenar estas usa para calcular los coeficientes de autocorrelación para la primera • El comando ACF se usa para calcular los coeficientes de autocorrelación para la primera diferenciación de los datos de ventas de Sears. PAQUETE DE CÓMPUTO SAS PAQUETE DE CÔMPUTO ejemplo 4.4, Perkin KendelI, un analista de Outboard Marine, Problema. En el ejemplo 4.4, Perkin Kendell, un analista de Outboard Marine, deséa la autocorrelación para detenninar Si SUS desea usar la autocorrelación para deterrninar si sus datos son estacionales. Solución con SAS con SAS $ SAS/CC=PRINT SAs/cc=PRINT OPTIONS PAGESIZE=60 LINESIZE=80; OPTIONS PAGESIZE6O LINESIZE8O; "SAS AUTOCORRELATION EXAMPLE"; TITLE "SAS AUTOCORRELATION EXAMPLE"; OUTBOARD; DATA OUTBOARD; INPUT SALES; SALES; CARDS; 147 .6 147.6 251.8 273.1 249.1 249. 1 139.3 221.2 260.2 259.5 140.5 245.5 245 .5 144 Exploración de los selección ExploraciOn de los patrones de datos y selecciOn de la técnica de pronóstico Ia técnica Capítulo Cap Itulo 4 298.8 287.0 168.8 168.8 322.6 393.5 404. 3 404.3 259.7 401.1 464. 6 464.6 479.7 264.4 402.6 411.3 385.9 232.7 309.2 309.2 310.7 293.0 205.1 205 . 1 234.4 285.4 258.7 193.2 263.7 292.5 315.2 178.3 274.5 295.4 311.8 PROC ARIMA; IDENTIFY VAR=OUTBOARD; IDENTIFY VAROUTBOARD; ENDSAS; ENDSAS; • Las dos primeras lineas proporcionan instrucciones al sistema sobre comandos e primeras líneas proporcIOnan instrucciones al sistema sobre comandos Las impresión. irnpresión. • La declaración TITLE da nombre al programa SAS. • La declaración DATA proporciona un nombre al archivo de datos. • La declaración INPUT da nombre a la columna de datos SALES (ventas). lIneas son irnágenes de tarjetas que • La declaración CARDS indica que las siguientes 40 líneas son imágenes de tarjetas que representan las ventas trimestrales de Outboard Marine de 1984 a 1992. 1984 1992. • El comando PROC ARIMA determina las autocorrelaciones significativas entre los detennina autocorrelaciones significativas entre periodos de desfasarniento dados. desfasamiento • El subcomando IDENTIFY indica que la variable para analizar es OUTBOARD. • La declaración ENDSAS hace que termine la ejecución de SAS. tennine La salida de córnputo de esta ejecución de SAS se presenta en la fig. 4.21. cómputo SAS se presenta en la fig. 4.21. Paquete de cOmputo SAS de cómputo 145 SAS AUTOCORRELATION EXAMPLE SAS Procedure ARIMA Procedure Name Name of variable = Y. = Y. Mean of working series = 284.6475 284.6475 Mean Standard deviation 82.46956 = 82.46956 Number of observations = Number 40 Autocorrelations Lag 0 O 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 Covariance 6801.228 6801 228 2866.123 2866 123 1320.944 1320 944 2121.483 2121 483 4986.262 4986 262 1206.109 -811.990 811.990 -356.159 356.159 2022.852 -1311.359 1311.359 -3004.888 3004.888 1 Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 Correlationi 9 8 7 6 5 4 3 2 101 2 345 6 7 891 . . ********************.. 1.00000 1 00000 9 0.42141 0 42141 0.19422 0 19422 0.31193 0 31193 0.73314 0.17734 -0.11939 -0.05237 0.05237 0.29742 -0.19281 -0.44182 : . *************** :**** **: *: 0 73314 0.11939 0.29742 : : ****: *********: " " marks two standard errors two standard errors 0.19281 0.44182 Inverse Autocorrelations Lag 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 Correlation -0.08825 -0 08825 -0.10834 0.10834 0.01038 -0.50030 -0.06139 0.06139 0.16114 0.06282 0.01640 0.09375 -0.04084 0.04084 -1 9 8 7 6 5 4 3 9 8 7 6 5 4 3 2 1 0 1 O 1 2 3 4 5 6 7 8 9 2 3 4 5 6 7 8 1 9 **.. ** **. : **********: **********. *. ·*** :* ·* :** ·** *:. * : : : : Partial Autocorrelations Lag 1 1 8 7 6 5 3 2 1 O 1 2 5 6 7 8 9 Correlation 1 Correlation -1 99 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 3 9 0.42141 0.02022 0.27152 0 27152 0.66908 -0.61920 O 61920 -0.38588 0 38588 -0.21644 0.21644 -O .10040 0.10040 -0.14334 0.14334 0.08322 1 2 2 3 3 4 4 : 5 5 6 6 :************* ************. : 7 7 8 8 9 9 ****: : : 10 10 : :** Procedure ARIMA Procedure Autocorrelation Check for White Noise for Noise Autocorrelations To Lag 6 Chi Square 41.03 DF 6 6 Prob 0.000 0.421 0.194 0.312 0.733 0.177 -0.119 0.119 0.733 Figura 4.21 Análisis de autocorrelación para Outboard Marine. Figura 4.21 Análisis de autocorrelación para Outboard Marine. CAPíTULO CAP1TULO Promedios móviles y métodos de atenuación 5 ACTIVIDAD A CT! VIDAD Tanto en organizaciones de compañIas de negocios como de gobierno se ha puesto un gran compañías de negocios como de gobierno se ha puesto un gran énfasis en el mejoramiento de Ia toma de decisiones. Debido a que existimos en tin medio la decisiones. un énfasis el tiempo, se ha hecho una meta común el asignar tiempo disponible junto influido por el tiempo, se ha hecho una meta comün el asignar tiempo disponible ji.mto con recursos competitivos que de alguna manera sea óptima. EstaJTIeta se puede lograr, en parte, sea optima. Estaineta parte, través de pronósticos precisos. Hace veinte años directivos decisiones a través de pronOsticos precisos. Hace veinte años los directivos tomaban su decisiones principalmente con base propio sentir e intuición sobre la evonomía y la industria. principalmente con base en su propio sentir e intuición sobre Ia economla y la industria. complementando economía la Ahora están complernentando este "sentir" hacia la economia y Ia industria con técnicas de técnicas pronóstico ya sean éstas sencillas o complejas. El incremento en el uso de microcomputasean éstas sencillas o complejas. El incremento en el uso de microcomputadoras continña fortaleciendo esta tendencia. continúa fortaleciendo esta tendencia. Este capItulo describirá tres tipos de técnicas de pronóstico: no formales, de promedios capítulo tipos técnicas de pronóstico: no formales, de promedios y de atenuación, Los métodos no formales se emplean para desarrollar modelos sencillos de atenuación. Los métodos no formales se emplean para desarrollar modelos sencillos que suponen que suponen que los periodos recientes son los mejores pronosticadores del futuro. Los los periodos recientes son los mejores pronosticadores del futuro. Los de promedio se desarrollan con base en un promedio de observaciones métodos deprornedio se desarroilan con base en un promedio de observaciones ponderadas. Los. métodos de atenuación se basan en promedios de valores anteriores de una serie en en promedios anteriores de serie en Los métodos de atenuación una fornia decreciente (exponenciai). forma decreciente (exponencial). un procedimiento métodos que La fig. 5.1 muestra tin esquema del procedirniento de pronóstico para los métodos que capítulo. Visualícese en una escala de tiempo. Usted se encuentra se abordan en este capItulo. VisualIcese en una escala de tiempo. Usted se encuentra en el ci punto la puede mirar hacia sobre observaciones pasadas de variable punto t de Ia fig. 5.1 y puede mirar hacia atrás sobre observaciones pasadas de la variable de interés (Y,) o hacia adelante en el futuro. Una vez seleccionada la técnica de pronóstico, (Y,) o hacia adelante en ci futuro. Una seleccionada la técnica de pronóstico, ésta se ajusta a los datos conocidos, y se obtienen los valores de pronostico (Y,). Ya que se valores de pronostico (Y). Ya que tienen disponibles pronóstico, se pueden comparar con las observaciones tienen disponibles los valores de pronóstico, se pueden comparar con las observaciones puede calcular el error del pronóstico (e). conocidas y se puede calcular ci error del pronóstico (e). Una estrategia tIpica para Ia evaluaciOn de métodos de pronóstico que se exponen en típica la evaluación de métodos de exponen en capítulo, siguientes pasos: este capItulo, comprende los siguientes pasos: 1. Se eligeun método de pronóstico con base en Ia intuiciOn del analista con respecto a] Seelige un método de pronóstico con base en la intuición del analista con respecto al patrón de datos. patron ci conjunto de datos en dos secciones una parte de 2. Se divide el conjunto de datos en dos secciones -una parte de inicialización y una parte depmeba. de pnieba. no Modelos no formales Usted está aqui aquí 147 Datos anteriores anteriores t Datos por pronosticar Datos Y,_3, Y,_2, Y,_1, Y,, Y,1, Y,2, Y,3, donde Y es la observación más reciente de una variable de una variable donde Y, la observación Y I ± es el pronóstico de un periodo en el futuro +1 es ci pronóstico de Figura 5.1 5.1 Esquema de pronóstico. pronóstico. 3. Se emplea Ia técnica de pronóstico elegida para desarrollar valores ajustados para la la la parte de inicialización de los datos. parte de inicialización de los datos. 4. Se utiliza la técnica pam pronosticar la parte de prueba de los datos y se determina y para pronosticar la parte de prueba de los datos y evalúa el error de pronóstico (consulte el cap. 4 para un repaso de la medición de la pronóstico (consulte el cap. 4 para un repaso de medición de evalña el precisión precision del pronóstico). 5. Se toma una decisión. La decisión pudiera ser la de emplear la técnica en su forma actual, decision. decision lade emplear la técnica modificarla, o desarrol lar un pronóstico mediante otra técnica y comparar los resultados. o desarrollar modificarla, pronOstico mediante otra técnica y comparar los resultados. MODELOS NO FORMALES NO FORMALES técnicas formales sencillas suponen los periodos recientes son los mejores Las tédnicas no formales más sencillas suponen que los periodos recientes son los mejores pronosticadores del futuro. El modelo más sencillo es pronosticadores futuro. = Vt Y'+l es el pronóstico realizado periodo para l. en donde Y1 es el pronóstico realizado en el periodo t pam el periodo t + 1. Ejemplo (5.1) 5.1 fig. 5.2 presenta las ventas de sierras por trimestre la Acme Company. Se emplea La fig. 5.2 presenta las ventas de sierras por trirnestre de Ia Acme Tool Company. Se emplea la próximo trimestre sean las mismas que Ia técnica no formal para pronosticar que las ventas del próximo trimestre sean las mismas que las del trimestre anterior. La tabla 5.1 muestra datos de 1988 a 1994. Si se usan los datos de usan los datos de las del trimestre anterior. La tabla 5.1 muestra datos de 1988 1994. 1988 a 1993 como Ia parte de inicialización y 1994 como Ia parte de prueba, el pronóstico la inicialización 1994 como la parte de prueba, el pronóstico 1988 a 1993 primer trimestre 1994 es para el primer trimestre de 1994 es + Yt Y25 = 650 y25 = 650 El error de pronóstico se determina usando la ecuación 4.4. El error para el periodo 25 es pronóstico determina usando Ia ecuación 4.4. El error para el periodo 25 es e 25 = Y25 e25 = Y25 - 5'25 = 850 - 650 = 200 = 850 - 650 = 200 El pronóstico para el periodo 26 es 850 con un error de -250. La fig. 5.2 muestra que estos pronóstico para el periodo 26 es 850 con un error de 250. La fig. 5.2 muestra que estos así se toma decisión de modificar el modelo. datos tienen una tendencia, asi que se torna la decision de modificar el modelo. Una revision de los datos del ejemplo 5.1 conduce al analista a concluir que se Una revisión de los datos del ejemplo 5.1 conduce al analista a concluir que incrementan a través del tiempo. Cuando esto sucede, se dice que son no estacionarios o incrementan a través del tiempo. Cuando esto sucede, se dice que son no 148 148 Promedios mOviles y métodos de atenuación móviles TABLA 5.1 TABLA 5.1 DE SIERRAS DE LA VENTAS DE SIERRAS DE LA ACME TOOL COMPANY, 1988-1994 COMPANY, Capítulo Cap Itulo 5 AÑO AIO. 1988 TRIMESTRE t 1 VENTAS 1 500 350 250 400 450 350 200 300 350 200 150 400 550 350 250 550 550 400 350 600 750 500 400 650 850 600 450 700 1989 1989 1990 1990 1991 1992 1993 1994 1 2 3 3 4 1 1 2 3 4 1 1 2 3 3 4 1 2 3 3 4 1 2 3 3 4 1 1 2 3 4 1 1 2 3 3 4 1 2 2 3 3 4 4 5 5 6 6 7 8 8 9 10 11 II 1 1 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 que tienen tendencia. que tienen una tendencia. Si se usa la ecuación 5.1, las proyecciones son coherentemente ecuación 5.1, las proyecciones son coherentemente se bajas. La técnica puede adaptarse para tornar en cuenta esta tendencia agregando la bajas. La técnica puede adaptarse para tomar en cuenta esta tendencia agregando la diferencia entre éste y el ültimo periodo. El modelo es último diferencia entre éste (Y Y1) Yt+1 = Y + (Y - Y -¡) +¡ = Y t t t t (5.2) La ecuación 5.2 toma en cuenta la cantidad de cambio ocurrida entre trimestres. El ecuación cuenta la cantidad de cambio ocurrida trimestres. primer trimestre 1994 es pronóstico para el primer trimestre de 1994 es y24 + ¡ = y 24 + (y24 -- Y24 - ¡) (y 24 y25 = Y24 + (y24 - y23) (Y 24 - Y23) Y25 = 650 + (650 - 400) (650 400) Y25 = Y25 = 650 + 250 250 Y25 = 900 Modelos no formales 900 149 800 ~ 700 <ti -¡¡; . ~ ~ 600 500 .§ i¡; 400 o Z 300 Z 300 200 lOO 100 I I I I I I I I OL-L-L-L-L-L-L-L-L-.L.....L.....L.....L.....L.....L.....L.....L.....L.....L.....L.....L.....L......L-..L-..L-..L-..L-..L0 1993 1989 1991 1992 1994 1991 1988 1990 I I I I I I I I I I I I I I I I Año Figura 5.2 Ventas de sierras de Ia Acme Tool Ca., 1988-1994. Figura 5.2 Ventas de sierras de la Co., Con este modelo, el error de pronóstico es error de pronóstico es e25 e 25 = Y25 - - Y25 Y25 e 25 == 8S0 -- 900 e25 850 900 e 25 ==-SO e25 50 la Para algunos fines, Ia proporción de cambio pudiera ser más apropiada que la cantidad absoluta de cambio, entonces el modelo serIa entonces el modelo sería t+1 = Vt Yr_I (S.3) (5.3) El pronóstico para el primer trirnestre de 1994, usando este modelo, es pronóstico trimestre 1994, usando Y24+1 = Y24 Y24+1 = Y24 Y24 • -- Y24Y24 - 1 Y24 Y24 Y 25 = Y24 Y25 = Y24 A • - Y23 YB 400 y 25 Y A = 6S0 650 =650 . 6S0 400 Y25 = 1,056 Y25 = I,OS6 Probablemente sería mejor si el pronosticador usara, al preparar su pronóstico, un promedio Probablernente serIa mejor si el pronosticador usara, a! preparar su pronóstico, unpromedio de los cambios absolutos anteriores o porcentajes de cambio. absolutos 150 Promedios mOviles y métodos de atenuaciOn móviles de atenuación CapItulo 5 Capítulo 5 5.1 La inspección visual de los datos de la tabla 5.1 indica que parece existir una variación estacional. Las ventas en trimestre son por lo regular mayores que aquellas en estacional. Las ventas en el primer trirnestre son por lo regular mayores que aquellas en cualquier trimestre. el patrón estacional fuerte, entonces el modelo apropiado cualquier otro trimestre. Si el patrOn estacional es fuerte, entonces el modelo apropiado pudiera ser t+I= (3 (5.4) establece que La ecuación 5.4 establece que en el siguiente trimestre, la variable tomará el mismo valor trimestre, variable tomará el mismo valor tenía en trimestre correspondiente del año anterior. El pronóstico para primer que tenha en el trimestre correspondiente del año anterior. El pronóstico para el primer 1994 trimestre trimestre de 1994 es )124+1 Y25 = Y24-3 = y21 = Y21 )125 = 750 750 La debilidad principal de este enfoque consiste en que ignora todo lo ocurrido desde el año consiste en todo pasado incluyendo cualquier patron de tendencia. Existen varias formas de introducir pasado incluyendo cualquier patrón de tendencia. Existen varias formas de introducir infonnación más reciente. Por ejemplo, el analista puede combinar enfoques y tomar en inforrnación más reciente. Por ejemplo, el analista puede combinar enfoques tomar en estacionales como tendencia. cuenta tanto las variaciones estacionales como las de tendencia. Un posible modelo es t+I = + (Y Y(_1) + ( + (Y - Y4) (5.5) donde el ténnino Yt-3 pronostica los patrones estacionales ci ténnino queda en donde el térrnino y, pronostica los patrones estacionales yy el término que queda para los últimos cuatro trimestres (tendencia). El pronóstico promedia la cantidad de prornedia la cantidad de cambio para los ültimos cuatro trimestres (tendencia). El pronOstico para el primer trirnestre de 1994, usando este modelo, seria bimestre de 1994, usando modelo, sería ~ Y 24+ 1 = - _ y 24-3 + + (Y24 - Y24l) (Y 24 - 3 Y 24 - 4 ) 24 - Y 24 - 1) + ... + (y24_3 -- y24_4) 4 4 Y25 = Y21 + (y24 - y23) + (y23 -y22) + (y22 - y21) + (y21 - y20) 4 4 Y 25 )125 ~ = 750 + (650 - 400) + (400 - 500) + (500 - 750) + (750 - 600) (650 400) + (400 - 500) + (500 750) + (750 - 600) = 750 4 )125 = = 750 + 12.5 750 + 12.5 = 762.5 762.5 aparente número modelos fonnales sólo Resulta aparente que el nñrnero y complejidad de modelos no formales posibles, solo está limitado por ingenio del analista, aunque estas técnicas deben utilizarse de manera limitado por el ingenio del analista, aunque estas técnicas deben utilizarse de manera juiciosa. Métodos de promedio 151 MÉTODOS DE PROMEDIO METODOS frecuencia, administración enfrenta la situación donde se requiere actualizar los Con frecuencia, la administración enfrenta la situación donde se requiere actualizar los pronósticos diana, semanal o mensualmente pam inventarios que contienen cientos de miles diaria, semanal o mensualmente para inventarios que contienen cientos de miles de elementos. A menudo no es posible desarrollar técnicas sofisticadas de pronóstico para elementos. posible desarrollar técnicas sofisticadas ello, llevar elemento. cada elemento. En vez de ello, para lievar a cabo esta tarea, se necesita alguna herramienta sencilo de pronóstico rápido, barato, muy sencilo y de corto plazo. probable que un administrador enfrente tal situación, emplee una técnica de Es probable que un adniinistrador que enfrente tal situación, emplee una técnica de promedio o de atenuación. Este tipo de técnicas utilizan una forma de promedio ponderado atenuación. técnicas utilizan una forma de promedio ponderado suposición observaciones anteriores para atenuar fluctuaciones de corto plazo. de observaciones anteriores para atenuar fluctuacionesde corto plazo. La suposición fundamental de estas técnicas es que las fluctuaciones en los valores anteriores representan fundamental las fluctuaciones en los valores anteriores representan puntos de partida aleatorios de alguna curva atenuada. Una vez que se identifica esta curva, plmtos atenuada. el futuro para producir un pronóstico. se puede proyectar hacia el futuro para producir un pronóstico. Promedios sim pies Promedios simples históricos se pueden atenuar en muchas formas. El objetivo consiste Los datos histónicos se pueden atenuar en muchas formas. El objetivo consiste en usar datos desarrollar anteriores para desarroliar un modelo de pronóstico para periodos futuros. En esta sección, modelo de pronóstico periodos futuros. el promedios simples. Al igual fonnales, se considera ci método de prornedios simples. Al igual que en los métodos no forrnales, se toma una decision para utilizar los prirneros t puntos de datos corno Ia parte de inicialización decisión plimeros como la y el resto corno la parte de prueba. A continuación, se usa la ecuación 5.6 para promediar como prueba. continuación, se usa la ecuación 5.6 para promediar la la palie inicial ización el siguiente (calcular Ia media de) Ia parte de inicialización de los datos y para pronosticar ci siguiente periodo. (5.6) Por ültirno, se determinan los errores de pronóstico y se toma una decisión con respecto a último, determinan los errores de pronóstico y torna urìa decision con respecto a lo adecuado de la técnica de pronóstico. la técnica de pronóstico. Un promedio simple se obtiene encontrando la media de todos los valores Un promedio simple se obtiene encontrando la media de todos los valores después esta media para pronosticar el siguiente periodo. pertinentes y usando después esta media para pronosticar el siguiente periodo. Ejemplo Ej emplo 5.2 El método de prornedios siniples se demuestra usando las ventas de sierras por trimestre de promedios simples se demuestra usando las sierras por trimestre de El método Company se presentan en la tabla 5.1. El pronóstico para el primer trimestre Acme Tool Company que se presentan en la tabla 5.1. El pronóstico para el primer trimestre de 1994 es n A '\' y Y24+1 = L (=) -n t A Y25 Y25=~ 9,800 24 Y25 Y == 408.33 25 152 Promedios móviles y métodos atenuación Promedios mOviles y métodos de atenuaciOn Capítulo Capitulo 5 error de pronóstico es El error de pronóstico es e25 = e25 = 850 - 408.33 e25 = 850 441.67 - e 25 e25 = El pronóstico para el segundo periodo de 1994 incluye un punto más de datos (850) que se pronóstico para segundo periodo de 1994 incluye un punto mãs de datos (850) que la de inicialización la anterior. incorpora a Ia parte de inicialización de Ia historia anterior. El pronóstico es A Y25+1 Y25+ = ~ = Y26 .9 26 == 426 10,650 10,650 método simple no parece apropiado para estos datos. Este método debería El método simple no parece apropiado para estos datos. Este método deberla cuando emplearse cuaxdo los datos son estacionarios: sin tendencia, estacionalidad u otros patrones sistemáticos. Promedios móviles método de promedio simple usa, para pronosticar, la media de todos los datos. Pero, El método de promedio simple usa, para pronosticar, Ia media de todos los datos. Pero, ,qué sucede analista está más interesado en las observacioens recientes? ¿qué sucede si el analista está más interesado en las observacioens recientes? Se puede especificar corno conjunto un nñiriero de puntos de datos calcular la media para las especificar como conjunto un nlunero de puntos de datos y calcular Ia media para las emplea el ténnino promedio observaciones rnás recientes. enfoque, observaciones más recientes. Para describir este enfoque, se emplea el término promedio móvil. Al estar disponible cada nueva observación, puede calcular una nueva media ,nóvil. Al estar disponible cada nueva observación, se puede calcular una nueva media elirninando el valor más antiguo e incluyendo el más reciente. Entonces, se usa este eliminando el valor más antiguo incluyendo más reciente. Entonces, se este promedio móvil para pronosticar el siguiente periodo. La ecuación 5.7 establece el modelo 5.7 establece el modelo pronosticar simple de promedio móvil. M= donde en donde = (Y + Y +Y + +Y + (Y+Y11+Y2+." +Y t-n+ t t - 1 t - 2 0'0 t - n 1 ) n n (5.7) M = promedio móvil en el periodo Mt = promedio móvil en el periodo It Y,+, = Y+ 1 = valor de pronóstico para el siguiente periodo pronóstico el siguiente periodo t Yr ==valor real en el periodo I t Y, valor real en = número de ténninos en el promedio móvil n = nümero de términos en el promedio móvil móvil El promedio móvil para el periodo t es la media aritmética de las n observaciones más recientes. que se asignan ponderaciones Nótese que se asignan ponderaciones iguales a cada observación. Al hacerse disponipromedio descarta el más antiguo. ble, cada nuevo punto de datos se incluye en el promedio y se descarta el más antiguo. La proporción de respuesta a los cambios en el patron subyacente de los datos depende del ~roporción de respuesta cambios el patrón subyacente los datos depende del nümero de penodos, n, que se incluyen en el prornedio móvil. número periodos, 11, que se incluyen en el promedio móvil. promedio sólo los últimos 11 periodos de la técnica Nótese que Ia técnica de prornedio móvil se refiere solo a los ültimos n periodos de número de puntos de datos promedio del datos conocidos; el nOmero de puntos de datos en cada promedio no cambia al correr del Métodos de promedio 153 tiempo. El modelo de promedio móvil funciona mejor con datos estacionarios. No maneja tiempo. modelo promedio móvil funciona mejor con datos estacionarios. No maneja muy bien Ia tendencia o la estacionalidad, aunque lo hace mejor que ci método de promedio la el simple. En un promedio móvil, el analista debe escoger el nümero de periodos n. Un promedio móvil, el analista debe escoger el número de periodos n. En promedio móvil de orden 11tomarIa Ia ñltima observación Yt. Y Ia usaría pam pronosticar el móvil de orden tomaría la última observación Yt. y la usarla para pronosticar el siguiente periodo. Esto es simplemente el enfoque de pronóstico no fonnal de Ia ecuación siguiente periodo. Esto simplemente el enfoque de pronóstico no formal de la ecuación 5.1. Para datos trirnestrales, los datos en un promedio móvil de 4 trimestres arrojan un trimestrales, los datos en promedio móvil 4 trimestres arrojan un 5.1. promedio de 4 trimestres; y para datos mensuales, un promedio móvil 12 meses promedio de los 4 trimestres; y para datos mensuales, un prornedio móvil de 12 meses elimina promedia los efectos estacionales. frecuente que se utilicen los promedios elimina o promedia los efectos estacionales. Es frecuente que se utilicen los promedios móviles con datos trimestrales o mensuales para auxiliar en el examen de los componentes trimestrales componentes en una serie de tiempo, como se muestra en el cap. 8. Entre mayor sea el orden del promedio cap. 8. Entre mayor sea el orden del promedio móvil, el efecto de atenuación. Empleado como un pronóstico, móvil, mayor será ci efecto de atenuación. Empleado como un pronóstico, un promeatención fluctuaciones serie de datos. dio móvil grande presta poca atención a las fluctuaciones en la serie de datos. móvil media de un conjunto específico Un promedio rnóvil se obtiene encontrando la media de un conjunto especIfico de valores y empleándolo después para pronosticar ci siguiente periodo. el siguiente periodo. Ejemplo 5.3 La tabla 5.2 demuestra la técnica de pronóstico de promedio móvil con datos de Acme Tool demuestra técnica de pronóstico de prornedio móvil con datos de Acme Tool La Company. El pronóstico de prornedio móvil para el primer trirnestre de 1993 es trimestre 1993 es Company. El pronóstico promedio móvil para M ZO -= Y ZO + 1 M20 = _A _ YZO + y20_l1++ YZO - Z + Y20-4+1I Y ZO - Y2O_2 + YZO - 4 + 4 4 y zo + y19 + y18 + y17 + y 19 + y 18 + y 17 4 550 + 400 + 350 + 600 550 400 350 + 600 4 = - 1,900 = 475 475 4 4 Cuando se conoce a! valor del primer trimestre de 1993, se puede calcular el error de Cuando se conoce al valor del primer trimestre de 1993, se puede calcular el error de pronóstico: e Z1 = YZ1 e21 = - - YZl = 750 - 475 = 275 = 750 - 475 = 275 El pronóstico para el primer trimestre de 1995 es el primer trimestre de 1995 es M M28 -= y 28+ 1 Z8 A _ - Y28 + Y28_1 + Y28_2 + YZ8 YZ8 + YZ8 - 1 + YZ8 - Z 4 4 4+ I YZ9 = Y28 + Y27 + Y26 + YZ5 Y28 + Y27 YZ6 + 4 4 YZ9 = 700 + 450 + 600 + 850 = 2,600 = 650 700 450 600 850 - 650 4 4 4 4 El analista debe emplear su juicio para deterrninar ci niimero de semanas, meses o emplear para detenninar el número semanas, trimestres en trimestres en los que basará ci prornedio móvil. Entre menor sea el nümero, se dará más basará el promedio móvil. Entre menor sea ci número, 154 5.2 TABLA 5.2 Promedios móviles y métodos de atenuaciOn móviles y métodos de atenuación PROMEDIO MOVIL PROMEDIO MÓVIL TRIMESTRAL DE ACME TOOL COMPANY ACME TOOL COMPANY PRONÓSTICO DE PRONOSTICO DE PROMEDIO MÓVIL, PROMEDIO MOVIL, Capítulo 5 CapItulo VENTAS AÑO A1O 1992 TRIMESTRE 1 t Yt 550 400 350 600 750 500 400 650 850 600 450 700 TOTAL MOVIL MÓVIL Y+ t 1 el 1 17 17 18 18 19 20 21 22 23 23 24 25 25 26 27 28 29 2 2 3 4 4 1993 1 2 3 3 4 1 1994 1994 I 1 2 2 3 3 4 1995 1 I 1,900 1,900 2,100 2,200 2,250 2,300 2,400 2,500 2,550 2,600 475 +275 525 550 562.5 562.5 575 600 625 637.5 650 -25 -150 +87.5 +275 0 O -175 +62.5 peso a los periodos recientes. Inversamente, entre más grande sea el nümero, se dará peso los periodos recientes. Inversamente, entre más grande sea el número, menor peso a los periodos rnás recientes. Es más deseable un número pequefio cuando hay más recientes. Es más deseable un nimero pequeño cuando hay cambios sübitos en el nivel de Ia serie. Un nümero pequeflo asigna mayor peso a la historia súbitos la número pequeño la historia reciente, lo que permite que el pronóstico se ajuste con más rapidez al nivel actual. Cuando reciente, el pronóstico se ajuste con más rapidez al nivel actual. Cuando existan fluctuaciones amplias no frecuentes en la serie, es deseable un número mayor. existan fluctuaciones amplias no frecuentes en la serie, es deseable un nimero mayor. Nótese que una suposición del promedio móvil es que los datos son estacionarios. El los datos son estacionarios. El ejemplo 5.4 muestra lo que sucede cuando se emplea la técnica del promedio móvil en datos con tendencia. El examen de la cohunna de con tendencia. El examen de Ia colurnna de error de Ia tabla 5.3 muestra que todos los la tabla muestra que valores son positivos, lo que significa que el pronóstico no se ajustó a la tendencia. En la positivos, lo pronóstico la tendencia. En la valores sección diseñada para siguiente secciôn se presenta la técnica de promedio móvil doble, la cual está disefiath para manejar datos con tendencia. tendencia. Promedio móvil doble Promedio móvil Una forma de pronosticar series de tiempo que tienen una tendencia lineal, consiste en de pronosticar de tiempo que tienen una tendencia lineal, consiste en Una utilizar la técnica del promedio móvil doble. El método hace lo que su nombre implica: se móvil doble. El método hace calcula un conjunto de prornedios móviles y después se calcula un segundo conjunto como conjlmto promedios móviles después promedio móvil del primero. móvil del primero. semana Video Store. Además, se muestran La fig. 5.3 muestra las rentas por semana de Movie Video Store. Adernás, se muestran en la gráfica el promedio móvil de tres sernanas y el prornedio móvil doble para estos datos. de tres semanas promedio para estos datos. Nótese cómo el promedio móvil se ubica por debajo de los valores reales en periodos periodos Nótese córno el promedio rnóvil se ubica por debajo de los valores reales comparables. Esto ilustra. lo que sucede cuando se usa la técnica de promedio móvil en comparables. Esto ilustra lo que sucede cuando se usa técnica promedio promedio Métodos de promedlo TABLA 5.3 5.3 155 RENTAS SEMANALES DE MOVIE VIDEO STORE RENTAS SEMANALES DE MOVIE VIDEO STORE PARA EL EJEMPLO 5.4 EJEMPLO 5.4 UNIDADES RENTADAS SEMANA POR SEMANA 1 1 2 3 3 4 5 5 6 7 7 8 8 9 10 11 12 13 14 14 15 16 = 133. EMC = 133. TOTAL MÓVIL MOVIL TRES SEMANAS TRES PRONÓSTICO DE PRONOSTICO DE MÓVIL PROMEDIO MOVIL A Yt +/ e, 654 658 665 672 673 671 693 694 701 703 702 710 712 711 728 1977 1995 - - 2010 2016 2037 2058 2088 2098 2106 2115 2124 2133 2151 659 665 670 672 679 686 696 699 702 705 708 711 717 - 13 8 8 1 1 21 15 15 7 3 8 7 3 3 17 datos con tendencia. Nótese también que el promedio móvil doble se ubica por debajo del tendencia. también qiie el promedio móvil doble se ubica por debajo proporción similar a la que se ubica el primer conjunto por debajo primer conjunto en proporcion similar a la que se ubica el primer conjunto por debajo valores reales. Esta diferencia entre ambos los de los valores reales. Esta diferencia entre arnbos conjuntos se emplea para pronosticar los valores reales. reales. técnica promedio resume mediante ecuaciones a 5.11. La técnica de promedio móvil doble se resume mediante las ecuaciones 5.8 a 5.11. 730 710 5 c:>. ~ ~ 690 ~ 670 ~ Q 650 I I I I I I I I I I I '---'---'---'---'---'---'---'---'---'---'---'---'---'--~ I 1 2 3 4 5 5 6 7 7 8 8 9 10 11 11 12 13 14 14 15 Período Periodo Figura 5.3 Figura 5.3 Promedios móviles dobles: Promedios móviles dobles: Movie Video Store. 156 156 móviles Promedios mOviles y métodos de atenuación Capítulo 5 CapItulo Primero, Primero, se utiliza la ecuación 5.7 para calcular el promedio móvil. A Yt + 1 = Yt + Yt-11 + Ytt-2 + - 2 tn Y+Y +Y +...+Y t-n+1 oo. + Y t- n+ 1 Dado que M1 = Dado que MI móvil. Y/+l' Entonces se Entonces se usa la ecuación 5.8 para calcular el segundo promedio ecuación 5.8 para calcular el segundo promedio M' = MH t M+M t-l +M /-2 +"'+Mt-n+l 1fl+1 t n n M+M1+M2+...+M = 2M - M; at = 2Mt - M (5.8) usa para calcular la diferencia entre ambos promedios móviles. La ecuación 5.9 se usa para calcular la diferencia entre ambos promedios móviles. (5.9) 5.1 O es un factor de ajuste adicional, similar a la medición de una pendiente La ecuación 5.10 es un factor de ajuste adicional, similar a la medición de una pendiente través de la serie. que cambia a través de la serie. b b t = = 2 _2_(M - M') n- 1 t t ni (MM) (5.10) último, 5.11 periodos m en el futuro. Por ültimo, se utiliza la ecuación 5.11 para realizar el pronóstico de periodos ni en el futuro. = a + btp Y/+ p = at + b,p en donde n = nñmero de periodos en el promedio móvil = número periodos en el promedio móvil Y ~ = valor real de la serie en el periodo t valor real de en periodo número p = niimero de periodos a pronosticar hacia el futuro (5.11) Ejemplo 5.4 La empresa Movie Video Store funciona con varios distribuidores de renta de videocintas en distribuidores de videocintas en Denver, Colorado. La companIa está creciendo y requiere ampliar su inventario para dar cabida compañía para dar cabida la la compañía a Ia creciente demanda de servicios. El presidente de Ia compañIa asigna a Jill Ottenbreit para pronostique datos de renta disponibles de las últimas 15 que pronostique las rentas del próximo mes. Los datos de renta disponibles de las ültimas 15 semanas presentan JiU desarrollar un pronóstico semanas se presentan en la tabla 5.4. Como primer paso, Jill intenta desarrollar un pronóstico utilizando un promedio móvil de tres semanas. EMC (elTor medio cuadrado) para este utilizando un prornedio móvil de tres semanas. El EMC (error medio cuadrado) para este modelo es 133. Puesto que los datos obviamente tienen tendencia, Jill encuentra que sus modelo es 133. Puesto que los datos obviamente tienen tendencia, Jill encuentra que sus pronósticos están consistentemente subestimados de las rentas reales. razón, decide pronósticos están consistentemente subestimados de las rentas reales. Por esta razón, decide intentar con el promedio móvil doble. Los resultados se presentan en la tabla 5.4. A intentar con el promedio móvil doble. Los resultados se presentan en la tabla 5.4. A continuación se presentan los cálculos para comprender el pronóstico para la semana 16. Se pronóstico semana 16. Se continuación se presentan tres semanas (columna 3). ecuación 5.7 para calcular el promedio móvil usa la ecuación 5.7 para calcular el promedio rnóvil de tres semanas (columna 3). y 15+1 = y15 + y15_1 + oo. + Y,53+1 + Y I5 -3+1 Yl5 + Y 15 - 1 + 3 3 Y 16 Y16 728+711+712 717 728 + 711 + 712 = 717 3 3 Métodos de promedio TABLA 5.4 5.4 PRONOSTICO DE PROMEDIO MOVIL DOBLE PARA PRONÓSTICO MÓVIL DOBLE PARA MOVIE VIDEO STORE: EJEM PLO 5.4 STORE: EJEMPLO 5.4 (1) 157 (2) (3) PROMEDIO MÓVIL MOVIL TRES SEMANAS TRES MI M (4) (5) (6) (7) (8) VENTAS P0k VENTASPOR PERIODO SEMANA PERIODO SEMANA YI t 1 2 2 3 3 4 5 5 6 6 7 8 8 9 10 11 11 12 12 13 13 14 14 15 16 16 1 PROMEDIO MOVIL MÓVIL DOBLE M' M,' I VALOR DEo DE a VALOR DEb DE b PRONÓSTICO PRONOSTICO a + bp (p = 1) (p 1) el 654 658 665 672 673 671 693 694 701 703 702 710 712 711 711 72S 728 659 665 670 672 679 686 696 699 702 705 708 70S 711 717 665 669 674 679 687 694 699 702 705 708 70S 712 675 675 684 693 705 704 705 708 711 - 5 5 3 3 5 5 7 9 5 3 3 3 3 3 3 5 5 680 678 689 700 714 709 70S 708 711 -9 15 5 5 1 -11 -7 2 2 1 1 -3 11 11 1 714 722 - 714 717 727 EMC = 63.7. Dado M t 717. Entonces, Dado M1 = 717. Entonces, se emplea Ia ecuación 5.8 para calcular el segundo promedio móvil la promedio móvil 4). de tres sernanas (columna 4). semanas M~5 = M +M 15 _ 1 +"+M 15-3+1 M I5 + M 15-I + ... + M I5 -3+1 15 3 717 + 711 + 708 717 711 + 708 3 3 - 712 = 712 ecuación 5.9 para calcular la diferencia entre ambos promedios móviles (columSe usa la ecuación 5.9 para calcular la diferencia entre ambos promedios móviles (columna 5). 5). G a15= 2M I5 - -M~5 = 2(717) -- 712 = 722 = 2M15 M5 = 2(717) 712 I5 La ecuación 5.10 ajusta la pendiente (colunma 6). ajusta la pendiente (columna 6). b15 b l5 = = 2 , 3=l (M15 - Mç5)2 (717- 712) = 5 (M M 15) = "2 (717 712) = 5 15 - Se utiliza la ecuación 5.11 para efectuar el pronôstico de un periodo a futuro (columna 7). 5.11 pronóstico futuro a15 + b15(1) 722 .9 15+1 = G I5 + b150) == 722 + 5 = 727 158 Promedios mOviles y métodos de atenuación móviles Capítulo CapItulo 5 cuatro semanas futuro es El promedio de cuatro semanas a futuro es Y15+4 lS + ls (4) = 722 + 5(4) 742 .9 15+4 ==a a15 +bb15(4) =722 + 5(4) = 742 EMe 133 a 63.7. Nótese que el EMC se redujo de 133 a 63.7. las observaciones más recientes apropiadas para contener Parece razonable que las observaciones más recientes son apropiadas para contener información importante. En la siguiente sección introduce técnica que da la información más importante. En Ia siguiente sección se introduce una técnica que da mayor énfasis a las observaciones más recientes las observaciones recientes MÉTODOS METODOS DE ATENUACIÓN EXPONENCIAL ATENUACIÔN atenuación exponencial es un método utilizado para revisar constantemente una La atenuación exponencial es un método utilizado para revisar constantemente una estimación luz de experiencias recientes. el promedio estimación a la luz de experiencias más recientes. El método está basado en el promedio (atenuación) de valores anteriores de serie, haciendo esto de forma decreciente (atenuación) de valores anteriores de una serie, haciendo esto de forma decreciente (exponencial). Las observaciones se ponderan, asignando mayor peso a las más recientes. más recientes. (exponencial). Las observaciones se ponderan, asignando mayor peso ponderaciones empleadas se designan como a para Ia observación más reciente, a(1 Las ponderaciones empleadas se designan como a para la observación más reciente, a(l -a) para siguiente más reciente, a(1 o2 para la siguiente y así sucesivamente. c para la siguiente más reciente, a(1 - a)2 para Ia siguiente y asi sucesivamente. En una forma atenuada, se podria pensar en un nuevo pronóstico (J)ara el periodo atenuada, se podría pensar en un nuevo pronóstico (para el periodo t + 1), como el promedio ponderado de la nueva observación (en el periodo t) y el promedio (en el periodo t) y el promedio anterior (para el periodo t). Se asigna la ponderación aaal nuevo valor observado y y 1 a a! (para el periodo t). Se asigna Ia ponderación a! nuevo valor observado 1- al anterior, suponiendo que 0 < a < l. De esta forma, pronóstico anterior, suponiendo que O < a < 1. De esta forma, nuevo pronóstico == a x (nueva observación) + (1- a) xx(pronóstico anterior) pronóstico a observación) + (1 a) (pronóstico anterior) manera más fonual, la ecuación de atenuación exponencial De manera más fornial, la ecuación de atenuación exponencial es = aY + (1 - a)Y, en donde (5.12) Y'+I = nuevo valor atenuado o valor de pronóstico para el siguiente periodo = atenuado valor de pronóstico para el siguiente periodo a = constante de atenuación (O < a < 1) = constante de atenuación (0 < a l) Y, ==nueva observación oovalor real de la serie en el periodo I Y, nueva observación valor real de la serie en el periodo t Y, = valor atenuado anterior o experiencia promedio de la serie atenuada al periodo = Ia serie al t 1 t-- 1 En un esfuerzo por interpretar mejor a alfa, Ia ecuación 5.12 se escribe como la escribe como Y'+i = aY, = = = = + (l - a)Y Y,+1aY+(la)Y A t aY, aY, aY + Y, - aY1 Y, + a(Y -- 2,) a(Y, Y) , La atenuación exponencial es simplemente el pronóstico anterior (Y,) más a veces el error atenuación exponencial es simplemente el pronóstico anterior (i,) más el error (Y, Y,), anterior. (Y, -- Y,), en el pronóstico anterior. Métodos de atenuación exponencial 159 159 La atenuación exponencial es un procedimiento para revisar constantemente tin exponencial un la luz de la experiencia más reciente. pronóstico a la luz de la experiencia más reciente. constante de atenuación sirve como el factor para ponderar. El valor real de a La constante de atenuación a sirve como el factor para ponderar. El valor real de a el cual la observación más reciente influir en el determina el grado hasta el cual Ia observación más reciente puede influir en el valor del pronóstico. Cuando a es cercana a 1, el nuevo pronóstico incluirá un ajuste sustancial de pronóstico. Cuando es cercana a 1, el nuevo pronóstico incluirá un ajuste sustancial cualquier error ocurrido en el pronóstico anterior. Inversamente, cuando cualquier error ocurrido en el pronóstico anterior. Inversamente, cuando aa está cercana a pronóstico es similar al anterior. Piense en Y, como tin promedio ponderado 0, el pronóstico es similar al anterior. Piense en Y1 como un promedio ponderado de todas ponderaciones que disminuyen de exponencial las observaciones anteriores con ponderaciones que disminuyen de manera exponencial al los hacia atrás (en el Como se muestra en la tabla 5.5, la velocidad ir tomando los datos hacia atrás (en el tiempo). Como se muestra en la tabla 5.5, la velocidad anteriores pierden su importancia, depende de a con que los valores anteriores pierden su importancia, depende de a clave del análisis es el valor de a Si se desea que los pronósticos sean estables y La dave del análisis es el valor de a. Si se desea que los pronósticos sean estables y atenúen las variaciones aleatorias, se requiere de un valor de apequeno. se atenüen las variaciones aleatorias, se requiere de un valor de a pequeño. Si se desea una respuesta rápida al cambio real en el patron de observaciones, resulta más apropiado tin respuesta rápida al cambio real el patrón de observaciones, apropiado un mayor valor de a. Un método para estimar a consiste en un procedirniento iterativo que mayor valor de a. Un método para estimar a consiste en un procedimiento iterativo que minimiza el error rnedio cuadrado (EMe) calculado en Ia ecuación 4.6. Se calculan los medio cuadrado (EMC) calculado en la ecuación 4.6. Se calculan los minimiza el pronósticos para aaigualaa.1, .2, ... , y para cada uno se se calcula la sumade los errores pronósticos para igual .1.........9, .9, y para cada uno calcula la suma de los errores cuadrados del pronóstico. Para generar pronósticos futuros, se elige el valor de a que cuadrados del pronóstico. Para generar pronósticos futuros, se elige el valor de a que el error más pequeño. produce el error rnás pequeño. TABLA 5.5. 5.5. COMPARACION COMPARACiÓN DE CONSTANTES DE ATENUACION CONSTANTES DE ATENUACiÓN a=.1 a= .1 PERIODO t t- II a=.6 a=.6 CÁLCULOS CALCULOS PONDERACIÓN .100 .090 .081 .073 .066 .590 1.000 CALCULOS CÁLCULOS PONDERACION PONDERACION PONDERACIÓN .600 .240 .096 .038 .015 .011 t t- 2 t-2 t 3 t-- 3 t - 4 t-4 restantes Los restantes x .1 .9 x.I .9 X .9 X .1 x.9 X.I x X x .1 .9 X .9 x .9 X .1 .9X.9X.9X.9X.1 .9 X .9 X .9 X .9 X .1 Total X .6 .4 X .6 .4 X .4 X .6 X X .6 X X .4 X .6 .4 X .4 X .4 X .6 .4 X .4 X .4 X .4 X .6 .4x.4X.4X.4X.6 1.000 Ejemplo Ej emplo 5.5 La técnica de atenuación exponencial se muestra en tabla 5.6 para los datos de Acme Tool Company de 1988 a 1993, utilizando constantes de atenuación de .1 y .6. Los datos de 1994 datos 1994 Company de 1988 1993, utilizando constantes de atenuación de .1 y .6. se eniplearán como la parte de prueba para ayudar a evaluar qué modelo se desempeña mejor. emplearán como Ia parte de prueba para ayudar a evaluar qué modelo se desempea mejor. La serie atenuada en forma exponencial se calcula asignando inicialmente }l1 igual a 500. Si atenuada forma exponencial calcula asignando inicialmente 9 igual Si anteriores disponibles, se podrían usar para desalTollar 1988 hay datos anteriores disponibles, se podrian usar para desalTollar una serie atenuada hasta 1988 160 Promedios mOviles y métodos de atenuaciOn móviles de atenuación EXPONENCIALMENTE 5.6 VALORES TABLA 5.6 VALORES ATENUADOS EXPONENCIALMENTE PARA EL EJEMPLO 5.5, VENTAS DE ACME TOOL COMPANY EJEMPLO 5.5, VENTAS COMPANY VALOR REAL, PERIODO 1 I Capítulo 5 CapItulo 5 VALOR ATENUADO, /1 ERROR DE DE PRONOSTICO, PRONÓSTICO, el VALOR ATENUADO, Yr 500 350 350 250 400 450 350 350 200 300 300 350 350 200 150 150 400 550 350 250 550 550 400 350 600 750 500 400 650 Y/(a = .1) Y,(a = .6) = .6) /1 ERROR DE PRONÓSTICO, PRONOSTICO, C, e, 2 3 3 4 5 6 7 8 9 10 ii 11 12 13 13 14 15 16 16 17 l7 18 18 19 19 20 21 22 23 24 25 500 500 485 (1) 485 (1) 462 (3) 462 (3) 455 455 444 420 , 408 402 382 359 363 382 378 366 366 384 401 401 395 416 449 454 449 469 (4) 469 (4) -150 150 -235 (2) 235 (2) -62 -5 -105 105 -244 244 -120 120 -58 -202 202 -232 232 +41 + 187 +187 -32 -128 128 +184 +166 -1 -51 +205 +334 +51 -54 +201 62 5 58 32 54 500 410 314 366 416 376 270 288 325 250 190 316 456 392 307 453 511 444 388 515 656 562 465 (4) 576 (4) -150 150 -160 160 +86 +84 --66 -176 176 +30 +62 -125 125 -100 100 +210 +234 -106 106 -142 142 +243 +97 -121 121 -96 +212 +235 -156 156 -12 + 185 +185 96 12 Los nürneros entre paréntesis se refieren explicaciones dadas dadas en Los números entre paréntesis se refieren a las a las explicacionesen el texto ci texto y utilizar csta cxpericncia como ci valor inicial de Ia seric atenuada. A continuación se muestran esta experiencia el la serie se muestran cálculos quc conducen al pronóstico dcl periodo 3) los cálculos que conducen al pronóstico del periodo 3. 1 1. Y'+I Y2+1 2+I = ay, + (1 -av (1 aY 2 + (1 = a.2 + (1 -- a)y, a)Y2 _v -' .1 (350) (1 - .1 )500 = .1(350) + (1 - .1)500 = 485 2. El crror para este pronóstico es error para este pronóstico f, = 250 - - 485 = 250 485 =-235 235 3. El pronóstico para ci periodo 4 es el es .v 4 = .1(250) + .9(485) = 462 .1 (250) + .9(485) 1 Los nlillleros de gula Ia 44 se muestranentre paréntesis en Ia tabIa 5.6. Los nrneros de guía 1a se muestran entre paréntesis en la tabla 5.6. exponencial Métodos de atenuación exponencial 161 1 4. Los pronósticos 4. Los pronósticos de ventas para el primer trimestre de 1994, utilizando constantes de ventas para el primer trimestre de 1994, utilizando constantes de atenuación .1 .6 son 469 y 576, respectivamente. atcnuación de .1 y .6 son 469 y 576, respectivamente. Nótese 10 estable que son los valores atenuados para Ia constante de atenuación de .1. lo estable que la de atenuación de .1. la minimización Por otra parte, con base en Ia rninirnización del error medio cuadrado (EMC), resulta mejor (EMC), de .6, que también compara la media del porcentaje la constante de atenuación de .6, que tarnbién es mejor si se compara la media del porcentaje absoluto (PEMA). Al comparar el pronóstico para cada constante de atenuación de error absoluto (PEMA). Al comparar el pronóstico para cada constante de atenuación con las ventas reales del primer trirnestre de 1994, también parece ser mejor Ia conStante ventas reales del plimer trimestre 1994, también ser mejor l? constante de atenuación de .6. .6. a =.1 ex = .1 ex = .6 a =.6 a = .34 ex = .34 EMC =25,317 EMC = 25,317 EMC = 23,216 EMC = 23,216 EMC = 21,421 EMC = 21,421 PEMA = 40.61% PEMA = 40.61 % PEMA 3X.14% PEMA = 38.14% PEMA = 35.41% PEMA = 35.41 % PME = -20.81% PME = -20.81% PME = PME = -10.33% PME = PME = -11.50% Cuando se emplea un programa de computadora que elige en forma automática la constante computadora que elige en forma automática la constante de atenuación, aesigual aa.34. El EMC se reduce a 21 421 y el PEMA equivale a 35.41%. atenuación, aes igual .34. El EMC se reduce a 21 421 Y el PEMA equivale 35.41 %. El porcentaje medio de error (PME), aa veces denominado sesgo, es de -11.50% para este El porceritaje medio de error (PME), veces denorninado sesgo, es de 11.50% lo que significa que los pronósticos basados en este modelo son consistentemente modelo, lo que significa que los pronósticos basados en este modelo son consistenternente muy grandes. Se necesita investigar la posibilidad de una tendencia o variación estacional necesita investigar Ia posibilidad de una tendencia o variación estacional rnuy grandes. en los datos. datos. afecta el valor pronósticos subsecuentes es valor Otro factor que afecta ci valor de pronósticos subsecuentes es la elección del valor Otro factor Y¡. La tabla se usó Y¡ inicial de Y¡, 5.5. inicial de Y,. La tabla 5.6 muestra que se usó Y, como valor inicial de Y,, en el ejemplo 5.5. 7, = y y ¡ = Yt¡ 9 = 500 Esta elección tiende a dar mucho peso a Y. en periodos posteriores. Por fortuna, Ia influencia a dar mucho peso a Y¡ en la influencia del pronóstico inicial disrninuye en gran medida al incrementarse t. inicial disminuye medida al incrementarse t. del Otro enfoque para inicializar 1', consiste en promediar las primeras n observaciones. inicializar Y¡ consiste en promediar las observaciones. columna de atenuación comenzaría entonces con La columna de atenuación comenzaria entonces con Y¡ = y = Y= ¡= 1 I 11 Yl Y¡ n Si se elige ii igual a 4, entonces ci valor inicial para el ejemplo 5.5 es n igual entonces el inicial ejemplo 5.5 Si Y¡ Y= ¡=1 I 4 Y¡ 500 350 250 400 500 + 350 + 250 + 400 4 n 375 =375 Rastreo la supone la continuidad en el futuro de algún patrón Debido a que Ia atenuación exponencial supone Ia continuidad en ci futuro de algün patron histórico, útil desarrollar pueda utilizar para detem1inar cuando histórico, resulta iitil desarrollar una medida que se pueda utilizar para determinar cuando 162 162 Promedios mOviles y métodos de atenuaciOn móviles de atenuación Capítulo 5 Cap Itulo 5 modifica patrón básico. La medida más común es señal de rastreo. Esta señal se modifica el patron básico. La medida más comün es la señal de rastreo. Esta seflal medición del límites, comprende el cálculo de alguna medición del error a través del tiempo y establece Ilmites, cuando el error rebase dichos límites, se alerte al pronosticador. de modo que cuando el error rebase dichos lImites, se alerte al pronosticador. rastreo comprende el Una señal de rastreo comprende el cálculo de alguna medición del error a través través del tiempo establece límites, de modo del tiempo y establece Ilmites, de modo que cuando el error rebase dichos cuando error rebase dichos límites, alerte al pronosticador. ilmites, se alerte al pronosticador. Por ejemplo, se puede emplear una señal de rastreo para determinar cuándo debe rastreo para determinar cuándo debe Por ejemplo, se puede emplear una señal cambiarse el tamaño de utilizado técnica atenuación exponencial. Ya que cambiarse el tarnaño de alfa utilizado en una técnica de atenuación exponencial. Ya que lo regular se pronostican un gran número de elementos, una práctica común consiste por lo regular se pronostican un gran nümero de elementos, una práctica comñn consiste en continuar con el mismo tamaflo de alfa durante varios periodos, antes de determinar si tamaño de alfa durante varios periodos, antes de determinar si en continuar es necesaria una revision. Por desgracia, la simplicidad de utilizar un modelo establecido revisión. desgracia, la simplicidad utilizar un modelo establecido es de atenuación exponencial es un fuerte motivador para no efectuar un cambio. Aunque en exponencial cambio. Aunque en algún punto es necesario actualizar alfa. Cuando un modelo produce pronósticos que algán punto es necesario actualizar alfa. Cuando un modelo produce pronósticos contienen un amplio margen de error, un cambio resulta apropiado. cambio resulta contienen Un sisterna de rastreo proporciona un método para monitorear la necesidad de cambio. sistema Dicho sistema contiene un nivel de variaciones perrnisibles entre el pronóstico y los valores pennisibles entre el pronóstico y los valores reales. Mientras el pronOstico se ubique dentro del nivel, no es necesario modificar a alfa. pronóstico se ubique dentro del nivel, no es necesario modificar a alfa. reales. sistema la Sin embargo, si el pronóstico se sale del nivel, el sistema señala Ia necesidad de actualizar a alfa. ejemplo, las cosas van bien, la técnica de pronóstico debería subestimar Por ejemplo, si las cosas van bien, la técnica de pronóstico deberia subestimar y misma frecuencia. Se puede desarrollar una señal de rastreo con base en sobrestimar con la misma frecuencia. Se puede desarrollar una seflal de rastreo con base en este razonamiento. número subestimaciones en los ültimos n pronósticos. Sea U el nümero de subestimaciones en los últimos n pronósticos. En otras palabras, otras palabras, U es el nimero de errores de entre los ültimos n que son positivos. Si el proceso está bajo U es número de errores de entre los últimos n que son positivos. Si el proceso control, el valor esperado de U serIa n/2; pero se contempla una variabilidad de la muestra, U sería que no serían raros los valores cercanos a n/2. otro lado, valores que por lo que no serian raros los valores cercanos a n/2. Por otro lado, los valores que no produciendo pronósticos con sesgo. fueran cercanos a 11/2 indicaría que la técnica está produciendo pronósticos con sesgo. fueran cercanos ii/2 indicarIa que la técnica Ej emplo Ejemplo 5.5 Suponga que Acme Tool Company decidió usar Ia técnica de atenuaciOn exponencial con alfa Tool Company decidió usar la técnica de atenuación exponencial con alfa igual a .1, como se muestra en el ejemplo 5.4. Si el proceso está bajo control y el analista el ejemplo 5.4. Si el proceso está bajo control y el analista igual .1, como se muestra decide monitorear los 10 últimos valores de error, U tiene un valor esperado de 5. De hecho, decide monitorear los 10 ñltimos valores de error, U tiene un valor esperado de 5. De hecho, 8 no serían alarmantes. de O, 1, 9 o 10 serían los valores de 2, 3, 4, 6, 7 u 8 no serIan alarmantes. Sin embargo, valores de 0, 1, 9 o 10 serIan preocupar, la probabilidad obtener dichos casualidad sería .024 de preocupar, ya que la probabilidad de obtener dichos valores por casualidad serla de .024 binomial). (distribución binomial). Si 2 ~ U ~ 8, procedimiento bajo control 8, entonces el procedimiento está bajo control Si U> entonces el procedimiento está fuera de control Si U < 2 ooU> 8, 8, entonces el procedimientoestá fuera de control Métodos de atenuaciOn exponencial atenuación 163 Suponga que, de Suponga que, de los 10 pronósticos siguientes mediante esta técnica, sólo uno tiene un error 10 pronósticos siguientes mediante esta técnica, solo uno tiene lOes muy baja, positivo. Debido a que la probabilidad de obtener sólo un error positivo entre 10 es muy baja, positivo. Debido solo .011, se considera que el proceso está fuera de control (sobrestimando) y se deberla modificar debería .011, alfa. el valor de alfa. Otra forma de rastrear una técnica de diagnóstico consiste en determinar un nivel que fonna detenninar un nivel que pronóstico. el EMe que se contuviera todos los errores de pronóstico. Esto se puede lograr utilizando el EMC que se al determinar el tamaño óptimo de alfa. Si la técnica de pronóstico es razonableestableció al determinar el tamaño óptimo de alfa. Si la técnica de pronOstico es razonabledebería mente precisa, el error de pronóstico deberla estar en una distribución normal con una media Bajo esta condición, existe una probabilidad 95% de que una observación real de cero. Bajo esta condición, existe una probabilidad del 95% de que una observación real se ubique dentro de aproxirnadarnente dos desviaciones estándar del pronóstico. En general, aproximadamente dos desviaciones estándar del es suficiente un intervalo de confianza del 95% para los sistemas de rastreo. El ejemplo 5.6 intervalo de confianza 95% los sistemas de rastreo. El ejemplo 5.6 ilustra este enfoque. Ejemplo Ej emplo 5.6 En el ejeniplo de Acme Tool Company, se determinOel valor óptimo de alfa como a = .34 Company, se determinó el valor óptimo de alfa como a = .34 En ejemplo = 21,421. La desviación estándar error de pronóstico es 'I EMC --J 21,421 con un EMC = 21,421. La desviación estándar del error de pronOstico es --J EMC óó'.J 21,421 = 146.4. El error de pronóstico deberia presentar una distribución normal con una media de presentar una distribución normal con una media de 146.4. pronóstico debería cero. Bajo esta condición hay un 95% de posibilidad de que Ia observación real se ubique 95% de posibilidad que la observación real se ubique cero. Bajo esta condición hay dentro de aproximadamente dos desviaciones estándar del pronóstico o desviaciones dentro ±1.96 VEMC = ±1.96 \/21,421 ±1.96(l46.4) = :±:286.9 ± 1.96 VEMC = ± 1.96 V21,421 = ± 1.96(146.4) = ±286.9 De ahI que para el ejemplo, la variación permisible sea de 286.9. Si en cualquier pronóstico ahí el ejemplo, la variación pennisible 286.9. Si en cualquier pronóstico posterior el error es mayor a 286.9, existen motivos para pensar que se debe calcular un nuevo se debe calcular un nuevo valor Optimo para alfa. óptimo La exposición anterior sobre señales de rastreo se aplica también a los métodos aán exposición anterior sobre señales de rastreo se aplica también a aún el resto del capítulo. por abordar en el resto del capItulo. NOtese que en la técnica de atenuación exponencial simple existe la suposición de que Nótese que en la técnica de atenuación exponencial Ia son estacionarios. El ejemplo 5.7 muestra lo que sucede cuando se emplea los datos son estacionarios. El ejemplo 5.7 muestra 10 que sucede cuando se emplea la técnica de atenuación exponencial en datos con tendencia. Siempre que ,exista una tendencia en datos con tendencia. Siempre queexista significativa, la atenuación exponencial se ubicará por debajo de los valores reales significativa, la atenuación exponencial se ubicará por debajo de los valores reales de pronóstico de serie de tiempo, través del tiempo. El examen de la columna de error pronóstico de la serie de tiempo, aatravés del tiempo. El exarnen de la columna de error en la tabla 5.7 muestra que todos los valores son positivos, lo que significa que el pronóstico contempló tendencia. A continuación se presenta la técnica de atenuación exponencial no conternpló la tendencia. A continuación se presenta la técnica de atenuación exponencial cual se diseñó datos con tendencia. doble, la cual se diseflO para manejar datos con tendencia. Atenuación exponencial doble La técnica de atenuaciOn exponencial doble, también conocida como Método de Brown, se de atenuación exponencial doble, también se para pronosticar series tiempo que tienen una tendencia lineal. Los conceptos usa para pronosticar series de tiempo que tienen una tendencia lineal. Los conceptos básicos similares los de los promedios móviles dobles. La técnica de atenuación básicos son sirnilares a los de los promedios mOviles dobles. La técnica de atenuación exponencial doble mediante el las ecuaciones 5.13 a 5.17. exponencial doble se resume mediante el uso de las ecuaciones 5.13 a 5.17. 164 Promedios mOviles y métodos de atenuaciOn móviles de atenuación RENTAS POR SEMANA TABLA 5.7 MOVIE VIDEO TABLA 5.7 RENTAS POR SEMANA DE MOVIE VIDEO STORE PARA EL EJEMPLO 5.7 STORE PARA EL RENTADAS UNIDADES RENTADAS POR SEMANA SEMANA YI Yr Yr Capítulo CapItulo 5 Yf+li + e, 1 1 2 2 3 4 5 5 6 6 7 7 8 9 9 10 11 11 12 13 14 15 IS 16 EMe = 147.3. EMC = 147.3. 654 658 665 672 673 671 693 694 701 703 702 710 712 711 728 654 654 655.6 659.4 664.4 667.8 669.1 678.7 684.8 691.3 696.0 698.4 703.0 706.6 708.4 716.2 4.0 9.4 12.6 8.6 3.2 23.9 15.3 16.2 11.7 6.0 11.6 9.0 4.4 19.6 Debido a que los valores de las series no son pronósticos en sí mismos, las ecuaciones sj ecuaciones comprensibles siguiente de actualización son más comprensibles si se adopta la siguiente notación. At atenuado exponencialmente de Yt en el periodo A, = valor atenuado exponencialmente de Y, en el periodo t A't doblemente atenuado exponencialmente de Y el A', = valor doblemente atenuado exponencialmente de Y,t en el t periodo I El valor simple atenuado exponencialmente se calcula ahora mediante Ia ecuación calcula ahora mediante la ecuación El valor simple atenuado exponencialmente 5.13. A, = aY, + (l -- a)A,1 aYt + (1 a)A'_1 (5.13) se usa para calcular el valor doblemente atenuado exponencialmente. La ecuación 5.14 se usa para calcular el valor doblernente atenuado exponencialmente. A', = aA t + (l -- a)A_1 A', = aA, + (1 a)A ;-1 exponencialmente. (5.14) La ecuación 5.15 se emplea para calcular la diferencia entre los valores atenuados La ecuación 5.15 se emplea para calcular Ia diferencia entre los valores atenuados a, = 2A t A', a t = 2A, -- A', (5.15) (5. 15) ecuación factor adicional ajuste, similar a la medición de una pendiente La eduaciôn 5.16 es un factor adicional de ajuste, similar a Ia medicion de una pendiente cambiar durante la serie. que puede cambiar durante la serie. b b,t = _a_ (A, -- A',) (A A') a t , = 1- a I '-V (5.16) atenuación exponencial Métodos de atenuacián exponencial 165 Por Ultirno, la ecuación 5.17 se usa para fonnular el pronóstico de p periodos en el último, Ia ecuación 5.17 se usa para forrnular el pronóstico de p el futuro. = a, + h,p. Ej emplo Ejemplo 5.7 (5.17) Este ejemplo se refiere a! ejemplo 5.4 en ci que la empresa Movie Video Store pretendia Este ejemplo se refiere al ejemplo 5.4 el que la empresa Movie Video Store pretendía pronosticar sus rentas del próximo mes. Los datos de renta de las ültimas 15 semanas se pronosticar sus rentas del próximo mes. Los datos de renta las últimas 15 semanas se la 5.4. Jill intentó un promedio móvil de presentan en Ia tabla 5.4. Jill intentó desarrollar un pronóstico mediante un promedio móvil de tres semanas y un promedio rnóvil doble. Decide emplear una atenuación exponencial de 0.4 un promedio móvil exponencial Ahora tiene los resultados, niostrados en Ia tabia 5.7. Ya que es obvio que los datos tienen una los resultados, mostrados la tabla los datos tienen una Jill tendencia, Jilt se encuentra con que su pronóstico está siempre subestimando las rentas reales. razón, decide intentar la atenuación exponencial doble. El programa de computadora Por esta razón, decide intentar Ia atenuación exponencial dobie. El programa de computadora automáticamente la niejor constante atenuacián minimizando el EMe. que utiliza selecciona automãticarncnte Ia mejor constante de atenuación minirnizando ci EMC. Los resultados se presentan en Ia tabla 5.8 para un valor de alfa de .4. Para poder comprender la alfa de .4. Para poder comprender el pronóstico la semana 16, se presentan continuación los cálculos correspondientes. ci pronostico de Ia semana 16, se presentan aacontinuación los cáiculos correspondientes. emplea la ecuación 5.13 para calcular el valor simple atenuado exponencialmente Se emplea Ia ecuación 5.13 para calcular el valor simple atenuado exponencialmente 3). (columna 3). = ay15 + (1 = .4(728) + (1 - .4)(708.4) = 716.2 .4(728) (1 .4)(708.4) = 716.2 TABLA 5.8 PRONOSTICO DE ATENUACION EXPONENCIAL DOBLE PARA MOVIE 5.8 PRONÓSTICO DE ATENUACiÓN EXPONENCIAL DOBLE PARA MOVIE STORE. TECNICA DE BROWN, PARA EL EJEMPLO VIDEO STORE, TÉCNICA DE BROWN, PARA EL EJEMPLO 5.7 (2) VENTAS VENTAS POR PERIODO SEMANA Y, (1) (3) (4) (5) (6) (6) VALOR DEb (7) (R) (8) PRONÓSTICO PRONOSTICO VALOR A, 654 655.6 659.4 664.4 667.8 669.1 669.\ 678.7 684.8 6R4.8 691.3 696.0 698.4 703.0 706.6 708.4 716.2 A' I 654 654.6 656.5 659.7 662.9 665.4 670.7 676.3 682.3 687.8 692.0 696.4 700.5 700.5 703.7 703.7 708.7 708.7 DEa a + hp + bp (p = 1) (p= 1) 654 654 657.3 664.2 672.2 676.0 675.3 692.0 699.0 706.3 709.7 709.1 714.0 716.8 716.2 728.7 e, 1 1 2 3 3 4 5 6 7 8 8 9 10 lO 11 1\ 12 13 14 15 16 \6 EMC = 39.82. 654 658 665 672 673 671 693 694 701 703 702 710 712 7\\ 711 728 - - - 654 656.6 662.3 669.1 672.7 672.8 686.7 693.3 700.3 704.2 704.8 709.6 712.7 713.\ 713.1 723.7 - 0 O .7 .7 1.9 3.1 3.3 2.5 5.3 5.7 6.0 5.5 4.3 4.4 4.1 4.\ 3.\ 3.1 5.0 4.0 7.7 7.8 0.8 -5.0 17.7 2.0 2.0 -3.3 -7.7 0.9 -2.0 -5.8 11.8 - 659 678 696 716 166 Promedios móviles y métodos de atenuación Capítulo Cap itulo 5 La ecuación La ecuación 5.14 se utiliza para calcular el valor doblemente atenuado exponencialmente se utiliza para calcular el valor doblemente atenuado exponencialmente (columna 4). A =A15 + (1 = .4(7 16.2) + (l - .4)(703.7) = 708.7 = .4(716.2) + (1 - .4)(703.7) 70S.7 La ecuación 5.15 se utiliza para calcular las diferencias entre los valores atenuados exponencalcular diferencias los valores atenuados exponencialmente (columna 5). a15 = 2A5 - A.5 2(716.2) = 2(7 16.2) -- 708.7 = 723.7 valor adicional la medición de La ecuación 5.16 es un valor adicional de ajuste, similar a Ia medición de una pendiente que cambia a través de la serie (columna 6). la serie (columna 6). b15 = 1a (A5 - A'15) (716.2 70S.7) = (716.2 - 708.7) = 5.0 = 1= :: Finalmente se emplea la ecuación 5.17 para hacer el pronóstico de un periodo en el futuro Finalmente se emplea Ia ecuación 5.17 para hacer el pronóstico de periodo en el futuro (colunma 7). (columna 7). YI5+1 = = a5 + b5(1) = 723.7 + 5.0(1) = 728.7 a l5 b I5 (1) = 723.7 + 5.0(1) = 72S.7 futuro El pronóstico de cuatro semanas a futuro es 15+4 Y15+4 y = a15 + b15(4) = 723.7 + 5(4) = a l5 b I5 (4) = 743.7 Jill piensa que encontró una buena técnica de pronóstico. El EMC se redujo a 39.82. Como verificación final, decide calcular los coeficientes de autocorrelación de los residuales y probar para determinar si alguno de ellos es signiuicativamente diferente de cero. Las hipótesis nula detetminar alguno de ellos es significativamente diferente Las hipótesis nula alterna para probar si el coeficiente de autocorrelación para un periodo de desfasamiento en y alterna para probar si el coeficiente de autocorrelación para un periodo de desfasamiento en diferente particular es diferente de cero son H o: = O H0:Pp,0 k H 1: Pk # O H1: PkO Como n = 14, el error esthndar (desviación estándar de la distribución muestral de los = 14, el estándar (desviación estándar de Ia distribución muestral los coeficientes de autocorrclación), es it'JT = .267. Si se prueba Ia hipótesis nula at nivel de al nivel de coeficientes autocorrelación), es 11M = .267. Si prueba la hipótesis significancia de .05, el valor correcto estándar normal de z es 1.96 y el valor critico es significancia de .05, valor con'ecto estándar normal de es 1.96 el valor crítico es decisión 1.96(.267) = .524. La regla de decision es I .96(.267) = .524. La coeficiente autocorrelación es menor que .524 mayor que .524, Si un coeficiente de autocorrelación es menor que -.524oomayor que .524, en caso contrario, no rechazarla (rechazar H o rechazar la hipótesis nula; en caso contrario, no rechazarla (rechazar H0 si .524 o rk < -.524 o rk> .524). r> Métodos de atenuaciOn exponencial atenuación 167 comandos Minitab autocorrelaciones para residuales de la tabla Los cornandos de Minitab para ejecutar las autocorrelaciones para los residuales de la tabla 5.8 son I 5.8 > C1 > SET Cl DATA > 4.0 7.7 7.8 > 4.0 7.7 7.8 DATA > END > C1 MTB > ACF Cl > MTB .8 -5 17.7 2 2 -3.3 7.7 .8 5 17.7 2 2 3.3 -7.7 .9 -2 5.8 11.8 .9 2 -5.8 11.8 of C1 ACF of Cl -1 . o -o. 8 -o. 6 -o. 4 -o. 2 1.0 0.8 0.6 0.4 0.2 o.o 0.0 o. 2 0.2 o. 4 0.4 o. 6 0.6 o. 8 0.8 1.0 1.o -- - -+- - - - -+- - - -+- - - -+- - - -+- - - -+- - +- - - -+- - +----+----+----+----+----+----+----+----+----+----+----+ XXX -0.062 1 0.062 XX 2 0.059 2 -0.059 XXX 3 0.080 3 0.080 4 -0.139 4 0.139 5 5 XXXX xxxx XX 0.051 -0.1]? 6 0.1117 7 0 7 -o 0.212 8 8 9 -0.160 9 0.160 xxxx XXXX xxxxxxxx XXXXXXXX XXXXXX xxxxxx XXXXX xxxxx XXXX xxxx 10 0.126 10 -0.126 0.003 11 12 0.058 X X XX MTB > STOP > verificaron 12 periodos desfasamiento los coeficientes de autocorrelación se ubican Se verificaron 12 periodos de desfasamiento y los coeficientes de autocorrelación se ubican dentro dentro de los Ilmites apropiados. Jill concluye que esta serie de residuales es aleatoria. límites apropiados. JiU serie de residuales es aleatoria. Al igual que en la atenuación exponencial simple, la elección de alfa es un problema. atenuación alfa es un problema. selecciona minimizando EMe los pronósticos de estos Alfa se selecciona minirnizando el EMC entre los valores reales y los pronósticos de estos valores utilizando modelo. Algunos programas de computadora determinan valor valores utilizando el modelo. Algunos programas de computadora determinan este valor automática. proceso de prueba y error. en forma autornática. En caso contrario, éste se convierte en un proceso de prueba y error. problema al exponencial doble detenninación Un problerna a! emplear la atenuación exponencial doble es la deterrninación de los la tendencia. ejemplo usó iniciales de atenuada ajuste valores iniciales de la serie atenuada y el ajuste de Ia tendencia. En el ejemplo 5.7 se usó de la serie para A A',. El problema supone el valor real de la serie para A,f y A ' f • El problema consiste en que este procedimiento supone hay tendencia presente dará por resultado un error. Tenderá a subestimar una que no hay tendencia presente y dará por resultado un error. Tenderá a subestimar una tendencia positiva. 168 Promedios mOviles y métodos de atenuación móviles atenuacián Capítulo 5 Se pueden calcular los valores de Ia pendiente de la tendencia y Ia intersección la tendencia y la intersección Se pueden calcular los valores de la pendiente mediante el procedirnientode mínimos cuadrados que se expondrá en el cap. 6. Las mediante el procedimiento de rnInimos cuadrados que se expondrá en el cap. Las =O ao 650.3 y b0 = 4.9, Los valores iniciales estimaciones generadas para el periodo t = 0 son a0 = 650.3 Yb o = 4.9. Los valores iniciales estirnaciones generadas se establecen mediante las ecuaciones 5.18 y 5.19 establecen mediante las ecuaciones 5.18 y I-a a I Ao=ao---bo A0 = a0 b0 a (5.18) (5.19) A=a0-2 Ej emplo Ejemplo 5.8 a lab .4 Jill JiII calcula los valores apropiados para el ejemplo 5.7 usando las ecuaciones 5.18 y 5.19. valores 5.19. 1 1- a .6 A0 = a0 - - - b o = 650.3 - - 4.9== 642.9 Ao G o b( = 650.3 -4.9 642.9 A 'o = a() -- 2 A = Go a ~ bo = 650.3 - 2 ~ 4.9 = 635.6 2 4.9 = 635.6 b0 = a .4 JiII comienza Ia atenuación empleando estos valores. La colunma 3 es Jill la atenuación empleando estos valores. La columna 3 es A1==aY I + (1 -ay + (1 Al La colunina 4 es columna a)A I _ 1 .4(654) (1 .4)(642.9) = 647.3 = .4(654) + (1 - .4)(642.9) = 647.3 A = cxA1 + (1 - cx)A1 = .4(647.3) (1 .4)(635.6) + 640.3 = .4(647.3) + (1 - .4)(635.6) + 640.3 columna La coluruna 5 es a1 = 2A1 - A 6 es La columna 6 es = 2(647.3) - 640.3 = 654.3 = 2(647.3) - 640.3 = 654.3 b1= 1a (A1A) .6 a = -~ (647.3 -- 640.3) = 4.7 = (647.3 640.3) = 4.7 La columna 7 es Yt + 1 = a1 + bl(l) = 654.3 + 4.7(1) = 659 = al b1(1) = 654.3 4.7(1) = 659 Atenuación exponencial a;ustada a la tendencia: Atenuación exponencial ajustada a Ia Método Método de Holt Otra técnica que se usa con frecuencia para manejar una tendencia lineal se denomina usa con frecuencia para manejar una tendencia lineal se denomina Otra técnica parámetros de Holl. La técnica de Holt atenúa la Método de dos parámetros de Holt. La técnica de I-Jolt atenUa en forma directa Ia tendencia Métodos de atenuaciOn exponencial atenuación exponencia 169 la diferentes constantes atenuación para cada ellas. y Ia pendiente empleando diferentes constantes de atenuación para cada una de ellas. En el enfoque de Brown, sólo enfoque de Brown, solo se usaba una constante de atenuación y los valores estimados de constante atenuación los valores estimados de Ia tendencia serán muy sensibles variaciones aleatorias. La técnica de la tendencia serán muy sensibles a variaciones aleatorias. La técnica de Holt proporciona flexibilidad al seleccionar las proporciones las que se rastrearán la tendencia y la mayor flexibilidad al seleccionar las proporciones aa las que se rastrearán la tendencia y la pendiente. Las tres ecuaciones que se utilizan en esta técnica son: técnica 1. La serie exponencialmente atenuada: atenuada: A, = aY, + (1 - + T,1) (5.20) 2. La estimación de Ia tendencia: de la T, = - A,1) + (I - 13)T,1 = Y(+p = (5.21 ) (5.21) 3. El pronóstico dep periodos en el futuro: de p periodos en el futuro: A, pT( A( + pT, (5.22) en donde A r = nuevo valor atenuado A, = los datos (O = a = constante de atenuación de los datos (0 ~ a ~ 1) Yr = nueva observación o valor real de la serie, en el periodo t observación o valor real de la serie, en el periodo 1', = {J = constante de atenuación de la Ia tendencia /3 = constante de atenuación de Ia estimación de la tendencia 1) (OSo{JSol) estimación de la tendencia futuro p = periodos a pronosticar en el futuro pronóstico de p periodos Yr+p = pronóstico de p periodos en el futuro += = T, = Tr (0fl La primera ecuaciOn,5.20, es muy similar a la ecuación original de atenuación atenuación La primera ecuación, 5.20, es muy similar a la ecuación original exponencial simple, 5.12, con excepción de que se incorpora un nuevo término (Tr) para exponencial simple, de que (Ti) para la tendencia. La estimación de la tendencia se calcula tomando la diferencia entre los valores Ia tendencia. Ia se calcula tomando sucesivos de atenuación exponencial (A, -- A,_1).Ya que los valores sucesivos se atenuaron atenuación exponencial (A r A r- 1). Ya que los valores sucesivos se atenuaron fines de aleatoriedad, diferencia constituye una estimación de la en los con fines de aleatoriedad, su diferencia constituye una estimación de la tendencia en los datos. Para atenuar Ia estimación de la tendencia se utiliza una segunda constante de segunda constante de Para atenuar la estimación de tendencia se utiliza atenuación, /3 atenuación, {J. La ecuación 5.21 muestra que la estimación de la tendencia (A, r -A,_1) se ecuación 5.21 muestra que la estimación de la tendencia (A - A r- 1) se multiplica por y se suma después aaIa anterior estimación de la tendencia (T,), multiplicada por y se suma después la anterior estimación de la tendencia (Tr), excepto que Ia atenuación se realiza para La ecuación 5.21 es (1 - {J). La ecuación 5.21 es similar a la 5.20, excepto que la atenuación se realiza para la /3). para los datos reales. El resultado la ecuación 5.21 es una tendentendencia en vez de para los datos reales. El resultado de la ecuación 5.21 es una tendenatenuada que excluye cualquier aleatoriedad. cia atenuada que excluye cualquier aleatoriedad. ecuación 5.22 muestra el pronóstico de p periodos a futuro. multiplica La ecuación 5.22 muestra el pronóstico de p periodos a futuro. Se multiplica la la (Tr) (P) el producto estimación de Ia tendencia (T,) por el número de periodos en el pronóstico (p) y el producto niimero de suma al nivel actual de los datos A r para eliminar aleatoriedad. se surna después al nivel actual de los datos A,,, para eliminar aleatoriedad. - 170 Promedios móviles y métodos de atenuaciOn móviles y métodos de atenuación Capítulo 5 Cap [tub Ejemplo 5.9 ilustra la atenuación exponencial ajustada la La tabla 5.9 ilustra la atenuación exponencial ajustada a Ia tendencia, para los datos de Acme Company. comenzar, se requieren dos valores estimados iniciales, el valor inicial Tool Company. Para comenzar, se requieren dos valores estimados iniciales, el valor inicial el valor inicial de la tendencia. lo regular, se estima estimado y el valor inicial de La tendencia. Por Jo regular, el valor inicial atenuado se estima cuantas observaciones anteriores de la serie. El valor inicial de la tendencia promediando unas cuantas observaciones anteriores de Ia serie. El valor inicial de Ia tendencia estima mediante de la pendiente de la ecuación de la tendencia obtenida de datos se estima mediante el uso de la pendiente de Ia ecuación de Ia tendencia obtenida de datos hay disponibles datos cero como estimación inicial. anteriores. Si no hay disponibles datos anteriores, se usa cero como estimación inicial. atenúa los datos El valor de alfa es similar al del modelo de atenuación (ecuación 5.12) y atenüa los datos eliminar aleatoriedad. La constante de atenuación es como a, excepto que atenúa la para eliminar aleatoriedad.La constante de atenuación es como a, excepto que atenáa Ia tendencia los datos. Ambas constantes de atenuación eliminan aleatoriedad ponderando tendencia en los datos. Ambas constantes de atenuación eliminan aleatoriedad ponderando valores anteriores. En Ia tabla 5.9 se demuestra la técnica para aa= .3 y fi = .1. A contmuación se presentan la tabla 5.9 se demuestra Ia técnica para = Y fJ = continuación presentan los cálculos que conducen al pronóstico del periodo 3. l. Actualización de Ia serie exponencialmente atenuada: la atenuada: A, = cxY, +(l - - a)(A,1 + T,_1) aY¡ + (1 a)(At-) + T'_l) A z == .3yz + (l - .3)(A2_1 + T z _ 1 ) A2 .3y2 + (I - .3)(A Z_¡ = .3(350) + .7(500 + 0) = 455 .3(350) .7(500 O) = 455 2. Actualización de la estimación de Ia tendencia la tendencia T, = f3(A, -A¡_.) + (l -T, = f3(A¡ - A,1) + (1 f3)T'_1 Tz T2== .1(A z - - AH) + (1 -- .I)1'2z _ 1 .l(A2 A2) + (l .1)T = .1(455- - 500) + .9(0) ==-4.5 .1 (455 500) + .9(0) 4.5 3. Pronóstico de un periodo a futuro: periodo futuro: Y,+p = A, = A, + pT, + pT, Y2+1 = = A2 + pT2 A z + pTz ,93 = 455 + (-4.5) = 450.5 y3 = 455 + (-4.5) = 450.5 4. Determinación del error del pronóstico del pronóstico e, = Y, - Y¡ e¡ = Y, - 1', 200.5 e3 = Y3 - Y3 = 250 -- 450.5== -200.5 250 450.5 e3 25 se calcula como:' El pronóstico para el periodo 25 se calcula como: 1. Actualización de la serie exponencialmente: 1. Actualización de Ia serie exponencialmente: A24== .3Y24 ++(1 -- .3)(A24_ + T241)) .3y24 (1 .3)(A z4 _ 1 + T Z4 - 1 A Z4 A2 = .3(650) + .7(517.6 + 9.8) = 564.2 A z = .3(650) .7(517.6 9.8) = 564.2 Métodos de Métodos de atenuación exponencial Actualizaciôn 2. Actualización de Ia estimación de Ia tendencia: la la tendencia: 171 T24== .1(A 24 - - A24_1) +(1 -- .1)T24 -¡ .l(A24 A 24 - 1) + (1 T 24 = .1(564.2 ~ 517.6) + .9(9.8) = 13.5 .1(564.2 - 517.6) + .9(9.8) = 13.5 Pronóstico de 3. Pronóstico de un periodo a futuro periodo futuro = A24 + pT24 225 564.2 + (13.5) = 577.7 Y25==564.2 + (13.5) = 577.7 TABLA 5.9 PRONÓSTICO DE ATENUACION EXPONENCIAL DE LAS VENTAS DE PRONOSTICO TABLA 5.9 ATENUACIÓN EXPONENCIAL DE LAS VENTAS DE COMPANY, TÉCNICA DE HOLT, PARA EL EJEMPLO 5.9 ACME TOOL COMPANY, TECNICA DE HOLT, PARA EL EJEMPLO 5.9 (1) (I) (2) Yt (3) A, (4) T, (5) (6) Y, ~ 500 500 450.5 379.8 379.8 376.0 390.5 390.5 369.4 369.4 304.6 304.6 289.1 295.1 251.4 202.8 249.7 336.5 337.7 305.9 381.0 438.6 432.7 411.2 476.8 575.9 567.9 527.4 577.7 e, 0 O -150 -200.5 20.2 74.0 -40.5 -169.4 -4.6 60.9 -95.0 -101.4 197.2 300.3 13.5 -87.7 244.1 169.0 -38.6 -82.7 188.8 273.2 -75.9 -167.9 122.6 122,6 I I 2 3 3 4 5 5 6 6 7 7 8 8 9 9 10 tO Ii 11 12 12 13 13 14 14 15 15 16 16 17 18 19 20 21 21 22 23 24 25 EMe 21 488.3. EMC = 21 488.3. 500 350 250 400 450 350 200 300 350 200 150 400 550 350 250 550 550 550 550 400 350 600 750 500 400 650 500.0 455.0 390.4 385.9 398.2 398.2 378.3 378.3 318.6 303.2 303.2 307.4 307.4 266.6 221.0 262.0 339.8 340.6 340.6 311.4 379.1 379.1 431.7 427.0 407.9 467.8 558.7 553.1 517.6 564.2 0 O -4.5 -10.5 -9.9 -7.7 -8.9 -14.0 -14.1 -12.3 -15.2 -18.2 -12.3 -3.3 -2.9 -5.5 1.8 6.9 5.7 3.3 8.9 17.1 14.8 9.8 13.5 la minimización del error medio Con base en Ia minimización del error rnedio cuadrado (EMC), este modelo no resulta de atenuación exponencial utilizó mejor que el de atenuación exponencial simple que utilizó una constante de atenuación de .34. error método de Holt .34. Si se compara los porcentajes de error medio absoluto (PEMA), el método de Holt es mejor. Al comparar los prornedios de ventas reales para el primer trimestre de 1994, el comparar los promedios primer trimestre de 1994, el 172 Promedios móviles y atenuación Promedios mOviles y métodos de atenuaciOn Capítulo 5 Cap itulo modelo de Holt parece desempeñarse mejor. También el porcentaje medio de error (PME) desempeñarse porcentaje medio de error (PME) resulta menor en el método de Holt. a= .34 IX = .30 .10 f3=.10 IX EMC 21,421 EMC = 21,421 EMC PEMA PEMA PEMA PEMA = 35.41% 35.41 % = 33.48% PME PME -11.50% = 11.50% -6.65% = 6.65% .30} .30 = .30} f3 = .20 22,380 = 22,380 EMC 22,349 EMC = 22,349 PEMA = PEMA = 33.74% PME = 6.22% = -6.22% Al utilizar un programa de computadora que elige de manera automática las constantes de de computadora que elige de manera automática atenuación, a es igual .3 /3 es igual .2. El EMC se reduce ligeramente atenuación, a es igual aa.3 y y f3es igual aa.2. El EMC se reduce ligeramente a 22 349 y el Y PEMA se mantiene casi igual en 33.74%. El porcentaje medio de error (PME) es 6.22%, que PEMA se mantiene casi igual en 33.74%. El porcentaje medio de error (PME) es -6.22%, que significa que predicciones basadas en modelo aún consistentemente grandes. Se significa que las predicciones basadas en este modelo son ann consistentemente grandes. Se necesita investigar Ia posibilidad de que haya en los datos una variación estacional. la posibilidad de que haya variación estacional. Atenuación exponencial ajustada a la la Atenuación exponencial ajustada a Ia tendencia y a Ia estacional: Modelo de variación estacional: Modelo de Winter examinar los datos de Acme Tool Company en la tabla 5.1, se observa que las ventas Al exarninar los datos de Acme Tool Company en la tabla 5.1, se observa que las ventas son consistentemente altas durante el primer y cumio trimestres y que son menores durante son consistentemente altas durante el primer y cuarto trimestres y que son menores durante Aparentemente patrón estacional. El modelo de atenuación exponencial el tercero. Aparenternente existe un patron estacional. El modelo de atenuación exponencial lineal y estacional de tres parãrnetros de Winter, que es una extension del modelo de Holt, parámetros extensión del modelo de Holt, lineal pronóstico. pudiera reducir el error de pronóstico. Se utiliza una ecuación adicional para detenninar la adicional para determinar la estacionalidad. Esta estirnación está dada por un Indice estacional y se estacionalidad. Esta estimación está dada por un índice estacional y se calcula con la ecuación 5.25, la cual muestra que la estimación del Indice estacional (Y,/A1) se multiplica la cual muestra que la estimación del índice estacional (Y/Al) multiplica y, se la estimación estacional (SI-L), multiplicada por (1 por 2 se suma después a la estimaciOn estacional anterior (S(_L),multiplicada por (1 -razón YI índice de hacerlo La razón Y, se divide entre Al para expresar el valor en forma de iiidice en vez de hacerlo A, para expresar el valor fonna en términos absolutos, de modo qiie pueda prornediarse con el Iridice estacional atenuado modo que pueda promediarse el índice estacional en té1111inos absolutos, al periodo t - L. L. al periodo ecuaciones que el Las cuatro ecuaciones que emplea ci modelo de Winter son: n. l. La serie exponencial atenuada: atenuada: A=a S Y L + (1 - a)(A,1 + T11) (5.23 ) (5.23) 2. La estimación de la tendencia: de la tendencia: T1 = f3(A - A1) + (1 - f3)T1 YI Y (5.24) 3. La estirnación de Ia estacionalidad: estimación la S = y - + (1 -- y)SfL SI = 'Y (l 'Y)S,-L A, (5.25) El pronóstico dep periodos en el futmo: 4. El pronOstico de p periodos en el futuro: = (A - pT1)S11, (5.26) Métodos de atenuación exponencial atenuaciOn exponencial 173 en donde A r = nuevo valor atenuado = nuevo valor atenuado a = constante de atenuación (O < a < 1) constante atenuación (0 < 1) fJ = constante de atenuación de la estimación de la tendencia /3 = (O < fJ < 1) (0<fl< 1) Y= ~ = nueva observación o valor real de la serie en el periodo nueva observación o valor real de la serie en el periodo t Tr = estimación de la tendencia T, = estimación de constante de atenuación de la estimación la y= constante de atenuación de Ia estimación de Ia estacionalidad (O < y< 1) (0<7<1) Sr ==estimación de la estacionalidad S1 estimación de la p = periodos a estimar a futuro = periodos estimar futuro L = longitud de la estacionalidad estacionalidad L= Y,+= pronóstico de p periodos a futuro Yr + p = pronóstico dep periodos a futuro La ecuación 5.23 actualiza la serie atenuada. Una pequeña diferencia en esta ecuación atenuada. Una pequeña diferencia en esta ecuación la distingue de la correspondiente (5.20) en el modelo de Holt. En Ia ecuación 5.23, Y1 se la correspondiente el modelo de Holt. En la ecuación 5.23, Yr se divide Sr-L, lo cual ajusta Yr aala estacionalidad, eliminando así los efectos estacionales que S,_L, lo cual ajusta Y. la estacionalidad, eliminando asI los efectos estacionales pudieran existir en el dato original 1",. en el dato original ~. Después de atenuar la estimación de la estacionalidad y la estimación de la tendencia estimación de estacionalidad estimación de Ia tendencia en en las ecuaciones 5.24 y 5.25, se obtuvo un pronóstico con la ecuación 5.26. Ésta es casi ecuaciones 5.24 5.25, obtuvo un pronóstico con la ecuación 5.26. Esta es casi la misma que Ia formula correspondiente, écuación 5.22, que se emplea para obtener el la fÓlmula correspondiente, écuaciOn 5.22, que se emplea para obtener el la pronóstico en el modelo de Holt. La diferencia estriba en que esta estimación para un diferencia estriba en que estimación para un pronóstico en el modelo de Holt. periodo futuro t + p, se multiplica por S,_L+. Este Indice estacional es ci iiltimo disponible, + se multiplica por Sr-L+p' índice el último de ahI que se utilice para ajustar el pronóstico a Ia estacionalidad. utilice para ajustar el pronóstico a la estacionalidad. de ahí Ejemplo Ej emplo 5.10 La tabla 5.10 ilustra la atenuación exponencial ajustada a la tendencia y a la estacionalidad, ilustra la atenuación exponencial ajustada tendencia y a la estacionalidad, La para los datos de Acme Tool Company. Para comenzar los cálculos, se requieren las para los datos de Acme Tool Company. Para comenzar los cálculos, se requieren las estimaciones iniciales de valor atenuado, tendencia y cada una de las cuatro estimaciones de las cuatro estimaciones de estirnaciones iniciales de valor atenuado, tendencia y cada estacionalidad. El valor inicial atenuado puede estimarse promediando unos cuantos valores estacionalidad. El valor inicial atenuado puede estimarse promediando unos cuantos valores anteliores de la serie. El valor inicial de Ia tendencia se puede estimar utilizando Ia valor inicial de la tendencia se puede estimar utilizando la anteriores de Ia serie. pendiente la ecuación de tendencia obtenida de datos anteriores. Las estimaciones de pendiente de Ia ecuación de tendencia obtenida de datos anteriores. Las estimaciones de estacionalidad se pueden calcular para datos anteriores mediante Ia descomposición de la estacionalidad se pueden calcular para datos anteriores mediante la descomposición de la serie de tiempo (cap. 8). (cap. serie de El valor de aes similar al dcl modelo de atenuación exponencial simple (ecuación 5.12), El valor de a es similar al del modelo de atenuación exponencial simple (ecuación 5.12), Y los datos para eliminar aleatoriedad. La constante de atenuación f3 es similar a alfa, salvo y los datos para eliminar aleatoriedad. La constante de atenuación /3 es similar a alfa, salvo que atenia la tendencia constante de atenuación y que atenúa Ia tendencia en los datos. La constante de atenuación r es parecida a alfa y a beta, datos. con excepción de que atenia Ia estacionalidad de los datos. atenúa la estacionalidad los datos. con excepción de En Ia tabla 5.10 se demuestra Ia técnica de Winter para = .4, ,B= .1 y = .3 Ya que En la tabla 5.10 se demuestra la técnica de Winter para aa= .4, f3 = .1 Y y = .3.. Ya que hay datos anteriores disponibles, se usa 500 como el inicial, O como el valor de no hay datos anteriores disponibles, se usa 500 como el valor inicial, 0 como el valor de estimación inicial de tendencia y 1.0 como la estimación inicial de estacionalidad. A estimación inicial de tendencia y 1.0 como Ia estimación inicial de estacionalidad. A los cálculos que conducen a los valores atenuados actualizados para continuación se presentan los cálculos que conducen a los valores atenuados actualizados para el periodo 2. 2. r 174 Promedios mOviles y métodos de atenuación Promedios móviles y Capítulo 5 Cap itulo 5 l. La serie exponencialmente atenuada: atenuada: 1. A= Al = a: Y, S + (1 -(l Y ,-L a:)(A I _ 1 + T11) Tt-I) A2 = .4 1.0 + (1 - .4)(A21 + T21) = .4-+ + - - .4)(500 O) 140 + 300 = 440 = .4 350 (1 (l .4)(500 + 0) = 140+ 300 =440 1.0 2. La estimación 2. La estimación de la tendencia: la tendencia: T1 = {3(A, - A,1) T, = - At-I) + (1 -(l {3)T'_1 T z = .1 (A z - - A2-\) + (l -- .1)Tz_ 1 T2 .1 (A2 A21) + (1 .1(440 - 500) (1 - .1)0 = = = 6 = .1(440 -500) + + (1 - .1)0 -66++O0 =-6 3. 3. La estirnación de la estacionalidad: estimación la estacionalidad: S =Y (l y)St-L S1= y ---!.. + (1 -- y)S(_L I Y A, S2 = .3 A2 + (1 - .3)1.0 350 = .3 440 + (1 - .3)1.0 = .2386 + .7 = .9386 .3 (1 .3)1.0 = .2386 + .7 = .9386 Los cálculos que conducen a! pronóstico del periodo 6 se muestrari a continuación. al del periodo 6 se muestran a continuación. l. La serie exponencialmente atenuada: serie exponencialmente atenuada: 1 A5 = .4 = .4 450 = 1.0 + (1 - .4)(A51 + T51) + .6[368.4 + (-11.2)1 = 394.189 .6[368.4 (-11.2)] = 394.189 2. La estirnación de la tendencia: estimación la tendencia: T5 = .1(A5 - A5_) + (1 .1(394.189 - 368.2) .9( 11.2) 7.5 = .1(394.189 - 368.2) ++.9(-11.2) ==-7.5 3. La estimación de la estacionalidad estimación la estacionalidad Ys S5 = .3 A + (1 - .3)S54 Ss = .3 (l - .3)SS_4 S = .3 394.2 + .7(1.0) = .3425 + .7 = 1.0425 = .7(1.0) .3425 .7 = 1.0425 450 394.2 Métodos de atenuación exponencial exponencial 175 4. El pronóstico de lm periodo a futuro 4. El pronóstico de un periodo a futuro Yt+p = (A1 + pT,)S,_L+P (A t + pT)St_L+P y5+ I = (A5 + pT5)S5_41I = (As + pT S )SS_4+ Y6 = [394.2 + 1(-7.5)](.9386) = 362.9 = 362.9 Y6 = [394.2 + técnica Winter resulta los modelos anteriores si se considera el La técnica de Winter resulta mejor que los modelos anteriores si se considera el pronósticos el primer trimestre minimizar el EMC. Al comparar los pronósticos de ventas reales para el primer trimestre minimizar EMe. de 1994, también Ia técnica de Winter parece desempenarse mejor. El uso de un programa 1994, la desempeñarse de de computadora para seleccionar de manera automática las mejores constantes de atenuamanera automática mejores constantes de atenuación, reducirIa ann más el EMC. reduciría aún más el EMe. PRONÓSTICO ATENUACION EXPONENCIAL DE LAS VENTAS DE TABLA 5.10 TABLA 5.10 PRONOSTICO DE ATENUACiÓN EXPONENCIAL DE LAS VENTAS DE TOOl COMPANY, TÉCNICA DE WINTER, PARA El EJEMPLO 5.10 ACME TOOL COMPANY, TECNICA DE WINTER, PARA EL EJEMPLO 5.10 (1) t (2) 1', Y, (3) A A, 500.0 440.0 360.4 368.2 394.2 381.2 311.9 295.6 303.0 260.3 219.5 277.5 364.7 364.7 377.0 (4) T1 T, (5) St S, (6) (7) Y,+p 500.0 500.0 500.0 500.0 500.0 500.0 500.0 500.0 357.0 357.0 362.9 338.8 305.5 293.2 271.2 202.9 206.2 287.6 321.7 296.5 404.9 490.3 387.3 337.6 554.1 591.0 491.7 430.9 687.3 751.9 546.2 449.6 718.8 e, 0.0 -150.0 -250.0 -100.0 93.0 -12.9 -138.8 -5.5 56.8 -71.2 -52.9 193.8 262.4 28.3 -46.5 145.1 59.7 12.7 12.4 12.4 45.9 159.0 159.0 8.3 -30.9 -37.3 I 1 2 2 3 3 4 5 5 6 6 7 8 9 10 11 12 13 14 15 16 17 18 18 19 19 20 21 500 350 250 400 450 350 200 300 350 200 150 150 400 550 350 250 550 550 400 350 600 750 500 400 650 22 23 24 25 26 27 28 28 354.1 354.1 403.1 426.4 437.5 450.1 450.1 471.9 471.9 531.8 548.8 546.4 546.4 0.0 -6.0 -13.4 -11.2 -7.5 -8.1 -14.2 -14.4 -12.2 -15.3 -17.8 -10.2 -0.5 0.8 -1.6 3.5 5.5 6.0 6.7 8.2 13.4 13.7 12.1 10.9 1.00 0.94 0.91 1.03 1.04 0.93 0.83 1.02 1.08 0.88 0.78 1.15 1.21 0.90 0.76 1.21 1.23 0.90 0.77 1.23 1.28 0.90 0.76 1.22 EMe EMC = 12431.5. 176 Promedios mOvilesy métodos de atenuación móviles y métodos de atenuación Capítulo CapItulo 5 El método de Winter proporciona una forma fácil de explicar la estacionalidad en un proporciona una forma fácil de explicar la estacionalidad en un modelo, datos tienen un patrón estacional. Un método alternativo consiste en modelo, cuando los datos tienen un patron estacional. Un método alternativo consiste en desestacionalización es desestacionalizar primero o ajustar estacionalmente los datos. La desestacionalización es estacionalmente los datos. desestacionalizar primero o proceso que quita a los datos en bruto el efecto de estacionalidad; este proceso se un proceso que quita a los datos en bruto el efecto de estacionalidad; este proceso se estacionamostrará en el cap.8. Después se aplica el modelo de pronóstico a los datos sin estacionamostrará en cap.8. Después se aplica el modelo de pronóstico a los datos lidad y posteriormente los resultados se estacionalizan de nuevo para proporcionar pronósticos precisos. Es frecuente que los pronosticadores encuentren este método más preciso que el uso encuentren este método uso del enfoque de Winter sobre los datos originales. Este enfoque es también más flexible que originales. enfoque es también más flexible que el método de Winter, pues permite utilizar Ia atenuación simple cuando los datos son datos son el método de Winter, pues permite utilizar la atenuación simple cuando estacionales, pero no hay presente una tendencia. presente una tendencia. estacionales, de corto plazo. La atenuación exponencial es una técnica popular para los pronósticos de corto plazo. frecuente que métodos Sus mejores ventajas son un costo simplicidad. Sus mejores ventajas son un bajo costo y simplicidad. Es frecuente que los métodos de exponencial único se requieren pronósticos de inventaatenuación exponencial sean el ünico enfoque cuando se requieren pronósticos de inventarios que contienen miles de elementos. miles de elementos. basan en Los pronósticos de promedios móviles simples y atenuación exponencial se basan en promedios prornedios ponderados de mediciones anteriores. La explicación consiste en que los valores anteriores. información de to que futuro. anteriores contienen información de lo que ocurrirá en el futuro. Debido a que los valoanteriores incluyen fluctuaciones aleatorias, asI como información relativa patrón res anteriores incluyen fluctuaciones aleatorias, así como información relativa al patron subyacente de una variable, se intento de atenuar estos valores. enfoque subyacente de una variable, se hace un intento de atenuar estos valores. Este enfoque fluctuaciones supone que las fluctuaciones extremas representan aleatoriedad en una serie de observaciorepresentan aleatoriedad en una de observaciotiempo. nes de tiempo. media de cierto número de valores Los promedios móviles implican el cálculo de la media de cierto nilmero de valores Los promedios móviles implican el de una variable. Este promedio se convierte ahora en el pronóstico del siguiente periodo; una variable. Este promedio se convierte ahora en el pronóstico del siguiente periodo; hasta formular futuro deseado. después, el proceso se repite hasta formular un pronóstico del periodo futuro deseado. Este método asigna una ponderación igual a cada valor anterior. Sin embargo, se puede formular argumento convincente para impOltancia valores más recientes. Se un argurnento convincente para dar mayor importancia a los valores más recientes. Se emplea la atenuación exponencial debido a que se asigna una ponderación decreciente a emplea la atenuación exponencial debido a que se asigna una ponderación decreciente a las observaciones más antiguas. Ambos enfoques comprenden una regla conjunto de las observaciones más antiguas. Ambos enfoques comprenden una regla o conjunto de reglas para detenninar las ponderaciones. las ponderaciones. reglas APLICACIÓN EN APLICACIÔN EN LA ADMINISTRACIÓN ADMINISTRACION Los pronósticos son uno de los insumos más importantes que desarrollan los administradores para auxiliarse en el proceso de toma de decisiones. Virtualmente, cada decision el proceso de toma de decisiones. Virtualmente, cada decisión res para auxiliarse algún operativa importante depende en algtin grado de un pronóstico. La acumulación de demanda se basa en un pronóstico de la demanda esperada; el departamento de producción tiene que programar los requerimientos de personal y los pedidos de materia prima prograrnar los requerimientos de personal y los pedidos de materia prima para el siguiente finanzas requerimientos o los dos siguientes meses; el departamento de finanzas debe determinar los requerimientos contrataciones suspensiones temporales. lista de aplicaciones de los pronósticos de contrataciones y suspensiones temporales. La lista de aplicaciones de los pronósticos numerosa. resulta muy numerosa. la importancia los pronósticos. De Los ejecutivos están en realidad conscientes de la importancia de los pronósticos. De hecho, se dedica una gran cantidad de tiempo al estudio de las tendencias en asuntos hecho, dedica gran cantidad tiempo al estudio de las tendencias en asuntos económicos políticos cómo pueden afectar los sucesos la demanda de productos y/o económicos y politicos y cómo pueden afectar los sucesos la demanda de productos yb Glosario Glosarlo 177 177 serVICIOS. Un aspecto de interés es la importancia que asignan los ejecutivos a los servicios. Un aspecto de interés es Ia importancia que asignan los ejecutivos a los pronósticos cuantitativos, comparados con sus propias opiniones. Este aspecto es en especial participan sucesos que tienen un impacto significativo en demanda. sensible cuando participan sucesos que tienen un impacto significativo en la demanda. Un problema de pronóstico cuantitativos datos históricos. problerna de los métodos de pronóstico cuantitativos es que dependen de datos históricos. Quizá por esta razón sean menos efectivos para predecir los Q uizápor esta razón sean menos efectivos para predecir los cambios que a menudo resultan mayor o menor demanda. computadora administradores en una mayor o menor dernanda. La computadora ha auxiliado a los administradores en la auxiliado automatización de Ia sensibilidad a cambios agudos en demanda, través de sistemas autornatización de la sensibilidad a cambios agudos en la demanda, a través de sisternas adaptativos y modelos causales. modelos causales. Los métodos no formales son ütiles por su relativa simplicidad. Estos métodos Los métodos no formales son útiles por su relativa simplicidad. Estos métodos simples tienden ser menos costosos, más fáciles de implementar más sencillos de simples tienden a ser menos costosos, más fáciles de implementar y más sencillos de comprender. Con frecuencia, el costo la complejidad los modelos más sofisticados comprender. Con frecuencia, el costo y la complejidad de los modelos más sofisticados tienen que cualquier ganancia precisión. motivos, negocios tienen mayor peso que cualquier ganancia en precision. Por estos motivos, los negocios pequeños encuentran prácticos los modelos no formales. Las empresas que no tienen pequeños encuentran prácticos los modelos no formales. Las empresas que no tienen y/o personal capaz estadísticos, prefieren computadoras yb personal capaz de manejar modelos estadIsticos, prefieren también los modelos fOll11 a1es. A menudo, los administradores empresas se enfrentan la modelos no formales. A menudo, los administradores de empresas se enfrentan con la necesidad de preparar pronósticos COlio plazo para varios elementos diferentes. Un necesidad de preparar pronósticos a corto plazo para varios elementos diferentes. Un ejemplo clásico el del gerente que debe programar la producción con base en algún ejemplo clásico es el del gerente que debe prograrnar la producción con base en algiiin pronóstico demanda, para cientos productos distintos, una línea de producción. pronóstico de dernanda, para cientos de productos distintos, en una lInea de producción. último, las empresas nuevas que no tienen grandes bases de datos históricos, Por i'iltimo, las empresas nuevas que no tienen grandes bases de datos históricos, encuentran útiles enfoques. ütiles estos enfoques. El método de prornedio móvil realiza bien su trabajo de ajuste a los cambios en El método de promedio mOvil realiza bien su trabajo de ajuste a los cambios en económico los patrones. Es económico de actualizar y no requiere almacenar muchos datos. Debido a muchos datos. ven de algím modo superadas por altos costos iniciales, los métodos que estas ventajas se yen de algin modo superadas por altos costos iniciales, los métodos de promedio móvil se usan con más frecuencia cuando son necesarios pronósticos de promedio móvil se usan con más frecuencia cuando son necesarios pronósticos repetidos. La atenuación exponencial es una técnica popular cuya fuerza reside en una buena La atenuación exponencial es una técnica popular cuya fuerza reside en una buena precisión plazo combinada rápida actualización de bajo costo. precision a corto plazo combinada con una rápida actualizaciOn de bajo costo. La técnica se usa ampliamente cuando se requieren pronósticos regulares mensuales o semanales para cuando requieren pronósticos regulares mensuales o semanales un gran nirn-iero de elementos. La atenuación expnencial se emplea cuando se requieren gran número de elernentos. La atenuaciOn expnencial se emplea cuando se sistemas de inventario que contienen miles de elementos. pronósticos de sistenias de inventario que contienen miles de elementos. GLOSARIO Atenuación exonenciaI Atenuación exponencial Es un proceso utilizado para revisar constanternente un pronóspara revisar constantemente un pronósla luz de la experiencia más reciente. tico a Ia luz de la experiencia más reciente. Promedio móvil encontrando Ia media específico Promedlo móvil Se obtiene encontrando la media de un conjunto especIfico de valores y usándola después para pronosticar el siguiente periodo. después para pronosticar el siguiente periodo. Promedlo simple Se obtiene encontrando la media de todos los valores aplicables y Promedio simple obtiene encontrando la media de todos valores aplicables media para pronosticar el siguiente periodo. empleando después esa media para pronosticar el siguiente periodo. alguna medición Comprende el cálculo través del tiempo Señal de rastreo Cornprende el cálculo de alguna medición de error a través del tiempo establecimiento límites, de modo que y el establecirniento de lImites, de modo que cuando el error acumulativo rebase dicho el límite, se alerte al pronosticador. pronosticador. ilmite, 178 móviles atenuación Promedios mOviles y métodos de atenuación Cap Itulo Capítulo 5 FÓRMULAS CLAVE FORMULAS CLAVE Modelo no formal Y t+I - Y , ,+1 - Y Modelo no formal de " Modelo no formal = Y, + (Y, - Y'-l) tendencia· Y'+I = Y1 + (Y1 - Y1_1) tendencia (5.1 ) (5.1) (5.2) Modelo no formal de proporción " Modelo no ~ Yt de cambio Y,+ 1 = Yt Yt+1 = Y, Yt-1 Y'-l Modelo no fomal Modelo no fomal = estacional t+I Modelo no formal de tendencia y estacional Modelo no t+1 (5.3) (5.4 ) (5.4) = + (Y1 - Y11) + 4 + (Y3 Y1_4) (5.5) Promedio simple Y1 Y,+ I tn Yt+ Y'-l + Y, + Y,i Y'-2 + ... + + Y,-n+l + ... Yt__n+1 (5.6) Promedio móvil móvil Y ,+ 1 = t+1 (5.7) n n Promedlo móvil doble Promedio móvil M1+M,1+M12+"+M n - fl + 1 (5.8) (5.9) (5.10) (5.10) (5.11) (5.11) (5.12) (5.12) (5.13) (5.13) a1 = 2M1 b, = n 2 -= 1 (M, - M;) nI (M1M) Y,+p Atenuación exponencial a1 bp = a, + b,p Y, Y,+ 1 = aY1 + (1 - a)Yt = aY, + (1 - a)Y, A1 Atenuación exponencial doble exponencial doble aY1 + (1 a)A ~ _ I A~ = aA1 + (l -A = aA, + (1 a1 = 2A, a, 2A, , A~ A (5.14 ) (5.14) (5.15) (5.15) (5.16) (5.16) b = _a_ (A - A') b,= (A,Ac) 1 - a' , b1p 1a a = a1 + (5.17) (5.17) Valores iniciales de Ia atenuación exponencial doble iniciales de la exponencial doble 1- a Aa = aa - - - b a b a A=a 1a (5.18) (5.18) Capítulo 5 Capitulo Problemas 179 A'0=a0-2 a o A 'o = Qo - 21-ab Modetode Holt A, = aY, + (1 - a)(A,_1 + T,_1) Modelo de Holt A, = aY, + (1 a)(A,_i + T,_l) T, TI = 13(A,- - A,_1) + (1 -- f3)T,_1 f3(A I A¡-J) (1 (3)T¡-J lab (5.19) (5.20) (5.21) (5.22) (5.23) (5.24) Y,+p = A, + PT, Al + pT, Modelo Modelo de Winter A, A , =a a lSI_L S,L Y Y + (1 -- a)(A,_1 + T,_1) (1 a)(A'_1 T,_I) T, = /3(A, A_1) + (I - (3)T rT r = f3(A, - - A¡-J) + (1 - /3)T,11 y :' + (1 - y)SI_L SI = Y __L. + (1 - y)S,_L , (5.25) = (A, + pT,)S,L,, (5.26) PROBLEMAS 1. ¿Qué técnica de pronóstico revisa constanternente una estimación a la luz de la experiencia más constantemente una estimación a Ia luz de Ia ,Qué reciente? L,Qué técnica de pronóstico usa el valor del periodo actual como pronóstico del siguiente 2. ¿Qué técnica de pronóstico usa el valor del periodo actual como el pronóstico del siguiente periodo? 3. ¿Quétécnica asigna igual ponderación a cada observación? LQé técnica asigna igual ponderación a cada observación? 4. ¿Qué técnica se debe emplear si los datos tienerl tendencia? emplear si los datos tienen Qué Qué 5. ¿Qué técnica se debe emplear si los datos son estacionales? emplear los datos son estacionales? 6. La Apex Mutual Fund invierte principalmente en acciones de tecnologIa. Los valores de posesión tecnología. fondo final cada de 1994, son los siguientes: neta del fondo al final de cada mes de 1994, son los siguientes: MES Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Novieinbre Diciembre PRECIO DEL FONDO 19.39 18.96 18.20 17.89 18.43 19.98 19.98 19.51 20.63 19.78 21.25 21.18 22.14 180 180 3. Promedios mOvites y métodos de atenuación móviles y métodos de Capítulo 5 CapItulo valor del pronóstico para la Mutual Fund, para cada mes, empleando un moEncuentre el valor del pronóstico para Ia Mutual Fund, para cada mes, enipleando un modelo no formal . .El valor para diciembre de 1993 fue 19.00. delo no fomlal El valor para diciembre de 1993 fue 19.00. Evah'ie el método de pronóstico mediante b. Evalúe el método de pronóstico mediante DAM c. Evalúe el método de pronóstico mediante EMC pronóstico mediante EMC Evalñe método d. Evalúe el niétodo de pronóstico mediante PEMA mediante PEMA Evahie método e. Evalúe el método de pronóstico mediante PME pronóstico mediante PME Evalüe método f. Pronostique el precio de la Mutual Fund para enero de 1995. Mutual Fund para enero 1995. Pronostique el precio g. Escriba un mernorando resurniendo sus apreciaciones. un memorando resumiendo sus apreciaciones. 7. Con referencia al problema 6, utilice tin promedio rnóvil de tres meses para pronosticar el precio tres meses pronosticar el precio Con referencia al problema 6, utilice un promedio móvil de la Mutual Fund para enero de 1995. ¿Es este pronóstico mejor que el fommlado con el este pronóstico mej 1995. método no formal? Explique. Explique. 8. Dada la serie siguiente: 8. Dada la serie siguiente: PERIODO I 2 3 4 5 5 YI Yt 200 210 215 216 219 220 225 226 Yt Y, el 100 6 7 8 3. ¿Cuál cs ci pronóstico para ci periodo 8, utiiizando un prornedio rnóvil de cinco meses? el periodo 8, utilizando un promedio móvil cinco meses? ,Cuál es el pronóstico b. Si se eniplea una constante de atenuación de .4, j,cuál serla ci pronóstico de atenuación exatenuación .4, ¿cuál sería el pronóstico de atenuación exSi emplea tilla ponencial para el periodo 4? ponencial c. En el apartado b, ,cuál seria ci error de pronóstico para ci periodo 3? apartado ¿cuál sería el error de pronóstico para el periodo 3? 9. El rendimniento de un bono de obligación general de Ia ciudad de Davenport flucti.ia con el 9. El rendimniento de un bono de obligación general de la ciudad de Davenport fluctúa con el Las cotizaciones mensuales 1994 son las siguientes: mercado. Las cotizaciones rncnsuaies para 1994 son las siguientes: MES Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre DEMANDA 9.29 9.99 10.16 10.16 10.25 10.61 10.61 11.07 11.52 11.52 11.09 11.09 1 0.() 10.80 10.50 10.86 10.6 9.97 CapItulo 5 Capítulo Problemas 181 181 a. Encuentre el valor de pronóstico del rendimiento de los bonos de obligacion general para Encuentre rendimiento obligacion para cada mes, comenzando por abril, mediante un promedio móvil de tres meses. mediante promedio móvil b. Encuentre el valor del pronostico del rendimiento de los bonos de obligacion general para pronóstico rendimiento obligacion general para mes, promedio móvil cada nies, comenzando por junio, mediante un promedio móvil de cinco meses. c. Evalñe estos métodos de pronóstico mediante DAM Evalúe métodos de pronóstico mediante DAM d. Evalüe estos métodos de pronóstico mediante EMC Evalúe métodos de pronóstico mediante EMC e. Evaliie estos métodos de pronóstico mediante PEMA Evalúe pronóstico f. Evalüe estos métodos de pronóstico mediante PME Evalúe métodos de pronóstico mediante PME g. Pronostique el rendimiento para enero de 1995 usando la mejor técnica. Pronostique rendimiento para enero de h. Redacte un memorando resumiendo sus apreciaciones. memorando resumiendo sus apreciaciones. 10. Esta pregunta se refiere al problema 9. Utilice la atenuación exponencial con una constante de problema 9. Utilice atenuación exponencial con una constante Esta pregunta atenuación de un valor inicial de 9.29, para pronosticar rendimiento 1995. atenuación de .2 y un valor inicial de 9.29, para pronosticar el rendimiento de enero de 1995. ¿Es este pronóstico mejor que el realizado mediante el modelo de promedio móvil? Explique. ,Es este pronóstico mejor que el realizado mediante el modelo de promedio móvil? Explique. 11. La Hughes Supply Company utiliza un método de administración de inventario para determinar administración determinar las demandas mensuales de varios productos. Se registraron los valores de demanda de las demandas mensuales de varios productos. Se registraron los valores de demanda de los ültimos 12 meses y están disponibles para pronósticos posteriores. A continuación se presentan están disponibles pronósticos posteriores. A continuación se presentan últimos los valores de demanda de un dispositivo eléctrico, para los 12 meses de 1994: demanda de un dispositivo 12 meses de 1994: MES Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Septiembre Octubre Noviembre Diciembre DEMANDA 205 25 I 251 304 2X4 24 352 300 30ü 241 24 2X4 3I2 312 29 2X9 35 3X5 256 Fuente: registros Fuente: registros de Hughes Supply Company. atenuación .5 y un valor inicial de 205, Use la atenuación exponencial con una constante de atenuación de .5 y un valor inicial de 205, para pronosticar la demanda en enero de 1995. Ia demanda en 1995. 12. La General American Investors Co., una companIa regulada de administración de inversiones, General American Investors compañía administración inversiones, invierte principalmente en acciones de calidad media y alta. Jim Campbell está estudiando el Campbell está estudiando el invierte principalmente en acciones de calidad media alta. valor de posesión por acción para esta compaflIa y le gustaría pronosticar esta variable para 1993. compañía y le gustarla pronosticar 182 Promedios móviles métodos de atenuación Promedios mOviles y métodos de atenuaciOn Capítulo 5 Capitulo Los datos son los siguientes: los siguientes: TRIMESTRE 1 2 18.47 23.85 23.94 19.19 19.80 25.05 26.06 26.69 3 3 17.63 17.63 20.44 24.84 18.97 18.97 22.89 20.33 28.89 28.71 4 1985 1986 1987 1988 1989 1990 1991 1992 16.98 16.98 21.95 22.75 18.04 18.23 21.50 25.33 27.44 20.65 19.29 16.70 17.03 21.41 20.60 30.60 28.56 The Value Une [nves/men/ Survey (Nueva York: Value Line, 1990, 1993), p. 2096. Fuente: The Value Line Investment Surve,v (Nueva York: Value Line, 1990, 1993), p. 2096. Calcule el Calcule el valor de posesión por acción utilizando los siguientes métodos de pronóstico: no de posesión por acción utilizando los siguientes métodos pronóstico: fOfilal, promedio móvil atenuación exponencial. Al coniparar estas técnicas considere que formal, promedio móvil y atenuación exponencial. Al comparar estas técnicas considere que el valor real de posesión por acción para el primer trimestre de 1993 fue de 25.87. Redacte un posesión por acción para el trimestre de 1993 fue 25.87. Redacte valor real informe para Jim indicando el método que debe utilizar y por qué. qué. indicando Southdown, lnc., el tercer productor de cemento a nivel nacional, 13. Southdown, Inc., el tercer productor de cemento a nivel nacional, está impulsando un programa de querna de combustible de desperdicio. El costo total para Southdown se estima en 37 milloquema combustible de desperdicio. El costo total para Southdown se estirna en 37 millodólares. Por esta razón, es en extremo importante para la compañía tener un pronóstico nes de dôlares. Por esta razón, es en extremo importante para la cornpaflIa tener un pronóstico trimestre de 1993. preciso de utilidades para el segundo trirnestre de 1993. Los datos son: utilidades TRIMESTRE TRIM ESTRE 1 2 88.8 89.1 185.2 158.4 149.8 136.8 136.1 3 3 92.1 92.4 162.4 160.6 151.7 141.3 138.6 4 1986 1986 1987 1987 1988 1989 1990 1990 1991 1992 1993 77.4 77.5 74.7 129.1 127.2 103.0 107.3 106.1 79.8 80.1 178.1 138.7 132.9 123.5 123.7 Fuente: The Value Line [nves/men/ Survey (Nueva York: Value Line, 1990, 1993), p. 900. Fuente: The Value Line Investment Survey (Nueva York: Value Line, 1990, 1993), p. 900. a. Utilice Ia atenuación exponencial con una constante de atenuación de .4 y un valor inicial la atenuación exponencial con una constante atenuación un valor inicial 77.4 para pronosticar los ingresos por acción para el segundo trimestre de 1993. de 77.4 para pronosticar los ingresos por acción para el segundo trimestre de 1993. b. Utilice ahora una constante de atenuación de.6 y un valor inicial de 77.4 para pronosticar una constante de atenuación de .6 y un valor inicial de 77.4 para pronosticar los ingresos por acción para el segundo trimestre de 1993. ingresos acción segundo 1993. c. Estime Ia constante de atenuación que dará el mejor pronóstico. la constante dará el mejor pronóstico. d. ¿Cómo es el valor de su pronóstico comparado con el de 142 de Va/tie Line? de su pronóstico comparado el de 142 de Value Line? Cómo Capítulo 5 CapItulo 5 Problemas 183 14. La Triton Energy Corporation realiza exploraciones y produce petróleo y gas. La presidenta de realiza exploraciones y produce petróleo y gas. la companIa, Gail Freeman, desea que un analista pronostique las ventas por acción para 1993. compañía, Gail Freeman, desea que un analista pronostique las ventas por acción Éste pronóstico Este será un pronóstico importante, ya que los planes de restructuración de Triton se encuentran en en un bache. Los datos son: POR ACCiÓN DE TRITON, 1974-1992 VENTAS POR ACCION DE TRITON, 1974-1 992 AÑO AT0 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 VENTAS POR ACCION ACCIÓN AÑO ARO 1984 1985 1986 1987 1988 1989 1990 1991 1992 VENTAS POR ACCION P0k ACCIÓN .93 1.35 1.48 2.36 2.45 2.52 2.81 3.82 5.54 7.16 1.93 5.17 7.72 5.33 8.12 10.65 12.06 11.63 6.58 Fuente: The Value Line Investment Survey (Nueva York: Value Line, 1990, 1993), p. 1848. ValueLine Investmellt Survey (Nueva York: 1990, 1993), p. 1848. Fuente: Utilice tanto el promedio móvil doble de Brown como Ia técnica de Holt, para pronosticar 1993. la para pronosticar 1993. Compare los resultados mediante las mediciones apropiadas. ¿Cómo resulta su pronóstico Compare los resultados mediante las mediciones apropiadas. ,Cómo resulta pronóstico de 8.30 de Value Line? comparado con el de 8.30 de Value Line? 15. La Consolidated Edison Company vende electricidad (82% de sus ingresos), gas (13%) y vapor Consolidated ingresos), (13%) y vapor la (5%) en Ia ciudad de Nueva York y en el condado de Westchester. A Bart Thomas, pronosticador de la compañIa, se le asigna la tarea de pronosticar las utilidades por trimestre para 1993. Los compañía, asigna la tarea de pronosticar las utilidades trimestre 1993. Los datos reunidos son: son: TRIMESTRE DE CONSOLlDATED EDISON INGRESOS POR TRIMESTRE DE CONSOLIDATED EDISON DÓLARES), 1985-1992 (MILLONES (MILLONES DE DOLARES), 1985-1992 AÑO ANO 1985 1985 1986 1986 1987 1987 1988 1989 1990 1991 1992 MARZO 31 31 1441 1414 1284 1327 1387 1494 1479 1456 JUN10 30 JUNIO 30 SEPTIEMBRE 30 1526 1411 1493 1469 1575 1613 1720 1717 DICIEMBRE 31 31 1321 1321 1185 1185 1192 1192 1213 1213 1371 1371 1209 1187 1125 1102 1218 1263 1330 1280 1369 1369 1344 1344 1480 Fuente:The Value Line fllvestment Survey (Nueva York:York: Value Line, 1990, 1993), p. 168. Fuente: The Value Line hwestment Survey (Nueva Value Line, 1990, 1993), p. 168. Determine Detem1ine la mejor técnica y formule el pronóstico para 1993. y formule el pronóstico para 1993. 184 Promedios móviles y métodos de atenuaciOn móviles y métodos de atenuación Capítulo 5 Cap Itulo CASO DE ESTUDIO 5.1 ESTUDIO S.l THE SOLAR ALTERNATIVE COMPANY 2 THE SOLAR ALTERNATIVE COMPANY2 La Solar Alternative Company está por iniciar su tercer año en funcionamiento. La compafila fue fundada compañía por Bob y Mary Johnson, ambos profesores de ciencias en Ia secundaria local. Los Johnson fundaron Johnson, ambos ciencias en la fundaron en sus investiesta empresa para obtener ingresos complementarios a su sueldo académico. Con base en sus investigaciones sobre sistemas de energía gaciones sobre sistemas de energIa solar, pudieron armar un sistema solar para calentar agua en el hogar. para calentar el hogar. El sistema consta de un tanque de almacenamiento de 378.5 litros, de fibra de vidrio, dos paneles solares almacenamiento de fibra de vidrio, dos paneles .91 por instalación. tuberla de .91 por (1.83 metros), controles electrónicos, tubería de PVC y diversas piezas para instalación. El periodo de vida del sistema es de diez afios. Aunque desde el punto de vista financiero esta vida del sistema es de diez años. El periodo situación no representa la novedad situaciOn no representa una oportunidad atractiva de inversión, existe suficiente interés en la novedad oporturiidad atractiva de inversion, para proporcionar un nivel moderado de ventas. Después de costos y gastos, los Johnson del concepto para proporcionar un nivel moderado de ventas. Después de costos y gastos, los Johnson de sistema de obtienen alrededor de $75 dólares libres de los $2000 que cuesta un sistema instalado. El costo de dólares libres de los materiales y equipo es del 75% del costo del sistema instalado. Un punto a favor del bajo margen del instalado. Un ganancia de ganancia es que el producto no es lo suficientemente rentable como para tener competencia por parte lo para tener competencia los contratistas calefacción. Los Johnson tienen el negocio en su casa, con una oficina en el de los contratistas en calefacciOn.Los Johnson tienen el negocio en su casa, con una oficina en ci sótano y emplean su cochera en donde cabe solo un automóvil, exclusivamente para aimacenar sótano emplean su cochera en donde cabe sólo un automóvil, exclusivamente para almacenar componentes y materiales componentes y materiales del sistema. Como resultado, los gastos adicionales son mInimos. Los Johnson resultado, los gastos adicionales son mínimos. Los Johnson el funcionamiento de la disfrutan de un modesto ingreso complementario por el funcionamiento de la empresa, la cual también representa ciertas ventajas de carácter fiscal. ciertas ventajas de carácter fiscal. Bob y Mary están satisfechos con el crecimiento del negocio. Aunque las ventas varían de un con crecimiento del negocio. Aunque las ventas varlan de un mes a otro, en general el segundo aflo fue mucho mejor que el primero. Muchos clientes en el segundo otro, en general el segundo año el primero. Muchos clientes en el segundo año fueron vecinos de personas que compraron el sistema durante el primer año. Aparentemente, aflo fueron vecinos de personas que compraron el sistema durante el primer año. Aparentemente, después de ver funcionar con éxito el sistema durante un año, otros se animaron aaprobar ci concepto funcionar con éxito durante un año, otros se animaron probar el concepto solar. largo del año. La mayor demanda se presenta al final del verano y solar. Las ventas se suceden a lo largo del año. La mayor demanda se presenta al final del verano y principios del otoflo, cuando por lo regular la gente hace planes para preparar sus hogares para la principios del otoño, cuando por lo regular Ia gente hace planes preparar hogares temporada de invierno, cuando ernplearán calefacciOn. invierno, cuando emplearán calefacción. Con el crecimiento anticipado del negocio, los Johnson piensan que necesitan un pronóstico de ventas para manejar con efectividad el próximo afio. Por lo regular, toma de 60 aa90 dIas la recepciOn con efectividad el próximo año. Por lo regular, toma de 60 90 días la recepción almacenamiento, después de de los tanques de almacenamiento, después de hacer el pedido. Los paneles solares están disponibles el pedido. Los paneles solares están disponibles de inmediato Ia mayor parte del afio. Sin embargo, al final del verano y durante el otoño el tiempo parte del año. Sin embargo, al final del verano y durante el la requerido ternlinar llevar 100 días. Aunque existe una competencia requerido para terminar un proyecto puede Ilevar de 90 a 100 dias. Aunque existe una competencia limitada, convertirse en una posibilidad real si se le pide al cliente potencial lirnitada, la pérdida de ventas puede convertirse en una posibilidad real si se le pide al cliente potencial espere varios meses para instalarle. Tal importante la hacer proyección que espere varios meses para instalarle. Tal vez sea más importante Ia necesidad de hacer una proyección los compras combinar factores con el de ventas para aprovechar los descuentos en compras por volumen. Al conibinar estos factores con el los componentes limitado almacenamiento disponible en la alto costo de los componentes del sistema y el limitado espacio de almacenamiento disponible en la MES Enero Febrero Marzo Abril Mayo Junio 2 1993 5 5 6 10 13 18 15 1994 1994 17 17 14 20 23 30 38 MES 1993 23 26 21 21 15 12 14 1994 44 41 33 23 26 17 Julio Agosto Septiembre Octubre Noviembre Diciembre 2 Este caso es una contribución de William P. Darrow de Ia Towson State University, Towson, Maryland una contribución William Darrow la Towson State University, Capítulo 5 CapItulo Caso de estudio 185 cochera, necesari<Hiesarrollar W1 la cochera, hacen necesariodesarro1lar Un pronóstico confiable. En Ia siguiente tabla se presenta la historia presenta historia de la compañía en sus dos primeros años: de ventas de Ia compañIa en sus dos primeros afios: PREGUNTAS 1. Identifique el modelo que deben emplear Bob y Mary como base en Ia planeación de su empresa la 1995 y exponga por qué se eligió dicho modelo. en 1995 y exponga por qué se eiigió dicho modelo. 2. Pronostique las ventas para 1995. 1995. ESTUDIO 5.2 CASO DE ESTUDIO 5.2 MR. TUX MR. John Mosby, propietario de varias tiendas de renta de ropa de etiqueta Mr. Tux, comienza a pronosticar Mr. Tux, la importante su negocio, ventas mensuales en dólares. (Véanse los casos de Mr. Tux Ia variable más inlportante de su negocio, ventas mensuales en dólares. (Véanse los casos de Mr. Tux final los cap. al final de los cap. 1 y 2). Una deysus empleadas, Virginia Perot, reunióPerot, reunió los datos dese I 2). Una de sus empleadas, Virginia los datos de ventas que ventas que se el del cap. presentaron en ci caso dcl cap. 2.. Sybil/Rlmner John usó el programa Sybil/Runner en el caso de estudio 4.2, para analizar los patrones de los datos. pam Ahora dcsca pronosticar por mcdio de las técnicas de promedio móvil y de atenuación exponencial. desea medio de promedio móvii y de atenuación exponencial. Comienza pidiendo al programa que pronostique mediante atenuación exponencial simple. El pronostique mediante exponencial simple. El progrania le indique la constante de atenuación (a) a programa Ic pide que indique la constante de atenuación (a) a utilizar, o que indique si desea que calcule el valor óptimo. John hace esto último y el programa encuentra que el valor óptimo de aes .400. ci óptimo. John hace esto iiltirno y el programa encuentra que el valor óptimo de aes .400. programa rcsúmenes de mediciones de error. El progrania calcula también varios resiinienes de mediciones de error. Estos valores resumen eirores reales de los datos histôricos, mediante el método de atenuación los errores en Ia predicción de valores reales de los datos históricos, mediante el método de atenuación la prcdicción dc exponencial simple en donde a = .400. John decide registrar tres mediciones de error que son: exponencial simple en donde a .400. John decide registrar tres mediciones de DAM = 281.66 DAM = 281.66 PME = -5.0% = PME = 5.0% PEMA = 24.0% = PEMA = 24.0% La desviación absoluta media (DAM) es el error promedio en que se incurre al pronosticar valores absoluta media (DAM) es error promedio pronosticar valores porcent'Úe medio de error (PME) indica un ligero sesgo. El PEMA indica que ci error anteriores. anteriorcs. El porcentaje medio de eiTor (PME) indica un ligero sesgo. El PEMA indica que el error promedio es de 24 l Yo de los valores reales, una cifra que John encuentra más bien elevada. 24% de los valores reaics, una cifra que John encuentra elevada. A continuación, John pide al programa que aplique a sus datos la atenuación exponencial de Holt. sus datos Ia atenuación exponencial Holt. Este programa utiiiza ci método dc atcnuación exponencial, pero puede también contemplar una programa utiliza el método de atenuación exponencial, puede también contemplar una De nuevo, John hace que el programa las constantes a tendencia en los datos. Dc nuevo, John hace que el programa calcule las constantes óptimas a utilizar en Ia actualización dc Ia serie y la tendencia. Dichos valores resultan ser a = .167 y /3 = .001. Los tres la la scrie y Ia tcndcncia. Dichos valores resultan ser a = .167 Y fJ = .001. Los tres resúmenes el restimcnes de medición de error, para ci método de Holt, son = DAM ==245.84 DAM 245.84 PME = -6.1% = PME =-6.1% PEMA = 18.8% = PEMA = 18.8% El siguicntc método que prueba Jolm es la atenuación exponencial de Winter. Este método puede John cs Ia atenuación exponencial de Winter. Este método puede siguicnte tomar en cuenta tanto Ia tendencia como los factores estacionales, y da por resuitado las siguientes cuenta tanto la tendencia como los factores estacionales, y da por resultado las siguientes constantes de atcnuación: a = .333, /3 = .667, y = .333. Las medicioncs de error son constantes de atenuación: a = .333, fJ .667, r = .333. Las mediciones de eiTor son DAM 334.52 = DAM ==334.52 PME -4.6 % = PME =-4.6% = PEMA = 22.6 % PEMA = 22.6 186 Promedios mOvfles y métodos de atenuación móviles y métodos de atenuaciôn Capítulo 5 Capitulo Por último, John da instrucciones al programa para utilizar un promedio móvil de tres meses ultirno, John da instrucciones at programa para utilizar un promedio móvil de sobre sus datos. Las mediciones de error para este modelo son DAM = 288.58 DAM = 288.58 PME =0.6% PME = 0.6 % PEMA =8.9% PEMA = 8.9 % Al comenzar el estudio de los resultados de su anáiisis, John se desilusiona con los resultados resultados su análisis, 10hn se desilusiona con los resultados obtenidos. Esperaba que alguno de los métodos le diera pronósticos precisos de los periodos anteriores: entonces podría usar ese método para pronosticar los niveles de ventas de los meses por venir del entonces podrIa usar ese método para pronosticar los niveles de ventas de los meses por venir del de estos métodos próximo año. Pero los errores prornedio (DAM) y los porcentajes de error (PEMA) de estos niétodos promedio lo llevan a buscar otra forma de pronóstico. Ilevan TAREA 1. Resurna el nivel de error para ci mejor método encontrado por John mediante el programa ReslID1a el nivel eITor para el mejor método encontrado por 10hn mediante el programa Sybil/Runner. ,Cuál es 2. ¿Cuál es el valor ideal del PME a! utilizar cuaiquier método de atenuación exponencial? PME al utilizar cualquier ,Cuai es el significado signo negativo el PME? 3. ¿Cual es ci significado de un signo negativo en el PME? ,Está 4. ¿Está usted de acuerdo con la decepción de John respecto a sus resultados? acuerdo con la decepción de 101m respecto a sus resultados? CASO DE ESTUDIO 5.3 ESTUDIO 5.3 CONSUMER CREDIT COUNSELING CREDIT COUNSELING Consumer Credit Counseling (CCC) se describió en los caps.l (caso de estudio .2) y La operación de Consumer Credit Counseling (CCC) se describió en los caps. I (caso de estudio 11.2) y 3 (caso de estudio 3.4). ejecutivo Marv Harnishfeger, llegó a la conclusión de que la variable más importante El director ejecutivo Mary Harnishfeger, iiegó a Ia conclusion de que Ia variable más importante requería el número de que requerla pronosticar CCC era ci niimero de nuevos clientes por atender en el resto de 1993. Marv en ci resto Mary proporcionó a Dorothy Mercer los datos mensuales de nuevos clientes atendidos por CCC en el periodo de 1993. Véase caso de estudio 4.3. En ese caso de estudio, Dorothy empleó el análisis de enero a marzo de 1993. Véase caso de estudio 4.3. En ese caso de estudio, Dorothy empleO ci anáiisis autocorrelación explorar el patrón de datos. Con base en de autocorreiación para explorar el patrOn de datos. Con base en los resultados de esta investigación: TAREA Desarrolle l. Desan'olle un modelo no formal para pronosticar ci nuimerode clientes a atender por CCC en el formal el número de clientes a atender por CCC en el resto de 1993. de 1993. 2. Desanolle un modelo de promedio mOvil para pronosticar el número de clientes a atender por Desarrolie un modelo promedio móvil para pronosticar el niimero de clientes a atender por el resto de 1993. CCC en ci resto de 1993. clientes a atender 3. Dcsarroile un modelo dc atenuaciOn cxponenciai para pronosticar ci nuirnero de ciientes a atender Desarrolle lID modelo de atenuación exponencial para pronosticar el número el resto de 1993. por CCC en cl resto dc 1993. 4. Evaluicestos modelos mediante las técnicas de medición de eITor de pronóstico que se Evalúe estos modelos mediante las técnicas de medición dc error de pronóstico que se presentaron en ci cap. 4. el cap. 4. Capítulo 5 CapItulo Caso de estudio 187 5. Elija el mejor modelo y formule ci pronóstico para el resto de 1993. mejor modelo y fom1Ule el pronóstico resto de 1993. Determine por qué adecuado método 6. Determine por qué es adecuado el método de pronóstico que eiigió. pronóstico que eligió. CASO DE ESTUDIO 5.4 PROYECCIÓN DE INGRESO QUINQUENAL PROYECCION DE INGRESO QUINQUENAL PARA DOWNTOWN RADIOLOGY PARA Downtown Radiology está desarrollando el centro niédico de iniágenes rnás completo y tecnológicamédico imágenes más tecnológicamente avanzado que cualquier otro ubicado en el area. El equipo que se planea para el centro será igual cualquier área. o superior a las instalaciones de imágenes de todos los centros medicos de la region. El centro tendrá médicos región. tendrá un digitalizador para tomografia computarizada CT serie 9800 y un equipo nuclear de imágenes por digitalizador para tomografia computarizada CT serie 9800 y un equipo nuclear de imágenes por resonancia magnética (MRI). También incluirá ultrasonido, medicina nuclear, angiografia por sustracTarnbién incluirá ultrasonido, medicina nuclear, angiografia por sustracción digital (DSA), equipo de mamografia y equipo convencional de radiologIa y fluoroscopía. Se mamografia convencional de radiología y fluoroscopla. Se ción digital (DSA), equipo ofrecerán membresías ofrecerán membreslas mediante alguna forma de oferta pOblica, y Downtown desea una evaluaciOn oferta pública, y Downtown evaluación independiente del mercado, para lo cual solicitó aaProfessional Marketing Associates, Inc., una independiente del mercado, para lo cual solicitó Professional Marketing Associates, Inc., una evaluación del mercado asI como una proyección de ingresos para cinco años. así corno una proyección de ingresos para cinco años. ENUNCIADO DEL PROBLEMA El propósito de este estudio consiste en pronosticar los próximos cinco ai'íos para el centro médico de próxirnos cinco aflos para ci centro medico de imágenes propuesto. OBJETIVOS OBJET! VOS del son Los objetivos del estudio son Identificar areas de mercado para cada tipo de servicio a ofrecer por las nuevas instalaciones. áreas las instalaciones. Reunir y analizar los datos existentes sobre ingresos en el area de mercado para cada tipo de el área servicio a ofrecer por las nuevas instalaciones. ofrecer por las nuevas instalaciones. Identificar las tendencias en la industria de atención aa la salud, que afecten positiva o Identificar las tendencias en Ia industria de atención la salud, que afecten positiva negativamente servicios proporcionar por las nuevas instalaciones. negativarnente los ingresos por los servicios a proporcionar por las nuevas instalaciones. Identificar, en la planeación del nuevo riesgo, factores en empresas, comercialización o Identificar, en Ia planeación dcl nuevo riesgo, factores en empresas, comercialización o instalaciones, impactarían negativamente instalaciones, que inipactarian positiva o negativarnente las proyecciones de ingresos. Analizar los servicios anteriores de Downtown Radiology como una base de datos para el Analizar los servicios anteriores de Downtown Radiology como una base de datos para ci pronósticos desarrollar. modelo de pronósticos a desarroliar. Utilizar el modelo apropiado pronóstico cuantitativo para liegar las proyecciones Utilizar el modelo apropiado de pronóstico cuantitativo para llegar a las proyecciones de cinco años de ingresos para ci centro propuesto. de ingresos para el centro propuesto. METODOLOGIA Procedimientos P roced irn ie n to s se Con ci propósito de formular Ia proyección de cinco aflos de ingresos, se implementaron los siguientes el la años de pasos: se realizó un análisis del nOmero de servicios anteriores. Sc desarroliO el método apropiado de análisis del número anteriores. Se desarrolló ci método pronóstico y se utilizó para determinar un punto de partida para Ia proyección de cada servicio. la 188 188 Promedios mOviles y métodos de atenuación móviles y Capítulo 5 Cap Itulo 5 1. Se determinó el area de mercado para cada tipo de servicio y se obtuvieron pronósticos de mercado cada tipo de servicio y se obtuvieron pronósticos de Se detenninó el área población para 1986 y 1990. 1986 y 1990. 2. Se estudiaron patrones de referencias de doctores, para determinar ci ni:imero de doctores que referencias doctores, detenninar el número de doctores Se estudiaron patrones enviaban pacientes a Downtown Radiology, así como el número de pacientes que envió cada envió cada enviaban pacientes a Downtown Radiology, asI como ci námero de doctor. 3. Se obtuvieron cifras del National Center for Health Statistics. Estas estadIsticas se compararon for Health Statistics. Estas estadísticas se compararon números reales obtenidos de la comisión del hospital. con nümeros reales obtenidos de Ia comisión del hospital. 4. La participación en el mercado de Downtown Radiology se calcuió con base en tomografias participación el mercado de Downtown Radiology calculó con base en tomografias computarizadas reales en el área de mercado (la participación en el mercado para otros servicios reales area mercado participación en ci mercado otros servicios detenninó en la participación Downtown Radiology, comparada con se determinó con base en Ia participación de Downtown Radiology, comparada con las cifras proporcionadas por ci National Center for Health Statistics). el National Center for Health Statistics). Suposiciones el cuantitativo, fonnular Se hicieron las Para desarrollar ci pronóstico cuantitativo, fue necesario formular ciertas suposiciones. Sc hicieron las siguientes: • El nuevo centro de imágenes estará funcionando con todo el equipo, excepto del de MRJ, para El centro de imágenes estará funcionando con todo ci equipo, excepto del de MRJ, para el1 de enero de 1985. eli de enero de 1985. • El equipo nuclear de imágenes por resonancia magnética (MRI) estará funcionando en abril de (MRJ) funcionando en abril de El 1985. menos para 50 médicos en el • La oferta de sociedad limitada tendrá un mercado exitoso por lo menos para 50 medicos en ci area área de servicio. interés económico en ci nuevo centro de imágenes, incrementarán • Los doctores quienes tienen interés económico en el nuevo centro de imágenes, incrementarán el número de pacientes que envIan al centro. envían ci nümero MRJ el área servico antes de 1987. • No habrá otros equipos MRI en ci area de servico antes de 1987. • El nuevo centro de imágenes ofrccerá servicios a precios menores que la competencia. ofrecerá servicios a precios menores que la competencia. • Se llevará a cabo un esfuerzo efectivo de comercialización, con una concentración especial en y sindicatos. número empresas con gran nilmero de empleados, grupos de aseguradoras y sindicatos. • Durante los primeros seis meses de funcionamiento, ci equipo MRT sustituirá aproximadamente el MRJ sustituirá aproximadamente ci 60% de los estudios de tomografia de la cabeza, que actualmente se hacen con ci equipo CT, el el el 12 siguientes. y absorberá ci 70% en los 12 meses siguientes. mantener los • El pñblico en general seguirá presionando a Ia industria de atención a la salud, para mantener los público presionando a la precios bajos. ala salud se 13.2% anualmente entre 1971 • El costo de imágenes en la industria de atención a la salud se elevó 13.2% anualmente entre 1971 1981. La Health Care Financing Administration la incremento y 1981. La Health Care Financing Administration estima que ia tasa promedio de incremento anual se reducirá aproximadamente a 11 o 12% entre 1981 y 1990 (Industry Surveys, abril de reducirá aproximadamente 11 o 12% entre 1981 y 1990 (Industry Surveys, abril de 1984). • Las compañIas ascguradoras remboisarán a los pacientes entre el 80 y el 100% dcl costo de compañías aseguradoras rembolsarán a los pacientes entrc ci 80 y ci del News, imágenes de resonancia magnética (Imaging News, febrero de 1984). dc Capítulo 5 CapItulo Caso de estudio 1800 189 1700 1600 1500 1400 1300 ;..:: 1200 < J, C ~ ~ 1100 1000 .900 900 800 700 600 600 5.4 Figura 5.4 Rayos-X por mes, julio de 1981 a mayo de 1994. RayosX por mes, julio de 1981 a mayo de 1994. 500 ' - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Modelos Se desalTolló un pronóstico para cada servicio con base en Ia experiencia anterior, las cifras de la desalTol1ó un pronóstico para cada servicio con base en la experiencia anterior, las la industria y suposiciones razonables. Debido aa que los modelos se desarrollaron basados en las desalTol1aron basados las industria y suposiciones razonables. Debido que los modelos suposiciones antes mencionadas , Si eStaSno son válidas, los modelos no serán precisos. mencionadas, si éstas no son válidas, los modelos no serán precisos. ANÁLISIS DE DATOS ANTERIORES ANALISIS Rayos-X RayosX Se analizó el ntU11ero de servicios de rayos-Xrealizados entrejulio de 1981 y mayo de 1984. Los datos analizó el nimero servicios de rayosX realizados entre julio de 1981 y mayo de 1984. comprenden rayos-X de diagnóstico, rayosX gastrointestinales, imágenes del pecho, inyecciones y comprenden rayosX de diagnóstico, rayos-X gastrointestinales, imágenes del pecho, inyecciones y procedimientos especiales. Los datos se presentan en la fig. 5.4. El examen de estos datos indica que procedirnientos especiales. Los datos se presentan en Ia fig. 5.4. El no están presentes patrones de tendencia, cíclicos o estacionales. Por esta razón, se eligió como método ciclicos razón, se eligió corno método apropiado de pronóstico, la atenuación exponencial. Se examinaron varios factores de atenuación y se encontró que el mejor modelo lo proporcionaba una constante de atenuación de .3. Este valor significa proporcionaba una constante de atenuaciôn de .3. Este valor significa que las observaciones históricas más recientes recibieron una ponderación de .3 y que al resto de la serie .3 ponderación serie Ia tabla 5.11. El histórica se asignó una ponderación de .7. Este modelo se presenta en la tabla 5.11. El pronóstico para junio de 1984 es de 855 servicios de rayos-X. es de 855 servicios de rayosX. Ultrasonido Se analizó el número de servicios de ultrasonido efectuados entre julio de 1981 y mayo de 1984. La fig. el niimero de servicios de ultrasonido efectuados entrejulio 1981 fig. 5.5 muestra el patrón de datos. Tampoco aquí se aprecia la presencia de un patrón de tendencia, cIclico cíclico n-iuestra el patron de datos. Tampoco aquI se aprecia Ia presencia de un patron o estacional. De nuevo se determinO que el mejor modelo era el de atenuación exponencial con un factor determinó que el mejor modelo era el de atenuación exponencial 190 Promedios móviles y métodos de atenuación Promedios mOviles y métodos de atenuaciOn Capítulo 5 Cap Itulo TABLA 5.11 TABLA 5.11 ATENUACION EXPONENCIAL ATENUACiÓN EXPONENCIAL DATOS POR ATENUAR: RAYOS-X ATENUAR: DATOS FACTOR DE ATENUACION = .3 ATENUACIÓN = PERIODO 19 20 21 PERIODO 1 1 RAYOS-X 1,072.00 953.00 1,157.00 1,800.00 1800.00 1,085.00 837.00 1,301.00 1,262.00 977.00 937.00 780.00 873.00 808.00 796.00 752.00 901.00 978.00 770.00 VALOR ATENUADO 1,072.00 1,036.00 1,036.00 1,072.51 1,290.76 1,229.03 1,111.42 1,168.29 1,196.41 1,130.58 1,072.51 1.072.51 984.76 951.23 908.26 874.58 837.81 856.77 893.14 856.20 RAYOS-X 882.00 794.00 946.00 848.00 785.00 779.00 636.00 846.00 712.00 767.00 719.00 689.00 804.00 796.00 910.00 849.00 932.00 VALOR ATENUADO 863.94 842.06 873.87 873.87 866.11 841.78 822.94 766.85 2 2 3 3 4 5 5 6 7 8 9 10 11 11 12 13 14 15 16 17 18 22 23 24 24 25 1,168.29 26 26 27 28 29 30 31 32 33 34 35 790.60 767.02 767.02 752.61 752.61 733.53 754.67 767.07 809.95 821.66 854.76 140 135 130 125 120 'C o 115 a 115 .9 110 "3 ¡g 105 8 8 5 ., .g .8 '§ 8 ., lOO 100 95 90 90 fJ 5 85 80 80 65 65 70 70 60 75 75 Figura 5.5. 5.5. Ultrasonidos en consultorio por mes, julio de 1981 a mayo de 1984. 1981 mayo de 1984. Ultrasonidos en consultorio por mes, julio Capitulo Capítulo 5 Caso de estudio estudlo 191 191 TABLA 5.12 ATENUACION EXPONENCIAL 5.12 ATENUACiÓN EXPONENCIAL DATOS POR ATENUAR: ULTRASONIDOS EN CONSULTORIO DATOS ATENUAR: ULTRASONIDOS CONSULTORIO PERIODO PERlODO 1 1 FACTOR DE ATENUACION = .3 ATENUACIÓN .3 VALOR ULTRASONIDOS ATENUADO ULTRASONIDOS ATENUADO 94.00 108.00 108.00 107.00 107.00 I03.00 103.00 77.00 111.00 111.00 84.00 83.00 78.00 82.00 88.00 79.00 79.00 80.00 86.00 88.00 105.00 105.00 96.00 94.00 98.20 100.84 101.49 101.49 94.14 99.20 94.64 91.15 87.20 85.64 86.35 84.14 82.60 81.82 83.07 84.55 90.69 92.28 PERlODO PERIODO 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 VALOR ULTRASONIDOS ATENUADO 123.00 123.00 111.00 111.00 134.00 134.00 122.00 122.00 91.00 103.00 103.00 79.00 111.00 111.00 77.00 92.00 95.00 114.00 114.00 97.00 89.00 120.00 120.00 117.00 117.00 142.00 142.00 101.50 104.35 113.24 115.87 108.41 106.79 98.45 102.22 94.65 93.86 94.20 100.14 99.20 96.14 103.30 107.41 117.79 2 3 4 5 6 7 8 9 10 II 11 12 13 14 15 15 16 17 18 de atenuación de .3. La tabla 5.12 niucstra qtie ci pronóstico para junio de 1984 es de 118 servicios de tabla 5.12 muestra que el 1984 118 servicios de ultrasonido. Se analizó Se anaiizó el nümero de servicios de ultrasonido realizados por las dos unidades móviles número de servicios de ultrasonido realizados por las dos unidades móviles propiedad de Downtown Radiology, en el periodo de julio de 1981 a mayo de 1984. En Ia fig. 5.6 se Radiology, en ci periodo dejulio de 1981 a mayo de 1984. En la fig. 5.6 se 270 270 260 260 250 240 240 230 230 o .§ 220 220 ] 210 210 200 8 200 190 5 190 180 '" 180 - -8 170 170 '§ 160 160 :3 140 140 130 130 120 ~ 150 150 - 110 100 ' - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 5.6 Figura 5.6 Ultrasonidos fuera de consultorio por mes, julio de 1981 a mayo de 1984. Ultrasonidos fuera de consultorio por mes, julio de 1981 mayo de 1984. 192 170 170 160 160 150 140 .§ 130 1 130 "3 120 § 110 tOO ~ 100 "'¡;:' 90 = 80 ... 70 ..@ 60 .u C ¡:¡ 50 50 C ~ 40 '(3 Q ~ 30 20 10 10 C o móviles y métodos de atenuación Promedios móviles y métodos de atenuaciOn Cap itulo Capítulo 5 ¿ ::s OL-.-l.----.L..---l..----.JL-..l...---I.----l..----.J_..l...---I.----l..----.J_..l...----L----L---.I-.L----L----L---.I----' 0 1 2 3 3 4 4 5 6 6 7 7 8 8 9 9 10 10 11 11 12 13 14 15 15 16 16 17 18 18 19 19 20 21 21 22 17 22 Figura 5.7 Figura 5.7 Medicina nuclear fuera de consultorio por mes, agosto de 1982 a mayo de 1984. fuera 1982 a mayo de 1984. patron datos. En apariencia, una tendencia creciente se puede nioderar muestra el patrón de datos. En apariencia, existe una tendencia creciente que se puede moderar mediante el método de atenuaciOn exponenciallineal de dos parámetros, de Holt. Se emplean las constantes de atenuación exponencial lineal de dos parámetros, de Holt. Se emplean las constantes de atenuación a= .37 y f3 = .18; el pronóstico parajlmio de 1984 es de 226. atenuación a= y /3 = .18; ci pronóstico parajunio de 1984 de Servicios de Servicios de medicina nuclear Se analizó el nímlero de servicios de medicina nuclear prestados por las unidades niOviles propiedad móviles propiedad anaiizO el nárnero de servicios de niedicina de Downtown Radiology, entre agosto de 1982 y mayo de 1984. La fig. 5.7 muestra ci patrOn de datos. de 1982 y mayo de 1984. La fig. 5.7 muestra el patrón de datos. Los datos no son estacionales y no presentan patrón de tendencia o cíclico. Por este motivo, se escogió patron de tendencia ciclico. Por este motivo, se escogió TABLA 5.13 5.13 ATENUACiÓN EXPONENCIAL ATENUACION EXPONENCIAL FACTOR DE ATENUACIÓN = .3 .3 POR ATENUAR: MEDICINA NUCLEAR DATOS POR ATENUAR: MEDICINA NUCLEAR FACTOR PERIODO 14 VALOR SERVICIO FUERA DE CONSULTORIO ATENUADO DE CONSULTORIO ATENUADO 167.00 78.00 64.00 65.00 37.00 48.00 58.00 104.00 41.00 39.00 21.00 167.00 140.30 140.30 117.41 117.41 101.69 82.28 72.00 67.80 78.66 67.36 58.85 47.50 PERIODO SERVICIO FUERA FUERA CONSULTORIO DE CONSULTORIO 29.00 49.00 56.00 44.00 14.00 14.00 24.00 36.00 41.00 65.00 19.00 19.00 61.00 VALOR ATENUADO 41.95 44.06 44.06 47.64 47.64 46.55 15 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36.79 32.95 33.87 3H7 36.01 44.70 36.99 44.19 Capítulo 5 CapItulo Caso de estudio 193 .3 la atenuación exponencial como el método apropiado de pronóstico. Se encontró que un factor de .3 corno el método apropiado de pronóstico. Se encontró daba el mejor modelo. Este modelo se presenta en la tabla 5.13. El pronóstico de servicios de medicina servicios de medicina parajunio de 1984 nuclear parajunio de 1984 es de 44. Tomograflas Tomografias computarizadas el número de tomografias practicadas Se analizó también el nt'irnero de tomografias practicadas en el periodo de juliode 1981 a mayo de 1984. periodo dejulio de 1981 a mayo de 1984. Los datos se presentan en Ia fig. 5.8. No se encontró estacionalidad y no parece haber tendencia en el la fig. número de tomografias. Sin embargo, parece haber un patrón cíclico. Sería importante conocer cuántas conocer cuántas nuimero de tomografias. Sin embargo, patron cIclico. SerIa 350 350 340 3401 "O - .~ 280 280270270 '[ 260260 1:3 ~ 330 330 320 320 310 310 300 300 290 290 - E 250§ 250 0 0 240 ~ 240 ~ C':l 230230 200200 190 190 180 180 \70 170 160 160 150 ' - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 150 E- ~ a ~ 220220 210210 0 Figura 5.8 Tomografias computarizadas por mes, julio de 1981 a mayo de 1984. 5.S Tomografias computarizadas por mes, julio de 1981 1984. tornografias se realizaron el mes pasado para ci pronóstico de lo que sucederá este mes. Se examinó un para el de sucederá este mes. Se examinó un tomografias el autolTegresivo (caps. 9 y 10) y se comparó con un modelo de atenuación modelo autolTegresivo (caps. 9 y 10) Yse comparó con un modelo de atenuación exponencial con una constante de atenuación de .5. Una constante de atenuaciOn más grande asigna mayor ponderaciOn en atenuación de .5. Una constante de atenuación mayor ponderación el pronóstico a las observaciones más recientes. Se determinó que era el mejor modelo y la tabla 5.14 muestra que la proyección del nOmero de tomografias para junio de 1984 es de 223. del número de tomografias parajunio de 1984 es de 223. ANALISIS DEL AREA DE MERCADO ANÁLISIS ÁREA DE MERCADO Se determinaron las areas de mercado para los servicios que presta actualmente Downtown Radiology, detem1inaron las áreas de mercado para los actualmente Downtown Radiology, exaniinando los registros de pacientes y los patrones de referencia de los doctores. Las áreas de mercado areas examinando los registros de pacientes y para los servicios que no presta Downtown Radiology en Ia actualidad, se determinaron investigando la a Ia competencia y analizando las areas geográficas que atienden. la áreas Área de mercado para tomografias computarizadas mercado para tomografias computarizadas Area El área de mercado para tomografias computarizadas del centro médico de imágenes propuesta, incluye area del centro medico de imágenes propuesta, los condados de Spokane, Whitman, Adams, Lincoln, Stevens y Pend Oreille en Washington y los condados Spokane, Whitman, Adams, Lincoln, Stevens y Pend Oreille en Washington y condados de Bonner, Boundaiy, Kootenai Benewah y Shoshone en Idaho. Con base en Ia proyecciOn Boundary, Benewah Shoshone en Idaho. Con base en la proyección 194 TABLA 5.14 5.14 móviles Promedios mOviles y métodos de atenuación ATENUACiÓN EXPONENCIAL ATENUACION EXPONENCIAL Capítulo 5 Capitulo DATOS POR ATENUAR: TOMOGRAFIAS COMPUTARIZADAS TOMOGRAFíAS COMPUTARIZADAS DATOS FACTOR DE ATENUACION = .3 ATENUACiÓN = FACTOR TOMOGRAFIAS TOMOGRAFÍAS VALOR PERIODO COMPUTARIZADAS ATENUADO PERIODO COMPUTARIZADAS ATENUADO I 1 2 3 3 4 5 5 6 7 8 9 10 II 11 12 13 14 14 15 16 16 17 18 VALOR TOMOGRAFÍAS TOMOGRAFIAS PERIODO COMPUTARIZADAS ATENUADO PERIODO COMPUTARIZADAS ATENUADO 19 20 21 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 238.00 250.00 214.00 344.00 236.00 266.00 248.00 261.00 322.00 327.00 312.00 297.00 299.00 272.00 279.00 322.00 276.00 320.00 238.00 244.00 229.00 286.5() 286.50 261.25 263.63 255.81 258.41 290.20 308.60 310.30 303.65 301.33 286.66 282.83 302.42 289.41 304.60 277.00 244.00 253.00 234.00 199.00 190.00 190(X) 187.00 226.00 190.00 151.00 201.00 166.00 166.0() 210.00 191.00 191.00 226.00 207.00 238.00 290.80 267.40 260.20 247.10 223.05 206.53 196.76 211.38 200.69 175.85 188.42 177.21 193.61 192.30 209.15 208.08 223.04 los porcentajes cOITespondientes, el área de mercado para tomografias computarizadas de los porcentajes correspondientes, ci area de niercado para tomografias computarizadas tendrá en 1985 una 1985 una población de 630 655 personas y en 1990, 696 018 personas. de 630 655 personas yen 1990, 696 O18 personas. Estimaciones cuantitativas cuantitativas proyectar los ingresos es necesario determinar ciertas estimaciones Para proyectar los ingresos es necesario determinar ciertas estimaciones cuantitativas. La estimación más importante comprende el número de doctores que participarán en la sociedad limitada. La más importante cornprende el niiniero de doctores que participarán en Ia sociedad limitada. La estimación utilizada en cálculos posteriores es que participarán por lo menos el 8% de Ia población de la estirnación doctores dcl condado de Spokane. del La siguiente incertidumbre que debe cuantificarse comprende Ia determinación de cómo se siguiente inceltidumbre que cuantificarse comprende la determinación de se afectará ci patron de referencias con Ia participación de 50 doctores en la sociedad limitada. Se supone el patrón la participación de 50 doctores en la sociedad limitada. Se supone que 30 de los doctores que actualmente envIan pacientes a Downtown Radiology, se unirán aaIa socicdad dc actualmente envían pacientes a Downtown Radiology, se unirán la sociedad De limitada. Dc los 30 que se adhieren, se suporic quc 10 no incrementarán sus referencias y que los otros sc adhicren, supone que incremcntarán 20 las dup1icarin. También se supone que 20 doctores quc nunca han enviado pacientcs a Downtown duplicarán. También se supone que 20 doctores que nunca han enviado pacientes la Radiology se unirán a la sociedad limitada y comenzarán a enviar por lo menos Ia mitad de su trabajo limitada y comenzarán a dc su trabajo a Downtown Radiology. La cuantificación de referencias adicionales de doctores sc aclarará con algunas obscrvaciones se con algunas observaciones número de 50 doctores que se unirán a la sociedad limitada es conservador. Hay cualitativas. El nOmero de 50 doctores que se unirán a Ia sociedad limitada es conservador. Hay una fuerte posibilidad de que se unan doctores de areas fuera dcl condado de Spokane. Tradicionalrnentc, áreas del Tradicionalmente, fucrte posibiiidad de súbita el patrón ci patron de referencias de los doctores cambia muy lentamente. Sin embargo, es probable que la sObita naturaleza competitiva dcl mercado tenga un impacto en las referencias médicas. Si Ia sociedad limitada competitiva del tenga impacto Si la cspccialidades un potcncial refcrencias ci niimero se ofrece a doctores con especialidades con 1m alto potencial de referencias radiológicas, el número de Capítulo 5 CapItulo Caso de estudio 195 se más número referencias se incrementará más de lo proyectado. Es muy amplia la variabilidad en el ntimero Ia de referencias de doctores por servicio. Pocos doctores abarcan un gran porcentaje de los servicios de abarcan Radiology, Downtown Radiology, si se recluta un nuevo número reducido de doctores con un alto porcentaje nuevo nümero reducido de doctores con un alto porcentaje lograría en el número total de servicios prestados por Downtown. de referencias, se lograria un gran efecto en el námero total de servicios prestados por Downtown. último, debe imágenes, la Por ültimo, se debe estimar el efecto que tendrá el nuevo centro de imágenes, en Ia participación de Downtown Radiology en el mercado. El nuevo centro tendrá el mejor participación de Downtown Radiology en el mercado. El nuevo centro tendrá el mejor equipo estará preparado efectuar todo espectro servicios menor costo. El equipo y estará preparado para efectuar todo el espectro de servicios a menor costo. El nümero número de nuevos doctores que enviarán pacientes aumentará con base en la comunicación doctores que enviarán pacientes aumentará base en la comunicación verbal de los nuevos doctores que inviertan. Si se formulan convenios entre el nuevo centro fonnulan y las compafilas de seguros, las empresas con un gran nümero de empleados yb los las compañías seguros, empresas con un gran número de empleados y/o sindicatos, Downtown podrIa incrementar su participación en ci mercado sindicatos, Downtown podría incrementar su participación en el mercado por lo menos en 4% en 1985, 2% en 1986 y 1% en 1987, reteniendo esta participación en 1988 y 1989. En 1985,2% 1986 y 1% en 1987, reteniendo 1988 1989. En el resto de este informe, se hará referencia a este incremento en Ia participación en el el ci resto de este informe, se hará referencia a este incremento en la participación imagen mercado corno el efecto de irnagen total. como Proyecciones de ingresos Proyecciones Se realizaron proyecciones de ingresos para cada servicio. En eSte caso de estudio, solo se presentan de ingresos para cada servicio. En este estudio, sólo se presentan las correspondientes a tornografias computarizadas. tomografias Proyecciones de tomografias Proyecciones de tomografias computarizadas en el modelo de atenuación exponencial y Con base en el modelo de atenuaciOn exponencial y en lo sucedido en los primeros cinco meses de lo 1984, ci pronOstico de tomografias computarizadas para 1984 (enero de 1984 enero de 1985) es de 2600. 1984, el pronóstico de tomografias computarizadas para 1984 (enero de 1984 aaenero de 1985) es de 2600. El National Center for Health Statistics reporta un Indice de 261 tomografias por cada 100 mu Statistics índice tomografias por cada 100 mil por mes. Utilizando la población para el área de mercado habitantes, por mes. Utilizando Ia poblaciOn proyectada de 630 655 personas para el area de mercado tomografias coniputarizadas, el mercado seria de 19 752 servicios en 1985. El nümero real de tomografias computarizadas, el mercado sería de 19 752 servicios en 1985. El número real de tomografias computarizadas que se efectuaron en el área de mercado en 1983, se estimO en 21600. tomografias computarizadas que se efectuaron en el area de mercado en estimó estimación conocimiento real de los Esta estimaciOn se basó en el conocimiento real de los servicios prestados por: Downtown Radiology por: Radiology (4970), Deaconess 300) YKootenai (1 820) así como estima(2600), Sacred Heart (4970), Deaconess (3 850), Valley (2 300) y Kootenai (1 820) asI como estimaciones para Radiation Therapy (2 400) y Northwest Imaging (4 000). Si las estimaciones son precisas, (2 YNorthwest Imaging (4000). Si las estimaciones son precisas, Downtown Radiology tenía, en 1983, una participación el Downtown Radiology tenla, en 1983, una participaciOn aproximada en ci mercado de 10.5%. También se analizaron los valores reales pam 1982, resultando que Downtown Radiology tenla airededor del 15.5% de para tenía alrededor del 15.5% de participación en el mercado de tomografias computarizadas, en ese año. De ahí que se pronostica que tomografias computarizadas, en ese aflo. De ahI que se pronostica que participación en el mercado 13% del Downtown Radiology prornedia airededor del 13% del mercado. Radiology promedia alrededor Con base en el incremento de referencias de doctores pertenecientes a la sociedad limitada pertenecientes y en un análisis del nOmero de referencias promedio para tomografias computarizadas, se proyecta, a análisis del número de referencias promedio para tomografias computarizadas, partir de esta fuente, un incremento de 320 tomografIas computarizadas para 1985. Si se emplean tomografías computarizadas para 1985. Si se los valores reales de 1983, la proporciOn para el área de mercado de tomografías computarizadas 1983, la proporción para ci area de mercado de tomografias mil habitantes. patrón continúa, el número de es de 3 568 (21 600/6.054) por cada 100 mu habitantes. Si este patron continua, ci nñmero de de 3 568 (21 600/6.054) por tomografias computarizadas en el área de mercado se incrementará a a 22514(3 568 X 6.31) en tomografias computarizadas en el area de mercado se incrementará 22 514 (3 568 x 6.31) 1985. De ahí que se proyecta que la participación en el mercado de Downtown Radiology 1985. De ahI que se proyecta que la participación en el mercado de será del 13% (2 920/22 514) Cuando aumenta al 4% la participación en el mercado con base del 13% (2 920b22 514) Cuando aumenta al 4% la participación en el mercado con base Radiology aumenta en la suma total de imágenes, la participación en el mercado de Downtown Radiology aumenta al 17% y el número proyectado de tomografias computarizadas alcanzará 3 827 (22 514 x .17). a! ci niuiiero proyectado de tomografias computarizadas aicanzará 196 Promedios móviles métodos de atenuación Promedios mOviles y métodos de atenuaciOn Capítulo 5 CapItulo No obstante, la investigación parece indicar que el equipo MRI sustituirá eventualmente un gran indicar sustituirá eventualmente un gran número tomografías computarizadas de cabeza (Applied Radiology mayo/junio de 1983 niimero de tomografias computarizadas de la cabeza (Applied Radiology mayo/junio de 1983 y febrero Diagnostic Imaging, febrero de 1984). El National Center for Health Statistics indica que el 60% de El National Center for Health Statistics indica que el 60% de las tomografías computarizadas fueron de cabeza. registros Downtown Radiology todas las tomografias computarizadas fueron de la cabeza. Los registros de Downtown Radiology que en 1982 el 59% las tomografías la y 54% en 1983. mostraron que en 1982 el 59% de las tomografias computarizadas fueron de la cabeza y 54% en 1983. Si el 60% de las tomografías de Downtown son de la cabeza y el equipo MRI sustituye aproximadamente 60% de las tomografias de Downtown la cabeza y el equipo MRI sustituye aproximadamente el 60% de éstas, se requieren nuevas proyecciones de este tipo de servicio para 1985. Considerando el de éstas, se requieren nuevas proyecciones de este tipo de servicio para 1985. Considerando que el equipo MRI solo funcionará la mitad del año, se pronostica una reducción de 689 tomografías sólo funcionará la mitad del año, se pronostica una reducción de 689 tomografias (3 827/2 x .60 x .60). .60). (3 El número proyectado de tomografías computarizadas para 1985 es de 3 138. El costo promedio nümero tomografias computarizadas para 1985 es de costo promedio de un estudio de este tipo es de $360 dólares yyel ingreso proyectado para los mismos es de $1 129680. tipo de $360 dOlares el ingreso proyectado paralos mismos es de $1 129 680. En la tabia 5.15 se muestran los ingresos proyectados por tomografias computarizadas para los se muestran los ingresos proyectados por tomografías computarizadas para Ia tabla próximos cinco años. Se estima que el costo del servicio se incremente aproximadamente en un 11% 11 % prOximos cinco años. Se estima que el costo del servicio se incremente aproximadamente anual. Sin considerar el efecto del equipo MRI, la proyección de tomografías computarizadas para 1986 ci La proyección de tomografias computarizadas para 1986 es de 4363 (6.31 X .19). Sin embargo, si ci es de 4 363 (6.31 x 1.02 x 3 568 x .19). Sin embargo, si el 60% de las tomografias son de la número proyectado de tomografias se reduciría cabeza y el MRI absorbe el 70% de éstas, el nimero proyectado de tomografias se reducirla a2531 [4463 - (4463 x .60 x .70)]. a 2531 [4463(4463x.60x.70)]. TABLA 5.15 PROYECCiÓN DE INGRESOS DE CINCO 5.15 PROYECCION DE INGRESOS DE CINCO AÑOS POR TOMOGRAFIAS COMPUTARIZADAS A1OS POR TOMOGRAFíAS COMPUTARIZADAS A4O AÑO 1985 1986 1987 1988 1989 SERVICIOS 3,138 2,531 2,531 INGRESOS $1,129,680 1,012,400 1,012,400 1,205,904 1,205.904 1,223,626 1,223,626 1,383,363 2,716 2,482 2,482 2,529 Sin considerar ci efecto del equipo MRI, la proyección de tomografías computarizadas para 1987 el Ia proyección tomografias computarizadas para 1987 4683 (6.31 .20). número es de 4 683 (6.31 x 1.04 x 3 568 x .20). Considerando el efecto del equipo MRI, el nümero .70)]. proyectado de tomografias se reduciría aa2716 [4683 - (4 683 x .60 x .70)]. de tomografias se reducirla 2 716 [4 683 (4683 Sin considerar ci efecto del equipo MRI, Ia proyección de tomografías computarizadas para 1988 el la proyección tomografias computarizadas para 1988 .20). Considerando el efecto del equipo MRI, número 4 773 (6.31 es de 4773 (6.31 x 1.06 x 3 568 x .20). Considerando el efecto del equipo MRI, el nümero proyectado de tomografias se reduciría a 2 482 [4773 -- (4 773 x .60 x .80)]. reduciria 482 [4 773 (4773 .80»). Sin considerar ci efecto del equipo MRI, Ia proyección de tomografías computarizadas para 1989 el la proyecciOn de tomografias computarizadas 4 863 (6.31 .20). MRI, el número es de 4863 (6.31 x 1.08 x 3 568 x .20). Considerando el efecto del equipo MRI, el nitmero reduciría 2 529 [4 863 - (4863 .80»). proyectado de tomografias se reducirla a 2529 [4863 - (4 863 x .60 x .80)]. PREGUNTA El contador de Downtown Radiology proyectO que los ingresos serIan considerablemente más altos. Downtown Radiology proyectó ingresos serían considerablemente más altos. Debido a que Ia participación de propiedad se ofrecerá mediante algün tipo de oferta pithlica, ia propiedad se ofrecerá mediante algún tipo de oferta pública, la Debido que la participación administración de Downtown Radiology debe tomar una decisiOn con respecto a la precision de las decisión con la precisión de las administración proyecciones de Professional Marketing Associates. Se Ic pide analizar ci informe. j,Cuáles serIan sus proyecciones de Professional Marketing Associates. Se le pide analizar el informe. ¿Cuáles serían sus recomendaciones? Versión Plus VersiOn estudiantil de Forecast Plus 197 197 VERSION ESTUDIANTIL DE FORECAST PLUS VERSIÓN ESTUDIANTIL DE FORECAST PLUS mediante la selección de la opción del menu principal. Se accesa el paquete de pronósticos mediante la selección de la opción 3 del menú principal. Si está usted empleando discos (no en im sistema de disco duro), el programa le solicitará empleando discos (no un disco duro), solicitará Si principal del sistema, el mensaje: que inserte el disco principal del sistema, con el mensaje: Insert MAIN Insert MAIN SYSTEM DISK in default drive drive Press <ENTER> ready Press <ENTER> when ready En este momento deberá sustituir el Data Management Disk por el Main System Disk. momento sustituir Data Management Disk Main System Disk. En Presione <Enter> y el programa solicitará el nombre del archivo de datos a utilizar: solicitará nombre utilizar: Presione <Enter> What is the name of the data file? CREDIT is the name of the data file? CREDIT El menu le permite elegir entre 13 diferentes técnicas de pronóstico mediante la siguiente menú le permite elegir entre 13 diferentes mediante siguiente pantalla: file name: Data file name: Variable: B: CREDIT B: NUMBER OF CLIENTS üF Forecasting Analysis * * * *** 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. Simple Moving Average (unweighted) Average (unweighted) Single Exponential Smoothing Single Exponential Double Exponential Smoothing Smoothing Double Smoothing Holt's Two-Parameter Smoothing Harmonic Smoothing Harrison's Harmonic Smoothing Brown's Quadratic Exponential Brown's Quadratic Exponential Smoothing Winter's Seasonal Smoothing Seasonal Smoothing Robust Decomposition Decomposition Census X-11 Decomposition Trend Analysis Regression Trend Analysis Multiple Regression Analysis Analysis Filtering Generalized Adaptive Filtering Analysis Box-Jenkins Analysis Return to Main Menu Which? los datos de nuestro cliente El programa de análisis exploratorio de datos mostró que los datos de nuestro cliente la presentaban una tendencia. Una técnica que elegimos intentar es Ia atenuación exponencial doble, opción 3. En la pantalla aparece: 3. pantalla aparece: doble, 198 Promedios mOviles y métodos de atenuación móviles NUMBER OF CLIENTS-DOUBLE EXPONENTIAL SMOOTHING Smoothing Constant = 0.35 = 0.35 Lead Time = 1 1 Lead Capítulo 5 Cap Itulo RESIDUAL AUTOCORRELATION FUNCTION Mean of the Residuals = .72 the Residuals = .72 Standard Deviation of the Residuals = 26.9765 26.9765 Standard Deviation of the Residuals Lag Value T-Value -1.0 : ------------ - - - - - - - - - - - - - - - - - - - - - - - - ----- 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 11 12 13 13 14 14 15 16 17 18 19 20 21 21 22 23 23 24 25 26 27 27 28 28 29 30 31 31 32 -0.12 -0.06 -0.08 -0.05 -0.03 --0.10 -0.01 -0.03 -0.13 -0.03 0.03 0.22 -0.04 0.04 -0.15 -0.01 0.18 -0.17 -0.05 -0.00 0.05 -0.12 0.03 0.26 -0.04 -0.04 -0.08 0.08 0.19 -0.28 0.08 -0.17 -1.20 -0.55 -0.77 -0.52 -0.33 -0.93 -O .10 -0.10 -0.29 -1.19 -0.33 0.31 2.10 -0.36 0.35 -1.32 -0.11 -0.11 1. 55 1.55 -1.49 -0.43 -0.03 0.42 -0.97 0.25 2.13 -0.35 -0.34 -0.62 0.61 1. 46 1.46 -2.14 0.56 -1.25 [ -0.55 [ -0.77 [ [ [ [ [ -0.29 [ [ -0.33 [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ -0.62 [ [ [ [ [ [ [ [ [ [ ..... . 0.0 - -- --- +1.0 -: ..... ....... .... . ..... . ....... . : .... .. . ... . ...... .. . ... .... . . : ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] . ..... .. :** : . .... .. . :** . : : : : ..... ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] I I I : - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - --: ] = Estimated Two-Standard Error Limits Limits Estimated Two-Standard Box-Pierce Chi-Square Statistic with 32 Degrees for Freedom = 43.2 43.2 Box-Pierce Chi-Square Statistic with 32 Degrees for .089 Probability = .089 NUMBER OF CLIENTS-DOUBLE EXPONENTIAL SMOOTHING NUMBER OF CLIENTS-DOUBLE = 0.35 Smoothing Constant = 0.35 = 1 Lead Time = 1 SUMMARY STATISTICS 122.15 Mean of the Original Data = 122.15 Standard Deviation of the Original Data = 30.043 Standard Deviation of the Original Data = 30.043 = .72 Mean of the Residuals = .72 Standard Deviation of the Residuals of the Residuals Standard Absolute Mean Absolute % Error % Error 26.977 Square Mean Square Error Mean % Error % 1. .0430 1 0430 -2.9088 -2 . 9088 Optimization Period Period of Series Remainder of Series Series Entire Series 19.4225 19.4225 17.8037 18.2002 -1.9410 609.0 609 .0 757.1 720.8 Figura 5.9 Atenuación exponencial doble para el caso de estudio 5.3. 5.9 Atenuación exponencial doble para el Pronóstico mediante hojas de cálculo PronOstico mediante 199 Double Exponential Smoothing Double Smooth Constant: Starting values [SO(1) ,SO(2): [SO(1) SO(2) time: Lead time: of forecasts: Number of forecasts: Time plot of original data, forecasts, and error: original data, forecasts. and error: autocorrelation function: Residual autocorrelation function: Table of original data, forecasts, and error: data. forecasts, and error: Surnmary statistics: Summary statistics: Final smoothed statistics: statistics: ENTER to accept: Press ENTER to accept: A A 1 1 Y Y Y Y N N y Y N N Para ejecutar la técnica de atenuación exponencial doble, podernos emplear las técnica de atenuación exponencial doble, podemos emplear Para ejecutar se muestran. Cuando asigna la opción de automático (A) opciones por omisión que ya se muestran. Cuando se asigna la opcion de automático (A) la constante de atenuación, el programa intentará encontrar mejor constante de a la constante de atenuación, el programa intentará encontrar la mejor constante de especificado (el valor por omisión para automático es de .1 a .9 atenuación en el nivel especificado (el valor por omisión para automático es de .1 a .9 con .1). Para la dos valores iniciales. incrementos de .1). Para Ia atenuación exponencial doble, se requieren dos valores iniciales. línea pronosticar. 1 La lInea Lead Time, se refiere al periodo que se desea pronosticar. El valor por omisión 1 lID pronóstico periodo inmediato siguiente. El níunero de pronósticos proporciona tin pronóstico para el periodo inmediato siguiente. El nñrnero de pronósticos of forecast) se refiere a cuántos pronósticos se desea que produzca el programa. (Number of forecast) se refiere a cuántos pronósticos se desea que produzca el programa. Para nuestro ejemplo, podrIamos haber elegido 9, para producir pronósticos para el resto podríamos haber elegido 9, pronósticos resto 1993. de 1993. salida. fig. A continuación, se presentan diversas opciones de salida. La fig. 5.9 muestra la salida cuando se responde Y la función de autocorrelación residual y las estadísticas cuando se responde Y a la función de autocorrelación residual y a las estadIsticas de resumen y N a las otras opciones. las otras opciones. resurnen y Por último el programa preguntará si desea almacenar pronósticos de los Por ültimo el programa preguntará si desea almacenar los pronósticos de los residuales: Do save the forecasts of residuals (y/n)? Do you want to save the forecasts of residuals (yin)? PRONÓSTICO MEDIANTE HOJAS DE CALCULO HOJAS DE CÁLCULO PRONOSTICO ForeCalc tm programa ForeCaic es un prograrna de pronóstico que trabaja con datos registrados en hojas de cálculo 1-2-3. Inserte ForeCalc enlácelo con su copia de Lotus como Lotus 1-2-3. Inserte ForeCaic y enlácelo con su copia de Lotus 1-2-3 como un programa agregado. amplía capacidad de Lotus 1-2-3 al proporcionarle tm conjunto externo agregado. Esto amplIa la capacidad de Lotus 1-2-3 al proporcionarle un conjunto adicional de menus. Forecalc emplea varios modelos diferentes de atenuación exponencial menús. Forecalc emplea varios modelos diferentes de atenuación exponencial sus datos. para el pronóstico de sus datos. 200 Promedios mOviles y métodos de atenuaciOn móviles atenuación Capítulo 5 Cap [tub El problema. los ejemplos 5.5 a! 5.10, se utilizaron modelos de atenuación El problema. En En los ejemplos 5.5 al 5.10, se utilizaron modelos de atenuación exponencial sobre los datos de ventas trimestrales de Acme Tool Company, de 1988 a 1993. Se requiere el pronóstico para 1994. pronóstico 1994. La solución mediante hoia de cálculo. Coloque el disco ForeCalc La solución mediante hoja de cálculo. Coloque el disco de ForeCaic en la unidad A y escriba INSTALLH después del indicador de comandos A:. Siga las indicacioy escriba INSTALLH después del indicador de comandos A:. Siga las indicacioinstalación. nes de instalación. Una vez concluida ésta, entre a Lotus 1-2-3 (version 2.3) y capture los vez concluida ésta, entre a Lotus 1-2-3 (versión datos de la tabla 5.6 en las celdas Al a A24 de la hoja de cálculo. Escriba /ADDIN datos de la tabla 5.6 en las celdas Al a A24 de la hoja de cálculo. Escriba /ADD-IN ATIACH ó /AA, que equivale seleccionar los comandos ADDIN FILE del menú ATTACH ó /AA, lo que equivale a seleccionar los comandos ADD-IN FILE del menu principal y ATTACH del submenü. En la pantalla aparecerá Ia solicitud del nombre del principal ATTACH submenú. la pantalla aparecerá la solicitud del nombre del archivo a incorporar: archivo I Enter add-in to attach: C:\123R23\*.ADN Enter add-in to attach, C,\123R23\' .ADN presentará lista de programas que se pueden incorporar a 1-2-3. Seleccione: Se presentará una lista de programas que se pueden incorporar a 1-2-3. Seleccione: FORECALC.ADN FORECALC . ADN El administrador de incorporación de programas presenta una lista de teclas de función administrador de incorporación de programas presenta una lista de teclas función disponibles: No~Key 7 No-Key 7 8 8 9 9 la 10 Si no desea asignar ninguna tecla de función al programa incorporado, seleccione N0-KEY. asignar ninguna tecla de función al programa incorporado, seleccione NOKEY. línea de menú aparece el submenú de incorporación de programas. Seleccione En la lInea de menu aparece el submenü de incorporación de programas. Seleccione INVüKE FüRECALC. línea menú menú de ForeCalc: INVOKE y elija FORECALC. En la IInea de menu aparece el menu de ForeCalc: Data Options Quit Forecast Options Quit 1. Seleccione DATA RANGE o DR. Presione <Enter>. La pantalla solicita ci rango de Presione el rango de 1. datos a considerar: data range: Enter data range: Al Como los datos se encuentran en las celdas Al a A24, escriba Al. . A24. La pantalla Como los datos se encuentran en las celdas Al A24, escriba Al. A24. solicita el nümero de periodos a manejar por afio: periodos a manejar por año: ci número . Enter number of periods per year: number of periods per year: 12 Ya que los datos son trimestrales, teclee un 4. La pantalla solicita el periodo inicial: son trimestrales, 4. La pantalla solicita el periodo inicial: Pronóstico PronOstico mediante hojas de cálculo ForeCalc Forecasts ForeCaic 201 WINTERS FORECAST 756.359 531.543 404.522 690.502 (95%) UPPER (95%) 904.482 704.977 601.225 909.117 PERIOD 1/1994 1/ 1994 2/1994 2/ 1994 3/1994 3/ 1994 4/1994 4/ 1994 LOWER (95%) (95%) 608.236 358.109 207.819 471.887 Exponential smoothing parameter values. smoothing Level parameter: parameter: parameter: Trend parameter: Seasonal parameter: 0.591565 0.029564 0.366746 R-square: 0.799 Adjusted R-square: 0.799 Durbin-Watson: 1.527 Durbin-Watson: 1.527 Standard forecast error: 66.237 Standard forecast error: 66.237 RMS Error: 61.959 RMS Error: 61.959 Error: 0.115 MAP Error: 0.115 Standardized BIC: 75.573 EIC: 75.573 Ini tial point: 1/1988 Initial point: 1/1988 Final point: 4/1993 Final point: Number of points: 24 points: 24 Number Mean value: 408.333 Mean value: deviation: 150.843 Standard deviation: 150.843 Figura 5.10 Atenuación exponencial de invierno para ventas de Acme Tools Company. 5.10 Atenuación exponencial invierno Acme Tools Company. Enter starting period: period: 1 Los datos comienzan en el primer trimestre, así que teclee un 1. La pantalla solicita trimestre, asI que teclee un 1. pantalla el aflo inicial: año Enter starting year: 1900 year: 1900 comienzan 1988, 1988. la pantalla reaparece el menú de Como los datos cornienzan en 1988, teclee 1988. En la pantalla reaparece el menu de ForeCalc. ForeCaic. 2. Después de registrar las especificaciones de sus datos, genere el pronóstico de la pronóstico la 2. Después de registrar las especificaciones de sus datos, genere siguiente manera: Seleccione: FORECAST Seleccione: AUTOMATIC [número a Digite: 4 [nürnero de periodos a pronosticar] Presione: <Enter> El programa elige automáticamente el mejor modelo a utilizar y optimiza los parámetros modelo a utilizar y optimiza los parámetros del modelo para asegurar un pronóstico preciso. Seleccione: Seleccione: VIEW Ia pantalla (fig.5 .10), se exhiben los pronósticos y sus lImites de confianza En la pantalla (fig.5.l O), se exhiben los pronósticos y sus límites de confianza asociados. ForeCalc número estadísticas resumidas ForeCaic también proporciona cierto niimero de estadisticas resurnidas que describen a qué tan bien se ajusta el modelo a su serie de datos. Seleccione: DIAGNOSTICS 202 móviles métodos de atenuación Promedios mOviles y métodos de atenuaciOn Capítulo 5 Cap Ituto Estas estadIsticas se muestran también en Ia fig.5.10. El programa ForeCaic permite ForeCa1c Estas estadísticas se muestran también en la fig.5.10. El además obtener gráficas e impresiones para cada una de las opciones. opciones. además obtener grálicas impresiones BIBLlOGRAFIA BIBLIOGRAFIA AAKER, D. A. YyJACOBSON, R. "The Sophistication of of 'Naive' Modeling". International Journal01 AAKER, D. A. JACOBSON, R. "The Sophistication 'Naive' Modeling". International Journal of Forecasting 3 (314) (1987): Forecasting 3 (314) (1987): 449-452. DALRYMPLE, D. D. J. y KING, B. E."Selecting Parameters for ShortTerm Forecasting Techniques." DALRYMPLE, 1. Y KING, B. E."Selecting Pararneters for Short-Tenn Forecasting Techniques." Decision Sciences 12 (1981): 661-669. (1981): GARDNER, E. S., Jr. Yy DANNENBRJNG, G. "Forecasting with Exponential Srnoothing: Sorne GuideliGARDNER, E. S., Jr. DANNENBRING, D. D. G. "Forecasting with Exponential Smoothing: Some Guidelines for Model Selection." Decision Sciences 11 (1980): 37~383. nes for Model Selection." Decision Sciences 11(1980): 370-383. HARRISON,P. P. "Exponential Srnoothing and Short-Tenn Sales Forescasting." Management Science HARRISON, J. J. "Exponential Smoothing and ShortTerm Sales Forescasting." 13 (11) (1967): 821-842. 13(11) (1967): HOLT, C. C. "Forecasting Seasonal and Trends by Exponential1y Weighted Moving Averages." Office HOLT, C. C. "Forecasting Seasonal and Trends by Exponentially Weighted Movmg ofNaval Research, Memorandum No. 52 (1957). Mernorandurn of Naval LEDOLTER, J. J. y ABRAHAM, B. "Some Comments of theInitialization of Exponential Smoothing." LEDOLTER, y ABRAHAM, B. "Sorne Cornrnents of the Initialization of Exponential Srnoothing." Journal of Forecasting 3 (1) (1984): 79-84. Journal 01 Forecasting 3 (1984): MAKRIDAKIS, S.S. y WHEELWIRIGHT, S Interactive Forecasting, Palo Alto, Calif.: Scientific Press, MAKRJDAKIS, y WHEELWIRIGHT, S .C. .C. Interactive Forecasting, Palo Alto, Calif.: Scientific Press, 1977, pp. 145-152. 1977, pp. McKENZIE,E., E., "An Analysis of General Exponential Smoothing".Operations Research 24 (1976): McKENZIE, "An Analysis of General Exponential Srnoothing". Operations Research 24 131-140. 13 1-140. THIEL, H. YWAGE, S. S. "Some Observations on Adaptive Filtering."Management Science.l0 (2) (1964): THIEL, H. y WAGE, "Sorne Observations on Adaptive Filtering." Management Science. 10(2) (1964): 198 - 224. 198-224. WINTERS, P.R. "Forecasting Sales by ExponentialIy Weighted Moving Averages." Management WINTERS, P.R. "Forecasting Sales by Exponentially Weighted Moving Averages." Science 6 (1960): 324-342. Science (1960): , CAPITULO Análisis de regresión 6 En el cap. 2, se expuso Ia reiación lineal entre dos variables numéricas (correlación). Una cap. 2, se expuso la relación lineal entre dos variables numéricas (correlación). Una vez establecida una reiaciOn lineal, se puede emplear 'el conocimiento de la variable vez establecida una relación lineal, se puede emplear el conocimiento de la variable gráfico más sencillo para independiente para pronosticar la variable dependiente. El modelo gráfico más sencillo para relacionar una variable dependiente con tilla soia variable independiente es una Ilnea recta. dependiente línea recta. una sola independiente En En este capitulo se exponen los modelos de regresión lineal simple (línea recta) y cómo capítulo exponen los modelos regresión lineal simple (linea recta) y ajustarlos a un conjunto de puntos de datos mediante el método de mInimos cuadrados. conjunto puntos de datos mediante el método de mínimos cuadrados. ajustarlos a Debido a que se requieren muchos cáiculos en ci análisis de regresión, se hace énfasis en requieren cálculos en el análisis de regresión, Debido aplicaciones de córnputo para las técnicas expuestas. aplicaciones cómputo la relación variables, el cap. 2, Para ampliar el análisis de Ia reiación entre dos variables, que se abordó en el cap. 2, siguiente ejemplo. considere el siguiente ejemplo. Ej empio Ejemplo 6.1 Suponga que el Sr. Bump observa el precio y volumen de yenta de galones de leche de 10 Suponga que el observa el precio y volumen de venta galones leche 10 semanas elegidas en forma aicatoria, Los datos obtenidos se presentan en Ia tabla 6.1. semanas elegidas en forma alcatOlia. Los datos obtenidos se presentan en la tabla 6.1. Primero, el genera dispersión de datos, que muestra Primero, el Sr. Bump genera un diagrama de dispersion de los datos, que se muestra en la flg. 6.1. En el diagrama parece ser que existe una relaciOn lineal negativa entre Y, ci niimero En una relación lineal negativa entre Y, el número In fig. TABLA 6.1 TABLA 6.1 DE LECHE LECHE DATOS DATOS PARA EL EJEMPLO 6.1: GALONES EJEMPLO GALONES SEMANA NIVEL SEMANAL NIVEL DE VENTAS, Y Y (MILES DE GALONES) 10 6 5 12 10 15 5 12 PRECIO DE VENTA, X VENTA, X PRECIO (MILES 1 2 2 3 3 $1.30 2.00 1.70 1.50 1.60 1.20 4 5 5 6 7 5 8 9 10 tO 17 1.60 1.40 1.00 1.10 20 204 Análisis de regresión Capítulo 6 Capitulo 6 de gaiones de leche vendidos y X, el precio de cada galón. Parece que al elevarse el precio, el galones elevarse precio, el X, el galón. volumen disminuye. Ahora, ci Sr. Bump desea medir el grado esta relación aparente. Los cálculos que Ahora, el Sr. Bump desea medir el grado de esta relación aparente. Los cálculos que la tabla 6.2. necesita se presentan en Ia tabia 6.2. El coeficiente de correlación para esta muestra de datos se calcuia a partir de Ia ecuación coeficiente de correlación para esta muestra de dabs se calcula a partir de la ecuación 2.16: r= r = VnX2 -- (X)2 .. Yn~y2 - (Y)2 Yn~X2 (~X)2 Vy2 - (~Y)2 (10)(149.3) - (14.4)(112) (I0)(149.3) - (14.4)(112) n>.XY - (X)(Y) = \/(10)(21.56) - 14.42.• V(i0)(i,488) -- 11222 Y(10)(21.56) - 14.4 2 Y(l0)(1,488) 112 1493 -- 1612.8 1493 1612.8 Y215.6 207.36 Y14,880 12,544 = V215.6 - 207.36 . \/14,880 - 12,544 -119.8 \/8.24 "./2,336 -119.8 (287)(48.33) = .86 = --.86 -119.8 138.7 La muestra de 10 puntos de datos revela un coeficiente de correlación simple de -.86, una de datos revela un coeficiente de correiación simple de -.86, concluir relación líneal ciertamente negativa entre Y yyX. De ahí que el Sr. Bump pueda concluir en relación lineal ciertamente negativa entre V X. Dc ahi que el Sr. forma tentativa que al aumentar ci precio de un galón de leche, disminuye el número de galones el ci nümero vendidos. TABLA TABLA 6.2 Y CALCULOS REQUERIDOS PARA EL EJEMPLO 6.1 PARA EL EJEMPLO 6.1 K X 1.30 XY 13.0 12.0 8.5 18.0 16.0 18.0 8.0 8.0 X2 X2 1.69 y2 100 36 25 144 100 225 25 144 289 400 1,488 10 n = 10 10 6 6 5 5 12 10 15 5 5 2.00 1.70 1.50 1.60 1.20 1.60 4.0 2.89 2.25 2.56 1.44 2.56 12 17 20 112 Totales Totalcs 1.40 1.00 1.10 14.4 16.8 17.0 22.0 149.3 1.% 1.96 1.00 1.21 21.56 La siguiente pregunta que pudiera presentarse es, ¿qué tanto disminuye ci volumen al siguiente pregunta que pudiera presentarse es, ,qué tanto disminuye el volumen al el elevarse ci precio? Esta pregunta sugiere dibujar una linea recta a través de los puntos exhibidos el diagrama de dispersión. Después dibujar esta línea, la pendiente de ésta mostrará la en ci diagrama de dispersion. Después de dibujar esta linea, Ia pendiente de ésta mostrará Ia disminución promedio en Ypara cada dOiar de incremento en X. (Vea Ia fig. 6.1). disminución promedio Ypara cada dólar X. (Vea la fig. Línea de regresiOn regresión Linea y 205 30 Ol 'O o :g Vl 20 O bIl " la o o o o o o 1.00 1.50 ~ 11 o o OL-----------'----------'---X 2.00 Precio Figura 6.1 Figura 6.1 Diagrama dispersión Diagrama de dispersion para ci ejemplo 6.1. el 6.1. LíNEA DE REGRESiÓN LINEA DE REGRESION De hecho, el Sr. Bump hubiera podido dibujar una línea recta aatravés de los puntos de De hecho, Sr. Bwnp hubiera podido dibujar una Ilnea recta través de los puntos datos, intentando que la recta se ajustara lo más posible a los puntos. Sin embargo, un mejor plmtos. procedimiento consiste en encontrar la ecuación de la línea se ajuste a los puntos. procedimiento consiste en encontrar la ecuación de Ia linea que mejor se ajuste a los puntos. Esta línea recta es de la forma Y = b o + bX. El primer término de esta ecuaciOn, b0, se bX El primer término de esta ecuación, b o, Esta lInea recta es de Ia forma i = denomina intersección de Y, ya que es el valor que toma Y cuando X es igual a cero. Al que Y cuando X es igual a cero. denomina intersección de Y, ya que es el segundo témino, b, se Ic denornina pendiente de Ia recta, pues representa la cantidad de representa la cantidad de segundo térnino, b, le denomina pendiente de la recta, cambio Yal incrementar X en exposición sobre la pendiente en carnbio en Y al incrernentar X en una unidad (recuerde la exposición sobre Ia pendiente en el Entonces, el Sr. Bwnp desea calcular valores bo y ci cap. 2). Entonces, lo que ci Sr. Bump desea hacer es calcular los valores de b0 Y de b. necesario definir qué significa que una línea ajuste a los Pero antes es necesario definir qué significa que una Ilnea se ajuste "mejor" a los puntos de datos reunidos. Existen muchas definiciones, pero la que se utiliza casi puntos datos relmidos. Existen muchas definiciones, pero la que se utiliza casi universalmente en el análisis de regresión es: análisis de regresión es: línea mejor conjunto de puntos de datos XY, La Ilnea que ,nejor se ajuste a un conjunto de puntos de datos X-Y, es aquella minimiza Ia suma distancias al cuadrado puntos a la línea, que minirniza la suma de las distancias al cuadrado de los puntos a la lInea, Y. A esta ilnea se le conoce como línea medidas en dirección vertical o hacia Y. A esta línea se le conoce como la ilnea su ecuación se denomina ecuación de de regresión y su ecuación se denornina ecuación de regresión. definición, el método que se emplea para encontrar los valores de b0y b se Bajo esta definiciOn, el método que se emplea para encontrar los valores de boY b se conoce corno método de mínimos cuadrados. Para encontrar las ecuaciones para b y b0 como inétodo de niIninios cuad,'ados. Para encontrar las ecuaciones bo se requiere el iiso del cáiculo. La derivada de estas dos ecuaciones aparece en el Apéndice uso cálculo. detivada estas dos ecuaciones aparece en el Apéndice A, con los siguientes resultados: los siguientes resultados: 206 b Análisis de regresiOn de regresión Capítulo 6 CapItulo nXYIXY b- nX2 - (X)2 nIXY - IXIY nIX 2 - (IX)2 (6.1 ) (6.1) b = IY _ bIX o_ n o n n bfl' bX (6.2) Ejemplo 6.2 presentan en 6.2 Los cálculos para los datos que se presentan en la tabla 6.2 son b= b = ba b0 (10)(149.3) - 14.4)( 112) ( 10)( 149.3) - ( (14.4)(112) (10)(21.56) - (14.4)2 (10)(21.56) (14.4)2 112 10 - -119.8 119.8 8.24 14.54 - -14.54 = \1~ 14.54)( - (-14.54)( 14.4 \ 1~~4) = 11.2 + 14.54(1.44) = 32.14 11.2 + 14.54(1.44) 32.14 10 ) esta manera, ecuación la recta que mejor se ajusta a los puntos de datos reunidos, De esta manera, la ecuación de la recta que mejor se ajusta a los puntos de datos reunidos, bajo el método de minimos cuadrados es mínimos bajo y = ba + bX Y=b0+bX = 32.14 - 14.54X = 32.14 14.54X (6.3) de la muestra. Esta ecuación se denomina ecuación de regresión de Ia muestra. El Sr.. Bump desearia ahora interpretar los valores en esta ecuación. La intersección de Bump desearía ahora interpretar valores esta ecuación. La intersección de Y ba, es valor de Y cuando X es igual a cero. Una estricta interpretación sugeriría que el Y, b0, es el valor de Y cuando X es igual a cero. Una estricta interpretación sugerirIa que el número de galones vendidos cuando X = 0 (esto es, si precio in galón de leche fuera niirnero de galones vendidos cuando X = O (esto es, si el precio de in gaion de leche fuera cero), es de 32 140 galones. Esta interpretación no concuerda con el sentido coniiin, ya que cero), de 32 140 galones. Esta interpretación no concuerda con ci sentido común, ya que esperaría más uno esperarla que se "vendiera" mâs leche si fuera gratis. El problema aquí ilustrado comprende aqul predicción de un valor para Y con base en un valor de X para ci se ha reunido la predicción de un valor para Y con base en un valor de X para el que no se ha reunido la muestra. la muestra valor de cero evidencia en Ia muestra. Es decir, ninguno de los puntos de Ia niuestra tiene un valor de cero o cercano a cero para X. En este caso, corno en niuchos otros de análisis de regresión, no es cero para X. En este caso, como en muchos otros de análisis de regresión, no es posibie hacer una interpretación i'itii de Ia intersección de Y. En términos más generales, posible una interpretación útil la intersección de Y. términos más generales, es prudente predecir valores de Y para cualquier X más allá del nivel X no es prudente predecir valores de Y para cualquier X que esté rnás aiiá del nivel de las X reunidas la muestra. reunidas em los datos de ia muestra. El valor El valor de la pendiente, b, se pudiera interpretar como ci cambio prornedio en Y, que la pendiente, se pudiera interpretar como el cambio promedio en Y, que disminuye en un prornedio ocurre al incrernentar X en 1. En este ejemplo, Y disminuye en un promedio de 14.54 (es decir, incrementar X en l. En se venden se venden 14450 galones menos) cuando Xaurnenta en 1 (el costo de un gaión de leche se galones menos) cuando X aumenta en 1 (el costo galón leche se eleva en Si). Cada dóiar de incrernento en un gaión de leche reduce Ia cantidad comprada en $1). Cada dólar de incremento en un galón de leche reduce la cantidad comprada en un promedio de 14 450 galones. 0, para poner esta declaración en unidades más comprensibies, 14 0, para poner esta declaración en unidades más comprensibles, la evidencia de Ia nmestra indica que cada incremento de 1 centavo en un galón de leche, leche, la evidencia de la muestra indica que cada incremento de centavo en un reduce la reduce Ia cantidad comprada en un promedio de 145.4 galones. promedio de 145.4 galones. puede ilustrar la relación XY dibujando, el diagrama dispersión, línea recta Se puede ilustrar la reiaciôn X-Y dibujando, en ci diagrama de dispersion, la lInea recta que mejor se ajusta a los puntos de datos, como se muestra en la fig. 6.2. Nótese que las que mejor se ajusta a los puntos de datos, como se muestra en Ia fig. 6.2. Nótese que las distancias verticales de los puntos hacia Ia lInea se nmestran corno Ilneas punteadas. Si se muestran como líneas punteadas. Si se distancias verticales de los puntos hacia la línea elevaran al cuadrado estas distancias elevaran al cuadrado estas distancias y se sumaran, esta suma seria Ia rnás baja posible para sumaran, suma sería la más baja posible para cualquier linea que pudiera dibujarse a través de estos puntos. Cualquier otra IInea dibujada a línea través de estos pW1tOS. Cualquier otra línea dibujada a través través de estos puntos tendrIa una suma mayor de distancias al cuadrado. Dc modo que, de tendría una distancias cuadrado. De modo que, de acuerdo con ci procedimiento de rnInimos cuadrados, esta línea representa el mejor ajuste para el mínimos cuadrados, ilnea representa 10 de la muestra. los 10 puntos de ia muestra. Linea de regresión Línea de regresiOn y b o=32.14 207 30 ~ Y=32.14-14.54X A o ;¡ "O '" !! t>O 20 . J! ~ 10 o L---------,,-'::-::--------::-';:-;:--X \.00 1.00 2.00 Precio Figura 6.2 6.2 Linea regresión Línea de regresión para los datos del Sr. Bump. Sr. este punto, se debe destacar la línea regresión En este punto, se debe destacar que a la lInea de regresión calculada se le denomina línea la línea se ajusta correctamente lInea de regresión de la muestra, debido a que es la lInea que mejor se ajusta puntos de datos de la muestra, extraídos en forma aleatoria de la población de dichos a los puntos de datos de Ia muestra, extraidos en forma aleatoria de Ia población de dichos datos. Como es común en los procesos de estadísticas, las estadísticas distinguen puntos de datos. Como es comün en los procesos de estadIsticas, las estadIsticas distinguen entre valores datos la población valores de datos muestra. Para entre los valores de datos de la población y los valores de datos de una muestra. Para mantener claramente separados estos dos gmpos, notación diferente mantener claramente separados estos dos grupos, se emplea una notación diferente para describir las relaciones existentes entre X y Y, como se muestra en Ia tabla 6.3. muestra en la tabla 6.3. relaciones existentes entre X Y, coeficientes de correlación de Ia población y de Ia muestra que aparecen en Los coeficientes de correlación de la población y de la muestra que aparecen en la abordaron el cap. 2. La ecuación de regresión de la muestra la ecuación tabla 6.3, se abordaron en el cap. 2. La ecuación de regresión de Ia muestra es Ia ecuación la mejor se ajusta a los puntos de datos observados la muestra. forma de Ia recta que mejor se ajusta a los puntos de datos observados de Ia muestra. En forma la relación XY revelada la muestra, subyacente a Ia relación X-Y revelada por los valores de datos de Ia muestra, se encuentra la relación XY de toda la población, representada por el modelo de regresión de Ia relación X-y de toda la población, representada por el modelo de regresión de la población. Este modelo sugiere que cada valor de Y en población es igual de población. Este modelo sugiere que cada valor de Y en la población es igual al valor de intersecciónf3 o, más una constante f3 veces su valor de .x, más un término de error fE. intersección /3, más una constante /3 veces su valor de X, más un término de error . error son las diferencias los valores reales de la población Entonces, los términos de error son las diferencias entre los valores reales de la población y los valores representados por la ecuaciOn de regresión del problema o fE = Y - (/3 + fiX). los valores representados por la ecuación problema o = Y - (/Jo + f3 X). muestra, En una muestra, estas diferencias o errores se denominan residuos. residuos. mayoría los paquetes de cómputo realizan correlación y análisis de regresión. La mayorIa de los paquetes de cómputo realizan correlación y análisis de regresión. final del capítulo, en la sección "Paquete de cómputo Minitab", se presentan las Al final del capitulo, en la sección "Paquete de cómputo Minitab", se presentan las instrucciones los ejemplos 6.1 y 6.2. instmcciones de Minitab para los ejemplos 6.1 y 6.2. TABLA 6.3 TABLA 6.3 NOTACiÓN PARA POBLACiÓN V NOTACION PARA LA POBLACION Y LA MUESTRA MUESTRA Coeficiente de correlación = r Coeficiente de correlación = Ecuación de regresión de Ia muestra: la de POBLACIÓN POBLACION Coeficiente de correlación = Coeficiente de correlación = p Modelo de regresión de la población: la población: Y=f30+J3X+ y = f30 + f3X + fE y = b o + bX Y=b0+bX 208 Análisis regresión Ariálisis de regresián Capítulo 6 Capitulo ERROR ESTÁNDAR DE LA ESTIMACIÓN ERROR ESTANDAR DE LA ESTIMACION Después de calcular la ecuación de la línea de regresión de la muestra, el Sr. Bump podrIa Ia IInea de regresión de Ia muestra, Sr. Bump podría la muestra se encuentran interesarse en medir hasta qué grado los puntos de datos de Ia muestra se encuentran interesarse en medir hasta qué grado los puntos de datos dispersos airededor de línea regresión muestra. dispersos alrededor de la lInea de regresión de la muestra. En particular, quisiera calcular la típica un punto de datos a la línea de regresión, medida en dirección de Y. Ia distancia tipica de tin punto de datos a la lInea de regresión, medida en dirección de Y. Este concepto de medición de dispersion es similar a la noción de desviación estándar Este concepto de medición de dispersión es similar la noción de desviación estándar su media. En el análisis dispersión empleada para medir la dispersion de valores de datos alrededor de su media. En el análisis medición de regresión, la medición se denomina error estándar de la estimación y está representado denomina error estándar de la estimación y está representado símbolo por el sImbolo Sy. x' La ecuación correspondiente es S = n-2 (6.4) error estándar de la estimación mide la cantidad estándar en la cual los El error estándar de la estimación mide Ia cantidad estándar en la dual los valores estimados (fl.' reales de Y difieren valores reales de Ydifieren de los valores estimados (Y).l la similitud entre la ecuación 6.4 y la fónnula de desviación estándar la Nótese Ia similitud entre la ecuación 6.4 y Ia formula de desviaciOn estándar de la muestra numerador se encuentran muestra en Ia estadIstica descriptiva simple. Véase cap. 2. En el numerador se encuentran la estadística descriptiva simple. Véase cap. 2. las mediciones reales de datos (Y) y las mediciones reales de datos (1') y el valor "promedio" o "esperado" de la variable (1') "promedio" o "esperado" de la variable (Y) como se determninamediante la línea de regresión de la muestra. Estas distancias se elevan detennina mediante la lInea de regresión de la muestra. Estas distancias se al cuadrado, se suman y se dividen entre los grados de libertad, y se obtiene la raIz cuadrada. entre grados de libertad, y se obtiene la raíz cuadrada. (Nótese que se pierden dos grados de libertad ya que se están estimando dos parámetros de grados parámetros la población mediante valores de datos de Ia muestra, a saber, b o Y b.) Así, el error estándar la Ia valores b0 y b.) AsI, el error estándar mide distancia típica desde un punto mide la distancia tIpica o estándar desde un punto de datos a Ia lInea de regresión de la la línea de regresión de la muestra. Un análisis de regresión que tenga un error estándar pequeno implica puntos regresión tenga un error estándar pequeño implica puntos muestra. cercanos la línea de regresión. Por el contrario, un error estándar grande de datos muy cercanos a Ia ilnea de regresión. Por el contrario, un error estãndar grande datos están muy dispersos alrededor la línea. significa que los puntos de datos están muy dispersos airededor de la linea. cálculo, la se puede convertir Para fines de cálculo, Ia ecuación 6.4 se puede convertir en s S y,x = JU' -- b0Y - bXY b,~Y n-2 - h¡XY n - 2 (6.5) Para ejemplo Bump, estándar Pam el ejemplo del Sr. Bump, el error estándar es 1 El error estándar de Ia estimación tarnbién se puede delmir como la desviación estándar de las dstribuciones la también puede defmir desviación las d;stribuciones Y supuestas de Y para cualquier X dada. Predicción de Y Predicción de'( 209 S s y·x = = j ~ j 59~14 j 1,488 (32.14)(11:) + (14.54)(149.3) 1,488 -- (32.14)(112) + (14.54)(149.3) 8 59.14 = v7.39 V7.39 2.72 = 2.72 El error estándar es una medición de la distancia vertical estándar desde los puntos medición distancia vertical El desde datos de la muestra hacia la línea de regresión de la muestra. Se puede utilizar para de datos de Ia muestra hacia Ia Ilnea de regresión de la muestra. Se puede utilizar para comparar la dispersión de puntos de datos airededor de la línea de regresión que se comparar la dispersion de puntos de datos alrededor de la ilnea de regresión que se dispersión encuentran en esta situación, con la dispersion de puntos de datos en otras situaciones. Los los analistas experimentados lo emplean para juzgar hasta qué grado se pudieran resumir los analistas experimentados lo emplean para juzgar hasta qué grado puntos de datos de Ia muestra mediante Ia Ilnea de regresión de mejor ajuste. Además, se datos de la muestra mediante la línea regresión ajuste. Además, supone que la población de puntos de datos presenta una distribución normal alrededor de supone puntos distribución normal airededor línea regresión de la población. Se puede usar Syx como una estimación la linea de regresión de Ia población. Se puede usar s,,,, como una estimación de la desviación desviación estándar de esa distribución normal. La importancia de realizar tal suposición de normalidad normal. de realizar tal abordará más adelante en este capítulo. se abordará rnás adelante en este capItulo. PREDICCIÓN DE Y PREDICCIÔN DE Y La siguiente tarea consiste en estimar el valor de Y para un valor dado de X. Para obtener Y dado de X. Para obtener de punto, de una predicción de pun to, se emplea la ecuación de regresión. Se sustituye el valor de X en emplea Ia ecuación de regresión. la ecuación y se encuentra el valor de predicción para V. se encuentra el valor de predicción para Y. Ej emplo Ejemplo 6.3 Suponga que el Sr. Bump desea pronosticar la cantidad de leche vendida si el precio se que el Bump desea pronosticar Ia cantidad de leche vendida si precio se 6.3 tenemos: estableciera en $1.63 dólares. Dc Ia ecuación 6.3 tenemos: dólares. De la estableciera y = 32.14 - 14.54 X 32.14 14.54 X = 32.14 -- 14.54(1.63) 32.14 14.54(1.63) 8.440 o = 8.440 o 8 440 galones Obsérvese que estimado es el Y; es decir, representa el punto sobre línea de Obsérvese que este estimado es el valor de Y; es decir, representa el punto sobre la lInea de regresión en donde x 1.63. regresión en donde x = 1.63. SV'X" da cuenta los de datos que generaron la línea Desde luego, el Sr. Bump se da cuenta de que los puntos de datos que generaron Ia linea encuentran dispersos alrededor de esa linea, segán la medición por medio de de regresión se encuentran dispersos alrededor de esa línea, según la medición por medio de Para hacer una predicción de intervalo de Y cuando 1.63, debe tomar en cuenta esta s... Pam hacer una predicción de intervalo de Y cuando X = 1.63, se debe tomar en cuenta esta dispersión. se debe considerar un segundo factor antes de hacer tal predicción. dispersion. Además, se debe considerar un segundo factor antes de hacer tal predicción. línea de Anteriormente se estableció que Ia linea de regresión calculada era Anteriormente se estableció que la línea de regresión calculada era una linea de regresión de Ia muestra, ya que se calculó a partir de una muestra aleatoria de diez puntos regresiOn de la muestra, ya que se calculó a partir de una muestra aleatoria de diez puntos no de todos los puntos de datos de la población. Otras muestras aleatorias de de datos y no de todos los puntos de datos de Ia población. Otras muestras aleatorias de diez puntos de datos podrIan producir diferentes líneas de regresión de la muestra, de forma diferentes lineas de regresión de Ia muestra, de forma podrían donde varias muestras extraídas de una población tienen medias diferentes. similar al caso donde varias muestras extraldas de una población tienen medias diferentes. modo para hacer una predicción intervalo de Y deben considerar tanto De modo que para hacer una predicción de intervalo de Y se deben considerar tanto la dispersión de los puntos de datos de la muestra alrededor de línea de regresión dispersiOnde los puntos de datos de la muestra alrededor de la Ilnea de regresión la muestra, como la dispersión de varias líneas la de la muestra, como Ia dispersion de varias Ilneas de regresión de Ia muestra alrededor de la verdadera Ilnea de regresión de la población. línea regresión de la población. 210 Análisis de regresión regresión Capítulo 6 Cap itulo El error estándar de pronóstico mide Ia variabilidad de los valores de predicción de error estándar de pronóstico mide la variabilidad de los valores de predicción de y alrededor del verdadero valor de Y para un valor dado de X; tornando en cuenta los dos los dos Y airededor del verdadero valor de Y para un valor dado de X tomando factores mencionados. de pronóstico es factores mencionados. El error estándar de pronóstico es s=s y.x S f f yox Fe 1 I +-+ ++ 1 I 11 (X-X)2 !'(X - X) 2 (XX)2 (XX) (6.6) Nótese que s...eses un ténnino en este error estándar,ya que el primer término bajo Nótese que s. x un término en este error estándar, ya que el primer ténnino bajo radical es 'l. Los otros factores miden la variabilidad de las líneas el signo radical es I. Los otros factores miden Ia variabilidad de las lmneas de regresión de la muestra airededor de la verdadera Ilnea de regresión. Nótese también que en Ia ecuación alrededor la verdadera línea de regresión. Nótese también que en la ecuación 6.6 aparece el valor particular de X que se está utilizando. En otras palabras, el error de aparece valor particular X está utilizando. palabras, de pronóstico depende del valor de Xpara el cual se desea un pronóstico. El error de pronóstico del valorde X para el cual se desea un pronóstico. más pequeño posible es X = X, pues asi el tercer término bajo el radical equivale a cero (X así tercer mas pequeno posible X= X; - X)2 = 0. Entre ms alejado esté X de X, mayor seth el error de pronóstico. más alejado esté X de X, mayor será el error de pronóstico. = O. Ejemplo 6.4 gráfica, el intervalo predicción dcl 95% del Sr. Bump para varios valores de X, De manera gráfica, el intervalo de predicción dcl 95% del Sr. Bump para varios valores de X, se vería similar al de 1a fig.6.3. se veria similar al de la fig.6.3. En forma rnás especIfica, el error estándar dcl pronóstico para x = 1.63 sc calcula corno: forma más espccífica, ci cstándar = 1.63 sc calcula como: s1 = 2.72 \/1 + sr = 2.72 ~I + 10 + 10 + ~ (1.63 - 1.44)2 (1.63 - 1.44f .8240 .8240 2.72(1.066) 2.90 = 2.72(1.066) = 2.90 cálculo, (X _:\12 determinó corno se muestra en la tabla 6.4. Nota: En este cálculo, L(XX)2 sese determinó como seniuestra en Ia tabla 6.4. y Y I / Línea de / Linea de de regresión Ia muestra la Y Intervalo de pronóstico de 95% para Y x L---------------'------------x x Figura 6.3 6.3 Intervalo pronóstico Intervalo de pronóstico para los datos del Sr. Bump. Predicción de Y PredicciOn de'( TABLA 6.4 CALCULO DE L (X -- X ) 6.4 CÁLCULO DE X)2 EL EJEMPLO 6.4 PARA EL EJEMPLO 6.4 211 x 1.30 \.30 2.00 1.70 1.50 1.60 1.20 \.20 1.60 1.40 1.00 1.00 1.10 1.10 (X-X)2 .0196 .3136 .0676 .0036 .0256 .0576 .0256 .0016 .1936 .1156 = .8240 = .8240 ¡(X - X)l Mediante la ecuación 6.7 se calcula un intervalo de predicción de 95% para Y cuando Mediante Ia ecuación 6.7 se calcula un intervalo de predicción de 95% para Ycuando X = 1.63. Esta ecuación se puede emplear siempre que el tamaño de Ia muestra sea X = 1.63. Esta ecuación se puede emplear sienipre que el tamaño de la muestra suficientemente grande (n ~ 30). 30 ). y ZSf Y ± Zs1. básicas: (6.7) Al calcular un intervalo de predicción, se hacen suposiciones importantes. De hecho, Al procedimiento regresión se apoya sobre las siguientes suposiciones todo el procedirniento de análisis de regresión se apoya sobre las siguientes suposiciones 1. La población de Yvalorespresenta una distribución normal con respecto a ía ilnea de la línea Lapoblación de Y valores presenta una distribución normal con la fig. la de la población. Esta condición se muestra regresión de ía población. Esta condición se muestra en Ia fig. 6.4. En Ia práctica, se obtienen resultados razonablemente precisos siempre que los valores de Y tengan una obtienen resultados razonablernente precisos siempre que los valores de tengan una distribución aproxi madarnente nonnal. di stribuci on aproximadamente nonnal. 2. La dispersión de los puntos de datos de la población airededor de la ilnea de regresión dispersion lospiintos de lapoblación alrededor de la línea de regresión de la población permanece constante a lo largo de la ilnea. Esto es, la varianza de la de la línea. Esto es, la varianza de la más población no es rnás grande ni más pequeña al incrementarse el valor de los puntos pequeña al de datos de X. La violación a esta suposición se conoce como heterosedasticidad y de datos de X. La violación a esta sup osición se conoce como heterosedasticidad en el condición se aborda en detalle en ci cap.7; en el cap. 9 se presenta un ejemplo de esta condición cura. y su cura. 3. Los términos de error (E) son independientes entre si. Esta suposición implica una Los términos de son independientes entre si. suposición muestra aleatoria suposición se conoce como muestra aleatoria de puntos de datos X-Y. La violación a esta suposición se conoce como datosX-Y. correlación serial y ocurre con frecuencia cuando los X-y miden correlación serial y ocurre con frecuencia cuando los valores de datos X-Y se miden a través del tiempo. En el cap. 9 se trata Ia identificación y solución de este problema. tiempo. la el cap. se trata 4. Existe en la población una relación lineal entreXy Y Las lIneas de regresión no lineal lineal entre X y Y Las líneas de regresión en lapoblación una ampliación caso lineal expuesto en este capítulo. Existen técnicas constituyen una ampliaciôn al caso lineal expuesto en este capItulo. Existen técnicas para manejar relaciones no lineales entre X y Y; algunas de elias se cornentan rriás relaciones no lineales entre X Y; algunas ellas se comentan más en este capítulo. adelante en este capItulo. En realidad Ia predicción de intervalo dada por Ia ecuación 6.7 solo es aproximadala predicción de intervalo dada la sólo es aproximadamente correcta para el ejemplo del Sr. Bump. Para un uso correcto del valor de Z de la de la mente correcta para ci ejemplo del Sr. Bump. Para un uso correcto dci valor 212 y Y regresión Análisis de regresiôn Capítulo 6 Capitulo I I _ I Distribución nonnal de valores valores Distribución de Y con respecto de Y con respecto a un punto de estimación de Ycon igual de estimación de Y con igual vananza varlanza Línea Linea de regresión de la Ia muestra '-------~-------"7_----___;;;_---x x Tres posibles valores de La variable de pronóstico valores de la pronóstico x Figura 6.4 6.4 Suposición de normalidad. normalidad. debe haber un tamaño de muestra reducido. Como regla tabla la curva n01111al, tabla de Ia curva normal, no debe haber un tamaño de rnuestra reducido. Como regla de de un tamaño muestra por lo menos 30, para utilizar la tabla normal. oro, se requiere de un tarnaño de muestra de por to menos 30, para utilizar la tabla normal. Para tamaños de muestra redticidos resulta apropiado calcular el intervalo de predicción tamaños de muestra reducidos resulta apropiado calcular el intervalo de predicción este caso, el intervalo se convierte en mediante la distribución t. En este caso, el intervalo se convierte en Y± ts1 (6.8) (Para la tabla t, dI = n - 2.) 2.) df Para los datos del Sr. Bump, un conjunto de 10 puntos de datos, resulta apropiada Ia conjunto 10 puntos de datos, resulta apropiada la formula de distribución t. Así, el fónnula de distribuciôn t. AsI, el intervalo es y ± tS (SI 8.44 2.306(2.90) 8.44 ± 2.306(2.90) 8.44 ± 6.69 8.44 6.69 1.75 a 15.13 1.75 15.13 bien o bien 1 750 galones a 15 130 galones 750 galones 15 lill intervalo fonna más amplio que el producido La ecuación 6.8 predice un intervalo en cierta forma imis amplio que el producido si se empleara la curva normal, Jo que refleja Ia presencia de un tamaiio de muestra reducido. nOlmal, lo la tamai'ío muestra reducido. Nótese Ia amplitud extrema del intervalo de conhianza caiculado. Es tan arnplio que resulta la extrema del intervalo de confianza calculado. amplio resulta virtualmente ini,til en la predicción de Y. Aunque esta imprecision se hace rnuy notoria en viItualmente inútil de Y. imprecisión hace muy notoria en Ia del estirnación lo es en ci punto la la amplitud del intervalo, no Jo es en el punto de estimación calculado a partir de Ia ecuación Coeficiente de determinaciOn determinación 213 de regresión. Este grado de precision implIcito es el mayor beneficio de la estimación del regresión. precisión implícito la estimación del intervalo. Otro punto importante a recordar es que no resulta prudente predecir más allá del resulta prudente predecir más Otro punto importante a recordar es que nivel de datos observados. Por lo tanto, se justifica que el Sr. Bump intente predecir Y Bump intente predecir Y nivel de datos observados. Por lo tanto, se justifica que el cuando x = 1.63, ya que algunos de los valores originales de X se encuentran cerca de 1.63. x= X Por otra parte, no harla bien en predecir Y cuando x = 3.00. No se han reunido valores de parte, haría Y cuando x = 3.00. No se han reunido valores de datos cercanos a este alto valor y, por esta razón, cualquier predicción que comprenda dicho comprenda dicho sería altamente sospechosa. precio valor de X serla altamente sospechosa. Para estimar la cantidad vendida cuando el precio unitario $3 dólares, Sr. Bump debe suponer que modelo lineal ain es válido. unitario es de $3 dólares, el Sr. Bump debe suponer que el modelo lineal aún es válido. Pudiera tener una buena razón para suponer esto, pero no posee evidencia directa que lo razón evidencia lo Pudiera tener una esto, pero sustente. COEFICIENTE DE DETERMINACIÓN COEFICIENTE DE DETERMINACION A continuaciOn se expone una ütil estadIstica denominada coeficiente de determinación. continuación se expone útil estadística determinación. Considere la fig. 6.5, muestra línea de regresión de Bump Considere la fig. 6.5, que muestra la lInea de regresión de la muestra del Sr. Bump con un punto de datos hipotético. Al considerar datos individual se junto con un punto de datos hipotético. Al considerar el punto de datos individual que se la línea de regresión, el Sr. Bump primero "esperaría" que este valor de Y fuera ubica bajo la linea de regresión, el Sr. Bump primero "esperarla" que este valor de Y fuera igual al promedio de todos los valores de Y, es decir Y. AsI, la distancia vertical entre Y y todos los valores de Y, es decir Y. Así, distancia vertical entre Y y Y que se muestra en Ia fig. 6.5, se convierte en Ia diferencia total o desviación que debe la fig. 6.5, se convierte en la diferencia total o desviación que debe que explicarse. Parte de esta distancia vertical es fácilmente explicable. Se esperarla que el valor de explicable. esperaría valor de Y fuera igual a Y, sólo si el valor de X de la observación fuera igual a X. Sin embargo, éste Y fuera igual a Y, sOlo si el valor de X de Ia observación fuera igual a X. Sin embargo, es el caso. El valor de X para esta observación es considerablemente más alto que no es el caso. El valor de X para esta observación es considerablemente más alto que X lo tanto, es comprensible qué el valor de Y de esta observación pudiera haberse Por lo tanto, es comprensible por qué el valor de Y de esta observación pudiera haberse Ya Y: el movido de Y a Y: el valor de X de Ia observación es mayor que ~ y es sabido que X y Y X de la observación es mayor que X, y es X Y y 32.14=h 32.14= h o 30 ~ Ac11.2= Y Línea LInea de regresión Bmnp del Sr. Bump /\ A y = 32.14 14.54X Y=32.14-14.54X 20 I I I 10 YY (Total) ¡- - - - - O} P f _Y (Explicada por X) - ~ (Explioada po' X) (NoexplicadaporX) : o } y - y (No explicada por X) 0 OL-----------L----'-------'------------X LOO 1.00 Precio }_P X= 1.44 x = 1.44 2.00 6.5 Figura 6.5 Variación explicada del Sr. Bump. Variación explicada y no explicada para los datos del Sr. Bump. 214 regresión Análisis de regresión Capítulo 6 Cap Itulo tienen una fuerte correlación negativa (r = .86). De ahí que la distancia vertical Y Ji' tienen una fuerte correlación negativa (r = -.86). De ahI que Ia distancia vertical Y - Y se "explique" mediante el movimiento de X, mientras que Ia distancia Y Y no se explique "explique" mediante el movirniento de X, mientras que la distancia Y -- Y no se explique movimiento de X. por el movimiento de X. Ejemplo 6.5 Sr. Bump, un mayor valor de X 1.70, Para los datos del Sr. Bump, considere un punto de datos con un mayor valor de X (x = 1.70, Y = 5). Para este punto de datos. Para este punto de datos. y = 5). y = 32.14 - 14.54(1.70) Y= 32.14 14.54(1.70) = 32.14 - 24.72 = 7.422 = 32.14 24.72 = 7.422 Por lo tanto tanto y = 11.2 Y =11.2 - YR = 7.422 = 7.422 Y = 5 Estos valores se presentan en Ia fig.6.6. la fig.6.6. Estos En este caso, La distancia de Ya 9 se explica mediante el movimiento de X (1.44) a su caso, la distancia de Y a ji mediante ci movimiento de (1.44) valor real (1.70), como se esperaba de acuerdo con el conocimiento de Ia relación entre Y y valor real (1.70), conio se esperaba de acuerdo con el conocimiento de la relación entre Y X -.86). En otras palabras, el movimiento de X de 1.44 1.70 explica el movimiento de X (r = .86). En otras palabras, ci movimiento de X de 1.44 aa1.70 explica el movimiento de 11.2 a 7.422, pero no explica el movimiento de 7.422 y de 11.2 a 7.422, pero no explica el movirniento de 7.422 a 5.00. y=5 y Línea regresión Linea de regresión 11.2 = Y 11.2=Y I I I I I I I I ---{) Y = 11.2 -o y 11.2 $ 9= 7.422 ~ 0 O y =5 Y 2.00 2.00 o 6.6 Figura 6.6 1.00 1.00 x = 1.44 X = 1.44 Pronóstico para ci Pronóstico de Y para el ejemplo 6.5. Para encontrar la porción de La desviación total que se explica mediante X para la desviación total que explica mediante X para Pam encontrar la porClOn cualquier observación, se debe dividir Ia desviación explicada entre Ia desviación total, de la desviación la desviación total, de observación, la manera siguiente: siguiente: Coeficiente de determinaciOn Coeficiente de determinación 215 Porcentaje de desviacion total explicada por y y Porcentaje de desviacion total no explicada por Porcentaje x= X = y- Y y Y _ Y yy-y X= y-y x- Y- Por supuesto, se deben considerar todos los puntos de datos, no solo uno. Además, ci cálcuio sólo el cálculo los puntos de datos se realiza con diferencias al cuadrado. Este cálculo se hace para todos los puntos de datos se realiza con diferencias al cuadrado. Este cálculo se hace de modo que el resultado final tenga una interpretación útil. interpretación ütil. El sImbolo del coeficiente de deterrninación de la muestra es r2 y su valor se define símbolo del coeficiente de detenninación de la muestra es ? y se define corno como r2 = r2 Desviación no explicada 1 - ---------=---- = Desviación total - V)2 (Y - V)2 (6.9) El coeficiente de determinación mide el porcentaje de variabilidad en Y que El coeficiente de determinación mide el porcentaje de variabilidad en Y que puede explicarse a través del conocimiento de la variable independiente X explicarse a través del conocimiento de Ia variable independiente X ecuación 6.9 la fonna usual de definir 1)., establece el porcentaje de La ecuación 6.9 es Ia forma usual de definir r2, y establece que ci porcentaje de variabilidad en Y que se explica mediante la variabilidad en X, es 100%, menos el porcenmediante Ia variabilidad en X, es 100%, menos el Y que explicado porX, El valor de 1). taje no explicado por X. El valor de ,2 es un valor muy importante en cualquier análisis importante anáiisis el la variabiiidad de regresión, ya que muestra el grado hasta ci cuál están relacionadas Ia variabilidad de Xy Y. x y Y. la práctica, ? puede calcular la fónnula el En Ia práctica, r2 se puede calcular mediante Ia siguiente formula equivalente en ci cáiculo: cálculo: r2 Ejemplo 6.6 r2 bo¡Y + bXY - fly2 b0Y b¡XY - ny2 ¡y2 _ ny2 - - (6.10) Para los datos del Sr. Bump, r2 se calcula con Ia ecuación 6.10. Sr. Bump, ,;2 la (32.14)(112) - (14.54)(149.3) -- (10)(1 1.2)2 (32.14)(l 12) - (14.54)(149.3) (10)(l1.2f 1,488 (10)(11.2)2 1,488 -- (I0)(11.2)2 174.9 3,599.68 -- 2,170.82 - 1,254 3,599.68 2,170.82 - 1,254 174.9 1,488 1,254 = 234 = .747 1,488 -- 1,254 234 - - Con base en este valor de r2, se formulan las siguientes declaraciones: base en este valor de ?, se formulan las siguientes declaraciones: 1, De la variabilidad en la cantidad de leche vendida, ci 75% se puede explicar l. De Ia variabilidad en la cantidad de leche vendida, el 75% se puede explicar por Ia la precio de la leche. variabilidad en el precio de Ia leche. la variabilidad en la cantidad de leche vendida, se puede explicar mediante 2. De Ia variabilidaden Ia cantidad de leche vendida, el 25% no sepuede explicar mediante la variabilidad el la la variabilidad volumen leIa variabilidad en ci precio de Ia leche. Esta porción en Ia variabilidad del volumen de leche se debe explicar mediante factores que aün no han sido identificados en este análisis debe explicar mediante factores aún no han sido identificados en este análisis de regresión (v. gr., clima, cantidad de publicidad, disponibilidad de productos sustitutos). clima, cantidad de publicidad, disponibilidad de productos sustitutos). 216 Análisis de regresión Capítulo 6 CapItulo 6 el coeficiente de correlación (ignorando de Nótese que r2 es el cuadrado de r, ci coeficiente de correlación (ignorando errores de es redondeo). Esto es determinación Coeficiente de determinación 1,). r2 r = (coeficiente de correlación)2 corre1aciónY = (r)2 = (r)2 Por lo tanto 10 .75 = (_.86)2 .75 = (-86) = .75 .75 = .75 Entonces, dpor qué es necesario identificar ambos valores en un análisis de regresion? ¿por valores un análisis de regresión? La respuesta es que cada uno tiene una ventaja sobre ci otro. cada tiene una ventaja sobre el otro. La ventaja del coeficiente de correiación (r) es que revela relaciones tanto positivas del coeficiente de correlación es que revela relaciones tanto positivas como negativas. En el caso de los datos reunidos por ci Sr. Bump. existe una reiación de los datos reunidos por el Sr. Bump. existe una relación como negativas. En ci negativa (r = -.86). En otros casos, se podria revelar una reiación positiva mediante el valor -.86). En otros casos, se podría revelar una relación positiva mediante el de r. Como se vera en ci siguiente capItulo, es importante identificar las relaciones verá en el siguiente capítulo, es importante identificar las relaciones Como existentes entre ciertos pares de variables, cuando se confrontan con un gran conjimto de variables, gran conjunto existentes entre variables y es necesario saber si existen relaciones positivas o negativas. NOtese que cuando si o Nótese que cuadrado el coeficiente de correlación, el valor es siempre positivo, perdiéndose se eleva al cuadrado ci coeficiente de correiación, el valor es siempre positivo, perdiéndose la relación. la naturaleza de Ia relación. del coeficiente de determinación (r) que tiene una interpretaLa ventaja dei coeficiente de determinación (r2) consiste en que tiene una interpretación útil. El valor de mide el porcentaje de variabilidad en Y que se explica por la cion muy ñtii. El valor de r2 mide el porcentaje de variabilidad en Y que se explica por la variabilidad en X Esta interpretación es muy ütii, io que hace de r2 una de las estadIsticas X Esta interpretación es muy útil, 10 que hace de una de las estadísticas consuitadas con mayor frecuencia en ci análisis de regresión. consultadas mayor frecuencia en el análisis de regresión. ilustra dos casos extremos para y cuando es igual La fig. 6.7 ilustra dos casos extremos para r2, cuando es igual a cero y cuando es igual l. En el primer caso, ninguna variabilidad Y a 1. En ci primer caso, ninguna variabilidad de las Y se explica mediante X: ci diagrama mediante X el diagrama r de dispersion sugiere que no existe relación lineal entre Xy V. Cuando r cuadrada = 1, toda X y Y. l, toda dispersión existe las Y la variabilidad de las Y se explica cuando se conoce X: todos los puntos de datos de Ia muestra X: todos los sobre la línea de regresión. se ubican sobre Ia linea de regresiôn. r r r, y Y y t-----'-...,.............,...,--'-...,....-- Y =Y Y Y ¡ ¡ 6 9 _ - A A ¿ '------------x x ,.2 =1-r(Y-Y)2/r(y-y)2 X ,.2 =1-r(y-Y)2/r(y-y)2 A = 1 (YY)2fE(YY)2 r2 = 1 (Y Y)2/(YY)2 = 1-1=0 =1-1=0 (a) Sin correlación lineal =1-0=1 =I-0=1 (b) Correlación lineal perfecta Figura 6.7 6.7 Valores Vaiores extremos de r2. ? Residuos 217 RESIDUOS Sr. Bump comenzó sólo 10 venta semanal (la El análisis del Sr. Bump comenzó con solo 10 cantidades de volumen de yenta semanal (Ia Y). Si hubiera disponible más información, el podría la variable Y). Si hubiera disponible más informaciOn, el Sr. Bump podria emplear Ia media y de Y como pronosticador de cada volumen de venta semanal. Si lo hace, generará ciertos V de V como pronosticador de cada volumen de yenta semanal. Si lo errores, uno por cada predicción que haga. Estos errores, denominados residuos, se cada predicción que haga. Estos errores, denominados residuos, errores, uno expusieron anteriormente en este capItulo. Al estimar los valores de Y con Y, el Sr. Bump capítulo. valores de Y Y, Sr. Bump expusieron anteriormente minimiza los errores de estimación sobre un largo periodo, ya que emplea el volumen medio un largo periodo, ya que emplea el volumen medio galones, como la mejor estimación volumen de yenta cada de ventas, 11 200 galones, como Ia mejor estimación del volumen de venta de cada de ventas, 11 semana. Los errores suman cero, ya que Ia media es el centro matemático de la distribuciOn cero, ya que la media es el centro matemático de la distribución de Y. Las diez predicciones y los diez residuos se muestran en Ia tabla 6.5. Y. Las diez predicciones y los diez residuos se muestran en la Además de los residuos, Ia tabla 6.5 muestra la suma de los residuos elevados al residuos, la tabla 6.5 muestra los residuos elevados al Además de cuadrado. Este cálculo se efectila con el propOsito de poder medir la cantidad total de error; se efectúa propósito de error; debido debido a que hay residuos tanto positivos como negativos, Ia suma de los residuos reales hay residuos tanto positivos negativos, la los residuos reales siempre es cero. Al valor de Ia surnatoria se le denomina suma de residuos cuadrados y la sumatoria se le denomina suma de residuos cuadrados siempre es cero. Al representa la variabilidad total de Y alrededor de la media. Esta es la variabilidad total representa Ia variabilidad total de Y alrededor de Ia media. Esta la variabilidad (233.60) que el Sr. Bump desea reducir, introduciendo el conocimiento de una variable conocimiento una variable (233.60) que Sr. Bump desea reducir, introduciendo relacionada, X. La fOrmula para obtener la suma de los residuos cuadrados alrededor de la relacionada, X La fórmula para obtener Ia suma de los residuos cuadrados alrededor de la media de Y, o Ia suma total de cuadrados es Y, o la suma total cuadrados es - Y)2 (6.11) (6.11 ) swna cuadrados se puede convertir en una vananza, dividiéndola La surna de los residuos cuadrados se puede convertir en una varianza, dividiéndola entre el número de grados de libertad. Como se está estimando un parámetro de la población niimero de libertad. Comose está estimando un parámetro de la población (ji.) mediante una estadIstica de Ia muestra ( Y), se pierde un grado de libertad. AsI, el grado estadística la muestra Y), Así, (ji) TABLA 6.5 6.5 y REAL YREAL 10 RESIDUOS PARA LOS DATOS DEL SR. BUMP RESIDUOS PARA LOS DATOS DEL SR. BUMP PRONÓSTICO DE YY(l7) PRONOSTICO DE (Y) 11.2 RESIDUO (Y - - Y) RESIDUO (Y ~ 1.2 -1.2 -5.2 -6.2 (Y - Y)2 6 5 5 12 11.2 11.2 11.2 11.2 11.2 11.2 11.2 .8 la 10 15 -1.2 3.8 -6.2 .8 5.8 5 12 17 20 11.2 11.2 11.2 11.2 11.2 11.2 11.2 11.2 Swnas Sumas 8.8 0.0 1.44 27.04 38.44 .64 1.44 14.44 38.44 .64 33.64 77.44 233.60 218 Análisis de regresión Anáhsis de regresion Capítulo 6 de libertad apropiado es 11 - - 1. De modo que la varianza total de Y alrededor de su media libertad apropiado es /1 l. modo que total Y airededor de su media es s2 = Y I(Y - Y)2 y)2 nI 11 - 1 (6.12) La raíz cuadrada de esta varianza es la desviación estándar de Y. Nota: La raiz cuadrada de esta varianza es Ia desviación estándar de Y. Ejemplo 6.7 datos del Sr. Blll11p, Para los datos del Sr. Bump, S2 y 233.6 = 25 96 = 233.6 = 25.96 9 . el siguiente importante: esta varianza de valores Y calculó Nótese ci siguiente punto importante: esta varianza de los valores de Y se calculó usando Y como ci mcjor estimador de los valores senianales de Y. Esto es, no se ha utilizado información elmcjor semanales Y. Esto es, no acerca acerca de la variable relacionada X. Cuando ci Sr. Bump incluye información con respecto a la variable relacionada X. el Sr. Bump incluye información con respecto a X, resultaría una menor varianza Y X está cOlTclacionada con y podrían X, resu]tarIa una menor varianza de Y puesto que X está colTelacionada con Y y se podrIan efectuar predicciones más precisas mediante la ecuación de regresión. ecuación de regresión. Suponga ahora que el Sr. Bump utiliza la ecuaClOn de regreslOn calculada para Suponga ahora que el Sr. Bump utiliza la ecuación de regresión caiculada para Y. Corno él estableció una reiación de predecir Y. Como él estableció una relación entre X y Y con base en los puntos de datos de X con base en los muestra = -.86), lInea de regresión debería generar predicciones más precisas para la muestra (r = .86), Iala líneade regresión deberIa generar predicciones más precisas para y que las generadas cuando se utiiizó Y para predecir los vaiores de Y. Si ci Bump Y que las generadas cuando se utilizó Y para predecir los valores de Y. Si el Sr. Bump predice Y mediante esta ecuación de regresión, ann habrá residuos, aunque éi espera que predice mediante esta ecuación regresión, aún residuos, aunque él espera que sean menores. En forma similar, tanto Ia suma de residuos cuadrados como Ia varianza de sean menores. En f01111a similar, tanto la suma de residuos cuadrados como la varianza de TABLA 6.6 RESIDUOS DE LOS DATOS DEL SR. BUMP ANÁLISIS ANALISIS DE LOS RESIDUOS DE LOS DATOS DEL SR. BUMP PRONOSTICO DE y(h PRONÓ~TICODE Y(Y) X Y Y 10 10 USANDOY = 32.14 - 14.54X USANDO Y= 32.14 14.54X 13.238 13.238 3.060 7.422 10.330 8.876 14.692 8.876 11.784 17.600 16.146 RESIDUO (Y -- Y) (Y -3.23X 3.238 2.940 -2.422 2.422 1.670 1.124 .308 .30X -3.876 3.876 .216 - .600 .600 3.854 0.000 (Y (Y _ y)2 Y)2 1.30 2.00 1.70 1.70 1.50 1.60 1.20 1.60 1.40 1.00 1.10 6 5 12 10 15 5 12 17 20 Surnas Sumas 10.48 8.64 5.87 2.79 1.26 .09 15.02 .05 .36 14.85 59.41 Residuos 219 los valores de Y alrededor de la línea de regresión deberían ser menores. Se infiere que r2 Y alrededor de Ia linea de regresión deberian ser menores. que? los valores será más grande. La tabla 6.6 presenta este análisis de residuos. grande. residuos. En el uadro 6.6 se puede apreciar que Ia suma de residuos cuadrados se reduce de uadro 6.6 se puede apreciar la suma de residuos cuadrados reduce de 233.6 5941; la reducción ocm-re debido a que los residuos ahora comprenden la 233,6 a 5941; la reducción ocurre debido a que los residuos ahora comprenden la de alrededor variabilidad de Y airededor de la ilnea de regresión, variabilidad de los valores de Y alrededor de Ia línea de regresión, en vez de airededor de Y. En otras palabras, el conocimiento de la variable relacionada X reduce el error de la de Y. En otras palabras, ci conocirniento de la variable relacionada X reduce el error de Ia tal el Sr. Bump pudiera esperar, a través del conocimiento del coeficiente predicción, tat como el Sr. Bump pudiera esperar, a través del conocirniento del coeficiente la de correlación de Ia muestra entre X y 1'. La surna de residuos cuadrados es Xy Y. La suma de residuos cuadrados es - Y)2 de Y alrededor de los valores de predicción es La varianza de Y airededor de los valores de predicciOn es S 2 s2y·x (6.13) (YY)2 n-2 (6.14) Ejemplo 6.8 Para los datos de ci Sr. Bump datos de el Sr. Bump 59.41 = = 59.41 = 7.43 8 8 S2 y'X Nótese que este rcsultado es ci cuadrado del error estándar de Ia es'imación, s3,. resultado el cuadrado enor estándar la estimación, Syx. Del eli-or original ,qué porcentaje puede ci Sr. Bump explicar Del elTor original ¿qué porcentaje puede el Sr. Bump explicar a través del conocimiento de Ia variable relacionada X? Este valor es el coeficiente de determinación r2.. la relacionada Xl el coeficiente de detem1inación r 2 I r2 .2 1 = I(Y I(YY)22 ----'----'----'-I(Y - Y)2 (YY)2 = = h 1 - 59.41 1 - .254 .746 =1'=1.254=.746 233.6 La respuesta, por supuesto, es ci mismo valor de r2 que se obtuvo anteriormente, e indica que el mismo ? anteriom1ente, indica que el conociniiento de X le pem1ite a ci Sr. Bump explicar ci 74.6% de Ia variabilidad de Y ci conocimiento de X Ic pernlite a el Sr. Bump explicar el 74.6% de la variabilidad de Y alrededor de su media. También, ci 25,4% de Ia variabilidad de Y no se explica mediante el También, el 25.4% la variabilidad Y explica mediante el airededor de de X. conocimiento de X. La relación entre Ia desviación total, Ia desviación explicada y Ia desviación no la desviación total, la desviación explicada la desviación no La relación explicada es: Desviación total = desviación explicada + desviación no expiicada explicada Desviación total = desviación explicada I(Y - Y)2 Y)2 233.6 233.6 = = = I(Y - Y)2 (Y Y)2 174.2 233.6 + + + (Y - Y)2 59.4 220 regresión Análisis de regresión Capítulo CapItulo 6 PRUEBA HIPÓTESIS PRUEBA DE LA HIPOTESIS En el cap. 2, se advirtió que ci coeficiente de correlación de la muestra r tiene su contraparte el ci Ia la poblacion, denorninado p (rho). En forma similar, la en Ia población, denominado p (rho). En forma similar, la población de todos los puntos X Y posee un coeficiente de detenninación ¡jo Como tenerse presente que X - Y posee un coeficiente de determinación p2. Corno siempre, debe tenerse presente que la inforrnación de Ia información de la muestra produce estadísticas de muestra que permiten al pronosticador estadIsticas de muestra que al inferencias sobre las relaciones existentes entre Xy Y junto con todos los puntos de hacer inferencias sobre las relaciones existentes entre X y Yjunto con todos los puntos de la población. estadística podría datos de Ia población. Una prueba estadistica que se podria considerar es H0: =0 B es la pendiente de la verdadera ilnea de regresión de Ia población. El no rechazar en donde 13es la pendiente de la verdadera línea de regresión de la población. El no rechazar significa que diferencia del la la esta hipótesis nula significa que a diferencia del hecho de que Ia evidencia de Ia muestra produjo un valor diferente de cero para b, la evidencia no es lo suficienternente fuet-te para cero para b, la evidencia no es lo suficientemente fuelte para rechazar la de que la línea de la rechazar la noción de que Ia Ilnea de regresión para todos los puntos de datos de la población declaración es equivalente a establecer que p 0. es plana (horizontal). Nótese que tal declaración es equivalente a establecer que p = O. Una población de puntos datos que tiene una línea de regresión plana tendrá también un población de puntos de datos que tiene una Ilnea de regresión plana tendrá también im coeficiente de correlación cero. coeficiente Cómo podría ser cero cuando ¿Cómo podria ser ~ cero cuando b es diferente de cero? Considere la fig. 6.8, en diferente cero? Considere fig. 6.8, en donde se muestra población de puntos de datos donde se muestra una población de puntos de datos a partir de Ia cual se seleccionó una la se seleccionó muestra de cinco puntos (los puntos de la muestra se señalan con x). Como sugiere este Como sugiere este muestra de cinco puntos (los puntos de muestra puntos de diagrama dispersión, diagrama de dispersion, si se seleccionan suficientes puntos de datos de muestra, resultará obvio que Ia poblaciOn de puntos de datos tiene una linea de regresión con una pendiente la población de puntos de datos tiene línea regresión con una pendiente plana. Esto plana. Esto es, tanto J3 como p son cero. Sin embargo, en Ia muestra aleatoria de cinco tanto ~ corno p son cero. embargo, en la muestra aleatoria de cinco se muy línea puntos de datos, se seleccionaron puntos que se ubican rnuy cerca de una ilnea de regresión ascendente. SeIÍa erróneo p3ltir esta evidencia que X Y de tendencia ascendente. Serla errOneo concluir a partir de esta evidencia que X y Y están y Y ..... ' b",O bO 0 O 0 O 0 O O O x X O ",," o .......... ..... ............... o Línea de regresión de Ia muestra la LInea de X x O 0 o 0 X X " ..... 0 o O \ - - - - - - - -::"""'.:::;...-......;......;-------..... O 0 0 O O .......... " X x ............... X - -- -: ..... " .......... .- o_. - O............... O ~=o O O 0 O 0 0 O 0 O 0 O O Línea regresión verdadera Linea de regresión verdadera 0 O O 0 x '----------------------x Figura 6.8 Puntos de datos de la población de la muestra. Figura 6.8 Puntos de datos de Ia población yyde Ia muestra. Prueba de Ia hipOtesis de la hipótesis 221 relacionadas en una forma lineal positiva. Sin embargo, si se prueba la hipótesis de que relacionadas en irna forma lineal positiva. Sin embargo, si se prueba la hipótesis de que f3 = 0, es probable que el pronosticador no pueda rechazarla. = O, es probable que el pronosticador no pueda rechazarla. Ejemplo 6.9 Para los datos del Sr. Bump, Ia prueba aparece en Ia tabla 6.7. Sr. Bwnp, la la De la tabla t para n - 2 grados de libertad tabla 2 grados de libertad t OI .(df=8) = 3.355 tol(df=8) = 3.355 tos(df=8) = 2.306 t05,(df~8J = 2.306 Sr. Bump rechazar la nula: la linea la De ahi que, el Sr. Bump pueda rechazar Ia siguiente hipótesis nula: Ia línea de regresión de Ia ahí población tiene una pendiente plana (/3 = 0). O). PRUEBA 6.7 PRUEBA DE HIPOTESIS PARA LA HIPÓTESIS LA TAB.LA 6.7 PENDIENTE H,: J3 = U S, = s = • V¡(x-x)' (6.15) (6.16) t=h-f3 s. -14.54 - O -14.54 14.54-0 -14.54 t-- - 2.72/V.824 -- 2.72/v':824 = 4.8 = ~4.8 3.00 Nota: Los valores utilizados Se calcularon anteriormenle en este Los valores utilizados se calcularon anterionnente capítulo. El término Sb es el elTor estándar dci coeficiente de del coeficiente de capItulo. El ténnino sb es ci error regresión. regreSión. Considere especiales Considere ahora dos situaciones especiales que ilustran Ia importancia de probar una la hipótesis hipótesis con respecto a la poblaciOn así como considerar el valor de r2. la población asI como considerar el ? Situación Suponga que n = 1000 y r2 = .10. Se rechaza la siguiente hipótesis nula: H0: /3 = 0. la siguiente hipótesis nula: Ha: f3 = O. Suponga que = 1000 Y ? = .10. Sin embargo, la regresión no se considera ütil. se considera útil. Razón. tamaño en extremo grande de la muestra produce estimación Rcizón. El tamaio en extremo grande de Ia muestra produce una estimación muy precisa de ¡J, el coeficiente de determinación de la población. Se puede rechazar la noción determinación de la población. Se nocion p2, de que este coeficiente sea igual a cero. Sin embargo, Ia relación entre X y Y, aunque el coeficiente cero. Sin embargo, la relación y Y, de pronosticador confia en que existe, es muy débil (¡T = .10). Por lo tanto, queda establecido, confia en que existe, es muy débil (p = .10). Por lo tanto, queda establecido, con un margen reducido de error, que existe uria débil relación en la población entre X y existe una débil relación población entre con Y, por lo que el pronosticador no puede utilizar el análisis de regresión. Y, por lo que análisis de regresión. 222 Análisis de regresión Capítulo 6 CapItulo 6 Situación p = O. 13=0. Suponga que n = 3 y r2 = .95. La siguiente hipótesis no se puede rechazar: H0:: Suponga que = Y r 2 .95. La siguiente hipótesis no se puede rechazar: H o Razón. Los tres puntos de datos casi se ubican sobre una línea recta. Sin embargo, Los puntos datos casi ubican sobre ilnea recta. embargo, es un tamaño de muestra en extremo reducido, lo que no constituye suficiente evidencia tamaño de muestra en extremo reducido, lo que no constituye suficiente evidencia es para hacer una declaración positiva acerca de todos los puntos de datos de la población. La población. acerca de todos los puntos de datos requiere reunir mayor hipótesis nula no se puede rechazar debido al elevado valor de r2. Se requiere reunir mayor evidencia de poder efectuar declaraciones significativas con respecto evidencia de la muestra antes de poder efectuar declaraciones significativas con respecto población. a la población. Algunos paquetes de cómputo no calculan la estadIstica t. En su utilizan una Algunos paquetes de cómputo no calculan la estadística t. En su lugar utilizan una prueba de proporción de varianza o estadística F. Para probar la hipótesis de que un modelo estadIstica F. modelo divide una estimación desviada la en particular es bueno, se divide una estimación no desviada de Ia varianza explicada por el modelo, entre la estirnación no desviada del error de varianza no explicado para el modelo, entre la estimación no desviada del error varianza explicado para emplea calcular la estadística modelo. modelo. La ecuación 6.17 se emplea para calcular la estadIstica F. r. F= Varianza contabilizada Varianza total total (r~ - r~)/(KF K (r. - r)/(KF -- KR) (1 -- rr)/(n -- K (1 ~)/(n KF) R) (6.17) F ) en donde r; = r2 para el modelo completo r r~ ,;1. para el modelo restringido r ==r2 para el modelo restringido KF = número de parámetros linealmente independientes a estimar en el el KF = nñrnero de parárnetros linealmente independientes modelo completo completo K R = número de parámetros linealmente independientes a estimar en el el KR = nürnero de parámetros linealmente independientes a modelo restringido n = tamaño de la muestra n= r;. - ~ = porcentaje de varianza total explicada por la(s) = variable(s) el modelo variable(s) en el modelo completo pero no en el modelo restringido 1 - r. = porcentaje de la varianza total no explicada por el modelo - r;. = porcentaje de la varianza total no explicada completo - modelo completo es modelo que el analista está interesado en probar. El modelo El modelo completo es el modelo que el analista está interesado en probar. El modelo pronosticador restringido se forma mediante el uso de la media de Ia variable Y (1') como el pronosticador mediante el uso de la media de la variable Y (Ji) o variable independiente. r~ es el porcentaje de la varianza explicada cuando se emplea X independiente. r es el porcentaje de la varianza explicada cuando se emplea X Y. r es cero que de la media de Y predecir Y no explica la para predecir Y. r~ es cero ya que el uso de Ia media de Y para predecir Y no explica la ninguna variable Y. varianza de ninguna variable Y. Para determinar el valor apropiado de F a partir de la tabla C.6, el analista necesita la tabla C.6, el analista necesita Pam determinar el valor apropiado de F conocer dos parãmetros: los grados de libertad tanto del nurnerador (KF - KR), como del parámetros: de libertad tanto del numerador (KF - K R), conocer denominador (n - KF). KF ). Salida de cOmputo de cómputo 223 Ej emplo Ejemplo 6.10 La hipótesis nula para probar la ecuación del .Sr. Bump, el modelo que usa el precio para La hipótesis nula para probar la ecuación del .Sr. Bump, el modelo que usa predecir ventas, no es una buena hipótesis: el conocimiento del movimiento de la variable movimiento la variable predecir ventas, no una buena hipótesis: el conocimiento precio no explica un porcentaje significativo de la varianza de la variable ventas. Se usa Ia precio explica porcentaje significativo de la varianza de la variable ventas. Se usa la ecuación 6.17 para calcular la estadIstica F apropiada. la estadística apropiada. F- (r - r)/(KF - KR) (1 - r)/(n - KF) (.746 0)/(2 1) (.746 -- 0)/(2 -- 1) (1 .746)/(10 2) (1 -- .746)/(10-2) .746 ~=23.5 = 23.5 .03175 .03 175 Debido a que Ia estadística F calculada (23.5) es mayor que el valor tabulado de F para 1 y 8 la estadIstica F calculada (23.5) es mayor que ci valor tabulado de F para Debido grados de libertad a los niveles de significancia de .05 (5.32) Y .01 (11.26), se rechaza la niveles significancia de .05 (5.32) y .01 (11.26), grados de libertad a rechaza hipótesis nula en ambos niveles de significancia. El Sr. Bump concluye que es un buen modelo hipótesis en niveles de significancia. El Sr. Bump concluye que es un buen modelo y que explica un porcentaje significativo de la varianza de la variable dependiente. porcentaje significativo de Ia varianza de variable dependiente. SALIDA DE CÓMPUTO SAL IDA DE COMPUTO problema análisis regresión del Sr. Bump (datos de la El problerna de análisis de regresión del Sr. Bump (datos de la tabla 6.1) se ejecuta en un cómputo de regresión para producir Ia salida que se presenta en tabla 6.8. programa de córnputo de regresión para producir la salida que se presenta en la tabia 6.8. salida es típica las generadas por El paquete utilizado produce una salida que es tIpica en comparación con las generadas por de análisis de regresión. Aunque no hay un formato cstándar otros programas de análisis de regresiOn. Aunque no hay un fonnato estándar para presentar resultados análisis regresión, muestra la tabla 6.8 contielos resultados de un análisis de regresión, la salida que se muestra en Ia tabla 6.8 contiene los vaiores que exhiben Ia rnayorIa de los programas de análisis de regresión. Para los valores que exhiben la mayoría de los programas de análisis de regresión. Para la tenninología la explicar ia terminologla utilizada en Ia salida de cómputo, en la siguiente lista se presentan de cómputo, en Ia siguiente lista presentan definiciones cálculos relacionados con la tabla 6.8. definiciones y ciIcuios relacionados con Ia tabla 6.8. 1. Correlación X vs. Y = .86. El coeficiente de correlación de ia muestra (r) indica ia C'orreiación X vs. Y -.86. El coeficiente de correlación de la muestra (r) indica la relación entre X y Y, o entre precio y ventas, respectivamente. Xy Y, 2. Coeficiente de regresión = -14.54.Este valor es Ia proporción de cambio en Y(ventas) Coeficiente de regresión 14.54. Este valor es la proporción de cambio en Y(ventas) cuando X (precio) se incrementa en una unidad (b). Cuando el precio se incrementa en XQrecio) se incrementa en una $1 14 $1 dólar, las ventas disminuyen en 14 540 unidades. 3. Error estóndar del coeficiente de regresión = 3.0. Este valor es Ia desviación estándar Error estándar del coeficiente de regresión = 3.0. Este valor es la desviación estándar muestreo de la distribución de rnuestreo del valor del coeficiente de regresión (b). s y·x Sv.r 2.72 272 2.72 .908 Sb = V(X X)2 = V824 V.824 3.00 = 3.00 224 regresión Análisis de regresion Capítulo Cap Itulo 6 TABLA 6.8 6.8 VARIABLE NO. 2 2 CÓMPUTO EL PROBLEMA DE REGRESiÓN DEL SR. BUMP SALIDA DE COMPUTO PARA EL PROBLEMA DE REGRESION DEL SR. BUMP MEAN STANDARD DEVIATION 0.30258 CORRELATION MEAN X y X VS Y (1) -0.86 (1) REGRESSION COEFFICIENT -14.54 0.30258 (2) (2) STD. ERROR OF REG. COEF OF REG. COEF 3.00 (3) (3) COMPUTED T VALUE -4.84 (4) (4) 1.44000 DEPENDENT 1 1 11.20000 INTERCEPT STO. ERROR OF STD. ESTIMATE ESTIMATE 5.09466 32.14 (5) (5) 5.09466 CORRELATION 0.86 MULTIPLE CORRELATION 0.86 R SQUARED (7) (7) 0.746 (8) (8) (9) 0.714 (9) 2.725 (6) (6) CORRECTED R SQUARED CORRECTED ANALYSIS OF VARIANCE FOR THE REGRESSION (14) OF VARIANCE FOR THE REGRESSION (14) SOURCES OF VARIATION DEGREES FREEDOM OF FREEDOM 1 1 8 8 9 9 SUM OF SQUARES MEAN SQUARES F VALUE TO REGRESSION ATTRIBUTABLE TO REGRESSION DEVIATION FROM REGRESSION DEVIATION TOTAL 174.175 174.175 174.175 59.425 (10) 7.428 (10) 233.600 (11 ) (11) 23.448 CORRELATION MATRIX: 2 BY 2 (13 ) CORRELATION MATRIX: 2 (13) VAR. 1 1 2 2 2 1.000 -0.863 -0.863 1.000 TABLE OF RESIDUALS RESIDUALS CASE NO. NO. 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 Y VALUE Y 10.00000 6.00000 5.00000 12.00000 10.00000 15.00000 5.00000 12.00000 17.00000 20.00000 Y ESTIMATE 13.23543 3.05824 3.05824 7.41989 7,41989 10.32765 8.87376 14.68932 14.68932 8.87376 11.78154 11.78154 17.59706 17.59706 16.14317 RESIDUAL -3.23543 (12 ) (12) 2.94176 -2.41989 1.67235 1.12624 0.31068 -3.87376 0.21846 -0.59706 3.85683 Salida de cOmputo cómputo 225 4. Valor calculado tt = 4.84. El valor calculado ttse usa para probar si el coeficiente de 4. Valor calculado = -4.84. El valor calculado se usa para probar si el coeficiente fJ es fonna la regresión de Ia población /3es diferente de cero en forma significativa. t 14.54 = = b - f3 = - 14.54 Sh Sb S b-3 Sh Sb sh = = VI(X V(x - yx 1)2 X)2 2.725 3.00 \1.8240 = 3.00 V.8240 -14.54 14.54 -4.85 (error de redondeo) t = - - - = 4.85 (error de redondeo) = 3.00 5. Instersección = 32.14. Este valor es ci punto de intersección de y (b0). De ahI que la = 32.14. Este valor es el plmto de intersección de y (b a). ahí ecuación completa de regresión sea y = 32.14 l4.54X Y= 32.14 - 14.54X 6. Error estándar de la estiinación = 2.725. El error estándar de la estirnación indica que Error estándar de la estimación = 2.725. El error estándar de la estimación Y ubican forma tIpica airededor de línea los valores de Y se ubican en fonTIa típica alrededor de casi 2.725 unidades de la lInea 2.725 de regresión. s y y·x S = = 59.425 (YY)2 j"¡(Y -- 2 J59.4252 n 10 n-2 10 -- 2 y)2 = = - Y7.428 = 2.725 V7.428 = 2.725 7. Correlación imiltiple = .86. El coeficiente de correlación multiple es la raIz cuadrada múltiple .86. coeficiente múltiple la raíz cuadrada r2 e indica el grado de relación entreXy Y pero no el tipo de relación. positiva de ,,2 e indica el grado de relación entre X y Ypero no ci tipo de relación. .74 = 74 Vr2 V74 v? = V.74 r2 r = .86 = .86 8. r cuadrada==.746. La regresión explica ci 74.6% de Ia varianza en ci volurnen de ventas. cuadrada . 746. La regresión explica el 74.6% de la varianza en el volumen de ventas. 1 - I(Y -- Y)2 E(Y y)2 I(Y -- Y)2 (Y y)2 - --- 59.4 233.6 1 .254 = .746 = I -- .254 = .746 9. r cuadrada corregida = = 714. El valor de r2 se ajusta a los grados de libertad apropiados. cuadrada corregida . .714. El valor de ,;2 .2 'C - I(Y -- Y)2/(n -- 2) Y Y)~(n 2) 1 - -'-------'----'---"I(Y -- Y)2/(n - 1) (Y Y)2/(n - 1) - 1 _ 59.425/8 233.6,9 233.6/9 1 1 7.428 7.428 = 1 - .286 = .714 1 - 286 = 714 25.956 . . 226 regresión Análisis de regresión Capítulo 6 Cap Itulo 10. Suma de desviaciones cuadradas de la regresión = 59.425. La suma de los residuos Suma de desviaciones cuadradas de la regresión = 59.425. residuos cuadrados es la diferencia entre la Yreal y la predicción de Y(Y), elevada al cuadrado Y real la predicción de Y (Y), y sumada (en ocasiones se le denomina como el error de la suma de cuadrados). ocasiones se le denomina como el error de la suina de cuadrados). I(Y - y)2 = 59.425 59.425 11. Suma total de cuadrados = 233.6. Es el valor de la suma de las desviaciones cuadradas cuadradas cuadrados = 233.6. Es el valor de la suma de la media. I(Y - Y)2 = 233.6 y)2 = 12. Tab/a de residuos. Los residuos miden Ia diferencia entre lo que es realmente Yy Jo que Tabla Los residuos miden la diferencia entre lo que es realmente Yy lo regresión. se predice que será cuando se usa Ia ecuación de regresión. Por ejemplo, la 1: Case 1: 2: Case 2: - - Y = 10 -- 13.23543= -3.23543 = 10 13.23543 = 3.23543 Y -- Y = 6 - 3.05824 = 2.94176 3.05824 = 2.94176 Y Y= Y -Y 13. Matriz de correlación. La rnatriz proporciona Ia correlación entre todas las variables en correlación. La matriz proporciona la correlación entre todas las variables en sólo variables, sólo hay un coeficente de conelación el análisis. Como solo comprende dos variables, sOlo hay un coeficente de correlación (-.863). (.863). 14. Análisis de varianza. El valor F (23.448) en esta tabla ANOVA (análisis de varianza), varianza. El valor F (23.448) en esta tabla ANOVA (análisis de varianza), nula de que la regresión no es significativa; es decir, Ia reducción en prueba la hipótesis nula de que Ia regresiOn no es significativa; es decir, la reducción en la suma de errores cuadrados de 233.6 a 59 425 se debe a la casualidad. Un valor alto elTores 233.6 a 59 425 se debe a la casualidad. Un valor alto de F permitirárechazar esta hipótesis, sugiriendo una regresión significativa. El vaFpermitirá rechazar esta hipótesis, sugiriendo una regresión significativa. El valor de F (23.488 = 174.175/7.428) se hace más grande en tanto se explique una mayor (23.488 = 174.175/7.428) parte cuadrados, mediante la regresión. parte de la suma total de residuos cuadrados, mediante Ia regresiOn. En este caso el valor el valor tabulado (dll! = 1, dft= 8, a= .01) es 11.26. De ahí que se rechace la hipótesis F tabulado (df, = 1, dfd = 8, a= .01) es 11.26. De ahi que se rechace la hipOtesis de que la regresión no es significativa al nivel de significancia de 1%, ya que 23.488 > 11.26. regresión noes significativa significancia de 1%, ya que 23.488> 11.26. Los grados de libertad apropiados en cualquier análisis dede regresión son k1, n-k y Los grados de libertad apropiados en cualquier análisis regresión son k - 1, n - k y n - I 1 para los atribuiblesa a la regresión, La desviación de la regresión y el total, n para los atribuibles la regresiOn, la desviación de Ia regresión y el total, respectivamente, en donde k es el número de coeficientes de regresión calculados a partir respectivamente, en donde kes el nümero de coelicientes de regresión calculados partir de los datos de la muestra (todas las b). Transformación de variables Trans form aciónde variables técnicas capítulo apoya la suposición existe una relación lineal Las técnicas en este capItulo se apoya en la suposición de que existe una relación lineal variable dependiente (Y) la variable de predicción (X). Se supone también esta entre la variable dependiente (Y) y la variable de predicción (X). Se supone también esta relación entre Y y pronósticos multiples como se expone en relaciOn entre Y y pronósticos múltiples como se expone en el cap. 7. muestran En ocasiones, los datos de interés no muestran una relación lineal. Si la relación X-y relaciOn lineal. Si la relación XY se acerca a ser lineal, Ia suposición de este capItulo sobre Ia relación de lInea recta podrIa lineal, la suposición capítulo la línea podría se precisión. Cuando la forma de proporcionar suficiente precision. Cuando éste no es el caso, se debe encontrar la forma de manejar una relación que no se puede aproximar a un modelo lineal. aproximar modelo lineal. mañejar una relación que de cómputo Salida de cOmputo 227 Existen dos formas básicas para el manejo de relaciones no lineales. El primero manejo de relaciones no lineales. El primero Existen dos fonnas básicas para consiste en ajustar los datos con una Ilnea curva o modelo y emplear la relación establecida línea con fines de pronóstico. Este enfoque constituye una ampliación del modelo lineal descrito ampliación del lineal descrito en este libro y es tema de más avanzados tratamientos del análisis de regresión. y es tema de más avanzados tratamientos del análisis de regresión. El segundo enfoque consiste en convertir una o más variables a otra fonna, de modo convertir una o más variables forma, que la relación resultante con Y sea lineal. Cuatro de las transforrnaciones más comunes relación resultante con Y lineal. Cuatro de las transfonnaciones comunes que se usan para generar nuevas variables de predicción son: el logaritmo de ~ la raIz que usan para generar nuevas variables de predicción son: el logaritmo de X raíz cuadrada de X, X cuadrada y el recIproco de X. Al graficar cada una de estas variables estas variables cuadrada de X, X cuadrada y el recíproco de X. Al graficar cada una contra Y, la esperanza es que, aunque la relación X-Yen sí misma no es lineal, alguna de contra Y, la esperanza es que, aunque la relación XY en si misma no lineal, alguna de transfonnaciones las transformaciones arroje una relación lineal. De ser así, se puede tratar a Y y a esta nueva lineal. asI, se puede tratar a Yy capítulo, incluyendo el cálculo variable mediante el modelo lineal expuesto en este capItulo, incluyendo el cálculo del variable mediante el modelo lineal expuesto en coeficiente de regresión y la ecuación de regresión. la ecuación de regresión. En el ejemplo siguiente, se emplea Minitab para graficar una relación X-Y simple que siguiente, se emplea Minitab para graficar una relación XY simple que calcule las cuatro transfonnaciones parece no ser lineal. Se instruye a! prograrna para que calcule las cuatro transformaciones lineal. Se instruye al programa descritas anteriorrnente. Entonces se pueden graficar estas variables contra Y, para producir anterionnente. Entonces se pueden graficar Y, para producir las gráficas que se muestran. se muestran. > MTB > DATA> DATA> DATA> MTB > > DATA> DATA> DATA> DATA> MTB > > MTB > > MTB > > MTB > > MTB > > MTB > MTB > ROW 1 SET C1 SET Cl 5 5 18 20 14 3 19 20 14 3 18 END SET C2 SET C2 25 12 30 10 50 90 25 12 30 END C2, PUT INTO C3 LOGE C2, PUT INTO C3 SORT 02, PUT INTO C4 SQRT C2, PUT INTO C4 C2 BY C2, PUT INTO C5 MULTIPLY C2 BY 02, PUT INTO C5 DIVIDE 1 BY C2, PUT INTO C6 DIVIDE 1 BY C2, PUT INTO C6 NAME C1 'Y' C2 'X' C3 'LOGX' C4 'SQRTX' 05 'X2' C6 1/Xe NAME Cl 'Y' C2 'X C3 'LOGX' C4 'SQRTX C5 'X2' C6 'l/X' PRINT C1-C6 PRINT C1C6 Y Y 5 5 18 X 10 50 LOGX 2.30259 3.91202 4.49981 3.21888 2.48491 2.48491 3.40120 SQRTX 3.16228 7.07107 9.48683 5.00000 3.46410 5.47723 X2 l/X 1/X X 1 2 2 3 3 4 4 5 5 6 6 20 14 3 3 19 90 25 12 30 100 2500 8100 625 144 900 0.100000 0.020000 0.011111 0.040000 0.083333 0.033333 • El comando SET se usa para introducir Y y X en' C1y C2. se usa para introducir YyXen'C1 y C2. • El cornando LOGE se emplea para calcular los logaritmos de los valores de X y comando LOGE se emplea para calcular los logaritmos de los valores de X almacenar los resultados en C3. 228 Análisis de regresion regresión Capítulo 6 CapItulo • El comando SQRT se utiliza para calcular las raíces cuadradas de los valores de X y cornando SQRT se utiliza para calcular las ralces cuadradas de los valores X almacenar los resultados en C4. • El comando MULTIPLY se usa para elevar a! cuadrado los valores de X y almacenar elevar al cuadrado los valores de X y almacenar los resultados en C5. • El comando DIVIDE se emplea para los recIprocos de X y almacenar los resultados en recíprocos los resultados en Xy C6. MTB> PLOT Cl VS C2 MTB > PLOT Cl VS C2 18.0+ y Y * 12.0+ 6.0+ 6 . 0+ - - - - - -+- - - - - - - - -+- - - - - - - - -+- - - - - - - - -+- - - - - - - - -+- - - - - - - - -+X 30 45 60 75 90 15 75 MTB > PLOT Cl VS C3 MTB > PLOT Cl VS C3 18.0+ 18.0+ y Y 12 . 0+ 12.0+ 6.0+ 6 . 0+ + - - - - - - - - - + - - - - - - - - - + - - - - - - - - - + - - - - - - - - - + - - - - - - - - - + - - - - - - LOGX + LOCX 2.00 2.50 2.50 3.00 3.50 4.00 4.50 de cómputo Salida de cOmputo 229 MTB > FLOT Cl VS C4 > PLOT Cl VS C4 18.0+ y Y 12.0+ 6.0+ 6 . 0+ - - - - - -+- - - - - - - - -++ + 3.6 4.8 - - - - - + - - - - - - - - - + - - - - - - - - - + - - - - - - - - - +SQRTX + SQRTX 6.0 7.2 8.4 9.6 MTB MTB > PLOT Cl VS C5 > FLOT Cl CS 18.0+ y Y - 12 . 0+ 12.0+ 6.0+ 6 . 0± ++ + + - - - - - - - -+- - - - - - - - -+- - - - - - - - -+- - - - - - - - -+- - - - - - - - -+- - - - - - - - -X2 + + + X2 0 o 1500 1500 3000 4500 6000 7500 230 de regresión Análisis de regresiOn Capítulo 6 Cap Itulo MTB> PLOT Cl VS C6 MTB > PLOT Cl VS C6 * 18.0+ y Y 12.0+ 6.0+ 6 .0+ 0.000 MTB > STOP MTB > STOP +- - - - - - - - -+- - - - - - - - -+- - - - - - - - -+- - - - - - - - -+- - - - - - - - -+- - - - - -1 Ix + + + + + + 1/x 0.020 0.040 0.060 0.080 0.100 0.020 0.100 0.080 0.040 Nótese que La primera gráfica (X vs. fl produce una relación no lineal. Es probable que la Y) produce relación lineal. Es probable línea través estos puntos de datos se produzca en el análisis y que el ajustar una ilnea recta a través de estos puntos de datos se produzca en el análisis y en en los pronósticos subsecuentes, un grado de error no deseado. pronósticos subsecuentes, un grado de En contraste, la segunda gráfica (Y vs. logaritmo de X) y la ültima gráfica (Y vs. segunda gráfica (Y vs. logaritmo de X) la última gráfica (Y vs. En contraste, recíproco X) prometedoras modelo lineal. Se podrían utilizar recIproco de X) se muestran ambas prornetedoras para el modelo lineal. Se podrIan utilizar los métodos lineales de este capítulo y del cap. 7, para emplear estos dos pronósticos en un los métodos lineales de este capItulo y del cap. 7, pam emplear estos dos pronósticos en un intento por encontrar una ecuación de predicción con un grado aceptable de precision. precisión. intento una ecuación de predicción con un APLICACIÓN EN LA ADMINISTRACIÓN APLICACIÔN EN ADMINISTRACION análisis de regresión es la herramienta estadística más ampliamente utilizada por la El análisis de regresión es la herrarnienta estadIstica más amplianiente utilizada por La administración, cuando existe la necesidad de evaluar el impacto de una sola variable variable administración, cuando existe la necesidad de evaluar el impacto de una independiente. independiente sobre una variable independiente. El análisis de regresión junto con el análisis regresiónjunto con el análisis de correlación, ayuda al pronosticador a caracterizar las relaciones entre variables. El pronosticador caracterizar las relaciones entre variables. de correlación, ayuda pronosticador puede determinar tanto la importancia como la direcciOn de La relación entre detenninar la importancia como la dirección la relación entre variables. La mayoria de Los problemas que utilizan el análisis de regresiOn comprenden una mayoría los problernas que utilizan el anlisis de regresión comprenden una versión más compleja denominada múltiple (que version rnás compleja denorninada análisis de regresión máltiple (que se describirá en el siguiente capítulo), ya que la mayoría de las relaciones implican el estudio de más de una sigUiente capitulo), ya que La rnayoria de las relaciones implican el estudio de rnás de una AplicaciÓfleo la administración AplicaciOnen Ia administraciOn 231 variable independiente. No obstante, en ocasiones se utilizan el análisis de regresión simple independiente. obstante, en ocasiones se utilizan el análisis y el análisis de correiación, algunos ejempios son análisis de correlación, algunos ejemplos son • Consumo de productos. Un fabricante pudiera intentar predecir qué tanta cerveza bebe Consumo deproductos. Un fabricante una persona por semana, a partir de variables como ingreso, edad educación o clase ma persona semana, partir de variables como ingreso, edad educación o clase social. • Ventas. Un detallista podría intentar predecir las ventas de un producto para una tienda Ventas. Un detallista podrIa intentar predecir las ventas de un producto versus otra, con base en diferenciales de precio, ingreso relativo a la comunidad de los alrededores, el trato amistoso del personal de la tienda, o el número y fuerza de los airededores, el trato amistoso del personal de la tienda, o el nümero y fuerza de los competidores en cada area de mercado. área de mercado. • Precios de la bolsa. Un analista de bolsa de una empresa regional de corredores podrIa Precios de la bolsa. Un analista de bolsa de una empresa regional de corredores podría intentar predecir el precio de una nueva emisión de una empresa local, con base en la el precio de una nueva ernisión de una empresa local, con base en la economía regional, el ingreso, la población o la imagen de la empresa. econornIa regional, vencida que • Cartera vencida. Un contador podrIa intentar predecir la cartera vencida que una vencida. Un contador podría intentar predecir en el compañía pudiera esperar encontrar en el siguiente trimestre fiscal, con base en el compaflIa pudiera esperar encontrar en el siguiente trimestre fiscal, número de personas desempleadas, crédito excesivo, tasas de interés o ventas nümero de personas desempleadas, crédito excesivo, tasas de interés ventas esperadas. • Requeriinientos de personal. Un director de personal de una gran compañIa manufacRequerimientos personal. Un director de personal de una gran compañía manufacturera podría intentar predecir los requerimientos de personal para el próxirno aflo, a requerimientos de próximo año, turera podrIa intentar predecir la de sus su escala de salario comparada con la de partir de la edad promedio de sus empleados, su escala de salario comparada con Ia de la cornunidad de los airededores, nuevos contratos de ventas esperados o la disponibicomtmidad alrededores, o la disponibilidad de trabajos competitivos. • Deinanda de Ufl centro comercial. El gerente de un nuevo centro comercial podrIa Demanda de un centro coinercial. El gerente de un podría tratar de anticiparse a la demanda, analizando el ingreso de la comunidad de los tratar de anticiparse a demanda, analizando el ingreso de la comunidad de el tamaño de la proximidad dimensiones de otros centros alrededores, ci tarnaño de Ia población o la proxirnidad y dimensiones de otros centros comerciales. cornerciales. detenninada relación las variables independiente dependiente, Una vez determinada la relación entre las variables independiente y dependiente, la administración puede, en algunos casos, partir adrninistración puede, en algunos casos, tratar de controlar la variable dependiente a partir detennina de este conocimiento. Por ejemplo, suponga que un gerente de comercialización deterrnina significativa entre los gastos de publicidad y las ventas. La que existe una relación positiva significativa entre los gastos de publicidad y las ventas. La podría ecuación de regresión podrIa ser Ventas = $43 000 + .3 (gastos de publicidad) Ventas = $43 000 gerente podría A partir de esta ecuación, el gerente de comercialización podrIa intentar controlar las las la cantidad de publicidad que maximizará las utilidades. ventas aumentando o disminuyendo la cantidad de publicidad que maxirnizará las utilidades. Siempre que el administrador tenga control sobre la variable independiente, hay posibilidad control sobre variable independiente, posibilidad la variable dependiente. ahí ecuación regresión de un control parcial de la variable dependiente. De ahI que la ecuación de regresión y el coeficiente de deterrninación ayuden a Ia administración a determinar si vale la pena dicho detenninación ayuden la vale la pena dicho control. 232 232 Análisis de regresiOn Análisis de regresión Capítulo 6 CapItulo 6 GLOSARIO Línea de regresión. Una línea de regresión es aquella que mejor se ajusta a un conjunto LInea de regresión. Una ilnea de regresión es aquella que mejor se ajusta a un conjunto las distancias a! cuadrado de los puntos la de datos X-Y. Minimiza la suma de las distancias al cuadrado de los puntos a Ia de datos X - Y. Minimiza línea, medidas en dirección vertical o de Y. de Y. ilnea, Error estándar de estimación. El error estándar de la estimación mide la cantidad Error estándar de Iala estimación.El error estándar de la estimación mide la cantidad estándar en que los valores reales de Y difieren de los valores estimados (Y). los valores reales de Y difieren de los valores estimados (Y). fÓRMULAS CLAVE FORMULAS CLAVE Método de mmnimoscuadrados: fórmula de la pendiente b = nXY -- IXIY mínimos cuadrados: formula Ia pendidnte b = nIXY nIX 2 - (IX)2 nIX2 - (IX)2 Método de mínimos cuadrados: formula de interseccion con Y b = IY _ bIx Metodo de minimos cuadrados: fórmula de intersección con Y o n n n fl Ecuación de regresión EcuaciOn y = bo Y = b0 + bX bX (6.1 ) (6.1) (6.2) (6.2) + (6.3) (6.3) Error estándar de la estimación: formula definitoria Error estándar de la estimación: fórmula definitoria S y.x y·x s = = YY)2 JI(Y -- 2Y)' n n-2 boIY - bIXY b0IY n - 2 n-2 (6.4) (6.4) Error estándar de la estimación: formula de cálculo Error estándar de la estimación: fórmula de cálculo S sy.x = y·x J Iy2 1y2 -- - (6.5) (6.5) Error estándar del pronóstico Error estándar del pronóstico S =Sy·x s¡=s y.x f Intervalo de predicción: muestra grande predicción: R 1 1+1+ +1-+ n n (X-X)2 (XX)2 I(X - X)2 I(XX)2 (6.6) (6.6) Y ± ZSf Y Zs¡ (6.7) (6.7) (6.8) (6.8) Intervalo de predicción: muestra reducida y ± ts1 Intervalo de predicción: muestra reducida V ± ts¡ Coeficiente Coeficiente de determinación = 1 r2 = 1 - I(Y - Y)2 y)2 I(Y y)2 I(Y -- Y)2 - (6.9) (6.9) Coeficiente de determinación: fórmula de cálculo Coeficiente de determinaciOn: formula 2 r boIY + bIXY - ny2 bIY+bIXYnY2 0 Iy 1y22 _. ny2 (6.10) (6.10) Capítulo 6 CapItulo Problemas 233 Suma total de cuadrados - Y)2 s2 V (6.11 ) (6.11) Varianza total de Y alrededor de su media Y airededor Varjanza l(Y - Y)2 y)2 n - 1 Suma de residuos cuadrados cuadrados l(Y - Y)2 y)2 n - 2 ni (6.12) (6.13) Varianza total de Y airededor de los valores predecidos de Y alrededor de los valores predecidos n-2 (6.14) Error estándar del coeficiente Error estándar del coeficiente de regresión s = sh = Sb s y·x S / (6.15) b - /3 Estadística para el coeficiente EstadIstica t para el coeficiente de regresión t = b - f3 Prueba de proporción de varianza o estadistica F F proporción de varianza o estadística F F (r~ r1)/(K KR (r. -- r)/(KFF- - KR)) (l r})/(n KF (1 -- r)/(n -- KF)) (6.16) = (6.17) PROBLEMAS 1. ¿Cuál de las siguientes situaciones es inconsistente? las siguientes situaciones es inconsistente? Cuál a. y = 499 + .21X y r = .75 = 499 .21X r = .75 b. Y = 100 + .9X y r = -.70 b.ç'=100+.9X yr=.70 c. y = -20 + IX y r = .40 d. Y = -7 - 4 X Y r = -.90 Los ingresos por acción de AT&T (American Telephone & Telegraph) estiman mediante 2. Los ingresos por acción de AT&T (American Telephone & Telegraph) se estiman mediante el 0.06X, PNB (Producto Nacional Bruto). La ecuación de regresión es = 0.078 + 0.06X, en donde el PNB (Producto Nacional Bruto). La ecuación de regresión PNB PNB se mide en miles de millones de dólares. miles de millones dólares. c.I'=-20+lX yr.40 d. Y = 7-4X yr.90 y a. Interprete Ia pendiente. la b. Interprete la intersección con Y. intersección con Y 3. Considere los datos de Ia tabla siguiente, en donde X = gastos semanales de publicidad y Y = Considere los datos de la tabla siguiente, en donde X = gastos semanales publicidad y. y = semanales. ventas senianales. y $1,250 1,380 1,425 1,425 1,450 x X $41 54 63 54 48 Y $1,300 X 1,400 1,510 1,510 1,575 1,575 1,650 $46 62 61 64 71 a. ¿Existe una relación significativa entre los gastos de publicidad y las ventas? j,Existe una relación significativa entre los las ventas? b. Establezca la ecuación de predicción. ecuación de predicción. c. Pronostique las ventas para un gasto de publicidad de $50 dólares. de publicidad $50 dólares. 234 Análisis de regresión Análisis de regresiOn Capítulo Cap Itulo 6 d. j,Que porcentaje de la varianza se puede explicar con la ecuación de predicción? ¿Qué porcentaje predicción? varianza explicada. e. Establezca Ia cantidad de varianza no explicada. la f. Establezca Ia cantidad total de varianza. la varianza. En la tabla siguiente se muestran los tiempos requeridos atención clientes las cajas de 4. En la tabla siguiente se muestran los tiempos requeridos de atención a clientes en las cajas de un supermercado y los valores de las compras. Responda con estos datos los apartados a, b, e y compras. Responda con estos datos los apartados a, b, e f del problema 3. Dé un punto e intervalo de estimación de 99% para Y si X = 3.0. f del problema 3. Dé punto intervalo de estimación de 99% para Y si X= TIEMPO REQUERIDO TIEM1O ATENCIÓN DE ATENCION MINUTOS) (EN MINUTOS) 3.6 4.1 .8 5.7 3.4 VALOR DE LAS COMPRAS LAS DÓLARES) (EN DOLARES) 30.6 30.5 2.4 42.2 21.8 VALOR DE TIEMPO REQUERIDO LAS LAS COMPRAS ATENCIÓN DE ATENCION (EN DOLARES) (EN DÓLARES) (EN (EN MINUTOS) 1.8 4.3 .2 6.2 40.1 2.0 15.5 6.5 2.6 1.3 A Lori Franz, supervisora de mantenimiento la Baltimore Transit Authority, gustaría 5. A Lon Franz, supervisora de mantenimiento de la Baltimore Transit Authority, le gustarla determinar si existe una relación entre el costo anual de mantenimiento de un autobüs y su determinar si existe una relación entre el costo anual de mantenimientode un autobús y su una relación, Lori piensa que puede pronosticar mejor el presupuesto anual antigüedad. antiguedad. Si hay una relación, Lori piensa que puede pronosticar mejor el presupuesto anual autobuses. Por ello, reúne los siguientes datos: de mantenimiento de autobuses. Por ello, reüne los siguientes datos: COSTO DE MANTENIMIENTO MANTENIMIENTO ($) ANTIGÜEDAD ANTIGUEDAD (EN AÑOS) (EN A1OS) AUTOBUS AUTOBÚS 1 Y Y $ 859 682 471 708 1,094 224 320 651 1,049 x X 8 8 1 2 2 3 4 5 5 3 9 11 11 5 6 6 7 7 2 2 1 1 8 8 9 12 dispersión. Grafique un diagrama de dispersion. LQué clase de relaciOn existe entre las dos variables? relación existe entre ¿Qué clase Calcule el coeficiente de correlación. correlación. correlación nivel de significancia .05. Pruebe el nivel de correlación a un nivel de significancia de .05. de manteni¿Debería usar Lori el análisis de regresiOn para pronosticar el presupuesto anual de manteni,DeberIa usar Lon análisis de regresión para el miento de autobuses? f. Determine Ia ecuación de regresión de la muestra. la regresión la muestra. g. Pronostique el costo de mantenimiento para un autobús que tiene 5 años de antiguedad. mantenimiento para un autobüs que de antigüedad. Pronostique el a. b. c. d. e. Andrew Vazsonyi es el gerente de la cadena de supermercados Spendwise. A él gustaría 6. Andrew Vazsonyi es el gerente de Ia cadena de supermercados Spendwise. A éI le gustarla poder pronosticar las ventas de libros en rústica (libros por semana), con base en la cantidad de espacio rüstica (libros por semana), con disponible en los estantes (en pies). Andrew reúne datos para una muestra de 11 semanas: muestra de 11 semanas: disponible en reáne Capítulo 6 CapItulo 6 Problemas Problemas NUMERO DE LIBROS NÚMERO DE LIBROS VENDIDOS Y r 275 142 168 168 197 197 235 PIES DE ESPACIO EN ESTANTES ESPACIO ESTANTES X SEMANA I 1 6.8 3.3 4.1 4.2 4.8 3.9 4.9 2 3 3 4 5 5 6 7 215 188 8 9 241 295 125 7.7 3.1 10 11 II 266 200 5.9 5.0 Grafique un diagrama de dispersion. dispersión. Grafique ¿Qué clase de reiación existe entre las dos variables? ,Qué clase relación existe entre el coeficiente de correlación. Calcule ci coeficiente de correlación. Pruebe el nivel de correlación a un nivel de significancia de .10. Pmebe ci nivel de correiación a un nivel de significancia de .10. )DeberIa usar ci análisis ¿Debería usar el anáiisis de regresión para pronosticar las ventas de libros en rüstica? regresión libros en rústica? ecuación de regresión de la muestra. Determine la ecuación de regresión de la muestra. Pronostique las ventas de libros en rüstica para una semana durante Ia cual hay un espacio rústica semana durante la cual hay un espacio disponible de disponible de 4 pies. 7. En ia siguiente tabia se presenta información de una empresa de órdenes por correo, para 12 empresa órdenes correo, 12 7. En la siguiente tabla se presenta información ciudades: NÚMERO DE ORDENES ÓRDENES NÜMERO RECIBIDAS RECIBIDAS POR CORREO,r CORREO, Y (EN MILES) CIUDAD (EN A B C D E a. b. c. d. e. f. g. NUMERO NÚMERO DE CATALOGOS CATÁLOGOS DISTRIBUIDOS, X DISTRIBUIDOS, x (EN MILES) 6 2 5 5 NÚMERO NIIJMERO DE NÚMERO ÓRDENES N1JMERO DE ORDENES CATÁLOGOS CATALOGOS POR RECIBIDAS POR DISTRIBUIDOS, X x CORREO,r CORREO, Y MILES) (EN MILES) (EN MILES) CIUDAD G H I J 24 16 23 18 18 18 18 35 34 15 15 32 15 15 3 3 11 11 F 15 15 32 25 I 1 10 13 13 2 2 12 7 K K L a. Determine si existe una relación lineal significativa entre estas dos variables (pruebe a un relación lineal significativa entre estas dos variables (pruebe a un Determine si existe nivel de significancia de .05). .05). nivel b. Determine la ilnea de regresión. línea de regresión. Determine ci c. Determine el error estándar de Ia estimación. la d. ¿Qué porcentaje de la varianza de la variable órdenes por correo se explica mediante Ia vaexplica mediante la va()Qué porcentaje de Ia varianza de la variable órdenes riable catálogos distribuidos? e. Pruebe para determinar si el coeficiente de regresión es diferente de cero en forma signifiPruebe determinar si ci coeficicnte de rcgresión es diferente de cativa. (Utilice un nivel de significancia de .01.) nivel de significancia de .01.) cativa. f. Pronostique las órdenes por correo recibidas cuando se distribuyeron 10 000 catálogos. recibidas cuando se distribuyeron 10 000 catálogos. Pronostique explicada para la variable Y. g. Caicule Ia varianza explicada para Ia variable Y. Calcule la En una regresión de inversiones sobre la interés, observaron los resultados que se 8. En una regresión de inversiones sobre Ia tasa de interés, se observaron los resuitados que se muestran en Ia tabla siguiente, para un periodo de 10 afios: la siguiente, un periodo de 10 años: 236 INVERSIÓN TASA PROMEDIO DE INVERSION ANUAL (MILES DE DÓLARES) INTERES (PORCENTAJE) (MILES DE DOLARES) INTERÉS (PORCENTAJE) 1,060 940 920 1,110 1,590 4.8 5.1 5.9 5.1 4.8 Análisis de règresión regresión INVERSION INVERSIÓN ANUAL (MILES DE DOLARES) DÓLARES) (MILES 2,050 2,070 2,030 1,780 1,780 1,420 Capítulo 6 Cap Itulo TASA PROMEDIO DE PROMEDIO INTERES INTERÉS (PORCENTAJE) 3.8 3.7 4.5 4.9 6.2 3. ¿Es significativa Ia relación entre estas variables? la ,Es b. ¿Se puede desarrollar una ecuación de predicción efectiva? efectiva? Se c. j,Podemos pronosticar la inversión anual si la tasa de interés dentro de 5 años es del 4%? c ¿Podemos pronosticar Ia inversion anual si Ia tasa de interés dentro de 5 afios es del 4%? d. Calcule e interprete r2.. interprete r2 e. Exponga la correlación y causalidad de este ejemplo. causalidad de este ejemplo. La ABC Investment Company está en 9. La ABC Investment Company está en el negocio de hacer licitaciones sobre inversiones ofrecidas licitaciones sobre inversiones ofrecidas por diversas conipañIas que desean financiamiento adicional. ABC tabuló su licitación sobre las compañías tabuló su licitación sobre las últimas 25 emisiones aa las que se aplicó licitación, en télminos del porcentaje de licitación de i'iltinias 25 emisiones las que se aplicó licitación, en términos del porcentaje de licitación de nominal. Para estas emisiones, tabuló también Ia licitación como porcentaje de valor valor nominal. Para estas emisiones, tabulO también la licitación como porcentaje de valor nominal, de principal competidor. Ahora, ABC pregw1ta si está empleando el mismo nominal, de su principal competidor. Ahora, ABC se pregunta si está empleando el mismo razonamiento que su competidor en Ia preparación de licitaciones. En otras palabras, ¿se podrIa la preparación de licitaciones. En otras razonamiento que se podría usar la licitación de ABC para pronosticar la de su competidor? De no ser asI, ci competidor pronosticar la de competidor? Dc no así, el competidor usar licitación de ABC debe estar evaluando las emisiones en forma distinta. Los datos se presentan en la siguiente tabia: f0l111a distinta. tabla: EMISIÓN EMISION 1 LICITACIÓN LICITACION DE ABC DEABC LICITACIÓN LICITACION DEL COMPETIDOR 100.104 105.032 99.5 17 99.517 95.808 95.808 98.835 98.835 101.563 101.563 101.237 99.123 94.803 100.063 99.564 103.889 99.348 EMISION EMISIÓN 14 15 16 17 18 19 20 21 22 23 23 24 25 LICITACIÓN LICITACION DE ABC DE 100.542 96.842 99.200 101.614 99.501 100.898 97.001 100.025 100.025 103.014 98.702 101.834 102.903 LICITACION LICITACIÓN DEL DEL COMPETIDOR 99.936 95.834 99.863 102.010 99.432 99.965 96.838 100.804 104.300 99.010 100.936 103.834 1 2 3 4 5 6 7 8 9 10 11 12 13 3. 99.035 104.358 99.435 96.932 98.904 101.635 100.001 98.234 93.849 99.412 99.949 104.012 99.473 ¿Hasta qué grado están ambas compafiIas empleando ci mismo razonarniento en Ia preparaestán ambas compañías enipleando el razonamiento en la ,Hasta ción de sus iicitaciones? sus licitaciones? b. Pronostique la iicitación del competidor, si Ia de ABC cs 101% del valor nominal. Dé ames 101 % del valor nominal. Dé amPronostique Ia licitación del competidor, si la bos un punto c intervalo de predicción bajo Ia suposición de que los datos constituyen Ia e intervalo predicción bajo la suposición de que constituyen la bos totalidad de la población de datos de licitaciones. la de datos de licitaciones. c. De acuerdo con ci apartado b, ¿cuál es Ia posibilidad de ABC de ganar esta iicitación en el apmtado licitación en cuái es la posibilidad de ABC Dc pmticular? (La licitación más baja gana.) gana.) particular? d. Si los datos constituyen una muestra aleatoria de los datos de licitaciones, en vez de la poconstituyen una muestra aleatoria de los datos de licitaciones, en vez de población total, qué serían necesarios en los apartados e? Responda la pregunbiación total, ¿qué cambios serIan necesarios en los apartados b y c? Responda la pregunta del apartado c, suponiendo que los datos corresponden a una muestra aleatoria. e, suponiendo datos corresponden una muestra aleatoria. Cap [tub 6 Capítulo 6 Problemas Probbemas 237 Evalúe las siguientes declaraciones: 10. Evalüe las siguientes declaraciones: a. "Una r2 alta representa una regresión significativa". "Una? alta representa una regresión significativa". "En un problema de regresión, un tamaflo de muestra muy grande siempre producirá resulb. regresión, tamaño de muestra muy grande siempre producirá resultados ütiles". útiles". Company, usted como analista de 11. Ed Bogdanski, propietario de American Precast Company, le contrata a usted como analista de medio tiempo. complacido cuando usted determinó que existe una relación medio tiempo. Ed quedó en extremo complacido cuando usted determinó que existe una relación número permisos de construcción y cantidad de trabajo disponible en su positiva entre el nümero de permisos de construcción y la cantidad de trabajo disponible en su companIa. compañía. Ahora, se pregunta 51 es posible emplear el conocimiento de las tasas de interés sobre se pregunta si CS posible emplear el conocimiento de las tasas sobre primeras hipotecas, para predecir el ni'imero de permisos de construcción que se emitirán cada hipotecas, número de permisos de construcción que emitirán cada mes. Usted reline una muestra aleatoria de nueve meses de datos: reúne muestra aleatoria de nueve meses de datos: PERMISOS DE CONSTRUCCIÓN V CONSTRUCCION Y 786 494 289 892 343 888 509 987 187 MES I 2 3 4 5 5 6 6 7 8 8 9 TASA TASA DE INTERÉS X INTERES x 10.2% 12.6 13.5 9.7 10.8 9.5 10.9 9.2 14.2 Grafique los datos en un diagrama de dispersion. un diagrama de dispersión. Determine la ecuación de regresión de la muestra. la muestra. Determine Pruebe coeficiente de regresión Pruebe el coeficiente de regresión a un nivel de significancia de .05. Al incrementarse la tasa de interés en 1 %, ¿cuál es la disminución promedio en el nümero 1 %, j,cuál es la disminución promedio número Al Ia de permisos de construcciOn? de construcción? e. Calcule el coeficiente de determinación simple. coeficiente de determinación simple. f. Escriba una oración comprensible para Ed, interpretando la r2 calculada en el apartado e. una oración comprensible para Ed, interpretando la r2 en el apartado e. g. Redacte un memorando para Ed explicando los resultados de su análisis. explicando resultados análisis. 12. Considere Ia población de 140 observaciones que se presentan en la tabla siguiente. La Marshall 140 observaciones que presentan en tabla siguiente. La Marshall 12. Considere la la relación entre el niimero de copias producidas mediante Printing Company desea estimar Ia relación entre el número de copias producidas mediante una impresión offset (X) su costo laboral directo asociado (Y). Seleccione una muestra técnica de impresión offset (X) y su costo laboral directo asociado (Y). Seleccione una muestra observaciones. aleatoria de 20 observaciones. a. b. c. d. diagrama de dispersión. Elabore un diagrama de dispersion. coeficiente de correlación la muestra. Calcule el coeficiente de correlaciOn de la muestra. la de la línea de regresión la muestra. Determine Ia ecuación de Ia Ilnea de regresiOn de Ia muestra. Dibuje Ia Ilnea de regresión sobre el diagrama de dispersion. la línea diagrama de dispersión. estándar de la estimación. Calcule el error estándar de Ia estimación. Calcule el coeficiente de determinación de Ia muestra e interprete su valor. determinación la muestra e interprete su valor. Pruebe Ia hipótesis de que Ia pendiente de la línea de regresión que pasa a través de los dalos daPruebe la hipótesis de que la pendiente de Ia lInea de regresión que de la totalidad de la población, tos de la totalidad de Ia poblaciOn, es cero. h. Formule un punto e intervalo de estimación del 90% de confianza para el costo laboral diestimación del costo laboral diFormule un recto, si el proyecto comprende 250 copias. si el proyecto comprende 250 copias. a. b. c. d. e. f. g. 238 Análisis de regresiOn regresión Capítulo CapItuto 6 TABLA PARA EL PROBLEMA 12 PARA EL PROBLEMA 12 üBS. OBS. (1) (2) (3) (4) (5) (6) (7) (8) (9) (lO) (10) (11) (12) (13) (14) (15) (16) (17) (18) (19) (20) (21) (22) (23) (24) (25) (26) (27) (28) (29) (30) (31) (32) (33) (34) (35) (36) (37) (38) (39) (40) (41) (42) (43) (44) (45,) (45J (46) (47) y Y 1.0 0.9 0.8 1.3 0.9 0.6 l.l 1.1 1.0 1.4 1.4 1.2 1.7 0.9 1.2 1.3 0.7 1.0 1.3 1.5 2.0 0.8 0.6 1.8 1.8 1.0 1.0 2.0 0.5 1.5 1.5 1.3 1.3 1.7 1.7 1.2 0.8 1.0 1.8 2.1 1.5 1.5 1.9 1.7 1.7 1.2 1.4 2.1 0.9 1.1 l.l 1.7 2.0 1.6 1.9 1.7 X 10 10 10 20 20 30 30 30 40 40 40 50 50 50 50 60 60 70 70 70 80 80 SO OBS. üBS. y Y 2.2 2.4 1.6 1.8 4.1 2.0 1.5 2.1 2.5 1.7 2.0 2.3 1.8 1.3 1.6 2.8 2.2 2.6 1.4 1.6 1.7 1.5 2.2 2.5 2.4 2.0 2.7 2.0 2.2 2.4 1.8 2.8 2.2 2.4 2.1 1.9 2.4 2.5 2.9 2.0 1.9 2.5 2.6 3.2 3.2 2.8 2.4 2.5 X 180 180 180 180 üBS. OBS. (95) (96) (97) (98) (99) (100) (101) (102) (103) (104) (105) (106) (107) (108) (109) (110) (111) (112) (113) (114) (115) (116) (117) (118) (119) (120) (121) (122) (123) (124) (125) (126) (127) (128) (129) (130) (131) (132) (133) (134) (135) (136) (137) (138) (139) (140) y Y 2.0 2.4 2.2 2.0 2.5 2.8 2.3 2.7 2.8 3.1 2.5 2.9 2.6 3.0 3.2 2.9 2.6 2.5 2.7 3.1 2.4 3.0 3.0 3.4 3.5 3.1 2.9 2.8 3.3 2.5 2.8 2.4 2.6 3.0 3.4 3.0 3.0 3.3 3.4 3.4 3.1 3.1 3.6 3.0 3.0 2.9 3.2 2.6 3.8 3.3 2.9 X 330 340 340 340 20 350 30 350 350 350 360 360 370 370 370 50 380 380 60 390 390 390 400 400 400 400 420 420 420 420 430 430 440 440 450 450 450 460 460 470 470 470 480 480 480 480 490 490 490 500 80 90 100 100 100 100 100 100 110 110 110 110 110 110 110 110 120 120 120 120 130 130 130 130 140 140 150 150 150 150 150 160 160 160 160 160 170 170 170 170 (48) (49) (50) (5I) (51) (52) (53) (54) (55) (56) (57) (58) (59) (60) (61) (62) (63) (64) (65) (66) (67) (68) (69) (70) (71) (72) (73) (74) (75) (76) (77) (78) (79) (80) (81) (82) (83) (84) (85) (86) (87) (88) (89) (90) (91) (92) (93) (94) 180 190 190 190 200 200 200 220 220 220 220 230 230 230 230 230 240 240 240 250 250 250 260 260 260 270 270 270 280 290 290 290 290 290 300 300 300 300 310 310 310 320 320 320 320 Capítulo 6 Cap Itulo Caso de estudio 239 ESTUDIO 6.1 CASO DE ESTUDIO 6.1 TIGER TRANSPORT TIGER compañía de camiones que se dedica a hacer mudanzas locales y a La Tiger transport Company es una compafila de camiones que se dedica a hacer mudanzas locales y a través del pals. Su preocupación actual es el precio que cobra por transportar cargas pequefias a grandes país. preocupación actual es el precio que cobra por transportar cargas pequeñas a grandes distancias. La empresa está satisfecha con sus tarifas para camiones con carga completa; estas tarifas empresa está satisfecha con sus tarifas para camiones con carga completa; estas tarifas se basan en los costos variables de conductor, combustible y mantenimiento, más gastos generales y conductor, mantenimiento, se Sin camión lleva la su carga posible, existe cierto utilidad. Sm embargo, cuando un camión Ileva menos de Ia mitad de su carga posible, existe cierto cuestionamiento sobre requeridos para ilenar camión. cuestionamiento sobre los bienes requeridos para llenar el camión. Para pronosticar las necesidades futuras de combustible y preparar presupuestos a largo plazo, la empresa quisiera determinar el costo futuras plazo, Ia de agregar carga a un camión parcialmente Ileno. a parcialmente lleno. La empresa piensa que el único costo adicional en que se incurre si se agrega carga adicional el ünico costo adicional en que se incurre si se agrega carga adicional combustible adicional, ya que entonces se reducirla el nimero al camión, es el costo de combustible adicional, ya que entonces se reduciría el número de millas vehículo. por galón del vehIculo. Como uno de los factores empleados para determinar las tarifas por cargas uno de los factores empleados para determinar las tarifas pequeflas, la empresa desearla saber el costo del desembolso asociado al costo de combustible por carga combustible por carga pequeñas, la empresa desearía saber el adicional. U sted es un recién graduado en administración que trabaja en el departamento de recién graduado en administración que trabaja en el departamento Usted es contabilidad de costos, y se le asigna el trabajo de investigar este asunto y aconsejar a la alta costos, se le asigna el trabajo de investigar aconsejar alta dirección sobre las consideraciones necesarias para una buena decisión sobre las tarifas. Usted dirección sobre consideraciones necesarias para una buena decision sobre las tarifas. son de hecho son casí idénticos en dimencomienza suponiendo que todos los camiones son iguales, de hecho son casI idénticos en dimensiones, capacidad total de carga y tamaflo del motor. Supone también que todos los conductores carga y tamaño los conductores mismo millaje en un viaje largo. El contador en jefe de empresa obtendrán el mismo millaje en un viaje largo. El contador en jefe de la empresa está de acuerdo con que estas suposiciones son razonables. son razonables. sólo Entonces, solo le queda una variable que pudiera afectar los millas por galón de los camiones en los millas por galón de los camiones en largos recorridos: el peso la carga. Usted encuentra departamento contabilidad tiene largos recorridos: el peso de Ia carga. Usted encuentra que el departamento de contabilidad tiene registros de cada viaje realizado por los camiones de Tiger durante los últimos años. Estos registros registros de viaje realizado los camiones de Tiger durante los ültimos años. Estos registros incluyen el peso total de Ia carga, Ia distancia cubierta y el nuimero de galones de combustible diesel total de la carga, la distancia cubierta y el número de consumidos. La proporción entre estas dos ültimas cifras son las millas por galón del viaje. últimas viaje. Usted selecciona como poblaciOn los viajes realizados en los últimos cuatro años, que ascienden población los viajes realizados en los ñltimos cuatro aflos, que ascienden a 5 428. Después, selecciona 40 nümeros de una tabla de nümeros aleatorios y, ya que los viajes están números números aleatorios y, ya que los viajes están uno tras otro, asigna el número 1 el número 2 al segundo y así sucesivamente. registrados uno tras otro, asigna el nOmero 1 al primero, el niimero 2 al segundo y asI sucesivamente. números Entonces, sus 40 nümeros aleatorios producen una selección aleatoria de 40 viajes por examinar. De producen una selecciOn aleatoria de 40 viajes por examinar. De estos viajes se registran el peso de la carga y las millas por galón, segün se muestra en Ia tabla 6.9. se registran el peso de la carga y las millas por según se muestra en la tabla 6.9. con un paquete de análisis de regresión, usted este Como Tiger tiene una computadora con un paquete de análisis de regresión, usted emplea este ejecutar los datos de la tabla 6.9. El reporte resultante aparece en la tabla 6.10. programa para ejecutar los datos de la tabla 6.9. El reporte resultante aparece en la tabla 6.10. Al estudiar el reporte de la tabla 6.10, usted decide que la muestra de datos produjo una ecuación ci Ia tabla 6.10, usted decide que la muestra de datos produjo una ecuación ütil. Esta conclusiOn se basa en una? relativamente alta (76%), un alto valor de tt(-10.9) Yun alto valor útil. conclusión se basa en una r2 relativaniente alta (76%), un alto valor de (-10.9) y un (119). A partir del reporte, usted formula la ecuación de regresión de F (119). A partir del reporte, usted formula la ecuación de regresiOn y = 8.84833 .06040X Y=8.84833 - .06040X Y y libras. en donde Y se mide en millas por galón y X se mide en miles de libras. la ecuación regresión siguiente La pendiente de Ia ecuación de regresión (-0.6040) se interpreta de la siguiente manera: cada JODO adicionales de carga, reducen el mil/aje de un camión en un promedio de .06040 millas 1000 libras adicionales de carga, reducen el millaje de un camión en un promedio de .06040 millas por galón. por 240 Análisis de regresión Capitulo 6 Capítulo 6 6.9 DATOS DE TIGER TRANSPORT: PESO DE POR VIAJE (MILES TABLA 6.9 DATOS DE TIGER TRANSPORT: PESO DE CARGA POR VIAJE (MILES DE LIBRAS DE LIBRAS Y MILLAS POR GALON GALÓN PESO 60 55 80 72 75 63 48 79 82 72 POR MILLAS POR GALON GALÓN 5.3 5.0 4.0 4.2 4.5 5.1 7.2 3.9 3.8 3.8 4.4 PESO 58 60 74 80 53 61 80 68 76 75 MILLAS POR GALÓN GALON 4.9 5.1 4.5 4.3 5.9 5.5 3.5 4.1 4.5 4.4 PESO 63 65 72 81 64 78 62 83 79 61 MILLAS MILLAS POR GALÓN GALON 5.0 4.9 4.6 4.0 5.3 4.4 4.9 3.8 4.1 4.8 PESO 63 62 77 76 51 74 78 50 79 55 MILLAS POT MILLAS PO R GALON GALÓN 5.0 4.9 4.6 4.5 5.7 4.2 4.3 6.1 4.3 4.7 la empresa aproximadamente por galón de combustible diese1. De ahí, Actualmente Ia enipresa paga aproximadarnente $1.25 por galón de combustible diesel. De ahI, puede usted entonces calcular el costo de transportae por 100 millas, 1000 libras de carga adicional, de millas, 1000 libras de carga adicional, de siguiente: la manera siguiente: la de millas por galón de la tabla 6.10 Promedio de millas por galón de Ia tabla 6. 10 = 4.7 (media de Ia variable 2) 100 millas, Costo de 100 millas, 100(1.25) 100(1.25) 4.7 TABLA 6.10 6.10 = $26.60 = $26.60 SALIDA DEL ANALISIS DE REGRESION PARA TIGER TRANSPORT ANÁLISIS REGRESiÓN TRANSPORT MEAN STANDARD DEVIATION 10.21763 10.21763 VARIABLE NO. NO. 1 CORRELATION X VS Y y X -0.87055 REGRESSION COEFFICIENT -0.06040 STD. ERROR STD. REG. COEF OF REG. COEF 0.00554 COMPUTED T VALUE -10.90562 68.59999 68.59999 DEPENDENT 2 2 4.70499 0.70890 8.84833 0.87055 0.35339 INTERCEPT MULT. CORR MULT. STD. ERR. STD. ERR. R SQUARE R CORR-RSQUARE CORR - RSQUARE 0.75786 0.75786 OF VARIANCE FOR THE REGRESSION ANALYSIS OF VARIANCE FOR THE REGRESSION SOURCES OF VARIATION SOURCES OF TO REGRESSION ATTRIBUTABLE TO REGRESSION DEVIATION FROM REGRESSION TOTAL TOTAL DEGREES OF OF FREEDOM 1 1 38 39 SUM OF SQUARES 14.85315 4.74572 19.59886 MEAN SQUARES 14.85315 0.12489 F VALUE 118.93246 118.93246 Capítulo 6 CapItulo 6 Caso de estudio 241 1000 Costo del mismo viaje con 1000 libras adicionales, 100(1.25) 100(1.25) = $26.94 = $26.94 (4.7 - .06(4) (4.7 - .0604) Por lo que = El costo adicional de transportar 100 millas, 1000 libras adicionales = $0.34. de los costos Ahora, usted piensa que terminó parte de su asignación, es decir, la determinación de los costos de desembolso asociados con el agregar un peso de carga a un camión sin llenar. Por supuesto, usted asociados con el agregar lienar. Por supuesto, usted se da cuenta de que existen otros factores que influyen en la decisión sobre la tarifa para cargas pequeñas. influyen en Ia decision sobre la tarifapara pequenas. TAREA memorando que resuma el análisis, para comentarios Prepare un memorando que resuma el análisis, para la alta dirección de la empresa. Incluya comentarios sobre el grado en que su trabajo mejora los pronósticos de necesidades de combustible e ingresos por camión. CASO DE ESTUDIO 6.2 ESTUDIO 6.2 BUTCHER PRODUCTS, INC. BurCHER PRODUCrS, 'NC. Gene Butcher es el propietario y presidente de Butcher Products, Inc. una pequeña empresa que fabrica pequefia empresa que ductos de fibra de vidrio para instalaciones de cableado eléctrico. Gene ha estado estudiando el número mimero día últimos años y medio de unidades de ductos fabricadas por dia durante los ültimos dos aflos y medio y está preocupado por cifra. Para programar la la amplia variabilidad de esta cifra. Para programar apropiadamente Ia producción, costo e ingresos, Gene necesita establecer una relación entre la producción y alguna otra variable. alguna otra su experiencia en la empresa, Gene no podía encontrar ninguna razón para la Con base en su experiencia en Ia empresa, Gene no podia encontrar ninguna razón para Ia variabilidad de Ia producción, hasta que comenzó a pensar en las condiciones climáticas. Su razonala en las condiciones climáticas. Su razonavanabilidad miento es que la temperatura externa pudiera tener algo que ver con la productividad de su fuerza de pudiera tener algo que ver con la productividad de su fuerza de trabajo y la producción diaria alcanzada. diana Gene selecciona en forma aleatoria varios dias de sus registros y anota el número de unidades de varios dias de sus registros y anota el thmero unidades de ductos producidas para cada uno de estos dias. A continuación acude a la oficina local de clima y, para dias. acude a la oficina local de clima y, para días la cada uno de los dias seleccionados, registra Ia temperatura alta del día. Con ello, está listo para ejecutar dIa. Con ello, está listo para ejecutar un estudio de correlación entre estas dos cifras, cuando se da cuenta de que sería probable que la estudio correlación entre estas dos cifras, cuando se da cuenta de que seria probable que la producción estuviera relacionada con una desviación de la temperatura ideal, en vez de con Ia proestuviera relacionada con una desviación de la temperatura ideal, en vez de con la profrío podrIa pia temperatura. Esto es, piensa que un dIa muy caluroso o muy frIo podría tener un efecto negativo en piensa que un día la un día entonces convertir sus Ia producción al compararlo con un dIa que tuviera la temperatura ideal. Decide entonces convertir sus lecturas de temperatura en desviaciones a partir de 65 grados Fahrenheit, temperatura que él entiende es la ideal para lograr una alta producción. Sus datos son los siguientes; Y representa el nñmero de ideal para lograr una alta producción. Sus datos son los siguientes; Y representa el número de unidades producidas, mientras que X representa la diferencia absoluta (eliminando los signos negativos) Xrepresenta absoluta (eliminando signos negativos) día entre la temperatura alta del dIa y 65 grados Fahrenheit: 242 y Y regresión Análisis de regresión Capítulo Cap itulo 6 x X 12 10 3 4 27 10 18 12 27 20 4 11 1l y Y X 15 15 25 8 8 35 5 5 12 2 2 7 7 17 17 8 8 12 485 512 625 585 318 405 379 497 316 351 525 395 327 308 603 321 426 410 515 515 498 357 429 401 Gene realiza un análisis de regresión utilizando la computadora de la empresa y el paquete de y el paquete de accesar Minitab, teclea las siguientes instrucciones para el programa: cómputo Minitab. Después de accesar Minitab, teclea las siguientes instrucciones para el programa: > SET C1 MTB > SET Cl DATA > 12 10 3 4 27 10 18 12 27 20 4 11 12 10 27 10 18 12 27 20 4 11 2 7 17 DATA > 15 25 8 35 5 12 2 7 17 8 12 15 25 8 35 5 12 DATA > END MTB > SET C2 > SET C2 DATA> 485 512 625 585 318 405 379 497 316 318 405 379 497 316 DATA > 485 512 625 DATA> 351 525 395 327 308 603 321 426 410 327 308 603 321 426 410 DATA > 351 525 DATA> 515 498 357 429 401 401 DATA > 515 498 357 DATA > END MTB > NAME Cl 'TEMP' C2 'UNITS' > C1 'TEMP' C2 'UNITS' 1 PREDICTOR C1 MTB REGRESS C2 MTB > REGRESS C2 ON 1 PREDICTOR Cl The is The regression equation is UNITS = 552 - 8.91 TEMP 552 UNITS Predictor Constant TEMP s 59.41 s = 59.41 Coef 552.04 -8.911 8.911 R-sq Stdev 22.85 1. 453 1.453 64.2% t-ratio 24.16 -6.13 6.13 p p 0.000 0.000 R-sq(adj) R-sq(adj) = 62.5% 62.5% ,Analysis of Variance Analysis SOURCE Regression Error Total DF 1 1 21 22 SS 132758 74109 206866 MS 132758 3529 F F 37.62 p P 0.000 Capítulo 6 Capitulo Caso de estudio 243 Unusual Observations Obs. TEMP UNITS 15 16 8.0 35.0 603.0 321.0 Fit Stdev.Fit 480.8 14.5 240.2 34.0 Residual 122.2 80.8 St.Resid 480.8 2.12R 1.66 X 1.66 X MTB > STOP > STOP Los resultados del análisis de regresión mostrados anteriormente, complacen a Gene. Los valores regresión mostrados anteriormente, complacen Gene. Los valores que indica que ambos valores en Ia ecuación de regresión de la muestra (552 -8.9) t son altos, lo que indica que ambos valores en la ecuación de regresión de la muestra (552 y y 8.9) son significativos: para ambos, el nivel de significancia es cercano a cero, como lo indican los valores p lo indican los valores significativos: ambos, para la prueba t. El valor de F es alto (37.62), asI que se puede emplear la ecuación de regresión de la la t. El valor de F es alto (37.62), así muestra en la población de todos los días de producción. muestra en la población de todos los dias de producción. Gene está en cierto modo decepcionado al encontrar que este valor, Al observar r cuadrada, Gene está en cierto modo decepcionado a! encontrar que este valor, lo aunque es satisfactorio (64.2%), no es tan alto como hubiera esperado. Sin embargo, piensa que es lo suficientemente alto para comenzar a pensar en formas de aumentar los niveles de productividad. productividad. PREGUNTAS l. ¿Cuántas unidades pronosticaría para un día cuando la temperatura alta es de 89 grados 89 grados Cuántas unidades pronosticaria para un dia cuando la temperatura alta es Fahrenheit? 2. ¿Cuántas unidades pronosticaría para un día cuando la temperatura alta es de 41 grados ,Cuántas unidades pronosticaria para un dIa cuando Ia temperatura alta es de 41 grados Fahrenheit? 3. Con base en los resultados del análisis de regresión mostrados con anterioridad ¿qué acción en los resultados del análisis de regresión mostrados con anterioridad qué acción incrementar Ia producción diana? aconsejaría que tomara Gene con el propósito de incrementar la producción diaria? aconsejarla que tomara Gene con propósito ,Piensa usted 4. ¿Piensa usted que Gene desarrolló una herramienta efectiva de pronóstico? herramienta CASO DE ESTUDIO 6.3 6.3 DEPARTAMENTO DE PERSONAL DE ACE DEPARTAMENTO DE PERSONAL DE ACE Ace Manufacturing Company emplea varios miles personas la fabricación de La Ace Manufacturing Company emplea varios miles de personas en Ia fabricación de para el equipo y cables para la industria de las pequeñas computadoras. teclados, gabinetes para el equipo y cables para Ia industria de las pequeflas computadoras. Ace se ha preocupado recientemente la tasa de ausentismo existente El presidente de Ace se ha preocupado recientemente con la tasa de ausentismo existente empleados la compañía pidió al departamento personal que atendierá esta entre los empleados de la compafiia y pidió al departamento de personal que atendiera esta situación. El departamento de personal se da cuenta de que un método efectivo para pronosticar personal se da cuenta de que un método efectivo pam fortalecería gran medida su capacidad para elaborar planes adecuados. el ausentismo fortalecerla en gran medida su capacidad para elaborar planes adecuados. director personal, McGone, intento por dimensionar problema, El director de personal, Bill McGone, en un intento por dimensionar el problema, decide algunos expedientes personal. Decide seleccionar 15 expedientes en decide revisar algunos expedientes del personal. Decide seleccionar 15 expedientes en el número de días de ausencia durante el último año fiscal, junto forma aleatoria y registrar el nümero de dIas de ausencia durante el ültimo afio fiscal, junto con la edad del empleado. Después artículo relacionado con personal en una con Ia edad del empleado. Después de leer un artIculo relacionado con personal en una que la efecto significativo en el ausentismo. revista reciente, él piensa que Ia edad puede tener un efecto significativo en el ausentismo. encuentra que edad y los días de ausencia muestran una buena correlacióh su Si encuentra que la edad y los dIas de ausencia muestran una buena correlación en su pequeña muestra, pretende tomar una muestra de 200 300 expedientes y formular una pequeña muestra, pretende tomar una muestra de 200 a 300 expedientes y formular una buena ecuación de predicción. predicción. A continuación se presentan los datos reunidos en Ia muestra inicial. El niimero de continuación presentan datos reunidos la inicial. número que X es la días de ausencia durante el ñltimo afio fiscal está representado por Y, mientras que X es la ausencia durante el último año fiscal está representado por Y, dias edad del empleado. empleado. 244 y Y 3 3 regresión Análisis de regresion X Capítulo 6 CapItulo 6 x y Y 9 9 12 X 4 4 25 36 41 7 7 4 4 8 8 5 5 3 3 3 5 5 7 7 27 35 6 6 31 31 35 41 41 2 2 2 2 56 60 51 33 37 31 31 29 PREGUNTAS PREGUNTA S Que tan bien se correlacionan los dias de ausencia y edad? ¿Se puede generalizar esta 1. ¿Qué tan bien se correlacionan los días de ausencia y la edad? ,Se puede generalizar esta correlación a toda la fuerza de trabajo? correlación a ,Cuá1 es la ecuación de pronóstico 2. ¿Cuál es la ecuación de pronóstico para los dIas de ausencia, utilizando la edad como Ia variable días la edad como la variable de predicción? 3. ¿Qué porcentaje de la variabilidaden los días de ausencia se puede explicar a través del Que porcentaje de la variabilidad en los dias de ausencia se puede explicar través del la conocimiento de Ia edad? conocimiento 4. ¿Qué tan bien ha resultado la ecuación de predicción? Al responder esta pregunta, utilice los bien ha resultado la ecuación de predicción? Al responder esta pregunta, utilice los ,Que procedimientos estadísticos para respaldar su respuesta. procedirnientos estadisticos apropiados para respaldar su respuesta. 5. Suponga que una persona recién contratada tiene 24 años de edad ¿cuántos días de ausencia le Suponga que una persona recién contratada tiene 24 aflos de edad ,cuántos dias de ausencia le el año fiscal? pronostica durante el año fiscal? Deberá Bill McGone proceder a tomar una muestra grande de enipleados de la compañIa con 6. ¿Deberá Bill McGone proceder a tomar una muestra grande de empleados de la compañía con en los resultados preliminares de la muestra? base en los resultados prelirninares de Ia muestra? 7. ¿Se desarrolló un método efectivo de pronóstico? de pronóstico? ,Se desarrolló CASO DE ESTUDIO 6.4 6.4 MR TUX MRTUX John Mosby ha oIdo que el análisis de regresión se utiliza a menudo para pronosticar series de tiempo oído pronosticar series de tiempo de variables y, como tiene una computadora personal con un paquete de cómputo de regresión, decide corno una intentarlo. Su variable dependiente serán sus volñnienes de ventas mensuales, los datos se presentaron volúmenes al final del cap. 2. Como primer intento, John decide usar el ni'irnero de periodo como la variable de predicción, o decide usar el número o X X. El primer valor de ventas y de su serie, $16 850, tendrá un valor x de 01, el segundo tendrá un valor y de su serie, $16 850, tendrá un valor x de 01, el segundo tendrá un valor de 02 y asI sucesivamente. Su razonarniento es que la tendencia creciente que él sabe que existe en sus así sucesivaniente. razonamiento sabe que existe en sus ventas se contabilizará niediante un valor siempre en aumento de X para explicar sus datos de ventas. en aumento de Xpara mediante Después de Después de realizar el análisis de regresión en su computadora, Joim registra los siguientes análisis de regresión en su computadora, Jolm registra los siguientes valores: t = t 8.877 8.877 = r-cuadrada = .49 = 78.81 F = 78.81 Y = 19,092 + 2,861.57X + 2,861.57X = Capítulo 6 CapItulo Caso de estudio 245 El alto valor de t le indica a John que Ia línea pendiente de su regresión de la muestra (2 861.57) la lInea pendiente de 861.57) es significativa; es decir, rechaza la hipótesis nula de que la pendiente en la población es cero. El alto le permite rechazar la hipótesis la significativa concluye que valor de F le permite rechazar Ia hipótesis nula de que la regresión no es significativa y concluye que cuadrada de la población es significativo. el valor de r cuadrada de la población es significativo. El John está decepcionado con ci valor de r cuadrada de la muestra (49%). Él esperaba un valor más el cuadrada alto de modo que pudiera usar su ecuación de regresión simple para pronosticar con precision sus ventas. pudiera pronosticar con precisión sus ventas. Se da cuenta de que este valor bajo puede deberse a la estacionalidad de sus ventas mensuales, un hecho cuenta bajo puede deberse la estacionalidad de sus ventas mensuales, que él conocIa antes de comenzar sus esfuerzos de pronóstico. Diferencias estacionales considerables pronóstico. conocía darían por resultado puntos de datos mensuales que no se agruparán airededor dat-Ianpor resultado puntos de datos mensuales que no se agruparán alrededor de la línea de regresión, Ilnea cuadrada no satisfactorio. así asI como un valor de r cuadrada no satisfactono. Hay otro aspecto en los resultados de su regresiOn que le molesta. En la impresiOn aparece la resultados de su regresión que impresión aparece 1.00228. Como no entiende esta información, llama a su profesor de declaración: Durbin-Watsom = 1.00228. Como no entiende esta información, llama a su profesor de estadística de la universidad. Después describirle los valores impresión de estadIstica de Ia universidad. Después de describirle los valores de la impresiOn de su regresión, el le que impartir el en la estadística profesor ie dice: "Tengo que impartir una clase en este momento, pero ci valor bajo en Ia estadIstica Durbin-Watson significa que violaste una de las suposiciones del análisis de regresión". DurbinWatson significa que violaste una de las suposiciones del análisis de regresiOn". TAREA l. Haga un comentario sobre la creencia de John de que sus ventas mensuales son altamente Haga comentario sobre creencia de de que sus ventas mensuales son altamente estacionales valor de cuadrada. estacionales y el "bajo" valor de rr cuadrada. 2. ¿Cuál es su opinion con respecto a lo adecuado dci método de pronóstico de John? lo adecuado del método pronóstico de John? ,Cuál es opinión las suposiciones regresión? 3. ¿Cómo fue que John violó una de las suposiciones del análisis de regresión? ,Cómo fue CASO DE ESTUDIO 6.5 6.5 CONSUMER CREDIT COUNSELING CREDIT La operación de Consumer Credit Counseling (CCC), se describió en los caps. 1 (caso de estudio 1.2) (CCC), se describió en los caps. i (caso de estudio 1.2) estudio 3.4). y 3 (caso de estudio 3.4). El director ejecutivo, Mary Harnishfeger, llegO a la conclusión de que la variable más importante Marv Hamishfeger, llegó a la conclusion de que CCC requeria pronosticar era el número de clientes por atender en el resto de 1993. Mary 1993. Marv CCC requería pronosticar era ci nñmero de clientes por atender en el resto proporcionó a Dorothy Mercer los datos mensuales del número de clientes atendidos por CCC para el mensuales del nñmero de clientes atendidos por CCC para el 1985 marzo de 1993 (véase estudio el Caso de estudio 4.3, periodo de enero de 1985 a marzo de 1993 (véase Caso de estudio 4.3). En el Caso de estudio 4.3, utilizó el de correlación el patrón En el Caso de estudio Dorothy utiiizó ci análisis de correlación para explorar ci patron de datos. En ci Caso de estudio modelos de promedios móviles y atenuación exponencial el resto de 5.3, utilizó los modelos de promedios móviles y atenuación exponencia! para pronosticar el resto de 1993. 1993 Dorothy se preguntó si el análisis de regresión se podría emplear para desarrollar un buen modelo podrIa emplear para desarrollar buen pronóstico. Le preguntó Marv si se le ocurrían algunas variables usar como pronóstico de pronOstico. Le preguntó a Mary si SC Ic ocurrIan algunas variables para usar como pronóstico potencial. Mat-v pensó que el número de personas que rei'men cupones de descuento pudiera estar reúnen cupones de descuento pudiera potencial. Marv pensó que el nümero de personas el número relacionado con ci nOmero de clientes atendidos. sólo encontrar datos sobre personas que reúnen cupones de descuento, Dorothy solo pudo encontrar datos sobre personas que reuinen cupones de descuento, para el periodo de enero de 1989 a diciembre de 1992: 1989 a 1992: 246 1989: 1990: 1991: 1991: Análisis de regresion Anáisis de regresión 24,450 25,163 26,784 28,161 29,254 30,863 32,383 33,556 24,761 25,184 27,044 27,044 27,936 27,936 29,962 31,288 32,625 33,751 25,397 25,417 27,567 28,423 30,499 31,492 33,499 33,777 Capítulo 6 Cap Itulo 1992: 25,617 25,411 28,080 28,366 30,879 31,577 34,076 33,769 25,283 25,565 28,142 29,029 30,995 31,912 34,191 34,077 25,242 26,543 28,412 29,035 31,356 32,050 33,788 34,232 28,080 Marv también tenla conocimiento de un Indice de actividad empresarial, calculado para el índice actividad empresarial, calculado para Mary también tenía conocimiento de índice condado por el Economic Development Council. Este Indice de actividad empresarial fue un indicador actividad empresarial fue un indicador los cambios relativos las condiciones los negocios la región. Los datos de este de los cambios relativos en las condiciones globales de los negocios de la region. Los datos de este índice son: Indice 1985: 1986: 1987: 1988: 1989: 1990: 1991: 1992: 1993: 110 102 108 104 107 103 114 122 125 108 105 105 109 106 106 116 118 125 105 106 105 109 109 110 118 123 130 104 107 108 103 105 108 119 118 104 105 104 104 103 104 110 110 118 118 102 106 108 104 103 105 120 120 103 105 105 105 105 99 103 103 105 105 120 120 122 122 101 105 105 102 106 106110 121 120123 102 103107 103 101 103 105 105 107 119 122 102104 105 105 105 101 106 107 121 123 123 99 103 104 102 107 111 119 124 99 101 104 102 99 112 120 122 1 TAREA l. Determine si hay una relación significativa entre el nñrnero de nuevos clientes atendidos y ci Determine si relación significativa entre número de nuevos clientes atendidos el nümero de personas que reinen cupones de descuento yb ci Indice de actividad empresarial. No número personas que reúnen cupones de descuento y/o el índice No las posibles transfonnaciones de datos. olvide las posibles transformaciones de datos. 2. Desarroile una ecuación de regresión y utilIcela para pronosticar el niirnero de nuevos clientes Desarrolle tilla ecuación de regresión y utilícela para pronosticar el número de nuevos clientes atendidos para los tres primeros meses de 1993. 1993. atendidos 3. Compare los resultados de su pronóstico con las observaciones reales de los tres primeros meses observaciones reales de los tres primeros meses -de 1993. de 1993. 4. ¿Sería el índice de actividad empresarial un buen pronóstico del número de nuevos clientes? ,SerIa ci indice de actividad enipresarial un buen pronóstico del niimero de nuevos clientes? 5. Suponga que desarrolió una buena ecuación de regresión. j,Podria emplearia para pronosticar el desarrolló regresión. ¿Podría emplearla Suponga resto de 1993? Explique su respuesta. 1993? Explique su respuesta. VERSION ESTUDIANTIL DE fORECAST VERSIÓN ESTUDIANTIL DE FORECAST PLUS Se accesa ci paquete de pronósticos mediante Ia selección de Ia opciôn 3 del menu principal. el mediante la selección de la opción 3 del menú principal. Si está usted utilizando discos (no en tin sistema de disco duro), ci prograrna le solicitará utilizando discos un disco duro), el programa le solicitará Si inse11e el disco del sistema principal, por medio del mensaje: que inserte el disco del sistema principal, por medio del mensaje: Insert in default drive Insert MAIN SYSTEM DISK in default drive Press <ENTER> ready Press <ENTER> when ready 247 NUMBER OF CLIENTS-LEAST SQUARES REGRESSION TREND ANALYSIS NUMBER OF CLIENTS-LEAST SQUARES REGRESSION TREND ANALYSIS RESIDUAL AUTOCORRELATION FUNCTION FUNCTION 90 Observations in the Residual Series the Series 90 Observations Mean of the Residual Series = 0 Residual Series = O Standard Deviation of the Residual Series = 24.2935 Series 24.2935 Standard Deviation of the Lag 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 11 12 13 14 15 16 17 17 18 19 20 21 21 22 23 24 25 26 27 28 29 29 30 31 32 33 Value 0.22 0 22 0.12 -0.00 0.01 -0.06 -O .10 -0.10 -0.07 -0.05 -O .12 -0.12 -0.07 0.03 0.27 0.07 0.10 -0.11 -0.08 0.06 -0.23 -0 23 -0.12 -0.07 0.03 -O .12 -0.12 0.05 0.27 0.02 0.00 -0.08 -0.08 0.03 -0.36 -0 36 -0.14 -0.25 -0.08 T-Value -1.0 ----- 0.0 -- +1.0 _o 2.23 23 1. 13 1.13 -0.00 -0.06 -0.52 -0.90 -0.65 -0.50 -1.12 -0.61 0.28 2.47 0.60 0.83 -0.95 -0.69 0.47 -1.87 -1 87 -1.00 -0.53 0.25 -0.96 0.36 2.13 0.16 0.03 -0.64 -0.60 0.23 -2.70 -2 70 -0.99 -1.74 -1.74 -0.52 2 [ :****]* : : ·*** ] I ] ] *. *. ] -0.52 **: **. ] **: **. ] *:. * ] ***: ***. ] -1.12 **:. ** ·* :*****]* .***** * ·** ·** ***: *** . -0.95 **:. ** ·* [*****. *****. ***. -1.00 **:. ** -0.53 ·* [ [ [ [ [ [ [ : [ [ [ [ [ [ [ : 2.47 [ : ] [ [ [ : 0.25 : [ *** . : -0.96 : [ : [ : [ : ·* .***** * :*****]* ·* : [ : : [ : [ **:. ** **:. ** : : : .- : :* ·* **[******. ******. ****: ****. ******. [****** **: **. [ [ 0.23 [ - - - - -- - - - - - - -- - - - - - - - - -- - - - - - - - - - - - - - - -- - - - - - -- -- [ ] = Estimated Two-Standard Error Limits Two-Standard Error Limits Box-Pieree Chi-Square Statistie with 33 Degrees of Freedom = 60.9 Box-Pierce Chi-Square Statistic with 33 Degrees of Freedom Probability = .002 OF CLIENTS-LEAST SQUARES REGRESSION TREND ANALYSIS NUMBER OF CLIENTS-LEAST SQUARES REGRESSION TREND ANALYSIS SUMMARY STATISTICS STATISTICS of the Original Data = 122.15 Mean of the Original Data = 122.15 Standard Deviation of the Original Data = 30.043 Data = 30.043 Standard of the Residuals = O Mean of the Residuals = 0 Standard Deviation of the Residuals = 24.294 = 24.294 Standard Mean Absolute Mean Absolute % % Error 16.7797 Mean Mean % Error -4.1396 Mean Square Square Error ErLor 584.2 % Error REGRESSION STATISTICS REGRESSION R-Squared: F Statistic: Statistie: 0.3461 51. 35 51.35 DF OF = l. 1, 97 Coeffieient Coefficient Intereept Intercept Slope Estd Std Error Estd Std 4.9457 0.0859 T-Value 18.48 7.17 91.3834 0.6154 Figura 6.9 Análisis de regresión de tendencia para el Caso de estudio 6.5. Figura 6.9 Análisis de regresión de tendencia para el Caso de estudio 6.5. 248 Análisis de regresión Capítulo 6 Cap Itulo En este panto, usted necesita sustituir el Data Management Disk por ci Main System Disk. punto, Management el System Disk. Presione <Enter> y el programa le solicitará el nombre del archivo: archivo: Presione <Enter> y is the name of the data file? What is the name of the data file? CREDIT El menu le perrnite elegir entre 13 diferentes técnicas de pronóstico. Una muestra de esta menú pennite 13 técnicas pronóstico. pantalla se presentó en la sección de Forecast Plus del cap. 5. sección Forecast Plus del cap. 5. utilizar como variable de predicción el número de personas que reúnen Para poder utilizar como variable de predicción el rnimero de personas que rei'lnen cupones de descuento o ci Indice de actividad, y el nümero de clientes atendidos como la actividad, número clientes cupones de descuento el índice variable independiente, tendríamos que utilizar el programa de regresión múltiple (véase variable independiente, tendrIamos que utilizar el programa de regresión multiple (véase cap. 7). En vez de ello, probaremos el programa de análisis de regresión de tendencia, cap. 7). En vez de ello, probaremos ci programa de análisis de regresión de tendencia, opción 10, el cual utiliza el periodo como variable de predicción. La pantalla muestra lo opción 10, ci cual utiliza el periodo como variable de predicción. La pantaila muestra lo siguiente: Regression Trend Analysis Regression Least Squares (1) Squares (1) or Robust (2) : Robust (2): Length of pre-analysis smoothing: smoothing: Power Transformation: [A=Automatic (least squares only). l=reciprocal. [AAutomatic (least squares only), 1=reciprocai, 2=1 I Sqrt. 31/(4th root), bLog, 5=1/4th root, 21/Sqrt, 3=1 I (4th root). 4=Log, 5=1 14th root. 6=Sqrt. 7S curve, 8none] 6Sqrt, 7=S curve, 8=none] 8 8 of forecasts Number of forecasts 1 Time plot of original data, forecasts, and error: original data. forecasts. and error: autocorrelation function: Residual autocorrelation function: Table of original data, forecasts, and error: of original data. forecasts. and error: Summary statistics: statistics: Press Press ENTER to accept: to accept: Y y Y N N y Y Para ejecutar este análisis de regresión de tendencia, podemos utilizar las opciones análisis de regresión de tendencia, podemos utilizar las opciones correspondiente respuesta por omisión que ya están dadas. La fig. 6.9 muestra la salida correspondiente a la respuesta dadas. fig. Yen la función de autocorrelación de residuos y en las estadIsticas de resumen, y N en el estadísticas en el Y en la función de autocorrelación de residuos y resto de las opciones. las opciones. último, ci programa le preguntará si desea almacenar los pronósticos de los Por uiltimo, el programa le preguntará si desea almacenar los pronósticos de los residuos: Do you want to save the forecasts of residuals (y/n)? to save the forecasts of residuals (y/n)? Pronóstico PronOstico mediante hojas de cálculo Al: 249 MEMU X-Range Y-Range Output-Range Intercept Reset Go Quit Specify independent variables (X range) independent variables (X range) A B D C A BCD E F G F G 1 1 Y X Y X 2 2 3 3 10 1.3 Regression Output: Output: 4 4 6 6 2 2 Constant 32.13592 5 5 5 1.7 5 Std Err Std Err of Y Est Y 2.725453 6 6 12 1.5 R Squared Squared 0.745613 7 7 10 1.6 No. Observations No. of Observations 10 10 8 8 15 1.2 Degrees of Freedom 8 9 9 5 5 1.6 10 10 12 12 1.4 X Coefficient(s) -14.5388 Coefficient(s) 14.5388 11 11 17 1 17 1 of Coef. 3.002445 Std Err of Coef. 3.002445 12 12 20 1.1 1.1 13 13 14 14 15 16 17 18 19 20 03-Jan-94 06:02 PM 03-Jan-94 06:02 PM H H NUM Figura 6.10 Análisis de regresión utilizando Lotus, para el ejemplo del Sr. Bump. Figura 6.10 Análisis de regresión utilizando Lotus, para el ejemplo del Sr. Bump. PRONÓSTICO MEDIANTE HOJAS DE CÁLCULO PRONOSTICO MEDIANTE HOJAS DE CALCULO El problema. En los ejemplos 6.1 6.8, se utilizó análisis de regresión para El problema. En los ejemplos 6.1 alal 6.8, se utilizóelelanálisis de regresión para detenninar si se podria emplear el precio de yenta para pronosticar las ventas semanales de podría venta para pronosticar las ventas semanales de determinar galones de leche (tabla 6.1), para el ejemplo del Sr. Bwnp. Para este pronóstico, se puede (tabla 6.1), para el ejemplo del Sr. Bump. Para este pronóstico, se puede galones usar Lotus 1-2-3 (version 2.3). usar Lotus 1-2-3 (versión 2.3). La solución mediante ho¡a de cálculo La solución mediante hoja de cálculo 1. Se captura la variable Y, ventas sernanales en las celdas A3 aala A 12, y la variable X, la variable Y, semanales las celdas A3 la A 12, Y la variable ~ precio de yenta, en las celdas B3 a la B12 de la hoja de cálculo (véase fig. 6.10). venta, las B 12 2. Escribir /DATA REGRESSION o IDR, lo que equivale a seleccionar DATA FILE del IDA TA REGRESSION o IDR, a seleccionar DATA FILE del menú menu principal y REGRESSION en el submenú. El menú de regresión (véase fig. 6.10) submenü. menu de regresión fig. 6.10) muestra lo rnuestra Jo siguiente: X-Range Y-Range Output-Range Intercept Reset Co Quit Intereept Reset Go Quit selecciona XRange y la pantalla solicita el rango de las X: Se selecciona X-Range y la pantalla solicita ci rango de las X: 250 Análisis de regresión Capítulo 6 CapItulo Enter independent variables, or X range: B3. . B12 variables. or X range: B3 . Bl2 . Usted puede elegir escribir Usted puede elegir entre escribir B3 ... B 12 o definir la variableXresaltando dicho rango. . variable Xresaltando Y-Range, el programa solicita el rango de las Y: Al seleccionar YRange, ci programa solicita el rango de las Y: dependent variables. or range: A3 . A12 Enter dependent variables, or Y Yrange: A3. ..Al2 Y, se selecciona OutputRange y en la pantalla se pide el Una vez definido el rango de Y,se selecciona Output-Range y en la pantalla se pide el rango donde se ubicarán los resultados: Enter output range: output range: D3....G11 D3 GII ejecutar la regresión. La salida se Después de indicar este rango, seleccione GO para ejecutar la regresión. La salida se la muestra en Ia fig. 6.10. 3. Para guardar la hoja de cálculo para uso futuro, escriba /FILE SAVE o IFS. Lotus le /FS. Lotus le Para guardar la hoja de cálculo para uso futuro, escriba solicitará el nombre del archivo a guardar: Enter name of file to save: of file to save: A:\*.WK1 A:\*.WK1 Asegúrese de que el directorio es el correcto AsegIirese de que el directOlio es el correcto y escriba BUMP. El programa borrará el BUMP. prograrna el asterisco, el punto y la extensión, pero no el directorio por omisión. Oprima <Enter> y extension, omisión. Lotus guardará autornãticarnente su archivo con Ia extension .\VK1. automáticamente con la extensión .WK1. PAQUETE DE CÓMPUTO MINITAB PAQUETE DE COMPUTO MINITAB El problema. quería El problema. En los problemas 6.1 y 6.2, el Sr. Bump querIa utilizar una ecuación problernas 6.1 pronosticar ventas de leche. de regresión para pronosticar ventas de leche. La solución Minitab La solución Mnitab > MTB > DATA> DATA > MTB > MTB > DATA> DATA > MTB > MTB > MTB > SET Cl SET C1 12 17 20 10 6 5 12 10 15 5 12 17 20 END C2 SET C2 1.70 1.50 1.60 1.20 1.60 1.40 1.00 1.10 1.30 2.00 1.70 1.50 1.60 1.20 1.60 1.40 1.00 1.10 END NAME Cl 'SALES C2 'PRICE' C1 'SALES' 'PRICE' PLOT Cl VS C2 C1 C2 Paquete de cómputo Minitab 20.0+ 251 SALES 15.0+ * * 10.0+ 10.0+ * 5.0+ 5 . 0+ * + + - - - -+- - - - - - - - -+- - - - - - - - -+- - - - - - - - -+- - - - - - - - -+- - - - - - - - -+- - PRICE + + +--PRICE 2.00 1.00 1.20 1.40 1.60 1.80 MTB > CORR C1-C2 > C1-C2 Correlation of SALES and PRICE = -0.863 PRICE MTB > BRIEF 3 > 3 MTB > REGRESS Cl 1 PREDICTOR C2; > C1 1 C2; > PREDICT 1.63. SUBC > PREDICT 1.63. The regression equation is The SALES = 32.1 - 14.5 PRICE 32.1 - 14.5 SALES Predictor Predictor Constant PRICE s S Coef 32.136 -14.539 R-sq Stdev 4.409 3.002 76.6% t-ratio 7.29 -4.84 P P 0.000 0.000 = 2.725 R-sq(adj) 71.4% R-sq(adj) = 71.4% of Analysis of Variance SOURCE SOURCE Regression Error Total Obs. 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 C1 Cl C2 10.000 1.30 1. 30 6.000 2.00 5.000 1. 70 1.70 12.000 1.50 1. 50 10.000 1. 60 1.60 15.000 1. 20 1.20 5.000 1. 60 1.60 12.000 1. 40 1.40 17.000 1. 00 1.00 1. 10 20.000 1.10 Fit Stdev.Fit Fit 1.034 8.438 DF 1 1 8 8 9 9 SS 174.18 59.42 59.42 233.60 MS 174.18 7.43 F 23.45 P P 0.000 St.Resid Fit Fit Stdev.Fit Residual -1.27 -3.235 0.959 13.235 1. 50 2.942 1.50 1.889 3.058 -0.98 -2.420 -0.98 1.163 7.420 0.65 1.672 0.880 10.328 0.44 1.126 1.126 8.874 0.987 0.13 0.311 1.123 14.689 -3.874 -1.52 0.987 8.874 0.08 0.218 0.870 11 .782 11.782 -0.27 -0.597 17.597 1.577 1.62 1. 62 1.336 3.857 16.143 95% P.1. P.I. C.I. 95% C.I. 1,714, 15.161) 1,714, 15,161) 6.054, 10.822) 6.054, 10.822) ( ( 252 Análisis de regresión Cap itulo Capítulo 6 Cl y los datos de precio • Los comandos SET se usan para capturar los datos de ventas en C 1y los datos de precio en C2. enC2. • El comando NAME se emplea para asignar nombres a las variables en cada columna. desarrollar un diagrama de dispersion con Cl • El comando PLOT se utiliza para desarrollar un diagrama de dispersión con Cl sobre el eje de las Yy C2 sobre el eje de las X. Y y C2 sobre el eje de las X • El comando CORP. se usa para calcular el coeficiente de correlación entre Cl y C2. CORR se usa para y C2. el coeficiente de • El comando BRIEF 3 se emplea para obtener una salida que incluya una tabla de comando BRIEF se emplea para obtener una salida que incluya una tabla de residuos. • El comando REGRESS se utiliza para desarrollar un análisis de regresión con las ventas como la variable dependiente (Y) y el precio como Ia variable independiente (X). (Y) la variable independiente (X). corno Ia • El subcornando PREDICT se usa para calcular un intervalo de confianza del 95%, en subcomando PREDICT se usa para calcular un intervalo de confianza del 95%, en este caso para un valor de x de 11.63. para un valor de x de .63. PAQUETE DE CÓMPUTO SAS PAQUETE DE COMPUTO Problema. En los ejemplos 6.1 y 6.2, el Sr. Bump desea emplear la correlación y 6.1 el Sr. Bump desea emplear la correlación y predecir ventas la regresión para deterrninar si puede usar el precio de la leche para predecir las ventas regresión detenninar si puede usar el precio de leche semanales. Solución SAS SAS $ SAs/cc=PRINT SAS/CCPRINT OPTIONS PAGESIZE=60 LINESIZE8O; OPTIONS PAGESIZE6O LINESIZE=80; TITLE 'REGRESSION ANALYSIS FOR EXAMPLES 6.1 & 6 2 "REGRESSION FOR EXAMPLES 6.1 & 6.2"; DATA BUMP; BUMP; y X; INPUT Y X; CARDS; 10 10 1.30 6 2.00 6 1.7 O 5 1.70 12 1.50 12 10 1.60 10 15 15 1.20 5 1.60 5 12 1.40 12 1. 40 17 1.00 17 1. 00 1.10 20 1.10 PROC PRINT; PRINT; CORR; PROC CORR; REG; PROC REG; MODEL YX; MODEL Y=X; ENDSAS; Paquete de cOmputo SAS cómputo 253 REGRESSION ANALYSIS FOR EXAMPLES 6.1 & 6.2 REGRESSION ANALYSIS 6.1 & 6.2 OBS GB S 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 y Y X X 1.3 2.0 1.7 1.7 1.5 1.6 1.2 1.6 1.6 1.4 1.0 1.1 10 10 6 6 5 5 12 12 10 10 15 '5 5 5 12 12 17 17 20 Correlation Analysis Simple Statistics Simple Variable N N Mean 11 . 20000 11.20000 1.44000 Std Dev Std 0ev Sum 112.00000 14.40000 Minimum 5.00000 5 . 00000 1.00000 1 . 00000 Maximum 20,00000 20 , 00000 2.00000 2 . 00000 10 10 10 10 5.09466 0.30258 y Y Coefficients / > :R: under Ho: RhoO N = 10 Pearson Correlation Coefficients I Prob > :R: under Ho: Rho=O / N = 10 X X y Y X 1.00000 1 .00000 0.0 -0.86349 0.0013 0.0013 -0.86349 -0 . 86349 0.0013 1.00000 1 .00000 0.0 Model: MODEL1 Model: Variable: Y Dependent Variable: Y of Analysis of Variance of Sum of Squares 174.17524 174.17524 59.42476 233.60000 2.72545 11.20000 24.33440 Source DF 1 1 8 8 9 9 Mean Square 174.17524 7.42809 F Value 23.448 Prob>F 0.0013 Model Error C Total Root MSE Dep Dep Mean C.V. R-square Adj R-sq Adj 0.7456 0.7138 Parameter Estimates Variable DF OF 1 1 Parameter Estimate 32.135922 -14.538835 Standard Error T for HO: HO: Parameter=O Parameter0 7.289 7 .289 Prob > :T: > :T: 0.0001 0 . 0001 0.0013 INTERCEP X 4.40858773 3.00244533 -4.842 Figura 6.11 Figura 6.11 Salida de SAS para los ejemplos 6.1 y 6.2. ejemplos 6.1 Salida de SAS 254 Análisis de regresiOn regresión Capítulo 6 Cap Itulo 6 • La declaración TITLE da nombre a! prograrna SAS. TITLE da nombre al programa SAS. • La declaración DATA asigna un nombre de archivo a los datos. • La declaración INPUT nombra y especifica el orden de los dos campos de datos Y y X. INPUT nombra y especifica el orden de los dos campos de datos Y y X • La declaración CARDS indica que las 10 siguientes imneasson imágenes de tarjetas que declaración CARDS indica que las 10 siguientes líneas son imágenes de tarjetas que de venta. representan el volumen semanal de ventas de galones de leche y el precio de yenta. • El comando PROC PRINT instruye a SAS para que enhiste los datos. PROC PRINT instruye a SAS para que enliste los datos. • El cornando PROC CORR indica que se desea una matriz de correlación. comando • Los subcomandos PROC REG y MODEL indican que X y Y son las variables de la subcomandos PROC REG indican X Y son las variables de Y variable dependiente y X regresión, siendo Y la variable dependiente y X la variable independiente. cómputo ejecución de SAS muestra fig. La salida de córnputo de esta ejecución de SAS se muestra en la fig. 6.11. BIBLIOGRAFíA BIBLIOGRAFIA DRAPER, N. Y SMITH, H., Applied Regression Analysis. Nueva York: John Wiley & Sons, DRAPER, N. ySMITH, R, Applied Regression Analysis. Nueva York: Jolm Wiley & Sons, 1966. KLEINBAUM, D.D. y KUPPER, K., Applied Regression Analysis and OtherMultivariable Methods. North KLEINBAUM, y KUPPER, K., Applied Regression Analysis and Other Multi variable Methods. Scituate, Mass.: Duxbury Press, 1978. 1978. NETER, J., WASSERMAN,W. y KUTNER, M. AppliedLinear Regression Models, Hornewood, Ill.: Richard NETER,J., WASSERMAN,W. y KUTNER, M. Applied Linear Regression Models, Homewood, Ill.: Richard D. Irwin, Inc. 1983. CAPíTULO CAPITULO Regresión múltiple Regresión mUltiple 7 ACTIVIDADES ACT! VIDADES En la regresiôn simple, se investiga la relación entre las variables independiente y En la regresión simple, se investiga la relación entre las variables independiente y dependiente. A menudo, La relación entre dos variables pennite a una persona predecir con la relaciôn entre dos variables perrnite a una persona dependiente. precisión la variable dependiente a partir del conocimiento la Por precision la variable dependiente a partir del conocirniento de Ia variable independiente. Por desgracia, muchas situaciones son tan simples. Por lo regular, se desgracia, muchas de las situaciones de la vida real no son tan simples. Por lo regular, se necesita más de una variable independiente pronosticar precisión variable necesita más de una variable independiente para pronosticar con precision la variable dependiente. Cuando se emplea más de una variable independiente o de predicción, el dependiente. Cuando se emplea más de una variable independiente o de predicción, convierte en uno para el análisis de regresión múltiple. Los conceptos básicos problema se convierte en uno para el análisis de regresión multiple. Los conceptos básicos siguen siendo los mismos, solo que se utiliza más de una variable independiente para siguen siendo los mismos, sólo que se utiliza más de una variable independiente para la variable dependiente. pronosticar la variable dependiente. variable independiente regresión ,niitiple comprende el uso La regresión múltiple comprende el uso de más de una variable independiente pronosticar una variable dependiente. para pronosticar una variable dependiente. VARIABLES DE PREDICCIÓN VARIABLES DE PREDICCIÔN ejemplo, regresemos al problema en el ventas de Como ejemplo, regresemos al problema en el que se pronostica el volumen de ventas de galones partir del conocimiento del precio galón. Sr. Bump se enfrenta galones de leche a partir del conocimiento del precio por galón. El Sr. Bump se enfrenta problema fonnular pronóstico que del todo preciso. Él puede explicar con el problema de formular un pronóstico que no es del todo preciso. El puede explicar casi 75% de la varianza total del volumen de ventas de galones de leche vendidos casi el 75% de la varianza total del volumen de ventas de galones de leche vendidos mediante el uso de una variable independiente. De modo que el 25% (1 -- r2) de la variación independiente. De modo que el 25% (1 ,.1) total queda sin explicaciOn. En otras palabras, a partir de la evidencia de la muestra, el explicación. En otras palabras, a partir de la evidencia de muestra, el Sr. Bump conoce el de lo que debería saber para pronosticar la perfección Sr. Bump conoce el 75% de lo que deberla saber para pronosticar a Ia perfección el volumen ventas. hacer más preciso el trabajo de pronóstico, debe encontrar otra volumen de ventas. Para hacer rnás preciso el trabajo de pronóstico, debe encontrar otra que le pennita explicar más la varianza total. Bump puede variable de predicción que le permita explicar más La varianza total. Si el Sr. Bump puede precisión. reducir la varianza no explicada, su pronóstico implicará menos error y más precision. menos Se debe buscar otra variable independiente que se relacione con el volumen de ventas Se debe variable independiente que se relacione con el volumen de de galones de leche. Sin embargo, esta nueva variable independiente variable de de galones de leche. Sin embargo, esta nueva variable independiente o variable de predicción, no puede tener una relación muy alta con la variable independiente que ya se predicción, no puede tener una relación muy alta con la variable independiente que ya se 256 Regresión múltiple RegresiOn multiple Capítulo 7 Capitulo está empleando (precio por galón). Si las dos variables independientes están altamente galón). Si las dos variables independientes están altamente está empleando (precio relacionadas entre si, explicarán Ia misma variación y la incorporación la segunda relacionadas entre sí, explicarán la misma variación y Ia incorporación de la segunda mejorará el pronóstico. En áreas como la econometría y la estadística aplicada, variable no mejorará el pronóstico. En areas corno la econometrIa y Ia estadIstica aplicada, preocupación con respecto este problema de intercorrelación existe una gran preocupación con respecto a este probiema de intercorre!ación entre las existe variables independientes que frecuencia se denomina colinealidad. Una solución variables independientes que con frecuencia se denomina colinealidad. Una solución sencilla al probierna de dos variables independientes altamente relacionadas, consiste sencilla problema de dos variables independientes altamente relacionadas, consiste abordará más adelante simplemente en no utilizarlas juntas. El problema de colinealidad se abordará más adelante simplernente en este capitulo. capítulo. Para resumir, los atributos de una buena variable de pronóstico son: Una buena resumir, los atributos de una buena variable depronóstico son: buena variable de pronóstico está relacionada con la variable dependiente. Una buevariable dependiente. variable na variable de pronóstico no está altamente relacionada con ninguna otra ninguna otra na variable de pronóstico no está altamente relacionada variable independiente. independiente. MATRIZ DE CORRELACION MATRIZ DE CORRELACIÓN El Sr. Bump decide que los gastos de publicidad podrIan ayudarie a mejorar su pronóstico pronóstico gastos de publicidad podrían ayudarle gastos de publicidad, el volumen semanal de ventas. Investiga la relación entre de volurnen senianal de ventas. Investiga Ia relación entre los gastos de publicidad, ci el precio por galón mediante el examen de una matriz de correlación. volumen de ventas y ci precio por galón mediante el examen de una matriz de correlación. matriz se crea mediante el cálculo de coeficientes correlación La inatriz de correlación se crea mediante el cálculo de coeficientes de correlación simples combinación de pares de variables. para cada combinación de pares de variables. En Ia tabla 7.1 se ilustra un ejemplo de matriz de correlación. El coeficiente de la tabla 7.1 se ilustra un ejemplo de matriz de correlación. El coeficiente de indica la relación existente entre las variables y se representa como r12. correlación que indica la relación existente entre las variables I1 y22 se representa como 1'\2' Nótese que el primer subIndice (r®2)se refiere al renglón y el segundo subíndice (rl~) se el primer subíndice (rCD2) se refiere al renglón y el segundo subindice (r1) se le permite refiere a la columna. Este enfoque estandarizado Ic pem1ite a uno determinar, a simple vista, la relación entre cualquier par de variables. Por supuesto, la relación entre las variables I Ia relación entre cualquier par de variables. Por supuesto, Ia relación entre las variables 1 2 (r¡0 es exactamente Ia misma que para las variables 2 y 1 (r71). Dc ahI que solo y 2 (r12 es exactamente la misma que para las variables 2 y I (1'21)' De ahí que sólo sea la la matriz. Además, la diagonal pIincipal siempre contendrá unos, ya necesaria Ia mitad de ia matriz. Además, la diagonal principal sienipre contendrá unos, ya que siernpre relaciona una variable consigo misma (rib1> r7, r33). siempre variable consigo misma (r¡ 1'22, 1'33)' 7.1 TABLA 7.1 MATRIZ DE CORRELAC ION CORRELACiÓN VARIABLES VARIABLES I I 2 r1, r l2 rn '22 '32 r'2 3 r ll r 21 '21 I"il r¡¡ 1"21 '21 2 3 3 r, 1"13 Ecuación regresión múltiple EcuaciOn de regresiOn multiple TABLA 7.2 7.2 257 MATRIZ DE CORRELACION DE CÓMPUTO PARA LOS DATOS DEL SR.BUMP CORRELACiÓN DE COMPUTO PARA LOS DATOS VARIABLES VENTAS, VARIABLES Ventas, 1 1 Precio, 2 Precio, Publicidad, 3 Pub licidad, 1 1 PRECIO, 2 2 -.86 .86 1.00 PUBLICIDAD 3 .89 1.00 -.65 - .65 1.00 El Sr. Bump procesa sus datos en la computadora y obtiene la matriz de correlación computadora obtiene correlación que se muestra en la tabla 7.2. (La mayorIa de los programas de regresión multiple muestra en la tabla 7.2. (La mayoría de los programas de regresión múltiple que proporcionan matrices de colTelación.) Una investigación de las relaciones entre los gastos cOlTelación.) Una investigación de las gastos de publicidad, el volurnen de ventas y el precio por galón, indica que la nueva variable de publicidad, el volumen de ventas y el precio por galón, indica que nueva variable pronóstico. de cOlTelación muestra independiente podría contribuir a mejorar el pronóstico. La matriz de correlación muestra independiente podria contribuir que los gastos de publicidad tienen una relación positiva alta (r13 = .89) con la variable gastos de publicidad tienen una relación positiva alta (r13 .89) la variable que dependiente, volurnen de ventas; y una relación negativa moderada (r23 -.65) con la dependiente, vohunen de ventas; y una relación negativa moderada (r23 = .65) con Ia independiente, precio Esta combinación de relaciones podría pennitir variable independiente, precio por galón. Esta combinación de relaciones podrIa perrnitir que que los gastos de publicidad explicaran parte de la varianza total del volurnen de ventas publicidad explicaran parte de varianza total del volrunen de ventas que aún que ann no se ha explicado por medio del precio por galón. Como se vera, cuando se se ha explicado por medio del precio por galón. Como se verá, cuando se emplean tanto el precio por galón como los gastos de publicidad para estirnar el volurnen estimar ci volrunen emplean tanto el precio R 2 se de ventas, R2 se incrementa al 93.2%. análisis la correlación es El análisis de Ia matriz de correlación es un paso inicial importante en la solución de inicial importante en la solución de cualquier problema que comprenda varias variables independientes. independientes. cualquier ECUACIÓN DE REGRESIÓN MÚLTIPLE ECUACION DE REGRESION MULTIPLE la regresión simple, la variable dependiente puede representar Y la variable En Ia regresión simple, la variable dependiente se puede representar por Y y Ia variable independiente X. En el análisis de múltiple X subíndices independiente mediante X. En el análisis de regresión multiple se utilizan X con subIndices para representar las variables independientes. La variable dependiente se continua reprerepresentar las variables independientes. La variable dependiente se continúa repreY, las variables independientes se representan como X X 3 ~l' En este sentando con Y, y las variables independientes se representan como X2;2,X3,, • . . X. En este sistema de notación, la nueva ecuación de regresión del Sr. Bump se escribe como ecuación regresión del escribe como sistema de notación, . . . Y= b0 + b2X2 + b3X3 en donde (7.1 ) (7.1) Y = volumen de galones vendidos, estirnado por la ecuación de regresión galones vendidos, estimado la ecuación de regresión Y volrunen bz, b3 coeficientes de regresión neta (el mejor conjunto ponderado b2, b 3 == coeficientes de regresión neta (el mejor conjunto ponderado entre las dos variables independientes, con el fin de lograr la maxima predicción) máxima variables independientes, con el fin de X2 = galón X2 = Precio por galón X 3 = Gastos de publicidad (en cientos de dólares) publicidad cientos dólares) ba = Constante o intersección con Y con Y b0 = Constante 258 RegresiOn multiple Regresión múltiple Capítulo Capitulo 7 El análisis utiliza el método de mInimos cuadrados para obtener la ecuación de método de mmlmos cuadrados pam obtener ecuación de El análisis utiliza regresión lineal de mejor ajuste para tres variables. Mientras que en el probiema con dos regresión lineal de mejor ajuste para tres variables. Mientras que en el problema con dos variables el método de mInimos cuadrados producla la ilnea recta de mejor ajuste, en este método de mínimos producía línea mejor ajuste, en este problema de tres variables, se emplea el método para obtener el plano de mejor ajuste (véase el fig. 7.1). Los pi.mtos se grafican en tres dimensiones aalo largo de los ejes Y, X22yyX3.• Los Los puntos tres dimensiones lo largo de los ejes Y, X X 3 Los fig. se ubican por arriba y por abajo del plano, de tal forma que (Y mínima. puntos se ubican por arriba y por abajo del piano, de tal forma que L (Y -- }Y es minima. Los vaiores de b2 y b3 se derivan como el mejor conjunto de ponderaciones que minimizan valores b2 y b3 se derivan como el mejor conjunto de la suma de las distancias al cuadrado entre los puntos de datos y el plano de regresión las distancias cuadrado entre los puntos de datos el plano de regresión Ia suma múltiple. multiple. y Y Ventas =-8.25X2+.59X3+ 16.41 5 /------r-----'-----J..----7-::-: : - - - - Y3 20 Publicidad 2.0 X2 Precio Punto Semana Ventas Precio Publicidad SemanaVentas A B 7 7 5 5 17 1.60 1.00 6 15 9 9 Figura 7.1 Figura 7.1 Piano de regresión mñltiple para los datos del Sr. Bump. Plano múltiple Sr. Bump. el cap. 6, el ejemplo comprendía dos variables y del proceso de minimización En el cap. 6, el ejemplo comprendia dos variables y del proceso de minimización resultaban ecuaciones. Ahora, deben resolver tres ecuaciones, para determinar los resultaban dos ecuaciones. Ahora, se deben resolver tres ecuaciones, para determinar los de bv b3 y b0) valores de b2, b3 Y ba.I Estas ecuaciones son = nb o + b2X2 b 3LX 3 LY = nb0 + b 2LX 2 + b3X3 X2Y LX 2Y = b oLX 2 + b2X ++ b 3LX 2X 3 b 2 LX b3X7X3 i (7.2) X3Y bIX3 + b 2LX 2X 3 LX 3Y ==b oLX 3 + b2IX2X3 + b3LX~ I Como se muestra en el apéndice A, una función de Ia forma F (b2, b3, b0) = L (y - ba - b2 X2 - b3 x3)2 se apéndice una función de la forma F (b 2, b3, ba) (y b2 X2 b3 X3)2 Como se muestra minimiza a través del método de cálculo de tomar las derivadas parciales con respecto a b0, b2, b3 e igualando través del método de cálculo de tomar las derivadas parciales con respecto a ba, b2, b3 a cero. estas derivadas a cero. Ecuación regresión múltiple EcuaciOn de regresiOn mUltiple 259 Ejemplo Ej emplo 7.1 cálculos de requeridas para problema del Sr. muestran la tabla Los cálcu!os de las sumas requeridas para el problema del Sr. Bump se muestran en la tabla 7.3. Sustituyendo 7.3. Sustituyendo en la ecuación 7.2 nos da 112= lObo + 14.4b2+ 114b3 112 = 10b0+ 14.4b2 + 114b3 149.3 = 14.4bo + 21.56b 2 + 155.3b3 = 14.4b0 + 21.56b2 155.3b3 1,480= 114b0+ 115.3b2 + 1,522b3 1,480 = 114bo + 115.3b2+ 1,522b3 frecuencia denomina estas ecuaciones como ecuaciones normales pueden Con frecuencia se denornina a estas ecuaciones como ecuaciones normales y se pueden resolver siniultáneamente por métodos matriciales. Este enfoque lo exponen Younger, Neter y simultáneamente por métodos matriciales. Este enfoque lo exponen Younger, Neter y Wasserman, Wasserman, cuyos textos podrá consultar si le interesan las matemáticas del procedimiento. le interesan las matemáticas del procedimiento. En este ejemplo, se usó un programa de córnputo para obtener programa cómputo b2 = -8.2476 = b 3 = .5851 b3 = b o = 16.4064 b0 = regresión múltiple queda ahora como la la Sustituyendo en Ia ecuación 7.1, Ia ecuación de regresión multiple queda ahora como y = 16.41 8.25 X + .59X3 V = 16.41 -- 8.25 X22+ .59X3 Esta ecuación resulta útil para pronosticar las ventas de la próxinia semana. Si se planea Esta ecuación resulta ütil pronosticar las ventas de próxima semana. se planea un precio unitario de $1.50 y gastos de publicidad de $1000, el pronóstico es de 9,930 galones; de publicidad de $1000, el pronóstico galones; esto es Y = 16.41 --8.25X22+ .59X33 f = 16.41 8.25X + .59X = = 16.41 - 8.25(1.5) .59(10) 16.41 - 8.25(1.5) + .59(10) = 9.93 (miles de galones) galones) 9.93 7.3 TABLA 7.3 CÁLCULOS ANÁLISIS DE REGRESiÓN MÚLTIPLE DEL SR. BUMP CALCULOS PARA EL ANALISIS DE REGRESION MULTIPLE PARA LOS DATOS DEL SR. BUMP PUBLICIDAD PRECIO POR (CIENTOS DE DE GALÓN, DÓLARES) GALON, DOLARES) X2 X3 x2 x3 SEMANA VENTAS (EN MILES), Y 10 X2y x2Y 13 13 12 8.5 18 16 18 8 8 16.8 17 22 X3y x3Y 90 42 25 168 150 180 30 120 255 x2x3 XzX3 y2 y2 X2 x2 X2 x3 1 1 2 2 3 4 4 5 6 7 7 8 9 9 10 10 6 6 5 5 12 10 15 5 5 12 17 20 112 11.2 $1.30 2.00 1.70 1.50 1.60 1.20 1.60 1.40 1.00 1.10 UO 9 7 7 5 5 14 15 15 12 6 6 10 15 21 114 11.4 420 11.7 14.0 8.5 21.0 24.0 14.4 9.6 14.0 15.0 23.1 155.3 100 36 25 144 100 225 25 144 289 400 1,488 1.69 1.69 4.00 2.89 2.25 2.56 81 81 49 25 196 225 144 36 100 225 441 1.44 1.44 2.56 1.96 1.00 1.21 21.56 Totales Medias 14.40 14.40 1.44 149.3 1,480 1,522 1,48 260 Regresión mUltiple RegresiOn múltiple Cap Ituo 7 Capítulo 7 análisis ejemplo del cap. para dos variables puede realizar El análisis para el ejemplo del cap. 6 para dos variables se puede realizar con una calculadora de mano. Sin embargo, con más de dos variables el análisis se complica de calculadora de mano. Sin embargo, con más de dos variables el análisis se complica de manera creciente, ya que el nümero de ecuaciones a resolver aumenta con cada nueva manera creciente, ya que número de ecuaciones resolver aumenta con cada nueva variable independiente. El mejor enfoque consiste en utilizar alguno de los diversos variable independiente. El mejor enfoque consiste en utilizar alguno de los diversos programas de córnputo disponibles para regresión multiple. cómputo múltiple. programas COEFICIENTES DE REGRESION COEfICIENTES REGRESIÓN interpretación ba, b 2 y b3 en la ecuación de múltiple. valor de considere la interpretación de b0, b2 Y b 3 en la ecuación de regresión multiple. El valor de b a es de nuevo una intersección con Y. Sin embargo, ahora se interpreta como el valor 1 nuevo una intersección Y. embargo, ahora interpreta como el :Y cuando tanto X2 como X 3 son iguales aa cero. A los valores b2 y b3 se les denomina cuando tanto X 2 como X3 son iguales cero. A los valores b 2 b 3 se les denomina regresión neta. Y por unidad de cambio coeficientes de i-egresión neta. Cada lmo mide cambios promedio en Ypor unidad de cambio uno está midiendo la la variable independiente relevante. No obstante, debido a que en la variable independiente relevante. No obstante, debido a que se está midiendo la En el cap. se expuso interpretación de b de b y la ecuación de regresión. Ahora En el cap. 66 se expuso la la interpretación a y b0en b en la ecuación de regresión. Ahora influencia simultánea de todas las variables independientes sobre Y, el efecto neto de X2 (o Y, el efecto neto de X 2 otra medir por separado de cualquier influencia de otras variables. de cualquier otra X), se debe medir por separado de cualquier influencia de otras variables. ahí que se diga que b mide el promedio de cambio en Y por unidad de cambio en X b De ahI que se diga que b22 mide ci prornedio de carnbio en Y por unidad de cambio en X2, las otras variables independientes. manteniendo constantes las otras variables independientes. coeficiente de regresión el promedio cambio la variable El coeficiente de regresión neta mide el promedio de carnbio en la variable dependiente por unidad dependiente por unidad de cambio en Ia variable independiente relevante, cambio en la variable independiente relevante, demás variables independientes. manteniendo constantes las demás variables independientes. En el ejemplo actual, el valor de -8.25de b22 indica que cada incremento de 1 centavo ci actual, el valor de 8.25 de b indica que cada incremento de 1 centavo en un galón de leche cuando los gastos de publicidad se mantienen constantes, reduce la galón de leche cuando los gastos de publicidad se mantienen reduce cantidad de compras en un prornedio de 8.25 galones. En forma sernej ante, el valor .59 de 1m promedio 8.25 galones. En forma semejante, el valor .59 b 3 significa que si se aumentan en $100 los gastos de publicidad, manteniendo constante el el b3 significa que si se aurnentan en $100 los entonces el volumen de ventas incrementará en promedio precio por galón, entonces el volumen de ventas se incrementará en un promedio de 590 precio galones. Ejemplo Ej emplo 7.2 influencias, considerernos un ejemplo en el que el precio $ 1.00 por Para ilustrar estas influencias, consideremos un ejemplo en el que el precio es de S 1.00 por se gastan $1000 en publicidad. Asi, galón y se gastan $1000 en publicidad. Asi, y = 16.41 8.25 X2 .59X3 V = 16.41 - 8.25 X2 + .59X3 = 16.41 - 8.25(1.00) + .59(10) = 16.41 - 8.25( 1.00) + .59(10) = 16.41 -- 8.25 - 5.9 = 14.06 o 14,060 galones 16.41 8.25 5.9 = 14.06 o 14,060 galones 14,060 galones de leche. Las ventas se pronostican en 14,060 galones de leche. ¿Cuál es el efecto en las ventas de un incremento de 1 centavo en el precio si los gastos j,Cuál es el efecto en las ventas de un incrernento de 1 centavo en el precio si los gastos de publicidad siguen siendo $1,000? $1,000? cle publicidad siguen Residuos 261 y = 16.41 8.25(1.01) + .50(10) Y = 16.41 - 8.25(1.01) + .50(10) = 16.41 8.3325 5.9 = = 16.41 - 8.3325 + 5.9 = 13.9775 Nótese disminuyen en 82.5 galones (14.06 13.9775 .0825). Nótese que las ventas disminuyen en 82.5 galones (14.06 -- 13.9775 = .0825). ¿Cuál es el efecto en las ventas de un incremento de $100 en publicidad, si el precio se ,Cuál es el ventas incremento publicidad, el precio se constante en $1.00? mantiene constante en $1 .00? y = 16.41 -- 8.25(1.00) + .59(11) Y 16.41 8.25( 1.00) .59(11) = 16.41 - 8.25 + 6.49 = 14.65 16.41 8.25 + 6.49 = 14.65 Nótese incrementan en 590 galones (14.65 14.06 = .59). Nótese que las ventas se incrementan en 590 galones (14.65 -- 14.06 = .59). INFERENCIA ESTADISTICA EN LA REGRESIÔN MULTIPLE ESTADíSTICA LA REGRESIÓN MÚLTIPLE Cuando cada una las mediciones que emplean en desarrollo ecuación Cuando cada una de las mediciones que se eniplean en el desarrollo de una ecuación de regresión multiple representa una muestra de probabilidad de una población especIfica, se probabilidad de específica, regresión múltiple representa una muestra estadísticas sobre los parámetros de población, en la pueden hacer inferencias estadIsticas sobre los parámetros de la pobiación, con base en la de regresión múltiple: siguiente ecuación de regresión multiple: Y = f3 + 137X7 + f33X3 + E (7.3) Por ejemplo, pueden datos de muestra para desarrollar ecuación Por ejemplo, se pueden usar datos de muestra para desarroliar una ecuación de regresión mñltiple de muestra en la forma regresión múltiple Y= b3X3 y = ha + b,X7 + h 3 X 3 h 2X 2 bo, b2 y b3 son estimaciones lineales, eficientes, no desviadas de los parámetros en donde b0, b2 Y b3 son estimaciones lineales, eficientes, no desviadas de los parárnetros general muestra, correspondientes de Ia población /, $2 [33' Ya que correspondientesde la población Po, ~ y $2. Ya que en general se usan datos de muestra, el analistra está por lo regular interesado en hacer inferencias sobre los parámetros de la por lo regular interesado en hacer inferencias sobre los parámetros de la población. pobiación. En el cap. 6 se expusieron ciertas suposiciones que son la base de este procedirniento se expusieron procedimiento de inferencia. El resurnen es ci siguiente: reSlUl1en el siguiente: l. Los valores de Y presentan una distribución nOlll1al con respecto al plano de Y presentan una distribución normal con a! piano regresiónrni.'iltiple. regresión múltiple. 2. Los puntos de dispersion alrededor del piano de regresión permanecen Los puntos de dispersión alrededor del plano de regresión pel1l1anecen constantes plano. constantes en cualquier parte del piano. 3. Los términos de error (E) son independientes entre si. ténninos sí. relación lineal entre cada X y Yen la población. 4. Existe una relación lineal entre cada X y Y en la población. RESIDUOS Como se rnencionó en ci cap. 6, un residuo es Ia diferencia entre io que realmente se observa mencionó el la lo observa lo que se pronostica mediante la ecuación de regresión (Y Y). Así, la ecuación de y io que se pronostica mediante Ia ecuación de regresión (Y -- Y,). AsI, ia ecuación de regresión múltiple del Sr. Bump para cada uno de los vohirnenes semanales de yenta regresión mñltiple del Sr. Bump para cada de los volúmenes semanales venta anteriores es Y = b0 + b2X2 + b3X3 + e (7.4) 262 Regresión mtttipIe RegresiOn múltiple Capítulo 7 CapItulo en donde y = volumen real Y = volumen real de ventas semanales en galones b2, b3 = coeficientes de regresión neta b2, b3 coeficientes X 2 = precio por galón galón X 3 = gastos de publicidad, en cientos de dólares = publicidad, cientos de dólares bo = constante = e = residuo [diferencia entre el valor real de Y y el valor de pronóstico de Y(Y)]. [diferencia de Y valor de pronóstico de Y(}')]. = Si se sustituye Y por b0 + b2X2+ b-73 en la ecuación (7.4), sustituye Y por bo b)(z + bX3 en la Y=Y+e 0 ó e=Y-Y e=Y-Y Ejemplo 7.3 Si Mr. Bump sustituye los datos de Ia primera semana en la ecuación 7.1, se obtiene un la primera semana en ecuación 7.1, se obtiene un Si Mr. Bump sustituye los datos pronóstico para las ventas de esa sernana de 10,950 galones de leche. esa semana de 10,950 galones de leche. y = 16.4064 8.2476X + .5851X3 Y = 16.4064 -- 8.2476X22 + .5851X3 = 16.4064 - 8.2476(1.30) + .5851(9) = 10.9504 16.4064 - 8.2476(1.30) .58?1(9) 10.9504 las semana fueron 10000 Sin embargo, él ya sabe que las ventas de esa sernana fueron de 10000 galones. Su pronóstico falló por 950 galones. En otras palabras, el residuo de este pronóstico es -950 galones. falló 950 galones. En otras palabras, el residuo de este pronóstico es -950 galones. e = y - y = e=Y-Y 10.000 10.950 = 10.000 -- 10.950 == -.950 La tabla 7 .4 ilustra el concepto de residuo para cada uno de los diez puntos de datos. 7.4 de los diez puntos de datos. 7:4 TABLA 7.4 RESIDUOS SR. BUMP RESIDUOS DEL MODELO COMPLETO PARA LOS DATOS DEL SR. BUMP PREDICCIÓN DE Y (Y), Y PREDICCION USANDO Y 16.4064 USANDO == 16.4064 (h, RESIDUO, Y Y 10 6 5 12 10 15 5 5 12 17 20 X2 X2 1.30 2.00 1.70 1.50 1.60 1.20 1.60 1.40 1.00 1.10 X3 X3 9 7 5 14 15 12 6 10 15 21 -8.2476X + .5851X -8.2476X22 + .5851X33 10.9504 4.0069 5.3 110 5.3110 12.2264 11.9867 13.5305 6.7208 10.7 108 10.7108 16.9353 19.6211 Smnas Sumas (Y- Y) (Y- Y) -.95041 1.99311 1.993 11 -.31097 -.22639 - .22639 -1.98673 - 1.98673 1.46953 - 1.72083 -1.72083 1.28925 .06471 .37888 (Y - h (y-y)22 .903279 3.972487 .096702 .051252 3.947095 2. 1595 18 2.159518 2.96 1256 2.961256 1.662166 1.662 166 .004187 .143550 15.901493 .<XXm .00000 Error estándar do Ia estimaciOn estándar de la estimación 263 otros valores de para estos puntos de datos, que produzcan una suma de residuos otros valores de b para estos puntos de datos, que produzcan una suma de residuos cuadrados menor de 15.901. 15.901. estimar cantidad de Cuando el Sr. Bump utilizó solo el precio por galOn para estimar la cantidad de Cuando el Sr. Bump utilizó sólo el precio por galón galones vendidos, la suma de los residuos cuadrados L (Y -- f)2 fue de 59.4. Al emplear el de los residuos cuadrados (Y y)2 fue de 59.4. publicidad corno variables de predicción, la suma de precio por galOn y los gastos de publicidad como variables de predicción, la suma de los galón y los gastos precio residuos cuadrados se reduce a 15.9. de modo que el Sr. Bump puede ahora explicar el residuos cuadrados se reduce a 15.9. de modo que Sr. Bump puede ahora explicar 93.2% de la varianza del volumen de ventas, a través del conocimiento de las relaciones varianza del volumen ventas, través del conocimiento las relaciones 93.2% entre el precio por galOn, los gastos de publicidad y el volumen de ventas.2 por galón, el volumen de ventas. 2 Desviación total = DesviaciOn explicada -- Desviación no explicada Desviación total Desviación explicada Desviación b 2 y b3 se derivan corno el mejor conjunto de ponderaciones que minimizan la Los valores b2 y b 3 se derivan como el mejor conjunto de ponderaciones que minimizan la al plano de regresión múltiple. suma de las distancias a! cuadrado entre los puntos de datos y el piano de regresión máltiple. cero sumarizar los residuos [ (Y Y)] para los diez puntos de datos, la columna Al sumarizar los residuos [L (Y - Y)]para los diez puntos de datos, la columna suma cero L (Y -- Y) = 0. Cuando los errores se elevan al cuadrado y se sumarizan [ (Y - Y)2], la elevan cuadrado sumarizan [L y)2], (Y Y) = O. Cuando los errores cuadrados es un valor mínimo, 15.901. No se pueden suma de los cuadrados es un valor mInimo, L (Y - y)2 = 15.90 1. No se pueden encontrar - I(Y - Yf = y)2 + (Y Y)2 = I(Y - Y)2 + I(Y -- y)2 233.6 = 217.7 + 15.9 233.6 = 217.7 + 15.9 R2 = 1 R2 = 1 - I(Y - Y)2 I(Y - Y)2 y)2 - = 1 -1 - 159 15.9 233.6 - 233.6 = 1 - .068 = .932 = 1 - .068 = .932 La informaciOn derivada hasta este punto se resume en la tabla 7.5. infonnación derivada hasta este punto se resume en 7.5. TABLA 7.5 RESUMEN DEL ANALISIS DE LOS DATOS DEL SR. RESUMEN DEL ANÁLISIS DE LOS DATOS DEL SR. BUMP VARIABLES EMPLEADAS PARA VARIABLES EMPLEADAS PAPA EXPLICAR LA VARIANZA DE Y DE y R2 (YY)2 233.6 59.4 15.9 15.9 Ninguna Precio gastos de publicidad Precio y gastos de publicidad .00 .75 .93 ERROR ESTANDAR DE LA ESTIMACION ERROR ESTÁNDAR DE LA ESTIMACIÓN como en una regresión simple, error estándar de la estimación es la desviación Tal como en una regresión simple, el error estándar de la estimación es la desviación Y airededor plano los residuos. Y mide la dispersión tIpica estándar de los residuos. Y mide la dispersiOn típica de los valores de Y alrededor del piano de regresiOn. El error estándar de la estimación se escribe como regresión. El error como I(Y y.x2x3 nk Y)2 (7.5) desviaciones utilizan aquí para simplificar el ejemplo. las desviaciones dividen entre los 2 Las desviaciones se utilizan aquI para simplificar ci ejemplo. Si las desviaciones se dividen entre los correspondientes grados de libertad, da como resultado las varianzas. correspondientes grados resultado las varianzas. 264 Regresión múltiple RegresiOn multiple CapItulo Capítulo 7 en donde = error estándar de la estimación de la variable dependiente Y, a la cual se estimación la variable dependiente Y, se regresión contra las variables independientes X X3 aplica una regresión contra las variables independientes X22yyX3.• Y = volumen real de ventas semanales, en galones Y = volumen real de ventas semanales, Y == volumen estimado de galones vendidos a partir de la ecuación de regresión Y volumen estimado de galones vendidos a partir de la ecuación de regresión número de observaciones n = nilmero de observaciones k = nürnero de parámetros linealmente independientes a estimar en la ecuación de linealmente independientes a k número regresión multiple (b's). regresión múltiple 3 SyX~ El error estándar de la estimación mide la cantidad estándar en que los valores El error estándar de la estimación mide la cantidad (Y) difieren estimados (Y). reales (Y) difieren de los valores estimados (Y). Ejemplo Ej emplo 7.4 El error estándar para los datos de el Sr. Bump es estándar para los datos de el Sr. El - - \I 15.901493 = vW = 1 51 15.901493 = V'2.27 = 1.51 10 -- 3 . . 10 3 típica en que La cantidad tIpica en que el valor real de volumen de leche vendido difiere de lo pronosticado mediante Ia ecuación de regresión miiltiple es 1,510 galones. la regresión múltiple 1,510 galones. SALIDA DE CÓMPUTO COMPUTO 7.6 se presenta la salida de computadora el problema el Sr. Bump. Una En la tabla 7.6 se presenta Ia salida de computadora para el problerna de el Sr. Bump. Una revision de esta salida nos conduce a las siguientes observaciones (las explicaciones se revisión de salida nos conduce a las siguientes observaciones (las explicaciones níunero la tabla 7.6). relacionan por nñrnero con la tabla 7.6). Los coeficientes de regresión son 1. Los coeficientes de regresión son -- 8.2476 para el precio y .5851 para los gastos de .5851 los gastos La ecuación de regresión es Y= 16.4064 8.2476X = .5851X3 publicidad. La ecuación de regresión es Y= 16.4064 --8.2476X22= .5851X3.• 2. La ecuación de regresión explica el 93.2% de Ia varianza de los volúmenes de ventas. la volürnenes de ventas. 3. El elTor estándar de Ia estimación es 1.507 galones. Este valor es la cantidad estándar o la estirnaciôn es error típica real difiere del valor de pronóstico. tIpica en que el valor real difiere del valor de pronóstico. 4. En el cap. 6 se probó el coeficiente de correlación para determinar si era diferente de probó el coeficiente de correlación determinar si era diferente de cero. cero. En esta ecuación, ambos coeficientes de regresión son significativos, corno 10 ecuación, coeficientes regresión significativos, como lo indican los valores calculados para ttde -3.76 y 4.38 (ya que, la tabla C.3 del Apéndice valores calculados para de 3.76 y 4.38 (ya que, la nos dice que para 7 grados de libertad, t01 = 3.499). para 7 grados de libertad, t. Ol 5. La matriz de correlación se dernostró en la tabla 7.2. se demostró en la tabla 7.2. 6. El cálculo de la desviaciôn de la surna de cuadrados (15.90 1) se demostró en la tabla desviación la suma cuadrados (15.901) se dernostrôen la tabla 7.4. A este térrnino se le denornina surna de los residuos cuadrados {(YY)2]. 7.4. A este ténnino se le denomina swna de los residuos cuadrados [L( Y - YlJ. 7. El cálculo de la suma de cuadrados atribuible a la regresión (217.699), se expuso en la a la regresión (217.699), se expuso en la sección de residuos. A este término se le denomina suma explicada de cuadrados [L(Y - .r/J. [SO'- J:;)2] Salida de cOmputo de cómputo TABLA 7.6 7.6 265 SALIDA DE COMPUTO PARA EL PROBLEMA DE REGRESION MULTIPLE DEL SR. BUMP CÓMPUTO REGRESiÓN MÚLTIPLE BUMP SALIDA STANDARD DEVIATION 0.30258 4.97103 VARIABLE 2 2 3 3 MEAN 1.44000 11.40000 11 .40000 CORRELATION X VS y REGRESSION STD. ERROR STD. COEFFICIENT DEVIATION OF REG. COEF. OF REG. COEF. -8.24760 (1) -8.24760 (1) (1) 0.58510 (1) 2.19605 0.13367 5.09466 COMPUTED REGRESSION T VALUE (4) -3.75565 (4) 0.89150 (4) 4.37716 (4) -0.86349 0.89150 DEPENDENT 1 11.20000 1 INTERCEPT 5.09466 (1) 16.40639 (1) 1.50719 (3) 1.50719 (3) MULTIPLE CORRELATION R SQUARED CORRECTED R SQUARED 0.96536 STD. ERROR OF ESTIMATE STD. ERROR OF (2 ) 0.93193 (2) ( 11) 0.91248 (11) ANALYSIS OF VARIANCE FOR THE REGRESSION FOR REGRESSION ANALYSIS SOURCES OF VARIATION SOURCES OF ATTRIBUTABLE TO REGRESSION REGRESSION DEVIATION FROM REGRESSION FROM REGRESSION TOTAL CORRELATION MATRIX: CORRELATION MATRIX: VAR. 1 1 2 2 3 3 1 DEGREES OF FREEDOM OF 2 2 7 7 SUM OF SQUARES MEAN SQUARES 108.849 108.849 2.272 F VALUE (10) 47.917 (10) 9 9 (7) 217.699 (7) 15.901 (6) (6) (8) 233.600 (8) 3 3 3 BY 3 2 2 -0.863 1.000 -0.654 3 (5 ) (5) 1.000 -0.863 0.891 0.891 -0.654 1.000 RESIDUALS TABLE OF RESIDUALS (9 ) (9) RESIDUAL -0.95041 1.99311 -0.31097 -0.22639 -1.98673 1.46953 -1.72083 1.28925 0.06471 0.37888 CASE NO. NO. 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 Y Y VALUE 10.00000 6.00000 5.00000 12.00000 10.00000 15.00000 5.00000 12.00000 17.00000 20.00000 Y ESTIMATE 10.95041 4.00689 5.31097 12.22639 11.98673 13.53047 6.72083 10.71075 16.93529 19.62112 8. El cálculo de la suma total de cuadrados (233.6) se demostró en la tabla 6.5. A este la suma total de cuadrados la tabla 6.5. A este se puede calcular ténnino se le denomina suma total de cuadrados [L( Y - rYl y se puede calcular término se denomina surna total de cuadrados [(Y suma adicionando la surna de residuos cuadrados y la suma explicada de cuadrados. 9. La columna de residuos se dernostró en Ia tabla 7.4. de residuos se demostró en la tabla 7.4. 10. El valor calculado F (47.917) se usa para probar si la ecuación de regresión (Y = 16.4064 F probar si la ecuación de regresión (f = - 8.2476X2 = .5851X3) explica un porcentaje significativo de la varianza de la variable 8.2476X2 = .5851X3) explica un porcentaje significativo de Ia varianza de la variable y. El cálculo del Y.El cálculo del valor F es F 266 Regresión mUltiple múltiple Cap Itulo Capítulo 7 F = F (.93193 0)/(3 1) (.93193 -- 0)1(3 -- 1) = 47.917 = 47.917 (1 - .93193)/(10 3) (1 - .93193)/(10-3) considerando que el valor F en tabla C.6 9.55 a! considerando que el valor F para 2 y 7 grados de libertad en la tabla C.6 es de 9.55 al nivel de significancia de .01, se puede concluir que la ecuación de regresión multiple múltiple porcentaje significarivo de la varianza de la variable Y. explica un porcentaje significarivo de la varianza de la variable Y. 11. El cálculo del valor corregido o ajustado de R2 11. El cálculo del valor corregido o ajustado de R2 es I(Y - Y)2 Y,? R2 R 1 =1 e n-k I(Y (Y nk 15.9 10 - 3 10 3 .91248 233.6 = .9 1248 10 10-11 ni y? = )2 n- 1 VARIABLES FICTICIAS tema observando el ejemplo siguiente: Abrimos este tema observando el ejemplo siguiente: Ejemplo Ej emplo 7.5 Suponga que un analista desea investigar qué tan bien puede Suponga que un analista desea investigar qué tan bien puede un examen de aptitud en examen de aptitud en particular, predecir el desempeño en el trabajo. Ocho mujeres y siete hombres hicieron la particular, predecir el desempeño en trabajo. Ocho mujeres siete hombres hicieron la mide la destreza manual en el manejo de objetos pequeños. Después, cada sujeto prueba, que mide la destreza manual en el manejo de objetos pequenos. Después, cada sujeto tornó de tomó un mes de capacitación intensiva corno ensambladores de partes electrónicas, seguido de como un mes en el puesto de ensamblador, durante el cual se evaluó su productividad mediante un puesto ensamblador, durante el cual productividad mediante un índice con valores en un intervalo de 0 a 10 (0 significa improductivo), O a 10 (O significa improductivo), Indice con valores la en la fig. 7.2 se muestra el diagrama de dispersión Los datos se presentan en Ia tabla 7.7 y en la fig. 7.2 se muestra el diagrama de dispersion colTespondiente. Cada trabajador que es mujer se representa con un 0 cada hombre con un 1. correspondiente. Cada trabajador que es mujer se representa con un O y cada hombre con im 1. la de aptitud y el desempeño De inmediato resulta evidente que Ia relación entre este examen de aptitud y el desempeño en el trabajo sigue dos patrones distintos, uno que se aplica a las mujeres y otro a los hombres. se aplica a las mujeres y otro a los hombres. En ocasiones es necesario deterrninar cómo se relaciona una variable dependiente con detenninar una independiente cuando un factor cualitativo ejerce influencia en la situación. Esta una independiente cuando un factor cualitativo ejerce influencia en la situación. Esta relación se logra creando una variable ficticia. Existen muchas fonnas de identificar relación se logra creando ima variable ficticia. Existen muchas forrnas de identificar cuantitativamente las clases de una variable cualitativa. En este texto emplearemos O y 1. cuantitativarnente las clases de una variable cualitativa. En este texto emplearemos 0 1. Las variables ficticias o de indicador se usan para detenninar la relación entre ficticicis o de indicador se usan determinar relación dependiente. variables cualitativas independientes y una variable dependiente. muestra ]a técnica de variable ficticia. Los puntos de datos para En Ia fig. 7.3 se muestra Ia técnica de la variable ficticia. Los puntos de datos para la fig. 1 representa los hombres. Se trazan dos líneas paralelas mujeres se muestran como 0 y el 1 representa a los hombres. Se trazan dos ilneas paralelas O en el diagrama de dispersion. La línea superior se ajusta a los datos para las mujeres y la dispersión. La linea superior se ajusta a los datos mujeres para los hombres. inferior a los datos para los hombres. Variables ficticias TABLA 7.7 DATOS PARA EL EJEMPLO 7.5: VARIABLE FICTICIA DE ENSAMBLADORES 7.7 DATOS EJEMPLO VARIABLE ELECTRÓNICOS ELECTRON ICOS CALIFICACIÓN EN EL CALIFICACION EN EL SEXO INDICE DE DESEMPEÑO íNDICE DE DESEMPE4O X3 SUJETO EXAMEN DE APTITUD, X2 DE APTITUD, X 2 EN EL PUESTO, Y Y 1 1 267 5 5 4 3 10 2 2 3 3 4 5 6 7 8 9 10 11 2 7 6 9 9 60 55 35 96 35 81 65 85 99 43 98 91 95 70 85 1,093 2 8 6 7 7 12 13 14 15 3 6 87 0(F) o (F) O (F) 0(F) O (F) 0(F) O (F) 0(F) O (F) 0(F) O (F) 0(F) O (F) 0(F) O (F) 0(F) 1 (M) 1(M) 1 (M) 1(M) 1 (M) 1(M) 1 (M) 1(M) 1 (M) 1(M) 1 (M) 1(M) 1 (M) 1(M) Yé = media del Indice de desernpeño en ci puesto (mujeres) = 5.75 índice desempeño el puesto (mujeres) = 5.75 YM = media del Indice de desempeño en el puesto (hombres) = 5.86 índice de desempeño en ci puesto (hombres) 5.86 XF = media de XF = media de la calificación en ci examen de aptitud (mujeres) = 64 el aptitud (mujeres) = 64 XM = media de Ia calificación en el examen de aptitud (hombres) 83 XM = media de la calificación en el examen de aptitud (hombres) = 83 y Y 10 10 9 0 = Mujeres O = Mujeres 1 = Hombres O 0 0 O 1 ~ 8 (l) 1 o.. d) ¡:: (l) ;:l 7 O 0 O 0 O 0 O 0 1 1 1 lt:: (l) o 6 5 4 3 2 2 E (l) (l) (l) o.. en "O "O (l) ,.,5 :.a u O 0 O I I I I I I '----'----'----'----'----'----'----.L..-.-.L..-._.L..-._.L..-._ _ I I O 0 10 10 20 30 40 50 60 70 80 90 100 100 x x Calificación en ci examen de aptitud aptitud Caiificación el Figura 7.2 Figura 7.2 Diagrarna de dispersion Diagrama de dispersión para los datos del ejemplo 7.5. 7.5. 268 y Y Regresión multiple RegresiOn múltiple Capítulo 7 CapItulo 10 o 0 o 0 = Mujeres 1 = Hombres 1\ A 9 y= .12X 2 -1.96 Y=.12X2 1.96 8 0 .9 tIl '1) I: "¡j 1=: '1=: '1) o- ~ 7 A Y= .12X-4.14 6 o 5 tIl '1) ~ 5 4 1 "O '1) "O ,.5 ;e 3 2 u '1) 2I I I I I I I o 0 Figura 7.3 Figura 7.3 10 lO 20 30 40 50 60 70 80 90 100 80 Calificación en el exarnen de aptitud examen aptitud Líneas las variables ficticias del ejemplo 7.5. LIneas de regresión para las variables ficticias del ejemplo 7.5. Cada una de estas ilneas se obtiene mediante la solución de la ecuación de regresión líneas obtiene ecuación de regresión múltiple 7.1. multiple 7.1. V = b0 + b2X2 + h3X3 en donde X2 x2 = calificación del examen calificación O para r 0 para mujeres X3 = x3=1{ variable ficticia 1 1 para hombres La ecuación simple es equivalente a las dos siguientes ecuaciones: dos siguientes ecuaciones: y = b0 + b2X2 Y = ba + b 2X 2 mUjeres para mujeres para hombres y ba + b2X 2 + b3 V = b0 + b2X2 + b3 Nótese que b3 representa el efecto de un hombre sobre el desernpeño en el puesto y b3 representa ci efecto de un hombre sobre ci desempeño en el puesto que b2 representa el efecto de las diferencias del examen de aptitud (se supone que el valor b 2 representa el efecto de las diferencias del exarnen de aptitud (se supone que ci valor b2 el mismo para hombres y mujeres). El punto importante consiste que una de b2 es el mismo para hombres y mujeres). El punto importante consiste en que una ecuación de regresión multiple arrojará las dos lIneas estimadas que se muestran en Ia fig. múltiple arrojará las dos líneas estimadas que se muestran la fig. 7.3. línea la estimación la hombres. podría 7.3. La lInea superior es la estirnación para mujeres y Ia inferior para hombres. Se podrIa Variables Variab'es ficticias 269 visualizar X3 como una variable "de intelTUptor", que está "encendida" cuando se hace una X3 como una variable "de interruptor", que está "encendida" cuando se hace cuando mujer. observación para un hombre y "apagada" cuando se hace para una mujer. observación para un hombre Los cornandos de Minitab para ejecutar los datos del problema 7.5 son: Los comandos de Minitab para ejecutar los datos del problerna 7.5 son: MTB > SET Cl > C1 DATA > 5 4 3 10 2 7 6 9 9 2 8 6 7 3 6 DATA> 5 4 10 2 7 6 9 9 2 8 6 7 3 6 MTB > END > MTB > SET C2 > C2 DATA > 60 55 35 96 35 81 65 85 99 43 98 91 95 70 85 DATA> 60 35 96 35 81 65 85 43 98 91 95 70 85 MTB > END > MTB > SET C3 > C3 > O 0 O O O O 0 0 1 1 DATA > 0 O 0 0 0 0 O O 1 1 1 1 1 1 1 1 1 1 MTB > END > MTB > NAME Cl 'JOB' C2 'TEST' C3 'GENDER' > C1 C2 'TEST' MTB > CORR C1-C3 > C1-C3 JOB 0.876 0.021 TEST 0.428 1 1 TEST GENDER MTB > REGRESS Cl ON 2 PREDICTORS C2 C3 C1 2 PREDICTORS C2 C3 MTB The regression equation is equation is The JOB = 1.96 + 0.120 TEST 2.18 GENDER JOB = -1.96 + 0.120 TEST -2.18 GENDER Predictor Constant TEST GENDER 0.7863 s = 0.7863 s Coef -1.9565 1.9565 0.12041 -2.1807 2.1807 Stdev 0.7068 0.01015 0.4503 t-ratio tratio -2.77 2.77 11.86 -4.84 4.84 P P 0.017 0.000 0.000 92.1% R-sq = 92.1% R-sq(adj) = 90.8% Rsq(adj) = 90.8% Analysis of Variance Analysis SOURCE Regression Error Total SOURCE TEST GENDER DF 2 2 12-12 14 SS 86.981 7.419 94.400 SEQ SS SS 72.486 72 .486 14.496 MS 43.491 0.618 F F 70.35 P P 0.000 DF 1 1 1 1 MTB > STOP > STOP para capturar los datos de desenipefio en el puesto en Cl, • Los cornandos SET se usan para capturar los datos de desempeño en el puesto en CI, comandos los datos de calificación del exarnen en C2 y Ia variable ficticia sexo en C3. examen la en C3. las vaIiables cada columna. • El comando NAME se emplea para dar nombre a las variables en cada columna. El cornando CORR se utiliza para calcular la rnatriz de correlación para las variables • El comando CORR se utiliza para calcular la matriz de correlación para las variables CI, C2 y C3. Cl, C2 y C3. 270 multiple Regresión múltiple Capítulo 7 Cap Itulo • El comando REGRESS se usa para desarrollar un análisis de regresión, siendo el comando REGRESS se para desarrollar análisis de regresión, siendo el desempeño en el trabajo la variable dependiente (Y) la calificación en el examen (X2) y (l') la calificación en el examen (X2) y el sexo (X3) como las variables independientes. (X;) como las variables Ejemplo Ej emplo 7.6 La ecuación de regresión mi'iltipleestimada para los datos del ejemplo 7.5 se muestra en la regresión múltiple estirnada para los datos del ejemplo 7.5 se muestra en la salida de cónlputo de Minitab. La ecuación es Minitab. salida cómputo y = -1.96 .12X2 2.18X 3 Y = -1.96 ++ .12X 2 -- 2.18X1 Para los dos valores (0 y 1) de X3,, Ia ecuación resulta valores (O y 1) de X 3 la ecuación resulta y 2.18(0) = -1.96 + .12X Y = -1.96 + .12Xz - 2.18(0) = -1.96 + .12X2 para mujeres y y Y y= -1.96 + .12X2 -- 2.18(1) = -4.14 ++.12X2 + .12X2 2.18(1) -4.14 .12Xz para hombres Estas ecuaciones se pueden interpretar de Ia siguiente manera. El valor del coeficiente de del coeficiente de Estas ecuaciones se pueden interpretar de la siguiente manera. El regresión b2 = .12, que es la pendiente de regresión b z = .12, que es Ia pendiente de cada una de las Ilneas, es el incremento promedio de las líneas, es el incremento promedio estimado en el indice de desernpeño por cada unidad de incrernento en la calificación del desempeño unidad de incremento la calificación estirnado en el índice examen de aptitud. Este coeficiente se aplica tanto a hombres como a mujeres. exarnen de aptitud. Este coeficiente se aplica tanto hombres conio El otro coeficiente de regresión b 3 ==-2.18 se aplica a los hombres. Si un hombre realizó coeficiente de regresión b3 -2.18 se hombres. el examen, el índice de desempeño en el puesto se reduce en 2.18 unidades, cuando se mantiene exarnen, el indice de desempeño en el puesto se reduce en 2.18 unidades, cuando constante la calificación de aptitud. aptitud. constante Una revisión de Una revision de las medias de las variables V y X2, clasificadas por sexo, ayuda a medias las variables Y y Xz, clasificadas por sexo, ayuda a comprender este resultado. La tabla 7.7 muestra que las medias del Indice de desempeflo para medias del índice de desempeño resultado. honibres (5.86) hombres (5.86) y para mujeres (5.75) fueron aproxirnadamente iguales. Sin embargo, en el mujeres (5.75) fueron aproximadamente iguales. embargo, el examen de aptitud, los hombres califican considerablemente más alto (83) que las mujeres (64). De ahI que si dos aspirantes, un hombre y una mujer, hacen el examen de aptitud y ambos dos aspirantes, hombre una mujer, hacen examen aptitud y ambos De ahí califican 70, el indice de desenipefio en el puesto para la mujer serA 2.18 puntos más alto que desempeño en el será 2.18 puntos más alto calificaii 70, el índice el del hombre, corno se nmestra a continuación: como se muestra a continuación: Mujer: Y = -1.96 + .12X2 = -1.96 + .12(70) = 6.44 Y = -1.96 + .12X 2 = -1.96 + .12(70) = 6.44 Hombre: Y = -4.14 + .12X 2 = y = -4.14 + .12X2 = -4.14 + .12(70) = 4.26 + .12(70) 4.26 Al observar la rnatriz de correlación en la salida de Minitab, se pueden apreciar algunos observar matriz de correlación en salida de Minitab, se pueden apreciar algunos puntos interesantes. Existe una alta relación lineal entre el desempeño en el puesto y el examen interesantes. una relación lineal entre el desenipeño en el puesto examen de aptitud, r12= .88. Mediante el conocimiento de esta relación, se puede explicar el 77% de aptitud, rlZ = .88. Mediante el conocimiento de esta relación, se puede explicar el 77% la varianza de la variable Indice de desempeflo en el puesto (.882 = .77). la variable índice de desempeño en el puesto (.88 2 = .77). El coeficiente de correlación r13 == .02 indica que virtualmente no hay relación entre el coeficiente de correlación r13 .02 indica que virtualmente no hay relación entre el el puesto. Esta conclusion resulta evidente tarnbién cuando se considera sexo y el desempeño en el puesto. Esta conclusión resulta evidente también cuando se considera el hecho de que la media de los Indices de desernpeño para hombres y mujeres es casi igual que la media de los índices de desempeño para hombres y mujeres es casi igual el (5.86 versus 5.75). A prirnera vista, se podria concluir que no es una información Otil el conocer primera podría concluir que no es una información útil si el aspirante es hombre o mujer. No obstante, Ia relación moderada r23== .43, entre el sexo hombre o mujer. No obstante, la relación r23 si aspirante .43, entre el sexo el examen de aptitud, indica que el examen podría discriminar entre y la calificación en el examen de aptitud, indica que el exarnen podrIa discriminar entre los la calificación sexos. Los hombres parecen calificar mejor que las mujeres (82 versus 64). Quizá exista un sexos. Los hombres parecen calificar mejor que las mujeres (82 versus 64). Quizá exista un elemento elemento de fuerza en el examen, que no existe en el puesto. examen, no existe en el puesto. Cuando se emplean tanto el sexo como el resultado del examen para pronosticar Cuando se emplean tanto el sexo como ci resultado del examen para pronosticar el desempeño en el trabajo, se explica el 92% de la varianza. Este resultado sugiere que ambas la varianza. Este resultado sugiere ambas desempeño en trabajo, ValidaciOn del modelo Validación modelo 271 variables hacen una valiosa contribución en Ia predicción del desernpeño. El examen de aptitud la desempeño. explica la el examen agregan explica el 77% de Ia varianza y ci sexo en conjunción con los resultados del exarnen agregan 11.86 y 4.84, se incluirán ambas variables otro 15%. Si se prueban los valores calculados de t, 11.86 Y-4.84, se incluirán anibas variables en la ecuación final. final. VALIDACION DEL MODELO VALIDACIÓN DEL ahora, se ha verificado la validez de las suposiciones inherentes al modelo Hasta ahora, no se ha verificado la validez de las suposiciones inherentes a! modelo de regresión. Ahora es ci momento de abordar aquellas situaciones en las que se violan las se violan las regresión. Ahora es el momento de abordar aquellas situaciones con-ectivas suposiciones e investigar las técnicas correctivas adecuadas. suposiciones la estadística Las suposiciones se enlistan en el recuadro de Ia sección "Inferencia estadIstica en la regresión multiple", presentado anteriormente en este capItulo. La primera suposición de primera suposición de múltiple", anterionnente capítulo. norrnaiidad se requiere para efectuar pruebas t y F, y se abordó en ci cap. 6. En realidad, Y se abordó en el cap. 6. En realidad, nonnalidad requiere para efectuar pruebas cuando el tamaño de la muestra es lo suficientemente grande (30 o rnás elernentos), el la muestra es lo suficientemente grande (30 o más elementos), el cuando ci tamaño límite central proporciona un razonamiento estas pruebas estadísticas teorema del limite central proporciona un razonarniento para usar estas pruebas estadIsticas sin la suposición de normalidad. suposición de nonnalidad. La segunda suposición se refiere a la dispersion de los puntos de datos de ia población dispersión de la población alrededor del plano de la pobiación. El analista supone que Ia dispersión de puntos de datos población. la dispersion airededor permanece constante en cuaiquier sitio a través del piano. Si en permanece constante en cualquier sitio a través del plano. Si en una situación dada no hay situación varianza constante, existe Este concepto se expondrá en la una varianza constante, existe heteroscedasticidad. Este concepto se expondrá en la siguiente sección. sección. La tercera suposiciOn implica una muestra aleatoria de puntos de datos X-Y. Pero, por suposición implica una muestra aleatoria do puntos de datos XY. Pero, ejemplo, los datos económicos ordenados en una serie histól;ca no se pueden siempre ejemplo, los datos econórnicos ordenados en una serie histórica no se pueden siempre considerar como aleatorios. Es decir, considerar como aleatorios. Es decir, una observación de precio en un periodo dado, está observación de precio periodo dado, está por lo regular correlacionada con el valor del periodo anterior. Para describir esta situación lo regular correlacionada el 9. se usa ci término correlación en serie, la cual se abordará con amplitud en ci cap. 9. el término correlación en serie, Ia cual se abordará con amplitud La cuarta suposición indica una relación lineal, ésta es una importante suposición de indica relación lineal, ésta es que ci modelo está correctarnente especificado. La graficación de los puntos de datos en un el correctamente especificado. un graficacion de diagrama de dispersión es un primer paso invaluable para evitar una mala especificación. invaluable tma mala especificación. diagrarna de dispersion es Con frecuencia aparece una curvatura pronunciada en la gráfica de los puntos de datos X-Y. fi.. ecuencia curvatura pronunciada en Ia gráfica de los puntos de datos XY. En ocasiones se emplea la transformación de datos sobre estos datos curvilIneos de modo emplea la transformación datos sobre estos datos curvilíneos de modo que los datos transformados resuiten lineales. Esta técnica se demostró en el cap. 6. resulten lineales. Esta técnica cap. 6. Heteroscedasticidad La heteroscedasticidad se presenta debido a cambios en las condiciones antecedentes no heteroscedasticidad se presenta debido cambios las condiciones antecedentes no reconocidos en la especificación del modelo. Los cambios que alteran la estructura inherente modelo. que alteran Ia estructura inherente a la economia y los carnbios en leyes o polIticas de gobierno ocasionan con frecuencia la economía y los cambios en leyes o políticas de gobierno ocasionan con frecuencia heteroscedasticidad. Un motivo común de esta condición es ci cambio en La precision de el cambio en la precisión heteroscedasticidad. Un motivo comñn de esta condición mediciones series tiempo datos. las mediciones con respecto a series de tiempo de datos. Existe heteroscedasticidad cuando los errores o residuos no tienen una varianza constante nivel completo valores. constante a través de un nivel completo de valores. 272 y Y y Y Regresión multiple múltiple CapItulo 7 Capítulo 7 ./' - -- -- --- -- - - --- -- --Constante (a) Constarite ./ ./ ./ ./ ./ ./ ./ ./ ./ ./ -- -- -- --- L......---------x x Figura 7.4 7.4 L......---------x x (b) Heteroscedástica (b) Varianza constante y heteroscedástica. y heteroscedástica. En la fig. 7.4 se ilustra el efecto de Ia heteroscedasticidad. La fig. 7.4(a) muestra una la fig. 7.4 se ilustra el efecto de la heteroscedasticidad. La fig. 7.4(a) muestra una Dada X, varianza constante. Dada X, las observaciones de Y se ubican dentro de ill1a banda constante se ubican dentro de una alrededor de la ilnea de regresión. De ahI que la varianza no depende del valor especificado línea regresión. ahí que Ia varianza no depende del valor especificado airededor para X. En la fig. 7.4(b), la varianza se incrementa amnentar X. emplea paraX. En la fig. 7.4(b), la varianza se incrementa al aurnentarX. Si se emplea la ecuación de regresión para pronosticar Y, serã menos probable que los intervalos de confianza de regresión para pronosticar Y, será menos probable que los intervalos de confianza contengan el valor verdadero de la variable Y, para valores grandes de Ia variable X. Esta verdadero la valiable Y, la variable X Esta contengan el el cap. 9. condición se aborda con detalle en el cap. 9. Colinealidad Siempre que aparece más de una variable independiente en una ecuación de regresión, es Siempre que aparece rnás de una variable independiente en una ecuación de regresión, es variables sí. esta situación se le conoce como posible que estas variables estén relacionadas entre si. A esta situación se le conoce corno colinealidad. colinealidad la situación en la que las variables independientes una La colinealidad es la situación en Ia que las variables independientes de una ecuación de múltiple están altamente interconoelacionadas. ecuaci on de regresión multiple están altarnente intercorrelacionadas. análisis, la colinealidad causa problemas en los siguientes aspectos: En un anilisis, la colinealidad causa problernas en los siguientes aspectos: l. Un coeficiente de regresión que tiene signo positivo en una ecuación de regresión de ecuación de regresión de dos variables, pudiera cambiar a signo negativo en una ecuación de regresión multiple múltiple que contenga otras variables con las que está altamente interrelacionado. (El cambio las que está altamente interrelacionado. (El cambio ser a la puede ser también a Ia inversa, de negativo a positivo.) 2. La estimación de los coeficientes de regresión fluctüa marcadamente entre una muestra fluctúa ill1a y otra. Validación modelo ValidaciOn del modelo 273 3. Con fiecuencia se usa la regresión multiple corno una herramienta interpretativa para 3. Con frecuencia se usa la regresión múltiple como interpretativa para evaluar la importancia relativa de varias variables independientes. Cuando las variables de varias variables independientes. Cuando las variables de predicción están intercorrelacionadas, éstas explican la misma varianza en Ia estirnala misma varianza en la estimación de Ia variable dependiente. Por esta razón, resulta en extremo difícil separar las la vatiable dependiente. Por esta razón, resulta en extremo dificil separar las ción influencias individuales de cada una de las variables independientes. las problemas exploran en el ejemplo siguiente: Estos problernas se expioran en ci ejemplo siguiente: EjempJo Ej empl o Se desarrolla una ecuación de regresión múltiple a partir de los datos que se presentan en Ia desalTolla ecuación regresión rnñltiple a partir de los se presentan en la tabla 7.8. Se pronostica el gasto en alirnentos a paltir del conocimiento de su relación con las pronostica ci gasto en alimentos a partir del conocimiento de su relación con tabla 7.8. variables de ingreso y tarnaflo de la familia. Una rápida revisión de la matriz de correlación variables de ingreso tamaño de Ia familia. Una rápida revision de matriz de cOlTelación la tabla 7.9, conduce a las siguientes conclusiones: estas variables, para estas variables, dada en Ia tabla 7.9, conduce a las siguientes conclusiones: l. Tanto ci ingreso como ci tamaño de Ia farnilia están relacionados en forma positiva con el el ingreso como el tamaño de la familia están relacionados en forma positiva gasto = gasto en alimentos y tienen potencial corno buenas variables de predicción (r12 = .88 y tienen potencial como de predicción Y r13 = .74). rl3 = .74). .87) Y 2. El ingreso y ci tamaño de Iala familiaestán altamente interrelacionados (r73 = .87) y El ingreso y el tamaño de familia están altamente interrelacionados (r23 la del gasto en alimentos. probablemente estén explicando la misma porción probablemente estén explicando Ia misma porción de Ia varianza del gasto en alimentos. de regresión múltiple para este ejemplo es La ecuación de regresión mñltiple para este ejemplo es 7.7 y 3.52 + 2.28X 2 .41X~ Y = 3.52 + 2.28X2 -- .41X Nótese que el coeficiente de regresión negativo (-.41) para Ia variable tarnaño de la familia ci coeficiente de regresión negativo (.41) para la variable tamaño (X3).Este coeficiente sugiere que un incremento de una persona en una farnilia, manteniendo Este coeficiente sugiere que un incrernento de una persona (X3 ). familia, disminuye en $41 el constante ci ingreso anual, disininuye en $41 el gasto anual estirnado en alimentos, sin importar el anual estimado $10 000 $20 000. resultado no lógico, especial el familiar si ci ingreso familiar es de $10 000 o $20 000. Este resultado no es lógico, en especial si se alimentos observa que en Ia rnatriz de correlación el tamaño de la familia y ci consumo de alirnentos la matriz de correlación el tamaño de la familia y el consumo observa que están rclacionados positivainenfe (r13 = .74). estin relacionados positivamente (r13 .74). 7.8 TABLA 7.8 DATOS PARA EL EJEM PLO 7.7 EL EJEMPLO DATOS GASTO ANUAL EN GASTO ALIMENTOS (CIENTOS DE DOLARES) DÓLARES) (CIENTOS INGRESO ANUAL (MILES DE DOLARES) DÓLARES) X2 X2 11 TAMAIO DE TAMAÑO DE FAMILIA, LA FAMILIA, X3 X3 6 2 1 1 3 5 5 4 2 2 3 3 FAMILIA A B B C e Y Y 24 8 16 18 24 23 11 11 15 21 20 3 4 D E F G H I 1 J J 7 9 8 5 7 8 7 2 274 TABLA 7.9 7.9 Regresión múltiple Regresian müItipe SALIDA DE COMPUTO PARA EL EJEMPLO 7.7 CÓMPUTO EJEMPLO STANDARD DEVIATION 2.38 1. 56 1.56 5.5 CapItuto Capítulo 7 VARIABLE NO. NO. 2 2 3 3 MEAN 6.9 3.0 18.0 CORRELATION X VS y .884 .737 REGRESSION COEFFICIENT 2.28 -0.41 STD ERROR COMPUTED OF REG. COEF. T VALUEX VS Y REG. COEF. 0.81261 1.23603 2.80 -0.33 DEPENDENT 1 1 INTERCEPT INTERCEPT OF STD. ERROR OF STD. ESTIMATE 3.52 2.89 MULTIPLE CORRELATION R SQUARED R SQUARED CORRECTED R SQUARE R CORRELATION MATRIX .886 0.785 0.723 EXPENDITURES EXPENDITURES EXPENDITURES INCOME SIZE 1. 00 1.00 INCOME .88 .88 SIZE .74 1. 00 1.00 .87 .87 1. 00 1.00 Nótese también que cuando se usa solo ci ingreso para estirnar el gasto en alirnentos, se también cuando sólo el ingreso para estimar alimentos, se el 78.1% (.884 2) la Al agregar el tamaño de la familia, R2 solo explica ci 78.1% (.8842) de Ia varianza. Al agregar ci tamaflo de Ia farnilia, R2 sólo aumenta 78.5%. Resulta evidente que el tamaño de la familia está explicando la misma varianza que a 78.5%. Resulta evidente que ci tarnaflo de Ia faniilia está explicando la misma varianza que ingreso. el ingreso. tilla colinealidad extrema, no hay fonna aceptable de realizar lID análisis Cuando existe una colinealidad extrema, no hay forma aceptabie de realizar un anáiisis regresión múltiple mediante conjlIDto dado de variables independientes. Las dos de regresión multiple mediante el conjunto dado de variables independientes. Las dos soluciones que se sugieren son: (1) usar en Ia ecuación final solo una de las variables las variables soluciones que se sugieren son: (1) usar en la ecuación final sólo una altamente cOlTelacionadas, crear utilizar una nueva variable que sea una combinación altarnente correlacionadas, o (2) crear y utilizar una nueva variable que sea una cornbinación de las dos variables altarnente interrelacionadas. las dos variables altamente interrelacionadas. SELECCIÓN DE LA MEJOR ECUACIÓN DE REGRESION SELECCION DE LA MEJOR ECUACION DE REGRESIÓN ¿Cómo se hace para desarroilar Ia mejor ecuación de regresión multiple, pam pronosticar desarrollar la múltiple, para Córno se interés? comprende selección lID conjunto completo una variable de interés? El primer paso comprende la selección de un conjunto completo variables potenciales predicción. Se incluye cualquier variable que pueda agregar de variables potenciales de predicción. Se incluye cualquier variable que pueda agregar precisión al pronóstico. En la selecciOn de la ecuación final, por lo regular se enfrenta el precision a! pronOstico.En la selección de la ecuación final, por lo regular se enfrenta el dilema el pronóstico niás dilerna de proporcionar ci pronOstico más preciso al menor costo. En otras palabras, al elegir al costo. incluir en la ecuación final, el analista debe evaluarlas mediante variables de predicción a incluir en Ia ecuación final, ci analista debe evaluarlas mediante dos criterios opuestos: clitelios opuestos: l. El analista desea que la ecuación incluya variables de predicción como sea posible. 1. El analista desea que la ecuación incluya tantas variables de predicción como sea posibie. Siempre que se incorpora una variable de predicciOn a una ecuación de regresión variable de predicción a ecuación de regresión Siempre que incorpora múltiple, R2 permanece suficienmñltipie, R2 permanece sin cambio o se incrementa. Mientras la muestra sea lo suficiencarnbio o se incrementa. temente grande (se recomienda un tamaño de muestra n de 10 para cada variable temente grande (se recomienda un tarnaflo de muestra n de 10 para cada variable Selección de la mejor ecuación de regresiOn de regresión SelecciOn de Ia 275 empleada en la ecuaciôn), cada nueva variable de predicción tiene el potencial de empleada en ecuación), nueva variable de predicción tiene el potencial mejorar el pronóstico. 2. Corno obtener y monitorear información sobre un gran número de X cuesta dinero, la 2. Como obtener monitorear infonnación sobre un gran nñrnero de Xcuesta dinero, la el ecuación debe contener ci menor número posible de pronosticadores. Por lo regular, nümero de pronosticadores. la ecuación rnás sencilla es la mejor. más La selección de la mejor ecuación de regresión implica por lo regular un acuerdo entre estos extremos y el juicio personal será una parte necesaria de cuaiquier solución. personal cualquier estos extrernos y ci Después de reunir una lista completa de pronosticadores potenciales, el segundo paso de reunir una lista completa de pronosticadores potenciales, el segundo paso consiste en eliminar las variables independientes que no parezcan ser apropiadas. Una vaIiables independientes que no parezcan apropiadas. consiste en eliminar independiente: fundamental variable independiente: (1) pudiera no ser fundamental para el problema (debe haber cierta causalidad plausible entre las variables dependiente e independiente), (2) pudiera estar causalidad plausible entre las variables dependiente independiente), (2) pudiera estar pudiera duplicar otras variables indesujeta a errores de medición considerables, (3) pudiera duplicar otras variables indesujeta errores de medición considerables, pendientes (colinealidad) o, (4) pudiera ser dificil medirla con precision (no datos pendientes (colinealidad) o, (4) pudiera ser dificil medirla con precisión (no hay datos disponibles o son costosos). costosos). disponibles El tercer paso consiste en recortar Ia lista de pronosticadores con ci propósito de el propósito de El tercer paso consiste en recoliar la lista de pronosticadores obtener la "mejor" selección de variables independientes. En la siguiente sección se obtener la "mejor" selección de variables independientes. En siguiente sección se abordarán las técnicas actualmente en uso. No se puede decir que alguno de los procediprocediabordarán las técnicas actualmente en uso. No se puede decir que algino de mientos de bñsqueda dé por resultado el "mejor" conjunto de variables independientes. Dc conjunto de variables independientes. De mientos búsqueda hecho, es frecuente que no haya un ñnico "mejor" conjunto. Para aumentar la confusion, un único "mejor" conjunto. Para aumentar la confusión, hecho, frecuente las diversas técnicas no necesariamente conducen a la misma ecuación final de pronóstico. diversas técnicas no necesariamente conducen a la misma ecución final de pronóstico. Todo ci proceso de selección de variables es en extremo subjetivo. Por esta razón se debe selección de valiables es en extrenlo subjetivo. Por esta razón se debe Todo el analizar como primer paso la rnatriz de correlación, antes de utilizar cualquier procedimienplimer la mattiz con-elación, cualquier procedimiento automático. La principal ventaja de los procedimientos autornãticos de büsqueda es que automático. los procedimientos automáticos búsqueda es que el analista puede enfocar sus juicios sobre las areas centrales del problerna. áreas centrales problema. ci Para dernostrar los diversos procedirnientos de bñsqueda, se presenta un ejemplo diversos procedimientos de búsqueda, se presenta un ejemplo Para demostrar sencillo cinco variables potenciales independientes. sencillo que tiene cinco variables potenciales independientes. Ejemplo 7.8 Pam Weigand, gerente de personal de Ia Zurenko Pharmaceutical Company, está interesada en la interesada en pronosticar si Uflaspirante en particular se convertirá en un buen vendedor. Pam decide emplear un aspirante en particular se convertirá en un buen vendedor. como variable dependiente (Y) las ventas del primer mes y elige las siguientes variables corno variable dependiente (Y) las ventas del primer mes elige las siguientes variables independientes para analizar: analizar: X2 = examen de aptitud X2 = examen de aptitud en ventas X 3 = edad, en años X3 = edad, X4 = calificación en la prueba X4 = calificación en la prueba de ansiedad x.~ = experiencia, X = experiencia, en ai'1os en años X 6 = PPG (punto promcdio de grado ) en secundaria = (punto promedio grado) en secundaria El gerente de personal reiine los datos que se muestran en Ia tabla 7.10 y asigna a su El gerente de personal reúne los datos que se muestran en la tabla 7.10 Y asigna a su analista la tarea de obtcner el "mejor" conjunto de variables independientes para pronosticar obtener "mejor" conjunto de variables independientes pronosticar analista Ia tarea Ia la habilidad en ventas. ventas. 276 TABLA 7.10 7.10 Regresión múltiple RegresiOn mUltiple CapItulo Capítulo 7 DATOS PARA EL EJEMPLO 7.8: ZURENKO PHARMACEUTICAL COMPANY DATOS EJEMPLO ZURENKO PHARMACEUTICAL COMPANY CALIFICACION CALIFICACIÓN EN EN EL EXAMEN DE APTITUD 10 19 27 31 64 CALIFICACIÓN CALIFICACION PPG EXPERIENCIA (EN AOS) (ENAÑOS) 0 DE VENTAS DE UN MES UN (UNIDADES) 44 47 60 71 61 60 58 58 56 66 61 51 51 47 53 74 .65 33 54 39 52 30 58 59 52 56 49 63 61 39 62 78 ENLA EN LA EDAD (EN ANOS) AÑOS) 22.1 PRUEBA DE ANSIEDAD 4.9 3.0 1.5 EN S ECIJNSECUNDARlA DARIA o 1 1 22.5 23.1 O 0 3 3 2 1 81 42 67 48 64 57 24.0 22.6 21.7 23.8 23.8 22.0 22.4 22.6 21.1 10 48 96 75 12 47 20 73 4 9 98 27 59 23 90 34 16 32 94 22.5 22.5 22.2 24.8 22.6 20.5 21.9 20.5 20.8 20.0 23.3 21.3 22.9 22.3 22.6 22.4 23.8 20.6 24.4 25.0 .6 1.8 1.8 3.3 3.2 2.1 6.0 1.8 1.8 3.8 4.5 4.5 .1 .9 4.8 2.3 3.0 .3 2.7 4.4 3.9 1.4 2.7 2.7 2.2 .7 3.1 .6 4.6 1 0 O 0 O 1 1 1 1 1 O 0 1 0 O 3 O 0 0 O I 1 2 2 0 O 1 1 1 2 1 1 2 1 1 3 5 1 1 1 1 1 2.4 2.6 2.8 2.7 2.0 2.5 2.5 2.3 2.8 3.4 3.0 2.7 2.8 3.8 3.7 2.1 1.8 1.5 1.9 2.2 2.8 2.9 2.9 3.2 3.2 2.7 2.7 2.4 2.4 2.6 3.4 2.3 4.0 3.6 El primer paso consiste en obtener, mediante un programa de cómputo, una matriz de consiste obtener, mediante programa cómputo, matriz de El correlación de todas las variables. La matriz proporcionará ci conociniiento esencial con correlación de todas las variables. La matriz proporcionará el conocimiento esencial con respecto a las relaciones básicas entre las variables. variables. respecto el examen de aptitud revisión la correlación la 7.11 revela La revision de Ia matriz de correlación de Ia tabla 7.11 revela que el examen de aptitud la la forma la en ventas, Ia edad, Ia experiencia y el PPG están relacionados en forrna positiva con Ia habiliy pronóstico. calificación de ventas y tienen potencial como buenas variables dad en ventas y tienen potencial como buenas variables de pronóstico. La calificación de la prueba de ansiedad muestra una ligera correlación negativa con respecto las ventas es prueba de ansiedad muestra una ligera correlación negativa con respecto aa las ventas y es probable que un pronosticador importante. Un mayor análisis indica que ci PPG y la probable que no sea un pronosticador importante. Un mayor análisis indica que el PPG y Ia la así la edad, asi como Ia experiencia y Ia edad están interrelacionados. Esta presencia de interrelación la que debe manejarse en el intento por encontrar el mejor conjunto posible de variables es Ia quc debe manejarse en ci intento por encontrar ci mejor conjunto posible de variables explicativas. Selección de Ia mejor ecuación de regresión la TABLA 7.11 TABLA 7.11 277 MATRIZ DE CORRELACiÓN MATRIZ DE CORRELACION PARA EL EJEMPLO 7.8 EJEMPLO 7.8 (1) VENTAS (2) EXAMEN (3) (4) (5) EDAD .798 .79R .228 .22R 1.000 ANSIEDAD -.296 .296 -.222 .222 -.287 - .287 I .000 1.000 EXPERIENCIA .55() .550 .350 .540 -.279 - .279 i .000 1.000 (6) PPG .622 .318 .31R .695 ~.244 (1) Ventas (2) Exarnen Examen (3) Edad (4) Ansiedad (5) Experiencia (6) PPG 1.000 1.000 .676 .676 1.000 - .244 .312 1.000 A continuación se demuestran dos procedimientos: el de todas las regresiones posibles A procediniientos: de regresión por pasos. y el de regresión por pasos. Todas las regresiones posibles Todas las El procedimiento llama a investigar todas las ecuaciones de regreslOn posibles que El procedirniento llama a investigar todas las ecuaciones de regresión posibles que comprendan v31iables independientes potenciales. comienza una ecuacomprendan las variables independientes potenciales. El analista cornienza con una ecuaque no contiene variables independientes analiza cada combinación ción que no contiene variables independientes y analiza cada cornbinación posible con el encontrar el mejor conjtillto de pronosticadores. propósito de encontrar el mejor conjunto de pronosticadores. de todas las regresiones posibles se pueden emplear diferentes criterios Con el enfoque de todas las regresiones posibles se pueden emplear diferentes criterios para comparar las diversas ecuaciones de regresión. Solo expondremos aquí la técnica de las diversas ecuaciones de regresión. Sólo expondremos aqul R2, que pasos. R2, que comprende cuatro pasos. procedimiento plÍmero posible de regresión El procedirniento requiere primero el ajuste de cualquier modelo posible de regresión comprenda la variable dependiente y cualquier número de variables independientes. que comprenda la variable dependiente y cualquier nürnero de variables independientes. Cada variable independiente puede, ya sea estar no en la ecuación (dos posibles Cada variable independiente puede, ya sea estar oo no en la ecuación (dos posibles resultados) y éste es un hecho real para cada variable independiente. De modo que en resultados) y éste un hecho real para cada variable independiente. Dc modo que conjunto, existen 2 ecuaciones (donde ii equivale al nürnero de variables independientes). conjunto, existen 2; ecuaciones (donde equivale al número de variables independientes). Así que si hay ocho variables independientes por considerar (i = 8), entonces se deben Asi que si hay ocho variables independientes por considerar (i = 8), entonces se deben examinar 2; = 256 ecuaciones. exarninar 2 = 256 ecuaciones. El segundo paso del procedimiento consiste en dividir las ecuaciones en grupos, de del procedimiento consiste dividir las ecuaciones en grupos, de acuerdo con el ni.'irnero de parámetros por estimar. con el número de paránietros por estimar. Ejemplo 7.9 En Ia tabla 7.12 se presentan los resultados de Ia ejecución de todas las regresiones posibles la 7.12 se presentan los resultados la ejecución todas las regresiones posibles para ci ejeniplo de la Zurenko Pharmaceutical Company. Nótese que la tabla 7.12 está dividida el ejemplo Phal111aceutical Company. Ia tabla 7.12 grupos de ecuaciones de regresión resultantes. Esta división coincide con el número de en seis grupos de ecuaciones de regresiOn resultantes. Esta division coincide con ci nOrnero de parámetros que con tiene cada ecuación. contiene ecuación. El paso el que está relacionado con la selección de la valÍable (o El tercer paso es el que está relacionado con Ia selección de Ia mejor variable (o variables) independiente(s) para cada grupo de parámetros. La ecuación que tenga Ia R2 más independiente(s) para cada grupo de parrnetros. La ecuación que tenga la R 2 más alta es la mejor. En Ia tabla 7.13 se presenta Ia mejor ecuación de cada uno de los grupos la 7.13 presenta la ecuación de tillO los grupos aita mostrados en la tahia 7.12. la tabla 7.12. El cuarto paso comprende la realización de la decisión subjetiva "¿Cuál ecuación es El cuarto paso comprende Ia realización de la decision subjetiva "Cuál mejor?" Por una parte ci analista desea la R2 más alta posible y por otro, desea la ecuación Por una palie el analista desea la R2 más posibie la ecuación 278 RegresiOn múltiple Regresión multiple Capítulo 7 CapItulo TABLA 7.12 VALORES DE R2 PARA TODAS LAS REGRESIONES 7.12 VALORES R 2 PARA TODAS LAS REGRESIONES ZURENKO PHARMACEUTICAL POSIBLES DE ZURENKO PHARMACEUTICAL VARIABLES INDEPENDIENTES UTILIZADAS NÚMERO NUMERO DE PARÁMETROS PARAMETROS 1 GRADOS DE GRADOS LIBERTAD 29 28 28 28 28 28 27 27 27 27 27 27 27 27 27 27 26 26 26 26 26 26 26 26 26 26 25 25 25 25 25 24 R2 R2 Ninguna 0 O .457 .637 .088 .302 .387 X2 X2 X3 Xj X4 X4 X X, X6 X6 X 2 ,X X2,X j 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 6 X 2 ,X4 X1,X4 X 2 ,X, X),Xs X 2 ,Xó X j ,X4 X,X4 X, X6 Xl'X, X, X Xj,Xc; X4,, X6 X4 X, X4 Xó X4,, X6 X, X6 X" X6 X 2 , Xl' X4 X2,X,X X 2 , Xl' X, X 2 , X;, X6 X7.X,,X6 X, ,X4,, X6 X 2 X4 X, X2 Xr X X,,, X4, X 6 .8948 .479 .569 .641 .642 .657 .646 .324 .409 .527 .8951 .8948 .8953 .575 X 2 , X" X(6 X X, X4, X Xl' Xr X, X, X.4 ,X6 Xj' X Xó X, X6, X6 Xj' X"X 6 X4,X5,X6 X4 , X" X6 .646 .701 .659 .650 .669 .531 .8951 .8955 .8953 .701 .671 X,,X3,X4,X X 2 , Xj' X4 , X, X,,, X, X4,, X6 X 2 Xj' X4 X X,, Xj' X, X ó X 2 , X, X" X X,,, X4, X" X ó X 2 Xr X, X X,X4.X,X6ó Xl' X4 , X" X X,,X,X4,X,X6 X 2 , Xl' X4 , X" Xó .8955 TABLA 7.13 ECUACIONES DE REGRESiÓN TABLA 7.13 LAS MEJORES ECUACIONES DE REGRESION PARA ZURENKO PHARMACEUTICAL PHARMACEUTICAL PARA NÚMERO DE NUMERO DE PARÁMETROS PARAMETROS 1 I VARIABLES INDEPENDIENTES Ninguna GRADOS DE GRADOS LIBERTAD 29 28 27 26 25 24 24 R2 F 2 2 3 3 Xj X2 , X X,,X j X, X" X X 2 , X., Xó Xl' Xl' X4 , X ó 4 5 5 6 X2.X,,X4.X.Xó Xl' X" X4 , X" X 0 O .637 .8948 .8953 .8955 .8955 49.09 66.220 .124 .054 .000 Selección de Ia mejor ecuaciOn de regresiOn la ecuación regresión SelecciOn 279 posible. Se debe también destacar que un tamaflo de muestra de n lOes más sencilla posible. Se debe también destacar que un tamaño de muestra de n = 10 es deseable más no esencial. El enfoque de todas las regresiones posibles supone que n excede regresiones posibles número de parámetros. al nümero de parámetros. Ej emplo Ejemplo 7.10 El analista intenta encontrar el punto en el que no vale la pena mcorporar variables El analista intenta encontrar el punto en el que no vale la pena incorporar variables independientes adicionales en el problema de la Zurenko Pharmaceutical, debido a que conduce de la Zurenko Pharmaceutical, debido que conduce a un muy pequeño incremento de R2. Los resultados de la tabla 7.13 indican claramente que incremento R2. Los resultados de la tabla 7.13 indican claramente que no es necesario agregar variables después de la del examen (X2) y la de edad (X3). Por lo tanto, necesario agregar variables después de la del examen (X2) edad (X]). to la ecuación final es ecuación final Y = b o + b 2X2 + b JX y = b0 + b,X7 + b3XJ explica el 89.48% de la varianza de Y. y explica el 89.48% de la varianza de V. Draper y Smith3 resumen mejor el procedimiento de todas las regresiones posibles: Draper Smith] resurnen mejor el procedimiento de todas las regresiones posibles: En general, no se justifica el análisis de todas las regresiones posibles. Aunque significa que análisis todas regresiones posibles. Aunque significa que En general, no el analista observó todas las posibilidades, también significa que examinó un gran niimero de posibilidades, también número de el ecuaciones de regresión, las cuales un pensamiento inteligente hubiera descartado. El volumen regresión, pensamiento descartado. de tiempo de tiempo de córnputo utilizado es un desperdicio y el esfuerzo fisico de exarninar todas las cómputo utilizado es un desperdicio y el esfuerzo fisico examinar más salidas de cómputo es enorme cuando se examinan más de unas cuantas variables. Es preferible algün esta tarea más corta. algún tipo de procedimiento que haga esta tarea rnás corta. Regresión pasos Regresión por pasos procedimiento al El procedirniento de regresión por pasos incorpora at modelo una variable independiente a la a paso. Mediante este procedimiento puede manejar en la computadora un Ia vez, paso a paso. Mediante este procedimiento se puede manejar en la computadora un número de una ejecución. gran ni'irnero de variables en una ejecución. enfoque secuencia regresión, incorpoEn esencia, este enfoque calcula una secuencia de ecuaciones de regresión, incorporando o eliminando en cada paso una variable independiente. En otras palabras, ci programa el programa individuales de la peor, siempre que de cómputo registra las variables en pasos individuales de la mejor a la peor, siempre que cumplan el criterio estadístico establecido. cumpian con el criterio estadIstico establecido. Se registra prirnero la variable independiene que explica Ia mayor cantidad de Se registra primero la variable independien~e que explica la mayor cantidad varianza en la variable dependiente. La siguiente variable por registrar, explica ~a mayor variable dependiente. siguiente variable por registrar, explica la varianza cantidad conjunción con primera así sucesivamente. se cantidad de varianza en conjunción con la prirnera y asi sucesivamente. En cada paso, se mayOl varianza no explicada registra en Ia ecuación la variable que explica la mayoi cantidad de varianza no explicada la ya está incluida en el modelo. por la variable que ya está incluida en el modelo. Se debe seflalar que algunos prograrnas de regresiôn por pasos permiten que una Se debe señalar que algunos programas de regresión por pasos permiten variable independiente se registre en Ia ecuación en las prim,~ras etapas, para ser eliminada independiente en la ecuación en las prim'ras etapas, para ser eliminada posterionnente debido a su relación con otras variables incorporadas al modelo en etapas variables incorporadas at modelo posteriormente debido a relación subsecuentes. Como una verificación en este paso, se evalúa la estadística parcial F para subsecuentes. Como una verificación en este paso, se evalüa Ia estadistica parcial F para cada variable la ecuación regresión ~~ compara punto cada variable en Ia eduación de regresión en cualquier etapa y s compara con un punto crítico predeterminado, elegido de la distribución F correspondiL Tlte. Esta comparación crjtico predeterminado, elegido de Ia distribución F correspondit.nte. Esta comparación proporciona una verificación de contribución proporciona una verificación de la contribución que hace cada variLble, como si fuera la cada vari. ble, como si fuera la 3 N. R, Draper y H. Smith, Applied Regression Analysis (Nueva York: Wiley, 1966), p. 161. R. Draper y H. Smith, Applied Regression (Nueva York: 1966), 167. 280 Regresión múltiple RegresiOri multiple Capítulo 7 CapItulo variable mãs registrada, sin importar cuándo se registró realmente en ecuación. variable más reciente registrada, sin importar cuándo se registró realmente en la ecuación. Toda variable que no contribuye se elirnina del modelo. no contribuye se elimina del modelo. El proceso por pasos funciona de la siguiente manera. El analista proporciona a! pasos funciona de la siguiente manera. El analista proporciona al El proceso cómputo por la variable dependiente (Y) paquete de córnputo de regresión por pasos la variable dependiente (Y) y diversas variables independientes (X) potencialmente importantes. importantes. Paso 1. La computadora ejecuta todos los modelos posibles de regresión simple modelos regresión simple Paso La computadora ejecuta todos de la forma: fonna: Y=130+132X7+E La variable independiente que produce el mayor valor (absoluto) de tt se emplea como el variable independiente que produce el mayor valor (absoluto) de se emplea corno el mejor pronosticador de Y y se identifica como X 2• Nótese que en el paso 1 la computadora de Y y se identifica como X2. Nótese que en el paso I siempre eligirá Ia variable independiente que tenga la correlación (absoluta) más alta con siempre eligirá la variable independiente que tenga correlación (absoluta) más alta dependiente. la variable dependiente. Paso 2. La computadora ajusta todos los modelos posibles de dos variables que La computadora ajusta todos los modelos posibles de variables Paso X 2 • Se ejecuta cada una de las en combinación con contengan X2. Se ejecuta cada una de las otras variables independientes en combinación con X,, para liegar a la forma: X 2, llegar la forma: Y= + /32X1 + + valiable independiente que produce el mayor valor (absoluto) de y Se retiene la nueva variable independiente que produce el mayor valor (absoluto) de tt y se utiliza para predecir Y en conjunción con X2. Este nuevo pronóstico se identifica como predecir Yen conjunción con X 2 . Este nuevo pronóstico se X3. Nótese que aunque X3 estará correlacionada con Y, no estará altamente correlaciono X 3 • Nótese aunque X 3 estará con altamente correlacionada con X 2 nada con X-,.• que es probable que X 2 X3 estén correlacionadas en cierto grado Debe notarse que es probable que X2 y X 3 estén correlacionadas en cielio grado y que inclusión de X 3 modifica valor de ~ los mejores la inclusion de X3 modifica el valor de ,L1,yy su estadIstica t. Algunos de los mejores su estadística t. Alglmos cómputo velifican nuevo /32 para asegurar que sigue siendo lo suficienteprogramas de córnputo verifican de nuevo /2 para asegurar que sigue siendo lo suficienteútil como pennanecer así, Ia computadora busca la mejor mente ütil corno para permanecer en el modelo. Si no es asI, la computadora busca la mejor modelo. de remplazo. variable de remplazo. Paso computadora ajusta todos los modelos posibles de Paso 3. La computadora ajusta todos los modelos posibles de tres variables que X 2 y X3. Se ejecuta cada una de las variables combinación con contengan X-, y X 3. Se ejecuta cada una de las variables independientes en combinación con X 2 y X3 para ilegar forma: X2 y X; para llegar a la forma: Y = ,B + /32X7 + f33X3 + 134X4 + E valiable independiente que pronostica el (absoluto) y Se retiene la variable independiente que pronostica el mayor valor (absoluto) de t y retiene se emplea para pronosticar Y en conjunción con X2 y X3. Este nuevo pronosticador se se emplea para pronosticar Y en conjunción con X 2 X 3. Este nuevo pronosticador identifica corno X4. Nótese que, alillque X4 está correlacionado con Y, no estará altarnente como X 4 • Nótese que, aunque Xt está correlacionado Y, altamente correlacionado X3 correlacionado con X 2 o X3.• El proceso por pasos continua hasta liegar a! paso donde ninguna de las variables continúa llegar al paso donde ninguna restantes tiene un coeficiente /3 que sea diferente de cero en forma significativa en alg(tn coeficiente que cero en fonna significativa en algíill nivel al fa. En este punto, la computadora no pl~ede incorporar una nueva nivel especificado de alfa. En este punto, la computadora no piiede incorporar una nueva Y. Por lo tanto, el resultado del procedimiento variable que contribuya al pronóstico de Y. Por 10 tanto, el resultado del procedirniento por Selección la ecuación SelecciOn de Ia mejor ecuaciOn de regresión 281 pasos pasos es un modelo que solo contiene variables independientes con valores que son un modelo que sólo contiene variables independientes con valores que son significativos nivel de significación especificado. significativos en el nivel de significacion especificado. se ilustra en el ejemplo 7.11. El procedirniento por pasos se ilustra en el ejemplo 7.1 1. procedimiento Ejemplo 7.11 el problema como funcionaría programa Ahora, paso a paso, el problema de Zurenko está resuelto, tal y como funcionarIa un programa pasos. de regresión por pasos. Pam examina Ia matriz de correlación que se muestra en 7.11 Y decide que al Pam examina la matriz de correlación que se muestra en la tabla 7.11 y decide que al ejecutar ci análisis de regresión por pasos, Ia variable edad se registrará primero en el modelo, el la registrará primero en el modelo, ventas (r13 = .798) y explicará el ya que tiene Ia mayor correlación con ventas (ru = .798) y explicará el 63.68% (.7982) de la la correlación (.798 2) de la varianza de las ventas. ventas. Ella advierte que Ia caiificación en el examen de aptitud se registrará en segundo lugar Ella advierte que la calificación en el examen de aptitud se registrará en segundo lugar relacionada (rl,2 .676), pero no altamente en el modelo, ya que está fuertemente relacionada con las ventas (r1,2== .676), pero no altamente niodelo, relacionada con variable (r2,3 = contemplada relacionada con la variable edad (r23= .228) contemplada en el modelo. Pam también nota que las otras variables no califican como buenas variables de pronóstico. buenas variables de pronóstico. La calificación en la prueba de ansiedad no será un buen pronosticador debido a que no está calificación en Ia prueba de ansiedad no será un buen pronosticador debido a que no bien relacionada con las ventas (r14 = .296). Las variables de experiencia y PPG tienen relacionada con las ventas (r1.4 -.296). Las variables de experiencia y PPO tienen potencial como buenas variables de pronóstico (r15 = .550) Y (r16 = .622). Sin embargo, ambas (r1.5 = y (r1.6 = .622). tienen tienen un problema de colinealidad niñltiple con Ia variable edad (r35 = .540) y (r36 = .695). colinealidad múltiple la variable (r3,5 .540) Y (r3,6 = .695). Los comandos de Minitab para ejecutar un análisis de regresión por pasos para ci ejemplo el análisis 7.11 se demuestran en Ia secciOn "Paquete de cómputo Minitab" al final del capitulo. La salida la sección "Paquete de cómputo capítulo. La salida 7.11 para esta ejecución de regresión por pasos se muestra en Ia tabla 7.14. esta ejecución de regresión se muestra en la tabla 7.14. SALIDA DE MINITAB DE TABLA 7.14 7.14 SALIDA DE MINITAB DE LA REGRESION POR PASOS REGRESiÓN POR PASOS EL EJEMPLO 7.11 DE ZURENKO PHARMACEUTICAL PARA EL EJEMPLO 7.11 DE ZURENKO PHARMACEUTICAL STEPWISE STEPWISE REGRESSION OF SALES ON 5 PREDICTORS, WITH N = 30 5 PREDICTORS, WITH N 30 STEP CONSTANT AGE T-RATIO APTITUDE T-RATIO S S 1 1 -100.85 100 .85 6.97 7.01 2 2 -86.79 86 .79 5.93 10.60 0.200 8.13 6.85 63.70 R-SQ R- SQ 3.75 89.48 Aunque Ia salida del proceso por pasos de Minitab contiene estadIsticas t, en reaiidad la estadísticas realidad Minitab utiliza Ia estadIstica F para decidir si se debe incorporar una variable al modelo. se debe incorporar una variable al modelo. Minitab utiliza la estadística F En este punto debe mencionarse que existe una relación matemática entre las estadisticas tt mencionarse estadísticas y F (t2 = F). En cada paso, el programa Minitab calcula i.ma estadística F para cada una de (f cada paso, el programa Minitab calcula una estadIstica F una de el modelo. La variable la estadística se incorpora las variables que no está en el modelo. La variable con Ia mayor estadIstica F se incorpora al modelo, siempre que dicha estadIstica sea mayor que el valor lImite de corte especificado; estadística límite a menos que se especifique otro valor). en este ejemplo, FENTER = 4.2 (se usa F = 4 a menos que se especifique otro valor). El ejemplo, FENTER = 4.2 (se usa en 282 Regresion multiple Regresión múltiple Capítulo 7 CapItulo procedimiento pasos Minitab realiza una verificación para asegurar que aún sean procedimiento por pasos de Minitab realiza una verificación para asegurar que aiin sean válidas las variables incorporadas al modelo en pasos anteriores. las variables incorporadas al modelo en pasos anteriores. En el anáiisis por pasos se procede de Ia siguiente manera: análisis se procede de la siguiente manera: Paso 1. 1. es: El modelo después del paso uno es: Ventas = -100.85 + 6.97 (edad) Ventas = 100.85 + 6.97 (edad) 68.70% la varianza las ventas y tiene la mayor estadística Este modelo explica el 68.70% de Ia varianza de las ventas y tiene la mayor estadistica F, F = 49.14. Como 49.14 es mayor que 4.2, Ia edad se incorpora al modelo. = Como 49.14 es mayor que 4.2, la edad se incorpora al modelo. Si el análisis se realiza utilizando la estadística tt de la salida, las hipótesis nula y utilizando la estadIstica de la salida, las hipótesis nula y Si análisis alternativa para detenninar si el coeficiente de regresión de la edad es diferente de cero en alternativa pam deterrninar si el coeficiente de regresión de la edad es diferente de cero en forma significativa, son forma significativa, on H0: Ha: H1: H¡: f3 2 = O 1320 f3 =f=. O /320 2 nivel de significación .05, la estadística 28 Si la prueba se realiza a un nivel de significación de .05, Ia estadistica t basada en 28 (/1 grados de libertad (n -- k = 30 - 2) es 2.048. La regla de decision es 2) es 2.048. La regla de decisión es grados Si la estadIstica calculada es mayor que 2.048 menor que 2.048, hipótesis nula Si la estadística tt calculada es mayor que 2.048 oomenor que -2.048, rechazar la hipótesis nula (rechazar H0 sit> 2.048 (rechazar Ho si t > 2.048 o t <-2.048). < -2.048). Como Ia estadistica t calculada que se muestra en Ia salida de Minitab, 7.01 (t2 = la estadística caiculada que la salida de Minitab, 7.01 (2 = = 49.13), es mayor que el valor crítico (7.01 > 2.048), se rechaza la hipótesis nula. El F = 49.13), es mayor que ci valor crItico (7.01 > 2.048), se rechaza la hipótesis nula. El coeficiente de regresiOn de la variable edad es diferente de cero en forma significativa. forma significativa. coeficiente regresión de la variable edad es diferente El reSultadOsignifica que la edad es una buena variable y ci procedimiento continña con el procedimiento continúa con El resultado significa que Ia edad es una el paso 2. Paso 2. Paso es: El modelo después del paso dos es: Ventas = -86.79+ 5.93 (edad) + 0.200 (aptitud) Ventas = 86.79 + 5.93 (edad) + 0.200 (aptitud) Este modelo explica el 89.48% de Ia varianza de las ventas. Las hipótesis nula y altemativa la alternativa determinar Si ci regresión calificación el examen para determinar si el coeficiente de regresión de la calificación en ci exarnen de aptitud es diferente de cero en forma significativa, son: fonna significativa, son: diferente H0: Ha: H1: H¡: /33=0 f3 3 = O /331'0 f3 3 t O Si la prueba se realiza en un nivel de significación de .05, Ia estadIstica critica de I Si ia prueba realiza nivel de significación .05, la estadística crítica t con base en 27 grados de libertad (/1 -- k = 30 - 3) es 2.052. La regia de decision es 27 grados de libertad (n k 3) es 2.052. La regla de decisión Si la estadística t calculada es mayor que 2.052 o menor que -2.052, rechazar Ia hipótesis nula Si estadIstica calculada es mayor que 2.052 o menor que 2.052, rechazar la hipótesis Ho si t > 2.052 I <-2.052). (rechazar H0 sit> 2.052 o t < -2.052). Selección de Ia mejor ecuaciOn de regresiOn Selecciôn de la mejor ecuación de regresión 283 que el valor calculado que se encuentra la salida Minitab es 8.13, se Ya que el valor calculado de t que se encuentra en Ia salida de Minitab es 8.13, se rechaza hipótesis nula. coeficiente regresión calificación en el examen rechaza la hipótesis nula. El coeficiente de regresión de la calificaciOn en el examen de aptitud es diferente de cero en forma significativa. El resultado significa que la calificación la calificación en el exarnen de aptitud es una buena variable cuando se utiliza en conjunción con la edad. examen es una buena vmiable cuando se utiliza en conjunción con la edad. Nótese que índice el coeficiente de regresión de la variable edad, 10.6, es ain Nótese que el Indice t para el coeficiente de regresión de la variable edad, 10.6, es 3ím significativo. El procedimiento continña con significativo. El procedimiento continúa con el paso 3. Paso Paso 3. La computadora ajusta todos los modelos posibles de tres variables que computadora ajusta todOs los modelos posibles de tres variables contengan X-, X3. Ninguna de las variables restantes es significativa al ejecutarlas contengan X 2 yy X 3• Ninguna de las variables restantes es significativa al ejecutarlas en con X 2 X3, asI que concluye el procedimiento combinación con X2 y X 3 , así que concluye el procedirniento por pasos. realidad, desarrolla el mejor modelo de tres variables y descarta, que En realidad, se desarrolla el mejor modelo de tres variables y se descarta, ya que ninguno de los Indices t resulta significativo. El mejor modelo de tres variables es: significativo. El variables es: los índices Ventas = -89.42+ 6.12 (edad) + 0.202 (aptitud) - .592 (PPG) 89.42 + 6.12 (edad) + 0.202 (aptitud) .592 (PPG) Este modelo explica el 89.50% de la v31ianza de ventas. Las hipótesis Este modelo explica el 89.50% de Ia varianza de las ventas. Las hipótesis nula y alternativa para detenninar si el coeficiente de regresiôn del PPG es diferente de altemativa para deterrninar si el coeficiente de regresión del PPG es diferente de cero en son: forma significativa, son: H0: H o: {36 = O 1360 {36 O 1360 =1=- H1:: H1 efectúa la pmeba en un nivel de significación de .05, la estadística crítica de Si se efectña la prueba en un nivel de significación de .05, la estadIstica crItica de tt basada en 26 grados de libertad (n -- k = 30 - 4) es 2.056. La regla de decision es: de libertad (11 4) es 2.056. La regla de decisión es: Si la estadIstica tt calculada es mayor que 2.056 oomenor que -2.056, rechazar la hipótesis nula hipótesis nula estadística calculada es mayor que 2.056 menor que 2.056, (rechazar H0 t > 2.056 o <-2.056). (rechazar H o sisit> 2.056 o t < -2.056). Si ejecuta este paso, el valor calculado de en Ia salida de Minitab -.36. La Si se ejecuta este paso, el valor calculado de t ten la salida de Minitab eses .36. La hipótesis nula no se rechaza. El coeficiente de regresión de la variable PPG no es diferente hipótesis regresión de de cero en forrna significativa. El resultado significa que el PPG no es una buena variable fonna significativa. El resultado significa que el PPG no cuando cuando se utiliza en conjunciôn con Ia edad y la calificación en el exarnen de aptitud. conjunción la calificación examen aptitud. Notas finales sobre Ia regresión por pasos la regresión por pasos Notas regresión en extremo fácil también La técnica de regresión por pasos es en extrerno fácii de usar. Por desgracia, tarnbién es en extremo fácil de usar equivocadamente. A menudo, los analistas que desarrollan un modelo extrerno fácii de equivocadarnente. A menudo, los analistas que desarrolian un modelo de regresión generan un gran conjunto de variables independientes potenciales y dejan regresión generan un gran conjunto de variables independientes potenciales dejan después el procedimiento de regresión por pasos detenninc cuáles son significativas. después que el procedimiento de regresión por pasos determine cuáles son significativas. problema El problerna consiste en que cuando se analiza un gran conjlmto de variables independientes conjunto esto es probable dé por resultado un error de tipo I. se realizan muchas pruebas de t y esto es probable que dé por resultado un error de tipo I. pmebas se razón, el modelo final pudiera contener una variable que no esté relacionada en Por esta razón, ci modelo final pudiera contener una variable que no esté relacionada en forma lineal con Ia variable dependiente, pero que se incorporó al modelo por mera forma lineal la variable dependiente, pero que incorporó modelo por mera casualidad. 284 Regresión múltiple RegresiOn müItpIe Capítulo 7 segundo problema comprende la selección inicial de variables independientes Un segundo problema comprende Ia selección inicial de variables independientes potenciales. Al elegir estas variables, con frecuencia se omiten términos orden alto potenciales. Al elegir estas variables, con frecuencia se omiten términos de orden alto (curvilíneos, no lineales y de interacción), para mantener manejable el niijnero de variables. número de variables. (curvilIneos, no lineales y podrian omitir valiables En consecuencia, se podrIan ornitir inicialmente del modelo diversas variables importantes. del Resulta la selección intuitiva del analista, de las variables independientes, es Resulta obvio que Ia selección intuitiva del analista, de las variables independientes, es crítica desalTollo de un modelo de regresión exitoso. crItica para el desarrollo de un rnodelo de regresión exitoso. USO DE LA REGRESION PARA PRONOSTICAR DATOS ESTACIONALES REGRESIÓN PRONOSTICAR DATOS ESTACIONALES USO En el cap. 8 se presentará un modelo de series de tiempo multiplicativo,en el que la En cap. 8 se presentará un modelo de series de tiempo multiplicativo, en el que la fluctuación estacional será proporcional al nivel de la tendencia, para cada observación. fluctuaciôn estacional será proporcional al nivel de Ia tendencia, para cada observación. Esta sección presenta un modelo de selies de tiempo de agregación, en ci que una cantidad sección presenta un modelo de series de tiempo de agregación, el agrega a la estimación de la tendencia de la serie histórica, correspondiente al constante se agrega a Ia estimación de Ia tendencia de Ia serie histórica, correspondiente a! incremento esperado en el valor de la variable dependiente debido a factores estacionales. la variable dependiente factores estacionales. incremento esperado en el En ci modelo nmltiplicativo, la estimación de Ia tendencia se multiplica por un porcentaje el modelo multiplicativo, la estimación de la tendencia se multiplica por un porcentaje fijo. En el modelo de agregación, se agrega una cantidad constante a la estimación de la agregación, se agrega cantidad constante a estimación de Ia fijo. En modelo tendencia. La ecuación 7.6 se emplea para hacer una regresión de datos trimestrales tendencia. La ecuación 7.6 se emplea para hacer lUla regresión de datos tlimestrales mediante este método. método. - b0 + b2S2 + b3S3 + b4S4 en donde (7.6) Yt = valor del pronóstico y para el periodo t periodo = y 52 = I si t es el primer trimestre del año; 0 en caso contrario es el plimer tlimestre O en caso contrario S2 = 1 53 = 1 S3 = 11 segundo trimestre del ao; en caso contralio si t es el segundo trimestre del año; 0Oen caso contrario 54 = si el tercer trimestre del año; O en caso contrario S4 = 1 si t es ci tercer trimestre del año; 0 en caso contrario b a = constante b0 = b 2, b3, b4 = coeficientes de regresión b,, b 3, b4 = coeficientes 52, 53 y S4 son variables ficticias que representan primero, tercer Las variables 8,, S3 Y 54 son variables ficticias que representan el prirnero, segundo y tercer trimestres, respectivarnente. Nótese que los cuatro niveles de la variable cualitativa se trimestres, respectivamente. Nótese que los cuatro niveles de Ia variable cualitativa se sólo ficticias. la describen solo con tres variables ficticias. Esto se debe a que Ia media del cuarto trimestre se contabiiizará mediante Ia intersecciOn b0. Si S2, 53 Y 54 son todos igual a cero, el cuarto contabilizará mediante la intersección ba. 52> S3 y S4 son todos igual a cero, el trimestre se representa mediante ba trirnestre se representa mediante b0.. Ejemplo 7.12 James Brown, pronosticador de Ia Washington Water Power Company, intenta pronosticar el pronosticador de la Washington Water Power Company, intenta pronosticar el James consumo eléctrico de clientes residenciales para 1994. Como sabe que los datos consumo eléctrico de clientes residenciales para 1994. Como sabe que los datos son estaciola para desariollar su modelo de regresión estacional. nales, decide emplear Ia ecuación 7.6 pal-adesarrollar su modelo de regresión estacional. James reüne datos trimestrales de 1980 a 1993. En tabla 7.15 reúne datos trimestrales de 1980 a 1993. En la tabla 7.15 se muestran los datos de consumo muestran consumo eléctrico, medidos em millones de kilowatthoras. eléctrico, medidos em millones de kilowatt-horas. Uso de Ia regresión para pronosticar datos estacionales la regresiOn para pronosticar datos DATOS CONSUMO ELÉCTRICO DE LA WASHINGTON WATER POWER TABLA 7.15 TABLA 7.15 DATOS DE CONSUMO ELECTRICO DE LA WASHINGTON WATER POWER COMPANY, COMPANY, 1980-1993, PARA EL EJEMPLO 7.12 PARA EL EJEMPLO 7.12 KILOWATTS MILLONES) (EN MILLONES) 1071 285 AÑO AIO TRIMESTRE TRJMESTRE AÑO ANO TRIMESTRE KILOWATTS (EN MILLONES) 1980 1 1 1987 1 1 2 2 3 3 4 4 1981 1 1 648 480 746 965 2 2 3 3 4 1 2 2 3 3 4 4 1 2 2 3 3 4 1 2 2 3 3 4 4 1 2 2 3 3 4 4 1 2 2 3 3 4 4 1 2 2 3 3 1 1 1988 2 2 3 3 4 1982 1 1 2 2 3 3 4 1 2 2 3 3 4 1 2 2 3 3 4 4 1 2 2 3 3 4 1 2 2 3 3 1 1 1983 1984 1985 1 1986 1 661 501 768 1065 667 486 780 926 618 483 757 1047 667 495 794 1068 625 499 850 975 623 496 728 1989 1990 1 1991 1 1992 1 1993 1 933 582 490 708 953 604 508 708 1036 612 503 710 952 628 534 733 1085 692 568 783 928 655 590 814 1018 670 566 4 Fuente: Washington Water Power Annual Report, varios años Power Annual Report, varios años James crea las variables ficticias Sb S3 y S4' que representan el primero, James crea las variables ficticias S2, S3 y S4, que representan el primero, segundo y tercer tercer trirnestres, respectivarnente. Los datos para los cuatro trirnestres de 1980 trimestres, respectivamente. Los datos para los cuatro trimestres de 1980 son Yr Yr S2 52 1 S3 53 54 54 1071 648 480 746 1 o O 0 O 0 0 o o 0 0 O 1 1 O 0 O 0 1 1 O 0 James registra todos los datos de la tabla 7.15 en un archivo y utiliza Minitab para realizar 7.15 el análisis. el estacional Los comandos de Minitab para ejecutar el análisis estacional son 286 Regresión múltiple RegresiOn multiple Capítulo 7 Capitulo 7 MTB MTB > READ 'USAGE.DAT' C1-C4 READ 'USAGE.DAT' C1-C4 55 ROWS READ 55 READ ROW 1 1 2 2 3 3 4 4 S C1 Cl 1071 648 480 746 S C2 1 C3 O 0 C4 C3 0 0 0 1 O 0 O 0 0 O 1 1 O O O O 0 1 1 O 0 MTB > > MTB > > SUBC> SUBC> SUBC> SUBC> SUBC> SUBC> NAME C1 NAME Cl REGRESS REGRESS PREDICT PREDICT PREDICT PREDICT PREDICT 'USAGE' C2 '1ST QT' C3 '2ND QT' C4 '3RD QT' 'USAGE' C2 '1ST QT' C3 '2ND QT' C4 '3RD QT' Cl 3 PREDICTORS C2-C4; C1 3 C2-C4; 0 0 0; O O O; 1 0 0; 1 O O; 0 1 0; O 1 O; O O 1; 0 0 1; The regression equation is is The USAGE = 768 + 236 1ST QT - 125 2ND QT - 249 3RD QT 768 1ST 249 USAGE 125 - - Predictor Constant 1ST QT QT 2ND QT 3RD QT s = 43.12 5 43.12 Coef 768.46 235.61 -125.46 125.46 -248.68 248.68 R-sq Stdev 11.96 16.61 16.61 16.61 t-ratio 64.25 14.19 14.19 -7.55 7.55 -14.97 14.97 P 0.000 0.000 0.000 0.000 t 95.0% 95.0% R-sq(adj) = 94.7% Analysis of Variance of Variance SOURCE Regression Error Total SOURCE 1ST QT 2ND QT QT 3RD QT Fit 768.46 1004.07 643.00 519.79 DF 3 3 51 54 DF 1 1 1 1 1 1 SS 1794906 94835 1889741 1889741 SEQ SS 1377949 112 416845 95% C.I. C.I. 744.45, 792.48) 744.45, 792.48) 95% P.1. P.I. 678.60, 858.32) 678.60, 858.32) MS 598302 1860 1860 F 321.75 P P 0.000 Stdev.Fit 11.96 11.52 11.52 11. 52 ( ( 980.93,1027.21) (980.93,1027.21) ( 914.44,1093.70) (914.44,1093.70) ( 619.86, 666.14) 619.86, 666.14) 732.63) 553.37, 732.63) 11 .52 11.52 496.64, 542.93) (496.64, 542.93) 430.16, 609.42) (430.16, 609.42) MTB MTB > STOP Pronósticos econométricos PronOsticos econométricos 287 • El cornando READ se usa para almacenar los datos almacenados en el archivo El comando READ se usa para almacenar los datos almacenados en el archivo USAGE.DAT, en las columnas Cl C4. USAGE.DAT, en las columnas Cl a C4. El comando NAME emplea • El comando NAME se emplea para dar nombre a las variables. variables. • El comando REGRESS se utiliza para desan-ollar una ecuación de regresión, con Cl como REGRESS se utiliza para desanollar como ecuación de regresión, con la variable dependiente y C2, C3 y C4 como las variables independientes. variables independientes. variable dependiente C2, C3 • Los subcomandos PREDICT se emplean para pronosticar el consumo del cuarto trimestre subcomandos cuarto trimestre 1993 y los tres primeros trimestres 1994. de 1993 y los tres primeros triniestres de 1994. modelo de regresión estacional es: El modelo de regresión estacional es: Y=b0+b2S2+b3S3+b4S4 Consumo = 768 236 (Icr trimestre) 125 (20. trimestre) 249 (tercer trimestre) Consunio = 768 + 236 (ler trimestre) - 125 (2o. trimestre) - 249 (tercer trimestre) James advielte que este modclo explica ci de la varianza dcl consumo eléctrico para James advierte que este modelo explica el 95% de Ia varianza dcl consumo eléctrico para residenciales. el cuarto trimestre de 1993 es: clientes residenciales. Su pronóstico para el cuarto trimestre de 1993 es: Cumto trimestre: Cuarto Consumo 768 + 236(0) 125(0) 249(0) = 768 = 768 + 236(0) - 125(0) - 249(0) = 768 Nótese que Ia constante 768 es el pronóstico para el cuarto trimestre. Este valor es también el la constante 768 es el pronóstico para el cuarto trimestre. Este valor es también el promedio o media del consurno eléctrico del cuarto trimestre. Los pronósticos de James para consumo eléctrico del cumto trimestre. James para promedio 1994 son: cada trimestre de 1994 son: Primer trimestre: trimestrc: Segundo trimestre: trimcstre: Tercer trimestre: Cumto trimestre: Cuarto trimestre: Consumo Consumo Consumo Consumo = 768 + 236(1) -- 125(0) - 249(0) = 1004 768 236(1) 125(0) 249(0) 1004 768 236(0) l25( 1) 249(0) 643 768 + 236(0) -- 125(1) - 249(0) = 643 768 + 236(0) 125(0) 249(1) 768 + 236(0) -- 125(0) - 249(1) 519 768 + 236(0) - 125(0) 249(0) = 768 + 236(0) - 125(0) - 249(0) = 768 768 PRONÓSTICOS ECONOMÉTRICOS PRONOSTICOS ECONOMETRICOS En este capItulo y en el cap. 6, el anulisis de regresión utilizó el conocimiento de una o este capítulo en el cap. 6, el análisis de regresión utilizó el conocimiento de una o más variables independientes para pronosticar la variable de interés. El uso de una variable rnás variables independientes para pronosticar la variable de interés. El uso de una variable pel111ite al independiente permite at analista pronosticar el valor de una variable dependiente, siempre ambas una relación lineal significativa. Cuando la variable dependiente se que exista entre ambas una relación lineal significativa. Cuando Ia variable dependiente se selie histórica, el análisis de regresión se conoce con el nombre de modelo encuentra en una serie histórica, el análisis de regresión se conoce con el nombre de modelo econométrico. la útil el valor futuro de una Para que Ia ecuación de regresión sea iitil en ci pronóstico de un valor futuro de una variable, como por ejemplo ventas al menudeo, el analista debe obtener una estimación del 288 múltiple Regresión mUltiple Capítulo 7 Cap Itulo valor de la variable independiente para el mismo periodo en el futuro. El analista debe tener para el mismo periodo en el futuro. El analista debe tener presente a! desarrollar un modelo de regresión lineal, que para pronosticar algün valor futuro al pronosticar algún valor futuro de la variable dependiente, debe conocer el valor o valores de la(s) variable(s) mdcde la variable dependiente, debe conocer el valor valores de la(s) variable(s) independiente(s), si es que Ia ecuación de regresión va a ser ütil. Por ejemplo, si se usa el PNB la ecuación de regresión útil. se usa el PNB pendiente(s), para pronosticar ventas al menudeo, se debe estimar el valor del PNB. Si no se puede para pronosticar ventas al menudeo, se debe estimar el valor del PNB. Si no puede obtener el obtener el valor del PNB para el próximo año, no se puede utilizar para pronoSticar las del PNB para el próximo año, no se puede utilizar para pronosticar las ventas al menudeo del próximo aflo. del próximo año. ventas la construcción modelo econométrico La esencia de la construcción de un modelo econométrico mediante el análisis de regresión consiste en identificación y especificación de factores de causa, a regresión consiste en la identificación y especificación de factores de causa, a utilizar en una ecuación de regresión. Sin embargo, recordamos que en la exposición del cap. 6 se dijo Ia exposición del cap. que ci uso del análisis estádistico no le permite al analista afirmar causa y efecto. En la del análisis estádistico no permite al analista afirmar causa y efecto. En Ia que el desarrollando modelo a partir construcción de un modelo econométrico, el analista está desarrollando un modelo a partir teoría de la teorla de que las variables independientes ejercen una influencia en el comportamiento de dependiente, en fonnas explicarse sentido común. la variable dependiente, en formas que pueden explicarse con base en el sentido comiin. Hoy día se utilizan modelos econométricos gran escala para modelar Hoy en dIa se utilizan modelos econométricos de gran escala para modelar específicas industria, industrias de la economía la empresas especIficas dentro de una industria, industrias selectas dentro de Ia econornia y Ia economía total. número de ecuaciones de economIa total. Los modelos econométricos comprenden un gran nárnero de ecuaciones de regresión lineal multiple simultáneas. Por ello, los modelos econométricos son sistemas múltiple simultáneas. Por ello, los modelos econométricos son sistemas simultáneas de variables independientes. de ecuaciones sirnultáneas que comprenden gran cantidad de variables independientes. Ejemplo 7.13 Una econoniista de una compafila nacional de aparatos eletrodomésticos debe desarrollar una compañía nacional eletrodomésticos desarrollar una Una economista ecuación de regresión que se usará para pronosticar las ventas mensuales de hornos de ecuación de regresión que se usará para pronosticar las ventas mensuales de hornos de microondas. La microondas. La economista decide utilizar corno variables independientes el ingreso personal decide como ingreso personal disponible, el precio tIpico de un horno de microondas y ci nüniero de casas por anmeblar con típico el número de casas por amueblar con disponible, ci retardo de tres meses. Su razonamiento al incluir la última variable los hornos de un retardo de tres meses. Su razonarniento al incluir Ia Ultima variable es que los hornos de microondas son uno de los iiltirnos elementos que se incorporan al hogar, asI que hay un últimos elementos que se incorporan al hogar, así que hay un microondas son uno de restardo de tres meses entre amueblar una casa y Ia compra de un homo de microondas. La horno de microondas. La restardo de tres meses entre amueblar una casa y la compra de ecuación de regresión que desarrolla es ecuación regresión que desarrolla es = b() + b,X, + hX + b4X4 en donde Y1 = pronóstico de ventas de hornos de microondas para el próximo YI = pronóstico de ventas de hornos de microondas para el próximo mes X2 = estimación dcl ingreso personal disponible para el próximo X2 = estimación del ingreso personal disponible para el próximo mes X = amueblado de casas hace X:1 = amueblado de casas hace tres mescs meses X4 = precio de un horno de niicroondas tIpico, este mes = un horno de microondas típico, Si la analista está pronosticando las ventas de hornos de microondas para enero de 1995, debe Si Ia analista está pronosticando las ventas de hornos de microondas para enero de 1995, debe la siguiente información: una estimación ingreso personal disponible para enero, obtener Ia siguiente inforrnación: una estimación del ingreso personal disponible para encro, dato que por lo regular proporcionan las agencias de gobierno; el número de casas por amueblar 10 nümcro aniueblar venta el presente mes (diciembre de 1994). desde octubre 1994; desde octubre de 1994; y el precio de yenta durante ci presente mes (diciembre de 1994). La analista potencial modelo. sólo tendrá que estimar una analista posee el potencial para desarrollar un buen modelo. Ella solo tendrá quc estimar una de de las variables independientes, el ingreso personal disponible y tendrá datos reales tanto para variables independientes, el ingreso personal disponible y tendrá datos reales tanto el precio de un horno de microondas tIpico durante diciembre, como del niimero de casas por horno de microondas típico número casas por el precio amueblar desde octubre. amueblar Aplicación en Ia AplicaciOn en la administración 289 SOBREAJUSTE El sobreajuste comprende la selección de 1m modelo que se apegue a las excentricidades excentricidades El sobreajuste comprende la selección de un modelo que se apegue de la muestra bajo análisis. otros conjuntos de datos de de los datos de Ia muestra bajo análisis. Al aplicar dicho modelo a otros conjuntos de datos de población, no se desempeña de la misma manera, ni siquiera aproximadamente. la misma población, no se desempefla de la misma manera, ni siquiera aproximadamente. Es más probable que ocurra un sobreajuste cuando el tamaflo de la muestra es probable ocurra un sobreajuste cuando el tamaño de la muestra es Es reducido, en especial si incluyen el modelo un gran número de variables indereducido, en especial si se incluyen en el modelo un gran nümero de variables mdcpendientes. ser por lo menos pendientes. La experiencia indica que ci tamaflo n de la muestra deberá ser por lo menos indica que el tamaño de 10 para cada variable independiente. (Si hay cuatro variables independientes, se requiere de vmiable independiente. (Si hay cuatro variables independientes, se requiere de tamaño por lo menos 40 elementos.) un tarnaflo de muestra de por lo menos 40 elementos.) Una forma de prevención pal-a evitar el sobreajuste consiste en desarrollar el modelo para evitar el sobreajuste consiste en desarrollar el modelo a partir de una porción de los datos y luego aplicar los resuitados a otro segmento. Si el partir de una porción de los datos y luego aplicar los resultados a otro segmento. Si el modelo toma cuenta principalmente las excentlicidades de Ia muestra en modelo torna en cuenta principalmente las excentricidades de la muestra en particular a de la cual fue aparecerá resultado al comparar los errores estimapartir de Ia cual flue desarrollado, aparecerã este resultado al comparar los errores estiniados para los dos conjuntos de datos. Si una rnedición comparable del en-or medio cuadrado conjuntos de datos. Si una medición comparable del eITor [1: (Y - Y)2] es sustancialmente mayor en el conjlmto que utilizó el modelo para estimar (Y - rYJ Cs sustancialmente mayor en el conjunto que utilizó ci para estimar [ observaciones, se ha presentado un sobreajuste. nuevas observaciones, se ha presentado un sobreajuste. APLICACION ADMINISTRACION APLICACIÓN EN LA ADMINISTRACIÓN Inicialmente, el análisis de regresión irniltiple fue concebido por estadIsticos y econode regresión múltiple fue concebido por estadísticos y econoInicialmente, el mistas matemáticos (econometristas), para auxiliar en ci pronóstico la actividad mistas matemáticos (econometristas), para auxiliar en el pronóstico de la actividad económica de diversos segmentos de la economía. Este uso continúa siendo una de sus económica de diversos segmentos de la economla. Este uso continia siendo una de sus aplicaciones principales. Muchos de los reportes yy pronósticos sobre el futuro de la aplicaciones principales. Muchos de los reportes pronósticos sobre el futuro de economla que aparecen en The Wall Street JoU/'nal, Fortune, Business Week y en otras economía que aparecen en The Wall Street Journal, Business Week y en otras están basados en modelos econométricos. El gobierno de EVA publicaciones similares, están basados en modelos econométricos. El gobierno de EUA utiliza ampliamente el análisis de regresión para Ia predicciôn de utilidades futuras, la predicción de utilidades futuras, utiliza ampliamente ci análisis de regresión desempleo y gastos, niveles de ingreso, tasas de interés, tasas de natalidad, desernpleo y requerimientos de beneficios del Seguro Social, asI corno de una multitud de otros sucesos. De beneficios del Seguro Social, así como de multitud otros sucesos. De tos hecho, cada departarnento principal en el gobierno de EUA hace uso de las herramientas departamento EVA de las herramientas descritas en este capItulo. este capítulo. descritas forma similar, las entidades empres31iales han adoptado modificado según En forma similar, las entidades empresariales han adoptado yymodificado seguln el necesidades, el análisis de regresión como ayuda en el pronóstico de sucesos futuros. En ci el como ayuda en ci pronóstico sucesos futuros. medio actual, pocas empresas pueden sobrevivir sin un pronóstico relativamente preciso de de rnedio actual, pocas las ventas del mañana, los gastos, requerimientos de capital y flujo de efectivo. Mientras mañana, gastos, requerimientos de capital y flujo efectivo. Mientras las ventas que empresas pequeñas o menos complejas pudieran arreglãrselas con pronósticos intuitipequeilas menos complejas pudieran arreglárselas pronósticos intuitivos, las grandes o mis complejas empresas han adoptado el anãlisis de regresión, que les vos, grandes más complejas empresas adoptado ci análisis regresión, que les afectarán permite estudiar las relaciones entre midtipIes variables independientes y cómo afectarán relaciones entre múltiples variables independientes y permite éstas ci futuro. el futuro. Por dcsgracia, Ia gran notoricdad que rccibc ci análisis de regresión por su utilidad desgracia, la gran notoriedad que recibe el análisis regresión su utilidad como herrarnienta del igualmente importante: corno herramienta de predicción dcl futuro, tiende a opacar un hecho igualmente importante: el presente. Dado que la ecuación de regresión evaluar su habilidad para ayudar a evaluar y controlar cl prcsente. Dado quc la ccuación de regresión proporciona información tanto de fuerza como de dirección, la administración puede evaluar información tanto dcfuerza dirección, adrninistración puede evaluar y modificar sus cstrategias actualcs. sus estrategias actuales. 290 Regresion multiple Regresión múltiple CapItulo Capítulo 7 Suponga, por ejemplo, que un fabricante de rnerrneladas desea saber sobre quién Suponga, por ejemplo, un fabricante de menneladas saber sobre quién sabor. Se concentrar sus esfuerzos de comercialización en la presentación de un nuevo sabor. Se concentrar sus esfuerzos de comercialización en la presentación de un el análisis de regresión para ayudar a detenninar el perfil de los principales puede emplear el análisis de regresiôn para ayudar a determinar el perfil de los principales consumidores de mermeladas. Por ejemplo, una compafila podría intentar predecir el consurnidores de mermeladas. Por ejemplo, una compañía podrIa intentar predecir el nümero de sabores que un ama de casa pudiera tener en un mornento dado, con base en ama de casa pudiera tener en un momento dado, con base en número algunas variables independientes como las siguientes: siguientes: algunas Número de niños en casa casa Nárnero Edad de los niflos los niños los niños Sexo de los niños la Propiedad versus renta de Ia casa versus Tiempo empleado en compras compras Ingreso Una reflexión, incluso superficial, sobre el ejemplo de las menneladas, conduce Una reflexión, incluso superficial, sobre el ejemplo de las mermeladas, conduce rápidamente al analista percatarse que el análisis de regresión tiene numerosas rápidamente al analista a percatarse de que el análisis de regresiOn tiene nurnerosas posibilidades de uso en estudios de segmentación de mercado, para detenninar qué variables determinar parecen impactar Ia participación en el mercado, Ia frecuencia de compras, la propiedad del la la frecuencia de compras, Ia propiedad del producto, Ia lealtad a un producto y marca, asI como muchas otras areas. la lealtad marca, así muchas áreas. Los científicos en aglicultura emplean el análisis de regresión para explorar las Los cientIficos en agricultura emplean el análisis de regresión para explorar las 1m (v.gr., toneladas maíz hectárea) el rendimiento relaciones entre ci rendimiento de un producto (v.gr., toneladas de maIz por hectárea) y el cantidad de fertilizante, la precipitación pluvial, la días sol y las tipo y cantidad de fertilizante, Ia precipitación pluvial, Ia temperatura, los dIas de so! y las plagas. granjas modemas equipadas mini y microcomputadoras junto plagas. Las granjas modernas están equipadas con mini y microcomputadoras junto con ayudan este proceso. paquetes de cómputo que ayudan en este proceso. Los investigadores medicos utilizan ci análisis de regresión para establecer lazos entre médicos el lazos entre la presión sanguInea y variables independientes como la edad, clase social, peso, hábito sanguínea social, peso, hábito de furnar y raza. Los doctores exploran el impacto de las cornunicaciones, el número de doctores exploran el impacto de las comunicaciones, el nirnero de de fumar y raza. consultas y Ia edad del paciente en relación con Ia satisfacción del paciente con el servicio. la con la satisfacción paciente con el servicio. Los directores de personal exploran las relaciones de los niveles salariales con la Los directores de personal exploran las relaciones de los niveles salariales con la crecimiento la industria, la afiliación ubicación geográfica, las tasas desempleo, ubicación geográfica, las tasas de desempleo, el crecimiento de Ia industria, la afiliaciôn sindical, el tipo de industria o los salarios competitivos. Los analistas financieros buscan de industria o los salarios competitivos. Los analistas financieros buscan sindical, ci causas de los precios altos de acciones, analizando ci rendimiento de dividendos, los dividendos, los causas de los precios altos de acciones, analizando el rendimiento interés del ingresos por acción, las aperturas de Ia bolsa, las expectativas de tasas de interés del ingresos por acción, las aperturas de la bolsa, las expectativas de tasas consumidor, los niveles de ahorro y las tasas de inflación. de inflación. consumidor, los niveles de aholTo Los gerentes de publicidad intentan con frecuencia estudiar el impacto de los Los gerentes de publicidad intentan con frecuencia estudiar el impacto de los la selección los medios, la copia de mensajes, la frecuencia presupuestos en publicidad, la seiección de los medios, Ia copia de mensajes, la frecuencia de la publicidad o la opinion de elección de las personas sobre el cambio en Ia actitud de opinión elección las personas sobre cambio en la actitud de de comercializadores ventas a partir consumo. En forma similar, los comercializadores pretenden determinar las ventas a partir consumo. de los gastos de publicidad, los niveles de precios, los gastos en mercados competitivos, ci publicidad, precios, los gastos en mercados competitivos, el ingreso disponible del consumidor, asI como una gran diversidad de otras variables. así gran diversidad de otras variables. ingreso Un ejemplo final ilustrará mejor Ia versatilidad del análisis de regresión. Los analistas la versatilidad del análisis de regresión. Los analistas útil en ubicación de bienes ralces encuentran que el anáiisis de regresión puede ser muy ütii en raíces en ci análisis el señalamiento de áreas geogrMícas en las que hay una alta o baja penetración de tipos baja penetración tipos el señalamiento de areas geograficas en las que hay Capítulo 7 CapItulo Glosarlo Glosario 291 específicos de al menudeo. ejemplo, de ferreterías podría buscar especIficos de tiendas a! rnenudeo. Por ejemplo, una cadena de ferreterias podrIa buscar una ciudad potencial para ubicar una nueva tienda, mediante el desarrollo de un modelo de diseñado pronosticar venta a11ículos una determinada ciudad. Los regresión diseñado para pronosticar la yenta de artIculos en una determinada ciudad. Los investigadores podrían concentrar sus esfuerzos en aquellas ciudades en las que el modelo las que el modelo investigadores podrian concentrar sus predijera ventas rnayores las determinar por muchos predij era ventas mayores a las realmente alcanzadas (como se puede determinar por muchos que no son potenciales las de artículos ferretería en estas medios). La hipótesis es que no son potenciales las ventas de artIculos de ferreterla en estas ciudades. En resurnen, el análisis de regresión ha proporcionado a la administración una En resumen, el análisis de regresión ha proporcionado la administración una herramienta poderosa y versátil, para estudiar las relaciones entre una variable dependiente vatiables independientes. controlar mejor los y diversas variables independientes. La meta consiste en comprender y controlar mejor los sucesos presentes asI corno predecir mejor los futuros. así como sucesos GLOSARIO El neto Coeficiente neto de Coeficiente neto de regresión. El coeficiente neto de regresión mide el cambio prornedio promedio unidad de cambio en la variable independiente en la variable dependiente por unidad de carnbio en la variable independiente en la vatiable dependiente pe11inente, manteniendo constantes el resto de las variables independientes. variables independientes. pertinente, manteniendo constantes el Colinealidad. La colinealidad es la situación en la cual las variables independientes de colinealidad es situación la cual las variables independientes de una ecuación de regresión multiple se encuentran altarnente intercorrelacionadas. múltiple se encuentran altamente intercorrelacionadas. Error estándar de la estimación. El estándar de estimación cantidad Error estándar de Ia estimación. El error estándar de la estimación mide la cantidad estándar en la que los valores reales de Y difieren de los valores estirnados (Y). que los valores reales de Y difieren de los valores estimados (Y). Heteroscedasticidad. Existe heteroscedasticidad cuando los errores o residuos no tienen heteroscedasticidad cuando los errores o residuos una varianza constante a través de un rango completo de valores. constante través valores. múltiple. La regresión multiple comprende el uso de más de una variable Regresión multiple. La regresión múltiple comprende el uso de más de una variable independiente, para pronosticar una variable dependiente. variable dependiente. independiente, Variables ficticias. valiables ficticias Variables ficticias. Las variables ficticias se emplean para detenninar las relaciones entre determinar variables independientes cualitativas y una variable dependiente. variables independientes cualitativas FÓRMULAS CLAVE FORMULAS CLAVE Ecuación de pronóstico de regresión multiple múltiple V = + b2X2 + b3X3 (7.1) Ecuaciones normales IY = nb0 + b 2 IX 2 + b3X3 nb o b 3IX 3 X2Y !X 2 Y = b0X2 + b2Xi -+ b 3IX 2X 3 boIX 2 b 2 IX ± b3X2X3 IX 3Y = b oIX 3 b 2 IX 2X 3 b 3IX; IX3Y = b0IX3 + b2X2X3 + b3IX Ecuación de regresión muultiple de Ia población de regresión múltiple la + f3 2 X 2 + f33X3 V = f3 0 + /32X2 + f33X3 + y = E (7.2) (7.3) (7.4) (7.5) (7.5) Ecuación de regresión múltiple de la muestra Y = b0 + b2X2 + b3X3 + e Ecuación de regresión multiple de la muestra y = bo + b 2X 2 + b 3X 3 + Error estándar de la estimación Error estándar de la estimación S s Y 23 = Y'X2 X3 -_ I(Y JI(Y - y)2 v nk V)2 n-k Regresión estacional Y t = b0 + b 2S 2 + b 3S 3 + b 4 S 4 = b o + b2S2 + b3S3 + b4S4 (7.6) 292 Regresión multiple RegresiOn múltiple Capítulo 7 Cap Itulo 7 PROBLEMAS características buena variable de pronóstico? 1. ¿Cuáles son las caracterIsticas de una buena variable de pronóstico? Cuáles 2. ¿Cuáles son las suposiciones de Ia técnica de regresión rnñltiple? suposiciones la técnica de regresión múltiple? Cuáles la regresión multiple? ,Que mide coeficiente neto regresión 3. ¿Qué mide el coeficiente neto de regresión en Ia regresión múltiple? la estimación la múltiple? 4. ¿Qué mide el error estándar de Ia estiniación en Ia regresión multiple? Que mide 5. Su ecuación de regresión mñltiple es Y= 7.52 + 3X2 - 12.2X3. Formule un punto de estimación, 5. Su ecuación de regresión múltiple es = 7.52 + 3X2 - 12.2X3• Formule dadosx2= 20 yx3 = 7. dados X2 = 20 Y X3 = 7. 6. Explique cada uno de los siguientes conceptos: los siguientes 6. Matriz de correlación a. Matriz de correlación b. R2 b.R2 c. Colinealidad d. Residuo e. Variable ficticia ficticia f. Regresión por pasos Regresión La mayoría de las soluciones de cómputo para el análisis de regresión comienzan con una 7. La rnayorIa de las soluciones de cómputo para el análisis de regresión coniienzan con irna matriz de correlación. Esta matriz debe ser el primer paso cuando se analiza un problema que comprende debe el primer paso cuando se analiza un problema que comprende rnás de una variable independiente. Responda las siguientes preguntas con respecto a la rnatriz más una variable independiente. siguientes respecto la matriz de correlación que se muestra en Ia tabla siguiente: muesh-a en la tabla siguiente: de Y NUMERO DE VARIABLE NÚMERO DE VARIABLE NÚMERO DE NÜMERO DE VARIABLE 1 1 2 2 3 3 4 5 5 .79 .39 .17 -.44 1.00 6 .70 .45 .21 -.14 .69 1.00 1 1.00 1.00 2 2 .55 1.00 3 3 4 5 5 6 .20 .27 1.00 -.51 .09 .04 1.00 ¿Por qué todos los elementos de Ia diagonal principal son iguales a 1? elementos la diagonal al? ,Por ¿Por qué aparece en blanco Ia mitad inferior de la matriz, bajo la diagonal principal? la la matriz, bajo la diagonal principal? ,Por Si la variable I es la variable dependiente, ,cuáles variables independientes tienen el mayor 1 es la variable dependiente, ¿cuáles variables independientes mayor relación grado de relación con ella? 4? d. j,Qué clase de relación existe entre las variables 1 y 4? ¿Qué clase de relación entre variables e. ¿Muestra esta rnatriz de colTelación alguna evidencia de colinealidad? matriz con-elación colinealidad? Muestra f. En su opinion, ,qué variable o variables se inclurán en el mejor modelo de pronOstico? Exopinión, ¿qué variable o variables se incluirán en el mejor modelo de pronóstico? Exel porqué. plique ci porqué. g. Si se ejecuta el problema en un programa por pasos, ,qué variable se registrará primero en ejecuta pasos, ¿qué variable se registrará primero modelo? el modelo? S.A Jennifer Dahl, supervisora de la cadena Circle O, le gustarla pronosticar el tiempo que toma 8. A Jennifer Dahl, supervisora de cadena Circle 0, le gustaría pronosticar el tiempo que toma . atender a un cliente en caja. Para ello, decide utilizar las siguientes variables independientes: un cliente en caja_ Para ello, decide utilizar las siguientes variables independientes: a. b. c. CapItulo 7 Capítulo 7 Problemas 293 monto de las compras y niimero de artIculos comprados. Jennifer reüne una muestra de datos las compras y número de artículos comprados. Jennifer reúne una muestra de datos para 18 clientes: 18 clientes: CLIENTE 1 ATENCIÓN TIEMPO DE ATENCION (EN MINUTOS) Y Y 3.0 MONTO (EN DOLARES) DÓLARES) X., X2 36 NÚMERO DE NUMERO DE ARTÍCULOS ARTICULOS x Xl 1 2 2 1.3 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 11 11 12 12 13 14 15 15 16 17 18 .5 .5 7.4 5.9 8.4 8.4 5.0 8.1 8.1 1.9 6.2 .7 1.4 9.1 .9 5.4 3.3 4.5 2.4 13 13 3 3 81 81 78 103 64 67 25 55 13 13 21 21 121 121 10 10 60 32 32 51 51 9 5 5 2 14 14 13 13 16 12 12 11 11 7 7 11 11 3 3 8 8 21 21 6 6 13 11 11 15 15 10 28 28 a. Determine la mejor ecuación de regresión. ecuación de regresión. artículo adicional, ,cuál el incremento promedio en ci tiempo de atenb. Al comprar un artIculo adicional, ¿cuál es ci incremento promedio en el tiempo de atención? c. Calcule el residuo para el cliente 18. cliente 18. d. Calcule el error estándar de Ia estimación. de la estimación. Interprete ci apartado e. Interprete el apartado d en términos de las variables empleadas en este problema. f. Calcule el punto de estimación del tiempo de atención si ci cliente compra 14 artIculos por tiempo el cliente 14 artículos Caicule el $70 dólares. un monto de $70 dólares. g. Calcule un intervalo de estimación del 95% para su pronóstico del apartado f. h. ¿Cuáles serian las conclusiones de Jennifer? ,Cuáles serían Las ventas de cerveza de la Shapiro One-Stop Store se analizan utilizando como variables 9. Las ventas de cerveza de la Shapiro OneStop Store se analizan utilizando como variables la número (21 por la calle. Se ejecuta una regresión temperatura y el niimero de personas (21 o más) que pasan por Ia calie. Se ejecuta una regresión siguientes variables: con las siguientes variables: y = nümero de paquetes Y = número de paquetes de seis cervezas X2 = temperatura alta X3 = contador de tráfico = contador de tráfico Se selecciona una muestra aleatoria de 20 días. La salida parcial de cómputo arroja los siguientes aleatoria de 20 dIas. La salida parcial de cómputo arroja los siguientes resultados. 294 Regresión multiple múltiple Capítulo 7 CapItulo 7 CORRELATION MATRIX: 3 BY 3 VAR. 1 1 1 2 2 3 3 2 2 3 3 1.000 0.827 0.822 0.827 1.000 0.680 0.822 0.680 1.000 VARIABLE NO. 2 2 3 3 MEAN 64.09999 537.54980 STANDARD DEVIATION 17.46243 195.59874 REGRESSION COEFFICIENT 0.78207 0.06795 STD ERRO OF REG. COEF. REG. COEF. 0.22694 0.02026 0.7 DEPENDENT 1 1 59.95000 -26.70621 27 .45083 27.45083 INTERCEPT -26.70621 ANALYSIS OF VARIANCE FOR THE REGRESSION ANALYSIS OF VARIANCE THE REGRESSION SOURCE OF VARIATION DEGREES OF OF FREEDOM 2 2 SUM OF SQUARES MEAN SQUARES F VALUE ATTRIBUTABLE TO REGRESSION ATTRIBUTABLE TO REGRESSION DEVIATION FROM REGRESSION REGRESSION TOTAL 17 17 11589.03500 2727.91400 19 14316.94900 19 36.11064 5794.51560 36.11064 160.46553 a. Analice Ia rnatriz de correlación. la matriz de con·elación. b. Pruebe, a 1m nivel de significación de .01, Ia significación de los coeficientes de regresión. significación .01, la significación regresión. Pruebe, un c. Pronostique el volumen de cerveza vendida si Ia temperatura alta es de 60 grados FahrenPl:onostique volumen la 60 grados Fahrenheit y el contador de tráfico es de 500 personas. el contador de tráfico es de 500 personas. d. Calcule R 2 e interprete su significado en términos del problerna. problema. R2 e interprete su significado témlinos e. Calcule el error estándar de Ia estimación. la estimación. Calcule f. Explique cómo afecta a las ventas de cerveza el incremento de un grado en Ia temperatura en la temperatura Explique córno afecta a las ventas de cerveza alta. g. Indique sus conclusiones para este análisis con respecto a Ia precisión de Ia ecuación de Indique sus conclusiones para este análisis con respecto a la precision de la pronóstico, así como de la contribución de las variables independientes. las variables independientes. pronOstico, asi corno de la contribución 10. El gerente de ventas de una gran distribuidora de partes automotrices, 10. El gerente de ventas de una gran distribuidora de partes automotrices, Hartman Auto Supplies, Supplies, desea desarrollar un modelo para pronosticar desde el mes de mayo, las ventas anuales de una un modelo para pronosticar desde el mes mayo, región. Si es posible pronosticar las ventas regionales, se podrá pronosticar el total de ventas de regionales, de region. la conipafila. Las dos variables independientes por investigar son el nñmero de distribuidoras en compañía. Las número de distribuidoras en region la región que almacenan partes de la compafila y el rnimero de automóviles registrados para cada de la compañía número cada región 10. de mayo. Los datos se presentan en el siguiente cuadro. region al lo. de mayo. Los datos se presentan en el siguiente cuadro. Capítulo 7 CapItulo 7 Problemas VENTAS ANUALES (EN MILLONES), Y Y 52.3 26.0 20.2 16.0 30.0 46.2 35.0 3.5 33.1 25.2 38.2 Problemas NUMERO NÚMERO DE DISTRIBUIDORAS X., Xz 2,011 2,850 650 480 1,694 2,302 2,214 125 1,840 1,840 1,233 1,699 295 NÚMERO DE AUTOMÓVILES NtJMERO DE AUTOMOVILES REGISTRADOS (EN MILLONES) REGISTRADOS X3 3 REGIÓN REGION X 1 1 2 2' 3 3 4 5 5 6 7 7 8 8 9 10 10 11 11 24.6 22.1 7.9 12.5 12.5 9.0 11.5 20.5 4.1 8.9 6.1 9.5 a. Analice la rnatriz de correlación. matriz de correlación. eITor comprende la región 1 b. ¿Qué tanto error comprende el pronóstico de la region 1 ,Qué c. Pronostique las ventas anuales para Ia regiOn 12, dadas 2 500 distribuidoras y 20.2 millones la región 12, dadas 20.2 millones Pronostique de autornóviles registrados. automóviles registrados. Exponga precisión d. Exponga la precision del pronóstico efectuado en el apartado c. pronóstico el apartado c. e. Indique cOrno se calculó el error estándar de Ia estirnación. cómo se calculó el en-or la estimación. f. Interprete los coeficientes netos de regresión. ¿Son válidos? netos de regresión. Son g. ¿Cómo podría mejorarse esta ecuación de regresiOn? ecuación de regresión? ,COrno podrIa mejorarse 11. El gerente de ventas de Hartman Auto Supplies decide investigar variable, 11. El gerente de ventas de Hartrnan Auto Supplies decide investigar una nueva variable, ingreso personal por region. Los datos correspondientes se presentan en la tabla siguiente: región. datos correspondientes la tabla siguiente: personal REGIÓN REGION 1 1 2 3 3 4 5 6 INGRESO PERSONAL (EN MILES DE DE MILLONES) 98.5 31.1 34.8 32.7 68.8 94.7 REGIÓN REGION 7 8 8 INGRESO PERSONAL (EN MILES DE MILLONES) 67.6 19.7 9 10 11 67.9 61.4 85.6 a. ¿Contribuye el ingreso personal por región en el pronóstico de ventas? Contribuye el ingreso personal por region en el pronóstico de ventas? b. Pronostique las ventas anuales de la region 12 para un ingreso personal de $40 mil milloanuales región 12 para ingreso personal de $40 mil millolas tres variables. nes, utilizando las tres variables. c. Exponga la precision del pronóstico formulado en el apartado b. precisión del pronóstico formulado en el apartado b. ,Qué variables incluiria en su modelo final de pronóstico? ,Por d. ¿Qué variables incluiría en su modelo final de pronóstico? ¿Por qué? 12. La Nelson Corporation decide desarrollar una ecuación de regresión múltiple para pronosticar el 12. La Nelson Corporation decide mñltiple para pronosticar el comporÚlmiento de las ventas. Se entrevista a una muestra aleatoria de 14 vendedores y se comportarniento de las ventas. Se entrevista a una muestra aleatoria de 14 vendedores y se les 296 Regresión múltiple Regresión multiple Capítulo 7 CapItulo aplica examen aptitud. Además, calcula índice de esfuerzo empleado aplica un examen de aptitud. Además, se caicula un Indice de esfuerzo empleado por cada vendedor, con base en la proporción de kilómetros recorridos en su automóvil con respecto al la proporción de kilómetros recorridos automóvil respecto al vendedor, total de kilómetros proyectados para una cobertura adecuada de territorio. El anáiisis de regresión análisis alToja los resultados: arroj a los siguientes resultados: Y = 16.57 + .65X22 + 20.6X3 y = 16.57 + .65X + 20.6X 3 (.05) (1.69) (1.69) Las cantidades entre paréntesis indican el error estándar de los coeficientes netos de regresión. cantidades entre paréntesis indican eITor estándar de los coeficientes netos de regresión. elTor estándar de la estimación 3.56. El elTor estándar de la 5y = 16.57. El error estándar de Ia estirnación es 3.56. El error estándar de La variable ventas es s, = 16.57. son Las variables son y = comportamiento de las ventas, en miles Y= X 2 = calificación en el examen de aptitud = ci exanien X 3 = índice de esfuerzo X3 = indice de csfuerzo a. ¿Son bastante diferentes de cero los coeficientes de regresión, en el nivel de significación .01? diferentes el nivel de significación .01? Son b. Interprete el coeficiente neto de regresión del índice de esfuerzo. Interprete el coeficiente neto de regresión del indice de esfuerzo. c. Pronostique el coniportamiento de ventas para un vendedor que tiene una calificación de 75 comportamiento de ventas calificación 75 en el exarnen de aptitud y un indice de esfuerzo de .5. examen aptitud lill índice de esfuerzo de .5. d. Calcule la surna de residuos cuadrados, :E (Y _ Y)2. suma de residuos cuadrados, E (Y Y)2. e. Calcule la suma total de cuadrados, :EE (Y Y2. Calcule la suma total de cuadrados, (Y - "Y)2. f. Calcule R2 e interprete su significado en términos de este problema. R2 tém1inos de este problema. R corrcgida. g. Calcule R ~ con-egida. 13. El Sr. Palmer, propietario de un lote de venta de casas móviles, desea pronosticar sus ventas 13. El Sr. Palmer, propietario de un lote de yenta de casas móviles, desea pronosticar sus ventas brutas. Selecciona en forma aleatoria datos de 40 meses sobre las cuatro variables siguientes: vendedores empleados X 2 = nñmero X2 = número de vendedores enipleados X 3 = temperatura promedio mensual promedio mensual X4 = rnrnero de lineas de casas móviles en inventario durante número de líneas de casas móviles en inventario durante mes el mes X 5 = gastos de publicidad = de publicidad la Los datos se presentan en Ia tabla P.13. presentan Los datos a. Ejecute una matriz de correlación de un programa de regresión miiltiple y analicela. Ejecute una matriz de cOlTelación de un programa de regresión múltiple analícela. CapItub Capítulo 7 Problemas 297 P. 13 TABLA P. 13 BRUTAS VENTAS BRUTAS (EN MILES), Y Y $54.3 79.9 57.1 89.3 115.0 126.0 76.5 81.1 56.7 138.8 47.9 42.5 39.4 68.9 60.3 87.7 46.9 44.2 84.4 64.1 115.3 40.7 79.2 39.5 14.7 24.1 117.3 67.9 73.2 63.7 36.1 58.6 97.2 41.8 93.9 21.8 17.3 65.9 32.4 61.1 NÜMERO DE NÚMERO VENDEDORES, TEMPERATURAS PROMEDIO, X2 x2 5 7 5 7 11 12 10 7 6 11 7 7 5 5 7 8 8 6 6 8 5 11 5 5 4 4 5 10 7 10 10 7 5 7 5 6 5 3 6 4 6 X3 x3 16.3 26.1 35.9 46.2 57.4 65.2 67.4 67.1 59.8 43.7 36.3 29.4 25.9 36.3 37.0 41.6 54.9 66.2 72.5 70.2 54.2 44.9 36.0 27.9 31.8 33.6 35.2 45.3 56.3 58.2 69.7 74.1 55.2 44.2 35.4 25.8 22.6 30.7 41.4 42.0 NUMEROS NÚMEROS DE LINEAS LÍNEAS X4 x4 6 9 8 8 8 8 15 15 16 7 7 7 8 8 16 5 5 4 5 5 10 10 13 6 8 8 5 5 8 8 8 4 7 5 5 6 4 11 9 11 11 6 5 5 6 11 4 9 2 4 7 7 9 PUBLICIDAD Xs x5 $ 716 $ 716 792 492 650 865 1,293 790 802 484 1,501 326 202 215 609 600 764 304 252 746 629 1,044 158 716 176 102 209 1,501 631 692 618 140 544 901 100 862 175 111 594 131 589 298 Regresión múltiple RegresiOn mUltiple Capítulo 7 CapItulo b. Exponga Ia importancia de cada variable independiente. la cada variable independiente. pronosticar las ventas brutas, c. j,Qué ecuación debe emplear el Sr. Palmer para pronosticar las ventas brutas, si desea in¿Qué ecuación debe emplear el Sr. variables independientes estadísticamente significativas? Utilice un nivel de cluir todas las variables independientes estadIsticarnente significativas? Utilice un five! de .01. significación de .01. d. ¿Qué ecuación de regresión aconsejaria usted al Sr. Palmer? 4,Por qué? regresión aconsejaría usted al Sr. Palmer? ¿Por ,Que e. ¿Existe un problema de colinealidad en Ia ecuación elegida en el apartado c? De ser asI, la c? De ser así, Existe ¿qué efectos pudiera tener? tener? qué f. Pronostique las ventas brutas de acuerdo con lo siguiente: brutas acuerdo 10 siguiente: Pronostique las cuatro vendedores empleados. Hay cuatro vendedores empleados. 40 grados Fahrenheit. La temperatura alta del mes es 40 grados Fahrenheit. en el inventario cinco líneas diferentes de casas móviles. Hay en el inventario cinco lIneas diferentes de casas móviles. Los gastos en publicidad son de $750. (Nota: Use Ia ecuación que seleccionó en el publicidad $750. (Nota: Use la ecuación que seleccionó en el apartado d.) g. Exponga Ia precision de este pronóstico. la precisión este pronóstico. 14. La Srta. Haight, una corredora de bienes raIces, desea pronosticar Ia importancia de cuatro SIta. Haight, una cOlTedora de bienes raíces, desea pronosticar la importancia de cuatro 14. factores la determinación de precios terrenos. Para ello, acumula datos sobre precio, factores en la deterrninación de precios de terrenos. Para ello, acurnula datos sobre precio, superficie, elevación y pendiente, asi como indices de vista terrenos. Ejecuta superficie, elevación y pendiente, así como índices de vista para 50 terrenos. Ejecuta los datos en un prograrna de correlación y obtiene la matriz correspondiente que se presenta en la tabla programa de cOlTelación obtiene la matriz con'espondiente se presenta en la tabla siguiente. SIta. un programa regresión pasos. siguiente. La Srta. Haight ejecuta los datos en un prograrna de regresión por pasos. VARIABLE VARIABLE PRECIO SUPERFICIE .59 ELEVACIÓN ELEVACION .66 .04 1.00 PENDIENTE .68 .64 .13 1.00 VISTA .88 .41 .76 .63 1.00 Precio Superficie Elevación Pendiente Vista 1.00 1.00 a. Determine qué variable se registrará primero en el modelo, cuál en segundo término, cuál Determine qué variable se registrará primero en modelo, cuál al final. en tercero y cuál al final. b. ¿Qué variable(s) se incluirá(n) en Ia mejor ecuaciOn de predicción? se inc1uirá(n) en la mejor ecuación de predicción? ,Que 15. National Presto es un fabricante de aparatos pequeños electrodomésticos y artIculos para el hogar, National Presto es un fabricante de aparatos pequefios electrodomésticos y mtículos para el hogar, incluyendo ollas de presión, calentadores, enlatadoras, freidoras, planchas, hornos rosticeros, presión, calentadores, enlatadoras, freidoras, planchas, rosticeros, incluyendo ollas freidoras palomitas maíz, abrelatas, cafeteras, rebanadoras, batidoras y freidoras profundas, ollas para palornitas de rnaiz, abrelatas, cafeteras, rebanadoras, batidoras y artículos portátiles varios. En la tabla P.15 se niuestran las ventas trimestrales en millones de trimestrales en millones artIculos portátiles varios. En Ia tabla P.15 se muestran las dólares. Las mej ores ventas de Presto se presenta principalmente en Ia temporada navideña, dOlares. Las mejores ventas de Presto se presenta principalmente en la temporada navideña, de modo que existe un fuerte efecto estacional. Desarrolle un modelo de regresiOn multiple modo que existe un fuerte efecto estacional. Desarrolle un modelo de regresión múltiple empleando variables ficticias para pronosticar las ventas del tercer y cuarto trimestres de 1993. 1993. empleando variables ficticias para pronosticar las ventas del tercer cumto trimestres informe resumiendo sus resultados. Escriba un informe resumiendo sus resultados. Capítulo 7 CapItulo estudio Caso de estudlo P. 15 TABLA P. 15 TRIMESTRE 1985 1986 1987 1988 1989 1990 1991 1992 1993 1 299 2 17.7 16.7 16.7 3 3 4 34.3 42.3 36.5 45.5 45.2 59.6 81.2 59.1 16.3 17.3 17.4 17.5 24.3 20.6 19.5 24.9 22.4 28.1 16.9 16.5 24.2 18.7 18.7 22.5 17.5 14.3 32.2 30.9 28.6 33.8 28.1 38.3 26.8 16.9 16.5 Fuente: The Value Line Investment Survey The Value Line Investment Survey (Nueva York: Value Line, 1993), p.132. Line, 1993), p.132. CASO DE ESTUDIO 7.1 7.1 EL MERCADO VALORES· EL MERCADO DE VALORES* A principios de 1982, Judy Johnson, vicepresidente de finanzas de una gran empresa privada de principios 1982, Judy Johnson, vicepresidente de finanzas de gran empresa privada de del con compañía para inversiones dcl noroeste, se enfrentó con un problema financiero. La compañIa necesitaba dinero para pagar sus deudas de corto plazo por vencer y para continuar la construcción de una planta carbonífera. veneer de carbonIfera. preocupación La principal preocupación de Judy era estimar el mercado de valores de 10 o 30 años; la compañía valores de 10 030 Ia compafila financiamiento de equidad 0 una necesitaba decidir entre utilizar un financiamiento de equidad o una deuda de largo plazo. Para tomar de plazo. decisión, se requería de un pronóstico confiable la tasa pagaría al de esta decision, se requeria de un pronOstico confiable de Ia tasa de interés que pagarla a! momento de emitir las obligaciones. Judy convocó a una reuniOn con su equipo financiero para discutir el problema del mercado de a una reunión del mercado de grupo, Ron Peterson, recién graduado de la maestría en administración valores. Un miembro del grupo, Ron Peterson, recién graduado de Ia maestrIa en administración de empresas, opinó que se podrIa desarrollar un modelo de regresión miiltiple pam pronosticar las tasas de que se podría desarrollar múltiple para Como la múltiple, desvió la las obligaciones. Corno la vicepresidenta no estaba familiarizada con Ia regresión multiple, desvió la discusión en otra direcciOn. Después de una hora de intercambios improductivos, Judy pidió a Ron que dirección. Después de una hora de intercambios improductivos, Judy pidió a Ron que le tuviera un informe sobre su escritorio ci lunes siguiente. el Ron sabIa que la dave para ci desarrollo de un buen modelo de pronOstico estaba en la Ron sabía que clave para el desarrollo de un buen modelo de pronóstico estaba en identificación de las variables independientes que se relacionaran con la tasa de identificación de las variables independientes que se relacionaran con la tasa de interés pagada al la la momento de Ia emisión de las obligaciones. Después de discutir el problema con varias personas de Ia obligaciones. el empresa, Ron decidió investigar las siguientes variables: un índice de las obligaciones de empresas de Indice de las servicio (Moody's), un Indice de ingresos sobre cargos fijos, las tasas de obligaciones de la tesorerIa, índice fijos, tesorería, servicio la madurez de las obligaciones (10 0 30 aflos) y Ia tasa lIder de préstamos al momento de la emisión. las obligaciones (lO o 30 años) y la líder préstamos al momento de la emisión. Ron reunió los datos que pensó podría relacionar con las tasas de interés de obligaciones para las podrIa con las tasas de interés de obligaciones para las emisiones de obligaciones de empresas de servicios durante 1980 y 1981. Al principio, no tenía la emisiones de obligaciones de empresas de servicios durante 1980 y 1981. Al principio, no tenia ia *Los datos para este caso fueron aportados por ma estudiante de MaestrIa en Administración de Empresas fueron una estudiante de Maestría en Administración de Empresas de la Eastern Washington University, Dorothy Mercer. El análisis lo efectuaron los estudiantes de MAE Tak Fu, University, estudiantes de MAE Tak Fu, Mercer, Mary Lou Redmond y Harold Wilson. Ron Hand, Dorothy Mercer, Mary Lou Redmond y Harold Wilson. 300 Regresión múltiple RegresiOn multiple Capítulo 7 Cap itulo certeza de cómo manejar el Indice de obligaciones de las empresas de servicio. Finalmente, decidió manejar el índice de obligaciones de las empresas de servicio. Finalmente, decidió considerar solo las empresas de servicios con un Indice igualo ligeramente mayor que el de su compañía. índice igual o ligeramente considerar sólo las empresas servicios su companIa. decision Esta decisión le proporcionó una muestra de 93 emisiones para analizar. Aunque aün estaba preocupado aún preocupado con respecto a la validez de utilizar los Indices de obligaciones como datos de intervalo. De modo que índices llamó a su exprofesor de estadIstica y aprendió que las variables ficticias resolverían el problema. Así, estadística aprendió ficticias resolverian problema. Asi, codificó los Indices de obligaciones de Ia siguiente manera: índices obligaciones de la siguiente manera: X 2 = 1 si el índice de las obligaciones es A; Oen caso contrario si el Indice de las obligaciones es A; 0 en X3 = 1 si el índice de las obligaciones es AA; Oen caso contrario si ci Indice de las obligaciones es AA; 0 en el índice de las obligaciones es BAA, tanto X como X 3 son Si ci Indice de las obligaciones es BAA, tanto A'22como A'3 son cero. seleccionar programa de regresión múltiple de la biblioteca de El siguiente paso para Ron fue seleccionar un programa de regresión multiple de la biblioteca de la programas de la computadora e ingresar los datos. En Ia ecuación del modelo completo se incluyeron del las siguientes variables: variables: Variable 1: 1: 2: Variable 2: 3: Variable 3: Y = tasa de interés pagada por la obligación al momento de Ia emisión y = tasa de interés pagada por la obligación al momento de la emisión X2 = 1 si el Indice de la obligación es A X2 = índice obligación A X3 = 1 si índice la obligación es AA X3 = 1 si el Indice de Ia obligacion es AA Variable 4: 4: 5: Variable 5: X4 = índice de ingresos sobre cargos fijos X4 = Indice de ingresos Xs = Tasas de las obligaciones de la Tesorería EVA 30 X = Tasas de las obligaciones de Ia Tesorerla de los EUA (para 10 y 30 de la emisión años) al momento de la ernisiOn años) Variable 6: 6: Variable 7: 7: X6 = madurez de o 30 años) X6 = madurez de las obligaciones (10 o 30 aflos) = líder momento la X7 = tasa Ilder de préstamos al momento de Ia emisión se en el Apéndice D. Los datos reales se presentan en el Apéndice D. Ron decidió analizar la matriz de correlación que se presenta en la tabla 7.16. No le sorprendió encontrar una alta relaciOnpositiva entre la tasa de interés pagada al momento de la emisión de las relación positiva entre la tasa de interés pagada al momento de Ia emisión de encontrar una obligaciones y la obligaciones y Ia tasa de interés de los bonos de la TesorerIa, r15 = .883. También esperaba una relación de interés de los bonos de la Tesorería, rl5 = .8 83. También esperaba relativamente alta entre la variable dependiente la tasa líder de préstamos (r 17 No le positiva relativarnente alta entre la variable dependiente yyla tasa Ilder de préstamos (r17 = .596). No le si sorprendió mucho el descubrir que estas dos variables también estaban relacionadas entre sí (colinear57 = .713). La relación negativa entre Ia variable dependiente Ia duración las lidad, r57= .713). La relación negativa entre la variable dependiente y la duración de maduración de las obligaciones (10 o 30 años), r16==-.221, también fue un resultado razonable para Ron. (lOo rl6 -.221, tarnbién fue un resultado razonable Ron. TABLA 7.16 7.16 MATRIZ DE CORRELACiÓN PARA EL ESTUDIO DEL MATRIZ DE CORRELACON PARA EL ESTUDIO DEL VALORES MERCADO DE VALORES VARIABLE VARIABLE 1 1 1 2 3 3 .173 4 .097 .037 .577 1.000 .253 .094 .094 .255 5 .883 -.256 .291 .253 1.000 -.477 .713 6 -.221 -.22 1 .278 7 .596 2 2 3 3 4 4 5 6 7 7 1.000 -.347 .173 .097 .883 -.221 .596 -.347 1.000 -.399 .037 -.256 .278 -.152 -.399 1.000 .577 .291 .010 .342 -.152 .342 .010 .094 -.477 1.000 -.314 -.3 14 .255 .713 -.314 -.3 14 1.000 Capítulo 7 CapItulo 7 Caso de estudio 301 A continuación, Ron ajecutó el modelo completo conteniendo todas las variables de predicción. revisión los valores t, que se presentan en la tabla 7.17, el índice de ingresos sobre La revision de los valores t, que se presentan en Ia tabla 7.17, indicó que el Indice de ingresos sobre variable 4 y la tasa líder al pronóstico cargos fijos, variable 4y Ia tasa ilder de interés, variable 7, no hacían ninguna contribución a! pronóstico haclan ninguna de la variable dependiente. EJECUCION TABLA 7.17 EJECUCiÓN DEL MODELO COMPLETO PARA EL ESTUDIO DEL MODELO COMPLETO PARA EL ESTUDIO DEL TABLA 7.17 MERCADO DE VALORES MERCADO VARIABLE VARIABLE NO. 2 2 3 4 5 5 6 6 7 7 3 MEAN 0.47312 0.15054 2.59053 12.63572 21.18279 16.78168 STANDARD DEVIATION 0.50198 0.35954 0.64437 1.45429 1.45429 9.98356 2.94729 1.69549 1.69549 -1.02621 0.95441 0.52344 CORRELATION X y X VS Y -0.34654 0.17257 0.09701 0.88303 -0.22122 0.59627 REGRESSION COEFFICIENT -0.82853 0.50198 -0.88937 -0.24165 1.25751 0.06284 9.98356 -0.00313 STD ERROR STD OF REG. COEF. OF REG. COEF. 0.13423 0.22474 0.11352 0.05964 0.00659 0.02720 COMPUTED T VALUE -6.17266 -6. 17266 -3.95737 -3 .95737 -2.12877 0.09701 21.08649 0.88303 9.53710 -0.11502 DEPENDENT DEPENDENT 1 14.99006 1 INTERCEPT MULT. CORR MULT. CORR STD. ERROR STD. R R SQUARED 0.91090 0.90578 CORRECTED R SQUARED R SQUARED FOR THE REGRESSION ANALYSIS OF VARIANCE FOR THE REGRESSION MEAN DEGREES OF SUM OF SOURCE OF VARIATION SQUARES OF SQUARES OF FREEDOM 6 6 86 86 92 92 240.90656 23.56342 264.46997 40.15109 0.27399 F VALUE 146.54047 ATTRIBUTABLE TO REGRESSION FROM REGRESSION DEVIATION FROM REGRESSION TOTAL Ron concluyó que Ia variable 4 no estaba relacionada con la variable dependiente (r14 = .097) y la (r14 la 7 con la Los resultados de la ejecución que Ia variable 7 era colineal con Ia variable 5. Decidió eliminar ambas. Los resultados de la ejecución cómputo para este modelo muestran en la tabla 7.18. Los valores calculados de fueron de cómputo para este modelo se muestran en Ia tabla 7.18. Los valores calculados de tt fueron significativos para cada una de las variables independientes. cada una de las variables independientes. En su infol111e para Judy, Ron incluyó los siguientes comentarios: informe 1. El modelo de regresión multiple apropiado, Y = -1.276 -.929X2 - 1.175X3 + 1.233X5 + .061X6 , de regresión múltiple apropiado, = -1.276 -.929X2 - 1.175X3 1.233Xs .061X6, explica el 90.6% de Ia varianza de Ia variable dependiente. de la varianza de la variable dependiente. explica el eITor típico promedio utilizar el modelo de 2. El error estándar de Ia estirnación, que es el error tIpico o prornedio al utilizar el modelo de El estándar la estimación, que es pronóstico es .53. Por ello, almededor del 95% de los valores reales de la variable dependiente .53. Por ello, alrededor del 95% de los de la variable dependiente se se ubicarán dentro de 1 .06 unidades de un pronóstico dado. dentro de 1.06 un pronóstico dado. 3. Los coeficientes de regresión son válidos y confiables. regresión son válidos y confiables. satisfecho esfuerzo supone Judy también lo estará. Ron quedó muy satisfecho con su esfuerzo y supone que Judy también lo estará. Y PREGUNTA ¿,Qué preguntas cree usted que fornmlará Judy a Ron? Qué formulará 302 TABLA 7.18 7.18 Regresión múltiple RegresiOn multiple MODELO FINAL PARA EL ESTUDIO DEL MERCADO DE VALORES MODELO FINAL PARA EL ESTUDIO DEL MERCADO DE VALORES Capítulo Cap Itulo 7 VARIABLE NO. 2 2 3 3 5 5 6 6 MEAN 0.47312 0.15054 12.63572 12.63572 21.18279 STANDARD DEVIATION 0.50198 0.35954 1.45429 9.98356 CORRELATION X VS y -0.34654 0.17257 0.88303 -0.22122 REGRESSION COEFFICIENT DEVIATION -0.92932 -1.17506 1.23307 0.06147 STD ERROR STD REG. COEF. OF REG. COEF 0.12637 0.17810 0.04599 0.00665 COMPUTED T VALUE -7.35422 -6.59793 26.80913 9.24634 DEPENDENT 1 1 14.99006 14.99006 INTERCEPT 1.69549 -1.27627 -1 .27627 0.95195 0.53093 MULT. CORR MULT. CORR STD. ERROR STD. R SQUARED R SQUARED R SQUARED CORRECTED R SQUARED 0.90621 0.90304 ANALYSIS OF VARIANCE FOR THE REGRESSION ANALYSIS OF VARIANCE THE REGRESSION DEGREES SUM OF MEAN SQUARES SQUARES OF FREEDOM ATTRIBUTABLE TO REGRESSION TO REGRESSION 4 4 239.66434 59.91608 DEVIATION FROM REGRESSION 88 24.80563 0.28188 TOTAL 92 264.46997 SOURCE SOURCE OF VARIATION F VALUE 212.55716 CASO DE ESTUDIO 7.2 7.2 VENTAS DE RESTAURANTE Jim Price, quien estaba trabajando en su grado de maestrIa en administración de empresas, laboraba en en su de maestría administración empresas, laboraba en un pequeño restaurante cerca de Ia Marquette University en Milwaukee, Wisconsin. Un día, la gerente la Milwaukee, Wisconsin. dia, Jim que acudiera a su oficina; le indicó que estaba muy interesada en pronosticar del restaurante le pidió a Jim que acudiera a su oficina; le indicó que estaba muy interesada en pronosticar dispuesto colaborar. Como quería las ventas semanales y querla saber si Jim estaba dispuesto a colaborar. Como Jim acababa de tomar acababa un curso de estadIsticas avanzadas dijo que le encantarIa el reto. estadísticas encantaría reto. Ia gerente que le proporcionara cualquier Jim pidió a la gerente que le proporcionara cualquier información histórica que tuviera disponible. histórica tuviera disponible. Ella le indicó que las ventas del restaurarite de Ia semana anterior se recopilaban cada lunes por la las ventas del restaurante la anterior recopilaban cada lunes Ella mañana. Jim comenzó su análisis obteniendo los datos de ventas semanales de la semana que terminó maiana. Jim comenzó su análisis obteniendo los datos de ventas semanales de la semana que terminó el domingo 4 de enero de 1981 hasta la semana que terminó el domingo 26 de diciembre de 1982; un 1981 1982; total de 104 observaciones. semanas resultó ser de $4 862. La fig. 7.5 es semanales para las La media de ventas semanales para las 104 semanas resultó ser de $4862. La fig. 7.5 es una gráfica de las ventas semanales a través del tiempo. La gráfica indica que las ventas semanales fueron del tiempo. La gráfica indica que las ventas semanales fueron muy inconsistentes, con una fluctuación de $1 870 a $7 548, con muy poca tendencia. Como Jim muy inconsistentes, con una fluctuación de $1 870 a $7 548, con muy poca tendencia. Como Jim concluyó recientemente un curso sobre análisis de regresión, decidió usar las ventas semanales como semanales como Ia la variable dependiente y buscar la posibilidad de encontrar predictores variables independientes i'itiles. buscar la posibilidad de encontrar predictores variables independientes útiles. una variable Jim probó con tres predictores. El primero fue el periodo. El segundo predictor fue una variable ficticia que indicaba si la universidad estaba o no en sesión completa durante esa semana (0 = no en sesión completa (O = no en ficticia revisión la sesión completa, 1 = en sesión completa). Una revision de los datos de ventas en Ia fig. 7.5 reveló que completa, 1 completa, las ventas semanales disminulan siempre que la universidad no estaba en sesión completa, es decir, semanales disminuían siempre que universidad no las durante los recesos de navidad, primavera y verano. Jim no se sorprendió, pues el restaurante se ubica se sorprendió, pues el restaurante se ubica comunidad cerca del campus de Ia universidad y la mayoria de sus clientes son miembros de la comunidad de del la universidad y mayoría Capitulo 7 Capítulo Caso de estudio 303 U4 • • • ••• . 6000 • • 6000 • •• 3 • . •• • • .3. • .• '" ~ • . > • • >4500 -. .• •• •• . • .• • 7500 .. 3 4500 3000 .. • ..2.• •••• . • I . • 1500 • • .. • 3 2 32 • • •• • ... ••• • • . .. . • • • • 2•• • 2 • . • . • . Cl • 2. 2 • .. •• . • • • 2• •• 2 . • . • 32 2 I 0 25 50 75 100 125 Periodo Figura 7.5 Figura 7.5 Ventas de restaurante, de enero de 1981 a diciembre de 1982. 1981 1982. Ventas restaurante, de enero Marquette. El tercer pronóstico que probó Jim fueron las ventas retrasadas una semana, ya que la revision pronóstico ventas retrasadas uia semana, ya que la revisión de la fig. 7.5 indicaba que las ventas de dos semanas adyacentes eran fiecuenternente similares. frecuentemente similares.· fig. rnedio de Minitab, Jim calculO las correlaciones simples entre los tres pronósticos potenciales Por medio de Minitab, Jim calculó las correlaciones simples entre los tres pronósticos potenciales y la variable dependiente, ventas semanales. Los resultados se presentan en Ia matriz de correlaciOn de la correlación Ia Ia tabla 7.19. Como Jim esperaba, casi no habIa tendencia en las ventas semanales como lo indicaba el la tabla 7.19. Como Jim esperaba, casi no había tendencia en las ventas semanales como lo indicaba el coeficiente de correlación de .049. Sin embargo, Ia variable ficticia estaba fuertemente correlacionada la ficticia actuales, si Ia universidad está o no en sesión completa tiene con las ventas actuales, r = .772; en otras palabras, si la universidad está o no en sesión completa tiene un buen potencial como pronóstico de las ventas de la semana actual. Las ventas de la semana actual potencial como pronóstico de las ventas de la semana actual. Las ventas de la semana actual relacionadas en forma r= estuvieron relacionadas en forma moderada, r = .58, con las ventas retrasadas una semana. No obstante, ventas retrasadas semana. No obstante, Jim tarnbién notó que Ia variable ficticia estaba moderadamente relacionada, rr = .49, con las ventas también la ficticia estaba moderadarnente relacionada, = .49, con las ventas retrasadas una sernana. una semana. De nuevo, con la ayuda del paquete de córnputo Minitab, Jim experimentO con diversos modelos cómputo experimentó modelos de regresión. Los resultados de éstos se presentan en la tabla 7.20. Como los datos manifestaron una 7.19 TABLA 7.19 MATRIZ DE CORRELACION DE LAS VENTAS DE RESTAURANTE DE CORRELACiÓN DE LAS VENTAS DE RESTAURANTE VENTAS ACTUALES PERIODO .049 1.000 VARIABLE FICTICIA .772 -.048 .048 1.000 VENTAS RETRASADAS VENTAS UNA SEMANA Ventas actuales actuales Periodo ficticia Variable ficticia Ventas retrasadas 1.000 .580 .120 .490 1.000 304 Regresión mUltiple RegresiOn múltiple CapItulo 7 Capítulo 7 tendencia casi el "periodo" agregó muy poco valor productivo al modelo de regresión. tendencia casi nula, el pronóstico "periodo" agregó muy poco valor productivo al modelo de regresión. sólo R2 ligeramente más alta que el modelo 2, y que ambos modelos Nótese que el modelo 4 tiene solo una R2 ligeramente más alta que el modelo 2, y que ambos modelos poseen una cantidad significativa de autocorrelación (la autocorrelación se abordará en forma más cantidad significativa autocorrelación autocorrelación se abordará forma completa en el cap. 9). Además, los modelos 3 tienen la misma R2 mientras que el modelo sólo completa en el cap. 9). Además, los modelos 3 yy55tienen la misma R2,, mientras que el modelo 77sOlo R 2 ligeramente superior al modelo 6. Por otra parte, el pronóstico "ventas retrasadas" incortiene una R2 ligeramente superior al modelo 6. Por otra parte, el pronóstico "ventas retrasadas" incorpora una buena cantidad de poder predictivo a! modelo de regresión. El modelo 6 tiene una R22 una buena cantidad de poder predictivo al modelo de regresión. El modelo 6 tiene una R significativamente más alta que el modelo 2, sin tener una autocorrelaciOn significativa. más alta que el modelo 2, sin tener una autocorrelación significativa. TABLA 7.20 7.20 MODELOS DE REGRESION DEL RESTAURANTE REGRESiÓN DEL RESTAURANTE MODELOS ¿AUTOCORRELACIÓN ,AUTOCORRELACION SIGNIFICATIVA .OS? EN EL NIVEL .05? EN Sí SI Sí SI No SI Sí No No No PRONOSTICO(S) PRONOSTICO(S) DEL MODELO R2 ESTADÍSTICA ESTADISTICA DURBIN-WATSON DURBINWATSON .81 1.30 1.89 1.32 1.89 1.74 1.73 COLINEALIDAD l. Periodo .0024 1.Perjodo .596 2. Variable ficticia .336 3. Ventas desfasadas .603 4. Periodo y ficticia Periodo 5. Periodo y ventas desfasadas Periodo desfasadas .336 retrasadas .649 6. Ficticia y ventas retrasadas Ficticia .651 7. Período, ficticia y ventas retrasadas .651 PerIodo, ficticia y Ninjna Ninguna Ninguna Ninguna Muy poca Poca Alguna Moderada decidió las ventas semanales, por las Jim decidiO seleccionar el modelo de regresión 6 para pronosticar las ventas semanales, por las el siguientes razones: 1. El modelo 6 tiene Ia segunda R2 mayor, sOlo .002 por debajo del modelo 7. modelo 6 tiene la segunda R2 sólo .002 del modelo 7. 2. Los parárnetros del modelo 6 fueron cada uno diferentes de cero en forma significativa al nivel parámetros del modelo fueron cada diferentes de cero significativa al nivel de .01. .01. 3. El modelo 6 no exhibió una cantidad significativa de autocorrelaciOn. modelo 6 no exhibió una cantidad significativa de autocorrelación. 4. El modelo 6 es rnás simple que el modelo 7 y no tiene tanta colinealidad. modelo 6 es más simple que el modelo 7 y no tiene tanta colinealidad. regresión utilizado por Jim fue 1 ficticia) .2605 El modelo de regresión utilizado por Jim fue Y= 2 614.3 + 1 610.7 (variable ficticia) + .2605 La R2 .649 significa la variación en las ventas (ventas retrasadas). La R2 = .649 significa que se puede explicar el 64.9% de la variación en las ventas semanales mediante el conocirniento de si Ia universidad estaba o no en sesión completa y de las ventas o no en sesión completa y de las ventas conocimiento la universidad la semana previa. ecuación regresión promedio ventas semanales de de Ia semana previa. La ecuación de regresión implica que el prornedio de ventas semanales es de alrededor de $1 611 más alto cuando Marquette se encuentra en sesión completa, manteniendo airededor de $1 611 más alto cuando Marquette se encuentra en sesión conipleta, manteniendo semana constantes las ventas de la sernana anterior. Jim quedó satisfecho con su esfuerzo pero se preguntó si otro tipo de modelo de pronóstico pudiera quédO satisfecho con su esfuerzo pero se preguntó si otro tipo de modelo de pronOstico pudiera ser más efectivo. Por este motivo, decidiO tomar un curso sobre pronósticos. motivo, decidió tornar un y= Capítulo 7 Cap itulo Caso de estudlo estudio 305 PREGUNTAS 1. ¿Fue correcto el uso de la variable ficticia por parte de Jim? variable ,Fue correcto el 2. ¿Fue correcto que Jim empleara las ventas retrasadas una semana como variable de predicción? predicción? ,Fue correcto 3. ¿Está usted de acuerdo con las conclusiones de Jim? las conclusiones de Jim? ,Está 4. j,SerIa otro tipo de modelo de pronóstico más efectivo para el pronóstico de las ventas semanales? ¿Sería pronóstico de las ventas semanales? CASO DE ESTUDIO 7.3 ESTUDIO 7.3 TUX MR. TUX John Mosby ejecutó un análisis de regresión simple utilizando el periodo como variable de predicción un análisis de regresión simple utilizando el penodo como variable de predicción y observó un decepcionante valor de r-<;uadradade .49 (véase el caso de Mr. Tux al final del cap. 6). rcuadrada de .49 (véase el caso de Mr. Tux al final del cap. 6). Como sabe que sus ventas tienen un fuerte componente estacional, decide ejecutar un modelo de sus ventas tienen un fuerte componente estacional, decide ejecutar Como modelo de múltiple estacional. regresión máltiple estacional. el paquete de cómputo Sibyl/Runner. Este programa Para realizar su análisis, John emplea el paquete de cómputo Sibyl/Runner. Este programa puede incluir cualesquier variables de pronóstico, y crear de manera automática variables ficticias para el manera automática variables ficticias para el incluir cualesquier variables de pronóstico, efecto estacional. Como los datos de Mr. Tux son mensuales, SibyllRunner codifica una variable de Mr. Tux son mensuales, SibyI/Runner codifica una variable efecto estacional. Como los cada enero como 1, otra para cada febrero como así sucesivamente. Sólo hay 11 estacional para cada enero como 1, otra para cada febrero como 11yyasI sucesivamente. Solo hay 11 variables estacionales, para los meses de enero a noviembre. Diciembre es el mes base y no tiene un variables estacionales, para los meses de enero a noviembre. Diciembre es el mes en la ecuación final de regresión. ajuste estacional en la ecuación final de regresión. variables de predicción: el nümero John ejecuta el programa utilizando las 12 variables de predicción: una para el número de mes, del 1 al 96, para representar el periodo y las otras once para representar el efecto mensual. A continuación para representar las otras once para representar el efecto mensual. A continuación se presentan las estadísticas clave generadas por su progama de cómputo: las estadisticas dave cómputo: R-<;uadrada = .877 Rcuadrada = .877 F=49.385 F = 49.3 85 DAM = 277.3 DAM=277.3 PEMA = 72.71% Durbin--Watson 1.41 Durbin-Watson = 1.41 EMC = 124 795.4 124795.4 PME=30.69% PME = 3 0.69% observaciones. JoOO La mediciones de error se efectuaron por medio del programa para las 96 observaciones. John mano PEMA para los últimos 12 meses datos y resultó ser de 21.25%. Él está muy calculó a mano el PEMA para los ültimos 12 meses de datos y resultó ser de 21.25%. El está muy decepcionado con las altas cifras de las mediciones de error, pues esperaba que resultaran pronósticos resultaran pronósticos los estacionales. precisos al incluir los efectos estacionales. Al revisar los valores de t de su regresión, John encontró que tanto para el término constante de su regresión, JoOO encontró tanto para el término constante Al los coeficiente regresión eran diferentes de cero en forma como para el coeficiente de regresión del periodo, los valores de tt eran diferentes de cero en forma significativa (-2.3 y 19.5). significativa (-2.3 19.5). autocorrelación de los residuos del modelo (véase graficar coeficientes Al graficar los coeficientes de autocorrelación de los residuos del modelo (véase la gráfica con siguiente), John se encontró con más problemas. 306 AUTOCORRELATION COEFFICIENTS RESIDUAL AUTOCORRELATION COEFFICIENTS I Regresión múltiple RegresiOn multiple CapItulo 7 Capítulo 7 I I I .5 I I I X I X IX I I III I I I - - X X xx XXX X X X X x X X X X X - - xx X . - X X - X XX O. o I-X- -X- -X- -X- -X- -X- -X- -X- -X- -X- -X- -X- -X- -X- -X- -X- -X- -X- -X- -X- -X- -X- -X- -X0.0 I-X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X--X XXX X X X X X XX - XXX XXX. - XX XX . XXX - XXX XX XXX. X X X XX -.5 I I I I -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+-+- -+- -+- -+- -+- -+- -+II-+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- LAG= 1 2 4 8 9 10 311 12 13 14 15 16 17 18 19 20 21 22 23 24 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 5 1 4 6 7 8 COR 0.29 -.09 -.29 -.29 0.03 0.27 0.05 -.14 -.05 -.15 -.02 0.24 0.29 0.05 -.14 -.05 -.15 -.02 -.09 -.29 -.29 0.48 .06 -.03 - .18 0.03 - o1 o. 08 - O3 -. O6 -.26 O . O6 O . O6 O . 48 --. 06 -. 03 0.068 O . O3 -..01 0.08 -. 1 VALUE - ..03 - .06 -. 2 6 0.06 COMPUTED (22 DEGREES OF FREEDOM) = 74.6209 FREEDOM) = 74.6209 22 CHI-SQUARE COMPUTED CHI-SQUARE FROM TABLE ( 22 DEGREES OF FREEDOM) = 33.90 FROM TABLE ( 22 OF FREEDOM) = 33.90 ( la la SibyIlRunner: En especial le molestó Ia declaración al final de Ia impresión de Sibyl/Runner: fOfila estadística el método de pronóstico, ya Este análisis indica que no se puede defender en forma estadIstica el método de pronóstico, ya que existe cierto patron en los residuos que se puede pronosticar. Las autocorrelaciones que patrón los residuos que se puede pronosticar. Las autocorrelaciones que que aleatorias están en periodos 23, 12, 11, l. no parecen aleatorias están en los periodos 23, 12, 11, 7, 6, 5, 1. PREGUNTAS 1. ¿Qué tan válido es el método de pronóstico de John? pronóstico John? Que tan válido 2. Explique los indices t para las variables ficticias. índices para las variables ficticias. 3. John está comprensiblernente molesto al fallar en el desarrollo de un buen método de pronóstico comprensiblemente un buen método de pronóstico utilizando el periodo y los efectos estacionales. ,Conio le explicarIa usted esta falla? los efectos estacionales. ¿Como le explicaría usted esta falla? Qué cree tisted que deberIa intentar ahora John en esfuerzo para pronosticar volúmenes 4. ¿Qué cree usted que debería intentar ahora John en su esfuerzo para pronosticar los volürnenes de ventas de Mr. Tux? Capítulo 7 CapItulo Caso de estudio Caso de estudlo 307 ESTUDIO 7.4 CASO DE ESTUDIO 7.4 CONSUMER CREDIT COUNSELING de Credit Counseling describió en el cap. (caso de estudio 1.2) y La operación de Consumer Credit Counseling (CCC), se describió en el cap. 1 (caso de estudio 1.2) y en el cap. 3 (caso de estudio 3.4). (caso de estudio 3.4). El director ejecutivo, Marv Hamishfeger, llegó a la conclusión de que la variable más importante Mary Harnishfeger, la conclusion de que la variable más importante que requeria pronosticar CCC era el nümero de nuevos clientes por atender en el resto de 1993. Mary número Marv requería Ic proporcionó número de nuevos clientes atendidos en el le proporcionó a Dorothy Mercer los datos mensuales de námero de nuevos clientes atendidos en ci enero 1985 a marzo de 1993 (véase Caso de estudio el Caso de estudio 4.3, periodo de enero de 1985 a marzo de 1993 (véase Caso de estudio 4.3). En ci Caso de estudio 4.3, Dorothy usó el análisis de autocorrelaciOn para explorar ci patrOn de datos. En el Caso de estudio 6.5, análisis de autocorrelación el patrón de estudio 6.5, número de personas que reúnen cupones de descuento y un índice de actividad empresarial probó el nümero de personas que reñnen cupones de descuento y un indice de actividad empresarial para desarrollar un modelo de regresión para pronosticar el resto de 1993. desarrollar un modelo de regresión para pronosticar el resto de 1993. Dorothy no quedó satisfecha con los resultados de su modelo de regresión. Decidió intentar la con resultados de modelo regresión. regresión múltiple yypidió a Marv que pensara enen otras variables que pudieran relacionarse con el nmero regresiOn mOltiple pidiO a Mary que pensara otras variables que pudieran relacionarse con el número de clientes atendidos. Mary le indicO que podía intentar el rn'imerode quiebras registradas y el númeMarv le indicó número de quiebras registradas y el namepodia ro de permisos de construcciOn emitidos. de permisos de construcción Dorothy localizó datos para ambas variables para el periodo de enero de 1986 a diciembre de localizó datos para ambas variables para el periodo de enero de 1986 diciembre de 1992: QUIEBRAS 1986: 1987: 1988: 1988: 1989: 1990: 1991: 1992: 160 171 174 180 172 136 130 170 206 162 149 146 167 165 140 140 173 196 200 173 195 178 165 185 179 172 172 143 181 181 145 162 165 169 168 156 166 129 160 177 170 177 173 151 166 150 168 143 143 149 140 165 146 145 165 177 180 180 160 129 143 134 131 192 169 131 143 132 127 145 155 169 166 164 195 170 170 168 160 152 169 162 140 157 186 152 157 146 161 135 140 94 PERMISOS DE CONSTRUCCION EMITIDOS PERMIS Os DE CONSTRUCCIÓN 1986: 1987: 1988: 1989: 1990: 1991: 1992: 49 44 32 61 111 67 133 60 76 32 48 92 118 210 149 137 127 108 166 166 205 298 214 145 149 161 161 189 253 334 191 150 128 200 245 296 312 193 168 178 204 261 300 333 161 161 168 132 164 207 284 311 174 170 164 164 32 175 238 282 327 168 203 158 146 152 92 200 171 198 247 282 261 352 312 387 111 111 104 121 153 164 237 243 64 48 77 79 108 130 140 238 regresión multiple que utilizaba ci nümero de personas que Dorothy desarrolló un modelo de regresiOn múltiple que utilizaba el número de personas que reúnen cupones de descuento, el Indice de actividad empresarial, el nimero reuinencupones de descuento, el índice de actividad empresarial, el número de quiebras registradas y nümero construcción modelo con base en la suposición el número de permisos de construcción emitidos. También creó un modelo con base en Ia suposición de que los datos fueran estacionales. PREGUNTAS PREGUNTA S l. Determine si existen relaciones signifIcativas entre el nuimero de clientes atendidos y cuaiquiera y cualquiera 1. Determine si existen relaciones significativas entre el número variables. de estas variables. 308 Regresion múltiple Regresión multiple Capítulo 7 CapItulo 7 2. Desarrolle una ecuación de regresión y üsela para pronosticar el nümero de nuevos clientes pronosticar el número nuevos clientes Desarrolle una ecuación de regresión úsela resto de 1993. atendidos para el resto de 1993. 3. Compare los resultados de su pronóstico con las observaciones reales de 1993. resultados de observaciones reales 1993. Compare 4. Suponga que desarrolló una buena ecuación de regresión. ¿Podría emplearla para pronosticar el que desarrolló una buena ecuación de regresión. PodrIa resto de 1993? 1993? Determine el utilizando variables ficticias para la estacionalidad fue un 5. Detem1ine si ci modelo de agregación utilizando variables ficticias para la estacionalidad fue un buen modelo. modelo. 6. Utilice el modelo estacional para pronosticar los tres primeros meses de 1993 Y compare sus Utilice el modelo estacional para pronosticar los tres primeros meses de 1993 y compare sus resultados. VERSIÓN ESTUDIANTIL DE FORECAST VERSION ESTUDIANTIL DE FORECAST PLUS Forecast Plus puede utilizar archivos de datos creados mediante otros prograrnas como Forecast Plus puede utilizar archivos de creados mediante programas como Lotus 1-2-3 dBase. Sin embargo, pudiera ser necesario emplear un programa Lotus 1-2-3 yydBase. Sin embargo, pudiera ser necesario emplear un programa de conversión para modificar el fonnato del archivo de datos. Forecast Plus sólo puede leer conversion para modificar ci forrnato del archivo de datos. Forecast Plus solo puede leer conversión pm1ir archivos ASCII. El programa de conversion (FX2FR) se ejecuta a partir del disco principal, Data Management Disk. Por ejemplo, creamos 1m archivo de datos (CLIENT), en ASCII, que contiene las contiene Por ejemplo, creamos un archivo de datos (CLIENT), en ASCII, variables clientes, cupones, pennisos ee Índice. El primer registro de este archivo, que variables clientes, cupones, perrnisos indice. El primer registro de este archivo, que representa los datos representa los datos de enero de 1989 es 1989 es 15024450 61107 Para convertir este archivo de manera que pueda ejecutarse con Forecast Plus, escriba ci convertir archivo manera que pueda ejecutarse Forecast escriba el del programa de conversión: nombre del prograrna de conversion: A: \FX2FR \FX2FR El sistema solicitará ci nombre del archivo a convertir el archivo convertir What is the name of the data file? CLIENT What is the name of the data file? CLIENT continuación, se le pedirt el fonnato tiene dicho archivo ("Enter data file fonnat"): A continuaciOn, se le pedirá ci formato que tiene dicho archivo ("Enter data file format"): l. StatPac file file 2. Constant field width Constant field 3. Variable field width Variable field Which? 3 3 Versión estudiantil de Forecast Plus Version estudiantil de Forecast Plus 309 Como nuestro archivo tiene campos de longitud variable, la elección es 3. Enseguida se Como nuestro archivo tiene campos de longitud variable, Ia elección es 3. Enseguida se solicita el nñrnero de variables número of variables: 4 Enter the number of variables: 4 registrar el programa solicita la longitud de cada variable: Después de registrar 4, el programa solicita la longitud de cada variable: Field Field Field Field width width width width for for for for for for for for Variable Variable Variable Variable Variable Variable Variable Variable # 1:: # 1 # 2: # 2: # 3:: # 3 # 4: # 4: 3 3 5 5 3 3 3 3 Se le pedirá el nombre del archivo convertido ("Enter Name of Output File: CLIENTFP"). conve11ido of CLIENTFP"). El archivo de datos ya ha sido convertido y se puede ejecutar en Forecast Plus. Las variables Plus. fueron separadas por comas y ahora ci primer registro es el plimer fueron separadas por comas 150,24450,61,107 150.24450.61.107 continuación, archivo etiquetas. En menú de administración A continuación, se debe crear el archivo de etiquetas. En el mern de administración (Data Management Menu), selecciona 1 (ENTER DATA); el de datos (Data Management Menu), se selecciona la opción 1 (ENTER NEW DATA); el programa le solicitará el nombre del archivo de datos al que desea incorporarle un archivo incorporarle archivo del archivo de datos al de etiquetas ("What data file would you like to add to?"). Después de responder CLIENTFP, to add to?"). Después de el prograrna indica to siguiente: programa lo siguiente: label file B:CLIENTFP does not exist The label file B:CLIENTFP does not exist Do you want to create it (y/n)? y to create it (y/n)? y *** Labels File Creation * ** File Creation *** Creating labels file B:CLIENTFP.LBL Creating labels file of variables: Number of variables: 4 4 Type of labeling: of labeling: Starting label: label: Starting observation: observation: YEAR 1989 1 1 310 Regresión multiple múltiple Number of observations between each label: 12 label: of observations between each Increment of the labels: of the labels: 1 12 Capítulo 7 Capitulo *** Labels File Creation * ** File Creation *** Variable 1 label: Variable 2 label: 2 label: Variable 3 label: 3 label: Variable 4 Label: 4 Label: CLIENTS FüüD FOOD PERMITS INDEX Ahora, llama al paquete de pronósticos seleccionando la opción del menú Ahora, se llama al paquete de pronósticos seleccionando la opción 3 del menu principal. Se le solicita ci nombre del archivo de datos plincipal. solicita el nombre del archivo de datos What is the name of the data file? is name of the data file? CLIENTFP menú le pennite elegir entre 13 diferentes técnicas de pronóstico. La pantalla corresponEl menñ le permite elegir entre 13 diferentes técnicas de pronóstico. La pantaila correspondiente se muestra en la sección de Forecast Plus del cap. 5. sección Forecast Plus del cap. 5. diente Para utilizar los cupones de descuento, los perrnisos y ci mndice de actividad corno los cupones de descuento, los pennisos y el índice actividad como Para nuestras vatiables de predicciOn y los clientes atendidos como la variable dependiente, se nuestras variables predicción y los clientes atendidos corno Ia variable dependiente, se el programa múltiple, opción 11. utiliza ci prograrna de regresión rnñltiple, opción 11. La pantalla muestra lo siguiente. Multiple Regression * * Enter the variables to use in the multiple regression. Enter Enter the variables to use in the multiple regression. Enter the dependent variable, followed by the independent variables by the independent variables the dependent variable, (LIST will list the variables) the variables): (LIST will CLIENTS ,FOOD, PERMITS, INDEX CLIENTS,FüüD,PERMITS.INDEX Descriptive statistics: statistics: statistics: Regression statistics: Regression coefficients Regression Simple Simple correlation matrix: matrix: Partial correlation matrix: matrix: Partial Inverted correlation matrix: Inverted matrix: of records to use in residual analysis: Number of records to use in residual analysis: Y Y Y Y Y Y Y Y Y y N N 50 Time plot of original data, forecasts, and error: Y Time plot of original data, forecasts, and error: Y autocorrelation function: Y Residual autocorrelation function: Y Interactive N Interactive prediction N Press ENTER to accept: to accept: Press Versión Forecast Plus VersiOn estudiantil de Forecast Plus 311 el orden Nótese que en el orden de registro de las variables fue primero la dependiente, seguida prirnero las independientes, separadas comas. Usted podría haber deseado usar números de de las independientes, separadas por comas. Usted podria haber deseado usar niimeros de de nombres. Para ejecutar regresión múltiple, pueden variable en lugar de nombres. Para ejecutar este modelo de regresión multiple, se pueden las opciones por omisión ya proporcionadas por sistema. fig. 7.6 muestra los usar las opciones por omisión ya proporcionadas por el sistema. La fig. 7.6 muestra los resultados cuando las respuestas son Y, Y, Y, Y, Y, N, O, Y Y N. resultados cuando las respuestas son Y, Y, Y, Y, Y, N, 0, N, Y y N. último preglmta si desea almacenar pronósticos residuos Por ültimo se le pregunta si desea almacenar los pronôsticos sobre residuos Do you want to save the forecasts or res:Lduals (yin)? to save the forecasts or residual s (y/n)? Do CLIENTS - MULTIPLE REGRESSION ANALYSIS - MULTIPLE Variables in the equation - OESCRPTIVE STATISTICS - DESCRPTIVE Variables Varo Var. OV DV IV1 IV2 1V2 IV3 1V3 label Variable label CLIENTS FOOO FOOD PERMITS INOEX INDEX Mean 127.6471 27781.6275 196.9608 106.4118 Standard 0ev. Oev. 40.8949 7674.1176 96.2239 27.7994 REGRESSION STATISTICS 0.7377 Coefficient Coefficient of multiple determination = 0.7377 (Corrected = 0.8589 0.8589 Coefficient of multiple correlation correlation Coefficient (Corrected 21.6043 (Corrected Standard error of multiple estimate estimate F-Ratio Oegrees of freedom Degrees of freedom Probability of chance chane e of observations Number of observations 44.0513 = 44.0513 = 3 & 47 3 & 47 = 0.0000 = 51 51 0.7267) 0.8525) 22.0498)21.6043 (Corrected = REGRESSION COEFFICIENTS Constant = -7.9141 = 7.9141 Varo Var. IV1 IV2 1V2 IV3 Coeff. -0.0011 0.0011 -0.0094 0.0094 1.5818 Beta -0.2088 0.2088 -0.0221 0.0221 1.0752 1.0752 F-ratio F-ratio 0.229 0.037 7.271 Probo Prob. 0.634 0.849 0.849 0.010 Std. Std. Error 0.0023 0.0488 0.5866 SIMPLE CORRELATION MATRIX OV DV IV1 IV2 1V2 IV3 I I IV1 IV2 1 I I I 0.828 0.503 0.857 0.700 0.979 0.625 0.625 Figura 7.6 Figura 7.6 múltiple caso de estudio 7.4. Regresión multiple para el caso de estudio 7.4. 312 Regresión múltiple Regresiôn multiple PARTIAL CORRELATION MATRIX PARTIAL IV1 IV1 IV2 1V2 IV3 - Capítulo 7 CapItulo IV2 1V2 I I I 0.553 0.971 -0.412 CLIENTS - MULTIPLE LINEAR REGRESSION LINEAR REGRESSION RESIDUAL AUTOCORRELATION FUNCTION FUNCTION of the Resuduals 20.9462 Standard Deviation of the Resuduals = 20.9462 Lag 1 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 1 Value 0.12 0.08 0.03 0.15 0.11 -0.08 0.02 -0.03 -0.23 -0.10 0.09 0.31 -O .15 -0.15 -0.08 -O .19 -0.19 0.01 0.19 T-Value 0.88 0.53 0.18 1. 04 1.04 0.73 -0.52 0.12 -0.21 -1.53 -0.62 0.59 1. 96 1.96 -0.91 -0.47 -1.12 0.06 1.10 -1.0 -1.0 0.0 · *** +1. O +1.0 2 [ : 0.53 *** · * · * · **** ·*** ** . 0.12 * . [******: ** . ] ] ] ] ] ] ] ] ] 11 11 12 12 13 13 [ [ [ [ [ -0.47 -1.12 [[ [ ] 14 14 15 16 17 17 [ [ ] ·** :*******] **** . ] ** . ] I *****. ] I ] : I *****. **. [ [ .***** :***** ] [ ] = Estimated Two-Standard Error Limits Two-Standard Error Limits Chi-Square Statistic with 17 Degrees of Freedom 17 Box-Pierce Chi-Square Statistic with 17 Degrees of Freedom == 17 Probability Probability = .456 Figura 7.6 (Continuación) 7.6 PRONÓSTICOS MEDIANTE HOJAS DE CALCULO DE CÁLCULO PRONÔSTICOS El problema. EnEn los ejemplos 7.1alal 7.4, se utilizóelelanálisis de regresión El problema. los ejemplos 7.1 7.4, se utilizó análisis de regreslOn múltiple para determinar si se podían emplear el precio de yenta y los gastos en publicidad multiple determinar podlan venta para pronosticar las ventas semanales de galones de leche (tabla 7.3) para el ejemplo pronosticar las ventas semanales de galones de leche (tabla 7.3) ejemplo del Sr. Bump. Este pronóstico se puede lievar a cabo mediante Lotus 1-2-3 (version 2.3). Sr. Bump. Este llevar (versión 2.3). mediante Lotus La solución mediante hoja La solución mediante hoia de cálculo cálculo 1. Para accesar la hoja 1. Para accesar Ia hoja de cálculo BUMP.WK1, escriba /FILE RETRIEVE o /FR. Cuando BUMP.WK1, escriba/FILE RETRIEVE o /FR. Cuando aparezca el mensaje Pronósticos mediante hojas de cãfculo cálculo PronOsticos mediante 313 Name of file to retrieve: of file to retrieve: A:\ línea deberá ver el de la cálculo que almacenó al final del En la tercera ilnea deberá ver el nombre de la hoja de cálculo que almacenó al final del cap. 6. Después de seflalar BUMP.WK1, oprirna <Enter>. de señalar BUMP.WKl, oprima 2. Para borrar los resultados de la regresión anterior, escriba /RANGE ERASE o /RE y 2. Para borrar los resultados de la regresión anterior, escriba IRANGE ERASE o /RE y aparecerá a! mensaje al range to erase: Enter range to erase: Escriba el rango D3..G12. D3 ..G12. 3. Ingrese ahora la variable Xen Ia colurnna C. ahora la X en la columna 4. Escriba ¡DATA REGRESSION o ¡DR, que equivale a seleccionar Data File del menú /DATA REGRESSION o /DR, que equivale a Data del menu submenú. principal y Regression del subrnenü. El menú de regresión muestra lo siguiente menu de X-Range Y-Range Output-Range X-Range Y-Range Output-Range Intercept Reset Intercept Reset Go Quit Se selecciona X-Rangeyyen la pantalla se solicita el rango respectivo XRange en la pantalla se solicita el rango respectivo independent variables. or range: B3 .012 Enter independent variables, or XXrange: B3. .. C12 Usted puede ya sea escribir B3..C12 o definir las variables X resaltándolas. Una vez sea escribir B3 ..C12 o definir las variables resaltándolas. definido el rango de X, se selecciona OutputRange para indicar el area en que se definido el rango de X, se selecciona Output-Range para indicar el área en que se esclibirán escribirán los resultados Enter output range: E3. .. HII output range: E3 .H11 Ya seleccionado el rango para los resultados, escriba GO para ejecutar la regresión. La los resultados, GO para ejecutar regresión. salida se muestra en Ia fig. 7.7. la 314 E3: Fill Table Sort Query Distribution Query Distribution Calculate linear regression regression A B C o B D C y X2 X3 1 1 Y 2 2 9 3 10 1.3 9 3 10 1.3 4 2 7 2 7 6 6 5 5 1.7 5 5 5 5 6 12 12 1.5 14 14 1.5 6 15 7 10 1.6 7 10 15 15 1.2 12 1.2 12 8 8 1.6 6 9 5 6 5 1.4 10 1.4 10 10 12 12 11 17 1 15 11 1 21 12 1.1 12 20 13 14 15 16 17 18 18 19 20 10:17 04-Jan-94 04-Jan94 10:17 AM Regresión múltiple RegresiOn multiple Matrix Regression Matrix Regression Capítulo 7 CapItulo MENU Parse G C H H E E F Output: Regression Output: Constant 16.40636 Std Err of Y Est of Y Est 1.507196 R Squared 0.931928 No. of Observations 10 No. 10 Degrees of Freedom 7 Degrees 7 X Coefficient(s) X Std Err of Coef. of Coef. -8.24758 0.585100 8.24758 0.585100 2.196057 0.133671 2.196057 NUM Figura 7.7 7.7 múltiple mediante Lotus para el ejemplo del Regresión multiple mediante Lotus para el ejemplo del Sr. Bump. PAQUETE DE CÓMPUTO MINITAB PAQUETE DE COMPUTO MINITAB El problema. En ci ejernpio 7.11, Pam Weigand deseaba ejecutar una regresión Weigand deseaba ejecutar una regresión En el ejemplo El por pasos para los datos de Ia Zurenko Pharmaceutical Company, con el propôsito de los datos de la Zmenko Phannaceutical Company, con el propósito por pasos pronosticar qué aspirante se convertirla en un buen vendedor. aspirante convertiría vendedor. La soludón con Minitab La solución con Minitab 'ZURENKO.DAT' Cl-C6 MTB > READ 'ZURENKO.DAT' Cl-C6 > 30 ROWS 30 ROWS READ ROW 1 1 2 2 3 3 4 4 S Cl C2 10 19 27 C3 C4 CS C5 O 0 C6 44 47 60 71 71 31 22.1 22.5 23.1 24.0 4.9 3.0 1.5 0.6 1 1 O 0 3 3 2.4 2.6 2.8 2.7 MTB > NAME Cl 'SALES' C2 'APTITUDE' C3 'AGE' C4 'ANXIETY' > Cl 'SALES' C2 'APTITUDE' C3 'AGE' C4 'ANXIETY' MTB > NAME CS 'EXP' C6 'GPA' > CS 'EXP' C6 'GPA' MTB > STEP C1 USING PREDICTORS C2-C6 MTE > STEP Cl USING PREDICTORS C2-C6 STEPWISE REGRESSION OF SALES ON 5 PREDICTORS, WITH N = 30 SALES ON 5 PREDICTORS, WITH N 30 STEPWISE CONsi~~i STEP CONSTANT 100.85 -loost I [ 86.79 1 -s6.7~ 2 Paquete de cOmputo SAS cómputo AGE T-RATIO APTITUDE T-RATIO RATIO S S 315 6.97 7.01 5.93 5 .93 10.60 10.60 0.200 0. 200 8.13 6.85 63.70 3.75 89.48 R-SQ capturar los datos del archivo ZURENKO.DAT las • El cornando READ se usa para captmar los datos del archivo ZURENKü.DAT en las comando READ usa columnas Cl a C6. a C6. columnas cornando las variables • El comando NAME se emplea para dar nombre a las variables en cada columna. • El cornando STEP se utiliza para desarrollar una regresión por pasos usando C1 como comando STEP se utiliza para desarrollar una regresión por pasos usando Cl la valÍable dependiente y C2 a C6 corno las variables independientes. variable y a C6 como las independientes. • La salida para el paso 1 muestra que la ecuación es 1 que la ecuación es y = -100.85 + 6.97 (edad) Y = -100.85 + 6.97 (edacl) y explica el 63.7% de la varianza. de la varianza. • La salida para el paso 2 muestra que Ia ecuación final es la final es y = - 86.79 + 5.93 (edad) + .20 (aptitucl) 86.79 + 5.93 (edad) + .20 (aptitud) Y y explica el 89.48% de la varianza. la varianza. PAQUETE DE COMPUTO SAS PAQUETE DE CÓMPUTO SAS El problema. En los problemas 10 Y 11, el gerente de ventas de Hartman Auto El problemas 10 y 11, el gerente de ventas de Hartman Auto Supplies desea desarrollar un modelo para pronosticar el total de las ventas anuales de una Supplies modelo para pronosticar el total de región. desarrollar un modelo de regresión por pasos utilizando como variables region. Decide desarrollar tin modelo de regresión por pasos utilizando corno variables independientes el número de distribuidoras, el nürnero de autornóviles registrados y el distribuidoras, el número de automóviles registrados y el independientes ci nirnero ingreso personal. La soluclón SAS La solución 5A5 $ SAS/CC=PRINT $ SAS/CCPRINT OPTIONS PAGESIZE=60 LINESIZE=80; OPTIONS PAGESIZE6O LINESIZE=80; 'STEPWISE FOR PROBLEMS 10 & 11'; TITLE 'STEPWISE ANALYSIS FOR PROBLEMS 10 & 11'; DATA HARTMAN; INPUT SALES OUTLETS AUTOS INCOME; SALES OUTLETS AUTOS INCOME; CARDS; 52.3 2011 24.6 98.5 52.3 2011 24.6 98.5 22.1 31.1 26.0 2850 22.1 31.1 20.2 7.9 650 7.9 34.8 12.5 32.7 16.0 480 12.5 32.7 1694 30.0 1694 9.0 68.8 9.0 68.8 316 Regresión multiple múltiple CapItulo 7 Capítulo 7 46.2 2302 11.5 94.7 46.22302 11.5 94.7 35.02214 20.5 67.6 67.6 35.0 2214 20.5 4.1 19.7 125 4.1 19.7 3.5 33.1 1840 8.9 67.9 33.1 1840 8.9 67.9 25.2 1233 6.1 61.4 1233 6.1 38.2 1699 1699 9.5 85.6 PROC STEPWISE; STEPWISE; 9.5 85.6 MODEL SALES=OUTLETS AUTOS INCOME! MODEL SALESOUTLETS AUTOS INCOME/ SLENTRY=.05: SLENTRY.05; ENDSAS; END SAS; • La declaración TITLE da nombre al prograrna SAS. da nombre al programa SAS. • La declaración DATA proporciona un nombre de archivo para los datos. • La declaración INPUT da nombre y especifica el orden de los cuatro campos en las declaración INPUT da nombre especifica el orden de las líneas de datos. ilneas • La declaración CARDS indica que las siguientes 11 lIneas son irnágenes de tarj eta que indica que las siguientes 11 líneas son imágenes de taIjeta representan a la variable Y y a las tres variables X Ia variable Yy las tres variables X • El comando PROC STEP WISE y el subcomando MODEL, indican que se van a regiscornando STEPWISE y el subcomando MODEL, trar en una ecuación de regresión las variables distribuidoras, automóviles e ingreso en una ecuaciôn de automóviles e ingreso (OUTLETS, AUTOS, INCOME), para predecir Ia variable independiente ventas (SALES). INCOME), para la variable independiente ventas (SALES). • La declaración SLENTRY = .05, especifica el nivel de significación para que una declaración SLENTRY = .05, especifica el de significación que una variable se registre en el modelo final de regresión. En la fig. 7.8, se muestra la salida de cómputo para esta ejecución de SAS. fig. salida STEPWISE ANALYSIS FOR PROBLEMS 10 & 11 FOR PROBLEMS 10 & 11 Stepwise Procedure for Stepwise Procedure for Dependent Variable SALES Variable SALES 1 Step 1 INCOME Entered R-square = 0.87682179 R-square Variable INCOME Entered 25.76209947 DF C(p) = Sum of Squares of Squares 1660.02452235 233.20456856 1893.22909091 Mean Square 1660.02L.52235 1660.02452235 F F 64.06 Prob>F 0.0001 Regression Regression Error Total 1 1 9 9 10 25.91161873 Variable Variable Parameter Estimate 1.03230539 0.47426771 Standard Error 3.88620209 0.05925344 Type II 11 Sum of squares F 0.07 0.07 64.06 Prob>F 0.7965 0.0001 INTERCEP INCOME 1.82835352 1660.02452235 Figura 7.8 Figura 7.8 Salida de cómputo de SAS para los problemas 10 y 11. los problemas 10 Y 11. Paquete de cómputo SAS Bounds on condition number: on condition number: 1, 1, 1 317 Step 2 2 AUTOS Entered Variable AUTOS Entered DF 0.96503519 R-square = 0.96503519 C(p) 4.29970153 F 110.40 C(p) = 4.299 Sum of Squares Sum of 1827.03269576 66.19639515 1893.22909091 1893.22909091 Standard Error Mean Square Square 913.51634788 8.27454939 Prob>F Regression Error Total 2 2 913.51634788 0.0001 8 8 10 10 Variable INTERCEP AUTOS INCOME Parameter Estimate -4 . 026 8977 3 -4.02689773 0.62092180 0.43016878 II Type II Squares Sum of Squares F F 2.66 20.18 151.98 Prob>F 2.46798811 0.13821024 0.03489322 1.085938. 1.085938, 22.02923556 167.00817341 1257.59286751 4.343753 4.343753 0.1414 167.00 0.0020 1257.59286751 0.0001 on condition number: Bounds on condition number: All left in the model are significant at the 0.1500 level. All variables left in the model are significant at the 0.1500 level. the 0.0500 significance level for entry into the No other variable met the 0.0500 significance level for entry into the modelo model. Summary of Stepwise Procedure for Dependent Variable SALES for SALES Summary of Stepwise Step 1 1 2 2 Number Variable Entered Removed In INCOME AUTO 1 1 Partial R**2 R**2 Model R**2 R**2 0.8768 0.9650 Model C (p) C(p) F F Prob>F 0.0001 0.0020 2 2 0.8768 0.0882 00882 25.7621 4.2997 65.0649 20.1834 7.8 Figura 7.8 (Continuación) BIBLIOGRAFíA BIBLIOGRAFIA BELSLEY, D. A. "Colinearity and Forecasting." Journal ofForecasting 3 (1984): 183-196. BELSLEY,D. A. "Colinearity and Forecasting." Journal of Forecasting 3 (1984): 183-196. DRAPER, N. R. SMITH, Applied Regression Analysis. Nueva York: John Wiley & DRAPER, N. R. YySMITH, H.H. Applied Regression Analysis. Nueva York:John Wiley & Sons, 1966, p. 1966, p. 167. 167. LARSEN, W. A. MCCLEARY, S. J. "The Use Partial Residual Plots in Regression Analysis." LARSEN, W. A. yyMCCLEARY, S. 1. "The Use ofof Partial ResidualPlots in Regression Analysis." Technometrics 14 (1972): 78 1-790. 14 781-790. LAVENBACH, H. y y CLEARY, J. The Professional Forecaster. Belmont, Calif.: Leaming LAVENBACH, H. CLEARY, J. P. P. The Professional Forecaster.Belmont, Calif.: Lifetime Learning 1982. Publications, 1982. NETER., y WASSERMAN, Applied Linear Statistical Models. Homewood, Ill.: Richard D. Irwin, NETER., 1.J.Y WASSERMAN, W. W. Applied Linear Statistical Models. Homewood, Ill.:Richard D. Irwin, 1985. YOUNGER., M. S. A A Handbook/or Linear Regression. North Scituate, Mass.: 1979. YOUNGER., M. S. Handbookfor Linear Regression. N0l1h Scituate, Mass.: Duxbury Press, 1979. CAPíTULO CAPITU LO Análisis de series de tiempo 8 ACTIVIDADES A CTI VIDAD ES regresión de correlación refieren la relación lineal entre dos o más Los análisis de regresión y de correlación se refieren a la relación lineal entre dos o más variables. Se emplea el conocimiento de la variable independiente X para predecir variables. Se emplea ci conocimiento de la variable independiente X para predecir la variable dependiente Y. En el análisis de series de tiempo independiente es el variable dependiente Y. En el análisis de series de tiempo la variable independiente es el (Y) toma tiempo. La variable bajo estudio (1') toma diferentes valores a través del tiempo. De ahí que valores a través del tiempo. De ahI que cualquier variable clasificada en cronológico serie histórica. Los periodos cualquier variable clasificada en orden cronoiógico sea una serie histórica. Los periodos años, trimestres, en algunos casos, días u horas. Las series pueden ser años, trimestres, meses, semanas y, en algunos casos, dIas u horas. Las series de tiempo se analizan para descubrir patrones anteriores de variabilidad, que puedan tiempo se analizan para descubrir patrones anteriores de variabilidad, que puedan emplearse para predecir valores futuros y asistir las operaciones emplearse para predecir valores futuros y asistir a las operaciones de administración de administración de series de tiempo no la empresas. Los análisis de series de tiempo no dan Ia respuesta a lo que nos reserva el futuro, resulta el proceso de pronóstico y ayuda a reducir errores en ellos. pero resuita valioso en el proceso de pronóstico y ayuda a reducir errores en elios. Las publicaciones como Statistical Abstract of Las publicaciones como Statistieal Abstraet 01 the United States, Survey of Current United States, Survey 01 Business, Monthly Labor Review, Federal Reserve Bulletin reportes anuales de Business, Monthly Labor Review, Federal Reserve Bulletin yy los reportes anuales de corporaciones, contienen series de tiempo de todo tipo. datos, que regularmente se corporaciones, contienen series de tiempo de todo tipo. Los datos, que regularmente se reportan forma mensual, trimestral anual, y abarcan precios, producción, ventas, reportan en forma mensual, trirnestral o anual, y abarcan precios, producción, ventas, empleo, desempleo, trabajadas, combustible empleado, energía ingreso, empleo, desempleo, horas trabajadas, combustible empleado, energIa producida, ingreso, páginas éstas y otras publicaciones económicas de negocios. etc., llenan las páginas de éstas y otras publicaciones económicas y de negocios. Es importante que los administradores comprendan el pasado y empleen los datos administradores comprendan el pasado empleen los datos Es importante que históricos y buen juicio para elaborar planes inteligentes que cubran demanda históricos y el buen juicio para elaborar planes inteligentes que cubran la demanda del futuro. Los pronósticos se formulan para auxiliar a la administración en la determinación formulan la administración la determinación futuro. Los pronósticos estrategias alternativas. de estrategias altemativas. Los pronósticos a largo plazo son por lo regular para 5, 10 e incluso 20 años a futuro. Los pronósticos largo plazo son por lo regular para 5, lOe incluso 20 años a futuro. pronósticos esenciales permitir el tiempo suficiente para que los departaEstos pronósticos son esenciales para permitir ci tiempo suficiente para que los departamanufactura, finanzas, ventas y otros de una compañía, desarrollen planes mentos de metas, manufactura, finanzas, ventas y otros de una compañIa, desarrollen planes probables plantas nuevas, financiamiento, desarrollo productos y nuevos para probables piantas nuevas, financiamiento, desarrollo de nuevos productos y nuevos métodos ensamble. Los pronósticos a largo plazo son interés alta métodos de ensamble. Los pronósticos a largo plazo son de particular interés para la alta dirección. dire cción. Las organizaciones empresariales en EVA deben pronosticar el nivel de ventas tanto organizaciones empresariales en EUA deben pronosticar el nivel de ventas tanto corto como a largo plazos. La competencia por los dólares del consumidor, la presión a corto como a largo plazos. La competencia por los dólares del consumidor, la presión Descomposición DescomposiciOn 319 beneficio para los accionistas y el deseo de abarcar una para obtener un beneficio para los accionistas y el deseo de abarcar una cada vez mayor participación en el mercado, son algunas de las principales fuerzas motivadoras en los las principales fuerzas motivadoras en los participación en el mercado, son algunas negocios. ahí declaración, denominada pronósticos, de las negocios. De ahI que sea necesaria una declaración, denominada pronósticos, de las la administración, expectativas de Ia administración, para tener disponibles las materias primas, las instalaciodisponibles prirnas, nes productivas y el equipo de personal para cubrir la demanda proyectada. equipo de personal cubrir la demanda proyectada. luego, la alternativa de no futuro. embargo, medio Desde luego, existe Ia alternativa de no planear a futuro. Sin embargo, en un medio dinámico, la esta planeación puede resultar desastrosa. Una compañía empresarial dinámico, Ia falta de esta planeación puede resultar desastrosa. Una compañIa que hubiese ignorado la tendencia hacia la televisión aacolor yylos circuitos de estado-sólido, ignorado tendencia hacia la television color los circuitos de estadosólido, habría perdido con rapidez toth participación en el mercado. toda participación en el mercado. habria En el análisis de series de tiempo, las consideraciones subjetivas son en extremo el análisis de series de tiempo, las consideraciones subjetivas en extremo importantes, ya que a la fecha no se ha encontrado un enfoque satisfactorio de probabilidad fecha se ha encontrado enfoque satisfactorio de probabilidad para dicho análisis. Aunque las consideraciones subjetivas serIan necesarias en la formulaserían necesarias disponible un enfoque de probabilidad adaptable al ción de pronósticos, incluso si hubiera disponible un enfoque de probabilidad adaptable al análisis de series tiempo. Siempre que se examina el pasado en busca pistas con análisis de series de tiempo. Siempre que se examina el pasado en busca de pistas con grado en que las condiciones causales que respecto al futuro, solo es relevante hasta el grado en que las condiciones causales que respecto al futuro, sólo es relevante estuvieron en efecto anteriormente, se mantengan constantes. La factores eStuvieron en efecto anterionnente, se mantengan constantes. La gran multitud de factores causales trabajo tiende a cambiar constantemente, asI que conexión entre pasado, causales en el trabajo tiende a cambiar constanternente, así que la conexión entre pasado, presente y futuro se debe reevaluar continuamente. futuro se debe reevaluar continuamente. Aunque las técnicas del análisis de series de tiempo no eliminan las evaluaciones series de tiempo no eliminan las evaluaciones Aunque las técnicas análisis subjetivas, sí aportan una ütil contribución al proporcionar un enfoque conceptual a los útil contribución proporcionar enfoque conceptual a los subjetivas, si aportan pronósticos. Los pronOsticos se elaboran con la ayuda de un conjunto de procedimienpronósticos. Los pronósticos se elaboran con la ayuda de un conjunto de procedimientos formales y los juicios se indican de manera expilcita. formales los se indican de manera explícita. DESCOMPOSICIÓN DESCOMPOSICION Un enfoque al anàlisis de Series de tiempo comprende un intento de identificar los factores análisis series de tiempo comprende un intento de identificar los factores que ejercen influencia sobre cada uno de los valores periódicos de una serie. Este que ejercen influencia sobre cada uno de los valores periódicos de una serie. Este denomina descomposición. Cada componente se identiprocedimiento de identificación procedirniento de identificaciOn se denornina descoinposición. Cada componente se identifica por separado de tal manera que Ia serie histórica pueda proyectarse al futuro y utilizarse la en pronósticos tanto de corto corno de largo plazos. de corto como de largo plazos. Los cuatro componentes que se encuentran en una serie histOrica se presentaron en el encuentran en una serie histórica capItulo 4. tendencia, variaciones cíclicas, variaciones estacionales y fluctuaciocapítulo 4. Ellos son: tendencia, variaciones cIclicas, variaciones estacionales y fluctuacioirregulares. nes irregulares. l. Tendencia. La tendencia es el componente de largo plazo que constituye la base del es el componente de largo plazo que constituye que producen o crecimiento (o declinación) de una serie histórica. Las fuerzas básicas que producen o crecirniento afectan Ia tendencia de afectan la tendencia de una serie son: cambios en la población, inflación, cambio serie son: cambios en la población, inflación, cambio tecnológico e incrernento en Ia productividad. incremento la 2. Variación ciclica. El componente cíclico es un conjunto de fluctuaciones en forma de ciclico onda o ciclos, de más de un año de duración producidos por cambios en las condiciones rnás de un año de duración producidos económicas. Respresenta la diferencia entre los valores esperados de una variable variable económicas. Respresenta la diferencia entre los valores esperados (tendencia) y los valores reales -lavariaciOn residual que fluctüa alrededor de la (tendencia) y los valores reales Ia variación residual que fluctúa airededor de la tendencia. tendenci a. 320 Análisis de series de tiempo Capítulo 8 Cap Itulo 8 3. Variación estacional. Las fluctuaciones estacionales se encuentran tIpicamente en los encuentran típicamente en datos clasificados por trimestre, mes o semana. La variación estacional se refiere a un patrón cambio regularmente recurrente a través del tiempo. movimiento patron de cambio regularmente recurrente a través del tiempo. El movimiento se completa dentro de la duración de un año y se repite a sí mismo año tras año. completa dentro de la duración de un afio y se repite a si mismo año tras afio. 4. Fluctuación irregular. El comportamiento irregular está compuesto por fluctuaciones causadas por sucesos impredecibles o no periódicos, como un clima poco usual, huelgas, periódicos, como un climapoco causadas guerras, mmores de guenas, elecciones y cambios en las leyes. rumores guerras, elecciones y cambios en las componentes de histórica, Para estudiar los componentes de una serie histórica, el analista debe considerar sus relaciones matemáticas. El enfoque que relaciones matemáticas. El enfoque que se utiliza con mayor frecuencia consiste en tratar los datos originates de una serie histórica como un producto de sus componentes; es decir, originales serie histórica como un producto de sus componentes; es decir, fluctuaciones cíclicas, que se expresa una serie anual es un producto de tendencia una serie anual es un producto de tendencia yyfluctuaciones ciclicas, que se expresa simbólicamente corno x C, como se muestra en la ecuación 8.1. En esta composición simbólicarnentecomo TTx C, como se muestra en Ia ecuación 8.1. En esta composición multiplicativa, T se mide en las unidades de los datos reales y el un índice. multiplicativa, T se mide en las unidades de los datos reales y C es ci valor de un Indice. y= TC Y=TC (8.1 ) (8.1) en donde y = Y = valor real T = tendencia T= C = componente cIclico cíclico En una serie medida periodos menores a un año, como las series de tiempo En una serie medida en periodos menores a un año, como las series de tiempo trimestrales, mensuales y trimestrales, se considera que cada valor original es el producto multiplicativo original es multiplicativo componentes, como ecuación de cuatro componentes, como se muestra en la ecuación 8.2. y = TSCf Y = TSCI (8.2) Más adelante, en este capItulo, se abordará la descomposición de series de tiempo mensuales capítulo, de series de tiempo mensuales trimestrales. y trimestrales. íNDICE DE PRECIOS INDICE DE PRECIOS Diversas series producción, ventas otras situaciones económicas Diversas series sobre producción, ventas y otras situaciones económicas contienen datos sólo disponibles solo en valores de dólares. Estos datos son afectados tanto por la cantidad fisica de bienes vendidos, como por su precio. La inflaciOn y la amplia variaciOn de precios a precio. La inflación amplia variación de precios de bienes vendidos, como través del tiempo pueden causar problemas en el análisis. Por ejemplo, un volumen de través del tiempo pueden causar problemas en el análisis. Por ejemplo, un volumen de dólares incrementado podría ocultar una disminución en las ventas provocada por precios dOlares incrementado podrIa ocultar una disminuciOn en las ventas provocada por con frecuencia necesario conocer qué tanto del cambio de los valores inflados. Por ello, con frecuencia es necesario conocer qué tanto del cambio de los valores en dólares representa un cambio real en la cantidad fisica y qué tanto se debe al cambio en en dólares representa un carnbio real en cantidad fisica la inflación. casos, los precios por Ia inflación. En estos casos, es deseable expresar los valores en dólares en expresar los valores en dólares en ténninos de "dOlares constantes". "dólares térrninos índice de precios nd ice de 321 El concepto de poder de coinpra es importante. El poder de compra actual de 1 dólar actual de 1 dólar concepto poder compra importante. como se define como Poder de compra actual de 1 dólar = actual de 1 dolar - 100 índice actual indice de precios actual 100 (8.3) Así, en noviembre de 1994 el índice de precios al consumidor (con 1982 como 100), AsI, si en noviembre de 1994 el Indice de precios al consumidor (con 1982 como 100), alcanza 150, el poder de compra actual del dólar del consumidor en noviembre de 1994 es alcanza 150, el de actual del dólar del consumidor en noviembre de 1994 es Poder de compra actual de 1 dólar = 100 = 0.67 o .67 de dolar compra actual de 1 dolar = 0.67 o .67 de dólar 150 1994 sólo El dólar de 1994 compraba solo dos tercios de los bienes y servicios que pudieron adquirirse con el dólar del periodo base (1982). con Para expresar los valores en dOlares en términos de dólares constantes, se utiliza la dólares en términos de dólares constantes, la Para expresar los valores siguiente ecuación: siguiente ecuaciOn: dólar = (valor del dólar) x 1 dólar) valor deflactado del dOlar = (valor del dólar) x (poder de compra de 1 dólar) (8.4) automóviles 1993 350,000 Suponga que las ventas de automóviles se elevaron de 300,000 dólares en 1993 a 350,000 dOlares en 1994, mientras que el indice de precios dólares en 1994, mientras que el índice de precios de un automóvil nuevo (con 1982 corno (con 1982 como año base) 135 a 155. Las ventas deflactadas para 1993 y 1994 serían afio base) se elevó de 135 a 155. Las ventas deflactadas para 1993 y 1994 serIan 100 Ventas deflactadas en 1993 = (300,000 dOlares) ( 1~ ) = 222,222 dólares deflactadas ~ (300,000 dólares) 222,222 dólares 135 (100 \ 1 (100 I I Ventas deflactadas en 1994 = (350,000 dólares) Ventas deflactadas en 1994 = (350,000 dólares) (~~ ) = 225,806 dOlares = 225,806 dólares 155 NOtese que las ventas reales en dólares tuvieron un incremento dirnensionable de 350,000 Nótese que las ventas dólares incremento dimensionable de 350,000 dólares 300,000 dólares = 50,000 dólares. Sin embargo, ventas deflactadas solo se dólares - 300,000 dólares = 50,000 dólares. Sin embargo, las ventas deflactadas sólo se incrementaron en 225,806 dólares - -222,222 dólares = 3,584 dólares. incrementaron en 225,806 dOlares 222,222 dólares = 3,584 La finalidad de deflactar los valores en dólares consiste en eliminar el efecto de los efecto de los finalidad de deflactar los valores en dólares consiste cambios precio. cambios de precio. Este ajuste se denomina deflación de precios o bien, se le refiere como ajuste denomina deflación de precios o bien, una serie en dólares constantes. la expresión de una serie en dólares constantes. deflación mediante el cual expresan términos de La deflación de precios es el proceso mediante el cual se expresan términos de serie en dólares constantes. una serie en dólares constantes. El proceso de deflación es relativamente simple. En él se utiliza un Indice calculado deflación relativamente simple. se utiliza un índice calculado los precios de bienes cuyos deflactar. ejemplo, a partir de los precios de bienes cuyos valores se van a deflactar. Por ejemplo, las ventas tienda de zapatos deben deflactarse mediante índice precios de zapatos, no de una tienda de zapatos deben deflactarse mediante un Indice de precios de zapatos, no índice de precios. Para deflactar dólares que representan a más por un Indice general de precios. Para deflactar valores en dólares que representan a rnás de bien, el analista debe desarrollar un índice de precios mediante la combinade un tipo de bien, el analista debe desarrollar un Indice de precios mediante la combinación de los indices de adecuados, proporción correcta. ciOn de los índices de precios adecuados, en la proporción correcta. 322 Análisis de series de tiempo Cap Itulo 8 Capítulo Ejemplo 8.1 El Sr. Burnham desea estudiar el crecimiento a largo plazo de Burnharn Furniture Store. La Burnham crecimiento largo plazo Burnham Furniture Store. La tendencia tendencia de largo plazo de su negocio debe evaluarse mediante el volumen fisico de ventas. su negocio debe evaluarse mediante el volumen físico de ventas. Si no se puede efectuar esta evaluación, los cambios de precios reflejados en las ventas en se puede efectuar esta evaluación, cambios precios reflejados las ventas en dólares no seguirán un patron congruente y sOlo oscurecerán el patron real de crecimiento. Si patrón congruente y sólo patrón crecimiento. Si se se emplean las ventas en dólares, las ventas reales en dólares deben dividirse entre un Indice dólares, dólares dividirse entre índice de precios adecuado para obtener las ventas que se miden en dólares constantes. se miden en dólares constantes. El indice de precios al consumidor (IPC) no es adaptable al caso de Burnharn, ya que precios consumidor (IPC) es adaptable caso de Burnham, ya que El índice contiene elementos tales como rentas, alimentos yy servicios personales que no vende la contiene elementos tales como rentas, alimentos servicios personales quc no vende la empresa, aunque algunos componentes de este Indice pudieran ser apropiados. Burnham está índice apropiados. empresa, aunque aigunos componentes de consciente de que el 70% de sus ventas corresponden a muebles y el 30% a aparatos. De ahI, aparatos. De ahí, consciente de que ci él puede multiplicar el componente de muebles al menudeo del IPC por..70 y el componente multiplicar el componente de muebles al menudeo del IPC por 70 y ci componente él de aparatos de aparatos por .30, para obtener un Indice combinado de precios. La tabla 8.1 ilustra este .30, para obtener un índice combinado precios. tabla 8.1 ilustra este enfoque, en enfoque, en donde los cálculos para 1986 son 1986 111.6(.70) + 105.3(.30) = 109.7 1l1.6(.70) + 105.3(.30) = 109.7 Las ventas se deflactan para 1986 en términos del poder de compra de 1982. 1982. Ventas deflactadas en 1986 = (42.1) - - ) = 38.4 38.4 Ventas deflactadas en 1986 (42.1) 100 ( 109.7 ,1 100 \ La tabia 8.1 muestra que mientras las ventas reales aunientaron congruentemente de 1986 tabla 8.1 muestra que mientras las ventas reales aWllentaron congruentemente de 1986 a 1993, ci volurnen fisico se mantuvo rnás bien estable. Es evidente que el incrernento en las 1993, el volumen fisico más estable. incremento las ventas se debió a elevación en los precios que, su vez, fue generada por la tendencia ventas se debió a clevaciOn en los precios que, a su vez, fue generada por la tendencia la economía. inflacionaria de ia economla. TABLA 8.1 TABLA 8.1 DATOS PARA EL EJEMPLO 8.1: VENTAS DE BURNHAMFURNITURE, 1986-1993 DATOS PARA EL EJEMPLO 8.1: VENTAS DE BURNHAM FURNITURE, 1986-1993 VENTAS DEFLACTADAS** DE (MILES DE DÓLARES DOLARES DE 1982) DE 1982) 38.4 41.2 40.4 40.8 42.3 43.0 42.6 40.8 AÑO AO 1986 1987 1987 1988 1988 1989 1989 1990 1990 1991 1992 1992 1993 1993 * DE VENTAS DE BURNHAM (EN MILES) MILES) 42.1 47.2 48.4 50.6 55.2 57.9 59.8 60.7 PRECIOS INDICE DE PRECIOS ÍNDICE ÍNDICE DE PRECIOS INDICE DE PRECIOS DE APARATOS DE DE MUEBLES AL MENUDEO AL MENUDEO lOO) (1982 = 100) lOO) (1982 = 100) 111.6 117.2 124.2 128.3 136.1 139.8 145.7 156.2 105.3 108.5 109.8 114.1 117.6 122.4 128.3 131.2 ÍNDICE DE PRECIOS* (1982=100) (1982 = 100) 109.7 114.6 119.9 124.0 124.0 130.6 \30.6 134.6 140.5 148.7 Elaborado muebles * Elaborado para muebles (70%) y aparatos (30%). (30%). el índice de precios por 100. ** Ventas divididas entre el Indice de precios por 100. TENDENCIA TEND ENCIA Las tendencias son movirnientosde largo plazo en una scrie histórica que se pucden serie histórica que se pueden Las tendencias son mOV1l11lentos de largo plazo en describir mediante tilla lInea recta o curva. Las fuerzas básicas que producen ooafectan La curva. Las fuerzas básicas que producen afectan la mediante una línea Tendencia 323 tendencia de serie son: cambios en la población, cambios de precios, cambios tendencia de una serie son: cambios en Ia población, cambios de precios, cambios tecnológicos, incrementos en la productividad y ciclos de vida de los productos. tecnológicos, incrementos en la productividad y ciclos de vida El incremento en la población puede provocar que las ventas al menudeo de una El incremento en la población puede provocar que las ventas menudeo de una comunidad se eleven cada año durante varios años. Más aún, las ventas en dólares corrientes varios años. Más aün, las ventas en dólares pudieran haber sido impulsadas hacia arriba durante el mismo periodo debido a incrementos generales en los precios de bienes al menudeo -aun cuando el volumen fisico de bienes bienes generales en los precios de bienes al menudeo aun cuando volumen fisico vendidos no haya variado. variado. vendidos El cambio tecnológico pudiera causar que una serie histórica se mueva hacia arriba o tecnológico causar que hacia abajo. El desarrollo y mejoramiento del automóvil, junto con las mejoras a los hacia abajo. El desarrollo mejoramiento del automóvil, junto con las mejoras los el registro de automóviles. Sin embargo, el automóvil, producido caminos, ha incrementado el registro de automóviles. Sin embargo, el automóvil, producido en volümenes crecientes, provocó también una tendencia aa la baja en la producción de la producción de en volúmenes crecientes, provocó también una tendencia la baja vagones vagones tirados por caballos y calesas. calesas. Los incrementos en Ia productividad los cuales, a su vez, se pueden deber al Los incrernentos en la productividad -los cuales, a su vez, se pueden deber aT cambio tecnológico incorporan una pendiente hacia arriba a muchas series de tiempo. Cualquier tecnológico- incorporan una pendiente hacia arriba a muchas series de tiempo. Cualquier medición total los fabricantes, medición total de salida, como las ventas de los fabricantes, está afectada por cambios en la productividad. Ia una serie histórica, debe primero conocer Antes medir la tendencia Antes de medir la tendencia de una serie histórica, se debe primero conocer el propósito de su rnedición. Este conocimiento guía al analista en Ia elección del método y propósito medición. conocimiento gula al la método dimension de Ia serie histOnca a utilizar en Ia medición. Existen dos propósitos fundarnendimensión la histórica la Existen dos propósitos fundamenoriginales. tales: la tendencia eliminarla de tales: proyectar Ia tendencia y eliminarla de los datos onginales. la la variable independiente es el tiempo. El analista debe En el análisis de la tendencia Ia variable independiente es el tiempo. El analista debe graficar los datos tanto sobre escalas aritméticas como semilogarItmicas antes de elegir el tanto sobre escalas aritméticas semilogarítmicas antes elegir el método de rnedición. Al hacerlo, el analista obtiene una guía adicional para escoger la método de medición. Al hacerlo, el analista obtiene una gula adicional para escoger Ia ecuación de tendencia, ya que la irnagen general de los datos es aparente. Si la gráfica de ecuación de tendencia, ya que imagen general de los datos aparente. la serie indica un movirniento en lmnearecta en la escala aritmética, el analista ajustará a indica un movimiento en línea recta en la escala aritmética, el analista ajustará los datos parece haber tendencia lineal, se debe los datos una lInea recta de tendencia. Si parece haber una tendencia no lineal, se debe línea recta de tendencia. semilogarítdesarrollar la curva de tendencia apropiada. Si los datos se grafican en papel semilogarItdesarrollar Ia curva de tendencia apropiada. Si los datos mico y una linea recta parece ajustar, se seleccionará un modelo exponencial que indique línea recta parece ajustar, se seleccionará mico una tasa constante de crecirniento. de crecimiento. una declaración de la finalidad Sin embargo, no siempre una gráfica de los datos y una declaración de la finalidad Sin embargo, no siempre una gráfica de ocasiones necesario de Ia medición permiten al analista efectuar la elección final. En ocasiones es necesario de la medición penniten al analista efectuar elección final. graficar dos más para cuál de ellas calcular y grafi car dos o más tendencias junto con los datos originales para ver cuãl de ellas junto se ajusta mejor a la serie histórica. serie histórica. se La tendencia Qué es lo que constituye un "mejor" ajuste es un asunto de juicio. La tendencia constituye "mejor" ajuste asunto Qué es que mejor se ajusta es aquella que hace el trabajo que el analista tiene que hacer. Ningün es aquella que hace que el analista tiene que hacer. Ningún método es superior para medir tendencias. A veces, una tendencia dibujada a mano sobre una serie histórica es suficiente para revelar una imagen de la fonna general y una serie histórica es suficiente para revelar una imagen de la forma general y la dirección de la serie. No obstante, para dibujar a mano una tendencia con propiedad, el propiedad, dirección de mano analista debe ser capaz de reconocer los ciclos principales y las fluctuaciones estacionales de reconocer los ciclos principales las fluctuaciones estacionales a través de las cuales debe pasar la tendencia. En ocasiones resulta dificil lograr esta través de las cuales debe pasar la tendencia. En ocasiones resulta 'dificil lograr esta apreciación, aamenos que el analista esté muy familiarizado· con la serie en particular que apreciaciOn, menos que el analista esté muy familiarizado con la serie en particular que esté analizando. esté analizando. De ahI que muchos analistas seleccionan un método objetivo que pueda ahí analistas seleccionan un método objetivo establecerse como una ecuación, con el fin de evitar las decisiones subjetivas que requiere establecerse corno una ecuación, con el fin de evitar las decisiones subjetivas que requiere el método manual. manual. 324 Análisis de series de tiempo Capítulo CapItulo 8 método más ampliamente utilizado para describir tendencias de línea recta se El método más ampliamente utilizado para describir tendencias de ilnea recta se denomina método de mínimos cuadrados. Este enfoque calcula la línea que mejor se ajusta método de mInimos cuadrados. Este enfoque calcula la linea que mejor se ajusta a un grupo de puntos, en conformidad matemática con un criterio establecido. l La ecuación matemática con un criterio establecido.' ecuación de tendencia es y = b a + bX Yb0+bX en donde (8.5) y= tendencia de la variable Y, codificada en periodos (X). Y = valor de predicción de tendencia de la variable Y, codificada en periodos (X). O bo = b0 = valor de la tendencia cuando x = 0 incremento disminución promedio Y (tendencia), cada incremento de b ==incremento oodisminución promedio en 1 (tendencia), para cada incremento de un periodo de X un periodo de X X = el valor del periodo seleccionado X = el valor del periodo seleccionado Ej emplo Ejemplo 8.2 En la tabla 8.2 se muestran los datos anuales de registros de automóviles nuevos de pasajeros se muestran datos registros nuevos EVA 1960 1992 y se grafican en la figura 8.1. Se emplean los valores de 1960 a 1992 en EUA de 1960 a 1992 y se grafican en Ia figura 8.1. Se emplean los valores de 1960 a 1992 desarrollar una ecuación de tendencia. Los registros son variable dependiente Y y el para desarrollar una ecuación de tendencia. Los registros son la variable dependiente Y y el variable independiente codifica como x (1960 1, 1961 etc.). periodo o variable independiente se codifica como x (1960 "= 1, 1961 = 2, etc.). ,J- es .205, lo que significa que la variable tiempo explica sólo una pequeña La r2 es .205, lo que significa que la variable tiempo explica solo una pequefia cantidad, 20.5% de varianza la variable de registros de automóviles nuevos de cantidad, 20.5% de la varianza de la variable de registros de automóviles nuevos de estimado de la tendencia registros automóviles de pasajeros pasajeros. El valor estimado de Ia tendencia para registros de automOviles de pasajeros pasajeros. El para 1960 es de 8,106.7, como se muestra en la columna de regresión de Ia tabla 8.2. Con 8,106.7, como se muestra en la columna de regresión de la tabla 8.2. Con se los registros se incrementen base en la pendiente de la ecuación de tendencia, se espera que los registros se incrementen 12 12 11 11 - .-.. ~ 10 ~ ..9 -999 ], ~ ~ ~ '60 Q) 8 P:: 7 6 5 I I I I I I I II I I I I 1960 1965 1970 1975 1980 1985 1990 Año Figura 8.1 8.1 Datos de registros del ejemplo 8.2. ejemplo 8.2. 1 Co~o 1 Corno se expuso en el capItulo 6, el método de mInimos cuadrados minimiza Ia suma de las distancias al expuso en el capítulo 6, el método de mínimos cuadrados minimiza la las distancias al cua&ado, dirección vertical, desde los puntos de datos línea tendencia. cuadiado, medidas en dirección vertical, desde los plll1tos de datos hacia la linea de la tendencia. Tendencia 8.2 REGISTROS DE AUTOMOVILES PASAJEROS EN TABLA 8.2 REGISTROS DE AUTOMÓVILES NUEVOS DE PASAJEROS EN ESTADOS UNIDOS, 1960-1992 ESTADOS UNIDOS. 1960-1992 REGISTROS (EN MILLONES) A110 AÑO 1960 1961 325 Y 6.577 5.855 5.855 6.939 7.557 8.065 9.314 9.009 8.357 9.404 9.447 8.388 9.831 10.409 X Y 1 COMPONENTE CICLICO CíCLICO 81.13 71.66 84.27 91.07 96.45 110.55 106.13 97.71 109.14 108.84 95.93 111.62 117.34 127.05 96.70 90.14 106.86 117.81 118.30 111.17 93.40 89.41 81.55 93.24 105.01 112.27 114.11 103.63 105.14 98.79 91.44 81.68 79.39 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1971 1972 1973 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 11.351 8.701 8.168 9.752 10.826 10.946 10.357 8.761 8.444 7.754 8.924 10.118 10.889 11.140 10.183 10.398 9.833 9.160 9.234 8.054 1 2 3 3 4 5 5 6 7 8 8 9 10 11 12 13 14 15 16 17 18 19 19 20 21 22 23 24 25 25 26 27 28 29 30 31 32 33 8.1067 8.1704 8.2341 8.2977 8.3614 8.4251 8.4888 8.5525 8.6162 8.6798 8.7435 8.8072 8.8709 8.9346 8.9982 9.0619 9.1256 9.1893 9.2530 9.3167 9.3803 9.4440 9.5077 9.5714 9.6351 9.6988 9.7624 9.8261 9.8898 9.9535 10.0172 10.0808 10.1445 del Departamento de Comercio, Business Fuente: Datos del Departamento de Comercio, Survey of Current Business (varios años). en un promedio de 63,680 cada año. La figura 8.2 muestra la ecuación de tendencia ajustada a los datos reales. La ecuación de tendencia proyecta que los registros en 1992 serán de datos reales. La ecuación tendencia proyecta que los registros 1992 serán 10,144,530. 1' = 8.043 + .06368X y 8.043 + .06368X Y(l992) = 8.043 .06368(33) Y(1992) = 8.043 + .06368(33) = 10.144 10.144 326 Análisis de series de tiempo Anâlisis Capítulo 8 Cap Itulo En realidad, los registros de automóviles nuevos de pasajeros En realidad, los registros de automóviles nuevos de pasajeros en 1992 fueron 1992 fueron al pronosticar registros, debe considerarse algún otro factor 8,054,000. Es evidente 8,054,000. Es evidente que al pronosticar registros, debe considerarse algün otro factor además tendencia. además de la tendencia. 8.1 Los comandos de Minitab para resolver el ejemplo 8.1 son MTB > READ 'REG92.DAT' Cl MTB 'REG92.DAT' C1 33 33 ROWS READ C1 Cl 6.577 5.855 6.939 7.557 6.939 MTB > PRINT Cl > PRINT C1 C1 Cl 6.577 9.404 9.752 10.118 8.054 MTB > > DATA> DATA> > MTB > MTB > > SUBC> SUBC> 5.855 9.447 10.826 10.889 10.889 6.939 8.388 10.946 11.140 7.557 9.831 10.357 10.357 10.183 10.183 8.065 9.314 10.409 11.351 8.761 8.444 10.398 11.140 9.833 5.855 9.009 8.701 7.754 9.160 8.357 8.168 8.924 8.234 8.761 SET C2 SET C2 1:33 1:33 END END C1 'REG' C2 'TIME' NAME Cl 'REG' C2 'TIME' REGRESS Cl 1 PREDICTOR C2. TRESRES C3, DHATS C4; REGRESS C1 1 PREDICTOR C2, C3. C4; PREDICT 34. PREDICT 34. The regression equation is regression equation is 8.04 0.0637 TIME REG = 8.04 + 0.0637 TIME Predictor Constant TIME 1.231 5 s = 1.231 Coef 8.0430 0.06368 Stdev 0.4384 0.02250 t-ratio 18.35 2.83 P 0.000 0.008 Coe R-sq = 20.5% 20.5% R-sq R-sq(adj) = 18.0% R-sq(adj) Analysis of Variance of Variance SOURCE Regression Error Total Fit 10.208 MTB > STOP STOP DF 1 1 31 32 Stdev.Fit 0.438 SS 12.134 46.952 59.085 MS 12.134 12.134 1.515 1.515 F 8.01 P 0.008 ( 95% C.I. C.I. 9.314. 11.103) 9.314, 11.103) ( 95% P.1. P. I. 7.543, 12.873) 7.543, 12.873) Tendencia 327 12 12 11 11 <Il I0 10 9 8 8 Y A ¡:: (lJ ], '50 (lJ ~ ~ .l:: <Il o <Il 7 7 6 I I I I I I I I I I I I I II I I I I I I I S 1960 1965 1970 1975 198() 1985 1990 Año Figura 8.2 8.2 Ecuación de tendencia para los datos del ejemplo 8.2. READ un archivo que contiene los datos de registros que • El comando READ se usa para leer un archivo que contiene los datos de registros que se presentan en la tabla 8.2. e2. • El comando SET se emplea para generar enteros del 1 al 33 y almacenarlos en C2. • El comando NAME se utiliza para dar nombre a las variables en cada columna. • El cornando REGRESS se usa para desarrollar un análisis de regresión con los registros comando regresión con los registros dependiente (Y) independiente (X). como variable dependiente (Y) y el tiempo como variable independiente (X). • El comando DHATS calcula las estimaciones de Yy las almacena en C4. Y y las almacena en C4. se calcular un intervalo de confianza del 95%, • El subcomando PREDICT se usa para calcular un intervalo de confianza del 95%, en valor de este caso para un valor de x de 34. Aunque es probable que Ia tendencia de mInimos cuadrados se utilice con mayor la tendencia mínimos cuadrados se mayor Aunque es probable frecuencia que cualquier otra para describir el crecimiento aa largo plazo de una serie serie frecuencia que cualquier otra para describir el crecimiento largo plazo de histórica, en ocasiones es necesario utilizar tendencias curvas para obtener una descripción necesario histórica, tendencias curvas para descripción lógica del cambio. Existen disponibles muchas ecuaciones para calcular tendencias de ilnea línea ecuaciones pam curva. útiles curva. Algunas de las ecuaciones de tendencia más ütiles comprenden la curva exponencial y la curva de crecimiento de Gompertz. A continuación se presenta una breve descripción curva de crecimiento Gompertz. continuación descripción de estos métodos. Tendencia no lineal Tendencia no lineal La figura 8.3 muestra que el ciclo de vida de un tIpico producto nuevo se divide en tres un típico producto nuevo divide La figura 8.3 muestra que el ciclo estados principales: introducción, crecimiento, yy por áltimo madurez y saturaciOn. El estados principales: introducción, crecimiento, por último madurez y saturación. El 328 de Análisis de series de tiempo Capítulo Capitulo 8 representado el eje horizontal, de días a años, dependiendo la tiempo, representado en ci eje horizontal, puede variar de dIas a aflos, dependiendo de la naturaleza del mercado. Un modelo lineal no funcionaría con este tipo de datos. Los naturaleza del mercado. Un modelo lineal no funcionarla con este tipo de datos. Los modelos lineales asumen que una variable se incrementa en una cantidad constante en cada en una cantidad constante en cada etapa de crecimiento de la mayoría de los productos nuevos parece incremenperiodo. La etapa de crecimiento de la mayorIa de los productos nuevos parece incremenuna cantidad o proporción constante. tarse en una cantidad o proporción constante. Introducción Crecimiento Tiempo Madurez y saturación Figura 8.3 8.3 Ciclo de vida de un producto nuevo tIpico. de un producto nuevo típico. Cuando una serie histórica comienza lentamente y después parece incrementarse en lentamente incrementarse Cuando proporción creciente tal (véase figura que la diferencia porcentual entre una una proporción creciente tal (véase figura 8.4), que la diferencia porcentual entre irna observación y otra es constante, se puede ajustar a una tendencia exponencial. En la figura una tendencia exponencial. En la figura número de vendedores en una mutualidad 8.4, el rnmero de vendedores en una mutualidad parece crecer a una tasa constante en vez de tendencia lineal pudiera indicar un crecimiento promedio a una cantidad constante. Una tendencia lineal pudiera indicar un crecimiento promedio de 8 vendedores por año. Un ajuste exponencial podrIa indicar un crecimiento promedio de ajuste exponencial podría de la figura 8.4. Si el modelo exponencial estimó 32% anual para los datos de la figura 8.4. Si el modelo exponencial estimó 50 vendedores mutualidad 1992, el incremento 1993 sería de 16 .32) en en la mutualidad para 1992, el incremento estimado para 1993 seria de 16 (55 x .32) en 8. lugar de 8. Si el analista no es cuidadoso, el modelo exponencial puede conducir a pronósticos es cuidadoso, el modelo exponencial puede conducir a pronósticos Si imprecisos. la figura 8.4 que el modelo exponencial siempre pronosticaría muy imprecisos. Nótese en la figura 8.4 que el modelo exponencial siempre pronosticarla número la mutualidad. ,Que pasa cuando tiene una cantidad creciente del nilmero de vendedores en Ia mutualidad. ¿Qué pasa cuando tiene lugar maduración saturación mercado la tasa de crecimiento disminuye? El lugar la maduración y saturación del mercado y la tasa de crecimiento disminuye? El pronóstico será mayor al valor real la variable. Otro problema se refiere uso de pronóstico será mayor al valor real de la variable. Otro problema se refiere al uso de mínimos cuadrados exponencial. Se ha argumentado que mInimos cuadrados ordinarios para ajustar el modelo exponencial. Se ha argumentado que Tendencia 329 70 60 60 50 50 '" ~ .g "O 40 5 > 30 30 20 10 1987 1988 1989 1989 1990 Año 1991 1992 1993 8.4 Figura 8.4 Gráfica del fondo mutualista de vendedores. fondo Gráfica este tipo de pronósticos estará desviado a menos que se incluya en la fónnula una corrección menos que se en la formula una corrección de varianza. Las curvas de crecimiento de Gompertz o de tipo logIstico representan la tendencia crecimiento Gompertz tipo logístico representan tendencia Las de muchas industrias y ilneas de productos a crecer a una tasa de declinación cuando productos crecer a una tasa de declinación cuando de muchas industrias y líneas maduran. La curva de Gompertz pudiera ser apropiada si la gráfica de datos refleja una maduran. La curva de Gompertz pudiera ser apropiada si la gráfica de datos refleja una situación en la que las ventas comienzan bajas, luego el producto tiene su auge de ventas las ventas comienzan bajas, luego de ventas situación en y, por iiltimo, las ventas se desvanecen al alcanzar la saturación. La figura 8.5 muestra la último, desvanecen al alcanzar saturación. La figura 8.5 y, 100 100 50 50 0 0 1 I I 2 3 4 5 o 2 3 4 5 (a) Aritmética (b) SemilogarItmica Semilogarítmica 8.5 Figura 8.5 Curvas Curvas de crecimiento de Gompertz. 330 Análisis de series de tie mpo series de tiempo Cap itulo Capítulo 8 las curvas de Gompertz en gráficas tanto aritmética como semilogarítmica forma general de las curvas de Gompertz en gráficas tanto aritmética como sernilogarItmica ventas. curva de Gompertz en extremo complejos y no están de ventas. Los cálculos para la curva de Gompertz son en extremo complejos y no están texto. Para los procedimientos cálculo, deberán comprendidos en el alcance de este texto. Para los procedimientos de cálculo, deberán comprendidos en el alcance de consultarse libros especializados.2 libros especializados. 2 decisión tendencia utilizar, debe conocer el propósito de calcular En la decision de qué tendencia utilizar, se debe conocer el propósito de calcular la tendencia. Por ejemplo, si el propósito consiste en obtener una estimación de gastos para tendencia. Por ejemplo, si el propósito consiste en obtener una estimación de gastos para un año futuro, se requiere un conocimiento de las fuerzas básicas que producen o afectan futuro, se requiere conocimiento las fuerzas básicas producen o afectan tendencia. La correcta elección de una tendencia es un aspecto de juicio, ahí que la tendencia. La correcta elección de una tendencia es un aspecto de juicio, de ahI que requiera de experiencia y sentido común por parte del analista. La línea o curva que mejor sentido comün parte del analista. lInea o que mejor tendencia se ajusta a los puntos de datos pudiera no tener sentido al proyectarla como la tendencia los puntos de datos pudiera no tener sentido al proyectarla como del futuro. VARIACIÓN CICLICA VARIACION CíCLICA la tendencia de la variable dependiente valor práctico directo El análisis de la tendencia de la variable dependiente tiene un valor práctico directo para los pronósticos a largo plazo. Sin embargo, ci anáiisis del componente cIclico es de un valor el análisis cíclico los dudoso en el pronOstico. El componente cíclico es la fluctuación en forma de onda o ciclo pronóstico. El componente cIclico es fluctuación o ciclo más de ocho meses de duración, debida condiciones económicas cambiantes. Los de más de ocho meses de duración, debida a a condicioneseconOmicas cambiantes. Los economistas le han prestado mucha atención al análisis de ciclos en los negocios y a sus negocios sus economistas le han prestado mucha atención al análisis de ciclos en causas, pero no está comprendido en el alcance de este texto considerar las nurnerosas está comprendido el alcance de este texto considerar las numerosas causas, pero teorías que se refieren a este problema. problema. teorlas que El componente cIclico de las Series de tiempo se identifica eliminando o promediando cíclico series de tiempo se los efectos de la tendencia. Ya que este componente constituye lo que queda después de tendencia. que este componente constituye que queda después de los efectos método dichos ajustes, dichos ajustes, se le refiere como el método residual. Los pasos especIficos comprendidos en el método residual dependen de si el análisis específicos comprendidos si el análisis Los comienza con series de datos mensuales, trimestrales o anuales. Si los datos son rnensuamensuales, anuales. Si los datos son mensuacornienza con series les o trirnestrales, entonces los efectos tanto de la tendencia como de los componenla tendencia como de los componenles trimestrales, tes estacionales se deben eliminar. Si los datos son anuales, entonces solo deben elirninarse los datos son anuales, entonces sólo deben eliminarse los efectos del componente de Ia tendencia. componente de la tendencia. descomposición de una serie histórica anual se representa En forrna simbólica, la descomposiciOnde una serie histórica anual se representa En fonTIa simbólica, como y TC Y TC C=-=T T C- (8.6) Y como una indicación precisa de la tendencia se trata la se acepta al valor se acepta a! valor de Y como una indicación precisa de la tendencia yy se trata a la discrepancia (residuo) como el componente cIclico. componente cíclico. la determinación efecto relativo componente cíclico cada valor anual, En la determinación del efecto relativo del componente cIclico en cada valor anual, 2 Para una descripción de los métodos matemáticos para ajustar curvas de crecimiento, véase F. E. Croxton, D. 2 una descripción de los métodos matemáticos para ajustar curvas de crecimiento, véase F. E. Croxton, D. J. Cowden y B. W. Boich, Practical Business Statistics, 14. ed. (Englewood Cliffs, N. J.: Prentice-Hall, 1969), W. Bolch, Practical Business Statistics, 14. ed. (Englewood Cliffs, N. 1.: Prentice-Hall, 1969), J. pp. 332-338, o Makridakis S. Wheelwright, Interactive Forecasting, Vol. Calif.: pp. 332-338, o S. Makridakis y S. C. Wheelwright, lnteractive Forecasting, Vol. 1 (Palo Alto, Calif.: Scientific 1977), 100-104. Press, 1977), pp. 100-104. VariaciOn cíclica Variación cIclica 331 Ejemplo Ej emplo 8.3 En la tabla 8.1 se presentan los indices cIclicos para el registro anual de nuevos automóviles En 8.1 se presentan los índices cíclicos el registro anual de automóviles de pasajeros en EUA de 1960 aa1992. Cada indice ciclico se calcula dividiendo elel número real de EVA de 1960 1992. Cada índice cíclico se calcula",dividiendo ni.'imero real de para cada año (Y) el número de tendencia, registros para cada año (Y) entre ci niimero esperado de registros (Y). La ecuación de tendencia, y = 8.043 + .06368X sirve para calcular el valor esperado de la tendencia. Esta proporción se esperado se sirve para calcular el Y 8.043 100 para convertir el componente cíclico a porcentaje o índice. multiplica por 100 para convertir el componente cIclico a porcentaje o indice. cíclico para 1960 la 8.1 se calcula (ignorando Por ejemplo, el valor cIclico para 1960 en Ia tabla 8.1 se calcula (ignorando errores de ejemplo, el como La estimación de la tendencia para 1960 es redondeo), corno sigue. La estimación de Ia tendencia para 1960 es y 8.043 .06368( 1) = 8.10668 Y = 8.043 + .06368(1) = 8.10668 valor cíclico 1960 es El valor cIclico para 1960 es 6.577 e = 8.10668 = 8.10668 (100) = 81.13 (lOO) = 81.13 El indice cIclico muestra la posición de cada valor de Y en relación con la lInea de tendencia. índice cíclico muestra Ia posición de cada valor de Y en relación con línea Y era 81.13% Esta posición se refleja como porcentaje. Por ejemplo, en 1960, el valor de Yera 8 1.13% de refleja porcentaje. Por ejemplo, en 1960, el la lInea de tendencia. En 1973, Y era el 127.05% de la línea de tendencia. Como los valores Ia línea de tendencia. En 1973, Y era ci 127.05% de la lInea de tendencia. Como los valores cíclicos se muestran como porcentajes de la línea de tendencia, se puede decir que se ha cIclicos se muestran corno porcentajes de Ia lInea de tendencia, se puede decir que se evaluación. En eliminado la tendencia de Ia serie, dejando solo ci componente cIclico para evaluación. En eliminado Ia tendencia de la serie, dejando sólo el componente cíclico 1960, los registros de automóviles nuevos de pasajeros fueron aproximadarnente 19% menores aproximadamente 19% menores 1960, los registros autornóviies nuevos de Jo esperado con base en Ia estimación de la tendencia. En 1973, los registros de automóviles lo esperado la estirnación de la tendencia. En 1973, nuevos de pasajeros fueron aproxirnadamente 27% superiores a lo esperado con base en Ia base en la de pasajeros fueron aproximadamente 27% superiores a esperado estimación de la tendencia. estimación The MINITAB commands to solve Example 8.3 are cammands ta salve Example 8.3 are The MTB > DIVIDE Cl BY C4, PUT INTO CS Cl C4, PUT INTO C5 MTB > MTB > LET C6 = C5*100 C6 C5*lOO MTB > MTB > PRINT C6 > PRINT C6 C6 81.131 97.715 97.715 96.697 96.697 89,411 89411 105.139 71.661 109.144 90.135 81.555 98.790 84.272 108.839 108.839 106.864 106.864 93.236 91.443 91.073 95.934 117.811 105.012 81.680 110.551 96.455 106.128 71.661 117.339 127.046 111.625 118.297 111.167 118.297 93.398 103.632 112.272 114.111 105.012 79.393 98.790 127.046 11 NTB > STOP MTB > STOP • Los Indices cIciicos se calculan dividiendo los valores reales de Y almacenados en Cl, índices cíclicos se calculan dividiendo los valores reales de Yalmacenados en Cl, entre los valores estimados de Y almacenados en C4. El resultado, aimacenado en C5, Y almacenados C4. almacenado en C5, entre por 100 para crear un número índice, que se almacena en C6. se multiplica por 100 para crear un nñrnero Indice, que se almacena en C6. de C6 (índice cíclico). • El comando PRINT lista el contenido de C6 (indice cIclico). figura 8.6 muestra una gráfica cíclica que se desarrolló para ayudar a analizar el La figura 8.6 muestra una gráfica ciclica que se desarrollô para ayudar a analizar ci cíclico. la componente ciclico. Nótese que Ia ecuación de tendencia se representa como 100% o como línea base. Resulta más fácil apreciar diversos patrones cIclicos en la linea base. Resulta más fácil apreciar diversos patrones cíclicos en una gráfica de este 332 130 Análisis de series de tiempo Capítulo 8 Cap Itulo 120 110 110 "E 1: 8 ... /:l; u 100 o 90 80 70 1960 1960 II I I I I I I I I I I I I I 1965 1970 1975 1975 1980 1985 1985 1990 Año Figura 8.6 Gráfica cíclica para los datos del ejemplo 8.3. datos del ejemplo 8.3. ciclica tipo; la cual sirve también para comparar ci componente cIclico de la variable de interés sirve también para comparar el componente cíclico la variable de interés tipo; negocios. con el patron cIclico de otras variables yb indicadores de los negocios. patrón cíclico de otras variables y/o Los Indices relativos responden las siguientes preguntas para cualquier serie histórica: índices para cualquier serie histórica: l. ¿Presenta ciclos la serie? Presenta 2. De ser así, ¿quétan extremo es el ciclo? asI, qué tan extremo es el 3. ¿Sigue la serie el estado general de la economla (ciclo de los negocios)? economía Sigue Ejemplo 8.4 Se puede emplear la figura Se puede emplear la figura 8.6 para responder preguntas con respecto al patron cIclico de para responder preguntas con respecto al patrón cíclico automóviles nuevos de pasajeros. Los registros fueron débiles 100) registros de autornóviles nuevos de pasajeros. Los registros fueron débiles (abajo de 100) abajo alrededor de 1960 a 1974. Luego, el patrón cíclico osciló hacia arriba de 1960 a 1974. Luego, ci patron cIclico osciló hacia arriba y hacia abajo airededor de la 1970 incrementó forma consistente alcanzar punto más tendencia hasta 1970 cuando se incrementó en forma consistente hasta aicanzar el punto más 127 1973. esto siguió una caída 1975. El patrón alcanzó un pico alto de 127 en 1973. A esto siguió una caida dramática a 90 en 1975. El patrOn alcanzó un pico de nuevo en 1978 de 118, pero luego cayO a uno bajo de 81 en 1982. En 1986 ilegó otro 1982. 1986 llegó otro 1978 118, pero luego cayó a uno bajo de 81 114, llegar bajo pico, 114, seguido de una declinación de seis años hasta ilegar a un punto bajo de 79 en 1992. 79 en 1992. Los indicadores cíclicos muestran que hay un efecto ciclico definido para el registro de Los indicadores cIclicos muestran que hay un efecto cíclico definido automóviles nuevos: automôviles nuevos: Los indicadores varían de 71.66 a 127.05. En contraste, se podría esperar varian de 71.66 127.05. contraste, podrIa esperar que indicadores cíclicos para leche o jabón para ropa fueran muy leves o inexistentes, mienque indicadores cIclicos para leche o jabón para ropa fueran muy leves inexistentes, mientras que otros como los de abrigos de pieles y joyerIa fueran extremos. El patrOn cíclico de de abrigos de pieles y joyería fueran extremos. El patrón cIclico de tras que registro de automóviles nuevos parece estar influido en cierto grado por las condiciones automóviles nuevos parece estar influido en cierto grado las condiciones registro de económicas. Los picos se presentan cuando la economía es fuerte y las caídas cuando es débil. econOrnicas. Los picos se presentan cuando Ia economia es fuerte y las caldas cuando es débil. el patrón cíclico variable. Sin embargo, parece haber otros factores que afectan ci patron cIclico de la variable. factores embargo, parece Una forrna de investigar los patrones cIclicos es a través del estudio de indicadores cíclicos través del estudio de indicadores Una fonna empresarial es una serie histórica relacionada con los negocios empresariales. Un indicador empresarial es una serie histórica relacionada con los negocios empresariales. Un que se usa para ayudar a evaluar ci estado general de la economla, en particular con que usa para ayudar a evaluar el estado general de la economía, en particular con referencia al ciclo de los negocios. Mucha gente de negocios economistas siguen referencia al ciclo de los negocios. Mucha gente de negocios yyeconornistas siguen sistemáticamente el movimiento de tales series estadIsticas para obtener su inforrnaciOn en tales series estadísticas para obtener su información Variación cíclica VariaciOn cIclica 333 fonna de una imagen que se desdobla, que esté actualizada, que sea comprensible, la forma de una imagen que se desdobla, que esté actualizada, que sea comprensible, relativamente objetiva y capaz de ser leIda y entendida en el menor tiempo posible. leída relativamente objetiva y capaz de Los indicadores empresariales son series Los indicadores empresariales son series de tiempo relacionadas con los tiempo relacionadas con negocios que ayudan a evaluar el estado general de la economla. economía. negocios La lista más importante de indicadores estadisticos se originó durante la aguda aguda La lista más importante de indicadores estadísticos se originó durante 1937-1938. recesión en los negocios de 1937-1 938. El secretario del tesoro, Henry Morgenthau, solicitó del tesoro, al Departamento Nacional de Investigación Económica (NBER: National Bureau of al Departamento Nacional de Investigación Económica (NBER: National Bureau Economic Research) que concibiera un sistema que seflalara cuándo la recesión se acercaria señalara acercaría a su final. Bajo Ia dirección de Wesley Mitchell y Arthur F. Burns, los economistas del final. Bajo la dirección de Wesley Mitchell Arthur F. Burns, los economistas del acuerdo su desempeño prometían seleccionaron 21 NBER seleccionaron 21 series que de acuerdo con su desempeflo en el pasado prometlan ser indicadores relativamente confiables de la recuperación económica. Debido que el ser indicadores relativamente confiables de la recuperación económica. Debido aa que el departamento ha revisado la lista en diversas ocasiones, en Ia tabla 8.3 aparece una departamento ha revisado la lista en diversas ocasiones, en la tabla 8.3 aparece una lista reciente reciente que consta de 22 indicadores. 22 indicadores. TABLA 8.3 TABLA 8.3 INDICADORES CICLICOS EMPRESARIALES cíCLICOS EMPRESARIALES INDICADORES COINCIDENTES INDICADORES RETRASADOS INDICADORES RETRASADOS Duración promedio del del desempleo, en semanas desempleo, Proporción Proporción entre inventarios de inventarios manufactura y comercio y ventas ventas manufactura en 1987 1987 Promedio líder Promedio de tasa lIder cargada por porcentaje los bancos, porcentaje Créditos comerciales e industriales industriales pendientes, millones Proporción del crédito a plazos a! Proporción plazos al consumidor consurnidor con respecto al ingreso personal, porcentaje Índice Precios Cambio en el Indice de Precios al servicios, a! Consumidor para servicios, porcentaje porcentaj e INDICADORES CONDUCENTES INDICADORES nóminas no Empleados en nóminas no semanales promedio Horas semanales promedio agrícolas, miles agricolas, en miles en manufacturas Ingreso personal menos pagos menos pagos Promedio semanal de solicitudes de solicitudes de transferencia, miles de millones de millones iniciales de seguro de desempleo, desempleo, iniciales de Índice producción industrial, fndice de producción industrial, miles Pedidos nuevos de fabricantes, fabricantes, Pedidos nuevos 1987 100 1987 = 100 bienes de consurno y materiales, de manufacturas y comercio, bienes de consumo y Venta de manufacturas y comercio, miles de millones miles millones en millones Cambio en el costo laboral por unidad costo laboral por unidad de de producción, manufactura, porcentaje porcentaje distribuidores, índice Desempeño de distnbuidores, Indice de difusión más lenta de entregas, entregas, de difusión porcentaje porcentaj e Contratos Contratos y pedidos para millones planta y equipo, miles de millones planta y Índice casas privadas Indice de unidades de casas privadas pennisos de nuevas autorizadas por pernlisos de construcción locales, 1967 = 100 construcción locales, 1967 100 Cambio en las órdenes no cubiertas órdenes no cubiertas por fabricantes, bienes duraderos, duraderos, miles de millones miles precios de materiales Cambio en precios de materiales sensibles, porcentaje sensibles, porcentaj e Índice precios de acciones, Indice de precios de acciones, acciones comunes, 1941-1943 lOO 500 acciones comunes, 194 1-1943 = 100 Oferta de dinero M2, miles de millones miles de millones Oferta Índice expectativas del consumidor, Indice de expectativas del consumidor, de Michigan, 1961:1 = lOO U. de Michigan, 1961:1 = 100 334 Análisis de series de tie mpo de tiempo Capítulo 8 Cap itulo El NBER ha encontrado que ciertas series de tiempo pueden ser ütiles como El NBER ha encontrado que ciertas series de tiempo pueden ser útiles como indicadores directos expansiones contracciones cíclicas en la actividad empresarial. indicadores directos de expansiones y contracciones cIclicas en la actividad empresarial. Después de estudios continuos de ciclos en los negocios, se ha aprendido que no todas las negocios, las Después continuos ciclos áreas de la economia se expanden en forma simultánea durante las expansiones, ni toeconomía expanden forma durante expansiones, ni areas contraen en forma concurrente durante los periodos de contracción. Un estudio de das se contraen en forma concurrente durante los periodos de contracción. Un estudio de series de tiempo económicas individuales y su relación con este movimiento cíclico general cIclico general indica que la periodicidad de la mayoría de las series se apega sólo en una pequeña medida mayoria solo pequena -yen ciertas series en ninguna- a periodicidad del ciclo de los negocios. Sin embargo, y en ciertas series en ninguna a la la periodicidad del ciclo de los negocios.Sin embargo, existen excepciones a esta aseveración genérica. esta aseveración genérica. departamento identificó 22 indicadores estadIsticos once de ellos clasificados El departamento identificó 22 indicadores estadísticos -once de ellos clasificados como conducentes, como conducentes,44 como coincidentes yy77 como retrasados- que han demostrado su como coincidentes como retrasados que han demostrado su utilidad como indicadores de condiciones de los negocios. Mensualmente se publican cifras Digest, actualizadas de estas series en Business Conditional Digest, del Departamento de Comercio Statistical los Estados Unidos y en Survey o/ Current Business; y semanalmente de los Estados Unidos y en Survey of Current Business; y semanalmente en Statistical Indicator Report, de Statistical Indicator Associates. Report, de Statistical Indicator Associates. Para guía de pronosticadores y otros usuarios, cada serie en la lista del NBER ha sido ha sido guIa pronosticadores el departamento en términos de los siguientes elementos: (1) evaluada y calificada por el departamento en términos de los siguientes elementos: (1) representa una actividad que tiene un papel dave en el grado hasta el cual la serie mide o representa una actividad que tiene un papel clave en el cíclico, proceso cIclico, (2) precisión estadística y dependencia de las series, (3) grado de apego de precision estadIstica y dependencia de las series, (3) grado de apego de las series a los ciclos históricos de los negocios, (4) congruencia con la que Ia serie se ha negocios, la se ha las series movido en cierta fase especifica (conducente, coincidente o retrasada), con el movimiento cierta fase específica (conducente, movimiento atenuación (v. ausencia fluctuaciones cíclico la economía, (5) cIclico en Ia economIa, (5) grado de atenuación (v. gr., ausencia relativa de fluctuaciones mayores (6) oportunidad de publicación. 3 series seleccionadas para la mayores irregulares) y, (6) oportunidad de publicación.3 Las series seleccionadas para la lista corta (tabla 8.3) tienen todas altas calificaciones y comprenden poca duplicidad de 8.3) tienen todas altas calificaciones y comprenden poca duplicidad de lista cobertura. Como se mencionó, se identificaron tres grupos de indicadores: los que proporcionan identifIcaron de indicadores: los que proporcionan Corno advertencias adelantadas de cambios probables en la actividad económica, los indicadores económica, advertencias adelantadas de cambios probables en conducentes; aquellos que reflejan el desernpeño actual de la economla, los indicadoreflejan el desempeño actual de la economía, los indicadoconducentes; aquellos pr~viamente señalados, res coincidentes; y aquellos que confirman los cambios previamente seflalados, los indicadores confinnan los retrasados. retra sados. l. Indicadores conducentes. En la práctica, se estudian los componentes de las series 1. Indicadores conducentes. En la práctica, se estudian los componentes de las series conducentes para ayudar a anticipar los momentos cruciales en la economla. La momentos cruciales en economía. conducentes para ayudar anticipar Survey of Current Survey o/Current Business publica esta lista cada mes, junto con los valores reales mes, de cada serie para varios meses anteriores y el aflo más reciente. También, se calcula, anteriores y año rnás reciente. También, año, un Indice compuesto de indicadores para cada mes y afio, un índice compuesto de indicadores conducentes; con frecuenreporta el valor mensual más prensa indicar la cia se reporta el valor mensual rnás reciente en la prensa popular para indicar la dirección general de la economía futura. Enjulio de 1993 este índice compuesto fue economIa futura. Enjulio indice fue ajunio de 1992 en el que fue de 148.8. 151.5 (1982 = 100), que subió de 151.5(1982 = 100), que subiO con respecto ajunio de 1992 en el que fue de 148.8. Ejemplos de indicadores conducentes son los permisos de construcción de casas Ejemplos indicadores conducentes permisos de construcción de casas valores. nuevas y el mercado de valores. 3 G. H. Moore y J. Shiskin, Indicators of Business Expansions and Contractions (New York: National Bureau y J. Shiskin, Indicators of Business Expansions Contractions (New York: National Bureau G. of Economic Research, 1957), pp. 8-28. of Economic Research, 1957), PP. 8-28. Variación cIclica VariaciOn cíclica 335 2. Indicadores coincidentes. Los cuatro indicadores coincidentes de la tabla 8.3 proporcoincidentes. cuatro indicadores la tabla 8.3 proporeconomía Cada mes se calcula cionan una medida del desempeño actual de la economla de EUA. Cada mes se calcula índice un Indice de las cuatro series, el cual se ubicó en 123.3 en junio de 1992 y subió a 126.9 series, el cual se ubicó en 123.3 enjunio 126.9 enjulio de 1993. Ejemplos de estos indicadores enjulio de 1993. Ejemplos de estos indicadores son el ingreso personal y las ventas. 3. Indicadores retrasados. Estos indicadores tienden a ubicarse en forma retrasada detrás retrasados. Estos indicadores tienden a ubicarse en forma del estado general de la economla, tanto en las aizas como en las bajas. También para economía, alzas para esta lista se calcula un Indice compuesto, que fue de 105.4 en junio de 1992 y bajó a índice compuesto, que fue de 105.4 enjunio 1992 bajó a 104.2 en julio de 1993. Como ejemplos se pueden citar la tasa líder de interés y los 104.2 en julio de 1993. Como ejemplos se pueden citar la tasa ilder comerciales pendientes. préstamos comerciales pendientes. Una de las mayores dificultades de un indicador consiste en determinar cuándo las mayores dificultades de un indicador consiste en determinar cuándo Una componente fluctuación series económica y alcanza un punto cIclico critico. El componente de fluctuación de las series económica y cíclico crítico. alcanza de negocios contiene movimientos irregulares de corto plazo, adicionales a los cIclicos. De adicionales a los cíclicos. De ahI que las gráficas de datos semanales, mensuales o trimestrales tengan la apariencia ahí que las gráficas de datos semanales, mensuales o trimestrales tengan la apariencia desigual de una sierra, como se muestra en la figura 8.6. En consecuencia, resulta dificil sierra, muestra la figura 8.6. En consecuencia, resulta dificil desigual de cíclicos críticos cerca del momento en identificar los puntos cIclicos criticos cerca del momento en el que ocurren. Recuerde que puntos críticos existen sólo como consecuencia una declinación seguida de un los puntos crIticos existen solo como consecuencia de una declinación seguida de un componente cíclico. aumento, o viceversa, en el componente ciclico. Por ello, pueden pasar varios meses antes identificar, seguridad, un auténtico giro cIclico hacia aniba abajo en de identificar, con cierta seguridad, un auténtico giro cíclico hacia arriba o hacia abajo en conducente. una serie conducente. cíclico Otro problema que surge en el uso del enfoque del indicador cIclico se debe a que no Otro problema que indicador conducente dado, antecede a presenta uniformidad en el mediante el cual presenta unifonnidad en el lapso mediante el cual un mdicador conducente dado, antecede a variabilidad considerable cíclicos la economla. cambios cIclicos en Ia economía. En vez de ello, se puede apreciar una variabilidad considerable el periodo conducente ciclo a ciclo. En consecuencia los indicadores conducentes en el periodo conducente de ciclo a ciclo. En consecuencia los indicadores conducentes señalar que puede esperarse una recesión o recuperación en algún momento futuro, pudieran señalar que puede esperarse una recesión o recuperación en algOn mornento futuro, pero proporciona poca ayuda para establecer el momento del cambio. Para establecer esta proporciona establecer el momento del establecer esta conexión, con frecuencia resultan útiles los análisis de los indicadores coincidentes y conexión, con frecuencia resultan Otiles los análisis de los indicadores coincidentes y retrasados. Por ejemplo, si los indicadores conducentes señalan un giro cíclico hacia abajo, retrasados. Por ejemplo, si los mdicadores conducentes señalan un giro cIclico hacia abajo, los analistas comenzarán a buscar con detenimiento signos de debilidad en los indicadores con detenimiento debilidad en los indicadores la práctica, uso efectivo de los indicadores cíclicos requiera coincidentes. De ahI que en la práctica, el uso efectivo de los indicadores cIclicos requiera ahí coincidentes. los tres grupos. de una continua evaluación de las series de los tres grupos. Otra dificultad más consiste en que, en ocasiones, los indicadores emiten "seflales que, en ocasiones, los indicadores emiten "señales Otra dificultad más consiste falsas", es decir, seflalan un punto crItico que no se materializa. Algunas veces, estas seflaseñalan crítico se materializa. Algunas veces, estas señafalsas", a factores que se pueden identificar por adelantado, como una gran huelga, de les se deben a factores que se pueden identificar por adelantado, como una gran huelga, de se pueden descartar dichas señales. En otros casos, ha sido imposible distinguir modo que se pueden descartar dichas señales. En otros casos, ha sido imposible distinguir señales falsas y las precisas hasta después de consumado el hecho. entre las señales falsas y las precisas hasta después de consumado el hecho. En resumen, En resumen, los indicadores empresariales han demostrado ser de gran utilidad en el indicadores empresariales han demostrado ser de gran utilidad críticos, especial donde la mayoría los otros métodos tiende pronóstico de puntos crIticos, en especial en donde Ia mayorIa de los otros métodos tiende indicadores desempeñado a fallar. Los indicadores tienen sus limitaciones, sin embargo, se han desempeflado tan bien método, a través del tiempo. como cualquier otro método, a través del tiempo. artículo economía", En su artIculo titulado "Signos tempranos de advertencia para la economia", Geoffrey Julius Shiskin dicen lo siguiente con respecto a la utilidad de los indicadores H. Moore y Julius Shiskin dicen lo siguiente con respecto a Ia utilidad de los indicadores estadísticos: 4 estadIsticos :' 4 G. H. Moore y J. Shiskin, "Early Warning Signals for the Economy", en Statistics: A guide to Business and Statistics: A guide to Business and ' G. H. Moore y J. Shiskin, "Early Warning Signals for the Econorny", Econornics (San Francisco: Holden-Day, 1976) p. 81. Economics (San Francisco: Holden-Day, p. 336 Análisis de series de tiempo Capítulo CapItulo 8 A partir de los datos registrados, parece ser claro que los indicadores de ciclo en los de los datos registrados, parece ser claro que los indicadores de ciclo en negocios resultan ütiles al juzgar el tono de negocios actuales y prospectos de negocios resultan útiles al juzgar el tono de los negocios actuales y los prospectos de corto plazo. Aunque debido sus limitaciones, indicadores con corto plazo. Aunque debido a sus limitaciones, los indicadores deben usarse junto con otros datos con plena conciencia de confianza y expectativas de los negocios y otros datos y con plena conciencia de la confianza y expectativas de los negocios y el consumidor, las polIticas gubernamentales y Los sucesos internacionales. Debemos también políticas y los sucesos internacionales. también frecuencia anticipar que con frecuencia los indicadores no serán fáciles de interpretar, que las interpreque indicadores no serán fáciles de interpretar, que las interpretaciones algunas veces varían entre los analistas y que las señales que ofrecen no serán taciones algunas veces varian entre los analistas y que las señales que ofrecen no serán interpretadas. correctamente interpretadas. Los indicadores proporcionan una imagen sensible y reveladora del flujo y reflujo de las las mareas económicas, que un avezado analista de la escena económica, politica e internacional, intemacional, puede utilizar para mejorar sus posibilidades de formular un pronóstico válido de las puede utilizar para mejorar sus posibilidades de formular un pronóstico válido de las tendencias económicas de corto plazo. Si el analista está consciente de sus limitaciones y está indicadores ütiles señales que le servirán de atento al mundo que lo rodea, encontrará en los mdicadores útiles señales que le servirán de guía evaluar la economía y sus necesidades. gula para evaluar la economIa y sus necesidades. Como un presenta el patrón cíclico registro de Corno 1m ejemplo de análisis y predicción, se presenta el patron cIclico de registro de automóviles automOviles nuevos. Ejemplo 8.5 patrón cíclico la variable: registro de automóviles nuevos, que se muestra Para explicar el patron cIclico de la variable: registro de automóviles nuevos, que se muestra figura 8.6, se deben investigar diversos factores. Si la de registro de automóviles en la figura 8.6, se deben investigar diversos factores. Si La variable de registro de automóviles de pasajeros está relacionada de manera lógica de pasajeros está relacionada de manera lógica con la economIa, en alguna medida los la economía, en alguna medida los indicadores coincidentes que proporcionan desempeño actual de la actividad indicadores coincidentes que proporcionan la medición del desempeño actual de la actividad económica, debieran proporcionar ayuda en el pronóstico. Muchas series de indicadores las de indicadores las econórnica, debieran proporcionar ayuda en el pronóstico. pronostican expertos y es frecuente que estos pronósticos estén disponibles en fuentes pronostican expertos y frecuente que estos pronósticos estén disponibles en fuentes existen estos pronósticos un buen registro de confiabilidad, pudieran publicadas. publicadas. Si existen estos pronOsticos y tienen tin buen registro de confiabilidad, pudieran proporcionar una base para el pronóstico de registro de automóviles nuevos. registro automóviles La figura 8.6 muestra que la variable de registro de autornóviles está relacionada con la automóviles La figura relacionada economía. Cuando en 1961, 1970, 1975, 1982, 1991 Y 1992, descendieron los registros de economla. Cuando en 1961, 1970, 1975, 1982, 1991 y 1992, descendieron los registros de automóviles, Ia economía estuvo deprirnida. Cuando Losregistros alcanzaron picos en 1965, deprimida. los registros alcanzaron picos en automóviles, la economla 1968, 1973, 1978 Y 1986, la econornia era saludable. economía saludable. 1968, 1973, 1978 y Una variable que podria explicar por Jo menos parte de esta fluctuación cIclica es el indice podría lo cíclica índice de precios de automóviles nuevos, que genera el gobierno federal y se publica en Survey 01 precios automóviles nuevos, que genera el gobierno federal y Survey of Current Business. Presumiblemente, cuando el precio es alto, los registros debieran ser bajos Business. Presumibleniente, cuando el precio es alto, bajos y cuando los precios son bajos, los registros debieran aumentar. El índice de precios de precios bajos, los registros debieran aumentar. El indice de precios de y cuando automóviles nuevos se ajustó a la tendencia para eliminar los efectos de la inflación y se automóviles nuevos se ajustô a Ia tendencia para elirninar los efectos de la inflación y se graficaron los cicLosresultantes en la figura 8.7. En ella se muestran las gráficas ciclicas tanto ciclos resultantes en la figura 8.7. En cíclicas tanto para registros de autonióviles nuevos como para el indice de precios de automóviles nuevos automóviles nuevos como índice de precios de automóviles nuevos para registros (periodo base 1982-1984). (periodo base figura relación registro automóviles nuevos índice La figura 8.7 revela una relación entre el registro de automóviles nuevos y el indice de precios de automóviles nuevos. Sin embargo, no parece haber una conexión entre ambos conexión entre ambos precios de automóviles nuevos. Sin embargo, no parece haber índices cíclicos. Debe haber otro factor, distinto a los precios de los automóviles, que esté precios los automóviles, que esté Indices ciclicos. Debe haber otro factor, distinto a provocando que provocando que los registros de automóviles exhiban el efecto cIclico que se muestra en las registros automóviles exhiban el cíclico muestra en las figuras 8.6 y 8.7. Un analista interesado en explicar la naturaleza cIclica de los registros de 8.7. Un analista interesado en explicar la naturaleza cíclica los registros de figuras automóviles nuevos, podria buscar variables económicas adicionales y graficarlas contra automóviles nuevos, podría buscar variables económicas adicionales y graficar1as contra los registros, esperando encontrar una o más variables con una fuerte relación. registros, esperando encontrar una o niás variables con fuerte relación. Variación cíclica VariaciOn cIclica 160 140 140 .~ 120 337 i:: 11) Q a.. lOO 100 ................ 80 80 0 ~ ...... I I I I I I I I I I 60 60 L.....JL.....JL.-.JL.-.J---.l---.l----l.----l.--L--L----L----L---L---L----l..-----l.-----l.--I.--I.---I---I---'-----'-----'----'-----'----...l..-...l..-...l..-.1....-J.........J 1990 1975 1980 1985 1965 1970 1960 I I I Año Ãñø Figura 8.7 Gráfica cIclica de registros de automóviles e indice 8.7 cíclica automóviles e índice de precios de automóviles nuevos. automóviles nuevos. decisión Hasta ahora, la decision muestra que se pueden separar y estudiar en forma individual los que una variación en una serie histórica. El proceso de separar la serie histórica factores que generan una variación en una serie histórica. El proceso de separar la serie histórica se denomina análisis; el proceso de reunirla nuevamente es la sIntesis. de reunirla nuevamente es la síntesis. se denornina la variable automóviles analizan los compoPara comprender Ia variable de registro de automóviles nuevos, se analizan los compodescomposición nentes individuales. La descornposición del año 1992 se lleva a cabo mediante la determinación ileva componentes de tendencia y cíclico (véase tabla 8.2). de los componentes de tendencia y cIclico (véase tabla 8.2). T= T = tendencia (1992) = 10.14453 e cíclico (1992) = 79.39 C = cIclico (1992) = 79.39 Para nuevamente Ia serie, analista emplea modelo multiplicativo original y Para unir nuevamente la serie, el analista emplea el modelo multiplicativo original y componentes correspondientes. sustituye los componentes correspondientes. Y= Te Y = TC Y(1992) = l0.14453(.7939) 8.054 Y(1992) = 10.14453(.7939) = 8.054 utilizar el modelo multiplicativo para estimar los registros de automóviles También se puede utilizar el modelo multiplicativo para estimar los registros de automóviles nuevos para 1993. Todo lo que necesita el analista son estimaciones precisas de los nuevos para 1993. Todo lo que necesita el analista son estimaciones precisas de los cíclico irregular. componentes de tendencia y cIclico irregular. la tendencia determina apropiada de tendencia, La estimación de la tendencia se determina mediante la ecuación apropiada de tendencia, en este caso Y= 8.043 + .06368X Puesto que X = 1 representa al lo. de julio de 1960, el valor este caso Y= 8.043 + .06368X. Puesto queX= representa al lo. dejulio de 1960, codificado 1993 la estimación de la tendencia es codificado de X para 1993 es 34 y la estimación de la tendencia es X y = 8.043 + .06368(34) = 10.208 Y = 8.043 + .06368(34) = 10.208 A continuación, se estima el componente cIclico para 1993. Este es un proceso subjetivo estima el componente cíclico 1993. Éste es un proceso subjetivo que el analista utiliza la información disponible proveniente de economistas destacados, en el que el analista utiliza la información disponible proveniente de economistas destacados, 338 Análisis de series de tiempo Capítulo Cap Itulo 8 boletines de aSOCIaCIOnes comerciales, proyecciones intemas de ventas y cualquier boletines de asociaciones comerciales, proyecciones internas de ventas y cualquier otra información que considere el curso futuro de los negocios de la empresa. Asimismo, el analista empresa. Asimismo, patrón estudia el patron anterior de índices cIclicos de los datos históricos, que aparecen en las figuras indices cíclicos de datos históricos, que aparecen figuras El índice cíclico el registro de automóviles nuevos disminuido de 8.6 y 8.7. El Indice cIclico para el registro de automOviles nuevos ha disminuido de manera 8.6 congruente 1988. ,Continuará este patron, o nivelarán registros, o inclusive congruente desde 1988. ¿Continuará este patrón, o se nivelarán los registros, o inclusive aumentarán nuevamente? ¿Cómo se comportará la economla en 1993? ¿Qué pronostican los economía en 1993? Que pronostican aumentarán nuevamente? ,COmo expertos para el los negocios? ¿Cuáles son las políticas propuestas para los precios expertos para ci ciclo de los negocios? ,Cuáles son las polIticas propuestas para los precios automóviles 1993? contestadas analista puede elegir de autornóviies nuevos en 1993? Una vez contestadas estas preguntas, el analista puede elegir estimación del 1993. una estimaciOn del ciclo para 1993. El aspecto más importante del proceso de estimaciOndel ciclo consiste en que el El aspecto más importante del proceso de estimación del ciclo consiste en que el formule predicción dirección correcta. Si el pronosticador predice con pronosticador formule su predicción en la dirección correcta. Si el pronosticador predice con éxito si ci patron cIclico de una variable en particular continuará aumentando o disminuyendo, o disminuyendo, éxito el patrón cíclico se nivelará, o tendrá un giro hacia arriba o hacia abajo, el pronóstico será razonablemente nivelará, tendrá un giro hacia arriba o hacia abajo, el pronóstico será razonablemente preciso. Si el analista indica Ia dirección correcta, no es tan importante ci valor real empleado el analista indica la dirección correcta, no es tan importante el valor real empleado para la estimaciOn. la estimación. En el ñltimo trimestre de 1992, el ingreso personal disponible real se incrementO en 3.8% último 1992, el ingreso personal disponible real se incrementó la tasa de desempleo declinó y Ia tasa de desempieo declinO a 7.3%. También fueron favorables los factores especificos de factores específicos de la industria de vehiculos autornotores, para Ia compra de automOviles por el consumidor. Los vehículos automotores, la automóviles por el consumidor. programas de incentivos sobre ventas mantuvieron en último trimestre, tan atractivos prograrnas de incentivos sobre ventas se mantuvieron en el ñltimo trimestre, tan atractivos conio anterior; las tasas de interés se mantuvieron bajas y los precios de automóviles como en el anterior; las tasas de interés se mantuvieron bajas y los precios de automOviles nuevos se incrernentaron en una tasa anual de sOlo 0.9%. El componente cíclico (C) para 1992 incrementaron sólo 0.9%. El componente cIclico (C) para 1992 fue cíclico arriba. fue de 79.39. Se estirna el componente cIclico para 1993 para nivelarlo y regresar hacia arriba. estima 1993 Se estirna un componente cíclico de .83 y se utiliza en la ecuación 8.1, para pronosticar 1993 estima un componente ciclico de .83 1'(1993) = T e Y(i993) = T x C 10.208(.83) = 8.473 = i0.208(.83) = 8.473 Resulta en extrerno dificil estimar e para más de un año o dos a futuro. De ahI que ahí Resulta en extremo dificil estirnar C para más de un año cualquier pronóstico de largo plazo para dicha variable sea, en el mejor de los casos, los casos, cualquier pronóstico de largo plazo para dicha variable sea, en el mejor riesgoso. Si Ia ecuación de tendencia se ajusta bien a los datos anteriores, entonces es riesgoso. Si la ecuación de tendencia se ajusta bien los datos anteriores, entonces es razonable una proyección a futuro de cinco a diez aflos. Mientras que se espere que el años. Mientras que se espere que razonable una proyección a futuro de cinco crecimiento declinación de la tendencia permanezca congruente con el comportamiento crecimiento o declinación de Ia tendencia permanezca congruente con ci comportamiento anterior, se puede anticipar un pronóstico preciso. anticipar un pronóstico preciso. VARIACIÓN ESTACIONAL VARIACION ESTACIONAL tendencia largo plazo. El análisis del El análisis de tendencia tiene implicaciones en la planeación de largo plazo. El análisis del estacional serie histórica tiene implicaciones más inmediatas de corto componente estacional de una serie histórica tiene implicaciones más inmediatas de corto es de gran importancia los niveles inferior de la administración. plazo y es de gran importancia para los niveles medio e inferior de la administración. Por ejemplo, planes de comercialización deben cuenta los patrones estacionales ejemplo, los planes de comercialización deben tener en cuenta los patrones estacionales esperados en las compras del consumidor. La identificación del comportamiento estacional serie histórica difiere del análisis de tendencia en por lo menos dos formas. en una serie histórica difiere del análisis de tendencia en por lo menos dos formas. 1. Mientras que la tendencia se deterrnina en forma directa a partir de los datos disponibles, 1. Mientras que la tendencia se detennina partir de los datos disponibles, el componente estacional se determina eliminando los otros componentes, de modo que los otros componentes, de modo que al final sólo quede el estacional. a! final solo ci Variación VariaciOn estacional 339 2. Mientras que Ia tendencia se determina mediante una ecuación o lIneas de mejor ajuste, Mientras que la tendencia se detennina mediante una ecuación o líneas de mejor ajuste, se se debe calcular un valor estacional por separado para cada mes (o trimestre) del estacional por separado para cada mes (o trimestre) del año, por lo regular en la forma de un nümero Indice. Al igual que en el análisis de fonna número índice. Al igual que análisis año, tendencia, se han desarrollado diversos métodos para medir la variación estacional; la métodos mayoría de los cálculos del índice estacional que ahora se emplean, son variaciones del mayorIa los del indice estacional que ahora se emplean, variaciones método de la proporción alpromedio móvil. niétodo de laproporción al promedio móvil. El componente estacional en una serie histórica se mide en la forma de un námero número El componente estacional en una serie histórica se mide en la forma de representa grado de influencia estacional para un segmento del índice. Indice. Su cálculo, que representa el grado de influencia estacional para un segmento del año en particular, comprende la comparación de los valores medidos o esperados para particular, comprende comparación de esperados segmento (mes, trimestre, etc.), con promedio general los segmentos del ese segmento (mes, trimestre, etc.), con el promedio general de todos los segmentos del año. este modo, un índice estacional 100 para un mes en particular, indica que el año. De este modo, un Indice estacional de 100 para un mes en particular, indica que el valor esperado para ese mes es de 1/12 del total del periodo anual centrado en ese mes. Un centrado en ese mes. Un 1/12 del total del otro mes, indica que esperado 25% índice estacional de 125 Indice estacional de 125 para otro mes, indica que el valor esperado para ese mes es 25% 1/12 del total anual. Un índice mensual de 80 nivel de actividad mayor que 1/12 del total anual. Un mndice mensual de 80 indica que el nivel de actividad es 20% menor que 1/12 del nivel de actividad total del año. Así, un esperado para ese mes es 20% menor que 1/12 del nivel de actividad total del afio. AsI, un número índice nümero Indice mensual indica las altas y bajas esperadas en los niveles de actividad mensual altas bajas esperadas en los niveles de actividad eliminando efectos ocasionados por los componentes de tendencias cíclico o trimestral, elirninando los efectos ocasionados por los componentes de tendencias cIclico irregular. e irregular. números índice son porcentajes que reflejan cambios tiempo. Los ninieros mndice son porcentajes que reflejan cambios a través del tiempo. En el siguiente ejemplo, se ilustra el método de la proporción al promedio móvil, para prornedio móvil, medir Ia variación estacional. la variación estacional. Ej emplo Ejemplo 8.6 de registros de automóviles datos mensuales los años de 1986 En el análisis de registros de automóviles nuevos, los datos mensuales para los aflos de 1986 a 1992 se utilizan como base para ci análisis del componente estacional, en lugar de los datos 1992 el del componente estacional, en lugar de los datos mensuales para el periodo completo de 1960 1992. las razones para esta reducción mensuales para el periodo completo de 1960 a 1992. Una de las razones para esta reducción de datos es Ia de simplificar los cálculos en esta exposición. Otra y más importante razón es la simplificar exposición. más importante razón es que si hubiese ocurrido cualquier cambio significativo en el patrón estacional de la compra de cambio significativo en el patron estacional automôviles nuevos en los años recientes, el uso del periodo completo de 1960 1992 del automóviles nuevos en los afios recientes, el uso del periodo completo de 1960 a 1992 del análisis estacional pudiera resultar en proyecciones más pobres de análisis estacional pudiera resultar en proyecciones más pobres de los patrones estacionales patrones estacionales esperados para esperados para 1993, que utilizando sólo datos de 1986 a 1992. utilizando solo datos 1986 1992. La La tabla 8.4 presenta los registros mensuales de automóviles nuevos, en miles, para el presenta registros mensuales de automóviles nuevos, en miles, para el 1986 diciembre de ilustrar ci principio de los cálculos de periodo de enero de 1986 a diciembre de 1987, para ilustrar el principio de los cálculos de la proporción al prornedio mOvil. El primer paso para los datos mensuales es calcular un promedio promedio móvil. El primer paso para los datos mensuales mOvii de 12 meses (para datos trimestrales, se calculará un promedio móvii de cuatro promedio móvil de cuatro móvil de 12 meses (para datos trimestrales, se calculará trirnestres). Ya que en este prornedio móvii se incluyen todos los meses del año, se eliminan trimestres). Ya que en este promedio móvil se incluyen todos los meses del año, se eliminan los los efectos ocasionados por el componente estacional, dejando sOlo los efectos ocasionados el componente estacional, dejando sólo efectos ocasionados por la tendencia de largo plazo, y los componentes cIclico eeirregular en los promedios mOviles. la tendencia de largo plazo, y los componentes cíclico irregular en los promedios móviles. A continuación se presentan los pasos para calcular indices estacionales mediante ci para calcular índices estacionales mediante el A continuación se presentan los la proporción promedio se muestran en la tabla 8.4. método de la proporción al promedio móvil, y se muestran en Ia tabla 8.4. 340 de Análisis de series de tiempo TABLA 8.4 8.4 REGISTROS DE AUTOMÓVILES NUEVOS DE PASAJEROS: DATOS PASAJEROS: DATOS REGISTROS DE AUTOMOVILES MILES, 1986-1987 MENSUALES, EN MILES, 1986-1 987 Cap hub 8 Capítulo PERIODO 1986 1986 Enero Febrero Marzo Abril Mayo Junio REGISTROS TOTAL MÓVIL DE MOVIL 12 MESES TOTAL MÓVIL DE MOVIL 2 AÑOS AOS PROMEDIO MÓVIL MOVIL CENTRADO 12 MESES 12 ÍNDICE INDICE ESTACIONAL 913 822 848 906 918 1012 934 10,965 10,965 }2 Julio Agosto 21,817)3 21,81713 21,553 909.04)4 909.04}4 898.0 102.75)5 102.75}5 99.55 10,852 894 10,701 1149 10,682 Septiembre Octubre Noviembre 21,383 21,353 891.0 889.7 885.6 128.96 106.55 81.19 102.51 948 10,671 719 10,583 21,254 21,117 10,534 10,534 Diciembre 1987 Enero Febrero Marzo 902 879.9 800 10,499 671 10,508 829 10,314 895 10,185 830 10,184 963 21,033 21,007 876.4 875.2 867.6 854.1 848.7 846.1 91.29 76.66 95.55 104.79 20,822 20,499 20,369 20.306 AbnI Abril Mayo Junio Julio Agosto Septienibre Septiembre Octubre Noviembre Diciembre 97.80 113.82 113.82 10,122 899 903 955 819 718 840 Variación estacional VariaciOn 341 1 Calcule el total móvil de 12 meses y coloque el total para enero a diciembre de 1986 Paso 1 Caicule el total móvil de 12 meses y coloque el total para enero a diciembre de 1986 frente al 10. dejulio de 1986. frente al 10. de julio de 1986. Paso 2 Dc modo que los promedios subsiguientes se ubiquen en el centro de cada mes, calcule 2 De modo los subsiguientes se ubiquen en el centro de cada mes, calcule un total móvii de dos años. móvil dos años. Como el total de dos años contiene 24 meses (enero 1986 una vez, Paso 3 Como el total de dos años contiene los datos de 24 meses (enero de 1986 una vez, febrero diciembre de 1986 dos veces, y enero de 1987 una vez), este total se febrero a diciembre de 1986 dos veces, y enero de 1987 una vez), este total se centra frente 15 de de 1986. frente al 15 de julio de 1986. 10,965 + 10,852 = 21,817 10,965 + = Paso 4 Divida el total móvil de dos aflos entre 24, con ci fin de obtener el promedio móvil Divida el total móvil de dos años el fin de obtener el promedio 12 meses. centrado de 12 meses. centrado - - = 909.04 909.04 24 21,817 Paso 5 La proporción al promedio rnóvil se calcula dividiendo el valor real de cada mes entre La proporción al promedio móvil calcula cada mes entre ci promedio móvil centrado de 12 meses, y multiplicando por 100 de modo que el promedio móvil centrado de 12 meses, y multiplicando por 100 de modo que la la fOffila porcentaje. proporción sea un námero indice en Ia forma de un porcentaje. proporción sea un número índice 934 - - (100) = 102.75 (lOO) = 102.75 909.04 Se repite este procedirniento para cada mes. procedimiento continuación, determina proporción porcentaje promedio mes. La A continuación, se determina la proporción de porcentaje promedio para cada mes. La tabla muestra el uso de este método de media modificado. enfoque elimina los valores tabia 8.5 muestra el uso de este método de media rnod?ficado. Este enfoque elimina los valores más alto más alto y más bajo y promedia los Indices restantes. y promedia los índices restantes. 8.5 CÁLCULO MEDIA MODIFICADA TABLA 8.5 CALCULO DE LA MEDIA MODIFICADA PARA ENERO, PARA EL EJEMPLO 8.5 EJEMPLO PARA ENERO, 80.00 83.63 86.85 89.78 89.n 90.67 91.29 83.63 86.85 89.78 90.67 350.93 Eliminar el valor más alto (91.29) alto (91.29) bajo (80.00) y promediar y el más bajo (80.00) y proinediar el resto: 350.93 -'± 4 = 87.73 87.73 350.93 -- ima Por ñltimo, se calculan los Indices estacionales multiplicando cada una de las proporciones último, índices estacionales promedio por un valor de modo que la suma de los 12 Indices merLsuaies sea igual exactamente valor de modo que la suma de los 12 índices mensuales exactamente prornedio el de los promedios antes a 1 200. Debido a que ci muitiplicador debe ser mayor que 1 si ci total de los promedios antes el multiplicador del ajuste del ajuste es menor que 1,200, y menor que 1 si el total es mayor que 1,200, se define al 1,200, Y menor que 1 el total es mayor que 1,200, se define al multiplicador como Multiplicador Multiplicador = 1,200 Total real Total (8.7) 342 de tiempo Análisis de series de tiempo Capítulo 8 Cap Itulo RESUMEN DE LOS INDICES ESTACIONALES MENSUALES PARA EL íNDICES ESTACIONALES MENSUALES PARA EL RESUMEN 8.6 TABLA 8.6 EJEMPLO EJEMPLO 8.6 MEDIA DEL DEL íNDICE INDICE MEDIA ESTACIONAL MENSUAL AJUSTADO *1.002311 MODIFICADA 87.73 85.31 98.75 100.59 104.89 114.77 103.88 103.72 113.12 111.47 100.67 87.04 96.76 -1197.23 87.9 85.6385.5 9'J.0 99.0 100.8 105.1 115.0 104.1 104.1 104.0 104.0 113.4 113.4 100.9 100.9 87.2 97.0 MES 1986 1987 1987 1988 1989 1990 1991 1992 90.67 86.76 98.34 102.96 102.Y6 103.24 124.92 Enero Febrero Marzo Abril Mayo Junio Junjo Julio Agosto Septiembre Octubre Noviembre Diciembre 91.29 76.66 95.55 104.79 97.80 102.75 102.75 99.55 128.96 128.96 106.55 106.55 81.19 102.51 113.82 106.72 106.60 111.48 95.39 83.58 97.45 89.78 94.04 106.80 99.16 102.59 113.42 102.02 104.75 109.86 95.06 90.02 105.73 86.85 85.86 99.07 100.20 105.73 105.73 115.21 115.21 102.29 109.46 119.69 100.96 84.98 89.01 80.00 85.63 102.04 100.03 100.03 109.71 114.08 103.75 103.99 111.47 104.97 97.10 94.86 83.63 82.98 95.15 96.95 107.98 115.99 110.81 102.02 98.95 108.06 109.86 101.38 89.55 92.23 95.06 -- 1200.0 La tabla 8.6 muestra los cálculos para los datos de resgistro de automóviles nuevos. El La tabla 8.6 muestra los cálculos para los datos de resgistro de autornóviles nuevos. El multiplicador es --- = = 1200 1200 1197.23 1.002311 1.002311 La iiltirna columna de Ia tabla 8.6 lista los valores de los indices estacionales calculados los valores de los índices estacionales calculados La última colunina de la tabla ajuste (multiplicando 1.002311). Una revisión para cada mes, determinados niediante el ajuste (niultiplicando por 1.002311). Una revision mes, detenninados mediante de estos valores muestra que el pico estacional en el número de registro de automóviles nuevos que el niimero de registro de automóviles nuevos baja estacional los meses de enero y ocurre en los prirneros meses del verano y la baja estacional ocurre en los meses de enero y primeros meses del verano ocurre febrero. El clima papel importante la explicación del patrón estacional de esta febrero. El clima juega un papel importante en la explicación del patron estacional de esta variable. El registro de automóviles nuevos tiende a subir en los meses de buen clirna como automóviles nuevos tiende los meses de buen clima como variable. El registro febrero. y y a bajar en los meses de clima malo como junio y julio y a bajar en los meses de clirna malo corno enero y febrero. Los resultados del análisis de vanación estacional se pueden emplear para (1) Los resultados del análisis de variaclOn estacional se pueden emplear para (1) programar la producción, (2) desestacionalizar las ventas, (3) evaluar las ventas actuales, ventas actuales, prograrnar la producción, (2) desestacionalizar las ventas, (3) la producción y los embarques y/o, (4) pronosticar ventas mensuales. producción y los embarques yb, (4) pronosticar ventas mensuales. Tendencia estacional Ten dencia estacional Una vez identificado el componente estacional, el siguiente paso consiste en calcular una identificado componente estacional, el siguiente paso consiste Una ecuación de tendencia estacional (ecuaciOn de tendencia mensual o trimestral). La tendencia (ecuación de tendencia mensual o trimestral). La tendencia se definió anteriorrnente en este capItulo como el crecimiento o declinación de largo plazo anterionnente capítulo como el crecimiento plazo Variación estacional VariaciOn 343 histórica. esta razón, tendencia serie mensual o trimestral debe de una serie histórica. Por esta razón, la tendencia de una serie mensual o trimestral debe congruente con crecimiento o declinación de largo plazo. puede calcular la ser congruente con su crecimiento o declinación de largo plazo. Se puede calcular la estacionales de los enfoques siguientes: tendencia de datos estacionales utilizando alguno de los enfoques siguientes: 1. Si no hay datos disponibles de largo plazo, la tendencia estacional debe calcularse a datos disponibles largo plazo, la tendencia estacional debe calcularse a Si partir de los datos estacionales. 2. Si la tendencia de los datos estacionales parece similar a! crecimiento de largo plazo la tendencia de los datos estacionales parece similar al crecimiento de largo plazo mediante la descrito mediante Ia ecuación de tendencia de largo plazo, se puede calcular la tendencia puede estacional a partir de los datos estacionales. partir de los datos estacionales. 3. Si hay disponibles datos mensuales o trimestrales para Ia serie anual completa, se puede o trimestrales para la se puede calcular Ia ecuación de tendencia estacional utilizando todos estos valores. la estacional utilizando todos valores. 4. Si ya se calculô Ia ecuación de tendencia de largo plazo, se puede convertir matemáticalculó la de largo plazo, se puede convertir matemáticarnente camente a una ecuación de tendencia estacional con los datos estacionales disponibles. Ej emplo Ejemplo 8.7 La figura 8.2 muestra la ecuación de tendencia de largo pla.zo para el registro de automóviles muestra la ecuación de tendencia de largo plazo registro de automóviles nuevos de pasajeros de 1960 a 1992. El enfoque más simple para desarroilar una ecuación de 1992. simple desarrollar una ecuación de tendencia estacional consiste en utilizar el procedimiento de mínimos cuadrados sobre los datos el minimos mensuales de 1986 a 1992. Esta es una solución razonable si la ecuación de tendencia mensual 1992. Ésta los resultante refleja con precisión el patrón de crecimiento de largo plazo. De acuerdo con los resultante refleja con precision el patron de crecimiento de largo plazo. De acuerdo datos datos de la figura 8.2, la pendiente de una ecuación de tendencia mensual desarrollada a partir de los datos mensuales de 1986 a 1992, serja negativa. Debido a que Ia dirección de la tendencia 1986 1992, sería la la de largo plazo ya fue establecida como positiva, dicha ecuación tendrá que convertirse para su como positiva, dicha ecuación tendrá que convertirse para su uso con los datos estacionales. Este proceso de conversión se demuestra en el Apéndice A. estacionales. Este proceso de conversion se demuestra en uso Los datos mensuales de esta serie, medidos en miles, se presentan en Ia primera columna miles, la del cuadro 8.7 y se emplean como Ia variable Y. Si se usaran los datos reales para desarrollar Y emplean la Y. Si Sc usaran los datos reales para desanollar dcl TABLA 8.7 8.7 CALCULOS CALCULOS PARA LOS COMPONENTES DE CORTO PLAZO COMPONENTES CORTO PLAZO DATOS REGRESIÓN T AJUSTE EST. TCl TCI REGRESION CI Cl C PERIODO y Y 1986 19R6 Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre 913.00 R22.00 822.00 848.00 R4R.00 906.00 918.00 1012.00 934.00 X94.00 894.00 1149.00 948.00 719.00 902.00 811.09 X11.09 811.53 811.97 X11.97 812.42 812.X6 813.30 X13.74 814.18 R14.18 814.63 815.07 R15.07 R15.51 815.51 815.95 I03R.25 1038.25 961.34 856.75 R56.75 898.64 X9R.64 873.22 879.69 897.08 859.95 1013.35 1013.35 939.49 824.20 930.01 128.01 12R.01 118.46 105.51 110.61 107.43 107.43 108.16 110.24 105.62 124.39 115.27 115.27 101.07 113.98 113.9R 114.00 114(X) 110.04 108.39 108.41 10R.41 111.17 112.74 111.32 112.06 113.23 107.56 92.55 100.53 99.11 99.77 99.16 93.69 111.75 102.86 X9.26 89.26 105.96 (continua) (continúa) 344 TABLA 8.7 8.7 (continuación) (continuación) DATOS Análisis de series de tiempo Capítulo 8 CapItulo 8 PERIODO 1987 y Y REGRESION REGRESIÓN T AJUSTE EST. TCI CI C I Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre 1988 800.00 671.00 829.00 895.00 830.00 963.00 899.00 903.00 955.00 819.00 718.00 840.00 774.00 810.00 919.00 852.00 883.00 981.00 883.00 901.00 937.00 807.00 764.00 896.00 816.40 816.84 817.28 817.72 818.16 818.60 819.05 819.49 819.93 820.37 820.82 821.26 821.70 822.14 822.58 823.03 823.47 823.91 824.35 824.79 825.23 825.68 826.12 826.56 827.00 827.45 827.89 828.33 828.77 829.21 829.66 830.10 830.54 830.98 831.42 831.86 832.31 832.75 833.19 833.63 834.08 834.52 909.75 784.74 837.55 887.73 789.51 837.10 863.46 868.61 842.26 811.65 823.05 866.09 880.18 947.30 928.48 845.08 839.92 852.75 848.09 866.68 826.38 799.76 875.78 923.83 833.56 844.39 841.59 836.15 841.83 825.80 797.19 846.48 843.14 792.82 765.74 715.55 703.92 768.37 780.97 744.90 783.80 745.83 111.44 96.07 102.48 108.56 96.50 102.26 105.42 105.99 102.72 98.94 100.27 105.46 107.12 115.22 112.87 102.68 102.00 103.50 103.50 102.88 105.08 100.14 96.86 106.01 111.77 100.79 102.05 101.66 100.94 101.58 99.59 96.09 101.97 101.52 95.41 92.10 86.02 105.01 106.61 103.01 101.17 103.04 103.04 103.75 102.58 103.07 102.67 102.68 102.90 105.40 105.40 106.12 90.20 99.49 107.30 93.65 98.57 102.77 102.84 100.05 96.36 97.45 100.05 99.01 106.03 104.53 95.73 97.34 100.26 100.16 103.33 97.99 93.16 102.81 107.99 Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre 1989 108.19 108.67 107.98 107.26 104.79 103.23 102.72 101.69 102.19 103.97 103.11 103.50 104.45 103.44 101.40 101.16 99.97 100.03 100.15 98.91 97.42 95.40 91.92 90.07 Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre 1990 733.00 722.00 833.00 843.00 885.00 950.00 830.00 880.00 956.00 800.00 668.00 694.00 619.00 657.00 773.00 751.00 824.00 858.00 96.49 98.65 100.25 99.78 101.61 99.55 95.94 103.09 104.21 100.00 100.00 100.19 100.19 95.50 94.25 103.45 103.25 97.40 103.03 98.91 (continúa) (continUa) Enero Febrero Marzo Abril Mayo Junio 84.57 92.27 93.73 89.36 93.97 89.37 89.74 89.19 90.78 91.74 91.21 90.36 Variación estacional VariaciOn 8.7 TABLA 8.7 (continuación) (continuaciOn) DATOS REGRESiÓN REGRESION T 834.96 835.40 835.84 836.29 836.73 837.17 837.61 838.05 838.49 838.94 839.38 839.82 840.26 840.71 841.15 841.59 842.03 842.47 345 PERIODO Julio Agosto Septiembre Octubre Noviembre Diciembre 1991 1991 Enero Febrero Marzo Abril Mayo Junio Jumo Julio Agosto Septiembre Octubre Noviembre Diciembre 1992 Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre 1993 Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre y Y AJUSTE EST. EST. TCI 748.20 747.41 727.60 762.10 808.15 808.15 704.21 681.18 690.01 675.90 669.52 707.71 688.46 725.15 649.29 649.99 685.79 699.25 647.50 CI 89.61 C 779.00 777.00 825.00 769.00 705.00 683.00 599.00 590.00 669.00 675.00 744.00 792.00 755.00 675.00 737.00 692.00 610.00 628.00 89.47 87.05 91.13 96.58 84.12 89.89 89.33 90.77 89.67 88.04 87.10 84.99 81.64 81.68 81.81 82.60 81.93 81.42 80.85 81.07 79.18 80.43 81.34 80.97 80.65 80.86 81.38 82.14 80.11 78.64 78.08 76.91 75.32 99.68 100.16 95.90 101.63 109.70 96.58 95.68 100.85 98.69 97.55 102.07 100.06 106.00 95.52 95.32 102.92 103.24 94.49 103.14 101.45 98.47 100.05 94.87 107.46 108.90 88.97 96.32 99.74 81.32 82.33 80.61 79.81 84.31 81.98 86.30 77.23 77.27 81.49 83.04 76.86 83.51 81.82 79.62 81.42 77.93 86.09 85.65 69.47 74.08 75.13 80.22 77.71 619.00 590.00 665.00 693.00 692.00 837.00 754.00 611.00 711.00 642.00 593.00 639.00 842.91 843.36 843.80 844.24 844.58 845.13 845.57 846.01 846.45 846.89 847.34 847.78 848.22 848.66 849.10 849.54 849.99 850.43 850.87 851.31 851.76 852.20 852.64 853.08 703.92 690.01 671.86 687.37 658.24 727.57 724.19 587.73 627.06 636.24 679.76 658.84 periodo Pronóstico tendencia = 810.649 Pronóstico de tendencia = 810.649 + .442 * periodo X 346 Análisis de series de tiempo Capítulo 8 Cap Itulo la ecuación de tendencia, los meses representarlan a la variable independiente (X) con enero tendencia, representarían independiente (X) con enero de 1986 como 1, febrero de 1986 como 2 y asI sucesivamente. Entonces, se usaría la ecuación 1, 1986 así sucesivamente. Entonces, usarla Ia ecuación 8.5 para calcular la ecuación de tendencia estacional. calcular la ecuación de tendencia estacional. 8.5 Para este ejemplo, la ecuación de tendencia de largo plazo se convirtió en una ecuación ejemplo, largo se convirtió en una ecuación A): estacional (véase ci Apéndice A): el estacional y = 810.649 .4422X Y = 8 10.649 + .4422X Utilizando la ecuación estacional, la tendencia estimada para diciembre de 1985 (cuando X = Utilizando Ia ecuación estacional, la tendencia estimada para diciembre de 1985 (cuando X = O) 810 649. El incremento promedio por mes es de aproximadamente 442 registros. 0) es 810 649. El incremento promedio por mes es de aproximadamente 442 registros. la segunda columna la tabla 8.7 se muestran los valores de tendencia resultantes En la segunda columna de la tabla 8.7 se muestran los valores de tendencia resultantes mediante esta ecuación. Nótese que tendencia estimada para enero 1986 es 811,091 mediante esta ecuación. Nótese que la tendencia estimada para enero de 1986 es 811,091 también el incremento cada mes es de aproximada(810,649 + 442). Nótese tanibién que ci incremento promedio de cada mes es de aproximadaregistros. mente 442 registros. ESTACIONAL DATOS AJUSTADOS EN FORMA ESTACIONAL En cada ejempiar del Survey of Current Business aparece un gran nürnero de indicadores ejemplar del Survey aparece gran número de indicadores económicos. Muchos de estos indicadores contienen datos ajustados en forma econórnicos. Muchos de estos indicadores contienen datos ajustados en forma estacional para que los usuarios del índice aprecien los patrones que son independientes de las para que los usuarios del indice aprecien los patrones que son independientes de las variaciones estacionales. La eiiminación de las variaciones estacionales ayuda variaciones estacionales. La eliminación de las variaciones estacionales ayuda a clarificar las fuerzas o debilidades básicas de los datos. Por ejemplo, los registros de automóviles datos. Por ejemplo, los registros de automóviles las fuerzas debilidades básicas nuevos pudieran incrementarseen un 10% de noviembre a diciembre, pero ¿es este nuevos pudieran incrementarse en un 10% de noviembre a diciembre, pero ,es este incremento una indicación de que las ventas de automóviles están terminando un trimestre indicación ventas de automóviles están tenninando un trimestre incremento sobresaliente? Se puede responder esta pregunta con más precisión si se conocen las conocen las sobresaliente? Se puede responder esta pregunta con más precision si fluctuaciones en los registros de autornóviles nuevos. La tabla 8.6 indica que un incremento automóviles nuevos. La tabia 8.6 fluctuaciones que un incrernento es típico entre noviembre y diciembre. Quizás un ajuste del incremento estacional mostraría tipico diciembre. Quizás un ajuste del incremento estacional mostrarla que todo el incremento se debe a factores estacionales. incremento debe a factores estacionales. valores serie histórica entre sus índices Si se dividen los valores mensuales originales de una serie histórica entre sus Indices estacionales correspondientes se dice que estacionales correspondientes se dice que los datos resultantes están desestacionalizados o desestacionalizados ajustados a ia variación estacional. Corno los valores resultantes aán incluyen movimientos la estacional. Como resultantes aún incluyen movimientos de tendencia cIclicos e irregulares, el proceso de desestacionalización de datos puede proceso de desestacionalización de datos puede de tendencia cíclicos irregulares, como representarse corno y = TSC/ Y=TSCI y TSC/ Y TSCI TC/ = - = - S S S S (8.2) (8.8) TCI== Resultan datos ajustados en forma estacional cuando los valores originales de Resultan datos forina cuando los valores una serie histórica, mensuales o trimestrales, se dividen entre sus indices una serie histórica, mensuales o trimestrales, se dividen entre sus índices estacionales correspondientes. cíclica Variaciones de corto plazo cIclica e irregular 347 Ejemplo Ej emplo 8.8 S.S La tabla 8.7 lista los datos ajustados en forma estacional para los registros de automóviles tabla 8.7 lista los datos ajustados en fonna estacional para los registros de automóviles nuevos, asi como diversos cálculos de corto plazo que abordarán más adelante nuevos, así como diversos cálculos de corto plazo que se abordarán más adelante en este capítulo. Estos valores calcularon dividiendo los valores reales mensuales de la tabla capitulo. Estos valores se calcularon dividiendo los valores reales mensuales de la tabla 8.7 entre los Indices estacionales de la tabla 8.6 y multiplicando el resultado por 100. Debido a entre índices estacionales de Ia tabla 8.6 multiplicando el resultado por 100. Debido componente estacional, el nümero de registros para junio de que se elimina el efecto del componente estacional, el número de registros para junio de cada año, registros, no marcadamente más alto que el mes de febrero, que es un año, un mes de altos registros, no es marcadarnente más alto que el mes de febrero, que es un los datos ajustados fonna estacional la tabla 8.7 mes registros. ahí mes de bajos registros. De ahI que en los datos ajustados en forma estacional de la tabla 8.7 componente estacional, aunque aán se incluyan los efectos de se haya eliminado el efecto del componente estacional, aunque aún se incluyan los efectos de tendencia, cíclico ajustados en fonna estacional (TC!) los componentes de tendencia, cIclico e irregular. Los datos ajustados en forma estacional (TCI) se muestran en Ia tabla 8.7. la Un ejemplo de cálculo para enero de 1986 es 1986 y = 913 V= s = .879 S = .879 Y = TSCI Y TSC/ 8.6) (tabla 8.6) - = TC/ =TCJ S S 913 y Y .879 = 1038.68 1038.68 la cómputo de la tiene un valor ligeramente distinto debido Nótese que Ia salida de cómputo de Ia tabla 8.7 tiene un valor ligeramente distinto debido de redondeo. al error de redondeo. VARIACIONES DE CORTO PLAZO CICLICA E IRREGULAR DE CORTO PLAZO CíCLICA E IRREGULAR Ahora se pueden calcular las variaciones cIclica e irregular, para el análisis de corto plazo. cíclica e irregular, pam Como los datos se ajustaron en forma estacional, ajustaron en fonna estacional, Corno los - - = TCI =TCI S TSC/ TSCI dividen estos valores desestacionalizados entre los valores de tendencia mensual se dividen estos valores desestacionalizados entre los valores de tendencia mensual correspondientes: - = =cI C/ T Los valores CI se muestran en la columna 4 de Ia tabla 8.7. Por ejemplo, para enero de columna la tabla 8.7. Por ejemplo, Los valores Cl muestran 1986, TC/ TCI 348 Análisis de series de tie mpo series de tiempo Capítulo 8 Cap Itulo y = 913 Y=913 s .879 S = .879 T = 811.09 T = 811.09 (tabla 8.6) (tabla8.6) (tabla8.7) (tabla 8.7) TSCI 913 TSC! TC! = - - = 1038.68 = 1038.68 TCI= S .879 s TC! TCI 1038.68 C! = = (lOO) = 128.06 (100) 128.06 T 811.09 T - 811.09 Después de ajustar los datos para las influencias estacional y de tendencia, se analizan estacional las variaciones cíclicas irregulares. desarrolla promedio móvil para atenuar las las variaciones ciclicas e irregulares. Se desarrolla un promedio móvil para atenuar las irregularidades. El proceso de cálculo ilustra en el ejemplo 8.9. irregularidades. El proceso de cálculo es simple y se ilustra en el ejemplo 8.9. Ejemplo Ej emplo 8.9 La tabla 8.8 presenta los cálculos para un promedio móvil de cinco meses para la columna Cl promedio móvil de cinco meses para la columna CI la 8.7. Nótese haberse empleado un promedio móvil de 7, 9 11 meses, de Ia tabla 8.7. Nótese que pudo haberse empleado un promedio móvil de 7, 9 u 11 meses, las variaciones aleatorias. para atenuar las variaciones aleatorias. promedios móviles de cinco meses se incluyen en Ia columna 5 (con encabezado C) Los promedios móviles de cinco meses se incluyen en la columna 5 (con encabezado C) sólo cíclico de la tabla 8.7 y, presumiblemente reflejan solo el efecto del componente cIclico de corto plazo. Cuando se compara la columna ciclico (C) de la tabla 8.7 con la columna cIclicoinegular Cuando se compara la columna cíclico (C) de la tabla 8.7 con la columna cíclico-irregular (el), parece que el promedio móvil de cinco meses ha atenuado las irregularidades de (CI), parece que el promedio mOvil de cinco meses ha atenuado las irregularidades de la el. El componente ciclico (columna C) columna CI. El componente cíclico (columna e ) se eleva y cae de manera atenuada y el ciclo es más fácil de identificar. más fácil de identificar. Como se muestra Como se muestra en la tabla 8.7, el mndice cíclico comienza en marzo de 1986 con un la tabla 8.7, el índice ciclico comienza en marzo de valor alto (114), indicando buena temporada en Ia economla para ventas de automóviles. Esta indicando temporada en la economía para ventas de automóviles. Esta buena temporada continua hasta finales de 1989, buena temporada continúa hasta finales de 1989, en que una recesión económica parece que una recesión económica parece deprimir las ventas de automóviles nuevos. Como se muestra en el resto de la columna e, esta deprimir las ventas de autornóviles nuevos. Como se muestra en el resto de la columna C, esta mala temporada continúa hasta octubre de 1992, en que C alcanza un punto bajo de 75.32. C alcanza un punto bajo de 75.32. mala temporada continia hasta octubre de 1992, Este índice cíclico de corto plazo se equipara al componente cIclico de largo plazo analizado equipara al componente cíclico Este indice ciclico largo plazo analizado en la figura 8.6. TABLA 8.8 PROCEDIMIENTO DE CALCULO DEL CÁLCULO DEL PROMEDIO MOVIL MESES PARA LOS DATOS PROMEDIO MÓVIL DE 5 MESES PARA LOS DATOS DEL CUADRO 8.7. 8.7. PERlaDO PERIODO (1982) Enero Febrero Marzo Abril Mayo Junio Julio CI el TOTAL MOVIL MÓVIL 5 MESES DE 5 MESES e C 128.01 118.46 118.46 105.51 110.61 107.43 108.16 110.24 570.02 550.17 541.95 114.00 110.03 108.39 Pronóstico PronOstico estacional 349 último, 8.9 Por ültimo, la identificación del componente irregular se desarrolla en la ecuación 8.9 mediante división la tabla 8.7 entre la columna C y multiplicando mediante la division de la columna CI de Ia tabla 8.7 entre la columna C y multiplicando el resultado por 100. 100. lI =- CI C (lOO) (100) (8.9) El componente irregular mide la variabilidad de las series de tiempo después de eliEl componente irregular mide la variabilidad de las series de tiempo después de eliminar los otros componentes. La mayor parte del componente irregular está hecho de componente irregular está hecho de minar los otros componentes. La mayor parte variabilidad aleatoria. Sin embargo, en ocasiones sucesos impredecibles causan irregulariSin embargo, en ocasiones sucesos impredecibles causan irregularidades en una variable. variable. dades Ejemplo 8.10 La última columna de tabla 8.7 (1) muestra La ñltirna columna de la tabla 8.7 (1) niuestra los Indices irregulares para los registros de índices irregulares para registros automóviles nuevos de pasajeros. Estos valores se calcularon dividiendo los indices cIclico autornóviles nuevos de pasajeros. Estos valores se calcularon dividiendo los índices cíclico irregular de la columna 4 entre los indices cIclicos de la columna 5 y multiplicando el resultado índices cíclicos colunma por 100. El indice irregular para marzo de 1986 es índice marzo 1986 l I CI el = - (100) e ~ 105.51 114 (100) 92.55 (100) = 92.55 veces, las variaciones irregulares explicarse. revisión A veces, las variaciones irregulares en una serie histórica pueden explicarse. Una revision de la columna irregular de la tabla 8.7 muestra que las irregularidades se presentaron en septiembre Ia columna Ia tabla 8.7 muestra que las irregularidades se presentaron 1986. irregularidades por problemas (111.75) y noviembre (89.26) de 1986. Estas irregularidades fueron provocadas por problemas de salarios y huelgas en la industria automotriz. y huelgas en la industria automotriz. razón para descomponer serie histórica consiste aislar y examinar los comUna razón pam descomponer una serie histórica consiste en aislar y examinar los cornponentes de la serie. Después de que el analista puede observar uno a la vez los componentes Ia los de tendencia, estacional, cíclico e irregular de una serie estacional, se pudieran ganar serie estacional, pudieran ganar de tendencia, estacional, cIclico e irregular de revelaciones en los patrones de los valores de los datos originales. Además de esta ganancia valores de los datos originales. Además de esta ganancia en conocimiento del proceso de descomposición, la identificación de componentes indiviconocimiento descomposición, identificación componentes individuales hace mucho más fácil el pronóstico a futuro de la serie. fácil la serie. duales hace PRONÓSTICO ESTACIONAL PRONÔSTICO ESTACIONAL Al pronosticar una serie histórica estacional, se invierte el proceso de descomposición. En Al histórica estacional, se invierte el proceso de descomposición. En vez de separar la serie en componentes para su examen, los componentes se recombinan de separar la serie en componentes para su examen, los componentes se recombinan pronósticos de periodos futuros. Para desarrollar pronósticos, para desarrollar los pronOsticos de periodos futuros. Para desarrollar estos pronósticos, se emplea el modelo multiplicativo Y = TSCI. modelo multiplicativo Y = TSCf. 350 Análisis de series de tiempo Capítulo 8 CapItulo 8 Ejemplo Ej emplo 8.11 pronóstico de corto plazo 1993 de los registros de automóviles El pronóstico de corto plazo para enero de 1993 de los registros de automóviles nuevos de pasajeros se desarrolla utilizando las tablas 8.6 y 8.7. pasajeros utilizando las tablas l. Tendencia. Las estimaciones mensuales de la ecuación de tendencia se muestran en tendencia se muestran en Las estimaciones niensuales de tabla 8.7. El valor de la tendencia para enero de 1983 se calculó de la siguiente manera: la tabla 8.7. El valor de la tendencia para enero de 1983 se calculó de la siguiente manera: como enero de 1986 está representado por como enero de 1986 está representado por XX==1, enero de 1993 10 está por X == 85 Y la 1, enero de 1993 lo está por X 85 y la proyección de Ia tendencia es 947.49 y = 810.649 + .4422X .4422X Y= = + .4422(85) = 810.649 + .4422(85) = 848.23 848.23 2. Estacional. En la tabla 8.6 se encuentra que el8.6 se encuentra que el Indice estacional ajustado En Ia tabla índice estacional ajustado para el mes de enero es de 87.9. 87.9. de CIclico. El 3. Cíclico. El analista predice el Indice cIclico utilizando toda Ia información reunida el índice cíclico utilizando toda la información reunida sobre el patron cIclico. El analista debe responder las siguientes preguntas: ¿Para los últimos sobre el patrón cíclico. El analista debe responder las siguientes preguntas: ,Para los ñltimos 1992, el patrón cíclico que se muestra en la tabla 8.7 fue ascendente descendente? meses de 1992, el patron ciclico que se muestra en la tabla 8.7 fue ascendente oodescendente? ¿Se identificó algún indicador conducente? ¿Cuáles el pronóstico econOmico para 1993? Para 1993? Para Se idcntificó algün indicador conducente? Cuál es el pronóstico económico llevar a término Ia demostración de este ejemplo, se utiliza un indice cIclico de 83. la demostración de este ejemplo, utiliza índice cíclico llevar 4. Irregular. Puesto que las fluctuaciones inegulares son variaciones aleatorias, es Puesto que las fluctuaciones irregulares son variaciones aleatorias, es común utilizar una estimación del 100% o 1.0. El pronóstico para enero de 1993 es comán una estimación del 100% o 1.0. El pronóstico para enero de 1993 es Y(enero de 1993) = TSCI Y(enero de 1993) = = (848.23) (.879) (.83) (1.0) = 618.84 = 618.84 El nOmero real de registros de automóviles nuevos de pasajeros para enero de 1993 fue de El número real de registros de automóviles nuevos de pasajeros para enero de 1993 fue de El pronóstico subestimó los registros 639 000. El pronOstico subestimó los registros en 20,160. = el = 639,000 -- 618.840 = 20,160 639,000 618.840 = En la práctica real, la irnportancia de los componentes individuales detennina su uso en el la importancia individuales determina su uso pronóstico de corto plazo. Si una variable es estacional en extremo, el análisis de variación plazo. estacional proporciona al proceso de pronóstico un insumo importante si no estacional proporciona al proceso de pronóstico un insumo importante si no es que total. Si se descubre un indicador conducente del cual se depende, el pronóstico pudiera basarse conducente del cual se depende, el pronóstico pudiera basarse en él por completo. De ahí que si un componente domina el análisis, pudiera en él por completo. De ahj que si un componente domina el análisis, pudiera sí solo, un proporcionar, por si solo, Un pronóstico práctico y preciso. EL MÉTODO DE DESCOMPOSICIÓN CENSUS " DESCOMPOSICIÔN CENSUS II EL METODO década de 1920, el National Bureau of Economic Research (Departamento En la década de 1920, el National Bureau of Economic Research (Departamento Nacional Investigación Económica), de Investigaciôn EconOmica), desarrolló un método que se utiliza comúnmente para el ajuste comünmente para estacional la descomposición histórica. Shiskin estacional y la descomposición de una serie histórica. Se considera a Julius Shiskin como el que contribuyó principalmente en el desarrollo de este enfoque. El método Census II se contribuyó método Census 11 se el departamento de censos y otras agencias gubernamentales ha empleado ampliamente por el departamento de censos y otras agencias gubernamentales Aplicación a Paadministración AplicaciOn la administración 351 y se utiliza cada vez más en el mundo de los negocios. Para una explicación detallada de el mundo los negocios. explicación detallada de este enfoque, deberá consultarse el Bureau of Census Technical Paper No. 15, "The X-1 1 enfoque, consultarse el X-11 Technical No. Variant of the Census Method II Seasonal Adjustment Program". 11 Seasonal Program". La variación X-111 del enfoque Census 11 consta de cuatro fases. La primera fase variación X-1 del enfoque Census II consta de cuatro fases. La primera fase los datos de la serie histórica mensual a las variaciones por día comercial. pretende ajustar los datos de la serie histórica mensual a las variaciones por dIa comercial. Estos ajustes son necesarios debido a que el námero de dias laborables o comerciales varia número días comerciales varía Estos ajustes de un alSo a otro, para un mes dado. En los sectores como el de ventas al menudeo, este año a otro, para un mes dado. sectores como ventas al menudeo, este factor puede afectar las ventas mensuales en forma significativa para un mes dado, de un un factor puede afectar las ventas mensuales en forma significativa para un mes año alSo a otro. estimaciones preliminares de La segunda fase del sistema X-11 comprende las estimaciones preliminares de La segunda fase del sistema X1 I comprende factores estacionales y el ajuste de Ia serie a la estacionalidad. En esta fase se realiza una estacionalidad. realiza una factores estacionales y el ajuste de la tendencia/ciclo después estacionalidad, separación previa de la estacionalidad, de los factores tendencialciclo y se intenta después aislar la aleatoriedad. la aleatoriedad. En la tercera fase se afina el ajuste para proporcionar factores estacionales más En tercera fase se afina el ajuste para proporcionar factores estacionales más precisos. Esta fase comprende también estimación los componentes tendencia, precisos. Esta fase comprende también la estimación de los componentes de tendencia, cíclico irregular. cIclico e irregular. última fase se generan estadísticas de resumen, que el En la ültirna fase se generan estadIsticas de resurnen, que el analista puede emdetenninar exitosamente aisló método los factores estacionales, así plear para deterrninar qué tan exitosarnente aisló el método los factores estacionales, asI como desarrollar estimaciones futuras de tendencia/ciclo en los datos, fines de como para desarrollar estimaciones futuras de tendencia/ciclo en los datos, para fines de pronóstico. Las pruebas en esta fase pronóstico. Las pruebas en esta fase se basan en consideraciones intuitivas y no son basan en consideraciones intuitivas y son estadísticas en el sentido maternático riguroso. Para una descripción más detallada del una descripción más detallada del estadIsticas en sentido matemático riguroso. la Methods and Applications método Census II, método Census 11, se remite al lector a Ia obra Forecasting: Methods and Applications de Makridakis, Wheelwright y McGee. McGee. APLICACIÓN A LA ADMINISTRACIÓN APLICACION ADMINISTRACION años recientes, la En afios recientes, el análisis de series de tiempo ha ido a Ia vanguardia de las herramientas estadIsticas para uso en pronósticos de sucesos futuros que están, en alguna forma, estadísticas para uso pronósticos de sucesos futuros que están, en alguna forma, entrelazados economía. fabricantes extremo interesados en los ciclos entrelazados con la economIa. Los fabricantes están en extremo interesados en los ciclos altibajos de la propia economía así como de las economías extranjeras modo que de altibajos de Ia propia economIa asI corno de las economIas extranjeras de modo que puedan predecir mejor la demanda de sus productos, que a su puedan predecir mejor la demanda de sus productos, que a su vez impacta sus niveles de inventarios, requerimientos de personal, flujos de efectivo y casi todas las demás actividades la empresa. de negocios dentro de la empresa. el problema La complejidad de estos problemas es enorme. Tómese, por ejemplo, el problema enorme. Tómese, La complejidad de la década 1960, el de predecir Ia demanda de petróleo y sus derivados. Al final de Ia década de 1960, el la demanda de petróleo y derivados. Al final de precio por barril de petróleo era muy bajo, y parecla haber una demanda mundial precio por barril de petróleo era muy bajo, y parecía haber una demanda mundial insaciable de gasolina petróleo. Luego vino una conmoción en el precio insaciable de gasolina y petróleo. Luego vino una conmoción en el precio del petróleo al principio y mediados de la década de 1970. ¿Cual sería la demanda futura del al principio mediados de la década de 1970. ,CuaI serla demanda futura del petróleo? ¿cuáles los precios? Empresas como Exxon y General Motors estuvieron cuáles los precios? Empresas como Exxon y General Motors estuvieron continuaban obviamente muy interesadas en estas preguntas. Si los precios del petróleo continuaban obviamente muy interesadas en estas preguntas. Si la escalada en forma logarItmica ¿disminuiría la demanda de autornóviles grandes? automóviles grandes? la escalada en fonna logarítmica disminuirIa la demanda ¿Cuál serIa la demanda de electricidad? En términos generales, los analistas pronostielectricidad? términos generales, los analistas pronostiCuál sería la demanda de energía y entre ésta la del petróleo, no sería nada elástica; así, caron que la demanda de energIa y entre ésta la del petrOleo, no serla nada elástica; asI, los precios continuarlan sobrepasando a la inflación. Sin embargo, estos pronósticos no los precios continuarían sobrepasando Ia inflación. Sin embargo, tomaron en cuenta un gran giro hacia abajo en el ciclo de negocios principios de tomaron en cuenta un gran giro hacia abajo en el ciclo de los negocios a principios de 352 Análisis de series de tiempo Capítulo 8 Cap Itulo 8 la década de 1980 y la mayor elasticidad de demanda de energIa por el consumidor, que la 1980 demanda de energía consumidor, que la pronosticada. Para 1980, el mundo comenzó a pronosticada. Para 1980, el mundo comenzó a ver que el mercado se inundaba de petróleo mercado de petróleo con una caIda radical en los precios. Parecía dificil creer que los consumidores se estuvieran ParecIa dificil que los caída beneficiando la guerra de precios de la gasolina. beneficiando de hecho una vez más con la guerra de precios de la gasolina. ve afectada no sólo La demanda de petróleo se ye afectada no sOlo por los sucesos cíclicos de largo plazo los sucesos cIclicos de largo plazo sino también los sucesos estacionales aleatorios, al igual la mayoría de otros sino también por los sucesos estacionales y aleatorios, al igual que la mayorIa de otros servicio. ejemplo, considere pronósticos de demanda para cualquier tipo de producto o servicio. Por ejemplo, considere industrias servicios menudeo. Todos los pronosticadores futuristas las industrias de servicios y menudeo. Todos los pronosticadores de negocios y futuristas encuentran prediciendo en los próximos 25 años veremos movimiento se encuentran prediciendo que en los próximos 25 años veremos un movimiento gradual las manufacturas servicios. De ahí que del empleo de las manufacturas hacia los campos del menudeo y los servicios. De ahi que es un negocio en extremo estacional cíclico, como las proyecciocomo el menudeo es un negocio en extremo estacional yycIclico, yycomo las proyeccioinventarios críticas nes de inventarios son criticas para los detallistas, se usará más ampliamente el análisis de series históricas por parte de un niunero creciente de detallistas sofisticados. La supervinúmero creciente de detallistas sofisticados. superviseries históricas por parte seremos vencia durante los periodos de gran cambio en la competencia de los que serernos testigos competidor. está más dependerá en ser más sofisticado que el propio competidor. Una indicación de que ya está un mayor interés en utilizar herramientas estadísticas sofisticadas es el auge ocurriendo un mayor interés en utilizar herrarnientas estadIsticas más sofisticadas es el auge en el mercado de las mini y microcomputadoras en el campo del menudeo. También hay el mercado de las mini y microcomputadoras campo menudeo. auge en la demanda de paquetes estadísticos cómputo. un auge en Ia demanda de paquetes estadisticos de cómputo. Los fabricantes tendrán una continua necesidad de proyecciones estadIsticas de continua necesidad de proyecciones estadísticas de Los fabricantes tendrán sucesos futuros. ¿Cuál será la tasa de inflaciOn?¿Cómo afectará ésta los ajustes en el costo inflación? Cómo afectará sucesos futuros. ,Cuál de vida que pudieran incluirse en el contrato laboral de una compaflIa?¿Cómo afectarán pudieran incluirse en el contrato laboral de una compañía? Córno afectarán de estos ajustes a los precios y la demanda? ¿Cuál es el grupo de habilidades administrativas precios demanda? Cuá1 es el grupo de habilidades administrativas estos ajustes para estrategias caída del gasto y proyectado para 1990? ¿Cuál será el efecto de las estrategias de auge y caIda del gasto y j,CuáI será el efecto de los impuestos? Una de las principales preguntas que afecta a casi todos los segmentos de Ia economIa afecta a casi todos los segmentos de la economía es: ,Cuál será la población futura de jóvenes? Los demOgrafos observan de cerca la tasa tasa es: ¿Cuál será la población futura de jóvenes? Los demógrafos observan de actual de fertilidad y utilizan casi cualquier técnica de pronóstico de series de tiempo cualquier técnica pronóstico series de tiempo actual de fertilidad utilizan disponible para intentar proyectar esta variable. Errores de cálculo muy pequeflos tendrIan de cálculo muy pequeños tendrían grandes impactos en todo, fablicación la validez del grandes impactos en todo, desde la fabricación de juguetes para bebés hasta la validez del los demógrafos están financiamiento del sistema de Seguro Social. Es interesante notar que los demógrafos están muy largo plazo (20 intento observando ciclos de negocios de muy largo plazo (20 años o más por ciclo), en un intento por predecir qué es lo que hará la población de esta generación de mujeres en edad de predecir qué 10 que hará la población de esta generación mujeres en edad de procrear, con respecto a tener hijos. ¿Tendrán uno o dos hijos, como las familias de las respecto tener hijos. Tendrán uno o dos hijos, como familias las procrear, décadas de 1960 y 1970, o volverán a tener dos o tres como las generaciones anteriores? volverán o tres como las generaciones anteriores? 1960 y 1970, detenninarán Ia composiciOn de edades de Ia población en próximos Estas decisiones deterrninarán la composición de edades de la población en los próximos 50 a 75 años. a 75 Los cientIlicos políticos están interesados en el uso del análisis de series de tiempo Los científicos politicos están interesados en el uso del análisis de series de tiempo patrones de cambio gasto del gobierno en defensa y programas para estudiar los patrones de cambio del gasto del gobierno en defensa y prograrnas social. tendencias tienen impacto futuro de de bienestar social. Es obvio que estas tendencias tienen un gran impacto en el futuro de industrias completas. Por último, en el campo legal ha aparecido un interesante microcosmos de aplicaciolegal aparecido un interesante microcosmos de aplicacioñltimo, análisis series históricas. Los abogados están haciendo un uso cada vez mayor nes del análisis de series históricas. Los abogados están haciendo un uso cada vez mayor persona de testigos expertos para testificar sobre el valor presente del ingreso futuro de una persona empresa, el costo incurrido la pérdida de un empleo debido discriminación, o el o empresa, ci costo incurrido por la pérdida de un empleo debido aa discrirninación, o el efecto sobre el mercado efecto sobre ci mercado de una huelga ilegal. Con frecuencia, estas cuestiones pueden una huelga ilegal. Con frecuencia, estas cuestiones pueden a través del uso juicioso del análisis de series históricas. responderse mejor a través del uso juicioso del análisis de series histOricas. Capítulo 8 Capitulo Problemas 353 GLOSARIO el se expresan Deflación de precios. La deflación de precios es el proceso mediante ci cual se expresan términos de una serie en dólares constantes. serie en dólares constantes. términos empresariales. Los indicadores empresariales son series de tiempo relacioIndicadores empresariales. Los indicadores empresariales son series de tiempo relacionadas con los negocios, que se usan para ayudar a evaluar el estado general de la nadas con los negocios, que se usan para ayudar a evaluar el estado general de economía. economla. Números Índice. Nümeros Indice. tiempo. Los números índice son porcentajes que muestran cambios a través del nürneros Indice son porcentajes que muestran cambios FÓRMULAS CLAVE FORMULAS CLAVE Serie histórica: datos anuales Serie histórica: y= TC Y = TC y = TSCI Y = TSCI (8.1) Serie histórica: datos mensuales o trimestrales mensuales de compra actual de $1 Poder de compra actual de $1 (8.2) 100 actual de precios Indice actual de precios (8.3) (8.4) (8.4) Valor deflactado del dólar Ecuación de tendencia (Valor del dólar) x (Poder de compra de $1) (Valor del dólar) x Y= Y ba + bX b0 + bX (8.5) (8.5) CI = - = CI = T = T Componente cIclicoirregular cíclico-irregular Multiplicador y Y TCI (8.6) (8.7) 1,200 Total real y Y TSCI Datos ajustados en forma estacional TCI = - = - = - = S S S Componente Componente irregular CI l = (100) (8.8) (8.9) = C PROBLEMAS 1. ¿Cuál es la finalidad de deflactar una serle histórica que está medida en dólares? deflactar seríe medida en dólares? ,Cuál es 2. En el periodo base dejunio de 1994, ci precio de una cierta cantidad de bienes fue de $1 289.73. de junio de 1994, el precio de una cierta cantidad de bienes fue de $1 289.73. rnás recientes, ci precio indice para estos bienes fue 284.7. Cuál sería el costo de En los meses más recientes, el precio índice para estos bienes fue 284.7. ¿Cuál serIa el costo de si se compraran en el último mes? dichos bienes si se compraran en ci iiiltirno mes? 3. Deflacte los siguientes volúmenes de ventas en dólares utilizando los índices de precios de las Deflacte los siguientes volümenes de ventas en dólares utilizando los Indices de precios de las mercancías muestran. índices mercancías 1982 = 100. mercanclas que se muestran. Estos Indices son para todas las mercanclas con 1982 = 100. 354 Análisis de series de tiempo Capítulo 8 Cap Itulo VENTAS VOLUMEN DE VENTAS (EN DOLARES) (EN DÓLARES) 1993 Enero Febrero Marzo Ablil Abril Mayo Junjo Junio Julio 358,235 297,485 360,321 378,904 394,472 312,589 401,345 INDICE DE PRECIOS ÍNDICE DE PRECIOS DE MERCANCÍA (1982 = 100) MERCANCIA (1982 118.0 IIXA 118.4 118.7 IIX.7 119.2 119.7 119.6 119.3 Fuente: Survey 01 Current Business. Business. Fuente: Survey of 4. Explique el concepto de descomposición de una serie histórica. Explique el concepto de descomposición de una serie histórica. ,Cuáles 5. ¿Cuáles son los componentes que se analizan en la descomposición de una serie histórica anual? la descomposición una serie histórica anual? ¿Y de una mensual o trimestral? trimestral? ,Y 6. ¿Cuáles son las fuerzas básicas que afectan Ia tendencia secular de la mayorIa de las variables? fuerzas básicas que afectan la tendencia secular de la mayoría de las variables? Cuáles modelo tendencia debería de los siguientes casos? 7. ¿Qué clase de modelo de tendencia deberIa utilizarse en cada uno de los siguientes casos? Qué La variable se incrementa en uria tasa constante. se incrementa en una tasa constante. b. La variable se incrementa en una tasa constante hasta que alcanza la saturación y se nivela. incrementa en uia tasa constante hasta que alcanza saturación se nivela. cantidad c. La variable se incrementa en una cantidad constante. la mayoría variables? 8. ¿Cuál es Ia fuerza básica que afecta el componente cIclico en Ia mayorIa de las variables? afecta el componente cíclico Cuál la fuerza 3. 9. Describa cada una de estas series, establecidas por el departamento de comercio de EUA: series Describa cada una de estas series, establecidas departamento de comercio de EUA: series conducentes, series coincidentes, series retrasadas. coincidentes, series retrasadas. estacional mayoría 10. ¿Cuál es Ia fuerza básica que afecta el componente estacional en la mayorIa de las variables? ,Cuál es la fuerza básica ll. Las estimaciones del servicio Value 11. Las estirnaciones del servicio Value Line de las ventas y el crecimiento de ingresos de compañías ingresos de compañIas individuales se derivan mediante correlación con las ventas, ingresos y dividendos de los derivan mediante correlación con las ventas, ingresos dividendos de los individuales se componentes correspondientes de componentes correspondientes de las Cuentas Nacionales de Ingreso como gasto de capital. Un gasto de capital. Un analista de Value Line, Jason Black, está revisando la tendencia en Ia variable gasto de capital Value Line, revisando tendencia en la variable gasto de capital analista entre 1977 y 1993. Los datos son los siguientes: 1993. Los datos son los siguientes: GASTO DE CAPITAL (MILES DE MILLONES $), 1977-1992 GASTO DE CAPITAL (MILES DE MILLONES $), 1977-1992 AÑO ANO 1977 1978 1979 1980 1981 1982 1983 1984 1985 (MILES DE DE $) MILLONES $) 214 259 303 323 369 367 357 416 443 ANO AÑO 19X6 1986 1987 19X7 1988 198X 1989 1989 1990 1990 1991 1991 1992 1993 1994 1994 (MILES (MILES DE MILLONES $) 437 443 545 571 578 57X 556 566 623 680* Fuente: The Vallle Sllrvey Line, Fuente: The Value Line Investment Survey (New York: Value Line, 1988, 1990), p. 175. 175. 1988, 1990), Estimación Line para 1994. * Estirnación de Value Line para 1994. Capítulo 8 CapItulo 8 Problemas Problemas 355 los datos. Grafique los datos. los años Determine el modelo de tendencia apropiado para los años 1977-1993. apropiado Si Si el modelo apropiado es lineal, calcule el modelo de tendencia de Ilnea recta para los apropiado es lineal, calcule línea los años 1977-1993. 1977-1993. d. ¿Cuál es el incremento promedio en el gasto de capital por afio, ocurrido desde 1987? capital por año, ocurrido desde 19871 ,Cuá1 es el incremento promedio en el e. Estime el valor de Ia tendencia para el gasto de capital en 1994. la de capital en 1994. f. Compare su estimación de tendencia con la de Value Line. tendencia con la de Value Line. g. ¿Cuál(es) factor(es) ejerce(n) influencia sobre el gasto de capital? LCuál(es) factor(es) ejerce(n) influencia sobre el gasto de 11. Analice el componente cIclico para la variable gasto de 12. Esta pregunta se refiere al problema 11. Analice el componente cíclico para la variable gasto de capital. a. b. c. a. ¿Afecta la economla a este componente cIclico? Afecta economía a este componente cíclico? b. ¿Qué componente es más importante, el de tendencia o el cIclico? importante, el cíclico? Que c. ¿Cómo pronosticarla para 1994? 1994? Cómo pronosticaría 13. Una gran compañla está considerandorecortar su publicidad en TV en favor de videos 13. Una gran compañía está considerando recortar su publicidad en TV en favor de videos empresariales para repartir a sus clientes. Esta acción está en consideración después de que el consideración que el empresariales para repartir a sus clientes. Esta acción presidente de Ia compañla leyó un artIculo en una revista, referente a los videos como arma de la compañía artículo revista, los videos como arma de ventas. Antes de tomar esta acción, el presidente quisiera investigar la historia de la publicidad tomar esta acción, el presidente historia la publicidad el país, en particular, el efecto cíclico. televisiva en el pals, en particular, el efecto cIclico. A continuación se presentan los totales de dólares gastados, en millones, en la publicidad continuación presentan totales millones, en la publicidad EUA. Calcule los índices cíclicos para esta serie histórica anual. televisiva en EUA. Calcule los Indices ciclicos para esta serie histórica anual. AIO AÑO 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 y Y 11,424 12,811 14,566 16,542 19,670 20,770 22,585 23,904 25,686 26,891 11,432.7 13,222.1 15,011.5 16,800.8 18,590.2 20,379.6 22,169.0 23,958.3 25,747.7 27,537.1 Fuente: Stafislical Abstract of the United Fuente: Statistical 01 United años. States, varios años. bajas del componente cíclico en EUA. Analice los picos y bajas del componente cIclico de la publicidad televisiva en dólares en EUA. Pronostique esta variable para 1990. 1990. Pronostique 14. Suponga que los siguientes Indices estacionales específicos para el mes de marzo se basan en el índices estacionales especificos para el en el proporción de promedio móvil: método de proporción de promedio móvil: 102.2 105.9 114.3 122.4 109.8 98.9 102.2 105.9 114.3 122.4 109.8 98.9 ,Cuá1 es el indice estacional para marzo utilizando el ¿Cuál es el índice estacional para marzo utilizando el método modificado de la media? la media? octubre es de $850. Suponiendo uh índice estacional de 15. El valor esperado de Ia tendencia para octubre es de $850. Suponiendo un Indice estacional de la tendencia 112 112 para el mes de octubre, ¿cuál serla el pronóstico para octubre? mes de octubre, cuál sería pronóstico para octubre? 356 Análisis de series de tiempo Capítulo 8 CapItulo 16. Para el mes de diciembre, están dados los siguientes Indices estacionales especIficos: Para el mes de diciembre, están dados los siguientes índices estacionales específicos: 75.4 86.8 96.9 72.6 80.0 85.4 75.4 86.8 96.9 72.6 80.0 85.4 ajuste es de 1.05 y se emplea el método modificado si la Si el ajuste es de 1.05 y se emplea el método modificado de la media y si Ia tendencia esperada para diciembre es de $900, ¿cuál es el pronóstico para diciembre? diciembre es de $900, ,cuál es el pronóstico para diciembre? 17. Un hotel de veraneo cerca de Portland, Maine, ha estado registrando por varios afios sus ventas Un hotel de veraneo cerca de Portland, Maine, ha estado registrando por varios años ventas mensuales, aunque nunca ha analizado estos datos. El hotel calcula los Indices estacionales para analizado estos datos. índices estacionales mensuales, aunque sus ventas mensuales. j,Cuáles de las siguientes declaraciones sobre el Indice son correctas? ¿Cuáles siguientes declaraciones el índice son correctas? a. La suma de los 12 nümeros indices mensuales debe ser 1,200. los 12 números índices mensuales ser 1,200. b. Un Indice de 85 en mayo indica que las ventas son menores en un 15% del promedio de índice 85 menores 15% mensuales. las ventas mensuales. c. Un Indice de 130 en enero indica que las ventas están 30% por arriba del promedio meníndice ventas promedio men30% ventas. sual de ventas. d. El Indice de cualquier mes debe estar entre cero y 200. índice 200. e. El Indice promedio para cada uno de los 12 meses deberIa ser 100. índice promedio los 12 meses debería ser 100. 18. Al preparar un informe para June Bancock, gerente de Ia Kula Department Store, usted incluye Al preparar un informe para June Bancock, gerente de la Kula Department Store, usted incluye las siguientes estadisticas de las ventas del ültimo año. Al observarlas, la Sra. las siguientes estadísticas de las ventas del último año. Al observarlas, la Sra. Bancock le dice "Este informe confirma lo que Ic he estado diciendo; el negocio está mejorando cada vez más." confirma le he estado diciendo; el negocio está mejorando cada vez más." Es ¿Es precisa esta afirmación? ¿Por qué? afirmación? tPor MES VENTAS (EN DOLARES) DÓLARES) 125 113 113 189 189 ÍNDICE INDICE ESTACIONAL AJUSTADO 51 Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre 201 206 241 230 245 271 291 320 419 50 87 93 95 99 96 89 103 120 131 131 189 189 Fuente: Department Store. Fuente: Registros de Kula Department Store. 19. A continuación se presentan los niveles de ventas trimestrales de Goodyear Tire. ¿Parece haber A continuación niveles de ventas trimestrales de Goodyear Tire. ,Parece haber un efecto estacional significativo en sus niveles de ventas? Analice esta serie histórica para efecto estacional significativo en niveles ventas? Analice esta serie histórica para obtener cuatro indices estacionales y determine el alcance del componente estacional en las obtener cuatro índices estacionales y determine el alcance del componente estacional en las de Goodyear. ventas de Goodyear. Capítulo CapItulo 8 Problemas 357 TRIMESTRE 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1 2 2 3 3 2,363 2,316 2,479 2,656 2,679 2,900 2,838 3,213 2,913 3,100* 4 2,292 2,063 2,268 2,616 2,643 2,692 2,497 2,778 2,874 2,850* 2,450 2,358 2,533 2,793 2,811 2,871 2,792 3,066 3,066 3,000 3,100* 2,477 2,366 2,625 2,746 2,736 2,811 2,780 2,928 2,916 3,050* 2,7 Fuente: The Value Line Investment Survey (New York: Value Line, Value lnvestment Survey (New York: Fuente: 1988,1989,1993,1994), p. 130. 1988, 1989, 1993, 1994), 130. * Estirnación de Value Line para 1994. Estimación de Value 1994. ¿Usaría usted para el pronóstico el componente de tendencia, el estacional, o ambos? estacional, o ambos? çUsaria usted para ci pronóstico b. Pronostique el ültimo trimestre de 1994. último trimestre 1994. c. Compare sus pronósticos con los de Value Line. pronósticos los de Value Line. 20. A continuación se presentan los valores de datos que representan las ventas mensuales de todas continuación representan las ventas mensuales de miles millones las tiendas al menudeo en EUA, en miles de miliones de dólares. Analice esta serie incluyendo comentarios de los cuatro componentes de la misma. Pronostique 1993 y compare sus resultados con los valores reales que aparecen en la tabla. aparecen la tabla. 3. A1O AÑO Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Noviembre Diciembre 1984 1984 93.1 1985 1986 1986 105.6 99.7 114.2 115.7 125.4 120.4 120.7 124.1 124.4 123.8 121.4 152.1 1987 1988 113.6 115.0 131.6 130.9 136.0 137.5 134.1 138.7 131.9 133.8 140.2 171.0 1989 122.5 118.9 141.3 139.8 150.3 149.0 144.6 153.0 144.1 142.3 148.8 176.5 1990 132.6 127.3 148.3 145.0 145.0 154.1 115.0 153.5 148.9 157.4 145.6 151.5 156.1 179.7 1991 130.9 128.6 149.3 148.5 159.8 153.9 154.6 159.9 146.7 152.1 155.6 182.0 1992 1992 142.1 142.1 143.1 154.7 120.4 125.4 159.1 165.8 164.6 166.0 166.3 160.6 168.7 126.9 167.2 204.1 1993 93.7 104.3 103.9 111.8 112.3 106.9 111.2 104.0 109.6 113.5 132.3 98.8 95.6 110.2 113.1 120.3 115.0 115.5 121.1 113.8 115.8 118.1 138.6 106.4 105.8 120.4 125.4 129.1 129.0 129.3 131.5 124.5 128.3 126.9 157.2 148.5 115.0 145.3 164.6 170.2 176.0 175.6 176.7 131.9 139.8 157.4 151.5 148.8 171.0 Fuente: Survey o/Current Business, 1989, 1993. 1989, 1993. Fuente: Survey of Current 21. Los Indices ajustados de manera estacional que se presentan en el siguiente cuadro, reflejan el índices ajustados estacional el siguiente cuadro, reflejan el el volumen del negocio del Mí. Spokane Resort Hotel, que proporciona servicios al cambio en ci volumen del negocio del Mt. Spokane Resort Hotel, que proporciona servicios a! turismo familiar en ci verano y ci entusiasmo por el esqul en nieve durante los meses de invierno. el el esquí los meses de invierno. No se esperan variaciones ciclicas agudas durante 1994. esperan variaciones cíclicas agudas durante 1994. 358 358 Análisis de series de tiempo Análisis de series de tie mpo Capítulo 8 Cap Itulo MES íNDICE INDICE ESTACIONAL AJUSTADO 120 137 MES Julio Agosto Septiembre Septiembre Octubre Noviembre Diciembre INDICE íNDICE ESTACIONAL AJTJSTADO AJUSTADO Enero Febrero Marzo Abril Mayo Junio 153 151 95 100 33 47 125 60 82 97 Mt. Spokane Resort Hotel. Fuente: Registros de Mt. Spokane Resort Hotel. a. Si en enero de 1994 hubieron 600 turistas en el hotel, ,cuá1 es la estimación razonable para enero de 1994 hubieron hotel, ¿cuál estimación razonable para febrero? b. La ecuación de tendencia mensual es Y = 140 + 5X, en donde X = 0 representa el 15 de ecuación tendencia mensual Y 140 + 5X, X O representa el 15 de cada mes de 1994? enero de 1988. ¿Cuál es el pronóstico para cada mes de 1994? enero de 1988. ,Cuál es el pronóstico c. ¿Cuál es el número promedio de nuevos turistas por mes? ,Cuá1 es el nümero promedio de nuevos turistas Seleccione un indicador conducente de la lista corta del NBER. 22. Seleccione un indicador conducente de la lista corta del NBER. a. Explique por qué este indicador conduce el ciclo de los negocios en los puntos crIticos. este indicador ciclo de los negocios en los puntos críticos. empresarial como barómetro de la b. Exponga Ia importancia de este indicador como barómetro de Ia actividad empresarial en la importancia de los ñltimos aflos. últimos años. Cuál la posición actual ciclo de los negocios? ¿Se está expandiendo o contrayendo? 23. ¿Cuál es la posición actual del ciclo de los negocios? ,Se está expandiendo o contrayendo? siguiente punto crítico? ¿Cuándo ocurrirá el siguiente punto crItico? ,Cuándo CASO DE ESTUDIO 8.1 THE SMALL ENGINE DOCTOR THE SMALL ENGINE Small Engine Doctor" (el doctor de motores pequeños), es el nombre de un negocio desarrollado por "The Small Engine Doctor" (el doctor de motores pequeflos), es el nombre de un negocio desarrollado por Thomas Brown. Tom Brown era cartero del Servicio Postal de EUA. Desde su infancia siempre se interesó Brown. Tom Brown era cartero del Servicio Postal de EUA. Desde su infancia siempre se interesó Capítulo 8 CapItulo Caso de estudio 359 359 en las reparaciones, desarmando viejos aparatos domésticos con el propósito de comprender "qué los los domésticos ci típico equipo diverso hacía sonar". Al crecer y convertirse en un tIpico habitante de los suburbios, adquirió equipo diverso hacIa sonar". de jardinería y para podar pasto. Cuando encontró que una escuela de la comunidad local ofrecIa un comunidad local ofrecía jardinerla curso sobre reparación de motores pequeños, aprovechó la oportunidad. Tom comenzó la reparación curso reparación motores pequeños, aprovechó la oportunidad. Tom comenzó la reparación de motores pequefios desmantelando su propio equipo, dándole mantenimiento y ensamblándolo de pequeños desmantelando su propio equipo, de nuevo. Poco después de terminar el curso, comenzó a reparar, para sus amigos y vecinos, segadoras, rotocultivadoras, máquinas para retirar nieve rotocultivadoras, máquinas para retirar nieve y otros equipos dejardinería. En el proceso, adquirió varios dejardinerla. En y herramientas especiales. manuales de equipo y herramientas especiales. pasó un negocio de No paso mucho tiempo antes de que Tom decidiera convertir su afición en un negocio de tiempo parcial. Colocô un anuncio en una circular de una tienda local bajo el nombre de "The Small Colocó un en circular últimos años, ci negocio creció lo para proporcionar Engine Doctor". Durante los dos ültimos años, el negocio creció lo suficiente para proporcionar salario regular. Aunque el crecimiento fue bienvenido, antes de un agradable complemento a su salario regular. Aunque el crecimiento fue bienvenido, antes de había cierto número de dudas. El negocio se encontraba entrar en su tercer año de funcionamiento, habia cierto nümero de dudas. El negocio se encontraba y una oficina. La política de Tom en la casa de Tom. El sótano se dividió en una estancia, un taller y una oficina. La polItica de Tom es la de tener en existencia sólo un número limitado de refacciones, ordenando las que se requirieran en existencia solo nOmero limitado de refacciones, ordenando las que se requirieran según fuera necesario. Esta parecIa ser la única forma de poder manejar la variedad segün fuera necesario. Ésta parecía ser la iinica forma de poder manejar la gran variedad de refacciones que podían requerirse para reparar motores de una docena o más fabricantes refacciones que podIan requerirse para reparar motores de una docena o más de fabricantes de jardinería. equipo de jardineria. Las refacciones probaron ser el problema más grave del negocio. Tom comenzó comprándolas refacciones probaron el probiema más grave del negocio. comenzO comprandolas tenía desventajas. Primero, tenia en las distribuidoras de equipo. Esta práctica tenla varias desventajas. Primero, tenía que pagar una comisión por las refacciones y, segundo, la mayoria de las veces ci distribuidor tenla comisiOn por las refacciones y, segundo, la mayoría de las veces el distribuidor tenía que ordenar a su vez una o más refacciones para una determinada reparaciOn. Las partes solicitadas al fabricante tenían reparación. Las partes solicitadas al fabricante tenlan tiempos de entrega de entre 30 y 120 djas. Como resultado, Tom modificO su política y comenzó a 30 y 120 días. Como resultado, Tom modificó su polItica y comenzó tiempos ordenar las refacciones directamente a Ia fábrica. Se encontró con que los cargos por manejo y envIo la fãbrica. manejo y envío se comían sus utilidades, aún cuando el precio era de solo ci 60% del precio al menudeo. Sin embargo, conhlan sus utilidades, an cuando el precio era de sólo el ventas perdidas y espacio de almacenalos dos problemas mayores que generaban las refacciones eran ventas perdidas y espacio de almacenamiento. Tom atrajo clientes por Ia calidad de su servicio y sus precios razonables, que posiblemente se dela razonables, bIan a sus bajos costos. desgracia, muchos clientes potenciales preferian ir a los distribuidores bían a sus bajos costos. Por desgracia, muchos clientes potenciales preferían ir a los distribuidores de equipo en vez de esperar varios meses para Ia reparación. El problema de mayor presiOn era ci espaesperar varios meses para la El problema de mayor presión era el espacio de almacenamiento. Mientras que una pieza del equipo estaba esperando a que liegaran las almacenamiento. Mientras que una pieza del equipo estaba esperando a que llegaran las cio tenía que almacenarlo en para que tanto su taller como refacciones, tenia que almacenarlo en sus instalaciones. No tardó mucho para que tanto su taller como automóvii lienaran de refacciones. Dc su cochera para un automóvil se llenaran con equipo en espera de refacciones. De hecho, en el segundo Tom suspendió la publicidad como táctica para limitar clientes debido su falta año de funcionamiento, Tom suspendió la publicidad como táctica para limitar clientes debido aasu falta de espacio. Para su tercer año de funcionamiento, Tom Brown consideró ampliar las existencias de inventario. de funcionarniento, Tom Brown consideró ampliar existencias reduciría costos de compra haciendo posible obtener descuentos por volumen y Esta práctica reducirla sus costos de compra haciendo posible obtener descuentos por volumen y términos de embarque más favorables. También esperaba que le diera un mejor tiempo de respuesta a que le diera un mejor tiempo de respuesta favorables. También sus clientes, mejorando tanto ci flujo de efectivo como las ventas. Los riesgos de esta estrategia son el el flujo estrategia son el costo de tener un inventario no controlado y Ia obsolescencia de las refacciones. controlado la Antes de comprorneterse a 51 mismo en el mayor inventario de refacciones, Tom desea tener un Tom desea tener un de comprometerse a sí mismo en el mayor pronóstico confiable de la actividad de los negocios en ci prOximo año. Confia lo suficiente en su pronOsticoconfiable de la actividad de los negocios en el próximo año. Confia lo suficiente en su conocimiento de mezcla conocimiento de la rnezcla del producto para agregar un pronóstico de órdenes de reparación de clientes pronOstico de órdenes de reparación de clientes como una base para hacer pedidos selectivos de refacciones. El pronóstico es complicado debido a los pronOstico es complicado debido a los patrones de demanda estacional y a una tendencia al incremento en las ventas. Tom planea desarrollar un pronóstico de ventas para su tercer año de funcionamiento. A Tom planea desarrollar un pronóstico de ventas para tercer año de funcionamiento. A continuación se presenta una historia de ventas para los dos primeros años. años. continuaciOn se 360 MES Enero Febrero Marzo Abril Mayo Junio Análisis de series de tiempo 1992 5 5 8 10 1993 21 Capítulo 8 Cap Itulo MES Julio Agosto Septiembre Octubre Noviembre Diciembre 1992 1992 1993 46 32 27 13 13 11 11 52 18 26 35 20 29 32 44 58 28 20 14 8 8 6 6 26 PREGUNTAS 1. Grafique los datos en un horizonte de dos aIios, de 1992 a 1993. Conecte los puntos de datos horizonte años, de 1992 1993. datos Grafique los datos para hacer un diagrama de dispersion. diagrama de dispersión. 2. Desarrolle una ecuación de tendencia lineal mediante regresión lineal y grafique los resultados. de tendencia lineal mediante regresión lineal y grafique los resultados. 3. Estime los factores de ajuste estacional para cada mes, dividiendo la demanda promedio para factores estacional mes, dividiendo demanda promedio Estime correspondientes entre pronósticos lineal corresponlos meses correspondientes entre el promedio de los pronósticos de tendencia lineal correspondientes. tendencia lineal ajustada de manera estacional. dientes. Grafique una tendencia lineal ajustada de manera estacional. 4.· Calcule un pronóstico de tendencia ajustada en forma exponencial, utilizando los valores Calcule pronóstico de tendencia ajustada en forma exponencial, utilizando los valores ajustados constantes (a = .1, fl= .1) a= .25,6= .25) Y a= .5,13= .5). Grafique cada ajustadosconstantes dede (a =.1,13= .1) ( (a= .25,13=.25) y (( a= .5, fl= .5). Grafique cada de los pronósticos. Extrapole los pronósticos final del tercer año. uno de los pronósticos. Extrapole los pronOsticos exponenciales hasta el final del tercer año. 5. Calcule los valores de la DAM para los dos modelos que en forma visual parezcan dar los Calcule los valores de la DAM para los dos modelos que en forma visual parezcan dar los más precisos. pronósticos más precisos. 6. Identifique cuál modelo usaría como base para su planeaciOndel negocio en 1994 y exponga Identifique cuál modelo usaria como base para su planeación del negocio en 1994 y exponga por qué seleccionO ese modelo entre los otros. qué seleccionó ese otros. CASO DE ESTUDIO 8.2 8.2 TUX MR. TUX John Mosby se ha estado anticipando a la descomposición de su serie histórica mensual de ventas en anticipando a descomposición de su serie histórica mensual de ventas en dólares. El sabe que su serie tiene un fuerte efecto estacional y le gustarla medirlo por dos razones. dOlares. Él sabe que su serie tiene un fuerte efecto estacional y le gustaría medirlo por dos razones. La primera, su banco está renuente de permitirle realizar pagos mensuales variables sobre su préstamo. renuente de permitirle realizar pagos mensuales variables sobre su préstamo. primera, John ha explicado que, debido a la estacionalidad de sus ventas y flujo mensual de efectivo, le gustaría y flujo mensual de efectivo, le gustarla hacer pagos adicionales en algunos meses y, reducir incluso a cero, los pagos en los otros meses. El adicionales en algunos meses y, reducir incluso a cero, los pagos en los otros meses. El banco desea ver alguna verificaciOn de la afirmaciOn de John de que sus ventas tienen un fuerte efecto desea ver alguna verificación afirmación de John estacional. La segunda razón es que John desea poder pronosticar sus ventas mensuales. Requiere de estos pronósticos para fines planeación, especial debido crecimiento su negocio. Tanto los pronósticos para fines de planeación, en especial debido al crecimiento de su negocio. Tanto los banqueros como quienes arriesgan capital desean ciertos pronósticos sólidos sobre los cuales basar sus inversión. decisiones de inversion. John sabe que su negocio está mejorando y que los prospectos futuros lucen lucen requieren documentación al respecto. brillantes, pero los inversionistas requieren documentación al respecto. Capítulo 8 Cap Itulo Caso de estudio 361 Las ventas mensuales de Mr. Tux se capturan en un programa de cómputo que realiza descomMI. de de la salida posición de series de tiempo. Los Indices estacionales se muestran en la tabla 8.9. El resto de la salida índices de cómputo aparece en la tabla 8.10. A John no Ic sorprende ver los Indices estacionales que se muestran en la salida, aunque le 10hn no le sorprende ver los índices estacionales muestran la salida, aunque le nümeros mostrar al banco. Después de revisar estas cifras con complace tener algunos números sin procesar para mostrar al banco. Después de revisar estas cifras con el banco, se acuerda que 1000 hará pagos dobles en abril, mayo, junio yy agosto y que no hará ningn banco, se acuerda que John hará pagos dobles en abril, mayo, junio agosto y que no hará ningún copia de los su préstamo en enero, febrero, pago sobre su préstamo en enero, febrero, noviembre y diciembre. El banco le pide una copia de los índices estacionales para mostrar a las autoridades superiores y para el archivo del préstamo de John. 1000. Indices autoridades superiores y el Con respecto al pronóstico para 1993, John comienza a notar la proyección de valores de tendencia la proyección valores de tendencia Con respecto pronóstico para 1993,1000 programa. Como muestra, él pidió el cálculo de 12 valores de tendenque pidió cuando ejecutó el programa. Como se muestra, él pidió el cálculo de 12 valores de tendenlos datos en diciembre 1992. 1000 cia después del final de los datos en diciembre de 1992. John decide hacer pronósticos para los seis índices meses siguientes, hasta junio de 1993, utilizando estas proyecciones de tendencia junto con los Indices hastajunio de 1993, proyecciones de tendenciajunto dichos estacionales mensuales para dichos meses. John Wall y viendo con regularidad en la televisión los 10hn ha estado leyendo el Wall Street Journal y viendo con regularidad en la television los estado leyendo financieras. De modo que una idea la la economía programas de noticias financieras. De modo que tiene una idea de Ia naturaleza general de Ia economia curso futuro. Además, de servicio y su curso futuro. Además, pertenece a un club de servicio empresarial que con frecuencia presenta cómputo, pláticas de expertos en economIa. Al estudiar la columna e en su salida de cómputo, que muestra el economía. Al estudiar Ia columna C en de historial cíclico de la serie, él piensa en cómo pronosticar este valor para los primeros seis meses de cIclico 1993. Puesto que los pronósticos de los expertos nacionales y locales indican una ligera mejoría en los 1993. Puesto que los de los expertos nacionales y locales indican una ligera mejorla en los TABLA 8.9 8.9 RESUMEN DE LOS INDICES ESTACIONALES MENSUALES PARA EL CASO DE ESTUDIO 8.2 RESUMEN DE LOS íNDICES ESTACIONALES MENSUALES PARA EL CASO DE ESTUDIO 8.2 MES Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre 1986 1987 28.56 56.04 44.07 171.06 171.06 320.43 107.95 61.06 138.19 138.19 87.18 81.47 42.57 66.76 1988 32.74 41.18 55.32 225.31 206.36 107.50 99.16 123.43 98.54 102.05 56.21 69.42 1989 1990 1991 1992 MEDIA MENSUAL 1988 MODIFICADA MObIFICADA MEDIA DEL INDICE íNDICE ESTACIONAL .......Á.mSTADO AJUSTADO 1990 1.030298 15.21 18.49 50.16 86.94 37.59 42.10 25.39 37.74 65.06 181.96 181.96 213.53 117.80 112.93 112.93 121.95 121.95 94.36 73.24 72.59 80.94 32.50 50.27 128.21 159.63 151.76 130.78 87.83 125.73 104.73 76.24 64.17 86.71 30.03 25.39 30.85 30.48 40.42 65.76 41.18 46.98 106.78 106.78 107.48 83.66 168.87 173.29 173.29 173.79 155.42 206.36 164.96 185.06 111.77 117.80 117.08 147.24 100.09 99.16 100.00 127.32 154.80 127.32 82.71 90.70 64.2181.47 79.47 60.69 55.93 79.77 74.22 -1164.71 1200.0 -- 31.4 48.4 86.2 179.1 190.7 164.96 120.6 120.6 103.0 131.2 93.4 82.71 81.9 57.6 76.5 362 Análisis de series de tiempo Capítulo 8 Cap itulo TABLA 8.10 CÁLCULO DE LOS COMPONENTES DE CORTO PLAZO PARA EL CASO DE TABLA 8.10 COMPONENTES CORTO EL CASO DE CALCULO ESTUDIO 8.2 PERIODO PERIODO 1986 1986 DATOS y Y REGRESIÓN REGRESION T I AJUSTE EST. AJTJSTE TCI CI C I Enero Febrero Marzo AbnI Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre 1987 Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre 1988 Enero Febrero Marzo AbnI Abril Mayo Jumo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre 1989 Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre 16850.00 12753.00 26901.00 61494.00 147862.00 147862.00 57990.00 51318.00 53599.00 23038.00 41396.00 19330.00 22707.00 15395.00 30826.00 25589.00 103184.00 197608.00 68600.00 39909.00 91368.00 58781.00 59679.00 33443.00 53719.00 21937.77 24815.35 27676.93 30538.51 33400.09 36261.67 39123.25 41984.83 44846.41 47707.99 50569.57 53431.15 56292.73 59154.31 62015.89 64877.47 67739.05 70600.63 73462.21 76323.79 79185.37 82046.95 84908.53 87770.11 53651.10 26348.65 31209.57 34342.66 77548.08 48075.48 49807.67 40858.39 24653.47 50556.44 33542.06 29693.33 49018.32 63688.82 29687.53 57625.36 103637.99 56871.49 38734.45 69649.62 62902.84 72885.26 58031.41 70246.88 244.38 106.18 112.76 112.46 232.18 132.58 127.31 97.32 54.97 105.97 66.33 55.57 87.08 107.67 47.87 88.82 153.00 80.55 52.73 91.26 79.44 88.83 68.35 80.04 97.57 81.00 61.60 122.43 105.96 86.96 92.54 88.76 98.77 116.51 92.69 88.52 80.04 78.13 76.03 101.48 101.48 111.32 97.84 109.67 92.58 103.03 93.11 161.5926901.0069.78 139.23 139.23 80.77 161.84 143.46 94.45 140.37 128.87 98.79 39123.25 93.91 53599.00 103.63 103.63 60.82 90.38 139.38 47707.99 76.03 73.98 89.65 53431.15 84.52 65.75 72.90 119.44 77.40 139.10 96.89 25589.00 49.41 95.58 92.93 84.59 180.86 93.27 86.37 57.69 91.39 91368.00 116.16 78.56 104.36 76.12 81.58 108.89 82.50 82.84 96.25 83.15 77.71 88.53 93.71 70600.63 82046.95 27773.00 36653.00 51157.00 217509.00 206229.00 110081.00 102893.00 128857.00 104776.00 111036.00 63701.00 82657.00 31416.00 48341.00 85651.00 242673.00 289554.00 164373.00 160608.00 176096.00 142363.00 114907.00 90631.69 93493.27 96354.85 99215.43 102078.01 104939.59 10780l.l 7 110662.75 113524.33 116385.91 119247.48 122109.07 122109.07 124970.65 127832.23 130693.80 130693.80 133555.39 133555.39 136416.97 136416.97 139278.55 142140.13 145001.70 147863.28 150724.86 88430.38 75727.84 59350.70 121472.64 108159.39 91260.51 99864.77 98227.40 112123.11 135606.95 110536.11 1080~8.32 91.59 93.92 99.35 94.62 96.73 97.88 97.05 95.31 91.18 9l.I8 125.56 125.56 91.50 65.73 133.67 99215.43 112.82 87.53 97.91 107801.17 91.76 100.91 120.06 97.26 97.08 96.34 92.09 85.05 109.16 112.14 95.38 139278.55 106.59 93.28 147863.28 97.81 88.98 (continúa) (con tinza) 100029.84 99876.11 99369.53 135526.03 151860.23 136270.23 155881.17 134237.58 152345.78 140334.56 83.08 84.84 89.40 92.96 99.27 102.58 102.89 102.89 99.24 99.24 105.33 104.64 Capítulo 8 Capitulo 8 Caso de estudio (continuación) (continua dOn) DATOS y Y REGRESIÓN REGRESION T 153586.44 153586.44 156448.02 363 TABLA 8.10 TABLA 8.10 PERIODO AJUSTE EST. EST. TCI 197039.23 166129.38 164309.28 164309.28 166042.16 166042.16 242403.16 147341.61 147341.61 132277.84 182026.91 182026.91 144694.39 163046.34 163046.34 191495.14 163225.16 202928.61 214659.73 CI C 106.75 106.75 106.62 Noviembre Diciembre 1990 Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre 1991 Enero Febrero Marzo Abril Abli1 Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre 1992 Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre 1993 Enero Febrero Marzo Abril Mayo Junio Julio Agosto 113552.00 127042.00 51604.00 80366.00 208938.00 263830.00 252216.00 219566.00 149082.00 149082.00 213888.00 178947.00 178947.00 133650.00 116946.00 164154.00 58843.00 82386.00 224803.00 354301.00 328263.00 313647.00 214561.00 337192.00 183482.00 144618.00 139750.00 139750.00 184546.00 184546.00 128.29 106.19 120.18 99.59 87.87 93.70 141.88 84.49 77.63 118.34 89.06 96.50 110.82 87.38 105.75 114.33 90.48 82.57 131.88 202233.30 93.31 78.24 118.88 95.21 116.72 90.79 219402.78 79.27 112.09 100.58 86.01 121.26 114.40 89.90 87.86 96.64 245157.00 97.05 123.59 83.97 77.98 159309.59 162171.17 165032.75 167894.34 170755.92 173617.50 176479.08 179340.66 182202.23 185063.81 187925.39 190786.97 193648.56 196510.14 199371.72 202233.30 205094.88 207956.45 210818.03 213679.61 216541.19 219402.78 222264.36 225125.94 227987.52 230849.09 233710.67 236572.25 239433.83 242295.41 245157.00 248018.58 250880.16 253741.73 256603.31 259464.89 262326.47 265188.06 268049.63 270911.22 273772.81 276634.38 279495.97 282357.53 103.14 102.39 146.88 87.76 77.47 104.84 81.99 90.91 105.10 88.20 107.98 112.51 117.38 109.27 103.53 103.87 99.79 88.59 92.06 94.21 94.84 100.94 102.11 98.41 106.94 104.91 99.19 104.85 107.28 105.18 103.75 103.06 99.87 101.55 97.34 106.58 187358.56 170215.63 260809.20 197867.11 172161.64 260022.92 208246.30 257040.70 196348.14 176620.25 242498.88 241325.81 241325.81 226203.86 315964.78 290690.47 228731.61 207030.00 226220.88 223525.00 286168.09 290111.50 211915.48 315295.41 338311.97 96.75 86.52 130.82 97.84 83.94 125.04 98.78 120.29 90.67 80.50 109.10 107.20 99.22 136.87 124.38 96.69 86.47 93.37 91.18 115.38 115.38 83.35 83.52 122.87 130.39 71043.00 152930.00 250559.00 409567.00 394747.00 272874.00 230303.00 375402.00 195409.00 173518.00 181702.00 258713.00 115.35 112.87 108.72 107.55 98.41 96.62 93.95 93.36 99.26 107.10 (continúa) (contináa) 364 TABLA 8.10 8.10 Análisis de series de tie mpo series de tiempo (continuación) (continuaciOn) DATOS Y REGRESIÓN REGRESION T Capítulo 8 Cap Itulo PERIODO AmSTE EST. AJUSTE EST. TCI CI C I Septiembre Octubre Noviembre Diciembre 285219.13 288080.72 290942.28 293803.88 PRONOSTICO FINAL = 19092.19 + 2861.579834 * X PERIODO PRONÓSTICO 19092.19 + 2861.579834 * X PERIODO 1993, último e 1992 negocios en 1993, y como el ültimo valor de C en octubre de 1992 ascendió (107.10), decide utilizar los siguientes valores de C para sus pronósticos: e 1992 1993 Noviembre Diciembre Enero Febrero Marzo Abril Mayo Junio 102 103 104 104 105 105 106 107 Con respecto al valor irregular (1) para estos meses, John no prevé ningún suceso inusual, excepto (l) para estos meses, John no prevé ningün suceso inusual, excepto 1993. para marzo de 1993. En ese mes, él planea hacer una promoción con tarifas reducidas en una de sus tarifas reducidas en una de tiendas remodelar. Corno estará tiendas que está terminando de remodelar. Como esta promoción estará respaldada con publicidad en radio y television, espera que las ventas en esa tienda sean 50% más altas de Jo normal. Para sus ventas televisión, espera que las ventas en esa tienda sean 50% más altas de lo sus ventas mensuales globales, piensa que este efecto representará airededor de un 15% más en las ventas totales. alrededor Con las cifras estimadas por John y su salida de cOmputo, él hace los siguientes pronósticos de cómputo, éI hace los siguientes pronósticos de ventas de Mr. Tux para los primeros seis meses de 1993: para los seis meses de 1993: PRONOSTICO DE VENTAS PRONÓSTICO VENTAS Enero Febrero Marzo Abril Mayo Junio 85,665 133,485 279,003 509,462 553,410 356,975 T S C I 262,326.47 = 262,326.47 265,188.06 = 265,188.06 = 268,049.63 268,049.63 = 270,911.22 270,911.22 273,772.81 = 273,772.81 276,634.38 = 276,634.38 (.314) (.484) (.862) (1.791) (1.907) (1.206) (1.04) (1.04) (1.05) (1.05) (1.06) (1.07) (1.0) (1.0) (1.15) (1.0) (1.0) (1.0) John queda perturbado después de estudiar los pronósticos para 1993, al observar un amplio amplio John perturbado después de estudiar los pronósticos para 1993, a! observar margen en las proyecciones de ventas mensuales -de $85,665 a 553,410. Aunque sabe que sus las proyecciones de ventas mensuales de $85,665 a 553,410. Aunque sabe que sus margen en Capítulo 8 Cap itulo Caso de estudio 365 volümenes volúmenes mensuales tienen una variabilidad considerable, le preocupa lo amplio de las fluctuaciones. le preocupa lo amplio de las fluctuaciones. John ha estado pensando en extender su ubicación actual en Spokane al área de Seattle. Recientemente actual en Spokane al area de Seattle. Recientemente descubrió que en Seattle hay diversos eventos "de etiqueta", que son diferentes de su mercado actual eventos etiqueta", que son diferentes de mercado actual en Spokane. Como los eventos se llevan a cabo en el otoño, cuando el mercado de Spokane es menor llevan el otoño, cuando el mercado (véanse los Indices estacionales para octubre y noviembre), percibe la ventaja de nivelar su negocio índices estacionales nivelar su negocio (véanse octubre noviembre), percibe al mercado de Seattle. ingresando al mercado de Seattle. Sin embargo, su verdadera preocupación se enfoca en Sin embargo, su verdadera preocupación se enfoca en sus peores meses, enero y febrero. peores meses, enero y febrero. ha considerando comprar una máquina confección de camisas etiqueta que Recientemente ha estado considerando comprar una máquina de confección de camisas de etiqueta que exhibición, que pudiera concentrarse los meses de vio en una exhibición, pensando en que pudiera concentrarse en esa actividad durante los meses de Si podría invierno. Si recibe una reacción positiva de compradores potenciales de camisas en dicho periodo, podrIa compradores potenciales camisas Como se puede ver, índices estacionales intentarlo. Como se puede ver, los Indices estacionales de su salida de cómputo han enfocado su atención de cómputo enfocado extremos en los extrenios de la oscilación de sus niveles mensuales de ventas. PREGUNTAS PREGUNTA S Suponga que el 1. Suponga que el banco de John pide dos frases que justifiquen Ia solicitud de John para hacer John pide dos frases que justifiquen la solicitud John para hacer pagos extra a su préstamo en algunos meses y ningñn pago en otros. Escriba esas dos frases. su préstamo en algunos meses ningún en otros. Escriba esas dos frases. 2. Suponga que el próxirno año John duplica su negocio en Seattle con respecto a Spokane. negocio Seattle con respecto a Spokane. Suponga que el próximo año John duplica Detern1ine los índices estacionales en Seattle que serian ideales para equilibrar los ingresos Determine los Indices estacionales en Seattle que serían ideales para equilibrar los ingresos mensuales Tux. niensuales de Mr. Tux. 3. Sin contar a Seattle, ,qué volurnen tendrIa John que vender de su máquina de confección de máquina confección Sin contar Seattle, ¿qué volumen tendría John que vender camisas camisas para que los meses de enero y febrero estuvieran en el "promedio"? y febrero "promedio"? CASO DE ESTUDIO 8.3 8.3 CONSUMER CREDIT COUNSELING CRED/T El funcionamiento de Consumer Credit Counseling (CCC) se describió en los capitulos 1 (Caso de (CCC) funcionamiento los capítulos 1 (Caso de 1.2) estudio 3.4). estudio 1.2) y 3 (Caso de estudio 3.4). El director ejecutivo Mary Harnishfeger, Ilegó a Ia conclusión de que Ia variable más importante niás Marv llegó la conclusion la requería número de nuevos clientes por atender en el resto de 1993. Mary que CCC requeria pronosticar era el nñrnero de nuevos clientes por atender en el resto de 1993. Marv proporcionó Dorothy Mercer los datos del nimero proporcionó a Dorothy Mercer los datos del número de clientes atendidos por CCC en el periodo de CCC en periodo enero de 1985 a marzo de 1993 (véase caso de estudio 4.3). 1985 1993 (véase caso de estudio a usted estos datos y le que lleve a cabo análisis de descomposición de la Dorothy le da a usted estos datos y le pide que lieve a cabo un análisis de descomposición de la serie histórica. Ella hace énfasis en que desea comprender por completo los componentes de tendencia, cíclico conocer la desea saber ciclico y estacional. Dorothy desea conocer Ia importancia de cada componente. También desea saber resto de 1993. si aparece alguna irregularidad en los datos. Su instrucción final es que pronostique el resto de 1993. TAREA Escriba un informe que proporcione a Dorothy Ia información solicitada. Al programar el resto de 1993, programar la suponga que el componente ciclico mantendrá Ia misma direcciOn que indican los tres primeros meses. cíclico la dirección que indican los tres primeros meses. 366 Análisis de series de tiempo tiempo Capítulo 8 CapItulo 8 VERSIÓN ESTUDIANTIL DE FORECAST PLUS VERSION ESTUDIANTIL DE FORECAST Para pronosticar el námero de clientes, decidimos utilizar el método de descomposición pronosticar número de clientes, decidimos método de descomposición Census X-II. programa, necesitamos ajustar los tomar en Census X-1 1. Para utilizar este programa, necesitamos ajustar los datos para tomar en ciclos de días comerciales, decir, los días que son comerciales (laborables) cuenta los ciclos de dIas comerciales, es decir, los dIas que son comerciales (laborables) aquellos lo son. Primero, se selecciona el menú de administración de datos contra aquellos que no lo son. Primero, se selecciona el menu de administración de datos (opción I). continuación, ajuste para días comerciales (opción (opcion 1). A continuación, se elige en el programa el ajuste para dias comerciales (opcion programa utiliza por omisión 5 días comerciales por semana días festivos, como 6). Este programa utiliza por omisión 5 dIas comerciales por semana yy99dIa.s festivos, como la sección de la tabla de parámetros. se describe en Ia sección de la tabla de parámetros. Después del ajuste, se accesa el programa de pronóstico mediante la elección de la Después ajuste, accesa el programa de pronóstico mediante la elección de la menú principal. emplean discos (no un sistema de disco duro), el sistema opción 3 del menu principal. Si emplean discos (no un sistema de disco duro), el sistema inserte disco del sistema principal le solicitará que inserte el disco del sistema principal Insert DISK in default drive Insert MAIN SYSTEM DISK in default drive Press <ENTER> when ready Press <ENTER> ready En este punto, usted necesita reemplazar el Data Management Disk por el Main System punto, usted necesita reemplazar Data Management Disk Main System el programa pedirá el nombre del archivo a utilizar Disk. Presione <Enter> y el programa pedirá el nombre del archivo a utilizar What is the name of the data file? of the data file? What is CREDIT El menú le permite elegir entre 13 diferentes técnicas de pronóstico. La pantalla correspon13 corresponEl menii cap. diente se mostró en la sección de Forecast Plus del cap. 5. diente se mostró en Plus X-ll, opción 9. Seleccionamos descomposición Census X-1 1, opción 9. Census X-11 Decomposition Census X-11 Quarterly or monthly labeling [Q/M]: Quarterly or monthly labeling [Q/M] : Starting year: year: Starting month/quarter: of original data series: Table of original data series: seasonal-irregular ratios (by percent): Final seasonal-irregular ratios (by percent): Final seasonal factors (by percent): Final seasonal factors (by percent): Final seasonally adjusted series: series: Final Final trend cycle: cycle: Final Final irregular factors (by percent) : irregular factors (by percent): for cyclical dominance moving average: Months for cyclical dominance moving average: Side by side plot of original data and adjusted data: data and adjusted data: Side by side Side by side plot of irregular, seasonal, and trend: irregular. seasonal. and trend: Side by side Box plot of irregular variation: irregular variation: Box Box plot of seasonal variation: seasonal variation: Box Component by season plot: season plot: to accept: Press ENTER to accept: M M 1985 1 1 N N N N N N N N N N N N N N Y Y Y Y Y Y Y Y Y Y Pronóstico PronOstico mediante hojas de cálculo 367 Pam ejecutar esta descornposición X-1 1, podrIamos usar las opciones por omisión Para ejecutar esta descomposición X-ll, podríamos usar opciones por omisión se incluyen. La figura 8.8. muestra la salida cuando responde Y a factores que ya se incluyen. La figura 8.8. muestra Ia salida cuando se responde Ya los factores estacionales finales y a la graficación de la variación estacional, y N a! resto de las opciones. y a la graficación de la variación estacional, y N al resto de las opciones. Finalmente, el programa preguntará si desea almacenar los pronósticos de residuos Finalmente, el programa preguntará si desea almacenar los pronósticos de residuos Do you want to save the forecasts of residuals (yin)? of residual s (y/n)? Do you want to PRONOSTICO MEDIANTE HOJAS DE CALCULO PRONÓSTICO MEDIANTE HOJAS DE CÁLCULO El Spreadsheet Forecaster es un paquete de herrarnientas que contiene 23 modelos prácticos Forecaster es un paquete de herramientas que contiene 23 modelos prácticos de pronóstico empresarial, listos para su uso. Estos modelos son patrones que funcionan patrones que funcionan de pronóstico empresarial, listos para su uso. Estos modelos surninistra con datos de posterior). Cada modelo se con Lotus 1-2-3 (versión 2.01 con Lotus 1-2-3 (version 2.01 ooposterior). Cada modelo se suministra con datos gráfica preestablecida e instrucciones paso a paso. muestra, una gráfica preestablecida e instrucciones paso a paso. OF CLIENTS NUMBER OF CLIENTS - Xli DECOMPOSITION XlI FINAL SEASONAL FACTORS FINAL YEAR 1985 1985 1986 1987 1988 1989 1990 1991 1992 1993 JAN 117.1 116.7 114.3 113.6 111. o 111.0 110.8 108.8 108.9 108.5 FEB MAR 109.6 111.0 111. o 114.2 116.4 119.2 121. o 121.0 123.2 123.2 123.3 122.6 APR 99.2 99.1 98.7 97.8 95.4 92.9 90.3 89.4 MAY 96.3 130.1 95.7 95.9 128.1 95.5 126.1 JUN JUL 82.8 83.2 83.6 85.1 87.5 91. o 91.0 94.0 95.5 AUG SEP MAY OCT 103.1 103.1 102.9 NOV DEC JUL 130.1 129.6 128.1 126.1 125.6 124.1 123.0 123.0 121.3 121.8 103.9 102.7 101.1 99.4 97.9 94.8 119.2 93.3 96.2 95.1 92.8 95.1 93.1 123.3 89.2 88.5 88.4 89.8 89.6 88.4 89.2 89.4 89.7 94.8 90.8 92.6 90.4 94.2 90.9 92.8 95.1 90.7 98.489.2 82.3 99.489.8 83.2 103.4 100.1 84.1 103.4 100.189.6 103.7 85.4 103.7 100.5 102.5 102.5 100.8 86.5 101 .3 101.3 101 .5 86.9 100.4 101.8 100.4 101.8 86.3 85.7 100.6 101.3 100.6 101.3 95.5 100.5 100.8 101.5 121.8 PROJECTED ONE YEAR AHEAD SEASONAL FACTORS SEASONAL FACTOR S YEAR 1993 1994 JAN 108.3 FEB MAR APR MAY 93.2 JUN 95.1 JUL 96.3 AUG 90.6 SEP OCT NOV DEC 95.5 89.0 122.1 122.3 122.1 122.3 108.3 95.5 100.6 101.0 85.4 85.4 100.6 Figura 8.8 8.8 Census X-II para el caso de estudio 8.3. Census X-1 1 para el caso de estudio 8.3. 368 - Análisis de series de tie mpo de tiempo NUMBER OF CLIENTS - XII DECOMPOSITION Xli BOX PLOT OF SEASONAL VARIATION 82.3 A : _" Capítulo 8 Cap Itulo 100.0 100.0 A - __ - - - - - - - - __ - - _1\- 130. 1 13 o .1 A 1\_: JAN 1- -- - ---1 1 * 1-1 1-- -----1 FEB 1- - - - - --1 I * 1-1 1- - - - - --1 1- -----------1 MAR 1- - -1 1- -- -- -- - -- --1 * I 1- ---- ----1 APR 1- -1 1- - -- -- - --1 1- -1 -1 * 11- -1 * 1 MAY 1- - -- ---1 JUN 1 * / 1- - - - - --1 : 1- -- -- -- -- --1 JUL : -/ 1- - -- --- - ---1 1-1 1*1 1-1 * 1 AUG 1- -----1 SEP 1-- ----1 1 * 1 - 1 1--1 OCT 1 * 1- 1- -1 NOV 1-1 1-1 * 11-1 : 1- --1 DEC :: - I * 1 : 1- --1 --- - - - --- - - - - -- - - - -- - - - - -- - - - -- - - - --- - - - -- - - - - - - - - ---- - - - - - - : * = Midmean * = Figura 8.8 (continuación) 8.8 PronOstico mediante hojas de cálculo Pronóstico mediante de cálculo 369 El problema. En el capItulo 4, ejemplo 4.4, se analizaron los datos de ventas ventas El En capítulo 4, ejemplo 4.4, se analizaron los datos trimestrales (tabla 4.5) de Outboard Marine. Desarrollar un modelo estacional multiplicativo Marine. para estos datos. datos. La solución mediante hoja de cálculo. Coloque el disco de Spreadsheet Forehoia de cálculo. de Spreadsheet ForeLa solución caster en la unidad A. Entre a Lotus 1-2-3. en unidad A. Entre Lotus 1. Pam cargar la hoja de cálculo de Spreadsheet Forecaster que desarrolia modelos l. Para cargar la hoja de cálculo de Spreadsheet Forecaster que desarrolla modelos estacionales multiplicativos, escriba !FILE RETRIEVE o /FR. En la pantalla aparecerá /FILE RETRIEVE /FR. En la pantalla aparecerá el siguiente mensaje solicitando el nombre del archivo Name of file to retrieve: of file to retrieve: A:\ línea verá el nombre de la hoja de cálculo que desea emplear. Presione En la tercera ilnea vera ci nombre de la hoja de cálcuio que desea emplear. Presione <Enter> después de seflalar MULTIQTR.WKl. La figura 8.9 presenta los datos de <Enter> después de señalar MULTIQTR.WKI. La figura 8.9 presenta los datos muestra en una hoja de muestra. muestra. 2. Coloque el indicador de ceida en la celda B3 y escriba OUTBOARD MARINE SALES. Coloque indicador celda B3 y escriba OUTBOARD Coloque el indicador en la celda B5 y escriba DOLLARS. 3. Ubique el indicador en la celda B9 y escriba 1984. Nótese que el resto de los años Ubique el indicador en Ia ceida B9 y escriba 1984. Nótese que el resto de los años cambian de manera autornática. automática. B2: [W4] "MULTIPLICATIVE SEASONAL ADJUSTMENT [W4] "MULTIPLICATIVE SEASONAL ADJUSTMENT MENU Worksheet Range Copy Move File Print Graph Data System Add-In Quit Copy Insert Global Insert Delete Column Erase Titles Column Window Status Page Learn D A B D E F B E F I K C G H 1 C G J J 1 MULTIPLICATIVE SEASONAL ADJUSTMENT, QUARTERLY DATA SEASONAL ADJUSTMENT. QUARTERLY DATA 1 2 TITLE1: 2 TITLE1: MULTIPLICATIVE SEASONAL ADJUSTMENT SEASONAL ADJUSTM~NT TITLE2: GAS GRILL SALES 3 TITLE2: GAS GRILL SALES 3 X-AXIS: 4 X-AXIS: QUARTER 4 Y-AXIS: UNITS 5 Y-AXIS: UNITS 5 6 6 7 7 Sum of Actual Actual Moving 11 of Avg. Seas. # of Adj. Year Qtr Per Per Avg. Ratio ratios ratios ratio index Year Ratio ratios ratios 8 data 8 data 1978 1 0.0 1. 62 9 1978 1 1.62 9 1 201 0.00 2 0.808 0.807 1 2 249.2 10 2 2 253 0.00 1. 83 2 0.913 0.912 10 2 2 0.0 1.83 2 277 .5 277.5 11 1. 24 11 1.24 4.16 3 3 312 250.8 3 1.385 3 3 3 1.383 225.7 252.8 4 4 12 4 4 237 0.94 1.80 2 0.901 0.899 263.6 12 2 1 13 1979 1 13 1979 5 209 254.5 0.82 Sum 4.008 4.000 5 259.1 14 2 260 275.0 0.95 14 2 6 6 285.2 276.3 15 15 3 3 7 7 394 1. 43 1.43 285.0 280.0 16 16 4 4 8 242 0.86 8 269.1 1 281.8 281.8 1980 1 224 0.80 17 9 277 . 7 17 9 277.7 2 10 2 303.0 18 267 0.88 292.9 3 322.5 1.49 19 3 11 1. 49 479 346.4 4 12 0.0 20 4 320 0.00 355.8 04-Jan-94 03:17 PM 04-Jan-94 03:17 NUM CAPS 7 0.807 0.912 Figura 8.9 Ajuste estacional multiplicativo de Spreadsheet forecaster. Figura 8.9 Ajuste estacional multiplicativo de Spreadsheet Forecaster. 370 Análisis de series de tie mpo de series de tiempo Capítulo 8 Cap Itulo 8 1-2-3 Series 1-2-3 Spreadsheet Computing Series SEASONAL ADJUSTMENT. MULTIPLICATIVE SEASONAL ADJUSTMENT, QUARTERLY DATA TITLE1: MULTIPLICATIVE SEASONAL ADJUSTMENT TITLE1 : TITLE2: OUTBOARD MARINE SALES TITLE2: OUTBOARD MARINE SALES X-AXIS: QUARTER X-AXIS: QUARTER Y-AXIS: DOLLARS Y-AXIS: Actual Moving Per Year Qtr Per 1984 1 1 2 2 3 3 4 4 1 1 2 2 3 3 4 4 1 1 2 2 3 3 4 4 1 1 2 2 3 3 4 4 1 1 2 2 3 3 4 4 1 1 2 2 3 3 4 4 1 1 2 2 3 3 4 4 1 1 2 2 3 3 4 4 1 1 2 2 3 3 4 4 1 1 2 2 3 3 4 4 1985 1986 1987 1988 1 1 2 3 4 4 5 5 6 6 7 8 8 9 9 10 11 12 13 14 15 16 17 18 19 20 21 1989 1990 1991 1991 1992 1993 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 data 147.6 251.8 273.1 249.1 139.3 221.2 260.2 259.5 140.5 245.5 298.8 287 168.8 322.6 322.6 393.5 404.3 404.3 259.7 401.1 464.6 479.7 264.4 402.6 411.3 411.3 385.9 232.7 309.2 310.7 293 205.1 234.4 285.4 258.7 193.2 193.2 263.7 292.5 315.2 178.3 274.5 295.4 311. 8 311.8 Avg. 0.0 0.0 230.4 228.3 220.7 217 .5 217.5 220.1 220.4 226.4 236.1 243.0 250.0 269.3 293.0 322.3 345.0 364.7 382.4 401.3 402.5 402.8 389.5 366.1 358.1 334.8 309.6 286.4 279.5 260.8 254.5 245.9 242.9 250.3 252.0 266.2 262.4 265.1 265.9 265.0 0.0 Ratio 0.00 0.00 1. 19 1.19 1.09 1. 09 0.63 1. 02 1.02 1.18 1.18 0.62 1. 04 1. 23 1.23 1. 15 1.15 0.63 1. 10 1.10 1. 22 1.22 1.17 0.71 1. 05 1.05 1.16 1.19 0.66 1.03 1. 03 1.12 1. 12 1. 08 1.08 0.70 1. 00 1.00 1. 08 1.08 1. 05 1.05 0.79 0.92 1.16 1.16 1.06 1. 06 0.77 1. 05 1.05 1.10 1.10 1.20 0.67 1. 03 1.03 1.11 0.00 Sum of of 11 of # ratios ratios 6.17 9 9 9 9.24 2 9 10 11.56 3 10.17 10.17 9 9 Sum 7 Avg. ratio 0.686 1.027 1.027 1.156 1.156 1.130 3.999 Seas Seas. index 0.686 1.027 1.156 1.131 4.000 0.63 243.0 345.0 401.3 250.3 265.0 Adj. data 215.1 245.2 236.2 220.3 203.0 215.4 225.0 229.5 204.8 1.04 239.1 258.4 253.8 246.0 314.1 340.3 357.6 378.5 390.6 401.8 424.3 385.3 392.0 392.0 355.7 341.3 339.1 301.1 3 01 .1 268.7 259.1 298.9 298.9 0.79 228.3 246.8 228.8 281.6 281.6 256.8 256.8 253.0 278.8 278.8 0.67 259.9 267.3 255.5 275.8 0.6 Figura 8.10 Salida de Lotus 1-2-3 para los datos de Outboard Marine con Spreadsheet Forecaster. Figura 8.10 Salida de Lotus 1-2-3 para los datos de Outboard Marine con Spreadsheet Forecaster. Paquetede cómputo Minitab Paquete de cómputo Minitab 371 4. Posicione el indicador de celdas en Ia celda B9 y registre el primer valor de datos, 147.6. indicador la registre el primer flecha hacia abajo J.. > continue registrando Oprima la flecha hacia abajo < 'I > y continúe registrando los datos hasta ingresar el valor 311.8 en Ia celda D48. En Ia columna J se muestra el índice estacional final para la la Indice la columna K. cada trimestre. Los datos ajustados en forma estacional aparecen en la columna K. /FILE IFS, y 5. Para almacenar la hoja de cálculo para su uso futuro, escriba IFILE SAVE o IFS, y el futuro, programa le solicitará el nombre del archivo A:\*.WK1 A:\*.WK1 Enter name of file to save: of file to save: Asegúrese el directorio Asegárese de que el directorio actual es el correcto. Escriba OUTBOARD y presione <Enter>. Ia hoja de cálculo, escribalPRiNT PRLNTER RANGEo /PPR aparecerá 6. Para imprimir la hoja de cálculo, escriba/PRINT PRINTER RANGE o IPPR y aparecerá el mensaje que le solicita el rango a imprirnir: el rango a imprimir: Enter print range: print range: El rango correspondiente es A1..K48. oprirna <Enter> y después GO. Los resultados Al..K48. oprima <Enter> Los resultados se muestran en la figura 8.10. figura 8.1 O. muestran PAQUETE DE COMPUTO MINITAB PAQUETE DE CÓMPUTO MINITAB El El problema. El problerna 20 requiere que el analista calcule los cuatro Indices los cuatro índices El problema 20 requiere que analista las ventas de Goodyear Tire. estacionales para las ventas de Goodyear Tire. La solución mediante Minitab. La solución mediante 'PROB20.DAT· C1 MTB > READ 'PROB2O.DAT' Cl > C1 Cl 2292 2450 MTB MTB MTB MTB MTB MTB MTB > LET C2 > LET C2 > LET C3 > LET C3 C4 > LET C4 > > DELETE > > DELETE > > DELETE > > LET C5 C5 > 2363 2477 C1 = Cl = Cl C1 = Cl C1 1 C2 1 C2 1:2 C3 1:2 C3 1:3 C4 1:3 C4 C1+C2+C3+C4 = C1+C2+C3+C4 1 III 1 1 COLUMN LENGTHS DURING OPERATION UNEQUAL COLUMN LENGTHS DURING OPERATION RESULT HAS SHORTER LENGTH HAS 372 Análisis de series de tiempo series de tiempo Capítulo 8 Cap Itulo El primer paso consiste en calcular un total móvil El primer paso consiste en calcular un total móvil de cuatro trimestres. Los datos se cuatro trimestres. Los datos copian en las columnas 2, 3 y 4. Enseguida, se usa el comando DELETE para eliminar Ia las columnas 3 Y 4. Enseguida, se usa el comando DELETE para eliminar la primera observación en la columna 2, las primeras dos observaciones en la columna 3 y las 2, primeras dos observaciones en la columna 3 y las primeras tres observaciones en Ia columna 4. Luego, se emplea el comando SET primeras tres observacionesen la columna 4. Luego, se emplea el comando SET para 1 almacenar agregar las columnas 1 a 4 y almacenar el resultado del total móvil de cuatro trimestres en CS. este punto, Minitab proporciona advertencia indicando que columnas C5. En este punto, Minitab proporciona una advertencia indicando que las columnas son longitud. Esta advertencia se ignora a lo largo de este proceso. A continuación, desiguales en longitud. Esta advertencia se ignora a lo largo de este proceso. A continuación, mismo tipo de idea para calcular un total móvil de dos años y, eventualmente, se utiliza el mismo tipo de idea para calcular un total móvil de dos aflos y, eventualmente, índices estacionales. los Indices estacionales. MTB > LET C6 C5 MTB > LET C6 = CS MTB > DELETE 1 C6 MTB DELETE MTB > LET C7 MTB > LET C7 C5+C6 MTB > PRINT C1 -C7 MTB > PRINT C1-C7 ROW 1 Cl C1 2292 2450 2363 2477 2063 2358 2316 2366 2268 2533 2479 2625 2616 2793 27 93 2656 2746 2643 2811 2679 2736 2692 2871 2900 2811 2497 2792 2838 2780 2778 3066 C2 2450 2363 2477 2063 2358 2316 2366 2268 2533 2479 2625 2616 2793 2656 2746 2643 2811 26/9 2679 2736 2692 2871 2900 2811 2497 2792 2838 2780 277 8 3066 C3 C4 C5 C6 C7 1 2 2 3 3 4 5 5 6 7 7 8 9 9 10 11 12 13 14 15 16 17 17 18 19 20 21 22 23 24 25 26 27 28 29 30 2363 2477 2063 2358 2316 2366 2268 2533 2479 2625 2616 2793 2656 2746 2643 2811 2679 2736 2692 2871 2900 2811 2497 2792 2838 2780 2778 3066 2477 2063 2358 2316 2366 2268 2533 2479 2625 2616 2793 2656 2746 2643 2811 2679 2736 2692 2871 2900 2811 2497 2792 2838 27 80 2778 3066 9582 9353 9261 9214 9103 9308 9483 9646 9905 10253 10513 10690 10811 10838 10856 10879 10869 10918 10978 11199 11274 11079 11000 10938 10907 11188 11462 2450 9353 9261 2363 9214 2477 9103 9308 9483 9646 9905 10253 102 's 3 18935 18614 18475 2358 18317 18411 18791 19129 19551 201 '"j 8 20158 10513 20766 10690 2625 21203 10811 21501 2793 21649 10838 108'j6 10856 21694 108/9 21735 10879 2643 217/,8 10869 217148 10918 21787 21896 10978 2736 22177 11199 2692 22413 22473 11274 223')] 110/9 2871 22353 220/9 22079 11000 21938 10938 218/,5 10907 2497 21845 22095 11188 2838 2 26'S 11462 2780 O 22650 2366 2268 2533 2625 2793 2643 10879 2736 10918 2811 11079 11000 2838 2778 2778 Bibliografía seleccionada Bibliografla 373 > LET C8 = C7/8 MTB > LET C8 = C7/8 > LET C9 = (C3/C8)*100 MTB > LET C9 = (C3/C8)*100 MTB > PRINT C9 > PRINT C9 El promedio móvil centrado de cuatro trimestres (CS) se calcula dividiendo el total El promedio móvil centrado de cuatro trimestres (C8) se caicula dividiendo ci total móvil dos años (C7) almacenado en Ia columna 7, entre S. índice móvil de dos aflos (C7) almacenado en la columna 7, entre 8. Cada indice estaciose calcula dividiendo real de cada trimestre (C3) entre el promenal trimestral se calcula dividiendo el valor real de cada trimestre (C3) entre el promedio móvil centrado de cuatro trimestres para ese trimestre y multiplicando por 100, de modo 100, muitiplicando resultado sea un número índice. Los siguientes comandos se emplean para calcular que el resuitado sea un nürnero Indice. Los siguientes comandos se emplean para caicular las medianas de cada trimestre. trimestre. las MTB > > DATA> DATA> > MTB > SUBC> SET ClO SET CI0 3 4 1 2 3 4 1 2 4 1 2 3 4 1 2 4 1 2 3 4 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 END END DESCRIBE C9; DESCRIBE C9; BY ClO. BY CI0. CI0 ClO C9 1 1 2 2 3 3 4 4 N N 6 6 6 6 7 7 7 7 MEDIAN 95.98 103.19 103.19 99.84 101.13 MTB > STOP > STOP El El comando SET se usa para identificar cada trimestre. Los comandos DESCRIBE y identificar cada trimestre. Los comandos DESCRIBE y se utilizan para calcular varias estadísticas de C9 para cada valor de CIO. Sólo BY se utilizan para calcular varias estadIsticasde C9 para cada valor de ClO. Solo es relevante la parte de salida que se muestra aquí. último paso, que no se muestra, reievante la parte de la salida que se muestra aqul. El ültimo paso, que no se muestra, valores de modo que sumen 400. consiste en ajustar estos valores de modo que sumen 400. BIBLIOGRAFíA BIBLIOGRAFIA BURMAN, 1. P. "Seasonal Adjustment A Survey." TIMS Studies in Management BURMAN, J. P. "SeasonalAdjustment -A Survey. " TIMS Studies in Management Sciences 12 (1979): 45-57. CROXTON, F. E.,COWDEN, D. D. YBLOCH, B. W. Practical Business Statistics. Englewood Cliffs, N. 1.: CROXTON, F. E., COWDEN, 1. J. y BLOCFJ, B. W. Practical Business Statistics. Englewood Cliffs, N.J.: Prentice-Hall, 1969. PrenticeHall, 1969. MAKRlDAKIS, S. y WHEELWRIGhT, S. Interactive Forecasting. Palo Alto, Calif.: Scientific MAKRIDAKJS, S. yWIIEELWRIGIIT, S. C. C. h'zteractive Forecasting. Palo Alto,Calif.: Scientific Press, 1977. MOORE, G. H. y SHISKIN, J. "Indicators of Business Expansions and Contractions." New York: National YSHISKIN, 1. "indicators ofBusiness Bureau of Economic Research, 1957, pp. 8-28. pp. ofEconomic MOORE, G. H. YSHISKIN, 1.J. "EarlyWarning Signals for the Economy." En Statistics: A Guide to Business MOORE, G. H. y SITIsKIN, "Early Warning Signals for the Economy." En Statistics: A Guide to Business and Economics, J. M. TANUR et al., EDS. San Francisco: HoldenDay, 1976, p. 81. and Economics, J. M. TANURet al., EDS. San Francisco: Holden-Day, 1976, p. 81. CAPíTULO CAPITULO Regresión de datos Regresión de d1 de series de tiempo 9 ACTIVIDAD A CT! VIDAD Muchas aplicaciones en la economla y en los negocios comprenden series de tiempo. Se negocios comprenden series tiempo. Muchas aplicaciones en la economía y puede Ilevar a cabo la regresión de datos mensuales, trirnestrales o anuales mediante las llevar cabo la regresión de datos mensuales, trimestrales o anuales mediante las técnicas descritas en los capitulos anteriores. Sin embargo, las mediciones de series de series de técnicas descritas en los capítulos anteriores. Sin embargo, las mediciones tiempo pueden considerarse muestras probabilisticas; en vez de están sujetas a tiempo no pueden considerarse muestras probabilísticas; en vez de ello, están sujetas a tendencias, ciclos, variaciones estacionales e irregulares y a fluctuaciones aleatorias. De ahi fluctuaciones ahí tendencias, vanaciones frecuencia surjan problemas de interpretación. que con frecuencia surjan problemas de interpretación. Los modelos básicos de regresión expuestos en los caps. 6 y 7 suponen que los Los modelos básicos de regresión expuestos en los caps. 6 y 7 suponen que los residuos (Y - Y) son variables aleatorias no correlacionadas o bien, variables aleatorias residuos (Y - Y) son variables aleatonas no correlacionadas o bien, variables aleatorias independientes nonnales. Por ello se supone que los ténninos de error sucedan de manera independientes norrnales. Por ello Se supone que los términos de error sucedan de manera sólo la mayoría las series debido a que los aleatoria. Esta suposición no solo es válida para la mayorIa de las series debido a que los télminos de error tienden a incrementarse siempre que se relaciona a través del tiempo a tienden incrementarse siempre que se relaciona través tiempo términos de una variable tomada de una industria creciente. Los términos de error se hacen rnayores tomada de una industria creciente. ténninos error se hacen mayores debido a que la variable o variables que comprende tienden aa crecer en una tasa debido a que la variable o variables que comprende tienden crecer en una tasa vez de hacerlo en una cantidad constante. Esta condición se denomina constante en vez de hacerlo en una cantidad constante. Esta condición se denornina constante se abordó el cap. 7. heteroscedasticidad y se abordó en el cap. 7. EL PROBLEMA DE LA HETEROSCEDASTICIDAD EN HETEROSCEDASTICIDAD EN EL PROBLEMA LA REGRESION DE DATOS DE SERIES DE TIEMPO REGRESIÓN DE DATOS DE SERIES DE Para abordar este tema emplearemos un ejemplo. tema emplearemos un ejemplo. Ej emplo Ejemplo 9.1 Suponga que analista comprometido con planeación futuro Reynolds Metals Suponga que un analista está comprometido con la planeación a futuro de Reynolds Metals Ca., desea establecer cuantitativa Co., un productor de aluminio, y desea establecer una base cuantitativa para proyectar ventas futuras. compañía disponible futuras. Como la compañIa vende en forma regional, una medida del gasto personal disponible región tendrá una relación cercana. La tabla 9.1 muestra las ventas y ingreso el por region tendrá una relación cercana. La tabla 9.1 muestra las ventas y el ingreso para el periodo 1973 - 1993. El analista correlaciona estas variables e intenta utilizar el ingreso para variables e intenta utilizar el ingreso para periodo 1973 - 1993. El analista correlaciona ventas 1994. pronosticar las ventas de Reynolds para 1994. Primero, hace gráfica los datos en una escala aritmética, como se muestra en la Primero, hace una gráfica de los datos en una escala aritmética, como se muestra en la La relación ser 1inea!. fig. 9.1. La relaciOn parece ser lineal. Al ejecutar los datos en un programa de cómputo, los resultados se muestran en la tabla programa cómputo, resultados muestran en 9.2. El ajuste es bueno; el 90% de Ia varianza de la variable ventas se explica mediante la 9.2. ajuste es bueno; el 90(Yo de la varianza de la variable ventas se explica mediante la ecuación lineal Y = ecuación lineal Y = -- 792 ++ 4.225l7X Sin embargo, una revision minuciosa de Ia fig. 9.1 792 4.22517X. Sin embargo, una revisión minuciosa de la fig. 9.1 indica los residuos satisfacen la suposición de varianza constante. Los residuos son indica que los residuos satisfacen la suposiciOn de varianza constante. Los residuos son TABLA 9.1 TABLA 9.1 DATOS EJEMPLO VENTAS REYNOLDS METALS DATOS PARA EL EJEMPLO 9.1: VENTAS DE REYNOLDS METALS AÑO AIO 1973 1974 1975 1976 1977 1978 1979 1980 1981 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1990 1991 1992 1993 VENTAS DE DE METALS REYNOLDS METALS (MILES (MILES DE DOLARES) DÓLARES) Y Y 295 400 390 425 547 555 620 720 880 1,050 1,290 1,528 1,528 1,586 1,586 1,960 2,118 2,116 2,477 3,199 3,702 3,316 2,702 INGRESO INGRESO PERSONAL DISPONIBLE (MILLONES DÓLARES) (MILLONES DE DOLARES) X x 273.4 291.3 306.9 317.1 336.1 349.4 362.9 383.9 402.8 437.0 472.2 510.4 544.5 588.1 630.4 685.9 742.8 80 1.3 80\.3 903.1 983.6 1,076.7 VENTAS VENTAS DE REYNOLDS METALS METALS RETRASADAS UN AO RETRASADASUN AÑO 295 400 390 425 547 555 620 720 880 1,050 1,290 1,528 1,586 1,960 2,118 2,116 2,477 3,199 3,702 3,316 4000 4000 - ~ 3500 3500 :o "'O c:: ~ ~ 3000 3000 ~ '" ..... ]., 2500 2500 - ~ i5 2000 ~ 2000 @ U ] ..g 1500 1500 - e > il.l ~ 1000 1000 500 500 o 0 200 300 400 500 600 700 800 900 1000 1100 300 400 500 600 700 800 900 1000 1100 Ingreso disponible (millones de dólares) Ingreso disponible (millones de dólares) Figura 9.1 las ventas de Reynolds Metals. Figura 9.1 Ajuste lineal de las ventas de Reynolds Metals. 375 376 TABLA 9.2 Regresión de datos de series de tiempo RegresiOn de datos de series Capítulo 9 Cap Itulo SALIDA DE COMPUTO PARA LAS VENTAS DE REYNOLDS METALS: AJUSTE LINEAL REYNOLDS METALS: AJUSTE LINEAL DE CÓMPUTO PARA LAS VENTAS VARIABLE NO. 2 2 MEAN STANDARD DEVIATION 241.16 CORRELATION X y X VS Y 0.95 REGRESSION COEFFICIENT 4.22517 STD. ERROR REG. COEF. OF REG. COEF. 0.31627 COMPUTED T VALUE 542.85 13.45 241.16 13.45 DEPENDENT 1 1 INTERCEPT 1078.69840 1517.90450 1078.69840 -792 MULTIPLE CORRELATION MULTIPLE R SQUARE R SQUARED CORRECTED R SQUARED 0.951 0.905 STD. ERROR OF ESTIMATE STD. DURBIN-WATSON STATISTIC 341.1 0.87 0.900 ANALYSIS OF VARIANCE FOR THE REGRESSION ANALYSIS OF VARIANCE THE REGRESSION SOURCE OF SOURCE OF VARIATION ATTRIBUTABLE TO REGRESSION DEVIATION FROM REGRESSION TOTAL DEGREES OF FREEDOM OF 1 1 19 20 SUM OF OF SQUARES MEAN SQUARES 21061184 116348 F VALUE 181.018 21061184 2210624 23271808 RESIDUALS TABLE OF RESIDUALS CASE NO. NO. 1 Y Y VALUE 295 400 390 425 547 555 620 720 880 1050 1290 1290 1528 1586 1960 2118 2116 2477 3199 3702 3316 2702 y ESTIMATE Y ESTIMATE RESIDUAL -76.36 -47.53 -123.91 -132.32 -91.16 -139.76 -132.20 -121.56 -41.98 -17.51 72.71 148.16 61.06 249.53 227 .54 227.54 -10.62 108.26 581.33 651.16 -77 .38 -77.38 -1087.54 1 2 2 3 3 4 4 5 5 7 6 6 7 8 8 9 9 10 11 12 13 14 15 16 17 18 19 20 21 371.36 447.53 513.91 557.32 638.16 694.76 752.20 841.56 921.98 1067.51 1217.29 1379.84 1524.94 1710.47 1890.46 2126.62 2368.74 2617.67 3050.84 3393.38 3789.54 El problema de correlación serial El 377 mayores ventas los años. Este resultado se presenta debido a mucho mayores al crecer las ventas a través de los años. Este resultado se presenta debido a variables se incrementan en una tasa constante. que las variables se incrementan en una tasa constante. Una solución al problema de heteroscedasticidad consiste en expresar en dólares constanal problema de heteroscedasticidad expresar en dólares constantes los valores tanto de la variable dependiente como de la independiente. La expresión en los valores tanto de la variable dependiente la independiente. expresión dólares constantes (véase exposición sobre deflación de precios dólares constantes de una serie de tiempo (véase exposición sobre deflación de precios en el cap. 8), con frecuencia supera el problema del incremento en los errores de pronóstico a través a través del tiempo. Otra solución es realizar uria transformación logarItmica (véase la exposición en Otra solución es realizar una transformación logarítmica exposición en el cap. 6). 6). EL PROBLEMA EL PROBLEMA DE CORRELACIÓN SERIAL DURANTE LA CORRELACION REGRESIÓN DE DATOS DE SERIES DE TIEMPO DATOS DE SERIES DE TIEMPO REGRESION Otro problema con las series tiempo de datos es movimiento en ciclos más Otro problema con las de series de tiempo de datos es su movimiento en ciclos más bien que en una forma puramente aleatoria. Es frecuente que este fenómeno provoque resultados aleatoria. Es frecuente que este fenómeno provoque resultados secuencia. Este punto se ilustra revisando la fig. negativos de varios errores positivos o negativos en secuencia. Este punto se ilustra revisando Ia fig. 9.1, residuos (1973-1982) negativos, significa las diez 9.1, Los primeros diez residuos (1973-1982) son negativos, lo que significa que las diez primeras estimaciones o predicciones basadas en la ecuación de regresión son todas muy primeras estirnaciones o predicciones basadas en la ecuación de regresión altas. Los siguientes cinco residuos (1983-1 987) son positivos, lo que representa que todas (1983-1987) todas altas. estas predicciones son rnuy bajas. El valor de cada aflo depende o está relacionado con el muy bajas. El año relacionado con el estas predicciones valor del afio anterior, en vez de que sea independiente de él. Este hecho no debe sorprender. año anterior, de que de él. Considere, por ejemplo, una serie de precios. Si las observaciones sucesivas de un año al observaciones sucesivas de Considere, ejemplo, una serie de precios. siguiente fueran en realidad independientes entre sí, viviríamos en una economla caótica. independientes entre si, vivirlamos en economía caótica. siguiente fueran En un mundo asI, los precios se determinarlan como números extraídos de una tabla de mundo así, los precios determinarían como rnmeros extraidos de una tabla de En números aleatorios. El conocimiento del precio en un aflo no ejercería influencia en el precio año no ejercerla nümeros del año siguiente. siguiente. del Los datos económicos ordenados en una serie de tiempo pueden considerarse como económicos ordenados en una Los una muestra aleatoria. Una observación en un periodo dado sobre precios, inventarios, una muestra aleatoria. Una observación en un periodo dado sobre precios, inventarios, regular correlacionada con producción, acciones y otras variables económicas, está por lo regular correlacionada con económicas, producción, acciones y (dependiente de) el valor (dependiente de) el valor de Ia misma variable en el periodo anterior. Para describir esta la variable periodo anterior. describir situación se emplea el término correlación serial. Los residuos (Y -- Y) no son indeson indesituación se emplea el término correlación serial. Los residuos (Y Y) pendientes entre una observación y la siguiente. De modo que el conocimiento del error en pendientes entre una observación y siguiente. De modo que el conocimiento del en un aflo ayuda al analista a anticipar el error en el año siguiente. Los residuos están el año siguiente. Los residuos están un año ayuda al analista anticipar el error autocorrelacionados. Existe correlación serial cuando las observaciones sucesivas a través del tiempo serial cuando las observaciones sucesivas a través del tiempo se encuentran relacionadas entre Si. relacionadas entre sí. común de correlación serial es de primer orden, en el que cada término La forma más comin de correlación serial es de primer orden, en el que cada término de error es una función del término de error del periodo anterior. Esta situación se ilustra función término error del periodo anterior. situación se ilustra de en la ecuación 9.1. 9.1. 378 Regresión de datos de series de tiempo series de tiempo Capítulo 9 Cap itulo Y=f30+/3X,+ el periodo anterior o depende en donde e, depende de su propio valor en el periodo anterior o E1 = pE1_1 + (9.1 ) (9.1) (9.2) en donde e, = término de error de Ia ecuación la ecuación = ténnino = parámetro (coeficiente correlación serial de primer orden) que mide p = parámetro (coeficiente de correlación serial de primer orden) que mide la correlación entre los térniinos de correlación entre los ténninos de error Vt = ténnino v. = término de error independiente con distribución normal nonnal Para este tipo de correlación serial, todo lo que se necesita es que el nivel de un Para correlación serial, todo lo que se necesita es que el nivel de ténnino de error (_ afecte directamente el nivel del siguiente término de error (). La término de error (e,-)\) afectedirectamente el nivel del siguiente ténnino de error (e,). La magnitud del coeficiente de correlación de primer orden (p), indica la fuerza la magnitud del coeficiente de correlación de primer orden (P), indica Ia fuerza de Ia correlación serial en la ecuación 9.2. Si P es cero, entonces no existe correlación serial correlación serial en ecuación 9.2. Si p es cero, entonces no existe correlación serial los ténninos de error son independientes (e, = y los ténninos de error son independientes ( = vJ Considere los datos que se presentan en la fig. 9.2, que grafica una serie de tiempo serie de tiempo Considere los datos que se presentan en fig. ficticia. La Ilnea recta es una línea de regresión con respecto al tiempo. La correlación serial línea ficticia. linea de inmediato. De 1983 a 1986 los términos de error (Y Y) son todos positivos es obvia de inmediato. De 1983 a 1986 los ténninos de error (Y - Y) son todos positivos muy bajas), mientras que 1987 a 1994 son (todas las estimaciones de regresión (todas las estirnaciones de la regresión son rnuy bajas), mientras que de 1987 a 1994 son negativos (todas las estimaciones de la regresión son altas). Se anticipa un valor negativos (todas las estimaciones de la regresión son muy altas). Se anticipa un valor negativo para 1995. Resulta fácil predecir la dirección de cada término de error sucesivo. sucesivo. negativo para 1995. Resulta fácil predecir Ia dirección de término En la economIa y en los negocios, una de las principales causas de residuos positivos economía en negocios, positivos correlacionados en forma serial es una especificación de error tal, semejante a omitir una correlacionados en fonna serial especificación tal, semejante a omitir una variable o a una forma funcional incorrecta. Cuando se relacionan en forma positiva los variable o una fOlma funcional incorrecta. Cuando se relacionan en fonna positiva los efectos secuencia en tiempo de una variable "faltante", los residuos tienden ser efectos de secuencia en el tiempo de una variable "faltante", los residuos tienden a ser correlacionados serialmente en forma positiva en la ecuación de regresión, debido a que correlacionados serialmente en forrna positiva en Ia ecuación de regresión, debido incluyen los efectos de la variable faltante. De ahí que no haya sido explicada una parte incluyen los efectos de Ia variable faltante. Dc ahI que no haya sido explicada una parte importante de Ia variación de la variable dependiente. la la variable dependiente. importante I I I I I I I I I 1982 1984 1986 1988 1990 1992 1994 Figura 9.2 Correlación serial positiva. 9.2 El problema de correlación serial El 379 Por ejemplo, considere la variable de registros de automóviles nuevos que se expuso registros de automóviles nuevos que se expuso en el cap. 8. Si se emplean corno variables de predicción el ingreso personal y el precio, el 8. Si se emplean como precio, el modelo pudiera explicar una gran parte la varianza de los registros de automóviles modelo pudiera explicar una gran parte de Ia varianza de los registros de automóviles nuevos. nuevos. Por desgracia, podrIa estar presente una correlación serial. La especificación del desgracia, podría una correlación serial. La especificación del modelo dejó fuera variables potencialmente clave como la población en edad de conducir, variables potencialmente dave como población edad de conducir, modelo dejó consecuencia, su que tiene un impacto definitivo en la yenta de automóviles y, en consecuencia, en su impacto definitivo en la venta de automóviles y, que tiene registro. Si los residuos en una ecuación de regresión están autocorrelacionados fonna Si los residuos en una ecuación de regresión están autocorrelacionados en forma uso del método de mínimos cuadrados varios problemas. positiva, el uso del método de rnInirnos cuadrados presenta varios problemas. 1. El error estándar de Ia estimación subestima seriamente la variabilidad de los términos la seriamente Ia variabilidad de los términos de error. 2. Los intervalos de confianza y pruebas que emplean las distribuciones t y F ya no son intervalos son pruebas que emplean las distribuciones estrictamente aplicables. estrictarnente subestima Ia variabilidad del coeficiente 3. El error estándar del coeficiente de regresión subestima la variabilidad del coeficiente de regresión estimado. La fig. 9.3 ilustra la presencia La fig. 9.3 ilustra Ia presencia de una correlación serial positiva en un modelo con una correlación un modelo con variable independiente. El residuo asociado con la primera observación, una sola variable independiente. El residuo asociado con Ia primera observaciOn, indicado Y-Y, resulta ser positivo. Este resultado conduce a series de cinco términos en la gráfica por Y Y, resulta ser positivo. Este resultado conduce a series de cinco términos positivos a una serie de cuatro residuos negativos. Nótese que la pendiente de positivos de error y a una serie de cuatro residuos negativos. Nótese que la pendiente de estimada regresión estirnada es menor que la pendiente real. La línea de regresión, ajustada mediante real. lInea de regresión, mínimos más la línea verdadera. mInimos cuadrados, se ajusta rnás a los puntos de datos que la lInea de regresión verdadera. resultado nos lleva artificialmente alta. Aün más, de Este resultado nos lieva a una ,,}. que es artificialmente alta. Aím más, el error estándar de la estirnación será menor que el error estándar real. Si para realizar pruebas estadIsticas se estimación error estándar real. Si para realizar pruebas estadísticas se Línea de regresiOn verdadera regresión Linea 0 O 0 o 0 O O ,..'" ..- ,..'" ,..,..'" ,..'" ,,'" O O ,..,..'" Línea de regresión Lmneade regresión ajustada O Figura 9.3 Correlaciôn de mínimos cuadrados. Figura 9.3 Correlación serial positiva y procedimiento de mInimos cuadrados. 380 Regresión de datos RegresiOn de datos de series de tiempo Capítulo 9 Cap Itulo emplea el error estándar de mInimos cuadrados, se sobreestimará el éxito del procedimiento mínimos del procedimiento de regresión. Cuando existe una correlación serial positiva y el primer residuo es positivo (véase Cuando existe una correlación serial positiva y el primer residuo es positivo (véase fig. 9.3), la ilnea de regresión estimada o ajustada tendrá una pendiente subestimada (muy línea regresión fig. pequeña) una instersección sobrestimada (muy grande). Si, por el contrano, pequeña) y una instersección sobrestimada (muy grande). Si, por el contrario, el primer residuo es negativo, la imnea de regresión estimada o ajustada tendrá una pendiente residuo es negativo, la línea de regresión estimada o ajustada tendrá una pendiente sobrestimada y una instersección subestimada. En ambos casos la ilnea de regresión de instersección subestimada. En ambos casos línea de regresión de sobrestimada y mínimos cuadrados se ajusta más a los puntos de datos observados que la lInea de regresión datos observados que la línea de regresión mInimos real. El problema no consiste en una desviación sino en una gran varianza en la estimación. en la estimación. real. es una falla el procedimiento de mínimos cuadrados. Cualquier otro procedimiento de No es una falla el procedimiento de mInimos cuadrados. Cualquier otro procedimiento de estimación (como el ajuste visual), se ajustaría en la misma forma al único patron de datos estimación (como el ajuste visual), se ajustarIa en la misma forma al inico patrón oscilante. En una sección posterior se abordarán técnicas que podrian mejorar el procedioscilante. sección técnicas podrían procediestimación. miento de estimación. PRUEBA DE DURBIN-WATSON PARA CORRELACIÔN SERIAL PRUEBA DE DURBIN-WATSON PARA CORRELACIÓN SERIAL enfoque se usa con frecuencia para determinar si existe correlación serial es Un enfoque que se usa con frecuencia para determinar si existe correlación serial es la prueba de Durbin Watson. La prueba comprende la determinación de si el parámetro de prueba de Durbin -- Watson. La prueba comprende la determinación de si el parámetro de autocorrelación se muestra en la ecuación 9.2, es igual a cero. autocorrelación p que se muestra en Ia ecuación 9.2, es igual a cero. = Las hipótesis a considerar son Las hipótesis +V H0: p=O H1: p>0 tiempo La hipótesis alternativa es p> 0, ya que los residuos en las aplicaciones de series de tiempo altemativa es p> 0, ya que los residuos en las aplicaciones de series tienden a mostrar una correlación positiva. mostrar una correlación positiva. cálculo consiste datos la línea de regresión de El primer paso en el cálculo consiste en ajustar a los datos la linea de regresión de mínimos cuadrados. A continuación se calculan los residuos yy la estadística de Durbinminimos cuadrados. A continuación se calculan los residuos la estadIstica de Durbin Watson n DW= t=2 '=2 I (e, - e,_1)2 (e, e'_lf n t=1 (9.3) I~ donde en donde e t == error o diferencia entre punto yylmnea diferencia entre punto línea e1 e,_ = error o o diferenciaentre pu.nto y lInea error diferencia entre punto y línea para el periodo anterior et-I = Durbin-Watson para correlación serial Prueba de DurbinWatson para correlaciOn serial 381 I (e, -- e_ i) = L (e1 e,_¡)2 = t=2 I = 2 n t=2 diferenri2 entre p1 reidiin u'tirn1 el interinr lvados al diferencia entre el residuo actual yv el anterior, elevados al cuadrado y sumados para todas las observaciones. observaciones. cuadrado y cada uno de los residuos elevados al cuadrado y sumados cada uno de elevados sumados después. n t=l disponible han Aunque no hay disponible un procedimiento de prueba exacto, Durbin y Watson han (l) y superior (5), de manera que proporcionado las fronteras inferior (1) y superior (S), de manera que se pueda efectuar una prueba correlación después D W. decisión son pmeba de correlación serial después de calcular el valor DW. Las reglas de decision son 1. Cuando la estadística de Durbin-Watson es mayor que la forntera superior (5), el la forntera superior (S), el Cuando la estadIstica de DurbinWatson coeficiente de autocorrelación es igual a cero (no existe autocorrelación positiva). 2. Cuando la estadIstica de Durbin-Watson es menor que la frontera inferior (1), el Cuando la estadística de DurbinWatson menor que la frontera inferior (l), el coeficiente de autocorrelación es mayor que cero (existe autocorrelación positiva). 3. Cuando la estadística de Durbin-Watson se ubica entre las fronteras inferior y superior, estadIstica de DurbinWatson se ubica entre conclusión positiva).l la prueba no ofrece una conclusion (no sabemos si existe autocorrelación positiva).' Durbin-Watson se emplea para determinar si existe una autocoLa prueba de DurbinWatson se emplea para determinar si existe una autocorrelación rrelaciOn positiva. Si W> concluir Ha. Si D W > S, concluir H0. Si DW< I, concluir H1.• D W < 1, concluir H l Si D W está entre las fronteras superior e inferior Si D W está entre las fronteras superior e (1 ~ DW ~ S), prueba nono ofrece conclusión. (I DW 5), la la prueba ofrece conclusion. Las fronteras criticas de S e I están dadas la tabla C.7 del Apéndice Para Las fronteras críticas de S e 1 están dadas en la tabla C.7 del Apéndice C. Para encontrar los valores apropiados de S e I, el analista necesita conocer el tamaño de encontrar los valores apropiados de S e 1, el analista necesita conocer el tamaflo de la nivel de significación y número independientes. tabla de muestra, el nivel de significaciOn y el mimero de variables independientes. En la tabla de Durbin-Watson del Apéndice el tamaño la muestra aparece columna la DurbinWatson del Apéndice C, el tamaño de la muestra aparece en la columna de la izquierda y el nimero de variables independientes está determinado aa partir de la parte izquierda y el número de variables independientes está determinado partir de la parte superior de cada columna. Si, por ejemplo se emplearan tres variables independientes, superior de cada columna. Si, por ejemplo se emplearan tres variables independientes, habría que buscar columna habrIa que buscar en la columna p - 11 = 3. Cuando no hay conclusion en los resultados, se necesita de un mayor nümero de mayor número Cuando no hay conclusión en los resultados, se necesita de observaciones. Pudiera no ser posible cubrir este requerimiento con los datos de la serie los de la serie modo que Durbin y Watson ofrecen una prueba aproximada que requiere de de tiempo, de modo que Durbin y Watson ofrecen una prueba aproximada que requiere de un minimo de 40 observaciones. mínimo de 40 observaciones. 1 J. J. for serial Correlationin U", Biometrilm Durbin y G.S. Watson, "Testing for serial Correlationin Least-Squares Regression II", Biornetrika 38 (1951): 159-178. 382 Regresión de datos RegresiOn de datos de series de tiempo Capítulo 9 Cap Itulo Ejemplo Ej emplo 9.2 En la tabla 9.3 aparecen los cálculos que muestran la implementación de la ecuación 9.3. Los En Ia tabla 9.3 aparecen los cálculos que muestran la implementación de la ecuación 9.3. Los datos corresponden a Reynolds Metals (ejemplo 9.1, tabla 9.1). La columna de residuos se datos corresponden a Reynolds Metals (ejemplo 9.1, tabla 9.1). La columna de residuos se obtuvo de Ia salida de cómputo de la tabla 9.2. Los cálculos para 1974, de las otras tres obtuvo de la salida de cómputo de tabla 9.2. Los cálculos para 1974, de las otras tres columnas son los siguientes: los siguientes: er _ -47.53 (-76.36) 28.83 er -- e,_1 = -47.53 -- (-76.36) ==28.83 1 e; = _47532 ==2,259.1 -47.53 2,259.1 2 (e r er _ I )2 = 28.83 2 = 831.17 (e1 -- e_1)2 = 28.832 = 831.17 La estadística de Durbin - Watson se calcula como La estadIstica de Durbin - Watson se calcula como '" (e - er-I )2 ¿ (er - e_1)2 (=2 r=2 DW = DW= (=1 t= I I e~ 1,926,035.14 1,926,035.14 = 2,210,641.78 = .87 - .87 Esta respuesta coincide con Ia salida de cómputo de Ia tabla 9.2. Utilizando el nivel de Esta respuesta coincide con la salida de cómputo de la tabla 9.2. Utilizando el nivel de significancia de .01 21 una variable independiente, se obticne significancia de .01 para una muestra de 21 y una variable independiente, se obtiene 1 = .97 1= .97 S= 1.16 S=1.16 Como DW = .87, Como DW = .87, se ubica por debajo de I = .97, se recha.za Ia hipótesis nula y se concluye 1 = .97, se rechaza la hipótesis se concluye que los residuos están autocOlTclacionados en forma positiva (p > 0). que los residuos están autocorrelacionados en forma positiva (p> O). TABLA 9.3 CÁLCULOS DE DURBIN- WATSON PARA EL EJEMPLO 9.2: 9.3 CALCULOS DE WATSON PARA EL EJEMPLO 9.2: REYNOLDS METALS VENTAS DE REYNOLDS METALS VENTAS, AÑO A11O 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1991 1992 1993 Y INGRESO, X X 273.4 291.3 306.9 317.1 336.1 349.4 362.9 383.9 402.8 437.0 472.2 510.4 544.5 588.1 588.1 630.4 685.9 742.8 801.3 903.1 983.6 1,076.7 1,076.7 RESIDUOS, RESIDUOS, e e,r e, - e'_1 (e, -e H )2 (e, -e1)2 831.17 5,833.90 70.73 1,694.15 1,694.15 2,361.96 57.15 113.21 6,332.98 598.78 8,139.65 5,692.70 7,586.41 35,520.94 483.56 56,720.19 14,132.45 223,795.22 4,876.23 530,770.53 1,020,423.23 e e f2 295 400 390 425 547 555 620 720 880 1,050 1,290 1,528 1,586 1,960 2,118 2,116 2,477 3,199 3,702 3,316 2,702 -76.36 -47.53 -123.91 -132.32 -91.16 -139.76 -132.20 -121.56 -41.98 -17.51 72.71 148.16 61.06 249.53 227.54 -10.62 108.26 108.26 581.33 651.16 -77.38 -1,087.54 1,087.54 28.83 -76.38 -8.41 41.16 -48.60 7.56 10.64 79.58 24.47 90.22 75.45 -87.10 188.47 -21.99 -238.16 118.88 473.07 69.83 -728.54 -1,010.16 5,830.85 2,259.10 15,353.69 17,508.58 8,310.15 19,532.86 17,476.84 14,776.83 1,762.32 306.60 5,286.74 21,951.39 3,728.32 62,265.22 51,774.45 112.78 11,720.23 337,944.57 424,009.35 5,987.66 1,182,743.25 Totales 1,926,035.14 1,926,035.14 2,210,641.78 a problemas de correlación serial Solución a problemas de correlaciOn serial 383 Nótese en Ia tabla 9.3 que los términos adyacentes de error t y et_1 tienden a ser Nótese en la tabla 9.3 que los términos adyacentes de error e e1 y e_ tienden a ser del mismo signo y magnitud.Cuando existe una correlación serial positiva, Ia diferencia magnitud.Cuando positiva, la diferencia (e - e,t - 1) tiende a ser muy pequeña, lo que lieva a tener un numerador pequeño en la lleva tener un numerador pequeño en (e - e _ i) tiende ser muy pequeña, lo estadIstica D W. estadística DW. SOLUCIÓN A PROBLEMAS DE CORRELACIÓN SERIAL SOLUCION A PROBLEMAS DE CORRELACIÔN SERIAL Una Una vez que se ha descubierto Ia conelación serial en la regresión de una serie de tiempo descubierto la correlación serie de tiempo datos, es necesario eliminarla antes evaluar efectividad de ecuación de datos, es necesario eliminarla antes de poder evaluar la efectividad de la ecuación de método apropiado para eliminar la correlación serial depende, en primer lugar, regresión. El método apropiado para eliminar la correlación serial depende, en primer lugar, qué fue 10 que la causó. La correlación serial puede surgir debido un error de qué fue lo que Ia causó. La correlación serial puede surgir debido aa un error de especificación, tal como omisión de variable, ténninos especificación, tal corno la omisión de una variable, o puede aparecer porque los térrninos independientes de error se encuentran intercorrelacionados en una ecuación correctarnente se encuentran intercorrelacionados ecuación correctamente independientes de especificada. La solución al problema de la correlación serial cornienza con una evaluación de la solución correlación comienza con especificación del modelo. ¿Es correcta Ia forma funcional? ¿Se omitió alguna variable especificación modelo. Es correcta la fonna funcional? ,Se omitió alguna variable importante? Existen errores de especificación que pudieran importante? ¿Existenerrores de especificación que pudieran tener cierto patrón a través del patron tiempo, que pudieran haber introducido una correlación serial en los residuos? Como en los negocios, una las causas principales de los residuos autocorrelacionados en fonna negocios, una de las causas principales de los residuos autocorrelacionados en forma positiva es la ornisión de uria o más variables clave, el mejor enfoque para resolver el positiva es omisión de una más variables dave, el mejor enfoque para resolver problema consiste en encontrarlas. A esta técnica se le conoce en ocasiones como problema consiste en encontrarlas. A esta técnica se conoce en ocasiones como del modelo. desgracia, mejoramiento de Ia especificación del modelo. Por desgracia, no siempre es posible utilizar la este método. variable faltante, aunque conocida para el analista, pudiera no ser este método. La variable faltante, aunque conocida para el analista, pudiera no ser cuantificable. Por ejemplo, se podrIa esperar que la inversiOn en negocios, en periodos podría la inversión negocios, en periodos cuantificable. Por ejemplo, futuros, la los inversionistas potenciales. Sin embargo, futuros, estuviera relacionada con Ia actitud de los inversionistas potenciales. Sin embargo, resulta dificil cuantificar Ia variable "actitud". No obstante, siempre que sea posible, se debe difIcil la especificar el modelo de acuerdo con una vision del sentido teórico. El problerna de la especificar ci modclo de acuerdo con visión sentido teórico. El problema de la autocorrelación serial no se resolverá mediante la aplicación de ninguna técnica correctiva correctiva autocorrelaciOn serial no se resolverá mediante Ia aplicación de ningura a un modelo sin sentido teórico. sentido teórico. Sólo puede considerar la posibilidad un ajuste, después de haber revisado Solo se puede considerar Ia posibilidad de un ajuste, después de haber revisado minuciosamente la especificación la ecuación. para eliminar minuciosamente Ia especificaciOn de Ia ecuación. Se abordarán varias técnicas para elirninar la correlación serial. Ia Un enfoque Un enfoque para la eliminación de Ia correlación serial, denominado regresión de la eliminación de la correlación serial, denominado regresión de cambios porcentuales, genera nuevas variables mediante ci de cambios porcentuales cambios porcentuales, genera nuevas variables mediante el uso de cambios porcentuaies (incrernento o disminución), entre un periodo y otro. Para demostrar esta gencraciOn de (incremento o disminución), entre un periodo y otro. Para demostrar esta generación de nuevas variables, se emplean los datos de Reynolds Metals de Ia tabia 9.1. La cantidad en Reynolds la tabla 9.1. La cantidad en cambió Y entre 1973 y 1974 fue de 105. Como porcentaje previos de Y que cambiO Y entre 1973 y 1974 fue de 105. Corno porcentaje de los valores previos de Y (295), lm incremento porcentual de 105/295 = .356 (295), este cambio representa un incrernento porcentual de 105/295 = .356 o 35.6%. Este nueva variable independiente para el periodo 2 (1974). Ya que se emplean valor es la nueva variable independiente para el periodo 2 (1974). Ya que no se emplean de las variables, la correlación serial será eliminada. Por desgracia, el los valores reales de las variables, Ia correiación serial será eliminada. For desgracia, el la cambio porcentual de Ia variable independiente pudiera no funcionar muy bien para explicar el cambio porcentual en la variable dependiente. en la variable dependiente. seglmdo enfoque eliminar la correlación la creación de un modelo Un segundo enfoque para eliminar Ia correlación serial, Ia creación de un modelo autorregresivo, genera una nueva variable de pronOstico, utilizando la variable Y retrasada variable de pronóstico, utilizando Ia autorregresivo, retrasada 384 Regresión de datos de series de tiempo RegresiOn de datos de Capítulo CapItulo 9 uno o más periodos. En el ejemplo de Reynolds Metals la variable de pronóstico para 1974 Ia variable de pronóstico para 1974 ventas de 1973 (295). es las ventas de 1973 (295). Otro enfoque la eliminación de la correlación serial, denominado primera Otro enfoque para la eliminación de la correlación serial, denominado primera diferenciación, genera nuevas variables las diferencias reales (incrementos o diferenciación, genera nuevas variables que utilizan las diferencias reales (incrementos o disminuciones) entre periodo periodo. De nuevo se usan los datos de Reynolds Metals de disminuciones) entre periodo y periodo. De nuevo se usan los datos de Reynolds Metals de Y de 1973 a 1974 fue de 105. Este valor es la nueva la tabla 9.1. La cantidad en que cambió Yde 1973 a 1974 fue de 105. Este valor es la nueva variable independiente para el periodo 2 (1974). El enfoque de primera diferenciaciOn variable independiente para el periodo 2 (1974). El enfoque de primera diferenciación supone que la relación entre los términos de error medidos mediante el coeficiente de coeficiente supone que relación entre los términos de error medidos mediante l. autocorrelación es 1. También, el enfoque iterativo para eliminar la correlación serial, genera nuevas También, el enfoque iterativo para eliminar la correlación serial, genera nuevas diferencias reales (incremento o disminución) entre un periodo variables que utilizan las diferencias reales (incremento o disminución) entre un periodo y otro. El enfoque iterativo estima el coeficiente de autocorrelación o relación entre los enfoque iterativo estima el coeficiente de autocorrelación o relación entre los otro. error. términos de error. continuación se presenta un ejemplo de cada uno los enfoques para la A continuación se presenta un ejemplo de cada uno de los enfoques para Ia la correlación serial. eliminación de la correlación serial. Error especificación en el modelo (omisión de Error de especificación en el modelo (omisión de una variable) ejemplo muestra cómo puede resolverse el problema de una variable faltante. El ejemplo 9.3 muestra cómo puede resolverse el problema de una variable faltante. Ejemplo Ej emplo 9.3 La Novak Corporation desea desarrollar un modelo de pronóstico para la proyección de ventas la de ventas futuras. Como la corporación tiene sucursales regionales, se elige como posible variable de futuras. Corno Ia corporación tiene sucursales regionales, se elige como posible variable de predicción al ingreso personal disponible en una base regional. La tabla 9.4 muestra las ventas predicción al ingreso personal disponible en una base regional. La tabla 9.4 muestra las ventas de Novak para 1977 - 1993. El ingreso personal disponible se presentó en la tabla 9.1. 1977 1993. El ingreso personal disponible 9.1. TABLA 9.4 DATOS PARA EL EJEMPLO 9.3: 9.4 DATOS EJEMPLO 9.3: VENTAS DE NOVAK CORPORATION NOVAK CORPORATION VENTAS AÑO AO 1977 1977 1978 1978 1979 1979 1980 1981 1981 1982 1982 1983 1983 1984 1985 VENTAS (MILLONES) 8.0 8.2 8.5 9.2 10.2 11.4 12.8 13.6 14.6 AicTo AÑO VENTAS (MILLONES) 16.4 17.8 18.6 20.0 21.9 24.9 27.3 29.1 1986 1987 1988 1989 1990 1991 1992 1993 Solución a problemas de correlaciOn serial correlación SoluciOn a 385 Los comandos Los cornandos de Minitab para resolver este ejemplo son: eje"plo son: MTB > READ 'NOVAK.DAT' C1-C2 'NOVAK.DAT' C1-C2 MTB 17 ROWS 17 ROWS READ ROW 1 1 2 2 3 3 4 4 Cl C1 C2 8.0 8.2 8.5 9.2 336.1 349.4 362.9 383.9 > MTB > > MTB > SUBC> SUBC> SUBC> C1 'SALES' C2 'INCOME' NAME Cl 'SALES' C2 'INCOME' REGRESS C1 1 PREDICTOR C2, RES IN C3, DHATS IN C4; REGRESS Cl 1 PREDICTOR C2, RES IN C3, DHATS IN C4; C5; RESIDUALS C5; DW. DW. The regression equation is regression equation is SALES -1.50 SALES = -1.50 + 0.0292 INCOME 0.0292 Predictor Constant INCOME s = s = 0.4767 Coef -1.5046 0.0291916 Stdev 0.3290 0.0005129 t-ratio t - ratio ~4.57 -4.57 56.92 P 0.000 0.000 R-sq = 99.5% R-sq R-sq(adj) = 99.5% R-sq(adj) of Analysis of Variance SOURCE Regression Error Total DF 1 1 15 16 SS 736.15 3.41 739.56 MS 736.15 0.23 F F 3239.89 P 0.000 Unusual Unusual Observations SALES Obs. INCOME 29.100 1077 17 Fit Stdev.Fit Fit 29.926 0.270 Residual -0.826 St.Resid -2.10R -2.1OR St.Re R denotes an obs. with a large St. resid. obs. a large sto resido statistic = 0.72 Durbin-Watson statistic = 0.72 NTB > C4 'ESTIMATE' C5 'RESIDUAL' NTB > NAME C4 'ESTIMATE' C5 'RESIDUAL' MTB > PRINT Cl C2 C4 CS C1 C2 C4 C5 MTB > ROW 1 1 2 2 3 3 4 4 5 5 6 6 SALES 8.0 8.2 8.5 9.2 10.2 10.2 11.4 INCOME 336.1 336.1 349.4 362.9 383.9 402.8 437.0 ESTIMATE 8.3067 8.6949 9.0890 9.7020 10.2538 11.2521 11.2521 RESIDUAL -0.30671 -0 . 49495 -0.49495 -0.58904 -0.50206 -0. 50206 -0.05378 0.14786 386 Regresión de datos de series de tiempo RegresiOn de datos de series Capítulo CapItulo 9 7 8 8 9 9 10 11 12 13 14 15 16 17 12.8 12.8 13.6 13.6 14.6 14.6 16.4 17.8 18.6 20.0 21.9 24.9 27.3 29.1 29.1 472.2 472.2 510.4 510.4 544.5 544.5 588. 1 588.1 630.4 630.4 685.9 742.8 742.8 801.3 801.3 903.1 903.1 983.6 983.6 1076.7 12.2797 12.2797 13.3948 14.3902 15.6630 16.8978 16.8978 18.5179 18.5179 20.1789 20.1789 21.8866 24.8583 27.2083 29.9260 29.9260 0.52032 0.20520 0.20977 0.73701 0.73701 0.90222 0.08209 0.08209 -0.17892 0.01337 0.04166 0.04166 0.09175 -0.82599 MTB > STOP MTB > STOP • • • • • El comando READ se usa para alniacenar los datos de ventas de Novak en CI el El cornando READ se usa para almacenar los datos de ventas de Novak en Cl y ci ingreso personal ingreso personal disponible en C2. El comando TRESIDS El cornando TRESIDS se emplea para calcular residuos estandarizados y almacenarlos estandarizados en C3. El comando DHATS se utiliza para calcular las estimaciones de Y almacenarlas El cornando DI-JATSse utiliza para calcular las estirnaciones de Y y aimacenarlas en C4. El subcomando RESIDUAL para calcular la diferencia entre la observación real El subcornando RESIDUAL se usa para calcular Ia diferencia entre la observación real (Cl) y Ia estiniación de Y (C4). El resultado se almacena en C5. (CI) y la estimación de Y (C4). El resultado se almacena en CS. El subcomando DW la estadística Durbin-Watson. El subcomando DW se emplea para calcular Ia estadIstica Durbin-Watson. Utilizando un nivel de significaciónde .01 para una muestra de 17 y una variable Utilizando un nivel de significación de .01 para una muestra de 17 y una variable independiente, se obtiene obtiene 1= .87 1 = .87 S=1.lO S= 1.10 La estadística de Durbin-Watson de La estadIstica de Durbin-Watson de .72 indica que existe una correlación serial (.72 < .87). indica existe correlación serial (.72 .87). Es evidente que en el modelo falta una o rnás variables. Una parte importante de Ia variación que falta o más variables. importante la variación Es de de las ventas no ha sido explicada. Este resultado es verdadero incluso aunque Ia salida de ventas no ha sido explicada. Este resultado verdadero incluso aunque la salida Minitab indique que el ingreso personal disponible está explicando el 99.5% de la varianza 99.5(10 la Minitab indique que ci de Ia variable ventas. la La niejor solución a este dilerna es encontrar Ia variable o variables que faltan. Se agi-ega mejor a este dilema es encontrar la variable o variables que faltan. Se agrega al modelo la tasa de desempleo y los resultados de Ia ejecución se muestran en Ia tabla 9.5. resultados de la ejecución se niuestran en la tabla 9.5. a! modelo Ia tasa de desempleo y cornandos MINITAH Los comandos de MINITAB para este ejemplo se detallan en Ia sección del paquete de córnputo se detallan en la del paquete de cómputo capítulo. Minitab al final del capItulo. Minitab al final nivel de significcióna de .01 para una muestra de 17 dos variables indeCon un nive] de significcióna de .01 para una muestra de 17 yydos variables mdcCon pendientes, se obtiene pendientes, 1= .77 .77 S= 1.25 S= 1.25 RegresiOn cambios porcentuales Regresión de cambios porcentuales 387 9.5 TABLA 9.5 SALIDA DE COMPUTO DE MINITAB PARA EL EJEM PLO 9.3 CÓMPUTO MINITAB PARA EL EJEMPLO regression equation is The regression equation is SALES = - 0.014 + 0.0297 INCOME - 0.350 UNEMP SALES = - 0.014 + 0.0297 Predictor Coef -0.0140 Constant INCOME 0.0297492 -0.34987 UNEMP s 0.2199 s = 0.2199 Stdev 0.2498 0.0002480 0.04656 t-ratio -0.06 119.96 -7.51 P P -0.0140 0.956 0.000 0.0002480 0.000 99.9% R-sq = 99.9% R-sq(adj) 99.9% R-sq(adj) = 99.9% Analysis of Variance Analysis SOURCE Regression Error Total SOURCE INCOME UNEMP DF 2 14 16 2 SS 738.88 0.68 739.56 SEQ SS 736.15 2.73 MS 369.44 0.05 F 7637.92 P 0.000 763 DF CF 1 1 1 1 Observations Unusual Observations Obs. INCOME SALES 17 1077 29.1000 Fit Stdev.Fit Fit Residual 29.0430 0.1713 0.0570 St.Resid 0.41 X 0.41 X obs. X value gives it large influence. X denotes an obs. whose X value gives it large influence. statistic Durbin-Watson statistic 1.98 estadística Durbin-Watson de .98 La estadistica de Durbin-Watson de 11.98 que aparece en la tabla 9.5 indica que se ha eliminado el problema de correlación serial (1.98 > 1.25). el > 1.25). Se puede utilizar la regresión Y = -- 0.14 ++.03X2 - -.35X33 para estimar las ventas de Se puede utilizar Ia regresión i = 0.14 .03X2 .35X para estimar ventas de conocimiento de que los términos de independientes. Novak Corporation, con el conocirniento de que los términos de error son independientes. Las estimaciones de expertos para la region, del ingreso personal disponible ($1185 millones) y estimaciones de expertos para la región, del ingreso personal disponible ($1 185 millones) y de Ia tasa de desempleo (7.8%), se emplean para pronosticar las ventas de Novak para 1991 la tasa de desempleo (7.8%), se emplean para pronosticar de Novak para 1991 en $32.8 millones. y + .03(1,185.0) .35(7.8) = 32.8 Y == -.014 + .03(1,185.0) - .35(7.8) = 32.8 REGRESiÓN DE CAM BIOS PORCENTUALES CAMBIOS REGRESION muestra método de regresión de cambios porcentuales, El ejemplo 9.4 muestra como usar el método de regresión de cambios porcentuales, para serial. corregir la correlación serial. Ejemplo 9.4 pronóstico, en miles de dólares, Sears Fred Gardner está comprometido en el pronOstico, en miles de dólares, de las ventas de Sears región occidental. Como independiente, eligió el Roebuck para la region occidental. Como su variable independiente, eligió el ingreso personal disponible. La tabla 9.6 muestra las ventas de Sears y disponible para el disponible. La tabla 9.6 muestra las ventas de Sears y el ingreso personal disponible para el periodo 1973 - 1993. periodo 1973 - 1993. Los comandos de Minitab para la ejecuciOn de estos datos son Minitab la ejecución son 388 Regresión de datos de RegresiOn de datos de series de tiempo Capítulo 9 Cap Itulo MTB > READ ·SEARS.DAT' C1-C2 MTB > READ SEARS.DAT' C1C2 21 ROWS READ 21 ROWS ROW 1 1 2 2 3 3 4 4 Cl C1 C2 27 3.4 273.4 291.3 306.9 317.1 3307 3556 3601 3721 MTB > MTB > REGRESS Cl 1 PREDICTOR C2: C1 1 PREDICTOR C2: SUBC> DW. DW. The regression equation is is The Cl = C1 = - 524 + 14.0 C2 C2 Predictor Constant C2 5 = s = 343.5 Coef -524.3 524.3 14.0496 Stdev St d ev 188.4 0.3185 t-ratio t- ratio -2.78 2.78 44.11 44. 11 P 0.012 0.000 R-sq = 99.0% R- sq(adj) = 99.0% R-sq(adj) = of Variance Analysis of Variance SOURCE Regression Error Total DF 1 1 19 20 SS 229603712 2241929 231845648 MS 229603712 117996 117996 F F P P 1945.86 0.000 0 . 000 Durbin-Watson statistic = 0.63 = 0.63 output that Fred The MINITAB output indicates that Fred can explain 99% of the Sears sales the Sears sales variance for the western region through the for the western region through the knowledge of its relationship with disposable income for the knowledge its relationship with disposable income for the western region. However, the Durbin-Watson statistic is .63. region. However, Durbin-Watson statistic is .63. the .01 for a 20 and one At the .01 significance level for a sample of 20 and one independent variable the test statistics are the test statistics are independent L= L .95 .95 U 1.15 U = 1.15 The Durbin-Watson statistic indicates positive serial indicates positive serial The correlation (.63 < .95). (.63 < In an attempt to eliminate the relationship among residuals, In an attempt to the relationship among residuals, a regression line is fitted to the percentage changes from a regression line is fitted to the percentage changes from year to year year to year rather than to the actual data. MINITAB is used to the actual data. is used to to perform these computations. computations. First, the differences are First, the computed for the two variables and stored in columns C3 and and sto red in columns C3 and computed for the C4. Regresión de cambios porcentuales RegresiOn de cambios 389 MTB MTB Cl, STORE IN > DIFFERENCES 1 FOR Cl, STORE IN C3 > IN FOR C2, > DIFFERENCES 1 FOR C2. STORE IN C4 > the varibles are lagged and stored in Next, Next. each of the varibles are lagged and sto red in C5 and C6. Cl, > LAG IN MTB > LAG 1 DATA IN Cl, PUT IN C5 IN C2, PUT > MTB > LAG 1 DATA IN C2. PUT IN C6 differences for Sears sales which are stored in The differences for Sears sales which are stored in C3 are divided by Sears sales lagged one period to compute the sales lagged one period to compute the divided percentage change from the previous year. This result is previous year. result is percentage The differences for disposable income which stored in C7. for disposable income which are stored in C4 are divided by disposable income lagged one in disposable income lagged one are period to compute the percentage change from the previous percentage change from the previous period to This result is stored in C8. year. result is stored in MTB > DIVIDE C3 BY C5, STORE IN C7 > C3 BY C5. IN MTB > DIVIDE C4 BY C6, STORE IN C8 > C4 BY C6. IN Next, Next. the results of each of the columns is printed. results of each of the columns is printed. MTB > PRINT C1-C8 > Cl ROW C1 1 1 3307 2 3556 2 3 3601 3 4 3721 5 5 4036 6 6 4134 7 4268 7 8 4578 8 9 9 5093 10 5716 11 6357 11 12 6769 13 13 7296 14 8178 15 8844 15 16 9251 17 10006 17 10006 18 11200 18 11200 19 12500 19 12500 20 13101 20 13101 21 13640 21 13640 C2 C3 C4 * C5 * C6 C7 C8 273.4 291.3 306.9 317.1 336.1 349.4 362.9 383.9 402.8 437.0 472.2 510.4 544.5 588.1 630.4 685.9 742.8 801.3 903.1 983.6 1076.7 249 45 120 315 98 134 310 515 623 641 412 527 882 666 407 755 1194 1300 601 539 17.900 17.900 15.600 15.600 10.200 19.000 13.300 13.500 21.000 21.000 18.900 34.200 35.200 38.200 34.100 43.600 42.300 55.500 56.900 58.500 101.800 80.500 93.100 3307 3556 3601 3721 4036 4134 4268 4578 5093 5716 6357 6769 7296 8178 8844 9251 10006 11200 12500 13101 273.4 273.4 291.3 306.9 317.1 336.1 349.4 362.9 383.9 402.8 437.0 472.2 510.4 544.5 588.1 630.4 685.9 742.8 742.8 801.3 903.1 983.6 0.075295 0.012655 0.033324 0.084655 0.024281 0.032414 0.072634 0.112495 0.122325 0.112141 0.064810 0.077855 0.120888 0.081438 0.046020 0.081613 0.119328 0.116071 0.048080 0.041142 0.065472 0.053553 0.033236 0.059918 0.059918 0.039572 0.039572 0.038638 0.057867 0.049232 0.084906 0.080549 0.080898 0.066810 0.080073 0.071927 0.088039 0.082957 0.078756 0.127044 0.089137 0.094652 0.084655 0.024281 0.120888 0.081438 0.046020 Finally. percentage changes for disposable income Finally, the percentage changes for disposable income (C8) are used to predict the percentage change in Sears sales (C7) used the percentage change in Sears sales (C7). changes are being used instead of actual Since percentage changes are being used instead of actual values. regression is run without using a constant or Yvalues, the regression is run without using a constant or Yintercepto intercept. 390 > MTB > > MTB > SUBC> SUBC> SUBC> Regresión de datos RegresiOn de datos de series de tiempo Capítulo 9 CapItulo C7 SALES' NAME C7 'SALES' C8 'INCOME' INCOME' C7 1 PREDICTOR C8; REGRESS C7 1 PREDICTOR C8; NONCONSTANT; DW. DW. regression equation is The regression equation is SEARS = 1.01 INCOME SEARS = 1.01 20 cases used 1 cases contain missing values contain rnissing values 20 cases used Predictor Noconstant Naconstant INCOME Coef 1 1 1.0297 Stdev 0.09616 t-ratio 10.53 P P 0.000 t s 5 = 0.03201 Analysis of Variance Analysis af SOURCE Regression Error Total DF 1 1 SS SS 19 20 20 0.11375 0.01947 0.13322 F MS F 0.11375 110.98 0.11375 110.98 0.00102 P P 0.000 statistic = 1.27 Durbin-Watson statistic = 1.27 resultados, residuos distribuidos forma más aleatoria, como lo indica En los resultados, los residuos están distribuidos en forma más aleatoria, como lo indica la estadIstica Durbin Watson de 1.27 (1 .27> 1.15). Los Ia estadística Durbin -- Watson de 1 .27 (1.27> 1.15). Los diversos errores estándar calculados para estos cambios porcentuales (S1., Sb) son más válidos que los calculados a partir de de estos cambios porcentuales (S.v.x, b) son rnás válidos que los calculados los valores originales. Desde luego, este resultado no necesariamente significa que el pronóstico sí sea más preciso. en si sea más preciso. punto, Fred puede acudir por ayuda a su conocimiento de la regresión múltiple. En este punto, Fred puede acudir por ayuda a su conocimiento de la regresión multiple. Si los cambios en las ventas de Sears están relacionados en forma simultánea otras Si los cambios en las ventas de Sears están relacionados en forma simultánea con otras variables que afectan las ventas, Ia precision de Ia estimaciOn debería mejorar. Por ejemplo, Ia las ventas, la precisión de la estimación deberia mejorar. la introducción en el modelo del cambio en desempleo (véase tabla 9.6). introducción en el modelo del cambio en la tasa de desempleo (véase tabla 9.6). La tabla 9.7 9.7 muestra los resultados de la salida de cómputo. La estadIstica de Durbin-Watson mejoró a muestra los resultados de la salida de cómputo. La estadística de DurbinWatson mejoró tanto, aparentemente no hay problemas de correlación serial. 1.82. Por lo tanto, aparentemente no hay problernas de correlaciOn serial. 1.82. variables modelo. Fred enfrenta ahora el dilema de incorporar o no más variables al modelo. Cabe señalar Fred enfrenta ahora el dilema de incorporar o al que siempre que se incorpora una nueva variable a! modelo, con fines de pronóstico, se deben variable. precisión del pronóstico se usar estimaciones de expertos para esa variable. Es posible que la precision del pronOstico se mediante este procedimiento. reduzca mediante este procedirniento. Si Si el analista decide utilizar el modelo demostrado en la tabla 9.7, habrIa necesidad de decide utilizar modelo demostrado en tabla 9.7, habría necesidad de conseguir estirnaciones expertas, tanto para el ingreso personal disponible como para la tasa estimaciones expertas, tanto para el ingreso personal disponible como para de desempleo. de desempleo. En la tabla 9.8 y aacontinuación se muestra el procedimiento de pronOstico. 9.8 Y continuación se muestra el procedimiento de pronóstico. l. Estimación del ingreso personal disponible para 1994. 1994. Estiniación del 2. Estimación de Ia tasa de desernpleo para 1994. desempleo 1994. Estimación de la (1185.0 1 076.7) = 108.3, y 3. (1185.0 -- 1 076.7) = 108.3, Y 108.3 = 10.1% 10.1% 1,076.7 RegresiOn do cambios porcentuales Regresión de cambios porcentuales 391 TABLA 9.6 DATOS PARA EL EJEMPLO 9.4: VENTAS DE SEARS, INGRESO TABLA 9.6 DATOS PARA EL EJEM PLO 9.4: VENTAS DE SEARS, INGRESO DESEMPLEO EN EUA, 1973 1993 DISPONIBLE Y TASA DE DESEMPLEO EN EUA, 1973 - 1993 DISPONIBLE Y TASA PORCENTAJE DE CAMBIO RESPECTO AL AIO ANTERIOR RESPECTO AL AÑO ANTERIOR AÑO ANO 1973 1974 1975 1975 1976 1977 1978 1979 1979 1980 1981 1981 1982 1983 1983 1984 1984 1985 1985 1986 1987 1987 1988 1988 1989 1989 1990 1991 1991 1992 1992 1993 VENTAS DE SEARS, Y 3,307 3,307 3,556 3,556 3,601 3,601 3,721 3,721 4,036 4,036 4,134 4,134 4,268 4,268 4,578 4,578 5,093 5,093 5,716 5,716 6,357 6,357 6,769 6,769 7,296 7,296 8,178 8,178 8,844 8,844 9,251 9,251 10,006 10,006 11,200 11,200 12,500 12,500 13,101 13,101 13,640 13,640 INGRESO DISPONIBLE, TASA DE DESEMPLEO (%) DESEMPLEO X2 x2 273.4 273.4 291.3 291.3 306.9 306.9 317.1 317.1 X, 4.4 4.4 4.1 4.1 4.3 4.3 6.8 6.8 5.5 5.5 5.5 5.5 6.7 6.7 5.5 5.5 5.7 5.7 5.2 5.2 4.5 4.5 3.8 3.8 3.8 3.8 3.6 3.6 3.5 3.5 4.9 4.9 5.9 5.9 5.6 5.6 4.9 4.9 5.6 5.6 8.5 8.5 LlY zx2 Ll X2 6.5 6.5 5.4 5.4 3.3 3.3 6.0 6.0 4.0 4.0 5.7 5.7 5.8 5.8 6.3 6.3 8.5 8.5 8.1 8.1 8.1 8.1 6.7 6.7 8.0 8.0 7.2 7.2 8.8 8.8 8.3 8.3 7.9 7.9 12.7 12.7 8.9 8.9 9.5 9.5 zX3 Ll X, 336.1 336.1 349.4 349.4 362.9 362.9 383.9 383.9 402.8 402.8 437.0 437.0 472.2 472.2 510.4 544.5 544.5 588.1 588.1 630.4 630.4 685.9 685.9 742.8 742.8 801.3 801.3 903.1 903.1 983.6 983.6 1,076.7 1,076.7 7.5 7.5 1.3 1.3 3.3 3.3 8.5 8.5 2.4 2.4 3.2 3.2 7.3 7.3 11.2 11.2 12.2 12.2 11.2 11.2 6.5 6.5 7.8 7.8 12.1 12.1 8.1 8.1 4.6 4.6 8.2 8.2 11.9 11.9 11.6 11.6 4.6 4.6 4.0 4.0 -6.8 -6.8 4.9 4.9 58.1 58.1 -19.1 -19.1 .0 .0 21.8 21.8 -17.9 -17.9 3.6 3.6 -8.8 -13.5 -13.5 -15.6 .0 .0 -5.3 -2.8 -2.8 40.0 40.0 20.4 20.4 -5.1 -5.1 -12.5 -12.5 14.3 14.3 51.8 51.8 4. (7.8 - 8.5 ) = .7, y (7.8 8.5) = .7, Y - - =-8.2% = -8.2% 5. Sears = 1.05 (ingreso) -- 0.0694 (desempleo) 0.0694 (desempleo) Sears = 1.05 (ingreso) = 1.05( 10.1) -- 0.0694( - 8.2) 1.05(10.1) 0.0694( 8.2) 11.174% cambio estimado o porcentaje de = 11.174% cambio estimado o porcentaje de íncremento en las ventas de Sears incremento en las -.7 8.5 Y(l994) = Y (1993) AY (1994) + Y (1993) 6. Y(1994) = Y(1993) x x I1Y (1994) + Y(1993) = 13 640 x .11174 + 13 640 13640 .11174 13 640 1 + 13,640 = 1 524 + 13,640 = 15 164, pronóstico de ventas de Sears en 15 164, región occidental la region occidental La estirnación de las ventas de Sears en la region occidental para 1994 es de $15,164. Los estimación de las ventas de Sears región occidental para 1994 de $15,164. Los diversos errores estándar calculados para este modelo de regresión múltiple son válidos y se diversos errores estándar calculados para este modelo de regresión multiple son válidos y pueden utilizar para desarrollar intervalos de confianza. Si se desea mayor precisión, se pueden de confianza. Si se desea precision, se pueden introducir al modelo otras variables importantes (poblaciOn, número de tiendas, gasto de introducir al modelo otras variables importantes (población, nümero de tiendas, gasto de consumo e Indice de precios). consumo índice 392 Regresión de datos de series de tie mpo series de tiempo RegresiOn Capítulo 9 Cap Itulo 9 TABLA 9.7 SALIDA DE COMPUTO PARA EL CAMBIO PORCENTUAL CON RESPECTO AL AÑO ANTERIOR 9.7 CÓMPUTO PORCENTUAL CON RESPECTO AL AfJO ANTERIOR SEARS, INGRESO DISPONIBLE DESEMPLEO DE LAS VENTAS DE SEARS, INGRESO DISPONIBLE Y TASA DE DESEMPLEO The regression equation is equation is The SEARS = 1.05 INCOME - 0.0694 UNEMP SEARS INCOME - 0.0694 UNEMP cases 20 cases used 1 cases contain missing values 20 cases Predictor Noconstant INCOME UNEMP Coef Stdev t-ratio p p 1.05230 -0.06942 0.06942 0.08739 0.02874 12.04 -2.42 2.42 0.000 0.027 1.052 s = s = 0.02859 Analysis of Variance SOURCE Regression Error Total DF 2 2 18 20 DF SS 0.118511 0.014708 0.133219 SS SEQ SS 0.113745 0.004766 MS 0.059255 0.059253 0.000817 F F 72.52 P P 0.000 SOURCE INCOME UNEMP 1 1 1 1 Durbin-Watson statistic = 1.82 1. 82 TABLA 9.8 9.8 PROCEDIMIENTO DE PRONOSTICO PARA LAS VENTAS DE SEARS PRONÓSTICO PARA LAS VENTAS DE SEARS PROCEDIMIENTO x4 X4 dY A0 AÑO 1993 1994 y Y 13,640 15,1646 15,1646 X, X2 1,076.7 1,185.0 1 1,185.0' X3 X3 X5 dX 2 9.5 I0.1 10.1 3 X6 dX1 51.8 -8.2 4 8 .2 8.5 7.82 7.8 2 4.0 11.1745 Nota: Los exponentes se refieren a los pasos en el texto. pasos en el texto. Nota: MODELOS AUTORREGRESIVOS MODELOS AUTORREGRESIVOS correlación entre observaciones adyacentes. A este método se conoce como modelo correlación entre observaciones adyacentes. A este método se le conoce como modelo Se retrasa la variable autorregresivo. Se retrasa la variable dependiente uno o más periodos y se utiliza como una periodos utiliza como una variable independiente. Por ejemplo, en la Reynolds Metals, ~ retrasa un variable independiente. Por ejemplo, en Ia ventas de Reynolds Metals, 1', se retrasa un periodo se utiliza con el ingreso personal como una variable independiente. Este periodo y se utiliza junto con el ingreso personal como una variable independiente. Este modelo se escribe modelo Una forma de resolver problema de correlación serial consiste en aprovechar la Una fonna de resolver el el problema de correlación serial consiste en aprovechar la Modelos autorregresivos 393 Y, = b0 + b2X2 + b3X3 en donde X3 = 1', - I X3 Y, _ (9.4) Un modelo autorregresivo expresa un pronóstico como como una función de valores Un modelo autorregresivo expresa un pronóstico una función de valores previos de esa serie tiempo. previos de esa serie de de tiempo. Ejemplo 9.5 En la tabla 9.1 se presentan los datos para el modelo de la ecuación 9.4. Nótese que se pierde 9.1 modelo de ecuación 9.4. Nótese que año de datos, ya que no se conocen las ventas de Reynolds para 1972. tamaño de la un año de datos, ya que no se conocen las ventas de Reynolds para 1972. El tamaño de Ia muestra es de 20 en lugar de 21. muestra es de modelo regresión múltiple presentan la Los resultados de Ia ejecución de este modelo de regresión mñltiple se presentan en la resultados la ejecución 9.9. La estadística de Durbin-Watson mejora a 1.92. Sin embargo, la estadística de tabla 9.9. La estadIstica de DurbinWatson mejora a 1.92. Sin embargo, la estadfstica de Durbin-Watsonno deberla emplearse cuando una variable dependiente retrasada aparece como DurbinWatson no debería emplearse cuando una variable aparece como lugar debe variable independiente, ya que tiende a presentar una desviación hacia arriba. En su lugar debe la estadIstica h de Durbin, para efectuar pruebas de residuos correlacionados en forma utilizarse Ia estadística h de Durbin, para efectuar pruebas de residuos correlacionados en forma serial. Reynolds Metals para 1994 La estimación de ventas de Reynolds Metals para 1994 es $2 607 000. estimación de ventas Y = 'I994 I994 .666 - .37X., + l.127X1 666 .37X 2 + 1.127X 3 donde X 3 Y1993. De modo que, en donde X3 = Y1993. Demodo que, .666 - .37( 1,185) + 1.127(2,702) = 2,607 }994 = .666 - .37(1,185) + 1.127(2,702) = 2,607 1'1994 matriz correlación en la tabla 9.9 lleva conclusión que revisión Una revision de la matriz de correlación en Ia tabla 9.9 nos lieva a la conclusion de que pudiera haber problema de colinealidad. alta interrelación entre variables indepudiera haber un problema de colinealidad. La alta interrelación entre las variables independientes, r23== .986, indica que es probable que estén explicando la misma varianza en la .986, indica que es probable que explicando la pendientes, r23 variable dependiente. El problema de colinealidad se hace obvio cuando se analiza el variable dependiente. El problema de colinealidad se hace obvio cuando se analiza el regresión de la variable ingreso personal disponible, b2 = .37. Como Ia variable coeficiente de regresiOn de la variable ingreso personal disponible, b2 = -- .37. Como la variable de ingreso muestra una relación positiva alta con las ventas, rl2 = .968, el coeficiente de de ingreso muestra una relación positiva alta con las ventas, r12 = .968, el coeficiente de única variable independiente regresión no es significativo. El modelo se podría mejorar regresiOn no es significativo. El modelo se podrIa mejorar si la ünica variable independiente fuera las ventas de Reynolds Metals retrasada periodo. Este modelo comprendería fuera las ventas de Reynolds Metals retrasada un periodo. Este modelo comprenderia un modelo autorregresivo de orden 1. Un modelo alternativo que se explicará en la exposición de alternativo que se explicará 10. las técnicas de Box-Jenkins en el cap. 10. las técnicas de BoxJenkins Mínimos cuadrados generalizados MInimos cuadrados Una forma de resolver problemas de autocorrelación consiste en desarrollar un modelo que fonna problemas de autocorrelación desarrollar un modelo que la reconozca Ia relación entre los residuos de una manera apropiada. Originalmente cada punto apropiada. ecuación de datos estaba representado por la ecuación 9.1., es decir Y, = /3+ f3X + = f3 0 + f3X, + E, 2 Methods, 2a. McGraw-Hill, 1972). 2 Johnston, Econometric Methods, 2a. Ed. (Nueva York: McGraw-Hill, 1972). 3 La estimación del ingreso personal disponible para esta region en 1994 es de $1,185. ingreso personal disponible esta región en 1994 es de $1,185. 394 Regresión de datos RegresiOn de datos de series de tiempo Capítulo 9 Cap Itulo TABLA 9.9 SALIDA DE CÓMPUTO PARA LAS VENTAS DE REYNOLDS METALS: TABLA 9.9 SALIDA DE COMPUTO PARA LAS VENTAS DE REYNOLDS METALS: MODELO AUTORREGRESIVO MODELO VARIABLE NO. NO. 2 3 MEAN STANDARD DEVIATION 0.179 0.348 CORRELATION X VS y 0.96792 0.98769 STANDARD REGRESSION STD. ERROR STD. COEFFICIENT OF REG. COEF. OF REG. COEF. -0.370 1.127 0.40752 0.20928 COMPUTED T VALUE -0.91 5.38 X 2.709 3.041 DEPENDENT 1 1 3.089 0.331 0.666 INTERCEPT STD. ERROR OF ESTIMATE STD. ESTIMATE MULTIPLE CORRELATION R SQUARE R CORRECTED R SQUARED R 0.98826 0.97665 0.97390 0.05346 1.91897 STATISTIC DURBIN-WATSON STATISTIC ANALYSIS OF VARIANCE FOR THE REGRESSION SOURCES SOURCES OF VARIATION ATTRIBUTABLE TO REGRESSION REGRESSION REGRESSION DEVIATION FROM REGRESSION TOTAL DEGREES OF FREEDOM OF SUM OF SQUARES SQUARES 2.032 0.049 2.081 MEAN SQUARES 1.016 1.016 0.003 F VALUE 355.544 2 2 17 19 3 3 BY 3 CORRELATION MATRIX: MATRIX : VAR. VAR. 1 1 2 2 3 3 1 2 2 0.968 1.000 0.986 3 3 1.000 0.968 0.988 0.988 0.986 1.000 0.968 0.988 0.986 OF RESIDUALS TABLE OF RESIDUALS CASE NO. NO. Y Y VALUE 2.60206 2.59106 2.62839 2.73799 2.74429 2.79239 2.85733 2.94448 3.02119 3.11059 3.18412 3.20030 3.29226 3.32592 3.32551 3.39393 3.50501 3.56844 3.52022 3.43168 Y ESTIMATE Y 2.53630 2.67722 2.65926 2.69196 2.80920 2.81021 2.85536 2.92081 3.00590 3.07987 3.16809 3.24054 3.24639 3.33883 3.36319 3.34992 3.41481 3.52075 3.57848 3.51006 RESIDUAL 0.06576 -0.08616 -0.03087 0.04603 -0.06491 -0.01782 0.00197 0.02368 0.01529 0.03072 0.01603 -0.04024 0.04587 0.04587 -0.01290 -0.03768 0.04400 0.09020 0.04769 -0.05826 -0.07837 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 11 11 12 12 13 13 14 14 15 15 16 17 17 18 18 19 19 20 Modelos autorregresivos 395 Se necesita crear un nuevo modelo que reconozca que el término de error () está Se necesita crear un nuevo modelo que reconozca que el término de error (~) está constituído por una fracción del término de error previo más cierto efecto aleatorio. En la constituldo por una fracción del término de error previo más cierto efecto aleatorio. En la ecuación 9.2, el térrnino de error se escribió como ecuación 9.2, término de Et = pti + V1 o 0 V= en donde pE11 = correlación entre residuos p = correlación entre residuos V1= error aleatorio VI = error VI V1==~ cuando p = 0 E cuando p ü convierte en El nuevo modelo se convierte en = + [3X + pE11 + V1 (9.5) Si los residuos no estãn relacionados y p es igual a cero, el resultado es la ecuación residuos están relacionados y igual cero, el resultado es la ecuación Si es 9.1, esto es Y I = f3 + 13X + PE f _ {3o + {3X f 1 + Vf = {3o + 13X+ ÜE f _ 1 + {3X f + OE1 = {3o + {3X I + Vf =p0+/3X+V, = Vf {3o + f3X + Ef en donde V = Ef {3X f Vf Si p mayor Si los términos de error están relacionadosyy p es mayor que cero, es deseable términos de error están relacionados cero, es deseable la estmctura ténninos de error. reconocer Ia estructura relacionada de los términos de error. Si conoce p, puede utilizar una diferenciacion generalizada para ajustar Si se conoce p, entonces se puede utilizar una diferenciacion generalizada para ajustar procedimiento de mínimos cuadrados de modo que los términos de indeel procedimiento de mInimos cuadrados de modo que los términos de error sean independientes. Para describir este procedirniento, se emplea el hecho de que el modelo lineal, procedimiento, se que el modelo lineal, pendientes. periodos. ecuación 9.1, se mantiene para todos los periodos. En particular 9.1, = f3 + I3X1 + (9.6) Ahora, se puede transformar la ecuación multiplicando la ecuación 9.6 por p y Ahora, se puede transfonnar la ecuación multiplicando la ecuación 9.6 por p restándola de la ecuación 9.1. ecuación 9.1. Yf = P0 + f3X + {3o + (3X f P(Y f Yf - E f [Ecuación 9.1] l ) = P13() +P{3Xf _ 1 + + p,11 p{3o + pf3X1_1 PE f f f - [p X Ecuación 9.6] x 9.6] f f - P(Y l ({3o p{3o) + ({3X P{3X - p(Y11)) = (1 - p130) + (f3X - p13X1 l )) + (E Y;=130(1p)+13X+v, y; = (3o(l - p) + {3X; + Vf - pE f - l) [resta] (9.7) La ecuación transformada tiene un proceso de error que se distribuye indeLa ecuación transformada tiene un proceso de error que se distribuye independientemente con una media igual a cero y constante. De ahí pendientemente con una media igual a cero y una varianza constante. De ahI que la regresión 396 Regresión de datos de series de tiempo Capítulo 9 CapItulo ordinaria de mInimos cuadrados, aplicada a la ecuación 9.7, arrojará estimaciones válidas mínimos cuadrados, aplicada ecuación 9.7, arrojará estimaciones válidas de parámetros de regresión. Recuerde, las variables fueron transformadas a la forma parámetros regresión. Recuerde, las variables fueron transformadas a Ia forma Y; = Y -- pY111 y = Y¡ pY¡_ X = X pX¡_1 X; = X¡ -- pX1 La ecuación 9.7 se puede reescribir como = y;= f3 ~ + f3X ; + + V¡ (9.8) la ecuación 9.8 se le llama versión generalizada de mínimos cuadrados de la ecuación A la ecuación 9.8 se le llama version generalizada de minimos cuadrados de la ecuación 9.7, en donde 9.7, 1. El término de error no está correlacionado en forma serial. 2. El coeficiente de regresión /3es el mismo que el coeficiente de regresión en la ecuación f3 es original correlacionada en forma serial, ecuación 9.1. fonna Primera diferenciación Un procedimiento de estimación que se utiliza comünmente, conocido como priinera Un procedimiento de estimación que se utiliza comúnmente, conocido como primera diferenciación, supone que p es igual a 1. Si P = 1, el modelo transformado de la ecuación dferenciación, supone que p es igual a 1. Si p = 1, el modelo transformado de la ecuación 9.7 se convierte en 9.7 Y=/30(l p)+f3X4-1 p) + f3X; + 1) + f3X; + = f3X; + =130(ll)+I3X+E=PX+E, E¡ E¡ E¡ (9.9) Por lo tanto, se deriva que ci coeficiente de regresión B se pueda estimar mediante el método el coeficiente de regresión 13 estimar mediante el método de mínimos cuadrados para efectuar la regresión a través de mInimos cuadrados para efectuar la regresión a través del origen con las variables origen con las variables transformadas y; = = Y¡ - pY¡-1 - X = X pX¡_1 X; = X¡ -- pX11 Nótese que estas variables transforrnadas son primeras diferencias. Este enfoque resulta estas variables transfonnadas son primeras diferencias. Este enfoque Nótese diversidad de aplicaciones. efectivo para una diversidad de aplicaciones. Ej emplo Ejemplo 9.6 contiene las variables transformadas y La tabla 9.10 contiene las variables transformadas y; y X; , basadas en la transformación de , basadas en primeras diferencias para las ventas de Sears en la región occidental. El cuadro también primeras diferencias para las ventas de Sears en la region occidental. El cuadro también contiene los cálculos para estimar la regresiOnlineal aa través del origen. Nótese que el contiene los cálcuios para estimar la regresión lineal través del origen. Nótese que coeficiente estimado de regresión, b = .0117, es similar al obtenido con mInimos cuadrados similar al obtenido con mínimos cuadrados coeficiente estirnado de regresión, b ordinarios aplicados a las variables originales, b = .014. Sin embargo, ci error estándar del embargo, el estándar ordinarios aplicados a las variables originales, b = .014. .00032. coeficiente considerablemente coeficiente de regresión, Sb = .00114, es considerabiemente mayor que Sb = .00032. Probaregresión, Sb = .00114, blemente es más preciso ci nuevo error estándar del coeficiente de regresión Sb = .00114. El el nuevo error estándar del coeficiente de regresión Sb El blemente error estándar original, Sb = .00034, para los mInimos cuadrados ordinarios aplicados a las original, Sb = .00034, para mínimos cuadrados ordinarios aplicados las variables originales es probable que subestime el verdadero error estándar debido aa la variables originales es probable que subestime el verdadero error estándar debido la correlación serial. correlaciOn Modelos autorregresivos 397 TABLA 9.10 DATOS TABLA 9.10 DATOS PARA EL EJEMPLO 9.6: CALCULOS DE REGRESION LINEAL A TRAVES DEL ORIGEN CÁLCULOS DE REGRESiÓN LINEAL TRAVÉS DEL ORIGEN LA PRIMERA DIFERENCIACiÓN REGiÓN DE LA PRIMERA DIFERENCIACION PARA LAS VENTAS DE SEARS EN LA REGION OCCIDENTAL VENTAS DE VENTAS, Y INGRESO DISPONIBLE, AÑO ANO 1973 1974 1975 1976 1976 1977 1978 1979 1980 1981 1982 1983 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 (000) (000) X x 273.4 291.3 306.9 317.1 336.1 349.4 362.9 383.9 402.8 437.0 472.2 510.4 544.5 588.1 630.4 685.9 742.8 801.3 903.1 983.6 1,076.7 LX'Y' b=--I_I b Y't X't X'Y' x;Y',t t (X ;)2 (X) (Y~ - -bX)2 (Y', bX~)2 3.307 3.556 3.601 3.721 4.036 4.134 4.268 4.578 5.093 5.716 6.357 6.769 7.296 8.178 8.844 9.251 9.25 1 10.006 11.200 12.500 13.101 13.640 .249 .045 .120 .315 .098 .134 .310 .515 .623 .641 .412 .527 .882 .666 .407 .755 1.194 1.300 .601 .539 17.9 15.6 10.2 19.0 13.3 13.5 13.5 21.0 18.9 34.2 35.2 38.2 34.1 43.6 42.3 55.5 55.5 56.9 56.9 58.5 58.5 101.8 101.8 80.5 80.5 93.1 Totales Totales 4.5 .7 1.2 1.2 6.0 1.3 1.8 1.8 6.5 9.7 21.3 22.6 15.7 18.0 38.5 28.2 22.6 43.0 69.8 132.3 48.4 50.2 -542.3 320.4 243.4 104.0 361.0 176.9 182.3 441.0 357.2 1,169.6 1,239.0 1,459.2 1,162.8 1,901.0 1,789.3 1,789.3 3,080.3 3,237.6 3,422.3 10,363.2 6,480.3 8,667.6 46,158.4 -- .0016 .0189 .0000 .0086 .0033 .0006 .0041 .0864 .0497 .0525 .0012 .0164 .1383 .0293 .0587 .0080 .2596 .0119 .1162 .3028 .315 3,422 1.300 1,076.7 1.1681 = L(X~)2 (X')2 542.3 =~=.0117 .0 117 46,158.4 s h2 = 2 SI, k(Y; - hYç)2/(n -- 1) bY;)2/(n 1) (Y - (X)2 "L(XY = .0614789 1.1681/19 = .0000013 .0000013 = 46,158.4 46,158.4 S = .00114 Sh = I, Los comandos Minitab para resolver este problema son > READ ·SEARS.DAT' C1 C2 MTB > READ 'SEARS.DAT' Cl C2 21 ROWS READ 21 ROW 1 1 2 2 3 3 4 4 Cl C1 C2 3307 3556 3601 3721 273.4 291.3 306.9 317.1 398 Regresión de datos de series de tiempo RegresiOn de datos de series de tiempo Capítulo 9 CapItulo > MTB > > MTB > MTB > NTB > MTB > > SUBC> SUBC> 1 FOR C1, STORE IN C3 DIFFERENCES 1 FOR Cl, STORE IN C3 1 FOR C2, STORE IN C4 DIFFERENCES 1 FOR C2, STORE IN C4 C3 'SEARS' C4 'INCOME' NAME C3 'SEARS' C4 'INCOME' REGRESS C3 1 PREDICTOR C4; C3 1 C4; NOCONSTANT. regression equation is The regression equation is SEARS = 0.0117 INCOME SEARS = 0.0117 20 cases used 1 cases contain missing values contain values 20 cases used Predictor Coef Nonconstant 0.0"11747 INCOME 0.011747 Stdev 0.001154 t-ratio 10.18 p p 0.000 0.001154 s = s = 0.2479 of Variance Analysis of Variance SOURCE Regression Error Total OF DF 1 1 19 20 SS 6.3696 1.1679 7.5375 MS 6.3696 0.0615 F 103.62 p P 0.000 Enfoque Enfoque iterativo enfoque iterativo también comprende la transformación de El enfoque iterativo también comprende Ia transformaciôn de las variables originales que la ecuación 9.8. se mostraron en la ecuación 9.8. y; = Y - pY1 = pY X = X X; = X1 - pX11 pX t t - 1 t - t - 1 Este proceso se basa en el modelo transformado, ecuación 9.7, la cual se puede resolver proceso el modelo transformado, ecuación 9.7, la cual se puede resolver de mínimos modelo transformediante métodos oridinarios de mInimos cuadrados. Por desgracia, el modelo transformado Y = ,B(l - p) + + se puede utilizar directamente ya que se desconoce el parámetro de autocorrelación p, no se puede utilizar directamente ya que se desconoce el parámetro de autocorrelación p, obtener variables transfonnadas la ecuación 9.8. Sin embargo, se han necesario para obtener las variables transformadas de la ecuación 9.8. Sin embargo, se han desarrollado técnicas para estimar p. En el libro Econometric Models and Economic el libro Econometric Models and Economic desarrollado técnicas para estirnar p. Forecasts de Pindyck Rubinfeld,4 se exponen diversos enfoques. Estos enfoques utilizan Forecasts de Pindyck yyRubinfeld,4 se exponen diversos enfoques. Estos enfoques utilizan lo general la noción de que p es un coeficiente de correlación asociado con errores de por lo general la noción de que p es un coeficiente de correlación asociado con en-ores de 4 R. S. Pindyck y D. L. Rubinfeld, Econometric Models and Economic Forecasts (Nueva York: McGraw-Hill, D. L. Rubinfeld, Econometric Models Economic McGraw-Hill, R. 1976,1976), 108-113. 1976, 1976), pp. 108-113. Modelos autorregresivos 399 periodos adyacentes. El enfoque iterativo no siempre funciona, debido que se tiende periodos adyacentes. El enfoque iterativo no siempre funciona, debido aa que se tiende a de autocorrelación subestimar el parámetro de autocorrelación p. Cochrane y Orcutt desarrollaron uno de los procedimientos más populares para Cochrane y Orcutt desarrollaron uno de los procedimientos más populares estimar en la presencia de la correlación serial de primer orden. Este procedimiento estimar p en la presencia de la correlación serial de primer orden. Este procedimiento iteración posterior resulte en iterativo produce estimaciones sucesivas de iterativo produce estimaciones sucesivas de p hasta que una iteración posterior resulte en mínimo. un cambio mInimo. Este enfoque emplea la noción de que p es un coeficiente de correlación errores de periodos adyacentes. asociado con errores de periodos adyacentes. La estimación inicial de p se deriva de los residuos utilizando la ecuación 9.10. se deriva de los residuos utilizando la ecuación 9.10. t2 ee,_1 (9.10) e_ t=2 p se sustituye por p en la ecuación 9.7, formando El valor p se sustituye por p en Ia ecuación 9.7, formando YH130(1j5)+f3X'+v (9.11) (9.11 ) ecuación estimada transformada valores de parámetros para la intersección La ecuación estimada transformada arroja valores de parámetros para Ia intersección los coeficientes de regresión (/3b . f3k)' Estas original (/31) y para todos los coeficientes de regresión (J3, .. . . , /3k).Estas estimaciones (/3k) revisadas de parámetros se sustituyen en la ecuación original y se obtienen nuevos residuos. se sustituyen en la ecuación original y se obtienen nuevos residuos. Los nuevos residuos estándar se calculan mediante la ecuación 9.12. calculan €, = Y, - ~l regresión Mediante la ejecución de la regresión ~2X =Y1f2x22 - ••• - ~kX k 13kXk (9.12) = pt_1 + V1 se pueden utilizar estos residuos de segunda ronda para obtener una nueva estimación de estos residuos de segunda ronda para obtener una nueva estimación de La segunda estimación de se compara con la primera y, estos valores son p. La segunda estimación de p se compara con la primera y, si estos valores son razonablemente cercanos, se emplea Ia segunda estimación, si no, razonablemente cercanos, se emplea la segunda estimación, si no, se hace otra iteración. Ej emplo Ejemplo 9.7 Minitab resultados del variable independiente La salida de cómputo de Minitab muestra los resuitados del uso de la variable independiente el enfoque ordinario de mínimos ingreso personal, para predecir las ventas de Sears ingreso personal, para predecir las ventas de Sears con ci enfoque ordinario de minimos Sears ecuación de predicción es cuadrados. cuadrados. Si los datos de Sears se ejecutan en miles de dólares, la ecuación de predicción es y = - .524 .014X Y= .524 ++.014X en donde Sb Sb = .0003185 t= 44.1 t = 44.1 r2 ?- = .99 DW= .63 .63 400 Regresión de datos de series de tiempo RegresiOn de datos de series de Capítulo 9 Cap Itulo Si se emplean los mínimos cuadrados generalizados (utilizando el método Cochrane -- Orcutt), mInimos cuadrados generalizados (utilizando el método Cochrane Orcutt), el resultado es y = 2.34 + .010933X Y= 2.34 + .010933X en donde Sb = .00137 Sb= .00137 t = 7.96 t= 7.96 ? = .78 P = .936 p= .936 2 Los resultados para este ejemplo se muestran en el ejemplo de TSP al final del capítulo. Nótese se muestran en el ejemplo de TSP al final del capitulo. Nótese que Ia estimación final de p es .936, lo que significa que Y se ejecutó en realidad como la estimación final de es .936, lo que significa que Y realidad como = = Yr -- .936 Y,...1 y X como X; - 936X_ . Cuando se compara la ecuación generalizada de mInimos 936.\';_1. Cuando se compara la ecuación generalizada de mínimos Y. .936Yr _ 1 Y ha cuadrados con Ia ecuación ordinaria de mínimos cuadrados, se observa que el valor de t ha cuadrados con la ecuación ordinaria de mInimos cuadrados, se observa que el valor disminuido. Este resultado tiene sentido, ya que una de las consecuencias de Ia correlación una de las consecuencias de la correlación disminuido. Este resultado tiene sentido, ya serial es que los mInimos cuadrados ordinarios subestiman el error estándar del coeficiente de los mínimos subestiman el regresión. hecho, correlación evitar cometer errores de regresión. De hecho, una razón para ajustar la correlación serial es evitar cometer errores de inferencia debidos a valores muy altos de t. Por último, la correlación serial no provoca ninguna t. ültimo, desviación en la estimación del coeficiente de regresión; sin embargo, se incrementa la cantidad la que cualquier estimación dada difiere de la verdadera /3. La solución de mínimos en la que cualquier estimación dada difiere de La verdadera fi. La solución de mInimos cuadrados generalizados (.010933) proporciona aproximadamente el mismo resultado que con (.010933) proporciona aproximadamente el mismo resultado que con el método ordinario de mInimos cuadrados (.014). ordinario de mínimos cuadrados (.014). y; frecuencia los Al aplicar el análisis de regresión a las series de tiempo de datos, con frecuencia los residuos correlacionan. Los problemas surgen debido a que el análisis de regresión residuos se correlacionan. Los problemas surgen debido a que el análisis de regresión supone que los residuos son independientes. situación describe con el término supone que los residuos son independientes. Esta situación se describe con el término La ,,). de un modelo que contiene correlación serial es artificialmente correlación serial. La r2 de un modelo que contiene eorrelación serial es artificialmente alta; además, error estándar subestima seriamente Ia variabilidad de los alta; además, el error estándar subestima seriamente la variabilidad de los residuos y los regresión ineficientes. coeficientes de regresiOn se vuelven ineficientes. principal de autocorrelación en los residuos es la omisión de una Una causa principal de autocorrelación en los residuos es la omisión de una o más variables eve. Por regular, esta omisión significa que una parte importante la variables clave.Por lolo regular,esta omisión significa que una parte importante de la variable variación de la variable dependiente no ha sido explicada. Cuando los efectos de secuencia en tiempo de una variable faltante se relacionan en forma positiva, los residuos se en el tiempo de una variable faltante se relacionan en forma positiva, los residuos se autocorrelacionan, pues incluyen los efectos de Ia variable faltante. La mejor solución a este la faltan te. variable faltante incluirla el modelo. problema consiste en buscar la variable faltante para incluirla en el modelo. APLICACIÓN A LA ADMINISTRACIÓN APLICACION ADMINISTRACION Para este capItulo también son apropiadas las aplicaciones descritas en el cap. 8. Sin Para este capítulo también son apropiadas las aplicaciones descritas en el cap. 8. Sin embargo, las técnicas descritas en este capítulo permiten al analista detectar y corregir el embargo, las técnicas descritas en este capitulo permiten al analista detectar y corregir el problema de correlación serial. De esta forma, se fortalece la capacidad de la administración para manejar series de tiempo de datos. El resultado neto es que la administración puede resultado neto la administración manejar series de tiempo de datos. Fórmulas clave FOrmulas dave 401 mayor variedad datos dependientes del tiempo y tratar con una mayor variedad de datos dependientes del tiempo y sentir la confianza de que las predicciones son sensatas. Las areas en las que estas técnicas tienen una utilidad predicciones sensatas. Las áreas las que estas técnicas tienen una utilidad que particular son: Pronóstico de ventas Pronóstico Proyección de costos de materias prirnas materias primas Proyección Estimaciones requerimientos de Estirnaciones de requerimientos de personal Proyección de precios de acciones y bonos Proyección de precios Proyección de penetración de nuevos nuevos Proyección productos Estudios de la relación publicidad-ventas Estudios de la relación publicidadventas Control Control de inventarios Ninguna de las aplicaciones anteriores es nueva ni representa algo que no se hubiera aplicaciones anteriores es nueva ni representa algo que no de No obstante, las herramientas empleadas en las proyecciones son podido enfrentar antes. No obstante, las herramientas empleadas en las proyecciones son más complejas y proporcionan respuestas rnãs válidas y confiables. De manera especifica, respuestas más válidas manera específica, rnás complejas lo regular se deben encontrar soluciones al problema de la correlación serial, que por lo regular se deben encontrar soluciones al problema de correlación serial, que acompai1a la regresión de la variable dependiente de una sel;e de tiempo. tiempo. acornpaña la regresión de la variable dependiente de una seie GLOSARIO Correlación serial Existe correlación serial cuando las observaciones sucesivas a través Existe correlación serial cuando las observaciones sucesivas a través del tiempo se relacionan entre 51. relacionan entre sí. Modelo autorregresivo Un modelo autorregresivo expresa un pronóstico como una Un modelo autOlTegresivo expresa un pronóstico como una Modelo función de los valores previos de esa serie de tiempo. serie de tiempo. función de FÓRMULAS CLAVE FORMULAS CLAVE Modelo lineal mínimos Modelo lineal ordinario de mInimos cuadrados Correlación serial de primer orden Correlación serial Y, = f3 0 + f3X + f3X, Y + Vt E, (9.1) (9.2) ft = n (e - e,_1)2 Estadística de Durbin - Watson EstadIstica de Durbin - Watson DW= t=2 DW = ¿ e; t=l n (9.3) Modelo autorregresivo Modelo + b2X 2 Y, = bo + b2X2 + b3Y_11 b3 Yt Y= (9.4) pE t _ 1 Correlación serial Correlación serial de primer orden Y, f3X, Y = f3 0 + f3X + + v, (9.5) (9.6) (9.7) Modelo lineal ordinario de mInimos cuadrados: periodo previo mínimos periodo previo Modelo lineal + E'_l = f3 0 = I3 + f3X'_1 + ct-I Modelo lineal ordinario transformado de mmnimos cuadrados ordinario transformado de mínimos Y,-l Y0(1p)+f3X+V Y~ = f3 o(1 - p) + f3X~ + v t 402 Regresión de datos RegresiOn de datos de series de tiempo Capítulo 9 CapItulo MInimos cuadrados generalizados y~ = f3 ¿ + I3X + v Mínimos generalizados Y = f3 f3X~ v, Modelo de primera diferenciación primera diferenciación f3X = f3X~ (9.8) (9.9) n +E E, t=2 n I L e,e'_1 tt-1 Estimación inicial de p de CochraneOrcutt Estimación inicial de p de Cochrane-Orcutt p= (9.10) Modelo lineal de Cochrane-Orcutt Modelo lineal de CochraneOrcutt Residuos estimados de CochraneOrcutt Residuos estimados de Cochrane-orcutt y~ = f3 o(1 - p) + f3X~ + v, 13)+f3X'+v (9.11) I3kXk (9.12) Coeficientes estandarizados Coeficientes (9.13) \S PROBLEMAS 1. ¿Por qué es un problema la correlación serial al analizar series de tiempo de datos? serial datos? j,Por qué ,Cuá1 es Ia causa principal la correlación serial? 2. ¿Cuál es la causa principal de Ia correlación serial? 3. ¿Qué suposición fundamental se no se satisface con rnás frecuencia al analizar variables de series se con más de series ,Que de tiempo? 4. ¿Qué estadIstica se emplea para detectar la correlación serial? detectar la correlación serial? ,Que estadística 5. Usted prueba una serie de 32 observaciones con dos variables independientes al nivel de Usted prueba una serie de 32 observaciones con dos variables independientes al nivel significación de .01, y la estadística calculada de DurbinWatson es igual 1.0. Cuá1 es significación de .01, Y Ia estadIstica calculada de Durbin-Watson es igual a 1.0. ¿Cuál es su conclusión? conclusion? 6. Usted prueba una serie de 61 observaciones con una variable independiente al nivel de Usted prueba una serie de 61 observaciones con una variable independiente al nivel de su significación de .05, y Ia estadIstica calculada de Durbin-Watson es igual a 1.6. j,Cuál es su significación de .05, y la estadística calculada de DurbinWatson es igual 1.6. ¿Cuál con clusión? conclusión? 7. ¿Cómo se elimina el problema de correlación serial? COmo se elimina el problema de correlación serial? 8. ¿Cómo funciona un modelo autorregresivo? modelo autorregresivo? ,Cómo funciona 9. ¿Cómo trabajan las técnicas de primera diferenciación e iterativa en Ia resoluciOn de diferencias iterativa en la resolución ,Cónio correlación de correlaciOn serial? 10. Tamson Russell, una econornista que trabaja para el gobierno, intenta determinar la funciOn de función de Tamson Russell, una economista que trabaja Tamson desarrolló un modelo demanda de combustible para automOviles de pasajeros en EUA. Tanison desarrolló un modelo automóviles de pasajeros en dernanda real regular, para predecir el consumo que empleaba el precio real por galón de gasolina regular, para predecir el consumo por año de combustible para motores. Con este modelo, ella sólo explicar 83.5% de la varianza. combustible para motores. Con este modelo, ella solo pudo explicar el 83.5% de la varianza. Tamson decidió agregar al modelo una variable que representara la población EUA. Tamson decidió agregar al niodelo una variable que representara la poblaciOn de EUA. Determine correlación serial. Los datos se muestran en Ia tabla P.10. Detemline si existen problenias de colTelaciOnserial. Los datos se muestran en la tabla P.1 o. problemas Capítulo CapItulo 9 Problemas 403 TABLA P.10 P.10 COMBUSTIBLE PARA MOTOR CONSUMIDO POR AUTOMOVILES AUTOMÓVILES CONSUMIDO (MILES (MILES DE MILLONES DE GALONES) MILLONES AÑO A1O 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 Y Y PRECIO DE DE LA GASOLINA POBLACION DE EUA POBLACIÓN EUA (MILLONES) X2 X2 .39 .53 .57 .59 .62 .63 .86 1.19 1.33 1.26 1.22 1.21 1.16 .92 .95 .95 X3 X3 211.9 213.9 216.0 218.0 220.2 222.6 225.1 227.7 230.1 232.5 234.8 236.3 238.5 240.7 242.8 245.1 78.8 75.1 76.4 79.7 80.4 81.7 77.1 71.9 71.0 70.1 69.9 68.7 69.3 71.4 70.6 71.7 Fuente: Statistical Abstract 01 the United States, varios años. Fuente: of States, 11. Se solicita a Decision Science Associates que realice un estudio de factibilidad para un hotel de factibilidad hotel de destino propuesto a ubicarse a 2.4 kilómetros de la presa Grand Coulee. Mark Craze no está Grand Coulee. está destino propuesto a ubicarse a kilómetros de satisfecho con el modelo de regresión que utilizó el precio de un galón de gasolina regular para regresión que utilizó el precio de un galón regular satisfecho con el modelo predecir el número predecir el nümero de personas que acudirian al centro de visitantes de la presa. Después de personas que acudirían al centro visitantes la presa. Después de graficar los dispersión, variable ficticia graficar los datos en un digrarna de dispersion, Mark decide utilizar una variable ficticia para un digrama representar celebraciones importantes en el área general. Mark usa un 1 para representar una representar celebraciones importantes en ci area general. Mark usa un 1 para representar una celebración y un O cuando no la hay. Nótese que el 1 en los datos de 1974 representa Ia Feria celebración y un 0 cuando no hay. Nótese que 1 en los datos de 1974 representa la Mundial Expo Mundial Expo 74, celebrada en Spokane, Washington, el 1 en 1983 representa la celebración celebrada en Spokane, Washington, el 1 1983 representa la celebración del quincuagésimo aniversario de Ia presa Grand Coulee y, del quincuagésimo aniversario de la presa Grand Coulee y, el 1 en 1986 representa Ia Feria 1986 representa la Mundial celabrada en Vancouver, Canada. Mark también decide utilizar el periodo como variable Canadá. de predicción. Escriba un reporte para que Mark presente a su jefe. Indique si hay problemas de correlación correlación que Mark presente a sujefe. Indique serial. serial. Señale también qué información adicional serla importante para decidir si se recomienda información adicional sería se recomienda la construcción de ese hotel. hotel. Ia construcción 12. Jim Jackson, un analista de precios de Ia Washington Water Power Company está preparando analista de precios de la Washington Water Power Company está preparando una caso de tarifas y necesita pronosticar el ingreso por consumo eléctrico residencial para 1993. necesita 1993. hora Jim decide investigar tres variables de predicción potenciales: uso residencial por kilowatt - hora potenciales: uso clientes de electricidad (kWh), cargo residencial por kWh (centavosIkWh) y, ci número (kWh), cargo residencial por kWh (centavos/kWh) y, el nümero de clientes de electricidad residenciales. Rei'ine datos de 1968 a 1992. Los datos se muestran en residenciales. Reúne datos de 1968 a 1992. Los datos se muestran en la tabla P.12. 404 TABLA P.11 TABLA P.11 Regresión de datos de series de tiempo RegresiOn de datos de series de Capítulo 9 Cap Itulo NUMERO DE NÚMERO VISITANTES A11O AÑO PERIODO PRECIO DE LA GASOLINA X X, CELEBRACION CELEBRACION y Y X2 1 1 2 3 4 5 6 7 8 8 9 10 11 12 13 13 14 X4 X4 0 1 1973 1974 1975 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 268,528 468,136 390,129 300,140 271,140 282,752 244,006 161,524 277,134 382,343 617,737 453,881 471,417 654,147 .39 .53 .57 .59 .62 .63 .86 1.19 1.31 1.22 1.16 1.13 .86 .90 o 1 0 o 0 o 0 o 0 o 0 o 0 o o 0 1 o 0 0 o 1 1 1 o 0 Fuente: Cou1ee Dam Visitors Center y Statistieal Abstraet 01 the United States, 1988. Fuente: Grand Coulee Darn Visitors Center y Statistical Abstract of the United States, 1988. TABLA P.12 P.12 A1O AÑO 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1981 1982 1983 1984 1985 1986 1987 1987 1988 1989 1989 1990 1991 1991 1992 1992 INGRESOS (MILLONES) Y Y 19.3 20.4 20.9 21.9 23.4 24.5 25.8 30.5 33.3 37.2 42.5 48.8 55.4 64.3 78.9 86.5 114.6 129.7 126.1 132.0 138.1 141.2 143.7 149.2 146.1 USO POR KwH CARGO (CENTAVOS/KwH) X X, NÚMERO DE NIIJMERO CLIENTES X4 X4 X2 X2 10,413 10,413 11,129 11,361 11,960 12,498 12,667 12,857 13,843 14,223 14,427 14,878 15,763 15,130 15,130 14,697 15,221 14,166 14,854 14,854 14,997 13,674 13,062 13,284 13,531 13,589 13,800 13,287 1.33 1.29 1.25 1.21 1.19 1.19 1.21 1.29 1.33 1.42 1.52 1.59 1.59 1.84 1.84 2.17 2.55 2.97 3.70 4.10 4.34 4.71 4.82 4.81 4.81 4.84 4.83 139,881 142,806 142,806 146,616 151,640 151,640 157,205 162,328 162,328 166,558 166,558 170,317 170,317 175,536 175,536 181,553 188,325 194,237 198,847 198,847 201,465 203,444 205,533 208,574 210,811 212,865 214,479 215,610 217,164 219,968 223,364 227,575 "Financia1 and Operating Supplement", Washington Water Annual varios años. Fuente: "Financial and Operating Supplement", Washington Water Power Annual Report, varios años. CapItulo Capítulo 9 Problemas Problemas 405 Jim testificó ante la comlsión de tarifas de Idaho y se le preguntó si habla problemas de tarifas Idaho se le preguntó si había problemas de testificó ante comIsión la respuesta y le pide envíe correlación serial. él no supo Ia respuesta y le pide a usted que envie una repuesta por escrito a correiación serial. él la comisión. Ia Power, preocupado la 13. Paul Raymond, presidente de Washington Water Power, esta preocupado por Ia posibilidad de Paul Raymond, presidente de Washington el hecho de que el número de accionistas comunes un intento de tomar el control y por el hecho de que el nümero de accionistas comunes ha un intento de tomar ci control y número de disminuido desde 1983. Le da a usted instrucciones de estudiar el niimero de accionistas disminuido desde 1983. Le da usted instrucciones de estudiar comunes desde 1968 y pronosticarlo para 1993. Usted decide investigar tres variables de comunes desde 1968 pronosticarlo para 1993. Usted decide investigar tres variables de predicción potenciales: ingresos por acción (comün), dividendos por acción (comün) y proporpotenciales: ingresos (común), dividendos (común) proporción de pago. Usted rene los datos de 1968 1992 que se presentan en la tabla P.13. ción de pago. Usted reúnelos datos de 1968 aa1992 que se presentan en la tabia P.13. TABLA P.13 TABLA P.13 ACCIONISTAS COMUNES Y Y 26,472 28,770 29,681 30,481 30,111 31,052 30,845 30,845 32,012 32,846 32,909 34,593 34,359 36,161 38,892 38,892 46,278 47,672 45,462 45,599 41,368 38,686 37,072 37,072 36,968 34,348 34,058 34,375 AÑO ANO 1968 1968 1969 1969 1970 1970 1971 1971 1972 1972 1973 1974 1974 1975 1976 1976 1977 1977 1978 1978 1979 1979 1980 1981 1981 1982 1982 1983 1984 1984 1985 1986 1986 1987 1987 1988 1989 1990 1991 1992 1992 INGRESOS POR ACCION ACCIÓN x2 X2 1.68 1.68 DIVIDENDOS POR ACCION ACCIÓN PROPORCIÓN PROPORCION DE PAGO xl X, X4 x4 72 73 73 72 71 71 1.21 1.28 1.28 1.70 1.70 1.80 1.32 1.36 1.36 1.39 1.44 1.86 1.86 1.96 1.96 2.02 2.02 2.11 2.42 2.42 2.79 2.79 2.38 2.38 2.95 2.78 2.78 2.33 3.29 3.29 3.17 3.17 3.02 3.02 2.46 2.46 3.03 3.03 2.06 2.06 2.31 2.31 2.54 2.54 2.70 3,46 3.46 2.68 2.68 2.74 2.74 1.49 1.53 1.53 1.65 1.76 1.94 1.94 2.08 2.16 2.28 2.40 2.48 2,48 2.48 2.48 2.48 2.48 2.48 2.48 2.48 2.48 2.48 71 63 55 74 61 75 93 69 76 82 101 82 120 107 98 92 72 93 91 Fuente: "Financial and Operating Supplement", Wash inglon Waler Power Annual Report, varios años. "Financia1 and Operating Supp1ement", Washington Water Annua1 Report, varios años. 406 Regresión de datos de series de tiempo RegresiOn de datos de series Capítulo CapItulo 9 a. Ejecute estos datos en la computadora y encuentre el mejor modelo de predicción. computadora predicción. b. ¿Hay en este modelo un problema de correlación serial? modelo problema correlación ,Hay problema correlación serial, memorando Paul que exponga las c. Si hay un problema de correlación serial, escriba un memorando para Paul que exponga las diferentes soluciones al problema de autocorrelación e incluya su recomendación final. soluciones a! problema su recomendación final. Thompson Airlines determinó 5% del número total de pasajeros locales que usan líneas 14. Thompson Airlines determinó que el 5% del nñmero total de pasajeros locales que usan lineas aéreas en EUA vuelan en aviones de Thompson. Se le asigna a usted la tarea de pronosticar el Thompson. aéreas EVA número de pasajeros que volará en Thompson Airlines en 1995. Los datos se presentan en Ia presentan en la niimero de pasajeros que volará en Thompson Airlines en 1995. Los tabla P.14. TABLA P.14 P.14 NÚMERO N1JMERO DE PASAJEROS (MILES) 22.8 26.1 29.4 34.5 37.6 40.3 AR0 AÑO 1962 1963 1964 1965 1966 1967 A1O AÑO 1968 1969 1970 1971 1972 1973 NUMERO NÚMERO DE PASAJEROS (MILES) 39.5 45.4 46.3 45.8 48.0 54.6 ANO AÑO 1974 1975 1976 1977 1978 1979 NUMERO DE NÚMERO PASAJEROS (MILES) 61.9 69.9 79.9 96.3 109.0 116.0 AÑO AI.TO 1990 1991 1992 1993 1994 NUMERO DE NÚMERO DE PASAJEROS (MILES) 117.2 124.9 136.6 144.8 147.9 a. Desarrolle un modelo de regresión de serie histórica, utilizando el periodo como variable inregresión serie histórica, como variable inel número de pasajeros como variable dependiente. dependiente y el nümero de pasajeros como variable dependiente. ,Están b. ¿Están los términos de error de este modelo dispersos de manera uniforme? error este modelo dispersos de manera uniforme? los términos error queden disperc. Transforme la variable nümero de pasajeros para que los términos de error queden dispernúmero sos de manera unifonne. SOS de manera uniforme. cómputo transformado d. Ejecute un prograrna de córnputo para el modelo transformado en el apartado c. programa e. ¿Son los términos de error independientes en Ia ejecución del modelo del apartado d? términos independientes la ejecución del modelo ,Son Si f. Si los términos de error son dependientes, (qué problemas se enfrentan al emplear este motém1inos dependientes, ¿qué problemas se enfrentan al emplear este modelo? g. Pronostique el número de pasajeros de Thompson Airlines para 1995. 1995. Pronostique el nümero pasajeros Airlines 15. La Thomas Furniture Company Ilega a Ia conclusion de que se puede mejorar la programaciôn La Thomas Fumiture Company llega a la conclusión de que se puede mejorar la programación de la producción desarrollando un método preciso de predicción de las ventas trimestrales. El producción desarrollando preciso de predicción de las ventas trimestrales. El analista de la cornpañIa, el Sr. Estes, decide investigar Ia relaciOn entre el número de permisos compañía, el la relación entre el nimiero de permisos analista Springfield. de construcción de casas habitaciOnyy las ventas de muebles en el area de Springfield. Estes construcción de casas habitación las ventas de muebles en el área piensa que los permisos se emiten entre lI y 2 trimestres antes de que se efectOen las ventas. pem1isos Sc erniten entre 2 trimestres antes de que se efectúen ventas. piensa que Además, él pregunta si las estaciones afectan las ventas de muebles. Estes decide considerar otra Adeniás, él pregunta silas estaciones decide variable independiente: independiente: x3 = 0 Si las ventas corresponden al primero o segundo trimestre o si las o segundo trimestre { Si las ventas corresponden al l si las ventas corresponden al tercer o cuarto trimestre trimestre 1 Capítulo 9 CapItulo 9 Problemas 407 Los datos se presentan en la tabla P.15. se presentan en la tabla P.15. TABLA P.15 P.15 VENTAS (EN MILES), ANO AÑO 1989 1990 PERMISOS X2 X2 TRIMESTRE 3 4 1 1 2 3 4 1 1 2 3 3 4 Y Y A1O AÑO 1992 VENTAS MILES), (EN MILES), Y Y TRIMESTRE 1 1 2 3 4 1 I 2 3 3 4 PERMISOS X2 X2 72 31 19 14 75 41 17 10 19 19 120 80 400 200 75 120 270 155 3 35 II 11 11 16 32 10 12 21 1993 1991 1991 120 150 660 270 200 280 800 320 a. Desarrolle un modelo de regresión que utilice los permisos de construcción como la variaDesarrolle un modelo regresión que utilice los permisos de construcción como ble de predicción. predicción. b. Pruebe si el modelo tiene autocorrelación. modelo tiene autocorrelación. c. Desarrolle un modelo de regresión que use tanto los permisos como el efecto estacional. Desarrolle un modelo de regresión que use tanto los permisos efecto estacional. d. ¿Es el modelo de regresión niñltip!e mejor que el modelo de regresión simple? (Pruebe con regresión múltiple mejor que el modelo de regresión simple? (Pruebe ,Es nivel de significación de .05.) un nivel de significación de .05.) ,Tiene e. ¿Tiene su mejor modelo un problema de autocorrelación? De ser así, ,cómo se puede corremodelo problema autocorrelación? De ser asi, ¿cómo se puede corregir? f. Pronostique las ventas de Thomas Furniture Company para 1994 por trimestres. Thomas Fumiture Company 1994 por trimestres. 16. Los datos de la tabla P.l6 muestran las ventas trimestrales ajustadas en forma estacional de 16. Los datos de la tabla P.16 muestran las ventas trimestrales ajustadas en forma estacional de Dickson Corporation y de la industria total para los ñltimos 20 trimestres. los últimos trimestres. Dickson Corporation y de industria total TABLA P.16 TABLA P.16 VENTASDE VENTASDE VENTAS DE VENTAS DE DICKSON LA INDUSTRIA DICKSON LA INDUSTRIA MILES), (EN MILLONES) (EN MILES), (EN MILLONES) VENTAS DE DICKSON (EN MILES), (EN VENTAS DE DE INDUSTRIA LA INDUSTRIA (EN MILLONES) MILLONES) A1O AÑO 1989 TRIMESTRE 1 1 2 3 4 4 1 1 2 3 4 4 1 1 2 Y Y 83.8 85.6 87.8 86.1 89.6 91.0' 91.0 93.9 94.6 96.4 96.0 X2 X2 AO TRIMESTRE AÑO TRIMESTRE 1991 1992 3 3 4 1 2 3 3 4 1 2 2 3 3 4 1 1 Y Y X2 37.1 36.6 37.6 38.3 39.3 40.2 41.1 41.4 41.1 41.4 1990 1991 31.8 32.5 33.2 32.4 33.8 34.3 35.3 35.7 36.4 36.3 1993 98.2 97.2 100.1 102.6 105.4 107.9 110.1 111.1 110.1 111.1 408 Regresión de datos de series de tiempo RegresiOn de datos de series Capítulo Cap itulo 9 a. Ajuste ci modelo de regresión lineal, obtenga los residuos y grafiquelos contra el tiempo. el modelo tiempo. ,Que ¿Qué es to que encuentra? lo encuentra? b. Calcule la estadIstica de Durbin-Watson y determine si existe autocorreiación. estadística de DurbinWatson y determine si existe autocorrelación. c. Estime el coeficiente de regresión b2 mediante ci enfoque de primera diferenciación. coeficiente regresión b 2 el enfoque de primera diferenciación. mediante difed. Estime el error estándar del coeficiente de regresión mediante el enfoque de primera diferenciación. e. ¿Son más precisas sus estirnaciones utilizando el enfoque de primera diferenciación? precisas sus estimaciones utilizando ci enfoque de pnmera diferenciación? Son Se hace un estudio para tratar de relacionar los ahorros personales el ingreso personal 17. Se hace un estudio para tratar de relacionar los ahorros personales con ci ingreso personal (en miles de miliones de dólares) para el periodo 1935-1954. Los datos se presentan en la tabia presentan en tabla miles de millones de dólares) para ci periodo 1935-1954. Los datos P.l? P.17. TABLA P.17 P.17 AHORRO PERSONAL, Y Y INGRESO PERSONAL, X AÑO ANO AÑO A11O AHORRO INGRESO PERSONAL, PERSONAL, Y Y X AHORRO INGRESO PERSONAL, PERSONAL, AÑO A1O Y X 1935 1935 1936 1937 1937 1938 1938 2 2 4 4 4 4 1 3 3 4 4 11 11 1939 1940 1941 60 69 74 74 68 73 78 96 1942 1943 1944 1945 1946 1947 1948 28 33 37 30 15 7 7 '3 13 123 123 151 151 165 165 171 171 179 191 191 210 1949 1950 1951 1952 1953 1954 9 13 13 18 19 19 20 19 19 207 279 257 273 288 290 a. Evalñe ci modeio de regresión simnple en el que se use ci mgreso personal para predecir el Evalúe el modelo regresión simnple en ci que el ingreso personal para predecir ci ahorro personal. En concreto, 1) haga una prueba de significación (a" .01) del coeficienahorro personal. En concreto, 1) haga una prueba de significación (a = .01) del coeficienregresión; pruebe la contribución de la variable ingreso personal a la predicción te de regresión; 2) pruebe la contribución de la variable ingreso personal a la predicción la (a = .01); hay autocorrelación. del ahorro personal utilizando Ia prueba F (a = .0 1); (3) pruebe si hay autocorrelación. ,Cómo ¿Cómo puede mejorarse ci modelo? el X3 = 0 b. Desarrolle una variable ficticia X3 para los años de guerra. Haga X 3 = O para los tiempos de ficticia X 3 para los aflos de guerra. 1941 a 1945. Ejey X3 paz y X3 = 1 para los tiempos de guerra. Se consideran años de guerra 1941 a 1945. Ejepara los tiempos de guerra. años cute un programa de córnputo para estc modelo de regrcsión mñltiple y evatñe los resuitaprograma cómputo este modelo regresión múltiple evalúe los resultaEspecíficamente, 1) determine silos años de guerra hacen una contribución dos. EspecIficarnente, 1) detem1ine si los aflos dc guerra hacen una contribución (a= .01); 2) pruebe importante a la predicción del ahorro personal (a= .01); 2) pruebe si hay autocorrelación. autocornlación. ¿Es el modelo de regresión múltiple mejor que el modelo de regresiónsimple? Es el modelo de regnsión multiple mejorque el modelo de rgrsión simple? 18. Use el método de CochraneOrcutt para corregir la correlación serial en los datos de Reynolds datos Reynolds Usc ci método de Cochrane-Orcutt para corregir la correlación serial del ejemplo 9.1. Metals dcl ejemplo 9.1. Cochrane-Orcutt para corregir la correlación serial en los datos de Novak 19. Utilice el método de CochraneOrcutt para corregir Ia correlación serial en los datos de Novak Utilice ci método Corporatión del ejemplo Corporation dci cjernplo 9.3. CASO DE ESTUDIO 9.1 COMPAÑíA DE SU ELECCIÓN LA COMPANIA DE SU ELECCIÔN Como se ha mencionado varias veces en este capítulo, las diversas variables en cada compañía, medidas capitulo, cornpafiIa, medidas y compañía. ellas, cada año, trimestre y mes, son mediciones vitales para la salud de la compañIa. Para cada una de elias, puede haber muchas otras variables que se encucntren altamcnte correlacionadas y que pudieran muchas otras variables que se encuentren altamente correlacionadas que pudieran proporcionar valiosas revelaciones poder de pronóstico. proporcionar valiosas reveläcioncs yypoder de pronOstico. Capítulo Cap Itulo 9 Caso de estudio 409 La finalidad de este caso de estudio es la de estimular la identificación de una importante variable de estimular la identificación de serie histórica para Ia compañía de su elección y analizar después los patrones en los datos mediante la conlpafiIa de su elección y analizar después los patrones en los datos mediante el análisis de correlación. Además, puede usted emplear programas de cómputo de análisis de regresión de correlación. usted emplear programas de cómputo de análisis de regresión para ver si se puede encontrar una buena ecuación de pronóstico. si se puede encontrar una buena ecuación de pronóstico. PREGUNTAS l. Identifique una companIa u organización de su interés, que sea una compafiIa local o nacional Identifique compañía organización interés, que sea una compañía local o nacional que tenga registros publicados, incluyendo Ia medición de variables de series de tiempo. la medición series de tiempo. que 2. Identifique una variable clave de Ia compañIa de su elección y registre sus valores para varios Identifique una variable dave de la compañía de su elección y registre sus valores para varios años, trimestres o meses. años, 0 3. Ya sea a mano o por computadora, calcule varios coeficientes de autocorrelación y grafiquelos a mano o por computadora, calcule varios coeficientes autocorrelación grafiquelos en un correlograma. un correlograma. 4. Con base en ci patron del correlograma, describa los patrones de su serie histórica. el patrón del correlograma, serie histórica. 5. Calcule una V retrasada y Ia primera diferenciación de sus datos, calcule los coeficientes de coeficientes Calcule una Y retrasada y la primera diferenciación de sus datos, autocon-elación, grafiquelos en correlograma resultantes. autocorrelación, grafiquelos en un correlograrna y describa los patrones resultantes. 6. Identifique diversas variables de pronóstico potenciales que usted piense que podrIan estar que podrían estar Identifique diversas variables de pronóstico potenciales que usted cOlTelacionadas con Ia variable dependiente. En el proceso puede utilizar los registros de la correlacionadascon la variable dependiente. En el proceso puede utilizar los registros de la compañía fuentes datos. compañIa junto con otras fuentes de datos. 7. Ejecute los datos en un programa de córnputo de análisis de regresión y obtenga una matriz de cómputo análisis matriz de Ejecute los datos correlación. Ensamble diversas combinaciones de variables de predicción que piense puedan puedan correlación. Ensamble diversas combinaciones de variables de predicción que tener éxito y ejecute un análisis de regresión para cada una. Vea si puede encontrar una buena análisis tener éxito regresión para cada una. ecuación de pronóstico para su variable dependiente. su variable dependiente. ecuación 8. Verifique su modelo para asegurarse de que no hay problemas de correlación serial Verifique asegurarse problemas correlación serial. CASO DE ESTUDIO 9.2 ESTUDIO 9.2 íNDICE DE ACTIVIDAD EMPRESARIAL DEL CONDADO DE SPOKANE INDICE DE ACTIVIDAD EMPRESARIAL DEL CONDADO DE SPOKANE Antes de 1973 el condado de Spokane, Washington, no tenla una medición actualizada de la actividad 1973 de tenía actualizada de la actividad empresarial en general. Sin embargo, lo que sucede en esta area como un todo, afecta cada negocio general. empresarial embargo, lo que área gobierno local, agencias de gobiemo e individuos. Los planes y políticas elaborados por una unidad económica planes poilticas elaborados por una unidad económica estarían incompletos sin algún conocimiento desempeño la economla la estarlan incompletos sin algün conocinhiento confiable de desempeflo reciente de Ia economía de Ia que la forma índice de Spokane serviría como un Ia unidad fornia parte. Un Indice de actividad empresarial de Spokane servirIa como i.m insumo vital en Ia formulación de estrategias y decisiones en organizaciones tanto públicas como privadas. püblicas la formulación Un Indice de actividad enipresaria! es un indicador de cambio relativo en las condiciones Un índice empresarial es un indicador de cambio relativo condiciones económicas generales dentro de una region deterniinada. A nivel nacional, el nivel producto económicas generales dentro de una región determinada. A nivel nacional, el nivel producto nacional bruto (que emite el Department of Commerce) y el indice de producción industrial (que el Department índice industrial (que consideran emite la Federal Reserve Board) se c,onsideran en general excelentes indicadores. Cada una de estas Cada una series se basa en miles de piezas de información (cuya recolección, ediciOn y cálculo son emprede de información (cuya recolección, edición y cálculo son empresas costosas y que tardan tiempo). Para un área local como el condado de Spokane, Washington, tiempo). Para un area local como el condado de Spokane, Washington, sas costosas más deseable una versión simplificada, capaz de proporcionar información razonablemente es más deseable una version simplificada, capaz de proporcionar información razonablemente actual a un costo moderado. precisa y actual a un costo moderado. 410 Regresión de datos de series de tiempo RegresiOn de datos de series Capítulo 9 Cap Itulo 9 común múltiple para construir un índice de actividad empresarial. Es cornñn utilizar la regresión rniltiple para construir un mndicede actividad empresarial. Existen la índice. tres preguntas esenciales que debe enfrentar Ia generación de dicho Indice. ,Cuáles • ¿Cuáles son los componentes del Indice? los componentes del índice? ,Representan estos Indices de manera adecuada los cambios en las condiciones generales en los • ¿Representan estos índices de manera adecuada los cambios en las condiciones generales en los negocios? ,Qué • ¿Qué valor se deberIa asignar a cada uno de los componentes elegidos? debería a del análisis de regresión. Las respuestas a estas preguntas se pueden obtener a través del anáiisis de regresión. El El Dr. Shik Chun Young, profesor de economla en la Eastern Washington University, está Shik Chun Young, profesor de economía en la Eastem Washington University, desalTol1ar un Indice de actividad econórnica para el condado de Spokane. Young selecciona intentando desalTollar Wl índice de actividad económica para el condado de Spokane. Young selecciona como variable independiente. En el condado, ingreso personal se el ingreso personal corno la variable independiente. En el condado, el nivel de ingreso personal se empresas considera como el mejor indicador disponible de las condiciones de las ernpresas locales. El ingreso personal mide el ingreso total recibido por los hogares antes del pago de impuestos personales. Como hogares antes del pago de impuestos personales. Como las actividades productivas son tIpicamcnte remuneradas por medios monetarios, el ingreso personal son típicamente por medios monetarios, el ingreso personal hecho, verse como una representación razonable del desempeño la economía. pudiera, de hecho, verse como una representación razonable del desernpeI'io general de la economIa. Por como ¿Por qué entonces es necesario construir otro Indice si el ingreso personal puede servir como un buen índice si el ingreso personal indicador de Ia actividad empresarial? Por desgracia, los datos de ingreso personal a nivel de condado la a nivel de condado los estima el Departamento de Comercio de EUA sobre una base anual y se liberan 16 meses más tarde. estirna ci Departamcnto Comercio de EVA sobre una base anual y se liberan 16 meses más tarde. datos son de poca utilidad para la planeación a corto plazo. La tarea de Young En consecuencia, estos datos son de poca utilidad para la planeación a corto plazo. La tarea de Young índice empresarial actualizado. consiste en establecer un indice de actividad empresarial actualizado. independientes Las variables independientes se extraen de aquellos datos locales que están fácilmente disponibles do aquellos datos locales que están fácilmente disponibles dichos datos mensuales en una base mensual. Actualmente, hay disponibles alrededor de 50 series de dichos datos mensuales consumo energia y que van desde empleo, actividades bancarias y transacciones en bienes raíces hasta consurno de energía quo van desde empleo, actividades transacciones raices series el tendría eléctrica. Si se incluyeran todas las series en ci análisis de regresión, el esfuerzo tendrIa baja productisólo unas cuantas de estas series serían significativas estadísticamente. I)e ahí vidad ya que solo unas cuantas de estas series serian significativas estadisticarnente. De ahI que se ciel10 de Ia relaciOn entre el ingreso personal los datos disponibles, con ci fin requiera cierto conocimiento do la relación entre el ingreso personal yy los datos disponibles, con el fin do determinar qué series incluir en la ccuación de regresión. A partir del conocimiento de Young de la de ecuación p3l1ir del conocirniento economía de Spokane, se seleccionaron las siguientes 10 series: economia do Spokane, X z, empleo total X), empleo en manufacturas empleo X 4 , empleo en Ia construcción la empleo empleo en X s, empleo en comercio a! mayoreo y rnenudeo al menudeo X 6 , empleo en servicios empieo X 7, débitos bancarios X s, depósitos bancarios X 9, permisos de construcción ernitidos emitidos permisos hipotecas X IO ' hipotecas en bienes raIces raíces XII, consumo total do electricidad de El primer paso en ci anáiisis es ia ejecución del modelo, el análisis es la ejecución del modelo, El paso Y=b+b2X2+b3X3+...+b11X11 Capítulo 9 CapItulo Caso de estudio 411 en donde y = ingreso personal Y = ingreso bo = intersección con Y b0 = intersección bz, b), ... , b¡¡ = coeficientes de las variables independientes respectivas b2, b3,.. b1 . La R 2 total corregida es .96, lo que significa que las 10 variables en conjunto explican el 96% de R2 total corregida es .96, lo que significa que las 10 variables en conjunto explican el la varianza en la variable independiente, ingreso personal. Sin embargo, otras estadísticas de la regresión La varianza en La variable independiente, ingreso personal. Sin embargo, otras estadIsticas Ia regresión Primero, de estas 10 variables independientes sólo 3 tienen un valor calculado que indican problemas. Pnmero, de estas 10 variables independientes solo 3 tienen un valor tt calculado que es significativo a un nivel de .05, éstas son: empleo total, empleo en servicios y débitos bancarios. significativo a .05, éstas débitos bancarios. Segundo, la matriz de correlación muestra un alto grado de interdependencia entre diversas variables Segundo, independientes-multicolinealidad. Por ejemplo, el empleo total y débitos bancarios tienen independientesmulticolinealidad. Por ejemplo, el empleo total y los débitos bancarios tienen un coeficiente de correlación de .88; el consumo total de electricidad depósitos bancarios, .76; y los coeficiente de correlación de .88; el consumo total de eLectricidad y los depósitos bancarios, .76; y los permisos de construcción ylas hipotecas sobre bienes raIces, .68. Tercero, existe autocorrelación, como autocorrelaciOn, como permisos y las hipotecas sobre bienes raíces, lo indica la estadística de Durbin - Watson de .91. Este fenómeno es más bien comün en series de tiempo estadIstica Watson de .91. fenómeno es más bien común en series de tiempo cada observación no es independientes de otras observaciones en la misma serie. de datos en donde cada observación no es independientes de otras observaciones en la misma serie. aleatoriedad observaciones es los conceptos básicos en la inferencia Como la aleatoriedad de las observaciones es uno de los conceptos básicos en la inferencia estadística, Young elige enfrentar primero el problema de autocorrelación. Adopta el método de primera estadistica, Young elige enfrentar prirnero el problema de autocorrelaciOn. Adopta el método de primera diferenciación para minimizar Ia interdependencia entre las observaciones serie histórica. diferenciación para minirnizar la interdependencia entre las observaciones de cada serie histórica. las 10 variables independientes se miden por la diferencia entre periodos en Ahora, Las 10 variables independientes se miden por la diferencia entre periodos en vez de por el valor absoluto de periodo. absoluto de cada periodo. De modo que para poder distinguir los conjuntos de datos, se emplea una distinguir los conjuntos de datos, se nueva designación de las variables independientes utilizadas. las M 2, cambio en el empleo total AX, cambio en el empleo M), cambio en el empleo en manufacturas LX3, LU4, empleo la L\X, cambio en el ernpleo en Ia construcción M s, cambio en el empleo en comercio al mayoreo y menudeo al rnenudeo X6, cambio en el empleo M 6, cambio en el empleo en servicios M M 7, 8, cambio en los débitos bancarios carnbio cambio en los depósitos bancarios M 9,, cambio en Los permisos de construcciOn emitidos en los permisos construcción MIO, raíces LXØ, cambio en las hipotecas en bienes ralces AXE, cambio en el consumo total de electricidad M¡ ¡, electricidad se convierte La ecuación de regresión se convierte en = b0 + b2zX2 + b3zX3 + ... + b11X11 en donde AY = cambio en el ingreso personal AY= bo intersecciOn b0 = intersección con Y bz, b3,. . b = coeficientes de regresión de las variables independientes respectivas b2, b), ... ,, b¡¡ = coeficientesde regresión de las variables independientes respectivas . 412 Regresión de datos de series de tiempo RegresiOn de datos de Capítulo CapItulo 9 Con esta ecuaciôn, se ejecuta una regresión con base en los datos de la primera diferenciación y produce Ia primera diferenciación ecuación, estadística una estadIstica de Durbin-Watsonde 1.71. Esta indica que no se mantiene una correlación seria. DurbinWatson de 1.71. Ésta indica que no se mantiene una correlación seria. El siguiente paso consiste en determinar cuál de las 10 variables sonpronosticadores signi ficativos las 10 variables sonpronosticadores significativos de Ia variable dependiente. Con el fin de seleccionar Ia mejor ecuación, se hacen regresiones de una la fin la de una variedad de posibles combinaciones de las 10 variables contra V. Los criterios empleados en la selección criterios empleados en la selección variedad de posibles combinaciones de las 10 variables contra Y. son los siguientes: R2 Una R2 corregida satisfactoriamente alta correlación las variables independientes Bajos coeficientes de correlación entre las variables independientes Que cada uno de los coeficientes de regresión de las variables independientes sea significativo nivel .05. a un nivel de .05. Después de cuidadoso escrutinio de los resultados de regresiones, Young encuentra que la Después de un cuidadoso escrutinio de los resultados de las regresiones, Young encuentra que la ecuación que contiene óXs M criterios ecuación que contiene AX,,AX 6yY MIl corno variables independientes, reúne mejor los criterios AX11 como variables independientes, reline mejor mencionados. Young razona que (además de los industriales y comerciales) el consumo total Sin embargo, Young razona que (además de los usos industriales y comerciales) el consumo total residencial, que de electricidad incluye el consumo residencial, que no debería tener una relación significativa con la deberIa tener una relación significativa con Ia actividad económica en el corto plazo. Para probar esta hipótesis, Young subdivide el consumo de plazo. hipótesis, actividad económica en electricidad total en cuatro variables: AX12, cambio en el uso de electricidad residencial; AX13, cambio total en cuatro variables: M I 2> de electricidad residencial; M 13 , en el uso de electricidad comercial; AX14cambio en el uso de electricidad industrial; y MIS' cambio en electricidad comercial; M I4 cambio en el uso de electricidad industrial; AX5, combinadas con M s y AX, se emplean para los usos comercial e indistrial. Cada una de estas variables, combinadas con AX5Y M 6, se emplean para producir cuatro nuevas ecuaciones de regresión (véase tabla 9.11). regresión (véase tabla 9.11). El análisis estadistico indica que Ia ecuación D es la mejor. Al compararla con las ecuaciones estadístico la es la mejor. Al compararla con las ecuaciones óXs M y AX11 como variables independientes, Ia ecuación A es Ia ñnica que previas que contienen AX, ,AX 6 Y MIl como variables independientes, la ecuación A es la única que la significacion estadistica. El resultado confirma la noción de Young de que los muestra deterioro en Ia significación estadística. El resultado confirma la noción de Young de que los usos de electricidad comercial e industrial son n3ejores pronosticadores que el ingreso personal y el uso mejores pronosticadores que el ingreso personal y el uso que incluye al consumo total de electricidad, que incluye al con sumo residencial. se selecciona la la final regresión, y los resultados Por lo tanto, se selecciona Ia ecuación D como Ia ecuación final de regresión, y los resultados son ~y = = 1.86 17.10 ~X5 + 23.01 ~X6 + .007 ~X15 -1.86 + 17.10 AX6 + 23.01 AX6 + .007 AX15 (4.07) (56.1) (.002) R'-. = .835 R~ = = 26.26 F = 26.26 N = N = 15 DW DW = 1.769 regresión son los errores estándar de la estimación Las cifras entre paréntesis bajo los coeficientes de regresión son los errores estándar de la estimación de los coeficientes, todos ellos significativos a un nivel de .05. Los valores tt de los coeficientes son de los coeficientes, todos ellos significativos a un nivel de .05. Los valores son 4.10, 4.20 y 2.97 para AX5, M 6 YMIS' respectivamente. La R2c indica que cerca del 84% de la varianza 4.10,4.20 Y2.97 para M s, AX6 y AX15, respectivamente. La R2 indica que cerca del 84% de la varianza TABLA 9.11 TABLA 9.11 ECUACIÓN ECUACION A ECUACIONES DE REGRESiÓN Y VARIABLES DE YOUNG ECUACIONES DE REGRESION Y VARIABLES DE YOUNG VARIABLES INDEPENDIENTES ~X5' ~X6' ~X12 LX5,LX6,LXi3 ~X5' ~X6' ~XIJ ~X5' ~X6' ~X14 X5,zX6,zX ~X5' ~X6' ~XIS VARIABLE VARIABLE DEPENDIENTE VARIABLES INDEPENDIENTES ~y ~y ~y B e C D ~y Capítulo 9 CapItulo Caso de estudio 9.12 TABLA 9.12 Caso de estudio CORRELACiÓN MATRIZ DE COEFICIENTES DE CORRELACION LlX) 413 LX6 LlX 6 .452 1.000 1.000 LlX" LlX) LlX 6 <lX 1) \.000 1.000 .452 .113 .122 .113 .122 1.000 del cambio en el ingreso personal se explica mediante las tres variables independientes. La estadIstica ingreso personal se explica mediante las tres variables independientes. La estadística DW muestra que no hay problema de autocorrelación. Además, la coeficientes de correlación DWmuestra que no hay problema de autocorrelación. Además, Ia matriz de coeficientes de correlación demuestra nivel de entre las independientes. de la tabla 9.12 demuestra un bajo nivel de interdependencia entre las tres variables independientes. fines de construcción índices, variables independientes en la ecuación final de Para fines de construcción de indices, las variables independientes en la ecuación final de convierten en componentes del índice. La ponderación, o peso específico de los comporegresión se convierten en componentes dcl indice. La ponderación, o peso especIfico de los compocoeficientes nentes puede determinarse a partir de los coelicientes de regresión. (Recuerde que los coeficientes de regresión representan el cambio promedio en la incremento de una unidad regresión representan ci carnbio prornedio en Ia variable dependiente para un incremento de una unidad independiente.) Sin embargo, como las variables en la de regresión no tienen la en la variable independiente.) Sin embargo, como las variables en la ecuación de regresión no tienen la misma unidad de medida (por ejemplo zY se mide en miles de dólares y M I5 en miles de kilowattsóY t.X15 en miles de kilowatts hora), se deben transformar a términos relativos los coeficientes de regresión. Esta transformación se transformar a térnlinos relativos Esta transformación se logra mediante ci cálculo de sus coeficientes /3. el de sus coeficientes 13. (9.13) S en donde b = coeficiente de regresiôn de Ia variable independiente regresión de la independiente la s = desviación estándar de la variable independiente Sy = desviación estándar de la s. = desviación estándar de Ia variable dependiente Es cornñn encontrar disponibles los valores de todas estas estadIsticas en la salida de cómputo común estas estadísticas la salida de cómputo son de la regresión. Por lo tanto, los coeficientes estandarizados de las tres variables independientes son f3 f3 5=' 4959 = .4959 .4959 = .3871 1.2811 = 1.2811 f3 6 16 f3'5 = .4833 =.4833 .3019 1.2811 .4833 = .3772 .4833 = .3772 1.2811 .3019 = .2357 .3019 .2357 1.2811 último, la índice 100%, se Por ültimo, debido a que Ia suma de las ponderaciones en un Indice debe ser igual a 100%, se normalizan los coeficientes estandarizados. Total COMPONENTE ESPECíFICO PESO ESPECIFICO .3871 1XX6 .3772 .3772 .2357 Total \.0000 1.0000 414 Regresión de datos de series de tiempo RegresiOn de datos de series Capítulo 9 CapItulo 9 Una vez determinados los componentes y sus respectivos pesos especIficos, se puede obtener el Vna detenninados específicos, Indice mediante los siguientes pasos: índice los siguientes pasos: 1. el periodo base. Paso 1. Calcule el porcentaje de cambio de cada componente desde el periodo base. el específico Paso 2. Multiplique el porcentaje de cambio por ci peso especIfico correspondiente. el Paso 3. Sume los porcentajes ponderados de cambio obtenidos en ci paso 2. los la fig. 9.4 se compara el Indice elaborado Spokane En Ia fig. 9.4 se compara el índice elaborado para la actividad económica del condado de Spokane Ia actividad económica condado EVA, dólares constantes (1967 = 100). con el PNB de EUA, en dólares constantes (1967 = 100). PREGUNTAS PREGUNTA S 1. Young eligió resolver primero el problema de autocorrelación. ¿Hubiera sido mejor eliminar autocorrelación. ,Hubiera mejor eliminar Young eligió resolver primero ci problema multicolinealidad abordar la autocorrelación? primero la multicolinealidad y después abordar Ia autocorrelación? 2. ¿Cómo afecta al análisis ci tarnaño reducido de la muestra? Cómo el tamaño reducido 3. ¿Debería haberse hecho a través del origen Ia regresión efectuada sobre la primera diferenciala efectuada sobre diferencia4Deberia haberse hecho a través del ción? 4. ¿Hay algUn uso potencial para datos retrasados? retrasados? ,Hay algún uso potencial 140 índice Spokane fndice de Spokane 130 130 ClJ 120 120 '[ ~ 0 ClJ I 110 110 Q., .,.-"- .... --/' /' ,I I I '_1 I I I I PNB de EVA 100 f------~~------------------100 90 Iijiliit!iiiliiiliii!iiijiii!iiijiiit,iiliiil,iij 1965 1966 1967 1968 1968 1966 1969 1970 1971 1972 1973 1967 1974 1972 1969 1975 1996 Figura 9.4 Índice Figura 9.4 Indice de actividad empresarial del condado de Spokane y del PNB de EUA, en dólares constantes (1967 = 100). EVA, dólares constantes = 100). Capítulo Capitulo 9 Caso de estudio Caso 415 5. A qué conclusiones se puede liegar at comparar el Indice de actividad empresarial del condado ¿A qué conclusiones se puede llegar al comparar el índice de actividad empresarial del condado PNB? de Spokane con el PNB? CASO DE ESTUDIO 9.3 9.3 MR. MR. TUX El propietario de Mr. Tux, John Mosby, decidió intentar un modelo autorregresivo en el pronóstico de moclelo autorregresivo en el pronóstico de al final del cap. 2). Como sus ventas mensuales (los datos aparecieron en el Caso de estudio Mr. Tux al final del cap. 2). Como él sabe que sus datos tienen un fuerte componente estacional (esto es, varían considerablemente de mes es, varian considerablemente a mes), desea reflejar este efecto en su modelo de pronóstico. decide intentar regresión múltiple el programa de cómputo Sybil/Runner, Para ello, decide intentar una regresión multiple con el programa de cómputo Sybil/Runner, variables: número los valores originales de Y utilizando dos variables: un nürnero de periodo para modelar el tiempo y los valores originales de Y Al retrasados 12 meses para modelar el componente estacional. Al utilizar Yretrasada 12 meses no puede 12 12 utilizar los primeros 12 meses de sus datos de ventas, pero como empezó con 96 periodos, esto le deja penodos, esto le deja un tamaño de niuestra de 84. muestra 84. predicción y obtiene los siguientes Ejecuta los datos con el programa utilizando dos variables de predicción y obtiene los siguientes valores clave en la ejecución de córnputo: dave en la ejecución de cómputo: VARIABLE TREND 2 2 3 LAGGED 3 1 SALES 1 MEAN 42.500 1085.354 1407.093 STANDARD DEVIATION STANDARD 24.393 888.505 997.094 CORRELATION COEFFICIENTS 2 3 VAR 2 1 3 2 1.00 2 3 0.73 1.00 3 0.73 1.00 1 0.70 0.95 1.00 1 0.70 0.95 REGRESSION NUMBER 1 DEPENDENT DEPENDENT VARIABLE IS SALES IS SALES ***** *** *** ** * ** ******* ***** ******* ** ***** ** *** ********* ***** ******** * VARIABLE CONSTANT 2 TREND 2 3 LAGGED 3 COEF STD.ERROR 68.202 2.033 0.056 T-RATIO 3.4 0.3 18.9 PCT VARIATION EXPLAINED 235.194 0.609 1.04% 1.04% 89.55% 1.056 0.906 0.952 R-SQUARED = 0.906 R = 0.952 F-TEST = = 390.024 STD ERROR OF EST. = 309.572 STD ERROR OF EST. FREEDOM OF NUMER. = 2 DENUMER. 81 DEGREES OF FREEDOM OF NUMER. = 2 OF DENUMER. = 81 TEST DURBIN-WATSON TEST 1. 82 1.82 416 Regresión de datos de series de tiempo Regresion Capítulo 9 CapItulo 9 MEAN MEAN MEAN ••• AGGREGATE ERROR STATISTICS STATISTICS SQUARED ERROR (MSE) ERROR (MSE) ABSOLUTE PC ERROR PC (MAPE) = (MAPE) PC ERROR (MPE) OR BIAS PC ERROR (MPE) OR BIAS = 92412.31 25.92% -13.22% ••• RESIDUAL AUTOCORRELATION COEFFICIENTS * ••• AUTOCORRELATION COEFFICIENTS ** I I II I I I I .5 I .5 I I I I I I I - I X IX I I I I I I I X X X X XX - O. o I-X- -X- -X- -X- -X- -X- -x- -x 0.0 I-X--X--X--X--X--X--X--X I- X X - x- -x- -x- -xX-X--X--XX X XX - X X -.5 I -.51 I 1 1 I 1 I I +- -+- -+- -+- -+- -+-+- -+- -+1 -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+1 LAG= 1 2 3 4 5 6 7 8 9 10 11 12 4 5 6 9 la 11 12 2 8 COR 0.08 0.13 -.24 0.00 0.02 -.10 VALUE -.01 -.10 0.03 0.04 -.01 -.17 0.02 CHI-SQUARE COMPUTED ( la DEGREES OF FREEDOM) = FREEDOM) 10 DECREES 11.1930 CHI-SQUARE FROM TABLE ( 10 DEGREES OF FREEDOM) = 18.30 FREEDOM) 18.30 ( ( TAREA Redacte un memorando para John explicando los resultados de este modelo autorregresivo. Asegürese Asegúrese de abordar Ia correlación serial, Ia colinealidad y Ia precisión del modelo. la la la precision del CASO DE ESTUDIO 9.4 CONSUMER CREDIT COUNSELING CREDIT El funcionamiento de Consumer Credit Counseling (CCC) se describió en los caps. 1 (Caso de estudio El (CCC) se describió en los caps. (Caso de estudio 3.4). 1.2) y 3 (Caso de estudio 3.4). El director ejecutivo Marv Harnishfeger, llegó a Ia conclusión de que Ia variable más importante a la conclusion la Mary requería número de nuevos clientes por atender en el resto de 1993. Marv que CCC requeria pronosticar era el rnmero de nuevos clientes por atender en el resto de 1993. Mary proporcionO a Dorothy Mercer los datos del número de clientes atendidos por CCC en el periodo de proporcionó a Dorothy Mercer los datos del nñmero de clientes atendidos por CCC en el enero de 1985 a rnarzo de 1993 (véase Caso de estudio 4.3). marzo a menudo la correlación representa un Recientemente, Dorothy fue informada de que a menudo la correlaciOn serial representa un Recientemente, Dorothy fue informada de problema al realizar una regresión con series de tiempo de datos. Ella está preocupada de que algunos tiempo de datos. Ella está preocupada de que algunos Versión estudiantil de Forecast Plus VersiOn estudiantil 417 modelos de regresión desan'ollados para pronosticar el nñmero de clientes atendidos, se yea de los modelos de regresión desarrollados para pronosticar el número de clientes atendidos, se vea le gusto informe afectada por esta condición. Como a ella Ic gustó el informe que usted presentó utilizando un modelo de series la situación. de análisis de descomposición de series de tiempo, le asigna ahora Ia tarea de verificar esta situación. Usted recucrda vagamente, en algún punto de su experiencia educativa, haber desarrollado un recuerda vagamente, en algin punto su experiencia desarrollado un modelo autorregresivo y pregunta a Dorothy si le gustaría probar esa posibilidad. Ella decide que sería si gustarla probar esa posibilidad. Ella decide que serla una buena forma de ocupar su tiempo. fomla su tiempo. TAREA Redacte un memorando para Dorothy que Ic proporcione la información que solicitO respecto a! Redacte memorando para Dorothy que le proporcione la información que solicitó respecto al problema de correlaciOn serial. DesalTolle un modelo autorregresivo y pronostique el resto de 1993. correlación serial. Desarrolle un modelo autorregresivo y pronostique ci resto de 1993. Redacte un segundo memorando para Dorothy presentando los resultados de este análisis. de este análisis. VERSIÓN ESTUDIANTIL DE FORECAST PLUS VERSION ESTUDIANTIL DE FORECAST PLUS Hemos decidido empiear un rnodelo autorregresivo para pronosticar el ni.imero de clientes. emplear modelo autorregresivo para pronosticar el número Usaremos un archivo de datos denorninado INDEX que contiene el ni'irnero de clientes datos denominado INDEX que contiene el número de clientes Usarernos un archivo atendidos y el Indice de actividad de enero de 1985 a marzo de 1993. Los datos de los atendidos .y el índice de actividad de enero de 1985 a marzo de 1993. Los datos de . pnmeros cmco meses son primeros cinco meses son CLIENTES INDICE 182 136 99 77 75 110 108 105 104 104 Primero, se selecciona el menú de administración de datos (opción 1) Y se elige a Prirnero, se selecciona ci nienui de administración de datos (opciôn 1) y se elige la archivo de datos (opcion 5). este programa nos permite continuación Ia transformación de un arch ivo de datos (opción 5). este programa nos permite calcular nuevos valores para las variables ya existentes. La pantalla crear nuevas variables o caicular nuevos valores para las variables ya existentes. La pantalla siguiente muestra lo siguiente LABELS VARIABLE LABELS 1. l. - CLIENTS 2. 2. INDEX -- KEY WORD LIST -KEY WRITE IF-THEN SELECT RECODE COMPUTE NEW LAG DIFFERENCE NORMALIZE DUMMY IF-THEN SELECT DIFFERENCE NORMALIZE SUM CLAG NEW CLAG CLAG = CLIENTS COMPUTE CLAG = CLIENTS (1) CLIENTS INDEX LAG (1) CLIENTS INDEX 418 Regresión de datos de series de tiempo RegresiOn de datos de series Capítulo 9 CapItulo El comando NEW se utiliza para crear una nueva variable liamada CLAG. El comando comando utiliza para crear una nueva variable llamada CLAG. El comando COMPUTE se emplea para asignar a nueva variable CLAG COMPUTE se emplea para asignar a la nueva variable CLAG los mismos valores de la mismos valores la retrasar periodo las variables variable CLIENTS. El comando LAG(l) se utiliza para retrasar un periodo las variables variable CLIENTS. El comando LAG(l) utiliza INDEX. Al presionar Escape (ESC), la pantalla muestra CLIENTS e INDEX. Al presionar Escape (ESC), Ia pantalla muestra Selection: Enter Selection: ==) l. Execute the commands => 1. Execute the commands 2. Re-enter the editing mode the editing mode 3. Quit & return to Data Management Menu & return to Data Management Menu Which? Después de seleccionar la opción 1 para ejecutar los comandos, en la pantalla aparece pantalla aparece Después de seleccionar opcion SYNTAX CHECK COMPLETED SYNTAX Input file name = B:INDEX Input file name = Output file name = NOT SPECIFIED Output file SPECIFIED Enter the name for the new output file (or FILES) for new output file (or FILES) Enter the OR- Press <ENTER> to write existing file: -OR- Press <ENTER) to write over the existing file: nuevo archivo de salida el nombre CRELAG, el cual contiene Se asigna al nuevo archivo de salida el nombre CRELAG, ci cual contiene CLIENTES 136 136 INDlCE INDICE 108 108 105 105 104 104 104 104 CLAG 182 182 99 99 77 77 136 99 77 75 75 Se requiere crear un nuevo archivo de etiquetas (CRELAG.LBL). Recuerde que ahora los nuevo archivo de etiquetas (CRELAG.LBL). los Se requiere comienzan en febrero. datos comienzan en febrero. del menú Ahora, se llama al paquete de pronóstico seleccionando Ia opción Ahora, se llama al paquete de pronóstico seleccionando la opción 3 del menu principal. solicita el nombre del archivo principal. El paquete solicita ci nornbre del archivo Versión estudiantil de Forecast Plus VersiOn estudiantil 419 What is the name of the data file? name of the data file? What is CRELAG CRELAC El menú le permite elegir entre 13 diferentes técnicas de pronóstico. La pantalla correspon13 corresponmenu diente se presentó en Ia sección de Forecast Plus del cap. 5. la diente Para utilizar como nuestras variables de pronóstico el índice de actividad y los clientes Pam el indice atendidos, retrasadas un periodo, y los clientes atendidos como nuestra variable dependiente, variable dependiente, programa regresión múltiple, 13. siguiente usamos el programa de regresión multiple, opción 13. La pantalla muestra lo siguiente Multiple Regression Enter the variables to use in the multiple regression. Enter Enter the variables to use in the multiple regression. Enter the dependent variable, followed by the independent variables the dependent variable, followed by the independent variables (LIST will list the variables) : the variables) (LIST will CLIENTS,INDEX,CLAG CLIENTS, INDEX, CLAD Descriptive statistics: statistics: Regression statistics: statistics: Regression coefficients: coefficients: Simple correlation matrix: matrix: Simple correlation matrix: Partial correlation matrix: Inverted correlation matrix: matrix: Inverted Number of records to use in residual analysis: records to use in residual analysis: Number Y Y Y Y Y Y Y Y Y Y N N 50 Time plot of original data, forecasts, and error: Y original data, forecasts. and error: Y Time y Residual autocorrelation function: autocorrelation function: Y N Interactive prediction Press ENTER to accept: to accept: Press Nótese que primero colocó la variable dependiente, seguida de las variables Nótese que primero se colocó Ia variable dependiente, seguida de las variables independientes separadas por comas. probable que usted quiera emplear números de independientes separadas por comas. Es probable que usted quiera emplear nuimeros de variable en lugar de nombres. Para ejecutar este modelo de regresión mñltiple, podemos de nombres. Para ejecutar este modelo de regresión múltiple, podemos variable las opciones por omisión que se proporcionan. Sin embargo, si queremos calcular una usar las opciones por omisión que se proporcionan. Sin embargo, si queremos calcular una estadística de Durbin-Watson, nuestra elección del mimero de registros a utilizar en el estadIstica de DurbinWatson, nuestra elección del número de registros utilizar en el análisis de residuos necesitará ser de 99. La fig. 9.5 muestra Ia salida de cómputo cuando fig. la análisis residuos necesitará ser de 99. las respuestas son Y, Y, Y, Y, Y, N, 0, N, Y y N. Y Y N. las respuestas son Y, Y, Y, Y, Y, N, 0, Por ültimo, el programa preguntará si desea almacenar los pronósticos o los residuos. último, los pronósticos o los residuos. Do you want to save the forecasts or residuals (yin)? to save the forecasts or residuals (y/n)? 420 - Regresión de datos de series de tiempo RegresiOn de datos de series de CLIENTS - MULTIPLE REGRESSION ANALYSIS ANALYSIS Capítulo 9 Cap Itulo Variables in the equation - DESCRIPTIVE DESCRIPTIVE STATISTICS STATISTICS Variables Var. Variable label label CLIENTS INDEX CLAG Mean 121.3673 121.3673 109.1020 109.1020 121.5408 121.5408 Standard Dev. Standard Dev. 29.1613 7.7213 7.7213 29.5733 DV IVl IV1 IV2 REGRESSION STATISTICS STATISTICS of determination 0.3853 (Corrected = 0.3789) Coefficient of multiple determination = 0.3853 (Corrected 0.6156) Coefficient of multiple correlation correlation 0.6207 = 0.6207 (Corrected = 0.6156) of estimate (Corrected 23.2222) Standard error of multiple estimate 23.1022 (Corrected = 23.2222) F-Ratio F -Ratio Degrees of freedom of freedom of chance Probability of chance Number of observations of observations 29.7763 = 2 & 95 2 & 95 = 0.0000 98 = 98 REGRESSION COEFFICIENTS REGRESSION Constant = -113.9440 Constant Var. Coeff. 2.0492 0.0966 Beta F-ratio 18.868 0.615 Prob. Probo Std. Error Std. Beta IVl IV1 IV2 0.5426 0.0980 0.000 0.435 0.4718 0.0980 0.1232 SIMPLE CORRELATION MATRIX DV IVl IV1 IVl IV1 IV2 I I 0.618 0.513 0.765 0.765 PARTIAL CORRELATION MATRIX PARTIAL IVl IV1 IV1 IV2 - I I 0.765 CLIENTS - MULTIPLE LINEAR REGRESSION LINEAR REGRESSION RESIDUAL AUTOCORRELATION FUNCTION FUNCTION Standard Deviation of the Residuals = 22.8628 Residuals 22.8628 Standard Lag 1 1 2 2 3 3 Value T-Value -0.29 1 .26 1.26 0.26 0.35 -1.0 0.0 +1.0 4 4 -0.03 0.13 0.03 0.04 -0.29 *: [ [ :*** :* :* I I [ : [ 9.S Caso de estudio 9.4. Figura 9.5 Modelo autorregresivo para el Caso de estudio 9.4. Pronósticos mediante hoja de cáIcuo PronOsticos mediante hoja de cálculo 5 5 6 6 7 7 8 8 9 9 10 11 421 [ [ *: * . [ { [ [ [ **:. ** [ [ [ [ [ :****] [ **:. ** [ [ [ ·** [ *** [ ***:. [ **:. ** [ [ [ :****] [ [*****: [***** : [ . 12 12 13 13 14 14 15 15 16 16 17 17 18 18 19 19 20 21 21 22 23 24 25 26 26 27 27 28 29 30 31 31 32 0.02 002 -0.03 -0.00 -0.01 -0.07 0.00 -0.02 0.19 -0.07 0.08 -0.11 -0.06 0.15 -0.20 -0.06 -0.06 0.05 -o .14 -0.14 -0.03 0.21 -0.09 0.04 -0.02 0.00 0.15 -0.33 0.07 -0.21 0.19 -0.29 -0.02 -0.06 -0.70 0.01 -0.17 1. 83 1.83 -0.64 0.75 -1.06 -0.56 1. 40 1.40 -1.80 -0.52 -0.51 0.43 -1.22 -0.27 -0,27 1. 78 1.78 -0.70 0.32 -o .18 0.01 1. 25 1.25 -2.61 0.49 -1.55 [ -0.17 [ : -1.80 [ [ [ **:. ** *: * . : [ [ [ [ ·* ****: [ **** . [ [ [ [ [ [ [ { [ [ [ [ [ *: * . :*****] **:. ** ] -0.18 ] ] ] ] ·**** I **[*****: **[*****: ] · * * . : [ ·** -1.55 [ *****. [ *****: ] ] ] = Estimated Two-Standard Error Limits Two-Standard Error Limits Statistic with 32 Degrees of Freedom Box-Pierce Chi-Square Statistic with 32 Degrees of Freedom = 40.7 Probability = .14 = .14 Figura 9.5 (continuación) 9.5 PRONÓSTICOS MEDIANTE HOJA DE CALCULO HOJA DE CÁLCULO PRONOSTICOS El problema. En el cap. 4, ejemplo 4.4, se analizaron las ventas trimestrales (véase El cap. tabla 4.5) de Marine Outboard. Desarrolle un modelo estacional autorregresivo pam estos de Marine üutboard. Desarrolle un modelo estacional autorregresivo para estos datos. La solución mediante hoja de cálculo ho¡a de cálculo La solución 1. Para accesar el archivo üUTBüARD.WKl escriba !FILE RETRIEVE o/FR. Lotus l. Pam accesar ci archivo OUTBOARD.WKI escriba /FILE RETRIEVE o /FR. Lotus solicitará el nombre del archivo con el mensaje Name of file to retrieve: file to retrieve: A:\ 422 Regresión de datos de series de tiempo RegresiOn de datos de Capítulo 9 CapItulo En la tercera Ilnea, usted vera el nombre de la hoja de cálculo que desea accesar. Después Ia hoja de cálculo que desea accesar. Después línea, verá señalar OUTBOARD.WKI, presione <Enter>. En Ia fig. 8.10 presenta de señalar OUTBOARD.WKI, presione <Enter>. En la fig. 8.10 se presenta una visualización de esta hoja de cálculo. 2. Pam borrar los tItulos, escriba IWORKSHEET DELETE ROW o IWDR y ci programa Para títulos, /WORKSHEET ROWo IWDR y el programa le pedirá el rango de celdas a borrar Enter range Enter range of rows to delete: rows to delete: Escriba ci rango A1 ...A6. Borre en forma similar las columnas E a la K. el rango .AI . . .A6. Bone en forma similar las columnas E a la K. 3. Escriba a partir de Ia columna A los tItulos que desee utilizar. partir de la A los títulos que desee utilizar. 4. Utilice el comando IMOVE para desplazar el número de periodo a la columna E. Para el nümero de periodo E. borrar la columna C, escriba IWORKSHEET DELETE COLUMN o IWDC. 5. Pam crear una columna con las ventas retrasadas un periodo, presione ICOPY o le. Para columna ventas retrasadas ICOPY Ic. Coloque el apuntador de celdas en solicita Coloque el apuntador de celdas en C3. El programa le solicita el rango de celdas a copiar: Enter range to copy FROM: C3. .. C3 range to copy FROM: C3 .C3 Presione Ia tecla de punto (.) para anclar lo resaltado comenzando en la celda CS. Oprima C5. Oprima Presione la de punto (.) para anclarlo comenzando en la tecla de flecha hacia abajo < .I.> para extender lo resaltado hasta C38. Opri< J, > hasta C38. OpriIa tecla lo resaitado Coloque indicador ma <Enter>. Coloque ahora el indicador de celdas en D7 y presione <Enter> para copiar y presione <Enter> para la columna. La fig. 9.6 muestra el resultado. fig. G3: A A B e C Sales 1 Year Qt Sales 1 2 2 147.6 147.6 1984 1 1 3 2 251. 8 251.8 4 2 273.1 3 273.1 3 5 249.1 4 249.1 6 139.3 139.3 7 1985 1 1 7 221.2 221.2 2 2 8 260.2 3 260.2 3 9 9 259.5 4 259.5 10 140.5 140.5 1986 1 1 11 11 245.5 2 245.5 12 2 12 298.8 13 3 13 4 287 14 168.8 168.8 15 15 1987 1 1 322.6 322.6 2 16 393.5 393.5 3 17 404.3 404.3 4 18 259.7 1988 1 1 19 2 401.1 20 2 04:00 PM 04-Jan-94 04:00 FM D D T 1 1 2 3 4 5 6 6 7 7 8 9 9 10 11 12 13 14 15 16 17 18 READY E F F G G H H I J J K Lagged 147.6 147.6 251. 8 251.8 273.1 249.1 139.3 139.3 221.2 260.2 259.5 259.5 140.5 140.5 245.5 245.5 298.8 298.8 287 168.8 168.8 322.6 322.6 NUM NUM de Lotus para un modelo autOlTegresivo. Figura 9.6 Hoja de cálculo de Lotus para un modelo autorregresivo. 9.6 Pronósticos mediante PronOsticos mediante hoja de cálculo 1-2-3 Spreadsheet Computing Series 1-2-3 Spreadsheet Year Year 1984 Qt 1 1 2 2 3 3 423 Sales 147.6 251. 8 251.8 273.1 249.1 139.3 221.2 260.2 259.5 140.5 140.5 245.5 298.8 287 168.8 322.6 393.5 404.3 259.7 401.1 464.6 479.7 264.4 402.6 411.3 385.9 232.7 309.2 310.7 293 205.1 234.4 285.4 258.7 193.2 263.7 292.5 315.2 178.3 274.5 295.4 311.8 311.8 T T Lagged Regression Output: Output: Constant 86.656 Std Err of Y Est of Y Est 52.914 R Squared 0.6296 No. of Observations 36 No. Degree of Freedom Degree 33 X Coefficient (-1.118 0.7990) (-1.118 0.7990) Std Err 0.8740 0.1069 Std Err of Coe 0.8740 0.1069 1 1 2 2 3 3 4 4 4 1985 1 1 2 2 3 3 4 1 1 2 2 3 3 4 4 1 1 2 2 3 3 4 4 1 1 2 2 3 3 4 4 1 1 2 2 3 3 4 1 1 2 2 3 3 4 4 1 1 2 2 3 3 4 4 1 1 2 2 3 3 4 4 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 1986 9 9 10 11 11 12 13 13 14 14 15 16 16 17 17 18 18 1987 1987 1988 1988 1989 1989 1990 19 19 20 20 21 21 22 23 24 25 26 27 27 28 29 30 31 32 33 1991 1992 1993 34 35 36 37 38 39 40 147.6 251. 8 251.8 273.1 249.1 139.3 221.2 221.2 260.2 259.5 140.5 245.5 298.8 298.8 287 168.8 168.8 322.6 393.5 404.3 259.7 401,1 401.1 464.6 479.7 264.4 402.6 411.3 385.9 232.7 309.2 310.7 293 205.1 234.4 285.4 258.7 193.2 263.7 292.5 315.2 9.7 Figura 9.7 Modelo autorregresivo para Outboard Marine. 6. Escriba /DATA REGRESSION o /DR, que equivale a seleccionar DATA FILE en el Escriba IDAT A REGRESSION o /DR, que equivale a seleccionar DATA FILE en el menú submenú. submenú menu principal y REGRESSION en el submenil. El submenü de regresión muestra lo siguiente: X-Range Y-Range Output-Range Intereept Intercept Reset Output-Range Go Quit Reset 424 Regresión de datos RegresiOn de datos de series de tiempo Capítulo 9 Cap Itulo Range Se selecciona X - Range y el programa solicita las variables independientes o rango de X a utilizar variables, or X range: Enter independent variables, or X range: Usted puede, ya sea escribir D7 ... E42 o bien definir las variables X resaltándolas. Se E42 las variables Xresaltándolas. selecciona Y - Range y el programa solicita Ia variable dependientes o rango de Y a selecciona Y Range y el programa solicita la dependientes rango de utilizar . Enter dependent variable, or Yrange: Enter dependent variable, or Y-range: Indique el rango C7. . .C42 para definir el rango de Ia variable dependiente Y. Después C7...C42 la Después Range y en la pantalla se pide el rango en el que se colocarán se selecciona Output - Range y en Ia pantalla se pide el rango en el que se colocarán los resultados Enter output range: output range: el rango correspondiente, escriba GO para ejecutar la regresión. Una vez seleccionado el rango correspondiente, escriba GO para ejecutar la regresión. Los resultados aparecen en Ia fig. 9.7. en la fig. 9.7. PAQUETE DE CÓMPUTO M/N/TAB PAQUETE DE CÔMPUTO MINITAB Los comandos de Minitab para analizar los datos de Novak del ejemplo 9.3 son ejemplo 9.3 son Los comandos Minitab MTB > READ 'NOVAK.DAT' C1-C3 > 'NOVAK.DAT' C1-C3 17 17 ROWS READ ROW 1 1 2 2 3 3 4 4 Cl C1 C2 336.1 349.4 362.9 383.9 C3 8.0 8.2 8.5 9.2 5.5 5.5 6.7 5.5 MTB > > MTB > MTE SUBC> SUBC> NAME Cl 'SALES' C2 ' INCOME' C3 'UNEMP' C1 C3 UNEMP' SALES' C2 C1 2 PREDITORS C2 C3, RES IN C4, DHATS C5; REGRESS Cl 2 PREDITORS C2 C3, RES IN C4, DHATS CS; RESIDUALS C6; RESIDUALS C6; DW. DW. ' The regression equation is equation is The SALES = - 0.014 + 0.0297 INCOME 0.0297 INCOME SALES = - 0.014 - 0.350 UNEMP t-ratio -0.06 0.06 119.96 p P 0.956 0.956 0.000 0.000 Predictor Constant INCOME Coef -0.0140 0.0140 0.0297492 Stdev 0.2498 0.0002480 Paquete de cómputo Minitab cOmputo Mintab UNEMP s = s= 0.2199 -0.34987 0.04656 -7.51 0.000 425 R-sq = 99.9% R-sq 99.9% R-sq(adj) 99.9% R-sq(adj) = 99.9% Analysis of Variance of Variance SOURCE Regression Err-or Error Total SOURCE INCOME UNEMP DF 2 2 14 16 DF 1 1 1 1 SS 738.88 0.68 739.56 MS 369.44 0.05 F P P 7637.92 0.000 ss SEQ SS 736.15 2.73 Stdev.Fit Fit Stdev.Fit 29.0430 0.1713 Residual 0.0570 Unusul Observations Unusul Obs. INCOME Obs. INCOME SALES 17 1077 29.1000 St Resid St 0.41 X X X denotes an obs. whose X value gives it large influence. obs. X gives it large influence. denotes Durbin-Watson statistic = 1.98 1.98 MTB > MTB > NAME CS 'ESTIMATE' C6 'RESIDUAL' C5 'ESTIMATE' C6 'RESIDUAL' MTB > PRINT Cl C2 C3 C5 C6 C1 C3 C5 C6 MTB > ROW 1 1 SALES 8.0 8.2 8.5 9.2 10.2 11.4 12.8 13.6 14.6 16.4 17.8 18.6 20.0 21.9 24.9 27.3 29.1 INCOME 336.1 349.4 362.9 383.9 402.8 437.0 472.2 510.4 544.5 588.1 630.4 685.9 742.8 801.3 903.1 983.6 1076.7 UNEMP ESTIMATE SALES 5.5 5.5 6.7 5.5 5.7 5.2 4.5 3.8 3.8 3.6 3.5 4.9 5.9 5.6 4.9 5.6 8.5 RESIDUAL -0.060394 -0.256058 0.062171 -0.282405 0.225310 0.232953 0.340875 -0.240452 -0.254899 0.178064 0.284685 -0.076576 -0.019434 0.035278 -0.238096 0.012003 0.056976 8.0604 8 .0604 8.4561 8.4378 9.4824 9.9747 11.1670 11.1670 12.4591 13.8405 13.8405 14.8549 16.2219 17.5153 17.5153 18.6766 20.0194 21 .8647 21.8647 25.1381 27.2880 27 .2880 29.0430 2 2 3 3 4 5 5 7 6 6 7 8 8 9 9 10 10 11 11 588.1 12 12 13 13 14 15 15 16 16 17 17 742.8 903.1 MTB > STOP > STOP • El comando READ se usa para almacenar los datos de ventas de Novak en Cl, el ingreso para almacenarlos Novak Cl, personal disponible en C2 y Ia tasa de desempleo en C3. en y la en C3. 426 Regresión de datos RegresiOn de datos de series de tiempo Capítulo 9 Capitulo • El comando TRESIDS se emplea para calcular los residuos estandarizados y almacese emplea para calcular los residuos estandarizados y almacenarlos en C4. C4. • El comando DHATS se utiliza para calcular las estimaciones de Y y almacenarlas en CS. C5. • El subcomando RESIDUAL se usa para calcular la diferencia entre las observaciones calcular la diferencia entre las observaciones (CI) y las estimaciones de Y (CS). almnacena reales (Cl) y las estimaciones de Y (C5). El resultado se aimnacena en C6. emplea para calcular Ia estadIstica de DurbinWatson. • El subcomando DW se emplea para calcular la estadística de Durbin-Watson. PAQUETE DE CÔMPUTO PAQUETE DE CÓMPUTO SAS Problema. En el ejemplo 4.4, Perkin Kendell, analista de Outboard Marine, usó Kendel1, En autocorrelación para determinar que sus datos eran estacionales. Ahora, él desea la autocorrelación para determinar que sus datos eran estacionales. Ahora, él desea desarrol1ar un modelo autorregresivo utilizando el tiempo ventas retrasadas cuatro desarrollar un modelo autorregresivo utilizando el tiempo y las ventas retrasadas cuatro predecir las ventas trimestrales. periodos para predecir las ventas trimestrales. Solución mediante SAS SAS Solución $ SAS/CC=PRINT $ SAS/CCPRINT OPTIONS PAGESIZE=60 LINESIZE=80; OPTIONS PAGESIZE6O LINESIZE8O; TITLE "SEASONAL AUTOREGRESSIVE MODEL"; "SEASONAL MODEL"; OUTBOARD; DATA OUTBOARD; INPUT YT XT; YT XT; LABEL YT=SALES YT=SALES YT4=LAGSALES XT=TIME; XTTIME; YT4=LAG4 (YT) YT4LAG4(YT);; CARDS; 147.6 251.8 273.1 249.1 139.3 221.2 221. 2 260.2 259.5 140.5 245.5 298.8 287.0 168.8 1 1 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 11 12 12 13 2 Páquete de cOmputo SAS cómputo 427 322.6 14 393.5 15 404.3 16 259.7 17 401.1 18 18 464.6 19 479.7 20 264.4 21 402.6 402.6 22 411.3 23 385.9 24 385.9 232.7 25 309.2 309.2 26 310.7 27 293.0 28 205.1 29 234.4 30 285.4 31 258.7 32 193.2 33 263.7 34 292.5 35 315.2 36 178.3 37 274.5 38 295.4 39 311.8 40 311.8 PROC REG; PROC MODEL YTYT4 XT/ DW; MODELYT=YT4 XT/ OW; EBDSAS; • El comando TITLE da nombre a Ia ejecución de SAS. da nombre a la ejecución de SAS. • La declaración DATA asigna nombre a los datos. asigna nombre a los datos. • La declaración INPUT da nombre y asigna el orden correcto a los dos campos de datos. INPUT da nombre y asigna el orden correcto a los dos campos de datos. • La declaración LABEL proporciona etiquetas para cada variable especificada. • La declaración YT4=LAG4(YT) asigna a YT4 el valor de YT retrasada 4 periodos. Por el de en ci caso I 147.6. el ejemplo, el valor de YT en el caso 1 es de 147.6. En consecuencia, ci valor de YT4 en el caso 5 es también 147.6. 147.6. deciaración las siguientes 40 lIneas son imágenes de tarjetas que • La declaración CARDS indica que las siguientes 40 líneas son imágenes de tarjetas que representan Ia variable YT (ventas) y la variable XT (tiempo). la (tiempo). • La declaración PROC REG y el subcomando MODEL indican que YT es la variable declaración PROC variable indican dependiente y que las variables de predicción son XT y YT4. de son XT y YT4. subcornando Ia estadIstica de Durbin-Watson. salida cómputo para • El subcomando DW calcula la estadística de Durbin-Watson. La salida de cómputo para de SAS se muestra en la fig. 9.8. esta ejecución de SAS se muestra en Ia fig. 9.8. 428 Regresión de datos de series de tiempo MODEL SEASONAL AUTOREGRESSIVE MODEL Model: MODELl Model: MODEL1 YT Dependent Variable: YT Capítulo 9 Cap Itulo 9 SALES Analysis of Variance Varianee Analysis Sum of Squares Squares 157086.20093 92397.06657 249483.26750 Souree Source Model Error C Total Root MSE Dep Mean C.V. DF DE 2 2 Mean Square 78543.10046 2799.91111 F Value 28.052 Prob>F 0.0001 78543.10046 33 33 35 52. 91419 52.91419 290.67500 18.20390 R-square R- square Adj R-sq Adj R-sq 0.6296 0.6072 Parameter Estimates Parameter Parameter Estimate 86.656861 0.799002 -1.118219 1.118219 Variable INTERCEP YT4 XT DF OF 1 Standard Error 33.43635742 0.10692437 0.87406456 T for HO: HO: Parameter=O ParameterO 2.592 7.473 -1.279 1.279 Prob>T 0.0141 0.0001 0.0097 1 1 Variable INTERCEP YT4 XT DF 1 1 1 Variable Label Intereept Intercept LAG SALES LAGSALES TIME 0.508 36 0.725 O Durbin-Watson D For Number of Obs.) of Obs.) For 1st Order Autoeorrelation 1st Order Autocorrelation Figura 9.8 Modelo autorregresivo estacional Marine. Figura 9.8 Modelo autorregresivo estacional para Outboard Marine. DE TSP EJEMPLO DE TSP estadístico como Un paquete estadIstico que con frecuencia usan los economistas y que funciona tanto en macro como pel1l1ite al usuario ejecutar diversas técnicas de uso común microcomputadoras es TSP. Este paquete permite al usuario ejecutar diversas técnicas de uso comün el área econometría. en ci area de econornetria. se demostrará para ilustrar programas estadísticos en En esta sección se deniostrará TSP para ilustrar el uso de paquetes de programas estadIsticos en la resolución de lm problema de cOlTelación serial mediante el método de Cochrane -- Orcutt. un correlación serial mediante el método de Cochrane EL PROBLEMA PROBLEMA En el ejemplo 9.7 se utilizó el ingreso personal disponible para predecir las ventas de Sears. Hubo un Sears. Hubo un correlación serial, de niodo que se utilizó ci método de CochraneOrcutt problema de correlación serial, de modo que se utilizó el método de Cochrane-Orcutt para obtener un modelo válido. Ejemplo de TSP 429 solución La solución mediante TSP El archivo de comandos (consulte a su instructor sobre la infonnación que requiera para ejecutar TSP sobre información que requiera para ejecutar TSP en su sistema de cómputo en particular) para ejecutar los datos del ejemplo 9.7 es PROGRAM LINE LINE ** ** *** ***** ******* *** ** ** ** ** ** ** ** ** ** *** *** ************ *** 'SEARS" 1 NAME SEARS 'SEARS' 1 1 FREQ A; A; 1 2 SMPL 1.21; 1.21; 2 SALES; 3 LOAD SALES; 33.307.3.556.3.601, 3.721, 4.036. 4.134. 4.268. 4.578. 5.093. 33.307,3.556,3,601,3.721,4,036,4.134,4,268,4.578,5.093, 5.716. 6.357. 7.296. 8.178. 8.844, 9.251, 10.006. 11.2. 3 5.716, 6.357, 6.769, 7.296, 8.178, 8.844. 9.251, 10.006, 11.2, 3 12.5. 13.101, 13.640; 312.5, 13.101, 13.640; INCOME: 4 LOAD INCOME: 4273.4, 291.3, 306.9, 317.1, 336.1. 349.4, 362.9, 383.9, 402.8, 4 273.4. 291,3. 306.9. 317.1, 336.1, 349.4. 362.9. 383.9, 402.8. 4 437. 472.2. 510.4. 544.5, 588.1, 630.4. 685.9. 742.8. 801,3 4437, 472.2, 510.4, 544.5, 588.1, 630.4, 685.9, 742.8, 801.3 4903.1.983.6.1076.7; 4903.1, 983.6, 1076.7; INCOME: 5 AR1 (PRINT, METHOD=CORC) SALES CC INCOME: AR1 (PRINT. METHODCORC) SALES END; 6 END; EXECUTION * ** ** ** ** ** * * * ** ** ** ** *** *** ** *** * **** ** ** ******* *** **** ** ***** ** *** **** Después de Ia ejecución, la salida de cómputo para los datos de Sears es: la Ia salida de cóniputo para los datos de Sears es: EQUATION 1 *********** FIRST-ORDER SERIAL CORRELATION OF THE ERROR SERIAL CORRELATION OF THE ERROR ITERATIVE TECHNIQUE COCHRANE-ORCUTT ITERATIVE TECHNIQUE OF DEPENDENT VARIABLE MEAN OF DEPENDENT VARIABLE = STANDARD DEVIATION = VARIABLE: SALES DEPENDENT VARIABLE: SALES 7.29225 3.37732 OPTIONS OPTIONS FOR ROUTINE ******************* = TRUE 20 METHOD = CORC 0.90000 RMIN = -0.90000 = 0.10000 TOL 0.0050 = FALSE WEIGHT = FAIR PRINT RSTART TSCS TRUE MAXIT = TRUE RMAX o = 0 RSTEP = FALSE UNNORM INITIAL ESTIMATE INITIAL SSR = 2.2419 PARAMETER ESTIMATES: ESTIMATES: -.5243 0.1405E-01 AFTER CONVERGENCE ACHIEVED AFTER ITERATION RHO *** 1 1 7 ITERATIONS 7 STD ERROR OF EQN STD ERROR OF **************** 2 2 3 3 4 0.815355 0.870710 0.897917 0.913437 0.248105 0.244495 0.242975 0.242195 430 5 Regresión de datos de series de tiempo RegresiOn de datos de series 0.923445 0.241729 0.930504 0.241421 7 0.935808 0.241201 7 FINAL VALUE OF RHO = 0.935808 FINAL VALUE STANDARD ERROR OF RHO = 0. 788240E-01 OF RHO 0.788240E-01 T-STATISTIC FOR RHO = 11.8721 STATISTICS BASED ON RHO-TRANSFORMED VARIABLES RHO-TRANSFORMED VARIABLES STATISTICS ***************** *** ***************** ******** 6 6 SUM OF SQUARED RESIDUALS = OF STANDARD ERROR OF THE REGRESSION = STANDARD ERROR OF THE REGRESSION MEAN OF DEPENDENT VARIABLE = STANDARD DEVIATION = R-SQUARED = ADJUSTED R-SQUARED = F-STATISTIC( 1, 18) F-STATISTIC( 1, 18) = DURBIN-WATSON STATISTIC(ADJ FOR o GAPS) = DURBIN-WATSON STATISTIC(ADJ FOR 0 GAPS) NUMBER OF OBSERVATIONS = ESTIMATED VARIABLE COEFFICIENT C C 2.340258 INCOME 0.1093294E-01 5 Capítulo 9 Cap Itulo 1.04720 0.241201 0.951593 0.499369 0.778978 0.766699 63.4400 63 . 4400 1.0813 20 STANDARD T- STATISTIC ERROR T-STATISTIC 1.778342 1.315977 0.1372636E-02 7.964924 0. 1372636E-O2 BIBLIOGRAFíA BIBLIOGRAFIA COCHRANE, D. y ORCUTT, G. N. "Application of Least Squares to Relationships Containing AutocoofLeast Squares Containing AutocoCOCHRANE, D. YORCUTT, rrelated Error Terms." Journal of the American Statistical Association 44 (1949): 32 - 61. (1949): Journal ofthe American 61. DURBIN, J.J. y WATSON,G. S. "Testing for Serial Correlation in Least Squares Regressionn." Biometrika DURBIN, y WATSON, G. S. "Testing for Serial Correlation in Least Squares Regression II."Biometrika 38(1951): 159-178. 38 (1951): 159-178. JOHNSTON, 1. Econometric Methods, 2a. ed. Nueva York: McGraw Hill, 1972. JOHNSTON, J. Econometric Methods,2a. ed. Nueva York: McGraw -- Hill, 1972. KING, J. L. y BESSLER,D. A. "A comparison of Multivariate Forecasting Procedures for Economic KNG, L. Y BESSLER, D. A. "A comparison of Multivariate Forecasting Time Series." International Journal ofForecasting 1 (1) (1985): 5 --24. Time Series." International Journal of Forecasting 1(1) (1985): 5 24. LESSER,C. E. V. survey Econometrics". ofthe Royal Statistical Society, Series A, LESSER,C. E. V. "A survey on Econometrics". Journal of the Royal Statistical Society, Series A, 34 (1968): 530-566. (1968): 530 - 566. MAKRTDAKIS, S., WIJEELWRIGHT, S. MCGEE, V. E.V. E. Forecasting: Methods and Applications.Nueva MAKRIDAKIS,S., WHEELWRIGHT,S. C y C y MCGEE, Forecasting: Methods and Applications. Nueva Sons, 1983. York: John Wiley & Sons, 1983. PINDYCK, R. S. RUBThWELD, L. Econometric Models and Economic Forecasts. Nueva PINDYCK, R.S. yy RUBINFELD, D. D. L. Econometric Models and Economic Forecasts. Nueva York: McGraw-Hill, 1976, pp. 108 - 113. 1976, 108 113. YOUNG, R. M. "Forecasting with an Econometric Model: The of Judgemental Adjustment." YOUNG, R. M. "Forecastingwith an Econometric Model: The Issue of Judgemental Adjustment." Journal of Forecasting 1 (2) (1982): 189 --204. ofForecasting (2) (1982): 189 204. CAPíTULO CAPITU LO La metodología La metodologIa Box-Jenkins (ARIMA) Box-Jenkins (ARIMA) 0 ACTIVIDAD Los enfoques de pronóstico de atenuación exponencial (cap. 5), del análisis de correlación atenuación exponencial (cap. 5), del análisis de correlación regresión (caps. y del análisis de descomposición de series de tiempo (cap. 8), y de regresión (caps. 6-7) y del análisis de descomposición de series de tiempo (cap. 8), asumen que los valores de la serie que se pronostica son independientes estadísticamente estadIsticamente o no relacionados entre sí. En los caps. 6 y 7 se empelaron ecuaciones de regresión relacionados entre si. los caps. 6 y 7 se empelaron ecuaciones de regresión lineal para pronosticar la variable dependiente mediante sustitución de valores de la(s) pronosticar variable dependiente mediante sustitución de valores de la(s) lineal en la ecuación regresión y calculando un valor de predicción variable(s) independiente(s) en la ecuación de regresiOn y calculando un valor de predicción para y. para Y. Este capítulo trata con un tipo de modelos que produce pronósticos con base en una capItulo trata con un tipo modelos que produce pronósticos con base en una síntesis de los patrones históricos en los datos. Los modelos de promedio móvil autorregreen los datos. Los modelos de promedio móvil autorregresIntesis integrado (ARIMA: Autoregressive integrated movingaverage) son una clase espesivo integrado (ARIMA: Autoregressive integrated moving-average) son una clase especializada de técnicas de filtración que ignoran por completo a las variables independientes ignoran independientes cializada de técnicas filtración completo dispositivo altamente refinado la fonnulación de pronósticos. ARIMA en la formulación de pronósticos. ARIMA es un dispositivo altamente refinado de ajuste que utiliza valores reales y anteriores de la variable dependiente, para producir de curvas que utiliza valores reales y anteriores de Ia variable dependiente, para producir Un estos pronósticos es la pre- dicción de pronósticos precisos de corto plazo. Un ejemplo de estos pronósticos es la pre- dicción de precios mercado creados analistas corredores de bolsa basan precios del mercado de valores, creados por analistas corredores de bolsa y que se basan movimiento acciones. por completo en patrones anteriores del movimiento de los precios de acciones. La metodología ARIMA es apropiada si las observaciones de una serie histórica son metodologIa ARIMA es apropiada silas observaciones de una serie histórica son estadísticamente 0 relacionadas entre si. En dependientes estadIsticamente o si están relacionadas entre sí. En este cap. se exponen los cap. métodos de BoxJenkins. métodos de Box-Jenkins. TÉCNICA DE BOX-JENKINS TECNICA DE BOX-JENKINS El método Box-Jenkinsde pronóstico es diferente de la mayorIa de los métodos. Esta técnica Esta técnica BoxJenkins de pronóstico es diferente de la mayoría de los no asume ningiin patrón particular en los datos históricos de la serie a pronosticar. Utilizan ningún patron en datos históricos de un enfoque iterativo de identificación de un modelo útil a partir de modelos de tipo general. itil a partir de modelos de tipo general. El modelo elegido se verifica contra los datos histôricos para ver si describe Ia serie con elegido contra históricos describe la serie con El precisión. precision. El modelo se ajusta bien si los residuos entre el modelo de pronóstico y los puntos bien silos residuos los puntos históricos son reducidos, distribuidos manera aleatoria independientes. Si de datos históricos son reducidos, distribuidos de manera aleatoria e independientes. Si el modelo especificado no es satisfactorio, se repite el proceso utilizando otro modelo diseñado 432 La metodología Box-Jenkins (ARIMA) La metodologla Box-Jenkins (ARIMA) CapItulo Capítulo 10 original. satisfactorio. para mejorar el original. Este proceso se repite hasta encontrar un modelo satisfactorio. La un el enfoque. fig. 10.1 ilustra el enfoque. fig. 10.1 Los modelos ARIMA o modelos de promedio móvil autorregresivo integrado son un autorregresivo integrado son un tipo general de los modelos de Box-Jenkins para series de tiempo estacionarias. Recuerde los modelos de Box-Jenkins para series de tiempo estacionarias. Recuerde que una serie histórica estacionaria es aquella cuyo valor promedio no cambia a través del estacionaria es aquella cuyo promedio no cambia través tiempo. Este grupo incluye a los modelos AR solo con términos autorregresivos, los tiempo. Este grupo incluye los modelos AR sólo con términos autorregresivos, los sólo con términos de promedio móvil ylos modelos MA sOlo con términos de promedio móvil y los modelos ARIMA que comprenden tanto términos autorregresivos como de promedio móvil. La metodología de Box-Jenkins tanto términos autorregresivos como de prornedio móvil. La metodologIa de BoxJenkins sus datos. permite al analista seleccionar el modelo que mejor se ajuste a sus datos. permite Se puede efectuar la selecciOn del modelo apropiado comparando la distribuciOn de la selección apropiado comparando la distribu~ión de Se los coeficientes de autocorrelación de la serie histórica que se ajustando, con las los coeficientes de autocorrelación de la serie histOrica que se está ajustando, con las figs. 10.2, 10.3 10.4 distribuciones teóricas para los distintos modelos. En las figs. 10.2, 10.3 y 10.4 se muestran autocorrelación de los modelos distribuciones teóricas coeficientes distribuciones teóricas de los coeficientes de autocorrelación para algunos de los modelos más comunes. ARIMA rnás comunes. Box-Jenkins aplican métodos autorregresivos y de promedio Las técnicas de BoxJenkins aplican métodos autorregresivos y de promedio Las técnicas móvil los problemas pronóstico de series de tiempo. rnóvil a los problernas de pronóstico de series de tiempo. Postular Ia clase general de los modelos 1 Identificar el modelo tentativo a desarrollar Estimar parámetros en el Estirnar paiárnetros modelo tentativo a desan-ollar tentativo a desarrollar Diagnóstico de Verificación i,Es adecuado ci modelo? No SI Uso del modelo para pronosticar pronosticar \ Fuente: Box G. M. Jenkins, Time Series Analysis and Control (San Francisco: Holden-Day, Fuente: G. P. BoxyyG. M. Jenkins, Time Series Anah'sis Forecasting and Control (San Francisco: Holden-Day, 1970), p. 19. Reimpreso con autorización. 1970), p. 19. Reimpreso con autorización. Figura 10.1 10.1 Diagrama de flujo del método de Box-Jenkins. Diagrama de flujo del método de BoxJenkins. Técnica de Box-Jenkins 433 Autocorrelación Autoconelación Autocorrelación AutocolTelación parcial S o 0 k (periodos retrasados) k k O k I¡;- + ., -1 1 (a) -1 ~ ~ -S11 +o O k O k ~ ~ <e: -1 (b) -1 O I¡;- k O k + ~ 4' + I -1 (e) (c) -1 ~ ~ + ~ 11 ;>-" O k O k N ~ -1 <e: (d) -1 10.2 autocorrelación parcial Figura 10.2 Coeficientes de autocorrelación y de autocorrelación parcial modelos AR( 1) Y AR(2). de los modelos AR(1) y AR(2). 434 La metodologla La metodología Box-Jenkins (ARIMA) Capítulo 10 CapItulo Autocorrelación Autocorrelación parcial Ol---l-----------k 0 O k -1 I I¿J~ -1 1 (a) :i" I I¿J~ + ~o " ..:: ~ O k O k :E ~ -1 (b) -1 N O k O k I I¿J~ ~N I - I -1 (e) -1 I¿J~ ~~ I I¿J~ + ~o 11 O k O ..:: N ~ :E -1 (d) -1 Figura 10.3 Coeficientes de autocorrelación y de autocorrelación parcial 10.3 Coeficientes autocorrelación autocorrelación de los modelos MA(1) y MA(2). MA(I) MA(2). Técnica de Box-Jenkins 435 Autoconoelación Autocorrelación Autoco¡Telación parcial Autocorrelación parcial k '~ O -1 Ilr~------:=-------- k (a) I ~ I ~- ~- o -1 k O k + I -1 (b) ~ -f:i ~ 11 + <' < II- ~ 0 O k 0 O k o:: ~ -1 1 (e) -1 1 k (d) Figura lOA de autocorrelación Figura 10.4 Coeficientes de autocorrelación y de autocorrelación parcial de un modelo mixto ARIMA(1,1). mixto ARIMA(l,l). 436 La metodologia La metodología Box-Jenkins (ARIMA) Capítulo 10 CapItulo modelo, que las distribuciones que se muestran son teóricas Al seleccionar un modelo, recuerde que las distribuciones que se muestran son teóricas que es muy improbable que las autocorrelaciones de datos reales sean idénticas y que es muy improbable que las autocorrelaciones de datos reales sean idénticas teóricas. exactamente a cualquiera de las distribuciones teóricas. Sin embargo, usted debe, mediante error, poder ubicar en fonna adecuada la mayoría de tiempo de datos, prueba y enor, poder ubicar en forrna adecuada Ia mayorIa de las series de tiempo de datos, al ganar experiencia, la tarea se hará más fácil. y at ganar experiencia, Ia tarea se hará más fácil. AUTOCORRELACIONES PARCIALES AUTOCORRELACIONES PARCIALES el analista darse cuenta del orden apropiado del proceso autorreAl principio, ci analista pudiera no darse cuenta del orden apropiado del proceso autorregresivo para ajustarlo a una serie histórica. A este mismo tipo de problema se enfrentó al gresivo serie histórica. este mismo tipo de problema se enfrentó al número de variables independientes a incluir en un modelo de regresión múltiple. decidir el námero de variables independientes a incluir en un modelo de regresión multiple. parciales se emplean para ayudar identificar el grado de relación Las autocorrelaciones parc/ales se emplean para ayudar aa identificar el grado de reiación la misma, mientras que valiable valores anteriores entre los valores reales de una variable y valores anteriores de Ia misma, mientras que se efectos de las otras variables (periodos retrasados). mantienen constantes los efectos de las otras variables (periodos retrasados). La exposición de la derivación de autocorrelaciones parciales rebasa el alcance de este Ia derivación texto.¡ En su lugar, la la texto.1 En su lugar, esta sección se concentrará en Ia forma totalmente mecánica en Ia cual sección cada grupo de modelos. puede aplicarse a cada grupo de modelos. Modelo autorregresivo autorregresivo toma la forma Un modelo autorregresivo toma Ia forma Yl = o +1Y,1 + + ... + + (10.1) en donde Y, = variable dependiente Y,_1, Y,_2, Y,, variables independientes que son variables Y,-b Y,-b Y'-v = = variables independientesque son variables dependientes desfasadas un número especIfico de periodos dependientes desfasadas un nirnero específico ifJO' de regresión 00,! ifJ¡, ifJl, ifJp = coeficientes de regresión 02, 0 E, = término de residuo que representa sucesos aleatorios no ténnino de residuo que representa sucesos aleatorios no explicados por el modelo explicados el modelos autOlTegresivos presentaron ecuación Sin embargo, la ecuación Los modelos autorregresivos se presentaron en la ecuación 9.4. Sin embargo, la ecuación 10.1 difiere en varias formas importantes. En la ecuación 9.4 los coeficientes de regresión 10.1 difiere en varias formas importantes. En Ia ecuación 9.4 los coeficientes de regresión se estiman mediante el método lineal de mínimos cuadrados. la ecuación 10.1 los se estiman mediante el método lineal de minimos cuadrados. En la ecuación 10.1 los coeficientes de regresión se encuentran por medio de un método de mInimos cuadrados no método mínimos coeficientes de lineal. Por 10 regular el método de mínimos cuadrados no lineal utiliza una técnica Por lo regular ci método de mInimos cuadrados no lineal utiliza una técnica de cálculo Se emplean solución iterativa para calcular los parámetros en vez de usar un càlculo directo. Se emplean estimaciones preliminares como puntos iniciales; luego estas estimaciones se mejoran mejoran estimaciones preliminares corno puntos iniciales; luego estas estimaciones ¡ Para una exposición de autocorrelaciones parciales, consñltese a G. Box y G. Jenkins, Time Series Analysis.' autocorrelaciones parciales, consúltese a G. Box y G. 1enkins, Time Series Analysis: Para Forecasting and Control (Saii Francisco: Holden-Day, 1976). and Control (San Francisco: Holden-Day, 1976). Autocorrelaciones parciales 437 sistemáticamente hasta encontrar valores óptimos. Además, la varianza para la ecuación sistemáticarnente hasta encontrar valores óptimos. Además, la varianza para ecuación 10.1 se calcula de una forma distinta que toma en cuenta el hecho de que las variables variables 10.1 se calcula de una form.a distinta que toma en cuenta el hecho de independientes están relacionadas entre sí. Por ültimo, La ecuación 10.1 pudiera o no último, ecuación 10.1 pudiera no independientes están relacionadas Si. contener un ténnino constante. No se emplea el término constante cuando los valores de la término valores de la un término su media (Y' = Y). (las Y) variable dependiente (las Y) se expresan como derivaciones de su media (Y' ==YY= Y). La fig. 10.2 muestra las ecuaciones de un modelo AR de orden 1, modelo AR(1) y fig. 10.2 ecuaciones de modelo orden 1, modelo AR(l) Y de un modelo AR de orden 2, modelo AR(2). Se pueden agregar términos para representar orden 2, modelo AR(2). Se pueden agregar términos para representar de el modelo AR(P), en donde p es el número de observaciones anteriores un modelo AR(p), en donde p es el nuimero de observaciones anteriores a incluir en el pronóstico del siguiente periodo. Las figs. 10.2(a) comportamiento de las pronOstico del siguiente periodo. Las figs. 10.2(a) y (b) ilustran el comportamiento de las funciones teóricas de autocorrelación y autocorrelación parcial para un modelo AR(1). funciones teóricas de autocorrelación y autocorrelación parcial para un modelo AR(l). Nótese qué tan diferente se comportan las funciones de autocorrelación y de autocorrelación se coeficientes de autocOlTelación cero en forma gradual, mientras parcial. Los coeficientes de autocorrelación descienden a cero en forma gradual, mientras que los coeficientes de autocorrelación parcial caen a cero después del primer periodo de coeficientes autocorrelación parcial caen a cero después del que retraso. Las figs. 10.2(c) y (d) muestran un modelo AR(2). De nuevo, los coeficientes de muestran un modelo AR(2). De nuevo, los coeficientes de retraso. Las figs. 10.2(c) autocorrclación descienden a a cero, mientras quelos coeficientes de autocorrelación parcial aUtocolTelaCiófl descienden cero, mientras que los coeficientes de autocorrelación parcial caen a cero, después del segundo periodo de retraso. En general, este tipo de patrón se después del segundo periodo de retraso. En general, este tipo de patron se caen mantendrá modelo AR(P). embargo, recordarse que las funciones rnantendrá para cualquier modelo AR(p). Sin embargo, debe recordarse que las funciones a la variación de autocorrelaciOn de la muestra diferirán de estas funciones teóricas debido a la variaciOn autocorrelación de la muestra diferirán de de Ia muestra. la Ejemplo 10.1 En la tabla 10.1 se rnuestra un ejemplo del uso de un modelo de pronóstico AR(2). Suponga la tabla 10.1 sc muestra un ejemplo dcl uso de un modelo de pronóstico AR(2). Suponga que que se muestran las ventas de los ñltimos cinco periodos de una serie que contiene 100 muestran las ventas los últimos cinco periodos de serie que contiene 100 obscrvaciones. Se elige el modelo AR(2) y el programa de cómputo de Box-Jenkins calcula observaciones. Se elige el modelo AR(2) y el programa de córnputo de BoxJenkins calcula los coeficientes de regresión de qi1 = .59 Y Ø = .40. El pronOstico del periodo t sin utilizar una coeficientes de regresión de epi = y f/>z = .40. El pronóstico del periodo constante en la ecuación es constante en 1, = + = .59(250) + .40(240) = 243.5 .59(250) .40(240) = 243.5 Por desgracia, no todas las series de datos pueden manejarse con modelos autorregresivos. de.sgracia, razón, enfoque Box-Jenkins considera también el modelo de promedio móvil Por esta razón, el enfoque de BoxJenkins considera tarnbién el modelo de promedio móvil (MA). TABLA 10.1 PRONÓSTICO CON UN MODELO TABLA 10.1 PRONOSTICO CON UN EL EJEMPLO 10.1 AUTORREGRESIVO PARA EL EJEMPLO 10.1 DE VALORES DE PERIODO RESIDUO é, VALORES 240 230 225 225 240 250 PRONOSTICO PRONÓSTICO 238.3 240.1 231.7 224.8 231.6 243.5 t - 5 t-4 t- 3 t- 2 tt- 11 t-5 t-4 t-3 t-2 1.7 -10.1 -6.7 + 15.2 +15.2 +18.4 + 18.4 438 La metodologla Box-Jenkins (ARIMA) metodología Capítulo 10 CapItulo Modelos de promedio Modelos de promedio móvil promedio móvil [onna Un modelo de promedio rnóvil toma la forma = + - W1E,1 W7E,_, + + (/f_q (10.2) en donde y, = variable dependiente dependiente W0, W1, W2, Wq = Wo, W), W2, w q = específico peso especIfico Cr = residuo o error Cr-h, e,_2, e, = valores previos de residuos C'_2, c,-q = valores ecuación 10.2 es similar a la ecuación 10.1 excepto que la variable dependiente Y, La ecuación 10.2 es similar a Ia ecuación 10.1 excepto que la variable dependiente Y depende previos residuos, de la misma variable. depende de los valores previos de los residuos, en vez de Ia misma variable. Los modelo promedio móvil (MA) proporcionan pronósticos de Y, con en una combinación de promedio móvil (MA) proporcionan pronósticos de Y, con base en una combinación lineal errores anteriores, mientras que los modelos autorregresivos (AR) expresan y, lineal de errores anteriores, mientras que los modelos autorregresivos (AR) expresan Y como función lineal cierto número de valores anteliores reales de Y,. Es una como una función lineal de cierto nñmero de valores anteriores reales de Y, . Es una los pesos específicos coeficientes negativos, aun cuando los pesos costumbre presentar los pesos especIficos con coeficientes negativos, aun cuando los pesos pueden ser positivos o negativos. La suma de W¡ + w-, + .... + wq no necesita ser igual a 1, negativos. La suma de w1 W2 + al, y los valores de w1 no se "mueven" con las nuevas observaciones, como sucede con los Y los valores de W¡ "mueven" con las nuevas observaciones, como sucede con los cálculos promedio móvil cap. 5. Nótese que el nivel promedio u de serie cálculos de promedio rnóvil en el cap. 5. Nótese que el nivel promedio f.1 de una serie MA(q) es igual a un término constante, w0, en el modelo, ya que E(c,) = 0 para todos los igual a un término constante, Wo, modelo, ya que E(e) = O para todos valores de t. El nombre pronzedio móvil pudiera parecer inadecuado ya que de hecho el valores El nombre promedio ,nóvil pudiera parecer inadecuado ya que de hecho similar a la atenuación exponencial. modelo es similar a la atenuaciôn exponencial. . La fig. 10.3 muestra las ecuaciones de un modelo MA de orden 1, MA(l) Y de un fig. 10.3 muestra las ecuaciones de un modelo MA de orden 1, MA(1) y de un modelo MA(2). Se pueden incorporar ténninos para representar un modelo MA(q), en modelo MA(2). Se pueden incorporar términos para representar un modelo MA(q), en antenores incluir donde q es el nñmero de térrninos de error anteriores a incluir en el pronóstico dcl siguiente número téllninos del siguiente periodo. figs. 1O.3(a) y (b) ilustran también el comportamiento de los coeficientes de periodo. Las figs. 10.3(a) y (b) ilustran también el comportamiento de los coeficientes de autocorrelación teóricos del modelo MA(1). Nótese que afortunado es que las funciones MA(l). las funciones de autocorrelación y de autocorrelación parcial se comporten muy diferente en los niodelos comporten muy diferente en los modelos AR y MA. Los coeficientes de autocorrelación del modelo MA(1) caen a cero después del Los coeficientes de autocorrelación del modelo MA(l) caen a cero después del primer periodo de retraso, mientras que los coeficientes de autocorrelación parcial descienretraso, mientras que coeficientes autocorrelación parcial descienden a cero en forma gradual. Además, los coeficientes de autocorrelación del modelo MA(2) gradual. Adernás, los coeficientes de autocorrelación del modelo MA(2) después del seglmdo periodo retraso, mientras que los parciales descendcaerán a cero después del segundo periodo de retraso, mientras que los parciales descenderán gradualmente a cero. {Véase íigs. 10.3(c) y (d).] Una vez más, se debe mencionar que cero. [Véase figs. 10.3(c) y (d).] Una vez más, se debe mencionar que autocorrelación la muestra diferirán de estas funciones teóricas debido las funciones de autocorrelación de Ia muestra diferirán de estas funciones teóricas debido a Ia variación de Ia muestra. la de la muestra. Ej emplo Ejemplo 10.2 tém1inos eITor la tabla 10.1, se presenta un ejemplo del uso Utilizando los términos de error que aparecen en Ia tabla 10.1, se presenta un ejemplo del uso lID modelo pronóstico MA(2). Si el prograrna de BoxJenkins calcula los valores de un modelo de pronóstico MA(2). Si el programa de Box-Jenkins calcula los valores de w cornoW¡ = -.9 y W2 = .35, entonces como i' = Y '2 = - - = 237 -- (.9)(18.4) - -(.35)(15.2) = 248.2 237 (-.9)(18.4) (.35)(15.2) = 248.2 Aplicación de Ia metodologIa AplicaciOn de la metodolog ía 439 Modelos autorregresivos de promedio móvil Modelos autorregresivos de promedio Además de los modelos AR y MA, ambos se pueden combinar en un tercer tipo de modelo en tm tercer tipo de modelo general denominado ARIMA. La ecuaciones 10.1 Y 10.2 se combinan para formar denominado ARIMA. La ecuaciones 10.1 y 10.2 = + -WE -WEt-2 2 1-2 2 Ytl + Yt2 + + -"'-WE q - p Y 1-p + - w1E1 -WEt-q q I-q (l0.3) (10.3) (P, utilizan combinaciones anteriores valores anteLos modelos ARIMA (p, q) utilizan combinaciones de errores anteriores y valores anteriores ofrecen un potencial ajustar modelos que pudieron ajustarse forma riores y ofrecen uii potencial para ajustar modelos que no pudieron ajustarse en forma adecuada mediante los modelos AR y MA por si solos. sí solos. adecuada mediante los modelos AR fig. lOA muestra la ecuación de un modelo ARIMA(l, 1) el comportamiento La fig. 10.4 muestra la ecuación de un modelo ARIMA(1, 1) yY elcomportamiento los coeficientes de autocorrelación y de autocorrelación parcial. teórico de los coeficientes de autocorrelación y de autocorrelación parcial. Una diferencia importante entre la metodología de Box-Jenkinsyylos métodos previos entre la metodologia de BoxJenkins los métodos previos consiste en que Box-Jenkinsno hace suposiciones acerca del rnmero de términos o de los consiste en que BoxJenkins no hace suposiciones acerca del número de términos o de los pesos específicos a asignar los ténninos. El analista selecciona el modelo apropiado, pesos especIficos a asignar a los términos. El analista selecciona el modelo apropiado, incluyendo número de términos; después el programa calcula los coeficientes, utilizanincluyendo el ni'iniero de términos; después el programa calcula los coeficientes, utilizanmétodo no lineal de mínimos cuadrados. pronósticos do un método no lineal de minirnos cuadrados. Se pueden hacer pronósticos de periodos futuros y se pueden construir intervalos de confianza para estas estimaciones. futuros se pueden construir intervalos de confianza para estas estimaciones. APLICACIÓN DE METODOLOGíA APLICACION DE LA METODOLOGIA Como se muestra en Ia fig.10.l, el enfoque de BoxJenkins comprende tres etapas Como se muestra en la tig.l 0.1, el enfoque de Box-Jenkins comprende tres etapas separadas. Estas son: identificación del modelo, estimación prueba del modelo y separadas. Éstas son: identificacióndel modelo, estimación yy prueba del modelo y aplicación del modelo. modelo. Eta pa 1: ldentificación Etapa': Identificación del modelo Si 1. El primer paso en la identificación del modelo consiste en determinar si la serie es la identificación estacionaria, es decir, si el valor de la media varía a través del tiempo. varla tiempo. Si la serie no es estacionaria, en general se puede convertir a una serie estacionaria mediante general puede a una serie estacionaria el método de diferenciación. El analista especifica el grado de diferenciación y el algoritmo diferenciación. especifica el grado de de BoxJenkins convierte los datos en una serie estacionaria y realiza los cálculos de Box-Jenkins convierte los datos en una serie estacionaria y realiza los cálculos subsecuentes utilizando los datos convertidos. los datos convertidos. 2. Una vez obtenida una serie estacionaria, el analista debe identificar la forma del modelo a utilizar. paso se logra mediante la comparación de los coeficientes de autocorrelación y de Este paso se logra mediante la cornparación de los coeficientes de autocorrelación y de autocorrelación parcial de los datos a ajustar con las correspondientes distribuciones de los autocorrelación parcial de los datos con las correspondientes distribuciones de los 440 La metodologia La metodología Box-Jenkins (ARIMA) Capítulo 10 CapItulo figs. diversos modelos ARIMA. Para ayudar en la selección de un modelo apropiado, en las figs. 10.2, 10.3 Y 10.4, se muestran las distribuciones teóricas para los modelos ARIMA más 10.2, 10.3 y 10.4, se muestran las distribuciones teóricas para los modelos ARIMA más comunes. Como puede verse, cada modelo tiene un conjunto único de autocorrelaciones y de autocorrelaciones y de Como puede verse, cada modelo tiene un conjunto ünico autocorrelaciones parciales, y el ser capaz de poder ubicar los coeficientes autocorrelaciones parciales, y el analista debe ser capaz de poder ubicar los coeficientes correspondientes una de las distribuciones teóricas. correspondientes a los datos, a una de las distribuciones teóricas. Aun cuando en general no será posible hacer coincidir exactamente los datos con las Aun cuando general no coincidir exactamente los datos con las la 2 para determinar si el distribuciones teóricas, se pueden efectuar pruebas durante Ia etapa 2 para determinar si el se puede intentar un modelo modelo es adecuado. Entonces, si el modelo no es satisfactorio, se puede intentar un modelo alternativo. Después altemativo. Después de un poco de práctica, el analista se hará más apto en la identificación modelo adecuado. de un modelo adecuado. En términos generales, el analista debe identificar las autocorrelaciones que caen analista debe identificar las autocorrelaciones que caen En términos generales, exponencialmente las autocorrelaciones descienden exponencialmente a cero, exponencialmente a cero. Si las autocorrelaciones descienden exponencialmente a cero, el es el AR; si son las autocorrelaciones parciales las que descienden a cero, proceso indicado es el AR; si son las autocorrelaciones parciales las que descienden a cero, entonces el proceso indicado es el MA; como entonceS el proceso indicado es el MA; y, si tanto los coeficientes de autocorrelación como de descienden a cero, el indicado es un proceso mixto los coeficientes de autocrrelación parcial descienden a cero, el indicado es un proceso mixto ARIMA. El analista puede determinar el orden de los procesos AR y/o MA contando el ARIMA. El analista puede determinar ci orden de los procesos AR yb MA contando el número coeficientes de autocorrelación y de autocorrelación parcial que son diferentes nñmero de coeticientes de autocorrelación y de autocorreiación parcial que son diferentes en fonna significativa. de cero en forma significativa. Etapa 2: Estimación del modelo Eta pa 2: Estimación del modelo y prueba adecuación de su adecuación 1. Una vez seleccionado un modelo tentativo, se deben estimar los parámetros para ese ese 1. Una vez seleccionado un modelo tentativo, deben estimar los parámetros modelo. model o. Por ejemplo, suponga que se eligió un modelo ARIMA( 1, I). La formula rnatemática ejernpio, suponga quc se eligió un modeio ARIMA(1, 1). La fónnula matemática y ia fOrmula de pronóstico dci rnodeio respectivamente son la fórmula de del modelo respectivamente son Yt + El - 4'iEi y y - WE Para utilizar la ecuación de pronóstico, ci analista debe caicuiar los valores para 01 y pronóstico, el analista debe calcular los valores para 9¡ y w1. Estos cálculos se reaiizan rncdiante el programa de córnputo BoxJenkins, Estos cáiculos se realizan mediante ci programa de cómputo Box-Jenkins, utilizando como criterio de selccción de valores óptimos el error rnedio cuadrado. valores óptimos ci medio cuadrado. utiiizando como criterio de selección Suponga que los valores caiculados de Ø W¡ fueron .25 .5. Ahora, el modelo Suponga que los valores calculados de 9¡ y w1 fueron .25 y .5. Ahora, ci modelo tentativo es tentativo W¡. = .25Y1 - .5E,_1 Antes de usar el modelo para pronosticar, el analista debe verificar si es 2. Antcs de usar ci modclo para pronosticar, ci analista debe verificar si es adecuado. Aplicación de Ia metodologIa AplicaciOn de la metodología 441 Este paso se realiza revisando los términos de error, E, = Y.-- 1', para asegurarse de que son Y, Y, para asegurarse aleatorios. Esta verificación puede hacerse revisando que las autocorrelaciones de los aleatorios. Esta verificación puede hacerse revisando que las autocorrelaciones de los ténninos son diferentes de cero en forma significativa. térrninos de error para estar seguros de que no son diferentes de cero en forma significativa. Si algunos retrasos de orden menor estacionales son diferentes de cero de manera Si algunos retrasos de orden menor o estacionales son diferentes de cero de manera significativa, entonces 1, significativa, entonces el modelo resulta inadecuado. El analista debe regresar a la etapa 1, inadecuado. El debe paso 2, seleccionar un modelo alternativo y después continuar el análisis. alternativo después También se puede revisar lo adecuado del modelo haciendo una prueba de ji cuadrada del modelo haciendo ji (f), conocida como Ia estadIstica Q de BoxPierce, sobre las autocorrelaciones de los Ci), conocida como la estadística Q de Box-Pierce, sobre las autocorrelaciones de los residuos. estadística es residuos. La estadIstica de prueba es Q Q=(Nd) I rr; = (N - d) k= 1 k=l m rn (10.4) La cual está distribuida aproximadarnente como una distribución de ji cuadrada con k - p está distribuida aproximadamente corno una distribución de ji - q grados de libertad. En esta ecuación q grados de libertad. En esta ecuación N = longitud de la seric histórica serie histórica N k = prirneras k autocorrelaciones que se verifican primeras autoc01l'elaciones se verifican 111 in número máximo retrasos verificados = nümero máxirno de retrasos verificados autocorrelación de la muestra del késirno término = función de autocolTelaciónde la muestra del k-ésimo término de residuo rk d = grado de diferenciación para obtener una serie estacionaria grado de diferenciación Si el valor calculado de Q es mayor que la para k - p -- qqgrados de libertad, entonces Si mayor p grados de libertad, entonces se debe considerar que el modelo es inadecuado. El analista debe regresar a la etapa 1, paso inadecuado. El debe Ia 2, seleccionar otro modelo y continuar el análisis hasta encontrar un modelo satisfactorio. satisfactorio. Ninguna de estas dos pruebas de adecuación debe considerarse como la última Ninguna de estas dos pruebas de adecuación debe considerarse como Ia itltima palabra, aunque en general deben utilizarse juntas, además de un juicio considerable por utilizarse jimtas, además de un considerable palabra, aunque parte parte del analista. Por ejemplo si se pueden explicar algunas desviaciones mayores por analista. ejemplo si se pueden explicar algunas desviaciones mayores circunstancias no usuales, sc pueden ignorar estas desviaciones si el modelo es circunstancias no usuales, se pueden ignorar estas desviaciones si el resto del modelo es adecuado. más modelos como aproximadamente iguales, Es posible que se puedan juzgar dos o más modelos como aproximadamente iguales, aunque ninguno de ellos se ajuste exactamente a los datos. En este caso, debe prevalecer aunque ninguno de ellos ajuste exactamente a los datos. En este caso, ci el principio de parsimonia y elegir el modelo más sencillo. parsimonia y elegir el modelo más sencillo. ..t Etapa 3: Pronóstico con el modelo Eta pa 3: Pronóstico con el l. Una vez que se encontró un modelo adecuado, se realizar para uno 1. Una vez que se encontró un modelo adecuado, se pueden realizar pronósticos para uno o varios periodos a futuro. a futuro. También se pueden formular intervalos de confianza sobre estas estimaciones. En general, fonnular confianza estimaciones. En general, entre más a futuro se pronostica, mayor será el intervalo de confianza. Estos pronósticos e rnás futuro pronostica, mayor será el intervalo de confianza. Estos pronósticos e intervalos de confianza se calculan mediante el programa de BoxJenkins a solicitud del intervalos de confianza se calculan mediante el programa de Box-Jenkins a solicitud del analista. 442 La metodologia Box-Jenkins (ARIMA) metodología Capítulo 10 CapItulo 2. Al haber más datos disponibles, se puede utilizar el mismo modelo para revisar los datos disponibles, mismo modelo pronósticos, seleccionando otro periodo de origen. 3. Si la serie parece camb jar a través del tiempo, pudiera ser necesario recalcular los la serie parece cambiar través del tiempo, pudiera ser necesario recalcular los parámetros, o incluso desarrollar un modelo nuevo por completo. los errores de pronóstico, pudieran indicar que Si se aprecian pequeñas diferencias en los errores de pronóstico, pudieran indicar que es necesario recalcular los parámetros, y el analista deberá regresar a la etapa 2, paso 1. l. es necesario recalcular los parámetros, y el analista deberá regresar a etapa Cuando se aprecian grandes diferencias en la dimension de los errores de pronóstico, los errores de pronóstico, Cuando se aprecian grandes diferencias en dimensión pudieran indicar que se requiere un modelo completamente nuevo, y el analista deberá requiere un modelo completamente nuevo, el analista deberá pudieran indicar que regresar a la etapa 1, paso 2, o inclusive a la etapa 1, paso 1 y repetir el proceso de ajustar 1, 1, 1 y repetir el proceso de ajustar un nuevo modelo a la serie histórica. la serie histórica. La siguiente notación se utiliza con frecuencia en las técnicas de Box-Jenkins. Se siguiente notación se utiliza con frecuencia en las técnicas de Box-Jenkins. identifica un modelo como ARIMA(p, d, q), en donde es el orden ténnino autorreidentifica un modelo como ARIIVIA(p, d, q),en donde pp es el orden del término autorregresivo, d es el nivel de diferenciación y q es el orden del término del promedio mOvil. En de diferenciación q es el orden del ténnino del promedio móvil. gresivo, diferenciación, la práctica, cuando no hay diferenciación, el modelo apropiado es ARIMA(p, q). Ejemplo 10.3 La Cameron Consulting Corporation se especializa en portafolios de servicios de inversion. A inversión. Lynn Stephens, el analista de la compañía, se le asignó la tarea de desarrollar técnicas de Lynn Stephens, el analista de Ia cornpa?iIa, se le asignó Ia tarea de desarrollar técnicas de pronóstico más complejas para pronosticar los promedios del Dow-Jones. Lynn asistió pronóstico más complejas para pronosticar los promedios del Dow-Jones. Lynn asistió recienteniente a un taller sobre la metodología de Box-Jenkins y decidió probar la técnica recientemente a un taller sobre Ia metodologla de Box-Jenkins y decidió probar Ia técnica sobre el Indice de Transporte. La Tabla 10.2 representa los 55 prornedios de cierre diario del Indice de Transporte. Tabla 10.2 representa los 55 promedios de cierre diario del Indice de Transporte durante los meses de verano. TABLA 10.2 TABLA 10.2 PROMEDIOS DIARiOS INDICE DE TRANSPORTE PROMEDIOS DIARIOS AL CIERRE DEL INDICE DE TRANSPORTE PERIODO PERIODO 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 PROMEDIO AL CIERRE CIERRE 222.34 222.24 221.17 218.88 220.05 219.61 216.40 217.33 219.69 219.32 218.25 220.30 222.54 223.56 PERIODO 15 15 PROMEDIO PROMEDJO AL CIERRE 223.07 225.36 227.60 226.82 229.69 229.30 228.96 229.99 233.05 235.00 236.17 238.31 241.14 241.48 PERIODO PERIODO 29 30 31 32 33 34 35 36 37 38 39 40 41 42 PROMEDIO AL CIERRE CIERRE 246.74 248.73 248.83 248.78 249.61 249.90 246.45 247.57 247.76 247.81 250.68 251.80 251.07 248.05 PEPJODO PERIODO 43 44 45 46 47 48 49 50 51 52 53 54 55 PROMEDI( PROMEDI O AL CIERRI CIE RRE 249.76 251.66 253.41 252.04 248.78 247.76 249.27 247.95 251.41 254.67 258.62 259.25 261.49 16 17 18 19 20 21 22 23 24 25 26 27 28 Aplicación de Ia metodologia la metodología 443 260.00 250.00 240.00 230.00 220.00 210.00 I I I I I I I I I I I 5 5 10 10 15 20 25 30 35 40 45 50 55 45 Periodo Figura 10.5 Promedios diarios al cierre del Indice de transporte. Figura 10.5 del índice de transporte. Lynn comienza el análisis observando la gráfica de los datos que se muestra en fig. Lynn cornienza el análisis observando la gráfica de los datos que se muestra en la fig. 10.5. ParecIa haber una tendencia en los datos. 10.5. Parecía haber una tendencia en los datos. Su primer paso en la identificación de un primer en la identificación de un modelo tentativo fue observar los coeficentes de autocorrelación de los datos, que se presentan que las 12 primeras autocorrelaciones parecían descender cero, la fig. 10.6. Al en la fig. 10.6. Al ver que las 12 primeras autocorrelaciones parecIan descender a cero, reconoció que su apreciación original era correcta y que estos datos tenían una tendencia y reconoció que su apreciación original era correcta y que estos datos tenlan una tendencia y deberIan diferenciarse. Lynn tomó en cuenta la tendencia ascendente en los datos mediante Ia Ia tendencia ascendente deberían diferenciarse. Lynn tomó la diferenciación estacional. aplicación de una diferenciación no estacional. autocorrelaciones de los datos diferenciados que se presenta en la fig.10.7 gráfica La gráflca de las autocorrelaciones de los datos diferenciados que se presenta en la fig. 10.7 estacionarios. embargo, no parecla existir ningün patron aparente. mostró que los datos eran estacionarios. Sin embargo, no parecía existir ningún patrón aparente. Una revision de las autocorrelaciones parciales confirma la ausencia de un patrón. Es evidente revisión autocOlTelaciones parciales confirma la ausencia de un patron. Es evidente que sOlo existe una tendencia en los datos del Índice de Transporte. Se puede emplear la que sólo existe una tendencia en los datos del fndice de Transporte. Se puede emplear la metodología de Box-Jenkinspara modelar los datos; sin embargo, otros métodos serian menos metodologia de BoxJenkins para modelar los datos; sin embargo, otros métodos serían costosos y posiblemente más precisos. costosos La estimación de la constante general es .725. Un examen de la función de autocorrelaciOn autocorrelación de los residuos rnostrO que el modelo era adecuado. Lynn confirmó esta observación mediante mostró que ci modelo era adecuado. Lynn confirmó esta observación estadística ji cuadrada. El valor calculado de ji cuadrada es menor que el la prueba de estadistica ji cuadrada. El valor calculado de ji cuadrada es menor que el valor prueba de la tabla para 17 grados de libertad a un nivel de significacion de .05 (17.06 < 27.6). 17 significación de .05 (17.06 <27.6). Normalmente, las Y se expresan como desviaciones de su media (Y == YY); no obstante, Normalmente, las Y se expresan como desviaciones de su media (Y Y -y); no obstante, Y. cuando se usa un término constante, se modelan los valores reales de Y término constante, modelan cuando 444 Lags Time Lags 24 23 22 La metodología Box-Jenkins (ARIMA) La metodotogla Autocorrelations Autocorrelat ions CapItulo Capítulo 10 21 21 20 19 19 18 17 17 * * 16 16 15 15 14 14 13 13 12 12 11 11 * * * * * * -.23 -.19 -.15 -.10 -.05 -.01 -.04 .09 .15 .22 .28 .33 .38 .44 .51 .56 .61 .61 .66 .66 .71 * 10 10 9 9 8 7 7 6 5 5 4 3 3 2 2 1 1 * .75 .75 * .80 * * .85 .90 .95 I I I I I I I I I I I I I I I -1 I I I I I I I I I +1 0 O Figura 10.6 Autocorrelación de los datos sin procesar de Ia tabla 10.2. Figura 10.6 Autocorrelación de la 10.2. El modelo de pronóstico con un término constante es El término constante Y, = .725 + Y1_1 Yt = .725 + Yt -¡ 57 son Los pronósticos para los periodos 56 y 57 son Y56 = Y56 = = .725 + 261.49 .725 261.49 = 262.22 262.22 y y Y57 = .725 = .725 + 262.22 + 262.22 Y57 = 262.94 262.94 Nótese que el pronóstico se incrernenta en .725 en cada periodo. pronóstico incrementa .725 cada periodo. Lynn decidió que la autocorrelaciOn marginalmente alta (.19) en el retraso 1 de la fig. autocorrelación 1 la fig. intentar un modelo ARIMA(O, 1, 1). Observe que la 10.7 indicaba la necesidad de intentar un modelo ARIMA(0, 1, 1). Observe que en Ia 10.7 indicaba la necesidad metodología Box-Jenkins siempre se ejecuta primero el modelo metodologIa de Box-Jenkins siempre se ejecuta primero el modelo más sencillo. De nuevo, mostró que la revisión de la función de autocorrelación de residuos mostró que el modelo era adecuado. revision valor calculado Lynn probó de nuevo la estadlstica ji cuadrada. El valor calculado de ji cuadrada es menor la estadística cuadrada. AplicaciOn de Ia metodologIa Aplicación la metodología Lags Time Lags 24 23 445 Autocorrelations .06 -.15 22 -.08 * * 21 21 20 19 * 18 18 17 17 16 16 15 * -.10 -.09 -.25 -.27 -.06 -.09 .02 14 13 12 11 10 9 9 8 8 * * I * .09 -.01 -.04 -.04 .07 .07 -.20 -.09 .11 7 7 6 6 5 5 4 4 3 3 * -.09 -.11 * .14 .14 .09 -.04 .19 19 I I I 2 2 1 1 *. -1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I O 0 +1 Figura 10.7 Autocorrelaciones de los datos diferenciados no estacionales 10.7 Autocorrelaciones de la tabla 10.2. 10.2. la tabla para 15 grados de libertad a un nivel de significación .05 (13.8 que el valor de la tabla para 15 grados de libertad a un nivel de significacion de .05 (13.8 < 25.0). <25.0). Los comandos de Minitab para resolver este ejemplo son Los comandos de Minitab para resolver este ejemplo son > 'TRANS.DAT' C1 MTB > READ 'TRANS.DAT' Cl 55 ROWS 55 ROWS READ C' C1 222.34 222.24 221.17 218.88 MTB > ACF Cl > ACF C1 OF C1 ACF OF Cl -1.0 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 0.8 1.0 +----+----+----+----+----+----+----+---+----+----+ 1 1 2 2 3 3 0.951 0.900 0.847 XXXXXXXXXXXXXXXXXXXXXXXXX xxxxxxxxxxxxxxxxxxxxxxxxx XXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXxxxxxx 446 4 4 5 5 6 6 7 7 8 9 10 11 12 13 14 15 16 17 0.795 0.748 0.707 0.658 0.658 0.609 0.561 0.505 0.440 0.381 0.328 0.277 0.277 0.215 0.152 0.093 La metodologla Box-Jenkins (ARIMA) metodología Box-Jenkins (ARIMA) Capítulo 10 CapItulo 10 xxxxxxxxxxxxxxxxxxxxx xXXxxxxxxxXxXxxXxxxxx xxxxxxxxxxxxxxxxxxxx XxXxxxXxxXxXxxxxxxxx xxxxxxxxxxxxxxxxxxx xXxXXXxxxXxxxxXXxxx xxxxxxxxxxxxxxxxx xxxxxxxXxxxxXXXxX xxxxxxxxxxxxxxxx xxxxxxXxXxxxxxxx xxxxxxxxxXxxXxX xxxxxxxxxxxxxxx xxxxxxxxxxxxxx XxxxXxxxxxxxxx xxxxxxxxxxxx xxxxxxxxxxxX xxxxxxxxxxx xxxXxXXXXxx xXxxxxxxX xxxxxxxxx xXXXxXxx xxxxxxxx XxxxXX xxxxxx xxxxX xxxxx XXX xxx El correlograma muestra que los datos son no estacionarios (con tendencia) y El correlograma muestra que los datos son no estacionarios (con tendencia) y ser diferenciados. requieren ser diferenciados. MTB > DIFFERENCE 1 1Cl. STORE IN C2 C2 MTB > DIFFERENCE Cl, STORE A continuación, se calculan y exhiben los coeficientes de autocorrelación y de autocorrecontinuación, coeficientes autocorre1ación autocorrelación parcial. MTB > ACF C2 MTB ACF C2 ACF OF C2 ACE OF C2 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 0.2 +- - --- -+- - -- - -+- - +----+----+----+----+----+----+----+----+----+----+ -0.185 XXXXXX -0.044 -0.044 XX 0.093 XXX 0.136 XXXX -0.110 -0.110 XXxx XXXX -0.095 XXX 0.110 XXXX -0.088 XXX -0.196 XXXXXX 0.069 XXX -0.042 XX -0.044 -0.044 XX -0.009 X X 0.095 XXX xxx 0.025 XX -0.086 XXX -0.056 -0.056 XX -1.0 -0.8 -0.6 -0.4 -0.2 1 1 2 2 3 3 4 5 5 6 6 7 7 8 9 10 11 12 13 14 15 15 16 17 MTB > PACE C2 MTB > PACF C2 la metodología Aplicación de Ia metodologIa 447 C2 PACF OF C2 1.0 0.8 0.6 0.4 0.2 -1.0 -0.8 -0.6 -0.4 -0.2 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 11 11 12 12 13 13 14 15 15 16 17 17 0.185 -0.081 0.081 0.121 0.094 -0.151 0.151 -0.038 0.038 0.108 0.148 -0.148 -0.104 0.104 0.125 -0.149 0.149 0.080 0.009 0.006 0.054 -0.082 0.082 -0.118 0.118 0.2 0.4 0.6 0.8 1.0 0.0 +- --- -+- - --- - -++----+----+----+----+----+----+----+----+----+----+ XXXXXX XXX XXXX XXX XXXXX XX XXXX XXXXX XXXX XXXX XXXXX XXX X X X X XX XXX XXXX • El cornando ACF se usa para calcular los coeficientes de autocorrelaciOn para los datos comando calcular los coeficientes de autocorrelación para los datos de transporte en C1. transporte en Cl. • El cornando DIFFERENCE se emplea para tornar la primera diferenciación de la comando DIFFERENCE se emplea para tomar Ia primera diferenciación de C1 y almacenarla en C2. columna Cl y almacenarla en C2. • El comando ACF se utiliza para calcular los coeficientes de autocorrelación de los datos autocorrelación diferenciación en C2. de la primera diferenciación en C2. • El comando PACF se usa para calcular los coeficientes de autocorrelación parcial para la primera en C2. los datos de la prirnera diferenciación en C2. apropiado. análisis previo indicó A continuación se ejecuta el modelo ARIMA apropiado. El análisis previo indicO que la primera diferenciación seguían camino ligeramente ascendente. los datos de la prirnera diferenciación seguIan un carnino aleatorio ligerarnente ascendente. Minitab correspondientes comandos Los cornandos de Minitab correspondientes son MTB > > SUBC> SUBC> SUBC> SUBC> CONT> ARIMA(0 1 0) Cl; ARIMA(O 1 O) C1; CONSTANT; FORECAST 3 DAYS AHEAD STORE IN C3, & CONF LIMITS DAYS IN C3. & FORECAST IN C4 C5. IN C4 C5. Estimates at each iteration ea eh iteration SSE Iteration Parameters O 0 1 1 2 2 3 3 191.847 191.308 191.307 191.307 0.825 0.730 0.725 0.725 448 La metodologIa La metodología Box-Jenkins (ARIMA) CapItulo 10 Capítulo 10 Relative change in each estimate less than 0.0010 each estimate less than 0.0010 Relative Final Estimates of Parameters Final Parameters ++ - - - - --+ Sto Dev. Estimate St. t-ratio IEstimate I It-ratio I 0.2581 2.81 I I 0.7248 I 0.7~48 I +- - - - - - - --+ ++ + + - - - - - --+ Differencing: 1 regular difference regular 1 Original series 55, after differencing 54 No. of obs. : series 55. after differencing 54 No. of obs.: SS = 191.307 Residuals: 191.307 (backforecasts excluded) excluded) +- - - - - - - - - - - - --+ + + DF = 53 MS 3.610 I OF = 53 I MS = +- - - - - - - - - - - - --+ + + Modified Box-Pierce chisquare statistic Modified chisquare statistic 48 Lag 24 36 12 49.8(DF=il8) Chisquare 9.5(DF=12) 27.0(DF=24) 49.8(DF48) 9.5(DF12) 27.0(DF24) 33.7(DF=36) +- - - - - - - --+ + + Type Constant from period 55 Forecasts from period 55 Period 56 57 58 Forecast 262.215 262.940 263.664 95 Limits 95 Percent Limits Lower Upper 258.490 265.939 268.207 257.672 270.115 257.213 Actual Ac t u a 1 • El comando ARIMA(O 1 O)CI se usa para ejecutar un modelo sin el término AR o MA ARIMA(O I O)C 1 lill sin ténnino AR o MA para los datos de Ia primera diferenciación. El cornando ARIMA(O OO)C2 produciría el la prirnera comando ARIMA(O 0 0)C2 producirla mismo resultado. término • El subcornando CONSTANT se emplea para ejecutar el modelo con un término El subcomando CONSTANT se emplea para ejecutar el modelo con constante. subcomando pronósticos en C3 y colocar • El subcornando FORECAST se utiliza para almacenar tres pronósticos en C3 y colocar en C4 y CS. límites ilmites de confianza en C4 y C5. Ia estirnación final del parámetro constante proporción • La salida muestra que la estimación final del parámetro constante es .7248, la proporción I para este parárnetro es 2.81 y el EMC (error medio cuadrado) es igual a 3.61. t parámetro 2.81 a 3.61. A continuación, se ejecuta el modelo de prornedio rnóvil de primer orden. Los A continuación, se ejecuta ci modelo de promedio móvil de primer orden. Los comandos de Minitab son cornandos de > ARIMA(O 1 1)C1; MTB > ARIMA(0 1 1)C1: SUBC> CONSTANT. CONSTANT. Estimates at Estimates at each iteration SSE Iteration Parameters 0.100 0 200.915 o 1 188.362 -0.050 1 188.362 0.050 2 183.584 -0.190 2 183.584 0.190 0.825 0.787 0.741 0.100 Aplicación de la metodología AplicaciOn Ia metodologIa 183.383 183.377 183.377 5 5 183.377 6 6 Relative change in each change in 3 449 -0.219 0.731 -0.224 0.730 0.729 -0.225 -0.226 0.730 0.0010 estimate less than 0.0010 3 4 4 Final Estimates Final Estimates of Parameters Parameters Estimate Sto Dev. Type Estimate St. Dev. MA 1 -0.2256 0.1366 Constant 0.3132 0.7296 t-ratio -1.65 2.33 Differencing: 1 regular difference 1 regular No. of obs. No. of obs.: Original series 55, after differencing 54 55. differencing 54 SS 183.359 (backforecasts excluded) excluded) Residuals: SS = 183.359 MS = 3.526 DF = 52 52 MS Modified Box-Pierce chisquare statistic Box-Pierce chisquare statistic 12 Lag 24 36 Chisquare 9.6(DF=11) 23.7(DF=23) 29.6(DF=35) 29.6(DF35) 9.6(DF11) 48 42.423.7(DF23) (DF=4 7) 42 . 4 (DF=47) la ténnino MA( 1) al Note que la proporción t para el término MA(1) no es significativa a! probarla al nivel de significación de 0.1. Por esta razón y tarnbién porque es más sencillo, se considera mejor también porque es más sencillo, se considera mejor el modelo con términos autorregresivos y promedio móvil de orden cero. con ténninos autorregresivos cero. Ejemplo 10.4 lOA Jim White, analista de Atron Corporation, tenía una serie histórica de lecturas para un proceso Jim White, analista de Atron Corporation, tenia una serie histórica de lecturas para un proceso que requerla de que requería de un pronóstico. Los datos se muestran en la tabla 10.3 y se grafican en Ia fig. pronóstico. Los datos se muestran en la tabla 10.3 la 10.8. Jim pensó que la metodología de Box-Jenkins funcionarIa mejor para estos datos. datos. 10.8. Jim pensO que la metodologla de Box-Jenkins funcionaría Jim comenzó ci primer paso en Ia identificación de un modelo tentativo observando las comenzó el primer paso en la identificación de un modelo tentativo observando las autocorrelaciones de los datos que se muestran en la fig. 10.9, para determinar si la serie era autocorrelaciones de los datos que se muestran en Ia fig. 10.9, para determinar si estacionaria. Las autocorrelaciones para los retrasos inferiores caen hacia cero con rapidez, de eStacionaria. Las autocorrelaciones para los retrasos inferiores caen hacia cero con rapidez, de concluyó que la serie era estacionaria. modo que Jim concluyó que Ia seric era estacionaria. TABLA 10.3 TABLA 10.3 60.0 81.0 72.0 72.0 78.0 78.0 61.5 78.0 78.0 57.0 84.0 72.0 72.0 67.8 LECTURAS DE UN PROCESO DE ATRON CORPORATION LECTURAS PROCESO 99.0 25.5 93.0 75.0 57.0 88.5 76.5 82.5 72.0 76.5 75.0 78.0 66.0 97.5 60.0 97.5 61.5 96.0 79.5 72.0 79.5 64.5 99.0 72.0 78.0 63.0 66.0 84.0 66.0 87.0 61.5 81.0 76.5 84.0 57.0 84.0 73.5 78.0 49.5 78.0 88.5 51.0 85.5 58.5 90.0 60.0 78.0 66.0 97.5 64.5 72.0 66.0 73.5 66.0 73.5 103.5 60.0 81.0 87.0 73.5 90.0 78.0 87.0 99.0 72.0 450 100.00 100.00 metodología Box-Jenkins (ARIMA) La metodologla Box-Jenkins (ARIMA) I Capítulo 10 CapItulo 10 I I 80.00 I MI 60.00 I I I 40.00 40.00 I 20.00 20.00 0 o 5 I I I I I I I I I I I 10 10 15 15 20 20 25 25 30 30 35 35 40 40 45 45 50 50 55 55 60 60 65 70 70 75 75 65 Figura 10.8 Lecturas de un proceso de Atron Corporation. 10.8 proceso de Atron Corporation. Time lags lags 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 10 9 8 7 7 6 Autocorrelations .19 -.19 .20 -.32 .32 .18 .20 -.20 .11 .11 -.09 .09 -.12 .12 .22 -.23 .23 .19 .19 -.19 .16 -.15 .15 .07 -.04 .04 .15 15 -.14 .14 .08 5 4 3 2 2 1 1 -1 1 I I I I .14 .14 .01 01 -.04 04 .28 28 -.53 53 I O 0 I I 1 +1 I Figura 10.9 Autocorrelaciones de los datos sin procesar de la tabla 10.3. Figura 10.9 Autocorrelaciones de los datos sin procesar de la tabla 10.3. Aplicación AplicaciOn de la metodología Ia metodologIa 451 Los dos primeros coeficientes de autocorrelación de de la muestra (.53Y .28) son Los dos primeros coeficientes de autocorrelación la muestra (-.53 y .28) son significativos a un nivel del 95% ya que se ubican fuera del rango. se ubican fuera del rango. significativos a un nivel del 0 ± 1.96( o ± 1.96( ~) O ± 1.96(.115) 0± 1.96(.115) 0 ± .225 O El coeficiente de autocorrelación de la muestra en el retraso 21 (-.32)también es significativo, coeficiente de autocorrelación de la muestra en el retraso 21 (.32) también es significativo, aunque este resultado se debe probablemente aa un desvío que se presenta en los retraso los aunque este resultado se debe probablemente un desvIo que se presenta en los retraso los superiores. sup eriores. En los coeficientes de autocorrelación parcial que aparecen en la fig. 10.10, Jim observó coeficientes autocorrelación parcial que aparecen en fig. que el primero era significativo, aunque ninguna de las demás autocorrelaciones parciales se significativo, aunque ninguna de las demás autocorrelaciones parciales se que aproximó a ser significativa. significativa. aproximó Los dos modelos son sugeridos mediante esta revision de los coeficientes de autocorrelasugeridos revisión coeficientes autocorrelación y de autocorrelación parcial. El parcial en el retraso 2 es cero (véase fig. 10.10). El ción de autocorrelación parcial. El parcial en el retraso 2 es cero (véase fig. 10.10). significado de este parcial es la dave de cuál de los modelos funcionará mejor. Como los significado de este parcial es la clave de cuál de los modelos funcionará mejor. Como los parciales en los retrasos 3, 4 y no son cercanos a cero, Jim piensa que el coeficiente de parciales en los retrasos 3, 4 Y 5 no son cercanos a cero, Jim piensa que el coeficiente de autocorrelación parcial de cero en el retraso 2 ocurrió debido a un error de muestreo casual. un error de muestreo casual. autocorrelación parcial de cero en el retraso Si de hecho los parciales descienden a cero, entonces se sugiere el modelo MA(2) mediante hecho los parciales descienden cero, entonces se sugiere el modelo MA(2) mediante Si los dos coeficentes significativos de autocorrelación en los retrasos 1 y 2 de la fig. 10.9. Sm coeficentes significativos de autocorrelación en los retrasos 1 y 2 de fig. 10.9. Sin Time Lags Lags 23 22 21 20 19 18 17 17 16 15 14 13 12 11 11 10 9 9 8 8 7 7 6 6 5 5 4 4 3 3 2 2 1 1 Autocorrelations -.09 .09 -.07 .07 -.23 .23 -.01 .01 -.09 .09 -.06 .06 -.13 .13 .04 .12 -.14 .14 .06 -.14 .14 -.01 .01 -.18 .18 .08 .06 .03 .00 .19 .07 .07 .15 00 .00 -.53 .53 * * I *I I * * * * * * * * I I * I* I* * * I I* I * * * * * -1 1 I I I I I I I I I I I I I I O +1 Figura 10.10 Autocorrelaciones parciales de los datos sin procesar de la tabla 10.3. Figura 10.10 Autocorrelaciones parciales de los datos sin procesar de 452 La metodologla Box-Jenkins (ARIMA) metodología Tabla 10.4 MODELOS MA(2) YY AR(1)PARA EL EJEMPLO 10.4 10.4 MODELOS MA(2) AR(1) PARA EL EJEMPLO 10.4 MA(2) Model Capitulo 10 Capítulo 10 at each iteration Estimates at each iteration SSE Iteration Parameters 7 7 0.567 -0.356 75.410 9786.2 0.356 Relative change in each estimate less than 0.0010 change in Final Estimates of Parameters Estimates of Type MA ] 1 MA 2 2 Constant Mean No. of obs.: No. of cbs.: Residuals: Estimate 0.5667 0.3560 -0.3560 75.410 75.410 75 75 SS 9724.97 SS = 9724.97 MS MS = 135.07 Sto Dev. St. 0.1107 0.1146 1.061 1.061 t-ratio t - ratio 5. 12 5.12 -3.11 3. 11 71 .08 71.08 (backforecasts excluded) excluded) DF = 72 72 DF 48 46.9(DF=46) 46.9(DF46) Modified Box-Pierce chisquare statistic chisquare statistic Modified Lag 24 12 36 7.0(DF=10) 23.8(DF22) 23.8(DF=22) 31.8(DF=34) Chisquare 7.0(DF1O) 31.8(DF34) from period 75 Forecasts from period 75 Period 76 77 78 AR(1) Model Model Forecast 80.648 78.169 75.410 95 Percent Limits 95 Lower Upper 57.864 103.431 51.982 104.356 47.996 102.825 Actual at each iteration Estimates at each iteration Iteration SSE Parameters 7 7 10113.5 -0.538 0.538 115.842 change less than 0.0010 Relative change in each estimate less than 0.0010 Estimates Final Estimates of Parameters Type AR 1 1 Constant Mean No. of obs. : No. of obs.: Residuals: Estimate ~0.5379 0.5379 115 .842 115.842 75.3267 Sto Dev. St. Dev. 0.0986 1.356 0.8816 t-ratio t - ratio ~5.46 5 . 46 85.44 85 . 44 75 SS = 10065.2 (backforecasts excluded) SS 10065.2 (backforecasts excluded) MS = 137.9 DF = 72 72 MS DF 12 12 9.3(DF=11) 9.3(DF11) Box-Pierce chisquare statistic Modified Box-Pierce chisquare statistic Lag Chisquare 24 29.9(DF=23) 29.9(DF23) 36 48 37.3(DF=35) 37.3(DF35) 58.3 (DF=4 7) 58.3(DF47) Forecasts from period 75 period 75 Forecasts Period 76 77 78 Forecast 77.116 74.364 75.844 95 Percent Limits 95 Lower Upper 54.097 100.135 48.226 100.502 48.871 102.817 AplicaciOn de Ia metodología Aplicación la metodologIa 453 embargo, si las autocorrelaciones parciales realmente cayeron a cero en el retraso 2, entonces cayeron retraso 2, entonces embargo, silas autocorrelaciones ser apropiado un modelo AR(l). pudiera ser apropiado un modelo AR(1). Se usará Minitab para analizar los datos mediante ambos modelos. Observe que se incluye Observe que se incluye término constante modelos debido valores variable dependiente un término constante en los modelos debido a que los valores de la variable dependiente no se han expresado como desviaciones de su media. Si los datos hubieran sido diferenciados, no desviaciones de su media. Si los datos hubieran sido diferenciados, no usaría se usarla el término constante. Los comandos de Minitab se muestran en la sección del Paquete se Ia sección del Paquete final del capítulo. de cómputo minitab, al final del capItulo. de El Cuadro 10.4 muestra los resultados de la ejecución de los modelos MA(2) y AR(1). muestra los resultados de ejecución de MA(2) AR(l). El Cuadro Ambos modelos parecen ser adecuados. Las proporciones t para ambos parámetros del modelo parámetro el modelo AR(l) es significativo MA(2) son significativos al nivel de .01. El parámetro para el modelo AR(1) es significativo significativos al nivel MA(2) .01. La estadística modificada de Box-Pierce para un nivel de significación a un nivel de significación de .01. La estadistica modificada de Box-Pierce para ji cuadrada es también significativa para todos es también significativa para todos los retrasos dados. Esta prueba muestra que los residuos retrasos dados. muestra que los residuos diferentes no son diferentes de cero en forma significativa. El EMC para ambos modelos es similar. Por fOl1lla significativa. El EMC para ambos modelos es similar. lo tanto, el AR(l) la sólo lo tanto, es probable que ci modelo AR(1) sea Ia mejor elección, pues solo tiene un parámetro, comparado con los dos que utiliza ci MA(2), y es el sencillo de modelos. comparado con los dos que utiliza el MA(2), y es ci más sencillo de los dos modelos. Los parámetros estimados para ci modelo son 115.84 para la constante y -.5379 para el parámetro parámetros estimados para el modelo son 115.84 para la constante y -.5379 para el parámetro autorregresivo. autotTegresivo. coeficientes de autocorrelación de los residuos muestran la fig.l 0.11. Sólo Los coeuicientes de autocorrelaciOnde los residuos se niuestran en Ia fig.10.l 1. SOlo un coeficiente es significativo y fáciimente podrIa haber ocurrido por casualidad. Jim confirma oCtuTido casualidad. confirma coeficiente significativo fácilmente podría Time Lag Lag 25 24 * Autocorrelations Autocorrelations -.07 -.07 -.11 23 23 22 21 21 20 19 19 18 18 17 17 16 15 15 14 13 13 * * * * 12 12 11 10 9 9 8 8 7 7 6 6 5 5 4 4 3 3 2 2 1 1 * * . * * * -.03 -.28 -.06 -.14 -.02 -.15 -.11 .14 -.15 .04 -.10 .03 -.07 -.03 .10 10 .14 -.06 .16 .09 .15 .15 * * 0 .09 .00 +1 I I I I I I I I I I I I I -1 O 0 Figura 10.11 Coeficientes de autocorrelación de los residuos del modelo AR(1) Figura 10.11 Coeficientes de autocorrelación de los residuos del modelo AR(l) ajustado ajustado con una constante. constante. 454 La metodología Box-Jenkins (ARIMA) La metodologIa Capítulo 10 CapItulo esta observación probando la estadistica ji cuadrada para 25 periodos de retraso. El valor esta observación probando la estadística ji cuadrada para 25 periodos de retraso. El valor calculado de ji cuadrada es menor que el valor de la tabla para 23 grados de libertad a un nivel la tabla para 23 grados de libertad a un nivel de significación de .05 (30.31 < 35.2). El modelo resulta adecuado. significación de .05 (30.31 <35.2). El modelo resulta adecuado. El modelo de pronóstico AR(1) con un término constante es ténnino constante Y, = 115.84 + (- .5379)Y,_, 115.84 + (-.5379)Y,1 El pronóstico para el periodo 76 es Y = 115.84 + (-.5379)(72) = 115.84 7ó Y = 77.11 77.11 76 es El pronóstico para el periodo 77 es Y = 115.84 + (-.5379)(77.11) 115.84 n = 74.36 Y/7 = 74.36 Ejemplo 10.5 quedó complacido los resultados de su pronóstico para la serie histórica Jim White quedó complacido con los resultados de su pronóstico para Ia serie histórica proceso mostrado la 10.3. Decidió la metodología Box-Jenkins de lecturas del proceso mostrado en Ia tabla 10.3. Decidió utilizar Ia metodologla Box-Jenkins pronosticar los errores en un proceso de control de calidad cargo. para intentar pronosticar los errores en un proceso de control de calidad a su cargo. Los datos se presentan la se presentan en Ia tabla 10.5 y se grafican en Ia fig. 10.12. 10.5 Y se grafican la fig. 10.12. la identificación Jim comenzó el primer paso con Ia identificación de un modelo tentativo observando las autocorrclaciones de los datos que aparecen en Ia fig. 10.13, para de determinar si Ia serie es determinar si la serie es autocorrelaciones de los datos que aparecen en la fig. 10.13, TABLA 10.5 10.5 -.23 .63 .48 -.83 -.03 1.31 .86 -1.28 O 0 -.63 .08 .08 -1.3 1.48 1.48 --.28 -.79 1.86 .07 .07 .09 ERRORES DEL CONTROL ERRORES DEL CONTROL DE CALIDAD DE ATRON -.2 -.21 .91 -.36 .48 048 -1.93 1.87 -.97 .46 046 2.12 -.97 .83 -.33 .91 -1.13 2.22 .8 .8 -1.95 2.61 .59 .71 -.84 -.11 1.27 1.27 .61 -1.38 - 1.38 -.04 .9 1.79 -.37 A .4 -1.19 .98 -1.51 .9 -1.56 2.18 -2.11 .7 .69 -.24 .34 .6 .15 -.02 .1 .1 -.62 2.27 -.62 .74 -.16 1.34 -1.83 .31 1.13 -.87 1045 1.45 .46 -.54 .89 1.07 1.07 .2 -.8 -.76 1.58 1.58 -.38 -1.95 -.51 -Al -.41 049 .49 1.54 -.96 "2ñ' 3.00 3.00 » f--- () tu ::J 5: a. ro ro 6" a. O 2.00 f--- I I I 11 I ID 3 1.00 1.00 I 1\ I JI 11 11 11 11 . 11 11 I 11 11 I . (Q 5" I 11 I m' / 0.00 0.00 I I A , -1.00 -2.00 I -3.00 -3.00 I I I I I I I II I I I I I I I I I I 5 5 10 15 20 25 30 35 35 40 45 50 55 30 60 65 70 75 80 85 90 75 Figura 10.12 Errores del control de calidad de Atron. 10.12 Errores del CJ1 CJ1 ~ 456 Time Lags Time La metodología Box-Jenkins (ARIMA) La metodologIa Autocorrelations .00 -.02 02 .03 CapItulo 10 Capítulo 10 24 24 23 22 22 21 21 -.04 .04 .03 -.03 .03 -.02 02 I 20 19 19 18 18 17 17 16 16 * * .04 -.05 .05 .01 .05 -.03 .03 -.02 .02 * I * 15 15 14 14 13 13 12 12 11 11 * I* I * I I I I .12 .02 -.16 .16 .02 15 .15 10 10 9 9 8 8 7 7 6 6 5 5 4 3 3 2 2 .13 -.13 -.01 .01 .07 -.06 .06 .09 -.49 .49 1 1 -1 1 I I I I I I O 0 I I I I I I I +1 +1 Figura 10.13 Figura 10.13 Autocorrelaciones de los datos, sin procesar, de Ia tabla 10.5. Autocorrelaciones de sin procesar, de la tabla 10.5. los coeficientes autocorrelación es diferente cero en forma Solo uno estacionaria. Sólo uno de los coeficientes de autocorrelación es diferente de cero en forma significativa significativaaa un nivel de significacióndel 95%, así que Jim concluye que la serie es un nivel de significación del 95%, asi que Jim concluye que la serie estacionaria. fig. 10.13 muestra que sólo el primer coeficiente de autocorrelación la muestra La fig. 10.13 muestra que sOlo ci primer coeficiente de autocorrelación de la muestra (-.49), es diferente de cero al nivel del 95%. Como los coeficientes de autocorrelacion (.49), es diferente de cero al nivel del 95%. Como los coeficientes de autocorrelacion se retraso 1, se sugiere un modelo MA(l). recortan después del periodo de retraso 1, se sugiere un modelo MA(1). partir de la muestra de coeficientes de autocorrelación la fig. 10.14, Jim observó A partir de la muestra de coeficientes de autocorreIaciOn parcial de la fig. 10.14, Jim observó significativas. patrón semeja al que Ia primera y segunda autocorrelaciones parciales eran significativas. Este patron semeja a! que la plimera segunda autocorrelaciones de un proceso en el que los parciales teOricos descienden hacia cero, sugiriendo de nuevo un en el que los parciales teóricos descienden hacia cero, sugiriendo modelo MA(1). A continuación, Jim usO Minitab pam estirnar los parámetros del modelo. MA(l). continuación, Jim usó para estimar los parámetros del modelo. MTB> ARINA(O 0 1)C1,C5; MTB > ARINA(0 O 1)C1.C5; CONSTANT; SUBC> CONSTANT; SUBC> FORECAST 3 C2. C3 C4. 3 C2, SUBC> C4. Estirnates at each iteration Estimates at SSE Pararneters Iteration Parameters 6 74.3130 0.588 0.153 6 Relative change in each estimate les s than Relative change in each estirnate less than 0.588 0.0010 Aplicación de la metodolog ía AplicaciOn Ia metodologIa 457 Final Estimates Final Estimates of Parameters Sto 0ev. St. Dev. Type Estimate 1 0.5880 0.0862 MA 0.04012 0.04012 Constant 0.15256 0.15256 0.04012 Mean of obs.: No. of obs. : 90 SS = 74.3056 SS 74.3056 t-ratio 6.82 3.80 Residuals: MS MS = 0.8444 excluded) (backforecasts excluded) DF = 88 88 CF Modified Box-Pierce chisquare statistic chisquare statistic 12 24 36 Lag 17.2(DF=35) Chisquare 9.1(DF=11) 10.9(DF=23) Chisquare 10.9(DF23) 9.1(DF11) 48 31.3 (DF=47) 17.2(D Forecasts from period 90 from period 90 Period 91 92 93 Forecast 0.27810 0.15256 0.15256 95 95 Percent Limits Lower Upper -1.52331 2.07952 -1.93716 2.24227 -1.93716 2.24227 Actual Time Lags 23 22 21 20 19 18 17 17 16 15 15 14 13 13 12 11 11 10 9 9 8 8 7 * *I * * * I* I * Autocorrelations .01 .01 -.04 .00 .03 -.12 -.02 -.02 I * .09 -.02 7 * 6 6 5 5 4 4 3 3 2 I I* 2 1 1 -1 .03 .03 .10 .05 05 .07 .07 .05 05 -.16 -.13 .12 .12 .00 -.15 .03 .03 -.01 -.14 -.2U -.20 -.49 I I I I I 0 O I I I I I I +1 Figura 10.14 Autocorrelaciones parciales de los datos, sin procesar, de la tabla 10.5. 10.14 Autocorrelaciones parciales de los datos, la tabla 10.5. 458 Time Lags 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 9 8 8 7 7 6 6 5 5 4 3 3 2 2 1 1 La metodologla Box-Jenkins (ARIMA) metodología Box-Jenkins (ARIMA) Autocorrelations Capítulo 10 CapItulo 10 I* * * * * * * * * * * * * * .04 .01 .02 .05 -.03 .19 19 . 11 .11 .07 .09 04 .04 .08 .04 .05 .05 .09 .04 .11 .11 .15 .15 .09 09 .12 12 .23 .09 -.09 .08 .19 -.02 .05 05 .13 04 .04 .10 -.08 I I I I I I I I I I I I I I I I I I -1 O 0 +1 Figura 10.15 Coeficientes de autocorrelación de los residuos del modelo MA(1). 10.15 Coeficientes de autocorrelación modelo MA(I). • El cornando ARIMA(O O 1)Cl, C5 se usa para ejecutar un modelo MA(l) para los datos comando ARIMA(O 0 1)C1, C5 se usa para ejecutar un modelo MA(1) para los y almacena los resultados en C5. en Cl y almacena los resultados en CS. estima que el parámetro para el modelo MA(1) es .588 y constante .15256. Se estirna que el parárnetro para el modelo MA(l) es .588 y la constante es .15256. Las proporciones tt son significativas para ambos. Los coeficientes de autocorrelación de los proporciones son significativas para ambos. Los coeficientes de autocorrelación de residuos para almacenaron la Una revisión de los coeficientes residuos para este modelo se almacenaron en Ia colunma 5. Una revision de los coeficientes modelo de autocorrelación de estos residuos se muestra en Ia fig.1O.15 e indica que son aleatorios. Esta residuos se muestra en la fig.lO .15 observación se confirmó al observación se confirrnó al probar la estadIstica modificada de Box-Pierce para ji cuadrada, estadística modificada de cuadrada, para varios periodos. pronóstico MA(l) es El modelo de pronóstico MA( 1) es ~ = .15256 -- (.588)e1_11 = .15256 (.588)e r _ Y91 = .15256 - (.588)(-.21353) == .27816 .15256 (.588)(-.21353) .278 16 pronóstico el periodo 92 es la constante 15256 se desconoce el Observe que el pronóstico para el periodo 92 es Ia constante ..15256 ya que se desconoce el Observe error para el periodo 91. periodo 91. Aplicación de Ia metodologIa la metodología 459 Ejemplo 10.6 A Jim White, analista de Atron Corporation, Ic agradó el procedimiento de pronóstico de lim White, analista de Atron Corporation, le agradó el procedimiento de pronóstico de Box-lenkins para los errores en el proceso Box-Jenkins para los errores en el proceso de control de calidad expuesto en el ejemplo 10.5. conferencia, lim viejo amigo lones le platicó el éxito obtenido. En una conferencia, Jim se encontró a su viejo amigo Ed Jones y le platicó ci éxito obtenido. Ed tenla uria aplicación similar y decidió intentar el método de Box-Jenkins. Los datos se tenía una aplicación similar decidió intentar el método Box-lenkins. Los datos se la 10.6. fig. 10.16 presenta gráfica los datos. muestran en Ia tabla 10.6. La fig. 10.16 presenta una gráfica de los datos. TABLA 10.6 TABLA 10.6 .77 .33 .33 2.15 ERRORES DEL CONTROL DE CALIDAD DE ED JONES ERRORES DEL CONTROL DE CALIDAD DE ED JONES 1.04 1.02 2.50 1.36 .48 .48 2.05 -1.46 -1.13 -2.85 -2.67 -2.71 -1.30 -.88 -.07 -1.47 -2.03 -2.54 -.23 .49 -.87 .61 .20 .98 .78 .80 .86 1.72 .15 -1.15 -2.46 -.37 .80 .80 .49 .50 .07 1.92 1.00 2.16 .04 1.91 .43 -.32 -.48 -.13 -2.26 -.73 .10 -1.47 -.89 -.53 -.20 -.70 -.27 .39 -.07 .89 .37 -.75 -1.24 -.62 -.54 -.23 1.05 -.66 .25 -.63 .91 -.21 .24 .05 .85 1.55 .40 1.82 .81 .28 1.06 3.00 2.00 _1 I I 1.00 I I' I 0.00 I -1.00 / I p I I I I I \1" A -2.00 -3.00 5 5 I I I I I I 10 10 15 15 20 25 30 30 35 40 45 50 55 60 65 70 75 80 70 10.16 En'ores calidad de Ed lones. Figura 10.16 Errores del control de calidad de Ed Jones. 460 Time Lags Lags 24 23 metodología Box-Jenkins (ARIMA) La metodologla Box-Jenkins (ARIMA) Autocorrelations Autocor relations * Capítulo 10 Capitulo 10 I -.08 .08 .03 -.01 .01 -.02 .02 -.09 .09 -.10 .10 -.13 .13 -.09 .09 -.18 .18 -.10 .10 .00 .04 -.04 .04 -.03 .03 -.07 .07 -.10 .10 -.19 .19 -.22 .22 -.16 .16 -.13 .13 .13 .13 .19 19 .35 .49 I I I* * 22 22 21 20 19 19 * * 18 18 17 17 16 16 15 15 14 14 13 13 12 12 11 10 10 9 9 8 8 7 7 6 6 5 5 4 4 3 3 2 2 1 1 -1 1 * I I I I I I I I I I I I I I I I 0 O +1 Figura 10.17 Autocorrelaciones de los datos en bruto de la tabla 10.6. Figura 10.17 Autocorrelaciones de los datos tabla 10.6. Ed cornenzó el primer paso con la identificación de un modelo tentativo observando las comenzó el primer paso con identificación de un modelo tentativo observando las autocorrelaciones de los datos que aparecen en Ia fig. 10.1 7, para de determinar si la serie es autocorrelaciones de la fig. 10.17, para de determinar si estacionaria. Las autocOlTelaciones de los retrasos inferiores descienden hacia cero después del estacionaria. Las autocorrelaciones de los retrasos inferiores descienden cero del tercer retraso, de modo que Ed concluye que la serie histórica es estacionaria. la serie histórica es estacionaria. tercer retraso, de modo Los dos primeros coeficientes de autocorrelación de la muestra (.49 y .35) son significacoeficientes de autocorrelación de Ia muestra (.49 Los tivos a un nivel de 95%, ya que se ubican fuera del limite. nivel se ubican fuera límite. tivos 0± 1.96(V) o ± 1.96( VISO) 0 1.96(.112) O ± 1.96(.112) 0 ± .219 O ± .219 El coeficiente de autocorrelación de la muestra en el periodo de retraso 7 (-.22) también es El coeficiente de autocorrelación de Ia muestra en el periodo de retraso 7 (.22) también es significativo, aunque este resultado deba a la casualidad. Los coeficientes significativo, aunque este resultado es probable que se deba a Ia casualidad. Los coeficientes cero, sugiriendo un modelo AR. de autocorrelación descienden hacia cero, sugiriendo un modelo AR. de los coeficientes de autocorrelación parciales de la muestra que presentan A partir de los coeficientes de autocorrelación parciales de Ia muestra que se presentan la fig. 1O.lS, Ed observó que el primero era significativo. Ya que las autocorrelaciones en Ia fig. 10.18, Ed observó que el prirnero era significativo. Ya que las autocorrelaciones la metodología Aplicación de Ia metodologIa Lags Time Lags 23 22 461 Autocorrelations -.03 .03 -.04 .04 -.03 .03 -.04 .04 .02 -.03 .03 .06 -.10 .10 -.17 .17 -.03 .03 .03 03 -.10 .10 .00 -.04 .04 .13 .13 21 21 20 19 19 18 18 17 16 15 14 14 13 12 11 11 10 9 9 8 8 * I I * * I I I 7 7 6 6 5 5 4 4 3 3 2 2 1 1 -.01 .01 -.07 .07 -.05 .05 -.27 .27 .01 .01 -.03 .03 .14 .49 -1 1 I I I I I O 0 I I I I I I +1 +1 Figura 10.18 Autocorrelaciones parciales de los datos en bruto de la tabla 10.6. 10.18 Autocorrelaciones parciales de los datos la tabla 10.6. parciales caen después primer periodo retraso y como se puede considerar parciales caen hacia cero después del primer periodo de retraso y corno se puede considerar que los coeficientes de autocorrelación descienden exponencialniente hacia cero, el proceso coeficientes autocorrelación descienden exponencialmente hacia cero, proceso que indicado es del tipo AR(1). No obstante, Ia autocorrelación parcial del segundo retraso es .14, parcial tipo AR(1). obstante, la .14, lo que podrIa indicar que los parciales descienden en forma exponencial hacia cero. Como podría los parciales descienden en forma exponencial hacia cero. Como lo existe esta posibilidad, se podrIa tarnbién probar un modelo ARIMA(1, 0, 1). podría también W1 modelo ARIMA(1, O, 1). continuación, Ed utiliza un programa de cómputo de BoxJenkins para estimar el(los) A continuación, Ed utiliza un programa de cómputo de Box-Jenkins para estimar el(los) parámetro(s) del niodelo. Debido a valores de la variable independiente no han sido paránietro(s) del modelo. Debido a que los valores de Ia variable independiente no han sido expresados como desviaciones de su media, normalmente se incluye ténnino expresados como desviaciones de su media, normalmente se incluye un término constante en Sin embargo, como la media de Yes en extremo pequeña (casi cero) comparada el modelo. Sin embargo, como Ia media de Y es en extremo pequena (casi cero) comparada desviación estándar, en este modelo no se incluye un ténnino constante. Se estima que con la desviaciôn estándar, en este modelo no se inciuye un término constante. Se estima que parámetro el modelo AR( 1) es .50084. Una revisión de los coeficientes de autocorreel paránietro para ci modelo AR(l) es .50084. Una revision de los coeficientes de autocorrelación de los residuos de Ia fig. 10.19 indica que son aleatorios, con una suma de los residuos de la fig. 10.19 son aleatorios, una suma de los residuos cuadrados igual a 1 .1. Ed confim1a esta observación probando la estadística de ji cuadrada para 1.1. Ed confirma esta observación probando la estadistica deji cuadrada para 26 periodos retrasados.. El valor calculado de ji cuadrada es menor que el valor de la tabia 26 periodos retrasados El valor calculado de ji cuadrada es menor que el valor de la tabla = 26 para 25 grados de Iibeltad (k - -p -- q = 26 - 11--0 O = 25) a un nivel de significación de .05 para 25 grados de libertad (k p = 25) a un nivel de significación de .05 (17.43 < 37.6). El modelo resulta adecuado. (17.43 37.6). El modelo resulta adecuado. 462 Time Lags Time Lags 26 25 La metodología Box-Jenkins (ARIMA) La metodologIa Autoc orre lat ions Autocorrelations -.10 .10 .06 -.11 .11 ..11 11 -.02 .02 .03 -.07 .07 -.03 .03 -.08 .08 .05 05 Capítulo 10 CapItulo 24 23 22 21 20 19 * 18 17 16 -.18 .18 -.03 .03 .03 .10 -.09 .09 .04 -.04 .04 .01 -.10 .10 -.12 .12 -.04 .04 -.19 .19 18 .18 15 14 13 12 11 10 9 9 8 8 7 7 6 6 5 5 * 4 4 3 3 2 2 1 1 -1 * I I O 0 .00 00 . 11 .11 -.07 .07 +1 I I I I I I I I I I I I I I Figura 10.19 Coeficientes de autocorrelación de los residuos del modelo AR(1). 10.19 Coeficientes autocorrelación modelo AR(I). El modelo de pronóstico ARIIMA(l O 1) es ARIMA(l 0 El ~ = .50O84Y_1 .50084Yr_l Los pronósticos para los periodos 81 y 82 son 81 y 82 son YS1 = (.50084)(l.06) = (.50084)( 1.06) YS1 = .53 y YS2 (.50084)(.53) = (.50084)(.53) YS2 = .265 .265 Ejemplo Ej emplo 10.7 Jill analista la ISC Corporation, necesita encontrar para pronosticar la Jill Blake, analista de Ia JSC Corporation, necesita encontrar un método para pronosticar la oferta al cierre de las acciones de JSC. Los datos se muestran en Ia tabla 10.7. Jill considera cierre de las acciones de ISe. Los datos se muestran en la tabla 10.7. Jill considera que la metodologIa de Box-Jenkinses Ia más apropiada para estos datos. La fig. 10.20 muestra metodología de BoxJenkins es la más apropiada para estos datos. 10.20 de los datos. una gráfica de los datos. primer paso con la identificación de un modelo tentativo observando las comenzó Jill comenzó el primer paso con Ia identificación de un modelo tentativo observando las autocorrelaciones de los datos que aparecen en fig. 10.21, para autocorrelaciones de los datos que aparecen en fig. 10.21, para de determinar si la serie es determinar la serie es estacionaria. Las autocorrelaciones de estacionaria. Las autocorrelaciones de los retrasos inferiores descienden rápidamente hacia retrasos inferiores descienden rápidamente hacia cero, así que Jill concluye que Ia serie histórica es estacionaria. la serie histórica estacionaria. cero, asi Aplicación de Ia metodologIa la metodología TABLA 10.7 10.7 235 235 463 CIERRE DE CIERRE DE ACCIONES DE LA ISC CORPORATION ISC CORPORATION 320 115 355 190 190 320 275 205 295 240 355 355 175 285 200 290 220 400 275 185 370 255 285 250 300 225 285 250 225 125 295 295 250 355 280 370 250 290 225 270 180 270 240 275 275 225 225 285 250 310 220 320 215 260 190 295 275 205 265 245 170 175 270 225 340 190 190 250 300 195 400 I I I 350 I I 300 I I I I I I I I I 250 I I A I I \ / I I vt I I \ \ I I I 200 I I I I 150 I I 100 I I I I I I I I I I I I 5 10 15 20 25 25 30 35 40 45 50 55 60 30 65 Figura 10.20 Cierre de acciones de la ISC Corporation. 10.20 de la ISC Corporation. 464 Lags Time Lags metodología Box-Jenkins (ARIMA) La metodologla Box-Jenkins (ARIMA) Autocorrelations .01 -.01 .01 Capítulo 10 n 20 19 19 18 18 17 17 * * * 16 16 15 15 14 14 13 13 12 12 I I* I I * -.07 .07 .03 -.10 .10 .13 .02 11 11 10 10 9 9 8 8 7 7 6 6 5 5 4 4 3 3 2 2 * I* I 1 1 .03 .09 -.11 .11 .14 -.02 .02 .04 -.08 .08 .02 .01 .01 -.18 .18 .11 . 11 -.20 .20 .33 -.40 .40 I 1 I I I I I I I I ~1 O 0 I I I I I I I I +1 Figura 10.21 Figura 10.21 Autocorrelaciones de tabla 10.7. Autocorrelaciones de los datos sin procesar de la tabia 10.7. Los dos primeros coeficientes de autocorrelación la muestra (.40 .33) son Los dos primeros coeficientesde autocorrelación dede lamuestra (-.40 y .33) son significativos y el resto parece descender exponencialmente cero. significativos a un nivel de 95%, y el resto parece descender exponencialmente hacia cero. de los coeficientes de autocorrelación parcial la muestra, A partir de los coeficientes de autocorrelación parcial de Ia muestra, que aparecen en la fig. 10.22, JiU observó que el primero era significativo y el segundo estaba cerca de serlo. Sm fig. 10.22, Jill observó que el primero era significativo y ci segundo estaba cerca de serb. Sin embargo el tercero desciende hacia cero. Como las autocorrelaciones parciales caen hacia cero Como las autocorrelaciones caen hacia cero después del ~egundo periodo de retraso después del segundo periodo de retraso y se puede considerar que los coeficientes de se puede considerar que los coeficientes de autocorrelación descienden cero en forma exponencial, AR(2). autocorrelación descienden a cero en forma exponencial, se debe considerar un modelo AR(2). A continuación, JiU utilizó un programa de cómputo de Box-Jenkins para estimar el(los) continuación, Jill utiiizó un programa de cómputo de BoxJenkins el(los) parámetro(s) del modelo. Ya que los valores de las variables independientes no fueron parámetro(s) del modelo. Ya que los valores de las variables independientes no fueron expresados como desviaciones de su media, se debe incluir en el modelo un término constante. desviaciones media, el Los parámetros estimados para el modelo AR(1) son 361.47 para la constante general y .40152 para ci modelo AR(l) son 361.47 para la constante general y .40152 ci autocorrelación para el parámetro autorregresivo. Ninguno de los coeficentes de autocorrelaciôn de los residuos es diferente de cero en forma significativa y la suma de los residuos cuadrados es igual a forma significativa y la suma de residuos cuadrados es igual a es diferente de cero 2,851.4. El modelo parece ser adecuado. JiU confirma esta observación probando la estadística 2,851.4. adecuado. Jill observación probando Ia estadIstica de ji cuadrada para 24 periodos retrasados. La ji cuadrada calculada es menor que ci valor cuadrada menor el valor de la tabla para 22 grados de libertad a un nivel de significación de .05 (16.45 < 33.92). libertad a un nivel de significación de .05 (16.45 <33.92). A continuación, Jill usa ci programa de cómputo para estimar los parámetros del modelo continuación, Jill el programa de cómputo para estimar los parámetros del modelo ARIMA(2, O, O). Se estima que los parámetros son -.32218 y .20809 con una constante general ARlMA(2, 0,0). Se estima que los parámetros son .32218 y .20809 con una constante general igual 286.48. Ninguno de los coeficientes de autocorrelación de los residuos es igual a 286.48. Ninguno de los coeficientes de autocorrelación de los residuos es diferente de cero de manera significativa y Ia suma de los residuos cuadrados es 2,719.9. Este modelo modelo de manera significativa y la suma de los residuos cuadrados tan1bién parece ser adecuado. Jill confirma esta observación utilizando la estadística de tarnbién parece ser adecuado. JiU confirma csta observación utilizando la estadIstica de ji Un análisis estacional Un anãlisis Time Lags Lags 19 19 465 Autocorrelations Autocorrela-tions .04 04 -.12 -.03 .21 .08 .13 -.04 -.03 18 18 17 17 16 16 * * 15 15 14 14 13 13 12 12 * 11 11 .14 .01 .01 * 10 10 9 9 8 8 7 7 6 6 5 5 * 4 4 3 3 2 2 1 1 * I I I I I I I I I I I I I -1 I I -.04 -.06 .07 -.13 -.14 -.03 -.02 .21 -.40 +1 O 0 Figura 10.22 Autocorrelaciones parciales de los datos sin procesar de La tabla 10.7. procesar de la tabla Figura 10.22 Autocorrelaciones parciales de cuadrada para 24 periodos retrasados. El valor calculado de ji cuadrada es menor que el valor cuadrada para 24 periodos retrasados. El valor calculado de ji cuadrada es menor que el valor de la tabla para 21 grados de libertad a un nivel de significación de .05 (13.76 32.57). Ya de Ia tabla para 21 grados de libertad a un nivel de significación de .05 (13.76 <<32.57). Ya que La suma de los residuos cuadrados es considerablemente menor se debe emplear el modelo la suma de los residuos cuadrados emplear el modelo O). ARIMA (2, 0, 0). El modelo de pronóstico ARIMA (2, 0, 0) es pronóstico O, O) es ~ = 268.48 + (- .32218)Y_1 + .20809Y_2 268.48 + (- .32218)Yt_l + .20809Yt_2 2;. Los pronósticos para los periodos 66 y 67 son pronósticos para los periodos 66 67 Y66 = 268.48 + (-.32218)(195) + .20809(300) = 268.08 Y66 = 268.48 + (- .32218)(195) + .20809(300) = 268.08 Y67 = 268.48 (- .32218)(268.08) + .20809(195) = 222.69 Y67 = 268.48 + (-.32218)(268.08) + .20809(195) = 222.69 UN ANAL ISIS ESTACIONAL UN ANÁLISIS Los patrones estacionales incorporan una mayor dificultad al pronóstico con modelos de Los patrones estacionales incorporan una mayor dificultad al pronóstico con modelos Box-Jenkins debido que adernás del patrón entre periodo y periodo existe un patron patrón Box-Jenkins debido que además del patron entre periodo y periodo existe la repetitivo más largo que ocurre cada L-ésimo periodo, en donde L es la longitud de la repetitivo más largo que ocurre cada L-ésimo periodo, en donde L es longitud estacionalidad. Para estirnar un patron estacional, se deben incluir en el modelo parámetros estacionalidad. estimar patrón en el modelo parámetros estacionales. Al igual que en Los modelos no estacionales, pueden ser procesos autorregreen los modelos no estacionales, pueden ser procesos autorregreestacionales. sivos de promedio móvil. Los ejemplos 10.8 y 10.9 aportarán indicaciones de cómo sivos o de promedio móvil. Los ejemplos 10.8 y 10.9 aportarán indicaciones de cómo resolver una aplicación estacional. aplicación estacional. ~ O) O) 2800.0 2400.0 2000.0 ID r 1600.0 6" a. o 5" ce 1200.0 ro 3 Qi' >;< ro o 800.0 I I I I ro c.... S· C/l ::J 7\ '> ::o ~ ~ () ID I 400.0 " I I I , ! I ! ! I I I I I " I I " I I I I J I 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 Figura 10.23 Ventas Figura 10.23 Ventas de Keytron Corporation. "2, 0 5" ...... o e Un análisis estacional 467 Ejemplo 10.8 A Kathy Fisher se le ha asignado la responsabilidad de pronosticar las ventas de Keytron A Kathy Fisher se le ha asignado la responsabilidad de pronosticar las ventas de Keytron Corporation. La compañía empezó hace 10 años y Kathy pudo encontrar 115 meses de datos Corporation. La compafila empezó hace 10 afios y Kathy pudo encontrar 115 meses de datos de ventas. Los datos comienzan en enero de 1986 y se muestran en la tabla 10.8. Kathy examinó 1986 10.8. Kathy examinó de la gráfica de datos de Ia fig. 1.23 Y decidió probar la metodología de Box-Jenkins. la fig. 1.23 y decidió probar la metodologIa de BoxJenkins. Kathy inició el primer paso con Ia identificación de un modelo tentativo observando las la identificación de un modelo tentativo observando las Kathy inició autocorrelaciones de los datos que se presentan en la fig. 10.24 para determinar si la serie era autocorrelaciones de los datos que se presentan en Ia fig. 10.24 para determinar si Ia serie era estacionaria. En su forma original, los datos no son estacionarios.. Muchas de las correlaciones f01111a son estacionarios.- Muchas de las estacionaria. son diferentes de cero en forma significativa (los retrasos 1, 3, 9, 11, 12, 13, 23, 24 y 25). Se significativa (los retrasos 1, 3, 9, 13, Y 25). Se son diferentes de indica un ligero patron de tendencia debido a que todas las correlaciones, excepto cinco, son patrón tendencia a que todas las correlaciones, excepto cinco, son positivas. Kathy decide hacer una primera diferencia de los datos. una primera diferencia los datos. positivas. La figura 10.25 muestra las autocorrelaciones de la primera diferenciación de los datos figura 10.25 autocorrelaciones de la primera diferenciación de los datos originales. El ligero patrón de tendencia ha desaparecido. Se ha logrado una serie estacionaria originales. El patrOn de tendencia ha desaparecido. Se ha logrado una serie estacionaria con una base de periodo a periodo. Sin embargo, existen muy altas autocorrelaciones en los base de periodo a periodo. Sin embargo, existen muy altas autocorrelaciones en los con retrasos 12, 24 Y 36. Kathy concluye que existe una tendencia entre periodos estacionales periodos retrasos 12, 24 y 36. Kathy concluye que existe una tendencia sucesivos (separados por un periodo de desfase de 12 meses). Si coeficiente sucesivos (separados por un periodo de desfase de 12 meses). Si el coeficiente de autocorreautocorrecaldo ci retraso 24, Kathy habria conciuIdo que los datos de la primera lación hubiera caído a cero en el retraso 24, Kathy habría concluído que los datos de la primera diferencia eran estacionarios. Time Lags Lags 30 Autocorrelations -.06 .06 -.10 .10 -.03 .03 .05 05 .00 .24 29 28 27 * 26 25 24 23 22 .64 .64 .23 * .03 21 20 19 18 * .10 .04 -.05 .05 -.01 .01 * 17 17 16 -.03 03 .04 04 15 14 13 12 11 10 9 9 .12 12 * .07 * .32 .79 79 .33 .11 .21 .21 * 8 7 7 6 5 5 4 3 3 2 2 1 1 .13 .03 .06 .04 04 .13 13 .23 .15 15 * .43 +1 -1 1 I I I I I O 0 I I I I I I Figura 10.24 Autocorrelaciones de los datos sin procesar de la tabla 10.8. 10.24 Autocorrelaciones de los datos sin procesar de 10.8. 468 TABLA 10.8 TABLA 10.8 1,736.8 1,736.8 1,297.4 1,297.4 559.0 559.0 1,455.6 1,455.6 1,526.2 1,526.2 1,419.6 1,419.6 1,484.6 1,484.6 1,651.0 1,651.0 1,661.4 1,661.4 1,851.2 1,851.2 1,617.2 1,617.2 1,614.6 1,614.6 1,757.6 1,757.6 1,302.6 1,302.6 572.0 572.0 1,458.6 1,458.6 1,567.8 1,567.8 La metodología Box-Jenkins (ARIMA) La metodologla Box-Jenkins (ARIMA) KEYTRON CORPORATION VENTAS DE KEYTRON CORPORATION 1,627.6 1,627.6 1,575.6 1,575.6 1,682.2 1,682.2 1,710.8 1,710.8 1,853.8 1,853.8 1,788.8 1,788.8 1,822.4 1,822.4 1,838.2 1,838.2 1,635.4 1,635.4 618.8 618.8 1,593.8 1,593.8 1,898.0 1,898.0 1,911.0 1,911.0 1,695.0 1,695.0 1,757.6 1,757.6 1,944.8 1,944.8 2,108.6 2,108.6 CapItulo Capítulo 10 1,895.4 1,895.4 1,768.0 1,768.0 1,840.8 1,840.8 1,804.4 1,804.4 2,191.8 2,191.8 2,202.2 2,202.2 2,449.2 2,449.2 2,090.4 2,090.4 2,184.0 2,184.0 2,267.2 2,267.2 1,705.6 1,705.6 962.0 962.0 1,929.2 1,929.2 2,035.8 2,035.8 2,152.8 2,152.8 1,708.2 1,708.2 806.0 806.0 2,028.0 2,028.0 2,236.0 2,236.0 2,028.0 2,028.0 2,100.8 2,100.8 2,327.0 2,327.0 2,225.6 2,225.6 2,321.8 2,321.8 2,275.0 2,275.0 2,171.0 2,171.0 2,431.0 2,431.0 2,165.8 2,165.8 780.0 780.0 2,056.6 2,056.6 2,340.0 2,340.0 2,033.2 2,033.2 2,288.0 2,288.0 1,822.6 1,822.6 2,054.0 2,054.0 1,544.4 1,544.4 600.6 600.6 1,604.2 1,604.2 2,007.2 2,007.2 2,067.0 2,067.0 2,275.0 2,275.0 2,581.8 2,581.8 2,540.2 2,540.2 2,519.4 2,519.4 2,267.2 2,267.2 2,048.8 2,048.8 2,314.0 2,314.0 1,796.6 1,796.6 1,822.6 1,822.6 2,072.2 2,072.2 1,952.6 1,952.6 1,835.6 1,835.6 1,944.8 1,944.8 2,009.8 2,009.8 2,116.4 2,116.4 2,134.6 2,134.6 1,799.2 1,799.2 756.6 756.6 1,890.2 1,890.2 2,256.8 2,256.8 2,111.2 2,111.2 2,080.0 2,080.0 2,202.2 2,202.2 1,903.2 1,903.2 2,337.4 2,337.4 2,022.8 2,022.8 2,225.6 2,225.6 2,441.4 2,441.4 2,113.8 2,113.8 1,994.2 1,994.2 1,895.4 1,895.4 1,947.4 1,947.4 1,770.6 1,770.6 626.6 626.6 2,615.6 2,615.6 2,163.2 2,163.2 899.6 899.6 2,210.0 2,210.0 2,376.4 2,376.4 2,259.4 2,259.4 2,584.4 2,584.4 Time Lags 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 7 6 5 4 3 2 1 1 I Autocorrelations * * I I *1 * I * * * * . * * * * * * * *. * * . . * * *. -1 .....,..06 -.10 -.03 .05 .05 .00 00 .24 .24 .64 64 .23 .23 .03 .03 .10 .10 .04 .04 -.05 -.01 -.03 .04 . 04 .12 .07 .32 .79 79 .33 .11 .21 .13 .13 .03 .06 .06 . 04 .04 .13 .23 .15 .43 43 -.06 -.10 -.03 -.05 -.01 -.03 I I I I I I I I I I I I I I I I O 0 +1 I I Figura 10.25 Autocorrelaciones de la primera diferencia de los datos Figura 10.25 Autocorrelaciones de Ia primera diferencia de los datos de Ia tabla 10.8. la 10.8. Un análisis estacional Un 469 eliminar Ia tendencia para los retrasosl2, 24 Y se emplea la diferencia de largo Para elirninar la tendencia para los retrasos 12, 24 y 36 se emplea la diferencia de largo plazo (diferencias cuya longitud está separada por 12 periodos). La fig. 10.26 muestra plazo (diferencias cuya longitud está separada por 12 periodos). La fig. 10.26 muestra las autocorrelaciones para los datos después de la primera diferencia y diferencia de largo autocorrelaciones para los datos después de Ia primera diferencia y de la diferencia de largo 12 meses). Sólo las autocorrelaciones los plazo (separada por un periodo de retraso de 12 meses). Solo las autocorrelaciones en los periodo retraso plazo (separada por periodos retrasados 1, 11, 12 y 13 son diferentes de cero en forma significativa. El resto de Y 13 son diferentes de cero en forma significativa. resto de periodos retrasados 1, 11, autocorrelaciones está disperso en forma aleatoria airededor de cero la parece ser las autocorrelaciones está disperso en forma aleatoria alrededor de cero y Ia serie parece ser estacionaria. Time Lags Lags 26 25 Autocorrelations .13 13 -.11 .11 .05 -.05 05 .06 -.03 .03 -.02 .02 .04 04 -.09 .09 .14 -.07 .07 -.02 .02 -.05 .05 .29 -.45 .45 .25 -.03 .03 .04 04 -.07 .07 .06 .06 .03 .03 -.09 09 .02 24 23 22 21 21 20 19 19 18 18 17 17 16 16 15 15 14 13 13 * 12 11 11 10 9 9 8 7 7 6 6 5 5 4 4 3 3 2 2 1 1 .05 05 .04 04 -.55 .55 -1 1 I I I I I O 0 I I I I I +1 Figura 10.26 Autocorrelaciones de diferencia corta y larga de los 10.26 Autocorrelaciones larga de los la tabla 10.8. datos de la tabla 10.8. Kathy examina las autocorrelaciones de Ia fig. 10.26 y las autocorrelaciones parciales de autocorrelaciones la fig. 10.26 Y las autocon'elaciones parciales de fig. 10.27 para identificar modelo apropiado. Primero, se concentra en ci patrón la fig. 10.27 para identificar el modelo apropiado. Primero, se concentra en el patron no estacional. La fig. 10.26 muestra las autocorrelaciones descienden a después del estacional. La fig. 10.26 muestra que las autocorrelaciones descienden a cero después del primer coeficiente significativo en el periodo de retraso 1 (-.55). La fig. 10.27 muestra una primer coeficiente significativo en el periodo de retraso 1 (.55). La fig. 10.27 muestra una caída exponencial las auto cOlTelaciones parciales estacionales, indicando W1 modelo caida exponencial de las auto correlaciones parciales no estacionaics, indicando un modelo IMA(l) para el patron no estacional. patrón no estacional. IMA(1) Ahora Kathy exaniina el patron estacional. La fig. 10.26 muestra que las autocorrelaciones examina patrón 10.26 las autocorrelaciones el periodo retrasado 24) después del primer coeficiente descienden hacia cero (.05 en ci periodo retrasado 24) después del primer coeficiente descienden hacia cero (.05 significativo en el periodo de retraso 12 (-.45). La fig. 10.27 muestra Ia disminuciOn de la significativo en ci periodo de retraso 12 (.45). La fig. 10.27 muestra la disminución de 470 Time Lags Lags 25 24 24 La metodologla La metodología Box-Jenkins (ARIMA) Autocorrelations -.13 -.04 .18 .18 -.06 -.13 -.08 .02 .02 * * Capítulo 10 CapItulo 23 22 22 21 20 19 18 17 16 I * I I * 15 14 13 12 11 10 9 9 -.09 -.03 -.11 .01 .01 -.06 -.07 -.12 8 8 7 7 6 6 * 5 5 4 4 3 3 2 2 1 1 .37 -.06 -.02 -.07 -.06 -.16 -.13 -.06 -.21 -.38 -.55 I I I I I -1 -1 O 0 I I I I I I +1 Figura 10.27 Autocorrelaciones parciales de diferenciaciones corta y larga 10.27 Autocorrelaciones parciales de diferenciaciones corta de los datos de la tabla 10.8. tabla 10.8. autocOlTelación parcial estacional, indicando un modelo IMA( 1) el patrón estacional. autocolTeiaciónparcial estacional, indicando un modelo IMA(1) para el patron estacional. Y60, Hubiera sido deseable examinar los coeficientes de los retrasos 36, 48 y 60, pero no fue posible. el cómputo Box-Jenkins para estimar A continuación, Kathy utiliza ci programa de córnputo de Box-Jenkins para esti mar el(los) parámetro(s) del modelo. Sc estirna que los parámetros para el modelo ARJMA(O, 1, 1)(0, 1, parámetro(s) del modelo. Se estima parámetros modelo ARIMA(O, 1, 1)(0, 1, 1) son .77948 y .61031. Un examen de los coeficientes de autocorrelaciOn de la fig. 10.28 1) son .77948 Y .61031. Un examen de los coeficientes de autocorrelación la fig. 10.28 indica que son aleatorios. Kathy confirma esta observación efectuando Ia prueba estadistica de aleatorios. confim1a la estadística de ji cuadrada para 34 periodos retrasados. El de ji cuadrada es menor que el valor ji cuadrada para 34 periodos retrasados. El valor calculado deji cuadrada es menor que ci valor de la tabla a un nivel de significación de .05 (11.82 <43.8). El modelo resulta adecuado. nivel significación de (11.82 < 43.8). El modelo resulta adecuado. El modelo de pronóstico ARIMA(0, 1, 1)(O, 1, 1) es pronóstico ARIMA(O, 1, 1)(0,1, 1) El Y = Yt - I + Y,_22 - Y t - 13 + Et -.77948e1_1 -- .61031e1_12 + .47572e_13 = Yt - .77948e _ .61031 e t - 12 + .47572e t _ 13 Y,_13 t 1 t - Yl16 = YI15 + Y 104 -- Y 103 + e116-- .77948e115 -- .61031e104 + .47572e103 e l16 .77948e 115 .61031e¡04 + .47572e 103 = p104 pronóstico 116 El pronóstico para el periodo 116 es Y 1l6 16 ji 116 2,584.4 + 2,275 - 2,288 --.77948(18 1.48) 2,584.4 2,275 2,288 .77948(181.48) .61031(-36.43) .47572(34.35) - .61031(-36.43) ++.47572(34.35) = 2,468.5 2,468.5 = Un análisis estacional estacional Lags Time Lags 34 33 471 Autocorrelations -.08 1* *1 32 31 .04 04 .12 30 29 28 27 26 25 I * I -.03 -.02 -.04 .00 -.02 24 23 22 I * I * 21 21 20 19 19 * 18 18 17 17 16 16 15 14 13 * I* I I 12 12 11 10 10 9 * * * * * .09 -.05 -.04 -.01 -.02 -.05 -.03 -.05 -.06 .10 -.10 -.03 -.01 .03 -.01 .04 04 .05 05 I I 8 8 7 7 .12 .00 .07 .01 -.01 -.03 .10 .03 -.09 * 6 6 5 5 4 4 * I 3 2 2 * 1 1 I I I I I I -1 O 0 I I I I I +1 10.28 Coeficientes de autocorrelación de los modelo Figura 10.28 Coeficientes de autocorrelación de los residuos del niodelo ARIMA(O, 1)(0, ARIMA(O, 1, 1)(O, 1, 1). pronóstico 117 El pronóstico para el periodo 117 es YH7 Yll ? = 2,599.8 2,599.8 Ejemplo 10.9 En el ejeniplo 4.4, Perkin Kendell, analista de Outboard Marine Corporation, utilizó un análisis ejemplo Corporation, utilizó un análisis de autocorrelación para concluir que Ia ventas trimestrales eran estacionales. Perkin decidió autocorrelación concluir la ventas trimestrales estacionales. Perkin decidió pronosticar las ventas de 1994 mediante la metodologIa de Box-Jenkins. Los datos se metodología de Box-Jenkins. Los datos se pronosticar las ventas de 1994 mediante la graficaron en Ia figura 4.7. Perkin observa primero para ver si las autocorrelaciones de los datos son estacionarias. Pcrkin primero si las autocOlTclaciones de los datos son estacionarias. Los comandos de Minitab son Minitab son 472 La metodología Box-Jenkins (ARIMA) La metodologla Capítulo 10 CapItulo > READ 0UTBOARD.DAT' C1 MTB > READ ·OUTBOARD.DAT' Cl 40 ROWS READ 40 ROWS C1 Cl 147 . 6 147.6 251 .8 273.1 249.1 251.8 MTB > ACF C1 NTB > ACF Cl ACF OF Cl C1 ACF -0.4 -0.2 1.0 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 +- -- -- -+- - - -+- - - -+- - - -+- - - -+- - - -+- - - -+- -- -- -+- - - -+- -- ---+ -+- - -+- -+-+XXXXXXXXXXXX xxxxxxxxxxxx 0.421 xxxxxx XXXXXX 0.194 xxxxxxxxx XXXXXXXXX 0.312 xxxxxxxxxxxxxxxxxxx XXXXXXXXXXXXXXXXXXX 0.733 XXXXX xxxxx 0.177 xxxx XXXX -0.119 xx -0.052 XX xxxxxxxx XXXXXXXX 0.297 -0.193 xxxxxx XXXXXX -0.442 xxxxxxxxxxxx XXXXXXXXXXXX -0.347 xxxxxxxxxx XXXXXXXXXX xx 0.028 XX xxxxxxxxxx -0.361 XXXXXXXXXX xxxxxxxxxxxxxx XXXXXXXXXXXXXX -0.509 XXXXXXXXXXX xxxxxxxxxxx -0.386 X x 0.014 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 11 11 12 12 13 13 14 14 15 15 16 16 no son estacionarios en su forma original. En el ejemplo 4.4. Perkin determinó Los datos no son estacionarios en su forma original. En el ejemplo 4.4. Perkin determinô diferente que cualquier coeficiente de autocorrelación mayor que .31 oomenor que -,31 era diferente de coeficiente de autocorrelación mayor que .31 menor que .31 cero en forma significativa, utilizando un nivel de significación de .05. Muchos de los periodos cero forma significativa, utilizando un nivel de significación de .05. Muchos de los periodos retraso tienen autocorrelaciones cero de manera significativa (retrasos 1, 2, de retraso tienen autocorrelaciones deiferentes de cero de manera significativa (retrasos 1, 2, 10, 11, 13, 14 15). Ya que las primeras cinco autocorrelaciones son positivas, pudiera 4, 10, 11, 13, 14 yY 15).Ya que las primeras cinco autocorrelaciones son positivas, pudiera tendencia. existir una ligera tendencia. existir Perkin decide hacer, utilizando Minitab, una primera diferencia de los datos y examinar Perkin decide hacer, utilizando Minitab, una primera diferencia de los datos y coeficientes de autocorrelación: los coeficientes de autocorrelación: MTB > DIFFERENCE 1 Cl STORE C2 MTB > C1 STORE C2 1 MTB > ACF C2 > C2 ACF OF C2 OF C2 -1.0 -0.8 -0.6 -0.4 -0.2 -0.4 -0.2 1 1 0.0 0.2 0.4 0.6 0.8 1.0 + - - - -+- - - -+- - - -+- - - - -+- - - -+- - - -+- - - -+- - - - -+- - - -+- - - --+ + + ++ + +----+ + + + XXXXXXXX XXXXXXXXX XXXXXXXX 2 2 3 3 -0.275 -0.275 -0.307 -0.307 -0.282 -0.282 xxxxxxxx Un análisis estacional Un 4 5 6 7 7 8 9 10 11 12 12 13 13 14 15 16 473 0.836 -0.200 -0.200 -0.316 -0.316 -0.254 -0.254 0.712 -0.177 -0.177 -0.288 -0.288 -0.260 -0.260 0.640 -0.153 -0.153 -0.217 -0.217 -0.242 -0.242 0.540 0.540 xxxxxxxxxxxxxxxxxxxxxx XXXXXXXXXXXXXXXXXXXXXX XXXXXX XXXXXXXXX XXXXXXX XXXXXXXXXXXXXXXXXXX XXXXX XXXXXXXX XXXXXXXX XXXXXXXX xxxxx XXXXXXXXXXXXXXxxX XXXXXXXXXXXXXXXXX XXXXX XXXXX XXXXXX XXXXXXX XXXXXXXXXXXXXXX autoconoelaciones para los datos la Las autocorrelaciones para los datos de Ia primera diferencia muestran que se eliminó la muestran tendencia logró serie estacionaria en una base periodo. Sin embargo, tendencia y se logró una serie estacionaria en una base de periodo a periodo. Sin embargo, altas autocorrelaciones en (.712), 12 (.64) (.54), no se como hay altas autocorrelaciones en los retrasos 4 (.836), 8 (.7 12), 12 (.64) y 16 (.54), no se estacional. caído ha logrado una serie estacionaria sobre una base estacional. Si la autocorrelación hubiera caido 8, Perkin hubiera podido concluir que los datos de la primera diferencia hacia cero en el retraso 8, Perkin hubiera podido concluir que los datos de la primera diferencia estacionarios. eran estacionarios. eliminar la largo plazo (diferenPara elirninar la tendencia estacional, se emplea Ia diferenciación de largo plazo (diferenlongitud separada por cuatro periodos). La columna 2 contiene los datos cias cuya longitud está separada por cuatro periodos). La columna 2 contiene los datos de la la primera diferencia y Ia columna 3 contiene los datos de la primera diferencia con una diferencia los datos de la primera diferencia con una de largo plazo (separada por un periodo de retraso de 4 trimestres). A continuación, se calculan de retraso de trimestres). A continuación, se calculan para esta serie (C3): las autocorrelaciones para esta serie (C3): MTB > DIFFERENCE C2 C3 MTB > DIFFERENCE44 C2 C3 MTB > PRINT CI-C3 MTB > PRINT Cl-C3 ROW 1 1 2 2 3 3 4 4 5 5 6 7 7 8 8 9 9 10 11 12 13 14 15 16 17 18 19 20 Cl C1 147.6 251.8 251. 8 273.1 249.1 139.3 221.2 260.2 259.5 140.5 245.5 298.8 287.0 287.0 168.8 322.6 393.5 404.3 259.7 401.1 464.6 479.7 C2 104.200 21.300 -24.000 -24.000 -109.800 81.900 39.000 -0.700 -0.700 -119.000 119.000 105.000 53.300 -11 .800 -11.800 -118.200 -118.200 153.800 70.900 10.800 -144.600 144.600 141.400 63.500 15.100 C3 * * * -22.3000 17.7000 17.7000 23.3000 109.800 -9.2000 -11.1000 0.8000 23.1000 14.3000 48.8000 17.6000 22.6000 53.300 -26.4000 -26.4000 -12.4000 -12.4000 -7.4000 -7.4000 4.3000 15.100 474 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 La metodologIa Box-Jenkins (ARIMA) metodología Capítulo 10 CapItulo 10 264.4 402.6 411.3 385.9 232.7 309.2 310.7 293.0 205.1 234.4 285.4 258.7 193.2 263.7 292.5 315.2 178.3 274.5 295.4 311.8 -215.300 -215.300 138.200 8.700 -25.400 -25.400 -153.200 -153.200 76.500 1.500 -17.700 -17.700 -87.900 -87.900 29.300 51. 000 51.000 -26.700 -26.700 -65.500 -65.500 70.500 28.800 22.700 -136.900 -136.900 96.200 20.900 16.400 -70.7000 -3.2000 -3.2000 -54.8000 -40.5000 62.1000 -61.7000 -7.2000 -7.2000 7.7000 65.3000 --47 . 2000 --47.2000 49.5000 -9.0000 -9.0000 22.4000 41.2000 -22.2000 49.4000 -71.4000 25.7000 -7.9000 -7.9000 -6.3000 -6.3000 29.300 25.7000 20.900 MTB > ACF C3 MTB > ACF C3 ACF OF C3 ACF OF C3 -1.0 -0.8 -0.6 -0.4 -0.2 1 1 2 2 3 3 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.2 0.4 0.4 0.6 0.6 0.8 1.0 1.0 0. +- - - -+- - - -+- - - -+- - - -+- - - -+- - - -+- - - -+- - - -+- - - -+- - +----+----+----+----+----+----+----+----+----+----+ 4 5 5 6 6 7 7 8 8 9 9 10 11 12 13 14 15 -0.341 -0.341 0.239 0.051 0.041 0.053 -0.085 -0.085 0.035 -0.386 -0.386 0.175 -0.348 -0.348 0.147 -0.284 -0.284 -0.055 -0.055 0.073 -0.010 xxxxxxxxxx XXXXXXXXXX xxxxxxx XXXXXXX xx XX xx XX XX xx XXX xxx XX xx xxxxxxxxxxx XXXXXXXXXXX XXXXX xxxxx xxxxxxxxxx XXXXXXXXXX XXXXX xxxxx xxxxxxxx XXXXXXXX xx XX XXX xxx X x Solo las autocorrelaciones en los periodos retrasados 1, 2, 8 y 10 son diferentes de cero Sólo autocorrelaciones en los periodos retrasados 1, 2, Y 10 son diferentes de cero en forma significativa. El resto de las autocorrelaciones estan dispersas de manera aleatoria forma significativa. El las autocorrelaciones estan dispersas manera aleatoria alrededor de cero y Ia serie parece ser estacionaria. y la serie parece ser estacionaria. Perkin a continuación las autocorrelaciones parciales para identificar ci Perkin ejecuta a continuaciOn las autocorrelaciones parciales para identificar el modelo apropiado: Un análisis estacional 475 MTB > PACF C3 MTB > PACF C3 PACF OF C3 PACF OF C3 -1.0 -0.8 -0.6 -0.4 -0.2 -1.0 -0.8 -0.6 -0.4 -0.2 1 1 2 2 3 4 5 6 7 7 8 8 9 10 11 12 13 14 14 15 0.0 0.0 0.2 0.4 0.4 0.6 0.6 0.8 1.0 - -+-+--+ +- - - -+- - - -+- - - -+- -- - -+- - - -+- - - -+- -- -- -+- - -- -+- - - -+- - XXXXXXXXXX -0.341 0.139 0.194 0.092 0.043 -0.117 -0.073 -0.457 -0.106 -0.221 0.136 -0.093 -0.140 0.018 0.147 xxxxxxxxxx xxxx XXXX XXXXXX xxxxxx xxx XXX xx XX XXXX xxx XXX xxxxxxxxxxxx XXXXXXXXXXXX xxxx XXXX XXXXXXX XXXXXXX XXX xxxx XXXX xxx X XXXX x XXXXX XXXXX Perkin se concentra primero en el patron no estacional. Advierte que los coeficientes de patrón no estacional. Advierte que los coeficientes de Perkin autocorrelación caen cerca de cero después del segundo periodo retrasado y que las autocorredel segundo periodo retrasado y que las autocorrelaciones parciales muestran una disminución gradual. La autocorrelaciOn en el periodo autocorrelación en periodo laciones parciales muestran una disminución gradual. coeficiente retrasado 2 parece ser clUcial para la detenninación del modelo. Si retrasado 2 parece ser crucial para Ia determinaciOn del modelo. Si este coeficiente es significativo, resultaría apropiado un modelo MA(2). Si no es significativo, el adecuado pudiera resultarla apropiado un modelo MA(2). Si no es significativo, el adecuado pudiera un modelo ARIMA( l, l). ser im modelo ARJMA( 1, 1). A continuación, Perkin pone su atención en el patrón estacional. Como el retraso 4 no es continuación, Perkin pone su atención en ci patron estacional. Como el retraso 4 no es significativo, resulta dificil decir si sería apropiado un modelo MA Decide probar significativo, resulta dificil decir si serIa apropiado un modelo MA o uno AR. Decide probar modelo comprende un ténnino MA(2) para el estacional un ténnino ambos. El mejor modelo coniprende un término MA(2) para el no estacional y un término ambos. MA(1) para el estacional. Los cornandos de Minitab para ejecutar el mejor modelo son MA(l) estacional. comandos de Minitab para ejecutar el modelo MTB MTB > ARINA (0 1 2) (O 1 2) SUBC> 4 SUBC> FORECASTS 4 (O (0 1 1) 1 1) 4 Cl PUT 04; 4 C1 PUT C4; at ea eh iteration Estimates at each iteration Iteration SSE Parameters 0 O 44598.9 0.100 0.100 1 1 40342.5 0.160 -0.050 2 2 37801.7 0.253 -0.200 3 3 36716.7 0.329 -0.279 4 35963.1 0.354 -0.293 5 5 35388.2 0.376 -0.308 6 6 35046.1 0.398 -0.320 7 7 34878.4 0.417 -0.329 8 8 34804.6 -0.335 0.431 9 9 34773.5 0.440 -0.339 0.100 0.125 0.092 0.002 -0.099 -0.192 -0.265 -0.315 -0.347 -0.368 0.253 0.398 476 10 La metodologla La metodología Box-Jenkins (ARIMA) 0.447 34760.6 34755.3 0.451 0.453 34753.1 12 34752.2 0.455 13 0.456 34751.9 14 0.457 34751.7 15 0.457 34751.6 34751.6 16 0.457 34751.6 17 0.458 34751.6 18 Relative change in each estimate Relative change in each estimate 11 CapItulo 10 Capítulo 10 -0.382 -0.342 -0.390 -0.344 -0.345 -0.395 -0.345 -0.399 -0.401 -0.346 -0.403 -0.346 -0.404 -0.346 -0.346 -0.404 -0.405 -0.347 less than 0.0010 less than -0.38 -0.39 -0.40 -0.40 Parameters Final Estimates of Parameters Final Sto Dev. St. 0ev. Type Estimate MA 1 1 0.4576 0.1659 MA 2 -0.3465 0.1683 2 4 -0.4045 0.1831 SMA 4 t-ratio 2.76 -2.06 -2.21 regular. 1 seasonal 4 Differencing: 1 regular, 1 seasonal of order 4 No. of obs. : Original series 40, after differencing 35 of obs.: differencing 35 Original series 40. SS = 34351.0 SS (backforecasts excluded) excluded) Residuals: MS = 1073.5 DF = 32 32 Modified Box-Pierce chisquare statistic statistic Modified 12 24 Lag 25.0(DF21) Chisquare 14.5(DF= 9) 25.0(DF=21) Chisquare 14.5(DF 9) from period 40 Forecasts from period 40 Period 41 42 43 44 36 * * (DF= *) (DF= *) * * 48 (DF= *) (DF= *) Forecast 154.756 248.895 273.166 277.728 95 Limits 95 Percent Limits Upper Lower 218.986 90.526 218.986 175.824 321.966 180.431 365.900 168.825 386.632 Actual • El comando ARIMA(0 1 2)(0 1 1) 4 Cl PUT C4 se usa para ejecutar ci modelo. La comando ARlMA(O 1 1) el PUT C4 se usa para ejecutar el modelo. La los datos no estacionales y ajusta primera parte (0 1 2) hace una primera diferencia de los datos no estacionales y ajusta parte (O 1 2) hace una primera diferencia un modelo MA(2). La segunda parte (0 11 1) 4 crea una diferencia estacional de cuatro modelo segunda parte (O 1) cuatro ajusta modelo MA(l). Los residuos se almacenan en la columna 4. órdenes y ajusta un modelo MA(1). Los residuos se almacenan en la columna 4. A continuación, Perkin desarrolia un correlograrna de las autocorrelaciones de los continuación, Perkin desarrolla un correlograma de las autocorrelaciones los residuos. MTB > ACF C4 > C4 OF C4 ACF OF C4 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 -0.2 0.0 +- - - -+- - - -+- - - -+- - - -+- - - -+- - - -+- - - -+- - - -+- - - -+- - +----+----+----+----+----+----+----+----+----+----+ XX 0.027 X -0.018 X 0.117 XXXX -0.097 XXX 0.8 1 1 2 2 3 3 4 4 Un análisis estacional 5 5 6 6 477 7 7 8 8 9 9 10 11 12 13 14 15 0.108 0.028 -0.263 -0.283 -0.283 0.006 -0.230 -0.230 0.026 -0.239 -0.239 -0.196 -0.196 0.205 0.034 xxxx XXXX XX xx xxxxxxxx XXXXXXXX XXXXXXXX xxxxxxxx X x xxxxxxx XXXXXXX xx XX XXXXXXX xxxxxxx xxxxxx XXXXXX xxxxxx XXXXXX XX xx Una revision de estos coeficientes de autocorrelacion de los residuos indica que son Una revisión de estos coeficientes de autocorrelacion de los residuos indica que son aleatorios. Perkin confirma esta observaciOn probando la estadística de jijicuadrada para 12 y confirma observación probando La estadIstica de cuadrada para 12 y aleatorios. 24 periodos retrasados. El valor calculado de ji cuadrada es menor que el valor de la tabla a 24 periodos retrasados. El valor calculado de ii cuadrada es menor que el valor de la tabla a nivel de significación de .05 para ambos periodos (14.5 < 16.9) (25 < 32.7). También un nivel de significaciOn de .05 para ambos periodos (14.5 < 16.9) y (25 < 32.7). También son significativas las proporciones tt para cada uno de los parámetros estimados. El modelo los parámetros estimados. modelo son significativas las proporciones para cada adecuado. resulta adecuado. Se estima que los parámetros son 0.4576 para el término MA(1), -.3465 para estima que los parámetros son 0.4576 para el término MA(1), .3465 el término MA(2) y -.4045para el término estacional MA(1). el término MA(2) y .4045 para el término estacional MA(1). El enfoque de BoxJenkins al análisis de series de tiempo es una muy poderosa enfoque de Box-Jenkins al análisis de series de tiempo es una muy poderosa herramienta para proporcionar pronósticos de corto plazo más precisos. Combina las fuerzas precisos. los métodos autorregresivo de promedio móvil sin hacer suposiciones acerca del de los métodos autorregresivo y de promedio móvil sin hacer suposiciones acerca del ecuación pronóstico sobre las intercorrelaciones de número de términos en nilmero de términos en la ecuación de pronóstico o sobre las intercorrelaciones de sus coeficientes. Además, se proporciona una prueba estadística para determinar lo adecuado coeficientes. Además, se proporciona una prueba estadistica para determinar lo adecuado ajustado, así como intervalos de confianza sobre los del modelo ajustado, asI como un medio para construir intervalos de confianza sobre los pronósticos. Sin embargo, el enfoque de Box-Jenkins tiene sus desventajas. Algunas de ellas son Sin embargo, el enfoque de BoxJenkins tiene sus desventajas. Algunas de ellas son las siguientes. 1. Se requiere una 1. Se requiere una cantidad de datos relativamente grande. Debe reconocerse si los datos relativamente grande. Debe reconocerse silos son estacionales, como en los datos con estacionalidad anual, entonces las observaciones con estacionalidad anual, entonces las observaciones como mensuales para un año constituyen por lo general 1 punto de datos y no 12. Makridakis no 12. Makridakis y colegas estiman que 72 puntos de datos es el mInimo requerimiento para un uso estiman que puntos el mínimo requerimiento para un uso confiable del método de Box-Jenkins, asumiendo un patron estacional de 12 meses de 12 meses de del método de BoxJenkins, asumiendo patrón duración. En muchos casos de este tipo, simplemente no hay disponibles datos históricos tipo, simplemente no hay disponibles datos históricos suficientes para utilizar el método de Box-Jenkins, y se deberá utilizar algún otro suficientes para utilizar el método de BoxJenkins, y se deberá utilizar algin otro método de series de tiempo. de tiempo. En general, se considera aplicable el método de Box-Jenkins cuando los datos En general, se considera aplicable el método de BoxJenkins cuando los datos corto. Algunas de las aplicaciones apropiadas para ocurren en un periodo relativamente corto. Algunas de las aplicaciones apropiadas para este método serian el análisis de precios de acciones sobre una base diaria o semanal de análisis de precios de acciones sobre una base diana datos, y los datos de un proceso quImico o de manufactura en el que se pudieran tomar químico tomar muestras a menudo. 478 metodología (ARIMA) La metodologla Box-Jenkins (ARIMA) Capítulo 10 2. No hay formas fáciles de actualizar los parámetros del modelo a! haber disponibles formas fáciles de actualizar los parámetros modelo al haber disponibles nuevos datos, como las hay en los modelos directos de atenuación. El modelo debe en los modelos directos de atenuación. El modelo debe nuevos reajustarse periódicamente o, peor aim, debe desarrollarse un modelo nuevo. aún, 3. La construcción de un modelo satisfactorio requiere de una gran inversion del tiempo un modelo satisfactorio requiere de una gran inversión del tiempo del en otros recursos. Los costos del desarrollo modelo, tiempo de del analista y en otros recursos. Los costos del desarrollo del modelo, el tiempo de ejecución en la computadora y los requerimientos ejecuciOn en la computadora y los requerimientos de almacenamiento son sustancialmente mayores para los modelos de Box-Jenkinsque para las técnicas más tradicionales los modelos de BoxJenkins que para como la atenuación.2 la atenuación. 2 APLICACIÔN EN LA ADMINISTRACION APLICACIÓN Los pronósticos son uno de los insurnos más importantes de que disponen los administralos insumos imp0l1antes que disponen los administraLos pronósticos son uno dores proceso de toma de decisiones. dores para ayudarse en el proceso de toma de decisiones. Prácticamente, algún grado de un Prácticarnente, cada decisión importante de operación depende en algñn grado de un decision pronóstico. La acmnulación de inventario se relaciona con el pronóstico de demanda pronóstico. La acumulaciOnde inventario se relaciona con el pronóstico de la demanda departamento producción requiere de calendarizar necesidades de esperada; esperada; el departarnento de producciOn requiere de calendarizar sus necesidades de primas dos meses siguientes; el departamento personal y de pedidos de materias prirnas para uno o dos meses siguientes; el departamento finanzas adecuar el financiamiento plazo para el próximo trimestre; el de finanzas debe adecuar ci financiarniento de corto plazo para el próximo trimestre; el departamento debe detenninar los requerimientos de contratación departarnento de personal debe deterrninar los requerirnientos de contrataciOn y descanso. aplicaciones los pronósticos es muy larga. La lista de aplicaciones de los pronósticos es muy larga. ejecutivos están conscientes de la importancia de De hecho, se Los ejecutivos están conscientes de La importancia de los pronósticos. De hecho, se tma cantidad tiempo el estudio de las tendencias en la economía, en los invierte una gran cantidad de tiempo en ci estudio de las tendencias en la economia, en los asuntos políticos en cómo los sucesos pudieran afectar la demanda de productos y/o asuntos politicos y en córno Los sucesos pudieran afectar Ia demanda de productos yb servicios. aspecto pal1icular interés la importancia los ejecutivos asignan a servicios. Un aspecto de particular interés es Ia importancia que los ejecutivos asignan a cuantitativos pronóstico comparada con sus propias opiniones. los métodos cuantitativos de pronOstico comparada con sus propias opiniones. Este aspecto particulannente sensible cuando encuentran involucrados sucesos que tienen un es particularmente sensible cuando se encuentran involucrados sucesos que tienen un impacto significativo sobre la demanda. problema los métodos cuantitativos de impacto significativo sobre Ia dernanda. Un problema con los métodos cuantitativos de es que dependen de datos históricos. pronóstico es que depen den de datos históricos. Por esta razón son probablemente los menos 2 Para 2 Para un resumen de los requerimientos relativos de tiempos de analista y computadora, requerimientos mInimos resmnen mínimos etc., pronóstico, consúltese et al., "An interactive de datos, aplicaciones, etc., para diversos métodos de pronóstico, consültese S. Makridakis et al., "An interactive System", American Statistician, vol 28 (1974), p. 157. Para un resmnen de algunas de las desventajas Forecasting System",American Statistician, vol 28 (1974), p. 157. Para un resumen de algunas de las desventajas la metodología de Box-Jenkjns, se remite al lector a D. C. Montgomery y L. A. Johnson, Forecasting de la metodologIa de Box-Jenkins, se remite al lector a D. C. Montgomery y L. A. Johnson, Forecasting and pronóstico de Time Series Analysis (New York: McGraw-Hill, 1976). Los niveles Time Series Analysis (New York: McGraw-Hill, 1976). Los niveles de uso de diversas técnicas de pronóstico de Taylor, "The APIeS Process Industry Survey: Implications for Education and demanda se muestran en S. G. Taylor, "The APICS Process Industry Survey: Implications for Education and demanda se muestran en S. and Abstracts oJ TIJe American Research", Proceedings and Abstracts of The American Institute Jor Decision Sciences Eighth Annual Meeting, Research", for Decision Sciences Eighth Annual Meeting, pp. 202-204. Western Conjerence, Western Regional Conference, 1979, pp. 202-204. Aplicación en Ia administraciOn la administración AplicaciOn 479 efectivos para detectar los giros que con frecuencia dan por resultado agudos cambios, hacia hacia arriba o hacia abajo, en la demanda. La computadora ha auxiliado a los administradores la demanda. a los administradores en autornatizar la sensibilidad a los cambios agudos en la demanda a través de sistemas sistemas en automatizar la sensibilidad a los cambios agudos en demanda causales. adaptables y modelos causales. tipo de problema que enfrentan con frecuencia los administradores de empresas Un tipo de problema que enfrentan con frecuencia los administradores de empresas es la necesidad de preparar pronósticos de corto plazo para varios elementos diferentes. Un varios elementos diferentes. Un ejemplo típico es el del gerente que debe calendarizar la producción con base en algin ejemplo tipico es del gerente debe calendarizar la producción con base en algún pronóstico demanda productos diferentes una línea de propronóstico de demanda para varios cientos de productos diferentes en una lInea de producción. frecuencia situación ducción. A las técnicas que se emplean con más frecuencia en esta situación se les conoce atenuación. como métodos de atenuación. atenuación exponencial una técnica popular para el pronóstico a corto plazo. La atenuación exponencial es una técnica popular para el pronOstico a corto plazo. mayores ventajas son el bajo costo y simplicidad. Por lo regular no es Sus mayores ventajas son el bajo costo y la simplicidad. Por lo regular no es tan precisa como otros métodos más complejos, como las técnicas autorregresivas. embargo, corno otros métodos más complejos, como las técnicas autorregresivas. Sin embargo, cuando se requieren pronósticos de inventarios que contienen miles de elementos, los requieren pronósticos de inventarios que contienen miles de elementos, los cuando métodos de atenuación son a menudo el ünico enfoque razonable. único métodos análisis series de tiempo depende de la suposición que hay componentes El análisis de series de tiempo depende de Ia suposición de que hay componentes regulares y repetitivos que interactüan para produccir una serie total. La tarea del analista regulares repetitivos que interactúan para produccir una serie total. La tarea del consiste en examinar e identificar cada uno de estos componentes. Una vez que los consiste en examinar e identificar cada uno de estos componentes. Una vez que los pronosticadores tienen algún conocimiento de cada una de las partes, están en una mejor pronosticadores tienen algñn conocimiento de cada una de las partes, están en posición para hacer seflalarnientos sobre el valor esperado de la serie total en algún periodo señalamientos sobre el valor esperado de la serie total algán futuro. fluctúan futuro. Las series de tiempo son apropiadas para pronosticar variables que fluctiian en cierto patrón estable a través del tiempo. tiempo. patron estable Los modelos autorregresivos se emplean con variables econOmicas a fin de contabiautorregresivos emplean económicas a fin de contabilizar las correlaciones entre observaciones adyacentes en una serie histórica. observaciones serie histórica. La técnica de filtración adaptable es a la vez sencilla y económica. Proporciona la filtración adaptable es la vez sencilla y económica. Proporciona la característica única de ajustar los parárnetros de manera automática. Es claro que resulta ajustar los parámetros manera automática. claro que resulta caracterIstica mica más poderosa que los métodos de atenuación, aunque también es más complicada. La poderosa que métodos de atenuación, aunque también más complicada. La rnás filtración adaptable lIena una brecha entre las técnicas de pronóstico ya que puede manejar filtración adaptable Ilena una brecha entre las técnicas de pronóstico ya que en forma efectiva cualquier patron de datos. fonna patrón de datos. El enfoque de Box-Jenkinses una herramienta muy poderosa para proveer pronóstiEl enfoque de BoxJenkins es una herramienta muy poderosa para proveer pronóstide corto plazo. En general se le considera más aplicable cuando los datos cos más precisos de corto plazo. En general se le considera más aplicable cuando los datos periodo relativamente corto. Los administradores deben tener en cuenta que ocurren en un periodo relativarnente corto. Los administradores deben tener en cuenta que la construcción de un modelo satisfactorio de Box-Jenkins requiere de una alta inversion la construcción de un modelo satisfactorio de BoxJenkins requiere de una alta inversión análisis y en los recursos de cómputo de la empresa. en tiempo de análisis y en los recursos de cómputo de Ia empresa. Aplicaciones apropiadas a Ia rnetodologIa de BoxJenkins Aplicaciones apropiadas a la metodología de Box-Jenkins son el análisis de precios acciones procesos químicos de acciones sobre una base diaria o el análisis de datos de procesos quImicos o de manudiana el análisis factura en pueden tomar muestras con frecuencia. La metodologla de BoxJenfactura en los que se pueden tomar muestras con frecuencia. La metodología de Box-Jenha utilizado kins también se ha utilizado para cambio precio en la estructura de la industria telefónica de EUA Estimar un carnbio de precio en Ia estructura de la industria telefOnica de EUA la amoniaco, la proporción del flujo Investigar Ia relación entre la concentración de arnoniaco, Ia proporciOn del flujo y la ríos temperatura en los rios rutas aéreas y ferroviarias Analizar la competencia entre rutas aéreas y ferroviarias Pronosticar el ernpleo empleo 480 La metodologla Box-Jenkins (ARIMA) metodología Capítulo 10 CapItulo Analizar un gran número de series de tiempo de consumo de energía para una empresa un gran nimero consumo de energia para una empresa Analizar el efecto de las promociones en las ventas de productos de consumo promociones consumo Analizar el efecto de Pronosticar diferentes categorías de asegura de la calidad de un producto. producto. Pronosticar diferentes categorlas de asegura de la calidad de GLOSARIO Técnicas dc Box-Jenkins Las técnicas de Box-Jenkinsaplican métodos autorregresivos técnicas de BoxJenkins aplican métodos autorregresivos Técnicas de y de promedio rnóvil a problernas de pronóstico de series de tiempo. móvil problemas de pronóstico de series tiempo. y FÓRMULAS CLAVE FORMULAS CLAVE Box--Jcnkins: modelo autorregresivo Box-Jenkins: modclo autorrcgrcsivo + cf>¡ Y'_I + Y, = cf>o + 41Y, + cP 2Y,-2 + Yr = Box-Jcnkins: modclo dc promcdio móvil BoxJenkins: modelo de promedio móvil + cf>pY,-p + E, (10.1 ) (10.1) + Y, = Wo + + E, I W¡E'_I - i1 14',E W - E,_2 2 +"+H'Et-q + ... + W'/'_'I q + 4Y '7, ni (10.2) Box--Jcnkins: modclo ARIMA BoxJenkins: modelo ARIMA = 1Y1 + + +E (10.3) PROBLEMAS 2Et_2 - Q = (N -Q = (N d) Estadística Q dc Box-Picrcc Estadistica Q de BoxPierce L r¡ k=\ (10.4 ) (10.4) l. a. Calcule un intervalo de confianza de 95% para los coeficientes autoconelación de una 1. a. Calcule un intervalo de confianza de 95% para los coeficientes de autocorrelación de una muestra de 100 observaciones de datos aleatorios. 100 observaciones de datos aleatorios. Que conclusión los coeficientes autocorrelación b. ¿Qué conclusion se puede obtener si todos los coeficientes de autocorrelación se encuendentro del intervalo y no muestran un patrón particular? tran dentro dcl intervalo y no muestran un patrOn particular? los primeros coeficientes autocorrelación son c. ¿Qué conclusion se puede obtener si los prirneros cinco coeficientes de autocorrelación son Qué conclusión diferentes dc cero en forma significativa y ci patrOn desciendc a cero en forma gradual? de forma significativa y el patrón desciende cero en forma gradual? ,A conclusión llegar r4' r8 y r1, son diferentes de cero fOlma significatid. ¿A qué conclusion se puede Ilegar si r4, rg Y rl2 son diferentes de cero en forma significativa? Suponga el siguiente modelo de serie histórica se ajustó 2. Suponga que ci siguiente modelo de serie histórica se ajustO aa los datos históricos y se ha los datos históricos y se verificado que es un modelo adecuado. un modelo adecuado. verificado Y, = 35 + ele+ .25e'_1 - - .3e'_2 = 35 + + .25e1 .3e, Las primeras cuatro observaciones son YI = 32.5, Y2 = 36.6, Y3 = 33.3 y y = 31.9. Calcule los cuatro observaciones son y1 32.5, ) 36.6, y = 33.3 Y Y4 = 31.9. Calcule los pronósticos para los periodos 5, 66yY 7 a partir del origen 4. Haga e'_1 y e,_2 igual a cero para el 7 a partir del origen 4. 1-laga e,_1 Y e'_2 igual para el para los periodos 5, periodo I. periodo 1. Capítulo CapItulo 10 Problemas 481 3. Se ajustó un modelo de serie histórica dando por resultado Se ajustó un modelo de serie histórica dando por resultado = 50 + + 50 la observación es Y5o 100. Suponga que en el periodo t - 50 Ia observación es Yso = 100. a. Determine los pronósticos para los periodos 51, 52 Y 53 a partir del origen 50. los pronósticos para los periodos 51, 52 y 53 del b. Suponga que el valor observado de Y51es 90. Revise los pronósticos de los periodos 52 y valor observado de YSl es 90. Revise los pronósticos de los periodos 52 Suponga 53. /\ c. Suponga que Ia estimación de la varianza del término de error cr 2 es 1.2. Calcule un inter1.2. interSuponga que la estimación de Ia varianza del término de error 2 de confianza del 95% sobre la estimación del periodo 51. valo de confianza del 95% sobre la estimación del periodo 51. 4. Complete Ia información faltante en el siguiente cuadro, indicando si la distribución teórica de 4. Complete la información faltante en siguiente cuadro, indicando si Ia distribución teórica de las autocorrelaciones parciales desciende o cae cero para estos autocorrelaciones y las autocorrelaciones y de las autocorrelaciones parciales desciende o cae a cero para estos modelos. MODEL AR MA ARIMA AUTOCORRELATIONS PARTIAL-AUTOCORRELATIONS 5. Dadas las gráficas en las figs. P5a a la P5c de las autocorrelaciones y autocorrelaciones parciales modelo una. de los datos originales de alguna serie, identifique un niodelo potencial para cada una. originales alguna 6. Después de ajustar un modelo MA(1) a Ia primera diferenciación de 24 observaciones de una modelo MA(I) la primera diferenciación de 24 observaciones de una Después de ajustar histórica, la fig. muestran autocorrelaciones de serie histórica, en Ia fig. P.6, se muestran las autocorrelaciones de los diez primeros residuos. Time Lags Lags 10 la Autocorrelations .10 9 9 8 7 7 6 6 S 5 4 4 3 3 2 2 1 1 I I .03 -.01 .01 .05 .12 -.10 .10 -.19 .19 -.09 .09 .08 -.02 .02 -.3 .3 -.2 -.1 O 0 .1 .1 .2 .2 .3 .3 .2 Figura P.6. P.6. a. ¿Qué Ic dice Ia inspección de los coeficientes de autocorrelación de los residuos con respecQué le la inspección los coeficientes autocorrelación respecto a lo adecuado del niodelo? lo adecuado del modelo? b. Calcule la estadIstica de ji cuadrada para estos datos y haga una prueba para determinar si una prueba para determinar si Calcule estadística de ji cuadrada estos el modelo es adecuado con base en Ia prueba de ji cuadrada. en la prueba de cuadrada. el modelo 482 Autocorrelación Periodos retrasados La metodologla Box-Jenkins (ARIMA) metodología (ARIMA) Capítulo 10 CapItulo 10 Autocorrelación AutocolTelación parcial retrasados Periodos retrasados 1.0 0 1.0 0 0 0 0.0 I----~:"""":':"'-------- 0 00 0 0 0 0 0.0 . 0 1 - - - - - - - - - - - - - - -1.0 1.0 -1.0 1.0 Figura P.5a. Autocorrelación Periodos retrasados parcial Autocorrelación parcial Periodos retrasados 1.0 1.0 0 0 -------------------o 0 0 0.0 I-----~~------- 0 0 0 0.0 f - - - - - - - - - - - - - 0 0 -1.0 1.0 -1.0 1.0 Autocorrelación parcial retrasados Periodos retrasados Figura P.Sb. Figura P5b. Autocorrelación retrasados Periodos retrasados 1.0 0 1.0 0 0 0 0 0.01----......;...-------0.0 -------------------- 0 o 0.0 I-------::...~-----0 0 -1.0 1.0 -1.0 1.0 Figura P.5c. P.Se. Capítulo 10 CapItulo 10 Problemas 483 7. Chips Bakery ha tenido problemas en el de pan integral le gustarla 7. Chips Bakery ha tenido problemas en el pronóstico de Ia demanda de su pan integral y le gustaría la que usted le ayudara. En los cuadros P7a al P7d se presentan los datos de demanda semanal y al P7d se presentan los datos de demanda semanal y ayudara. los cuadros los datos sin procesar y sus diversas diferencias. las autocorrelaciones para los datos sin procesar y sus diversas diferencias. TABLA P.7A DEMANDA DE VENTAS SEMANALES (EN MILES) DE PAN INTEGRAL P.7A DEMANDA DE VENTAS SEMANALES (EN MILES) DE PAN INTEGRAL SEMANA DEMANDA SEMANA DEMANDA 1 1 2 3 3 4 5 5 6 7 8 9 10 11 12 13 SEMANA DEMANDA SEMANA DEMANDA 14 14 15 SEMANA DEMANDA SEMANA DEMANDA SEMANA DEMAND SEMANA DEMAND A 40 41 42 43 44 45 46 47 48 49 50 51 52 47.31 50.08 50.25 49.00 49.97 52.52 53.39 52.37 54.06 54.88 54.82 56.23 57.54 22.46 20.27 20.97 23.68 23.25 23.48 24.81 25.44 24.88 27.38 27.74 28.96 28.48 16 17 18 19 20 21 22 23 24 25 26 30.21 30.09 33.04 31.21 32.44 34.73 34.92 33.37 36.91 37.75 35.46 38.48 37.72 27 28 29 30 31 32 33 34 35 36 37 38 39 39.29 39.61 41.02 42.52 40.83 42.15 43.91 45.67 44.53 45.23 46.35 46.28 46.70 P.7B TABLA P.7B FUNCiÓN DE AUTOCORRELACIÓN DE LOS DATOS SIN PROCESAR FUNCION DE AUTOCORRELACION DE LOS DATOS SIN PROCESAR AUTOCORRELACIÓN AUTOCORRELACION .94 .88 .82 .77 .71 .65 RETRASO 1 1 RETRASO 7 8 9 AUTOCORRELACIÓN AUTOCORRELACION .59 .53 .48 .43 .38 .32 2 3 4 5 6 10 11 II 12 TABLA P.7C FUNCiÓN DE AUTOCORRELACIÓN DE LA PRIMERA TABLA P.7C FUNCION DE AUTOCORRELACION DE LA PRIMERA LA SERIE DIFERENCIA DE LA SERIE RETRASO 1 1 2 3 4 5 5 6 AUTOCORRELACIÓN AUTOCORRELACION -.40 -.29 -.29 .17 .21 -.22 -.05 RETRASO 7 8 8 AUTOCORRELACION AUTOCORRELACIÓN .20 9 10 II 11 12 -.03 -.03 -.23 .21 .14 484 La metodologia Box-Jenkins (ARIMA) La metodología TABLA P.7D FUNCION DE AUTOCORRELACION DE LA SEGUNDA P.7D FUNCiÓN AUTOCORRELACIÓN DE DIFERENCIA DE DIFERENCIA DE LA SERIE Capítulo 10 CapItulo RETRASO AUTOCORRELACIÓN AUTOCORRELACION -.53 .53 -.10 .10 .11 .18 -.20 .20 .04 -.04 RETRASO 7 8 8 9 10 \O 11 11 12 AUTOCORRELACIÓN AUTOCORRELACION .16 -.05 .05 .06 -.23 .23 .16 .13 1 2 3 3 4 4 5 5 6 1 Inspeccione las gráficas y sugiera un modelo apropiado para el pronóstico de dernanda de apropiado demanda Inspeccione las gráficas ventas senianales. L,Porqué se decidió por este niodelo? semanales. ¿Por qué se decidió modelo? ,Cuál b. ¿Cuál es la ecuación para ci pronóstico de denianda de ventas sernanales del pan integral? el pronóstico demanda de ventas semanales pan integral? c. Realice las pruebas necesarias de diagnóstico para determinar si ci modelo elegido es adenecesarias de diagnóstico para determinar si el modelo elegido es adecuado o no. no. d. Utilizando el programa de Box-Jenkins, pronostique la demanda para las siguientes cuatro Utilizando ci programa de BoxJenkins, pronostique la demanda para las siguientes cuatro senianas, comenzando semanas, cornenzando con Ia sernana 53 y construya intervalos de confianza del 95% sola semana 53 intervalos del sobre estos pronósticos. pronósticos. 3. 8. Los datos de Ia tabia P.8 respresentan cotizaciones sernanales de acciones de IBM. Los datos de la tabla P.8 respresentan cotizaciones semanales de acciones de IBM. P.8 TABLA P.8 PERIODO IBM PERIODO Abr. 7 IBM 241 PERIODO Jul. 7 7 IBM 258 259 268 276 285 288 295 297 292 299 294 284 277 PERIODO IBM Ene. 6 Ene. 13 13 20 27 Feb. Feb. 3 \O 10 17 24 Mar. Mar. 2 10 \O 17 24 31 31 267 267 268 264 263 260 256 256 252 245 243 240 238 14 21 21 28 May 5 May 5 12 19 26 Jun. 2 2 9 9 16 16 23 30 244 254 262 261 265 261 261 257 268 270 266 259 14 21 21 28 Ago. 4 11 11 18 18 25 Sep. 1 8 8 15 15 22 29 1 268 Oct. 6 6 13 20 27 Nov. 3 3 \O 10 17 24 256 Dic. 1 8 8 15 22 29 1 279 287 276 273 270 264 261 268 270 276 274 284 304 3. Obtenga gráficas de los datos, autocorrelaciones y autocorrelaciones parciales mediante el datos, autocorrelaciones y autocorrelaciones parciales mediante el programa Box-Jenkins; utilice después esta información para sugerir un modelo moprograrna de BoxJenkins; utilice después esta información para sugerir un modelo oomodelos apropiado(s) de pronóstico. pronóstico. ,Es la son estacionarios? b. ¿Es Ia serie estacionaria? ¿Qué corrección recomendaría si los datos no son estacionarios? estacionaria? ,Que corrección recornendarIa silos Capítulo 10 CapItulo 10 Problemas 485 c. Utilice el programa de Box-Jenkins para calcular valores mejorados de los parámetros. de Box-Jenkins para calcular valores mejorados de los parámetros. d. Realice pruebas de diagnóstico para determinar si el modelo es adecuado. el modelo es adecuado. e. Después de encontrar un modelo satisfactorio, haga los pronósticos de enero para la primeDespués de un modelo satisfactorio, haga los pronósticos de enero ra semana del próximo afio. del próximo año. la Los datos de la tabla P.9 corresponden a 150 días de las cotizaciones 9. Los datos de Ia tabla P.9 corresponden a 150 dias de las cotizaciones al cierre de acciones de la DEF Corporation. Determine el modelo apropiado de Box-Jenkins y pronostique 5 dIas a futuro. días ci modelo apropiado de es su pronóstico? ¿Qué tan preciso es su pronóstico? Que TABLA P.9 P.9 PERIODO PERlODO 1 1 DEF 136.0 132.8 130.4 128.8 136.8 135.2 134.4 139.2 136.8 136.0 133.6 139.2 137.6 139.2 139.2 136.0 138.4 137.6 139.2 134.4 136.8 139.2 139.2 140.0 139.2 140.8 139.2 138.4 136.0 142.4 140.0 144.8 140.0 139.2 139.2 136.8 140.8 141.6 139.2 PERIODO 51 52 53 54 55 56 56 57 58 59 59 60 61 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 n 79 80 81 82 83 84 85 86 87 88 89 DEF 140.8 135.2 135.2 133.6 133.6 134.4 134.4 137.6 134.4 140.8 137.6 132.8 136.8 135.2 135.2 132.8 144.0 137.6 138.4 136.0 135.2 138.4 134.4 138.4 139.2 141.6 134.4 135.2 136.0 135.2 136.0 132.8 133.6 134.4 133.6 131.2 132.0 131.2 132.8 132.0 133.6 131.2 PERlODO PERIODO 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 DEF 136.0 137.6 131.2 136.0 136.0 133.6 129.6 132.8 135.2 132.0 132.8 132.8 136.0 136.8 136.8 133.6 134.4 130.4 132.8 134.4 135.2 136.8 134.4 136.0 137.6 138.4 137.6 n7.6 138.4 137.6 137.6 140.0 135.2 135.2 135.2 136.0 112.0 132.0 133.6 133.6 134.4 134.4 133.6 133.6 2 2 3 3 4 5 5 6 7 8 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 139.2 486 La metodología Box-Jenkins (ARIMA) La metodologIa P.9 TABLA P.9 (continuación) PERIODO GEF DEF PERIODO DEF PERIODO 140 141 142 143 144 145 146 147 148 149 150 Capítulo 10 DEF 133.6 132.8 132.0 136.0 133.6 133.6 135.2 139.2 136.8 136.0 134.4 40 41 42 43 44 45 46 47 48 49 50 142.4 140.8 140.0 132.0 142.4 138.4 138.4 136.8 139.2 135.2 138.4 90 91 92 93 94 95 96 97 98 99 100 131.2 129.6 131.2 130.4 131.2 136.0 135.2 136.8 136.8 136.8 136.8 133.6 135.2 10. Los datos de la tabla P.lO son el número 10. Los datos de la tabla P.10 son el nürnero de accidentes automovilIsticos semanales para los años accidentes automovilísticos semanales para los años de 1984 y 1985. Determine el modelo apropiado de Box-Jenkins y pronostique los accidentes 1984 y 1985. Determine el modelo apropiado de Box-Jenkins y pronostique los accidentes para la semana 91. ¿Qué tan preciso es su pronóstico? su pronóstico? ,Que tan TABLA P.10 P.10 PERIODO 1 OBSERVACIÓN OBSERVACION PERIODO OBSERVACIÓN OBSERVACION PERIODO OBSERVACIÓN OBSERVACION 1 101 101 84 54 39 26 40 99 31 31 32 32 33 33 34 35 35 16 17 61 62 63 64 65 66 67 68 69 70 2 2 79 53 40 27 31 56 78 114 140 112 82 80 70 55 37 23 20 39 71 110 112 93 75 60 63 46 32 23 53 90 3 3 4 4 5 5 6 21 21 28 7 8 8 9 10 10 11 11 12 12 13 13 14 14 15 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 148 147 134 106 83 76 63 57 37 32 22 20 23 30 50 61 59 64 58 44 26 24 18 18 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 30 51 62 57 46 40 32 23 20 18 18 24 33 52 66 78 83 87 64 44 71 72 73 74 75 76 77 78 79 80 81 81 82 83 84 85 86 87 88 89 24 29 73 138 154 119 102 90 Capítulo 10 Caso de estudio CapItulo 10 Caso de estudio 487 11. Utilice la metodologia de Box-Jenkins para modelar los datos de ventas al menudeo en EUA, 11. Utilice metodología de para modelar los datos de ventas al menudeo EUA, caso de estudio 4.1. que se presentaron en el caso de estudio 4.1. CASO DE ESTUDIO 10.1 10.1 VENTAS DE RESTAURANTE Este caso se refiere a los datos y a la situación del caso de estudio de ventas de restaurante del cap. 7. cap. 7. Jim Jim Price terminó un curso sobre pronósticos y está ansioso de aplicar la metodologIa de tem1inó curso sobre pronósticos está ansioso de aplicar la metodología de Box-Jenkins a los datos de ventas del restaurante. Estos datos, que se muestran en la tabla 10.9(a), los datos de ventas del restaurante. Estos datos, que muestran en 10.9(a), comienzan con la semana que termina el domingo 4 de enero de 1981 y continúan hasta la semana que ei domingo 4 de enero de 1981 y continüan hasta la semana que 1982. tabla 10.9(b) contiene nuevos datos para termina el domingo 26 de diciembre de 1982. La tabia 10.9(b) contiene nuevos datos para la semana 1983 la que tem1ina el 2 de enero de 1983 hasta Ia semana que tem1ina el 30 de octubre de 1983. termina termina ci TABLA 1O.9A VENTAS DE RESTAURANTE: DATOS ANTERIORES TABLA 10.9A VENTAS RESTAURANTE: DATOS ANTERIORES TE1uim4oDE TÉRMINO DE LA SEMANA 1/4/81 1/4/81 1/11/81 1/18/81 1/18/81 1/25/81 1/25/81 2/1/81 2/8/81 2/15/81 2/22/81 3/1/81 3/8/81 3/15/81 3/22/81 3/29/81 4/5/81 4/12/81 4/19/81 4/26/81 5/3/81 5/3/81 5/10/81 5/17/81 5/24/81 5/31/81 6/7/81 6/14/81 6/21/81 6/28/81 7/5/8 1 7/5/81 7/12/81 7/19/81 7/26/8 1 7/26/81 8/2/8 1 8/2/81 8/9/81 8/16/81 8/23/81 8/30/81 VENTAS $1,688 2,514 5,843 4,912 5,133 4,563 5,416 6,416 5,879 3,460 4,517 5,188 5,944 5,842 6,589 5,447 7,548 6,403 4,103 6,594 5,742 3,714 3,399 3,376 3,627 4,201 3,515 3,645 3,416 3,565 2,428 3,292 3,460 6,212 6,057 TERMINO DE TÉRMINO LA SEMANA 9/6/81 9/13/81 9/20/81 9/27/81 10/4/91 10/11/81 10/18/81 10/18/81 10/25/81 10/25/81 11/1/81 11/8/81 11/15/81 11/15/81 11/22/81 11/29/81 12/6/81 12/13/81 12/20/81 12/27/81 12/27/81 1/3/82 1/10/82 1/17/82 1/24/82 1/31/82 2/7/82 2/14/82 2/21/82 2/28/82 3/7/82 3/14/82 3/21/82 3/28/82 4/4/82 4/11/82 4/18/82 4/25/82 5/2/82 VENTAS $5,739 5,560 5,335 5,305 5,364 5,511 5,698 5,382 5,629 5,617 5,742 3,747 4,159 4,853 5,607 3,946 1,919 1,898 1,870 3,962 5,973 5,009 5,328 5,014 4,986 5,213 4,807 3,964 5,201 4,863 5,019 4,868 5,777 6,543 6,352 TÉRMINO DE TERMINO DE LA SEMANA VENTA S VENTAS $5,837 7,162 4,997 4,063 3,942 4,011 3,999 4,794 4,956 3,885 4,209 3,614 3,722 4,307 3,322 5,962 6,784 6,069 5,897 5,916 4,998 5,111 5,612 5,906 6,010 5,937 6,004 5,959 4,223 4,679 5,307 6,101 6,896 2,214 5/9/92 5/16/82 5/23/82 5/30/82 6/6/82 6/13/82 6/20/82 6/27/82 7/4/82 7/11/82 7/18/82 7/25/82 8/1/82 8/8/82 8/15/82 8/22/82 8/29/82 9/5/82 9/12/82 9/19/82 9/26/82 10/3/82 10/10/82 10/17/82 10/24/82 10/31/82 11/7/82 11/14/82 11/21/82 11/28/82 12/5/82 12/12/82 12/19/82 12/26/82 488 La metodologia Box-Jenkins (ARIMA) metodología TABLA 10.9B VENTAS DE RESTAURANTE: DATOS NUEVOS TABLA 1O.9B VENTAS DE RESTAURANTE: DATOS NUEVOS Capítulo 10 CapItulo TERMINO T ÉRMINO DE LA SEMANA 1/2/83 1/2/83 1/9/83 1/9/83 VENTAS $2,431 $2,431 2,796 4,432 4,432 5,714 5,714 5,324 5,324 5,011 5,01! 5,336 5,336 4,999 5,340 5,340 5,009 5,009 5,590 5,590 3,308 3,308 6,558 4,991 4,991 6,952 6,952 TERMINO TÉRMINO DE LA SEMANA SEMANA 4/17/83 4/17/83 VENTAS $6,357 $6,357 7,273 8,678 8,678 7,418 7,418 10,388 10,388 4,940 4,940 4,195 4,195 3,895 3,895 3,762 3,739 3,739 3,975 3,975 4,634 4,634 4,891 3,463 3,463 3,536 3,536 TÉRMINO DE TERMINO DE LA SEMANA 7/31/83 7/31/83 8/7/83 8/14/83 8/21/83 8/21/83 8/28/83 9/4/83 9/11/83 9/11/83 9/18/83 9/18/83 9/25/83 10/2/83 10/9/83 10/16/83 10/16/83 10/23/83 10/30/83 10/30/83 VENTAS $3,558 $3,558 3,791 3,791 3,946 3,946 3,054 3,054 6,893 6,893 8,037 8,037 4/24/83 4/24/83 1/16/83 1/16/83 1/23/83 1/23/83 1/30/83 1/30/83 2/6/83 2/6/83 2/13/83 2/13/83 2/20/83 2/20/83 2/27/83 2/27/83 3/6/83 3/6/83 3/13/83 3/13/83 3/20/83 3/20/83 3/27/83 4/3/83 4/3/83 4/10/3 4/10/&3 5/1/83 5/1/83 5/8/83 5/8/83 5/15/83 5/22/83 5/29/83 5/29/83 6/5/83 6/5/83 6/12/83 6/19/83 6/19/83 6/26/83 6/26/83 7/3/83 7/3/83 7/10/83 7/10/83 7/17/83 7/17/83 7/24/83 6,884 6,884 7,143 7.143 8,318 8,318 6,871 6,871 6,514 6,514 6,656 6,656 6,484 6,484 6,125 6,125 PREGUNTAS Cuá1 es modelo de l. ¿Cuál es modelo de Box-Jenkins apropiado para utilizar sobre los datos originales? utilizar sobre los datos originales? ,Cuáles 2. ¿Cuáles son sus pronósticos para las primeras cuatro semanas de enero de 1983? 1983? Cómo 3. ¿Cómo son estos pronósticos comparados con las ventas reales? las ventas reales? 4. j,Córno resulta su modelo de Box-Jenkins comparado con los modelos de regresión utilizados ¿Cómo resulta su modelo de comparado con los modelos de regresión utilizados en el cap. 7? 5. ¿Utilizaría el mismo modelo de Box-Jenkins si se combinaran los datos nuevos con los Uti1izaria el mismo modelo de Box-Jenkins si se combinaran los datos nuevos con los anteriores? CASO DE ESTUDIO 10.2 ESTIIDIO 10.2 MR. MR. TUX John Mosby decidió intentar el método de Box-Jenkins para pronosticar sus ventas mensuales. Él decidió intentar el método para pronosticar mensuales. Ei John estado entiende que este procedimiento es mucho más complejo que los métodos más sencillos que ha estado intentando. también posible obtener pronósticos precisos avanzado intentando. Sabe también que es posible obtener pronósticos más precisos mediante este avanzado programa método. Además, tiene acceso al prograrna de cómputo Sybil/Runner que puede ejecutar el método de Box-Jenkins. y como ya tiene los datos reunidos Box-Jenkins. y como ya tiene los datos reunidos y almacenados en su computadora, decide probarlo. su de que 96 meses de datos de ventas. En decide utilizar John decide utilizar todo su conjunto de datos, que consiste en 96 meses de datos de ventas. En al Box-Jenkins, la los mensajes introductorios de Ia pantalla de su computadora, a! activar el programa de Box-Jenkins, modelar elemento estacional en series de tiempo de datos, así como John lee que el programa puede modelar un elemento estacional en series de tiempo de datos, asI como móviles como utilizar tanto los promedios rnóviles corno un modelo autorregresivo. CapItulo 10 Capítulo 10 Caso de estudio 489 En el caso de estudio 4.3, John ejecutó un correlograma y determinó que sus datos tenían una ejecutó un correlograma y determinó que sus datos tenjan una Hizo una primera diferenciación de los datos y encontró estacionalidad. Como la autocorretendencia. Hizo una primera diferenciación de los datos y encontró estacionalidad. Corno Ia autocorrelación en el periodo retrasado 24 fue significativa, John decidió que los datos de la primera diferencia fue significativa, John decidió que los datos de la primera diferencia eran estacionarios. Para eliminar la tendencia estacional, realizó diferencia largo plazo no eran estacionarios. Para eliminar Ia tendencia estacional, realizó una diferencia de largo plazo (diferencia la estacionalidad separada por 12 meses). Los coeficientes de autocorrelación se muestran estacionalidad separada por 12 meses). Los coeficientes de autocorrelación se muestran en la fig. 10.29 y los coeficientes de autocorrelación parcial en la fig. 10.30. 10.29 Ylos coeficientes de autocorrelación la 10.30. -- SHORT DIFFERENCES -- SHORT TERM = MODEL = 0 o 1 LONG TERM = INITIAL MSE = 508957.0000 INITIAL *** AUTOCORRELATION COEFFICIENTS COEFFICIENTS ERROR = 0.175 CHI SQUARED = STANDARD ERROR = 0.175 63.61 CHI DEGREES OF FREEDOM = 24 24 DEGREES TIME LAG AUTOCORRELATION AUTOCORRELAT ION 27 -0.09 27 -0 . 09 0.18 26 25 -0.05 -0 . 05 24 24 - - - - - -0.18 0 . 44 23 0.44 22 -0.30 21 -0.04 21 -0. 04 20 0.17 * 19 19 -0 . 06 -0.06 18 -0.15 18 17 0.18 17 16 0.03 15 -0.08 15 -0 . 08 * -0.03 14 -0. 03 13 0.02 12 - - - - - - - - - . - - * 1-- - . - - - - - - - - - - - - - - -0.04 12 -0 . 04 11 -0.01 10 0.03 1 * * -0.01 9 8 0.05 8 0 . 05 7 7 -0.05 -0 . 05 6 6 0.13 -0.22 5 5 4 4 -0.01 3 3 0.18 2 -o .12 2 -0.12 1 -0.43 1 -0 . 43 -1 ¡'I'I'I'I'I'I'I'I'I' '1'1'1'1'1'1'1'1'1'1 0 o +1 Figura 10.29 Coeficientes de autocorrelación de los datos con diferencia 10.29 Coeficientes de autocorrelación de los el caso de estudio 10.2. de corto y largo plazos para el caso de estudio 10.2. largo plazos 490 La metodologla Box-Jenkins (ARIMA) metodología Box-Jenkins (ARIMA) PARTIAL *** PARTIAL AUTOCORRELATION COEFFICIENTS COEFFICIENTS STANDARD ERROR = 0.110 SQUARED= STANDARD ERROR CHI SQUARED= 62.36 DEGREES OF FREEDOM = 24 24 DEGREES TIME LAG LAG AUTOCORRELATION AUTOCORRELAT ION 25 25 0.02 24 24 - - - - - - - - - - - - - - - - - ° - - - * - - - ° - - - - - - - - - - - - - - - 0.00 0 . 00 23 23 0.13 22 22 -0.35 21 21 -0.02 -O .02 * 20 -0.08 -0 . 08 19 19 -O . 14 -O .14 * 18 18 0.03 0 . 03 17 0.09 16 -O .19 -0.19 15 15 -O .14 -0.14 * 14 -0.05 -0. 05 13 -0.02 * 12 - - - - - - - - - - - - - - - - - ° - * - I --- ° - - - - - - - - - - - - - - - - -O . 09 12 -0.09 11 -0. 01 -0.01 10 -0.01 -0. 01 9 9 -0.04 -O . 04 8 8 -0.06 7 7 -0.24 -0. 24 6 6 -O .16 -0.16 5 5 -0.23 -0. 23 * 4 4 -0.01 -O . 01 3 3 -0.09 -O . 09 * I * 2 2 -0.38 -O . 38 1 * 1 1 -0.43 -0. 43 I * CapItulo Capítulo 10 ¡o¡olololololo/'lololol%l'lolo""lol'l -1 O 0 +1 +1 Figura 10.30 Coeficientes de autocorrelación parcial de los datos con Figura 10.30 Coeficientes de autocorrelación parcial de los datos diferencias de corto y largo plazos para el caso de estudio 10.2. caso de estudio 10.2. diferencias de corto TAREA 1. Considerando la complejidad del método de Box-Jenkins, si John encuentra un buen modelo, Considerando Ia coniplejidad del método de BoxJenkins, si John encuentra un buen modelo, ¿podrá explicarlo a su banco y al resto de su equipo de administración? ,podrá ,Qué 2. ¿Qué modelo(s) emplearia usted para ajustar el término no estacional? emplearía 3. ¿Qué modelo(s) emplearla usted para ajustar el término estacional? emplearía el término estacional? Que 4. Si tiene usted un programa de Box-Jenkins, intente encontrar un buen modelo. usted un programa de BoxJenkins, intente encontrar un buen CASO DE ESTUDIO 10.3 10.3 CONSUMER CREDIT COUNSELING CONSUMER CREDIT COUNSELING La operación de Consumer Credit Counseling (CCC) se describió en los caps. 1 (caso de estudio 1.2) 1 1.2) estudio 3.4). y 3 (caso de estudio 3.4). CapItulo 10 Capítulo 10 Caso de estudio 491 El director ejecutivo Marv Harinshfeger llegó a la conclusión de que la variable más importante El Mary Ia conclusion de que la variable más importante que requeria pronosticar CCC era el ni'imerode clientes por atender en el resto de 1993. Mary que requería pronosticar CCC era ci número de clientes por atender en el resto 1993. Marv proporcionó proporcionó a Dorothy Mercer los datos mensuales del número de clientes atendidos por CCC en el Mercer los datos mensuales del nimero periodo de enero de 1985 a marzo de 1993 (véase caso de estudio 4.3). de 1985 a marzo de 1993 (véase caso de estudio 4.3). Dorothy estaba muy contenta con su trabajo de pronósticos. Sin embargo, usted no Hasta ahora, Dorothy estaba muy contenta con su trabajo de pronOsticos. Sin embargo, usted no está por completo satisfecho y decide que es el momento de realmente impresionarla. Usted le informa ci momento de realmente impresionaria. Usted le informa debería de las más poderosas técnicas utilizadas los pronósticos, los modelos de que deberIa intentar una de las más poderosas técnicas utilizadas en los pronósticos, los modelos de Box-Jenkins. Dorothy nunca escuchó hablar de Box-Jenkins, pero está dispuesta dejar que usted 10 BoxJenkins. Dorothy nunca escuchó hablar de BoxJenkins, pero está dispuesta aadejar que usted lo intente. TAREA Escriba un memorando para Dorothy que explique la metodología de Box-Jenkins. Desarroile un memorando para Dorothy que explique Ia metodologla de BoxJenkins. Desarrolle modelo metodología un rnodeio utilizando esta metodoiogIa y pronostique el resto de 1993. Escriba un segundo memorando ci resto de 1993. Escriba un segundo los resultados de análisis. para Dorothy que contenga los resuitados de este análisis. CASO DE ESTUDIO 10.4 ESTIJDIO 10.4 LYDIA E. PINKHAM MEDICINE COMPANY LYDIA E. PINKHAM La Lydia E. Pinkham Medicine Company era una empresa familiar cuyo ingreso principal provenía de empresa familiar cuyo ingreso principal provenIa de venta Compuesto Vegetal Lydia Pinkham. los podrían algo de ese la yenta del Compuesto Vegetal Lydia Pinkham. Quizá los estudiantes podrIan usar hoy algo de ese el desafortunadamente ya no tenía la imagen de compuesto para aliviar ci estrés; desafortunadamente ya no se vende. La etiqueta tenla la imagen de Pinkham el compuesto comercializaba hacia las mujeres. La publicidad del compuesto Lyidia Pinkham y ci compuesto se coniercializaba hacia las mujeres. La publicidad del compuesto incluía invitación: "... el inciuIa esta invitación: "oo. escriba libre y ampliamente a la Sra. Pinkham a Lynn, Mass., y asegure ci Ia Sra. consejo que ofrece sin cargo a todas las mujeres. Este consejo ha hecho brillar el Sol en muchos hogares briliar ci Sol en muchos a los que ci nerviosismo y la irritabilidad casi habIan destruído". Dc hecho, la compafiIa aseguraba que el habían destruido". De compañía cada carta era respondida por una empleada. La mujeres escribieron a la Sra. Pinkham. Entre los respondida por empleada. La mujeres escribieron a Ia Sra. Pinkham. Entre los cada Catia el estarIa comentarios estaba ci siguiente: "Sin el Compuesto vegetal de Lydia Pinkham, a estas alturas ya estaría muerta, o aún peor, loca ...ya me habla dado por vencida; como habla intentado tantas cosas, crel que ann loca.. . ya me había dado por vencida; como había intentado tantas cosas, creí que ya nada me harIa bien. Pero gracias a su medicina, estoy ahora sana y fuerte; de hecho soy una persona haría persona completamente Este completarnente nueva." Este y otros testimonios se reprodujeron en publicidad impresa del compuesto. única de Ia compañIa (un producto dominante que representaba Ia La naturaleza iThica de la compañía (un producto dominante que representaba la mayor parte de la empresa, la ausencia de personal de ventas y una gran proporción de utilidades las ventas de Ia empresa, Ia ausencia de personal de ventas y una gran proporción de las utilidades invertidas en publicidad), asi como la disponibilidad de datos tanto publicidad, invertidas en publicidad), así como Ia disponibilidad de datos tanto en ventas como en publicidad, condujeron en 1943 al Comité de Determinación de Precios del Departamento Nacional de Investigación condujeron en 1943 DeterminaciOn de Precios del Departamento Nacional de Investigación Económica (NBER National Bureau ofEconomic Research) a recomendar que se sometieran los datos of Economic Research) a recomendar que se sometieran los datos Este caso es una contribución dc Susan C. White, Northwestern State University, Natchitoches, Louisiana. Para una contribución de Susan C. White, Northwestem State University, Louisiana. información, consúltese Neural Networks versus Statistical mayor información, constiltese Susan C. White, "Predicting Time Series with Neural Networks versus Statistical Models: The Lydia Pinkham Data", Proceedings of the 24 th Annual Conference of the Decision Sciences Models: The Lydia Pinkharn Data", Proceedings of the 24 th Annual Conference of the Decision Sciences Institute. Southwest Regían, 1993, 108-110. Institute, Southii'est Region, 1993, 108-1 10. 492 La metodologla Box-Jenkins (ARIMA) La metodología Capítulo 10 CapItulo 10 a un análisis minucioso. Durante varios años no se emprendió la investigación.3 Los analistas hablan años no se emprendió la investigación. 3 habían estudiado los datos mediante modelos causales que incluían los datos de publicidad y otras variables estudiado modelos causales que inclulan los datos de publicidad y variables (similares el Sin embargo, varios investigadores sugirieron económicas (similares a los presentados en ci cap. 7). Sin embargo, varios investigadores sugirieron que los enfoques de Box-Jenkinsutilizando solo los datos de ventas ofreclan predicciones comparables, enfoques BoxJenkins utilizando sólo los datos de ventas ofrecían predicciones comparables, inciuso causales. 4 Los datos de ventas eran atractivos de e incluso superiores, al compararlas con los enfoques causales.4 Los datos de ventas eran atractivos de estudiar por dos razones: l. El producto en si no habla cambiado durante la duración de la serie, es decir, no había cambios El producto sí había durante Ia duración de Ia serie, es decir, no habIa cambios en la serie derivados de cambios en el producto. serie derivados cambios el producto. había cambios la fuerza de ventas durante la duración de la serie, y la proporción de 2. No habla cambios en la fuerza de ventas durante la duración de Ia serie, y la proporciOn de se mantenIa mas o menos constante. Por ello, no habla cambios utilidades gastadas en publicidad se mantenía mas o menos constante. Por ello, no había cambios en los datos generados por promociones especiales u otros fenómenos de comercializaciOn. datos generados por promociones especiales u otros fenómenos de comercialización. la Es tIpico que los datos reales no presenten esta "claridad" en términos del producto y la "claridad" en términos del producto Es típico que los datos reales no presenten continuidad en Ia comercialización. la Entonces, Ia tarea a realizar consistla en determinar qué modelo de BoxJenkins sería Entonces, la tarea a realizar consistía en determinar qué modelo de Box-Jenkins serIa "mejor" desarrollaría para los datos, mismos que se presentan al final de este caso. El modelo se desarroliarIa con los datos de 1907 a 1948 y se probaria con los datos de 1949 a 1960 que se presentan en Ia tabla 10.10. 1948 probaría con los datos de 1949 a 1960 que se presentan en la tabla 10.10. k FAC 0.978 0.949 0.916 0.876 0.836 0.795 0.757 0.725 0.700 0.7üO 0.682 FACP 1 2 2 3 3 0.978 -0.168 0.168 -0.113 0.113 -0.138 0.138 0.049 -0.07\ 0.071 0.111 0.069 0.135 0.056 4 5 5 6 7 7 8 8 9 10 IDENTIFICACIÓN IDENTIFICACION DEL MODELO Se empleó Timeslab5 para examinar los datos de 1907 a 1948; los datos de 1949 a 1969 se utilizaron 1949 1969 utilizaron Se Timeslab5 para examinar los datos de 1907 1948; los datos para examinar la capacidad de pronóstico del modelo seleccionado. Las pruebas preliminares sugirieron pronóstico del modelo seleccionado. Las pruebas preliminares sugirieron datos eran estacionarios (esto hay una tendencia aparente), así que no se utiliza la que los datos eran estacionarios (esto es, no hay una tendencia aparente), asI que no se utiliza la examinar diferenciación. Después de exarninar las autocorrelaciones y las autocorrelaciones parciales (abajo se 10 determinó muestran los datos de estos coeficientes para 10 periodos), se deterrninó que un modelo AR era el más el apropiado para los datos. Para seleccionar ci orden del modelo AR se utilizó el criterio de información ci (Ale). herramienta la eiección de Akaike (AIC). (Esta herrarnienta excede el alcance de este libro.) Dicho criterio condujo a Ia elección Kristian S. Palda, The Measureniet of Cu,nulative Advertising Effects (Englewood Cliffs, N. J.: Prentice-Hall, The Measllremet oJCllmlllative Advertising Effects (Englewood J.: Prentice-Hall, Kristian 1964). 1964). '4 Véase P. W. Kyle, "Lydia Pnkham Revisited: A Box-Jenkins Approach", Journal ofAdvertising Research, 1 18, W. Kyle, "Lydia Pnkham Revisited: A Box-Jenkins Approach", JOllrnal oJAdvertising Research, 8, 2 (1978), 3 1-39; Y Thomas H. Naylor, Terry G. Seaks y D. W. Wichern, "Box-Jenkins Methods: An Alternati2 (1978), 31-39; y Thomas H. Naylor, Terry G. D. W. Wichern, "Box-Jenkins Methods: An Alternatito Econometric Models", lnternational Statistical Revie1,1', 40,2 (1972),123-137. ve to Econometric Models", International Statistical Review, 40, 2 (1972), 123-137. 5 H. Joseph Newton, TIMESLAB: A Time Series Analysis Laboratory (Wadsworth & Brook/Cole Publishing Newton, TIMESLAB: A Tune Series Analysis (Wadsworth & Brook/Cole Publishing H. 1988). Company, 1988). 3 CapItulo Capítulo 10 Caso de estudio 493 TABLA 10.10 DATOS DE LYDIA E. PINKHAM MEDICINE COMPANY TABLA 10.10 DATOS DE LYDIA E. PINKHAM MEDICINE COMPANY VENTAS (MILES DE (MILES DÓLARES DOLARES CORRIENTES) VENTAS (MILES DE DÓLARES DOLARES CORRIENTES) VENTAS (MILES '(MILES DE DÓLARES DOLARES CORRIENTES) AI1O AÑO AÑO ANO AROS AÑOS 1907 1908 1909 1910 1910 1911 1912 1912 1913 1913 1914 1914 1915 1916 1917 1918 1919 1920 1921 1922 1923 1924 1016 921 934 976 930 1052 1184 1089 1087 1154 1330 1980 2223 2203 2514 2726 3185 3352 1925 1926 1927 1928 1929 1930 1931 1932 1932 1933 1933 1934 1934 1935 1935 1936 1936 1937 1937 1938 1938 1939 1939 1940 1940 1941 1941 1942 1942 3438 3438 2917 2359 2240 2196 2111 1806 1644 1814 1770 1518 1103 1266 1473 1423 1767 2161 1943 1943 1944 1945 1945 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 2602 2518 2637 2177 1920 1910 1984 1787 1787 1689 1689 1866 1866 1896 1684 1633 1657 1569 1390 1397 1289 2336 de un modelo AR(2) para los datos. Los coeficientes de autocorrelaciôn y de autocorrelación parcial autocorrelación parcial parecen indicar que deberla seleccionarse un modelo AR(1) (véase pregunta 2). debería Wl AR( 1) ESTIMACIÓN DEL MODELO V PRUEBA DE SU SUFICIENCIA Y ESTIMACION Se utilizó Timeslab para estimar los parámetros del modelo AR(2) utilizando los datos de 1907 a 1948. El modelo tentativo de pronóstico fue: fue: El Y = 1.302 Y,_1 -- 0.309 Y122 ~ 1.302 Y t - I 0.309 Y t = Los términos de error resultantes se probaron utilizando Ia prueba Q con k = 10. El valor calculado de la estadIstica de la prueba es 2.285 con un valor dep de 0.971; esto indica que el modelo es adecuado. la estadística de la prueba es 2.285 con un valor de p de 0.971; esto indica que el modelo es adecuado. Además, se probaron los coefIcientes individuales bajo Ia hipótesis nula de que el coeficiente verdadero coeficientes la el cero. El valor dep fue de 0.000 1; el valor dep para el segundo coeficiente era cero. El valor de p para el primer coeficiente fue de 0.0001; el valor de p para el segundo coeficiente la hipótesis nula de que el coeficiente es cero a un nivel de fue de 0.0424. En ambos casos se rechaza Ia hipótesis nula de que el coeficiente es cero a un nivel de fue significación dcl 5%. del PRONOSTICO PRONÓSTICO MEDIANTE EL MODELO MODELO El último paso en el análisis del modelo AR(2) para estos datos fue pronosticar un periodo a futuro, con con ültirno paso el análisis del AR(2) fue hasta 1958.) los valores de 1949 a 1960. (Por ejemplo, para el pronóstico de 1959 se emplearon los datos hasta 1958.) emplearon los Los resultados fueron 494 La metodología Box-Jenkins (ARIMA) La metodologIa Capítulo 10 CapItulo AO AÑO 1949 1949 1950 1950 1951 1952 1952 1953 1953 1954 1954 1955 1955 1956 1956 1957 1957 1958 1958 1959 1959 1960 REAL 1984 1787 1787 1689 1866 1896 1684 1633 1633 1657 1657 1569 1569 1390 1387 1387 1289 PRONOSTICO PRONÓSTICO 1893.2 1992.6 1713.3 1646.6 1907.3 1891.6 1606.4 1605.5 1652.5 1530.5 1324.7 1376.1 Además de los pronósticos, se calcularon algunas mediciones de error tanto para los mediciones los Además (1949-1960). Estos fueron estimación (1907-1948) datos de estimación (1907-1 948) como para los datos de prueba (1949-1960). Estos fueron DATOS Estimación Prueba DAM 206.3 100.9 PEMA 12.00% 6.14% EMC 80502.8 15337.3 Así pronósticos del modelo AR(2) tienen desviación AsI los pronósticos del modelo AR(2) tienen una media de desviación absoluta de error medio cuadrado $100,900, una media de porcentaje de error absoluto de 6.14% y un error medio cuadrado porcentaje $100,900, de 15,337.3. Estas cifras se comparan favorablemente con las mediciones de error de los 15,337.3. Estas cifras comparan favorablemente con las mediciones de error de los modelos causales desarollados por otros investigadores. investigadores. modelos RESUMEN Y CONCLUSIONES CONCLUSIONES AR(2) parsimonioso (número mInimo de términos o parámetros) a los Se ajustó un modelo AR(2) parsirnonioso (niimero mínimo de témlinos o parámetros) a los datos de Lydia Pinkham para los años de 1907 a 1948. Este modelo produjo pronósticos de un paso bastante Pinkham 1907 1948. modelo pronósticos de precisos para los años de 1949 a 1960. 1949 1960. PREGUNTAS 1. Después de concluido este análisis, se tuvieron disponibles los datos de ventas de 1961: 51,426. disponibles 1961: $1,426. Después ¿Cuál pronóstico del modelo 1961? agregara año conjunto datos de i,Cuál es el pronóstico del modelo para 1961?. Si se agregara este aflo al conjuntó de datos de ¿cuáles serian los ajustes en Y EMC? prueba, j,cuáles serían los ajustes en el DAM, PEMA y EMC? 2. Ajuste a los datos un modelo AR(1) y compare los resultados con los del modelo AR(2). i,Cuál los datos un modelo AR(I) y compare los resultados con los del modelo AR(2). ¿Cuál que sea mejor? ¿Por qué? de ellos piensa que sea mejor? i,Por qué? 3. Estos datos son atractivos debido a la naturaleza ünica (no cambiante) del producto y Ia Estos datos son atractivos debido a la naturaleza única (no cambiante) del producto la comercialización para la duración de los datos. ¿Qué factores pudieran afectar los datos de ventas de los datos. ,Que automóviles cobre durante este mismo periodo? ¿Por anuales de automóviles y de cobre durante este mismo periodo? i,Por qué? Para una lectura adicional sobre la Lydia E. Pinkham Medicine Company y sobre Lydia Pinkham, Ia Lydia E. Pinkham Medicine Company y sobre Lydia Pinkham, consúltese Sarah Stage, Female Complainls: Lydia Pinkham and lhe Business 01 Women' s Medicine consñltese Sarah Stage, Female Complaints: Lydia Pinkham and the Business of Woin en's Medicine 1979). (New York: Norton, 1979). Capítulo 10 CapItulo 10 estudio Caso de estudio 495 CASO DE ESTUDIO 10.5 ESTUDIO 10.5 DEMANDA DIARIA DE PERM 1505 PARA PESCA DE TRUCHA DEMANDA DIARIA DE PERMISOS PARA PESCA Para conservar los recursos naturales y proporcionar recreación a turistas y a sus ciudadanos, el estado y de Missouri tiene funcionando 15 areas de administración de truchas. El Missouri Department of administración de truchas. El Missouri Department of de Missouri tiene funcionando 15 áreas Conservation cría anualmente aproximadamente 3 millones de truchas. Después de 15 meses estas Conservation cria anualmente aproximadamente 3 millones de truchas. Después de 15 meses truchas se liberan en lagos y corrientes. Cuatro de las funciones principales son "parques de truchas", funciones que tienen corrientes brotantes que se surten diariamente durante la temporada que va del 1 de marzo durante Ia temporada que al31 de octubre (245 días). Este caso describe el desarrollo y aplicación de un modelo para pronosticar a! 31 de octubre (245 dIas). Este caso describe el desarrollo y aplicación de un modelo para pronosticar la demanda diana de truchas en el parque de truchas más grande del estado, Bennett Spring.66El modelo diaria de truchas en el parque de truchas más grande del estado, Bennett Spring. El modelo ha sido utilizado por el administrador del criadero para Ia planeación diaria de liberación de peces. A la diana de liberación de peces. A continuación se exponen los resultados de su uso durante Ia temporada de 1979. su la 1979. Permisos Pennisos Yt Yt Memorial Day Día del DIa Trabajo I I I / I C,. "I 10 / I I I I I I I I I I I I I 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220 230 240 80 100 110 120 130 140 150 160 170 180 190 200 210 220 230 240 (a) Pennisos Y 687, = 301.4 (a) Permisos en 1978, media Y= 687, desviación estándar S = 301.4 Figura lO.31a 1977 y 1978 por día. Figura 1O.31a Permisos vendidos en 1977 y 1978 por dIa. parques de truchas de Missouri, una persona debe tener una licencia comprar Para pescar en los parques de truchas de Missouri, una persona debe tener una licencia yycomprar un permiso diario de pesca de trucha por $1.50. Este permiso concede al pescador un limite de 5 truchas pesca por permiso concede al pescador un límite de 5 truchas por dIa. Cada uno de los cuatro parques de truchas de Missouri tiene un administrador responsable de truchas de Missouri tiene un administrador responsable día. pronosticar las ventas de permisos de manera que puedan liberarse un número adecuado de truchas. puedan liberarse un nümero adecuado de truchas. manera aclimatar éstas la corriente y al shock del manejo transportación, las truchas se liberan la noche Para aclimatar éstas aaIa corriente y al shock del manejo y transportación, las truchas se liberan la noche anterior a! siguiente día del periodo de pesca. La política del Departamento de Conservación consiste dIa del periodo de pesca. La polItica del Departamento de Conservación al en liberar, en promedio, 2.25 peces por cada permiso vendido. Además, al liberar los peces solo se tiene peces por cada permiso vendido. Además, al liberar los peces sólo se tiene el pronóstico calidad de la pesca en disponible el pronOstico del número de permisos vendidos. En consecuencia, la calidad de Ia pesca en nuimero de permisos vendidos. En cualquier dIa depende de Ia precisión del pronóstico. Si no se liberan suficientes peces, declina la calidad cualquier día depende de la precision suficientes peces, declina la calidad y cantidad de Ia pesca. Aunque una declinaciOndel número de pescadores pudiera no ser un problema la declinación del nümero de pescadores pudiera no ser un problema serio, los ingresos del criadero y la economia local dependen mucho del comercio con pescadores y ingresos del criadero la economía local seno, turistas. En contraste, si se liberan demasiados peces, los costos por funcionamiento se harán excesivos. se liberan demasiados peces, los costos por funcionamiento se harán excesivos. La yenta de permisos vendidos del día se conoce antes de liberar las truchas por la tarde. El venta permisos vendidos del dIa se conoce antes de liberar las truchas por la tarde. El administrador del criadero emplea esta informaciOn para hacer el pronOstico de un dIa a futuro. Como del criadero emplea esta información hacer el pronóstico día Como Este caso es una contribución de Stephen A. De Lurgio, University of Missouri, Kansas City. contribución Lurgio, University Este A. Missouri, Kansas City. ofthe American Institute for Decision Sciences Conference 1980, Methodology", Proceedings of the American lnstilutefor Decision Sciences Conference -1980, Las Vegas, Nev., Vegas, Nev., pp. 237-239. 6 Stephen De Lurgio, "Forecasting Daily Demand at 6 Stephen A. De Lurgio, "Forecasting Daily Demand at a State Trout Park Using ARIMA/Box-Jenkins a State Trout Park Using ARIMAJBoxJenkins 496 La metodología Box-Jenkins (ARIMA) La metodologla Capítulo 10 CapItuto I I I A V 1 I I 'V. I I I I I I I I I I 10 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220 230 240 100 110 120 130 140 150 160 170 180 190 200 210 220 230 240 (b) Permisos en 1977 (b) Pennisos Figura 1O.31b Figura IO.3Ib Permisos vendidos en 1977 1978 Permisos vendidos en 1977 y 1978 por dIa. día. la venta de los pernmisos es estacional con respecto tanto al día de la semana pudiera esperarse, la yenta de los pernrnisos es estacional con respecto tanto al dIa de la semana como al mes del año. Las figuras 10.31(a) y (b) ilustran la demanda de pemlisos en 1977 y 1978. Observe 1977 Observe corno a! mes del año. Las figuras Ia demanda permisos el alto grado de asociación entre las dos series. Mediante el uso de estos datos, se desarrolla un modelo Mediante de se desarrolla un modelo de pronóstico. IDENTIFICACION DEL MODELO IDENTIFICACIÓN MODELO Las graficas de las figs. 10.3 1(a) y (b) revelan una estacionalidad diaria lo mismo que una anual [p. ej., gráficas 1O.31(a) y (b) revelan una estacionalidad diana [p. las ventas para un día dado de la semana, periodo t, está altamente correlacionado con el del mismo día (no dia t, está altamente correlacionado con del mismo dia (no fecha) del año anterior, es decir tt -- 364]. Esta alta correlación entre semana y semana y entre un aflo 364]. Esta alta correlación entre semana y semana y entre un año y otro sugiere tres posibles enfoques a! modelo de la serie: 1) modelos con parámetros estacionales al serie: 1) modelos con parámetros estacionales diferenciación de 7 días Indices diferenciación anual semanales (v. gr., diferenciación de 7 dIas o índices estacionales), 2) aquéllos con diferenciación anual y parámetros(p. ej., di ferenciación de 364 dIas o parámetros) y, (3) alguna combinación de los dos anteriores. parámetros (p. ej., diferenciación de 364 días parámetros) combinación dos anteriores. Para modelar estocástico de histórica, necesario tener una serie estacionaria Para modelar el proceso estocástico de una serie histórica, es necesario tener una serie estacionaria en nivel y varianza. Lo estacionario en el nivel se logra a través de diferenciación y lo estacionario en nivel lo en ,:,arianza a través del uso de trasformación de potencias (p. ej., logaritmos y exponenciación). Las la varianza a través del uso de trasformación de potencias (p. ej., logaritmos y exponenciación). Las figs. ilustran venta de permisos en figs. 10.32(a) y (b) ilustran los valores de autocorrelación y los patrones para la yenta de permisos en 1978. Como se estacionalidad pronunciada de 7 dIas; de hecho, 1978. Como se puede apreciar, la serie tiene una estacionalidad pronunciada de 7 días; de hecho, la apreciar, Ia sene estacionaria con respecto a los retrasos de 7 días. ahí diferencia serie no es estacionaria con respecto a los retrasos de 7 dIas. De ahI que sea necesaria una diferencia de dIas para lograr una serie estacionaria. Aunque no se ilustra aqul, las autocorrelaciones en los retrasos 364 7 días para lograr una serie estacionaria. Aunque no se ilustra aquí, las autocorrelaciones en los retrasos 364 y 728 confirman que la serie no es estacionaria con respecto a los retrasos de 364 días. Por lo tanto, respecto retrasos de dIas. Por lo tanto, días la alternativa serie estacionaria. Ya que con tomar una diferencia de 364 dIas es Ia alternativa para lograr una serie estacionaria. Ya que con tomar o de 364 días se logra una serie estacionaria, no es necesario una diferenciación ya sea de 7 o de 364 dIas se logra una serie estacionaria, no es necesario tomar ambas. Es decir, existen dos enfoques alternativos para modelar la serie: modelar el ambas. Es enfoques alternativos para modelar la serie: modelar comportarniento estocástico utilizando una diferenciación de dlas, o modelar con comportamientoestocástico utilizando una diferenciación de 77 días,o modelar con una diferenciación no anlbas. anual, pero no ambas. Debido a que la serie diferenciada de forma anual alToja el mejor modelo, sólo se desarrollarán forma anual arroja modelo, solo aquí modelos con diferenciación bastante evidente aqul los modelos con diferenciaciOn anual. La efectividad de la diferenciación anual es bastante evidente diferenciación en la asociación de las gráficas (a) y (b) de la fig. 10.31. Esta asociación se confirma por el alto coeficiente Ia asociaciOn de las gráficas (a) y (b) de la fig. 10.31 . Esta asociación se confirma por el alto coeficiente Z. de determinaciOn (R2) de Z. determinación (R 2) zt= y, - Y,-364 z, = Y1_Y,364 Capítulo 10 CapItulo 10 Caso de estudlo 10.5 estudio 10.5 AUTOCORRELATION FUNCTION AUTOCORRELATION FUNCTION DATA - BENNET SPRINGS DAILY DATA 1978 1978 - BENNET SPRINGS DAILY DIFFERENCING -- ORIGINAL SERIES IS YOUR DATA. IS YOUR DATA. DIFFERENCING BELOW ARE OF ORDER 1 DIFFERENCES BELOW ARE OF ORDER 1 SERIES ORIGINAL SERIES OF THE SERIES =0.63993E+03 MEAN OF THE SERIES =0.63993E+03 STo DEV. OF SERIES =0.30138E+03 ST. DEV. OF OBSERVATIONS = NUMBER OF OBSERVATIONS = 245 1- 7 0.06 -0.04 -0.05 0.01 0.43 0.76 17 0.56 ST.E. 0.08 0.08 0.06 0.08 0.08 0.08 0.09 8- 14 0.01 -0.05 -0.04 0.42 80.03 0.40 0.70 ST.E. 0.11 0.12 0.12 0.12 0.12 0.13 0.12 15- 21 0.38 0.00 -0.05 -0.04 0.01 0.36 0.64 15- 21 -0.04 ST.E. 0.14 0.14 0.14 0.14 0.15 ST.E. 0.14 0.14 22- 28 -0.05 0.31 0.60 22- 28 0.33 -0.04 -0.10 -o .10 -0.10 ST.E. 0.16 0.16 0.16 0.16 0.16 ST.E. 0.16 0.16 29- 35 0.29 -0.08 -0.13 -o .12 -0.07 29- 35 -0.12 0.27 0.56 ST.E. 0.18 0.18 ST.E. 0.17 0.18 0.18 0.18 0.18 36- 42 0.26 -0.10 -0.16 -o .16 -0.12 0.19 0.46 -o .12 -0.16 36- 42 ST.E. 0.19 0.19 0.19 0.19 ST.E. 0.19 0.19 0.19 0.19 43- 49 0.19 -0.12 -0.17 -o .16 -0.11 -0.17 43- 49 -0.16 0.43 0.18 ST.E. 0.19 0.19 0.19 0.20 0.20 0.20 0.20 ST.E. 0.20 0.19 0.18 50 0.20 ST.E. BY STo ERROR = 0.33235E+02 MEAN DIVIDED BY ST. ERROR = O.33235E+02 THIS SERIES IS WHITE NOISE. THE VALUE TO TEST WHETHER THIS SERIES IS WHITE NOISE, THE VALUE SHOULD BE COMPARED WITH A CHI-SQUARE VARIABLE 0.10935E+04 SHOULD BE COMPARED WITH A CHI-SQUARE VARIABLE OF FREEDOM WITH 50 DEGREES OF FREEDOM 497 0.08 0.70 0.11 0.13 0.38 0.16 0.16 0.29 0.19 0.19 1 DIFFERENCE 1 MEAN OF THE SERIES = -. 96311E+00 OF THE SERIES = -.96311E+OO STo DEV. SERIES ST. 0EV. OF SERIES =0.28340E+03 = 244 NUMBER OF OBSERVATIONS = 1- 7 7 0.07 -0.45 -o .10 -0.09 -0.04 0.09 0.77 1-0.10 -0.09 ST.E. 0.06 0.06 0.08 0.08 0.06 0.09 0.08 0.09 0.06 8- 14 8-0.08 -0.35 0.08 0.70 0.07 -0.38 -0.07 -0.08 ST.E. 0.11 0.12 0.11 0.12 0.12 0.12 0.12 0.12 15 - 21 -0.06 15- 21 0.06 -0.36 -0.06 -0.06 -0.33 0.68 0.07 ST.E. 0.14 0.14 0.14 0.14 0.14 0.14 0.14 0.14 0.14 22- 28 22- 28 0.06 -0.34 -0.07 -0.06 -0.37 -0.37 0.69 0.08 0.69 ST.E. 0.16 0.16 0.16 0.16 0.16 0.16 0.16 0.16 29- 35 29- 35 0.06 -0.34 -0.07 -0.05 -0.34 0.06 0.67 ST.E. 0.18 0.18 0.18 0.18 0.18 0.18 0.18 0.18 36- 42 -0.07 -0.05 -0.31 0.04 0.61 36- 42 0.07 -0.33 ST.E. 0.19 0.19 0.19 0.19 0.20 0.20 0.19 0.19 0.20 43- 49 430.06 -0.29 -0.07 -0.04 -0.29 0.05 0.57 ST.E. ST.E. 0.20 0.20 0.20 0.20 0.21 0.20 0.20 0.20 0.21 50 0.06 ST.E. 0.21 ST.E. 0.21 MEAN DIVIDED BY ST. ERROR = 0.53086E-01 BY STo ERROR = 0.53086E-01 THIS SERIES IS WHITE NOISE, THE VALUE TO TEST WHETHER THIS SERIES IS WHITE NOISE. THE VALUE 0.12280E+04 SHOULD BE COMPARED WITH A CHI-SQUARE VARIABLE A CHI-SQUARE VARIABLE 0.12280E+04 WITH 50 DEGREES OF FREEDOM DEGREES OF FREEDOM Figura 10.32(a) Valores serie original. Figura 10.32(a) Valores de autocorrelación de la serie original. BENNET SPRINGS DAILY DATA 1978 DATA 1978 GRAPH OF OBSERVED SERIES ACF SERIES GRAPH INTERVAL IS O.2000E-01 INTERVAL IS O.2000E-01 -.1000E+01 -. 1000E+O1 0.0 O.lOOOE+Ol 0.0 0.1000E+O1 +++++++++ +++++++++ . +++++++++ +++++++++ +++++++++ +++++++++ . +++++++++ . +++++++++ +++++++++.+++++++++.+++++++++.+++++++++.+++++++++ +++++++++.+++++++++.+++++++++.+++++++++.+++++++++. X X 1 VALUES ~ (O (lO XXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXX XXXX X X X X 0.55776E+00 0. 55776E+0O 0.555l7E-Ol 0.55517E-01 -.430l5E-Ol -. 43015E-01 -.53520E-Ol -. 53520E-01 0.13397E-Ol 0.13397E-01 0.42625E+00 0. 42625E+00 0.76323E+00 0. 76323E+00 0.4l800E+00 0. 41800E+00 0.14226E-Ol 0.14226E-01 -. 45636E-01 -.45636E-Ol -.38520E+00 -. 38520E+00 0.26532E-Ol 0.26532E-01 0.39999E+00 0. 39999E+00 0.69986E+00 0. 6998 6E+0 0 0.37890E+00 0. 37 890E+00 0.34458E-02 -.48895E-Ol -. 48895E-01 -.42508E-Ol -. 42508E-01 0.13563E-Ol 0.13563E-01 0.359l8E+00 0. 35918E+00 0.64356E+00 0. 6435 6E+00 0.32620E+00 2 3 4 5 6 7 XXX X X XXXX X X X X XX 8 9 10 10 11 12 12 X X XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX X X XXXXXXXXXXXXXXXXXXXX X X XX X X XXX X X XXX XXX X X XXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXX 13 14 XXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXX X X X X XX r Q) ro XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX 15 15 X X X X X X X X XXX XXX X X XXX X X XXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXX 16 17 17 O" ce 3 6" Q. o 03' Ol 18 18 19 19 20 21 22 23 24 25 26 27 28 X X XXXXXXXXXXXXXXXXXXX X X XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX X X XXXXXXXXXXXXXXX X X XXX X X XXXXXX XXXXXX X X XXXXXX XXXXXX X X XXXX XXXX X X XXXXXXXXXXXXXXX X X XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XX ::J ro o >< L CJ) S' '" -. 37652E-01 -.37652E-Ol -.99340E-Ol -. 99340E-01 -.97673E-Ol -. 97673E-01 -.53649E-Ol -. 53649E-01 » ;O ~ ~ () C) Q) 0.31171E+00 0.3ll71E+00 0.60l99E+00 0. 60199E+00 '"O Figura lO.32(b) Patrones original. Figura 10.32(b) Patrones de autocorrelación de la serie original. autocorrelación O" 0 ...... e: C o Capítulo 10 Cap Itulo Caso de estudio 499 la desviación La desviación estándarde las ventas diarias de permisos para 1978 es 301.4, mientras que la desviación estándr de las ventas diarias de petmisos para 1978 es 301.4, mientras estándar de la serie diferenciada anualmente Z. es 116.7. Por 10 tanto, el coeficiente de detetminación es Zt es 116.7. Por lo tanto, el coeficiente de determmación es R2 = 1 R2 = 1 (Y t y t _ 364 )2/(n 1) (Y,- - Y,64)2/(n -- 1) (Y,- - Y)2/(n - 1) (Y t YY/(n - 1) = 1 =1 - 852 85 2 = 92% 301.4 2 = 92% 301.42 Al desarrollar modelos potenciales, resultó evidente que por lo menos habia dos diferentes series 10 había series resultó evidente reporesentadas por la estación de 245 días. 10.33 la anuales (Zt). reporesentadas por Ia estación de 245 dias. La fig. 10.33 ilustra Ia gráfica de las diferencias anuales (Zr). Como ahj se muestra, Ia demanda durante los primeros 60 dIas del año es mucho más variable que más ahí la días avanzado el año. Esta gran variabilidad es, en parte, el resultado de una más alta variabilidad el clima resultado abril. que la lluvia y en los meses de marzo y abril. Las temperaturas son menores y más variables, mientras que la liuvia y la nieve son mayores durante este periodo. Además, en la primavera, acuden relativamente más nieve son mayores durante este periodo. Además, en la primavera, acuden relativamente pescadores vecinos al parque estatal, mientras que en el verano hay más pescadores que son turistas de el verano hay más pescadores que son turistas de número ciudades y estados cercanos. El nñmero de observaciones extremas durante marzo y abril confunde la extremas durante marzo y abril confunde modelo; consecuencia, se decidió estudiar dos modelos, uno para los 60 dIas de identificación del modelo; en consecuencia, se decidió estudiar dos modelos, uno para los 60 días de continuación verano. los 185 días primavera y otro para los 185 dIas del verano. A continuación se expondrá el modelo de verano. El abordará brevemente modelo para primavera se abordará brevernente más adelante. La fig. 10.34 muestra las funciones de autocorrelación (FAC) y de autocorrelación parcial (FACP) autocorrelación parcial (FACP) forma los meses de verano. Como ahí se muestra, el patrón de para la serie dieferenciada en forma anual de los meses de verano. Como ahi se muestra, el patron de autocorre!ación confirma que la serie es estacionaria con respecto al nivel (p. ej., las FAC descienden serie estacionaria con respecto al nivel (p. ej., las FAC descienden autocorrelación rápidamente). 1 rápidarnente). La declinación exponencial de las autocorrelaciones en los retrasos 1 y 5 es indicativa de un proceso autorregresivo de primer orden. Para confirniar esta identificación, considere los patrones orden. confim1ar los patrones de las FACP que aparecen en la fig. 10.35. Las FACP de un modelo autorregresivo de primer orden que aparecen en la fig. 10.35. Las FACP de un modelo autorregresivo de primer orden deberían deberian tener un solo pico en el retraso 1. La fig. 10.35 no muestra este pico en el retraso1. Ninguno el retraso 1. La fig. 10.35 no muestra este pico en el retrasol. Ninguno 10 tanto, esta identificación de los otros retrasos tiene una FACP estadisticamente significativa. Por lo tanto, esta identificación otros retrasos tiene una FACP estadísticamente significativa. parece ser correcta. estacionaria la serie original. Si la Para lograr una serie estacionaria se obtuvo una diferenciación anual de la serie original. Si la media de estas diferencias (Z,) es estadísticamente diferente de cero, entonces la serie ha experimentado (Zt) estadisticarnente experimentado estadIsticamente la serie diferenciada una tendencia; en contraste, si Ia media de Ia serie diferenciada no es estadísticamente diferente de cero, contraste, si la la ha experimentado un giro estacional. Se realiza una prueba de significación estadIstica entonces Ia serie ha experimentado un giro estacional. Se realiza una prueba de significación estadística sobre serie diferenciada en forma anual. Como muestra fig. 10.34, la media de la serie sobre la serie diferenciada en forma anual. Como se muestra en la fig. 10.34, la media de la Serie diferenciada anualmente (Zt) es 47.246 con una desviación estándar de 84.7. Esta media está a 7.54 diferenciada anualmente (Z,) es 47.246 con una desviación estándar de 84.7. Esta media está enores estándar de una media de errores estándar de una media de cero sin tendencia. sin 47.24 .0 z- 47.24 -- .0 Z= 84.7 \/183 VT83 = 7.54 = 7.54 En consecuencia, el modelo tentativo que se ha identificado es un modelo autorregresivo de consecuencia, modelo tentativo que ha identificado es un modelo autorregresivo de primer orden para una serie diferenciada anualmente que parece poseer una tendencia: primer para una serie diferenciada anualmente que parece poseer una tendencia: + + = Zt = eP¡Zt __ 1 + ePa + E t Yl - Yt- 364 Yt - Yt_364 = eP/ Yt-¡ - Y365) + ePa + Et - Yt- 365 ) + + U'I o o Diferenciación anual Yt - 1't-244 Yt -244 r Q) ro 3 (Q 6" 6" c. o ro I o x L ro ::) Di' J I I I I I I I I I I I 10 10 20 30 40 50 60 70 80 90 100 110 60 120 110 130 140 150 90 160 170 180 190 200 200 210 220 230 S· 7' Figura 10.33 Datos diferenciados anualmente (Zt = Y,_364), Media Z = 47, Desviación estándar S = 85. 10.33 anualmente (Zt = Yt-364), Media Z 47, Desviación estndar S = 85. » ;;O en ~ ~ () C) Q) "O ~ 0 6" ...... o C AUTOCORRELATION FUNCTION DATA - BENNET SPRINGS YEARLY DIFFERENCED DATA BENNET DIFFERENCING SERIES IS YOUR DATA DIFFERENCING - ORIGINAL SERIES IS YOUR DATA DIFFERENCES BELOW ARE OF ORDER BELOW ARE OF ORDER - 183 OBSERVATIONS 153 ORIGINAL SERIES SERIES OF THE SERIES =0.47246E+02 MEAN OF THE SERIES =0.472465+02 ST. DEV. OF SERIES =O.84706E+02 =0.84706E+02 ST. DEV. 1B3 NUMBER OF OBSERVATIONS = 183 7 0.49 0.17 17 0.49 0.22 0.16 0.12 0.17 10.16 0.12 ST.E. 0.09 STE. 0.47 0.09 0.10 0.09 0.10 0.10 0.10 8- 14 0.11 0.10 0.04 O. 12 0.19 B- 14 0.15 0.12 0.17 0.10 0.04 ST.E. 0.10 0.10 0.10 STE. 0.10 0.10 0.10 0.10 0.10 15- 21 0.06 -0.04 -0.04 -0.05 -0.02 -0.04 15- 21 0.13 STE. ST.E. 0.11 0.11 0.11 O. 11 0.11 0.11 0.11 0.11 0.11 22- 28 22- 2B 0.02 0.08 0.15 -0.03 -0.02 -0.01 O.OB 0.11 0.15 ST.E. 0.11 0.11 0.11 O. 11 O. 11 STE. 0.11 0.11 0.11 0.11 29- 35 0.05 -0.04 -0.10 -0.10 -0.09 0.00 0.01 29- 35 0.00 ST.E. 0.11 0.11 0.11 0.11 0.11 O. 11 STE. 0.11 0.11 0.11 -0.10 -0.06 -0.07 -0.09 -0.05 0.01 3636- 42 0.02 -0.09 ST.E. 0.11 0.11 0.11 O. 11 0.11 O. 11 ST.E. 0.11 0.11 0.11 43- 49 -0.02 43- 49 -0.10 -0.17 -0.11 -0.10 -0.05 -0.11 0.10 0.12 STE. ST.E. 0.11 0.11 0.11 0.12 0.12 0.11 0.12 0.11 50 0.10 ST.E. 0.12 0.12 DIVIDED BY ST. ERROR = 0.75453E+01 MEAN DIVIDED BY ST. ERROR = O.75453E+O1 TO TEST WHETHER THIS SERIES IS WHITE NOISE THE VALUE O.13752E+O3 SERIES IS WHITE NOISE 0.13752E+03 TO SHOULD BE COMPARED WITH A CHI-SQUARE VARIABLE WITH 50 DEGREES OF FREEDOM A CHI-SQUARE VARIABLE 50 DEGREES OF - () C) Q) 'U 0.17 0 5" O C ~ ...... () O en Q) o' a. ro ro ~ e a. 0.12 1 2 3 GRAPH OF OBSERVED SERIES ACF SERIES INTERVAL IS 0.2000E GRAPH INTERVAL IS O.2000E - 01 O.1000E*O1 -.lOOOE+Ol 0.0 0.1000E*01 VALUES -. 10005+01 +++++++++ +++++++++ +++++++++ +++++++-+-+ +++++++++ +++++++++ +++++++++ +++++++++ +++++++++ +++++++++. +++++++++.+++++++++.+++++++++.+++++++++.+++++++++.+++++++++.+++++++++.+++++++++.+++++++++.+++++++++. X x 0.49088E+00 0 . 490B8E+O0 XXXXXXXXXXXXXXXXXXXXXXXXXX X x XXXXXXXXXXXX X x 0.21950E+00 O.2195OE+OO 0.16585E+00 O.16585E+OO 0.16362E+00 O.16362E+O0 0.12050E+00 O.12050E+OO 0.167335+00 0.16733E+00 XXXXXXXXX XXXXXXXXX x X 4 5 6 7 XXXXXXXXX XXXXXXXXX X x XXXXXXX X x X x XXXXXXXXX XXXXXXXXX XXXXXXXXX x X B 9 0.15930E+00 O.1593OE+OO 0.14695E+00 O.14695E+OO XXXXXXXXX XXXXXXXXX X x XXXXXXX X x X x X X X o .11335E+00 O.11335E+OO 0.10092E+00 O.10092E+OO O.4O855E-01 O.40855E-Ol 10 11 12 32 13 13 14 15 15 16 XXXXXX XXX XXXXXXX XXXXXXXXXX X X X X 0.11918E+00 O.11918E+OO 0.18523E+00 O.18523E+OO O.17087E+OO 0.17087E+00 XXXXXXXXXX XXXXXXX X X 0.12816E+00 0.128165+00 0.64959E-00 0.64959E-OO XXXX .. O CJ1 Figura 10.34 Función autocorrelación de anualmente, Figura 10.34 Función de autocorrelación de la serie diferenciada anualmente, meses de verano. PARTIAL AUTOCORRELATIONS PARTIAL AUTOCORRELATIONS SPRINGS YEARLY DIFFERENCED DATA DATA - BENNET SPRINGS YEARLY DIFFERENCED DATA - ORIGINAL SERIES IS YOUR DATA. DIFFERENCING - ORIGINAL SERIES IS YOUR DATA. DIFFERENCES BELOW ARE OF ORDER DIFFERENCES - 183 OBSERVATIONS 183 1 ORIGINAL SERIES SERIES MEAN OF THE SERIES =O.47246E+O2 SERIES =0.47246E+02 STo DEV. OF SERIES =0.84706E+02 ST. 0EV. OF SERIES =O.84706E+02 = 183 NUMBER OF OBSERVATIONS = 1B3 1- 7 7 0.49 -0.03 0.09 18- 14 0.05 0.00 0.02 B- 14 15- 21 0.02 -0.06 -0.11 15- 21 22- 2B -0.02 0.02 0.02 22- 28 29- 35 -0.01 -0.08 -0.07 29- 35 36- 42 -0.13 0.06 -0.07 36- 42 43- 49 -0.10 -0.06 0.12 43- 49 50 50 0.03 U'I O N 0.07 -0.05 -0.05 0.05 -0.04 -0.05 -0.91 0.01 0.12 -0.04 0.09 -0.05 0.00 0.05 0.12 0.02 0.08 0.03 0.02 0.03 -0.01 -0.04 0.11 -0.01 0.08 -0.04 COB -0.03 0.00 0.02 O.1B 0.05 0.18 0.01 0.02 BENNET SPRINGS YEARLY DIFFERENCED DATA DIFFERENCED DATA SERIES PACF GRAPH OF OBSERVED SERIES PACF GRAPH INTERVAL IS O.2000E-01 IS 0.2000E-01 -.1000E+01 -. 1000E+O1 +++++++++ +++++++++ +++-1-+++++ +++++++++ 1 0.0 +++++++++ +++++++++ +++++++++ XXXXXXXXXXXXXXXXXXXXXXXXXX 0.1000E+01 O.1000E+O1 VALUES 0.49088E+00 0. 49O88E+OO -.28271E-01 -. 28271E-01 0.90889E-01 0.908B9E-01 O.67994E-01 0.67994E-01 O.56142E-02 0.56142E-02 O . 12271E+00 0.12271E+O0 2 3 4 4 5 6 7 8 9 10 10 11 12 13 14 15 16 17 18 19 20 20 X X XXXXXX X X XXXX X X X X X X XXXXXXX X X XX X X XXX X X X X X X XX X X XXXX X X XXXXXXX X X XXXXX X X XX X X XX X X XXXX X X XXXXXX X X XXXX XXXX X X XXX X X XXX X X X X xx XX X X r al 0.22506E-01 O.22506E-01 0.49187E-01 3 8' c.. o ro (Q 0.41294E-02 0.41294E-02 O.17691E-Ol O.17691E-01 -. 51217E-01 -.51217E-Ol o ñ)' o X ro O.12201E+OO O.83580E-01 0.25146E-01 O.25146E-01 0.15836E-01 O.15836E-01 -. 60585E-01 -.60585E-01 L ro ::J 7' rn ~ S' -.10534E+OO -. 10534E+00 -. 53679E-01 -.53679E-01 ~ ~ al ::u -.41861E-01 -. 41861E-01 -.79435E-02 -. 79435E-O2 -.43159E-01 -. 43159E-01 () C.) "2, 21 21 X X 0 o ...... o e Figura 10.35 Autocorrelaciones parciales de los datos diferenciados anualmente. 10.35 Autocorrelaciones parciales de los anualmente. Capítulo 10 Cap Itulo 10 Caso de estudio 503 en donde 01 = el parámetro autorregresivo de primer orden t/J¡ el Oo t/Jo = un parámetro de tendencia del = el error en el ajuste del modelo El E STIMACION ESTIMACIÓN Pack 7, estirnaron las estadIsticas y el de la Mediante los programas Pack7, se estimaron las estadísticas y el intervalo de confianza del 95% de la tabla 10.11. 1) aquí El modelo estimado (de aqul en adelante denominado modelo 1) es Y YI -- Y I - 364 = = .4969(Y1_1 - Y_365)+ 49.7 + .4969(YI _ YI - 365 ) + 49.7 J El Si se escribe este modelo en forma de pronóstico es atrayente y perspicaz. =Y Y = y, I I - 364 364 + .4969(YI _ .4969(Y J - Y_365) + 49.7 YI - 365 ) La demanda pronosticada en el periodo tt es igual a la demanda del mismo dIa del año anterior más .4969 anterior más .4969 demanda pronosticada en el periodo es igual a demanda del mismo día veces el cambio anual en la dernanda experimentado en el periodo t t- - 1 más un incremento anual veces el cambio anual en la demanda experimentado en el periodo I más un incremento anual (tendencia) de 49.7. Este resultado parece muy lógico considerando el tipo de estacionalidad de Ia serie. parece considerando el tipo de estacionalidad de la serie. TABLA 10.11 TABLA 10.11 ESTADíSTICAS Y PARAMETROS DEL MODELO 1 1 ESTADISTICAS PARÁMETROS NIVEL NIVEL DE CONFIANZA DE 95% CONFIANZA PARÁMETRO PARAMETRO VALOR .4969 49.7 E, LIMITE INFERIOR .3666 26.41 LIMITE SUPERIOR .6272 70.17 ePI <Po to ElTOr estándar de los residuos los residuos Error Nárnero de residuos = 182 Número 182 = 74.22 74.22 DIAGNOSTICO DIAGNÓSTICO El procedimiento de modelado Box-Jenkins ARIMA es iterativo. Después de identificar y estimar un El procedimiento de modelado BoxJenkins ARIMA es iterativo. estimar un analista está obligado a diagnosticar el modelo usando pruebas estadísticas bien definidas. modelo, el analista está obligado a diagnosticar el modelo usando pruebas estadIsticas bien definidas. Estas pruebas incluyen I) una prueba estadistica de los parárnetros del modelo, 2) el análisis de las FAC 1) una prueba estadística de los parámetros del modelo, 2) el análisis de las FAC y FACP de los residuos, 3) una prueba de la bondad del ajuste de ji cuadrada sobre los coeficientes de de Ia bondad del ajuste deji de autocorrelación y, 4) un análisis de Ia gráfica de los resultados para mayor confirmación de la la autocorrelación y, 4) un análisis de la gráfica de los resultados para mayor confirmación aleatoriedad y lo estacionario en nivel y varianza. Si cualquiera de estas pruebas indica un modelo estacionario nivel varianza. cualquiera aleatoriedad inadecuado, entonces se identifica un nuevo modelo, se estima y se diagnostica. Hagamos estas pruebas identifica Hagamos estas pruebas sobre el modelo 1. modelo 1. 7 David J. Pack, A computer Program for the Analysis of Time Series Models Using lhe Box-Jenkins Philosophy 1. Pack, A compuler Program for lhe Analysis of l'in,e Series Models Using the BoxJenkins Pa: Automatic Forecasting Systems, 1978). (Hatboro, Pa: Automatic Forecasting Systems, 1978). 504 La metodología Box-Jenkins (ARIMA) La metodologla Capítulo 10 CapItulo 10 de diagnóstico Pruebas de diagnóstico Prueba estadística parámetros del sistema. Prueba estadIstica de los parámetros del sistema. Debido a que los intervalos de confianza la 10.11 no incluyen al cero, ambos parámetros de este modelo son estadísticamente de 95% de la tabla 10.11 no incluyen al cero, ambos parámetros de este modelo son estadIsticamente diferentes de cero. En consecuencia, el modelo parece ser adecuado con respecto a los parámetros consecuencia, modelo ser adecuado respecto a los parámetros diferentes individuales. Las FAC y FACP de los residuos. Las FAC de los residuos del modelo están dadas en la fig. y FAC 10.36. Como se puede ver, las FAC en los retrasos inferiores y superiores son todas insignificantes Como 10.36. en los retrasos inferiores y superiores son todas insignificantes no ser en forma significativa estadísticamente diferentes de estadísticamente. estadIsticamente. (p. ej., han demostrado no ser en forma significativa estadIsticamente diferentes de hay FAC que sean mayores a errores estándar del cero. De ahí la serie parece no tener cero). No hay FAC que sean mayores a dos errores estándar del cero. De ahi que la serie parece no tener no se muestran, las FACP confirman esta conclusión. interferencias. Aunque no se muestran, las FACP confirman esta conclusion. Por otra parte, debe reconocerse que en una gráfica de 50 FAC de una serie sin interferencias interferencias parte, debe reconocerse que en gráfica de 50 FAC cabría FAC estuvieran a más de dos errores estándar del cero, sólo por casualidad. cabrIa esperar que algunas FAC estuvieran a más de dos errores estándar del cero, solo por casualidad. retrasos 1,2,3, 7 o 14, uno podría preocuparse debido Para esta serie, si se presentara un solo pico en los retrasosl, 2, 3, 7 o 14, uno podrIa preocuparse debido a sería indicación de que interferencia a que seria una indicaciOn de que los residuos pudieran no estar libres de mterferencia y que por ello el inadecuado. obstante, si se presentaran algunos picos en otros retrasos, podría modelo resultara inadecuado. No obstante, si se presentaran algunos picos en otros retrasos, podrIa inferirse que son consecuencia de un error aleatorio. La estructura del modelo y la serie nos guía en la estructura del modelo y la serie nos gula en la aleatorio. decisión si unas FAC altas son motivo de preocupación. decision de si unas FAC altas son motivo de preocupación. AUTOCORRELATION FUNCTION FUNCTION DATA - 182 OBSERVATIONS 182 - THE ESTIMATED RESIDUALS THE 1 MODEL 1 SERIES ORIGINAL SERIES MEAN OF THE SERIES =0.43597E-04 SERIES STo DEV. OF SERIES =0.73815E+02 ST. DEV. OF SERIES OF 182 NUMBER OF OBSERVATIONS = 117 7 0.02 0.07 0.05 0.08 0.05 0.08 -0.02 0.08 0.04 0.08 -o .13 -0.13 0.08 ST.E. 8- 14 0.08 8- 14 0.08 ST.E. 15 - 21 -0.05 15- 21 ST.E. 0.08 0.08 22- 28 22- 28 -0.02 ST.E. 0.08 0.08 29- 35 -0.06 29- 35 ST.E. 0.08 36- 42 -0.01 36- 42 0.08 ST.E. 43- 49 0.02 43- 49 -0.06 ST.E. 0.08 0.09 0.08 50 ST.E. 0.09 STE. DIVIDED BY STo ERROR = 0.79678E-Os MEAN DIVIDED BY ST. ERROR = 0.79678E-05 TO TEST WHETHER THIS SERIES IS WHITE NOISE. THE VALUE TO TEST WHETHER THIS SERIES IS WHITE NOISE, THE VALUE 0.30010E+02 SHOULD BE COMPARED WITH 0.30010E+02 SHOULD BE COMPARED WITH A CHI-SQUARE VARIABLE CHI-SQUARE VARIABLE WITH 43 DEGREES OF FREEDOM 43 DEGREES OF FREEDOM -0.07 0.07 0.03 0.08 0.05 0.08 -0.01 0.08 -0.03 0.08 0.01 0.08 -o .14 -0.14 0.08 0.02 0.07 0.07 0.08 0.07 -0.08 0.08 -0.05 0.08 -0.01 0.08 -0.05 0.08 -0.06 0.08 0.08 -0.07 0.09 0.09 -0.02 0.09 0.06 0.08 0.08 0.08 0.07 0.08 0.07 0.04 0.12 0.03 0.07 0.08 0.08 0.08 0.08 -0.02 -0.03 0.03 -0.05 0.05 0.08 0.08 0.08 0.08 0.03 -0.01 0.11 0.05 0.08 0.08 0.08 0.08 0.08 -0.08 -0.06 0.07-0.08 0.06 0.08 0.08 0.08 -0.03 0.05 -0.06 0.07 0.08 0.08 0.08 -0.06 0.11 0.01 0.09 0.09 0.09 0.0 0.08 0.0 0.0 0.0 0.08 0.09 Figura 10.36 Autocorrelaciones de los residuos del modelo 1. Figura 10.36 modelo l. Capítulo 10 Capitulo 10 Caso de estudio 505 Prueba de la bondad del ningún Prueba de Ia bondad del ajuste de ji cuadrada. Anteriormente se confirmó que ningün pico cuadrada. de dos errores estándar. tener varios picos individual excede del individual excede del cero más de dos errores estándar. Sin embargo, se pueden tener varios picos estadísticamente insignificantes que son, en forma individual, congruentes con la suposición de no estadisticamente insignificantes que son, en forma individual, congruentes con la suposición de no interferencia, pero que en conjunto estos picos son una fuerte indicación de un comportamiento una fuerte indicación de un comportamiento interferencia, pero que interferencia). Por fortuna, hay disponible la prueba de no aleatorio (con interferencia). Por fortuna, hay disponible la prueba de la bondad del ajuste de ji la significación de autocorrelaciones. muestra en la fig. cuadrada, para probar Ia significación de un grupo de autocorrelaciones. Como se muestra en la fig. las 30.00 a 43 grados de libertad. Este valor no es 10.36, el valor de ji cuadrada para las FAC es de 30.00 a 43 grados de libertad. Este valor no es 10.36, el valor de cuadrada estadísticamente diferente de cero en forma significativa. Esto es, el valor de ji cuadrada para 43 grados estadIsticamente Esto es, el valor deji de libertad de un modelo sin interferencia tiene una posibilidad entre el 90 Y 95% de tener un valor modelo sin interferencia tiene posibilidad entre el tener un valor y mayor o igual a 30.00; en cuarenta grados de libertad el valor de ji cuadrada tendría que exceder 51.8 ii tendrIa que 51.8 alcanzar un nivel de significación de .10. En consecuencia, la serie ha demostrado no antes de alcanzar un nivel de significación de .10. En consecuencia, La serie ha demostrado no ser significativamente diferente de una poca interferencia. Una gráfica de residuos. YaYa que no resulta reveladora para estosdatos, no se ilustra una gráfica gráfica gráfica de residuos. que no resulta reveladora para estos datos, no se de los residuos. El análisis visual de los residuos es un paso muy importante en el diagnóstico de residuos. análisis los residuos es un paso muy importante en el diagnóstico de cualquier modelo de pronóstico. La gráfica de residuos para este modelo es congruente con la hipótesis de poca interferencia. PRECISIÓN DEL PRONOSTICO PRONÓSTICO PRECISION La fuerza de los métodos de construcción ARIMA radica en su habilidad para modelar eL proceso los métodos de construcción ARlMA radica en su habilidad para modelar el proceso estocástico fundamental de la serie. Cuando este proceso estocástico permanece estable en el flituro, se estable en el futuro, pueden obtener pronósticos muy precisos. Exploremos Ia precision del modelo asI como la comparaciOn obtener pronósticos muy precisos. Exploremos la precisión del modelo así como la comparación con los de la administración. de su pronóstico con los de la administraciOn. En Ia tabla 10.12 se muestran las precisiones de pronóstico del modelo y de la administración la la administración el pronóstico futuro durante 1979. El primer pronóstico se hizo con utilizando el pronOstico de un periodo a futuro durante 1979. El primer pronOstico (mayo) se hizo con 1977-1978. La media de los residuos El los parámetros ajustados a los datos de 1977-1 978. La media de los residuos e, y el error estándar de los residuos se obtienen del pronóstico de un periodo a futuro (p. ej., el pronóstico de mayo 13, 13, los residuos se obtienen dcl pronóstico de un periodo a futuro (p. ej., pronóstico 12). Después obtener todos los datos de mayo, se revaloran los conociendo la demanda de mayo 12). Después de obtener todos los datos de mayo, se revaloran Los conociendo parámetros usando una serie diferenciada de mayo-octubre de 1978 hasta mayo de 1979. Entonces se rnayo-octubre di ferenciada TABLA 10.12 PRONOSTICO ADAPTABLE (RODANTE) PARA 1979 TABLA 10.12 PRONÓSTICO ADAPTABLE (RODANTE) PARA 1979 PARÁMETROS PARAMETROS MODELO DEL MODELO MES PRONOSTICO PRONÓSTICO DEL MODELO 1 MODELO 1 PRONOSTICO DEL PRONÓSTICO ADMINISTRADOR ADMINISTRADOR El ao a 42.6 38.9 35.7 37.5 a1 al ç El -9.3 9.8 -9.1 10.0 .5 RSE 89.9 66.8 90.3 59.4 76.6 ESR 81.8 84.2 76.0 77.0 80.0 Mayo Jw1io Junio Julio Agosto .5373 .5067 .5033 .4623 Media -20.8 -7.5 -12.7 -27.7 -17.2 506 La metodologia Box-Jenkins (ARIMA) metodología Capítulo 10 CapItuto 10 pronósticos parajunio y se repite el procedimiento. Como puede hacen pronósticos parajunio y se repite el procedimiento. Como puede verse en la tabla 10.12, el modelo en el pronóstico de cuatro meses de la temporada de 1979 fue bastante preciso; de hecho, fué preciso en el pronóstico de cuatro meses de la temporada de 1979 = lo fue (ESR = 76.6), como Jo fue en el ajuste de los datos de 1978 (ESR = 74.22). Como se muestra en la tabla 10.12, si el administrador hubiera usado el modelo 1 en vez de sus en la tabla 10.12, si el administrador hubiera usado el modelo I estimaciones subjetivas, su pronóstico habria sido un poco más preciso. Hubiera experimentado un error experimentado un error estimaciones subjetivas, su pronóstico habría sido medio cercano a cero y un menor ESR. Sin embargo, existe una pequeña diferencia entre los pronósticos ESR. Sin embargo, existe una pequena diferencia pronósticos cercano del administrador y del modelo debido a que el administrador usa los mismos datos que el modelo para administrador y del debido a que el administrador usa los mismos datos que el modelo para ilegar a su pronóstico. Esto es, compara el periodo tt-- 1 con el periodo tt -- 365 y ajusta el periodo t con periodo llegar pronóstico. Esto es, compara el periodo Y 364 para llegar al pronóstico del periodo t. Aunque las diferencias entre los pronósticos del administrador para Ilegar al pronóstico del periodo 1. Aunque las diferencias entre los pronósticos del administrador los efectuados el modelo no son grandes, la efectividad parsimonia del modelo son muy y los efectuados por el modelo no son grandes, la efectividad y parsimonia del modelo son muy evidentes. IMPLEMENTACIÓN IMPLEMENTACION El modelo 1 es muy sencillo de implementar. Los datos necesarios para pronosticar la demanda se han implementar. han obtenido rutinariamente por cinco afios anteriores a 1979. En la última parte de 1979, el administrador años anteriores a 1979. En Ia ültima parte de 1979, el administrador utilizó el pronóstico del modelo I junto con sus propias estimaciones para obtener la demanda esperada 1junto obtener demanda esperada del dIa siguiente. Aproxiniadamente cada cuatro semanas se actualizan los parámetros del modelo modelo del día siguiente. Aproximadamente cada cuatro semanas se actualizan mediante programas Pack. 10.12, Si revaloran Como se muestra en la tabla 10.12, los parámetros del modelo han variado poco. Si se revaloran sólo una vez al año, la precisión del pronóstico sólo afectaría los parámetros solo una vez al aflo, Ia precision del pronóstico sOlo se afectarIa ligeramente. CONCLUSIONES RESUMEN Y CONCLUSIONES El propósito de modelar consiste en proporcionar a un gerente operativo un modelo parsimonioso. Como proporcionar un gerente operativo un modelo parsimonioso. Como se expuso aquí, los procedimientos de BoxJenkins representan un enfoque efectivo en esta se expuso aquI, los procedimientosde Box-Jenkins si representan un enfoque efectivo en esta aplicación. A pueden mejorar la precisión con que se elaboran aplicaciOn. A través del uso del modelo, se pueden mejorar la precisiOn y facilidad con que se elaboran pronOsticos. El administrador ha encontrado que el modelo ARIMA es iti1 y fácil de implementar. los pronósticos. El administrador ha encontrado que el modelo ARlMA es útil y fácil de implementar. Que estos modelos se desempefien ligeramente mejor que un administrador experimentado es la un administrador experimentado la estos modelos se desempeñen ligeramente mejor evidencia de su efectividad en el mejoramiento de los pronósticos. Es de dudar que otros modelos de evidencia de su efectividad en el mejoramiento de los pronósticos. Es de dudar que otros modelos de pronóstico hubieran convergido tan rápido en un modelo sencillo y preciso como los procedimientos tan del ARIMA. del APÉNDICE MODELOS DE INICIO DE PRIMAVERA APENDICE - MODELOS DE INICIO DE PRIMAVERA Para esta serie y ubicaciOn geográfica, la influencia del clima en la venta de permisos fue mucho mayor ubicación geográfica, mfluencia mucho mayor yenta en la los meses verano. Con datos temperatura y en los primeros 60 a 90 dIas de Ia serie que en los meses de verano. Con datos de temperatura y primeros 60 días precipitación pluvial, se utilizaron varios métodos, incluyendo el ARIMA de variación múltiple y los precipitaciOn pluvial, se utilizaron varios métodos, incluyendo el ARIMA de variación multiple y los de regresiónn multiple, para pronosticar Ia demanda de permisos para pesca de trucha durante los meses múltiple, para pronosticar la demanda permisos para pesca de trucha durante los meses de marzo, abril y mayo. Aunque se identificaron modelos estadisticamente adecuados, sus estadisticas estadísticamente sus estadísticas de error (p. ej., precisiOn) fueron ya sea inferiores a las del adrninistrador 0, Sj fueron más precisas, eran precisión) fueron sea precisas, eran alas del administrador o, si tan complejas como para considerarlas como alternativas no deseables para el personal operativo. A la continúan estos modelos. fecha, se continñan investigando estos modelos. Versión estudiantil de Forecast Plus VersiOn estudiantil 507 PREGUNTAS l. Dadas las siguientes demandas actuales, pronostique la demanda para el periodo t, utilizando el siguientes demandas periodo t, utilizando el modelo 1. l. Yr- 1 = 700 = 700 = 670 = 670 = 732 Yr- 364 = 732 Yr - 365 2. Exponga las razones por las que los pronósticos del administrador son casi tan precisos que los del administrador son casi tan precisos que del modelo durante los meses de verano y por qué su pronóstico pudiera ser mucho más preciso durante la temporada inicial de primavera. durante 3. Escriba el modelo 1 en forma de pronóstico para pronosticar dos periodos a futuro. forma de pronóstico futuro. 4. La yenta de pernlisos es altamente estacional. Identifique tantas causas fundamentales de esta venta de permisos es altamente estacional. Identifique causas fundamentales esta estacionalidad como le sea posible. le sea posible. 5. En estos datos ¿por qué cree usted que los modelos de diferenciación anual se desempeñen mejor ,por qué cree usted que los manera significativa que modelos siete periodos (p. ej., aquéllos que modelan una de manera significativa que los modelos de siete periodos (p. ej., aquéllos que modelan una siete días)? estacionalidad de siete dias)? 6. Al calcular 20 FAC para una serie con poca interferencia, ¿cuál es la probabilidad de que una una serie con poca interferencia, cuál probabilidad de FAC estén distantes más de dos errores estándar valor hipotético de cero? o más FAC estén distantes más de dos errores estándar del valor hipotético de cero? VERSIÓN ESTUDIANTIL DE FORECAST PLUS VERSION ESTUDIANTIL DE FORECAST PLUS menú Se accesa el paquete de pronóstico seleccionando la opción 3 del menu principal. Queremos probar el programa Box-Jenkins,opción 13.La pantalla exhibe lo siguiente programa BoxJenkins, opción 13.La pantalla exhibe lo siguiente Box-Jenkins Analysis Menu 1) Identification 2) Estimation/forecasting 3) Return to Forecasting Menu Nuestra elección es 1, para identificar el modelo apropiado a probar. La pantalla muestra apropiado Nuestra elección Box-Jenkins Analysis: Identification Box-Jenkins Analysis: Identification to the original data series: Transformation to the original data series: (1= Reciprocal. 2=1/Sqrt. 3=1/4th root, (1= Reciprocal, 21/Sqrt, 31/4th root. 4=Log. 5=4th root. 6Sqrt, 7=none) 4Log, 5=4th root, 6=Sqrt. 7none) Degree of Regular Differencing: of Regular Differencing: Degree of Seasonal Differencing: of Seasonal Differencing: 7 7 o 0 o 0 508 La metodología Box-Jenkins (ARIMA) La metodologla of Seasonal Period: Length of Seasonal Period: of Autocorrelation Function: Plot of Autocorrelation Function: Autocorrelation Function: Plot of Partial Autocorrelation Function: lags to print in ACFs: Number of lags to print in ACFs: 12 y Y y Y Capítulo 10 CapItulo 10 24 Press ENTER to accept: ENTER to accept: el cap. 4 analizamos los coeficientes autocorrelación para estos datos y En el cap. 4 analizamos los coeficientes de autocorrelación para estos datos y se concluyó que había presente una ligera tendencia. Las figs. 10.37 10.38 muestran las concluyó que habla presente una ligera tendencia. Las figs. 10.37 y 10.38 muestran las autocorrelaciones y autocorrelacione¡ parciales al hacer una primera diferenciación de autocorrelaciones y las autocorrelacione parciales al hacer una primera diferenciación de (se 1 para una diferenciación regular). los datos (Se usa un 1 pam una diferenciación regular). NUMBER OF CLIENTS - BOX-JENKINS ANALYSIS: IDENTIFICATION - BOX-JENKINS ANALYSIS: IDENTIFICATION AUTOCORRELATION FUNCTION AUTOCORRELATION FUNCTION 98 Observations in the Working Series 98 in the Working Series Mean of the Working Series = .088667 of the Working Series = .088667 of the Working Series Standard Deviation of the Working Series = 26.69835 26.69835 Degree of Regular Differencing = 1 Differencing = 1 Lag 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 11 12 13 14 15 15 16 17 17 18 18 Value -0.31 -0 31 -0.08 -0 08 -0.09 0.18 -0.04 -O .14 -0.14 0.04 0.11 0 11 -0.11 -0.08 0.01 0.16 0.08 -O 11 -0 .11 -O .15 15 0.16 0 16 0.08 0 08 -O .17 -0.17 -0.05 0.06 0 15 0.15 -0.26 -0.26 -0.02 0.31 T-Value -3.04 -3 04 -0 74 -0.74 -0.86 1. 57 1.57 -0.38 -1.24 0.34 0.92 0 92 -0.96 -0.70 0.06 1. 30 1.30 0.66 -0.93 -0 93 -1.23 1 1. 30 0.65 0 65 -1.37 -0.41 0.45 1. 14 1 14 -1.95 -O .14 -0.14 2.25 -1.0 .-- - - T-Value - - - - - - - - - - - - -- - - - - - - 0.0 - - - - -1.0 - +1.0 --_o - - - - - - -- -- - - -- *** [.***. ***[****: ] **.. [ ** [ **:. ** [ [ [ · **** [ *: *. [ [ ****: [ **** . [ ·* [ ·.*** *** ***: [ *** . [ 1 ] ] ] ] 19 19 20 21 22 23 23 24 ] ] ] ] **:. ** [ -0.70 ] [ ] [ ·**** ] [ ] ·** ***. [ *** . ] ****. [ -1 *23 ** * . ] [ ·**** ] [ I [ ] ·** ****: [ **** . ] [ * . [ ] [ [ [ [ : [ [ [ [ .**** [ ·* •**•* [******: [******: [ [ [ [ [ ] ] ] ] :******]* 2.25 :---------------------------------------------------: [ ] = Estimated Two-Standard Error Limits Error Limits Box-Pierce Chi-Square Statistic with 24 Degrees of Freedom = 50.5 Box-Pierce Chi-Square Statistic with 24 Degrees of Freedom = 50.5 Probabili ty - .001 Probability - .001 Figura 10.37 autocorre1ación la diferenciación Figura 10.37 Coeficientes de autocorrelación de Ia primera diferenciación del nümero de clientes, para el caso de estudio 10.3. número clientes, para el caso de estudio 10.3. Versión estudiantil Plus VersiOn estudiantil de Forecast PIus 509 NUMBER OF CLIENTS - BOX-JENKINS ANALYSIS: IDENTIFICATION OF - BOX-JENKINS ANALYSIS: IDENTIFICATION FUNCTION PARTIAL AUTOCORRELATION FUNCTION 98 Observations in the 98 Observations in the Working Series Mean of the Working Series = .088667 Series = .088667 Standard Deviation of the Working Series = 26.69835 Standard Deviation of the 26.69835 Differencing = 1 Degree of Regular Differencing = 1 Lag 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 la 10 Value -0.31 -o .19 -0.19 -0.21 0.06 0.01 -0.15 -0.05 0.05 -O .10 -0.10 -O .12 -0.12 -O. la -0.10 0.04 0.19 0.06 -O .19 -0.19 -0.00 0.12 -0.09 -0.10 -O .10 -O .10 -0.10 0.09 -0.08 -0.13 0.19 T-Value -3.04 -1.92 -2. la -2.10 0.58 0.05 -0.50 -0.47 0.51 -1.00 -1.21 -1.03 0.41 1.88 0.58 -1.89 -0.03 1.18 -0.86 -0.97 -1.03 0.90 -0.80 -1.25 1.84 -1.0 .- 0.0 -- +1. O +1.0 ---_o - - - - -- - - - - - - -- -- - - - - - 11 12 13 14 15 16 17 18 18 19 20 21 22 23 23 24 *** [****: ***[****: [**** -1.92 : [****:: [**** [ · [ [ [ [****:: [**** *:. * [ [ [ · [ ***. [ *** -1.00 . [ ***. [ *** . [ ***: [ *** . [ [ · [ [ : [ [ :· II [****: [**** -1.89 : [ [ [ · [ **: ** [ -0.86 . [ **: ** . [ [ *** [ ***:. [ [ · [ ** [ -0.80 . II [ ***. [ : : ] ] * : 0.58 I0.05 ] : * I I I : * * * * *1.88 ] * 0.58 ] : *** I ** I * * * *1.84 ] ] = Estimated Two-Standard Error Limits Error Limits Figura 10.38 autocorrelación parcial la Figura 10.38 Coeficientes de autocorrelación parcial de Ia primera diferenciación del nümero de clientes, para el caso 10.3. diferenciación del número de clientes, para el caso de estudio 10.3. Como las autocorrelaciones ya sea que caen o descienden después del primer Corno las autocorrelacionesya sea que caen o descienden después del primer coeficiente de autocorrelacióny, el coeficiente de autocorrelacióncae a cero, deben coeficiente de autocorrelación y, el coeficiente de autocorrelación cae a cero, deben funcionar los modelos MA(1) ooARTMA(1,1). modelos MA(I) ARIMA(l,I). En el menú de análisis de Box-Jenkins se selecciona la opción de estimaciónlpronósse selecciona estimación/pronósmenñ tico (2). La pantalla exhibe tico (2). Analysis: Box-Jenkins Analysis: Estimation Transformation to the original data series: to the original data series: (1= Reciprocal. 2=1/Sqrt, 3=1/ 4th root, (1= Reciprocal, 21/Sqrt, 31/4th root. 4=Log. 5=4th root, 6Sqrt, 7=none] 4Log, 5=4th root, 6=Sqrt, 7none] of Regular Differencing: Degree of Regular Differencing: 7 7 1 510 La metodología Box-Jenkins (ARIMA) La metodologla Degree of Seasonal Differencing: Differencing: of Seasonal Period: Length of Seasonal Period: Regular Autoregressive Terms: Terms: Regular Moving Average Terms: Terms: Seasonal Autoregressive Terms: Autoregressive Terms: Seasonal Moving Average Terms: Average Terms: constant term (Y/N/A): Include constant term (YIN/A) : of Backforecasts: Number of Backforecasts: Iterations for Parameter Estimates: Maximum Iterations for Parameter Estimates: Convergence Tolerance: Initial estimates for data (A) or user (U) : estimates for data (A) or user (U): Plot Function: Plot of Residual Autocorrelation Function: Number of lags to print in ACF: print in ACF: Number ENTER to accept: Press ENTER to accept: 0 o Capítulo 10 CapItulo 12 12 o 0 O 0 O 0 O 0 A O 0 50 .001 A A Y 24 MA(l) El modelo MA(1) es el mejor. Se emplea un 1 para los términos regulares de promedio los términos móvil. La salida se muestra en Ia fig. 10.39. móvil. se muestra en la fig. 10.39. Por ültimo, el programa le preguntará si desea almacenar los pronósticos de los Por último, programa preguntará si desea almacenar los pronósticos de los residuos save the forecasts of residuals (y/n)? Do you want to save the forecasts of residuals (yin)? NUMBER OF CLIENTS - BOX-JENKINS ANALYSIS CLIENTS - BOX-JENKINS PARAMETER ESTIMATES AND STATISTICS STATISTICS 98 Observations Used for Parameter Estimates 98 Used for Parameter Estimates Differencing = 1 Degree of Regular Differencing = 1 Sum of Squared Sum of Squared Errors = 59075.64 Residual Variance = 602.8126 602.8126 Parameter MA(l) MA(1) Value 0.4678 T-Statistic 5.20 OF CLIENTS NUMBER OF CLIENTS - BOX-JENKINS ANALYSIS RESIDUAL AUTOCORRELATION FUNCTION RESIDUAL AUTOCORRELATION FUNCTION 97 in the Residual Series 97 Observations in the Residual Series Mean of the Residual Series = .221538 Series = .221538 Mean of the Residual Series 24.56271 Standard Deviation of the Residual Series = 24.56271 Lag 1 1 Value 0.03 T-Value -1.0 T-Value 1.0 0.25 : 0.0 [ [ +1.0 ] :---------------------------------------------------: .* 2 2 -O . 1 2 0.12 -1 . 1 6 1.16 : [ *** : ] 10.39 Modelo MA(1) número 10.3. Figura 10.39 Modelo MA(1) para el niimero de clientes del caso de estudio 10.3. Paquete de cOmputo Minitab cómputo 3 3 511 ***: [ *** . [ 4 4 5 5 6 6 7 7 8 8 9 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 -0.10 0.11 -0.06 -o .18 -0.18 -0.00 0.05 -o .14 -0.14 -o .13 -0.13 0.05 0.24 0.12 -o .13 -0.13 -o .16 -0.16 0.13 0.05 -0.20 -o .12 -0.12 0.07 0.09 -0.23 0.06 0.35 -1.00 1. 09 1.09 -0.61 -1.67 -0.01 0.45 -1.32 -1.17 0.43 2.17 1. 05 1.05 -1.08 -1.36 1.04 0.37 -1.60 -0.92 0.52 0.67 -1.78 0.41 2.59 . -- II [ ·*** **. **. [[****: **** : [ : [ ·* : ] ] I ] ] ] I ] I ] [ * ****.: [ *** [ ] I ] I ***. *** . [ ] ·* I :*****J [ II [ [ [ .*** ·*** ] I ] I ] ] I ] I ] I ] I ] I ] I ] I ** -1.08 * . ****:. **** .*** ·*** .* ·* ***.. *** [ *****. [*****: [ ·** .** ·** [*****: -1.78 [ ] ·* :******]** [ [ : -- - - -- -- - - - - - -- -- --- - -- -- - -- - - - --- - - - - - -- - -- -- - _o ] = Estimated two-Standard Error Limits two-Standard Error Limits Chi-Square Statistic with 23 Degrees of Freedom Box-Pierce Chi-Square Statistic with 23 Degrees of Freedom = 48 = .000 Probability = .000 Figura 10.39 (Contináa) Figura 10.39 (Continúa) PAQUETE DE CÓMPUTO MINITAB PAQUETE DE COMPUTO MINITAB El problema. En ci ejemplo 10.4, Jim White, analista de Atron Corporation, El En el ejemplo 10.4, Jim White, analista de Atron Corporation, desea usar ci método de Box-Jenkins para pronosticar las lecturas de un proceso en Box-Jenkins para pronosticar las lecturas de un proceso desea usar el método particular. Jim desea ejecutar los modelos MA(2) y AR(l). particular. Jim desea ejecutar los modelos MA(2) y AR(l). La solución mediante Minitab La solución mediante Minitab > 'ATRON.DAT' C1 MTB > READ 'ATRON.DAT' Cl 75 ROWS READ 75 ROWS Cl C1 60.0 81.0 72. o 72.0 78.0 81.0 MTB > ACF Cl C1 > ACF OF Cl C1 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 +- ---+----+----+----+----+----+----+----+----+----+ -0.528 XXXXXXXXXXXXXX 0.282 XXXXXXXX 0.6 1 1 2 2 512 3 La metodologla La metodología Box-Jenkins (ARIMA) (ARIMA) 3 -0.038 0.008 0.144 -0.137 0.147 -0.036 0.068 -0.150 0.158 -0.189 0.187 -0.234 0.221 -0.120 -0.086 0.105 XX X X XXXXX xxxx XXXX XXXXX XX XXX XXXXX XXXXX XXXXXX XXXXXX XXXXXXX XXXXXXX XXXX XXX XXXX Capítulo 10 CapItulo 10 4 4 5 5 7 6 6 7 8 8 9 9 10 11 12 13 14 15 15 16 17 18 MTB > PACF Cl > PACF C1 PACE PACF OF Cl C1 1 1 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 2 11 12 12 13 14 15 16 17 17 18 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 1.0 -1.0 -0.8 -0.6 -0.4 -0.2 +- - - -+- - - -+- - - -+- - - -+- - - -+- - - -+- - - -+- - - -+- - - -+- - --+ +----+----+----+----+----+----+----+----+----+- --+ -0.528 XXXXXXXXXXXXXX 0.003 X X 0.155 XXXXX 0.065 XXX 0.189 XXXXXX 0.002 X X 0.026 XX 0.060 XXX 0.084 XXX XXXXXX -0.184 -0.009 X X -0.143 XXXXX 0.057 XX -0.135 XXXX 0.123 XXXX 0.038 XX XXXX -0.129 XX -0.055 0.6 MINITAB Los comandos de MINITAB para probar el modelo MA(2) son MTB > ARIMA(O O 2)C1; MTB > ARIMA(0 0 2)C1; SUBC> CONSTANT; SUBC> SUBC> FORECAST 3 PERIODS AHEAD STORE IN C3, SUBC> 3 PERIODS AHEAD STORE IN C3. CONT> IN C4 AND C5 IN C4 AND CS Estimates at each iteration each iteration Estimates & CONF LIMITS & CONF Paquete de cOmputo Minitab cómputo Iteration SSE Parameters 7 0.567 -0.356 75.410 7 9786.2 0.356 Relative change in each estimate less than in each estimate less than 0.0010 Final Estimates of Parameters of Parameters Final Type 1 MA 2 MA 2 Constant Mean No. of obs: No. of obs: Residuals: 513 0.567 Estimate 0.5667 -0.3560 0.3560 75.410 75.410 75 SS = 9724.97 SS MS = 135.07 St. 13ev. Sto Dev. 0.1107 0.1146 1.061 1.061 1.061 1.061 t - ratio t-ratio 5.12 -3.11 3. 11 71.08 excluded) (backforecasts excluded) DF = 72 Modified Box-Pierce chisquare statistic chisquare statistic Modified Lag 12 24 36 Chisquare 7.0(DF=10) 7.0(DF1O) 23.8(DF=22) 31.8(DF=34) 31.8(DF34) Forecasts from period 75 period 75 Forecasts 48 46.9(DF=46) 46.9(DF46) Period 76 77 78 Forecast 80.648 80. 648 78.169 75.410 95 Limits 95 Percent Limits Lower Upper 103.431 57.864 51.982 104.356 47.996 102.825 Actual Actual MTB > STOP > STOP El comando ARIMA(O 0 2)Cl • El comando ARIMA(0 O 2)C1 se usa para ejecutar un modelo MA(2) para los datos ejecutar modelo MA(2) para los datos almacenados en Cl. almacenados en Cl. El subcomando CONSTANT se emplea para ejecutar el modelo con • El subcomando CONSTANT se emplea para ejecutar el modelo con un término término constante. • El subcomando FORECAST se utiliza para almacenar tres pronósticos en C3 y colocar subcornando FORECAST se utiliza para almacenar tres pronósticos en C3 y colocar los límites de confianza en C4 y CS. C5. los ilmites • La salida muestra la estirnación tinal del parámetro constante, 75.41, el coeficiente del estimación final del parámetro constante, término MA(1), .5667 Y el coeficiente del término MA(2), -.3560. Las proporciones t MA(1), .5667 y el coeficiente del término MA(2), .3560. para estos parámetros son 71.08,5.12 Y-3.11, respectivamente. parámetros son 71.08, 5.12 y 3.11, respectivamente. de Minitab para probar el modelo AR(1) Los comandos de Minitab para probar el modelo AR( 1) son MTB > ARIMA(1 0 0)C1; > ARIMA(l O 0)C1; SUBC> SUBC> CONSTANT. Estimates at each iteration Estimates each iteration SSE Parameters Iteration 514 La metodologla Box-Jenkins (ARIMA) metodología 7 0.538 7 10113.5 -0.538 115.842 Relative change in each estimate less than in each estimate less than Relative Capítulo 10 CapItulo 10 0.0010 Final Estimates of Parameters of Parameters Final Type Estimate St. Dev. Sto Dev. 1 AR 1 -0.5379 0.5379 0.0986 115.842 Constant 1.356 Mean 75.3267 0.8816 No. of obs. : of obs.: Residuals: 75 75 SS = 10065.2 SS 10065.2 137.9 MS = t-ratio -5.46 5.46 85.44 (backforecasts excluded) (backforecasts DF = 73 73 Modified Box-Pierce chisquare statistic chisquare statistic 12 24 Lag Chisquare 9.3(DF=11) 29.9(DF=23) 9.3(DF11) 29.9(DF23) 48 48 58.3 (DF=47) 58.3 (DF=4 7) period 75 Forecasts from period 75 Period 76 77 78 Forecast 77.116 74.364 75.844 95 Percent 95 Lower 54.097 48.226 48.871 36 37.3(DF=35) 37.3(DF35) Limits Upper 100.135 100.502 102.817 PAQUETE DE CÓMPUTO SAS PAQUETE DE COMPUTO El El problema. En el ejemplo 10.4, Jim White, analista de Atron Corporation, En ejemplo 10.4, Jim White, analista de Atron Corporation, desea usar el método de BoxJenkins para pronosticar las lecturas de un proceso en proceso desea usar el método de Box-Jenkins para pronosticar las lecturas de particular. modelos y AR(l). particular. Jim desea ejecutar los modelos MA(2) y AR(1). SAS Solution SAS $ SAS/CC=PRINT SAs/cc=PRINT OPTIONS PAGESIZE-60 LINESIZE=80; OPTIONS PAGESIZE-60 LINESIZE8O; TITLE "BOX-JENKINS MODELS FOR EXAMPLE 10.4"; TITLE FOR EXAMPLE 10.4"; DATA WHITE; INFILE 'ATRON.DAT' 'ATRON.DAT'; INPUT Y :4.1; Y :4.1; PROC ARIMA DATAWHITE; PROC ARIMA DATA=WHITE; IDENTIFY VAR=Y; IDENTIFY VARY; ESTIMATE P1; ESTIMATE P=l; FORECAST LEADS; FORECAST LEAD=5; ESTIMATE Q=2; ESTIMATE Q=2; LEAD=5; FORECAST LEAD=5; ENDSAS; Paquete de cOmputo SAS de cómputo 515 • El comando TITLE da nombre a esta ejecución de SAS. datos. • La declaración DATA asigna un nombre a los datos. • La declaración INFILE identifica un archivo externo, ATRON.DAT, que se desea leer con una declaración INPUT. la variable • La declaración INPUT nombra Ia variable Ye indica que el formato a leer es 4.1. • El comando PROC ARIMA modela un valor en respuesta a una serie histórica como serie histórica como combinación lineal de una comb macion lineal de sus propios valores anteriores. • El subcomando IDENTIFY indica que la variable a analizar es 1'. indica que la variable a analizar es Y. • El subcomando ESTIMATE solicita una estimación del modelo especificado por P y y Q. P especifica los grados de Ia parte autorregresiva del modelo, y Q da los grados de la Q Q. del la parte de promedio mOvil del modelo. El primer subcomando ESTIMATE indica un móvil del modelo. El primer modelo AR(l) y ci segundo un modelo MA(2). AR(I) y el segundo un modelo MA(2). • El subcornando FORECAST se emplea para generar valores de pronOstico para una serie subcomando FORECAST se emplea para generar valores de pronóstico para una serie comando previo histórica utilizando las estimaciones de parámetros producidas por el comando previo número múltiple ESTIMATE. LEAD especifica el nürnero de valores de pronósticos de paso multiple a calcular. La salida de córnputo para esta ejecución de SAS se muestra en la fig. 10.40. cómputo 10.40. BüX-JENKINS MODELS FOR EXAMPLE 10.4 10.4 BOX-JENKINS MüDELS FüR ARIMA Procedure Identification of Model Identification of Model of variable = Y. Name of variable = Y. 75.24 series Mean of working series = = 13.72598 Standard deviation 75 75 Number of observations = Autocorrelations Covariance Lag Covariance O 188.402 o 1 99.565968 -99.565968 1 2 53.049264 2 3 -7.222704 7.222704 3 4 1.495728 4 5 27.179760 5 6 -25.886208 25.886208 6 7 27.643824 7 8 -6.778944 6.778944 8 9 12.782688 9 12.782688 10 -28.340880 28.340880 10 11 11 29.810352 432 101 2 3 5 6 7 8 9 1 Correlation-1 9 8 7 6 5 4 3 2 1 0 1 52 3 4 5 6 7 891 Correlation1 987 6 : * ** * * * * * * * * * * * ** * * * * ********************: 1.00000 ** ** * * * **** -0.52848 0.52848 ***** 0.28157 -0.03834 0.03834 0.00794 *** 0.14426 *** -0.13740 0.13740 *** 0.14673 *. -0.03598 0.03598 0.06785 ***: -0.15043 0.15043 *** 0.15823 Figura 10.40 Modelos AR(1) 10.4. Figura 10.40 Modelos AR(l) y MA(2) para el ejemplo 10.4. 516 12 13 14 15 16 17 18 -35.537616 35.224416 -44.065152 41.576880 -22.644288 -16.208256 19.846176 -0.18863 0.18696 -0.23389 0.22068 -0.12019 -0.08603 0.10534 La metodologia La metodología Box-Jenkins (ARIMA) CapItulo Capítulo 10 marks two standard errors two standard errors Inverse Autocorrela-tions Autocorrelations Lag Correlation -1 9 8 7 6 5 4 3 2 1 O 1 2 3 4 5 6 7 8 9 9 8 7 6 5 4 3 2 1 0 1 2 3 5 7 8 9 ******** 1 .******** 1 0.40194 * . * 2 2 -0.05296 3 3 -0.16432 *** . 4 *** . 4 -0.15553 5 *** . 5 -0.17276 * . 6 6 -0.05491 • * . 7 7 -0.10161 ** . 8 8 -0.08906 9 9 0.01222 10 10 0.14989 ·*** 11 11 0.08808 · ** 12 12 0.05877 ·* 13 13 -0.01142 * . 14 14 -0.05127 ** . 15 15 -0.10505 16 16 0.07156 · * 17 17 0.12525 ·*** 18 18 0.03722 · * Procedure ARIMA Procedure 14 6 Partial Autocorrelations Partial Lag Correlation -1 9 8 7 6 5 4 3 2 1 O 1 2 3 4 5 6 7 8 9 1 9 8 6 5 4 3 2 1 0 1 2 3 4 5 8 9 1 7 ***********: ***********. 1 1 -0.52848 2 2 0.00318 3 3 0.15495 · *** 4 4 0.06502 · * 5 5 0.18938 · **** . 6 6 0.00201 · 7 7 0.02572 8 8 0.06007 · * 9 9 0.08414 ·** 10 .**** . 10 -0.18429 11 11 -0.00943 12 *** . 12 -0.14288 13 13 0.05708 ·* 14 14 -0.13511 *** . 15 15 0.12298 ·** 16 16 0.03789 · * 17 17 *** . -0.12886 * . 18 18 -0.05518 Autocorrelation Check for White Noise for Noise : 6 . To Chi Autocorrelations Prob 0.000 0.000 0.000 Square DF Lag Square DF 6 31.49 6 6 6 12 41.36 12 12 18 57.76 18 18 -0.528 0.147 0.147 0.187 0.187 0.282 -0.036 -0.234 -0.038 0.068 0.221 0.008 -0.150 -0.120 0.144 0.158 -0.086 -0.137 -0.189 0.105 Figura 10.40 (Continúa) 10.40 (Contináa) de cómputo SAS Paquete de cOmputo SAS ARlMA Procedure Estimation of AR(1) Parameters of AR(l) Parameters ARIMA Conditional Least Squares Estimation Conditional Least App rox. Approx. Std Error 0.89556 0.09938 517 Parameter MU AR1,1 Estimate 75.30138 -0.52889 T Ratio 84.08 -5.32 Lag O 0 1 1 Std Error Constant Estimate 115.12749 Variance Estimate = 139.455214 139.455214 Std Error Estimate = 11.8091157 11.8091157 Std Error Estimate = 585.144392* AlC 585.144392* AIC = 589.779368* SBC 589.779368* Number of Residuals= 75 Number 75 * log determinant. * Does not include log determinant. Does not Correlations of the Estimates Correlations Parameter MU AR1,1 MU AR1,1 1.000 -0.003 -0.003 1.000 Check of Residuals Autocorrelation Check of Residuals Chi Square Lag Square 6 5.38 6 12 9.27 12 18 16.17 16.17 18 24 29.63 To DF OF 5 5 11 11 17 17 23 Autocorrelations Prob 0.004 0.089 0.147 0.094 0.372 0.136 0.094 -0.016 -0.096 0.597 0.021 -0.118 0.512 0.021-0.118 0.130 -0.115 0.160 -0.139 -0.059 -0.282 -0.016 Model for Variable Y Y Model for 75.3013812 Estimated Mean = 75.3013812 Autoregressive Factors Factors 1: 1 + B**(l) Factor 1: 1 + 0.52889 B**(1) 0.164 0.032 -0.161 -0.137 -0.029 -0.083 -0.096 -0.021 -0.066 0.164 ARlMA Procedure Forecast Using AR(1) Model Forecast Using AR(l) Model ARIMA Forecasts for variable Y Y Forecasts for Obs 76 77 77 78 79 80 Lower 95% Forecast Std Error 95% Upper 95% 95% 77.0474 11.8091 11.8091 53.9020 100.1929 48.1947 74.3779 13.3590 100.5612 48.8180 13.7614 75.7898 102.7616 75.0431 13.8719 47.8547 102.2314 75.4380 48.1894 102.6866 13.9026 ARlMA Procedure Estimation of MA(2) Parameters ARIMA Procedure Estimation of MA(2) Parameters Std Error Figura 10.40 (Continúa) Figura 10.40 (Contináa) 518 La metodologla Box-Jenkins (ARIMA) metodología Conditional Least Squares Estimation Conditional Least Squares Estimation Approx. Std Error Std 1.06124 0.11157 0.11584 Capítulo 10 Parameter MU MA1,1 MA1,l MA1,2 Constant Estimate 75.38035 0.55463 -0.34081 T Ratio 71.03 4.97 -2.94 Lag 0 O 1 1 2 2 Estimate = 75.3803455 75.3803455 Variance Estimate = 137.163733 137.163733 Std Error Estimate = 11.7116921 11.7116921 Std Error = 584.867281" 584.867281* AlC AIC 591.819745* SBC 591.819745" Number of Residuals Residuals= 75 Number 75 include log determinant. * Does not include log determinant. " Correlations of the Estimates Estimates Parameter MU MA1,l MA1,1 MA1,2 MAl2 MU 1.000 -0.002 -0.047 MA1,l MA1.1 -0.002 1.000 -0.395 MA1,2 -0.047 -0.395 1.000 Autocorrelation Check of Residuals Check of Residuals To Lag 6 6 12 18 24 24 Chi Square 2.60 7.16 12.93 23.98 Autocorrelations DF DF 4 10 10 16 22 Prob 0.627 0.710 0.678 0.348 0.007 0.146 0.041 -O .108 -0.108 0.031 0.075 -0.098 -0.026 -0.008 -0.003 0.136 -0.270 0.084 -0.117 -0.105 0.005 -0.018 0.152 0.031 0.043 -0.098 -0.136 0.010 -0.130 -0.033 Model for variable Y for variable Y Estimated Mean = 75.3803455 75.3803455 Estimated Factors Moving Average Factors Factor 1: 1 - 0.55463 B**(1) + 0.34081 B**(2) 1: 1 B""(l) + 0.34081 B""(2) ARlMA ARIMA Procedure Forecast Using MA(2) Model MA(2) Model for variable Y Forecasts for variable Y Obs 76 76 77 77 78 78 79 80 Forecast 80.3867 77 .9901 77.9901 75.3803 75.3803 75.3803 75.3803 Std Error 11.7117 13.3925 13.9746 13.9746 13.9746 Lower 95% Lower 57.4322 51.7414 47.9906 47.9906 47.9906 Upper 95% 103.3412 104.2389 102.7701 102.7701 102.7701 102.7701 Std Error 11.7117 Figura 10.41 Figura 10.41 Modelos AR(1) y MA(2) Modelos AR(l) Y MA(2) para el ejemplo 10.4. lOA. Capítulo 10 CapItulo Bibliografía Bibliografia 519 BIBLIOGRAFíA BIBLIOGRAFIA Box, G. JENKINS, G. Time Series Analysis: Forecasting and Control. San Francisco: HoldenDay, Box, G. yY JENKINS, G. Time Series Analysis: Forecasting and Control. San Francisco: Holden-Day, 1976. DE LURGIO, S.A. "Forecasting Daily Demand at a State Trout Park Using ARIMNBox-Jenkins DE LURGIO, S.A. "Forecasting Daily Demand at aState Trout Park Using ARIMA/BoxJenkins Methodology." Proceedings of the American Institutefor Decision Sciences Conference, 1980. Las Institute forDecision Sciences Conference, 1980. Las Methodology." Proceedings olthe Vegas, Nev., pp. 23 7-239. Nev., pp. 237-239. JENKINS, G. y McLEOD, G. Case Studies in Time Analysis. Lancaster, UK: Gwilym Jenkins & JENKINS, G. y MCLEOa G. Case Studies inTime Analysis. Lancaster, UK: Gwilym Jenkins & Partners Ltd., 1982. 1982. LIBERT, G. "The M-. Competition with Fully Automatic BoxJenkins Procedure." Journal of LIBERT,G. "The M-. Competition with aaFully Automatic Box-Jenkins Procedure." Journal 01 Forecasting 3 (3) (1984): 325-328. (1984): LUSK, E. 1. y NEVES, S. "A Comparative ARIMA Analysis of the 111 Series of the Makridakis LUSK, E. J.Y NEvEs,1. J. S. "A Comparative ARIMA Analysis of the111 Series of the Makridakis olForecasting Competition." Journal of Forecasting 3 (3) (1984): 329-332. (1984): MAKRlDAKIS, S. y WHEELWRIGHT, S. C. C. Interactive Forecasting, Palo Alto, Calif.: Scientific MAKRIDAKIS, S. y WHEELWRIGHT, S.Interactive Forecasting, Palo Alto, Calif.: Scientific Press, 1977. MAKRlDAKIS, S. S. etal. "An Interactive Forecasting System."American Statistician 28 (1974): 153-158. MAKRIDAKIS, etal. "An Interactive Forecasting System." American Statistician 28 (1974): 153-158. MONTGOMERY, D. S. y y JOHNSON, L. A. Forecasting and Tune Series Analysis, New York: McGraw MONTGOMERY, D. S. JOHNSON, L. A. Forecasting and Time Series Analysis, New York: McGraw1976. Hill, 1976. O'DONOV AN, T. M. Short Ter,n Forecasting: An Introduction to the Box-Jenkins Approach. New Term Forecasting. An Introduction to the BoxJenkins Approach. O'DONovAN, T. M. York: John Wiley & Sons, 1983. & 1983. ,,PACK, D.J. "In Defense of ARIMA Modeling". International Journal of Forecasting 6 (2) (1990): PACK, DJ. "In Defense of ARIMA Modeling". Intemational Journal ofForecasting (2) (1990): 211-218. QUENOUILLE, M. H.H. "The Joint Distribution ofSerial Correlation Coefficients." Annuals of MathemaQUENOUILLE, M. "The Joint Distribution of Serial Correlation Coefficients." Annuals 01 Mathematical Statistics 20 (1949): 561-57 1. 20(1949): 561-571. CAPíTULO CAPITULO Elementos de iuicio Elementos de juicio en los pronósticos 1 ACTIVIDAD A CTIVIDAD Todas técnicas de pronóstico cubiertas este libro comprenden la manipulación Todas las técnicas de pronóstico cubiertas en este libro comprenden la manipulación de producir predicciones pronósticos de importantes variables datos históricos para producir predicciones o pronósticos de importantes variables datos históricos interés. Las exposiciones en los capítulos previos se refirieron a análisis complejos de de interés. Las exposiciones en los capitulos previos se refirieron a análisis complejos de datos y quizá se implicó que el juicio del pronosticador no estaba comprendido. De hecho, implicó del pronosticador no estaba comprendido. De hecho, datos el uso del buen juicio es un componente esencial de toda buena técnica de pronóstico. Se buen es un componente esencial de toda buena técnica de pronóstico. Se el relevantes a! problema y requiere de buen juicio para decidir sobre los datos que son relevantes al problema y para interpretar los resultados del proceso de análisis de datos, y en ocasiones constituye una constituye una interpretar los resultados del proceso de análisis de datos, principal del propio análisis. parte principal del propio análisis. En el cap. 3, se describieron métodos pam identificar y recolectar datos relevantes al 3, se describieron para datos relevantes al pronóstico. En este capItulo se exponen algunos de los elementos importantes de pronóstico capítulo los elementos importantes de pronóstico que son complementos sustituciones de la manipulación metódica de dichos datos que son complementos o sustituciones de la manipulación metódica de dichos datos históricos. Adernás, se describen diversos elementos relativos a la administración del históricos. Además, se describen diversos elementos relativos a la administración del pronóstico. proceso de pronóstico. PRONÓSTICOS DE JUICIO PRONÔSTICOS DE JUICIO juicio Pronósticos de juicio muchas situaciones de pronóstico solo se emplea el análisis históricos En muchas situaciones de pronóstico sólo se emplea el análisis de datos históricos para final; opinión generar el pronóstico final; no se inyecta en el proceso el juicio u opinion del analista. Este libro refiere principalmente a estas técnicas de pronóstico y, como resultado, a libro se refiere principalmente a estas técnicas de pronóstico y, como resultado, a los pronósticos mediano plazos. pronósticos son preocupación esencial de pronósticos de corto y mediano plazos. Tales pronósticos son la preocupación esencial de la mayorIa de los niveles de administración en una organización y están asociados con la mayoría de administración en organización la las decisiones que deben efectuarse. mayor parte de las decisiones que deben efectuarse. Estos procedimientos de pronóstico dependen de la manipulación de datos histôricos manipulación de datos históricos y asumen un pasado y un futuro indistinguibles, con excepción de las variables especIficas asumen un pasado y un futuro indistinguibles, con excepción de las variables específicas identificadas que afectan la posibilidad de sucesos futuros. Esta suposición excluye un sucesos futuros. Esta suposición excluye un identificadas que afectan la posibilidad cambio sustantivo en la base tecnológica de la sociedad, una suposición de que la sugerencia de que 521 de muchos desarrollos recientes es errónea. Considérese, por ejemplo, la introducción y de muchos desarrollos recientes es errónea. Considérese, por ejemplo, la introducción y costo. proliferación de computadoras personales de alta velocidad y bajo costo. proliferación personales de En algunas situaciones de pronóstico, el analista complementa el proceso de análisis situaciones pronóstico, el analista complementa el proceso análisis de datos después de considerar las circunstancias no usuales de la situación, o después de considerar las circunstancias no usuales de la situación, o después de de datos después reconocer que el pasado histórico no es un predictor preciso del futuro. La cantidad de juicio histórico no es un predictor preciso del futuro. La cantidad dejuicio incrementarse en la que se inyecta en el proceso tiende a incrementarse en la medida en que los datos históricos el caso sean reducidos en niimero o se juzgue que son parcialmente irrelevantes. En el caso sean reducidos en número se juzgue que son parcialmente irrelevantes. extremo, pudiera ser la opinion del analista que ninguno de los datos históricos es los datos históricos es extremo, pudiera ser la opinión del analista que ninguno directamente relevante en proceso de pronóstico. Bajo estas condiciones, se emplean directamente relevante en el proceso de pronóstico. Bajo estas condiciones, se emplean pronósticos basados exciusivamente en las opiniones de "expertos" para formular pronósticos basados exclusivamente en las opiniones de "expertos" para formular el escenario para el futuro. pronóstico o escenario para el futuro. manera interesante, investigación muestra que, cuando disponibles De manera interesante, la investigación muestra que, cuando hay disponibles datos históricos, modificación de los pronósticos producida medios analíticos tiende a históricos, la modificaciOn de los pronósticos producida por medios analiticos tiende a precisión de los pronósticos. l descubrimiento pudiera atribuirse alguna reducir la precision de los pronósticos.1 Este descubrimiento pudiera atribuirse a alguna desviación por parte del pronosticador, debido quizá a una tendencia a ser demasiado desviación por parte del pronosticador, debido quizá a una tendencia ser demasiado a subestimar la incertidumbre futura. Se ha demostrado también uso de optimista o a subestimar La incertidumbre futura. Se ha demostrado también que el uso de el proceso de pronóstico tiende incrementar costo del componente de juicio un componente de juicio en el proceso de pronóstico tiende a incrementar el costo del mismo. 2 mismo.2 Cuando hay pocos ningún dato histórico disponible que ayude proceso de Cuando hay pocos o ningin dato histórico disponible que ayude en el proceso de pronóstico, se debe depender del juicio, si es que sobre pronOstico, se debe depender del juicio, si es que se desean pronósticos o predicciones sobre dirección, se han el futuro. Como estas situaciones surgen a menudo, en especial en la alta dirección, se han desarrollado técnicas para mejorar la precisión de dichos pronósticos mediante Ia utilización la precision tomar en consideración del juicio ejecutivo disponible para una mayor ventaja. Vale la pena tomar en consideración técnicas, frecuencia ejecutivos consideran su propio juicio superior a estas técnicas, ya que con frecuencia los ejecutivos consideran su propio juicio superior a gente prefiere otros métodos de predicción del futuro. Como establece Makridakis, "La gente prefiere predicción futuro. Como establece Makridakis, otros métodos hacer pronósticos de juicio. Creen que su conocimiento del producto, del mercado y del pronósticos de juicio. Creen conocimiento producto, mercado y del habilidad única cliente, así visión e información interior le proporciona cliente, asI como su vision e información interior le proporciona una habilidad Imica para pronosticar a juicio."3 a A continuación se presentan varias preguntas, cada una de las cuales sugiere mas bien varias preguntas, cada una de las cuales sugiere mas bien el uso de la imaginación y "actividad cerebral intensa" que Ia completa dependencia de la la imaginación y "actividad cerebral intensa" que la completa dependencia la el recolección y manipulaciOn de datos históricos. Para cada una de estas preguntas, alguna recolección manipulación de datos histOricos. Para cada una de estas preguntas, de las técnicas de pronóstico que se abordan en este capItulo pudiera proporcionar valiosos que se abordan en este capítulo pudiera proporcionar valiosos puntos de vista sobre el ambiente de operación futuro de la empresa, al equipo de operación futuro de la empresa, equipo de puntos de vista sobre el ambiente administración de una companIa. compañía. administración Cuál EUA la • ¿Cuál será Ia distribución de edades en EVA en el año 2025? trabajarán su hogar los ciudadanos estadunidenses dentro de 25 • ¿Hasta qué grado trabajarãn en su hogar los ciudadanos estadunidenses dentro de 25 ,Hasta años? ,Qué • ¿Qué ciudades serán los mayores centros de poblaciOn y negocios en 20 aflos? de población años? 1 S. Makridakis, "The Art and Science of Forecasting", [nternational Journal of Forecasting, Vol. 2 Vol. 2 Makridakis, "The Art and Science of Forecasting", International Journal 01 45. (1986), p. 45. 2 Ibid. 2 [bid. 3 Ibid., p. 63. [bid., 63. I 522 juicio en los pronósticos Elementos de juicio en los pronOsticos Capítulo 11 CapItulo 11 Hasta • ¿Hasta qué grado dependerá EUA de otros palses para la manufactura de productos de EVAde países para la manufactura de productos de consumo claves? ,Hasta televisión • ¿Hasta qué grado serán populares las compras desde el hogar utilizando la television o la computadora dentro de 20 años? • ¿De qué tiempo de ocio dispondrá el estadunidense promedio durante el siguiente siglo? De LComenzará EUA a retirarse de • ¿Comenzará EVA a retirarse de sus compromisos airededor del mundo durante los compromisos alrededor mundo durante los EVA? próximos 25 años? De ser así, ¿en qué forma afectará esto a los negocios en EUA? 25 aflos? Dc ser asI, en qué forma afectará esto técnicas expuestas capítulo se En ocasiones las técnicas expuestas en este capItulo se les denomina pronósticos de pronósticos ya que el juicio es el principal único componente del proceso. A algunas de ellas juicio, ya que el juicio es el principal ooánico cOmponente del proceso. A algunas de ellas les conoce también como métodos tecnológico con frecuense les conoce también como métodos de pronóstico tecnológico puesto que con frecuense relacionan con la proyección de efectos del cambio tecnológico en el futuro cia se relacionan con La proyección de los efectos del cambio tecnológico en el futuro incierto. El resto de este capItulo esboza algunos de los métodos de pronóstico de uso más incierto. este capítulo los métodos de pronóstico de uso más común donde el juicio del pronosticador es el ingrediente principal. 4 comün en donde el juicio del pronosticador es el ingrediente principal.4 Curvas Curvas de crecimiento pronóstico curva de crecimiento se concentra en los cambios a largo plazo El método de pronóstico de curva de crecimiento se concentra en los cambios a largo plazo de una variable de interés y proyecta esta variable al futuro sin tomar en cuenta Ia tecnologIa esta variable al futuro sin tomar en cuenta la tecnología que pudiera dar por resultado los cambios predecidos. Por ejemplo, el costo por transacciOn los cambios predecidos. Por ejemplo, el costo por transacción de computadora se pudiera proyectar al próximo siglo con base en el pasado histórico de el pasado histórico de de computadora se proyectar al próximo siglo esta variable. En este proceso no se considera Ia tecnologIa necesaria para producir los proceso no se considera la tecnología necesaria para producir los esta variable. En cambios proyectados. viaje en automóvil, así En forma similar se podrIa proyectar el costo por milla del viaje en automóvil, asI forma podría proyectar el costo como el uso del automóvil por la población estadunidense. De nueva cuenta, no se considera del automóvil estadunidense. De la tecnología comprendida la producción de automóviles ni combustible necesarios Ia tecnologIa comprendida en La producción de automóviles ni el combustible necesarios cambios predecidos. para los cambios predecidos. lo regular las proyecciones de curvas de crecimiento comprenden pronósComo por lo regular las proyecciones de curvas de crecimiento comprenden pronOsticos de largo plazo, generalmente se usan varias relaciones curvas entre el tiempo y la largo plazo, generalmente se usan varias relaciones curvas entre el tiempo la ticos variable de interés. La curva exponencial es a menudo la base de las proyecciones de curvas exponencial a menudo la base de las proyecciones de curvas crecimiento, que esta curva comprende mejoras siempre decrecientes través del de crecimiento, ya que esta curva comprende mejoras siempre decrecientes a través del tiempo. Aunque pudieran esperarse imprecisiones al utilizar las crecimiento para Aunque pudieran esperarse imprecisiones al utilizar las curvas de crecimiento para método de gran beneficio para la administración ya predecir el futuro, este método puede ser de gran beneficio pam la administraciOn ya que concentra su atención en los aspectos de largo plazo de los negocios de una compañía. Es concentra su atenciOn en los aspectos de largo plazo de los negocios de una compañIa. Es típico que las curvas de crecimiento a menudo en retiros ejecutivos o tIpico que la alta dirección use las curvas de crecimiento a menudo en retiros ejecutivos o sesiones a puerta cerrada. en sesiones a puerta cerrada. ' 4 Para una descripción organizada de muchos métodos de pronóstico, incluyendo los de juicio, consñltese organizada de muchos métodos de pronóstico, incluyendo los dejuicio, consúltese David M. Georgoff y Robert G. Murdick, "Manager's Guide to Forecasting." Harvard Business Review, Vol. 11 Robert G. Murdick, "Manager's Guide to Forecasting." Harvard Business Review, Vol. David (enero-febrero, 1986), pp. 110-120. 110-120. (enero-febrero, 1986), 523 El método El método Delphi Cuando reunión expertos se pregunta sobre el futuro, la dinámica del grupo Cuando en una reimión de expertos se les pregmta sobre el futuro, Ia dinámica del grupo puede a veces distorsionar el proceso y dar por resultado un consenso que pudiera no haber resultado que pudiera no haber sido pensado cuidadosamente por todos los participantes. El método Delphi, utilizado por todos los participantes. sido pensado cuidadosamente método Delphi, utilizado primero primero en un proyecto en la década de 1950 de la RAND Corporation, financiado por la 1950 la RAND Corporation, financiado Air Force, pretende eliminar de las deliberaciones de los pronosticadores el aspecto de deliberaciones pronosticadores de la dinámica de grupo. En la primera ronda del método, los expertos responden por escrito la primera ronda del método, los expertos responden por escrito las preguntas propuestas por el equipo de investigación. Después, este equipo resume los propuestas investigación. Después, comentarios de los participantes y se les envIa por correo. Entonces, los participantes comentarios de los participantes se les envía por correo. Entonces, los participantes originales, pueden leer las reacciones de los dernás y, ya sea, defender sus puntos de vista originales, reacciones demás y, o modificarlos con base en las opiniones de los demás. modificarlos opiniones los demás. Este proceso continúa durante dos o tres rondas más hasta que los investigadores están los investigadores Este proceso continua durante dos satisfechos con satisfechos con los diversos puntos de vista desarrollados yycuidadosamente considerados. diversos puntos de vista desarrollados cuidadosamente considerados. Entonces, se puede invitar a los participantes a reunirse para compartir y debatir sus puntos de participantes reunirse Entonces, compartir vista. Al concluir este proceso, ci grupo de investigación podría tener un muy buen punto de vista el podrIa tener un muy vista sobre el futuro y comenzar a planear la posición de su organización de acuerdo con éste. sobre comenzar planear posición su organización de acuerdo con éste. Variantes del método Delphi incluyen la eliminación de la conferencia del grupo al Variantes del método Delphi incluyen Ia eliminación de Ia conferencia del grupo a! final del proceso escrito. Es probable que fuera en extremo dificil reunir a diversos expertos final a expertos connotados, de modo que puede concluir el proceso después de dos tres rondas connotados, de modo que se puede concluir el proceso después de dos o tres rondas por escrito. Otra variante es el método Delphi en "tiempo-real", en la que los expertos se Otra variante es el método Delphi en "tiemporeai", en la que los expertos encuentran en misma ubicación, separados durante fase escrita. Cada experto encuentran en la misma ubicación, pero separados durante la fase escrita. Cada experto retroalimentación de los puntos de vista recibe, en pocos minutos, una retroalirnentación de los puntos de vista de los otros; de esta los manera, se pueden efectuar varias rondas escritas antes de reunir a los expertos para la fase varias rondas escritas antes de reunir a los expertos para la fase discusión. de discusión. Una variante más comprende el uso de computadoras en tiempo-real conectadas por Una variante más comprende el uso de computadoras en tiemporeal se puede llevar los participantes teléfono. La fase escrita se puede Ilevar a cabo en un breve periodo aunque los participantes diferentes. Para concluir el proceso se puede emplear estén en ubicaciones diferentes. Para concluir el proceso se puede emplear una conferencia el teléfono. de seguimiento utilizando las computadoras o el teléfono. Delphi consiste en que connotados La ventaja del método Delphi consiste en que se puede pedir a connotados expertos que consideren cuidadosarnente el tema de interés y replicar concienzudamente a los puncuidadosamente el tema de interés y replicar concienzudamente a los puntos de vista de los demás sin Ia interferencia de Ia dinámica de grupo. El resultado, si el vista los demás sin la interferencia de la dinámica de grupo. El resultado, si ci tos proceso maneja cuidado, pudiera ser buen consenso futuro con las proceso se maneja con cuidado, pudiera ser un buen consenso del futuro junto con las alternativas de diversos escenarios. 5 ri5 de escenarios Formulación de escenarios fOnTIulación de escenarios comprende la un futuro La formulación de escenarios comprende Ia definición de las particularidades de un futuro del medio ambiente una organización incierto mediante la escritura de un "guión" del rnedio ambiente de una organización para 5 Para una descripción detallada del método Delphi, véanse: Frederick J. Parente y Janet K. AndersonJanet K. AndersonPara una descripción detallada del método Delphi, véanse: Frederick J. y Peter Ayton, eds. (New York: Parente, "Delphi Inquiry Systems", en Judgmental Forecasting, George Wright y Peter Ayton, eds. (New York: & Sons, 1987), pp. 129-156. John Wiley & Sons, 1987), pp. 129-156. 524 Elementos de juicio en los pronOsticos juicio en los pronósticos CapItulo 11 Capítulo 11 varios años a futuro. La nueva tecnología, los cambios en la población y la variación en la varios años futuro. tecnologIa, los cambios en la población y la variación en la demanda por parte del comsumidor se encuentran entre los factores que se consideran y demanda por parte del comsumidor se encuentran entre los factores que se consideran y entrelazan en esta especulación para estimular Ia imaginación de la alta dirección. la imaginación la alta dirección. entrelazan escenario o más escenarios Por lo regular se escribe el escenario más probable junto con uno o más escenarios escribe junto menos probables, pero posibles. Al considerar la posición de la compañía para cada uno de menos probables, pero posibles. Al considerar la posición de la compañIa para cada uno de estos ambientes futuros, la alta dirección está en i.ma mejor posición para reaccionar a los una mejor posición para reaccionar los estos ambientes futuros, cambios reales del medio empresarial según se vayan presentando y para reconocer las reconocer las cambios reales del medio empresarial segün se vayan presentando y implicaciones de largo plazo de agudos cambios que de otra forma pasarIan desapercibidos. agudos cambios que de otra forma pasarían desapercibidos. De esta manera, la organización está en mejor posición de mantener su rentabilidad a largo en rentabilidad largo plazo en vez de concentrarse en las utilidades de corto plazo e ignorar el medio tecnológico piazo cambiante en el que opera. cambiante en El proceso formulación de escenarios es a menudo seguido por una fase El proceso de formulación de escenarios es a menudo seguido por una fase de desarrolló escenario. discusión, a veces discusión, a veces por un grupo distinto al que desarrolló el escenario. Se puede emplear de modo que se la discusión entre los grupos para defender y modificar los puntos de vista de modo que se desarrollen un sólido consenso y escenarios alternativos. Por ejemplo, el equipo de desarrollen un sólido consenso y escenarios alternativos. Por ejemplo, el equipo de planeación de una compaflIa podría desarrollar los escenarios y discutirlos con el equipo compañía podrIa desarrollar los de la alta dirección. Incluso Si flO se demuestra después que ninguno de los escenarios es alta dirección. Incluso si no se demuestra después que ninguno escenarios es verdadero, este proceso alienta la previsión de largo plazo del equipo de alta dirección y lo verdadero, alienta prevision del prepara mejor para reconocer y reaccionar a los cambios importantes del rnedio. importantes medio. COMBINACiÓN DE PRONÓSTICOS COMBINACIÔN DE PRONOSTICOS desarrollo del estudio de los pronósticos comprende la combinación de dos o Una rama de desarrollo del estudio de los pronósticos comprende la cornbinación de dos o más métodos de pronóstico para producir un pronóstico final. Un ejemplar del International pronóstico final. Un del Journal of Forecasting (Vol. 5, NtIm. 4, 1989) contiene una sección especial sobre esta 01 5, Núm. 1989) contiene una sección especial sobre esta técnica. Algunas partes resúmenes de tres artículos en este ejemplar ilustran nueva técnica. Algunas partes de los resirnenes de tres artIculos en este ejemplar ilustran la naturaleza del desarrollo de pronósticos combinados: Ia naturaleza Una investigación sobre 200 estudios demuestra que Ia combinación de pronósticos produce la investigación sobre aunque modestas en la precisión. Sin embargo, esta investigación no ganancias consistentes aunque modestas en Ia precision. Sin embargo, esta investigaciOn no define bien las condiciones bajo las cuales es más efectiva Ia combinación, ni cuántos condiciones bajo cuales es más efectiva la combinación, ni cuántos define bien deben combinarse en cada situación. métodos deben combinarse en cada situaciOn.66 El volumen de la investigación sobre combinación de pronOsticos es sustancial. No obstante, combinación de pronósticos es sustancial. se sabe poco relativamente sobre cuándo y cOmo los administradores combinan pronósticos. relativamente sobre cuándo y cómo los administradores combinan pronósticos. Elementos gerenciales importantes que requieren un mayor estudio incluyen el ajuste ajuste Elementos gerenciales importantes que requieren un mayor estudio incluyen gerencial de pronósticos cuantitativos, el uso de sistemas expertos en la cornbinaciOn de gerencial de pronósticos cuantitativos, el uso de sistemas expertos en la combinación de pronósticos y el análisis de costos de la combinación de pronósticos.77 análisis de costos de la combinación de pronósticos. 6 Scott Amlstrong, Forecasts: The the Beginning the Beginning 6 J. Scott Armstrong, "Combining Forecasts: The End of the Beginning or the Beginning of the End?" Intemational Journal of Forecasting, Vol. 5, Nüni. 4 (1989), pp. 585-592. International Joumal 01 Forecasting, Vol. 5, Núm. 4 (1989), pp. 585-592. 7 Essam Mahoud, "Combining Forecasts: Sorne Manageria! Issues", Intemational Joumal of Forecasting, Forecasts: Some Managerial Issues", International Journal 01Forecasting. Vol. Núm. 4 (1989), pp. 599-600. Vol. 5, Nñm, 4 (1989), pp. 599-600. pronósticos Los pronOsticos y las redes neurales 525 los años, combinación A través de los afios, se ha acumulado una considerable literatura respecto a la combinación conclusión línea de pronósticos. La primera conclusion de esta lInea de investigación es que se puede mejorar sustancialmente Ia precisiOn de los pronOsticos por medio de Ia combinación de varios sustancialmente la precisión de los pronósticos por medio de la combinación de varios individuales esa pronósticos mdividuales . . . Este documento proporciona una revisión y anotación de esa Este documento proporciona una revision y literatura ... 8 En los aflos venideros, es posible que se lleve a cabo una mayor investigación sobre años venideros, es posible que lieve investigación las ventajas de combinar pronósticos, junto con las técnicas para hacerlo. El objetivo de combinar pronósticos, junto con técnicas hacerlo. objetivo de las ventajas pronósticos precisos cuyo costo tales combinaciones será el de desarrollar pronósticos precisos cuyo costo sea efectivo. PRONÓSTICOS Y LAS REDES NEURALES LOS PRONOSTICOS Y LAS REDES NEURALES Los métodos convencionales de pronóstico, como los que se describen este libro, Los métodos convencionales de pronOstico,como los que se describen en este libro, dependen de datos históricos para desarrollar un modelo y utilizarlo para proyectar a futuro futuro interés. Estos valores proyectados convierten los pronósticos que se las variables de interés. Estos valores proyectados se convierten en los pronósticos que se utilizan desarrollar planes para el negocio. En estos modelos, se asume que el futuro utilizan para desarrollar planes para el negocio. En estos modelos, se asume que el futuro exactamente como el pasado, excepto para aquellas variables específicas reconocidas será exactamente corno el pasado, excepto para aquellas variables especIficas reconocidas por el modelo. modelo. ocasiones, modelos convencionales hacen suposiciones sobre la forma de En ocasiones, los modelos convencionales hacen suposiciones sobre la forma de la distribución la suposiciones que pudieran no estar sujetas verificación. distribución de Ia población, suposiciones que pudieran o no estar sujetas aaverificación. estimación que usan modelo regresión, asumen Por ejemplo, los intervalos de estirnación que usan un modelo de regresión, asurnen que la población fundamental sigue una distribución normal. una distribución nonnal. El desarrollo de la inteligencia artificial pretende duplicar el proceso El campo de desarrollo de Ia inteligencia artificial pretende duplicar el proceso del cerebro hwnano el sistema nervioso mediante la computadora. cerebro humano y el sisterna nervioso mediante Ia computadora. Aunque este campo se campo se origina en la biologla y en Ia psicologIa, está avanzando con rapidez hacia otras areas, la biología y en la psicología, está avanzando rapidez hacia otras áreas, ongina incluyendo los negocios la economía. tres principales impulsos la inteligencia incluyendo los negocios y Ia economia. Los tres principales impulsos en Ia inteligencia artificial del lenguaje, Ia robótica y las redes neurales artificiales. Este artificial son el procesamiento del lenguaje, la robótica y las redes neurales artificiales. Este último posee las aplicaciones más comerciales, incluyendo a los pronósticos. ültimo campo posee las aplicaciones más comerciales, incluyendo a los pronósticos. En las redes neurales, se prograrnan muchos ejemplos en la computadora, ejemplos redes neurales, se programan muchos ejemplos la computadora, En que captan el nivel completo de relaciones anteriores entre todas las variables que pudieran el completo de relaciones antenores entre todas las variables que pudieran afectar los resultados de las variables dependientes. Después, el programa de redes neurales resultados variables dependientes. Después, el programa de redes neurales asimila estos ejemplos e intenta desarrollar las relaciones fundamentales "aprendiendo" al desarrollar las relaciones fundamentales "aprendiendo" al asirnila estos ejemplos avanzar proceso. avanzar el proceso. Este proceso de aprendizaje, también denominado entrenarniento, es proceso de aprendizaje, también denominado entrenamiento, es análogo al aprendizaje de capacitación del ser humano en el trabajo. análogo al aprendizaje de capacitación del ser humano en el trabajo. Algunos investigadores de pronósticos han apreciado la similitud entre las técnicas de Algunos investigadores pronósticos han apreciado la similitud entre las técnicas de redes neurales y los métodos convencionales de pronóstico que pretenden encontrar redes neurales y los métodos convencionales de pronóstico que pretenden encontrar variables predigan con éxito la variable dependiente. La ventaja teórica de las redes variables que predigan con éxito Ia variable dependiente. La ventaja teOrica de las redes herramienta de pronóstico es se necesita especificar la relación por neurales como herramienta de pronOstico es que no se necesita especificar la relaciOn por adelantado, método comprende aprendizaje sobre utilizando adelantado, ya que el método comprende el aprendizaje sobre las relaciones utilizando los 8 8 Robert T. Clemen, "Combining Forecasts: A Review and Annotated Bibliography", International Robert CIernen, "Cornbining Forecasts: A Review and Annotated Bib1iography", International 01 Forecasting. Vol. 5, Núm. (1989), pp. 559-583. Journal of Forecasting, Vol. 5, Nim. 44(1989), pp. 559-583. 526 Elementos de juicio en los pronOsticos de juicio pronósticos Capítulo 11 CapItulo 11 ejemplos dados. Además, las redes neurales no requieren ningima suposición sobre la la ejemplos dados. Además, las redes neurales no requieren ninguna suposición distribución fundamental de la población y, a diferencia de muchos métodos convencionales de pronóstico, pueden funcionar con datos incompletos. funcionar datos incompletos. A una aplicación de red neural exitosa se le denomina en ocasiones enlace compatible. en ocasiones Esto significa que el programa de red neural puede rápida y fácilmente reemplazar el red neural puede rápida y fácilmente reemplazar el Esto significa que programa modelo existente, digamos un análisis de regresión, sin perder continuidad. Se puede lograr precisos, un impacto a veces una mejora en el desempeflo, como pronósticos más precisos, con un impacto veces una mejora en el desempeño, como pronósticos mínimo Las neurales son valiosas en los casos mInimo en las operaciones actuales. Las redes neurales son en especial valiosas en los casos en que faltan insumos o están altamente correlacionados, o cuando los sistemas no son faltan insumos o están altamente correlacionados, o cuando los sistemas son en extremo. lineales en extremo. A continuación se presentan algunos ejemplos del uso exitoso de redes neurales en continuación presentan algunos ejemplos del uso exitoso de neurales casos prácticos. Estos ejemplos fueron proporcionados por NeuralWare, Inc., un proveedor prácticos. ejemplos fueron proporcionados por NeuraiWare, Inc., un proveedor comercial de programas de redes neurales (Penn Center West, Building IV, Suite 227, comercial de programas de redes neurales (Penn Center West, Building IV, Suite 227, Pittsburgh, PA 15276). 15276). millones de dólares, • Una planta de Kodak en Texas redujo sus costos en 3 millones de dólares, manteniendo el rendimiento y calidad del producto. Comenzaron reuniendo datos operativos históriproducto. Comenzaron reuniendo datos operativos histórirendirniento cos, que se utilizaron en una red neural para predecir la calidad del producto en función de los diversos parámetros de proceso. Uno • Uno de los problemas clásicos en la interpretación de seflales sIsmicas para la los problemas clásicos en la interpretación de señales sísmicas para la exploración petrolera consiste en encontrar la primera evidencia de una onda en encontrar la primera evidencia de una onda de choque en los registros de los sensores. Los métodos tradicionales de proceso de métodos señales no han tenido mucho éxito en identificar la primera evidencia: solo el 30% sólo de un algoritmo. Varias compañIas petroleras han utilizado con éxito una red neural compañías para identificar la primera onda, Amoco reporta una tasa del 95%. Esto tuvo un gran del 95%. Esto tuvo un gran impacto en su capacidad para mejorar el proceso de datos sIsmicos para el modelo datos sísmicos el modelo de embalse. Un alemán de motores de ventiladores eléctricos automotrices empleaba • Un fabricante alemán de motores de ventiladores eléctricos automotrices empleaba inspectores maestros para determinar si im motor terminado era muy ruidoso o ruidoso o inspectores maestros para determinar si un motor terminado aprender presentaba un sonido "curioso". A una red neural le tomó una semana para aprender A una red neuralle de un inspector maestro y actualmente realiza el trabajo de pruebas de ruido. El inspector maestro actualmente realiza el pruebas ruido. El de impacto financiero es un producto uniforme de mayor calidad con pocas quejas por parte de los clientes. Los inspectores maestros fueron relevados de este trabajo de Los inspectores fueron este trabajo de gran presión para concentrarlos en otras tareas de mejorarniento de calidad en la concentrarlos en de mejoramiento la gran fábrica. • Desde 1989, una compafila de préstamos ha utilizado una red neural para determinar si compañía para determinar si los clientes son sujetos de un crédito instantáneo. redes neurales pam • Varias compafilas han descubierto que se pueden usar redes neurales para desarrollar compañías han descubierto que se pueden indicadores ütiles en el comercio. Los resultados indican que los indicadores comerciaútiles les de las redes neurales, acoplados con estrategias de comercio apropiadas, pueden las redes neurales, acoplados con estrategias de comercio apropiadas, les arrojar utilidades en forma congruente en el mercado. fonna Resumen pronôsticos Resumen de pronósticos de juicio 527 • La Air Force está empleando una red neural para pronosticar las fallas de componentes pronosticar las fallas de componentes en sus aviones. Se reunieron diversos datos sobre cada avión y se entrenó a la red neural para predecir la posibilidad de fallas específicas en aviones específicos. Los resultados especIficas en aviones especificos. Los el inventario de refacciones y el mantenimiento preventivo. se usan para el inventario de refacciones y el mantenimiento preventivo. • Se ha desarrollado un producto comercial para predecir los resultados de las carreras de desarrollado un producto comercial para predecir los resultados de las carreras de específica caballos. caballos. El sistema requiere que el usuario alimente información especIfica sobre los caballos en uria carrera. Acierta el 80% de las veces que decide las probabilidades de veces una carrera. Acierta el apuesta al favorito. de la apuesta a! favorito. Con ejemplos como éstos que actualmente disfrutan de éxito en práctica, es Con ejemplos como éstos que actualmente disfrutan de éxito en la práctica, no es dificil imaginar a un sistema de red neural prediciendo con éxito el volumen mensual de red neural prediciendo con volumen dificil imaginar ventas, ventas, la tasa de abstencionismo de los empleados o la tasa ilder de interés. Liberadas de abstencionismo empleados líder de interés. Liberadas de las restricciones de las restricciones de confinarniento por adelantado de relaciones específicas yy de la confinamiento por adelantado de relaciones especIficas de la suposición de distribuciones de la población, estas redes tienen un suposición de las distribuciones de la población, estas redes tienen un gran potencial de pronósticos precisos y su uso está ganando una amplia aceptación. su uso está ganando una amplia aceptación. RESUMEN DE PRONÓSTICOS DE JUICIO RESUMEN DE PRONOSTICOS DE JUICIO El peligro en el uso de Ia mayorIa de los métodos de pronóstico que se exponen en este uso de la mayoría de los métodos pronóstico exponen este El peligro texto consiste que comprenden la manipulación de datos históricos para generar texto consiste en que comprenden Ia manipulación de datos históricos para generar el pronóstico. Esta práctica es un procedimiento válido si el pronóstico es para futuro pronóstico. Esta práctica es uii procedimientoválido si el pronóstico es para el futuro cercano, pero se hace cada vez rnás sospechosa al incrementarse el horizonte del pronóstico. más al Los métodos que se abordan en este capItulo son valiosas adiciones a! arsenal del abordan en este capítulo son valiosas adiciones al arsenal del Los métodos que pronosticador cuando se considera la particular preocupación de alta dirección: la pronosticador cuando se considera Ia particular preocupación de la alta dirección: Ia largo plazo del medio ambiente de la compañía. predicción a largo plazo del medio ambiente de la compañIa. Diversos autores han fascinado al público en general con sus especulaciones sobre las a! püblico en general con especulaciones de largo plazo actualmente evidentes en nuestra sociedad y el futuro que auguran. tendencias de largo plazo actualmente evidentes en nuestra sociedad y el futuro que auguran. más provocativos se encuentran Entre los más provocativos se encuentran Alvin Toffler, El shock del futuro (New York: Random House, 1970). 1970). Alvin Toffler, El shock delfuturo (New York: (New York: Bantam 1980). Alvin Toffler, La tercera ola (New York: Bantam Books, 1980). Alvin Toffler, La York: John Naisbitt, Megatrends (New York: Warner Books, 1982). John Naisbitt, Megatrends Books, 1982). York: John Naisbitt y Patricia Aburdene, Megatrends 2000 (New York: Aburdene, Megatrends John William Morrow, 1990). 1990). Estos autores poseen una habilidad unlca para especular sobre el futuro en formas Estos autores poseen una habilidad 1nica para especular sobre el futuro en formas provocativas, sin embargo, las necesidades específicas de pronóstico de un negocio provocativas, sin embargo, las necesidades especIficas de pronóstico de un negocio requieren de procedimientos más formales que arrojen proyecciones plausibles de la requieren de procedimientos más formales que arrojen proyecciones plausibles de la su ambiente competitivo. capítulo algunos conformación a largo plazo de su ambiente competitivo. Este capItulo se refiere a algunos los métodos que pueden emplearse para formular tales proyecciones. de los métodos que pueden emplearse para formular tales proyecciones. 528 pronósticos Elementos de juicio en los pronósticos Capítulo 11 Capitulo 11 OTROS ELEMENTOS DE JUICIO EN LOS PRONÓSTICOS ELEMENTOS DE JUICIO EN LOS PRONÔSTICOS Se han desarrolado diversas técnicas para ayudar a quienes toman decisiones en ci proceso el evaluación de información sobre el futuro incierto y tomar las mejores decisiones. Con de evaluación de información sobre el futuro incierto y tomar las mej ores decisiones. Con frecuencia, estas técnicas se abordan en libros de texto y artIculos periodísticos bajo el título artículos periodIsticos tItulo general de "toma de decisiones", o en ocasiones "toma de decisiones bajo incertidumbre". "toma de decisiones", o en ocasiones "toma de decisiones bajo incertidumbre". Cuando los administradoresse enfrentan aa la tarea de tomar decisiones de frente a lo Cuando los administradores se enfrentan Ia tarea de tomar decisiones de frente lo incierto, su habilidad de pronosticar se convierte en un elemento crítico en el proceso de incierto, su habilidad de pronosticar se convierte en un elemento crItico en el proceso de de decisiones. toma de decisiones. Cuando se ha concluido el análisis de datos históricos, quien toma las decisiones debe quien formular un juicio con respecto a las alteraciones en el curso de acción de la empresa. En alteraciones en el curso empresa. formular un juicio con respecto otras palabras, el pronóstico otras palabras, ci analista debe enlazar los resultados del proceso de pronóstico dentro de los procedirnientos de toma de decisiones existentes en la empresa. A continuación se continuación los procedimientos de toma de decisiones existentes en Ia empresa. exponen brevemente algunos de los elementos de la teoría de decisiones que con frecuencia algunos elernentos de Ia teoria de decisiones que con frecuencia son relevantes en esta etapa del proceso. esta etapa del proceso. Quienes toman decisiones usan a menudo el concepto de valor esperado, ya sea en sea en Quienes toman decisiones usan a menudo el concepto de valor esperado, forma explícita o implícita. Este concepto comprende el valor promedio que puede tomar una forma explIcita impilcita. Este concepto comprende el valor promedio que puede tomar variable numérica aleatoria lo largo de varias pruebas. En la tabla 11.1 presenta variable nurnérica aleatoria aa lo largo de varias pruebas. En la tabla 11.1 se presenta X una variable aleatoria discreta X en una distribución de probabilidad; se muestra cada valor cada valor cada asumir Xjunto con la probabilidad posible que puede asurnir X junto con la probabilidad de cada uno. El El valor esperado de una variable aleatoria discreta es el valor promedio que de una variable aleatoria discreta es promedio que asume la variable aleatoria durante un gran nümero de observaciones. durante un número observaciones. Nótese que Ia suma de probabilidades en Ia tabla 11.1 es 1.00 o 100%, lo que significa la la 11.1 es que se ha identificado cada valor posible que puede asumir X. Suponga que la tabla 11.1 ha identificado cada valor posible que puede asumir X. Suponga que la tabla 11.1 representa el nñrnero de contratos rnayores que una empresa firmará durante el siguiente contratos mayores una empresa firmará durante el siguiente representa número año fiscal. La pregunta que responde el valor esperado es: ¿Cuántos pedidos nuevos pueden afio fiscal. La pregunta que responde el valor esperado es: Cuántos pueden TABLA 11.1 DISTRIBUCiÓN DE PROBABILIDAD PROBABILIDAD TABLA 11.1 DISTRIBUCION ESPERADO DEL VALOR ESPERADO x 1 P(X) .10 .20 .25 .30 .15 1 2 2 3 4 5 - 1.00 elementos de juicio en los pronósticos Otros elementos de juicio en los pronOsticos 529 esperarse promedio, si válida la distribución probabilidad de la tabla 11.1? esperarse en promedio, si es válida la distribución de probabilidad de la tabla 11 .1? La ecuación 11.1 se usa para calcular el valor esperado de una distribución de probabilidad ecuación 11.1 usa para calcular el valor esperado de una distribución de probabilidad como la que se muestra en Ia tabla 11.1. la que se muestra en la tabla 11.1. E(X) E(X) = !X[P(X)] X[P(X)] (11.1) en donde E(X) valor esperado E(X) = valor esperado X valores que puede asumir X = valores que puede asumir la variable aleatoria aleatona P(X) = probabilidad de ocurrencia de cada X cada X P(X) probabilidad de ocurrencia Se Se puede calcular el valor esperado de Ia tabla 11.1 mediante la ecuación 11 .1 de la la 11.1 mediante la ecuación 11.1 de manera siguiente: siguiente: E(X) = 1(.10) + 2(.20) 3(.25) + 4(.30) + 5(J5) E(X) = l(.lO) + 2(.20) + 3(.25) + 4(.30) + 5(.15) = 3.2 = 3.2 El esperado de distribución de probabilidad de la tabla 11.1 es 3.2. en este El valor esperado de la distribución de probabilidad de la tabla 11.1 es 3.2. Si en este X el número el próximo año se podría ejemplo X representa ci nárnero de contratos mayores para el próximo aflo fiscal, se podrIa esta misma distribución, firmarían en promedio, se repitiera muchas decir que, en prornedio, si se repitiera muchas veces esta misma distribución, se firmarian nuevos contratos. Nótese que no posible el valor 3.2 en cualquier año; sólo son 3.2 nuevos contratos. Nótese que no es posible el valor 3.2 en cualquier aflo; solo son 5). No obstante, el valor 3.2 representa el valor posibles los valores enteros (1, 2, posibies los valores enteros (l, 2, 3, 4, 5). No obstante, el valor 3.2 representa el valor promedio de la distribución a lo largo de muchos intentos. frecuente proniedio de Ia distribución a lo largo de muchos intentoS. Es frecuente que quienes toman decisiones se interesen en dichos valores esperados y los utilicen como su mejor expectativa de interesen esperados su mejor expectativa de decisiones nwnéricas críticas en la planeación del futuro incierto. variables numéricas criticas en la planeación del futuro incierto. utilidad sobre Todos los que toman decisiones utilizan los conceptos de la teoría de la utilidad sobre toman decisiones utilizan los conceptos de la teorla diaria, tanto para decisiones personales como de la organización. Sin embargo, una base diana, tanto para decisiones personales como de la organización. Sin embargo, dan cuenta de que la teoría de la utilidad se ha estudiado formalmente y que su pocos se dan cuenta de que la teorIa de la utilidad se ha estudiado formalmente y que su puede mejorar el proceso de toma de decisiones. La teoría de la utilidad reconoce uso puede mejorar ci proceso de toma de decisiones. La teorla de Ia utilidad reconoce formalmente dólares que no pueden juzgarse observando formalmente las cantidades en dólares que no pueden juzgarse simplemente observando sus valores. debe considerar también en empresa el impacto diversas cantidades valores. Se debe considerar tarnbién en la empresa ci impacto de diversas cantidades en dólares. dOiares. Considérense las tablas 11.1 y 11 .2. En la tabla 11.1 se calculó que el valor esperado 11.1 11.2. En Ia tabla 11.1 se calculó que el valor esperado Considérense las TABLA 11.2 DISTRIBUCION DE PROBABILIDAD TABLA 11.2 DISTRIBUCiÓN DE PROBABILIDAD DE LA TEORIA DE LA UTILIDAD TEORiA UTILIDAD DE x X -10 -5 0 O P(X) 1 19.8 1 - .15 .10 .25 .25 .25 1.00 530 Elementos de juicio en los pronOsticos pronósticos CapItulo 11 Capítulo 11 sería También de la tabla 1.2 3.2, calculado mediante la ecuación serIa 3.2. Tarnbién el valor esperado de Ia tabla I11.2 es 3.2, calculado mediante Ia ecuación 11.1, como sigue: sigue: 11.1, E(X) -10(.15) + -5(.10) O(.25) + 1(.25) + 19.8(.25) E(X) = 1O(.15) + 5(.lO) + + 0(.25)+ 1(.25) + 19.8(.25) =3.2 3.2 Suponga ahora que los valores de X tanto en la tabla 11.1 como en la 11.2 Suponga ahora que los valores de X tanto en Ia tabla 11.1 como en la 11.2 representan las posibles utilidades netas de una compañIa en millones de dólares. El una compañía millones de dólares. El representan las posibles utilidades netas administración la compañía debe decidir si desean embarcarse en ci proyecto equipo de adrninistración de Ia compafila debe decidir si desean embarcarse en el proyecto reflejado por las posibles utilidades de Ia tabla 11.1, o si prefieren Ia imagen de utilidades la 11.1, si prefieren la imagen de utilidades que se refleja en la tabla 111.2. Si solo se emplea el concepto de valor esperado, ambos emplea el concepto de valor esperado, ambos que refleja en la tabla 1 .2. Si sólo proyectos serIan idénticos en atractivo, ya que presentan el mismo valor esperado, proyectos serían idénticos en atractivo, ya que presentan el mismo valor esperado, 3.2 millones de dólares. dólares. Sin embargo, nótese la vasta diferencia entre los dos cuadros en términos de riesgo Sin embargo, nOtese la vasta diferencia entre los dos cuadros en términos de riesgo la tabla 11.1 es imposible incurrir en una pérdida. peor y retribución. En la tabla 11 . I es irnposible incurrir en una pérdida. Incluso en la peor situación posible, habrIa una utilidad positiva de I rniliOn de dólares. Por otra parte, la habría una utilidad positiva 1 millón de dólares. millones dólares. la tabla 11.2 hay distintas mayor utilidad posible es solo de 5 millones de dólares. En la tabla 11.2 hay distintas utilidad posible es sólo posibilidades posibilidades de perder una gran cantidad de dinero. Por otra parte, es posible una gran una gran cantidad de dinero. Por otra parte, es posible una gran utilidad de 19.8 millones de dólares. Una compañía conservadora podría elegir la utilidad de 19.8 millones de dólares. Una compañIa conservadora podria elegir la inversión inversion que se refleja en Ia tabla 11 .1, mientras que una companIa agresiva escogería refleja en la tabla 11.1, mientras que una compañía agresiva escogerla la imagen de utilidadlpérdida de Ia tabla 11 .2. Los procedimientos de la teoria de imagen de utilidad/pérdida de la tabla 11.2. Los procedimientos de la teoría decisiones permiten a quienes las toman reflejar fonnalmente sus actitudes hacia decisiones permiten a quienes las toman reflejar formalmente sus actitudes hacia en el proceso de toma de decisiones. diferentes cantidades de dinero en el proceso de toma de decisiones. leoria de decisión se refiere fonnalmente a los elementos La teoría de decision se refiere formalmente a los elementos que comprenden la comprenden funciOn de tonia de decisiones de los IIderes empresariales. A menudo, los valores esperados función de toma de decisiones de los líderes empresariales. A menudo, los valores esperados teOlía de decisiones son entrelazadas dentro de esta más general consideración de toma y la teorla de decisiones son entrelazadas dentro de esta más general consideración de toma ayudar quienes toman de decisiones. También, se emplea el diagrama de árbol para ayudar a quienes toman de decisiones. También, se emplea eI diagraina de árbol decisiones a visualizar una situación compleja y a tomar decisiones racionales. En Ia fig. situación compleja y tomar decisiones racionales. En la fig. decisiones a visualizar 11.1 se muestra uno de estos diagrarnas de árbol. 11 .1 se muestra uno de estos diagramas la naturaleza de las ventas La fig. 11 I refleja Ia incertidumbre que existe sobre Ia naturaleza de las ventas La fig. 11.1 refleja la incertidumbre que futuras e incorpora la decisiOn entre construir una nueva planta o reparar Ia vieja. El futuras incorpora decisión entre construir una nueva planta reparar la vieja. El problema consiste en que si la compañIa supiera que habrIa una demanda alta, serIa probiema consiste en que si la compañía supiera que habría una demanda alta, sería mejor construir la nueva planta; por otra parte, si se supiera que habrIa una baja mejor construir Ia nueva planta; por otra parte, si se supiera que habría una baja demanda, las utilidades serlan rnayores reparando la planta vieja. Incluso en este sencillo serían mayores reparando Ia planta vieja. Incluso en este sencillo demanda, ejemplo, se puede apreciar el beneficio del diagrama de árbol: permite a quienes toman quienes toman ejemplo, decisiones ..,pbservar las diversas opciones disponibles, identificar aquellas incertidumincertidumdecisiones o bservar las diversas opciones disponibles, bres que están más allá del control de laIa ernpresa ydeterminar de manera explícita bres que están rnás allá del control de empresa y determinar de manera explicita los costos, utilidades probabilidades de eventos futuros. En situaciones más los costos, utilidades yyprobabilidades de eventos futuros. En situaciones más complicadas, son evidentes los beneficios del diagrama de árbol y de teoría fonnal complicadas, son evidentes los beneficios del diagrama de árbol y de la teorla formal de decisiones. El teorema de Bayes es un concepto estadístico diseñado para revisar las proEl leorema de Bayes es un concepto estadistico diseflado para revisar las probabilidades preliminares con base en evidencia de muestra. Este concepto es a menudo babilidades preliminares con base en evidencia de muestra. Este concepto es menudo aplicable en situaciones en las que se determina Ia estimación de probabilidades de eventos se detennina la de eventos futuros desconocidos y luego se modifican después de reunir evidencia de muestra. Un futuros desconocidos y luego se modifican después de reunir evidencia de muestra. Un mercado prueba utilizado muchos fabricantes ejemplo sería el concepto de mercado de prueba utilizado por muchos fabricantes de ejemplo serIa ci concepto . Otros elementos de juicio en los pronósticos 531 Utilidad - - - - - - $150 millones - - - - - -$40 inillones $40 millones ~~;;:; \(S ,~~ '&~ - - - - - - $150 millones ~ .~c .Z "" C, (c C, ~~ b<~-$' ~~~ 4& ,o.~ > CP"" 0° /VO éJJlJp¡' 11pJi4 lélJ' léJ of0 4 // C,> P/éJ1}téJ - - - - $40 millones $40 millones , '1, 0 6 - - - - - - - - - - - - $40 millones Figura 11.1 árbol. Figura 11.1 Diagrama de árbol. productos de consumo. Una compama corno éstas podria estirnar como muy alta la productos de consumo. Una cornpañia como éstas podría estimar como muy alta Ia probabilidad de la aceptación del püblico de un nuevo producto. Sin embargo, antes de probabilidad de aceptación del público de nuevo producto. embargo, antes arriesgar los millones de dólares que requiere una campafia nacional, se debe emprender un campaña nacional, se debe mercado prueba en áreas que la compañía reconozca como buenos mercados repremercado de prueba en areas que Ia cornpañIa reconozca como buenos mercados representativos. Entonces, los resultados de esta prueba de mercado se emplean para modificar sentativos. Entonces, los resultados de esta prueba de mercado se emplean para modificar las estirnaciones originales del éxito del producto yy se torna una decision sobre la las estimaciones originales del éxito del producto se toma una decisión sobre la introducción del producto nacional. introducciOn del producto a nivel nacional. La fig. 11 .2muestra una aplicación del teorema de Bayes en una situación de mercado fig. 11.2 muestra una aplicaciOn del teorema de Bayes en una situación de mercado prueba. La administración de gran compañía productos de consumo necesita de prueba. La administraciOn de una gran companIa de productos de consumo necesita introduce nuevo producto a nivel nacional. Estiman que su nuevo producto decidir si introduce un nuevo producto a nivel nacional. Estiman que su nuevo producto 50% de probabilidad de ventas altas en el mercado nacional. Están considerando tiene un 50% de probabilidad de ventas altas en el mercado nacional. Están considerando utilizar un mercado de prueba para determinar si pueden pronosticar mejor las ventas altas prueba para detenninar si pueden pronosticar mejor las ventas altas 11.2 presenta un árbol de decisión o bajas del nuevo producto. La fig. II .2 presenta un árbol de decisiOn de los resultados del de prueba. mercado de prueba. 532 Predicción del mercado de pi-ueba prueba . ~o , Yv";; ~~ juicio en los pronósticos Elementos de juicio en los pronOsticos =.40 Capitulo 11 Capítulo 11 =40 -- --1 del Ventas del nacional mercado nacional I I I I I I I : P(S) = .40 + .075 = .475 .475 P(H/S)= P(H/S) = .4~5 =84 = .84 =.10 --T=.10 ----i-- I I I I I I I = .075 __ J =075-- P(F) = .10 + .425 = .525 .10 + .425 = .525 P(L/F) 81 P(LIF) = .425 = .81 .525 . = .425 = .425 --- .J Figura 11.2 Decision de Bayes para Ia introducciOn de un nuevo producto. Figura 11.2 Decisión para la introducción de experiencia anterior muestra que cuando se introdujo un nuevo producto se La experiencia anterior muestra que cuando se introdujo un nuevo producto y se alcanzaron ventas altas, el mercado estas ventas altas el 80% alcanzaron ventas altas, el mercado de prueba predijo con éxito estas ventas altas el 80% las veces. También la experiencia cuando introdujo nuevo de las veces. Tarnbién la experiencia anterior muestra que cuando se introdujo un nuevo ventas fueron bajas, mercado de prueba predijo éxito las ventas bajas producto y las ventas fueron bajas, el mercado de prueba predijo con éxito las ventas bajas las veces. Se puede utilizar el teorema el 85% de las veces. Se puede utilizar el teorerna de Bayes para calcular la probabilidad de nuevo producto éxito el mercado nacional que un nuevo producto tenga éxito en el mercado nacional bajo diferentes condiciones del mercado de prueba. fig. 11.2 muestra el cálculo dos probabilidades particular mercado de prueba. La fig. 11 .2 muestra el cálculo de dos probabilidades de particular interés. interés 9 • Si Ia prueba de mercado predice el éxito, hay un 84% de probabilidades de que el mercado predice el un 84% de probabilidades que el Si la prueba altas a nivel producto tenga ventas altas a nivel nacional. • Si Taprueba de mercado predice el fracaso, hay un 81 % de probabilidades de que el Si la prueba de mercado predice ci fracaso, hay un 81% de probabilidades de que el bajas a nivel nacional. producto tenga ventas bajas a nivel nacional. este ejemplo, mercado ayudaría a la administración a decidir si se En este ejemplo, una prueba de mercado ayudarIa a Ia administración a decidir si se el introduce o no ci producto a nivel nacional. La precisión del mercado de prueba es suficiente nacional. precision del mercado de prueba es 9 general del teorema de Bayes para eventos Al, A z . La propuesta general del teorerna de Bayes para nneventos A1, A7,, .... , Al! es A es . P(A1 I B) = P(A1)P(B I A1) P(A)P(B I A1) + P(A2)P(B I A2) + + P(A)P(B I A) fl Administración del proceso de pronOstico AdministraciOn proceso de pronóstico 533 para modificar la probabilidad de ventas altas del valor previo a Ia prueba de 50% ya sea modificar probabilidad de ventas altas del valor previo la 50% ya sea probabilidades teorema de a 84% (éxito) o a 81 % (fracaso); estas probabilidades se calcularon usando el teorema de (éxito) o a 81 (fracaso); Bayes. Será mucho más fácil tomar Ia decisión sobre la introducción del producto de lo que la decision Bayes. la del la hubiera sido sin la pmeba de mercado, ya que Ia probabilidad de éxito cambiará de manera prueba de mercado, significativa del 50%. significativa del valor previo a la prueba del 50%. En la ley de Bayes, se incorpora el procedimiento estadIstico formal pam modificar ley de Bayes, se incorpora el procedimiento estadístico para las probabilidaes previas con base en nueva evidencia. Se puede encontrar una exposición probabilidaes previas evidencia. de este procedimiento en libros de estadIsticas administrativas, inferencia estadIstica y procedimiento libros de estadísticas administrativas, estadística toma de decisiones estructurada.1° decisiones estructurada. 10 ADMINISTRACIÓNDEL PROCESO DE PRONÓSTICO ADMINISTRACION DEL PROCESO PRONOSTICO En el cap. 1 se presentó el tema de los pronósticos con sugerencias sobre su utilidad dentro los de la organización moderna. necesidad pronosticar requerimientos de las de la organización modema. La necesidad de pronosticar los requerimientos de las organizaciones modernas de fonnular decisiones oporturas al enfrentar la incertidumbre. organizaciones modernas de fonnular decisiones oportunas al enfrentar la incertidumbre. Este proceso de realizar adivinaciones sustentadas sobre la incertidumbre futura (pronóstide realizar adivinaciones sustentadas sobre la incertidumbre futura (pronósticos) comprende un proceso racional de extender al futuro los datos históricos y experiencias. racional de extender y experiencias. Ahora, con el beneficio de los capítulos intermedios que cubren numerosas técnicas de Ahora, con el beneficio de los capitulos intennedios que cubren numerosas técnicas de pronóstico, es posible revisar, mediante estas técnicas, las nociones básicas del cap. 1, para mediante estas técnicas, las nociones básicas del cap. importantes. ilustrar los puntos importantes. El proceso de pronóstico El proceso Un punto clave que se abordó en el cap. 1 es la importancia del uso del buen juicio Un punto dave que se abordó en el cap. es la importancia uso del buen juicio administrativo junto con técnicas cuantitativas para producir buenos pronósticos. El administrativo junto con técnicas cuantitativas para producir buenos pronósticos. El buen administrativo es de hecho importante y se puede ahora ilustrar mediante las diversas juicio administrativo es de hecho importante y se puede ahora ilustrar mediante las diversas técnicas de pronóstico expuestas en los capItulos previos. Si los pronósticos han de tédnicas de pronóstico expuestas en los capítulos previos. Si los pronósticos han de ser precisos, comprendidos y utilizados por quienes toman decisiones en empresa, siempre precisos, comprendidos y utilizados por quienes toman decisiones en la empresa, siempre mezcla juiciosa de técnicas cuantitativas y sentido común. es necesaria una mezcla juiciosa de técnicas cuantitativas y sentido comi.in. El análisis de series de tiempo (descomposición) es un buen ejemplo de una técnica comprende necesidad del uso del análisis de la historia que comprende la necesidad del uso del buen juicio junto con el análisis de la historia previa. Una cornpañia podría pronosticar la historia anterior de ventas unitarias mediante compañía podrIa análisis tiempo que utilizara datos mensuales y arrojara un un programa de análisis de series de tiempo que utilizara datos mensuales y arrojara un análisis tendencia, de variación cíclica, de variación estacional movimientos análisis de tendencia, de variación cIclica, de variación estacional yymovimientos irregulares. recomposición de estos cuatro factores comprendería irregulares. Un recomposición de estos cuatro factores en meses futuros comprenderla un juicio considerable con respecto a los elementos cíclicos ee irregulares y, si se un considerable con respecto a los elementos cIclicos irregulares y, si se fonnularan estos elernentos, se producirIa un pronóStico utilizable de ventas unitarias. Al Al formularan estos elementos, se produciría un pronóstico utilizable 10 10 Véase, por ejemplo, John E. Hanke y Arthur G. Reitsch, Understanding Business Statistics, 2a. ed. Hanke y Arthur G. Reitsch, Understanding Business Statistics, ed. Véase, por ejemplo, John (Homewood, 111.:Richard D. Irwin, Inc., 1994) cap. 18. 18. Ill.: Richard D. Irwin, Inc., 534 Elementos de juicio en los pronOsticos pronósticos Capítulo 11 CapItulo 11 utilizar el método de descomposición es importante decidir cuántos periodos históricos importante decidir cuántos periodos históricos utilizar método de descomposición análisis. incluir en el análisis. Siempre que se lleve a cabo un pronóstico, el análisis de regresión comprende Ia regresión la Siempre que se lieve necesidad del uso del juicio junto necesidad del uso del juicio junto con las técnicas estadIsticas. Si se conduce una las técnicas estadísticas. Si conduce una regresión multiple utilizando como variable dependiente la tasa de desempeño en regresión múltiple utilizando como variable dependiente la tasa de desempeño en el puesto de los empleados y como variables de predicción el examen inicial de aptitud y la empleados como variables aptitud y la puesto edad, se podría obtener un valor de cuadrada de 75%. Además los valores las edad, se podria obtener un valor de R cuadrada de 75%. Además los valores tt de las podrían el valor de regresión F. variables de predicción podrIan ser ambos significativos junto con el valor de regresión F. Entonces, el pronosticador se ye tentado a medir las dos variables de predicción para cada Entonces, pronosticador ve tentado aspirante al puesto, desempeño en puesto. Sin embargo, es necesario aspirante al puesto, para predecir el desempeflo en el puesto. Sin embargo, es necesano preguntas adicionales. Primero, ,es suficiente la explicación del 75% de la considerar tres preguntas adicionales. Primero, ¿es suficiente Ia explicación del 75% de la varianza fines intuitivo la deseable varianza para fines de pronóstico? Quizá el juicio intuitivo sobre Ia contratación deseable un método quizá se requiera precisión el prode una persona sea un método superior, o quizá se requiera de mayor precision en el proceso de pronóstico y debieran sondearse otras variables de predicción. Segundo, ¿se puede de pronóstico y debieran sondearse otras variables de predicción. Segundo, ,se asumir que futuros aspirantes sen idénticos en los muestreados en el estudio asurnir que futuros aspirantes sen idénticos en esencia a los muestreados en el estudio de regresión? Si difieren en cualquier forma sustancial, el modelo de pronóstico no será de regresión? Si difieren en cualquier forma sustancial, el modelo de pronóstico no será válido. válido. Por ültimo, ¿se justifica el costo del proceso de pronóstico en términos del último, ,se justifica el costo del proceso de pronóstico en términos del beneficio recibido? La prueba de Ia empresa podria ser costosa, en especial si se beneficio recibido? La prueba de la empresa podría ser costosa, en especial si se adquiere de una agencia externa de pruebas y debe justificarse mediante los beneficios beneficios adquiere de una agencia externa pronóstico. del pronóstico. Las técnicas de Box-Jenkins expuestas en este texto ilustran un problema común de texto ilustran un problema comin de Las técnicas de BoxJenkins expuestas l. pronóstico mencionado en el cap. 1. Estos procedimientos son a menudo métodos superiores pronóstico, que producen menores errores pronóstico en muchas situaciones complede pronóstico, que producen menores errores de pronóstico en muchas situaciones complejas. Su desventaja consiste en que se requiere de cierta capacidad por parte del usuario. Si Su desventaja que se requiere de cierta capacidad por parte del usuario. Si el proceso que genera el pronóstico es un total rnisterio para quien toma las decisiones, el pronóstico un total misterio para quien toma las decisiones, el el proceso pronóstico pudiera ser descartado en Ia administración de la organización sin importar qué ser descartado en la administración la organización sin impOltar qué tan preciso sea. tan Las pruebas de chi cuadrada expuestas en este libro ilustran Ia extension del análisis libro ilustran la extensión Las pmebas de datos dentro de areas de datos no nurnéricas. La opinion de Ia gente es por lo regular el áreas datos no numéricas. opinión la gente es por lo regular el insumo de estas técnicas y penniten a las organizacion es probar las reacciones del público insurno de estas técnicas y permiten a las organizacion es probar las reacciones del püblico hacia nuevos productos, campanas publicitarias o irnagen de la compañIa. Existen mucha.s productos, campañas publicitarias o imagen de la compañía. Existen muchas otras técnicas diseñadas para datos cualitativos, aunque las pruebas de chi cuadrada se usan pmebas comúnmente para analizar tales datos, en especial en los prograrnas de tabulación de datos programas cornünmente para analizar tales datos, en especial ahora disponibles para las computadoras personales. que hay ahora disponibles para las computadoras personales. La regresión de series de tiempo de datos se presenta con frecuencia en La regresión de series de tiempo de datos se presenta con frecuencia en las organizaciones en que se lleva medición del desempeño con una organizaciones en que se Ileva a cabo un registro de rnedición del desempeño con una base semanal, mensual trimestral. Como la correlación un problema común en base semanal, mensual o trirnestral. Como Ia correlaciôn es un problema comuin en dichos estudios, es vital una comprensión de esta condición y de dichos estudios, es vital una comprensión de esta condición y de su cura si se espera se espera análisis sean válidos para el proceso de toma de decisiones. que los resultados de tales anãlisis sean válidos para el proceso de toma de decisiones. desgracia, menudo falta comprensión; este defecto se problema Por desgracia, a menudo falta esa comprensión; este defecto se ha vuelto un problema creciente con advenimiento programas cómputo económicos para análisis creciente con el advenimiento de programas de cómputo econôrnicos para anãlisis de regresión. aspectos de corto, mediano y largo plazos de las técnicas de pronóstico y Los aspectos de corto, mediano y largo plazos de las técnicas de pronóstico y su los diferentes niveles de administración en una empresa se pueden ilustrar relación con los diferentes niveles de adrninistración en una empresa se pueden ilustrar análisis de series de tiempo y el pronóstico tecnológico. La primera y segunda con el análisis de series de tiempo y el pronóstico tecnológico. La primera y segunda líneas de administración de una empresa pudieran interesarse en un análisis de una serie lInéas de adniinistración de una empresa pudieran interesarse en un TABLA 11.3 11.3 MODELOS PRONÓSTICO MODELOS DE PRONOSTICO ¿SE j,SE REQUIERE COSTO COMPUTADORA? CAPITULO COSTO COMPUTADORA? CAPÍTULO MÉTODO METODO DESCRIPCIÓN DESCRIPCION APLICACIONES Modelos casuales de pronOstico pronóstico Modelos Análisis de Pronóstico exploratorio; PronOstico Análisis regresión asume una relación de asurne causa y efecto entre causa la sisIa entrada a un sistema salida terna y su salida exploratorio; Pronóstico cxpioratorio; asume una relación de causa y efecto entre efecto entre más a un rnás de una entrada a un su salida sistema y su salida Modelos de pronóstico de series históricas históricas Modelos de pronóstico Pronóstico expioratorio; Método de exploratorio; Método descornposición asume una reiaciOn de descomposición una relación efecto entre causa y efecto entre el tiempo y Ia salida la salida ci sistema; el sisde un sistema; ci sistema se descompone en descompone componentes sus componentes Regresión múltiple multiple Pronóstico de Pronóstico de corto y y mediano plazos de promediano ductos y servicios ductos servicios existentes; estrateexistentes; tegias de mercado, promercado, producción y sencilla ducción p1 aneaciOn planeación Igual que Igual el anterior ci De bajo Dc bajo a mcdio medio lo Por lo regular 6 6 De bajo De medio a rnedio SI Sí 7 Prornedi os Promedios rnóvi les móviles Para climinar Ia aleatoeliminar la aleatoWla serie riedad en una serie histórica; pronOsticos pronósticos proyección basados en proyección de series hisde datos de series hisatenuados tóricas atenuados mediante un promedio promedio móvil inóvil los promedios Similar a los proinedios rnóviles pew con vamóviles pero con valores ponderados cxlores ponderados exponencialmente, dando dando más los datos rnás peso a los datos rnás recientes más Sc Se emplean con variables variables económicas para consiconsiderar las relaciones las relaciones entre observaciones serie adyacentes en una serie histórica ningún patrón No asume ningrn patron particular en los dadatos históricos de Ia Los histOricos de la serie a pronosticar; serie usa un enfoque iterausa tivo de identificativo ción de un posible un posible útil partir modelo iitil a partir de tipos generales (IC de de tipos modelos Atenuación Atenuaci on exponencial Pronóstico de mediano piaPronóstico piazo, zo, para planeación de equipo, una nueva planta y equipo, financiamiento, desalTofinanciarniento, desalTolb de llo de nuevos productos y nuevos métodos de ennuevos métodos de ensamble, sanibie, pronósticos de corto plazo para personal, personal, pubiicidad, publicidad, inventarios, financiamiento y planeación de producción Pronósticos de corto piazo plazo para operaciones como inventarios, inventarios, calendarización, control, precios y ción, control, precios promociones prornociones especiales; se usa Sc usa para calcular los componentes tanto cIclico tanto cíclico el como estacional para ci método de descomposición iriétodo de corto piazo plazo Pronósticos de corto piazo plazo para operaciones como calendarizainventarios, calendarización, control, precios y don, control, precios promociones espcciaies especiales Pronósticos de Pronósticos de corto y mediano plazos para daplazos tos económicos ordenalos económicos ordenauna serie histódos en una scrie histOrica; precios, inventainventaproducción, rios, producción, ventas acciones y ventas que Igual que ci anterior el Dc De bajo a medio SI Sí 8 Bajo No 5 y8 5y 8 Bajo Si Sí 5 Modelos autolTegresivos Medio SI Sí 9 y 10 10 Téclúcas Técnicas de Box-Jenkins Alto Sí Si 10 536 Elementos de juicio en los pronósticos Capítulo 11 CapItulo 11 histórica de las ventas unitarias mensuales reunidas durante los últimos cuatro años. histórica de las ventas unitarias mensuales reunidas durante los ültimos cuatro años. Mediante el uso del juicio con respecto al futuro del componente cíclico de esta serie, se Mediante el uso del juicio con respecto al futuro del componente cIclico de esta serie, se podrían pronosticar las siguiente año fiscal utilzarse para calendarizar la podrIan pronosticar las ventas para el siguiente aflo fiscal y utilzarse para calendarizar la fábrica. Los administradores producción mensual de la fábrica. Los administradores de nivel medio pudieran emplear el mismo programa de serie histórica para analizar los datos de ventas unitarias anuales mismo programa de serie histórica para analizar los datos de ventas unitarias anuales durante los iiltimos ocho años y pronosticarlas para cinco años aa futuro. En este caso, se durante los últimos ocho años y pronosticarlas para cinco aflos futuro. En este caso, se podría componente ciclico en un intento de planear las necesidades de gasto de podrIa ignorar el componente cíclico en un intento de planear las necesidades de gasto de capital para Ia fábrica durante este periodo de cinco aflos. Al mismo tiempo, la alta dirección la años. podría comprometerse en tecnológico utilizando el método podrIa comprometerse en el pronóstico tecnológico utilizando el método Delphi junto con la formulación de escenarios. Su finalidad sería evaluar la posición actual de la compañia formulación de escenarios. Su finalidad serla evaluar la posición actual de compañía mercado y buscar los cambios tecnológicos o sociales que amenazaran su nicho de en el mercado y buscar los cambios tecnológicos o sociales que amenazaran su nicho de mercado durante los próximos mercado durante los próximos veinte años, u ofrecer oportunidades que no son evidentes años, ofrecer oportunidades son evidentes la diaria. en Ia operación diana. Las técnicas de análisis de datos expuestas en este libro se resumen en la tabla 11 .3. libro se resumen en la tabla 11.3. Las técnicas señala aplicaciones, niveles de costo e indica Este cuadro proporciona descripciones, sefala aplicaciones, estima niveles de costo e indica si es necesaria una capacidad de córnputo para implementar cada técnica. Se hace también capacidad de cómputo implementar técnica. Se hace también los capítulos que se aborda cada técnica. referencia a los capItulos en que se aborda cada técnica. MON/TOREO DE LOS PRONÓSTICOS MONITOREO DE LOS PRONOSTICOS La recolección de datos y Ia selección de una técnica de pronóstico aceptable son apenas recolección la selección de una técnica de pronóstico aceptable son apenas los primeros pasos en un proceso efectivo y dinámico de pronóstico. En este libro se han proceso efectivo y dinámico de pronóstico. En este libro se han los primeros pasos en descrito diversos pasos en el proceso de pronóstico, haciendo énfasis en el aprendizaje de pronóstico, haciendo énfasis en el aprendizaje de descrito diversos pasos en proceso las técnicas cornñnmente empleadas en los pronósticos reales. En la fig. 11 .3 se resumen comúnmente empleadas en los pronósticos reales. En fig. 11.3 se resumen las los pasos dave del proceso de pronóstico. clave del proceso de pronóstico. los La recolección y revision de datos histOricos apropiados se describió previamente en revisión datos históricos apropiados se describió este libro (caps. 3 y 4), junto con las consideraciones en la selección de una técnica o modelo en de una técnica o modelo de pronóstico. Como sugiere la fig. 11.3, el siguiente paso consiste por 10 regular en de pronóstico. Corno sugiere la fig. 11 .3, el siguiente paso consiste por lo regular en pronosticar periodos históricos anteriores cuyos valores reales se conocen. Los errores pronosticar periodos históricos anteriores cuyos valores reales se conocen. Los errores resultantes se pueden resurnir en varias formas, como se expone en el cap. 4 y, este proceso resmnir corno expone en el cap. continúa encontrar una técnica con una proporción aceptable de beneficiocosto. se continua hasta encontrar una técnica con una proporción aceptable de beneficio-costo. futuro los resultados Entonces, se usa el modelo para pronosticar periodos a futuro y los resultados se incorporan al proceso de torna de decisiones de la empresa. toma decisiones de la empresa. a! De cuando es necesario hacer una pausa en el proceso de pronóstico y reconsideDc vez en cuando es necesario hacer una pausa en el proceso de pronóstico y reconsidepasos usuales son los siguientes: rar los procedimientos que se están utilizando. Los pasos usuales son los siguientes: los procedimientos que l. Se descartan los valores histOricos más antiguos que se están empleando en el proceso históricos más antiguos que se están empleando en el Se de pronOstico y se agregan al banco de datos los valores reales más recientes. pronóstico y se agregan al banco de datos los valores reales más recientes. 2. Después de esta actualización de datos, se recalculan los parámetros utilizados en el esta actualización datos, se recalculan los parámetros utilizados en el valorees) la(s) constante(s) de modelo de pronóstico. Por ejemplo, el(los) valor(es) óptimo(s) de la(s) constante(s) de ponderación empleado(s) en la atenuación exponencial pudiera(n) cambiar, tal vez en tal vez en forma considerable, al agregar valores de datos más recientes. O los coeficientes en un al valores recientes. 0 los coeficientes en un análisis regresión pudieran cambiar a! ajustar diferentes valores de datos en análisis de regresión pudieran cambiar al ajustar diferentes valores de datos en una ecuación. Mon itoreo de los pronósticos Monitoreo de Recolecc ion 537 de datos Revisión Revision de datos patrones de datos + t Selección SelecciOn del método de pronóstico método pronóstic Pronóstico de periodos anteriores + + i,PrecisiOn aceptable? > SI Nuevo examen de datos patrones de datos Pronóstico de periodos futuros futuros Pronóstico y uso de los resultados en el proceso proceso de toma de decisiones decisiones cuando, De vez en cuando, verificación de Ia la precisión de los precision pronósticos pronOsticos Sí SI Precisión > aceptable? Revisión los Revision de los patrones de datos patrones históricos con datos históricos actualizados Figura 11.3 Proceso de pronostico. Figura 11.3 pronóstico. 3. Se examina el modelo de pronóstico con nuevos parámetros para una adecuada preciSe examina el modelo de pronóstico con nuevos parámetros para una adecuada precisión. Si se juzga que esta precision es suficiente, el moldeo se usa como antes hasta el suficiente, el moldeo se como antes el precisión periodo de actualización. Si precision del pronóstico sejuzga inadecuada o siguiente penodo de actualizaciOn. Si la precisión del pronóstico se juzgainadecuada o marginal, se pueden revisar los patrones en los nuevos datos con la posibilidad de elegir un nuevo procedirniento de pronóstico. Este proceso continúa hasta que se juzga un nuevo procedimiento de pronóstico. Este proceso continua hasta que se juzga precisión la precision adecuada la precision del modelo elegido, de acuerdo con Ia precisión de pronóstico de periodos históricos anteriores. 538 Elementos de juicio en los pronOsticos pronósticos CapItulo 11 Capítulo 11 proceso anterior se resume en ci diagrama de flujo de la fig. 11.3 Y constituye ci El proceso anterior se resume en el diagrama de flujo de la fig. 11.3 y constituye el retroalimentación que tipo de ciclo de retroaiirnentación que se encuentra comúnmente en diseños de sistemas de comünmente en diseños todo tipo. señal En ocasiones, se monitorean los pronósticos de manera constante mediante una señal de rastreo, concepto que se abordó en el cap. 5 después del material sobre el método simrastreo, concepto que se abordó en el cap. material sobre método simple de atenuación exponencial. La idea consiste en establecer Ilmites dentro de los cuales atenuación exponencial. La idea límites dentro de por el pronóstico, si el proceso de pronóstico se espera que se ubiquen los errores generados por el pronóstico, si el proceso de pronóstico es adecuado. Mientras que es adecuado. Mientras que los errores se ubiquen dentro de estos lImites aceptables, el errores se ubiquen dentro de estos límites aceptables, el proceso de pronóstico continúa. Tan pronto como un error cae fuera del margen aceptabie, error fuera del margen aceptable, proceso de pronóstico continia. Tan pronto como atención la administración se enfoca en ci proceso de pronóstico y retoman la atención de Ia administración se enfoca en el proceso de pronóstico y se retoman los pasos de actualización y revision antes señaiados. Este concepto se ilustra en ci ejemactualización revisión señalados. concepto ilustra en el ejempasos plo 11.1. 11.1. Ej emplo Ejemplo 11.1 Sue Bradley es Ia responsabie del proceso de pronóstico de las ventas rnensuales en dôiares la responsable proceso de pronóstico de las ventas mensuales en dólares compañía. error aceptable de su compañIa. Sue eligió un modelo de pronóstico que presenta una tasa de error aceptabie para sus superiores. EspecIficaniente, el eITor estándar de su proceso de pronóstico es de $935; Específicamente, ci error es decir, el pronóstico y los valores reales de ventas mensuales en dólares están tIpicamente el pronóstico y los valores reales de ventas mensuales en dólares están típicamente $935. separados en $935. Sue asume que errores de pronóstico presentan distribución normal con una Sue asume que los en-ores de pronóstico presentan una distribución normal con una media una desviación estándar $935. Hace esta suposición después de cero y una desviación estándar de $935. Hace esta suposición después de revisar una gráfica de errores anteriores de pronóstico y encuentra que siguen una curva en forma de gráfica de errores anteriores de pronóstico y encuentra que siguen una curva en forma de alrededor cero. Utilizando campana airededor de cero. Utilizando un nivel de confianza del 95%, establece los siguientes nivel conlianza límites dentro de ubique el error de pronóstico de cada mes: lImites dentro de los cuales espera que se ubique ci error de pronóstico de cada mes: o ± (1.96)(935) 0 0 ± 1833 o ± 1833 2400 2400 + C1 Cl 1200 + 1200 + * * * * o+ * * * * * * * * * -1200 + * -1200 + * + +---- C2 + +-----+-----+-----+-----+-----+----C2 + 2.0 4.0 10.0 0.0 6.0 8.0 Figura 11.4 datos. Figura 11.4 Gráfica de errores de datos. Revisión pronóstico Revisián de los pasos de pronóstico 539 e4 C4 2400 + * * * * * 0+ * * * * * * * + 6.0 * * * * + * * * * + es +C5 -1200 + * _____ + + 2.0 2.0 * + 4.0 + + + 8.0 + + 10.0 12.0 12.0 Figura 11.5 Gráfica Figura 11.5 Gráfica de errores de datos. De este modo, Sue espera que cada pronóstico mensual se encuentre dentro de $1 833 del Sue espera pronóstico mensual se encuentre dentro de $1 833 del valor real para el flies, con una confianza del 95 por ciento. Si es asi, el procedimiento de valor real para mes, con una confianza del 95 por ciento. Si así, el procedimiento pronóstico continuará sin su atención. Pero si el error de pronóstico fuera mayor de $1 833, pronóstico continuará sin su atención. Pero si el error de pronóstico fuera mayor de $1 833, pronóstico incluso consideraría revisaría ambos parámetros en la técnica ella revisarla anibos paránietros en Ia técnica de pronóstico elegida e incluso consideraria el uso de otra técnica. otra técnica. Para nionitorear con más facilidad los errores de pronóstico, Sue diseña una gráfica para monitorear con facilidad los errores de pronóstico, Sue diseña llevar registro los mismos. Durante el transcurso de varios meses, Sue encuentra dos lievar un registro de los mismos. Durante el transcurso de varios meses, Sue encuentra dos primera, gráficas que cerca sus procedimientos pronóstico. gráficas que hacen que examine de cerca sus procedimientos de pronóstico. La primera, que muestra en la fig. 11.4, muestra errores de distribución normal, se niuestra en la fig. 1 1.4, muestra errores de pronóstico que aparentan una distribución normal, hasta el periodo niás reciente. Este error fuera de tolerancia conduce a Sue a actualizar los hasta periodo más reciente. Este error fuera tolerancia conduce a actualizar los parámetros en modelo de pronóstico, después de actualizar su base de datos mediante la paránietros en su niodelo de pronóstico, después de actualizar su base de datos mediante La agregación de valores recientes y la eliminación del mismo nimero antiguos. agregación de valores recientes y la eliminación del mismo número de valores más antiguos. nuevo Sue revise Algún tiempo después, 1ma segunda gráfica de error, fig. 11.5, hace que de nuevo Sue revise Algñn tiempo después, una segunda gráfica de error, fig. su proceso pronóstico. An cuando ninguno de los valores ha excedido sus límites de su proceso de pronóstico. Aún cuando ninguno de los valores ha excedido sus ilmites de tolerancia, Sue aprecia que los errores recientes no parecen tener una distribución normal. De tener una distribución normal. De tolerancia, hecho, los errores aumentan en una dirección positiva y es obvio que pronto estarán fuera de positiva pronto estarán fuera de hecho, control. actualiza de datos y, después de examinar cuidadosamente los patrones control. Sue actualiza su base de datos y, después de examinar cuidadosamente los patrones elige una nueva técnica de pronóstico. de datos, elige una nueva técnica de pronóstico. REVISIÓN DE LOS PASOS DE PRONÓSTICO DE PRONOSTICO REVISION En el cap. I se seflaló en varias ocasiones que si se esperaba obtener un pronóstico preciso, 1 se señaló en varias preciso, debería ejercitarse en forma constante el buen juicio junto con el análisis cuantitativo. Se deberla ejercitarse en [onna constante el buen juicio junto análisis cuantitativo. enlistaron diversas preguntaS que deberIan surgir si la administración del proceso de si administración del proceso enlistaron diversas preguntas que deberían pronóstico se conducla de manera adecuada. A continuación repetimos estas preguntas. manera adecuada. A continuación repetimos estas preguntas. pronóstico conducía • ¿Por qué se requiere de los pronósticos? Por específicos? • ¿Quién usará el pronóstico y cuáles son sus requerimientos especIficos? Quién uSará el pronóstico cuáles 540 Elementos de juicio en los pronOsticos juicio en los pronósticos CapItulo 11 Capítulo 11 • ¿Qué nivel de detalle o agregación se requiere y cuál es el horizonte de tiempo el horizonte de tiempo j,Qué nivel de detalle o agregación se requiere y cuál apropiado? ,Qué • ¿Qué datos hay disponibles y serán éstos suficientes para generar el pronóstico requerido? ,Cuál pronóstico? • ¿Cuál será el costo del pronóstico? Que • ¿Qué tan preciso se puede esperar que sea el pronóstico? ,Se • ¿Se hará el pronóstico a tiempo para ayudar en el proceso de toma de decisiones? • ¿Comprende el pronosticador con claridad côrno se utilizará el pronóstico en la organicómo ,Cornprende zación? para evaluar pronóstico después de • ¿Hay disponible un proceso de retroalimentación para evaluar el pronóstico después de ,Hay efectuado y para evaluar de acuerdo con ello el proceso de pronóstico? El proceso real de pronóstico puede comenzar cuando se formulan yyresponden adeproceso real de pronóstico puede comenzar cuando se formulan responden adecuadamente las preguntas anteriores. En el cap. 1 se listaron los pasos a seguir en dicho cuadamente las preguntas anteriores. En el cap. I se listaron los pasos a seguir en dicho proceso. Recolección de datos Recolección Reducción y condensación de datos datos Reducción Constmcción modelo Construcción del modelo Extrapolación del modelo (el pronóstico real) pronóstico real) Extrapolación del A esta lista de pasos pudiera agregarse otra: retroalimentación una vez que el proceso de lista de pasos pudiera agregarse retroalimentación una vez que proceso pronóstico está en marcha, para determinar si se obtuvo la precisión suficiente yy si la pronóstico está en marcha, para determinar si se obtuvo la precision suficiente si la administración encuentra ütil y de pronóstico en toma de administración encuentra útil y de costo efectivo el pronóStico en el proceso de toma de decisiones. Aunque el tema principal de este libro sido la construcción modelos la Aunque el terna principal de este libro ha sido la construcción de modelos o Ia selecciOn de un método apropiado de pronóstico, los autores esperan haber enfatizado selección de un método apropiado de autores esperan haber enfatizado también importancia del son importarnbién la importancia del proceso de pronóstico. Las preguntas anteriores son imporlas situaciones de pronóstico se deben considerar si se espera obtener tantes en todas las situaciones de pronóstico y se deben considerar si se espera obtener útiles. recomendamos especialmente el estudio de los resultados ütiles. Nosotros recomendarnos especialmente el estudio de los casos al final al final de los este capítulo, que están diseñados para enfatizar los aspectos de de este capItulo, ya que están diseflados para enfatizar los aspectos de juicio de los pronósticos. PRONÓSTICOS LA RESPONSABILIDAD EN LOS PRONOSTICOS La ubicación del proceso de pronóstico dentro de una empresa varIa dependiendo del ubicación del proceso de pronóstico dentro de una empresa varía dependiendo del tamaño la tamaflo de ésta, Ia importancia conferida a los pronósticos formales y la naturaleza del estilo de administración de Ia empresa. La responsabilidad de los pronósticos recae en alguna administración la empresa. La responsabilidad los pronósticos recae en alguna parte de Ia continuidad entre un departamento de pronóstico por separado y los pronósticos de pronóstico separado la dentro pequeñas unidades administrativas sin relación otros esfuerzos dentro de la dentro de pequeflas unidades administrativas sin relación aa otros esfuerzos dentro de Ia empresa. Costo de los pronOsticos los pronósticos 541 Los equipos de pronóstico son más comunes en las grandes organizaciones que en organizaciones que en las pequefias. Las grandes empresaspueden sufragar la contratación de los expertos las pequeñas. Las grandes empresaspueden sufragar la contratación de los expertos requeridos para pronósticos complejos y pueden equipar a requeridos para pronósticos complejos y pueden equipar a su personal con una moderna una moderna capacidad de cómputo y programas. La ventaja de este esfuerzo centralizado consiste en centralizado consiste capacidad de cómputo programas. La ventaja de que esta opinion experta está disponbie para todas las unidades de la organización. La opinión experta disponble para todas las unidades de organización. que desventaja es que es muy difícil lograr la coordinación entre el personal de pronósticos desventaja es que es muy dificil lograr la coordinación entre el personal pronósticos y los administradores de Ilnea. El personal de pronósticos se pudiera encontrar ocupando de línea. más tiempo en negociar con los usuarios y explicar su función que realmente pronostiusuarios más tiempo en cando. En el otro extremo se encuentra la ubicación del proceso de pronóstico dentro de extremo encuentra ubicación de pronóstico dentro de En cada unidad de la empresa sin haber coordinación o cooperación entre las unidades. La coordinación o cooperación entre las unidades. La de ventaja de este proceso es que no hay malentendidos entre quienes pronostican y quienes hay malentendidos entre quienes usan usan los pronósticos: son las mismas personas. Los pronósticos generados en estas pronósticos: las mismas personas. Los pronósticos generados en estas condiciones tienden a ser aceptados y utilizados en el proceso de toma de decisiones. de decisiones. condiciones tienden a ser aceptados y utilizados en el proceso La desventaja es que pudiera ser dificil lograr la complejidad y por ende la precision dificil lograr la complejidad y por ende precisión La desventaja es que pudiera de los pronósticos, debido a que los recursos y programas de cómputo no pueden cómputo pueden de los pronósticos, debido a que los recursos y programas repartirse es dificil persuadir a la alta dirección repartirse entre muchos usuarios. Por lo regular es dificil persuadir a la alta direcciOn muchos usuarios. para adquirir equipo y programas cuando ellos saben que existen en otros puntos de la equipo programas cuando ellos saben que existen en otros puntos de la comp añI a. compañía. Muchas organizaciones intentan ubicar la responsabilidad de los pronósticos en Muchas organizaciones intentan ubicar la responsabilidad de los pronósticos en un punto medio entre los extrernos antes mencionados. Se podrIa asignar un pequeflo grupo los extremos antes mencionados. podría pequeño punto de pronosticadores a subunidades dentro de Ia empresa para atender las necesidades de pronosticadores subunidades dentro de la empresa atender las necesidades de diversas areas funcionales. La tarea de dicho grupo comprenderla la adecuada coordinación áreas funcionales. comprendería entre usuarios asI como Ia generación de pronósticos precisos. En ocasiones esta responsaasí la generación de pronósticos precisos. En ocasiones esta responsabilidad de los pronOsticos se combina con otras funciones como las de apoyo estadIstico o pronósticos se combina con otras funciones como las estadístico computaciona 1. computacional. advenimiento El advenimiento de pequeñas computadoras económicas y prograrnas de cómputo de pequeias computadoras económicas programas de cómputo de pronóstico ha generado una tendencia a desplazar hacia abajo, en las organizaciones, la las organizaciones, la pronóstico ha generado una tendencia desplazar hacia abajo, función de pronóstico. Hoy día es posible que los administradores tengan acceso a función de pronóstico. Hoy en dIa es posible que los administradores tengan acceso a herramientas complejas de pronóstico por una fracción del costo de dicha capacidad hace herramientas complejas de pronóstico por una fracción del costo de dicha capacidad hace usar adecuadamente diez años. Sin embargo, el conocimiento requerido cinco o diez años. Sin embargo, el conocimiento requerido para usar adecuadamente esta capacidad no se incluye en el paquete de equipo o de programas; la necesidad de capacidad no se incluye en el paquete de equipo o de programas; la necesidad de adecuado de las técnicas de pronóstico al desplazarse comprender el uso adecuado de las técnicas de pronOstico se ha incrementado al desplazarse usuarios en capacidad de cómputo de las manos de los "expertos" las de la capacidad de cómputo de las manos de los "expertos" aa las de los usuarios en una organizaciOn. organización. COSTO DE LOS PRONÔSTICOS PRONÓSTICOS Los costos obvios comprendidos en Ia creaciOn de pronósticos son el equipo y programas comprendidos la creación de pronósticos son el equipo programas de cómputo y el equipo de personal. Pero hay costos adicionales no tan obvios debidos al equipo personal. adicionales no tan obvios debidos al la compañía así deben considerar como gasto de la compafila en tiempo de personal asI como en dinero. Se deben considerar como costos del pronóstico el tiempo empleado por personal asalariado en la recolección de datos personal asalariado Ia recolección de datos el proceso de pronóstico, el monitoreo del proceso y la interpretación de resultados. para ci proceso de pronóstico, ci monitoreo del proceso y la interpretación de resultados. Este costo debe sopesarse frente a los beneficios recibidos si es que se a alcanzar Este costo debe sopesarse frente a los beneficios recibidos si es que se van a alcanzar la utilidad de los pronósticos resultantes. decisiones racionales con respecto a Ia utilidad de los pronósticos resultantes. 542 Elementos de juiclo en los pronOsticos juicio en los pronósticos Capítulo 11 CapItulo 11 producción Una alternativa para la producción interna de pronósticos es utilizar consultores para de pronósticos es consultores para un pronóstico un este fin. Esta práctica en especial atractiva la necesidad este fin. Esta práctica es en especial atractiva si Ia necesidad de un pronóstico es un requerimiento requerimiento de única vez en lugar de uno continuo. Además un requerimiento de nica vez en lugar de uno continuo. Además un requerimiento de empresa sugiere el empleo pronóstico que rebase la capacidad técnica del personal de una empresa sugiere el empleo consultores profesionales. Esta contratación externa de asistencia en pronósticos hace de consultores profesionales. Esta contratación externa de asistencia en pronósticos hace la identificación del fácil. que Ia identificación del costo sea un asunto fácil. ADMINISTRACIÓN EN LOS PRONÓSTICOS ADMINISTRACIÔN EN LOS PRONOSTICOS que los pronósticos generados dentro una empresa han de convertirse en aspectos Si es que los pronósticos generados dentro de una empresa han de convertirse en aspectos importantes del toma de decisiones, existen varios factores que son consideraimportantes del proceso de torna de decisiones, existen varios factores que son consideraciones relevantes. Primero, debe reconocerse los administradores efectivos están ciones relevantes. Prirnero, debe reconocerse que los administradores efectivos están interesados en resultados prácticos útiles. general, pronosticadores deben interesados en resultados prácticos y iitiles. En general, los pronosticadores deben cubrir requelimientos estos administradores; deben proporcionar respuestas a la de los requerimientos de estos administradores; deben proporcionar respuestas a Ia serie de preguntas planteadas antenorrnente en este capItulo. anterionnente este capítulo. Segundo, los pronósticos deben ser lo suficientemente precisos para ser ütiles. Los útiles. Segundo, los pronósticos deben ser suficientemente precisos para buenos administradoresno se quedarán con un proceso de pronóstico prolongado, sin proceso de pronóstico prolongado, sin buenos administradores no se quedarán con su complejidad, si no resultados precisos. importar su complejidad, Si flO se generan resultados precisos. Por último, se deben reconocer en los procesos de pronóstico los instintos de Por ñltimo, se deben reconocer en los procesos de pronóstico los instintos de analizar las situaciones beneficio-costo de todo buen administrador. La habilidad beneficiocosto de todo buen administrador. La habilidad de analizar las situaciones en términos de costo incurrido frente beneficio obtenido es la dave de un proceso términos de costo incurrido frente aa beneficio obtenido es la clave de un proceso Esta situación administrativo efectivo y debe ser reconocido por el personal de pronósticos. Esta situación crea a menudo dificultades entre el pronosticador y el usuario. El pronosticador debe crea menudo dificultades entre el pronosticador y el usuario. El pronosticador debe siempre tener presente que el resultado final proceso pronóstico generar un siempre tener presente que el resultado final del proceso de pronóstico es generar un proceso administrativo excedan el costo de generarlo. producto cuyos beneficios al proceso administrativo excedan el costo de generarlo. LOS PRONÓ~TICOS yEL SISTEMA DE PRONOTICOS Y EL SISTEMA DE INFORMACION ADM INISTRATIVA INFORMACION ADMINISTRATIVA últimos años, los sistemas de información administrativa de las empresas modernas En los ültimos años, los sistemas de información administrativa de las empresas modernas complejidad utilidad. principal proceso de pronóstico han crecido en complejidad y utilidad. Su principal beneficio en el proceso de pronóstico enonne recolectar y registrar datos a través de la organización. comprende su enorrne capacidad para recolectar y registrar datos a través de la organización. la El pronosticador debe resistirse a Ia tentación de reunir datos para los modelos de pronóstico pam los de en uso, si dichos datos ya fueron recolectados y registrados en el sistema de inforrnación uso, si dichos datos ya fueron recolectados y registrados en el sistema de infonnación de la compañía. administrativa de Ia cornpañIa. Es importante Ia dependencia en los bancos de datos existentes aim cuando los datos la dependencia en aun los datos Es disponibles no precisamente en el formato secuencia de tiempo requeridos disponibles no estén precisarnente en el formato o secuencia de tiempo requeridos por el pronosticador. Antes de desechar los datos ya registrados y recolectar otros nuevos, deben pronosticador. Antes datos disponibles. Desde considerarse modificaciones en el modelo de pronóstico o en los datos disponibles. Desde modificaciones en ci modelo luego, este consejo asume que el proceso de recolección datos implica un gasto luego, este consejo asume que el proceso de recolección de datos implica un gasto considerable en tiempo. Si necesarios un modelo de pronóstico son fáciles considerable en tiempo. Si los datos necesanos para un modelo de pronóstico son fáciles utilizar los datos reunidos obtener en el formato correcto, esto sería preferible de obtener en el formato correcto, esto serIa preferible a utilizar los datos reunidos fonna adecuada no están actualizados. anterionnente anteriormente que no tienen la forma adecuada o no están actualizados. El futuro de los pronOsticos de los pronósticos 543 Una ventaja adicional de utilizar los datos disponibles en el sisterna de información datos disponibles el sistema de información adrninistrativa de la empresa consiste en que el proceso de pronóstico se convierte en un administrativa de la empresa consiste en que el proceso de pronóstico se convierte en componente de este sistema. Como tal, ingresa a la red de distribución y toma de decisiones de decisiones establecida por sistema se incorpora con mayor facilidad al proceso toma de ya establecida por el sistema y se incorpora con mayor facilidad a! proceso de toma de decisiones de compañía. Este proceso contrasta con proceso de pronóstico que decisiones de la compañIa. Este proceso contrasta con un proceso de pronóstico que pretende infiltrarse en procesos de decisiones que administrapretende infiltrarse en los procesos de toma de decisiones que ya emplean los administrala compañía. dores de la companIa. EL FUTURO DE LOS PRONÔSTICOS EL fUTURO DE LOS PRONÓSTICOS Como mencionó el cap. 1, pronósticos siguen ganando importancia en Como se mencionó en el cap. 1, los pronósticos siguen ganando importancia en las organizaciones modernas debido a Ia creciente complejidad del mundo de los negocios junto del mundo de los negociosjunto la disponibilidad de equipo y programas menor costo y mayor capacidad. con la disponibilidad de equipo y prograrnas de cómputo de menor costo y mayor capacidad. Para cualquiera resulta obvia Ia continua competencia en las areas de computadoras Para cualquiera resulta obvia la continua competencia en áreas de computadoras pequefias y prograrnas; menos obvias pudieran ser las tendencias de largo plazo que pequeñas y programas; menos obvias pudieran ser las tendencias de largo plazo que lentamente cambian el maquillaje de Ia escena de los negocios y el juicio en las sutiles pero los negocios la presiones fonTIas de operación de los empresarios. poderosas presiones en las fonnas de operación de los empresarios. Considérense algunas de las "megatendencias" identificadas por Naisbitt en su libro identificadas su libro Considérense algunas de título. 11 fuerzas empresarial con ese tItulo.1' Estas fuerzas tienen una particular importancia para el mundo empresarial nos hacen pensar en la necesidad de pronosticar utilizando programas equipo y nos hacen pensar en Ia necesidad de pronosticar utilizando programas y equipo modernos. moderno s. Sociedad industrial hacia sociedad de inforrnación sociedad de infonTIación industrial Economía economía Economla nacional hacia economla mundial Prevision de corto plazo hacia prevision de largo plazo Previsión COli0 previsión descentralización Centralización hacia descentralización de tipo y/o múltiples Opciones de tipo yb hacia opciones mi'iltiples tendencias subrayan importancia la continuidad del desarrollo administrativo Estas tendencias subrayan la importancia de Ia continuidad del desarrollo administrativo por parte de los empresarios, que deben tratar con los complejos elementos que enfrentan de los empresarios, que deben tratar con los complejos elementos durante los próximos necesidad de desarrollar sus empresas durante los próxirnos años. En particular enfatizan la necesidad de desarrollar complejos enfrentar incertidumbres futuros. En métodos cada vez más complejos para enfrentar las incertidumbres de eventos futuros. En la importancia creciente de los otras palabras, hacen énfasis en Ia importancia creciente de combinar el buen juicio y los el de manipulación datos en buenos pronósticos empresariales. métodos sofisticados de rnanipulación de datos en buenos pronósticos empresariales. Naisbitt, Al cornenzar a manifestarse en la escena de los negocios las tendencias de Naisbitt, Al comenzar a manifestarse en la escena cierta combinación la la habilidad de o cierta combinación de ellas, Ia atención se enfoca con mayor agudeza en la habilidad de líderes empresariales para reaccionar rápida y redituablemente a los eventos cambiantes. los ilderes empresariales para reaccionar rápida y redituablemente a los eventos cambiantes. negocios que pasará después? adquirirá una mayor importancia; La pregunta básica en los negocios ¿quepasará después? adquirirá una mayor importancia; esta pregunta es la que se refieren los pronósticos empresariales. a esta pregunta es aala que se refieren los pronOsticos empresariales. 11 (New York: Warner Books, 1982). John Naisbitt, Megatrends (New York: Warner Books, 1982). 544 Elementos de juicio en los pronOsticos en los pronósticos Capítulo 11 CapItulo 11 GLOSARIO Valor esperado El valor esperado de una variable aleatoria discreta es ci valor promedio aleatoria el valor promedio número observaciones. que asume la variable aleatoria durante un gran nümero de observaciones. un FÓRMULA CLAVE FORMULA CLAVE Fórmula del esperado Formula del valor esperado E(X) E(X) = ¡X[P(X)] IX[P(X)] (11.1) (11 .1) CASO DE ESTIJDIO 11.1 ESTUDIO 11.1 BOUNDARYELECTRONICS BOUNDARY ELECTRONICS Boundary Electronics es un gran proveedor de productos electrónicos para uso doméstico. Entre sus productos electrónicos uso doméstico. Entre sus están las videocaseteras para el hogar y los sistemas de television ventas mayores estmn las videocaseteras para el hogar y los sistemas de televisión por satélite. Debido satélite. a que los negocios de la companIa crecieron con rapidez, Guy Peterson, presidente de Boundary, está la compañía cambio en las condiciones del mercado que pudiera alterar su patrón de ventas. preocupado por un canibio en las condiciones delmercado que pudiera aiterar su patron de ventas. el compañía, Guy Al preguntar a sus adminsitradores sobre ci futuro de la compafiIa, Guy descubrió dos cosas. La cosas. la mayorIa cotidianos para primera, que Ia mayoría de sus gerentes están muy ocupados pensando en los problemas cotidianos para gerentes cubrir creciente demanda que no piensan gran cosa en el futuro a cubrir la creciente demanda que no piensan gran cosa en el futuro a largo plazo. Y segunda, las opiniones opiniones sí varían muy presidente de la compañía, Guy que si tienen varIan de las rnuy optimistas a las muy pesimistas. Como presidente de Ia compañIa, Guy obligaciónde considerar seriamente el ambiente futuro de su compañía. siente que tiene la obiigaciónde considerar seriamente el ambiente futuro de su companIa. Después de meditar el asunto, Guy planea un retiro en sábado con seis miembros de su equipo Después de meditar el asurto, directivos. salón reuniones un hotel local y hace arreglos para el almuerzo y de altos directivos. Renta un salon de reuniones en un hotel local y hace arreglos para ci aimuerzo y pausas durante el día. pausas para café durante ci dia. Cuando se reúne el grupo el sábado por la mañana hace una presentación rei'ine el grupo el sábado por Ia mañana hace unapresentación dci dIa e instruye después cada del tema del día e instruye después a cada persona para que elabore una descripción de una o dos páginas páginas del la compañía dci ambiente operativo de la compañIa durante los próximos 20 años para cada una de las situaciones siguientes: l. El rnedio operativo de la cornpañIa continuará en esencia corno hasta ahora. Los produccompañía como ahora. Los producEl medio operativo que demandará el mercado modificaciones actuales interventos que dernandará ci mercado serán modificaciones de productos actuales y no intervendrá tecnoiogIa nueva. tecnología 2. Grandes canibios tecnoiógicos harán obsoleta Ia linea actual de productos de Ia compañIa. cambios tecnológicos harán obsoleta la línea actual de productos de la compañía. Habrá que desarrollar nuevos productos para cubrir la demanda en el tiempo libre de la desarrollar nucvos productos para cubrir Ia demanda en ci tiempo la población estadunidense. Entre estos 3. Entre estos dos extremos, ¿cuál es el escenario más probable para el ambiente operativo extremos, j,cuál es el escenario más probable para ambiente operativo de la compañIa? compai'iía? Guy concede una hora a los miembros dcl equipo para desarrollar los escenarios para cada una de estas del para cada una de estas tres situaciones. Durante esa hora, Guy piensa en el resto del día y en lo que sucederá. Espera que sus hora, Guy piensa en ci resto del dIa y en lo que sucederá. Espera que sus desarrollen algunas en' gerentes dcsanollen algunas ideas provocativas y que en las discusiones subsecuentes resulten vivas e subsccuentes rcsulten vivas c interesantes. Además de obtener ideas para su propio uso, Guy espera que ci ejcrcicio de ese dIa ayude Además de obtener ideas para su propio uso, Guy espera que el ejercicio de ese día ayude Capituto 11 Capítulo 11 Caso de Estudjo Estudio 545 a sus gerentes a ver más allá de los problemas y oportunidades inmediatos de la compañía y les dé una compañIa visión largo de la misma. vision de más largo plazo de la misma. PREGUNTAS 1. ¿Qué proceso cree usted que debe utilizar Guy después de Ia hora de actividades escritas? la de actividades escritas? Qué proceso 2. Dados sus objetivos, ¿hay algin otro enfoque que pudiera haber utilizado Guy? objetivos, ,hay algún otro enfoque que pudiera haber utilizado Guy? 3. ¿Cree usted que Guy iogrará sus objetivos con esta reuniOn sabatina? logrará sus objetivos con esta reunión ,Cree usted CASO DE ESTUIMO 11.2 ESTUDIO 11.2 GOLDEN GARDENS RESTAURANT GARDENS RESTAURANT Sue y Bill Golden decidieron abrir unìrestaurante en una ciudad del medio oeste. Emplearon más de un un restaurante en una ciudad del medio oeste. Emplearon más de un Bill el área año en investigar ci area y visitando restaurantes de precio medio a alto. Definitivamente piensan que y encontraron un buen lugar disponible a buen precio. hay sitio para otro restaurante y encontraron un buen lugar disponibie a buen precio. Además, tienen contactos con varios chefs de primera línea y creen poder atraer a uno de ellos a lInea y creen poder atraer a uno de ellos a su nuevo restaurante. Sus investigaciones con los bancos locales los convencieron de que dados sus restaurante. Sus investigaciones con los bancos locales los convencieron de que thdos su propios recursos y su experiencia en el negocio de restaurantes, habrá financiamiento disponible con experiencia negocio financiamiento disponible facilidad. El único punto que aim preocupa a los Golden es la atmósfera o decoración de su restaurante. aún atmósfera o decoración de su restaurante. El ünico Realizaron ya entrevistas a tres grupos difercntcs dc residentes del área que comen fuera con regularidad ya entrevistas a diferentes de rcsidentes Realizaron area fucra sin llegar a un consenso en esta materia. Han platicado el asunto entre ellos ampliamente y ahora piensan esta materia. Han platicado el asunto entre ellos ampliamente y ahora piensan que algunas otras opiniones serlan valiosas. otras opiniones serían valiosas. Después de leer sobre algunas de las técnicas utilizadas en los pronósticos de juicio, creen que Después de algunas de las técnicas utilizadas en los pronósticos dejuicio, creen que alguna de ellas podrIa ayudarles a decidir sobre la atmósfera para su nuevo restaurante. Han identificado atmósfera para su nuevo restaurante. alguna podría sus socios que estarían a no están seguros de utilizar sus varios de sus amigos y socios que estarIan dispuestos a ayudarles pero no están seguros de utilizar sus habilidades. PREGUNTAS 1. ¿Qué método sugerirIa usted a los Golden para utilizar Ia experiencia de sus amigos en la sugeriría usted la la ,Que decisión sobrc atmósfera y decoración de restaurante? decisiOn sobre la atmOsfera y decoración de su nuevo restaurante? ,Existen 2. ¿Existen otros métodos quc hayan pasado por alto en su intcnto de investigar este asunto? métodos que pasado intento de investigar este asunto? DE ESTUDIO 11.3 CASO DE ESTUIDIO 11.3 BUSBY ASSOCIATES ASSOCIATES universitaria administración cuando entró trabajar Jill Tilson era una recién graduada de una escuela universitaria de administración cuando entrO a trabajar agrIcola. ci con Busby Associates, un exportador en grande de equipo agrícola. Durante el proceso de contratación, 546 Elementos de juicio en los pronOsticos juicio en los pronósticos Capítulo 11 CapItulo 11 el Busby observó curso pronósticos en currículo JiU el ci presidente de Busby observó un curso de pronósticos en el curriculo de Jill y decidió iniciar ci empleo de JiU con un proyecto de pronóstico que había estado discutiendo muchas veces con los altos ejecutivos Jill proyecto pronóstico habla de la empresa. había exportación de El presidente de Busby pensaba que habia una fuerte relación entre las ventas de exportación de la empresa y las cifras nacionales de exportación. Las cifras nacionales estaban fácilmente disponibles fuentes gubernamentales, asI que el proyecto de pronosticar y representativa de fuentes gubernamentales, así que el proyecto de Jill era pronosticar una buena y representativa variable exportación. esfuerzo tenía éxito, el presidente creía que tendría una variable de exportación. Si este esfuerzo tenIa éxito, ci presidente de Busby crela que tendrIa una herramienta para pronosticar sus propias ventas de exportación. Jill localizó Ia copia más poderosa herramienta para pronosticar sus propias ventas de exportación. JiU localizó la copia más biblioteca local y registró las cifras trimestrales de reciente del Survey 01 Current Business en una biblioteca local y registró las cifras trimestrales de of dólares. Ella exportación de bienes de consumo en miles de millones de dólares. EUa pensó que ésta era una buena variable representativa de exportaciones nacionales Anticipando la posibilidad pronosticar variable representativa de las exportaciones nacionales totales. Anticipando la posibilidad de pronosticar mediante el análisis de regresión, registró también los valores de podrían mediante ci análisis de regresión, registró también los valores de otras cuatro variables que pensó podrian variables tener una buena correlación con su variable dependiente. Concluyó con valores de cuatro variables para 14 trimestres. Después calculó tres variables adicionales a partir de los valores de su variable dependiente: ci los su variable dependiente: el cambio en Y, el porcentaje de cambio en Yy Yretrasada un periodo. Asi, a! comenzar a pensar en las Y, ci porcentaje de cambio en Y y Y retrasada un periodo. Así, al comenzar a pensar en las diversas formas de pronosticar su variable, habla reunido los datos que se presentan en Ia tabla 11.4. había reunido los datos que se presentan en la tabla 11.4. Jill JiU capturó sus datos en un prograrna de cómputo que efectuaba análisis de regresión y calculó programa la matriz de correlación para sus siete variables. Dcspués de revisar esta matriz, eligió tres regresiones Después con una variable de predicción y seis regresiones con dos variables de predicción. Ejecutó después estas regresiones Ejecutó después estas regresiones y eligió la que consideró la mejor: utilizaba un predictor (Y retrasada un periodo) con los la mejor: utilizaba un predictor (Y los siguientes resultados: cuadrada = .98389, = 25.9, F = 671.6, r cuadrada = .98389, t = 25.9, F = 671.6, Durbin-Watson = 2.18 DurbinWatson = 2.18 Durbin-Watson que JiU utilizó comenzaba con n = 15 Ysu tamaño La tabla de DurbinWatson que Jill utilizó comenzaba con n = 15 y su tamaflo de muestra era sólo de solo de 13. De modo que interpoló los valores críticos de DW y estimó que el límite superior para la prueba de 13. Dc interpolO los valores crIticos de DW y estimó que ci limite superior para la prueba de autocorrelación era 1.35. Como su estadistica de DW era 2.18, concluyO que no habIa presente autocorrelación era 1.35. Corno su estadística de era 2.18, concluyó que había presente autocorrelación en su regresiOn. Ella pen sOque había encontrado una buena variable de predicción (Y predicciOn (Y autocorrelación en su regresión. pensó que habla encontrado una buena retrasada un periodo). JiU tamaño de muestra era muy reducido: 13 trimestres. Volvió al Survey Jill se dio cuenta de que su tarnafo de muestra era muy reducido: 13 trimestres. Volvió al Survey 01Current datos se desilusionó al encontrar que los años le of Current Business para reunir más puntos de datos y se desilusionó al encontrar que los afios que Ic interesaban interesaban en la definición de su variable dependiente cambiaban, resultando en una serie inconsistente. variable dependiente una serie inconsistente. medio final eUa Esto es, la serie tuvo un nîedio salto hacia arriba durante el periodo final de la década de 1980 que ella estaba estudiando. JiU comentó este problerna con su jefe y acordó que se podría emplear como variable Jill comentO este problema con su jefe y se acordó que se podrIa emplear como variable dependiente las exportaciones totales de mercancías dependiente las exportaciones totaies de mercancIas en vez de las exportaciones de bienes de consumo. JiU Jill encontró que esta variable se mantenía congruente durante varios ejemplares del Survey o/Current mantenla ejempiares del Survey of Current podía años muestran en la tabla Business y que podia recolectar varios aflos de datos. Jill reunió los datos que se muestran en la tabla 11.5, retrasó los datos un periodo y ejecutó de variable 11 .5,retrasó los datos un periodo y ejecutó de nuevo un análisis de regresión utilizando como variable Y retrasada un periodo. de predicción a Yretrasada un periodo. ocasiOn obtuvo nuevamente excepción En esta ocasión obtuvo nuevamente buenas estadIsticas en su reporte de regresiOn, con excepción estadísticas en reporte de regresión, de la estadIstica de DurbinWatson. Este valor era de .96 yyella concluyO que habla presente de estadística de Durbin-Watson. Este valor era de .96 ella concluyó que había presente autocorrelación, ya que este valor está por debajo del valor inferior de la tabla para la prueba de autocorreiaciOn, ya que este valor está por debajo del valor inferior de Ia tabla para la prueba de Durbin-Watson.Jill probó otras ejecuciones agregando ciel númerode periodo yyci cambio en Y como DurhinWatson. Jill probó otras ejecuciones agregando nOmero de periodo el cambio en Y como varIables de predicción, pero no pudo encontrar una estadística de Durbin-Watson lo suficientemente variables predicciOn, pero no pudo encontrar una estadistica de DurbinWatson lo suficientemente Capítulo 11 CapItulo 11 Caso de Estudio 547 HISTÓRICA DE DATOS TRIMESTRALES TABLA 11.4 TABLA 11.4 SERIE HISTORICA DE DATOS TRIMESTRALES VARIABLE PERIODO 1987 1 1 2 3 3 4 1988 1988 1 1 2 2 3 3 4 1989 1 1 2 2 3 3 4 1990 1 1 2 2 1 2 2 3 4 5 6 7 18.2 19.8 20.9 22.1 24.0 26.0 27.7 29.7 33.6 35.0 35.0 38.0 128.3 45.8 66.1 129.7 136.4 140.7 156.9 148.5 306.2 311.6 320.7 324.2 331.0 337.3 342.6 352.6 351.5 357.6 365.2 366.3 369.1 370.Oa 370.0' 110.0 109.7 109.9 109.7 109.4 110.5 110.6 110.9 113.4 112.4 111.9 111.0 111.9 112.1 1.6 1.1 1.1 1.2 8.79 5.56 5.74 8.60 8.33 6.54 7.22 13.13 4.17 0.00 8.57 18.2 19.8 20.9 22.1 24.0 26.0 27.7 29.7 33.6 35.0 35.0 38.0 40.7 1.9 2.0 1.7 1.7 2.0 3.9 1.4 0.0 3.0 2.7 1.3 189.8 168.9 154.5 154.5 174.1 191.3 201.2 40.7 42.0 7.11 3.19 aEstimado 3Estimado Clave de variable: variable: 1: Bienes de consumo, exportaciones, miles de millones de dólares exportaciones, millones de dólares 2: Ahorro personal bruto, miles de millones de dólares de millones de dólares 3: Ingreso nacional de comercio al menudeo, miles de millones de dólares al menudeo, miles de millones de dólares 4: Indices de precios de ponderación fija para compras de la defensa nacional, equipo militar, 1982 = 100 Índices ponderación fija para compras de Ia defensa nacional, equipo militar, 1982 = 100 5: Cambio en Ia variable dependiente respecto al periodo previo la 6: Porcentaje de cambio en la variable dependiente respecto al periodo previo la variable dependiente respecto al periodo previo 7: Variable dependiente retrasada un periodo Variable dependiente retrasada las variables 1 a 4: Survey 01 Current Business, Fuente de las variables 1 a 4: Survey of Current Business, Vol. 70, Nüm. 7 (Julio, 1990), U.S. Department of Commerce. 70, Núm. 7 (Julio, 1990), U.S. Department of Commerce. concluir se había eliminado otras alta como para concluir que se habla elirninado la autocorrelación. Jill decidió entonces buscar otras técnicas para pronosticar su nueva variable independiente: exportaciones totales de mercanclas. Utilizó pronosticar exportaciones totales de mercancías. Utilizó se Y de la tabla 11.5. la serie histórica de datos que se presenta en la columna Yde la tabla 11.5. Entre los programas de cómputo disponibles en Busby estaba Sibyl/Runner, un programa de cómputo disponibles Sibyl/Runner, un programa pronóstico que maneja una variedad de métodos de pronóstico. Jill preparo sus datos para utilizarlos preparó utilizarlos con este programa y comenzó a trabajar a través de varias rutinas de pronóstico. Entre ellas había un rutinas pronóstico. habIa un procedimiento la fig. 11.6 se muestra la gráfica trimestral de procedimiento para graficar los datos sin procesar. En la fig. 11.6 se muestra la gráfica trimestral de exportaciones totales de mercancIas para los años de 1984 al segundo trirnestre de 1990. mercancías 1984 trimestre 1990. Después de estudiar la Después de estudiar la fig. 11.6, Jill decidió usar sólo los últimos 16 puntos de datos en su esfuerzo solo ültimos puntos su esfuerzo de pronOstico. Su razonamiento fue que comenzando en el periodo 9, la serie habIa mostrado un pronóstico. Su razonamiento fue que comenzando en el periodo la serie había mostrado un 548 Elementos de juicio en los pronósticos juiclo CapItulo 11 Capítulo 11 TABLA 11.5 SERIE HISTÓRICA DE DATOS TRIMESTRALES: EXPORTACIONES TABLA 11.5 SERIE HISTORICA DATOS TRIMESTRALES: EXPORTACIONES MERCANCiAS (MILES MILLONES DÓLARES) TOTALES DE MERCANCIAS (MILES DE MILLONES DE DOLARES) PERIODO 1984 1984 Y 219.3 223.1 225.9 228.0 225.0 221.6 218.0 218.6 220.7 221.4 225.7 230.4 234.5 246.6 261.6 281.3 306.7 319.2 327.9 342.8 360.6 373.2 367.3 378.7 394.2 394.4 Y RETRASADA UN Y RETRASADA UN PERIODO 1985 1985 1986 1987 1988 1989 1990 1990 1 2 3 4 1 2 3 3 4 1 2 3 4 1 2 3 3 4 1 1 2 3 3 4 1 1 2 2 3 3 4 1 1 2 1 1 1 1 219.3 223.1 225.9 228.0 225.0 221.6 218.0 218.6 220.7 221.4 225.7 230.4 234.5 246.6 261.6 281.3 306.7 319.2 327.9 342.8 360.6 373.2 367.3 378.7 394.2 Fuente: Survey Curren! Business, varios ejemplares. Fuente: Survey 01of Current Business, varios ejemplares. estable, mientras que presentaba crecimiento y declinaincremento relativamente estable, mientras que antes de ese periodo presentaba crecimiento y declinaprograrna el uso de un nñmero reducido de puntos de datos (16), ción. El programa Sibyl/Runner le advirtió sobre el uso de un número reducido de puntos de datos (16), pero ella continuó después de ignorar esta advertencia. ella continuó después de ignorar esta advertencia. Jill comenzó su análisis liamando Ia rutina del programa de Sibyl, utilizando solo los i'iltimos 16 llamando la programa de Sibyl, utilizando sólo los últimos 16 de datos. El primer análisis producido por el programa indicó que había cierto patrón puntos de datos. El primer análisis producido por el programa indicó que habIa cierto patrOn en los estacionalidad. prograrna utilizó diversos métodos de pronóstico para pronosticar datos, pero no era estacionalidad. El programa utilizó diversos métodos de pronóstico para pronosticar los valores de muestra e imprimió una tabla con los porcentajes de error de pronóstico para cada método pronOstico para cada método periodo. y cada periodo. Después de estudiar estos errores de pronóstico, Jill eligió tres técnicas de pronóstico para un Después errores pronóstico, Jill eligió tres técnicas pronóstico tenían el mayor análisis. Los tres que escogió tenlan el porcentaje más bajo de errores de pronóstico y fueron más bajo de errores de pronóstico y fueron Atenuación exponencial simple simple los datos Atenuación exponencial de Brown, la cual puede acomodar una tendencia en los datos AtenuaciOn exponencial de Brown, Ia cual puede acomodar Atenuación exponencial cuadrática, que permite una línea curva de tendencia a través de los los Atenuación exponencial cuadrática, que permite una linea curva datos CapItulo 11 Capítulo 11 Caso de Estudio 549 VALUE 219.300 223.100 223. 100 225.900 228.000 225.000 221.600 221 .600 218.000 218. 000 218.600 218. 600 220.700 221.400 221 .400 225.700 230.400 234.500 246.600 261.600 281.300 306.700 319.200 327.900 342.800 360.600 373.200 367.300 378.700 PERIODO 1 1 . 3 3 4 4 2 2 .* * .** * 6 7 7 8 8 9 9 10 6 .*** * 5 5 * * * * * .* * . .* * 12 13 14 15 16 17 18 19 20 21 22 23 24 11 .** * ** * * * * * * * * * * * * * * * * * * * * * * * * * + + +-----+-----+-----+-----+-----+ + + ALTO 378.700 BAJO == 218.000 ALTO == 378.700 BAJO 218.000 Figura 11.6 Gráfica de valores de datos trimestrales: exportaciones totales de 11.6 Gráfica de mercancías, del primer trimestre de 1984 al segundo trimestre de 1990. 1984 segundo trimestre de 1990. mercancias, Después, pidió los pronósticos de sus datos utilizando cada técnica, con los resultados siguientes: Después, pidió los pronósticos de sus datos utilizando cada técnica, con los resultados siguientes: TÉCNICA TECNTCA ERROR MEDIO CUADRADO 185.5 81.0 87.7 CONSTANTE ÓPTIMA CONSTANTE OPTIMA DE ATENUACION ATENUACIÓN Exponencial simple Brown Exponencial de Brown cuadrática Exponencial cuadrática .999 .722 .485 óptima la simple Jill advirtió que la constante optima de atenuación utilizando Ia atenuación exponencial simple era casi 1.00 (.999). Aparentemente, a fin de rastrear a través de los datos de manera óptima, el programa a través de los datos de manera optima, el programa básicamente utilizando un valor de datos para predecir el siguiente. Esto es equivalente a usar el estaba básicamente utilizando un valor de datos para predecir ci siguiente. Esto es equivalente a usar el método no formal simple para pronosticar. Como Ia atenuación exponencial de Brown produjo el error mínimo cuadrado más reducido, Jill la mInimo cuadrado pensó que deberIa emplear ese método. Ella revisó más adelante la impresión para este método y debería método. revisó impresión este método y pensó el absoluto (PEMA) era 2.39% encontró que ci porcentaje de error medio absoluto (PEMA) era 2.39% y el porcentaje medio de error medio (PME) o desviación era .34%. Jill consideró satisfactorios estos valores y decidió usar el método de (PME) consideró satisfactorios estos valores y decidió usar el método de para pronosticar valores futuros. atenuación exponencial de Brown para pronosticar valores futuros. que eligió, solicitó pronósticos después Utilizando el método que eligió, solicitO pronósticos para los siguientes cuatro periodos después datos. Los valores de pronóstico presentan a continuación: del final de sus datos. Los valores de pronOstico se presentan a continuación: 550 juicio en los pronósticos Elementos de juicio en los pronOsticos Capítulo 11 CapItulo 11 PERIODO PRONÓSTICO PRONOSTICO 17 17 18 18 19 19 20 401.27 407.30 413.34 419.38 Jill se dio cuenta de que al transcurrir cada trimestre habrIa disponible un nuevo valor real de las se dio cuenta de que al transcurrir cada trimestre habría disponible un nuevo valor real de exportaciones totales de mercancIas y se podrían actualizar los pronósticos de periodos futuros. mercancías podrIan Jill se reunió después con su jefe para discutir sus resultados. Ella indicó que pensaba que tenla Jill sujefe para discutir sus resultados. Ella indicó que pensaba que tenía de la mercancías, una buena forma de pronosticar Ia variable nacional exportaciones totales de mercancIas, mediante el uso de atenuación exponencial con ajustes de tendencia. Su jefe le pidió que explicara este método, lo Su jefe le que explicara este método, lo siguiente asignación era utilizar los para verificar la corazonada presidente cual hizo. Su siguiente asignación era utilizar los datos reales para verificar Ia corazonada del presidente de Busby: que las exportaciones de Busby tenIan una buena correlación con las exportaciones de Busby: que las exportaciones de Busby tenían una buena correlación con las exportaciones podía establecer vínculo, tendría método pronosticar nacionales. Si ella podia establecer este vInculo, Busby tendria un buen método para pronosticar sus exportaciones y utilizar éstos para planear operaciones futuras. PREGUNTAS 1. Jill no consideró Ia cornbinación de los pronósticos generados por los tres métodos que la combinación de los pronósticos generados por los métodos Jill acción? analizó (,Cómo le iría si lo hiciera? L,Cuáles serían las ventajas y desventajas de tal acción? ¿Cómo Ic irIa silo hiciera? ¿Cuáles serIan las ventajas y 2. La constante optima de atenuación utilizada por la atenuación exponencial de Brown fue óptima de atenuación utilizada por atenuación exponencial de .722. Al Ilegar más datos en los siguientes trimestres, Jill probablemente ejecutaría sus dallegar siguientes trimestres, JilI probablemente ejecutaria sus tos para ver si este valor cambia. tCon qué frecuencia cree usted que deba hacerse esto? cambia. ¿Con qué frecuencia usted deba hacerse esto? 3. Es posible que la elección del niétodo de pronóstico pudiera cambiar a otra técnica al agreque la elección del método de pronóstico pudiera cambiar a otra técnica al agregar los datos de nuevos trimestres a la base de datos. ¿Debe Jill reejecutar de vez en cuandatos de nuevos trimestres a Ia base de datos. Debe JiU reejecutar completo para verificar esto? ,Con frecuencia do su análisis por completo para verificar esto? ¿Con qué frecuencia se debe hacer? CASO DE ESTUDIO 11.4 11.4 MR. TUX El propietario de varias tiendas de renta de ropa Mr. Tux, John Mosby, ha intentado diversas formas de formas de pronosticar variable más importante, ventas mensuales en dólares. Sus esfuerzos se describen al final pronosticar su variable niás importante, ventas mensuales en dólares. Sus esfuerzos se describen a! final capítulo de cada capitulo de este libro. Después de concluir estos intentos de pronóstico, John decide que hora resumir esfuerzos e intentar llegar a pronosticar el futuro. Él está consciente es hora de resurnir sus esfuerzos e intentar Ilegar a un método de pronosticar el futuro. El está consciente de que debe actualizar tanto sus datos como su método de pronóstico en algún momento futuro, pero pronóstico algün momento futuro, pero momento por el mornento necesita elegir una forma de pronosticar los siguientes meses. comenzar, resume resultados los métodos que ha intentado hasta ahora. A Para comenzar, John resume los resultados de los métodos que ha intentado hasta ahora. A continuaciOn se presentan los resultados de cada método, junto con el capItulo en ci que se expusieron continuación se presentan los resultados de cada método,junto con el capítulo el sus esfuerzos. • Capítulo 2: Podría funcionar el uso del promedio anual para pronosticar las ventas anuales futuras, CapItulo Podria funcionar del prornedio anual para pronosticar pero como John observó una tendencia creciente, necesita de una forma más efectiva de extender fomla estos promedios en el futuro. Además, John está muy preocupado por el efecto estacional, pues estos promedios en el futuro. Además, John está muy preocupado por ci efecto estacional, pues Capítulo 11 CapItulo 11 Estudio Caso de Estudio 551 sabe que sus ventas varían considerablemente por mes. Sus esfuerzos mediante promedios anuales ventas varlan considerablemente mediante promedios anuales no rinden frutos. • CapItulo 3: Junto con su asistente, Virginia Perot, John superó los problemas en la recolección Capítulo 3. con su asistente, Virginia los en la recolección de datos, existentes antes del comienzo de su estudio. El no pensó que fuera tan difIcil obtener Él pensó que fuera tan dificil obtener los datos históricos de sus ventas mensuales, pero está contento de tener un conjunto completo conjunto completo de datos con los cuales trabajar. • CapItulo 4. Mediante el programa Sibyl/Runner, John estableció que en sus datos existIan tanto Capítulo 4: el SibyllRunner, en sus datos existían estacional. Aunque antes de empezar él sabla que estos elementos una tendencia como un efecto estacional. Aunque antes de empezar él sabía que estos elementos estaban ahí, quedó complacido al ver que su programa de cómputo lo establecla en forma establecía fonna estaban ahi, quedó complacido al ver que programa de cómputo estadística. El programa indicó también que varios coeficientes de autocorrelación estaban fuera autocorrelación estaban fuera estadIstica. de los lImites de control, indicando a John que se necesitaba reflejar en su modelo final de límites control, indicando que se necesitaba reflejar en su modelo final de tendencia. pronóstico los efectos tanto estacional corno de tendencia. como • CapItulo 5: Cuando John utilizó Ia atenuación exponencial, incluyendo métodos que tomaron Capítulo la atenuación métodos tomaron en cuenta los factores estacional y de tendencia, las mediciones de error resultantes no fueron resultantes no fueron satisfactorias. John se dio cuenta de que estas mediciones, como el error promedio y satisfactorias. John se dio cuenta de que estas mediciones, como el error promedio y el porcentaje promedio de error, eran el resultado de predecir valores anteriores de su variable. eran el resultado de predecir valores anteriores de su variable. Pero corno eran demasiado altos, él no quiso emplear estas técnicas para predecir el futuro como eran demasiado altos, él predecir el futuro desconocido. • CapItulo 6. La siguiente técnica que intentó John fue el análisis de regresión simple, utilizando Capítulo 6: La siguiente número de periodo corno variable independiente o de Él que esta variable el rn'irnerode periodo como variable independiente o de predicción. El razonó que esta variable tomarIa tomaría en cuenta el factor de tendencia que él sabIa tenían sus datos. Con un valor de r cuadrada sabía tenian cuadrada demostró no ser satisfactorio. de 49%, este método demostró no ser satisfactorio. • CapItulo 7: A continuación, John probó Ia regresión múltiple utilizando tanto el número de Capítulo A continuación, John probó la regresión mñltiple utilizando tanto el nümero tendencia, conjunto de variables ficticias para contabilizar el periodo para reflejar la tendencia, como un conjunto de variables ficticias para contabilizar el efecto estacional (meses). Su valor de cuadrada de efecto estacional (meses). Su valor de R cuadrada de 88% fue una mejora considerable con mejora considerable respecto a su regresión simple, pero la computadora reportó un porcentaje de error medio (PEMA) Ia computadora porcentaje de 72.7 1%. Con este tipo de error, John decidió no usar la regresión multiple. 72.71 %. Con este tipo de error, John múltiple. • CapItulo 8: Finalmente, John obtuvo algunos resultados alentadores mediante el método de Capítulo Finalmente, John obtuvo algunos resultados alentadores mediante el método de descomposición. Pudo mostrar a su banco los índices estacionales y hacer los convenios deseados Pudo mostrar Indices estacionales y hacer los convenios deseados sobre los pagos de su préstamo. También generó pronósticos para los meses siguientes usando su préstamo. También para los meses siguientes usando los componentes de tendencia, cIclico, estacional e irregular. Sin embargo, le quedó un senticíclico, estacional irregular. le quedó un sentimiento de inquietud de que no tenía una medición precisa en su método de pronóstico. Pensó en tenia medición precisa en su método de pronóstico. Pensó en utilizar sus pronósticos y llevar un registro de su precision mes a mes al ir liegando los datos llegando los datos utilizar sus pronósticos y lievar un registro de precisión mes reales. • CapItulo 9. El modelo autorregresivo que probO John dio por resultado un valor de R cuadrada Capítulo 9: El modelo autorregresivo que probó un valor de R cuadrada de 91 %. John estaba muy complacido con el resultado hasta que notO que unos de sus valores tt con el resultado hasta que notó sus valores 91%. era 0.3, dando por resultado que no se rechazara una hipótesis nula. Aunque pensO que sabía por pensó que sabla por habia funcionar qué había resultado este valor bajo, le pareció que este modelo no iba a funcionar como un método permanente de pronóstico en su forma actual. fomla • CapItulo 10: El método de BoxJenkins preocupO a John desde un principio, ya que no lo Capítulo 10: El método de Box-Jenkins preocupó a John desde un principio, ya que lo comprendia en su totalidad. El sabla que tendrIa que explicar cualquier pronóstico que obtuviera Él sabía tendría a los inversionistas y banqueros en su intento por obtener capital para expansiOn, de modo que expansión, de modo que quería un método de pronóstico que fuera a Ia vez preciso y comprensible. No estaba seguro de la estaba seguro de queria que los reportes de Box-Jenkinscalificaran en ninguna de estas categorlas. categorías. que los reportes de BoxJenkins calificaran en ninguna 552 Elementos de juicio en los pronósticos Capítulo 11 CapItulo 11 Al pensar en estos esfuerzos, John se dio cuenta de que el tiempo había transcurrido y que pronto debIa debía habla generar los pronósticos de sus ingresos mensuales. Disponia de un tiempo limitado para intentar ingresos mensuales. Disponía de tiempo limitado para intentar generar los pronósticos de modificaciones a los métodos utilizados y poder pensar en la combinación de dos o más métodos. Pero en la combinación de dos o más métodos. Pero tenía tiempo para adquirir nuevos programas de cómputo intentar métodos completamente no tenla tiempo para adquirir nuevos programas de cómputo eeintentar métodos completamente diferentes. Al preguntarse qué deberIa hacer, miró de nuevo sus lemas favoritos que tenía diferentes. Al preguntarse qué debería hacer, miró de nuevo uno de sus lemas favoritos que tenla la hacer algo, aunque esté mal." enmarcado en Ia pared de su oficina: "Hay que hacer algo, aunque esté mal." TAREA Suponga que se le contrata para ayudar a John Mosby con su problema de pronósticos. Redáctele un fecha recomiéndele curso de acción. Tenga presente memorando que resuma sus esfuerzos a la fecha y recomiéndele un curso de acción. Tenga presente desarrollar pronósticos sus ventas mensuales con rapidez, que sean lo más precisos que John debe desarrollar pronôsticos de sus ventas mensuales con rapidez, que sean lo más precisos posible y que pueda emplear en su exposición a los inversionistas. Sea especIfico en su recomendación emplear exposición a los Sea específico en su recomendación a! propietario de Mr. Tux. al Tux. CASO DE ESTUIIMO 11.5 CASO DE ESTUDIO 11.5 CREDIT COUNSELING CONSUMER CREDIT COUNSELING La operación de Consumer Credit Counseling (CCC) se describió en los caps. 1 (Caso de estudio 1.2) en los caps. (Caso de estudio 1.2) estudio 3.4). y 3 (Caso de estudio 3.4). El director ejecutivo, Mary Harinshfeger, Ilegó a la conclusión de que la variable más importante conclusion Ia variable más importante Marv llegó que CCC requerla pronosticar era el ni'imero de nuevos clientes por atender en el resto de 1993. Mary requería pronosticar era el número en el resto de 1993. Marv proporcionó a Dorothy Mercer los datos mensuales del nOmero de clientes atendidos por CCC en el los datos mensuales del número de clientes atendidos de 1985 a marzo 1993 (véase Caso de estudio 4.3). periodo de enero de 1985 a rnarzo de 1993 (véase Caso de estudio 4.3). Dorothy, con su ayuda, intentó diversas formas de pronosticar Ia variable más importante. Estos su la estos intentos, Dorothy decide que es tiempo esfuerzos se describen al esfuerzos se describen a! final de cada capítulo. Concluidos estos intentos, Dorothy decide que es tiempo capItulo. estos esfuerzos e intentar llegar para pronosticar el resto del año. de resumir estos esfuerzos e intentar Ilegar a un método para pronosticar el resto del aflo. TAREA Suponga que Dorothy lo asigna a usted para ayudarle con este problema de pronOstico. Escríbale un este pronóstico. EscrIbale un reporte que recomiende un curso de acción. Tenga presente que Marv debe desarrollar el pronóstico de Mary debe desarrollar el pronóstico de número nürnero de clientes atendidos que sea lo más preciso posible y que él pueda usar en la toma diaria que diana la específico Marv. de decisiones de Ia organización. Sea especIfico sobre su recomendación a Dorothy y Mary. Recuerde considerar los aspectos expuestos en este capItulo, como el costo. capítulo, CASO DE ESTUIMO 11.6 ESTUDIO NUEVA VISITA A LYDIA E. PINKHAM MEDICINE COMPANY NUEVA VISITA A LYDIA E. PINKHAM MEDICINE Este caso demuestra una aplicación real del uso de redes neurales en el pronóstico de series de tiempo neurales en el pronóstico de series de tiempo Comprendernos para entender de datos. Comprendemos que no se han proporcionado a los estudiantes los antecedentes para entender Este caso es una contribución de Susan C. White, Northwestern State University, Natchitoches, Louisiana. lll1a contribución de Susan C. White, Northwestern State University, Natchitoches, Louisiana. White, "Predicting Time Series with Neural Networks versus Para mayor inforrnación, consúltese Susan C. White, "Predicting Time Series with Neural Networks versus información, consültese Susan Para Statistical Models; The Lydia Pinkham Data", Proceedings of Annual Conlerence of The Decision Statistical Models; The Lydia Pinkham Data", Proceedings 01 the 24th Annual Conference 01 The Decision Sciences Institute, Southwest Region, 1993, 108-1 10. Sciences /nstitute. Southwest Region, 1993, 108-110. Capítulo 11 CapItulo 11 Caso de Estudio Caso Estudlo 553 completamente este Sin pensamos que se derivarán beneficios de la experiencia de este completamente este caso. Sin embargo, pensamos que se derivarán beneficios de La experiencia de este caso real. Lydia E. Pinkham y el Compuesto Vegetal de Lydia Pinkham se presentaron en el La empresa Lydia E. Pinkham y el Compuesto Vegetal de Lydia Pinkham se presentaron en el 10.4. Caso de estudio 10.4. Durante el final de Ia década de 1980 y principios de la de 1990, se han hecho muchos intentos principios de lade 1990, se han hecho muchos intentos la mayoría sido en el de utilizar redes para pronosticar series de tiempo de datos. La mayorIa de los trabajos han sido en el la energIa, ya que estas compañias requieren precisos de la demanda por campo de Laenergía, ya que estas compañías requieren de pronósticos precisos de La demanda por hora de su producto. Sin embargo algunas investigaciones se han enfocado en series de tiempo de negocios más tradicionales como series micro y macroeconómicas, datos demográficos y datos especIficos de macroeconómicas, datos demográficos específicos Prácticamente todo este trabajo ha utilizado adelante entrenada empresas. Prácticamente todo este trabajo ha utilizado una red de alimentación hacia adelante entrenada alimentación mediante retropropagación. Este caso de estudio empleará este tipo de red para pronosticar los datos de mediante retropropagación. Este caso de estudio empleará este tipo de red para pronosticar Los datos de ventas de Lydia Pinkham. Los pronósticos resultantes se compararán con los del modelo AR(2) Lydia Pinkham. Los pronósticos resultantes compararán los del modelo AR(2) ventas presentado en el Caso de estudio 10.4. 10.4. fig. La fig. 11.7 describe una red neural de alimentación hacia adelante 2-4-1 -la red utilizada para describe una red neural de alinientación hacia adelante 2-4--i la red utilizada para este estudio. El primer número en el conjunto 2-4-1 indica el nümero de entradas a la red. En este caso nñmero en el conjunto 2-4-1 indica número Ia red. En este caso las dos entradas son Y, y Y,_7. (El usode dos periodos previos para pronosticar el periodo actual es entradas son Y/-1 Y1-2. (El uso de dos periodos previos para pronosticar el periodo actual es modelo AR(2); así, tanto el modelo AR(2) como el modelo de red neural usan la congruente con el modelo AR(2); asI, tanto el modelo AR(2) como el modelo de red neural usan La El 4 el mmero de nodos, misma "inforrnación" en el cálculo de predicciones un paso adelante.) E14 indica el número de nodos, "información" o unidades de proceso, en el estrato ocu/to. (Se le denomina "oculto" ya que no está directamente oculto. (Se denomina que no está directamente proceso, conectado con el "mundo exterior", como lo estánlos estratos de entrada y salida.) El niimero de nodos lo estn los estratos de entrada y salida.) número estrato oculto se elige, en cierto sentido, de manera arbitraria: la en el estrato oculto se elige, en cierto sentido, de manera arbitraria: pocos nodos ocultos limitan Ia capacidad de la red para "ajustar" los datos y demasiados nodos ocultos hace que la red memorice los demasiados ocultos hace que la red memorice (o estimación). La memorización conduce a un muy pobre desempeño sobre la datos de entrenamiento (o estimación). La memorización conduce a un muy pobre desempeflo sobre la muestra de prueba. En este caso, el nñniero de nodos en el estrato oculto es simplemente el doble del número nodos en el estrato oculto es simplemente el doble del número de entradas. Por ñltimo, el ünico nodo de salida da el pronóstico un paso adelante, o Y,. último, único salida adelante, o Y/. nñmero La red neural catcula su saLida de la siguiente manera: cada uno de los arcos de conexión entre calcula su salida de Ia siguiente manera: cada uno conexión entre los nodos de dos estratos adyacentes tiene un peso ponderado asociado. Cada nodo en el estrato oculto peso asociado. ci calcula una suma ponderada de sus entradas. (Los nodos del estrato de entrada simplemente pasan las entradas. (Los nodos del estrato de entrada simplemente pasan las suma ponderada se "transforma" entonces de cierta forma, tal que Y= entradas al estrato oculto.) Esta suma ponderada se "transfornla" entonces de cierta forma, tal que Y = 1/(1 + e), en donde pasa al estrato de salida, en donde cada nodo calcula 1/(1 + e-J,en donde YYpasa al estrato de salida, en donde cada nodo calcula de nuevo una suma nuevo una suma ponderada. Esta suma ponderada final es la salida de la red. La red se entrena ajustando todas las se entrena ajustando las ponderada. Esta suma ponderada final es Ia salida de la red. ponderaciones conectadas en una forma iterativa. forma EL MODELO DE RED NEURAL DE RED NEURAL BrainMaker,'2 un paquete comercial de simutación disponible La red neural se entrenó utilizando BrainMaker, 12 un paquete comercial de simulación disponible para redes neurales basadas en PC. Para este estudio, el tamaño del paso se fijó en 0.500 y La tolerancia del fijó en 0.500 y la tolerancia del entrenarniento a 0.001. (Otros paquetes podrIan requerir que el usuario especifique una entrenamiento a 0.001. (Otros paquetes podrían requerir que el usuario especifique una tasa de de aprendizaje y un término de momentum.) Como en el Caso de estudio 10.4, se usan las primeras 42 momentum.) de estudio 10.4, se usan las primeras 42 aprendizaje observaciones 'para entrenar la red; las 12 últimas se emplean para evaluar el desempeño de la red en la observaciones para entrenar Ia red; las 12 ñltimas se emplean para evaluar el desempei'io de la red en Ia predicción de un paso adelante. Un problema con el uso de las redes neuraLes para pronosticar series adelante. problema con el uso de las redes neurales de tiempo de datos, está en determinar qué tanto entrenar a Ia red; una red sobreentrenada tiende a tiempo deternlinar tanto entrenar la red; sobreentrenada tiende memorizar los prueba. memorizar los datos de entrenamiento y tiene un desempeño pobre sobre los datos de prueba. Por to entrenamiento y tiene un desempeño pobre sobre lo 12 Scientific Software, 1990. 12 BrainMaker, California Scientific Software, 1990. 554 y en el periodo t -- II ci periodo Elementos de juicio en los pronOsticos juicio en los pronósticos el periodo 2 y en ci periot.io t - 2 Capítulo 11 Capitulo 11 entrada Estrato de entrada Ponderaciones de concxión Ponderaciones dc conexión Càicuio y transfonnacidn de Ia suma pondera Ponderaciones de conexión Ponderaciones dc concxión Estrato de salida salida Predicción Prcdicciim de Y y en ci penodo t el periodo Figura 11.7 2~-1 de alimentación hacia adelante. Figura 11.7 Una red 2-4-1 de alimentación hacia adelante. tanto, algunos investigadores han sugerido simplemente suspender "temprano" elel entrenamiento antes investigadores han sugerido simplemente suspender "temprano" entrenamiento -antes la red neural haya memorizado los datos.1 3 Para determinar entrenamiento, se de que Ia red neural haya memorizado los datos.'3 Para determinar el efecto del entrenamiento, se entrenó la red para 10,000, 20 000, 50,000, 75,000 Y 100,000 iteraciones. (Una iteración es la entrenó a la red para 10,000, 20 000, 50,000, 75,000 y 100,000 iteraciones. (Una iteración es la presentación de una observación; esto representa 250,500, 1 250, 1 875 Y2 500 pasadas a través de un 250, 500, 875 y2 500 pasadas a través de un de entrenamiento, respectivamente.) Esto permite analista evaluar el posible conjunto completo de entrenamiento, respectivamente.) Esto permite al analista evaluar el posible pe procesador Intel 386SX-20, impacto del sobreentrenamiento. (El trabajo se realizó en una PC con un procesador Intel 386SX-20, 100000 y el "tiempo" de entrenamiento para 100 000 iteraciones fue de aproximadamente 20 minutos.) minutos.) 13 N. Morgan H. Bourlard, "Generalization and Pararneter Estirnation Feedforward Nets: Sorne 13 N. Morgan y H. Bourlard, "Generalization and Parameter Estimation in Feedforward Nets: Some Experirnents", D.S. Touretzky, ed. Neural Information Processing Systerns 2, 1990, 630-637. Experiments", en D.S. Touretzky, ed. Neural Information Processing Systems 2, 1990, 630-637. Capitulo 11 Capítulo 11 Bibliografía BibliografIa RESULTADOS DE LA RED NEURAL DE LYDIA E. PINKHAM MEDICINE RESULTADOS DE LA RED NEURAL DE LYDIA E. PINKHAM DATOS ESTIMADOS DATOS DATOS DE PRUEBA DATOS EMC 51923.0 53926.3 54311.3 54424.2 54725.5 555 TABLA 11.6 11.6 ITERACIONES 10,000 20,000 50,000 75,000 100,000 DAM 189.7 189.7 189.8 189.8 195.0 196.0 196.5 196.5 PEMA 11.06% 10.80% 11.22% 11.40% 11.53% DAM 182.2 182.2 169.6 169.6 176.3 176.3 178.1 181.9 181.9 PEMA 11.26% 10.18% 10.51% 10.66% 11.02% EMC 43441.1 37737.4 41529.7 42758.1 43985.4 11.22% 11.40% RESULTADOS 11.6 En la tabla 11.6 se presentan el DAM, PEMA Y EMC para los diversos modelos de red neura!. Éstos y diversos modelos de red neural. Estos se comparan en forma favorable modelo AR(2). autor de este caso está actualmente no se comparan en forma favorable con el modelo AR(2). El autor de este caso está actualmente experimentando con un tipo diferente de red neural -una red neural de base radial- la cual produce neural de experimentando con un tipo diferente de red neural -una la cual produce a los del AR(2). resultados comparables a los del modelo AR(2). una lectura adicional sobre redes neurales, véase Tarun Khanna, 01 Neural Para una lectura adicional sobre redes neurales, véase Tarun Khaima, Foundations of Neural Networks (Reading, MA.: Addison-Wesley Publishing Company, 1990). Networks (Reading, MA.: Addison-Wesley Company, 1990). PREGUNTAS 1. Encuentre un articulo que describa una aplicación de redes neurales a los pronósticos de at1ículo aplicación los pronósticos de series de tiempo. ¿Quémétodo utilizaron los autores y qué tanto éxito tuvo? series de tiempo. Qué método utilizaron los autores y qué tanto éxito tuvo? Si 2. Si tiene usted acceso a un sirnulador de red neural, trate de encontrar una red que produzsimulador red que produzca mejores pronósticos que la red 2--4-1 presentada aqul. mejores pronósticos que Ia red 2-4-I presentada aquí. Por 3. ¿Por qué se vislumbra a las redes neurales como una alternativa viable a los otros métovislumbra las redes neurales alternativa los otros métodos de pronóstico expuestos en este libro? expuestos este libro? BIBLIOGRAFíA BIBLIOGRAFIA ADAMS, F.F. G. The Business ForecastingRevolution. New York: Oxford University Press, 1986. Press, 1986. ADAMS, G. The Business Forecasting Revolution. New York: Oxford GEORGOFF, D.D. M. y MARDICK, G. G. "Manager's Guide to Forecasting."Harvard Business Review 11 GEORGOFF, M. Y MARDICK, R. R. "Manager's Guide to Forecasting." Harvard Business Review (1986): 110-120. (1986): HOGARTH, R.R. M. y MAKRIDAnS, S. "Forecasting and Planning: An Evaluation." Management Science HOGARTH, M. Y MAKRIDAKIS, S. "Forecasting and Planning: An Evaluation." Management Science 27 (2) (febrero, 1981): 115-138. 27(2)(febrero, 1981): 115-138. MAKRIDAKIS, S. S. "The Art and Science of Forecasting." Intern ational Journal ofForecasting 2 (1986): MAKRIDAKIS, "The Art and Science ofForecasting." International Journal olForecasting 15-39. REm, R. A. "The Forecasting Process: Guidelines for the MIS Manager." Journal of Systems 01 Systems REID, R. A. "The Forecasting Process: Guidelines for the MIS Manager." Management (Noviembre, 1986): 33-3 7. Management (Noviembre, 1986): 33-37. WRIGHT, G. yyAYTON, P. P. EDS. Judgmental Forecasting. New York: JohnWiley & Sons, 1987. WRIGHT, G. AYTON, EDS. Judgmental Forecasting. New York: John Wiley & Sons, , APENDICES Apéndice A Delivaciones Apéndice A Derivaciones Apéndice Gráficas de proporción semi logarítmicas Apéndice B Grãficas de proporción oosemilogarItmicas Apéndice C Tablas Apéndice C Tablas Apéndice Datos para el Caso de estudio 7.1 Apéndice D Datos para ci Caso de cstudio 7.1 Apéndice E Conjuntos de datos y base de datos Apéndice E Conjuntos de datos y base de datos APÉNDICE APENDICE Derivaciones Derivciciones Derivación de correlación Derivación r r= _ [(X -- p-x)/O"x][(Y - p-y)/O"y] IZXZ y [(X ZXZY N =I N = N N - (X/N)2 \/[(Y2/N) (IY/N)2]/N - (IX/N)2 Y[(Iy2/N) - (Y/N)2]/N I(X - p-x)(Y - p- y) - - I(X - p-x)(Y - p)) p- y - - - \/(X2/N) Y (IX2/N) V[NX2 (IX)2]/N 2 V[NY2 (IY)2]/(N 2/N) Y[NIX2 - (X)2]/N2 Y[NIy 2 - (Y)2]/(N2/N) p-x)(Y - p- y) = VNIX2 - (IX)2 YNIy 2 - (Y)2 YNIX 2 - (IX)2 \/NIY2 - (Iy)2 N I (X N(X - - N(XY - Yii, -- X P- y ++P-XP-y) p,) NI(XY - y P-x X p. VNX2 (IX)2 VNIY2 - (Iy)2 = VNIX 2 - (IX)2 VNIy 2 - (IY)2 N[IXY N[IXY- - (IXIY/N) - (XIY/N) + N(X/N)(Y/N)] (XIY/N) - (IXIY/N) + N(IX/N)(IY/N)] \/NIX2 - (IX)2 YNIy2 - (Iy)2 YNIX2 - (X)2 \/NIY2 - (Y)2 N[IXY - - (XIY/N) (IXIY/N) (IXIY/N)] N[Y.XY (IXIY/N) - - (XY/N) + (IXY/N)] VNX2 - (X)2 YNIy 2 - (Y)2 \/NIY2 - (Iy)2 YNIX2 - (IX)2 N[IXY - - (IXIY/N)] N[IXY (IXY/N)] VNx2 - (IX)2 VNIY2 - (~:y)2 YNIX2 - (X)2 YNIy 2 - (Y)2 NIXY - - IXIY NIXY IXY VNx2 - (X)2 VNY2 - (Y)2 559 560 Derivaciones Apéndice A Derivación de mInimos cuadrados mínimos y Y 0 (X, Y) (X,Y) 0 0 d=Y-Y d=YY = y - (b o + bX) = Y(b0+bX) 2 = {Y - (b0 + bX)}2 d = [Y - (b o + bX)]2 d2 Id 2 = I[Y - (b0o+ bX)]2 (b + bX)]2 = I(Y - b0 -- bX)2 b o bX)2 ° 0 0 0 o y = ba + bX Y=b0+bX 0 0 0 0 0 1...- 0 X x Derivadas parciales 8I = 2I(Y - bX - b0)(X) = 2(Y - bX - bo)(-X) 8b 6b = 2I( - XY bX2 boX) = 21(XY + + bX2++b0X) 8b 8b0 o 8I = 2I(Y - bX - b )(-1) =2(YbXb0)(-1) o = bo = 2I( - + + bX++b0)) 2(Y Y bX Para obtener los mInimos, igualar los parciales a cero obtener los mínimos, los parciales 21(XY+bX2+b0X)=O I(-XY++ bX2 + b0X) = 0 (XY bX2 + boX) = O - IXY + boIX + bX2 = O XY+b0X+bX2=O O: 2(Y+bX+b0)=O I( - y + bX+ b0) = 0 I(Y + bX + bo) = O - I y + Nb o + b Ix = O Y+Nb0+bX=O Encontrar una bo Y Encontrar una b0 y b tales que liP sea un mInimo d2 sea un mínimo b0IX+ bIx 2 = Ixy boIX + bX2 = XY Nb o + bIX = IY Nb0+bX=IY resta XN X N X Ix xx NbØIX NbIx 2 = NXY NboIX ++ NbX2 = NIxy NboIX + b(IX)2 = IxIY Nb0IX + b(X)2 = b[NIX 2 (IX)2] = NXY b[NX2 - (2X)2] = NIxy -b b NbIx 2 - - b(X)2 = NXY - XY NbIX2 b(IX)2 = NIxy - IXIY IXIY NIxy - - IxIY NXY IXY = NX22 - (X)2 - NIX _ (IX)2 formula de la pendiente fórmula de la pendiente Nb o + bIx = IY Nb0+bIX=Y Nb o = b Nb0 IY - bIx =YbX = IY IY b0=-o N N bIx bX = - - bX y N =YbX N fórmula la intersección con Y formula de la intersección con Y Conversión de valores de tendencia anual a mensual mensual Conversion de 561 CONVERSIÓN DE VAL ORESDE TENDENCIA ANUAL A MENSUAL CONVERSION DE VALORES DE TENDENCIA ANUAL A Pasos para convertir Ia ecuación de tendencia de anual a mensual: la de anual a mensual: Pasos l. Se deben convertir la pendiente y La constante de valores anuales a mensuales. convertir la pendiente y la constante de valores Para ello, divida b0 Y b) entre 12. Este paso debe omitirse cuando los datos sean bo y b1 entre 12. Este paso debe omitirse cuando los datos acumulativos o cuando sean porcentajes. En otras palabras, acurnulativos o cuando las cifras anuales sean porcentajes. En otras palabras, para que este paso sea aplicable, los datos mensuales deben sumar los totales sea aplicable, mensuales deben para anuales. ecuación anual registro automóviles anuales. La ecuación anual para el registro de automóviles nuevos es y = 8.043 + .06368X Y= 8.043 + .06368X donde 1 unidad representa I año, X = 0 representa el 1 de julio de en donde I unidad de X representa 1 año, y X = O representa elIde julio de 1959. 1959. y = 8.043/12 + .06368/12(X) 1' = 8.043/12 + .06368/12(X) y .67025 + .0053066X Y = .67025 + .0053066X 2. Los datos anuales y mensuales deben registrarse en el mismo tipo de unidades. unidades. Los datos anuales mensuales deben registrarse en Si están así, omita este paso. En caso contrario, convierta los datos anuales a contrario, convierta los datos anuales Si están asI, omita este paso. mensuales desplazando el punto decimal segñn corresponda. Como los datos mensuales desplazando el punto decimal según corresponda. Como anuales están registrados en rnillones de registros y los mensuales en miles, anuales están registrados en millones de registros los mensuales en miles, punto decimal tres posiciones hacia la derecha. desplace el punto decimal tres posiciones hacia la derecha. y = 670.25 + 5.3066X Y = 670.25 + 5.3066X 3. Se debe convertir el valor de X de anual a mensual dividiéndolo entre 12. En Se debe conve11ir el X anual mensual dividiéndolo entre la ecuación, la X se refiere a unidades en términos de años. Convierta X de términos años. Convierta X Ia ecuación, Ia X se refiere unidades modo que represente meses dividiéndola entre 12. 12. modo y + 5.3066/12(X) Y = 670.25 + 5.3066/12(X) y= + .4422X Y = 670.25 + .4422X 4. Se debe cambiar el oligen a Ia mitad del primer mes de datos, por lo regular el lo regular el debe el ongen la 15 de enero. Para moverlo del 1 de julio de 1959 al 15 de enero de 1986, se 15 de enero. Para moverlo del I de julio de 1959 al 15 de enero de 1986, se deben surnar 317.5 meses al valor codificado de X. La ecuación mensual final codificado de X. deben sumar 317.5 meses al es y == 670.25 + .4422(X + 317.5) Y 670.25 .4422(X 317.5) Y == 670.63 + .4422X + 140.399 670.63 .4422X 140.399 y = 810.649 .4422X Y = 8 10.649 + .4422X en donde y = valores mensuales de tendencia Y= valores mensuales de tendencia esperados mensuales con el 0 ubicado en el 15 1986 X = valores men sualescon el O ubicado en el 15 de enero de 1986 APEN DICE APÉNDICE Gráficas de proporción Gráficcis de proporción o semilogarítmlcas semilogcirItmicas ACTIVIDAD Cuando gráfica con aritmética vel1ical demuestra útil, se encuentran Cuando una gráfica con una escala antmética vertical no demuestra ser ñtil, se encuentran muchos tipos de problemas. Como un ejernplo tipico de esta situación, considérese el caso problemas. ejemplo típico situación, considérese el caso muchos de Alexander Furniture Company. Esta empresa ha estado fablicando una linea de muebles Fumiture Company. Esta empresa ha estado fahicando una línea de muebles que nosotros Ilamaremos línea de producto A. En 1990 comenzó a producir una ilnea que nosotros llamaremos Ilnea de producto A. En 1990 comenzó producir una línea adicional muebles, línea de producto B, que diferia de la en estilo como adicional de muebles, Imneade producto B, que difería de Ia anterior tanto en estilo como en margen de precios. En ci periodo de 1990 aa1994, ambas lineas de productos han 1994, ambas líneas de productos han en margen precios. En el periodo de 1990 incrementado se muestra en la 8.1. incrementado sus ventas, como Sc muestra en Ia fig. B.1. 6,000,000 5,000,000 Línea A LInea de producto A rf¡ C,, :o "O ~ (';l ~ 4,000,000 r::: ~ i:: > ti) 3,000,000 2,000,000 1,000,000 LInea Línea de producto B 0 o 1990 1991 1992 Año Aflo 1993 1994 1994 Figura B.1 Ventas de dos lIneas de B.I líneas productos de la Alexander Furniture la Alexander Furniture Company, 1990-1994; gráfica de Company, 1990-1994; linea línea aritmética. 562 Escala proporcional o logarItmica logarítmica 563 Esta gráfica, que utiliza una escala aritmética vertical, ofrece Ia impresión distintiva gráfica, escala aritmética la impresión distintiva de que Ia lInea de producto A se desempeñó mucho mejor en este periodo que la Ilnea de la línea desempeñó mucho mejor en este periodo que línea de producto B. impresión surge debido a que el incremento absoluto en las ventas de producto B. Esta irnpresión surge debido a que el incremento absoluto en las ventas de la línea de producto A fue mucho mayor que el de Ia linea de producto B, de ahI que la curva ahí la curva !Inea de producto A fue mucho que el la línea de de la Ilnea A suba de manera más acentuada en Ia gráfica. línea A suba de manera más acentuada en la gráfica. La administración de la compañía no tenía expectativas de que el volumen de ventas La adrninistración de Ia cornpañia no tenIa expectativas de que el volumen de ventas la línea igualara al de la línea establecida, tampoco de que el incremento de Ia nueva lInea se igualara a! de Ia lInea ya establecida, ni tampoco de que el incrernento las ventas de la nueva línea igualara o superara al de la línea establecida. en las ventas de Ia nueva lInea igualara o superara al de Ia Imnea establecida. Por ello, el incremento interés no se centró en una comparación de las ventas absolutas o del incrernento absoluto, de las ventas bien en una comparación del incremento relativo en ambas líneas. sino más bien en una cornparación del incremento ,-elativo en las ventas de ambas lIneas. Específicamente, la EspecIficamente, Ia pregunta que se formuló fue si las ventas de la línea B se incrementaron que formuló flue silas de Ia lInea B se incrementaron más rãpidamente que las de Ia lInea A. Se puede responder a esta pregunta mediante el más rápidamente que las la línea A. Se puede responder a esta pregunta mediante el cálculo lazos relativos para cada línea de producto y graficándolos en papel gráfico cálculo de lazos relativos para cada lInea de producto y graficándolos en papel gráfico grúfica con una escala logarítmica también aritmético. Una grtfica con una escala proporcional o logaritmica también responderá a esta pregunta y sin ningún cálculo intermedio. pregunta -ysin ningñn cMculo intermedio. la exposición relativa a la Alexander Fumiture Company, Antes de continuar con la exposición relativa a Ia Alexander Furniture Company, Antes de continuar abordaremos las caracterIsticas de Ia escala proporcional o logarItmica. las características de la escala proporcional o logarítmica. ESCALA PROPORCIONAL 0 LOGARíTMICA ESCALA PROPORCIONAL O LOGARITMICA la tig. 8.2 se muestra una gráfica escala horizontal, o de tiempo, es escala En Ia fig, B.2 se muestra una grãfica cuya escala horizontal, o de tiempo, es una escala aritmética convencional. Sin embargo, Ia escala vertical es una escala aritmética convencional. Sin embargo, la escala vertical es una escala proporcional o o 6,000,000 6 6 5,000,000 5 5 4,000,000 4 3,000,000 ~ Línea de producto A LInea de 3 2 2,000,000 1,000,000 800,000 600,000 500,000 400,000 300,000 200,000 1 1 8 6 5 4 3 2 Línea de producto B LInea de producto 100,000 1 L-..JL-_-...l_ _---L_ _----L_ _---'---1994 1993 1992 1991 1990 Año Aflo Figura B.2 Ventas de dos lineas de B.2 dos líneas de productos la productos de Ia Alexander Furniture Company, Company, 1990-1994; gráfica de línea proporcional o semilogarItmica. semilogarítmica. lInea 564 Gráficas de proporción o semilogarítmicas semilogaritmicas Apéndice B logarítmica, es decir, una escala en Ia que intervalos iguales representan diferencias iguales lU1a la representan logarItmica, los logaritmos números. Dicha gráfica se denomina gráfica proporcional semilogaen los logaritmos oonümeros. Dicha gráfica se denomina gráfica proporcional oo semilogaritmica. rItmica. Nótense los espacios graduados de las marcas en la escala vertical. En ella se Nótense los espacios graduados de las marcas en Ia escala vertical. En ella se parte, muestran dos conjuntos níuneros. Los números interiores, 1, 2, etc., no muestran dos conjuntos de nürneros. Los niirneros interiores, 1, 2, etc., no son parte, propiamente dicha, de la escala, pero corresponden a los niimeros guía que se encuentran en números guIa el papel gráfico semilogarItmico. Por lo regular estos niimeros guía no se reproducen semi logarítmico. Por lo regular estos números gula no reproducen el papel en Ia gráfica, pero los incluimos aqul para mostrar córno se construye una escala la gráfica, pero los incluimos aquí para mostrar cómo se construye una escala proporcional. El número inferior guía es I y sirve como el punto de partida de la escala. El niimero inferior gula es 1 y sirve corno el punto de partida de la escala. Cualquier niimero positivo de Ia escala diferente de cero debe colocarse aqul. En el caso número la colocarse aquí. En el caso Company volumen ventas más pequeño fue de de Ia Alexander Furniture Company el volurnen de ventas más pequeflo fue de de la $135 000; por ello, es más conveniente iniciar Ia Ilnea de base de $135 000; por ello, es más conveniente iniciar la línea de base de la escala con con $100000. Aunque podríamos comenzar la línea de base de la escala con cualquier valor $100 000. podriamos Ia lInea de base de Ia escala con cualquier valor positivo diferente de cero, por lo regular es más sencilio empezar con 1, 10 o algün positivo diferente de cero, por lo regular es más sencillo empezar con 1, 10 algún múltiplo de 10, ya que entonces las principales divisiones horizontales señaladas con ya que entonces las principales divisiones horizontales señaladas con mültip!o de marcas representarán nñmeros redondos. En el número guía opuesto colocamos marcas representarán números redondos. En el niirnero guIa opuesto 2, colocarnos el sea $200000. En forma similar, valor que es el doble del de la línea de base, valor que es el dobie del de Ia ilnea de base, oosea $200 000. En forma similar, escribimos $300 000 que corresponden al níunero gula y así sucesivamente. Al escribirnos $300 000 que corresponden al nñmero guía 3 y asi sucesivamente. Al 10 veces el de la línea número gula que sigue al número 9 se le nñmero guía 1 que sigue al nuimero 9 se le asigna un valor de 10 veces el de Ia lInea de base; en este caso se le da un valor de $1 000 000. Nótese que las distancias verticales debase; en este caso se le da mi valor de $1 000 000. Nótese que las distancias verticales números gula, venían haciéndose más pequeñas hasta este punto, ahora se entre los niimeros guía, que venlan haciéndose más pequeflas hasta este punto, ahora se hacen más grandes. De hecho, es la misma secuencia de graduaciones que inicia de hacen más grandes. Dc hecho, es Ia misma secuencia de graduaciones que inicia de nuevo. Cada secuencia completa de graduaciones se denomina ciclo. Al etiquetar nuevo. Cada secuencia completa de graduaciones se denomina ciclo. Al etiquetar el siguiente ciclo, se procede igual que antes. Debemos escribir $2 000 000 que corressiguiente ciclo, procede igual antes. Debemos escribir $2 000 corresponden número gula 2 del segundo ciclo, ya este número dos veces el valor ponden al nl'imero guía 2 del segundo ciclo, ya que este mimero es dos veces el valor del segundo de la base del segundo ciclo. Nótese que el tope del primer ciclo se convierte ahora en la del segundo ciclo. Procediendo esta forma, llenaremos escala vertical de la Ia base del segundo ciclo. Procediendo de esta forma, Ilenaremos la escala vertical de la ciclo no fig. B.2. Se puede apreciar que el segundo ciclo no está completo, pues no hay necesidad llevar la escala hasta $ 000000. de lievar Ia escala hasta $11000 000. El El papel gráfico semilogarItmico se encuentra disponible en uno, dos, tres o incluso semi logarítmico encuentra disponible en tres o incluso rnás ciclos. Desde luego, el nñrnero de cicios depende del alcance de los datos. Si se más ciclos. Desde luego, ci número de ciclos depende del alcance de los datos. Si se graficara una serie en la que ei valor rnás alto es ocho veces ci valor mãs pequeo, por 10 graficara una serie en Ia que el valor más alto es ocho veces el valor más pequeño, por lo regular se usaría papel de un ciclo, ya que sabernos que el tope de un ciclo tiene 10 veces veces regular se usarla papel de un cicio, ya que sabemos que el tope de un ciclo tiene la línea base. otra palie, una serie cuyo valor más alto fuera, por decir, el valor de Ia lInea de base. Por otra parte, una serie cuyo valor más alto fuera, por decir, el 12 veces el más pequeño, requeriría de un papel grf1co semilogarItmico con por lo menos papel gráfico semi logarítmico con por lo menos 12 veces el mãs pequeno, requerirla dos ciclos. Una vez etiquetada Ia escala vertical, se produce Ia graficación de Ia serie en la etiquetada la escala vertical, la graficación de la en la Una forma usual. común que el papel gráfico semi logarítmico rayado los forma usual. Es comin que el papel gráfico sernilogaritmico tenga un rayado entre los 20 números guía de la escala vertical para ayudar a Ia graficación. Si, por decir, hay 20 niimeros guIa de Ia escala vertical para ayudar a la graficación. Si, por decir, espacios entre los nimeros guía 1 y 2 en el papel gráfico empleado en la fig. B.2, cada espacios entre los números gula I y 2 en el papel gráfico empleado en la fig. B.2, cada uno de los espacios representará $5 000 en el primer ciclo y $50 000 en el segundo. los espacios representará $5 000 en el $50 el segundo. uno Estas líneas rayado adicional la escala vertical permiten graficar datos con Estas lIneas de rayado adicional en Ia escala vertical permiten grafIcar los datos con precisión. mucha precision. Interpretación de la escala proporcional o logarItmica InterpretaciOn de Ia escala proporcional o logarítmica 565 INTERPRETACIÓN DE LA ESCALA PROPORCIONAL O LOGARíTMICA INTERPRETACION DE LA ESCALA PROPORCIONAL 0 LOGARITMICA Después de considerar la mecánica de etiquetado de la escala vertical y de graficar los Después de considerar la mecánica de etiquetado de Ia escala vertical de graficar los puntos, podemos ahora discutir las formas de interpretar una gráfica semilogaritmica. puntos, podemos ahora discutir las formas de interpretar una gráfica semilogarítmica. Primero, en Ia escaia vertical de la fig. B.2 entre $100 000 Primero, compare Ia distancia en la escala vertical de la fig. B.2 entre $100 000 y $300 000 la y entre $300 000 y $900 000. Nótese que en cada instancia se cubrió Ia misma distancia $300000 y $900 000. Nótese que cada instancia se cubrió la misma distancia en en la escala vertical, sin importar el hecho de que en el primer caso representa un increvertical, sin importar el hecho de que en representa un incremento $200 mientras que el segundo representa incremento $600 000. mento de $200 000, mientras que en el segundo representa un incremento de $600 000. Nótese también que el incremento relativo en cada caso es el mismo, es decir 200%. Si se incremento relativo en 200%. Si se mide en Ia escala vertical cualquier otro caso en el que se haya un incremento de 200%, mide en la escala de 200%, se encontrará se encontrará que Ia distancia requerida para un incremento de 200% en la escala vertical la requerida la escala vertical de Ia fig. B.2 es siempre la misma. de la fig. B.2 es siempre Ia misma. En general, Ia escala proporcional tiene las siguientes caracterIsticas importantes: la proporcional siguientes características importantes: • Porcentajes iguales de carnbio requieren de distancias verticales iguales en la escala escala Porcentajes iguales cambio requieren de distancias verticales iguales proporcional. Entre el la veliical requerida. • Entre mayor sea el cambio relativo, mayor será Ia distancia vertical requerida. Ahora regresaremos a nuestra discusión de las escalas de las ilneas de los productos líneas de los productos Ahora regresaremos a nuestra discusión de se sobrepusieron la gráfica A y B de Ia Alexander Furniture Company. En la fig. B.2, se sobrepusieron a la gráfica A B de la Alexander Furniture Company. En fig. líneas horizontales de guiones para ayudar a comparar las distancias requeridas para reflejar reflejar lIneas horizontales incremento las ventas entre 1990 y 1994 para cada una de las dos líneas de producto. el incremento en las ventas entre 1990 y 1994 para cada una de las dos ilneas de producto. Como Ia distancia es mayor para la línea del producto B que para la línea del producto A, Como la distancia es mayor para Ia lInea del producto B que para la Ilnea del producto A, concluimos que la línea del producto más reciente experimentó un mayor incremento concluirnos que Ia lInea del producto rnás reciente experimentó un mayor incremento en las ventas en estos cinco años. relativo en las ventas en estos cinco años. Para interpretar Ia gráfica proporcional, no es necesaria la medición, en esta forma, medición, en esta fonna, Para interpretar la grática proporcional, no la distancia vertical. Nôtese en Ia fig. B.2 que la curva de Ia línea del producto B de Ia distancia vertical. Nótese en la fig. B.2 que Ia curva de la linea del producto B está rnás inclinada que Ia de Ia linea del producto A, ya que Ia curva de B tiene que cubrir una más inclinada que la de la línea del producto A, que la curva cubrir mayor distancia vertical durante ci mismo periodo. De ahI que podarnos decir simplemente vertical durante el mismo periodo. De ahí que podamos decir simplemente lo siguiente: lo en gráfica • Entre más inclinada sea Ia curva en una gráfica proporcional, mayor será el porcentaje la de cambio. camhio. Este resultado significa que sólo se necesita comparar las pendientes de las curvas Este resultado significa que solo se necesita comparar las pendientes de las curvas para obtener conclusiones sobre los cambios relativos. Si las dos líneas de la fig. B.2 para obtener conclusiones sobre los cambios relativos. Si las dos Ilneas de Ia fig. B.2 hubieran sido paralelas, habrían indicado una proporción de cambio igual, supuesto hubieran sido paralelas, hahrIan indicado una proporción de cambio igual, por supuesto porque líneas la pendiente. porquc dos IIneas rectas paralelas tienen Ia misma pendiente. AdeméÍs de comparar los cambios relativos entre dos periodos entre varias series sobre Adeniis de comparar los dos periodos entre varias series sobre gréÍfica también una gráfica proporcional, podemos también estudiar los cambios relativos entre un periodo y otro en cualquier serie dada. Por ejemplo, Ia fig. B.3(a) presenta una gráfica proporcional cualquier serie dada. Por ejemplo, la fig. B.3(a) presenta una gráfica proporcional en la que la serie estéÍ representada por una línea recta. Es evidente de inmediato que el en Ia que Ia serie estã representada por una lInea recta. Es evidente de inmediato que el línea porcentaje de cambio entre uno y otro periodo de esta serie es constante, ya que porcentaje de camhio entre uno y otro periodo de esta serie es constante, ya que una Ilnea 566 proporción p semilogarítmicas Gráficas de proporciOn ,o semilogarItmicas Apéndice B 1/ I] /~( I I I I I I I I I I (a) Incrernento a (a) Incremento tasa constante una tasa constante (b) Incremento a una tasa creciente creciente (e) Incrernento a (c) Incremento una tasa decreciente una tasa (b) Incrernento a I I I I I I I I i I I (d) Disminución a (d) Disrninución una tasa constante tasa constante (e) Disrninución a (e) Disminución una tasa creciente una tasa (f) Disminución a (f) una tasa decreciente una B.3 diferentes Figura B.3 Ejemplos de diferentes patrones sobre papel proporcional. proporcional. recta tiene una pendiente constante. Mientras que una lInea recta en una grãlica aritmética recta constante. Mientras que una línea recta en gráfica aritmética línea indica indica una cantidad constante de cambio, una IInea recta en una gráfica proporcional indica proporción tasa constante cambio. una proporcki ootasa constante de camhio. La fig. B.3(b) presenta en una gráfica proporcional una serie cuya tasa de incremento de incremento La fig. presenta en una grifica proporcional se hace cada vez músgrande al graficar cada punto sucesivo. Se sabe este resultado porque se hace cada vez ms grande al grafícar cada punto sucesivo. Se sabe la curva se hace cada vez músinclinada. En breve, estableceremos que esta serie aumenta Ia curva se hace cada vez ms inclinada. En breve, estableceremos que esta serie aumenta tasa creciente. en una tasa creciente. En forma similar, podemos fúcilmente apreciar que la serie en la fig. B.3(c) aumenta En forma similar, podemos ftcilmente que Ia serie en Ia fig. B.3(c) aumenta en una tasa decreciente ya que Ia curva se hace cada vez nienos inclinada. La fig. B.3(d) decreciente ya que la curva se menos inclinada. La fig. en una (f) presenta una disminuye constante, mientras que las figs. presenta una serie que disminuyc a una tasa constante, mientras que las figs. B.3(e) y (f) series que disminuyen a tasas creciente y decreciente, respectivamente. presentan dos series que disminuyen a tasas creciente y decreciente, respectivamente. Hagamos ahora una Interpretación más completa de la fig. 8.2. Aunque las ventas de Hagamos ahora una Interpretación más completa de Ia fig. B.2. Aunque las ventas de ambas IIneas de productos han estado aumentando, las ventas de la nueva línea de producto líneas de productos han estado aumentando, las ventas de Ia nueva linea de producto lo ha hecho mIs rpido. Dc hecho, las ventas de Ia lInea del producto B han estado lo hecho mús rúpido. De hecho, las ventas de la línea del producto B han estado aumentando a una tasa creciente, mientras que las ventas de Ia lInea del producto A han la línea producto A han aunientando a una tasa creciente, mientras que las ventas aumentado a una tasa decreciente. Dc ahI que, aunque las ventas de Iala nueva línea aún están a una tasa decreciente. De ahí que, aunque las ventas de nueva linea aim muy por dehajo de las de Ia lInea ya estahiecida, y aunque los incrernentos absolutos en debajo las de la línea ya establecida, y aunque los incrementos absolutos en muy ventas scan menores, Ia nueva lInea de producto ha tenido éxito. Por lo tanto, las gráficas línea producto Por lo tanto, las gráficas ventas sean menores, la administración con proporcionales proporcionan respuestas expeditas aalas preglmntas de la adrninistración con respuestas expeditas las preguntas respecto al incremento relativo en las ventas de las dos lineas de producto. dos líneas de producto. respecto aI incremento relalivo en APÉNDICE APENDICE Tablas C Tabla C.l Términos individuales de la Distribución Binomial Tabla C.1 Términos individuales de Ia Distribución Binomial Tahia C.2 Áreas de Distribución de probabilidad normal Tabla C.2 Areas de I)istrihución de probahilidad normal estándar Tabla C.3 Valores criticos de I Tabla C.3 Valores críticos Tabla CA Valores criticos de ji cuadrada Tabla C.4 Valores críticos dc ji cuadrada Tabla C.S Digitos aleatorios Tahia C.5 Dígitos aleatorios Tabla C.6 Distrihución F Tabla C.6 Distribución F Tabla C. 7 Limites de prueha de Durhin-Watson Tahla C.7 Límites de prueba dc Durbin-Watson 567 TABLA C.1 TABLA C.1 TERMINOS INDIVIDUALES DE LA DISTRIBUCION BINOMIAL TÉRMINOS INDIVIDUALES DE LA DISTRIBUCiÓN p p n x 0 O .05 .10 .9000 .1000 .8100 .1800 .0100 .15 .20 .25 .30 .35 .40 .45 .50 .55 .60 .30 .65 .70 .75 .80 .85 .90 .95 2 3 4 5 5 6 7 1 0 O 1 1 2 2 O 0 1 1 2 2 3 3 O 0 1 1 2 2 3 3 4 0 O 1 1 2 2 3 3 4 5 5 0 O 1 1 2 2 3 3 4 5 5 6 O 0 1 1 2 2 3 3 4 5 5 6 6 7 7 1 .9500 .0500 .9025 .0950 .0025 .8574 .1354 .0071 .0001 .1715 .0135 .0005 .0000 .7738 .2036 .0214 .0011 .0000 .0000 .7351 .2321 .0305 .0021 .0021 .0001 .0000 .0000 .0000 .6983 .2573 .0406 .0036 .0002 .0000 .0000 .0000 .0000 .0000 .8500 .1500 .7225 .2550 .0225 .7290 .2430 .2430 .0270 .0010 .6561 .6561 .6141 .6141 .3251 .3251 .0574 .0034 .5220 .3685 .0975 .0115 .0005 .4437 .3915 .1382 .1382 .0244 .0244 .0022 .0022 .0001 .0001 .377 1 .3771 .3993 .1762 .0415 .0415 .0055 .0055 .0004 .0000 .3206 .3206 .3960 .3960 .2097 .0617 .0109 .0109 .0012 .0001 .0000 .2916 .0486 .0036 .0001 .5905 .3281 .0729 .0081 .0004 .0000 .53 14 .5314 .3543 .0984 .0146 .0012 .0001 .0000 .4783 .3720 .1240 .0230 .0026 .0002 .0000 .0000 .7500 .7000 .6500 .8000 .6000 .5500 .5000 .4500 .4000 .3500.5000 .8000 .9500 .2500 .2000 .1500 .3000 .3000 .2500 .1000 .0500 .4000 .2000 .2500 .3000 .3500 .2000 .4500 .5000 .5500 .6000 .6500 .7000 .7500 .7500 .8000 .8500 .9000 .9500 .6400 .5625 .4900 .4225 .3600 .3025 .2500 .2025 .1600 .1225 .0400 .0225 .0100 .0025 .0900 .0625 .4800 .4950 .3200 .3750 .4200 .4550 .3200 .5000 .4950 .4800.3750 .4950 .4550 .4550 .4200 .3750 .3200 .2550 .1800 .0950 .0400 .0625 .0900 .1225 .1600 .2025 .2500 .3025 .3600 .4225 .4900 .5625 .6400 .7225 .8100 .9025 .7290 .1250 .5120 .4219 .3430 .2746 .2160 .1664 .3430 .0911 .0640 .0429 .0270 .0156 .0429 .0156 .0900 .0034 .0010 .0001 .2880 .3840 .4219 .4410 .4436 .4320 .4084 .4410 .3750 .3341 .1890 .1406 .0960 .0574 .1890 .2389 .0071 .0270 .0574 .0960 .1406 .1890 .2389 .2880 .3341.1890 .3750 .4084 .4320 .4436 .2430 .4219 .4410 .4219 .3840 .3251 .1354 .0080 .0156 .0270 .0429 .0640 .0911 .0270 .1250 .1664 .2160 .2746 .0034 .1664 .7290 .3430 .4219 .5120 .6141 .3430 .8574 .3164 .1785.4096 .1296 .0915 .0410 .0256 .0150 .4096 .3164 .2401 .0625 .1785 .0081 .0016 .0005 .0001 .0039 .0000 .2916 .4096 .4219 .4116 .3845 .3456 .2995 .2500 .2005 .1536 .1115 .0756 .0469 .0256 .0115 .0036 .0005 .1536 .2109 .2646 .3105 .3456 .3675 .3750 .3675 .3456 .3105 .2646 .2109 .2109 .1536 .0975 .0486 .0135 .0256 .0469 .0756 .1115 .1536 .2005 .2500 .2995 .3456 .3845 .4116 .4219 .4096 .3685 .2916 .1715 .4219 .4096 .0016 .0039 .0081 .0150 .0256 .0410 .0625 .0915 .1296 .1785 .2401 .0625 .3164 .5220 .6561 .8145 .3277 .2373 .1681 .1160 .0078.2373 .0503 .0313 .0185 .0102 .0503 .0024 .0010 .0003 .0053 .0000 .0001 .0024 .0000 .2059 .3602 .3124 .2592.3955 .1128 .0768 .0488 .0284 .4096 .3955 .0284 .0146 .0146 .0064 .0022 .0004 .0000 .1563 .3456 .2048 .2637 .3087 .3364 .2048 .3125 .2757 .2304 .1811 .3369 .05 12 .1811 .1323 .0879 .0512 .0244 .0081.0879 .0011 .3369 .3456 .3364 .0879 .1323 .1811 .2304 .0879 .0512 .2757 .3125 .2048 .0729 .0214 .3087 .3369 .2637 .1382 .3087 .0064 .0146 .0283 .0488 .0768 .1128 .1562 .0488 .2059 .2592.1128 .3601 .2059 .4096 .3915 .3281 .3124 .3955 .2036 .0024 .0053 .0102 .0185 .0503 .0778 .1160 .1681 .2373 .3277 .4437 .5905 .2373 .0000 .0312 .0003 .0010 .7738 .1780 .1176 .0754 .0467 .0277 .0007 .2621 .0083 .0041 .0007 .0002 .0001 .0000 .0000 .0000 .0156 .0018 .1359 .0938 .0609 .0044 .0004 .0938 .0001 .3932 .3560 .3025 .2437 .1866 .3560 .0369 .1359 .0015 .0000 .0205 .0102 .1861 .2458 .2966 .3241 .3280 .3110 .2780 .2344 .3280 .1382 .0951 .0951 .0595 .0001 .0595 .0330 .0154 .0055 .0012 .0001 .0819 .1318 .1852 .2355 .2765.1318 .3032 .3125 .3032 .0819 .0415 .0146 .0021 .2765.2765 .3032 .1852 .1318 .2355 .1852 .1382 .1861 .0001 .2344 .2780 .2966 .0951 .3110 .3280 .3241 .3241 .2458 .1762 .0984 .0305 .0154 .0330 .0595 .0951 .0102 .0205 .1866 .2437 .3025 .2321 .0015 .0044 .0205 .0369 .0609 .0937 .1359 .3932 .3993 .3543 .2321 .3560 .1866 .0002 .0007 .0018 .0041 .1780 .2621 .2351 .235 1 .0001 .0467 .0754 .1176 .1780 .3771 .0000 .0083 .0156 .0000 .0277 .0277 .1176.5314 .0037 .0001 .2097 .1335 .0824 .0490 .0280 .0152 .0152 .0078 .0490 .0016 .0006 .0002 .0280 .0000 .0000 .0000 .0000 .0002 .0000 .3115 .2471 .3670 .3115 .1848 .1306 .0872 .0547 .0320 .0172 .0084.0547 .0036 .0013 .0004 .0001 .0036.0000 .2753 .3115 .3177 .2985 .2753 .2985 .2613 .2140 .1641 .0012 .0002 .0000 .1240 .0774 .0466 .0250 .0250 .0115 .0774 .0043 .1172 .2613 .1147 .1730 .2269 .2679 .0577 .2903 .2918 .2734 .2388 .1935 .1442 .0972 .0287 .0109 .0026 .0002 .1935.0577 .0287 .0577 .0972 .1442 .2388 .2734 .2918 .2903 .2679 .2269 .2269 .1730 .1147 .0617 .0230 .0036 .3115 .2753 .2097 .1240 .0406 .0115 .0250 .0466 .046<Y .0774 .1172 .1641 .2985 .3 177 .3177 .0043 .0115 .0012 .0043.2613 .2140 .0013 .0036 .0084 .0172 .0320 .0547 .0872 .1306 .0320 .1848 .2471 .2471 .3115 .3670 .3960 .3720 .2573 .0004 .0013 .0000 .0490 .0001 .0016 .0037 .0280 .0037 .0490 .0824 .0824 .1335 .2097 .3206 .4783 .6983 .0000 .0001 .0002 .0006 .0078 .0152 .0574 .0064 .0819 .0004 .0043 .0466 .0287 .2753 .2097 n n x O 0 1 1 2 3 4 5 6 7 8 0 O 1 1 2 2 3 3 4 5 5 6 7 7 8 8 9 9 0 O 1 1 2 3 3 4 5 5 6 7 8 9 10 0 O 1 1 2 3 4 .05 .6634 .2793 .0515 .0054 .0004 .0000 .0000 .0000 .0000 .6302 .2986 .0629 .0077 .0006 .0000 .0000 .0000 .0000 .0000 .5987 .3151 .0746 .0105 .0010 .0001 .0000 .0000 .0000 .0000 .0000 .5688 .3293 .0867 .0137 .0014 .10 .15 .2725 .3847 .20 .1678 .3355 .2936 .1468 .0459 .0092 .0011 .0001 .0000 .1342 .3020 .3020 .1762 .0661 .0165 .0028 .0003 .0000 .0000 .1074 .2684 .3020 .2013 .0881 .0264 .0055 .0008 .0001 .0000 .0000 .0859 .2362 .2953 .2215 .2215 .1107 .1107 .25 .1001 .1001 .30 .30 .35 .40 .45 .45 .50 .55 .60 .65 .70 .75 .80 .85 .90 .95 8 9 10 11 .4305 .3826 .1488 .0331 .0046 .0004 .0000 .0000 .0000 .3874 .3874 .1722 .0446 .0074 .0008 .0001 .0000 .0000 .0000 .3487 .3874 .1937 .0574 .0112 .0015 .0001 .0000 .0000 .0000 .0000 .3138 .3835 .2131 .0710 .0158 .2376 .0839 .0185 .0026 .0002 ..0002 .0000 .0000 .2316 .3679 .2597 .1069 .0283 .0050 .0006 .0000 .0000 .0000 .1969 .3474 .2759 .1298 .0401 .0085 .0012 .0001 .0000 .0000 .0000 .1673 .3248 .2866 .1517 .0536 .0000 .0000.0000 .0000 .0002 .0001 .0000 .0000 .0000 .0007 .0576 .0319 .1678 .0017 .0168 .0007 .0319 .0168 .0039 .0084 .0039 .0004 .0000 .0000 .0000 .0001 .0000 .2670 .1977 .1373 .0313 .0033 .2670 .0313 .0164 .1977 .0012 .1373 .0896 .0548 .0079 .0011 .0002 .0000 .0000 .0100.0703 .0000 .3115 .1094 .0413 .0217 .0038 .2587 .1569 .2965.2376 .2587 .2090 .0703 .0092 .0004 .0467 .0231.1239 .2076 .2188 .1719 .0026 .0467 .0000 .2076 .2541 .2786 .2787 .2188 .1239 .0808 .2786 .2568 .0185 .0459 .0004 .1875 .1361 .0865 .0185 .1361 .1875 .2627 .2734 .2322 .2627 .2322 .0185 .2627 .2734 .0046 .0865 .0046 .1468 .2786 .2541 .2076 .0331 .0054 .1468 .0839 .0231 .1239 .2188 .0808 .2568 .0467 .0026 .2787 .1719 .0808 .2936 .1488 .0515 .0100 .1569 .2090 .2587 .2965 .3115 .2376 .0000 .0413 .1094 .1569 .0038 .0100 .0217 .0703 .1373 .2670 .3355 .3847 .2793 .3826 .2793 .0548 .1977 .0004 .0012 .0033 .0079 .0164 .0012 .8996 .0004 .0312 .0164 .1678 .2725 .0576 .4305 .0319 .0576 .1001 .2725 .6634 .0000 .0017 .0039 .0084 .0001 .0168 .0002 .0007 .0000 .0000 .0020 .0008 .0404 .0008 .0003 .0000 .0000 .0751 .0046 .0001 .0000 .0000 .0000 .0207 .0101 .0000 .0000 .0000 .0000 .0083 .0013 .0004 .0001 .0000 .0035 .2253 .1556 .3679 .1004 .0339 .0176 .2253 .0605 .3020 .0000 .0000 .0003 .0000.0039 .1110 .2668 .0407 .0212 .0098 .0012 .0039.2162 .0003 .3003 .1612 .0703 .3003 .2668 .2162 .0006 .0001 .0000 .0028 .0743 .0087 .0028 .1160 .0424 .0210 .2336 .2668 .1069 .2716 .2119 .1641 .2336 .27 16 .2508 .1762 .0008 .0050 .0000 .2128 .1181 .0165 .2508 .0735 .0389 .1715 .2600 .2461 .1672 .2600 .0735 .1168 .2194 .1168 .0074 .0006 .1715 .1168 .0661 .0283 .2194 .1715 .1168 .1672 .2128 .2461 .2600 .2508 .0735 .0389.0008 .1181 .2716 .2668 .2336 .1762 .1069 .0446 .0077.1762 .0743 .1641 .2119 .2508 .0087 .0210 .0424 .0028 .1160 .2597 .1722 .0629 .2162 .0703 .2668 .3003 .3020 .1110 .1612 .2668 .0012 .0039 .0098 .0212 .0407 .0703 .3020 .3874 .2986 .1556 .2253 .3679 .1004 .1556 .0001 .0004 .0013 .0035 .0083 .0176 .0339 .0605 .0001 .1342 .3874 .6302 .0404 .0751 .2316 .0046 .0207 .0404 .0003 .0008 .0020 .0101 .0000 .0001 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0003 .0000 .0000 .0563 .0282 .0060 .0025 .0010 .0003 .0001 .0000 .0000 .0135 .1074 .0563 .3487 .0001 .0042 .0001 .0000 .0000 .0000 .0000 .0000.0000 .1877 .1211 .0403 .0207 .0098 .0016 .1211 .0005 .0725 .0043 .0014 .0001 .0004 .0000 .0000 .0000 .1209 .0763 .0439 .1757 .0229 .0106 .2816 .2335 .1757 .1937 .0000 .0000 .0090 .0031 .0001.0090 .0212 .0008 .2150 .1665 .1172 .0746 .0425 .2668 .2503 .2522 .0000 .0055 .0001 .0012 .1596 .0689 .0368 .0162 .2508 .1460 .2384 .2051 .1115 .0368 .1460 .2001 .2377 .0015 .0001 .1536 .2461 .2340 .1029 .0584 .0264 .0085.1029 .0584 .1029 .1536 .2007 .2340 .2007 .0010 .0401 .0112 .2384 .2001 .0881 .2377 .2001 .0162 .0368 .1115 .1596 .2051 .2508 .0368 .0689 .1460 .1115 .0689 .2013 .0574 .0105 .2522 .2668 .1665 .2503 .1298 .0425 .0746 .1172 .1665 .2150 .0031 .0212 .0090 .0746 .3020.1757 .1937 .0229 .0439 .0763 .1209 .1757 .2335 .0763 .2335 .2816 .2759 .0004 .0014 .0043 .0106 .3151 .1211 .1877 .2684 .0725 .3474 .3874 .1211 .0207 .0016 .0042 .0098 .0207 .0403 .0042 .0725 .0000 .0001 .0005 .3487 .5987 .0001 .0003 .0010 .0025 .0282 .0025 .0563 .1074 .1969 .0000.0000 .0135 .0282 .0060 .0000 .0000 .0000 .0002 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0036 .0014 .0005 .0000 .0014 .0000 .0422 .0198 .0088 .0198 .0021 .0000 .0000.0000 .0266 .0125 .0932 .0054 .0007 .0125 .0000 .0000 .0002 .0054 .0000 .0000 .1549 .0932 .0518 .2362 .0518 .0000 .0000 .0513 .0269 .0126 .0018 .0005 .0001.0052 .0000 .0000 .0269 .0000 .0018 .000 .2581 .1395 .0887 .0052 .0513 .1998 .2254 .0037 .0011.0234 .0002 .0000 .0000 .2568 .1774 .1259 .0806 .0462 .0234 .0102 .0806 .0000 .2581 .0064 .0017 .0000 .0000 .2201 .2365 .2060 .1611 .1128 .0701 .0173 .0003 .2428 .0379 .1721 (continuación) (continuaciOn) TABLA C.1 TABLA C.1 (Continuación) (ContinuaciOn) n x .05 .0001 .0000 .0000 .0000 .0000 .0000 .0000 .5404 .3413 .0988 .0173 .0021 .0002 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .10 .10 .0025 .0003 .0000 .0000 .0000 .0000 .0000 .2824 .3766 .2301 .0852 .0213 .0038 .0005 .0000 .0000 .0000 .0000 .0000 .0000 .15 .0132 .0023 .0003 .20 .25 .0803 .0803 .0268 .30 .35 .40 040 .45 045 .50 .55 .60 .65 .70 .75 .80 .85 .90 .95 5 5 6 7 7 8 8 9 12 10 11 O 0 1 1 2 2 3 3 4 5 5 6 7 7 8 8 9 10 11 12 .0000 .0000 .0000 .0000 .1422 .3012 .2924 .1720 .0683 .0193 .0040 .0006 .0001 .0000 .0000 .0000 .0000 .0388 .0097 .0017 .0002 .0000 .0000 .0000 .0687 .2062 .2835 .2362 .1329 .0532 .0155 .0033 .0005 .0001 .0000 .0000 .0000 .1830 .1830 .0566 .0985 .0064 .0173 .0173 .0379 .0064 .0000 .0037 .0102 .0011 .0001 .0000 .0005 .0018 .0000 .0002 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0317 .0138 .0138 .0057 .1267 .0712 .0368 .1678 .1088 .2323 .2581 .2397 .2397 .1954 .1936 .2311 .1936 .2367 .1585 .0193 .2039 .1032 .1281 .0401 .0792 .1281 .0291 .0591 .0115 .0024 .0078 .0078 .0199 .0024 .0015 .0048 .0004 .0015 .0008 .0000 .0000 .0002 .0000 .0001 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .1321 .1321 .0985 .2256 .1931 .1471 .0566 .0268 .0003 .0097 .0023 .0000 .2256 .2360 .2270 .1830 .1321 .0803 .0388 .0132 .0025 .0001 .0388 .1128 .1611 .2060 .2365 .2428 .2201 .0536 .0158 .0014 .0701 .1721 .1107 .0536 .0462 .2581 .0137 .0806 .1259 .1774 .2254 .0806 .2568 .1517 .0234 .0037 .2215 .2254 .1517 .0710 .0126 .0005 .0052 .0000 .0269 .0018 .2581 .2953 .1395 .0269 .0513 .0887 .1395 .1998 .2953 .2866 .2866 .2131 .0867 .0054 .0125 .0266 .0518 .0932 .1549 .2362 .3248 .3835 .3293 .0007 .0021 .2362 .0000 .0422 .0000 .0000 .0014 .0859 .1673 .0002 .0005 .0036 .0088.0005 .0198 .1673 .3138 .5688 .0022 .0000 .0008 .0002 .0057 .0001 .0000.0008 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0075 .0001 .0000 .0000 .0000 .0000 .0000 .0000 .0174 .0000 .0000 .0010 .0003 .0029 .0008 .0161 .0068 .0025 .0002 .0000 .0000 .0000 .0639 .0339 .0339 .1678 .0000 .0000 .0048 .1419 .0537 .0004 .0125 .0001 .0000 .0923 .0277 .0125 .0015 .0000 .0000 .0000 .1700 .1208 .0762 .0420 .0199 .0078 .0024 .0005 .0001 .2128 .1208 .0005 .0001 .0078 .0000 .0000 .1934 .1489 .1009 .0291 .1489 .0115 .2270 .2225 .0591 .0000 .0033 .0006 .0000 .0115 .1766 .2124 .0401 .0155 .2256 .2124 .2256 .2124 .1766 .1281 .0792 .0155 .0040 .0040 .0005 .0000 .2225 .2270.1489 .1585 .1032 .0532 .0193 .0038 .2039 .1032 .0002 .0532 .1489 .1934 .1009 .0591 .2311 .0683 .0420 .0762 .1208 .1700 .2128 .2367 .1936 .1329 .0683 .0213 .0021 .2581 .2362 .0923 .1419 .1954 .2397 .2362 .1720 .0852 .0173 .0277 .0125 .0537 .2323 .0000 .2835 .2924 .2301 .0025 .0068 .0161 .1088 .1678 .0988.2835 .0339 .0000.0639 .0029 .0368 .1267 .2062 .3012 .3766 .3413.2062 .0010 .0029 .0075 .0174 .0368 .0712 .0003 .0000 .1422 .0317 .0687 .0057 .2824 .5404.0687 .0022 .0000.0000 .0001 .0002 .0008 .0057 .0138 .1471 .1471 .2207 .2360 .1931 Fuente: Tabla págs. 464-466 en Business Statistics: Concepts and Applications de William J. Stevenson, Copyright © 1978 por William 1. Stevenson. Reproducida con Fuenfe: Tabla A, págs. 464-466 en Business Statistics: Concepts and Applications de William J. Stevenson, Copyright © 1978 por William J. Stevenson. Reproducida con peJ.miso de Harper & Row, Publishers, lnc. permiso de Harper & Row, Publishers, Inc. Apéndice ApéndiceC e Tablas 571 TABLA C.2 ÁREAS DE DISTRIBUCiÓN DE PROBABILIDAD NORMAL ESTÁNDAR TABLA C.2 AREAS DE DISTRIBUCION DE PROBAWLIDAD NORMAL ESTANDAR JlL Media z 1.93, área sombreada área total de 1. Para z = 1.93, el area sombreath es .4732 de un area total de 1. Para z .00 .0000 .0398 .0793 .1179 .1554 .1915 .2257 .2580 .2881 .3159 .3413 .3643 .3849 .4032 .4192 .4332 .4452 .4554 .4641 .4713 .01 .02 .03 .04 .0160 .0557 .0948 .1331 .1700 .2054 .2389 .2704 .2995 .3264 .05 .06 .07 .08 .09 0.0 0.1 0.2 0.3 0.4 0.5 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.1 .0040 .0438 .0832 .1217 .1591 .1950 .2291 .2612 .2910 .3186 .3438 .3665 .3869 .4049 .4207 .4345 .4463 .4564 .4649 .4719 .4778 .4826 .4864 .4896 .4920 .4940 .4955 .4966 .4975 .4982 .4987 .0080 .0478 .0871 .1255 .1628 .1985 .2324 .2642 .2939 .3212 .3461 .3686 .3888 .4066 .4222 .4357 .4474 .4573 .4656 .4726 .4783 .4830 .4868 .4898 .4922 .4941 .4956 .4967 .4976 .4982 .4987 .0120 .0517 .0910 .1293 .1664 .2019 .2357 .2673 .2967 .3238 .3485 .3708 .3907 .4082 .4236 .4370 .4484 .4582 .4664 .4732 .0239 .0199 .0596 .0478 .0636 .1026 .0987 .1406 .1368 .1217 .1772 .1736 .2123 .2088 .2422 .2454 .2734 .2764 .3051 .3023 .3289 .3315 .3531 .3554 .3438 .3749 .3770 .3944 .3962 .4115 .4066 .4131 .4265 .4207 .4279 .4394 .4357 .4406 .4515 .4505 .4599 .4608 .4678 .4686 .4744 .4750 .0279 .0675 .1064 .1443 .1808 .2157 .2486 .2794 .3078 .3340 .0160 .0319 .0714 .0948 .1103 .1480 .1844 .2190 .2518 .2823 .3106 .2995 .3365 .0359 .0753 .1141 .1517 .1879 .1736 .2224 .2549 .2852.2734 .3133 .3389.3289 .3621 .3830 .4015.3944 .4177 .4319 .4441 .4545 .4505 .4633 .4706 .4767 .4817 .4857 .4842 .4890 .4878 .4906 .4916 .4936 .4952 .4964 .4974 .498 1 .4981 .4984 .4986 .4990 .06 .24 .27 1.2 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 .3508 .3729 .3925 .4099 .4251 .4382 .4495 .4591 .4671 .4738 .4793 .4838 .4875 .4904 .4927 .4945 .4959 .4969 .4977 .4984 .4989 .3599 .3577 .3810 .3790 .3980 .3997 .4147 .4162 .4292 .4306 .4418 .4429 .4525 .4484 .4535 .4616 .4625 .4693 .4699 .4756 .5761 .4808 .4850 .4884 .4911 .4932 .4949 .4962 .4972.4968 .4979 .4985 .42 .4 .475 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 .4772 .4821 .4861 .4893 .4918 .4938 .4953 .4965 .4974 .498 1 .4981 .49865 .4999683 .4788 .4834 .4871 .4901 .4893 .4925 .4943 .4957 .4965 .4968 .4977 .4983 .4988 .4798 .4783 .4803 .4842 .4830 .4846 .4881 .4878 .4909 .4906 .4929 .4931 .4946 .4948 .4960 .4961 .4970 .497 1 .4971 .4978 .4979 .4984 .4985 .4989 .4989 .4812 .4793 .4854 .4887 .4913 .4934 .4951 .4963 .4973 .48980 .4986 .4 .49 .49 .4989 .4990 .49 4.0 .4999683 572 TABLA C.3 VALORES CRITICOS DE tt C.3 VALORES CRíTICOS DE Tablas Apéndice C e la tc( df 1 1 t.995 1'995 t.050 1'050 t.025 1'025 t.oIo 1'010 t.005 1'005 2 3 3 4 3.078 1.886 1.638 1.533 1.476 1.440 1.415 1.397 1.383 1.372 1.363 1.356 1.350 1.345 1.341 6.314 2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 1.812 1.796 1.782 1.771 1.761 1.753 1.746 1.740 1.734 1.729 1.725 1.721 1.717 1.714 1.711 1.708 1.706 1.703 1.701 1.699 1.645 1.645 12.706 4.303 3.182 2.776 2.571 2.447 2.365 2.306 2.262 2.228 2.201 2.179 2.160 2.145 2.131 2.120 2.110 2.101 2.093 2.086 2.080 2.074 2.069 2.064 2.060 2.056 2.052 2.048 2.045 1.960 1.960 31.821 6.965 4.541 3.747 3.365 3.143 2.998 3.896 2.821 2.764 2.718 2.681 2.650 2.624 2.602 2.583 2.567 2.552 2.529 2.528 63.657 9.925 5.841 5.841 4.604 5 5 6 7 7 8 8 9 9 10 11 12 13 14 15 16 17 18 19 20 21 4.032 3.707 3.499 3.355 3.250 3.169 3.106 3.055 3.012 2.977 2.947 2.921 2.898 2.878 2.861 2.845 1.337 1.333 1.330 1.328 1.325 1.323 1.321 1.321 1.319 1.318 1.316 22 23 24 25 26 27 28 29 inf. 2.518 2.508 2.500 2.492 2.485 2.831 2.819 2.807 2.797 2.787 1.315 1.314 1.313 1.311 1.282 2.479 2.473 2.467 2.462 2.326 2.779 2.771 2.763 2.756 2.576 "Table of Percentage Points of the t-Distribution." Calculada por Maxine Menington, Biometrika, vol. Fuente: "Table of Percentage Points of the t-Distribution." Calculada por Maxine Merrington, Biome/rika, vol. 32 (1941), p. Reproducida pelll1íso del Profesor D. V. Lindley. 32 (1941), p. 300. Reproducida con permiso dcl Profesor D. V. Lindley. e Apéndice C Tablas Tabtas 573 C.4 VALORES CRíTICOS DE JI CUADRADA TABLA C.4 VALORES CRITICOS DE JI CUADRADA o dJ X~ X ~75 X 2 di 1 1 2 3 3 4 X2 X2 995 X 2990 X 990 0.0001571 0.0201007 0.114832 0.297110 0.554300 0.872085 1.239043 1.646482 2.087912 2.55821 3.05347 3.57056 4.10691 4.66043 5.22935 5.81221 6.40776 7.01491 7.63273 8.26040 8.89720 9.54249 10.19567 10.8564 11.5240 11.5240 12.1981 12.1981 12.8786 13.5648 14.2565 14.9535 22.1643 29.7067 37.4848 45.4418 53.5400 61.7541 70.0648 2 X 2950 X .950 2 X 2900 X 9()I.) 2 0.0000393 0.0100251 0.0717212 0.206990 0.411740 0.41 1740 0.675727 0.989265 1.344419 1.734926 1.734926 2.15585 2.60321 3.07382 3.56503 4.07468 4.60094 5.14224 5.69724 6.26481 6.84398 7.43386 8.03366 8.64272 9.26042 9.88623 0.0009821 0.0506356 0.215795 0.484419 0.831211 1.237347 1.68987 2.17973 2.70039 3.24697 3.81575 4.40379 5.00874 5.62872 6.26214 6.90766 7.56418 8.23075 8.90655 9.59083 10.28293 10.9823 10.9823 11.6885 11.6885 12.4011 0.0039321 0.102587 0.351846 0.710721 0.0157908 0.210720 0.584375 1.063623 1.61031 2.20413 2.83311 3.48954 4.168216 4.86518 5.57779 6.30380 7.04150 7.78953 8.54675 9.31223 10.0852 10.8649 11.6509 12.4426 13.2396 14.0415 14.0415 14.8479 15.6587 15.6587 16.4734 17.2919 17.2919 18.1138 18.1138 12.4613 18.9302 19.7677 19.7677 0.114832 0.2 5 6 7 8 9 10 11 1.145476 1.63539 2.16735 2.73264 3.32511 3.94030 4.57481 5.22603 5.89186 6.57063 12 13 14 15 16 17 18 19 19 20 21 22 23 24 24 25 7.26094 7.96164 8.67176 9.39046 10.1170 10.8508 11.5913 12.3380 13.0905 13.8484 14.6114 15.3791 15.3791 16.1513 16.9279 17.7083 17.7083 18.4926 26.5093 26.5093 34.7642 43.1879 26 26 27 28 29 30 10.5197 11.1603 11.8076 12.4613 13.1211 13.7867 20.7065 27.9907 35.5347 43.2752 51.1720 59.1963 67.3276 13.1197 13.8439 14.5733 15.3079 16.0471 16.7908 24.4331 32.3574 40.4817 40 50 60 70 80 20.5992 29.0505 37.6886 46.4589 90 100 100 48.7576 57.1532 65.6466 74.2219 51.7393 51.7393 60.3915 69.1260 77.9295 55.3290 64.2778 73.2912 82.3581 (continuación) (continuaciOn) 574 TABLA C.4 C.4 Tablas (ContinuaciOn) (Continuación) 2 2 2 X2 Apéndice C e if di J 1 1 2 3 3 4 X.1J(K) X 2.70554 4.60517 6.25139 7.77944 9.23635 10.6446 12.0170 13.3616 14.6837 15.9871 17.2750 18.5494 19.8119 19.81 19 21.0642 22.3072 23.5418 24.7690 25.9894 27.2036 28.4120 29.6151 30.8133 32.0069 33.1963 34.3816 35.5631 36.7412 37.9159 39.0875 40.2560 51.8050 63.1671 74.3970 85.5271 X .050 050 X 025 X~25 2 X oto X~1I0 2 X X~)()5 2 3.84146 5.99147 7.81473 9.48773 5.02389 7.37776 9.34840 11.1433 11.1433 12.8325 12.8325 14.4494 16.0128 16.0128 17.5346 19.0228 19.0228 20.4831 21.9200 23.3367 24.7356 26.1190 27.4884 28.8454 30.1910 31.5264 32.8523 34.1696 35.4789 36.7807 38.0757 39.3641 40.6465 41.9232 43.1944 44.4607 45.7222 46.9792 59.3417 71.4202 83.2976 95.0231 106.629 118.136 129.561 6.63490 9.21034 11.3449 11.3449 13.2767 13.2767 15.0863 16.8119 18.4753 20.0902 21.6660 23.2093 24.7250 26.2170 27.6883 29.1413 30.5779 31.9999 33.4087 34.8053 36.1908 37.5662 38.9321 40.2894 41.6384 42.9798 44.3141 45.6417 46.9630 48.2782 49.5879 7.87944 10.5966 12.8381 14.8602 16.7496 18.5476 20.2777 21.9550 23.5893 25.1882 26.7569 28.2995 29.8194 31.3193 32.8013 34.2672 35.7185 37.1564 38.5822 39.9968 41.4010 42.7956 44.1813 45.5585 46.9278 48.2899 49.6449 50.9933 52.3356 5 6 6 7 8 9 10 10 11 11 11.0705 12.5916 14.0671 15.5073 16.9190 18.3070 19.6751 21.0261 22.3621 23.6848 24.9958 26.2962 27.5871 28.8693 30.1435 31.4104 31.4104 32.6705 33.9244 33.9244 35.1725 36.4151 36.4151 37.6525 38.8852 38.8852 40.1133 41.3372 42.5569 12 12 13 13 14 15 15 16 17 18 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 43.7729 55.7585 55.7585 67.5048 79.0819 90.5312 101.879 113.145 124.342 50.8922 50.8922 63.6907 76.1539 88.3794 100.425 100.425 53.6720 66.7659 79.4900 91.9517 104.215 116.321 128.299 140.169 70 80 90 100 96.5782 107.565 118.498 118.498 112.329 112.329 124.116 124.116 135.807 Fuente: "Tables of PercentagePoints of the r-Distribution."lJio,netrika, vol. 32 (1941), Pp. 188-189, por Fuenfe: "Tables of Percentage Points of the ,-Distrihution." Biometrika, vol. 32 (1941), pp. 1 88-189, Catherine Catherine M. Thompson. Rcproducida COIlpermiso del Profesor D. V. Lindicy. Thompsoll. Reproducida con perniiso dcl Profesor D. V. Lindlcy. e Apéndice C TABLA C.5 e.s 43732 29127 24907 27618 76254 Tablas DíGITOS DIGITOS ALEATORIOS 575 62416 31941 48769 19841 19841 95278 11681 19662 38220 74342 36330 55667 97044 10801 1080! 62086 82969 92689 82257 03500 49935 90394 46528 61139 72052 96412 38542 13240 73520 80523 46746 93786 16286 16286 46721 52053 87528 77360 46689 01401 53605 01524 12742 52254 93840 74544 67022 64180 36939 66753 40172 14663 45022 17274 09277 45565 90018 30763 24316 03505 41372 15756 15207 66288 95475 89229 10627 48453 28504 84737 17047 05437 80332 10094 10094 51141 5114! 22661 30636 00483 09146 17036 30051 93477 08067 76298 68433 54676 52265 23345 51717 32774 66673 10133 39786 55843 21574 91480 09283 96058 17775 24043 14942 21144 76197 35987 01390 68587 82269 17095 41679 34860 23013 06590 98568 62341 07313 82703 41920 61559 36445 98860 47316 21103 52986 89517 59388 42444 21244 93429 22771 58746 09068 96518 74617 24199 55120 00700 91336 34653 27845 01290 49345 61166 47206 70451 30468 08320 33405 40481 50597 48719 75813 62301 99636 28175 82583 34269 00319 59114 69676 96815 98378 79190 51540 78755 57952 22278 65113 55922 87223 17337 54844 58252 68336 73816 01648 58018 45107 19338 14995 65026 66710 55075 87041 49480 78304 40787 78039 45136 22664 25419 43174 63152 45306 08340 77194 97859 54394 32773 43057 88431 86323 21022 67484 36687 80079 61551 96446 27508 02259 91325 41056 40794 30830 79385 96097 77985 75052 45621 08640 68134 61071 36343 29434 94266 24853 74990 96546 40460 77704 47938 10121 25145 1012! 26343 44517 33309 94009 13029 06897 88052 67014 44660 52122 52890 92076 95923 77259 40321 67829 19788 19788 24316 50319 85905 08143 89824 00856 69419 88005 01064 53706 79854 31307 87509 28935 09026 82028 67060 9735! 97351 92490 15912 62032 28504 57678 28473 00893 52642 01676 86149 75572 77623 80332 52532 86304 79075 24661 21656 24661 46455 72563 72234 62196 40750 63223 41937 91686 60336 17036 81050 70091 60464 19270 62520 73052 75564 77702 13451 22848 67255 32171 47150 93236 84759 91944 62796 28638 42329 66969 03262 62316 64180 95896 51717 97286 76811 29925 55120 20032 00700 21995 25175 49329 81241 13053 49743 55843 45798 44925 96389 27111 69002 13456 49850 47895 98610 07139 70451 86031 89932 77683 24043 98982 51549 09132 55290 49329 59366 57122 50597 43216 18460 95243 89724 68893 68587 92167 81404 60025 71431 65340 99889 37989 20727 47049 03845 34269 83563 49386 17007 06152 78816 59456 54263 84568 78996 82279 04486 79190 64642 76913 03934 44848 05617 88869 40584 09140 32256 26648 48913 6337! 65047 63371 70316 50357 02307 69823 63536 79822 47603 61395 00972 10065 51694 53359 66420 01648 70730 56213 68624 251'89 43255 18666 74617 37134 93363 8140! 81401 06036 18575 04385 958 29 81296 02748 78304 07130 07814 33309 29255 25145 41752 61867 24199 49080 84654 85841 81857 13555 27619 76456 67466 73978 09033 6842! 68421 46270 60820 89126 28473 97089 6155! 99840 25756 19112 66593 48198 34334 30830 20933 79385 09026 10816 15688 25861 97831 83400 78826 75608 98284 93236 31430 92167 170 57678 44848 72563 009 67255 258 576 TABLA C.6 C.6 DISTRIBUCiÓN F DISTRIBUCION Tablas Apéndice e ApéndiceC ~ A A f"""ee- Por ejemplo, ci valor Por ejemplo, el valor de Ia escala F para 82 = 3. 8, = 10 colTespondidnte al área .01 en Ia pal-te derecha de la escala para 2 10 cOITespondiente al area .01 la pal1e derecha de la cola es 6.55. Ia cola El El valor F correspondiente al area .05 en Ia parte dcrecha de Ia cola aparece en caracteres normaics. cOITespondiente al área .05 la parte derecha la caracteres nOllnales. El valor F correspondiente al área .01 en la derecha de la cola en negritas. El valor F correspondiente al area .01 en Ia parte derecha de Ia cola aparece en negritas. DI' Grados de de libertad del denominador denorninador 161 4,052 18.51 98.49 10.13 34.12 7.71 21.20 6.61 16.26 5.99 13.74 5.59 12.25 532 5.32 11.26 5J2 5.12 10.56 4.96 10.04 4.84 9.65 4.75 9.33 4.67 9.07 4.60 8.86 4.54 8.68 449 4.49 8.53 4.45 8.40 2' 02> grados de libertad dcl nurnerador libertad del numerador 2 2 200 4,999 19.00 99.00 9.55 30.82 6.94 18.00 5.79 579 13.27 5.14 10.92 4.74 9.55 4.46 8.65 4.26 8.02 4.10 7.56 3.98 7.20 3.88 6.93 3.80 6.70 3.74 6.51 3.68 6.36 3.36 6.23 3.59 6.11 3 216 5,403 19.16 99.17 9.28 29.46 6.59 659 16.69 5.41 12.06 4.76 9.78 4.35 8.45 4.07 7.59 3.86 6.99 3.71 6.55 3.59 6.22 3.49 5.95 3.41 5.74 3.34 5.56 3.29 5.42 3.24 5.29 3.20 5.18 4 225 5,625 19.25 99.25 9.12 28.71 6.39 15.98 5.19 11.39 4.53 9.15 4.12 7.85 3.84 7.01 3.63 6.42 3.48 5.99 3.36 5.67 3.26 5.41 3.18 5.20 3A1 3.11 5.03 3.06 4.89 3.01 4.77 2.96 4.67 5 230 5,764 19.30 99.30 9.01 28.24 6.26 15.52 5.05 10.97 4.39 8.75 3.97 7.46 3.69 6.63 3.48 6.06 3.33 5.64 3.20 5.32 3.11 5.06 3.02 4.86 2.96 4.69 2.90 4.56 285 2.85 4.44 2.81 281 4.34 6 7 8 8 9 10 3 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 234 5,859 19.33 99.33 8.94 27.91 6.16 15.21 4.95 10.67 428 4.28 8.47 3.87 7.19 3.58 6.37 3.37 5.80 3.22 5.39 3.09 5.07 3.00 4.82 2.92 4.62 285 2.85 4.46 2.79 4.32 2.74 4.20 2.70 4.10 237 239 241 5,928 5,981 6,022 19.16 19.36 19.37 19.38 99.36 99.37 99.39 9.28 8.88 8.84 8.81 27.49 27.34 30.82 27.67 6.09 6.04 6.00 14.98 14.80 14.66 4.88 4.82 4.78 10.45 10.15 11.39 10.29 5.14 4.21 4.15 4.10 8.26 8.10 7.98 3.79 3.73 3.68 9.55 7.00 6.84 7.85 6.71 3.44 3.50 3.39 6.19 5.91 8.65 6.03 3.29 3.23 3.18 5.62 5.476.42 5.35 3.14 3.02 3A4 302 3.07 5.21 5.06 4.95 3.01 2.90 2.95 4.88 4.745.67 4.63 2.92 2.85 2.80 6.93 4.65 4.50 4.39 2.84 2.72 2.77 4.44 4.30 4.19 5.74 270 2.77 2.70 2.65 4.28 4.145.03 4.03 2.64 2.70 2.59 4.14 4.00 3.89 5.42 2.66 2.59 2.54 4.03 3.89 3.78 5.29 2.50 2.55 2.62 3.93 3.79 3.68 242 6,056 19.39 99.40 99.36 8.78 27.23 5.96 14.54 4.74 10.05 4.06 7.87 363 3.63 6.62 3.34 5.82 3.48 3.13 5.26 2.97 3.33 4.85 3.20 2.86 4.54 2.76 4.30 2.67 4.10 4.86 2.60 3.94 255 2.55 3.80 4.56 2.49 3.69 2.45 3.59 8.8 7.00 4.2 4.0 Apéndice e ApéndiceC TABLA C.6 C.6 Tablas (Continuación) (ContinuaciOn) 577 8j , de Grados de libertad del denominador 18 19 19 20 21 grados de 8z' grados de libertad del nurnerador numerador 2' 1 2 3 3 4 4 2.93 4.58 2.90 4.50 2.87 4.43 2.84 4.37 2.82 4.31 2.80 4.26 2.78 4.22 2.76 4.18 5 5 6 7 2.66 4.01 2.63 3.94 2.60 3.87 2.57 3.81 2.55 3.76 2.53 3.71 2.51 3.67 2.49 3.63 2.58 3.85 2.55 3.77 2.52 3.71 2.49 3.65 2.47 3.59 2.45 3.54 2.43 3.50 2.41 3.46 8 9 10 22 23 24 25 4.41 8.28 4.38 8.18 4.35 8.10 4.32 8.02 4.30 7.94 4.28 7.88 4.26 7.82 4.24 7.77 3.55 6.01 3.52 5.93 3.49 5.85 3.47 5.78 3.44 5.72 3.42 5.66 3.40 5.61 3.38 5.57 3.16 5.09 3.13 5.01 3.10 4.94 3.07 4.87 3.05 4.82 3.03 4.76 3.01 4.72 2.99 4.68 2.77 4.25 2.74 4.17 2.71 4.10 2.68 4.04 2.66 3.99 2.64 3.94 2.62 3.90 2.60 3.86 2.51 4.58 3.71 3.52 2.48 3.63 3.49 2.45 4.94 3.56 2.42 3.51 2.40 3.45 3.42 2.38 3.41 2.36 3.36 2.34 5.57 3.32 2.46 3.60 2.43 3.52 2.40 3.45 2.37 3.40 2.35 3.35 2.32 3.30 2.30 3.25 2.28 3.21 2.41 3.51 2.38 3.43 2.35 3.37 2.32 3.31 2.30 3.26 3.26 2.64 2.28 3.21 2.26 3.17 2.24 3.13 3.13 2.52 3.76 2.45 3.50 Fijeizie: Reproducido mediante permiso de Statisüca/ Methods. 7a. eel., por Gcorge \V. Snedeeor y William C. Fuente: Reproducido mcdiante permiso de StatistiC'a! Methods, 7a. ed., George W. Snedccor y William C. 1980 de la lo\\'a Press. Ames. lowa. Cochran. Copyright © 1980 de Ia Iowa State University Press, Ames, Iowa. 578 TABLA C.7 TABLA C.7 LíMITES PRUEBA DE DURBIN-WATSON LIMITES DE PRUEBA DE DURBIN-WATSON Tablas Apéndice C e Nivel de significacion a = Nivel de significación a = .05 p-l=1 p-1=1 n n 15 15 16 16 17 17 18 18 19 20 21 21 22 23 24 25 26 27 28 29 30 30 31 31 32 33 34 34 35 36 36 37 38 39 39 40 45 50 50 55 60 65 70 70 75 80 80 85 90 90 95 100 100 p-l=2 p-1=2 dL dL du d dL dL p-l=3 p-1=3 d du 1.75 1.73 1.73 1.71 1.69 1.68 1.68 1.67 1.66 1.66 1.66 1.66 1.65 1.65 1.65 1.65 1.65 1.65 1.65 1.65 1.65 1.65 1.65 1.65 1.66 1.66 1.66 1.66 1.67 1.67 1.68 1.69 1.70 1.70 1.71 1.72 1.72 1.73 1.73 1.74 p-l=4 p-1=4 dL dL d du p-l=5 p-l=5 dL dL d du dL dL d du 1.08 1.10 1.13 1.16 1.18 1.20 1.22 1.24 1.26 1.27 1.29 1.30 1.32 1.33 1.34 1.35 1.36 1.37 1.38 1.39 1.40 1.41 1.42 1.43 1.43 1.44 1.48 1.50 1.53 1.55 1.57 1.58 1.60 1.61 1.62 1.63 1.64 1.65 1.36 1.37 1.38 1.38 1.39 1.40 1.40 1.41 1.41 1.42 1.42 1.43 1.44 1.44 1.45 1.45 1.45 1.46 1.46 1.47 1.48 1.48 1.49 1.49 1.50 1.50 1.50 1.50 1.51 1.51 1.51 1.52 1.52 1.53 1.54 1.54 1.54 1.54 1.57 1.59 1.59 1.60 1.60 1.62 1.63 1.63 1.64 1.65 1.65 1.66 1.66 1.67 1.67 1.68 1.68 1.69 1.69 1.69 0.95 0.98 1.02 1.05 1.05 1.08 1.10 1.13 1.13 1.15 1.15 1.17 1.17 1.19 1.19 1.21 1.22 1.24 1.26 1.27 1.28 1.28 1.30 1.31 1.32 1.32 1.33 1.33 1.34 1.35 1.35 1.36 1.37 1.37 1.38 1.39 1.43 1.43 1.46 1.49 1.49 1.51 1.54 1.55 1.55 1.57 1.57 1.59 1.60 1.61 1.62 1.63 1.54 1.54 1.54 1.53 1.53 1.54 1.54 1.54 1.54 1.55 1.55 1.55 1.56 1.56 1.56 1.57 1.57 1.57 1.58 1.58 1.58 1.59 1.59 1.59 1.60 1.60 1.62 t.62 1.63 1.64 1.65 1.66 1.67 1.68 1.69 1.70 1.70 1.71 1.72 0.82 0.86 0.90 0.93 0.97 1.00 1.03 1.05 1.08 1.08 1.10 1.12 1.14 1.16 1.16 1.18 1.18 1.20 1.21 1.23 1.24 1.26 1.27 1.28 1.29 1.31 1.32 1.33 1.34 1.38 1.42 1.45 1.48 1.50 1.52 1.54 1.56 1.57 1.59 1.60 1.61 1.36 1.97 0.69 0.56 0.74 1.93 0.62 0.78 1.90 0.67 1.90 0.71 0.82 1.39 1.87 1.08 1.85 0.75 0.86 1.83 0.79 0.90 1.81 0.93 0.83 1.81 0.96 0.86 1.80 1.79 0.90 0.99 0.93 1.01 1.78 1.04 0.95 1.04 1.77 1.06 1.76 0.98 1.76 1.32 1.01 1.76 1.08 1.48 1.10 1.03 1.75 1.12 1.27 1.05 1.74 1.14 1.14 1.74 1.07 1.74 1.16 1.74 1.09 1.11 1.18 1.73 1.18 1.73 1.13 1.19 1.21 1.73 1.21 1.15 1.22 1.73 1.I6 1.22 1.24 1.73 1.24 1.18 1.25 1.19 1.25 1.53 1.72 1.I9 1.21 1.21 1.26 1.72 1.26 1.54 1.72 1.22 1.22 1.27 1.27 1.23 1.29 1.72 1.29 1.72 1.48 1.29 1.34 1.34 1.34 1.38 1.38 1.72 1.41 1.72 1.38 1.62 1.73 1.41 1.41 1.44 1.44 1.44 1.47 1.47 1.73 1.46 1.64 1.46 1.49 1.74 1.74 1.49 1.51 1.74 1.51 1.53 1.52 1.75 1.55 1.55 1.54 1.54 1.57 1.75 1.56 1.58 1.75 1.56 1.58 1.57 1.76 1.631.65 1.59 2.21 2.15 2.10 2.06 2.02 1.99 1.99 1.96 1.94 1.92 1.90 1.89 1.88 1.86 1.85 1.84 1.83 1.83 1.83 1.82 1.8 I 1.81 1.81 1.80 1.80 1.80 1.79 1.79 1.79 1.79 1.78 1.77 1.77 1.77 1.77 1.77 1.77 1.77 1.77 1.77 1.77 1.78 1.78 1.78 1.78 1.78 1.12 1.58 1.34 1.42 1.48 1.68 e Apéndice C C.7 TABLA C.7 Tablas (Continuación) (ContinuaciOn) Nivel de significación a = .01 Nivel de significación a =.01 579 p-1=1 p-l=l n p-1=2 p-l=2 dL dL du p-l=3 dL dL du p-l=4 p-.l=4 dL dL du dL dL p-l=5 p-l=5 du 1.96 1.90 1.90 1.85 1.80 1.80 1.77 1.74 1.71 1.71 1.69 1.67 1.66 1.65 1.64 1.63 1.62 1.61 1.61 1.60 1.60 1.59 1.07 1.59 1.08 1.59 1.59 1.59 1.58 1.58 1.58 1.58 1.24 1.59 1.59 1.60 1.61 1.61 1.52 1.62 1.62 1.62 1.63 1.43 1.64 1.64 1.64 1.57 1.65 1.58 dL dL du 1.07 1.09 1.10 1.12 1.13 1.15 1.16 1.17 1.19 1.20 1.21 1.22 1.23 1.24 1.25 1.26 1.27 1.28 1.29 1.30 1.31 1.32 1.32 1.33 1.33 1.34 1.34 1.38 1.40 1.43 1.45 1.47 1.49 1.50 1.52 1.53 1.54 1.55 1.56 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 38 39 39 40 45 50 55 60 65 70 75 80 85 90 95 100 0.81 0.84 0.87 0.90 0.93 0.95 0.97 1.00 1.02 1.02 1.04 1.05 1.05 1.07 1.07 1.09 1.09 1.10 1.10 1.12 1.12 1.13 1.13 1.15 1.15 1.16 1.16 1.17 1.18 1.19 1.19 1.21 1.22 1.23 1.24 1.25 1.29 1.32 1.36 1.38 1.41 1.43 1.45 1.47 1.48 1.50 1.51 1.52 1.52 0.70 0.74 0.77 0.80 0.83 0.86 0.89 0.91 0.94 0.96 0.98 1.00 1.02 1.04 1.05 1.07 1.08 1.10 1.11 1.13 1.14 1.15 1.16 1.18 1.19 1.20 1.24 1.28 1.32 1.35 1.38 1.40 1.42 1.44 1.46 1.47 1.49 1.50 1.25 1.25 1.25 1.25 1.25 1.25 1.26 1.26 1.27 1.27 1.27 1.27 1.28 1.28 1.29 1.29 1.30 1.30 1.31 1.32 1.32 1.32 1.33 1.34 1.34 1.34 1.35 1.36 1.36 1.37 1.38 1.38 1.39 1.39 1.40 1.42 1.45 1.47 1.48 1.50 1.52 1.53 1.54 1.55 1.56 1.57 1.58 1.46 0.59 1.46 1.44 1.44 0.63 0.67 1.43 0.71 1.42 1.42 1.41 0.74 1.41 0.77 0.95 1.41 1.41 1.41 0.80 1.40 1.40 0.83 1.00 0.86 1.40 0.88 1.41 1.41 1.41 0.90 1.41 1.41 0.93 1.41 0.95 1.41 0.97 1.42 0.99 1.01 1.42 1.02 1.42 1.04 1.43 1.05 1.43 1.43 1.07 1.44 1.08 1.44 1.10 1.11 1.45 1.12 1.45 1.14 1.45 1.46 1.15 1.20 1.48 1.24 1.49 1.51 1.28 1.32 1.52 1.53 1.35 1.55 1.37 1.39 1.56 1.42 1.57 1.43 1.58 1.48 1.45 1.59 1.47 1.60 1.48 1.60 1.60 0.49 0.53 0.57 0.61 0.65 0.68 0.72 0.75 0.77 0.80 0.83 0.85 0.88 0.90 1.25 0.92 0.94 0.96 0.98 1.00 1.01 1.03 1.04 1.06 1.07 1.09 1.10 1.16 1.20 1.25 1.28 1.31 1.34 1.37 1.39 1.41 1.41 1.43 1.45 1.46 1.70 1.66 1.63 1.63 1.60 1.58 1.57 1.55 1.54 1.53 1.53 1.52 1.52 1.51 1.51 1.51 1.51 1.51 1.51 1.51 1.51 1.51 1.51 1.51 1.52 1.52 1.52 1.53 1.54 1.55 1.56 1.57 1.58 1.59 1.60 1.60 1.61 1.61 1.62 1.63 1.63 0.39 0.44 0.48 0.52 0.56 0.60 0.63 0.66 0.70 0.72 0.75 0.78 1.02 0.81 0.83 0.85 0.88 0.90 0.92 0.94 0.95 0.97 0.99 1.00 1.16 1.02 1.03 1.05 1.11 1.16 1.32 1.21 1.35 1.25 1.38 1.28 1.31 1.34 1.36 1.39 1.41 1.42 1.44 Reproducido permiso J. Durbin y G. S. Watson. "Testing for Serial COITelation in Least Fuente: Reproducido con permiso de J. Durbin y G. S. Watson. "Testing for Serial Correlation in Least (1951), pp. 159-178. Squares regression-I1", Bio,nefrika, vol. 38 (1951), pp. 159-178. Squares regression-lI", Biometrika, vol. APÉNDICE APENDICE Datos para el Datos Caso de estudio 7.1 Caso de estudio 7.1 D 20.50 20.00 20.00 20.00 20.00 20.00 20.00 19.50 19.50 18.50 18.50 18.00 18.00 17.50 17.00 17.50 17.50 19.00 19.00 19.50 19.50 20.00 20.00 20.00 20.00 20.00 20.00 20.50 20.50 20.50 20.50 14.75 14.50 14.13 14.63 14.00 13.38 14.57 13.88 15.38 15.63 15.88 15.00 16.13 15.25 16.00 16.25 17.38 16.35 17.00 17.00 16.00 16.00 16.63 16.63 16.38 16.75 16.75 15.13 16.00 16.00 14.50 14.50 16.25 16.88 17.38 16.00 16.75 0.00 0.00 1.00 l.oo 0.00 l.OO 1.00 0.00 0.00 1.00 l.oo 0.00 0.00 1.00 l.oo 1.00 l.oo 0.00 0.00 0.00 0.00 0.00 1.00 l.oo l.oo 1.00 0.00 1.00 l.00 0.00 l.oo 1.00 0.00 l.oo 1.00 0.00 0.00 0.00 0.00 0.00 1.00 l.00 0.00 0.00 0.00 1.00 l.oo 0.00 l.oo 1.00 1.00 l.oo 0.00 0.00 0.00 0.00 0.00 0.00 1.00 l.oo 0.00 0.00 0.00 0.00 0.00 1.00 l.00 0.00 0.00 0.00 1.00 l.oo 0.00 1.00 l.oo 0.00 0.00 0.00 1.00 l.oo 0.00 2.01 2.53 2.10 4.13 2.10 3.97 3.27 3.50 2.85 1.81 l.81 2.72 2.43 3.27 3.13 2.55 2.08 2.12 3.40 2.63 2.61 2.06 2.08 2.09 4.29 2.50 3.32 2.95 1.85 l.85 1.55 l.55 3.33 3.33 2.77 12.57 12.57 12.57 12.14 12.57 12.57 12.14 13.19 13.19 13.12 12.69 13.12 12.69 12.69 13.68 13.68 13.20 14.10 13.60 14.10 14.10 14.10 14.10 13.60 12.69 12.96 12.96 13.47 12.96 12.96 14.28 13.59 14.28 14.94 10.00 10.00 10.00 30.00 10.00 10.00 30.00 10.00 10.00 10.00 30.00 10.00 30.00 30.00 10.00 10.00 30.00 10.00 30.00 10.00 10.00 10.00 30.00 30.00 30.00 10.00 30.00 10.00 30.00 10.00 10.00 580 Datos para el Caso de estudio 7.1 de estud io 7.1 17.13 17.50 17.00 16.75 16.75 17.20 18.75 17.50 17.50 18.00 18.00 15.63 14.75 15.25 15.75 15.25 15.25 15.75 15.75 15.63 15.63 16.13 15.75 15.75 16.13 16.13 16.25 16.00 15.88 16.50 16.50 16.38 16.38 12.50 12.50 12.25 12.25 14.25 14.25 15.00 15.00 15.25 15.25 16.00 16.00 14.88 14.88 14.75 14.75 15.50 15.50 13.75 13.75 11.30 11.30 12.38 12.38 12.15 12.15 11.75 11.75 12.38 12.38 12.63 12.63 11.13 11.13 11.38 11.38 11.88 11.88 11.75 11.75 13.63 13.63 13.88 13.88 13.00 12.00 13.13 13.13 14.27 0.00 0.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 1.00 0.00 1.00 1.00 1.00 0.00 0.00 1.00 1.00 0.00 1.00 0.00 0.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 0.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 0.00 1.00 0.00 1.00 1.00 0.00 0.00 1.00 1.00 1.00 0.00 0.00 1.00 0.00 1.00 1.00 0.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 1.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 2.18 4.21 581 14.94 14.67 15.32 15.32 15.32 15.32 14.68 15.15 15.15 13.39 13.39 13.35 13.35 13.39 13.35 13.39 13.39 13.35 13.50 13.50 13.50 13.50 13.50 13.50 10.60 10.60 12.13 12.13 12.13 12.34 12.34 12.34 11.40 11.40 11.36 11.36 11.36 9.81 9.81 9.81 9.81 9.78 9.81 9.81 10.24 11.00 11.00 11.10 11.00 11.34 10.00 30.00 10.00 10.00 10.00 10.00 30.00 10.00 10.00 10.00 10.00 30.00 30.00 10.00 30.00 10.00 10.00 30.00 10.00 30.00 10.00 30.00 30.00 30.00 30.00 30.00 30.00 30.00 30.00 30.00 30.00 30.00 30.00 30.00 30.00 30.00 30.00 30.00 30.00 30.00 30.00 10.00 30.00 30.00 30.00 30.00 30.00 10.00 30.00 30.00 20.50 20.50 19.50 19.50 19.50 19.50 19.00 18.00 18.00 17.00 17.00 16.50 16.50 16.50 16.50 16.50 16.50 16.50 16.00 16.00 15.80 15.80 15.80 15.80 15.80 15.80 15.80 15.80 15.80 15.30 15.30 15.30 15.30 15.80 16.50 16.50 1780 17:80 17.80 19.00 19.00 20.00 19.50 17.50 17.50 17.50 14.50 13.00 13.00 13.00 13.00 12.50 12.50 12.50 12.00 12.00 11.00 11.00 11.00 11.00 11.00 11.00 11.00 11.00 12.30 12.30 2.66 2.66 3.58 3.58 2.96 2.96 1.93 2.57 3.18 3.18 1.93 2.20 2.20 2.21 2.21 3.24 3.24 2.35 2.11 2.80 2.80 1.95 2.80 2.80 4.00 2.81 3.38 2.57 3.96 3.96 2.67 3.05 2.36 2.36 2.54 2.54 2.20 3.03 3.24 3.24 1.95 2.86 2.86 2.64 2.23 2.24 3.24 3.24 1.95 2.32 2.45 1.88 1.76 1.99 2.20 2.14 2.61 1.84 1.62 3.56 2.65 2.65 1.80 582 14.63 14.63 15.25 15.25 Datos para el Caso de estudio 7.1 estudio 7.1 0.00 0.00 Apéndice D 12.30 12.20 12.30 13.50 13.50 13.50 13.50 13.50 13.50 13.50 14.50 14.50 15.50 17.00 17.00 14.25 13.52 13.52 14.63 14.75 14.75 14.00 14.00 14.50 14.50 14.25 14.63 13.30 14.50 1.00 1.00 1.00 0.00 0.00 0.00 0.00 0.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 1.69 1.88 2.77 2.22 2.42 1.77 2.22 2.99 2.22 1.93 3.35 3.35 2.21 11.34 11.34 11.34 11.75 11.75 11.59 11.39 11.75 11.75 11.59 11.75 11.75 11.75 11.75 12.68 12.68 12.68 30.00 30.00 30.00 10.00 30.00 30.00 10.00 30.00 10.00 10.00 10.00 10.00 APÉNDICE APENDICE Coniuntos de datos y Conluntos de ' E base de datos 17 medidas Este apéndice contiene 17 conjuntos de series de datos y ocho variables financieras medidas 266 corporaciones EVA los últimos años.! cada una para 266 corporaciones de EUA en los iiltimos años.' ! Estamos en deuda con Ia Dra. Lynn Stephens de Ia Eastern Washington University por proporcionarnos estos deuda con la Dra. Lynn Stephens de la Eastern Washington University por proporcionarnos estos últimos datos. ñltimos datos. 583 584 Conjuntos de datos y base de datos Apéndice E APÉNDICE E APENDICE E CONJUNTOS DE DATOS PRODUCCIÓN PRODUCCION EN GRANJAS CASILLEROS CASILLEROS DE HUEVO (EN MILLONES) MILLONES) 173.4 176.6 176.6 176.4 176.4 181.2 182.5 184.7 194.8 192.5 191.5 190.1 SALIDAS AL EXTRANJERO SALIDAS ESTADUNIDENSES DE CIUDADANOS ESTADUNIDENSES (EN MILES) 1961 2,020 2,292 2,588 2,841 3,341 3,814 4,334 4,820 5,767 6,499 7,059 8,312 8,758 8,306 8,177 7,755 8,330 9,245 9,939 9,971 9,978 10,275 12,258 12,258 13,909 13,909 14,768 14,768 14,357 14,357 16,425 17,209 17,209 1966 1971 193.6 192.3 183.5 182.3 179.5 179.2 179.5 186.5 192.3 193.6 194.0 193.7 189.4 189.5 190.0 190.0 193.2 193.5 186.8 188.6 192.2 195.9 1959 1976 1981 1986 1991 17,603 17,603 19,022 17,579 Conjuntos de datos y base de datos 585 PRINCIPALES ELECTRODOMESTICOS, EMBARQUES INDUSTRIALES, CONGELADORES (EN MILES). PRINCIPALES ELECTRODOMÉSTICOS, EMBARQUES INDUSTRIALES, CONGELADORES (EN MILES). AÑO ANO Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre 1983 100 97 115 111 113 136 148 134 117 92 78 82 1984 109 100 94 97 118 134 153 133 106 87 80 70 1985 110 73 88 90 112 112 136 149 131 108 100 66 75 1986 1987 84 82 105 97 106 136 137 138 109 87 93 86 1988 91 89 82 108 112 126 156 152 128 110 99 94 1989 89 88 85 89 106 110 125 139 121 93 84 90 1990 98 79 87 90 103 126 126 155 136 136 123 101 101 97 100 100 1991 110 95 75 100 114 114 109 109 1992 ~ 90 91 128 120 132 176 205 166 135 160 138 136 1988 1993 90 77 80 99 106 140 159 159 122 110 94 72 72 142 154 154 138 138 132 132 118 106 106 125 78 121 130 119 112 158 167 137 156 137 72 112 152 PRODUCCiÓN DE CERVEZA (MILLONES DE BARRILES) (MILLONES DE BARRILES) PRODUCCION AIO AÑO Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre 1983 14.77 14.53 16.78 18.42 18.17 18.47 18.50 18.27 15.71 15.41 15.41 13.62 12.46 12.46 1984 14.15 14.75 17.72 16.81 18.74 18.47 19.12 17.59 14.58 15.14 13.06 12.89 1985 15.50 15.50 14.55 16.76 16.76 17.97 17.97 18.86 18.86 18.23 18.23 18.59 18.59 17.71 17.71 14.54 14.36 13.12 13.12 13.13 1986 1987 15.60 15.63 17.66 17.42 17.44 18.58 18.09 16.81 15.82 15.50 13.81 13.69 1988 15.80 15.85 17.12 17.73 18.31 18.58 18.17 17.72 15.78 15.61 14.02 13.22 1989 15.88 14.55 15.29 17.57 17.72 17.30 18.41 18.82 18.28 18.88 14.54 15.28 15.82 14.78 13.45 13.13 1990 1991 1992 1988 1993 15.71 15.71 15.21 16.51 17.99 18.67 18.67 18.65 18.33 18.33 17.06 17.06 15.26 15.62 13.53 13.53 13.97 13.97 16.46 16.27 15.74 15.17 17.97 16.08 17.48 17.99 17.23 18.90 18.10 18.58 18.65 19.16 18.25 19.88 18.96 18.63 16.08 16.08 16.11 16.65 16.62 15.62 15.44 14.47 13.64 13.97 15.36 15.65 15.80 15.36 16.10 15.85 15.78 15.78 17.41 17.57 18.06 17.41 18.00 17.44 17.44 18.89 18.87 18.95 18.96 18.96 18.34 18.51 17.55 15.66 16.15 14.78 14.43 14.32 13.45 15.2 PRESCRIPCIONES NUEVAS NUEVAS AÑO A1O 1984 1985 200 118 90 79 78 91 167 169 169 289 347 375 203 1986 223 104 107 85 75 99 135 121 335 460 488 326 1987 1987 346 261 224 141 148 145 223 272 445 560 612 467 1988 1989 1989 613 392 273 322 189 257 324 404 677 858 895 664 1990 628 308 324 248 272 634 299 424 548 372 876 676 Enero Febrero Marzo Abril Mayo Junio Junjo Julio Agosto Septiembre Octubre Noviembre Diciembre 154 96 73 49 36 59 95 95 169 210 278 298 245 518 404 300 210 196 186 247 343 464 680 711 610 586 Conjuntos de datos y base de datos Apéndice E PASAJEROS DIARIOS POR AUTOBUS PARA 146 DiAS EN PASAJEROS DIARIOS POR AUTOBÚS PARA 146 DíAS EN LA RUTA PIKE STREET, SEATTLE, WASHINGTON. RUTA PIKE STREET. SEATTLE. WASHINGTON. 350 353 419 489 611 516 625 715 744 657 339 351 351 375 429 492 579 538 640 652 782 364 371 371 361 361 404 475 620 496 616 718 731 549 463 525 582 575 625 664 810 369 373 428 527 592 537 637 695 695 777 331 331 331 382 366 444 449 533 475 527 581 630 542 534 621 634 621 733 704 718 840 840 816 340 340 429 467 522 663 538 641 641 772 868 346 406 474 526 638 582 547 654 716 872 341 403 463 513 513 357 631 631 540 649 712 811 429 432 564 645 526 534 662 732 810 398 425 453 599 682 548 699 755 762 381 381 427 462 367 409 456 587 638 595 383 402 474 599 592 521 594 700 748 572 60! 601 555 672 761 761 634 545 704 748 626 649 375 429 409 514 601 521 643 662 711 750 697 572 682 555 datos se leen izquierda a derecha. Los datos se leen de izquierda a derecha. ESTADíSTICAS OCUPACiÓN MENSUAL DEL MOTEL NINE. ESTADISTICAS DE OCUPACION MENSUAL DEL MOTEL NINE. A1O AÑO Enero Febrero Marzo Abri! Abril Mayo Junio Julio Agosto Septiembre Octubre Octubre Noviembre Diciembre 1984 563 1985 635 639 712 622 621 676 501 220 561 603 626 606 1986 647 658 713 688 724 707 629 238 613 730 735 652 1987 676 748 811 729 701 790 594 231 617 556 691 701 706 1988 748 773 814 767 729 749 681 241 241 680 708 694 772 1989 795 788 890 797 751 751 821 821 692 291 291 727 868 812 812 800 1990 843 635 847 639 942 804 840 872 656 370 742 847 732626 899 1991 778 856 939 813 783 828 657 310 780 860 780 808 1992 895 856 893 875 835 935 833 300 791 900 782 880 1993 19 599 669 598 598 580 668 499 215 556 587 546 571 875 993 977 969 872 1006 832 346 850 914 869 994 PRODUCCION PRODUCCiÓN DE CELULOSA (MILES DE TONELADAS CORTAS). CELULOSA (MILES DE TONELADAS CORTAS). A1IO AÑO Enero Febrero 1988 5276 4919 5227 5003 5004 4949 5219 5265 5007 5079 4974 5282 1989 5466 4821 1990 5480 4988 5272 5254 5156 5175 5490 5366 5200 5410 5123 5428 1991 5579 5033 5319 5285 5188 5197 5604 5357 5133 5483 5186 5472 1992 1992 Marzo Abril Abri! Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre 5307 5193 5087 5102 5399 5301 5063 5295 5021 4991 5681 5254 5525 5489 5320 5417 5711 5419 5318 5409 5310 5458 y base de datos Conjuntos de datos y base de datos ÍNDICE DE PRECLO DE LA iNDICE DE PRECIO NUMERO DE GRANJAS EN EUA NllMERO DE GRANJAS EDUCACION SUPERIOR (1983= 100) EDUCACIÓN SUPERIOR (I983=100) (EN MILES) (EN 1970 39.5 42.1 44.3 46.7 49.9 54.3 57.9 61.7 65.8 70.6 77.5 85.9 94.0 100.0 104.7 110.5 115.6 120.3 125.8 133.1 587 1975 1975 1980 1985 1985 1990 2521 2497 2456 2436 2437 2440 2440 2407 2379 2334 2293 2250 2213 2197 2171 2140 2105 PRECIO PROMEDJO DE *WELLHEAD, PROMEDIO GAS NATURAL (CENTAVOS POR GAS NATURAL (CENTAVOS POR MILLON MILLÓN DE PIES CUADRADOS) PIES CUADRADOS) 1972 18.6 21.6 30.4 44.5 58.0 79.0 90.5 117.8 158.8 198.2 245.7 259.3 265.5 248.0 194.2 166.5 169.0 169.0 172.0 PRECIO PROMEDIO ANUAL DE DE PRECIO PROMEDIO ACCIONES COMUNES DE COMUNES DE MOODY'S ELECTRIC UTILITY ELECTRIC 80.20 71.21 48.26 5 1.25 51.25 60.10 67.55 63.54 60.28 54.80 55.41 63.56 74.04 71.16 87.24 111.11 105.90 97.99 110.45 112.61 126.97 1975 1980 1985 1990 1990 PROMEDIO ANUAL EN PROMEDIO ANUAL DE PAGO EN TRABAJOS DE FERROCARRIL TRABAJOS DE FERROCARRIL HORA) (CENTAVOS POR HORA) 1970 403.0 451.9 503.4 550.6 575.9 631.3 690.3 740.0 840.2 922.7 1021.0 1114.0 1226.0 1226.0 1466.8 1384.6 1384.6 1429.9 1429.9 1474.7 1474.7 1511.0 1564.0 1576.2 1576.2 1582.7 1582.7 1681.9 1681.9 1975 1980 1985 1990 1990 A1O AÑO 1985 TRIMESTRE 1 1 RENDIMIENTO TRIMESTRAL PROMEDIO PROMEDIO DE BONOS DE BONUS DE LA TESORERIA A 90 DIAS PROMEDIO DE LA TASA LIDER LA TESORERÍA A 90 DÍAS TASA LÍDER (EN PORCENTAJE) (EN PORCENTAJE) 8.18 7.46 2 3 1986 4 1 1 2 2 3 3 4 1987 1987 1 1 2 3 3 1988 1988 1989 1990 4 1 1 2 2 3 3 4 1 1 2 2 3 3 4 1 1 2 2 3 3 4 1991 1 1 2 2 3 3 4 7.10 7.17 6.89 6.13 5.53 5.34 5.53 5.73 6.03 6.00 5.76 6.23 6.99 7.70 8.53 8.44 7.85 7.64 7.76 7.77 7.49 7.02 6.05 5.59 5.41 4.58 10.54 10.54 10.20 9.50 9.50 9.37 8.61 7.85 7.50 7.50 8.05 8.40 8.87 8.59 8.78 9.71 10.18 10.98 11.36 10.66 10.50 10.04 10.00 10.00 10.00 9.19 8.67 8.40 7.60 588 Conjuntos de datos y base de datos MILES DE CARGAS DE PRODUCTOS FORESTALES EN TRANSPORTES DE CARGA MILES PRODUCTOS FORESTALES EN TRANSPORTES DE CARGA AÑO ANO 1987 1987 589 1988 16.9 18.5 18.6 17.9 18.0 17.4 16.4 16.5 16.7 17.0 12.4 16.9 16.9 1989 16.1 16.1 15.8 16.0 16.6 16.2 16.2 15.8 15.8 16.6 15.8 15.8 15.6 15.6 15.6 15.6 14.4 14.4 14.3 1990 15.6 16.7 17.2 16.7 16.3 16.4 13.9 15.9 15.5 15.2 13.9 14.0 1991 1991 13.2 14.5 14.7 14.1 15.2 15.3 14.9 14.0 15.3 14.4 14.2 15.0 Enero Febrero Marzo Marzo Abli1 Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre 17.6 19.0 19.1 19.1 18.7 19.1 19.9 18.3 19.1 18.6 18.8 16.7 17.3 PRECIOS INDUSTRIALES/PROPORCiÓN DE INGRESOS PRECIOS INDUSTRIALES/PROPORCION DE INGRESOS ANO AÑO 1986 TRIMESTRE 1 1 2 3 4 1 1 2 3 4 1 2 2 3 4 1 1 2 2 3 3 4 1 2 2 3 3 4 1 2 3 3 4 1 1 2 2 3 3 4 1 1 1 P/I 17.56 18.09 16.47 18.73 22.16 21.80 20.82 14.09 13.61 13.29 12.50 12.35 12.46 13.30 14.73 14.73 15.40 15.8 15.8 17.0 14.8 14.8 15.9 15.9 18.8 18.8 20.4 23.7 29.2 28.4 26.8 26.0 26.0 1987 1988 1989 1990 1990 1991 1991 1992 BASE DE DATOS DATOS -01 c.c o NUMERODE VENTAS NÚMERO DE VENTAS COMPAÑÍA (MILLONES) COMPANIA (MILLONES) 1 2 3 3 4 5 6 7 8 9 10 10 11 11 12 12 13 14 15 15 16 17 18 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 1 EMPLEADOS (MILES) 42.0000 20.9050 39.0000 23.3000 35.0000 23.0000 3.9000 8.3780 50.9120 5.5000 39.6000 22.6000 28.0000 46.8810 2.8940 10.1000 22.8010 2.3000 18.0000 3.1000 8.1000 1.1390 5.8000 16.0270 8.7000 4.0000 2.1070 5.0000 1.5760 7.0000 1.6000 6.8330 36.1000 GASTO DE CAPITAL (MILLONES) 147.9000 93.0000 66.8670 59.5560 297.0000 394.0000 2.5900 10.9840 102.7080 16.6010 206.1020 50.6690 1.3120 1.3120 103.0000 4.5770 19.5600 58.0940 3.9510 1.1400 1.1400 2.0090 37.4250 1.3880 18.9780 18.9780 228.7270 86.4030 14.9460 14.9460 14.8080 14.8080 39.7150 1.6590 14.4610 5.5880 72.5190 306.0220 GASTOS INTANGIBLES (MILLONES) 30.6000 29.1000 55.8600 69.6080 29.0000 20.0000 4.2880 3.3720 217.0920 29.5900 157.3520 47.0790 42.0000 31.1000 2.2090 27.0000 33.0000 5.2890 14.5000 18.4930 18.0560 26.3250 12.6000 27.3350 2.8080 8.3710 43.5920 27.8920 23.5420 5.5880 72.5190 31.8030 101.4290 COSTO DE COSTO GASTOS GASTOS DE GASTOS BIENES GASTOS DE NÓMINA Y NOMINA y VENDIDOS RELACIONADOS PUBLICIDAD VENDIDOS RELACIONADOS PUBLICIDAD (MILLONES) (MILLONES) (MILLONES) GASTOS GASTOS EN INVESTIGACIÓN INVESTIGACION Y DESARROLLO (MILLONES) 28.0000 8.9000 11.1820 8.5000 9.2530 14.6000 30.7320 64.8730 8.7790 18.3650 16.4130 16.4 130 9.5000 8.7330 18.5000 1.1000 23.6520 29.6320 38.5420 56.9820 8.6330 2.7860 88.5230 1.4600 9.6000 9.4440 32.000 1.8510 .7500 26.3330 1.8000 57.2710 57.27 10 44. 1550 44.1550 16.1100 322 1.8008 3221.8008 1690.6001 2197.2764 2357.8206 8129.0000 11851.0000 323.8606 660.4856 4351.1601 985.8357 3802.5581 2576.0464 106.0160 5669.8945 319.6570 511.7217 884.6189 166.3750 59.1310 136.6970 767.8799 61.3280 445.6387 2259.6316 624.8040 329.9578 308.7327 598.9507 172.7920 910.8406 142.1830 425.0828 4337.9140 2285.2007 1057.2002 1387.0679 1743.7952 7423.0000 10942.0000 10942.0000 233.5300 582.2649 4156.8671 4156.8671 874.1287 2997.2703 1885.9053 84.6590 4424.3007 246.6980 286.2288 467.4436 111.0310 43.7430 105.3300 519.3948 35.2020 213.2880 1696.3772 1696.3772 408.4707 225.0410 239.1300 481.9436 118.7090 677.2527 126.9660 256.2837 2344.1631 599.7998 343.2000 66 1.3997 661.3997 25.6320 1178.0000 2556.0000 22.8350 25.6250 12.8360 19.5000 518.0000 349.4910 35.5550 785.0000 42.8370 48.9990 36.5000 31.0000 3 1.0000 26.3210 26.32 10 15.8880 112.1350 17.3140 12.1000 421.8057 168.0200 20.9850 329.9578 36.5000 45.0000 48.2000 7.0000 1.6000 6.8330 36.1000 36. 1000 118.3000 114.9000 95.5680 51.9170 5 1.9 170 12.8000 11.6530 3.5290 44.9990 66.2640 112.3860 139.7290 48.8170 48.8 170 22.9370 141.3000 14 1.3000 87.0000 1.8700 16.0350 4.0230 90.3250 46.3000 2 1.8470 21.8470 2.4270 62.8060 116.5990 33.4700 12.9790 18. 1220 18.1220 39.8230 7.9090 58.2130 58.2 130 2.7310 2.73 10 12.1440 270.2576 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 271.0076 209.4520 62.4180 4300.0000 390.6829 270.0127 97.9660 66.4090 56.5550 3267.9551 2745.7439 2609.0000 1677.6016 6887.6210 10584.1990 10584.1990 2912.7644 4309.5820 1946.4766 9254.1171 5018.6914 1510.7798 1560.0750 2794.0000 921.3689 1253.5430 1328.1138 1314.6299 7869.6914 73.0550 108.5090 1422.4507 87.4350 7.8240 868.7107 137.3950 753.8848 1445.0166 3062.6316 2450.4285 141.2580 6.8030 2.0780 2.9980 3.8000 95.5000 5.1000 6.3000 2.0000 12.5261 3.9000 31.9790 43.9680 33.2000 11.6440 53.5000 132.1400 45.8540 66.8000 24.4530 151.2000 62.8510 15.3000 22.7000 37.4000 13.9700 13.0580 13.1160 27.3460 113.3710 7.8240 87.4350 16.5000 7.6550 9.5280 15.3400 2.8750 6.5480~ 6.5480" 27.0030 49.6190 32.6000 1.3040 5.1000 27.1230 14.4690 3.7390 412.2886 30.8480 40.0340 6.9940 3.7570 1.6240 502.0398 251.0340 248.0001 248.0001 284.6089 1075.1719 714.2002 195.2680 275.3079 121.3300 121.3300 1431.0906 479.8997 207.9320 207.9320 162.5190 162.5190 256.0999 61.9380 66.4310 201.1960 36.9330 687.7998 26.5680 5.6630 100.4700 8.5150 26.6950 42.4040 14.1080 14.1080 24.2870 84.1490 84.1490 67.6310 81.9220 81.9220 4.5050 9.5230 6.5030 14.6060 7.6680 157.6030 10.8550 22.4540 5.2500 1.0090 6.9940 45.6140 16.1110 10.0000 87.4830 84.0390 22.6000 45.6430 67.3120 6.2920 121.3300 1.6240 1.6240 63.5190 61.9380 7.3000 18.4340 18.4340 13.9700 13.9700 31.2730 43.0750 90.2000 20.6650 37.3860 69.8820 15.3750 7.7640 1.2120 9.7470 4.2120 4.2 120 99.9080 83.1580 88.8250 6.7300 1.4590 134.3790 176.4890 34.4700 2108.5503 225.1080 189.8000 189.8000 64.5920 57.2310 44.0550 2517.7566 1638.7969 1874.0000 1185.9717 1185.9717 4721.9570 7353.5000 2189.5293 2913.9036 1403.4976 6187.7851 3478.0989 1157.2117 1188.9126 1928.4988 597.7000 806.6758 851.8938 569.7327 5580.5976 38.9980 77.1740 1060.5420 51.3970 6.7860 686.0518 112.2350 596.5076 786.8777 1446.5227 906.9639 95.1540 2.3980 35.7730 2.0780 2.9980 5.1000 6.3000 2.0000 31.9700 33.2000 53.5000 754.8977 45.0000 564.0000 24.4530 1375.7996 1375.7996 3204.2688 3204.2688 879.6548 993.3997 546.0508 2125.2012 1318.0999 13.9700 18.4340 780.7996 45.1640 236.5000 1.1550 6.4690 1931.5005 22.8990 36.9990 305.7000 11.3940 20.5720 200.4850 30.7620 13.4000 1.9360 668.9910 6.7120 3.7000 12.2490 20.2540 1.~N70 1.8970 44.0500 257.6807 18.3780 87.4830 714.9990 121.3300 4.9080 2.5900 59.1300 19.5600 3.9510 161.2000 18.0000 6.4840 44.0700 93.4000 14.9460 1.6590 1.6590 35.2020 95.9510 9.2530 27.6660 19.3190 18.3650 18.3650 19.2020 19.2020 32.0000 31.2730 174.4610 76.5000 43.0750 90.2000 6.3970 69.8820 4.2100 10.4000 10.4000 83.1580 88.8250 39.8650 243.0450 423.2698 9.9040 .7230 11.6440 33.4770 43.7430 18.9700 18.9700 14.9460 14.9460 1.6590 1.6590 57.7210 108.1480 83.0000 36.1310 231.4690 377.1001 66.0560 40.5470 40.0810 334.8057 144.3000 144.3000 39.7150 24.7010 70.1000 22.6500 48.6510 33.5620 42.1160 155.9000 99.8430 1.6500 1.6500 25 2 55 25.4520 2.7200 52.1780 22.7240 1.9000 6.4200 76.1870 74.5240 90.5730 9.7580 11.9490 11.9490 (continuación) DE DATOS BASE DE DATOS (continuación) (continua ción) VENTAS NUMERO DE NÚMERO DE COMP AÑÍA (MILLONES) COMPAIJjA (MILLONES) EMPLEADOS (MILES) DE GASTO DE CAPITAL (MILLONES) GASTOS INTANGIBLES (MILLONES) COSTO DE COSTO EN GASTOS EN GASTOS DE DE I3IENES NÓMINA Y GASTOS DE INVESTIGACION BIENES GASTOS DE INVESTIGACiÓN NOMINA y VENDIDOS RELACIONADOS PUBLICIDAD Y DESARROLLO VENDIDOS RELACIONADOS PUBLICIDAD Y DESARROLLO (MILLONES) (MILLONES) (MILLONES) (MILLONES) (MILLONES) 75 76 77 n 78 79 80 81 8! 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 100 101 10! 102 103 103 104 105 106 107 1852.08Y6 1852.0896 365.7217 1981.4397 2362.1326 357.0696 220.3790 1082.4927 848.3799 1112.0386 1515.8816 1328.5508 2878.4956 4312.0507 54.3250 122.9470 2014.7056 969.8328 45.3670 255.1320 1710.4700 365.8809 33.2650 53.7460 52.8760 9.6630 1451.6687 321.3638 156.4580 52.1870 447.2100 86.8170 1132.3499 217.4120 25.4000 4.9030 28.7000 40.7000 5.5500 3.7000 17.9000 17.1000 16.5890 37.0000 19.9200 58.0000 56.6000 37.3860 57.1720 31.0000 18.5170 8.3500 3.3000 31.7000 3.4800 2.0870 .5250 1.1420 2.4190 29.0000 4.9110 4.91 lO 2.3500 .8650 7.7670 1. 1000 1.1000 18.0150 3.2000 89.5500 17.0620 155.8530 110.100() 110.1000 12.6430 10.7860 51.3360 41.2990 74.5790 108.0460 108.046() 44.6810 44.68 10 182.2670 169.2950 1.0660 13.7480 74.7910 40.8340 1.6430 10.6420 91.5640 20.0140 1.5120 2.0870 2.4190 12.7460 86.6820 13.1180 4.5670 1.5100 12.7460 1.2810 16.8570 4.4840 57.7900 16.7160 141.2700 99.8430 52.lnO 52.1780 9.7580 52.1780 11.9490 44.6610 52.3290 6.2850 348.1426 66.9970 2.8130 7.5620 54.2710 7.0670 20.2520 54.7540 6.7300 4.4840 42.2810 1.2160 7.9670 97.2690 11.0840 3.8620 20.6490 41.7940 19.3850 1.6970 10.5440 672.7947 217.5420 668.7720 1055.4187 141.2700 67.1220 31O.n20 386.0066 378.7710 758.5320 566.2200 1247.2339 2672.3262 26.5960 94.6720 700.4778 448.5286 15.7310 131.6750 752.5889 177.5500 19.7100 16.1820 27.1500 5.6960 505.8267 268.0159 114.1930 36.5130 280.3218 57.2600 785.0718 142.6020 4.5070 3.4720 3.4720 634.0596 11.3940 2.1330 20.5720 315.8997 16.0000 7.3000 469.9229 323.7090 1.1500 1.1500 6.4600 4.7670 17.6580 503.6768 9.4450 2.1230 12.2220 530.2456 25.8740 19.7100 16.1800 27.1500 5.6950 5.6950 36.1200 57.2600 6.4800 59.3250 26.8120 26.6950 36.9240 57.5790 28.4910 6.730 55.2940 75.7000 36.8860 7.1610 114.9660 40.6150 91.2150 74.5950 36.9560 391.6277 260.3870 0.7520 1.4590 45.0900 91.2690 5.1820 42.5670 239.9010 16.7100 1.1550 1.1550 7.6770 6.4690 0.4570 137.7250 1.1110 4.7670 18.0150 9.4400 2.1230 25.8740 3.2520 148.0770 11.8950 161.3500 113.1280 18.9510 6.2610 65.6910 61.6940 77.3130 61.8300 115.5890 85.3970 37.6540 44.6610 3.8670 21.1460 8.5670 52.3290 6.2850 42.0600 23.7910 2.8890 19.7100 16.1820 27.1500 30.7620 13.4000 5.6960 1.9360 505.8267 1.3420 6.7120 3.7000 108 109 110 111 111 112 113 113 114 114 115 115 116 116 117 117 118 118 119 119 120 120 121 121 122 122 123 123 124 124 125 125 126 126 127 127 128 128 129 129 130 130 131 131 132 132 133 133 134 134 135 135 136 136 137 138 138 139 139 140 141 141 142 143 144 144 145 146 146 147 7.7640 1581.8760 201.4650 198.9010 1497.0076 153.2290 367.9246 367.9246 494.4136 52.4550 37.3860 57.7120 586.4766 586.4766 476.2078 15.3570 393.6016 393.6016 4701.1210 1167.8340 1167.8340 12298.3980 439.4727 29127.0030 1993.6624 4660.8945 976.4578 3834.9324 9535.7382 657.7776 100.4570 100.4570 60334.5110 2150.0000 18069.0000 109.7380 109.7380 592.7710 4642.3945 2072.4412 4509.3828 34736.0030 1191.0337 1191.0337 312.7300 1553.1077 6997.7734 86.6820 20.8580 1.1000 1.1000 .9110 7.4000 1.8400 5.1000 8.3500 1.2120 .8200 13.1190 13.1190 3.8030 4.0510 4.5671 5.6000 7.5620 2.8100 50.7000 1.9020 108.7000 8.0000 18.1000 8.8280 6.6610 42.7800 1.2640 43.0750 43.0750 130.0000 90.2110 90.2110 58.3000 58.3000 69.8870 69.8870 3.2520 14.3280 14.3280 11.1480 11.1480 13.3540 13.3540 207.7000 4.2070 4.2120 9.1500 30.0080 1.2810 142.2810 7.9670 9.7470 131.9400 11.0840 20.6490 19.3850 7.2210 1.3370 1.3370 3.4390 44.3730 34.2780 16.8570 30.2360 353.2830 48.6920 1221 .8008 1221.8008 65.1100 1897.0005 43.4190 636.1238 14.8590 316.7156 316.7156 1107.3838 56.1460 44.0680 4186.9296 311.7000 1680.0000 32.2560 123.7680 353.5999 270.1846 502.2720 1760.7100 255.6150 76.5000 343.9539 956.1719 7.2210 5.8820 1.3370 1.3370 .4290 6.0210 3.4390 11.2110 11.2110 3.1490 7.0620 44.3730 .7160 34.2780 30.2360 53.2830 2.8890 48.6920 8.4580 10.4000 39.8650 9.9040 45.7820 28.4900 55.2940 68.2690 75.7000 36.8860 7.1610 40.6150 91.2150 74.5900 36.9560 3.8770 33.5620 42.1160 1.6500 1.6500 2.7200 1.9000 1.9000 6.4200 23.6410 11.2330 6.4800 1280.1670 169.2630 164.1940 1098.2969 59.2350 230.1690 342.9849 26.8120 26.6950 36.9240 391.3706 244.7830 9.5280 265.3079 3707.6846 1017.6038 9285.7109 263.8108 20032.0000 1755.5662 3675.6895 879.3516 3557.4734 7075.1875 565.0176 72.7830 45999.0070 1460.7996 13442.0000 97.0130 420.3206 4085.0989 1640.8118 2838.0845 26053.9060 865.6477 452.4130 988.8760 4886.8125 9.5280 359.0999 57.5700 73.9670 99.4080 9.2800 73.9670 6.4690 4.7670 9.4400 2.1230 25.8740 99.9080 29.0000 9.2800 4.9110 4.91 10 2.3500 1016.5000 51.1480 78.7700 3.5730 440.7996 91.8000 7.4050 971.0000 14.4700 14.4700 22.0310 3405.0000 3405.0000 57.4030 1345.0000 1345.0000 2.5200 67.3300 324.0000 324.0000 1.2400 1.2400 236.4540 20.9400 82.6730 17.0050 17.0050 185.6600 720.5000 20.8580 1.1000 7.4000 1.8400 5.1000 8.3500 1.2110 3.8030 4.0510 5.6000 7.5620 2.8100 5.8820 6.0200 11.2110 3.1490 7.0620 13.1160 27.3460 16.5000 31.1370 3.4000 15.3440 2.8250 6.5480 27.0030 49.6110 32.6000 1.3040 25.4000 4.9030 28.7000 40.7000 5.5500 2.0370 3.7000 .2670 17.9000 12.5840 17.1000 268.0159 1 12.2490 114.1930 36.5130 280.3280 4.5070 11.3940 2.1000 57.2600 785.0718 .9510 20.5720 16.0000 142.6020 7.3000 3707.6846 6.4800 59.2350 64.6000 31.2730 2 86.0000 43.0750 11.6000 11.6000 90.2000 69.8820 29.7730 4.2120 83.1580 290.0000 25.1000 88.8250 13442.0000 6.7300 1.4590 1.4590 25.0000 4.9810 12.8000 16.7160 99.8430 52.1780 9.7580 58.2460 (continuación) (con tinuaciOn) BASE DE DATOS BASE DE (continuaciOn) (continuación) NUMERO DE NÚMERO DE VENTAS COMPAÑÍA (MILLONES) COMPAJiA (MILLONES) 148 149 150 151 151 152 152 153 153 154 154 155 155 156 156 157 157 158 158 159 159 160 160 161 162 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 EMPLEADOS (MILES) 5.1420 94.8000 34.9740 37.5750 47.01 10 47.0110 24.1450 33.7210 67.8410 6.7310 3.5310 1.5420 16.2970 2.3150 6.2550 10.9000 16.1790 19.3970 1.9190 52.1400 3.7000 94.5000 3.3640 52.5350 4.3020 20.0000 8.8000 1.3000 36.0620 12.6590 12.5120 1.0250 1.0250 4.1520 GASTO DE DE CAPITAL (MILLONES) 41.9800 2913.()()()() 2913.0000 1774.3904 1049.6729 1744.0364 762.2510 601.1216 1344.3777 12.7120 26.6780 97.4910 732.()()()() 732.0000 15.0860 51.1060 145.5140 51.1480 78.7700 3.5730 110.4470 7.4050 398.2000 14.4730 29.1000 22.0310 57.4030 22.0670 2.5210 2.5210 263.6167 67.3340 133.3850 133.3850 1.2400 1.2400 20.9420 GASTOS INTANGIBLES (MILLONES) GASTOS GASTOS DE COSTO COSTO DE GASTOS GASTOS EN GASTOS NOMINA Y NÓMINA GASTOS DE INVESTIGACION INVESTIGACIÓN BIENES VENDIDOS RELACIONADOS VENDIDOS RELACIONADOS PUBLICIDAD Y DESARROLLO (MILLONES) (MILLONES) (MILLONES) (MILLONES) 375.3599 20632.()()()() 20632.0000 8259.7656 19964.6050 10046.0000 3336.7566 5714.3085 24787.6050 74.5510 1035.7129 480.5110 4540.4609 319.4939 606.8318 681.9656 746.2820 1021.4856 122.3210 3540.9612 203.3440 5224.0000 190.4190 18.0560 341.5906 999.7520 678.4258 50.9650 2710.3455 771.0059 653.8069 60.0820 248.7160 25.0200 2344.()()()() 1051.0000 994.0000 1126.7310 431.9976 9.7320 1572.7996 31.5580 3 1.5580 6.6000 23.5230 444.8997 10.6050 3.5230 26.3250 12.6000 435.2998 27.3350 1235.0000 2.8080 2550.0000 8.3710 8.37 10 43.5920 135.6000 27.8920 229.1270 24.8290 974.3379 23.5420 351.4700 93.0000 123.1000 513.1880 28085.0030 11062.8980 23232.4060 14961.5000 5197.7070 7428.2343 28607.5030 87.6100 1165.6736 567.3650 5954.9414 368.0940 751.7327 895.4087 1063.2908 1306.0867 140.4440 4357.2812 263.9048 6184.8945 257.6509 50.5150 419.6470 1227.4490 779.3450 72.1760 3248.0076 921.1270 711.9827 72.4110 297.5686 41.9800 32.5600 43.0250 90.2110 69.8870 4.2120 6.7310 10.4000 39.8650 9.9040 28.9400 55.9240 2.7160 13.5380 9.3840 25.7670 2.7490 55.8600 12.0830 27.2080 69.6080 7.5700 29.0000 20.0000 4.2880 3.3700 29.5900 19.4460 19.4460 10.5250 10.5250 45.0790 42.0000 .8990 11.3330 89.()()()() 89.0000 16.5890 37.0000 19.9200 7.7130 7.7 130 33.7210 58.0000 58.0000 67.8410 56.6000 31.0000 18.5170 3.300 3 1.7000 31.7000 3.4800 6.8000 39.0000 16.698016.1790 23.3000 35.()()()() 35.0000 3.9000 8.3780 50.9 120 50.9120 5.5000 39.6000 22.6000 28.()()()() 28.0000 46.88 10 46.8810 2.8940 10.1000 22.8010 22.8010 2.3000 18.0000 3.1000 3.1000 11.9490 231.0000 114.0000 19964.6050 89.7370 80.3250 15.0520 21.0000 52.0000 44.6610 2.4490 52.3290 18.5000 6.2850 9.9000 30.6000 14.6320 14.6320 13.2830 13.2830 29.1000 55.8600 3.2500 37.1000 69.6080 29.0000 20.0000 9.0000 4.2880 3.3700 29.5900 157.3520 45.0790 42.0000 31.1000 2344. 105 1 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 677.8489 582.6238 3750.4109 88.8070 306.9397 331.7366 546.9500 7.5910 3479.4573 485.6138 123.2280 488.2327 100.7820 165.7970 274.8440 11049.5000 1154.8477 578.7107 124.5440 3711.2029 124.8600 2466.0000 2829.2991 814.8196 4051.7996 67.0390 240.5670 45.2140 69.9520 54.5490 317.4480 _. 847.9927 467.9546 126.6750 85.7290 680.7666 211.3230 254.3030 1396.8108 3981.0000 6.0700 1.4000 1.4000 38.1700 2.3330 2.8000 5.2000 8.9000 30.6000 41.3940 6.6580 2.0450 4.6500 1.7030 4.7660 3.5500 166.8480 14.4190 14.4190 11.4920 11.4920 1.8000 63.4000 2.0000 26.8650 36.2000 14.8000 14.8000 46.0000 28.0000 4.0000 2.0000 81.0000 1.1270 1.1270 5.7840 24.0000 4.8450 14.0007 14.0007 49.0000 8.2200 1.5670 3.1000 29.4160 52.9000 17.0050 25.0290 120.8280 9.7320 31.5880 6.6000 23.5230 170.3720 58.6750 10.6050 20.4800 2.4430 2.4430 3.2790 3.2790 21.7900 667.7998 32.2360 26.3000 4.6280 303.3838 5.2240 161.7000 156.8000 48.5520 349.5999 3.5010 5.5670 1.41 10 1.4110 33.3333 1.7720 1.7720 12.6650 85.0240 13.1650 13.1650 7.7490 2.1610 19.2340 4.8350 2.7620 2.7620 79.9820 188.3000 31.1000 2.2090 27.0000 7.2110 33.0000 11.0250 5.2890 14.5000 18.4930 3.5250 5.2550 613.3047 1.1111 1.1111 1.6800 88.0003 2.9530 55.5000 4.0800 8.0141 1.9850 4.5720 2.3200 2.0202 27.1000 16.0111 16.0111 2.6000 2.5 170 2.5170 1.3220 1.3220 18.1010 8.0033 17.7200 11.0330 19.7930 2.3810 14.1441 14.1441 49.4949 77.7878 15.6180 2.3570 28.2626 70.3000 474.3450 3240.7886 66.6540 220.4980 295.3848 439.0479 5.0480 3100.5391 3100.5391 335.3318 335.3318 96.6630 402.8457 88.7960 120.1080 213.1860 9955.3984 1037.4727 1037.4727 433.8230 101.5300 2729.9280 79.7770 2028.7996 2261.0000 622.9507 3036.5999 54.9070 184.1350 38.0970 65.4570 42.5990 254.1990 664.9578 400.5806 109.6830 72.8400 578.8528 578.8528 171.4130 205.8410 1000.2886 1000.2886 3120.5999 169.2570 66.8670 1132.6216 59.5500 2.5900 10.9840 16.0010 50.6690 1177.5999 42.0000 20.9000 402.8400 4.0000 2.0000 3.0000 4485.1953 424.4556 1.0111 23.6630 22.0222 51.0000 18.4021 930.2000 204.9000 1215.2996 66.5620 61.6900 62.3201 52.3302 42.4444 80.1010 34.1021 4.0999 50.6410 9.9901 9.8175 65.0000 42.4381 3.8107 1085.7996 8.1000 1.1390 5.8000 16.0270 8.7000 4.0000 2.1000 5.0000 1.5760 93.0000 66.8670 77.0101 21.0000 4.0008 3.7521 22.0007 21.1234 12.3456 78.9101 91.0111 21.3141 3.2000 51.1617 18.1920 46.0000 21.2223 24.2526 2.5860 27.2829 30.3132 33.3435 36.3738 39.4041 42.4344 45.4647 48.4950 51.5253 54.5556 57.5859 16.1580 75.8000 2.2090 27.0000 33.0000 5.2890 5.2890 14.5000 18.4930 18.0560 26.3250 15.0500 1.4320 12.6000 22.2426 28.3032 18.2022 24.2628 52.5000 30.3234 5.3300 5.3300 36.3840 33.0000 2.6500 14.9000 25.2000 1.4150 56.6000 42.4446 3.0470 3.0470 48.5052 54.5658 60.6264 66.6870 10.4000 1.0011 1.0022 1.0033 1.3090 1.8201 2.0880 3.4510 3.4510 37.5000 (continuación) (continziación) 1 3 BASE DE DATOS (con/inzlación) (continuación) BASE NUMERO DE NÚMERO DE VENTAS COMPAÑÍA (MILLONES) COMPAIiA (MILLONES) EMPLEADOS (MILES) 56.5320 17.2880 9.8850 18.0002 1.3200 2.1980 1.0560 43.1111 18.5216 2.6000 14.2421 5.7000 16.8750 1.1080 3.4190 1.0000 12.5358 8.2000 10.3000 7.0000 10.0000 GASTO GASTO DE CAPITAL (MILLONES) 259.5000 103.0320 103.0320 25.4530 5.6666 6.1110 5.5430 8.8888 7.7777 1.6940 4.6850 12.0818 15.8370 37.4620 2.5820 13.3250 1.5700 18.7842 56.0530 17.9320 3.9360 27.0360 GASTOS INTANGIBLES (MILLONES) COSTO GASTOS DE COSTO DE NOMINA NÓMINA Y BIENES VENDIDOS RELACIONADOS (MILLONES) (MILLONES) 3352.3008 1055.9436 848.7227 16.5170 48.9480 138.5690 17.9930 13.9720 38.8190 64.0500 5.9500 144.7340 491.1160 28.1320 105.1630 35.9730 12.9550 359.8350 376.4170 267.2456 375.3457 1275.7002 12.0000 4.0877 3.3876 4.5222 4.5222 43.4350 18.1111 14.2222 88.9922 106.1150 12.4243 7.8246 42.4444 210.0050 81.8118 145.6840 51.7100 51.7 100 43.4400 12.8888 77.9999 1.1007 2.0008 179.9240 GASTOS EN GASTOS GASTOS DE INVESTIGACION INVESTIGACIÓN PUBLICIDAD Y DESARROLLO DESARROLLO (MILLONES) (MILLONES) 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 3943.0990 1260.2349 1260.2349 973.2527 19.9060 66.8260 178.7460 26.7510 20.5750 51.5960 106.1150 8.5160 308.8916 753.8069 41.2960 145.6840 51.3130 21.4070 585.6597 516.7239 316.8147 509.7000 49.9000 11.4810 5.5580 5.5580 1.4100 88.1388 138.0000 211.0113 82.1003 1.1620 9.9210 12.1402 13.1402 3.6210 12.1213 1.0087 8.0025 5.5554 80.9960 9.3610 12.1314 15.1617 56.5320 60.6 162 60.6162 63.6465 66.6768 69.7071 69.707 1 72.7374 75.7677 78.7980 81.8283 8 1.8283 81.0077 77.0222 22.4443 47.8877 16.4370 12.5456 51.8196 21.4231 37.8286 13.6920 13.6920 5.6670 86.8686 85.8686 42.3000 2.1133 3.3210 3.32 10 4.2242 5.62 10 5.6210 6.2155 6.2 155 7.2 102 7.2102 8.9712 8.97 12 24.2601 24.260 1 23.28 10 23.2810 24.8588 2.7060 4.9340 24.5293 1.8480 59.6085 64.882 1 64.8821 8.96 10 8.9610 5.6000 76.7686 3.6080 33 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 341.3887 33.0660 200.5920 184.5810 217.7520 386.8118 69.1530 81.4650 329.5518 36.3870 344.7937 22.8030 196.3030 31.5660 108.8580 83.6260 390.8726 363.9839 52.2620 228.6110 60.8250 16.6890 39.8290 28.9020 8.7410 61.9446 7.1270 1.0872 4.0000 4.0500 4.0880 7.4040 12.1212 1.6220 6.0040 133.0000 7.5000 84.1000 5.4660 13.7124 \.7000 1.7000 1.2320 6.1660 7.0160 .4420 5.6500 1.5000 40.5000 62.1000 93.4000 27.0000 7.0000 7.1570 1.9540 5.3320 7.2780 7.3840 18.4880 1.6190 4.1890 12.2520 12.7246 12.7246 24.7400 2.1060 5.9730 8.1264 8.1264 1.2870 1.2870 4.1220 17.3310 11.2700 5.1030 1.8370 1.4910 1.4910 57.6000 3.9900 1.1040 1.l040 55.6000 35.0470 8.1819 9.2021 20.0290 10.3570 10.1146 47.1213 48.1415 16.4950 8.0540 51.5355 57.5982 83.4952 99.9242 10.1115 92.4445 55.6677 40.5880 11.5610 l.l500 1.1500 41.5600 45.3100 9.8540 1.5610 36.5000 32.1400 43.2000 287.6907 24.0720 153.5480 142.7160 179.1020 179.1020 302.5586 54.4310 70.5080 269.6377 27.7690 205.0610 10.6830 142.1520 22.3750 45.9130 45.0950 296.8577 234.6320 43.5110 161.4700 41.6820 9.8450 32.6580 23.1410 6.3700 432.3777 9.0007 12.7210 7.6660 8.7770 78.3910 2.9990 11.3410 4.4555 12.1417 21.8283 92.9395 96.9899 97.9294 95.0092 92.6666 92.5555 58.2130 2.7310 12.1440 20.5400 1.8970 18.3700 4.9080 2.5900 59.3100 160.6660 86.8888 83.1111 82.2222 22.6665 44.6621 18.1716 15.1413 12.1110 9.8765 4.3210 8.1234 5.6788 12.4582 14.5220 1.4330 13.5620 18.0000 6.4860 44.0700 14.9460 1.6590 35.2020 9.2530 18.3650 27.6600 19.2020 86.7795 95.9594 94.9388 1.0790 89.9012 3.8620 13.8125 47.8552 51.9185 54.3321 4.8200 43.8388 2.2710 66.7274 53.5422 22.5673 10.0000 86.0000 16.0000 3.0730 30.7300 63.5300 30.0000 10.0000 56.6660 6.3530 Indice , Abacus Scientific Software Company, 10 Company, 10 Abacus Scientific Aburdene, P., 527 Aburdene, P., Ace Personnel Department (caso de estudio), 243-44 Ace Personnel Department (caso de Add-a-Stat, 10 Add-a-Stat, Administradores: Véase también Pronóstico empresarial, aplicación en Ia Véase también Pronóstico empresanal, aplicación en la administración ventas sobre pronósticos, 542 ventas sobre pronósticos, y el enfoque Box-Jenkins, 479,480 y ci monitoreo de pronósticos, 536-539 pronósticos, 536-539 y el y ci proceso de pronóstico, 533-536 el proceso pronóstico, 533-536 y Ia necesidad de los pronósticos, 2-3, 73-74, 176-177, 289, 290-91, la 2-3, 73-74, 176-177,289,290-91, 318,351-353,400-401,478-480,533 318, 35 1-353, 400-401, 478-480, 533 Y Ia responsabilidad del pronóstico, 540-541 pronóstico, 540-541 y la Ajuste de Ia curva 5, 118 Ajuste de la curva S, 118 Alcam Electronics (caso de estudio), 56-5 8 de estudio), 56-58 American Index, 67 A,nerican Statistics index, 67 Análisis de regresión simple vs. multiple, 255 vs. múltiple, Análisis la administración, 230-231. Véase ta,nbién aplicaciones en Ia adniinistración, 230-23 1. Véase también Análisis de regresión Análisis de regresión, 203-233, 255-291, 318, 374-402, 534 regresión, 374-402, 534 Análisis en la administración, 230-231, 289-291 aplicación en Ia administración, 230-23 1, 289-291 coeficiente de en, coeficiente de determinación en, 213-216, 232 pronóstico para, 10-232 error estándar del pronóstico para, 2210-232 estimación del 208-209, estimación del error estándar para, 208-209, 232 linea de regresión definida, 205 en, 205-207, 232 método de minimos cuadrados en, 205-207, 232 muestra muestra de ecuación de regresión para, 206 regresión para, 206 de regresión en, 207 muestra de linea de regresión en, 207 porcentaje, 383, 387-392 por cambios de porcentaje, 383, 387-392 predicción de y, 209-213 209-213 primeras diferencias en, 396-398 primeras diferencias la autocorrelación en, 377-380 problemas con Ia autoconelación en, 37 7-380 prueba en, 220,226 prueba de hipótesis en, 220,226 regresión para, 279-284 regresión por pasos para, 279-284 residuales residuales en, 207, 217 217 la ecuación de regresión para, 274-284 selección de Ia ecuación de regresión para, 274-2 84 series de tiempo, 374-401 sobre datos de series de tiempo, 374-401 suma de residuales cuadrados para, 217-2 19 cuadrados para, 217 -219 suma de cuadrados para, 217, 233 suma total de cuadrados para, 217, 233 suposiciones en, 261,271 suposiciones en, 211, 226, 261, 271 regresiones todas las regresiones posibles, procedimiento en, 277-279 Véase también Correlación, Múltiple, Regresión de datos Véase también Correlación, Regresión Multiple, Regresión de datos de series de tiempo tiempo las transformaciones variables, 226-230 y las transformaciones de variables, 226-230 tiempo, 98-100,118,119,318-353,379-402, Análisis de series de tiempo, 98-100, 118, 119, 3 18-353, 379-402, 479,533 479, 533 en la administración, 351-353 aplicaciones en Ia administración, 35 1-353 Il, de descomposición de, 350-351 Census II, método de descomposición de, 350-351 aleatorio en, 322, .353 componente aleatorio en, 322, .353 forma estacional en, 346-347, 353 datos ajustados en fonna estacional en, 346-347, 353 descomposición en, 319-20, 349 descomposición en, 98, 99, 319-20, 349 432 estacionarias, 432 374-377 heteroscedasticidad en, 374-377 indice de precios en, 320-322 320-322 indice juicios en, 63, 319 319 minimos cuadrados en, 324-327, 393-396 método de minimos cuadrados en, 324-327, 393-396 multiplicativo en, 54-295 modelo multiplicativo en, 2254-295 de, 374-401 regresión de, 374-401 319, 322-330 tendencia en, 319, 322-330 tendencia estacional en, 342-346 tendencia estacional tendencia no lineal en, 285-287 tendencia no lineal en, 'aIores de tendencia mensuales o trimestrales en, valores de tendencia mensuales o trimestrales en, 300-304, 311 variación cíclica en, 319, 330-338 330-338 variación ciclica vanación estacional en, variación estacional en, 320-338, 347 variaciones cIclicas e írregulares de corto plazo en, 347-349 347-349 vanaciones cíclicas e irregulares de y deflación de precios, 321-322 detlación precios, 321-322 y el análisis, 336 el y el modelo aditivo, 284-287 el y Ia correlación serial, 377-400 la correlación serial, 377-400 y Ia curva de Gompertz, 329-3 30 la de Gompertz, 329-330 y Ia sIntesis, 337 la sintesis, Y Ia suma total de cuadrados, 233 cuadrados, 233 y la y los indicadores empresariales, 3 32-335, 353 indicadores empresariales, 332-335, Anderson, Parente, Janet, 523 Anderson, Parente, Applied Decisions Systems, 9 Argyl Food Products (caso de estudio), 78-81 Products 78-81 Argyl de Arrnstrong, J. Scott, 524 Armstrong, J. Scott, Atenuación exponcncial cuadrática, 118 118 Atenuación exponcncial Atenuación exponencial de Brown, 116, 163-168 Atenuación exponencial de Brown, 116, 598 Indice Atenuación exponencial doble Brown), 163-168 Atenuación exponencial doble (Método de Brown), 163-168 fónnula para Ia, 164-165, 178 formula para la, 164-165, 178 exponencial, 118, 163-168 Atenuación lineal exponencial, 118, 163-168 Surveys, Inc., 68 Audits and Surveys, Inc., 68 Autobox,9 Autobox, 9 Autocast 11, Autocast II, 9 Autocorrelación parcial, 436-437 100-114, 122-125, Autocorrelación, 98, 100-114, 122-1 25, 377-400 formulas para, 100, 101, fónnulas para, 100, 101, 125, 126 126 parcial,436-437 parcial, 436-437 377-380 problemas de, 377-380 prueba de Durbin-Watson para, 380-383, 578-579 prueba de Durbin-Watson para, 380-383, 578-579 solución para, 383-384,387-400 solución de problemas para, 383-384, 387-400 Y el análisis de regresión, 21 y el anulisis de regresiOn, 2111 y el enfoque iterativo, 398-400 Y enfoque iterativo, 398-400 la series de tiempo, 377-400 y la regresión de datos de series de tiempo, 377-400 Y la técnica Box-Jenkins, 439-465 y técnica Box-Jenkins, y Ia tendencia, 108 la 108 Y los modelos de autorregresión, 392-393, 436-437 modelos de autorregresión, 392-393, 436-437 y Y generalizados, y minimos cuadrados generalizados, 393-396 diferencias, y primeras diferencias, 396-398 véase Coeficiente de autocorrelación Autocorrelación, coeficicnte Autocorrelación, coeficiente dc, véase Coeficiente de autocorrelación teorema 530-533 Bayes, teorerna de, 530-533 Beaumont, et al., 10 Beaumont, et al., Berhard, Amold and Company, 68 Berhard, Arnold Bondad dcl ajuste, pnieba de, 3 7-39. Véase también Pmeba de pmeba de, 37-39. Véase ta,nbién Prueba de Bondad del Ji-cuadrada de estudio), 544-545 Boundary Electronics (caso de estudio), 544-545 Box-Jcnkins, técnica, 1, 108, 115, 117, 118, 431-480, 534 Box-Jenkins, técnica, 1, 108, 115, 117, 118,431-480,534 aplicación de la metodología en Ia, 439-465 aplicaciOn de Ia metodologia en la, aplicación en Ia administraciOn, 479-480 la administración, 479-480 desventajas de Ia, 477-478 la, 477 -4 78 desventajas etapa 1 (identificación del modelo), de Ia, 439-440 la, etapa (identificación etapa 2 (estimación y prueba del modelo), de Ia, 440-441 del modelo), de la, 440-441 etapa etapa 3 (pronóstico con), de Ia, 441-465 la, 441-465 etapa modelo autorregresivo de promedio móvil (ARIMA), en Ia, 439-465 promedio mó\~1 (ARIMA), en la, 439-465 modelo de autorregresión (AR) en Ia, 436-437 la, modelo de autorregresión (AR) modelo de mó\~1 la, 438 modelo de promedio móvil (MA), en Ia, 438 y el análisis estacional, 465-478 análisis estacional, y las autocorrelaciones parciales, 436-437 autocorrelaciones parciales, 436-437 pmeba de, 480 Box-Pierce, prueba dc, 453, 480 Brown, Método de (atenuaciOn exponencial doble), 163-168 (atenuación exponencial doble), 163-168 Brown, of Economic Activity, 64 Bureau of Economic Activity, 64 Bums, Arthur F., 533 Burns, Arthur Associates (caso de estudio), 545-550 Busby Associates (caso de estudio), 545-550 Business and Economic Forecasting. 9 Business Economic Forecasting. Business Forecast Systems, Inc., 9, 10 Business Forecast Systems, Inc., 9, Business Week, 289 Business Week 289 Products, lnc. (caso de estudio), 241-243 Butcher Products, Inc. (caso (IC estudio), 24 1-243 Cambios de porcentaje, regresión de, 383-387-392 Cambios de porcentaje, regresión de, 383-387-392 Capacitación Capacitación (en redes neurales), 525 Robert, 9 Carbone, Robert, 9 Casos de estudio: de estudio: Personal Department, 34-244 Ace Personal Department, 2234-244 Aleam Electronics, 55-57 Alcam Electronics, Food Products, 76-79 Argyl Food Products, 76-79 Boundary Electronics, 544-545 Boundaiy Electronics, 544-545 545-50 Busby Associates, 545-50 Butcher Products, Inc., 241-243 Inc., 241-243 Consumer Credit Counseling, 12, 80-82, 135-36, 186-87, 245-246, Counseling, 12,80-82, 135-36, 186-87,245-246, 307-308,365,416-417,490-491,552 307-308, 365, 416-417, 490-491, 552 diaria de pennisos para pesca de tmcha, 495-507 Demanda diana de penriisos para pesca de trucha, 495-507 El Mercado de Valores, 299-302 Valores, 299-302 mercado, 82-89 Estudio de factibilidad de mercado, 82-89 Restaurant, 545 Golden Gardens Restaurant, 545 Índice Condado de Spokane, 409-415 Indice de actividad empresarial para el Condado de Spokane, 409-415 Compañia Su Elección, 408-409 La Coinpañia de Su Elección, 408-409 599 Lydia E. Pinkham Medicine Company, 491-494,552-555 Lydia E. Pinkharn Company, 491-494, 552-555 Mr. Tux, 11-12, 57-58, 80, 134-135, 185-186, 244-245, 305-306, Mr. Tux, 11-12,57-58,80,134-135, 185-186,244-245,305-306, 360-365,415-416,488-490,550-552 360-365, 415-416, 488-490, 550-552 Murphy Brothers Furniture, 131-134 Fumiture, 131-134 Muiphy Proyección de ingreso quinquenal para Downtown Radiology, Radiology, Proyección de ingreso quinquenal para 187-196 187- 196 Small Small Engine Doctor, 35 8-360 Doctor, 358-360 Solar Alternative Company, 184-185 Altemative 184-185 Solomon's Jewelry, 79 Tiger Transports, 239-24 1 239-241 Ventas de restaurante, 302-305, 487-488 Ventas de restaurante, 302-305,487-488 vs. correlación, Causalidad vs. correlaciOn, 46 datos del, 64-65 Censo, datos del, 64-65 11, método de descomposición, 117, 118,350-351 Census II, método de descomposición, 117, 118, 350-351 CIS/Index to CISllndex to Publications 01 the United States Government, 65 Government, of Cochrane, 399-402 399-402 Coeficiente autocorrelación, 100-114, 122, 126, 432 Coeflciente de autocorrelación, 100-114, 122, 125, 126, 432 Coeficiente correlación, 43-47, 216, 220 Coeficiente de correlación, 43-47, 48, 50, 216, 220 con autocorrelación, 100-112 con autocorrelación, fónnula para el, 45, 50 fOrmula para el, 45, y el coeficiente de determinaciOn, 216 Y el coeficiente de determinación, y Ia relación negativa, 44 y la relación negativa, de determinación, 13-216 Coeficiente de determinación, 2213-216 fónnula para el, 45, 48 fómiula para el, 45, vs. coeficiente de correlación, 216 vs. coeficiente de correlación, Coeficiente de regresión, Coeficiente de regresión, 223, 260-61, 291, 396 Coeficientes de regresiOn, 223, 260-26 1, 291, 396 de regresión, 260-261, 3% Coeficientes netos de regresión, 260-26 1, 291 netos de regresión, 260-261, 291 Colinealidad, 256, 272-272, 291 272-272, 291 Colinealidad, Combinación de pronOsticos, 524, 525 525 CombinaciOn de pronósticos, Componente aleatorio (en análisis de series de tiempo), 99-100, 125, tiempo), 99-100, 125, Componente aleatorio (en análisis 320, 353 353 Componente ciclico, definición de, 99, 117, 125, 319 Componente cíclico, definición de, 99, 117, 125, 319 Componente estacional o series, 111-114, 116-117, 125 Componente estacional o series, 99, 111-114, 116-117, 125 atenuación para, 172-176 atenuación exponencial ajustada para, 172-176 en en el análisis de series de tiempo, 320, 338-347, 342-346 análisis tiempo, 338-347, y Ia autoconrelación, 11-114 la autocorrelación, 11-114 la regresión, 284-87, 291 y Ia regresiOn, 284-87, 291 y Ia técnica de Box-Jenkins, 465-478 Y la Box-Jenkins, los métodos no fonnales, 150 y los métodos no formales, 150 Compuserve, Inc., 66 Compuserve, Ine., Compustat, 66 Compustat, Computadoras: tecnológico, 177,478,521-541 como cambio tecnológico, 118, 177, 478, 521-541 y Ia organización de Ia función de pronóstico, 3 Y la organi7.ación de la función pronóstico, 3 y Ia relevancia de los datos, 3 la relevancia datos, 3 Computer Software Consultants, lnc., 10 Computer Software Consultants, Inc., 10 ConexiOn compatible, Conexión compatible, 526 61 Confiabilidad (de los datos), 61 Confiabilidad (de Constante de atenuación,159-160 Constante atenuación,159-16O Constmcción de modelos, 6-7 Construcción Consultores, pronóstico mediante, 542 542 Consultores, pronóstico Contingencia, tabla de pmeba de, véase Pruebas de Ji-cuadrada Contingencia, tabla de prueba de, Control de produccibn, 48 producción, Control Correlación serial de primer orden, 377-378 CorrelaciOn serial de primer orden, estimación de para, 398-400 estimacibn de para, Correlación serial, 277, 400-401 277,400-401 Conelación prueba de Durbin-Watson para, 380-3 83 Durbin-Watson para, 380-383 prueba soluciones para, 383-384, 387-392, 392-393, 393-396 soluciones para, 383-384, 387-392, 392-393, 393-396 y los datos de series de tiempo, 377-400 tiempo, 377-400 y los datos de series Correlación, 89, 203, 318. Véase también Regresión múltiple, ConelaciOn, 42, 89, 203, 318. Véase también Regresión mOltiple, Análisis de regresiOn, Análisis de series de tiempo Anñlisis de regresión, Análisis de series aplicación en la administración, 48, 230 aplicaciOn en Ia administraciOn, 48, coeficiente de, 43-47, 48, 204, 398 coeficiente de, 43-47, 48, 204, fOrmula para el, 45, fónnu!a para el, 45, 50 dispersión de, 205 diagramas de dispersiOn de, 40-42, 205 vs. causalidad, 46 vs. causalidad, autocorrelación, 98, 100-114, 122-124,125,377-400. Véase y autocorrelaciOn, 98,100-114, 122-124, 125, 377-400. Véase también AutocorrelaciOn también Autocorrelación 600 Correlogramas, 103, 125 Correlogramas, 103, Costos de Ia pronóstico, 541 -542 la pronóstico, 541-542 Costos Countv and City Data Book, 65 County and City Book, Creatil'e ComplIting, "Choosing and Using Business Forecasting Business Forecasting Creative Computing, "Choosing and Software", 10, IOn IOn Software", Cuestionario Cuestionario por correo, 67 Cuestionario por correo, 69 Cuestionano por correo, 69 crecimiento, Gompcrtz (logística), 116, 118, 329, 330, 522 Curvas de crecimiento, Gompertz (logistica), 116, 118, 329, 330, 522 Econometrics, 9 Chase Econometrics, 9 Daisy,9 Daisy, 9 Loma, 65n Daniells, Lorna, 65n numéricos), Datos cualitativos (no numéricos), 4 pruebas de Ji-cuadrada para, pruebas de Ji-cuadrada para, 534 técnicas de pronóstico en, 97, 117, 520-527 117, 520-527 técnicas de pronóstico en, variables de prueba para, 266 variables de prueba para, Datos del Gobiemo de Estados Unidos de America, 63, 64, 65, 73, 74 Dabs del Gobierno de Estados Unidos de América, 63, 64, 65, 73, 74 Datos estacionales ajustados, 346-349, 353 353 Datos estacionales ajustados, Datos no numCricos, véase 1)abos cualitativos numéricos, Datos cualitativos Datos Datos priniarios, 67-73-75 Dabs primarios, encuesta, 67-69 encuesta, Datos propios, 66-68 I)atos Datos seclmdarios, 53, 64-67, 69-73 69-73 Datos secundarios. Datos, fuentes de: Dabs, fuentes de: bases de datos computarizadas, 64 bases de datos computarizada, comerciales, 66 comerciales, Iuientes extcrnas, fuentes extcrnas, 64-66 primarios, 53-54, 63, 74, 65 primarios, 53-54, 63, 74, propios, 65-66 propios, publicaciones, 64, 65, 66 publicaciones, 64, 65, secundarios, 65,66-69, 71-75 secundarios, 65, 66-69, 71-75 sistemas como MIS, 542 sistemas como MIS, tipos de, 62-63, 344-345 tipos de, 62-63, Datos, recolección de, 6, 61. 73, 540, 563 Datos, recolección de, 6, 61, 73, 540, 563 Datos, reducción o condensación de, 6, 540 540 Dabs, reducción o condensación l)atos: Datos· acumulación de, 6, 61, 73, 540, 563 acuniulación de, 6, 61, 73, 540, 563 aplicabilidad, 118 aplicabilidad. 118 61 consistencia, 61 criterios de utilidad, 611 611 criberios de encucsta, 67-69. J'éase también Encuestas Encuestas encuesta, 67-69. Véase integridad, 73, 118 integridad, 73, 118 oportunidad. 61 oportlmidad, 61 prccisión, 61 precision, relevancia. 61, relevancia, 61, 73 series de tienipo, fuentes de, 62, 318 318 series de tiempo, fuentes validez, 73 73 9 Decision Support Modeling, 9 Decisiones, teoria de, 530-533 530-533 Decisiones, teoria Dellación de precios, 321-322, 353 353 DeflaciOn de precios, Demanda diaria de permisos para pesca de trucha (caso de estudio), permisos para pesca de trucha (caso de estudio), Demanda diana 495-507 Demograt1a, datos sobre, 64-65 64-65 Dcrnogralia. datos Derivación de correlación, 559 DcnivaciOn dc correlaciOn, Derivación de minirnos cuadrados, 560 l)enivación de minimos cuadrados, Derivaciones: correlación, 559 correlaciOn, minimos cuadrados, 560 minimos cuadrados. Descomposición en el análisis (IC series de tiempo, 98, 99, 319-320, 99, 319-320, Descomposición en análisis de series de ~9 . 349 clásica, 99, 117, 118 clásica. 99, 1 17, 118 método Census 11 para, 117, 118, 350-351 II para, 118, 350-351 mctodo Desestacionalización de 176, 346-347 Desestacionalización de datos, 176, 346-347 Desfase, indicadores de, 335 335 Desfase, variables, 392. Véase también Modelos autorregresivos Desfase, variables, 392. Véase ton,bién Modelos auborregresivos Desviación estándar, 23 Desviac iOn estándar, Desviación media absoluta (MAD), 120, 122, 126 Desviación media absoluta (MAD), 120, 122, 126 Desviaciones, 263n Desviaciones, Diab'fama de árbol, 530-531 Diagrama rhol, 530-531 Indice Diagramas de dispersión, 39-43, 48 Diagramas de dispersion, 39-43, regresión en, 180-185 linea de regresión en, 180-185 Diferenciación (primera diferencia), 108-110, 384, 396-398, 402, 439 Diferenciación (primera diferencia), 108-110, 384, 396-398, 402, 22-28,47 Distribución binomial, 22-2 8, 47 aplicación en Ia administraciOn, 47 en la administración, fórmula fóimula para, 22, 49 reglas para, 27 reglas para, términos individuales de, 568-570 tCrminos individuales de, 568-570 Distribución continua, 27 Distribución Distribución de Poisson, 39,48 Poisson, 39,48 Distribución Distribución normal, 28, 47, 209, 571 571 Distribución normal, 28, 47, tabla de areas para, 571 áreas para, 571 tabla y Ia prueba de Ji-cuadrada, 39 la Ji-cuadrada, Distribuciones de probabilidad, 26-39 26-39 Distribuciones Distribuciones: binomial, 27-28,47,568-570 binomial, 27-28, 47, 568-570 de Poisson, 39, 48 de Poisson, de probabilidad, 2 1-30 probabilidad, 21-30 muestral, 30 muestral, normal, 28,47,571 nornlal, 28, 47, 571 t, 572 t, 30, 572 Dólares constantes, 320. Véase también Poder de compra y Dellación Dólarcs constanbes, 320. Véase también Poder de compra y Deflación de dc precios Dow Jones News Retrieval Service, 66 Retrieval Sen'ice, Dow Draper and Smith, 279, 279n Smith, 279n Draper Dun and Bradstrect, Inc., 66 Bradstreet, Inc., Dun Durbin- Watson, prueba de, 380-383, 401, 578-579 Durhin-Wabson, prueha de, 380-383, Easy Forecaster Plus 1 o 11, 9 Forecaster Plus I o 11, Economelric Models and Economic Forecasts, 398 Econometric Models and Economic Forecasts, 398 Economelrics Software, Inc., 9 9 Econometrics Software, Econometrics Toolkit (ET), 9 Econometrics Toolkit (El'), };conomic Report 01 the President, 65 Economic Report oft/ic President, Economics Sollware Program (ESP), 9 Economics Software Program (ESP), EcuaciOn de rcgrcsión, 205, Ecuación de regresión, 205, 206, 232 Ecuacioncs norniales, 259 Ecuaciones normales, 259 Ejemplos de cOmputo: Ejeniplos dc cómputo: para catcular aubocorrelaciones y desarrollar correlogramas, 103, 104, para calcular aulocorrelaciones y dcsarrollar 103, 104, 107,108, 114, 123, 124, 132, 143 107, 108, 114,123,124,132,143 panl diferencias, para calcular diferencias, 109, 143, 397-398 índices estacionales, 371-373 para calcular indices estacionales, 371-373 para coeficiente 246-49, 250-51 para calcular un coeficiente de correlación, 242-43, 246-49, 250-51 desviación estándar, 59-60 para dcsviación estándar, 59-60 determinar la estacionalidad, 114-145 para determinar Ia esbacionalidad, 114-145 el análisis de regresión con estaeionalidad, 286-287 para el análisis de regresión con estacionalidad, 286-2 87 para análisis de regresión, 224, 240, 242-243, 246-249, 250-252, para el análisis de regresión, 224, 240, 242-243, 246-249, 250-252, 252-253 25 2-25 3 para el series de tiempo, 326-331 para cI análisis de series de tiempo, 326-331 para el procedimiento 314-315 para cI procedimiento de regresión por pasos, 314-315 indices ciclicos, 331 para encontrar indices ciclicos, 331 generar números aleatorios, para generar nOmeros aleaborios, 95-96 para imprimir la relación X-Y, 227, 228, para impnmir Ia relacion X-Y, 227, 228, 230 dispersión, 267 imprimir un para impnimir 1m diagrama de dispersion, 267 la atenuación exponencial doble, 196-199, 199-202 para Ia abcnuaciOn exponencial doble, 196-199, 199-202 la 58- 59 para Ia media, 58-59 para la regresión de datos de series tiempo, 326, 385-386, para Ia regresión de datos de series de tienipo, 326, 376, 385-386, 387 la varianza, 58-59 para Ia varianza, 58-59 para locali7~r 417 -421 para localizar una variable perdida, 385-386, 417-421 para mostrar colinealidad, 274 mostrar colinealidad, 274 para residuales, 167, para obtener residuales, 167, 306 regresión multiple, 265, 269,301,302,308-312,312-314para regresiOn múltiple, 265, 269, 301, 302, 308-3 12, 312-314315-317 3 15-317 para translonmar variables, 227 transfOlmar variables, Véase también ForeCaic, Forecast Plus, Lotus, Minitab, SAS, Véase también ForeCalc, Foreeast Plus, Lotus, Minitab, SAS, TSP Spreadsheet Forecaster, TSP el modelo autorregresivo, 394-421-424 y el modclo autorrcgresivo, 394-421-424 la administración de datos, 89-93 y Ia administración de dabos, 89-93 la correlación serial, 385-386, 387. 388-390, 392, y Ia correlaciOn serial, 385-386, 387, 388-390, 392, 428-430 - Indice y Ia descomposición Census XII, 366-367, 367-371 y la descomposición Census XII, 366-367, 367-371 Y las técnicas Box-Jenkins, 444, 445-453, 456-458, 460-462, Box-Jenkins, y 464-477 de conveniencia, 72 Ejemplos de conveniencia, 72 Mercado de Valores (caso de estudio), 299-302 El Mercado de Valores (caso de cstudio), 299-302 Employment and Employment and Earnings, 65 e indicadores empresariales, 332-335 Empresarial, ciclo e indicadores empresariales, 332-335 Encuestas: datos para, 67-69 datos disefto del diseño del muestreo para, 68-69 tamaño de Lamuestra para, 69 tamafio de la muestra para, iterativo, 384, 398-400, 431 Enfoque iterativo, 384, 398-400, 431 Entra basura-sale basura (GIGO), 61 basura-sale basura (GIGO), 61 personal, 68 Entrevista personal, 68 telefónica, 68 Entrevista telefónica, 68 pronóstico (error estándar del pronóstico), 210, 232. Véase Error del pronóstico (error estándar del pronóstico), 210, 232. Véase la distribución muestral, Error estándar de Ia distnbución muestral, 30 la estimación, 208-209, 232, 263-269, 291 Error estándar de Ia estimación, 208-209, 232, 263-269, 291 en Ia regrcsión multiple, 263-264, 291 en la regresión múltiple, 263-264, 291 coeficiente regresión, 223 Error estándar del coeficiente de regresión, 223 pronóstico, 209 Error estándar del pronóstico, 209 medio cuadrado (MSE), 120, 122, 126, 163, 167, 171, 175 Error medlo cuadrado (MSE), 120, 122, 126, 163, 167, 171, 175 términos de, 119-122 Error, términos de, 119-122 en Ia prueba de Durhin-Watson, 380-381 Durbin-Watson, 380-381 en la en Ia técoica Box-Jenkins, 442 en la técnica Box-Jcnkins, 442 Véase twnbien Residuales Véase lamhién Residualcs pronóstico. véase Errores en el pronóstico Errores de pronóstico. véasc Errores en el pronóstico pronóstico, 7,119-122, 126, 147-149, 152,207,210, Errores en el pronóstico, 7, 119-122, 126, 147-149, 152, 207, 210, 374, 374, 378 modelo la regresión), error de especificación en el modelo (en Ia regresión), 384-387 error de especificación medición de, 119-122 medición de, 119-122 161-163,538 rastreo rastrco de, 161-163, 538 suposición de independencia en Ia regresión, 211 en la regresión, 211 suposición de tipos de, 33 tipos de, la fónTIula para el error de pronóstico (residual), 119, 126 y Ia formula para el error de pronOstico (residual), 119, 126 Progrdl1l), ESP (Economics Software Program), 9 Estadistica Ji-cuadrada (Prucba dc la Bondad del Ajustc), 37-39, Estadistica de Ji-cuadrada (I'rucha de Ia Bondad del Ajuste), 37-39, 48, 534 48,534 prueba Box-Pierce, 441 como prueha Box-Pierce, 441 fónTIula para, 37-49 formula para, y los grados de libertad, 38-49 libertad, 38-49 descriptiva, 22-25, 47, 48 Estadistica descriptiva, 22-25, 47, 48 aplicación en Ia adminsitraciOn, 22, 47 aplicación en la adminsilración, 22, 47 Estadistica descriptiva. 22-25, 47-48 descriptiva, 22-25, 47-48 Estadísticas de ingreso, Estadisticas dc ingrcso, 65 Estimación, 31-33, 47 31-33, 47 factibilidad mercado (caso de estudio), 82-89 Estudio de factihitidad de mercado (caso de estudio), 82-89 segmentación de mercado, de regresión en, Estudios de segmentaciOn de niercado, análisis de regresión en, 289-290 Choice, 9 Expert Choice, 9 Express Easycast, 9 9 540 Extrapolación de modelos, 6,7, 62, 540 ExtrapolaciOn de modelos, 6,7. estadística prueba, 222, 233, 281 F, estadistica y prueba, 222, 233, 281 tabla de distribuciOn para, 576-577 tabla de distribución para, 576-577 Federal Reserve Bulletin, 62, 65, 318 Federal Reserve Bulletin, 62, 65. 31 8 Filtración adaptativa, 118, 479 adaptativa, Flemming Software, 10 Flemming Software, Calc, lO Fore CaIc, 10 computadora para la atenuación exponencial, 199-202 ejemplo de computadora para Ia atcnuación exponencial, 199-202 Forecast Master, 9 9 Forecast Plus, 9 Forecast Plus, de datos, 1-95 administración de datos, 991-95 doble, 196-199 atenuación exponencial doble, 196-199 correlogramas, 136-139 autocorrelaciones y correlogranias, 136-139 Jenkins, 507-511 Box Jenkins, 507-51 1 Ccnsus X-II, 366-367 descomposición Census X- 11, 366-367 computadora para: ejemplos de computadora para: introducción a, introducciOn a, 13-14 regresión múltiple, 308-312 regresión mñltiple, regresión, 246-249 regresión, Forecast Pro, 9 Forecast Pro, Forecast!, 10 Forecast!, 10 Forecast/DSS, 10 ForecastfDSS, Forecasler, The, 10 Forecaster, The, 10 Forecasting Methods and Applications, 351 Forecasling Melhods and Applicalions, 351 Forecasling Studies. 65 Forecasting Sludies, Forlune Directory, The, 66 Fortune Direclory, The, Framework, 10 Framework, 10 Futurcast: The Total Forecasting System, 9 Futurcast: The Total Forecasting System, Futurion Associates, Inc., 9 Futurion Associates, 601 Generación de escenarios, 523-524 Generación de Gobierno de los Estados Unidos de América, datos del, 63, 64, 65, 73, Gobierno de los Estados Unidos de America, datos del, 63, 64, 65, 74 Golden Gardens Restaurant (caso de estudio), 545 Golden Gardens Restaurant (caso estudio), Gompertz, curvas de crecimiento de, 116, 118, 329-330, 522 1l 8, 329-330, 522 Gompertz, curvas de crecimiento de, Grado de relación, 43 Grado de relación, Grados de libertad, 24-25, 48 Grados de libertad, 24-25, Y los valores t, y los 'alores 1, GráJicas de proporción, 562-566 proporción, 562-566 Grálicas Gráficas semilogaritmicas, 562-566 Gráficas semilogaritmicas, Graph N' Calc, 9 Graph Cale, Cuide lo Consumer Markets, 66 Guide to Consumer Markets, Gwilym Jenkins & Partners, Ltd., 9 Gwilym Jenkins & Partners, Ltd., Handbook of Labor Statistics, 65 Handbook of Labor Statistics, 65 Heteroscedasticidad, 271-272, 291, 374-377 374-377 Heteroscedasticidad, 271-272, Hewlett Packard, 9 Hewlett Packard, Hipótesis nula, 33 Hipótesis nula, Indicadores ciclicos, 332-335 Indicadores ciclicos, problemas con, 335 problemas Indicadores coincidentes, 335 335 Indicadores Indicadores económicos (empresariales), 346, 353 Indicadores económicos (empresariales), 117, 332-335, 346, 353 Indicadores empresariales, 117, 332-335, 346, 353. Véa.se ta;nbién Indicadores empresariales, 117,332-335, 346, 353. Véase también Indicadores ciclicos e Indicadores econOmicos e Indicadores económicos Indicadores Indicadores estadísticos, 333-335 Indicadores estadisticos, Indicadores principales, 118,334 Indicadores principales, Índice de actividad empresarial para el Condado de Spokane (caso de (caso de Indice dc actividad empresarial para el estudio), 409-415 estudio), Índices de precios, en el análisis de series de tiempo, 320-322 Indices de precios, en análisis de series de tiempo, 320-322 Inferencia estadística, 21 Inferencia estadistica, 21 Inflacion y el análisis de series de tiempo, 320-322 de tiempo, 320-322 Inflacion y el análisis Institute 01' Business Forecasting, 9 Institute of Business Forecasting, 9 lnlemational Journal ofForecasting, 2n, 5, 10,524, 524n International Journal ofForecasling, 2n, 5, 10, 524, 524n Intervalo de confianza (estimación del intervalo), 3 1-33, 48 del intervalo), 31-33, 48 Intcrvalo de conlianza con autocorrelación, 379 con autocorrclación, el modelo Box Jenkins, 439 en el modelo Box Jenkins, 439 en la regresión, 211, 212, 232 en Ia regresión, 211, 212, fómmla para una proporción en, 31, 49 proporción en, 31, 49 fómula para Intervalos, estimación de 3 1-33, 48, 209-213 Intervalos, estimación de 31-33, 48, 209-213 Intervalos, pronOstico de, 209-213 Intervalos, pronóstico de, Inlex Solutions, Inc., 10 Intex Solutions, Inc., 10 Investigación de mercado, 72-73, 74. Véase también Encuestas, lnvestigación de mercado, 72-73, 74. Véase lambién pruehas dc mercado en pruehas dc Investigación exploratoria, 70 lnvestigación exploratoria, of Forecasling, 8n, IOn Journal of Forecasting, 8n, IOn "éase Juicio intuitivo, véase Juicio personal personales intuitivos). Véase Pronóstico Juicios personales (subjetivos, intuitivos). Véase Pronóstico empresarial, aspectos de empresarial, aspectos de juicio en K., IOn Kcating, K., IOn Kinnear, T.e. y J.R. Taylor, 66n Kinnear, T.C. y J.R. Taylor, elección (caso 408-409 compañía de La cornpaflia de su elecciOn (caso de estudio), 408-409 Levcnbach Associales, 9, lO Levenbach Associates, 9, 10 602 Línea de regresión, 205, 232 Linea regresión, Lisa 7/7 10 Lisa 717 Office System, 10 Lotus 1-2-3, 10, 14 14 Lotus 1-2-3, Lotus, ejemplos de computadora para: computadora para: Lotus, autocorrelación, 139-141 autocorrelación, 139-141 introducción, 14-16, 96-97 introducción, Lotus-FORMAN, 10 Lotus-FORMAN, modelo autorregresivo, 421-424 autorregresivo, regresión multiple, 312-3 14 múltiple, 312-314 Lydia E. Pinkham Medicine Company (caso de estudio), 491-494, Lydia E. 552-555 55 2-55 5 Macropredicción, 4-5 Mahmoud, al., Mahmoud, et al., 8,9 Mahoud, E., Mahoud, E., 524n Malcridakis, Spyros, 2n, 9, 351, 477, 521n 477, 521n Makridakis, Spyros, 2n, Management Systems, Management Decision Systems, Inc., 9 Marlcet 66 Market Facts, Inc., 66 Market Research Corporation of America, 66 Market Research Corporation of America, Matriz de correlación, 256-2 57 256-257 Matriz McGee, V.E., 351 McGee, V.E., Media (estadistica), 22, 47, 49, 151 Media (estadistica), 22, 47, 49,151 Medición numérica, véase Técnicas de pronóstico cuantitativas Medición numérica, véase Técnicas de pronóstico cuantitativas 2000, 527, 543 Megatrends 2000, 527, 543 Megatrends, 527, 543 Megatrends, 527, 543 Mentiras muestras Mentiras y muestras de juicio, 72 Mercados de prueba, 72-73 72-73 Mercados Método de atenuación lineal exponencial dos parámetros, Método de Holt de atenuación lineal exponencial de dos parámetros, 116,168-172,179 116, 168-172, 179 Método de los minimos cuadrados, 205-207, 232, 324-327, 402, 205·207,232, 324-327,402, Método de Véase también Enfoque iterativo Véase también Enfoque iterativo con correlación serial, 393-396 con correlación serial, con el procedimiento Orcutt, 399-400 con ci procedimiento de Cochrane y Orcutt, 399-400 en el análisis de regresión, 205-207 205-207 en en el análisis de series de tiempo, 324-327, 393-396 series de tiempo, 324-327, 393-396 en en Ia regresión múltiple, 258 en la regresión multiple, fórmula para el, formula para el, 206 Método de minimos cuadrados no lineales, 436-437 Método de minimos cuadrados Método Delphi y Rand Corporation, 523 523 Método Delphi Método Delphi, 523 Delphi, Método residual, 330-33 2 residual, 330-332 atenuación exponencial, 115, 116, 118, 146, 158-176, Métodos de atenuaciOn exponencial, 115, 116, 118, 146, 158-176, Métodos 177, 479-535 177, 118, 168-172 ajuste por tendencia (Método de Holt), 118, 168-172 tendencia (Método ajuste ajuste por tendencia y \'anación estacional (Modelo de Winter), variación estacional (Modelo de Winter), ajuste pot 172- 176 172-176 aplicación de los, 115, 116, 118, 177 aplicación de los, 115, 116, 118, aplicación en Ia adminstración, 177 aplicación en la adminstración, 163-168 atenuación exponencial doble (Método de Brown), 163-168 atenuaciOn exponencial doble (Método de fórmulas 158, 178 formulas para, 158, 178 para pronóstico de corto plazo, 118, 177, 479 118, 177, 479 para pronóstico y rastreo, 161-163 Y el rastreo, 16 1-163 Métodos de atenuación, véase Métodos de atenuaciOn exponencial atenuación, véase Métodos de atenuación exponencial Métodos pronósticos, 22,47,115, 146, 151-158 176, Métodos de promedios de pronósticos, 22, 47, 115, 146, 151-158 176, Métodos de promedios 177 Métodos no formales, 115, 118, 146, 147-150, 177, 178 118, 146, 147-150, 177, 178 Métodos no formales, aplicación en Ia administraciOn, 177 la administración, e indicadores estadisticos, 333-334 333-334 350-351 método Census II, por, 350-351 método Census I1, National Bureau of Economics Research (NBER), 333-334, 350 National Bureau (NBER), 333-334, para seleccionar la ecuación de regresión, 274-284 Métodos para seleccionar la ecuación de regresiOn, 274-284 regresión por pasos, 2 79-284 pasos, 279-284 todas las regresiones posibles, 277-279 todas Micranal, 9 Micranal, Micro-BJ,9 Micro-BJ, 9 Micro-Macro, entomo, 4 Micro-Macro, entorno, véase Computadoras Microcomputadoras, véase Computadoras Ming Telecomputing, Inc., 10 Ming Telecomputing, Inc., ID Mínimos ciradrados generalizados, 393-396 Minimos cuadrados generalizados, Indica Indice Mínimos cuadrados, método, véase Método de minimos cuadrados Minimos cuadrados, método, véase Método mínimos Minitab, 8, 9 Minitab, 8, Minitab, ejemplos de computadora para: Minitab, ejemplos computadora para: regresión con estacionalidad, análisis de regresiOn con estacionalidad, 286-287 análisis de regresiOn, 242-243, 250-252 regresión, 242-243, 326, 331, 385-87, 388-90 análisis de series de tiempo, 326, 331, 385-87, 388-90 análisis análisis residual, 167 167 autocorrelación, cálculo y desarrollo de correlogramas, 104, autocorrelación, cilculo desarrollo de correlogramas, 104, 108 141-143, 197, 108 141-143, correlación serial, 385-387, 388-390 388·390 desviación esténdar, la, 38-59 desviaciOn estándar, cálculo de Ia, 38-59 diferenciación de datos, 143, diferenciación de datos, 109, 143, 397-398 112 estacionalidad de muestreo, 112 generación de variable perdida, 385-386, generación de variable perdida, 385-386, 387 índice localizar, 331 indice ciclico, para localizar, 331 de, 371-373 indices estacionales, cálculo de, 371-373 introducción a, 16, 18 18 introducciOn a, media, cálculo de Ia, 58-59 la, media, números aleatorios, generaciOn de, 9 5-96 generación 95-96 nOmeros para Ia regresión por pasos, 314-315 pam la 445-452, 456-458, 472-477, procedimiento de Box-Jenkins, 445-452, 456-458, 472-477, 511-514 regresión multiple, 269 regresión múltiple, relación X-Y, 227, 228-230 relaciOn X-Y, 227, 227 transformación de variables, 227 varianza, cálculo de Ia, 58-59 la, 58-59 varianza, Mitchell, Wesley, 333 333 Modelo aditivo de series de tiempo, 284-87 aditivo tiempo, 284·87 Modelo multiplicativo, 284, 349, 353 Modelo multiplicativo, 284, 349, 431,432, Modelos autorregresivos de promedios mOviles (ARIMA), 431, 432, promedios móviles 435, 439-478 436-437 Modelos de autorregresión (AR), 384, 392-393, 401, 433, 436-437 Modelos de autorregresión (AR), de, 439-465 aplicación de, 43 9-465 aplicación en Ia 479 aplicaciOn en la administración, 479 de Box-Jenkins, 436-437 como técnica de Box-Jenkins, 436-437 Modelos de promedio móvil (MA), 118, 152-158, 176, 177, 178,434, Modelos de promedio móvil (MA), 118, 152-158, 176, 177, 178, 434, 438 en la administración, 177 aplicación en Ia administraciOn, 177 Modelos econométricos, 117, 118, 187-288 Modelos econométricos, 117, Monthly Labor Review, 62, 318 Review, 62, Monthly Moody's Investors Service, 68 Investors Service, Moore, Geoffrey H., 334n 336 Moore, Geoffrey Mortgenthau, Henry, 333 333 Mortgenthau, Muestra, 22,23 Muestra, aleatoria, 30, 70-72 aleatona, 30, 70-72 bloque, 771·72 1-72 correlación de, 44-45 coeficiente de correlación de, 44-45 conveniencia (cuota), 72 72 de, desviación estándar de, 23, 49 71 estratificada, 71 media media de, 22, 23, 49 mercados mercados de prueba, 72-73 aleatoria, 72 no aleatona, 72 varianza 24, 49 vananza de, 24, 49 la encuestas), 70 Muestra, tamafto de Ia (en encuestas), 70 tamaño Muestrales, distribuciones, 30, 48 48 muestreo 30 error de muestreo de, 30 72 Muestras Muestras a juicio, 72 aleatorias, 72 Muestras no aleatorias, 72 Muestreo aleatorio simple, 71-72 simple, 71-72 70-72, 75 Muestreo aleatorio, 70-72, 75 71-72 Muestreo de grupos, 71-72 estratificado, 71 Muestreo estratificado, 71 por cuotas, 72 Muestreo par cuotas, 72 sistemático, 71 Muestreo sistemático, 71 Muestreo, diseño para encuesta, 68-69 Muestreo, encuesta, lO Multifit, 10 Multiple Multiple Time Series Program (MTS), 9 131-134 Murphy Brothers Furniture (caso de estudio), 131-134 Indica Indice Naisbitt, John, 527, 543 527, 543 and Regional Economic Projection Series, The, 66 National and Regional Economic Projection Series, The, 66 National Family Opinion, 66 Wasserrnan, Netter and Wasserman, 259 News Retrival Service, 66 Retrival Service, Nielsen, A.C., Company, 66 Nielsen, AC., Company, 66 Nivel de significancia, 34 significancia, NPD Research, Inc., 66 NPD Research, Nuametrics, 9 Nuametncs, Número indice, para la variacion estacional, 339-342, 353 variación estacional, 339-342, 353 Nümero índice, Números aleatorios, 70-575 70-575 Nümeros Orcutt, 399-402 Uníversíty Press, 9 Oxford University Press, 9 Paquetes para pronóstico, 8-10 Paquetes de cómputo pam pronóstico, 8-10 Parente, 523 Parente, Frederick J., 523 pe Magazine, 10, iOn IOn PC Magazine, Pendiente, la relación líneal, 42-43 Pendiente, en Ia relación lineal, 42-43 398 Pindyck, R.S., 398 23 Población (estadistica), 22, 23 coeficiente de correlación 50 coeficiente de correiación de, 44, 50 de, 23, 49 desviación estándar de, 23, 49 media de, media de, 22, 23, 49 23 parámetros de, 23 varianza de, 24, 49 varianza compra, 321 Poder de compra, 321 Políticas pronóstico, 11 Politicas de pronóstico, 11 Porcentaje medio de error (MPE), 120-121, 122, 126, 172 120-121, 122, 126, 172 Porcentaje medio de Porcentaje medio de error absoluto (MAPE) 120, 122, 126, 171 Porcentaje medio de crror 120,122,126,171 Predicasts, Inc., 66 Predicasts, Inc., Primera diferencia, 108-110,384, 396-398, 402, 439 Primera diferencia, 108-110,384, 396-398, 402, 439 Pro· Cast, 9 Pro* Cast, Procedimiento de regresión por pasos, 279-284 279-284 Procedimiento de regresión Programas de cómputo, Programas de cómputo, 8-10 Promedio líneal móvil, 116 Promedio lineal móvil, Promedio móvil doble, 154-158 Promedio móvil doble, fórmula para, 156-178 formula pam, 156-178 Promedio mOvil simple, 115, 118, 176 176 Promcdio móvil simple, 115, Promedio simple, 115, 15 1-152, 177, 178 115, 151-152, 178 véase Media Promedio, véase Media Pronóstico 431, 477, 479, 534-536 Pronóstico a corto plazo. 45,62. 117, 1 iS, 318, 431, 477, 479, 534-536 plazo, 45,62, 117, IIR, Pronóstico dcmográfico, importancia, 64-65 PronOstico demográfico, importancia, 64-65 empresarial, Pronóstico empresarial, 1-7, 9 117, 118, 318, 431, 477, 479, 534-536 a corto plazo, 4, 5, 62, 117, 118, 318, 431, 477, 479, 534-536 plazo, a largo plazo, 4,5,62,117,118,318,522,527,534,536 plazo, 4, 5, 62, 117, 118, 318, 522, 527, 534, 536 aceptación en Ia administraciOn de la, 5-6, 11, 542 accptación la administración de Ia, 11, 542 la, 533 administración de Ia, 7-8, 533 administración 11,46-47, 73-74, aplicaciones a Ia administración del, 3, 7-8, 11, 46-47, 73-74, aplicaciones la administración del, 3, 124-125, 176-177, 239-231, 289-291, 351-353, 400-401, 124-125,176-177,239-231,289-291,351-353,400-401, 478-480, 526-527, 533-536, 542 533-536, 542 478-480, aspectos de juicio de la, 5, 6-7, 15, 62-63, 70-72, 97, 150, 284, aspectos de juicio de la, 2, 4, 5, 6-7, 15, 62-63, 70-72, 97, 150, 284, 319, 478-479, 520-540 520-540 319, combinación del, 524-525 combinación del, conceptos básicos del, 6, 97-98. Véase tanzbién Conceptos especificos 6, 97-98. Véase también Conceptos específicos conceptos básicos costo-beneficio del, 6, 11, 536, 542 costo-beneficio del, 6, datos en ci, 61-75, 97, 318, 478 datos en el, 61-75,97,318,478 en las ventas al menudeo, 352 352 en las medición la, 7,119-22,1266,147-49,152,207,210,74, error de medición en Ia, 7, 119-22, 1266, 147-49, 152, 207, 210, 74, 378, Véase también Residuales 378, Véase futuro del, 543 543 futuro generación de escenarios en el, 455 generación de escenarios en historia del, I1 historia intermedio, 118, 534, 535 intermedio, 118, 534, juicios personaics en ci. Véase Pronóstico empresarial, aspectos de personales el. Véase Pronóstico aspectos juicio dcl del paquetes el, lista de paquctes de cómputo para ci, 8-10 5 macropronósticos, macropronósticos, 4, 5 el, 523 método Delphi en ci, 523 603 atenuación para 115, 166,118, 146, 158-176,479,535. métodos de atenuación pam el, 115, 166,118, 146, 158-176,479, 535. Véase también Métodos exponenciales de Véase también Métodos exponenciales de atenuación promedio para el, 22,47,115,146, 151-158, 176-177 métodos de promedio para el, 22, 47, 115, 146, 151-158, 176-177 146, 147-150, 178 métodos no formales para la, 62, 115, 118, 146, 147-150, 177, 178 formales para Ia, 62, micropronósticos, 5 micropronOsticos, 4, 5 la, 536-539 monitoreo de Ia, 536-539 la, 73-74,176-177,289,290-291,318,351-353, necesidad de Ia, 2-3, 73-74, 176-177, 289, 290-291, 318, 35 1-353, 400-401,478-480,533 400-401, 478-480, 533 el, 6-7, 539-540 pasos en ci, 6-7, 539-540 política del, 11 politica del, 11 procedimiento de la crecimiento el, 116, 118, 329-330, procedimicnto de Ia curva de crecimiento en el, 116, 118, 329-330, 522 proceso de, 533-539 533-539 pronósticos macroeconOmicos, 5 pronOsticos macroeconómicos, 4, 5 para el, 11 reglas para ci, 11 del, 540-541 responsabilidad del, 540-541 la, 118, 535 resumen de modelos de Ia, 118, 535 selección evaluación el, 5-6, 48-49, 97-98, selección y cvaluación de métodos para el, 5-6, 48-49, 97-98, 114-118,122,146-147,151,154,158,163,176,177,230-231, 114-118, 122, 146-147, 151, 154,158,163,176, 177, 230-231, 290-291, 318, 400-401, 477-478, 289, 290-291, 318, 400-401, 477-478, 479-480, 521-522, 533-539 544 533-539 subjetiva, Véase Pronóstico empresarial, aspectos de juicio de subjetiva, Véase Pronóstico emprcsarial, aspectos de juicio tccnológica, 522. Véase Pronóstico empresarial, aspectos de tecnológica, 522. Véase Pronóstico empresarial, aspcctos de tiempo, 117, 146 juicio de y los horizontcs en el tiempo, 117, 146 de los horizontes determinísticas 98. Véase también Regresión múltiple, técnicas detcrministicas en, 98. Véase también Regresión mOltiple, tiempo, Regresión de series de tiempo Análisis Análisis de series de tiempo, Regresión de series de tiempo de, 4 tipos dc, 4 yel análisis de regresión, 203-233, 255-291, 318, 374-402,525. y ci análisis dc rcgrcsión, 203-233, 255-291, 318, 374-402, 525. Véase también Análisis de regrcsión regresión Véase ta,nbién Análisis y ci análisis de series dc ticmpo, 98, 100, 118, 119, 318-353, el de tiempo, 100, 118, 119, 318-353, 379-402 37 9-402 Y el sistema de información administrativo 542-543 y ci sistema dc informaciOn admimstrativo (MIS), 542-543 y Ia corrclación, 39-43-203, 318. Véase también CorrelaciOn Y la correlación, 318. Véase también Correlación disponibilidad dc computadoras y costos, 1, 3, 8, 61, 118, 177, y la disponibilidad de computadoras y costos, 1,3,8,61, 118, 177, 478, 521, 543 543 Y la regresión múltiple, 117, 118. 230, 255-291. Véase también y Ia rcgrcsión mOltiple, 117, 118. 230, 255-291. Véase también múltiple Regresión mOltiple redes neurales, y las rcdcs neuralcs, 525-527 variables dependientes vs. variables independicntcs, 203, 230-231, y variables depcndientes vs. variables independientes, 203, 230-231, 255, 318, 431. Véase también AutocorrclaciOn, Colinealidad, 431. Véase también Autocorrelación, Co1inea1idad, Correlación serial CorrclaciOn años 80, Pronóstico en los negocios en los aflos 80, 65 Pronóstico en los negocios en Pronóstico estacional (para una serie de tiempo), 349-350 Pronóstico estacional (para una serie Pronóstico macroeconómico, 4-5 PronOstico macroeconómico, 4-5 Pronóstico por juicio, véase Pronóstico empresarial, aspectos de juicio Pronóstico por juicio, véase Pronóstico cmprcsarial, aspectos de dc Pronóstico tecnológico, 522 PronOstico tccnológico, Pronóstico, 9 Pronóstico, métodos de, véase Pronóstico empresarial Pronóstico, métodos de, véase Pronóstico cmpresarial Pronóstico, véase también Pronóstico empresariai empresarial Pronóstico, Pronóstico: intervalo, 232 intcrvalo, 211-213, 232 punto, 209 punto, 209 selección de, 274-284 274-284 sclección variables de pronOstico, 255-256, 275 variables dc pronóstico, 255-256, 275 Véase también PronOstico empresanal Véase también Pronóstico empresarial e Inferencia estadistica y Ia colincalidad, 256 la colincalidad, Pronósticos a largo plazo, 4, 5, 62, 117, 118,318, 522, 534-436 Pronósticos a Iargo plazo, 4, 5, 62, 117, 118, 318, 522, 534-436 usodc, 14-16 uso de, 14-16 móvil, 339-342 Proporción con el método de promedio móvii, 339-342 ProporciOn con ci método dc (caso de Proyección de ingreso quinquenal para Downtown Radiology (caso de ProyecciOn de ingreso quinquenal pam estudio), 187-196 estudio), 187-196 (caso de Proyección de ingreso quinquenal para Downtown Radioloy (caso de ProyecciOn de ingrcso quinquenal pam estudio), 187 cstudio), 187 de hipótesis, 33-36, 47-48, 220-226 Prueba dc hipOtesis, 33-36,47-48, 220-226 pasos en, 33 pasos en, Prueba parcial, 279-280 Prucba F parcial, 279-280 Prucbas: Pruebas: de hipótesis, 33-36,47-48,220-226 de hipOtesis, 33-36, 47-48, 220-226 604 de Ji-cuadrada, 37-39, 48, Véase también Ji-cuadrada, de Ji-cuadrada, 37-39,48, 534. Véase también Ji-cuadrada, pruebas Publicaciones: datos secundarios en, 64-66 dabs seclmdarios sobre el sobre ci cambio tecnológico (libros), 527 334 sobre indicadores empresariales, 334 Punto, estimación de, 31, 33, 48 Punto, estimación de, Punto, pronóstico de, 209 Punto, pronóstico de, Quattro Pro, 10, 14 Quattro Pro, 105n Quenouille, M.H., 105, 105n Quenouilie, M.H., Rastreo, 161-163, 538 Rastreo, 161-163,538 RATS,IO RATS, 10 Redes neurales (y Redes neurales (y los pronosticos), 525-527 pronósticos), Regresión de cambios de porcentaje, 383, 387-392 387-392 Regresión de cambios Regresión mñltiple, 117, 118, 230, 255-291 múltiple, 117, 118, 230, 255-291 la administración, 230-231, 289-291 aplicación en la administración, 230-231, 289-291 coeficientes netos de 260-261, 291 coeficientes netos de regresión en, 260.261, 291 para, 257-291 ecuación para, 257-29 1 estimación en, 263-264, 291 error estándar de estimación en. 263-264, 291 inferencia 261 inferencia estadistica en, 261 regresión por pasos en, 377 -3 80 procedimiento de regresión por pasos en, 377-3 80 procedimiento de rC¡,,'Tesiones 277-279 procedimiento de todas las regresiones posibles en, 277-279 regresión múltiple series de tiempo, 374-40 l rcgresión multiple de series de tiempo, 374-40 1 problemas la correlación serial problemas con Ia corrclactón serial en, 377-380 seiección de Ia ecuación en. 274-284 selección de la ecuación sobreajuste 289 sobreajuste en, 289 suposición en, 261 suposición validación del modelo para, 271 validación modelo para, 271 variables pronóstico 256 variables de pronóstico en, 256 prueba en, 266-271, 291 variables de prueba en, 266-27 1, 291 Véase también Correlación, Análisis de regresión, Análisis de series Véase ta,nbién Correlación, Analisis de regresión, Análisis de senes de tiempo ticmpo vs. regrcsibn simple, 255 vs. regresión simple, 255 y el pronóstico econométrica, 287-2 88 yel pronóstico economélIica, 287-288 la colinealidad, 256, 272-274, 291 y Ia colinealidad, 256, 272-274, 291 Y la hcteroscedasticidad, 271-272, 291 y Ia heteroscedasticidad, 271-272, 291 Y la de correlación, 256-257 y Ia matriz dc correlación, 256-257 la estacional, y Ia regresión estacional, 284-287 las ecuaciones normales, 259 y las ecuaciones normales, 259 los coclicientes de regresión, 260-261 y los coeficientes de regresion, 260-261 los residuales, 261-263. Véase también Residuales y los residuales, 261-263. Véase tainbién Residuales Relación curvada, 41, 226-230, Relación curvada, 41, 226-230. 328-330, 522 curva Gompertz para, 329-330, 522 curva de crecimiento de Gompertz para, 329-330, 522 Relación lineal negativa perfecta, 41 negativa perfecta, 41 Rclación positiva perfccta, 41 Relación lineal positiva perfecta. 41 Relación lineal, 42,47,203 Relación lineal, 41, 42, 47, 203 regresión, 211 como suposición del análisis de regresibn, 211 Relación negativa, 41, 43 Relación negativa, 41, Relación positiva, 41 positiva, 41 Relaciones de variables, cease Correlacibn, Regresión m6ltiple, Relaciones de variables, véase Correlación, Regresión múltiple, Análisis de datos de series de tiempo tiempo Análisis de datos Relaciones lineles, 227 Relaciones no uncles, 227 Residuales, 119, 122-123, 125, 207. 217, 261-263, 377 Residuales, 119, 122-123, 125,207.217,261-263,377 122-123 correlación de, 122-123 mcdición error en medicibn de error en Véase ta,nhiCn metodologia de Box-Jenkins, Pronóstico Vease también metodología de Box-Jenkins, Pronóstico empresarial, empresanal, Rubinfeld, D.L, 398 Rubinfeld, I).L., 398 SAS (Statistical Analysis System), SAS (Statistical Analysis System), 8 computadora para: ejemplos de computadora para: analisis de regresión, 252, 253, 315-317 análisis 253, 315-317 Box-Jcnkins,514-518 Box-Jenkins, 514-518 143-145 estacionalidad, 143-145 introducción, 18-20 18-20 426-428 modelo autorregresivo, 426-428 múltiple, regresión rnñltiple, 315-317 Indice SCA,IO SCA, 10 Associates Corporation, 10 Scientific Computing Associates Corporation, 10 Inc., 9 Scientific Systems, Inc., 9 Series estacionarias, 115, 125.432.439 Series de tiempo estacionarias, 108, 115, 125. 432. 439 Series de tiempo no eslacionarias, 108, 148. Véase ta,nbién Tendencia estacionarias, 108, 148. Véase también Tendencia tiempo, 98-100, 125 Series de tiempo, 98-100, 125 377-400 autocorrelación en, 377-400 estacionarias c. no estacionarias, 108, 115, 439 estacionanas vs. no estacionarias, 108, 115, 125, 432, 439 fuentes de datos de, 62 62 fuentes de Shazam,9 Shazam, 9 336, 350 Shiskin, Julius, 334n, 336, 350 Shoek del Futuro, El, 527 Shock del Futuro, El, y pronóstico, 542-543 Sistema MIS y pronóstico, 542-543 Doctor (caso de estudio), 358-360 Small Engine Doctor (caso de estudio), 35 8-360 Inc., 10 Smart Software Inc., 10 Il, 10 Smartforecast II, 10 289 Sobreajuste, 289 Programas Softwarc, Sofiware, véase Programas de cómputo Alternative 184-185 Solar Alternative Company (caso de estudio), 184-185 Je\\'elry estudio), Solomon's Jeweliy (caso de estudio), 79 10 SORITEC, 10 10 Sorites Group, 10 SOl/ree. The. 66 Source. The. 66 Spreadsheet Foreeaster, 10 Spreadsheet Forecaster, Spreadshect Forecaster, ejemplo de computadora de la descomposición Spreadsheet Forecaster, ejemplo de computadora de Ia descomposición X-1 1, 367-371 X-Jl,367-371 SPSSx (Statistical Package for the Social Sciences), 8,9 (Statistieal Package for Sciences), 8,9 Standard Poor's COIporation Statistical Sen'ice, 66 Standard and Poor's Corporation Statistical Service, 66 STAT-PACKETS, 10 STAT-PACKETS, 10 StalisliclIl Abstract oft/ic Uinled States, 62, 65, 318 Statistical Abstract of the Uinted States, 62, 65, 318 Statistical Analysis Statistical Analysís System (SAS), 8 8 de computadora para: ejemplos de computadora para: análisis regresión, 315-317 analisis de regrcsión, 252-253, 315-317 Box-Jenkins,514-518 Box-Jenkins, 514-518 estacionalidad, 143- 145 estacionalidad, 143-145 introducción, 18-20 introduccibn, 18-20 autorregresivo, 426-428 modelo autorregresivo, 426-428 regresión múltiple, 315 -317 regresiOn mOltiple, 315-317 StatisliclIl Indicator Reporls, 334 Statistical Indicator Reports, 334 Statistical Indicators Association, 334 Statistical Indicators Association, Statistical Package for the Social Sciences (SPSSx), Statistical Package for the Social Sciences (SPSSx), 8 StatPac, 9 StatPac, StatPac, Inc., 10 StatPac, Inc., 10 Statpro,9 Statpro, 9 Stratix, 9 Stratix, Suma dc Suma de los residuales cuadrados, 217-219 residuales cuadrados, 217-219 Suma total de cuadrados, 233 Suma total cuadrados, Suposiciones: de sirnilitud pasado-futuro, 6 de similitud pasado-futuro, en el análisis de regresión, 211, 226,261, 271 226,261, 271 en ci Surrey of Buying Power. The, 66 SI/n'ey ofBuying POlVer. The, SU/Te\! ofCl/rrent Business, rhe, 52,64,318,334-336 Surrey of Current Business, The, 52, 64, 318, 334-336 Sybyl/Runner, Sybyl/Runncr, 9 Symphony, Symphony, 10 SYSTAT,9 SYSTAT, 9 t, distribución, 30 ,122, 212, 572 ,122, t, distnhución, 281 estadistica, 281 también Pronóstico, errores en, Error, términos de y Residuales tanzbiCn Pronóstico, errores en, Error, términos de Tashman, L., IOn IOn Tashman, Técnicas cualitativas, véase Pronóstico empresarial, aspectos de TCcnicas cualitativas, véase Pronóstico empresarial, aspectos juicio de julcio de Técnicas de pronóstico cuantitativas (numbricas), 2, 4, 5, 7, 97-98. Iécnicas de pronóstico cuantitativas (munéricas), 2, 4, 5, 7, 97-98. VCasetambién Promedios, Promedios móviles, Atenuación Véase twnbién Promedios, Promedios móviles, exponencial, Regresión, Regresión Múltiple, Métodos no exponencial, Regresibn, Regresión MñltipIe, Métodos no foniaIes, Anáiisis de series de tiempo y Métodos Box-Jenkins fonnales, Análisis de series de tiempo y Métodos Box-Jenkins Tendencia central, mediciones de, 24 Tendencia central, mediciones de, 24 Tendencia estacional (en el anáiisis de series de tiempo), 342-346 de tiempo), 342-346 Tendencia estacional (en ci análisis Tendencia no lineal, 328-330 328-330 Tendencia no 1, 1, Indice Tendencia, 99, 108, 116, 125, Tendencia, 99, 108, 116, 125, 322-330 atenuación exponencial ajustada para, l 18, 168-172 atenuación exponencial ajustada para, 118, 168-172 eurva creeimiento Gompcrtz 116, 118, 329-330, 522 curva de crecimiento de Gornpertz para, 116, 118, 329-330, 522 99 definición de, 99 ejemplo de computadora para correlación serial, 428-430 computadora ejemplo en el tiempo, 319, 322-330, 338-339 en ci análisis de series de tiempo, 319, 322-330, 338-339 estacional, estacional, 342-346 mensual niensual o trimestral, 342-346 no lineal, 328-330 TSP, 9 TSP, valor valor It y prueba, 50, 122, 212, 281, 572 50,122,212,281,572 Y el método no formal, 148 y ci método no formal, 148 Tendencias futuras necesidad pronósticos, 527-543 Tendeneias futuras y nccesidad de pronóslicos, 527-543 Tendencias, valores mensuales o trimestrales, 342-346 Tendencias, valores mensuales trimestrales, 271 Teorema del limite central, 29, 271 Teorema del Teoria la Teoria de Ia utilidad, 529-530 Tercera 0/a, La, 527 Tercera Ola. La, 527 Thompson, J. Walter Company. 66 Company, Thompson, J. Tiger Transport (caso de cstudio), 239-241 Transport estudio), 239-241 Timestat. 10 Tirnestat. 10 Fimestat, Timestat, Inc., 10 10 Todas las regresiones posibles. prcedimiento, 277-79 Tod'as las regresiones posibles. procedimiento, 277-79 605 independiente, 203 independiente, 255-256, 275 predictor, 255-256, 275 clave faltantes, 378, 383-387 Variables dave faltantes, 378, 383-387 Variables de indicador (de prueba), 266-271, 291 prueba), 266-271, 291 indicador prueba, 266-271, 291 Variables de prueba, 266-271, 291 de, 226-230 Variables, transformación dc, 226-230 plazo (en el análisis de series de tiempo), Variaciones ciclicas dc Variaciones ciclicas de corto piazo (en ci análisis de series dc tiempo), 347-349 34 7-34 9 Variaciones cíclicas, 319, 330-338 Variaciones ciclicas, 319, y Ia demografia, 352 Y la demografía, 352 las fluctuaciones corto plazo, 335 y las fluctuacioncs de corto plazo, 335 los indicadores empresariales, 346, 353 y los indicadorcs emprcsarialcs, 332-335, 346, 353 Variaciones, i'éase Variacioncs ciclicas; Fluctuaciones irrcgulares, I'éase Variaciones cíclieas; Fluctuaciones irregulares, Variación estacional Variación Varian7.a, 263 Varianl.a, fórmula para una mucstra, 23 muestra, 23 formula para fórmula para una poblaeión, 23 fOrmula para una población, y Ia hcteroscedasticidad, 271-272, 291, 374-377 la heteroseedaslicidad, 271-272, Y la suma de residuales cuadrados, 217-219 y Ia suma de residuales cuadrados, 217-219 las desviaciones, 263 y las dcsviaciones, 263 Ventas de rcstaurante (caso de estudio) 302-305, 487-488 Ventas dc restaurante (caso de cstudio) 302-305, Viches, R.P., 66n Vichcs, R.1., 6611 Visi On, 109 Visi On, 109 VisTrencVl'lot, Visl'rend.'l'lot, 9 Wads,,"orth Electronic Publishing Company, 10 Wadsworth Electronic Publishing 10 JVal! Sti'ec( Journal, The. 289 Wa/I Slret:t Journal. The, 289 Wallonick Associates, 9 Wallonick Associates, Wheelwright, S.C., 351 Vheclwright, Se., 351 R., 1011 Whitycombe, R., IOn Wiley, John & Sons, 9, 10 10 Wiley, John Sons, Winter, modelo de, 117, 172-176, 179 Winter, modelo de, 117, 172-176, 179 X-II variante del método Census II, programa dc ajuste estacional, X-ll variante del método Census 11, programa de ajuste estacional, 9,351 9 Xtrapolator, 9 y ounger, 259 Younger, 259 YSTAT, 10 YSTAT,IO Tot'llcr, Alvm: Torner, Alvin: El Shock dd Eu/mo, 527 Shock dcl Flllllm. 527 I.a Tercera O/a. 527 La i'e,'ce,'a 0/a, 527 esperado, 26-27, 49, 528-529, 544 Valor csperado, 26-27. 48, 49. 528-529. 544 fónnula para ci, 27-49 fórnmla para el, 27-49 Valores de tendencia clliltrimestral, 342-346 Valorcs dc tcndencia cuatrimcstral, 342-346 Valores 28-29. 49 Valorcs estandarizados. 28-29. 49 Vallle /.ine bll'eSllIlenl Soccer, 66 Value I_inc ln'esnucnt SlIr",?\·. 6/1 Value Line, Value Line, 66 Variahle continua. 48-127 Variable alcatoria continua. 48-127 Variablc aleatoria discreta, Variable aleatoria discreta. 26, 48 Variable aleatoria, 27,49 Variable alcatona. 27, 49 Variable: aleatoria continua, aleatoria continua, 26, 48 aleatoria discreta, 26, 48 aleatoria discreta, 26, aleatoria, 26 aleatoria, de ¡micha. 266-271. 291 de prucha. dependicnte, 203 dcpcndicnte. 203 faltante. 378. 383-387 faltantc. 378. Ziknllmd. W.G .. 65n Zikmund. W.G.. 65n

Pronostico en Los Negocios - Hanke Reitsch

Comments

Description