-Pronosticos y proyecciones

June 9, 2018 | Author: Carla Chavez Luna | Category: Documents


Comments



Description

107
107
114
114

145
145
CAPÍTULO 5

PRONÓSTICOS Y PROYECCIONES


1. INTRODUCCIÓN

La proyección es la base de la planeación corporativa a largo plazo. El personal de producción y operaciones utiliza proyecciones para tomar decisiones periódicas que involucran la selección de los procesos, la planeación de la capacidad y la disposición de las instalaciones, al igual que las continuas decisiones acerca de la planeación de la producción, su programación y el inventario.

Una proyección perfecta es virtualmente imposible, ya que existen muchos factores que no pueden predecirse con certeza, así que el objetivo deberá ser utilizar el mejor método de proyección posible. Para llevar a cabo una proyección exitosa se debe revisar y actualizar continuamente los datos.

La administración de la demanda, tiene el propósito de coordinar y controlar todas las fuentes de demanda para que el sistema productivo sea eficiente y el producto se despache a tiempo.

Existen dos fuentes básicas de demanda:

Dependiente, es la demanda de un producto o servicio causada por la demanda de otros productos o servicios, y no necesita proyección, sino un registro.
Independiente, es la que no se deriva directamente de otros productos.

La empresa no puede influir en la dependiente, pero sí en la independiente de la siguiente manera:

1. Realizar acciones para influir en la demanda.
2. Ser pasiva y sólo responder a la demanda.

En este texto se determinará la proyección para artículos independientes. Las organizaciones a menudo usan los pronósticos con tres fines:
Para decidir si la demanda es suficiente para generar los rendimientos deseados. Si existe demanda, pero a un precio demasiado bajo para cubrir los costos en que se incurre al elaborar el producto, la organización debe rechazar la oportunidad.
Para determinar las necesidades de capacidad a largo plazo al diseñar las instalaciones. Una proyección precisa de la demanda, a varios años en el futuro, puede ahorrarle a la organización grandes gastos para ampliar o contraer la capacidad con el fin de adaptarse a la demanda futura. Debido a las fuerzas competitivas que existen en el medio, incluso en el sector no lucrativo, una organización que produce deficientemente ya sea por exceso de capacidad ociosa o porque no la tiene suficiente para satisfacer la demanda, está llamando al desastre.
Para determinar las fluctuaciones a corto plazo (de 1 semana a 3 meses) de la demanda del producto, programar la mano de obra, fijar la cantidad de materiales, etc.

Según la precisión que se requiera, se impondrán métodos desde simples hasta altamente sofisticados. Típicamente los pronósticos a largo plazo (3 a 10 años) exigen menos precisión y sirven únicamente para fines de planificación general, mientras que los de corto plazo (una semana a varios meses) requieren gran precisión, porque en ellos se basa la mano de obra detallada, la programación de las máquinas y la planificación de materiales.

Los tipos de proyección se clasifican en:
Cualitativas, son subjetivas y de juicio y se basan en opiniones.
Análisis de las series de tiempo, en la que los datos de la demanda anterior se pueden usar para predecir la demanda futura.
Proyección causal, en la que se usa la técnica de regresión, en la que la demanda está relacionada con factores subyacentes del medio.

2. TÉCNICAS CUALITATIVAS EN LA PROYECCIÓN

2.1. Proyección fundamental

Esta técnica forma la proyección agregando niveles sucesivos desde abajo. La base del este método es suponer que la persona más cercana al cliente o la utilización final del producto, conoce mejor sus necesidades futuras. Aunque esto no es siempre cierto, es una suposición válida.

Las proyecciones efectuadas en este nivel de abajo se suman y se pasan al nivel superior que sigue. Por ejemplo, una proyección de las ventas generales puede derivarse combinando las informaciones de cada vendedor, quién es el que está cerca de su propio territorio de mercado.

2.2. Investigación de mercado

Las empresas contratan consultores externos especialistas en investigación de mercados que recopilan datos del mercado, por medio de encuestas o entrevistas, para buscar nuevas ideas, gustos y preferencias de productos existentes, de la competencia, etc. Esta investigación se utiliza para proyectar ventas de largo alcance y de nuevos productos.

2.3. Consenso de grupo

Esta técnica se basa en la idea de que un grupo de personas de varias posiciones puede desarrollar una proyección más confiable que la de un grupo más pequeño. Estas proyecciones se desarrollan a través de reuniones abiertas con libre intercambio de ideas con todos los niveles de gerencia, vendedores o clientes. La dificultad de la técnica es que los niveles superiores pueden ejercer intimidación a los niveles inferiores.

2.4. Analogía histórica

Se proyecta la demanda de un nuevo producto con un producto ya existente análogo: producto complementario o competitivo. Un ejemplo sería el de una empresa que produce tostadoras, podría usar su base de datos histórica de ventas para proyectar la demanda de cafeteras.

2.5. Método Delfi

Para evitar la dificultad de intimidación del consenso de grupo, este método oculta la identidad de los participantes del estudio y además todas las opiniones tienen el mismo peso. El procedimiento es:

1. Escoger a los expertos que van a participar. Debe haber variedad de conocimientos en áreas diferentes.
2. A través de un cuestionario obtener las proyecciones de los participantes.
3. Resumir los resultados y redistribuirlos a los participantes junto con nuevas preguntas.
4. Resumir de nuevo, refinar las proyecciones y condiciones y desarrollar nuevas preguntas.
5. Repetir el paso 4 si es necesario. Distribuir los resultados finales a los participantes.

Se pueden lograr resultados satisfactorios en 3 vueltas, la idea es lograr un consenso en la proyección.
3. ANÁLISIS DE LAS SERIES DE TIEMPO

3.1. Componentes de una serie temporal

Una serie temporal es un conjunto de valores correspondientes a una variable, observados en el tiempo. La serie cronológica se considera como una estadística de dos variables donde una de ellas es el tiempo (variable independiente) y la otra los valores de la variable observada (variable dependiente).

Debido a que las condiciones económicas y comerciales varían con el tiempo, los administradores deben encontrar formas para mantenerse al día respecto a los efectos que esos cambios tendrán en sus negocios. Una técnica muy útil en la planeación de las necesidades operativas es el pronóstico, que tiene como objetivo predecir los eventos futuros de manera que las proyecciones se puedan incorporar en el proceso de toma de decisiones.

Como ejemplos, se citan algunos:

Los funcionarios del gobierno pronostican aspectos como el desempleo, inflación, producción industrial e ingresos esperados de los impuestos personales y corporativos para formular las políticas.
Los ejecutivos de mercadotecnia pronostican la demanda de un producto, ingresos por ventas, preferencias del consumidor, inventarios, etc., a fin de tomar decisiones oportunas respecto a sus operaciones futuras y realizar una buena planificación estratégica.
Los directores de una línea área deben pronosticar el uso de necesidades con base en el número de vuelos, empleados y pasajeros, para mantener un inventario de refacciones de reemplazo para su flota de aviones.
La administración de una universidad debe ser capaz de pronosticar la inscripción de estudiantes, de acuerdo con las proyecciones nacionales de población y las tendencias de la enseñanza según los desarrollos tecnológicos, para planear la construcciones de dormitorios y otras instalaciones académicas, el reclutamiento de estudiantes y profesores, etc.

Los valores en el tiempo son resultado de un conjunto de fuerzas o factores que actúan sobre el fenómeno en estudio. Estas fuerzas pueden ser agrupadas en cuatro grandes componentes:

Tendencia secular (T): Es el comportamiento promedio de la serie temporal. Es la dirección predominante de la serie observada en un espacio de tiempo suficientemente amplio.
Variación estacional o periódica (E): Permite comprender las influencias de las estaciones o de otros períodos del año sobre los valores de la variable, que generalmente se dan en fenómenos económicos, como por ejemplo las series de producción de productos agrícolas, ventas de grandes empresas, aumento de casos de gripe en invierno, etc.
Variaciones cíclicas (C): Son propias de las variables económicas. Permiten comprender las oscilaciones que aparecen a lo largo de la tendencia secular y que abarcan a intervalos de tiempo superiores a un año. Difieren en intensidad y amplitud, pero generalmente duran de 2 a 10 años o más, de acuerdo al ciclo de un negocio.
Variaciones accidentales o irregulares (A): Son manifestaciones que corresponden a situaciones esporádicas o eventuales que influyen en los valores de la variable y dan lugar a un movimiento
brusco en la trayectoria de la serie temporal. Son movimientos accidentales y aleatorios, como ser:
una helada en el campo, una política pasajera de dumping, la entrada de un número extraordinario de turistas, etc.

Este conjunto de fuerzas que actúan sobre los valores de las variables, no tienen una manera esclarecida, por lo cual se elaboran hipótesis sobre dicha forma de acción (Ver gráfico 5.3.1):

Hipótesis multiplicativa: Hipótesis aditiva:
Gráfico 5.3.1. Serie cronológica con sus 4 componentes


y









Fuente: Casa Aruta, Ernesto. Doscientos Problemas de Estadística Descriptiva, 1965t.

donde:

La recta nos muestra la tendencia lineal de la serie:
La curva cíclica de período corto las variaciones estacionales: La curva cíclica de período largo la variación cíclica:
Las puntas asistemáticas las variaciones accidentales:

Los gerentes, industriales e investigadores están muy interesados en predecir los cambios que pueden darse con respecto al tiempo de toda una serie de variables que manejan, porque constituyen una parte muy importante en la toma de decisiones que deben realizar.

La calidad de las predicciones que los investigadores pueden efectuar está estrechamente relacionada con la información que se puede extraer y la manera de utilizarla. El análisis de series temporales es un método cuantitativo que se utiliza para determinar patrones en los datos recolectados a través del tiempo, para luego proyectarlos al futuro.

La tabla 5.3.1 muestra un resumen de los cuatro componentes principales de una serie de tiempo.

Tabla 5.3.1. Características de los 4 componentes de una serie temporal

Componente
(Clasificación)
Definición
Razón de la influencia
Duración
T
(Sistemático)
Patrón de movimiento global o
persistente, a largo plazo.
Cambios en tecnología,
población, riqueza, valores.
Varios años
E
(Sistemático)
Fluctuación más o menos regular
que ocurre en cada periodo de 12 meses cada año.
Condiciones de clima,
costumbres sociales o religiosas.
Dentro de 12
meses (O datos mensuales o trimestrales).
C
(Sistemático)
Oscilación o movimiento
repetitivo arriba o abajo en 4 etapas: Pico (prosperidad), contracción (recesión), fondo (depresión) y expansión (recuperación o crecimiento)
Interacción de numerosas
combinaciones de factores que influyen en la economía.
De 2 a 10 años,
con diferente intensidad en un ciclo completo.
A
(No sistemático)
Fluctuación errática o residual
presente después de tomar en cuenta los efectos sistemáticos.
Variaciones aleatorias en los
datos o debidas a eventos no previstos como huelgas, huracanes, inundaciones, asesinatos políticos, etc.
Corta duración y
sin repetición.
Fuente: Berenson – Levin – Krehbiel. Estadística para administración, 2000.
4. DETERMINACIÓN DE LOS COMPONENTES DE UNA SERIE CRONOLÓGICA

3.1. Tendencia secular

Existen varios métodos para la determinación de la tendencia secular.

a) Método de las medias móviles

Este método busca diluir la importancia individual de cada observación, promediándola mediante una media aritmética, considerando las observaciones. Cada valor observado de y, es sustituido por una media aritmética, que se obtiene por valores componentes de y, en grupos de un número determinado de valores y aplicados mecánicamente. Se presentan dos casos, según el número de observaciones elegidas para calcular el promedio sea par o impar. Cuando el número de observaciones es par luego se deberá realizar otra vez el método de medias móviles con n = 2 para que los datos estén centrados. Si el número de observaciones elegido es impar los datos están centrados y no es necesario hacer nada.

b) Método analítico

Una tendencia secular puede hallarse mediante un análisis de regresión, pudiendo comportarse bajo cualquier modelo visto en los capítulos anteriores, con la particularidad de que la variable independiente es siempre el tiempo.
Aplicando mínimos cuadrados a: (función lineal) Las ecuaciones normales son:



{



que es un sistema de 2 ecuaciones con las incógnitas a y b. Si la función es: (función exponencial)
Aplicando logaritmos:



Las ecuaciones normales son:



{

Si la función es: (función potencial)

Aplicando logaritmos:



Las ecuaciones normales son:

{
( )


Nota: La tendencia secular puede seguir la forma de cualquier función. En todo caso, el investigador deberá determinar la curva que mejor se ajuste a los datos temporales. En el Anexo del texto se presentan varios modelos no lineales y el procedimiento para linealizarlos.

Ejemplo

La tabla 5.4.1 presenta las ventas mundiales anuales de una fábrica (en millones de unidades) de automóviles, camiones y autobuses hechos por la General Motors para un periodo de 24 años, de 1975 a
1998.

a) Halle la tendencia secular por medio del método de medias móviles, usando un valor de n=7. b) Determine la tendencia secular por el método analítico.

Tabla 5.4.1. Ventas mundiales anuales de la General Motors

Año
Ventas
Año
Ventas
Año
Ventas
1975
6,6
1983
7,8
1991
7,4
1976
8,6
1984
8,3
1992
7,7
1977
9,1
1985
9,3
1993
7,8
1978
9,5
1986
8,6
1994
8,4
1979
9,0
1987
7,8
1995
8,3
1980
7,1
1988
8,1
1996
8,4
1981
6,8
1989
7,9
1997
8,8
1982
6,2
1990
7,5
1998
8,1

Fuente: Berenson – Levin – Krehbiel. Estadística para administración, 2000.

Para determinar la tendencia por medio de las medias móviles con n=7, calculamos la primera media con las ventas de los primeros 7 años.
̅

La siguiente es determinada, dejando el valor de venta del primer año, y tomando en cuenta las ventas de los años 2 al 8:
̅

Se sigue el mismo procedimiento hasta cubrir las ventas de los últimos 7 años.

Para determinar la tendencia por medio del análisis de regresión, se elegirá el modelo lineal. Luego de todo el procedimiento, la recta de las ventas en función de los años es:



Los resultados se muestran en la tabla 5.4.2.
Tabla 5.4.2. Promedios móviles de las ventas mundiales anuales de la General Motors

Año
Año
Ventas
Medias móviles
Regresión
0
1975
6,6
-
7,96
1
1976
8,6
-
7,97
2
1977
9,1
-
7,97
3
1978
9,5
8,10
7,98
4
1979
9,0
8,04
7,99
5
1980
7,1
7,93
8,00
6
1981
6,8
7,81
8,00
7
1982
6,2
7,79
8,01
8
1983
7,8
7,73
8,02
9
1984
8,3
7,83
8,03
10
1985
9,3
8,01
8,03
11
1986
8,6
8,26
8,04
12
1987
7,8
8,21
8,05
13
1988
8,1
8,09
8,06
14
1989
7,9
7,86
8,06
15
1990
7,5
7,74
8,07
16
1991
7,4
7,83
8,08
17
1992
7,7
7,86
8,09
18
1993
7,8
7,93
8,09
19
1994
8,4
8,11
8,10
20
1995
8,3
8,21
8,11
21
1996
8,4
-
8,12
22
1997
8,8
-
8,12
23
1998
8,1
-
8,13

Fuente: Berenson – Levin – Krehbiel. Estadística para administración, 2000.

El gráfico 5.4.1 muestra la conveniencia de usar uno u otro método. El método de la media móvil busca de mejor manera incluir las alteraciones que existen en la serie cronológica.

Gráfico 5.4.1. Dos métodos de cálculo de la tendencia de las ventas mundiales anuales de la
General Motors

10,00
9,50
9,00
8,50
8,00
Ventas7,50
Ventas
7,00
6,50
6,00
1970 1975 1980 1985 1990 1995 2000

Tiempo

Recta de regresión

Media Móvil

Serie de Ventas
3.2. Desestacionalización y determinación del índice de variación estacional

Este método trata de aislar la variación estacional eliminando las otras componentes por medio del cociente o la división, tomando en cuenta la hipótesis multiplicativa. Deben ser eliminadas la tendencia secular y las variaciones accidentales. Cuando el período en estudio es corto, la variación cíclica puede suponerse incluida en la tendencia, por lo cual, al eliminarse ésta, queda también eliminada aquella.

El método consiste en:

Dada la serie cronológica por meses, estaciones, trimestres, etc., en varios años, se halla la tendencia mediante el método de las medias móviles tomando un año de período (n tendrá el valor del número de periodos en los que se dividió el año).

Se centran los valores así obtenidos en los instantes de tiempo originales, si es que se utilizó un n par en el cálculo de las medias móviles. Si es que se utilizó un n impar, no es necesario centrar.




Se elimina la tendencia y la variación cíclica en ella incluida, dividiendo los datos de la serie original por los valores de la tendencia en cada instante de tiempo.




Se eliminan las variaciones accidentales hallando las medias aritméticas de los valores observados en cada período de repetición anual.



Sobre estos últimos valores se calculan los índices de variación estacional, uno para cada momento de repetición anual, en forma de porcentajes.

Los índices de variación estacional representan la fuerza de la componente estacional una vez eliminadas las otras tres componentes. Por consiguiente, eliminando por cociente la influencia de las estaciones en el fenómeno observado cronológicamente, obtendremos la serie correspondiente "desestacionalizada".




Ejemplo

Sea los siguientes datos observados durante cuatro años sobre las ventas en miles, en cada estación
(ver tabla 5.4.3).

Tabla 5.4.3. Serie temporal de ventas (miles de $)

Estación
año 1
año 2
año 3
año 4
Primavera
2,0
2,4
2,6
3,0
Verano
2,2
2,8
3,0
3,6
Otoño
2,4
3,0
3,4
3,8
Invierno
2,8
3,4
3,8
4,0

Halle el índice de variación estacional (I.V.E.) y desestacionalice la serie. Se procede de la siguiente
manera:

1er Paso. Se halla la tendencia secular por el método de las medias móviles, tomando un año de período
(n=4) (ver tabla 5.4.4).

Tabla 5.4.4. Primer paso. Desestacionalización de la serie temporal de ventas

Estación
año 1
año 2
año 3
año 4
Primavera
-

2,75

3,10

3,55
Verano
-
2,35

2,90

3,20

3,60
Otoño

2,45

2,95

3,30

-
Invierno

2,60

3,00

3,45

-

2do Paso. Se centran los valores (ver tabla 5.4.5).

Tabla 5.4.5. Segundo paso. Desestacionalización de la serie temporal de ventas

Estación
año 1
año 2
año 3
año 4
Primavera
-
2,675
3,050
3,500
Verano
-
2,825
3,150
3,575
Otoño
2,400
2,925
3,250
-
Invierno
2,525
2,975
3,375
-

3er Paso. Los datos corresponden a un corto plazo, por lo tanto la tendencia secular y la variación cíclica se eliminan juntas.

Se elimina la tendencia y la variación cíclica, dividiendo los datos originales por los valores de la tendencia en cada intervalo de tiempo (ver tabla 5.4.6).

Tabla 5.4.6. Tercer paso. Desestacionalización de la serie temporal de ventas

Estación
año 1
año 2
año 3
año 4
Primavera
-
0,897
0,852
0,857
Verano
-
0,991
0,952
1,007
Otoño
1,000
1,026
1,046
-
Invierno
1,109
1,143
1,126
-

4to Paso. Se elimina la variación accidental, hallando la media aritmética de los valores observados en el tiempo del paso anterior (ver tabla 5.4.7).

Tabla 5.4.7. Cuarto paso. Desestacionalización de la serie temporal de ventas

Estación
M.A. (promedio)
Primavera
0,8687
Verano
0,9833
Otoño
1,0240
Invierno
1,1260

4,0020

5to Paso. Se determinan los I.V.E.:

Los promedios hallados no suman 4 exactamente, ya que se eliminaron varios decimales en los cálculos, así que para obtener los índices de variación estacional, se realiza una regla de tres simple de forma que su suma sea igual a los periodos en los que se dividió cada año (ver tabla 5.4.8).

4,002 ------> 4,000
0,8687 -----> IVEP

Se realiza este cálculo para todos los valores.

Tabla 5.4.8. Quinto paso. Ajuste del IVE

Estación
IVE
Primavera
0,8683
Verano
0,9828
Otoño
1,0235
Invierno
1,1254

4,0000

6to Paso. Se obtiene la serie desestacionalizada, dividiendo los datos originales de la serie entre el IVE
respectivo para cada estación (ver tabla 5.4.9).

Tabla 5.4.9. Sexto paso. Desestacionalización de la serie temporal de ventas

Estación
año 1
año 2
año 3
año 4
Primavera
Verano Otoño Invierno
2,30
2,24
2,34
2,49
2,76
2,85
2,93
3,02
2,99
3,05
3,32
3,38
3,46
3,66
3,71
3,55

La gráfica de la serie cronológica, la tendencia secular y la serie desestacionalizada se muestra en el gráfico 5.4.2.

Gráfico 5.4.2. Serie temporal de ventas desestacionalizada












Ventas4
Ventas

3,5

3

2,5

2
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Tiempo
Serie Cronológica
Tendencia Secular
Serie Desestacionalizada


Se puede observar que la serie desestacionalizada muestra un patrón similar a la tendencia secular, indicando que la serie cronológica si presentaba un fuerte componente estacional, sobre todo en primavera e invierno. También se puede decir que la tendencia de las ventas es creciente en el periodo de 4 años mostrado.
5. CÁLCULO DE PRONÓSTICOS DE SERIES TEMPORALES

5.1. Objetivos del pronóstico

En el pronóstico se debe tener presente dos objetivos y se debe buscar una solución intermedia que satisfaga ambos objetivos.

1. Producir un pronóstico tan bueno como lo permitan los datos disponibles. Normalmente se puede interpretar que este objetivo requiere el empleo de los datos más recientes porque son más representativos del comportamiento actual de la serie de tiempos.

2. Igualar el comportamiento al azar de los datos. Todas las series contienen cierta proporción de esta variación errática o al azar. La conclusión razonable es evitar una reacción excesiva ante una fluctuación debida puramente al azar. La interpretación general de este objetivo es que en el pronóstico se deben incluir varios periodos de datos, de manera que se igualen las fluctuaciones al azar que existen normalmente.

Es evidente que los métodos para lograr los dos objetivos serán un tanto contradictorios.

5.2. Errores en la proyección

La demanda de un producto se genera a través de la interacción de una serie de factores demasiados complejos de describir con exactitud en un modelo. En consecuencia todas las proyecciones tienen con certeza algún error. El error se refiere a la diferencia entre el valor de la proyección y lo que realmente ha ocurrido.

5.2.1. Fuentes de error

Los errores pueden clasificarse como sistemáticos o aleatorios. Los sistemáticos se presentan cuando se comete una equivocación consistente: una falla en la inclusión de las variables correctas, utilización de relaciones equivocada entre las variables, empleo de una línea de tendencia incorrecta, etc. Los errores aleatorios se pueden definir como aquellos que no se pueden explicar con el modelo de proyección utilizado.

5.2.2. Medición de error: Desviación absoluta media (MAD) o media del error absoluto (MAE) y sesgo o media del error (ME)

Cuando se haga una evaluación de diferentes métodos de pronóstico, necesitaremos una medida para conocer la efectividad. El error en el pronóstico es el mecanismo más comúnmente utilizado, y se calcula como la diferencia numérica entre la demanda pronosticada y la real. Evidentemente, un método cuyo resultado contiene grandes errores de predicción es menos deseable que el que implica menos errores. El MAE porcentual es denominado MAPE (porcentaje de la media del error absoluto)


( )
" " " "
( )
" "



Se debe tomar en cuenta que la MAD expresa la dimensión del error, pero no la dirección del error.
Otra medida del error menos usada, es el sesgo o ME. También se puede calcular el porcentaje d ela media del error (MPE).


( )
( )
( )
( )



A diferencia de la MAD, el sesgo indica la tendencia direccional de los errores de predicción. Si el procedimiento de predicción sobreestima constantemente la demanda actual, el sesgo tendrá un valor negativo; si la subestimación muestra una tendencia constante, entonces el sesgo tendrá un valor positivo.

Una predicción ideal daría una MAD y un sesgo de cero. Sin embargo, en la práctica, en general existe una compensación entre el sesgo y la MAD, en algunas situaciones hay que conservar uno a expensas del otro. Si se tuviera que sacrificar uno a expensas del otro, probablemente la MAD sería el indicador designado. El bajar la MAD hasta o casi cero automáticamente mantendrá bajo el nivel de sesgo.

Una señal de rastreo (TS, Tracking signal) es una medida que indica si el promedio de proyección está manteniendo el ritmo de los cambios reales en la demanda, ya sean hacia arriba o hacia abajo. Cuando se utiliza en las proyecciones, la TS es el número de desviaciones MAD en que el valor de la proyección se encuentra por encima o por debajo de la ocurrencia real. La TS se calcula como la suma aritmética de las desviaciones de la proyección divididas por la MAD. RSFE es la suma continua de los errores de proyección, considerando los signos.





Otra medida del error es el RMSE (Raíz del cuadrado medio del error):

Ejemplo

En la Tabla 5.5.1 se muestra un ejemplo de una proyección de la demanda y la demanda real, con todos los cálculos para calcular las medidas del error del pronóstico.

Tabla 5.5.1. Cálculo de los errores en la proyección

Mes
Proyección
Demanda real
e
e acumulados
e abs
e abs acumuladas
MAD (MAE)
TS
Sesgo
(ME)
MPE
MAPE
e^2
e^2 acumulados
RMSE
1
1000
950
-50
-50
50
50
50,00
-1,00
-50,00
-5,2632
5,2632
2500
2500
50,00
2
1000
1070
70
20
70
120
60,00
0,33
10,00
0,9346
5,6075
4900
7400
60,83
3
1000
1100
100
120
100
220
73,33
1,64
40,00
3,6364
6,6667
10000
17400
76,16
4
1000
960
-40
80
40
260
65,00
1,23
20,00
2,0833
6,7708
1600
19000
68,92
5
1000
1090
90
170
90
350
70,00
2,43
34,00
3,1193
6,4220
8100
27100
73,62
6
1000
1050
50
220
50
400
66,67
3,30
36,67
3,4921
6,3492
2500
29600
70,24
Totales


220

400






29600



La proyección se había fijado en un nivel constante de 1000 y las demandas reales son las que se indican en la tabla. La proyección en promedio estaba errada en 67 unidades (6,35%), la señal de rastreo era de 3 desviaciones positivas y el sesgo era de 37 (3,49%), indicando que la proyección subestimó la demanda real. El RMSE es de 70 unidades.
5.3. Métodos de pronóstico

El objetivo de los modelos de análisis por tiempos es determinar la magnitud de uno o más de los componentes de las series de tiempos y aprovechar ese conocimiento con fines de pronóstico.

Se considerarán varios métodos de pronóstico:

Métodos sencillos de intentos de pronóstico
Promedios móviles (Componente de tendencia)
Igualación exponencial (Componente de tendencia)
Modelo multiplicativo de tendencia lineal (Los tres componentes)

Cada uno de los modelos se presenta dentro del contexto de un ejemplo.

5.3.1. Métodos sencillos

Dos métodos sencillos pero nada satisfactorios son: el promedio de toda la demanda y la demanda del último periodo, para pronosticar la del periodo siguiente.

Ejemplo

Un centro de salud es una clínica sostenida con fondos federales, que atiende las necesidades de los pobres del centro de la ciudad. Actualmente se encuentra en su cuarto año de operaciones y está elaborando su plan de personal para el próximo trimestre. El gobierno federal exige que, cada trimestre, el centro formule una solicitud de presupuesto para el siguiente. La solicitud se basa en buena parte en el pronóstico de la demanda de servicios específicos para el trimestre siguiente.

Los datos que aparecen en la tabla 5.5.2 se refieren a los servicios de emergencia que se presentan en el centro. Anteriormente el director del centro de salud ha tratado de pronosticar la demanda, pero ninguna de sus técnicas ha resultado satisfactoria.

Tabla 5.5.2. Demanda de servicios de urgencia en el centro de salud

Año
Trimestre
Número de periodo
Número de visitas
de pacientes
1971
1
1
3500

2
2
8000

3
3
5500

4
4
10000
1972
1
5
4500

2
6
6000

3
7
3000

4
8
5500
1973
1
9
5000

2
10
9500

3
11
7500

4
12
15000
1974
1
13
13500

2
14
17500

El empleo de la demanda anterior como pronosticador de la del siguiente produjo pronósticos muy erráticos. Por ejemplo, el administrador produjo por este método una demanda de 3500 visitas para el segundo trimestre de 1971, pero en realidad fueron 8000 (la horas extra y los pedidos hechos
apresuradamente llegaron al máximo durante este trimestre). Luego pronosticó 8000 visitas para el tercer trimestre, pero únicamente se atendieron 5500.

Luego recurrió al promedio de toda la demanda, para pronosticar la del periodo siguiente. Para el cuarto trimestre de 1971 predijo una demanda de 5667 ((3500+8000+5500)/3), pero fue realmente de 10000.

Después de evaluar estos dos métodos sencillos, el administrador decidió considerar métodos más sofisticados.

5.3.2. Promedios móviles

Para superar el problema que implica el uso de un simple promedio, esta técnica genera el pronóstico del periodo siguiente promediando únicamente la demanda real de los últimos n períodos (n es con frecuencia del orden de 4 o 7). La elección del valor de n es arbitraria, pero debe estar basada en la experimentación; es decir debe ser aquel que mejor se adapte a los datos históricos disponibles.

Este promedio móvil se calcula mediante la siguiente fórmula:



En donde:

t = Número de periodo del periodo actual
Ft+1 = Pronóstico de la demanda para el periodo siguiente
Di = Demanda real en el periodo i
n = Número de periodos de demanda que se deben incluir (el orden)

Ejemplo

Volviendo al ejemplo del centro de salud, el administrador puede pronosticar la demanda del tercer trimestre de 1974, usando un promedio móvil de orden 4, de la siguiente manera:
( )


( )


La media móvil es un término medio entre el pronóstico de la demanda del período anterior y el promedio simple. Si se incluyen pocos periodos, el pronóstico es similar al de la demanda del periodo anterior, y si se incluyen muchos, es similar al promedio simple.

La tabla 5.5.3 presenta los pronósticos realizados al ejemplo del centro de salud con promedios móviles de orden 4.

El MAD tiene un valor de , el sesgo es: y el TS es:
. Obviamente estos valores revelan que el pronóstico no es muy confiable. En general se ha subestimado la demanda real.

El gráfico 5.5.1 muestra el pronóstico con el método de medias móviles.
Tabla 5.5.3. Pronósticos con el método de medias móviles para el centro de salud

Año
Trimestre
Número de periodo
Y real
Y
pronosticado
Residuos
Residuos absolutos
1971
1
1
3500
-
-
-

2
2
8000
-
-
-

3
3
5500
-
-
-

4
4
10000
-
-
-
1972
1
5
4500
6750
-2250
2250

2
6
6000
7000
-1000
1000

3
7
3000
6500
-3500
3500

4
8
5500
5875
-375
375
1973
1
9
5000
4750
250
250

2
10
9500
4875
4625
4625

3
11
7500
5750
1750
1750

4
12
15000
6875
8125
8125
1974
1
13
13500
9250
4250
4250

2
14
17500
11375
6125
6125

3
15
-
13375
18000
32250



20000
18000
16000
14000
12000
10000
8000
6000
4000
2000
0

Gráfico 5.5.1. Pronóstico con medias móviles






























0 2 4 6 8 10 12 14 16

Y real Y pronosticado

5.3.3. Igualación o ajuste exponencial

Este método se lleva a cabo con la siguiente ecuación:
( ) ( )
( )
En donde es una constante de igualación que debe estar comprendida entre 0 y 1. Esta constante es el
peso asignado a la última demanda real. Mientras más cerca esté de 1, mayor será la influencia de la
demanda actual para el pronóstico y viceversa. Con el promedio móvil, en cambio, a todas las demandas se le asigna un peso igual al determinar el pronóstico del periodo siguiente.

La selección del valor adecuado de se hace de la siguiente manera:

En general valores altos de se usan cuando hay baja variabilidad en la serie cronológica, es decir presenta una curva bastante uniforme, y viceversa.

El valor adecuado de , al igual que el de n, se determina por un proceso de prueba y error. Típicamente los valores son del orden de 0,05 a 0,5 para aplicaciones empresariales. Una manera es probar distintos valores y elegir el que tenga menor MAD.

Ejemplo

La tabla 5.5.4 presenta los pronósticos igualados exponencialmente, usando los valores de de 0,1 y
0,6. Puesto que no hay datos de un pronóstico para el periodo 1, es preciso elegir algún valor. Se dirá que el pronóstico para el periodo 1 es igual a la demanda real de ese periodo. Luego se puede ir calculando de la siguiente manera:
( ) ( )
( ) ( )
Tabla 5.5.4. Pronósticos con suavizado exponencial


Año

Trimestre
Número
de periodo

Y real
Y
pronosticado
(a=0,1)

Residuos
Residuos absolutos
Y
pronosticado
(a=0,6)

Residuos
Residuos absolutos
1971
1
1
3500
3500
0
0
3500
0
0

2
2
8000
3500
4500
4500
3500
4500
4500

3
3
5500
3950
1550
1550
6200
-700
700

4
4
10000
4105
5895
5895
5780
4220
4220
1972
1
5
4500
4694,5
-194,5
194,5
8312
-3812
3812

2
6
6000
4675,05
1324,95
1324,95
6024,8
-24,8
24,8

3
7
3000
4807,545
-1807,545
1807,545
6009,92
-3009,92
3009,92

4
8
5500
4626,7905
873,2095
873,2095
4203,968
1296,032
1296,032
1973
1
9
5000
4714,11145
285,88855
285,88855
4981,5872
18,4128
18,4128

2
10
9500
4742,70031
4757,2997
4757,2997
4992,63488
4507,36512
4507,36512

3
11
7500
5218,43027
2281,56973
2281,56973
7697,05395
-197,053952
197,053952

4
12
15000
5446,58725
9553,41275
9553,41275
7578,82158
7421,178419
7421,17842
1974
1
13
13500
6401,92852
7098,07148
7098,07148
12031,5286
1468,471368
1468,47137

2
14
17500
7111,73567
10388,2643
10388,2643
12912,6115
4587,388547
4587,38855

3
15
-
8150,5621


15665,0446







46505,621
50509,711

20275,0743
35762,6222

El MAD para de 0,1 es de 3885,4, el sesgo es de 3577,3 y el TS es de 11,97. Para un de 0,6 el MAD
es de 2751, el sesgo de 1559,6 y el TS de 7,37.

Se puede observar que un mejor pronóstico se logra con un de 0,6, pero aun así el pronóstico ha subestimado la demanda real. De los resultados se deduce que se debería haber usado un más cercano a 1.

El gráfico 5.5.2 muestra la diferencia entre los dos pronósticos usando distintos coeficientes.


20000

Gráfico 5.5.2. Pronósticos exponenciales


15000


10000


5000


0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15


























Y real Y pronosticado (a=0.1) Y pronosticado (a=0.6)


5.3.4. Descomposición. Tendencia lineal, modelo multiplicativo

Conceptualmente el modelo se presenta así:
( ) ( )
Para desarrollar este modelo se debe analizar primero los datos históricos disponibles y tratar de
descomponer los datos originales en sus dos componentes, T y E.

Ejemplo

En el gráfico 5.5.3 y la tabla 5.5.5 se presenta el volumen trimestral de pasajeros del nuevo Tráfico Masivo del Centro de la ciudad (en miles). Se ve que la demanda aumenta de modo general. Para pronosticar el futuro volumen de pasajeros, el alcalde de la ciudad ha decidió probar el modelo por tiempos de tendencia lineal, basado en la suposición de que la demanda sigue a la vez una tendencia bastante constante de un trimestre a otro y patrón trimestral de temporada (estacionalidad).

Tabla 5.5.5. Volumen trimestral de pasajeros para el tráfico masivo

Trimestre
(xi)
Pasajeros
(miles) (yi)
1
3,5
2
8
3
5,5
4
10
5
9,5
6
14
7
11,5
8
16
9
15,5
10
20
11
17,5
12
22
13
21,5
14
26

Observando el gráfico por tiempos de los datos de la demanda, resulta claro que la demanda está por arriba del promedio durante el segundo y cuarto trimestres, y abajo del promedio en el primero y el tercero, debido probablemente al clima.

La tendencia: Como ya se explicó, la tendencia es la dirección que toma a la larga la serie de datos.

Gráfico 5.5.3. Tendencia del volumen trimestral de pasajeros del tráfico masivo


30

25

20

15

10

5

0





























0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15


La estacionalidad (método de razón/tendencia):

Reconociendo que hay un claro patrón de temporada se puede estimar la magnitud de la variación por temporada respecto a la curva de tendencia (el componente de estacionalidad).

Los pasos para el cálculo son los siguientes:

1. Se calcula la tendencia secular de la serie ( ) por el método de medias móviles, tomando como periodo el número de periodos en los que se divide un año. En este caso, como el año se dividió en trimestres, el n es de 4. Luego se centran los valores con un n de 2.

2. Se elimina de la serie la tendencia secular, dividiendo los valores originales de la serie entre la
tendencia secular hallada en el paso 1 ( ).
3. Se elimina la variación accidental (A) de la serie, hallando el promedio de los valores de cada trimestre
del año, para obtener la variación estacional de la serie ( ), también denominado índice de variación estacional (IVE).
4. Se desestacionaliza la serie, dividiendo los valores originales entre el IVE ( ).
5. Se determina un modelo lineal de los valores desestacionalizados de la serie, mediante el método de
mínimos cuadrados ( ).

6. Se ajusta el valor estimado de la serie desestacionalizada multiplicando cada valor de Ye por el IVE.
Por último se halla el pronóstico requerido.

La tabla 5.5.6 muestra todos los cálculos para cada trimestre de la serie.
Tabla 5.5.6. Cálculos para el pronóstico del índice de pasajeros

Trimestre
Periodo
Pasajeros (miles) (yi)
y=TC (n=4)
y=TC (n=2)
y=EA
y=IVE
Y=TCA
Ye
Ye ajustado por IVE
1
1
3,5



0,922
3,796
4,523
4,170
2
2
8
6,75


1,139
7,024
6,028
6,865
3
3
5,5
8,25
7,5
0,733
0,828
6,646
7,533
6,233
4
4
10
9,75
9
1,111
1,075
9,301
9,037
9,716
1
5
9,5
11,25
10,5
0,905
0,922
10,303
10,542
9,721
2
6
14
12,75
12
1,167
1,139
12,293
12,047
13,720
3
7
11,5
14,25
13,5
0,852
0,828
13,897
13,552
11,215
4
8
16
15,75
15
1,067
1,075
14,882
15,057
16,188
1
9
15,5
17,25
16,5
0,939
0,922
16,810
16,562
15,271
2
10
20
18,75
18
1,111
1,139
17,561
18,067
20,576
3
11
17,5
20,25
19,5
0,897
0,828
21,147
19,572
16,196
4
12
22
21,75
21
1,048
1,075
20,463
21,077
22,660
1
13
21,5



0,922
23,317
22,582
20,822
2
14
26



1,139
22,829
24,086
27,432
3
15




0,828

25,591
21,178
4
16




1,075

27,096
29,132

En el gráfico 5.5.4 se muestra la serie desestacionalizada y el modelo lineal que le corresponde, y por el cual se calcula Ye.



30,000

Y=TCA

25,000

20,000

15,000

10,000

5,000

0,000


y = 1,5049x + 3,0178R² = 0,98480 5 10 15




y = 1,5049x + 3,0178
R² = 0,9848

















Tomando las componentes de tendencia y de temporada, el alcalde de la ciudad puede pronosticar ahora los volúmenes de pasajeros para cualquier trimestre futuro. Primero se calculará el valor de la tendencia para el trimestre que se pronostica, y ese valor se multiplica por el factor de estacionalidad IVE que corresponda. La tabla muestra el pronóstico para el tercer y cuarto trimestre del cuarto año, que son de
21178 y 29132 pasajeros.

Este modelo de tendencia lineal puede ser útil para la planificación de operaciones y la programación del tráfico masivo del centro de la ciudad.

5.3.5. Otros modelos. Advertencias

Aunque conviene probar un modelo simple de tendencia lineal antes de recurrir a modelos más complejos, ese simplemente no resulta adecuado en muchas situaciones de pronóstico. El investigador debe reconocer que un procedimiento de pronóstico sólo produce resultados útiles si los datos usados se ajustan a los supuestos del modelo. Los datos que siguen un patrón no lineal no se deben sujetar a un análisis lineal. Algunos modelos no lineales son el cuadrático, exponencial, etc.

Existen otros métodos de pronósticos de series de tiempo. Algunos de ellos son:

Suavizamiento exponencial lineal de Brown
Suavizamiento exponencial lineal de Holt
Suavizamiento exponencial cuadrático
Suavizamiento exponencial de Winter
Modelos ARIMA

6. PROYECCIÓN CAUSAL

6.1. Conceptos básicos

En muchas investigaciones de tipo estadístico, el objetivo es determinar a partir de información histórica o experimental, relaciones o funciones mediante las cuales se puedan realizar pronósticos, lo más exactamente posible, entre dos o más variables relacionadas entre sí. Los análisis de regresión y correlación brindan al investigador las herramientas necesarias para cumplir este objetivo.

Para que sea valiosa desde el punto de vista de la proyección, cualquier variable independiente debe ser un indicador anticipado. Por ejemplo, se puede esperar que un periodo extenso de lluvias incremente la venta de paraguas e impermeables. Esto es una relación causal, en la cual una ocurrencia causa la otra. Si el elemento causante se puede prever con anticipación, puede utilizarse como base de la proyección.

El primer paso en la proyección de la relación causal es encontrar las ocurrencias que constituyen realmente las causas. Pueden ocurrir varios escenarios al tratar de encontrar las causas:

Algunos indicadores anticipados no son relaciones causales pero, de manera indirecta, pueden sugerir la ocurrencia de algunas otras causas.
Otras relaciones causales pueden existir solo como coincidencia. Ej: Las ventas de alcohol en Suecia era directamente proporcional a los salarios de los profesores. Esta es una relación falsa o también
denominada espuria.

El objeto básico de la econometría es determinar y estimar un modelo de relación entre las variables económicas de un determinado sistema. Ejemplo: Para analizar si la expansión monetaria ha sido inflacionaria, se determinará un modelo entre la tasa de inflación y la tasa de crecimiento histórica de algún agregado monetario.

Este modelo tiene la siguiente forma general:
( )
donde y es la variable cuyo comportamiento se pretende explicar y x1, x2, ..., xk son las distintas variables
que se suponen potencialmente relevantes como factores explicativos de la primera. es una lista de
parámetros que recogen la magnitud con que las variaciones en los valores de las variables xi se transmiten a variaciones en la variable y.

Si el estudio se limita a un modelo lineal, se tiene:



La estimación de tales relaciones se efectúa a partir de información muestral acerca de los valores tomados por y, x1, x2, ..., xk y trata de cuantificar la magnitud de la dependencia entre ellas.

Con objeto de ganar precisión entre las variables consideradas, evaluaremos críticamente la validez de las hipótesis propuestas por la teoría económica acerca de las relaciones estimadas, que pueden consistir de dos cuestiones: si cualquier variable explicativa es o no significativa en la relación que se
analiza, o si aparece con un determinado coeficiente.

Ejemplo del primer tipo es: ¿Afecta el precio de la competencia a la demanda del producto?. Ejemplo del segundo es: ¿Tiene la demanda del producto elasticidad precio unitaria?

Para cumplir este objetivo, es crucial que el analista económico:

Delimite claramente la cuestión teórica en la cual se va a basar su ejercicio empírico.
Identifique la variable que pretende explicar y sus determinantes potenciales.
Escoja la información estadística relevante para cuantificar la relación.
Cuantifique, o estime los parámetros desconocidos que aparecen en la relación.
Utilice el modelo de relación estimado y lo contraste con algún supuesto teórico mediante la inferencia estadística.

6.2. Análisis de regresión y correlación

6.2.1. Esquema general

La figura 5.6.1 muestra los tipos de modelos que se pueden determinar mediante un análisis de regresión y los coeficientes que validan el modelo mediante un análisis de correlación.

Figura 5.6.1. Análisis de regresión y correlación

Lineal




Simple





Tipo de
Análisis


Regresión




No Lineal

Potencial

Exponencial

Logarítmica

Polinomial





Múltiple



Correlación

Coeficiente de correlación

Coeficiente de determinación

Coeficiente de no determinación

6.2.2. Análisis de regresión

El análisis de regresión es una técnica empleada para desarrollar una ecuación que permite expresar la relación entre variables y estimar el valor de y (variable dependiente o de respuesta), con base en valores de xi (variables independientes o explicativas).

La técnica consiste en realizar un diagrama de dispersión de los datos a investigar, luego de determinar por medio de él la ecuación de ajuste entre las variables y desarrollar sistemas de ecuaciones que permitan determinarla con base al principio de mínimos cuadrados.

El diagrama de dispersión (o nube de puntos) es una gráfica que presenta la relación entre dos variables de interés.

El principio de mínimos cuadrados es una técnica empleada para llegar a la ecuación de regresión minimizando la suma de los cuadrados de las distancias verticales entre los valores de y observados y los valores pronosticados de y (llamados residuos): esto significa que existe cierto grado de error en las mediciones de las variables explicativas que por supuesto el investigador querrá minimizar.

El principio de mínimos cuadrados minimiza la siguiente función:
( )
donde:

ei = Error de predicción entre el valor de y observado y el estimado (residuo). yi = Ordenadas de los valores observados (datos).
ye = Ordenadas estimadas a partir de la ecuación de regresión. A veces se lo nombra como ̂
El diagrama de dispersión de la figura 5.6.2, aclara todos los conceptos arriba mencionados.

Figura 5.6.2. Diagrama de dispersión


yi












Recta de regresión






yi







ye





ye

yi
Nube de puntos


ye

yi
xi


Una serie de datos de dos variables, pueden poseer varios tipos de tendencias. Dependerá de ellas que la serie pueda ajustarse a un modelo determinado. Los tipos de regresión más usuales se muestran en la figura 5.6.3.

Figura 5.6.3. Tipos de regresión usuales


y

y





x









x
Dependencia lineal

Dependencia lineal inversa

y




y










x
No hay correlación


x
Dependencia parabólica

y





y





x
Dependencia exponencial
directa

x
Dependencia exponencial inversa


Cuando existe una serie donde hay más de dos variables, el modelo más usado es la regresión lineal múltiple. Sin embargo, puede ser no lineal en una o dos variables independientes. En este caso el diagrama de dispersión debe dibujarse en tres dimensiones, como lo muestra la figura 5.6.4.

Figura 5.6.4. Tipos de regresión múltiple

z z












y
y

x x
Dependencia lineal

Dependencia no lineal



6.2.3. Análisis de correlación (Calidad de ajuste)

Mide la bondad o calidad de ajuste entre los valores observados (datos) y los valores calculados con la ecuación de regresión hallada, mediante 3 coeficientes:

Coeficiente de correlación.
Coeficiente de determinación.
Coeficiente de no determinación.

6.2.3.1. Coeficiente de correlación

Dada la función, el coeficiente de correlación permite determinar el grado de asociación que existe en la relación de dependencia de las variables consideradas. Dicho de otro modo mide la intensidad de la relación entre las variables consideradas, mediante la siguiente expresión:
̅ ̅ ̅

Donde:

Varianza total: Varianza Explicada: Varianza no explicada:

( ̅)

( ̅)
̅

( )
̅̅
Se cumple que: ̅ ̅̅
la varianza total es igual a la suma de la varianza explicada y la no explicada.

El esquema de la intensidad y dirección del coeficiente de correlación está mostrado en la figura 5.6.5

Figura 5.6.5. Intensidad del coeficiente de correlación

Negativa perfecta



intensa



moderada



débil

Ninguna correlación



débil



moderada



intensa

Positiva perfecta

-1 -0.5

0 0.5 1

Fuente: Mason y Lind. Estadística para Administración y Economía, 1995.

Conviene obtener un valor del coeficiente de correlación cercano a 1 o -1, porque indicará una gran intensidad de la relación entre las variables consideradas, sea directa o inversa, respectivamente, con el modelo considerado.

6.2.3.2. Coeficiente de determinación y no determinación

Mide la proporción de la variación total en la variable dependiente, que se explica o se debe a la variación en la(s) variable(s) independiente(s).

Se calcula mediante el cuadrado del coeficiente de correlación y generalmente se lo expresa como porcentaje:
̅


Conviene obtener un valor del coeficiente de determinación cercano a 100%.

El coeficiente de no determinación mide la proporción de la variación total en la variable dependiente, que no se explica o se debe a la variación en la(s) variable(s) independiente(s), sino a otro tipo de variables no consideradas en el modelo: . Conviene obtener un valor del coeficiente de no determinación cercano a 0%.

6.2.4. Regresión y correlación lineal

La función de regresión lineal es una función matemática que permite mostrar la relación de causalidad que existe entre las variables, mediante la relación:

donde: , es la ordenada al origen.
, es la pendiente de la recta.

Suponemos que cada y (cada par de observaciones) puede ser descrita por el modelo:



donde ei es el error experimental (también denominado por ui), que es una variable aleatoria independiente distribuida normalmente con media 0 y varianza llamada perturbación estructural o término de error del modelo (residuo).
Denotando con a y b a las estimaciones de y se puede estimar la recta mediante:



donde: a = Ordenada al origen.
b = Pendiente de la recta.

Ej: Una familia quiere determinar una función que le permita estimar su consumo (de un artículo específico) en base a sus ingresos. Para ello reunió la siguiente información (Tabla 5.6.1):

Tabla 5.6.1. Ingreso y consumo de una familia

xi
yi
15
18
20
21
25
24
32
27
38
35

Sea: yi = consumo en unidades
xi = ingreso en decenas de Bs.

a) Halle la función de regresión y determine su correlación.
b) ¿Cuánto gastaría la familia si su ingreso es de 42, 50 y 87 decenas de Bs.? El procedimiento que se sigue para determinar dicha función de regresión es:

1er Paso. Definir el diagrama de dispersión o nube de puntos que permite establecer la naturaleza de la función matemática existente entre los datos cuya relación se busca (Gráfico 5.6.1).

Gráfico 5.6.1. Ingreso y consumo de una familia

40

35

30

Consumo25
Consumo

20

15
15 20 25 32 38

Ingreso

La nube de puntos sugiere una línea recta de la forma:

En este caso se tiene el caso de una regresión "y en x" ("consumo función ingreso").
2do Paso. Se aplica el método de mínimos cuadrados, minimizando ( ) , siendo
, donde yi, xi son datos y a, b son parámetros a determinar. Derivando parcialmente ( )
respecto de a y b, e igualando a cero se obtiene el sistema de ecuaciones normales, que permiten hallar
el valor de dichos parámetros.
Dichas ecuaciones son:




Despejando las constantes a y b, de las anteriores ecuaciones se tiene:


̅
( )

3er Paso. Se calcula a y b, parámetros de la función de regresión:
Se calcula ( ) y ( ) en columnas (3) y (4) respectivamente (Tabla 5.6.2).
Tabla 5.6.2. Cálculo de los coeficientes de regresión y de correlación del consumo de una familia

xi
yi
xi * yi
2
xi
ye
( ̅)
( ̅)
15
18
270
225
17
49
64
20
21
420
400
21
16
16
25
24
600
625
24
1
1
32
27
864
1024
29
4
16
38
35
1330
1444
33
100
64
130
125
3484
3718

170
161

Reemplazando valores en las fórmulas:
( ) ( )
( ) ( )


( ) ( )

Luego: , que es la función de regresión.

4to Paso. Dado , se estima cuanto gastaría la familia si el ingreso es 42, 50 y 87 decenas de
Bs.

Reemplazando los valores en la función de regresión:
( )
( )
( )
La correlación se determina mediante los siguientes cálculos:


1) Halle ̅: ̅
2) Calcule ( ̅) en columna (6).
3) Calcule ( ̅) en columna (7).
4) Reemplace los valores hallados para calcular el coeficiente de correlación:

( ̅)

( ̅)
̅



Conclusión: Como , se puede decir que existe alta correlación positiva entre "x" y "y" o una relación intensa entre el ingreso y el consumo.

El coeficiente de determinación será el siguiente:



Conclusión: Se puede concluir que el 94,7% de la variación en el consumo se explica por la variación en el ingreso y un 5,3% se explica o se debe a otras variables no consideradas.

Nota: Una fórmula alternativa para hallar la correlación y la determinación, sólo en el caso lineal, es:

[ ( ) ][ ( ) ]

Vamos a ver más detenidamente los supuestos del modelo lineal.

1) Linealidad en las variables

En la mayoría de los casos en los que un modelo lineal es excesivamente restrictivo, el modelo lineal es una buena aproximación al verdadero no lineal, de relación entre variable dependiente e independiente.

2) Esperanza matemática nula.

Suponemos que la esperanza matemática del término del error ei (o ui) del modelo es cero.

3) Homocedasticidad o varianza constante.

Suponemos que la varianza del término del error es observaciones muestrales.

4) Ausencia de autocorrelación.

2 y es constante a lo largo de todas las

Suponemos que los términos de error correspondientes a dos observaciones muestrales cualesquiera, que son dos variables aleatorias diferentes, son estadísticamente incorrelacionadas.

5) Estabilidad temporal.

Los coeficientes del modelo son constantes en el tiempo; igualmente creemos que el modelo es el mismo para todas las observaciones muestrales.

6) Causalidad unidireccional.

Suponemos que existe una relación causal desde la variable explicativa x hacia la variable y, pero no al revés.

7) Variables explicativas deterministas

La variable explicativa x, debe ser determinista. La variable endógena y no lo es, pues depende de la evolución de una variable aleatoria, el término del error del modelo.
6.2.5. Regresión y correlación múltiple

En general, una variable dependiente puede tener más de un factor explicativo, por lo que el modelo de regresión simple puede ser muy sencillo para la mayoría de las aplicaciones de interés. Cuando hay varias variables independientes determinando el comportamiento de una dependiente, deben considerarse todas ellas simultáneamente.

Los datos de cualquier problema de regresión múltiple que contemplen dos variables independientes, se ajustarán a una ecuación de este tipo:



Usaremos para realizar la estimación la siguiente ecuación. Los datos de cualquier problema de regresión múltiple que contemplen dos variables independientes, se ajustarán a una ecuación de este tipo:


donde: a, b, c, son parámetros a calcular mediante el análisis de regresión. x1 y x2, son las variables independientes
y, es la variable dependiente.

Según mínimos cuadrados, se tendrá que minimizar la siguiente expresión:
( )
Las ecuaciones que resultan son las siguientes:




{

Ej: Una compañía desea estimar el monto a pagar a sus ejecutivos en base a su edad y al número de años que estudiaron en la universidad. Para ello obtuvo la siguiente información histórica (Tabla
5.6.3):

Edad de los ejecutivos de una compañía
No. de años que estuvieron en la Universidad y = Ingresos anuales (miles de $).

Tabla 5.6.3. Ingreso de ejecutivos en función de su edad y años de estudio

x1
x2
y
37
4
51,2
45
0
46,8
38
5
55,0
42
2
50,3
31
4
45,4

a) Ajuste los datos a una ecuación lineal múltiple.
b) Estime cuánto ganará en promedio un ejecutivo recién contratado por la compañía, si tiene 40 años de edad y estuvo 4 años en la Universidad.

Los cálculos nos llevan a los siguientes resultados (Tabla 5.6.4).

Tabla 5.6.4. Cálculo de los coeficientes de regresión y correlación del ingreso de ejecutivos

x1
x2
Y
2
x1
x1*x2
x1*y
2
x2
x2*y
ye
( ̅)
( ̅)
37
4
51,2
1369
148
1894,4
16
204,8
51,1770
2,1316
2,0650
45
0
46,8
2025
0
2106,0
0
0
46,9618
8,6436
7,7184
38
5
55,0
1444
190
2090,0
25
275,0
55,1135
27,6676
28,8745
42
2
50,3
1764
84
2112,6
4
100,6
50,0303
0,3136
0,0843
31
4
45,4
961
124
1407,4
16
181,6
45,4116
18,8356
18,7350
193
15
248,7
7563
546
9610,4
61
762,0

57,5920
57,4772

Reemplazando los valores hallados en el sistema de ecuaciones:
{
( )
La ecuación de regresión múltiple es:



Luego se realizan los cálculos para el análisis de correlación:
̅


Conclusión: Se puede concluir que existe una relación intensa (casi perfecta) entre la edad de los ejecutivos, el número de años que estudiaron en la universidad y sus ingresos anuales. Además que el
99,8% de la variación en sus ingresos está explicada por la variación de su edad y su formación académica.

Por lo tanto la estimación que realizará la compañía de los ingresos del nuevo ejecutivo es muy confiable:
( ) ( )
El nuevo ejecutivo ganará 54060 $us anuales.

6.2.6. Regresión y correlación no lineal

Se determinó que aplicando mínimos cuadrados a la función lineal: , las ecuaciones normales eran:


Si la función es: (función exponencial)

Aplicando logaritmos: , las ecuaciones normales son:


Si la función es: (función potencial)

Aplicando logaritmos: , las ecuaciones normales son:

( )
Nota: El lector, a través de los mínimos cuadrados puede determinar las ecuaciones de regresión para
cualquier función que sea más adecuada a los datos experimentales.

Ej: Las cifras siguientes son datos sobre el porcentaje de las llantas radiales producidas por cierto fabricante que aún pueden usarse después de recorrer cierto número de millas (Tabla 5.6.5):

Tabla 5.6.5. Porcentaje útil de llantas en función del recorrido

Millas recorridas
(miles)
Porcentaje
útil
1
98,2
2
91,7
5
81,3
10
64,0
20
36,4
30
32,6
40
17,1
50
11,3

Ajuste a una curva exponencial y estime qué porcentaje útil tendrán las llantas radiales del fabricante si recorrieron 25000 millas. Los cálculos son los siguientes (Tabla 5.6.6):

Tabla 5.6.6. Cálculos de los coeficientes de regresión y correlación del porcentaje útil de llantas

x
y
ln y
x2
x*ln y
ye
( ̅)
( ̅)
1
98
4,587
1
4,59
96,024
1947,02
1759,73
2
92
4,519
4
9,04
91,946
1415,64
1434,20
5
81
4,398
25
21,99
80,721
741,20
710,01
10
64
4,159
100
41,59
64,975
98,51
118,81
20
36
3,595
400
71,89
42,098
312,41
143,45
30
33
3,484
900
104,53
27,276
461,18
718,20
40
17
2,839
1600
113,56
17,672
1367,15
1325,15
50
11
2,425
2500
121,24
11,450
1829,70
1816,88
158
433
30,005
5530
488,43

8172,80
8026,44

Reemplazando los valores hallados en el sistema de ecuaciones:
{
( )
( )
La ecuación resultante es: ( )
Realizando el análisis de correlación:
̅

Se concluye que existe una relación intensa entre las millas recorridas y el porcentaje útil que aun tienen las llantas. El 98,21% de la variación en el porcentaje útil se debe a la variación en las millas recorridas por las llantas. Por lo tanto, la estimación que se realizará mediante la ecuación de regresión hallada es confiable.
( )
El porcentaje útil de las llantas luego de recorrer 25000 millas será de 33,86%

6.2.7. Regresión y correlación no lineal múltiple

Dependiendo de la situación, los modelos son muy variados. Aquí presentamos un ejemplo de modelación por medio de la función de producción de Cobb-Douglas.

La producción Q en una fábrica, con frecuencia se considera como una función de la cantidad K de la inversión de capital y del tamaño L de la fuerza laboral.

Las funciones de producción de la forma:
( )
donde A y son constantes positivas y , han demostrado ser especialmente útiles en el análisis
económico.

Ejemplo

Un investigador quiere averiguar si los datos de producción de una compañía pueden ser modelados mediante una función de Cobb-Douglas (rendimientos constantes a escala). Para ello recopiló datos históricos mostrados en la Tabla 5.6.7 que relaciona la cantidad invertida (K en miles de dólares), el tamaño de la fuerza laboral (L en miles de horas-Hombre) y la producción (Q en miles de unidades al año).

Tabla 5.6.7. Producción en función a la inversión y la fuerza laboral

K
L
Q
10
10
900
15
10
1220
20
20
1800
25
20
2128

Mediante el método de mínimos cuadrados, se hallan las ecuaciones para determinar los parámetros de la ecuación de Cobb-Douglas:
( ) donde
Aplicando logaritmos a la ecuación de Cobb-Douglas:
( )
Realizando un cambio de variables:


Minimizando: ( )

( )

( ) ( )

( ) ( )

( ) ( )


Repartiendo la sumatoria y multiplicando:














Volviendo al cambio de variable:

( )
( )
Calculando las sumatorias requeridas (Tabla 5.6.8):

Tabla 5.6.8. Cálculos para determinar los parámetros de la ecuación de Cobb-Douglas

K
L
Q
lnK
lnL
lnQ
LnK LnL
(LnK)2
(LnL)2
Ln K LnQ
Ln L LnQ
10
10
900
2,3026
2,3026
6,8024
5,3019
5,3019
5,3019
15,6631
15,6631
15
10
1220
2,7081
2,3026
7,1066
6,2355
7,3335
5,3019
19,2450
16,3636
20
20
1800
2,9957
2,9957
7,4955
8,9744
8,9744
8,9744
22,4546
22,4546
25
20
2128
3,2189
2,9957
7,6629
9,6429
10,3612
8,9744
24,6660
22,9561
70
60
6048
11,2252
10,5966
29,0675
30,1547
31,9710
28,5526
82,0288
77,4374

Sustituyendo en las ecuaciones y resolviendo, se hallan los siguientes parámetros de regresión:

La ecuación de Cobb-Douglas será:

( )
Luego se realiza el análisis de correlación (Tabla 5.6.9):

Tabla 5.6.9. Cálculos para determinar el análisis de correlación

Qe
( ̅ )
( ̅ )
900,0045
374544
374538,4874
1219,9939
85264
85267,5654
1799,9836
82944
82934,5727
2128,0193
379456
379479,8395

922208
922220,4650

Entonces:





Interpretación: Existe una relación perfecta entre la producción, la inversión y el tamaño de la fuerza laboral.



Interpretación: el 100% de la variación de la producción se explica por la variación de la inversión y la fuerza laboral. El 0% es explicado por otras variables no consideradas en el modelo.
CASO

PREDICCIÓN DE LA CIRCULACIÓN DEL PERIÓDICO DEL DOMINGO


Usted trabaja en el departamento de mercadotecnia de una cadena nacional de periódicos. La compañía matriz se interesa en investigar la factibilidad de iniciar una edición dominical para algunos de sus periódicos. Sin embargo, antes de tomar la última decisión, es necesario estimar la circulación que puede esperarse para el domingo. En particular, desea predecir la circulación del domingo de tres periódicos (en tres ciudades distintas) que tienen una circulación diaria respectiva de 200000, 400000 y 600000.

Le han pedido que desarrolle un modelo que le permita predecir la circulación dominical esperada y escribir un informe con los resultados y el resumen de lo que encontró. Con este propósito, los datos recopilados de una muestra de 32 periódicos son los siguientes:


Periódico

Circulación (miles)

Periódico
Circulación
(miles)

Diario
Domingo

Diario
Domingo
Des Moines Register
164659
278803
Portland Oregonian
353745
440096
Philadelphia Inquirer
422829
865989
Washington Post
818231
1123305
New York Times
1107168
1644128
Long Island Newsday
559233
646446
New York Daily
News

619032

974034

San Diego Union Tribune

383263

456494
Sacramento Bee
285762
353366
Chicago Sun Times
491143
438337
Los Angeles Times
1068812
1361988
Minneapolis Star Tribune
355743
673264
Boston Globe
466317
751377
Baltimore Sun
326636
471637
Cincinnati Enquirer
202973
322238
Pittsburgh Post Gazette
241798
437864
Miami Herald
362184
492235
Rocky Mountain News
326189
415962
Chicago Tribune
664586
1045756
Boston Herald
285930
193462
Detroit News
236246
789666
New Orleans Times Picayune
265820
304991
Houston Chronicle
549856
740952
Charlotte Observer
238216
301026
Kansas City Star
278394
415918
Hartford Courant
217759
303191
Omaha World
Herald

234106

291764
Rochester Democrat an
Chronicle

147331

246520
Denver Post
353786
474668
St. Paul Pioneer Press
202922
264732
St. Louis Post
Dispatch

318994

539421

Providence Journal Bulletin

168368

243643

Preguntas

En el informe, se deben incluir los siguientes aspectos:

1. Análisis de regresión.
2. Análisis de correlación.
3. Predicción.
4. Conclusiones.
5. Decisiones.

Este caso de estudio ha sido extractado del libro: Berenson-Levine-Krehbiel. Estadística para
Administración. Segunda Edición.
CASO

SPRINGVILLE HERALD

Antecedentes

Springville representa una amplia área suburbana de cerca de 50 millas fuera de una gran ciudad en el oeste de Estados Unidos. En esencia, esta zona era de uso agrícola antes de la Segunda Guerra Mundial y experimentó una expansión considerable en población e industria entre los años 1950 y 1980, con poco crecimiento a partir de 1980. El Herald, es un periódico que en sus inicios fue administrado por una familia, se publica en forma diaria y dominical desde 1957. Su circulación actual es de 250000 ejemplares entre semana (lunes a sábado) y 300000 ejemplares el domingo, con crecimiento moderado desde 1980. El estado financiero de la compañía es sano, pero en la actualidad los miembros de la alta gerencia están más conscientes de los costos y de la necesidad de mejorar la eficiencia en las operaciones.

Se formó un equipo de trabajo con jefes de nivel corporativo y de departamento para analizar las acciones y esfuerzos que tienden a mejorar la calidad. Estuvieron de acuerdo en que el primer paso era establecer una misión para el periódico que comunicara en forma concreta los objetivos –tanto a los clientes como a los empleados.

Problema

En la implantación de la estrategia corporativa de aumentar las ventas de entrega a domicilio, el departamento de mercadotecnia debe trabajar de cerca con el de distribución para lograr que funcione el proceso inicial de entrega para los clientes de prueba. Esto es importante para asegurar que el mayor número posible de clientes de prueba se conviertan en clientes permanentes, ya que se creará una impresión negativa fuerte si ocurren problemas durante la primera semana de reparto.

Como parte de su responsabilidad en el proceso, es esencial para el departamento de mercadotecnia poder pronosticar el número de suscriptores en los próximos meses. Un equipo formado por administradores de los departamentos de mercadotecnia y distribución, convino en desarrollar un método mejor para pronosticar las nuevas suscripciones. Melissa Hogue, jefa de mercadotecnia, pidió a Lauren May, especialista en pronósticos de mercado, que propusiera algunas ideas acerca de los métodos de pronósticos que se podían usar. Lauren, recién contratada en la compañía por sus habilidades especiales en métodos de pronósticos cuantitativos, preguntó al equipo cómo se habían hecho los pronósticos de las nuevas suscripciones en el pasado. Al Baum, un miembro del equipo, respondió que por lo común, después de examinar las nuevas suscripciones de los dos o tres meses anteriores, un grupo de administradores desarrollaba un pronóstico por consenso. Lauren preguntó si alguien había intentado determinar qué factores podían ser útiles para predecir las nuevas suscripciones cada mes. Todos contestaron que los pronósticos en el último año habían sido bastante inexactos, porque unos meses se realizaba un gran esfuerzo de ventas por teléfono y otros la dedicación era menor.

Lauren sugirió que se obtuvieran los datos de los dos últimos años de los registros de la compañía. En particular estaba interesada en conocer el número de nuevas suscripciones y el número de horas dedicadas a ventas por teléfono cada mes. La siguiente tabla indica el número de nuevas suscripciones para el mes y el número de horas dedicadas a ventas por teléfono.

Ejercicios

a) ¿Qué crítica puede hacer al método de pronósticos que consistía en examinar las nuevas suscripciones de los últimos 3 meses como base para las proyecciones futuras?
b) ¿Qué factores, además del número de horas de venta por teléfono pueden ser útiles para predecir el número de suscripciones?
c) Analice los datos y desarrolle un modelo estadístico para predecir el número de nuevas suscripciones para un mes, con base en el número de horas dedicadas a la venta por teléfono para lograrlas. Escriba un informe con todos los detalles de lo que encontró respecto al modelo que se ajustó a los datos.
d) Si se espera que se dediquen 1000 horas de ventas por teléfono en el siguiente mes, pronostique el número de nuevas suscripciones esperadas para el mes. Indique la suposición en la que se basa este pronóstico. ¿Piensa que estas suposiciones son válidas?
e) ¿Cuál sería el peligro de predecir el número promedio de nuevas suscripciones para un mes en que se dedican 2000 horas a las ventas por teléfono? Explique.

Número de nuevas suscripciones y número de horas dedicadas a ventas por teléfono por mes para un periodo de dos años

Periodo
Horas de ventas por
Nuevas
Periodo
Horas de ventas por
Nuevas
1
1224
5357
13
1435
5836
2
1458
6177
14
1349
5201
3
1006
4795
15
965
3775
4
1395
5692
16
985
3592
5
1131
4312
17
1117
4566
6
921
3421
18
840
2974
7
704
2624
19
1412
5673
8
1154
4087
20
940
3554
9
1168
4934
21
1090
4399
10
803
2546
22
1498
6143
11
830
3591
23
1240
4827
12
981
4271
24
1055
5418

Este caso de estudio ha sido extractado del libro: Berenson-Levine-Krehbiel. Estadística para
Administración. Segunda Edición, 2001. Prentice Hall, México.
CASO MUDANZAS EASTWESTSIDE

El propietario de una compañía de mudanzas suburbana, usa un estimador para determinar el número de horas de mano de obra necesarias para una mudanza. Esto le ha resultado útil, pero desea poder desarrollar una estimación más confiable y exacta para predecir las horas de mano de obra. En un esfuerzo preliminar para lograr un medio de estimación con mayor exactitud, recopiló datos de 36 mudanzas en las que el origen y el destino se encuentran en el distrito de Manhattan en la ciudad de Nueva York y el tiempo de viaje es una porción insignificante de las horas trabajadas. Los resultados son los siguientes:



Observación
Horas de
mano de obra


Habitaciones
Pies
cúbicos de mudanza


Observación
Horas de
mano de obra


Habitaciones
Pies
cúbicos de mudanza
1
24
3,5
545
19
25
3
557
2
13,5
2
400
20
45
5,5
1028
3
26,25
2,5
562
21
29
4,5
793
4
25
3
540
22
21
3
523
5
9
1
220
23
22
3,5
564
6
20
3
344
24
16,5
2,5
312
7
22
3,5
569
25
37
4
757
8
11,25
2
340
26
32
3,5
600
9
50
5
900
27
34
4
796
10
12
1,5
285
28
25
3,5
577
11
38,75
5
865
29
31
3
500
12
40
4,5
831
30
24
4
695
13
19,5
3
344
31
40
5,5
1054
14
18
2,5
360
32
27
3
486
15
28
4
750
33
18
3
442
16
27
3,5
650
34
62,5
5,5
1249
17
21
3
415
35
53,75
5
995
18
15
2,5
275
36
79,5
5,5
1397

Desarrolle un modelo para predecir las horas de mano de obra basadas en el número de habitaciones y el número de pies cúbicos de mudanza del departamento de origen. Escriba un resumen ejecutivo de no más de una página con sus conclusiones. Además, entregue un apéndice técnico que proporcione y explique los resultados estadísticos.

Este caso de estudio ha sido extractado del libro: Berenson-Levine-Krehbiel. Estadística para
Administración. Segunda Edición, 2001. Prentice Hall, México.
CASO

MOUNTAIN STATE POTATO COMPANY


Mountain States Potato Company es una empresa que procesa papas en el este de Idaho. Un producto secundario del proceso, llamado pastel filtrado se vende como alimento para ganado. Hace poco un ganadero se quejó de que el ganado no subía de peso y pensaba que el problema estaba en el pastel filtrado que le compran a la compañía. En un principio, todo lo que se sabía del pastel filtrado era que los registros históricos mostraban que el porcentaje de sólidos se aproxima a 11.5% en años anteriores. En la actualidad, el contenido de sólidos estaba entre 8 y 9%. Se habían hecho varias adiciones en los años intermedios para aumentar en forma significativa el volumen de agua y sólidos y la temperatura de depuración. Lo que en realidad afectaba a los sólidos era un misterio, pero como la planta tenía que desechar sus sólidos si quería operar, debía hacer algo rápido. La única solución práctica fue determinar una forma de hacer que el contenido de sólidos subiera de nuevo a los niveles anteriores.

Se pidió a las personas que participaban en el proceso, que identificaran las variables que se podían manipular para variar el contenido de sólidos. Con esta revisión se obtuvieron 6 variables que afectarían el porcentaje de sólidos. Las variables incluidas en el estudio son:

Variable
Explicación
Sólidos
Porcentaje de sólidos en el pastel filtrado
pH
Acidez. Indica la acción bacterial en el depurador. Cuando la acción bacterial
evoluciona, se producen ácidos orgánicos que pueden medirse mediante el pH. Este se controla con el tiempo fuera de servicio del sistema
Inferior
Presión de la línea de vacío menor que de la línea de fluido en el tambor rotatorio
Superior
Presión de la línea de vacío mayor que de la línea de fluido en el tambor rotatorio
Grueso
Grueso del pastel medido en el tambor
Varidriv
Control de la velocidad del tambor. Puede diferir de Drumspd debido a
ineficiencias mecánicas
Drumspd
Velocidad a la que gira el tambor cuando se recolecta el pastel filtrado. Se mide
con la ayuda de un cronómetro

Los datos se obtuvieron al supervisar el proceso en varios tiempos al día, durante 20 días, y se dan en la tabla siguiente.

Desarrolle un modelo de regresión para predecir el porcentaje de sólidos. Escriba un resumen ejecutivo dirigida al presidente de Mountain States Potato Company.

Este caso de estudio ha sido extractado del libro: Berenson-Levine-Krehbiel. Estadística para
Administración. Segunda Edición, 2001. Prentice Hall, México.

Sólidos
pH
Inferior
Superior
Grueso
Varidriv
Drumspd
9,7
3,7
13
14
0,25
6
33
9,4
3,8
17
18
0,875
6
30,43
10,5
3,8
14
15
0,5
6
34
10,9
3,9
14
14
0,5
6
34
11,6
4,3
17
18
0,375
6
36,24
10,9
4,2
16
17
0,5
6
31,76
11
4,3
16
19
0,375
6
34
10,7
3,9
15
16
0,375
6
32,13
11,8
3,6
8
8
0,375
6
37
9,7
4
18
18
0,5
6
36
11,6
4
12
13
0,313
5
45
10,9
3,9
15
15
0,5
5
50
10
3,8
17
18
0,625
5
46,91
10,3
3,8
13
14
0,5
4
57,5
10,1
3,6
17
17
0,625
4
60,4
9,9
3,8
17
18
0,5
4
53,14
9,5
3,5
17
18
0,625
6
34,4
10,5
3,8
15
17
0,5
6
33,96
10,8
3,9
15
17
0,75
6
35
10,4
3,9
14
15
0,5
6
35
10,9
4
15
16
0,5
6
34
11,2
4,4
17
19
0,375
6
34
9,5
3,8
17
17
0,5
6
33,49
10,7
3,9
15
17
0,5
6
33,38
10,1
3,8
15
17
0,5
6
41
10,5
3,8
17
17
0,5
6
36
10,9
4
15
17
0,25
6
34
15,5
4,3
13
15
0,625
6
41
13,1
4
17
17
0,5
6
35
11
4
14
15
0,375
6
36
12,5
4,2
15
17
0,313
6
37,72
11,7
4,2
14
14
0,25
6
36
11,9
4,4
15
16
0,375
6
36,52
11,7
3,4
8
10
0,313
6
38,08
17,8
4,3
12
12
0,313
6
38
11,8
4,5
14
15
0,25
6
33
10
3,7
12
13
0,25
5
48
10,3
3,7
15
15
0,5
5
48
9,8
3,8
14
15
0,5
5
47,24
10
3,7
13
14
0,5
6
37
10,6
4,1
14
15
0,5
6
33,7
11,2
3,9
13
14
0,375
6
38,26
10,9
3,7
13
14
0,313
6
38
11
4,1
13
14
0,375
6
37
11
4,1
14
15
0,375
6
38
11,7
4,5
14
14
0,25
6
36,26
11,8
4,4
13
14
0,25
6
37,45
12
4,2
13
13
0,375
6
38
11,8
4,6
14
14
0,375
6
36,9
11,1
4
14
15
0,5
6
37
11,6
3,9
14
14
0,5
6
37,5
11
4
14
15
0,5
6
36
11,2
3,9
15
15
0,313
6
35
11
4,2
14
14
0,375
6
37
144
CASO

LA AEROLÍNEA NORTE - SUR


En 1994, las Aerolíneas del Norte se fusionaron con las Aerolíneas del Sudeste para crear la cuarta empresa más importante de transportes de los Estados Unidos. La nueva Aerolínea Norte – Sur heredó una envejecida flota de aviones Boeing 727-200 y a Stephen Ruth. Ruth era un duro ex secretario de la Armada, que se incorporó como nuevo presidente de la compañía.

La primera preocupación de Ruth para la creación de una compañía financieramente sólida eran los costos de mantenimiento. Estaba comúnmente asumido, en la industria aeronáutica, que los costos de mantenimiento crecían con la edad de los aviones. Rápidamente advirtió que históricamente había existido una diferencia significativa en los informes sobre costos de mantenimiento de los 727-200 (impreso 41 de la ATA), tanto en las áreas de fuselaje como de motores entre las Aerolíneas del Norte y las del Sudeste, teniendo esta última una flota más nueva.

El 12 de noviembre de 1994, Peg Young, Vicepresidente de Operaciones y Mantenimiento, fue llamado al despacho de Ruth y se le pidió que estudiase el asunto. En concreto, Ruth quería saber (1) si la edad media de la flota estaba correlacionada con los costos directos de mantenimiento de fuselaje y (2) si existía una relación entre la edad media de la flota y los costos directos de mantenimiento de motores. Young debía dar una respuesta, con descripciones gráficas y cuantitativas de las relaciones, el 26 de noviembre.

El primer paso de Young, fue poner a trabajar a su equipo en la determinación de la edad m edia de las flotas de B727-200 del Norte y del Sudeste, por trimestres, desde la introducción de este avión en cada aerolínea a finales de 1985 y principios de 1986. La edad media de cada flota fue calculada multiplicando el número total de días de calendario que el avión había estado en servicio hasta el momento considerado por la utilización media diaria de las respectivas flotas, dando el total de horas voladas por la flota. El total de horas voladas por la flota se dividía entonces por el número de avio nes en servicio en ese momento, dando la edad del avión "medio" de la flota.

La utilización media se halló calculando el total de horas reales de vuelo hasta el 30 de septiembre de
1993 de los datos de la del Norte y la del Sudeste, y dividiéndolas por el total de días de servicio de todos los aviones hasta ese momento. La utilización media para la del Sudeste era de 8,3 horas por día, mientras que en la del Norte era de 8,7 horas por día. Debido a que los datos de costos disponibles se calcularon para cada periodo anual acabando al final del primer trimestre, la edad media de la flota fue calculada en los mismos instantes de tiempo.

Los datos de la flota se muestran en la tabla siguiente. Los costos de fuselaje y de motores están ambos emparejados con la edad media de la flota en esa tabla.

Cuestiones de discusión

1. Prepare la respuesta de Peg Young a Stephen Ruth.

Caso extractado del libro "Dirección de la Producción. Decisiones Estratégicas", de Jay Heizer y Barry
Render, Cuarta Edición, Prentice Hall,1997.
Datos sobre los aviones Boeing 727-200 de las aerolíneas Norte-Sur


Datos de las aerolíneas del Norte
Datos de las aerolíneas del Sudeste
Año
Costo de fuselaje por
aeronave
Costo de motores
por aeronave
Edad media
(Horas)
Costo de fuselaje por
aeronave
Costo de motores
por aeronave
Edad media
(Horas)
1987
51,80
43,49
6,512
13,29
18,86
5,107
1988
54,92
38,58
8,404
25,15
31,55
8,145
1989
69,70
51,48
11,077
32,18
40,43
7,360
1990
68,90
58,72
11,717
31,78
22,10
5,773
1991
63,72
45,47
13,275
25,34
19,69
7,150
1992
84,73
50,26
15,215
32,78
32,58
9,364
1993
78,74
79,60
18,390
35,56
38,07
8,259

* Los datos y nombres de las aerolíneas e individuos han sido cambiados en este caso para mantener la confidencialidad. Los datos y temas aquí descritos son reales.
CASO COMERCIALIZADORA DE COLA DIETÉTICA

Un almacén de comestibles vende dos marcas de cola dietética. Las cifras de ventas revelan que si la primera marca se vende a x centavos por lata y la segunda marca a y centavos por lata, los
consumidores comprarán ( ) latas de la primera marca por semana. En la
actualidad, la primera marca se vende a 45 centavos por lata y la segunda a 48 centavos por lata. El
almacén quiere realizar algunas pruebas de mercado, para adoptar una estrategia de ventas.

Preguntas

a) ¿Cuáles son los valores de las constantes a, b y c de la ecuación de la demanda (Redondear al primer decimal)? Se tienen los siguientes datos del mercado:

x
y
Q
40
40
80
45
48
65
40
45
123
42
40
47
35
40
155
38
42
128
40
42
96
41
41
72
42
42
64
43
45
73

b) Realice el análisis de correlación y prediga cuál será la demanda si el precio de la primera marca es de 40 y el de la segunda es de 50 centavos.

c) ¿Cómo cambiará la demanda porcentual de la primera marca de cola dietética si el precio de ésta aumenta en 2 centavos por lata, mientras que el precio de la segunda marca disminuye en un centavo por lata?

d) ¿En qué porcentaje cambiará la demanda de la primera marca si el precio de la segunda se incrementa en 1%?

Caso extractado del libro "Dirección de la Producción. Decisiones Estratégicas", de Jay Heizer y Barry
Render, Cuarta Edición, Prentice Hall, 1997.
CASO NORTHWESTERN HOSPITAL SUPPLY

Suzi Trotter fue contratada por una compañía que provee a hospitales, la Northwestern Hospital Supply Inc., hace dos años, como representante de ventas. Debido a que logró incrementar las ventas en el occidente de Oregon, Suzi fue transferida a operaciones, en donde es analista de operaciones. Sabe que, si logra buenos resultados en este puesto, probablemente sea gerente regional de operaciones o gerente en el área de ventas en un lapso de 12 a 36 meses.

La primera asignación de trabajo a Suzi es el de recomendar un procedimiento de pronóstico por elemento para una familia de partes que incluye artículos ortopédicos. La demanda para un artículo representativo, rollos para recubrimiento, se muestra en la tabla siguiente. El procedimiento normal de pronóstico para este artículo es un estimado intuitivo realizado por un empleado experimentado en abastecimientos. Después de revisar sus notas de clase de un curso de operaciones que tomó hace tres años en la Universidad Estatal de Oregon, Suzi decidió probar un modelo de pronóstico, suavizado exponencial de primer orden. Su supervisora piensa que los datos son estacionales y le gustaría contar con un modelo representativo de la estacionalidad. A Suzi le gustaría emplear la computadora de la compañía para probar valores diferentes de los coeficientes de suavizado, pero no está segura de sus habilidades como programadora.

Después de pensar sobre un modelo de pronóstico y sobre la selección de parámetros (tales como valores iniciales y coeficientes de suavizado), Suzi ha decidido usar MAD como primer mecanismo de evaluación. Ha oído hablar del sesgo, pero no recuerda nada significativo que la convenza para emplearlo.

Tiempo
(Semanas)

Ventas
Tiempo
(Semanas)

Ventas
Tiempo
(Semanas)

Ventas
Tiempo
(Semanas)

Ventas
1
1084
13
1023
25
964
37
903
2
1056
14
1003
26
936
38
883
3
1090
15
1036
27
970
39
916
4
953
16
835
28
833
40
715
5
868
17
747
29
748
41
691
6
868
18
856
30
847
42
736
7
1034
19
1008
31
905
43
888
8
1088
20
1036
32
968
44
908
9
1069
21
920
33
861
45
909
10
856
22
805
34
736
46
685
11
876
23
816
35
757
47
696
12
796
24
776
36
752
48
692

Preguntas

1. Hacer una gráfica con los datos e identificar cualquier patrón que se observe a partir de la gráfica.

2. Diseñar un procedimiento de análisis para Suzi Trotter. Incluir los modelos de pronóstico, medidas de evaluación y el procedimiento para determinar los valores iniciales y los parámetros del modelo para cualquier tipo que se desee probar.

3. ¿Qué tanto se podrían modificar los modelos de la media móvil sencilla y exponencial de primer orden para que pudieran incluir ajustes para tendencias y para datos estacionales?

4. Llevar a cabo el análisis recomendado en la pregunta 2.

5. Discutir los problemas de implementación que Suzi podría encontrar una vez que haya completado su análisis.

Caso extractado del libro "Dirección de la Producción. Decisiones Estratégicas", de Jay Heizer y Barry
Render, Cuarta Edición, Prentice Hall, 1997.
CASO BARDSTOWN BOX COMPANY

La Bardstown Box Company es una pequeña empresa particular situada en Bardstown, Kentucky. Las acciones de la compañía están repartidas entre tres hermanos, de los cuales el accionista principal es el fundador Bob Wilson, quien fundó la empresa hace 20 años, cuando renunció como vendedor de un importante fabricante de cajas de cartón corrugado.

Bob atribuye su éxito al hecho de que él puede servir mejor que cualquiera de sus competidores más importantes al área de cinco estados que considera como "su territorio". Bardstown Box proporciona cajas de cartón corrugado a muchas destilerías regionales y a varias fábricas de cerveza. Al mismo tiempo imprime sobre pedido cajas de tamaño estándar para muchas pequeñas empresas fabricantes de la región. Bob considera que los fabricantes más importantes de cajas no pueden proporcionar económicamente este nivel de servicio personal a sus clientes.

Bob reconoce el riesgo que representa el depender demasiado de un solo cliente y ha adoptado la política de que ninguno de sus clientes puede representar más del 20% de las ventas. Dos de las destilerías representan cada una un 20% de las ventas, de manera que sus compras están limitadas. Bob convenció a los agentes de compras de esas dos empresas para que agregasen a otros proveedores, puesto que ese suministro alternativo les protegerá contra cualesquiera problemas que se puedan presentar en Bardstown con respecto a embarques, escasez de cartón o cuestiones laborales.

En la actualidad, Bardstown tiene más de 600 clientes, cuyos pedidos van desde 100 cajas hasta compras generales de 50000 cajas al año. Las cajas se producen en 16 tamaños estándar, con impresiones especiales de acuerdo con las especificaciones de los clientes. El equipo de impresión de Bardstown limita este trabajo a dos colores. La estandarización y la impresión limitada permite a Bardstown competir en precio con los grandes productores; pero la empresa proporciona también el servicio para pedidos pequeños y de "urgencia" que los grandes fabricantes de cajas no pueden atender.

Sin embargo, este servicio personal exige un rígido control del inventario y una programación precisa de la producción. Hasta ahora, Bob Wilson ha pronosticado siempre la demanda y elaborado sus programas de producción recurriendo a su experiencia; pero debido al creciente número de cuentas y a los cambios de personal en los departamentos de compras de sus clientes, la precisión de sus pronósticos ha disminuido con rapidez. El número de pedidos pendientes va en aumento, las entregas tardías se vuelven comunes y los niveles de inventario de cajas terminadas aumentan también. Hace poco se rentó un segundo almacén, dado que el principal está lleno. Se tiene la intención de trasladar al espacio rentado, algunas de las cajas que se mueven con más lentitud.

La demanda de cajas ha aumentado siempre antes de la época de navidad, cuando los clientes comienzan a formar sus existencias para la demanda promocional. Esa variación de temporada ha hecho aumentar siempre la dificultad de hacer un pronóstico confiable.

Bob Wilson siente que ahora es muy importante establecer un método mejorado de pronóstico, capaz de tener en cuenta el aumento del número de clientes y la variación de temporada. Piensa que si ese método se puede aplicar al pronóstico de la demanda total, también puede servir para pronosticar la demanda de los clientes más importantes. Luego se podrán integrar los requerimientos de los clientes más pequeños a fin de igualar el volumen de producción y almacenamiento.

Bob ha compilado los datos siguientes de la demanda:


Mes
Ventas (Número de cajas)

1974
1975
1976
1977
1978
Enero
12000
8000
12000
15000
15000
Febrero
8000
14000
8000
12000
22000
Marzo
10000
18000
18000
14000
18000
Abril
18000
15000
13000
18000
18000
Mayo
14000
16000
14000
15000
16000
Junio
10000
18000
18000
18000
20000
Julio
16000
14000
17000
20000
28000
Agosto
18000
28000
20000
22000
28000
Septiembre
20000
22000
25000
26000
20000
Octubre
27000
27000
28000
28000
30000
Noviembre
24000
26000
18000
20000
22000
Diciembre
18000
10000
18000
22000
28000
Totales
195000
216000
209000
230000
265000

Preguntas

1. Establezca un método de pronóstico para Bardstown y pronostique la demanda total para 1979.

2. ¿Cómo podría Bob aumentar la exactitud del pronóstico?

3. ¿Debe la experiencia de Bob con el mercado ser uno de los factores del pronóstico? ¿En qué forma?

Caso extractado del libro "Dirección de la Producción. Decisiones Estratégicas", de Jay Heizer y Barry
Render, Cuarta Edición, Prentice Hall, 1997.
TRABAJO PRÁCTICO 5


1. La Sunrise Baking Company comercializa rosquillas a través de una cadena de almacenes de productos alimenticios. Esta compañía ha experimentado problemas de sobreproducción y subproducción debido a errores de proyección. Los datos siguientes corresponden a su demanda en docenas de rosquillas para las últimas 4 semanas. Las rosquillas se hacen para el día siguiente, de manera que la producción del domingo es para las ventas del lunes y así sucesivamente. La panadería está cerrada los sábados, asi que la producción del viernes tiene que satisfacer la demanda del sábado y la del domingo.


4 semanas atrás
3 semanas atrás
2 semanas atrás
1 semana atrás
Lunes
2200
2400
2300
2400
Martes
2000
2100
2200
2200
Miércoles
2300
2400
2300
2500
Jueves
1800
1900
1800
2000
Viernes
1900
1800
2100
2000
Sábado




Domingo
2800
2700
3000
2900

Realice una proyección sobre las bases siguientes:

a) Diaria, utilizando un promedio móvil de 4 semanas.
b) Sunrise está planeando también sus compras de ingredientes para la producción de pan. Si la demanda de pan se había proyectado en 22000 panes para la última semana y se demandaron realmente 21000 panes solamente, ¿cuál sería la proyección de Sunrise para esta semana utilizando un ajuste exponencial de ?
c) Con la proyección hecha en el anterior inciso suponga que para esta semana la demanda real fue de 22500. ¿Cuál sería la nueva proyección para la próxima semana?

2. Para proyectar la demanda de un producto se utilizó un modelo de proyección específico. A continuación se indican las proyecciones y la correspondiente demanda que se registró posteriormente. Utilice la MAD, sesgo y la TS para evaluar la exactitud del modelo de proyección.

Periodo
Demanda real
Proyección
Octubre
700
660
Noviembre
760
840
Diciembre
780
750
Enero
790
835
Febrero
850
910
Marzo
950
890

3. Se presentan los datos trimestrales de los dos últimos años. Con base en los mismos elabore una proyección para el próximo año utilizando el método de descomposición de series de tiempo, con la tendencia lineal.

Periodo
Demanda real
Periodo
Demanda real
1
300
5
416
2
540
6
760
3
885
7
1191
4
580
8
760

Regresión lineal

4. La tabla siguiente suministra las cifras aproximadas del censo de los Estados Unidos (en millones)
para los 48 estados adyacentes en la primera mitad del siglo XX:

Año
1900
1910
1920
1930
1940
1950
Población
75
91,97
105,7
122,78
131,7
178,5

Use esta recta para "predecir" la población en 1970. (La población real de los 48 estados adyacentes era aproximadamente 200 millones en 1970. Encuentre los coeficientes de correlación y de determinación y exprese su significado.

5. Un funcionario de la oficina de admisiones de un centro de estudios superiores ha reunido los datos siguientes que relacionan los promedios por grados-puntos (PGP) de los estudiantes de enseñanza media y superior.

PGP enseñanza
media
PGP enseñanza
superior
2,0
1,5
2,5
2,0
3,0
2,5
3,0
3,5
3,5
2,5
3,5
3,0
4,0
3,0
4,0
3,5

Halle la ecuación de la recta de los mínimos cuadrados para estos datos y utilícela para predecir el
PGP en la enseñanza superior de un estudiante cuyo PGP en la enseñanza media es de 3,75.

6. Una tienda de departamentos advierte que la tendencia de las ventas de una nueva rasuradora eléctrica es como se da en la siguiente tabla. Halle la ecuación de la línea recta que mejor se ajuste a los datos. Luego, estime las ventas de la rasuradora, en la semana 10.

Semanas
1
2
3
4
5
6
Ventas [u]
20
24
28
33
35
39

Regresión lineal múltiple

7. Usted como gerente de marketing está intentando predecir la demanda anual de su producto estrella "Tapun", utilizando las siguientes variables: Precio = Precio del producto [$], Ingreso = Ingreso del consumidor [cientos de $]. Usted recopiló datos correspondientes al período 1982 - 1985:



Año
Demanda
Precio
Ingreso
1982
60
7
8
1983
70
6
9
1984
65
6
10
1985
65
8
11

a) Encuentre la ecuación de regresión que mejor se ajuste a los datos, los coeficientes de determinación y correlación, e interprételos.
b) ¿Qué valor de demanda predeciría si el precio de los productos fue de 6 $ y el ingreso del consumidor de 1200 $?.

8. Halle la ecuación de regresión para el precio del producto B, a partir de los siguientes datos que obtuvo la empresa de una encuesta:

qA
qB
pB
5
5
20
1
2
19
1
4
17
3
1
22

a) Realice el análisis de correlación para determinar si la función hallada dará pronósticos confiables. b) Pronostique cuál sería el precio de B, si se demandan 4 unidades de A y 2 unidades de B.

Regresión no lineal

9. Los datos siguientes son los beneficios netos de una compañía durante los primeros seis años que ha operado.

Año
Beneficio
(miles de $)
1
112
2
149
3
238
4
354
5
580
6
867

Pronostique el beneficio neto de la compañía para el octavo año que habrá operado en el negocio, si los datos se ajustan a una función exponencial.

10. Los siguientes son datos relacionados con el volumen de un gas (en pulgadas cúbicas) y su presión
(en libras por pulgada cuadrada), cuando el gas está comprimido a una temperatura constante.


Volumen
Presión
50
16,0
30
40,1
20
78,0
10
190,5
5
532,2

Ajuste a una función potencial y estime la presión de este gas cuando está comprimido a un volumen de 15 pulgadas cúbicas.

11. Una empresa, encuentra que cuando el precio de su producto es p dólares por unidad, el número de unidades vendidas es q, como se indica a continuación. Encuentre una ecuación de regresión de q sobre p.

Precio
10
30
40
50
60
70
Demanda
70
68
63
50
46
32

12. La producción en miles de unidades de una empresa desde que comenzó sus operaciones, está dada en la siguiente tabla:

Año
Producción
1991
10
1992
15
1993
16
1994
18
1995
21

Halle la ecuación que mejor se ajuste a los datos y luego estime la producción que la empresa alcanzaría en el año 2000.

13. Una empresa descubre que sus utilidades netas se incrementan al aumentar la cantidad gastada en la publicidad del producto. La empresa dispone de los registros dados en la tabla.

Gasto en publicidad (Miles de $)
10
11
12.3
13,5
15
Utilidades (miles de $)
50
63
68
73
75

Determine la ecuación que mejor se ajuste a los datos y luego estime el dinero que debería gastarse en publicidad a fin de obtener una utilidad de 80000 $.

Regresión no lineal múltiple

14. Se tienen los siguientes datos de la producción de una fábrica que depende de la mano de obra (miles de $) y el equipo (miles de $). ¿Cuál será la producción si se gastan 55000 $ en mano de obra y 95000 $ en equipos? Se sabe que la producción se puede modelar mediante una función de Cobb Douglas.

K
L
Q
80
40
3810
75
45
3796
70
50
3754
90
30
3744

15. Una empresa produce mediante la siguiente ecuación: ( ) , donde la producción
está en unidades al mes, la inversión está en miles de $ al mes y la fuerza laboral en horas
trabajador al mes. Halle los coeficientes y de la función, si los datos históricos de la producción son los siguientes:

K
L
Q
50
500
12927
80
700
19782
100
1000
25853
110
1200
29275
120
1300
31863

Copyright © 2024 DOKUMEN.SITE Inc.