REGRESIÓN MÚLTIPLE-EJERCICIOS

March 19, 2018 | Author: pacobeta | Category: Regression Analysis, Linear Regression, Physics & Mathematics, Mathematics, Science


Comments



Description

REGRESIÓN MÚLTIPLE.Muchos problemas de regresión involucran más de una variable regresiva, Tales modelos se denominan regresión múltiple. Como ejemplo, suponga que la vida útil de una herramienta de corte depende de la velocidad y del Angulo de corte. Un modelo de regresión múltiple que podría describir esta relación es y = b0 + b1 x1 + b2 x2 + E Donde y representa la vida de la herramienta, x1 la rapidez de corte y x2 el ángulo de corte. Este es un modelo de regresión múltiple con dos regresores. El término lineal se emplea debido a que la ecuación anterior es la función lineal de los parámetros desconocidos b0, b1 y b2. El parámetro b0 define la ordenada al origen del plano. Alguna veces llamamos b1 y b2 coeficientes de regresión parciales, porque b1 mide el cambio esperado en y por un cambio unitario en x1 cuando x2 se mantiene constante, y b2 mide el cambio esperado en y por un cambio unitario en x2 cuando x1 se mantiene constante. En general, la variable dependiente o respuesta y puede relacionarse con k variables independientes. El modelo y = b0 + b1 x1 + b2 x2 + ……. + bk xk + E Se denomina modelo de regresión múltiple con k variables independientes. Su raíz cuadrada es el coeficiente de correlación “r" R2 Ajustado: Un valor ajustado que se usa para comparar los modelos con diferentes números de términos Estadística C-p de Mallows: Un parámetro de regresión usado para ayudar a determinar qué modelo de regresión múltiple debe elegirse (se desea baja.TERMINOLOGÍA DE REGRESIÓN MÚLTIPLE. Adecuación: Valor pronosticado de la variable de respuesta. dada una combinación específica de configuraciones de los factores Residuales: La diferencia entre un valor adecuado (pronosticado) y un valor experimental real Multicolinearidad: Condición en la que dos o más variables predictoras (Variables X) se correlacionan entre sí R2: Medida de cuánta variación es explicada por medio de la ecuación de regresión.8 < Ri2 < 0. Variable de Respuesta (Y.9) Pauta: Asegúrese de que VIF < 5 cuando sea posible y debe ser <10 . Factor o Variable de Predicción (X): Variable incontrolada o controlada cuya influencia está siendo estudiada Espacio de Inferencia: Rango de operación de los factores estudiados.(Ri2 > 9 ) VIF > 5: grado moderado de multicolinearidad (0. Calcula el grado de multicolinearidad Un VIF grande implica que al menos una variable es redundante VIF > 10: alto grado de multicolinearidad . ): El elemento de salida del proceso. Pauta: desea C-p ≤ cantidad de términos en el modelo) VIF: Factor de inflación de la varianza. Es la suma de los cuadrados del modelo de regresión dividido entre la suma total de cuadrados. mismos que se presentan en la siguiente tabla.EJERCICIOS DE REGRESIÒN MULTIPLE 1.. Verifique la posibilidad de reducir el modelo y obtenga un pronóstico del consumo de energía eléctrica para una temperatura promedio de 55. Y 240 236 290 274 301 316 300 296 267 276 288 261 X1 25 31 45 60 65 72 80 84 75 60 50 38 X2 24 21 24 25 25 26 25 25 24 25 25 23 X3 91 90 88 87 91 94 87 86 88 91 90 89 X4 100 95 110 88 94 99 97 96 110 105 100 98 A) B) C) D) Ajuste el modelo de regresión múltiple para estos datos Pruebe la significación del la regresión Calcule los residuos de éste modelo. se dispone de los datos históricos del año pasado. una pureza promedio del producto de 93 y 107 toneladas del producto generadas. E) Determine selección hacia adelanta .Se piensa que la energía eléctrica que consume una planta química se relaciona con la temperatura ambiental promedio (X1). la pureza promedio del producto (X3) y las toneladas del producto generadas (X4). el número de días del mes (X2). Analice los residuos. 22 días del mes. 9 109.X2.5 93.12 y 18 respectivamente. 35.6 95.5 74.7 72.3 87.8 113.. Pruebe la significación del modelo Construya los intervalos de confianza correspondientes al 95% Analice lo residuales. x2.1 115.2. Determine selección hacia adelanta Pronostique una vez obtenidas las conclusiones de los puntos anteriores el desprendimiento de calor por gramo de cemento si para los ingredientes x1.4 X1 7 1 11 11 7 11 3 1 2 21 1 11 10 X2 26 29 56 31 52 55 71 31 54 47 40 66 68 X3 6 15 8 8 6 9 17 22 18 4 23 9 8 X4 60 52 20 47 33 22 6 44 22 26 34 12 12 a) b) c) d) e) f) Ajuste un modelo de regresión múltiple de éstos datos. los datos aparecen en la siguiente tabla.3 104.X4) . x4 son 5. en calorías por gramo de cemento (Y) para diversas cantidades de ingredientes (X1. x3.9 83. .Hald informa acerca de los datos relativos al desprendimiento de calor.3 109. Numero de observación 1 2 3 4 5 6 7 8 9 10 11 12 13 Y 78.2 102.X2. 75 18. El Ingeniero Industrial responsable del estudio ha sugerido que las dos variables más importantes que afectan el tiempo de entrega (Y) son la cantidad de cajas de producto abastecido (X1) y la distancia caminada por el representante (X2). Le interesa predecir el tiempo necesario para que el representante de ruta atienda las máquinas expendedoras en una tienda.03 14. Ésta actividad de servicio consiste en abastecer las máquinas con productos embotellados y algo de mantenimiento y limpieza.50 19..83 10.00 9.88 13.75 19.50 12.00 29.00 13. Pruebe la significación del modelo Construya los intervalos de confianza correspondientes al 95% Analice lo residuales.83 79. El ingeniero ha reunido 25 observaciones de tiempo de entrega que se muestran en la siguiente tabla.32 18.00 15.75 24.90 52.10 17. Determine selección hacia adelante .35 19.50 40.Un embotellador de bebidas gaseosas analiza las rutas de servicio de las máquinas expendidotas en un sistema de distribución.3.50 35.) (Y) 16.68 11.00 17.11 8.24 21.33 21. Observación 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 a) b) c) d) e) Tiempo de entrega (min.75 Cantidad de cajas (X1) 7 3 3 4 6 7 2 7 30 5 16 10 4 6 9 10 6 7 3 17 10 26 9 8 4 Distancia (pies) X2 560 220 340 80 150 330 110 210 1460 605 688 215 255 462 448 776 200 132 36 740 140 810 450 635 150 Ajuste un modelo de regresión múltiple de éstos datos. . se midió la viscosidad (Y2) X1 0 -1 1 -1 1 -1 1 0 -1 1 0 0 0 0 0 X2 0 -1 -1 1 1 0 0 0 0 0 -1 1 -1 1 0 X3 0 0 0 0 0 -1 -1 0 1 1 -1 -1 1 1 0 Y1 8392 9895 9204 7882 7105 8939 4548 8598 9152 8992 10504 7462 9368 7772 8440 Y2 1075 2325 1575 690 420 1188 930 920 1275 860 5600 540 1225 620 1015 a) Ajuste el modelo de regresión múltiple para la variable Y1 b) Ajuste el modelo de regresión múltiple para la variable Y2 c) ¿El modelo explica la variación observada en Y1? Argumente con base en significancia del modelo. de lograrse esto. residuales y coeficientes de determinación.f) Pronostique una vez obtenidas las conclusiones de los puntos anteriores el tiempo de entrega para una cantidad de cajas de 15 y una distancia de 275 pies. De acuerdo a conocimientos técnicos que se tienen. . 4. Además de Y1.En el área de desarrollo de una empresa se pretende obtener un nuevo polímetro de bajo peso molecular (Y1). se considera que los factores críticos son X1: persulfato de sodio (NaPS). se obtendría un polímetro que funcione como dispersante en la industria de la cerámica. Para encontrar las condiciones óptimas se realizó un experimento y se obtuvieron los siguientes datos (los valores de los factores están codificados). X2: ácido hipofosforoso (H3PO2) y X3: isopropanol (IPA). 919 29. y el ingreso personal total para el primer trimestre del año.86 60.625 45.5 9.5 16.92 15.Suponga que el Gerente de ventas de una gran compañía distribuidora de partes para automóviles. incluyendo el número de tiendas al menudeo en la región que almacena las partes comercializadas por la compañía. Varios factores parecen estar relacionados con las ventas.5 7.994 .0 4.1 1687 8.116 12.0 4.4 7. también pueden estimarse las ventas totales de la compañía.0 Ventas anuales Y 37. N° de Número de automóviles Ingreso tiendas de registrados personal menudeo (millones) (mmdd) X3 X1 X2 1739 9.7 1846 8.62 95. Obsérvese en la tabla anexa que para la regresión 1 se tuvieron 1739 tiendas al menudeo que almacenan las partes de auto de la empresa.600 8.81 20.196 32..0 5.0 4.3 649 7. También se registraron las ventas anuales totales en ese año según cada región.055 3. entonces en años futuros podría utilizarse el pronóstico de abril para revisar los planes de producción y mantener el inventario correcto en las tiendas al menudeo.0 5. que hubo 9 270 000 automóviles registrados en la región hasta el 1 de abril y que las ventas para ese año fueron por $ 37 702 000 dólares.1 15. el número de automóviles registrados en la zona hasta abril 1.1 10.0 5.9 11.0 4.8 2290 11.4 1221 5. con base en la experiencia.114 20.1 Antigüedad promedio N° de de los Supervisores autos X5 (años) X4 3.702 24.9 1427 10.81 68.28 16.0 3.1 13.5. Sí. desea calcular desde abril las ventas totales de la región. Finalmente se seleccionaron cinco variables independientes como las más importantes (de acuerdo al gerente de ventas).27 85. Después se recopilaron datos para un año reciente.0 5.0 5.31 33.0 4.611 17.3 241 6. se encuentra que los estimados de abril de las ventas anuales son razonablemente exactos.77 34.96 69.2 1096 10. Según las ventas regionales.1 120 3. 8 32.4 23..6 21.8 Maestría: 1 Sí 0 No Determine la ecuación de regresión.0 28.6 35. una calificación de la efectividad en la enseñanza asignada por el director y si el profesor tiene o no grado de maestría. ¿Que sueldo estimaría usted para un profesor con cinco años de experiencia.1 23. una calificación de 60 dada por el director y sin maestría.8 36. es presidente del sindicato de profesores del distrito escolar de Ostego.6 41.3 33. al presidente le gustaría investigar la estructura de los sueldos de personal docente en el distrito.0 26.0 32.8 38.6.8 20.6 19.6 31. Sueldo (mdd) Y 21.7 15. Al prepararse para futuras negociaciones.El señor Mike Wilde. Una muestra aleatoria de 20 profesores dio como resultado los siguientes datos. Considera que existen tres factores que afectan el pago laboral de un profesor: años de experiencia. Años de experiencia X1 8 5 2 15 11 14 9 7 22 3 1 5 23 17 12 14 8 4 2 8 Calificación de director X2 35 43 51 60 73 80 76 54 55 90 30 44 84 76 68 25 90 62 80 72 Maestría X3 0 0 1 1 0 1 0 1 1 1 0 0 1 0 1 0 1 0 1 0 .7 22.7 20.7 28. 1 37.2 37.8 7.8 11.9 .7 ROE (%) 36.Un productor de comida para cerdos desea determinar que relación existe entre la edad de un cerdo cuando comienza a recibir un complemento alimenticio de reciente creación.7 17. la empresa se ha expandido más allá del concepto original de tienda y ahora incluye Sam’s Club que es una operación de margen muy bajo con fuerte rotación de inventario.7 33. si tiene nueve semanas de edad y pesa 48 libras.8 32.Walmart es una de las compañías más grandes y exitosas de Estados Unidos. El peso inicial del animal y el aumento de peso de un periodo de una semana con el complemento alimenticio.7.7 81 8..6 4.5 14. Número de lechón 1 2 3 4 5 6 7 8 Peso inicial (lbs) 39 52 49 46 61 35 25 55 Edad inicial (semanas) 8 6 7 12 9 6 7 4 Aumento de peso 7 6 8 10 9 5 3 4 a) calcule la ecuación que mejor describa estas tres variables b) Cuánto podemos esperar que un cerdo aumente de peso en una semana con el complemento alimenticio.3 35.6 30.2 7.0 28.8 3.6 4. En el inicio la compañía daba una excelente tasa de rendimiento (ROE) a sus accionistas. el inventario.6 24.400 tiendas en operación y ventas anuales por 82 mil millones de dólares. el porcentaje de tiendas que eran Sam’s Club y ROE Año 1985 1986 1987 1989 1990 1991 1992 1993 1994 1995 1996 Inventario miles de millones de dólares 1. 8.1 35.0 7.2 2.2 17.5 2. Junto con el crecimiento rápido.4 Porcentaje Sam’s Club 1.5 2..8 9.8 12.6 10. pero su desempeño en este rubro ha decaído.7 6. La siguiente información es el resultado de un estudio de ocho lechones.5 26. con más de 2.2 1. Los siguientes datos muestran cifras para los anos fiscales que terminan en enero de la fecha mostrada. 3 46. Los datos siguientes corresponden a 10 autos con precio (Y) en miles de dólares.Un estudiante graduado que quiere comparar un auto Neptuno usado investigó los precios.80 5.92 9.400 2.700 ¿Que porcentaje de cambio en el PIB se esperaría en un año en el cual el déficit federal fue de 240.2 34..99 6. Los datos correspondientes a seis años son: Y Cambio en el PIB 2..300 2.5 3.6 18.000 millones de dólares y el promedio Dow Jones fue de 3.0 1.05 9.000 millas recorridas. Que consejo daría a los administradores de la empresa para aumentar ROE 9.9 26.4 21.20 4.5 -1.0 X1 Déficit federal 100 400 120 200 180 80 X2 Dow Jones 2. dos de los indicadores examinados son el monto del déficit del gobierno federal (en miles de millones de dólares) y el promedio industrial Dow Jones (el valor medio del año). Encuentre la ecuación y pronostique cuanto pagaría si desea comprar un auto Neptuno 1991 con alrededor de 40.000? 10.55 9. Piensa que el año del modelo y el número de millas recorridas influyen en el precio de compra.02 8.4 28.9 11.850 2.100 3.87 3.0 4.2 44.4 .0 1.74 X1 Año 1987 1992 1993 1988 1994 1991 1992 1988 1989 1991 X2 Millas en miles 55.Desarrolle una ecuación de regresión múltiple para pronosticar ROE para Walmart con base en las dos variables dadas.La reserva Federal de Estados Unidos realiza un estudio preliminar para determinar la relación entre ciertos indicadores económicos y el cambio porcentual anual en el producto interno bruto (PIB).550 2. año (X1) y millas recorridas (X2) en miles. Y Precio en miles de dólares 2.8 36.37 4. el número de pies cuadrados de construcción (en ciento de pies cuadrados).50 4.50 95.1 6. ha reunido datos de 12 ventas recientes.35 2. que precio de venta puede esperar 12.5 baños y seis años de antigüedad.70 160.0 millones de autos y la cota promedio del acero importado por tonelada de $3.2 5.1 los fabricantes de automóviles norteamericanos planean producir 6.5 25.Una persona está pensando vender su casa.5 1.7 3.1 22.6 20. Los datos son los siguientes: Y Millones de toneladas vendidas 4.50 .0 2.5 6.8 Pisos 1 1 2 2 2 1 2 2 1 2 2 3 Baños 1 1 1.5 13. Precio de venta 49.0 1.6 20.5 1.50 Pies cuadrados 8.7 15. 800 pies cuadrados (18 cientos de pies cuadrados). 1.9 7.20 4.5 1.9 9.0 2.5 2.65 67.Una industria acerera ha estado buscando los factores que influyen en la cantidad de acero (en millones de toneladas) que puede vender cada año.0 X2 Cota de Importaciones 3.1 5.2 3.1 5. La administración sospecha que los siguientes son los factores principales: la tasa anual de inflación del país.1 3.7 40.25 112.0 11.00 2.5 12. Con el fin de decidir el precio que pedirá por ella.7 7.0 4.5 10.0 4. Registró el precio de venta ( en miles de dólares) .0 1.15 81.60 3.11.5 X1 Tasa de Inflación 3..9 19.0 Antigüedad 2 6 11 8 22 17 12 11 9 8 18 12 Si la casa de ésta persona tiene 1.7 4.60 91.0 20.25 100.95 81..6 12. el número de baños y la antigüedad de la casa en años. el precio promedio por tonelada de acero importado que acota los precios (en dólares) y el número de automóviles ( en millones) que los fabricantes de autos de Estados Unidos planea producir ese año.9 Año 1993 1992 1991 1990 1989 1988 1987 Cuantas toneladas de acero esperará vender la compañía en un año en el que la tasa de inflación es de 7.65 149.0 17.35 104. un piso.65 232. el número de pisos.3 3.1 4.05 X3 Número de automóviles 6.10 5. 2:no) (X3) 1 2 1 1 2 1 1 1 2 1 2 1 . selecciona al azar 12 distribuidores. De ellos obtiene el número de vehículos vendidos el último mes.El gerente de ventas distrital de un importante fabricante de automóviles está estudiando las ventas. Para investigar. La información es la siguiente: Autos vendidos en el último mes(Y) 127 138 159 144 139 128 161 180 102 163 106 149 Publicidad (X1) 18 15 22 23 17 6 25 26 15 24 18 25 Fuerza ventas (X2) 10 15 14 12 12 12 14 17 7 16 10 11 Ciudad (1:si. Específicamente le gustaría determinar qué factores afectan el número de autos vendidos en una distribuidora. el número de vendedores de tiempo completo empleados en la distribuidora.. los minutos de publicidad radiofónica comprados en dicho periodo. y si ésta se localiza en la ciudad o no.13. el valor total de inventario al inicio del presente año y la ganancia bruta de cada empresa.000 (dólares) al principio del año. ha pagado 64 dividendos consecutivos de acciones comunes y tiene un inventario valuado en $ 1 500.14.El señor Steve Douglas fue contratado como gerente en entrenamiento por una importante empresa financiera. el número de dividendos consecutivos pagados de acciones comunes. La Master Chemical Company emplea 220 personas. Sus descubrimientos son: Compañía 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Ganancia bruta (mmd) (Y) 2800 1300 1230 1600 4500 5700 3150 640 3400 6700 3700 6440 1280 4160 3870 980 Número de empleados (X1) 140 65 130 115 390 670 205 40 480 810 120 590 440 280 650 150 Dividendos consecutivos (X2) 12 21 42 80 120 64 43 14 88 98 44 110 38 24 60 24 Inventario inicial (mmd) (X3) 1800 320 820 76 3600 8400 508 870 5500 9875 6500 9130 1200 890 1200 1300 a) Determine la ecuación de regresión. ¿Cual es la ganancia bruta calculada? . se le pidió que estudiara la utilidad bruta en la industria química.. Como primer proyecto. ¿Que factores afectan las utilidades en esa industria? Steve selecciona al azar una muestra de 16 compañías y obtiene datos respecto a la cantidad de empleados.
Copyright © 2024 DOKUMEN.SITE Inc.