Problema No.1 En una etapa inicial del procesamiento mecánico de piezas de acero, se sabe que una herramienta sufre un deterioro gradual que se refleja en cierto diámetro de las piezas manufacturadas. Para predecir el tiempo de vida útil de la herramienta se tomaron datos de horas de uso y el diámetro promedio de cinco piezas producidas al final de la jornada. Los datos obtenidos para una herramienta se muestran a continuación: Horas de uso 16 32 48 64 80 96 112 128 144 160 176 192 208 224 240 256 272 288 304 320 a) Diámetro (mm) 26.2 25.7 26.0 27.7 28.3 29.5 30.1 31.8 31.4 33.4 33.6 32.7 35.0 36.1 35.7 36.2 36.8 39.1 38.7 39.2 ¿En este problema cuál variable se considera independiente y cuál dependiente? R: La variable dependiente serán las horas de trabajo mientras que la independiente será el diámetro de la pieza. b) Mediante un diagrama de dispersión analice la relación entre estas dos variables. ¿Qué tipo de relación observa y cuáles son algunos hechos especiales? Relación positiva fuerte c) Haga un análisis de regresión (ajuste una línea recta a estos datos, aplique pruebas de hipótesis y verifique residuos) d) ¿La calidad de ajuste es satisfactoria? Argumente e) Si el diámetro máximo tolerado es de 45, ¿Cuántas horas de uso estima que tiene esa herramienta? f) Señale el valor de la pendiente de la recta e interprételo en términos prácticos g) Obtenga el error estándar de estimación y comente qué relación tiene éste con la calidad de ajuste. grafica de dispersion f(x) = 0.05x + 24.86 R² = 0.98 a) La variable independiente son las horas de uso y la variable dependiente es el diámetro de las piezas. b) Diagrama de dispersión: se puede observar que existe una correlación lineal positiva entre las horas de uso y el diámetro, ya que conforme aumentan las horas de uso aumenta el diámetro. Gráfico de Diámetro vs Horas de uso 40 Diámetro 37 34 31 28 25 0 100 200 Horas de uso 300 400 c) Análisis de regresión, como podemos observar la línea recta que mejor explica la relación entre las horas de uso y el diámetro está dada por: Diámetro = 24.8632 + 0.0464098*Horas de uso La cual se puede observar en el grafico del modelo ajustado: Gráfico del Modelo Ajustado Diámetro = 24.8632 + 0.0464098*Horas de uso 40 Diámetro 37 34 31 28 25 0 100 200 Horas de uso 300 400 Prueba de Hipótesis: H0: β1= 0 o H0: El modelo no se ajusta H0: β1≠ 0 o H0: El modelo si se ajusta De acuerdo a la tabla de coeficientes podemos ver que si existe una pendiente, lo cual significa que entre las variables horas de uso y diámetro si existe una relación. Coeficientes Mínimos Cuadrados Parámetro Estimado Intercepto 24.8632 Pendiente 0.0464098 Estándar Estadístico Error T 0.323206 76.9267 0.00168629 27.5218 Valor-P 0.0000 0.0000 Para poder rechazar o aceptar la hipótesis nula tenemos que tomar en cuenta el análisis de varianza del modelo, el cual se presenta a continuación: Análisis de Varianza Fuente Suma de Cuadrados Modelo 366.674 Residuo 8.71365 Total (Corr.) 375.388 Gl Cuadrado Medio 1 366.674 18 0.484092 19 Razón-F Valor-P 757.45 0.0000 Analizando esta tabla podemos concluir que el modelo si se ajusta ya que el valor-P es menor al nivel de confianza de 0.05, por ello podemos decir que con un nivel de confianza del 95% se rechaza la hipótesis nula. Verificación de supuestos: El supuesto de varianza constante si se cumple ya que al graficar los residuos contra los predichos, los puntos caen aleatoriamente dentro de la banda horizontal sin que sigan algún patrón definido. Gráfico de Residuos Diámetro = 24.8632 + 0.0464098*Horas de uso 1.2 0.8 residuo 0.4 0 -0.4 -0.8 -1.2 25 28 31 34 predicho Diámetro 37 40 El supuesto de independencia si se cumple ya que los puntos o residuos se encuentran dispersos de forma arbitraria dentro del grafico de residuos vs número de corrida, sin cumplir ninguna tendencia. Gráfico de Residuos Diámetro = 24.8632 + 0.0464098*Horas de uso 1.2 0.8 residuo 0.4 0 -0.4 -0.8 -1.2 0 4 8 12 número de fila 16 20 d) el coeficiente de determinación R2ajustado es de 97.6788% lo cual indica que nuestro modelo tiene una calidad de ajuste satisfactoria, ya que explica el 97.6% de la variabilidad en Diámetro. e) El valor sería de 433.89 horas a un diámetro de 45 mm, sin embargo realizar una extrapolación la cual está más allá de la región que contiene a las observaciones originales está mal ya que probablemente el modelo ya no se ajuste adecuadamente fuera de la región, ya que nuestra región de estudio va de 25.7 a 39.2 mm de diámetro. f) el valor de la pendiente es de 0.0464098, esto nos indica la razón de cambio en el diámetro (y) con respecto al cambio de las horas de uso (x), es decir cuánto va a variar el diámetro cuando se varíen las horas de uso. g) El error estándar de la estimación fue de 0.695767, lo cual indica que la calidad de ajuste de nuestro modelo es buena, ya que si el error estándar de estimación es menor la calidad del ajuste será mayor. Problema No. 2 Se piensa que el vapor consumidas una planta química temperatura (en °F) de ese mes. se muestra la consumo anual: Mes Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre Temperatura 21 24 32 47 50 59 68 74 62 50 41 30 Consumo/1000 185.79 214.47 288.03 424.84 454.58 539.03 621.55 657.06 562.03 452.93 369.95 273.98 número de libras de mensualmente por se relaciona con la ambiente promedio En la tabla siguiente temperatura y el A) Trace un diagrama de dispersión de los datos. ¿Parecería apropiado un modelo de regresión lineal simple en este caso? R= Si, con la finalidad de saber cómo la temperatura afecta el consumo y así poder predecir a que temperatura es conveniente tratar el consumo. B) Suponiendo que un modelo de regresión lineal simple es apropiado, ajuste el modelo de regresión que relacione el consumo de vapor ( y ) con la temperatura promedio ( x ). ¿Cuál es la estimación del consumo esperado de vapor cuando la temperatura promedio es 55°F? R= 497.3545 C) ¿Qué cambio se espera en el consumo de vapor promedio cuando la temperatura mensual promedio cambia 1°F? R= 2.15% R= 108.7056 consumo/1000 D) Suponga que la temperatura mensual promedio es de 47°F. Calcule el vapor ajustado y el residual correspondiente. VAPOR= 424.84 RESIDUAL= -0.042718344 Problema No. 3 En un artículo de Wear se presentan los datos del desgaste por rozamiento del acero dulce y la x=viscosidad delaceite viscosidad del aceite. Los datos representativos, con y y=volumen del desgaste ( 10−4 mm ), son: Y 240 181 193 155 172 110 113 75 94 x 1.6 9.4 15.5 20.0 22.0 35.5 43.0 40.5 33.0 a) Construya un diagrama de dispersión de los datos. ¿Parecería plausible un modelo de regresión lineal simple? R= Si, parece correcto usar el diagrama b) Ajuste el modelo de regresión lineal simple usando mínimos cuadrados. c) Estime el desgaste por rozamiento cuando la viscosidad es x=30 . R= 62.3768 d) Obtenga el valor ajustado de correspondiente. Y=172 Residual= 15.11749821 y cuando x=22.0 y calcule el residual Problema No. 4 En un proceso de extracción se estudia la relación entre tiempo de extracción y rendimiento. Los datos obtenidos se muestran en la siguiente tabla. Tiempo (minutos) Rendimiento (%) 10 15 20 8 12 13 15 12 14 20 19 64 81.7 76.2 68.5 77.9 82.2 74.2 70 76 83.2 85.3 a) ¿En este problema cuál variable se considera independiente y cuál dependiente? b) Mediante un diagrama de dispersión analice la relación entre estas dos variables. c) Haga un análisis de regresión (ajuste una línea recta a estos datos, aplique pruebas de hipótesis y verifique residuos). d) ¿La calidad del ajuste es satisfactoria? Argumente e) Destaque el valor de la pendiente de la recta e interprételo en términos prácticos. f) Estime el rendimiento promedio que se espera a un tiempo de extracción de 25 minutos y obtenga un intervalo de confianza para esta estimación. a) La variable dependiente es el % rendimiento y la variable independiente es el tiempo dado en minutos. b) Diagrama de dispersión: se puede visualizar que no existe una relación ya que los puntos son muy dispersos, algunos incrementan y otros decrecen sin importar el tiempo, sin embargo se tendría que verificar los supuestos y comprobar si en verdad existe una relación entre el rendimiento y el Gráfico de Rendimiento vs Tiempo tiempo, si no es asi los datos que miden la calidad de ajuste nos lo indicaran. 88 R en dim ie n to 84 80 76 72 68 64 8 10 12 14 Tiempo 16 18 20 c) Análisis de regresión, como podemos observar la línea recta que mejor explica la relación entre el tiempo y el porcentaje de rendimiento está dada por: Rendimiento = 57.9578 + 1.19492*Tiempo La cual se puede observar en el grafico del modelo ajustado: Gráfico del Modelo Ajustado Rendimiento = 57.9578 + 1.19492*Tiempo 88 Rendimiento 84 80 76 72 68 64 8 10 12 14 Tiempo 16 18 20 Prueba de Hipótesis: H0: β1= 0 o H0: El modelo no se ajusta H0: β1≠ 0 o H0: El modelo si se ajusta De acuerdo a la tabla de coeficientes podemos ver que si existe una pendiente, lo cual significa que entre las variables tiempo y porcentaje de rendimiento si existe una relación. Coeficientes Mínimos Cuadrados Parámetro Estimado Estándar Estadístico Error T Valor-P Intercepto 57.9578 Pendiente 1.19492 6.28403 9.22303 0.414959 2.87962 0.0000 0.0164 Para poder rechazar o aceptar la hipótesis nula tenemos que tomar en cuenta el análisis de varianza del modelo, el cual se presenta a continuación: Análisis de Varianza Fuente Suma de Cuadrados Modelo 243.684 Residuo 293.872 Total (Corr.) 537.557 Gl Cuadrado Medio 1 243.684 10 29.3872 11 Razón-F Valor-P 8.29 0.0164 Analizando esta tabla podemos concluir que el modelo si se ajusta ya que el valor-P es menor al nivel de confianza de 0.05, por ello podemos decir que con un nivel de confianza del 95% se rechaza la hipótesis nula. Verificación de supuestos: El supuesto de varianza constante si se cumple ya que los puntos se encuentran dispersos de forma aleatoria por toda la gráfica a lo largo de la banda horizontal. Gráfico de Residuos Rendimiento = 57.9578 + 1.19492*Tiempo 7.5 res id u o 4.5 1.5 -1.5 -4.5 -7.5 67 70 73 76 predicho Rendimiento 79 82 Gráfico de Residuos El supuesto de independencia siRendimiento se cumple= 57.9578 ya que+ 1.19492*Tiempo los puntos o residuos se encuentran dispersos 7.5 de forma arbitraria dentro del gráfico de residuos vs número de corrida, sin cumplir ninguna 4.5 residuo tendencia. 1.5 -1.5 -4.5 -7.5 0 2 4 6 número de fila 8 10 12 d) el coeficiente de determinación R 2ajustado es de .3986 lo cual indica que nuestro modelo no tiene una buena calidad de ajuste, ya que solo nos explica el 39.865% de la variabilidad en Rendimiento. Además en general, para fines de predicción se recomienda un R 2ajustado de al menos 0.7 o 70% de explicación del modelo. e) el valor de la pendiente es de 1.19492, esto nos indica la razón de cambio en el %Rendimiento (y) con respecto al cambio de Tiempo(x), es decir cuánto va a variar el Rendimiento cuando se varíe el tiempo. f) Se podría calcular el valor que piden con respecto a los 2 min, sin embargo realizar una extrapolación la cual está más allá de la región que contiene a las observaciones originales está mal ya que probablemente el modelo ya no se ajuste adecuadamente fuera de la región, ya que nuestra región de estudio va de 8 a 20 min de Tiempo. Problema No. 5 En un artículo de Journal of Environmental Energineering se reportan los resultados de un estudio sobre la presencia de sodio y cloruros en corrientes superficiales de la parte central de Rhode Island. Los datos que se presentan a continuación corresponden a la concentración de cloruros y (en mg/l) y al área de carretera de la vertiente x (en %). x 0.19 0.15 0.57 0.70 0.67 0.63 0.47 0.70 0.60 0.78 0.81 0.78 0.69 1.30 1.05 1.06 1.74 1.62 y 4.4 6.6 9.7 10.6 10.8 10.9 11.8 12.1 14.3 14.7 15.0 17.3 19.2 23.1 27.4 27.7 31.8 39.5 a) Trace un diagrama de dispersión de los datos. ¿Parecería apropiado un modelo de regresión lineal simple en este caso? R= Si, para ver la relación aunque presentan un índice de error alto B) Ajuste el modelo de regresión lineal simple usando el método de mínimos cuadrados. b) Estime la concentración de cloruros media de una vertiente que tiene 1% del área de carretera. R= 20.567 Encuentre el valor ajustado que corresponde a R= 10.13 x=0.47