´ NO LINEALREGRESION TAREA 3 (Mayo 2012) 1. El rendimiento de un proceso qu´ımico depende de la temperatura (X1 ) y de la presi´on (X2 ). En un estudio, el rendimiento del proceso (Y ) fue medido para n=18 corridas del proceso bajo varias condiciones de temperatura y presi´on. El archivo de datos rend_quimico.txt consta de una linea de datos para cada corrida. Las variables se encuentran sobre cada linea en el siguiente orden. Y = rendimiento del proceso X1 = temperatura (◦ C) X2 = presi´on (psi) Use estimaci´on por m´ınimos cuadrados ordinarios para ajustar el siguiente modelo β1 β2 Yi = β0 Xi1 Xi2 + εi donde εi ∼ N ID(0, σ 2 ) i=1,. . . ,18. a) Para obtener valores iniciales, ignore el error aleatorio aditivo en el modelo no lineal mostrado arriba y use m´ınimos cuadrados para ajustar el modelo log(Yi ) = log(β0 ) + β1 log(Xi1 ) + β2 log(Xi2 ) + error Liste sus valores iniciales para β0 , β1 y β2 . b) Usando los valores iniciales de la parte a), encuentre las estimaciones de m´ınimos cuadrados de los par´ametros en el modelo no lineal. c) Haga una gr´afica que muestre los datos observados y la curva estimada para el rendimiento medio. ¿Le parece que este modelo no lineal es apropiado para los datos? d ) Grafique los residuales contra los valores de X1 y X2 en gr´aficas separadas. ¿Qu´e indican estas gr´aficas? 1 Este archivo consta de una linea de datos para cada corrida. ignore el error aditivo y note que Yi−1 ≈ β1 −1 1 + X . b) Usando los valores iniciales de la parte a). Los datos se presentan en el archivo cinetica. d) y e). ¿Qu´e sugiere esta gr´afica? f ) Sin importar sus resultados en partes c). asuma que el modelo no lineal propuesto es apropiado y use propiedades distribucionales asint´oticas de los estimadores de m´ınimos cuadrados para lo siguiente. Escriba su conclusi´on. 2) Construya un intervalo de confianza del 95 % para el rendimiento medio cuando X1 = 50 y X2 = 60. 3) Pruebe la hip´otesis nula H0 : β1 = β2 versus la alternativa Ha : β1 6= β2 .txt. a) Para obtener valores iniciales. β0 β0 i Use an´alisis de regresi´on por m´ınimos cuadrados para obtener estimaciones de (β0 )−1 y (β1 /β0 ) y liste sus valores iniciales para β0 y β1 . En un estudio de cin´etica enzim´atica. c) Haga una gr´afica que muestre la velocidad media estimada y los datos observados. se espera que la velocidad de una reacci´on (Y ) est´e relacionada con la concentraci´on (X) de una sustancia como sigue: β0 Xi + εi Yi = β1 + Xi Se hicieron observaciones en n = 18 concentraciones y la velocidad de reacci´on fue registrada. β1 y β2 . ¿Le parece que este modelo no lineal es apropiado? 2 . 2.e) Construya una gr´afica de probabilidad normal para los residuales. 1) Construya intervalos de confianza del 95 % para β0 . Indique como llev´o a cabo su prueba. con Yi precediendo a Xi en la i-´esima linea. encuentre estimaciones de m´ınimos cuadrados de β0 y β1 en el modelo no lineal original. d ) Grafique los residuales contra la concentraci´on (X). la evaluaci´on de momentos. . X2 . ¿Qu´e sugiere esta gr´afica? f ) Construya intervalos de confianza del 95 % para β0 y β1 . adem´as de un intervalo de confianza para la mediana. El bootstrap provee un estimador razonablemente bueno para el error est´andar de la mediana muestral. Xn es una muestra aleatoria de una poblaci´on con f. donde f (θ) es la funci´on de densidad evaluada en θ. El archivo consta de una linea de datos para cada paciente y cada 3 .a.a. g) Estime la concentraci´on (X) en la cual la velocidad esperada de la reacci´on es 25.d. sin embargo. y computando la mediana muestral θˆn = (X(m) + X(m+1) )/2 Cuando se conoce la forma de la f.d. Teor´ıa asint´otica est´andar revela que n V ar(θˆn ) → 1 4[f (θ)]2 cuando n → ∞. se puede obtener la distribuci´on muestral exacta θˆn a partir de la teor´ıa de los estad´ısticos de orden. Suponga que n = 2m es un entero par. Entonces.txt contiene tiempos de sobrevivencia (en d´ıas) para 69 pacientes que recibieron transplantes de coraz´on. F (x) y funci´on de densidad f (x). sin ning´ un conocimiento de la f. B´asicamente. a) El archivo corazon. X(1) ≤ X(2) ≤ . A menos de que n sea muy peque˜ no. un estimador consistente para la mediana se obtiene ordenando las observaciones de la mas peque˜ na a la mas grande. Reporte un intervalo de confianza del 95 % para la concentraci´on. F (x) o la densidad f (x). Usted podr´ıa usar (4n[f (θˆn )]2 )−1 como una estimaci´on de V ar(θˆn ). Sea θ la mediana de la poblaci´on. . el bootstrap reemplaza la derivaci´on de resultados te´oricos asint´oticos con simulaci´on. 3. si conociera la forma de la funci´on de densidad. .a. . ¿Qu´e sugiere esta gr´afica? e) Construya una gr´afica de probabilidad normal para los residuales. la mediana verdadera de la poblaci´on. . ≤ X(n) .d.. tales como la varianza de θˆn . puede ser bastante tediosa. . Suponga que X1 . a) Construya intervalos individuales del 95 % de confianza para β0 .linea contiene un tiempo de sobrevivencia. Use m´etodos bootstrap para completar lo siguiente. 4. Compute la mediana muestral para los tiempos de sobrevivencia. b) Construya un intervalo del 95 % de confianza para el rendimiento esperado del proceso cuando se corre a una temperatura de 100◦ C y a una presi´on de 50 psi. Escriba su conclusi´on. Considere el modelo que usted ajust´o a los datos del proceso qu´ımico en el Problema 1.txt. b) Repita la parte a) para los tiempos de sobrevivencia de un conjunto similar de 34 pacientes que no recibieron los transplantes de coraz´on. Use m´etodos bootstrap para obtener un error est´andar para la mediana muestral y un intervalo de confianza del 95 % basado en percentiles para la mediana poblacional. c) Construya un intervalo de predicci´on del 95 % para el rendimiento que ser´a observado cuando el proceso se corre a una temperatura de 100◦ C y a una presi´on de 50 psi. 2) Mantenga la matriz modelo fija y remuestree residuales centrados 3) Mantenga la matriz modelo fija y remuestree residuales centrados que tambi´en han sido re-escalados para que tengan aproximadamente la misma varianza que los errores aleatorios del modelo. Los datos en este caso se presentan en el archivo corazon2. β1 y β2 . 4 . c) Use m´etodos bootstrap para probar la hip´otesis nula de que la mediana del tiempo de sobrevivencia para pacientes que reciben transplantes de coraz´on es igual a la mediana del tiempo de sobrevivencia para pacientes similares que no reciben transplantes de coraz´on. Use 5000 muestras bootstrap. Use m´etodos bootstrap emp´ıricos para cada uno de los siguientes esquemas de remuestreo: 1) Remuestree casos con reemplazo.