Regresión Logarítmica: Es un modelo de regresión que se utiliza cuando el modelo lineal no logra un coeficiente de determinación apropiado, o cuando el fenómeno en estudio tiene un comportamiento considerado potencial o logarítmico. Ecuación característica La función que define el modelo es la siguiente: Donde: Yi : Variable dependiente, iésima observación A, B: Parámetros de la ecuación, que generalmente son desconocidos E: Error asociado al modelo Xi : Valor de la í-esima observación de la variable independiente Al sustituir los parámetros por estimadores, el modelo adopta la siguiente forma: Aplicando logaritmos de ambos lados, con lo cual se convierte a una forma lineal: Tabla de datos Para el ajuste de un conjunto de datos al modelo geométrico de regresión, se construye la siguiente tabla de datos: X .. Y .. Ln x Σln x Ln y .. Σln y (ln x)2 .. Σ(ln x)2 (ln y)2 Ln X*ln y .. .. 2 Σ(lny) ΣLnx*lny Debido a las propiedades de los logaritmos, ningún valor de x ni de y puede ser negativo. Se puede trabajar con logaritmos naturales o logaritmos base 10. Estimadores del modelo Será necesario utilizar antilogaritmos para obtener el valor final de a Análisis de varianza para la regresión Con el objeto de determinar si el modelo explica o no el fenómeno en estudio.C. ser igual a cero.M.Reg/C. Total. Error/(n-2) Σ(lny)2-(Σlny)2 /n n-1 F calculada F tabulada C. No puede obtenerse valores negativos Pruebas de Hipótesis para el modelo Para el coeficiente b Para probar la hipótesis de que el coeficiente b es igual a un valor b´.M. se calcula el coeficiente de determinación. Reg/1 S.C. 2.C. se procede de la siguiente manera: 1. se realiza el análisis de varianza.C. Se plantea la hipótesis Ho:b=b´ y la alternativa Ha: b≠ b´ Se calcula el estadístico : Sb es conocido como el error standard de b y se calcula de la siguiente manera: El cuadrado medio del error se obtiene del anàlisis de varianza.Error Ho: El modelo no explica el fenómeno en estudio Ha: El modelo sí explica el fenómeno en estudio Grado de ajuste del modelo Para determinar el grado de ajuste del modelo. 3.S. Regresión S. de la siguiente manera El valor de r2 tiene un rango entre 0 y 1. que se calcula de la siguiente manera Fuente de Variación Regresión Error Total Grados de libertad 1 n-2 n-1 Suma de cuadrados Cuadrado medio b* (ΣLnxlny-Σ(Lnx)*Σ(lny)/n) S. Se busca en la tabla de t de student el valor tabulado para los siguientes datos: n-2 grados de libertad y un nivel α/2 . 4. con los siguientes datos: n-2 grados de libertad y nivel α/2 Si el valor de t calculado es mayor que el tabulado. para lo cual se sigue el siguiente procedimiento: 1. la hipótesis se acepta 5. Intervalos de confianza Para el coeficiente b El intervalo de confianza para el coeficiente b se calcula así: El cuadrado medio del error se obtiene del análisis de varianza El valor de t se obtiene de la tabla de t de student con n-2 grados de libertad y un nivel α/2 Para el coeficiente a El intervalo de confianza para el coeficiente a se calcula así: El cuadrado medio del error se obtiene del análisis de varianza El valor de t se obtiene de la tabla de t de student con n-2 grados de libertad y un nivel α/2 . Se define la hipótesis: Ho: a=a´ y la alternativa Ha: a≠a´ Se calcula el error standard para a con la siguiente fórmula: 3. en caso contrario. en caso contrario. Se calcula el estadístico de prueba: 4. Se obtiene en la tabla de t de student el estadístico comparador. se rechaza el Ho. se rechaza la Ho. Si el valor de t calculado es mayor que el tabulado. Para el coeficiente a Se puede probar la hipótesis de que el coeficiente a es igual a un valor a´. 2. se acepta. Los datos finales fueron: POTENCIA 100 500 1000 5000 10000 DECIBELES 60 80 90 99 120 En base a los datos anteriores: a) Construya un diagrama de dispersión b) Efectúe la estimación del modelo logarítmico c) Determine el grado de ajuste e interprételo d) Elabore el análisis de varianza y discútalo e) Qué lectura se obtendría con una potencia de 3000 vatios? f) Pruebe la hipótesis que b=1 con un 99% de confianza g) Calcule intervalo de confianza al 95% para a y b a) Diagrama de Dispersión . dado un valor de x 0 se obtiene de la siguiente manera: El cuadrado medio del error se obtiene del análisis de varianza El valor de t se obtiene de la tabla de t de student con n-2 grados de libertad y un nivel α/2 El valor de xm que aparece en la fórmula es el promedio de valores de x Ejemplo: Se realizó un estudio comparativo del nivel de ruido (en decibeles) producido por discotecas rodantes.Para la media de y Un intervalo de confianza para la respuesta media de y. se procedió a evaluar diferentes niveles de potencia (en vatios). dado x0 sería: El cuadrado medio del error se obtiene del análisis de varianza El valor de t se obtiene de la tabla de t de student con n-2 grados de libertad y un nivel α/2 El valor de xm que aparece en la fórmula es el promedio de valores de los logaritmos de x Para la estimación de y El intervalo de confianza para la estimación de y. 7875 22.8552 27.4033 Estimadores del modelo c) Grado de ajuste del modelo Se puede concluir que el grado de ajuste del modelo es alto.5951 4.0836 39.4998 4.5426 84.6214 47. d) Análisis de varianza del modelo .9078 8.0943 4.6052 6.5172 9.2326 31.9190 (ln y)2 16.1375 44.1151 22.2103 35.3588 (ln x)2 21.2022 20.2493 Lnx*Lny 18.3820 4.2146 6.8304 264.7637 19.2076 38.7171 72.9201 100.0944 160.b) Estimadores del modelo Tabla de Datos: x 100 500 1000 5000 10000 y 60 80 90 99 120 SUMAS: Ln x 4.4551 Ln y 4.2483 21. por lo que el modelo es confiable para hacer predicciones. sustituyendo el valor de x por 3.3.2661-0.255/1=0. se rechaza la Ho y se acepta la Ha.255/0.1 2* 4 0. e) Qué lectura en decibeles se obtiene al aplicar una potencia de 3.12 Tabla de Andeva: Fuente de Variaci ón Grad os de libert ad Suma de cuadra dos Cuadra do medio F calcula da F tabula da Regresi ón Error 1 0.255 68.003 7 Total 5 0.91 F Tabulada (1.000 Pruebe la hipótesis de que b=1 con un 99% de confianza Inicialmente se plantea Ho: b=1 y su alterna Ha: b≠1 . simplemente se utiliza la ecuación anteriormente encontrada por estimación.0111 0.255 Cuadrado medio del error= 0.0111 Grados de libertad de regresión=1 Grados de libertad totales= 5-1=4 Grados de libertad del error=5-2=3 Cuadrado medio de regresión= 0.000 vatios? Para esto.255= 0.0.91 34.01)= 34.0037 F Calculada=0.2550 0.0037=68.2661 Debido a que F calculada es mayor que F tabulada.0111/3=0.iii) iv) v) vi) vii) viii) ix) x) xi) Suma de cuadrados del error : 0. con lo cual se concluye que el modelo sí explica el fenómeno en estudio y que los resultados obtenidos no se deben a la casualidad. 182 Intervalo de confianza para b: El intervalo final será entonces el siguiente: -0.4998 -5(4. Calcule intervalos de confianza al 95% para a y b El valor de t de student al 95% con 3 grados de libertad es= 3.47176)2= 0.0111 Grados de libertad de regresión=1 Grados de libertad totales= 5-1=4 .841 Finalmente.4998 4.09430 4.5595 4. dado que t calculada es mayor que la tabulada.99)/2=0.5595 4. con 5-2=3 grados de libertad y (1-.664 Intervalo de confianza para a: El intervalo final para el logaritmo de a sería: 3.2661 4. se concluye al 99% que el coeficiente b no es igual a 1.0943 4.7875 Suma de cuadrados del error =: 0.255=0.3892< B< 0.1137< Ln A <3.005 de α.3820 (4.2661-0.El valor de t de student de calcula de la siguiente manera: (el logaritmo de 1 es cero) El valor de t se obtiene en la tabla de t de student. siendo el valor igual a 5.7875) 4.382 4.8803 Análisis de varianza Suma de cuadrados de regresión Suma de cuadrados total 4. (2007).255 Cuadrado medio del error= 0.255/0.255/1=0.91 F Tabulada (1.Grados de libertad del error=5-2=3 Cuadrado medio de regresión= 0. .3.0. M.0111/3=0. Valencia: Universidad de Valencia. Estadística y Probabilidad.12 Bibliografía: Martínez.01)= 34.0037 F Calculada=0.0037=68.