Regresión y Correlación La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación.En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muestrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación. El análisis de correlación generalmente resulta útil para un trabajo de exploración cuando un investigador o analista trata de determinar que variables son potenciales importantes, el interés radica básicamente en la fuerza de la relación. La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos Los datos necesarios para análisis de regresión y correlación provienen de observaciones de variables relacionadas. y b señala su pendiente. por el contrario. Es decir se puede intuir una relación de causa y efecto entre dos variables. EL termino “correlación “significa relación mutua. pero en las que una variable es relativamente costosa. La regresión puede utilizadas de diversas formas. Ni con regresión ni con la correlación se pude establecer si una variable tiene “causa “ciertos valores de otra variable. El análisis de regresión únicamente indica qué relación matemática podría haber. Una ecuación lineal tiene la forma y = a + bx En la que a y b son valores que se determina a partir de los datos de la muestra. el de variable independiente. Se considera tres técnicas de correlación uno . a indica la altura de la recta en x= 0. La variable y es la que se habrá de predecir. y x es la variable predictora. La finalidad de una ecuación de regresión seria estimar los valores de una variable con base en los valores conocidos de la otra. es poco interesante trabajar con ella. Determinación de la ecuación matemática En la regresión. mientras que con la otra variable no ocurre lo mismo. La variable y recibe le nombre variable dependiente y la variable x. Se emplean en situaciones en la que las dos variables miden aproximadamente lo mismo. Análisis de Correlación EL objetivo de un estudio de correlación es determinar la consistencia de una relación entre observaciones por partes. los valores de y son predichos a partir de valores de x dados o conocidos. ye que indica el grado en el que los valores de una variable se relacionan con los valores de otra.Regresión lineal La regresión lineal simple comprende el intento de desarrollar una línea recta o ecuación matemática lineal que describe la reacción entre dos variables. de existir una. o. Otra forma de emplear una ecuación de regresión es para explicar los valores de una variable en término de otra. Ecuación Lineal Dos características importantes de una ecuación lineal 1) la independencia de la recta 2) la localización de la recta en algún punto. la cual simplifica los cálculos: r= n (∑xy)-(∑x)(∑y) _ √n(∑x2)-(∑x)2 ·√n(∑y2)(∑y)2 Existen 3 formas posibles para obtener el valor de r en el caso de datos de medición: estandarizar cada conjunto y hallar el producto medio. y después medir y. a diferencia del análisis de referencia de regresión. Para un conjunto de datos los tres métodos producirán el mismo valor para r no obstante cada método agrega algo a la comprensión del significado del termino “correlación” . tanto y como x deben de variar libremente. no es aceptable seleccionar ciertos valores de x. Esta técnica es valida mientras si es posible establecer ciertos supuestos bastante estrictos. y la magnitud de r indica cuan cerca esta de la “recta” tales puntos. quien ideo este método. Es decir. Una es su signo (+ o -) y la otra. Tales supuestos son los siguientes: 1. El signo es igual al de la pendiente de una recta que podría “ajustarse” a los datos si estos se graficaran en un diagrama de dispersión. es su magnitud. calcular el coeficiente de determinación r2 y obtener su raíz cuadrada como utilizar la formula. Carácter de r El coeficiente de relación presenta dos propiedades que establecen la naturaleza de una relación entre dos variables. Método practicar para calcular r Dado que los cálculos necesarios pueden requerir mucho tiempo especialmente cuando se resta las medias del grupo de cada observación se elevan a cuadrado esas diferencias. 2.para datos de medición. Existe una versión. otro para datos jerarquizados y el último para clasificaciones nominales. La distribución conjunta de frecuencia es normal. Esto recibe el nombre de de distribución normal divariada. Tanto x como y son variables continuas aleatorias. Datos Continuos: r de Pearson EL grado de relación entre dos variables continuas se resume mediante un coeficiente de correlación que se conoce como “r de Pearson “en honor del gran matemático Kart Pearson. En el caso de cada conjunto represente estos en una gráfica y si parece apropiada una ecuación lineal. determine los coeficientes a y b a partir de los mismos. Tamaño x 20 22 25 30 40 45 50 55 60 63 70 Costo total y 3500 3000 2000 1600 1000 800 900 950 1100 1300 1500 2 Una compañía que tiene 15 tiendas ha recopilado datos en relación con los metros cuadrados de area de ventas respecto a los ingresos mensuales.1.. y si parece apropiado un modelo lineal determine la ecuación de regresión Tienda a o j e k d n g c l b i h f m 15 Metros X 55 80 85 90 90 110 130 140 180 180 200 200 215 260 300 2315 2 Ingreso Y 45 60 75 75 80 95 95 110 120 105 115 130 140 170 200 1615 XY 2475 4800 6375 6750 7200 10450 12350 15400 21600 18900 23000 26000 30100 44200 60000 289600 X 3025 6400 7225 8100 8100 12100 16900 19600 32400 32400 40000 40000 46225 67600 90000 430075 2 . Trace una gráfica de los datos. sin tener en cuenta la cantidad concreta de cada uno de ellas. c)¿ Qué volumen de ventas de la empresa se podría esperar en un año que se gaste de publicidad 60000 pesetas? ¿ Y para un gasto en publicidad de 200000 pesetas? d) Si lo único que interesase fuese la evolución del volumen de ventas en términos de gastos en publicidad. Ptas) Gastos Publicidad(miles ptas.) 10 16 15 32 20 48 22 56 30 64 32 80 a) ¿ Existe relación lineal entre las ventas de la empresa y sus gastos en publicidad? Razona la respuesta. De una determinada empresa se conocen los siguientes datos. b) Obtener las rectas de regresión mínimo cuadrático. ¿existiría correlación ordinal entre ambas variables? SOLUCIÓN: . referidos al volumen de ventas ( en millones de pesetas) y al gasto en publicidad ( en miles de pesetas) de los últimos 6 años: Volumen de ventas(mill.3.