![]() |
||
![]() |
||
![]() ![]() ![]() ![]() ![]() ![]() ![]() |
||
|
|
LECCION 13ª
Representamos en un gráfico los pares de valores de una distribución bidimensional: la variable "x" en el eje horizontal o eje de abcisa, y la variable "y" en el eje vertical, o eje de ordenada. Vemos que la nube de puntos sigue una tendencia lineal:
El coeficiente de correlación lineal nos permite determinar si, efectivamente, existe relación entre las dos variables. Una vez que se concluye que sí existe relación, la regresión nos permite definir la recta que mejor se ajusta a esta nube de puntos.
Una recta viene definida por la siguiente fórmula:
Donde "y" sería la variable dependiente, es decir, aquella que viene definida a partir de la otra variable "x" (variable independiente). Para definir la recta hay que determinar los valores de los parámetros "a" y "b":
La regresión lineal nos permite calcular el valor de estos dos parámetros, definiendo la recta que mejor se ajusta a esta nube de puntos. El parámetro "b" viene determinado por la siguiente fórmula:
Es la covarianza de las dos variables, dividida por la varianza de la variable "x". El parámetro "a" viene determinado por:
Es la media de la variable "y", menos la media de la variable "x" multiplicada por el parámetro "b" que hemos calculado. Ejemplo: vamos a calcular la recta de regresión de la siguiente serie de datos de altura y peso de los alumnos de una clase. Vamos a considerar que la altura es la variable independiente "x" y que el peso es la variable dependiente "y" (podíamos hacerlo también al contrario):
El parámetro "b" viene determinado por:
Y el parámetro "a" por:
Por lo tanto, la recta que mejor se ajusta a esta serie de datos es:
Esta recta define un valor de la variable dependiente (peso), para cada valor de la variable independiente (estatura):
|