|

13ª
CLASE
Regresión lineal
14ª
CLASE
Probabilidad: Introducción
15ª
CLASE
Probabilidad: Relación entre sucesos
16ª
CLASE
Cálculo de probabilidades

|
|
 |
 |
LECCION 12ª
Coeficiente de correlación lineal
En una distribución bidimensional puede ocurrir que las
dos variables guarden algún tipo de relación entre
si.
Por ejemplo,
si se analiza la estatura y el peso de los alumnos de una clase
es muy posible que exista relación entre ambas variables:
mientras más alto sea el alumno, mayor será su peso.
El coeficiente de correlación lineal mide
el grado de intensidad de esta posible relación entre las
variables. Este coeficiente se aplica cuando la relación
que puede existir entre las varables es lineal (es decir, si representaramos
en un gáfico los pares de valores de las dos variables
la nube de puntos se aproximaría a una recta).
  
No obstante, puede que exista una relación que no sea
lineal, sino exponencial, parabólica, etc. En estos casos,
el coeficiente de correlación lineal mediría mal
la intensidad de la relación las variables, por lo que
convendría utilizar otro tipo de coeficiente más
apropiado.
Para ver, por tanto, si se puede utilizar el coeficiente de correlación
lineal, lo mejor es representar los pares de valores en un gráfico
y ver que forma describen.
El coeficiente de correlación lineal se calcula
aplicando la siguiente fórmula:

Es decir:
Numerador: se denomina covarianza y se calcula
de la siguiente manera: en cada par de valores (x,y) se multiplica
la "x" menos su media, por la "y" menos
su media. Se suma el resultado obtenido de todos los pares de
valores y este resultado se divide por el tamaño de la
muestra.
Denominador se calcula el produto de las varianzas de
"x" y de "y", y a este produto se le calcula
la raíz cuadrada.
Los valores que puede tomar el coeficiente de correlación
"r" son: -1 < r < 1
Si "r" > 0, la correlación lineal
es positiva (si sube el valor de una variable sube el de la
otra). La correlación es tanto más fuerte cuanto
más se aproxime a 1.
Por ejemplo: altura y peso: los
alumnos más altos suelen pesar más.
Si "r" < 0, la correlación lineal
es negativa (si sube el valor de una variable disminuye el de
la otra). La correlación negativa es tanto más
fuerte cuanto más se aproxime a -1.
Por ejemplo: peso y velocidad:
los alumnos más gordos suelen correr menos.
Si "r" = 0, no existe correlación lineal
entre las variables. Aunque podría existir otro tipo
de correlación (parabólica, exponencial, etc.)
De todos modos, aunque el valor de "r" fuera próximo
a 1 o -1, tampoco esto quiere decir obligatoriamente que existe
una relación de causa-efecto entre las dos variables, ya
que este resultado podría haberse debido al puro azar.
Ejemplo: vamos a calcular
el coeficiente de correlación de la siguiente serie de
datos de altura y peso de los alumnos de una clase:
|
Alumno
|
Estatura
|
Peso
|
Alumno
|
Estatura
|
Peso
|
Alumno
|
Estatura
|
Peso
|
|
x
|
x
|
x
|
x
|
x
|
x
|
x
|
x
|
x
|
|
Alumno
1
|
1,25
|
32
|
Alumno
11
|
1,25
|
33
|
Alumno
21
|
1,25
|
33
|
|
Alumno
2
|
1,28
|
33
|
Alumno
12
|
1,28
|
35
|
Alumno
22
|
1,28
|
34
|
|
Alumno
3
|
1,27
|
34
|
Alumno
13
|
1,27
|
34
|
Alumno
23
|
1,27
|
34
|
|
Alumno
4
|
1,21
|
30
|
Alumno
14
|
1,21
|
30
|
Alumno
24
|
1,21
|
31
|
|
Alumno
5
|
1,22
|
32
|
Alumno
15
|
1,22
|
33
|
Alumno
25
|
1,22
|
32
|
|
Alumno
6
|
1,29
|
35
|
Alumno
16
|
1,29
|
34
|
Alumno
26
|
1,29
|
34
|
|
Alumno
7
|
1,30
|
34
|
Alumno
17
|
1,30
|
35
|
Alumno
27
|
1,30
|
34
|
|
Alumno
8
|
1,24
|
32
|
Alumno
18
|
1,24
|
32
|
Alumno
28
|
1,24
|
31
|
|
Alumno
9
|
1,27
|
32
|
Alumno
19
|
1,27
|
33
|
Alumno
29
|
1,27
|
35
|
|
Alumno
10
|
1,29
|
35
|
Alumno
20
|
1,29
|
33
|
Alumno
30
|
1,29
|
34
|
Aplicamos la fórmula:
|
(1/30)
* (0,826)
|
| r
= |
----------------------------------------------------------
|
|
(((1/30)*(0,02568))
* ((1/30)*(51,366)))^(1/2)
|
Luego,
Por lo tanto, la correlación existente entre estas dos
variables es elevada (0,7) y de signo posítivo.

Clase anterior |

Proxima clase |
|