You are on page 1of 4

CORRELACION Y REGRESION LINEAL

Con el anlisis de correlacin y regresin se pretende determinar qu tan relacionadas estn


entre si dos variables.
Si la relacin entre ambas variables es bastante fuerte, es posible obtener un modelo
matemtico que puede ser utilizado para hacer predicciones en base a datos que no se
encuentran dentro de la distribucin original.

El punto de partida para el anlisis de regresin y correlacin lineal, es obtener un conjunto


de pares de datos de las variables que se suponga que estn relacionados entre s. La grafica
resultante es el diagrama de dispersin. A travs del diagrama de dispersin es posible
suponer una curva que se aproxime a los datos denominada curva de regresin. Esto va
a depender del tipo de dispersin que se obtenga de la nube de puntos.

MODELO DE REGRESION LINEAL


Con el anlisis de regresin lineal se pretende obtener un modelo matemtico que relacione
ambas variables. Este modelo se conoce con el nombre de modelo de mnimos
cuadrados

El modelo de mnimos cuadrados se representa de la siguiente manera:

s xy
y y (x x)
s x2

Donde: = media marginal de la variable y


= media marginal de la variable x
= covarianza
= desviacin tpica marginal de la variable x elevada al cuadrado

Entonces para obtener el modelo matemticos de mnimos cuadrados, se procede de la


siguiente manera.
Paso 1: Determinar cul de las dos variables es independiente y cual la dependiente.
La designacin de cual variable es la independiente y cual la dependiente requiere de
criterio, y anlisis del problema.

Por lo general: Se designa con x a la variable independiente.


Se designa con y a la variable dependiente.

Paso 2: Calculo de medias marginales.


Paso 3: Calculo desviaciones tpicas marginales.
Paso 4: Calculo de la covarianza.
Paso 5: Calculo de la correlacin.

Si al calcular la correlacin se determina que la relacin entre ambas variables es bastante


fuerte, entonces se procede con el paso 6.

Interpretacin del coeficiente de correlacin


-1.00 Correlacin negativa perfecta
-0.95 Correlacin negativa muy fuerte
-0.75 Correlacin negativa considerable
-0.50 Correlacin negativa media.
-0.10 Correlacin negativa dbil
0.00 No existe correlacin alguna.
0.10 Correlacin negativa dbil
0.50 Correlacin negativa media.
0.75 Correlacin negativa considerable
0.95 Correlacin negativa muy fuerte
1.00 Correlacin negativa perfecta

correlacin de 0 a 1 correlacin de 0 a -1

Paso 6: determinar el modelo de regresin lineal


En este paso se sustituyen los datos que pide el modelo ya calculados en los pasos
anteriores.
Ejemplo
En los casos anteriores las variables x, y cuentan con una frecuencia de ocurrencia de
los dados, pero puede haber casos en que esta frecuencia no exista. Cuanto esto paso el
procedimiento para obtener el modelo de regresin lineal es el siguiente:

Aos de trabajo 4 5 7 6 5
Salario (en miles de
quetzales) 52 54 55 54 53

Aos de Sueldo
trabajo recibido
x y xi2 yi2 xi*yi
4 52 16 2,704 208
5 54 25 2,916 270
7 55 49 3,025 385
6 54 36 2,916 324
5 53 25 2,809 265
27 268 151 14,370 1,452

Ejemplo
Cuando se cuenta con frecuencia en cada valor de x y y
La siguiente tabla muestra los salarios de 5 empresas diferentes, pagados a sus empleados
de acuerdo a los aos de trabajados. Se desea realizar un anlisis entre 22 empleados para
determinar si las empresas pagan lo justo en funcin de los aos trabajados y conforme la
ley lo estipula.

Aos de trabajo 4 5 7 6 5
Salario (en miles de
quetzales) 52 54 55 54 53
No. Empleados 3 4 5 7 3

Aos de Sueldo
trabajo recibido
x y fi fi*xi fi*yi xi2 fi*xi2 yi2 fi*yi2 fi*xi*yi
4 52 3 12 156 16 48 2,704 8,112 624
5 54 4 20 216 25 100 2,916 11,664 1,080
7 55 5 35 275 49 245 3,025 15,125 1,925
6 54 7 42 378 36 252 2,916 20,412 2,268
5 53 3 15 159 25 75 2,809 8,427 795
22 124 1184 720 63,740 6,692

You might also like