You are on page 1of 25

Correlacin y Regresin

La correlacin mide la asociacin


entre las variables X e Y.

La regresin encuentra una relacin
entre las variables X e Y.

Diagrama de dispersin
Dados n datos: (x
1
,

y
1
), ( x
2
, y
2
),, ( x
n
,

y
n
).
El diagrama de dispersin es la grfica
de los datos.
Y



X
Covarianza
Dados n datos: (x
1
,

y
1
), ( x
2
, y
2
),, ( x
n
,

y
n
).

La covarianza es:
n
y y x x
sd
n
i
i i
xy

=

=
1
__ __
) )( (
Propiedad.
Covarianza












.
2
1 1 1
) 2
) 1
x xx
n
i
i
n
i
i
n
i
i i
xy
sd sd
n
y
n
x
n
y x
sd
=
|
|
|
|
.
|

\
|
|
|
|
|
.
|

\
|

|
|
|
|
.
|

\
|
=

= = =
Coeficiente de correlacin lineal

Dados n datos: (x
1
,

y
1
), ( x
2
, y
2
),, ( x
n
,

y
n
).

El coeficiente de correlacin lineal es:

y x
xy
sd sd
sd
r
*
=
Propiedad.
Coeficiente de correlacin lineal
1)


2)

) 1 0 (
1 1
2
s s
s s
r
r
0 , 1
0 , 1
1
2
< + = =
> + = =
+ = =
b bx a y r
b bx a y r
bx a y r
Regresin lineal simple
Dados n datos: (x
1
,

y
1
), ( x
2
, y
2
),, ( x
n
,

y
n
).

La regresin lineal simple encuentra una recta
L: y = a + bx
que modela los datos,
para estimar un valor de la variable Y
dado un valor de la variable X.

Coeficiente de regresin


El coeficiente de regresin es la pendiente
de la recta de regresin.

Mtodo de mnimos cuadrados
Dados n datos: (x
i
,

y
i
)
(i = 1, 2,, n.)

x
i (i = 1, 2,, n.)
: valor observado de X.
y
i (i = 1, 2,, n.)
: valor observado de Y.


Si L: y = a + bx es la recta de regresin,

(i = 1, 2,, n.)
: valor esperado de Y
dado X = x
i
(i = 1, 2,, n.)
: error
i i
bx a y + =

i i i
y y e

=
Sea


La recta de regresin de mnimos cuadrados
de Y sobre X, es la recta L: y = a + bx
que minimiza





= = =
+ = = =
n
i
i i
n
i
i i
n
i
i
bx a y y y e SCE
1
2
1
2
1
2
)) ( ( )

(
SCE
Los valores de b y a que minimizan ,
son:

SCE
x
y
sd
sd
r b =
__ __
x b y a =
Propiedad. Recta de regresin
Si L: y = a + bx es la recta de regresin de
mnimos cuadrados de Y sobre X.
1)

2)

3)

L y x e ) , (
__ __
0
__
= e
__ __

y y =
Ejemplo

Durante 8 semanas se observa la relacin,
entre el nmero de comerciales contratados
y el valor de las ventas (en miles de soles)
de un artculo.
Semanas Comerciales (X) Ventas (Y)
1 58 208
2 51 171
3 85 253
4 35 126
5 62 206
6 70 220
7 98 275
8 104 281
a) Encontrar una recta de regresin de las
ventas sobre el nmero de comerciales.

b) Si en una semana se contratan 75
comerciales, estimar las ventas esa
semana.
0
50
100
150
200
250
300
0 20 40 60 80 100 120
Comerciales
V
e
n
t
a
s
a)
x y L
a b
r
sd
sd sd
y x
xy
y x
171 . 2 698 . 64 :
698 . 64 , 171 . 2
981 . 0
187 . 1074
196 . 49 , 242 . 22
5 . 217 , 375 . 70
__ __
+ =
= =
=
=
= =
= =
0
50
100
150
200
250
300
0 20 40 60 80 100 120
Comerciales
V
e
n
t
a
s
b)

5 . 227 ) 75 (

75 = + = = b a y x Si
0
50
100
150
200
250
300
0 20 40 60 80 100 120
Comerciales
V
e
n
t
a
s
Descomposicin de la varianza
Varianza Total:


Varianza No Explicada:


Varianza Explicada
por la Regresin:

n
y y
sd VT
n
i
i
y

=

= =
1
2
__
2
) (
n
y y
n
e e
sd VNE
n
i
i i
n
i
i
e

= =

=

= =
1
2
1
2
__
2
)

( ) (
n
y y
sd VER
n
i
i
y

=

= =
1
2
__
2

(
Propiedad.
Descomposicin de la varianza
.
VER VNE VT + =
) (
2

2 2
y e y
sd sd sd + =
Coeficiente de determinacin

El coeficiente de determinacin es:



Mide que proporcin de la VT es la VER




VT
VER
R =
Propiedad.
Coeficiente de determinacin






.
) 1 0 (
2
s s
=
R
r R
Ejemplo

En el ejemplo anterior:

% 96 96 . 0
981 . 0
2
= = =
=
r R
r

You might also like