Professional Documents
Culture Documents
Regresión y Correlación
Relaciones entre variables
Francis Galton
•Primo de Darwin
“Cada peculiaridad en un hombre es compartida por sus •Estadístico y aventure
descendientes, pero en promedio , en un grado menor. Regresión a la •Fundador (con otros)
la estadística moderna
media”
para explicar las teoría
de Darwin.
Regresión y Correlación
Conclusión
Regresión y Correlación
Modelo de Regresión Lineal
Yi xi i
Error
Residual
Parámetros
Parte
sistemática
Regresión y Correlación
Elementos del Modelo
Regresión y Correlación
Supuestos del Modelo
Regresión y Correlación
CALCULO DE LA RECTA DE REGRESIÓN
( x1 , y1 ) , ( x2 , y2 ) , ... , ( xn , yn )
Yi xi i
Modelo de Regresión
yi ~ N ( E (Y / xi ), 2 )
Recta de Estimación y a b. x
Regresión y Correlación
Regresión Lineal
Algebra de la Muestra.
– X = Variable independiente
• Predictora
• Explicativa
Regresión y Correlación
Estudio conjunto de dos variables
Regresión y Correlación
Diagramas de dispersión o nube de puntos
100
90
80 Pesa 76 kg.
70
Regresión y Correlación
Relación entre variables.
100
90
80
70
60
50
40
30
140 150 160 170 180 190 200
Regresión y Correlación
Predicción de una variable en función de la otra.
100
90
80
70
10 kg.
60
50
10 cm.
40
30
140 150 160 170 180 190 200
Regresión y Correlación
Estimación
a ˆ Existen dos métodos para hallar los estimadores de y
que dan los mismos resultados.
b ˆ
Método de Máxima
Verosimilitud
n
2 n
Regresión y Correlación
i i i
( y y ) [ y (a b. x i )] 2
i 1 i 1
n
(a, b) [ yi a b. xi ]2 mín
i 1
(a, b)
0
a
(a, b)
0
a Y b.X
b
n n
xi . yi n.X .Y ( xi . X ).( yi Y ) Cov( x, y )
b i 1
n
i 1
n
V ( x)
x 2
i n. X 2
( xi X ) 2
i 1 i 1
Regresión y Correlación
Covarianza de X e Y
1
cov( x, y) ( xi x )( yi y)
n i
Regresión y Correlación
Relación directa e inversa.
330 100
280 90
80
230
70
180
60
130 50
80 40
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Para valores de X por encima de la media •Para los valores de X mayores que la media le
tenemos valores de Y por encima y por corresponden valores de Y mayores también.
debajo en cantidades similares. No existe
relación •Para los valores de X menores que la media le
corresponden valores de Y menores también.
e i yo yc 16
14
12
10
yo
i ~ N (0, )
8
2 6
2
0
0 1 2 3 4 5 6
cov( i , j ) 0 i j
Regresión y Correlación
100
90
80
70
ei en
yˆ a bx
60 e1
50
40
30
140 150 160 170 180 190 200
Regresión y Correlación
Interpretación de los coeficientes
• b= pendiente de la recta
Regresión y Correlación
Otros modelos de Regresión
¿recta o parábola?
¿recta o cúbica?
Regresión y Correlación
Interpretación de la variabilidad en Y
Regresión y Correlación
Interpretación del residuo
Ahora en los errores de predicción (líneas
verticales). Los proyectamos sobre el eje Y. Y
Regresión y Correlación
Coeficiente de Determinación = r2
100
90 ŷ
80 Error no yo
Explicado
Error
70 Error Explicado total
60
50 y
40
30
140 150 160 170 180 190 200
Regresión y Correlación
Error = Error no + Error Explicado
y Y yi yˆ i yˆ i Y
total Explicado
y Y yi y ˆ i Y
ˆi y
2 2
i
y yi y ˆ i Y
ˆi y
n n
2 2
i Y
i 1 i 1
yi Y yi yˆ i yˆ i Y
n n n
2 2 2
i 1 i 1 i 1
V .T .V . N .E V .E .
Regresión y Correlación
V .T . V . N .E .V .E . V . N .E . V .E .
1
V .T . V .T . V .T . V .T .
V . N .E . V .E .
1 r 2
V .T . V .T .
0 r2 1
r 2 0 VE 0 VNE VT
r 2 1 VE VT VNE 0
No detecta el tipo de relacion
Regresión y Correlación
Coeficiente de Determinación
Resumiendo: Y
VNE
R 1
2
VT
S 2
e S 2
Y
Regresión y Correlación
Resumen sobre bondad de un ajuste
Regresión y Correlación
Coef. de correlación lineal de Pearson
cov( x, y )
r
Sx Sy
Regresión y Correlación
Coeficiente de Correlación :r
• Existe una relación lineal entre las variables, la cual está medida por el
coeficiente de correlación poblacional definido como :
cov( x, y)
n i 1
( xi X )( yi Y ) xi yi nXY
r r i 1
1 r 1
S ( x ).S ( y) 1 n
( x nX )( y nY )
2 2 2 2
n
( x i X ) 2 ( yi Y ) 2 i i
i 1
2 2 2
Regresión y Correlación r (r ) 0 r 1; 1 r 1
Correlaciones Negativas
90 80
80 70
70 60
60 50
50
40
40
30
30
20 20
10 r=-0,5 10 r=-0,7
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 r=-0,95 10 r=-0,999
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Regresión y Correlación
correlaciones positivas
330 130
120
280 110
230 100
90
180 80
70
130 60
80 50
r=0,1 40
r=0,4
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
110 100
100 90
90 80
80
70
70
60
60
50 50
40 r=0,6 40 r=0,8
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Regresión y Correlación
casi perfectas y positivas
100 100
90 90
80 80
70 70
60 60
50 50
40 r=0,9 40 r=0,99
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
100
90
80
70
60
50
40 r=1
30
140 150 160 170 180 190 200
Regresión y Correlación
Animación: Residuos del modelo de regresión
Regresión y Correlación
INFERENCIA SOBRE EL COEFICIENTE DE CORRELACIÓN
Distribución del coeficiente de correlación muestral r
r
~ t n2
( n ) es pequeño 1 r2
n2
H0 : = 0 H0 : X e Y son independientes
H1 : 0 H1 : X e Y no son independientes
Regresión y Correlación
DISTRIBUCIÓN DE LOS ESTIMADORES DE y
a ~ N ( , a )
a
~ N (0,1) con a e. xi2 e es desconocido
a n. ( xi X ) 2
a
entonces ~ t n2
Sa
b e
b ~ N ( , b ) ~ N (0,1) como b e es desconocido
b ( xi X ) 2
b
entonces ~ t n2 ,
Sb
Regresión y Correlación
VARIANCIA DE LA RECTA DE REGRESIÓN
Y X
i i i con i ~ N (0, 2 )
E ( yˆ i ) xi E ( yi )
yˆ i es un estimador no viciado de x i
Regresión y Correlación
V {Y b( x i X )}
V (Yˆi ) V (a bxi )
2 V ( i )
2 2
V (Y ) e
n
2
2
V (Yˆi ) ( xi X ) 2 .
n i
( x X ) 2
1 ( x X ) 2
V (Yˆi )
2 i
2
Regresión y Correlación
n ( xi X )
ESTIMACIÓN DE LA MEDIA DE Yi
Yi ~ N ( . xi , e )
yˆ i ( . xi ) yˆ i yi
~ N (0,1)
yˆ i yˆ i
yˆ i ( . x i ) yˆ i yi
yˆ i S ( yˆ i )
~ t n2
S ( yˆ i ) S ( yˆ i )
yˆ i t n 2; / 2 .S ( yˆ i ) yi yˆ i t n 2; / 2 .S ( yˆ i )
Regresión y Correlación
ESTIMACION DE UN FUTURO VALOR Yi PARA Xi FIJO
1 ( xi X ) 2
V(yˆ /x i ) V ( i ) V ( yˆ i ) .
2 2
2
n i
( x X )
1 ( xi X ) 2
V ( yˆ / xi ) S 2
S .1
2
2
n ( xi X )
( yi ) e
yˆ i t n2; / 2 .S ( yi ) y yˆ i t n2; / 2 .S ( yi )
Regresión y Correlación