You are on page 1of 5

Anlisis de Datos I

Esquema del Tema 12

Tema 12. Regresin Lineal


1. INTRODUCCIN
2. IDENTIFICACIN DEL MODELO
3. VALORACIN DEL MODELO
Coeficiente de determinacin
Descomposicin de la varianza del criterio
4. APLICACIN DEL MODELO
5. EJEMPLO

__________________
Bibliografa: Tema 10 (pg. 185-210)
Ejercicios recomendados del libro: 1, 2, 3, 5, 6, 8, 11, 12, 13,
16, 17, 19 y 24..

Carmen Ximnez

Anlisis de Datos I

Esquema del Tema 12

1. INTRODUCCIN
OBJETIVO: Hacer predicciones o pronsticos en una variable (Y) a partir de otra (X):
Regresin de Y sobre X

Variable predictora: X (o variable independiente, VI) La que se utiliza para hacer pronsticos
Variable criterio:
Y (o variable dependiente, VD) Sobre la que se pronostica
Para ello, se crea un modelo (la recta de regresin Y = A + B X) que se aproxime o ajuste
lo ms posible a los datos observados en X y en Y.

2. IDENTIFICACIN DEL MODELO


Criterio de Mnimos cuadrados
Y = A + BX

Se trata de encontrar aquella recta de regresin Y en que la


distancia al cuadrado entre ella y las puntuaciones
observadas sea mnima. Es decir:

(Y i - Y i)2

(Y

Modelo en Directas:

YX

Yi ' ) 2
n

- Pendiente: B

0 Error cuadrtico medio

Yi = A + B Xi

n Xi Yi

X Y
n X -( X )

i
2

2
i

O Tambin:

BYX = rXY

SY
SX

- Origen: A YX = Y - B YX X
Modelo en Diferenciales: yi = a + b xi

Modelo en Tpicas: zy = a* + b* ZX
*

- Origen: no hay (a = 0)
- Pendiente: b = BYX

- Origen: no hay ( a = 0 )
*
- Pendiente: b = rxy

Por tanto: y = b x

Por tanto: zy = b* Zx

3. VALORACIN DEL MODELO


Coeficiente de determinacin:
2
rXY
: Proporcin de varianza de Y

que queda explicada por X

Descomposicin de la varianza del criterio (Y):


Modelo:

Yi
Puntuacin
emprica

Carmen Ximnez

Yi
Puntuacin
pronosticada

(Yi Yi)
Error en el
pronstico

Anlisis de Datos I

Esquema del Tema 12

La varianza para Y = Y + (Y Y) es:

S Y2 = S Y2' + S Y2Y ' + 2 S Y '(Y Y ')

SY2 ' =

Donde:

(Y

2
S Y-Y
' =

'

Y' )2

n
(Yi Yi' ) 2
n

= S Y2 X

S Y(Y-Y) = 0

Sustituyendo:

S Y2 = S Y2 ' + S Y2 X

Donde: SY2 (Varianza del criterio) se descompone en:

SY2 ' : Varianza de los pronsticos (varianza explicada)


SY2X : Error cuadrtico medio (varianza no explicada)
La expresin

2
SY2 X = SY2 (1 rXY
)

conecta SY2 con el coeficiente de correlacin de Pearson

Otras frmulas tiles derivadas de las anteriores son:

S Y2 '
=
............. Proporcin de varianza explicada por el modelo
S Y2

1 r2 =

S Y2 X
S Y2

...... Proporcin de varianza no explicada por el modelo

4. EJEMPLO (resuelto)
X: Auto-registro del n cigarrillos fumados al da
Y: Deseos de comenzar una terapia contra el tabaco

5
8

X
Y

7
6

9
7

13
5

6
9

10
8

6
4
2
0
0

10 12 14

rxy =

X Y
n X (X ) n Y (Y )

n Xi Yi

2
i

2
i

5 264 40 35
5 360 402 5 255 352

= 0,80

X e Y estn linealmente relacionadas (de forma inversa)

Carmen Ximnez

Anlisis de Datos I

:
Media
Varianza
Desv. tp.

Esquema del Tema 12

X
5
7
9
13
6
40
8
8
2,83

X2
25
49
81
169
36
360

Y
8
6
7
5
9
35
7
2
1,41

Y2
64
36
49
25
81
255

XY
40
42
63
65
54
264

I. Identificacin del modelo


Directas: Yi = 10,2 0,40 Xi

B=

n Xi Yi

n X

X Y
- ( X )

2
i

5 264 40 35 80
=
= 0,40
5 360 402
200

A = Y - BX = 7 - (-0,40)(8) = 10,2
Diferenciales yi = -0,40 xi
Tpicas zyi = -0,80 zxi
10
8
6

Y - Y (Y - Y)2
-0,20
0,04
-1,40
1,96
0,40
0,16
0
0
1,20
1,44
0
3,6
0
0,72
0,72

Y
8,20
7,40
6,60
5
7,80
:
35
Media
7
Varianza 1,28

4
2
0
0

8 10 12 14

II. Valoracin del modelo


2

Coeficiente de determinacin: rxy = (-0,80)2 = 0,64


Proporcin de varianza de Y que queda explicada por X

Descomposicin de la varianza del criterio (Y):

S Y2 = S Y2 ' + S Y2 X

2
S Y2 = 2 .... S Y2 X = S Y2 (1 rXY
) = 2 (1 0 , 64 ) = 0 , 72

S Y2 ' = S Y2 S Y2 X = 2 0 , 72 = 1 , 28
III. Aplicacin del modelo

Si un sujeto fuma 15 cigarrillos al da Cunto punta en deseos de dejar de fumar?


Directas:
Yi = 10,2 0,40 Xi = 10,2 (0,40) (15) = 4,2
Diferenciales: yi = 0,40 xi = (-0,40) (15 - 8) = -2,80
Tpicas:
Zyi = -0,80 Zxi = (-0,80) ((15 8)/2,83) = -1,98

Carmen Ximnez

Anlisis de Datos I

Esquema del Tema 12

5. EJERCICIOS
EJERCICIO 1

Xi
4
5
2

Yi
8
7
4

X: Horas de estudio
Y: Calificacin obtenida

1. Obtenga la ecuacin de regresin de Y sobre X (en directas, diferenciales y tpicas)


2. Le merece confianza el modelo? (represente grficamente el ajuste de los puntos a la
recta)
3. Descomponga la varianza del criterio
4. Si un sujeto estudia 3 horas, Qu calificacin le pronosticaramos segn el modelo?
5. Si un sujeto estudia 2 horas, En cunto nos equivocaramos al predecir su calificacin
con la ecuacin el modelo?
EJERCICIO 2

Tras medir en una muestra las variables


X: Extroversin
Y: Impulsividad
V: Control
Se obtuvieron los estadsticos:
X

Y
0,85

V
0,62
-0,93

Medias:

15

21

12

Varianzas:

14

R=

X
Y
V

Se desea predecir la impulsividad a partir de alguna de las restantes variables


1. Obtenga la ecuacin de regresin
2. Descomponga la varianza del criterio y valore el modelo anterior
3. Si un sujeto obtuviera una diferencial de 3 en la predictora, Qu puntuacin directa le
pronosticara en impulsividad?
4. Qu valor tiene en la predictora un sujeto al que le pronosticamos 18 puntos con el
modelo?

Carmen Ximnez

You might also like