Professional Documents
Culture Documents
300
f(x)=ax+b
R2=0.99
250
200
150
0
100
50
REGRESIN
10
15
20
25
x+1
REGRESIN
Es una forma de estudiar la asociacin o relacin, entre
una variable dependiente (Y) y la variable que es la base de
la prediccin a la que se le denomina variable
independiente (X)
Y
y=f(x)
X2
X1
Donde:
Qu vamos a estudiar
En esta unidad estudiaremos la Regresin Lineal simple, es
decir, vamos a tratar diferentes formas de describir la relacin
entre dos variables cuando estas son numricas.
Ejemplo:
Estudiar si hay relacin
entre la altura (X ) y el peso (Y ).
y=f(x)
= 0 + 1 X
Y
Esta
determinado
por 2
variables:
residuo
error
Y = b0 + b 1 X
b0 (ordenada en el origen, constante)
b1 (pendiente de la recta)
DIAGRAMA DE DISPERSION
Es la representacin de los puntos o datos de cada una
de las variables en el plano cartesiano.
100
90
80
70
60
50
40
30
140
150
160
170
180
190
200
SC xy
( X )( Y )
XY
n
SC x
2
X
i
( Xi ) 2
n
B1
SC xy
SC x
_
donde:
B0 y B 1 x
Xi
Yi
x
,y
_
Y = b0+b1(X)
EJEMPLO:
En un estudio de la relacin entre la publicidad por radio y las
ventas de un producto, durante 10 semanas se han recopilado,
los tiempos de duracin en minutos de la publicidad por semana
(X), y el nmero de artculos vendidos (Y).
Semana
10
Publicidad en
minutos X
20
30
30
40
50
60
60
60
70
80
Ventas Y
50
73
69
87
108
128
135
132
148
170
Solucin
Y X Y
i i
X Xi / n ,
2
i
Y Yi / n
Solucin
Reemplazando en las formula de los coeficientes de regresin, se tiene lo
siguiente:
b1
_
SC xy
SC x
b 0 y b x
Por lo tanto la recta de regresin Y = b0+b1(X), estar determinada de la siguiente
manera Y = 10+ 2x.
Interpretacin
B0: El Nmero real de artculos vendidos es de 10 unidades.
B1: El nmero promedio de artculos vendidos aumenta en 2 unidades a
medida que aumenta cada minuto de duracin, de la publicidad en la semana.
Sy.x
2
y
B0 y B1 xy
n2
e=yy
El anlisis de correlacin
El anlisis de correlacin es la tcnica estadstica
que permite describir el grado hasta el cual una
variable est linealmente relacionada con otra.
Hay dos medidas que se usan para
describir la correlacin
El coeficiente de correlacin
El coeficiente de determinacin
EL COEFICIENTE DE CORRELACIN DE
PEARSON
r
SCXY
( SCX )( SCY )
Fuerte
Negativa
-1 -0,9
Perfecta
Negativa
Moderada
Negativa
-0,5
Dbil
Negativa
Dbil
Positiva
0
No existe
correlacin
Moderada
Positiva
0,5
Fuerte
Positiva
0,9 1
Perfecta
Positiva
CASO 2
CONTAMINACIN
60
50
y = 0.9036x + 3.8296
R = 0.9129
40
30
20
10
10
20
30
40
50
60
Resumen
Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones
0.96
0.91
0.91
3.23
33
Y = 3.8296 + 0.9036 X
Por cada unidad porcentual de reduccin de slidos, el
porcentaje de reduccin de la demanda de oxgeno aumenta
en 0.9036 (%).
R2= 0,9129