You are on page 1of 40

1

TEMA 5
CORRELACIN Y REGRESIN
LINEAL SIMPLE
CORRELACIN Y REGRESIN LINEAL SIMPLE
2
NDICE
INTRODUCCIN
DIAGRAMA DE DISPERSIN
COVARIANZA
REGRESIN LINEAL SIMPLE: CRITERIO DE
LOS MNIMOS CUADRADOS
BONDAD DE AJUSTE Y CORRELACIN
EL COEFICIENTE DE CORRELACIN
LINEAL DE PEARSON Y LAS RECTAS DE
REGRESIN
PREDICCIN
ALGUNAS REFLEXIONES
CUADRO RESUMEN
REGRESIN NO LINEAL
CORRELACIN Y REGRESIN LINEAL SIMPLE
3
INTRODUCCIN
Existen muchos fenmenos reales en los que intervienen dos variables
conjuntamente y para los que se busca analizar la relacin entre ambas.
Siempre que sea posible predecir con exactitud los valores de una
variable a partir de los de la otra, se dice que ambas variables estn en
relacin funcional. Cuando las dos variables no tienen ninguna relacin se
dice que son independientes y podemos estudiarlas por separado.
No obstante, en la mayora de problemas econmico-empresariales, entre
dos variables no se puede establecer una relacin funcional ni tampoco
afirmar que exista interrelacin. Se dice que existe relacin o dependencia
estadstica entre las dos variables y su anlisis se puede abordar desde dos
enfoques distintos y complementarios:
CORRELACIN Y REGRESIN LINEAL SIMPLE
4
INTRODUCCIN
De la determinacin de la funcin matemtica que explica las fluctuaciones
de una variable en funcin de la otra se encarga la denominada Teora de la
Regresin. Mientras que el estudio del grado de dependencia que pueda
existir entre las variables es propio de la denominada Teora de la
Correlacin.
A) La determinacin de una funcin matemtica que mejor explique las
variaciones de la variable dependiente (endgena), en funcin de las
fluctuaciones que experimente la variable independiente (exgena).
B) El estudio del grado de dependencia existente entre las variables
estudiadas.
CORRELACIN Y REGRESIN LINEAL SIMPLE
5
DIAGRAMA DE DISPERSIN
(a) Elegir el tipo de curva que mejor se adapte a los datos disponibles, es
decir, que mejor represente la relacin entre las variables endgena y
exgena. En esta fase suele ser de gran utilidad la representacin grfica
como orientacin para la eleccin.
(b) Fijado el tipo de curva a travs de su ecuacin en forma explcita con un
cierto nmero de parmetros, determinar stos mediante las condiciones
que se impongan segn el procedimiento de ajuste empleado.
Si representamos grficamente en unos ejes de coordenadas los pares de
valores de las dos variables, obtenemos el llamado diagrama de dispersin.
El problema de la Regresin consiste en la obtencin de la ecuacin de una
curva que se adapte lo mejor posible al conjunto de los puntos dados. Por
tanto, tenemos dos problemas:
CORRELACIN Y REGRESIN LINEAL SIMPLE
6
DIAGRAMAS DE DISPERSIN
0
10
20
30
40
50
60
0 20 40 60 80 100 120 140 160 180
0
10
20
30
40
50
60
40 45 50 55 60 65 70 75 80 85
0
20
40
60
80
100
120
0 10 20 30 40 50 60
0
5
10
15
20
25
30
0 10 20 30 40 50 60
Relacin directa Relacin inversa
Ausencia de relacin Relacin no lineal
CORRELACIN Y REGRESIN LINEAL SIMPLE
7
COVARIANZA
Es una medida de la asociacin lineal entre dos variables que resume la
informacin existente en un grfico de dispersin
Mide la tendencia que tiene la nube de puntos a situarse en los cuadrantes
primero y tercero o en los cuadrantes segundo y cuarto tomando como
origen de coordenadas el centro de gravedad de la distribucin de
frecuencias
( )( )
k h
XY i j ij
i 1 j 1
1
s x x y y n
N
= =
=

( ) y , x
CORRELACIN Y REGRESIN LINEAL SIMPLE
8
COVARIANZA
( ) y , x ( ) y , x
( ) y , x
0
10
20
30
40
50
60
0 20 40 60 80 100 120 140 160 180
0
10
20
30
40
50
60
40 45 50 55 60 65 70 75 80 85
0
20
40
60
80
100
120
0 10 20 30 40 50 60
0
5
10
15
20
25
30
0 10 20 30 40 50 60
Relacin directa s
xy
>0 Relacin inversa s
xy
<0
Ausencia de relacin s
xy
=0 Relacin no lineal s
xy
~ 0
( ) y , x
( ) y , x
( ) y , x
( ) y , x
CORRELACIN Y REGRESIN LINEAL SIMPLE
9
COVARIANZA
Una expresin alternativa de la covarianza es:
Es una medida invariante por cambios de origen pero no
por cambios de escala por lo que su valor no tienen un
significado relativo y no puede utilizarse como medida de
grado de fortaleza de la relacin existente entre X e Y
Por el contrario, su signo si es invariante por ambos tipos de
cambio y es un indicador de si el tipo de relacin existente
es directa o inversa
k h
XY i j ij
i 1 j 1
1
s x y n xy
N
= =
=

CORRELACIN Y REGRESIN LINEAL SIMPLE


10
REGRESIN LINEAL SIMPLE:
CRITERIO DE LOS MNIMOS CUADRADOS
La Regresin Lineal Simple busca encontrar la relacin lineal que mejor
explique una variable a partir de la otra. La ecuacin de la recta y = a + bx
depende de dos coeficientes a y b que deben calcularse a partir de los datos
observados.
- El parmetro b es la pendiente de la recta, se denomina coeficiente de
regresin y nos dice cuanto aumenta la variable dependiente cuando la
independiente aumenta una unidad.
- El parmetro a es la ordenada en el origen y representa el valor de la
variable dependiente cuando la independiente toma el valor cero.
CORRELACIN Y REGRESIN LINEAL SIMPLE
11
REGRESIN LINEAL SIMPLE:
Para cada valor observado de la variable independiente x
i
podemos
considerar dos valores de la variable dependiente, el observado y
i
y el
estimado a partir de la ecuacin de la recta, es decir, . La
diferencia entre el valor observado y el valor terico recibe el nombre de
error o residuo, as, el residuo i-simo viene dado por
i i
y a bx = +
i i i
u y y =
Y
X
-
y
i
y
i
x
i
.
= y
i
- u
i
y
i
.
observado
estimado
residuo
-
-
-
-
Y
X
-
y
i
y
i
x
i
.
= y
i
- u
i
y
i
.
= y
i
- u
i
y
i
.
observado
estimado
residuo
-
-
-
-
Recta de regresin de Y sobre X
CORRELACIN Y REGRESIN LINEAL SIMPLE
12
La seleccin de los parmetros a y b se realiza minimizando la suma de
los errores al cuadrado.
En este criterio como los errores estn elevados al cuadrado, no se
compensan los residuos positivos con los negativos y adems, la
expresin es susceptible de manipulaciones algebraicas. Este mtodo
recibe el nombre de Mtodo de los Mnimos Cuadrados.
( )

= =
= =
N
1 i
2
i i
N
1 i
2
i
y

y u s Re SC
REGRESIN LINEAL SIMPLE:
Mtodo de los mnimos cuadrados
CORRELACIN Y REGRESIN LINEAL SIMPLE
13
Sustituyendo valores, vemos que el error total SCRes es funcin de a y b.
y, por tanto, los valores de a y b que hacen mnimo el error total SCRes
son los que resultan de igualar a cero las derivadas parciales primeras
de SCRes respecto a cada uno de estos coeficientes.
( ) ( )

= = =
= = =
N
1 i
2
i i
N
1 i
2
i i
N
1 i
2
i
bx a y y

y u s Re SC
( )
( )

= = =
c
c
= = =
c
c


= =
= =
0 x u 2 x bx a y 2
b
s Re SC
0 u 2 bx a y 2
a
s Re SC
N
1 i
i i
N
1 i
i i i
N
1 i
i
N
1 i
i i
REGRESIN LINEAL SIMPLE:
Recta de regresin de Y sobre X
CORRELACIN Y REGRESIN LINEAL SIMPLE
14
operando:

=
=


= = =
= = =
0 x b x a y x
0 x b a y
N
1 i
2
i
N
1 i
i
N
1 i
i i
N
1 i
i
N
1 i
N
1 i
i

+ =
+ =


= = =
= =
N
1 i
2
i
N
1 i
i
N
1 i
i i
N
1 i
i
N
1 i
i
x b x a y x
x b aN y
Los valores de a y b resuelven este sistema de ecuaciones normales:
la ecuacin de la recta de
regresin de Y sobre X puede
escribirse:
( )
XY
2
X
S
y Y x X
S
=
X
S
S
Y X b Y
N
x
b
N
y
2
X
XY
N
1 i
i
N
1 i
i
= =

= =
a =
2
X
XY
2
N
1 i
i
N
1 i
2
i
N
1 i
i
N
1 i
i
N
1 i
i i
S
S
N
x
N
x
N
y
N
x
N
y x
=
|
|
|
|
.
|

\
|



= =
= = =
b =
y pasa siempre por el centro de
gravedad:
( )
X, Y
REGRESIN LINEAL SIMPLE:
Recta de regresin de Y sobre X
coeficiente de regresin de Y sobre X
CORRELACIN Y REGRESIN LINEAL SIMPLE
15
REGRESIN LINEAL SIMPLE:
Intercambiando los papeles de las variables, en este caso, se busca la
recta X = a + b Y que mejor se ajusta a la nube de puntos.
Ahora para cada valor observado de la variable independiente y
i
podemos considerar dos valores de la variable dependiente, el observado
x
i
y el estimado a partir de la ecuacin de la recta, es decir, .
El residuo i-simo viene dado por
i i
x a ' b' y = +
i i i
u x x =
Y
X
-
y
i
x
i
= x
i
- u
i
.
residuo
-
-
-
-
observado estimado
x
i
.
x
i
Y
X
-
y
i
x
i
= x
i
- u
i
.
residuo
-
-
-
-
observado estimado
x
i
.
x
i
Recta de regresin de X sobre Y
CORRELACIN Y REGRESIN LINEAL SIMPLE
16
REGRESIN LINEAL SIMPLE:
Aplicando el Mtodo de los Mnimos Cuadrados, tenemos:
( ) ( )

= =
= =
N
1 i
2
i i
N
1 i
2
i i
y ' b ' a x x

x s Re SC
Los valores de a y b son los que resultan de resolver el siguiente sistema
de ecuaciones normales:

+ =
+ =


= = =
= =
N
1 i
2
i
N
1 i
i
N
1 i
i i
N
1 i
i
N
1 i
i
y ' b y ' a y x
y ' b N ' a x
2
Y
XY
S
S
' b =
Y
S
S
X ' a
2
Y
XY
=
( ) Y y
S
S
X x
2
Y
XY
=
Por tanto, la ecuacin de la recta de regresin de X sobre Y puede
escribirse:

Recta de regresin de X sobre Y


coeficiente de regresin
de X sobre Y
CORRELACIN Y REGRESIN LINEAL SIMPLE
17
REGRESIN LINEAL SIMPLE:
-
-
-
-
-
-
-
-
-
b > 0
Y
X
-
-
-
-
-
-
-
-
-
b > 0
Y
X
-
-
-
-
-
-
-
-
-
b < 0
Y
X
-
-
-
-
-
-
-
-
-
b < 0
Y
X
2
X
XY
S
S
b = 0 S
2
X
> como
signo
= signo S
XY
As, si S
XY
> 0 o equivalentemente b > 0 la dependencia lineal entre X e Y
es directa, y sta es inversa cuando S
XY
< 0 o b < 0.
Signo de la dependencia lineal
CORRELACIN Y REGRESIN LINEAL SIMPLE
18
BONDAD DE AJUSTE
Como se ha dicho el objetivo fundamental es realizar predicciones, pero
estas deberan ir acompaadas de un estudio de su fiabilidad. En este
sentido, cuanto mejor sea el ajuste, mayor ser la fiabilidad de la
prediccin efectuada a partir de l.
Del estudio de la fiabilidad y del grado de dependencia que pueda existir
entre las dos variables se encarga la denominada Teora de la
Correlacin.
CORRELACIN Y REGRESIN LINEAL SIMPLE
19
El grado de bondad del ajuste se deducir a partir de los residuos o
errores.
- Si cada residuo es nulo, la lnea pasa por todos los puntos de la nube, y,
en este caso, se dice que entre las variables existe una dependencia
funcional o de tipo matemtico, y el ajuste es perfecto.
- Cuando estos residuos son pequeos, el ajuste es bueno y la lnea tiene
una gran representatividad.
- Si son grandes, el ajuste no es fino y la lnea ajustada explica el
fenmeno observado con dificultad.
BONDAD DE AJUSTE
CORRELACIN Y REGRESIN LINEAL SIMPLE
20
BONDAD DE AJUSTE
( )
k k
2
2 2
rY i i i
i 1 i 1
1 1
s u y y
N N
= =
= =

Una vez obtenida la ecuacin de la recta de regresin de Y sobre X, un
indicador que puede ser utilizado para evaluar la bondad del ajuste es la
varianza residual o varianza de los residuos,
( )
2 2
Y
2
X
2
XY 2
Y XY
2
X
XY 2
X
2
2
X
XY 2
Y XY
2
X
2 2
Y
2
rY
r 1 S
S
S
S S
S
S
2 S
S
S
S bS 2 S b S S = =
|
|
.
|

\
|
+ = + =
Cuanto menor (mayor) sea la varianza
residual mejor (peor) ser el ajuste, pues
ms prximos (distantes) estarn los
valores tericos a los observados.
El ajuste ser ptimo en el caso de que la varianza residual valga cero. Operando:
Varianza residual
CORRELACIN Y REGRESIN LINEAL SIMPLE
21
BONDAD DE AJUSTE
Otro coeficiente interesante, es la varianza explicada por la recta de
regresin de Y sobre X o varianza de los valores predichos, es decir:
que si toma valores grandes indica que el ajuste es bueno. Operando adopta
la siguiente expresin:
( )
( )
k k
2
2
2
eY i i
i 1 i 1
1 1
s y y y y
N N
= =
= =

( ) ( )
2
Y
2 2
X
2
2
X
XY 2
X
2
k
1 i
2
i
k
1 i
2
i
2
eY
s r s
s
s
s b x x
N
1
b x b a bx a
N
1
s =
|
|
.
|

\
|
= = = + =

= =
2
eY
2
Y
2
Y
2 2
Y
2
rY
s s s r s s = =
y, por tanto,
Varianza explicada por la recta de regresin
de Y sobre X
CORRELACIN Y REGRESIN LINEAL SIMPLE
22
0 s
2
rY
=
Es decir, la varianza total se descompone como suma de la varianza
explicada por la regresin y la varianza residual. De modo que si
2
rY
2
eY
2
Y
s s s + =
2
Y
2
eY
s s =
equivalentemente , implica que toda la varianza de Y queda explicada
por la regresin, es decir, el ajuste es perfecto.
El caso opuesto es cuando o
explicarse por la regresin.
0 s
2
eY
=
2
Y
2
rY
s s =
, la varianza de Y no puede
Un inconveniente de ambas varianzas es su dependencia de las unidades
de medida, por lo que resulta aconsejable obtener otro indicador que
solvente esta desventaja.
BONDAD DE AJUSTE
Descomposicin de la varianza total en varianza
residual y varianza explicada
CORRELACIN Y REGRESIN LINEAL SIMPLE
23
COEFICIENTE DETERMINACIN
Dado que las varianzas anteriores vienen afectadas por la unidad de medida,
un indicador objetivo de la bondad explicativa de la recta de regresin es el
coeficiente de determinacin, cociente entre la varianza explicada y la
varianza total y, por tanto, independiente de cambios de origen y escala. Este
coeficiente mide la proporcin de varianza que se explica con la regresin.
2 2 2 2
2
eY Y rY rY
2 2 2
Y Y Y
s s s s
r 1
s s s

= = =
Sustituyendo los coeficientes de regresin por sus expresiones queda:
2
Y X
XY
2
Y
2
X
2
XY
2
X
XY
2
Y
XY 2
s s
s
S S
S
S
S
S
S
r
|
|
.
|

\
|
= = =
CORRELACIN Y REGRESIN LINEAL SIMPLE
24
COEFICIENTE CORRELACIN
El coeficiente de determinacin es el cuadrado del coeficiente de correlacin
lineal de Pearson definido en el captulo anterior como el cociente entre la
covarianza y el producto de las desviaciones de las variables.
Al estar el coeficiente de determinacin comprendido entre 0 y 1, el
coeficiente de correlacin lineal de Pearson est acotado entre 1 y 1.
Y X
XY
s s
s
r =
CORRELACIN Y REGRESIN LINEAL SIMPLE
25
COEFICIENTE CORRELACIN
Recordemos que el signo de r dependa del signo de la covarianza, puesto que
las desviaciones tpicas son siempre positivas. As,
- si r es positivo, la relacin lineal entre las variables es directa, y tanto
ms fuerte cuanto mayor sea el coeficiente de correlacin, siendo perfecta
cuando r = 1.
- si r es negativo, la relacin entre las variables es inversa, siendo sta ms
intensa a medida que r se aproxima a 1.
- si r igual a cero significa que no existe relacin lineal entre las variables
o, equivalentemente, que las variables estn incorreladas, lo cual no
quiere decir que no exista algn otro tipo de dependencia no lineal.
CORRELACIN Y REGRESIN LINEAL SIMPLE
26
LAS RECTAS DE REGRESIN
Si r = 0, entonces las variables estaran incorreladas y las rectas de regresin
seran perpendiculares.
( ) Y y Y X x
S
S
0 Y y
X
Y
= = + =
( ) X x X Y y
S
S
0 X x
Y
X
= = + =
Y
X
Y
X
Y
X
Y
X
Recta de regresin X/Y:
Recta de regresin Y/X:
CORRELACIN Y REGRESIN LINEAL SIMPLE
27
LAS RECTAS DE REGRESIN
Si r = 1, entonces ambas rectas coinciden y la relacin es perfecta en sentido
directo.
Recta de regresin X sobre Y:
Recta de regresin Y sobre X:
( ) X x
S
S
Y y
X
Y
+ =
( ) Y y
S
S
X x
Y
X
+ =
Y
X
Y
X
-
-
-
-
-
Y
X
Y
X
-
-
-
-
-
CORRELACIN Y REGRESIN LINEAL SIMPLE
28
LAS RECTAS DE REGRESIN
Si r = -1, entonces ambas rectas coinciden y la relacin es perfecta en sentido
indirecto.
Recta de regresin X sobre Y:
Recta de regresin Y sobre X:
( ) X x
S
S
Y y
X
Y
=
( ) Y y
S
S
X x
Y
X
=
Y
X
Y
X
-
-
-
-
-
Y
X
Y
X
-
-
-
-
-
-
-
-
-
-
CORRELACIN Y REGRESIN LINEAL SIMPLE
29
PREDICCIN
La prediccin constituye la aplicacin ms interesante de la tcnica de la
regresin y consiste en determinar a partir del modelo estimado el valor que
toma la variable endgena para un valor dado de la variable exgena.
Si se quieren predecir valores de la variable Y para un valor concreto de la
variable independiente X, se considera la recta de regresin de Y sobre X. Es
decir, la prediccin de Y para un valor concreto x
i
de la variable X se
obtendra sustituyendo el valor x
i
en la ecuacin de la recta: ( )
i i
y x a bx = +
( ) ( )
XY
i i
2
X
s
y x y x x
s
= +
CORRELACIN Y REGRESIN LINEAL SIMPLE
30
PREDICCIN
Anlogamente, cuando se quieren predecir valores de la variable X, se
considera la recta de regresin de X sobre Y. Esta prediccin de X para un
valor concreto y
i
de la variable Y se obtendra sustituyendo el valor y
i
en la
ecuacin de la recta. Es decir: ( )
i i
x y a ' b' y = +
( ) ( )
XY
i i
2
Y
s
x y x y y
s
= +
CORRELACIN Y REGRESIN LINEAL SIMPLE
31
PREDICCIN
Cuando la prediccin se hace para valores de la variable exgena situados
dentro del intervalo de variacin de los datos con los que se ha calculado la
regresin, recibe el nombre de interpolacin. Si la prediccin se efecta para
un valor de la variable exgena situado fuera de ese intervalo se denomina
extrapolacin y su fiabilidad disminuir. En general, las predicciones para
valores muy alejados del centro de gravedad de la distribucin pueden no ser
muy fiables puesto que se corre el peligro de que no sea vlido el modelo
utilizado. Adems, la bondad de los valores pronosticados para la variable
endgena ser tanto mayor cuanto mejor sea el ajuste, es decir cuanto mayor
sea el valor del coeficiente de determinacin. Resumiendo:
Predicciones poco fiables r
2
bajo o extrapolacin
Predicciones fiables r
2
alto e interpolacin
CORRELACIN Y REGRESIN LINEAL SIMPLE
32
ALGUNAS REFLEXIONES
La existencia de una fuerte asociacin o correlacin lineal entre variables no
garantiza la existencia de una relacin causal entre ambas. Tres sencillos
ejemplos aclararn las distintas situaciones:
- Los ingresos y gastos de las familias estn fuertemente correlacionados. En
este caso, la teora econmica confirma que la relacin de correlacin lineal
evidencia una relacin de causalidad.
- Segn se recoge en GOOD (1979, pg. 692), existe correlacin lineal
positiva entre el nmero de tas solteras que un individuo tiene y la
proporcin de calcio en sus huesos. No existe relacin causal entre estas
dos variables sino que existe una tercera, la edad, que es causa comn de
ambas.
- En la ciudad de Oldenburg en los aos 1930-1936 se constat una fuerte
correlacin lineal positiva entre el nmero de nacimientos y el de cigeas
avistadas. No es causalidad, sino sencillamente casualidad.
CORRELACIN Y REGRESIN LINEAL SIMPLE
33
CUADRO RESUMEN
Recta de Y sobre X Recta de X sobre Y
Ecuacin de la recta
( ) X x
S
S
Y y
2
X
XY
= ( ) Y y
S
S
X x
2
Y
XY
=
Pendiente de la recta
2
X
XY
S
S
b =
2
Y
XY
S
S
' b =
Ordenada en el origen
X
S
S
Y a
2
X
XY
= Y
S
S
X ' a
2
Y
XY
=
Descomposicin de la
varianza
2
rY
2
eY
2
Y
S S S + =
2
rX
2
eX
2
X
S S S + =
Varianza explicada
2
Y
2
XY
2
eY
S r bS S = =
2
X
2
XY
2
eX
S r S ' b S = =
Varianza residual
( )
2
Y
2
XY
2
Y
2
rY
S r 1 bS S S = = ( )
2
X
2
XY
2
X
2
rX
S r 1 S ' b S S = =
Coeficiente de
determinacin
' bb
S S
S
S
S
1
S
S
r
2
Y
2
X
2
XY
2
Y
2
rY
2
Y
2
eY 2
= = = = ' bb
S S
S
S
S
1
S
S
r
2
Y
2
X
2
XY
2
X
2
rX
2
X
2
eX 2
= = = =
Coeficiente de correlacin
Y X
XY
S S
S
r =
Y X
XY
S S
S
r =

CORRELACIN Y REGRESIN LINEAL SIMPLE
34
REGRESIN NO LINEAL
Aunque la regresin lineal tiene aplicacin en numerosos problemas, en
ocasiones, bien la naturaleza de la relacin que liga las variables, bien las
caractersticas concretas de los datos, exigen la utilizacin de ajustes de
funciones no lineales. Algunas de estas funciones no lineales se pueden
convertir en ajustes lineales sin ms que aplicar una sencilla transformacin.
CORRELACIN Y REGRESIN LINEAL SIMPLE
35
REGRESIN NO LINEAL
Por ejemplo, si la funcin a ajustar es una exponencial, es decir, y = ab
x
,
tomando logaritmos en ambos miembros obtenemos lo siguiente:
logy = loga + xlogb
de manera que llamando z = logy, A = loga y B = logb, se tiene:
z = A + Bx
que vuelve a ser la expresin de un modelo de regresin lineal simple.
CORRELACIN Y REGRESIN LINEAL SIMPLE
36
REGRESIN NO LINEAL
Anlogamente, si la funcin a ajustar es y = ax
b
, de nuevo tomando
logaritmos en ambos miembros se tiene:
logy = loga + blogx
de manera que llamando z = logy, A = loga y w = logx, se tiene:
z = A + bw
que vuelve a ser la expresin de un modelo de regresin lineal simple.
CORRELACIN Y REGRESIN LINEAL SIMPLE
37
EJERCCIOS
Se sabe que existe una relacin lineal entre la cantidad de lluvia cada en el mes
anterior a la recoleccin (X) en Dl. por m
2
y la produccin de sandas (Y) en kg por
m
2
. En un estudio llevado a cabo en diferentes lugares del pas, se han obtenido los
siguientes resultados:

Y 40 44 46 48 52 58 60 68 74 80
X 6 10 12 14 16 18 22 24 26 32

Predecir la produccin de sandas si la lluvia cada ha sido de 23,5 Dl por m
2
Es una
prediccin fiable?
CORRELACIN Y REGRESIN LINEAL SIMPLE
38
EJERCCIOS
El Ministerio de Economa con el fin de valorar el impacto econmico de la huelga de
transporte en los productos perecederos de la cesta de la compra de los ciudadanos ha
realizado un estudio de la evolucin da a da de los precios, obteniendo los siguientes
resultados:

N de das de huelga % de subida de precios n
ij

1-3 0-2 10
3-5 2-4 5
5-8 4-8 3
8-12 8-16 2

a) Obtener la recta de regresin mnimo cuadrtica del % de subida de precios
sobre el n de das de huelga.
b) Analiza la bondad del ajuste mediante el coeficiente de correlacin lineal y la
varianza residual.
c) Predecir el % de subida de los precios si la duracin de la huelga es de una
semana.
d) Si la huelga llegase a durar un mes, cul sera el % de subida de precios
esperado?, es creble esta prediccin?
CORRELACIN Y REGRESIN LINEAL SIMPLE
39
EJERCCIOS
El departamento de Accin Social del Ayuntamiento de Sariena, preocupado por la
falta de comunicacin familiar ha realizado un estudio entre las familias con hijos
adolescentes para estudiar la posible relacin entre el gasto mensual () en la factura
de sus telfonos mviles (X) y el nmero de horas que cada mes dedican a actividades
familiares (Y) obteniendo los siguientes resultados:


X Y 0-6 6-20 20-40
0-10 0 5 7
10-40 2 3 5
40-100 6 2 0

Predecir el nmero de horas que un adolescente con un gasto mensual en telfono
mvil de 60 dedica cada mes a actividades con su familia. Es una prediccin
fiable?.
CORRELACIN Y REGRESIN LINEAL SIMPLE
40
EJERCCIOS
A partir de las siguientes observaciones, obtenidas al estudiar la inversin en
I + D (X) y los beneficios (Y), ambos en miles de euros, en una muestra de
16 empresas, estimar la relacin potencial de Y sobre X (Y = a X
b
). Predecir
el beneficio que tendra una empresa con una inversin de 9000 euros. Es
fiable?
X 14 12 22 7 25 19 10 13 15 17 11 15 8 13 19
Y 121 115 155 100 146 142 108 127 124 135 122 120 111 129 132

You might also like