You are on page 1of 40

Universidad Carlos III de Madrid

Csar Alonso
ECONOMETRIA
EL MODELO DE REGRESIN LINEAL MLTIPLE
ndice
1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2. El modelo de regresin lineal mltiple . . . . . . . . . . . . . . . . . . . . . 3
2.1. Supuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2. El modelo de regresin lineal con dos variables . . . . . . . . . . . . . 4
2.3. Interpretacin de los coecientes en el modelo de regresin mltiple . 6
2.4. Relacin entre el Modelo de Regresin Lineal Mltiple y el Simple:
Regresin larga vs. regresin corta . . . . . . . . . . . . . . . . . . . . 7
3. Estimacin MCO en el modelo de regresin lineal mltiple . . . . . . . . . 9
3.1. Estimacin MCO en el modelo de regresin con dos variables . . . . . 11
4. Propiedades de los estimadores MCO . . . . . . . . . . . . . . . . . . . . . 11
4.1. Varianzas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
4.2. Estimacin de o
2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
4.3. Estimacin de las varianzas de los estimadores MCO . . . . . . . . . 14
5. Medidas de bondad del ajuste . . . . . . . . . . . . . . . . . . . . . . . . . 14
5.1. Error estndar de la regresin . . . . . . . . . . . . . . . . . . . . . . 14
5.2. El coeciente de determinacin . . . . . . . . . . . . . . . . . . . . . 14
6. Interpretacin de los parmetros del modelo de regresin lineal . . . . . . . 15
6.1. Especicaciones ms usuales . . . . . . . . . . . . . . . . . . . . . . . 16
6.1.1. Modelo lineal en variables . . . . . . . . . . . . . . . . . . . . 16
6.1.2. Modelos semilogartmicos . . . . . . . . . . . . . . . . . . . . 17
6.1.3. Modelo doble logartmico . . . . . . . . . . . . . . . . . . . . . 19
6.1.4. Modelo con trminos cuadrticos . . . . . . . . . . . . . . . . 20
1
6.1.5. Otros modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
6.1.6. Especicaciones: Comentarios nales . . . . . . . . . . . . . . 22
7. Inferencia en el modelo de regresin lineal: Contraste de hiptesis . . . . . 23
7.1. Ejemplo: contraste sobre la media poblacional . . . . . . . . . . . . . 26
7.2. Distribuciones muestrales de los estimadores MCO . . . . . . . . . . . 29
7.3. Contrastes sobre el valor de un parmetro . . . . . . . . . . . . . . . 30
7.4. Contrastes sobre una hiptesis lineal . . . . . . . . . . . . . . . . . . 34
7.5. Contrastes de varias restricciones lineales . . . . . . . . . . . . . . . . 35
7.6. Contraste de signicacin conjunta o global . . . . . . . . . . . . . . 37
Captulos 10 y 12 de Goldberger. Captulo 3 de Wooldridge
1. Introduccin
En la mayora de las relaciones econmicas intervienen ms de dos variables.
Los factores que afectan al fenmeno econmico objeto de estudio suelen ser
mltiples.
Esto supone una limitacin en la aplicacin del modelo de regresin lineal simple
1 = ,
0
+,
1
A
1
+
1
en el anlisis emprico.
Aunque nuestro inters fundamental radique en el efecto concreto de una de-
terminada variable A
1
sobre un fenmeno econmico 1 , generalmente entran
en juego factores adicionales A
2
. . . . . A
K
.
Dichos factores adicionales estn, generalmente, relacionados con A
1
.
Recordemos que todos los factores no incorporados al modelo estn con-
tenidos en el trmino inobservable (la parte no explicada) del modelo,
1
.
En la medida en que A
1
no sea independiente de A
2
. . . . . A
K
, tendremos
que, en el modelo simple, el trmino inobservable no vericar 1 (
1
[A
1
) =
0.
En tal caso, debemos incorporar los factores adicionales A
2
. . . . . A
K
al
modelo para poder aislar el efecto causal de dicha variable A
1
.
Al controlar por varios factores, en el modelo de regresin lineal mlti-
ple
1 = ,
0
+,
1
A
1
+,
2
A
2
+ +,
K
A
K
+
ser ms fcil que se cumpla que su trmino inobservable es independiente
de dichos factores que en el modelo simple.
En el modelo de regresin lineal mltiple, la pendiente ,
j
(, = 1. . . . . 1) se
interpreta como el efecto parcial o efecto ceteris paribus de un cambio en
la variable asociada A
j
.
Si los supuestos que veremos a continuacin se cumplen, dicha interpretacin
es correcta aunque los datos no procedan de un experimento.
1
En tales condiciones, el modelo de regresin mltiple permite reproducir las
condiciones de un experimento controlado (mantener los restantes factores
jos) en un contexto no experimental.
Ejemplo 1: Efecto causal de la educacin sobre el salario
1 = Salario A
1
= Educacin
Nuestro inters fundamental radica en el efecto de la educacin.
Pero sabemos que otras variables afectan tambin al salario. Por ejemp-
lo, sean A
2
= Sexo, A
3
= Experiencia (laboral), A
4
= Capacidad (que
suponemos medible).
Salario = ,
0
+,
1
Educacin +,
2
Sexo +,
3
Experiencia +,
4
Capacidad +
Cabe esperar que Educacin no sea independiente de Experiencia, Sexo y
Capacidad.
En ese caso, al variar el nivel de Educacin tambin varan Experiencia,
Sexo y Capacidad:
Las proporciones de hombres y mujeres puede diferir por niveles de
educacin
La Experiencia puede tener una distribucin diferente por niveles de
educacin.
(Si adquirir ms Educacin retrasa la incorporacin al mercado de
trabajo, esperamos que C (A
1
. A
2
) < 0).
La Capacidad puede tener una distribucin diferente por niveles de
educacin.
(Si los individuos con mayor Capacidad tienden a adquirir ms Edu-
cacin, esperamos que C (A
1
. A
4
) < 0).
,
1
es el parmetro de mayor inters.
En la regresin mltiple, nos aseguramos de que ,
1
captura el efec-
to parcial de la educacin manteniendo otros factores, en este caso
Experiencia, Sexo y Capacidad, jos.
En la regresin simple, Experiencia, Sexo y Capacidad forman parte
del trmino inobservable
1
, sobre el que no tenemos control.
2
Ejemplo 2 (Wooldridge): Efecto del gasto en educacin sobre el rendimiento
escolar
Supongamos que disponemos de datos de distintas escuelas pblicas en
distintos distritos, para las que observamos, para un curso determinado, la
calicacin media avgscore y el gasto en educacin por alumno expend.
Nuestro inters radica en cuanticar el efecto del gasto en educacin por
alumno expend (que es una herramienta de poltica pblica) en el rendimien-
to escolar avgscore.
Pero el entorno familiar tambin afecta al rendimiento escolar, que a su
vez esta correlacionado con la renta media de las familias avginc.
ADEMS, el gasto per capita en educacin tiende a crecer con la renta de
las familias avginc (porque el gasto en educacin depende de la capacidad
scal del distrito).
En la regresin simple de avgscore sobre expend, el trmino de error in-
cluir, entre otros factores no controlados, avginc.
En tal caso, es difcil defender que el trmino inobservable del modelo
simple no va a variar cuando vare expend.
2. El modelo de regresin lineal mltiple
2.1. Supuestos
En el Modelo Lineal de Regresin Mltiple suponemos:
1. Linealidad en los parmetros
2. 1 ( [A
1
. A
2
. . . . . A
K
) = 0.
(Para cualquier combinacin de valores de A
1
. A
2
. . . . . A
K
, la media del trmino
inobservable es siempre la misma e igual a 0)
Implicaciones:
1 () = 0 (por la ley de esperanzas iteradas)
C (/(A
j
) . ) = 0 = (en particular) C (A
j
. ) = 0 (, = 1. . . . . 1).
3
3. Homocedasticidad condicional:
\ ( [A
1
. A
2
. . . . . A
K
) = o
2
= \ (1 [A
1
. A
2
. . . . . A
K
) = o
2
(La varianza de y/o de 1 cada una de las subpoblaciones asociadas a
cualquier combinacin de valores de A
1
. A
2
. . . . . A
K
es constante)
4. (A
1
. A
2
. . . . . A
K
) no forman una combinacin lineal exacta
(Ausencia de Multicolinealidad Exacta)
Ntese que los supuestos 1. y 2. implican que:
Tenemos una Funcin Esperanza Condicional (FEC) lineal:
1 (1 [A
1
. A
2
. . . . . A
K
) = ,
0
+,
1
A
1
+,
2
A
2
+ +,
K
A
K
La FEC nos proporciona, para cada combinacin de valores de (A
1
. A
2
. . . . . A
K
),
la media de 1 en la subpoblacin correspondiente dicha combinacin
de valores.
La FEC nos proporciona la mejor prediccin posible en el sentido de
que minimiza 1(
2
), siendo = error de prediccin =1 c(A
1
. A
2
. . . . . A
K
).
La FEC, al igual que ocurra en el modelo de regresin lineal simple, coin-
cide con el 1(1 [A
1
. A
2
. . . . . A
K
), que es el mejor predictor lineal en el sen-
tido de que minimiza 1(
2
), siendo = 1 (,
0
+,
1
A
1
+,
2
A
2
+ +,
K
A
K
).
Por tanto, las condiciones de primer orden que determinan los ,s son:
1() = 0. C(A
1
. ) = 0. . . . . C(A
K
. ) = 0.
2.2. El modelo de regresin lineal con dos variables
Vamos a considerar el modelo de regresin mltiple ms sencillo posible (con
slo 2 variables).
1 = ,
0
+,
1
A
1
+,
2
A
2
+
Para ilustrarlo, supongamos que la poblacin de inters est compuesta por
individuos de edad, experiencia laboral y capacidad similares.
4
Consideramos las siguientes variables:
1 = Salario
A
1
= Educacin
A
2
= Sexo=
_
1 si es mujer
0 si es hombre
Tenemos que:
1(1 [A
1
. A
2
) = ,
0
+,
1
A
1
+,
2
A
2
de manera que
1(1 [A
1
. A
2
= 0) = ,
0
+,
1
A
1
1(1 [A
1
. A
2
= 1) = ,
0
+,
2
+,
1
A
1
de manera que, como se ve en el grco, si ,
2
< 0, 1(1 [A
1
. A
2
= 0) es una
recta paralela a 1(1 [A
1
. A
2
= 1) y por encima de sta.
5
2.3. Interpretacin de los coecientes en el modelo de regre-
sin mltiple
Si todas las variables excepto A
j
permanecen constantes,
1(1 [A
1
. A
2
. . . . . A
K
) = ,
j
A
j
de manera que
,
j
=
1(1 [A
1
. A
2
. . . . . A
K
)
A
j
,
j
: Cuando A
j
vara en una unidad (permaneciendo el resto de las variables con-
stantes), 1 vara, en promedio, en ,
j
unidades.
Ntese que:
La regresin mltiple 1 = 1(1 [A
1
. A
2
. . . . . A
K
) + responde a una pregunta
diferente que las (tericas) regresiones simples 1 = 1(1 [A
1
) +
1
,..., 1 =
1(1 [A
K
) +
K
En nuestro ejemplo:
1(1 [A
1
. A
2
) = ,
0
+ ,
1
A
1
+ ,
2
A
2
= Valor esperado del salario para unos
valores dados de educacin y sexo.
,
1
= Incremento en el salario medio asociado a un ao adicional de
educacin manteniendo el sexo constante (es decir, para individuos
del mismo sexo).
1(1 [A
1
) =
0
+
1
A
1
= Valor esperado del salario para unos valores dados
de educacin.

1
= Incremento en el salario medio asociado a un ao adicional de
educacin, pero sin mantener el sexo constante (es decir, ignorando
que al comparar dos distribuciones con distintos aos de educacin,
las proporciones de hombres y mujeres pueden ser distintas).
6
2.4. Relacin entre el Modelo de Regresin Lineal Mltiple
y el Simple: Regresin larga vs. regresin corta
Continuamos con el modelo de regresin lineal mltiple ms sencillo, con dos
variables, que denotaremos como Regresin larga poblacional,
1 = 1(1 [A
1
. A
2
) +
donde
1(1 [A
1
. A
2
) = 1(1 [A
1
. A
2
) = ,
0
+,
1
A
1
+,
2
A
2
Los parmetros ,
0
, ,
1
y ,
2
han de vericar:
1() = 0 = ,
0
= 1(1 ) ,
1
1(A
1
) ,
2
1(A
2
) (1)
C(A
1
. ) = 0 = ,
1
\ (A
1
) +,
2
C(A
1
. A
2
) = C(A
1
. 1 ) (2)
C(A
2
. ) = 0 = ,
1
C(A
1
. A
2
) +,
2
\ (A
2
) = C(A
2
. 1 ) (3)
De (2) y (3) tenemos:
,
1
=
\ (A
2
)C(A
1
. 1 ) C(A
1
. A
2
)C(A
2
. 1 )
\ (A
1
)\ (A
2
) [C(A
1
. A
2
)]
2
,
2
=
\ (A
1
)C(A
2
. 1 ) C(A
1
. A
2
)C(A
1
. 1 )
\ (A
1
)\ (A
2
) [C(A
1
. A
2
)]
2
Ntese que si C(A
1
. A
2
) = 0:
,
1
=
C(A
1
. 1 )
\ (A
1
)
(pendiente de 1(1 [A
1
))
,
2
=
C(A
2
. 1 )
\ (A
2
)
(pendiente de 1(1 [A
2
))
Supongamos que estamos particularmente interesados en el efecto de A
1
sobre
1 .
Pero nos preocupa que A
1
y A
2
puedan estar relacionadas.
En tal caso, el coeciente del modelo de regresin lineal simple NO nos
proporciona el efecto de inters.
Sea el Modelo de Regresin Lineal Simple, que denotamos como Regresin
corta poblacional,
1(1 [A
1
) =
0
+
1
A
1
7
Los parmetros
0
y
1
han de vericar:
1(
1
) = 0 =
0
= 1(1 )
1
1(A
1
) (4)
C(A
1
.
1
) = 0 =
1
= C(A
1
. 1 ) /\ (A
1
) (5)
(Obviamente, podramos considerar otra regresin corta poblacional correspon-
diente a la proyeccin lineal de 1 sobre A
2
, con argumentos similares)
A partir de (2) y de (5) tenemos que:

1
=
C(A
1
. 1 )
\ (A
1
)
=
,
1
\ (A
1
) +,
2
C(A
1
. A
2
)
\ (A
1
)
= ,
1
+,
2
C(A
1
. A
2
)
\ (A
1
)
Ntese que:

1
= ,
1
solamente si C(A
1
. A
2
) = 0 si ,
2
= 0.

C(A
1
. A
2
)
\ (A
1
)
es la pendiente de 1(A
2
[A
1
) :
1(A
2
[A
1
) = o
0
+o
1
A
1
8
3. Estimacin MCO en el modelo de regresin lin-
eal mltiple
Nuestro objetivo consiste en estimar los parmetros poblacionales, los betas,
a partir de un conjunto de datos.
Supondremos que nuestros datos (

i
. r

1i
. r

2i
. . . . . r

ki
), con i = 1. . . . . :, son
una realizacin de una muestra aleatoria de tamao : de una poblacin,
(1
i
. A
1i
. A
2i
. . . . . A
ki
).
Sea el modelo:
1 = ,
0
+,
1
A
1
+,
2
A
2
+ +,
K
A
K
+
Dada una muestra aleatoria de tamao : de la poblacin, podemos escribir:
1
i
= ,
0
+,
1
A
1i
+,
2
A
2i
+ +,
K
A
Ki
+
i
i = 1. . . . . :
donde para todo i = 1. . . . . :, se cumplen los supuestos 1. a 4.
Vamos a ver cmo podemos obtener estimadores de los parmetros ,
0
, ,
1
. . ,
K
y o
2
, denotados como

,
0
,

,
1
. .

,
K
y o
2
.
Partiremos igualmente del principio de analoga para proponer estimadores,
generalizando el resultado del modelo de regresin lineal simple al caso del
modelo de regresin mltiple
La obtencin de los estimadores requiere tambin resolver un sistema de ecua-
ciones (aunque analticamente la resolucin es ms compleja).
Los parmetros poblacionales ,
0
. ,
1
. . ,
K
son aquellos que resuelve el prob-
lema
mn

0
;
1
; ;
K
1(
2
),
donde = 1 ,
0
,
1
A
1
,
2
A
2
,
K
A
K
Para estimar dichos parmetros, en lugar del error
i
(inobservable), podemos
utilizar el residuo (desviacin entre el valor observado y el valor predicho)
como,

i
= 1
i


1
i
= 1
i
(

,
0
+

,
1
A
1i
+

,
2
A
2i
+ +

,
K
A
Ki
)
9
donde

1
i
es el valor predicho o valor ajustado, y denir el criterio MCO,
que es el anlogo muestral del criterio mn 1(
2
),
mn

0
;
1
; ;
K
1
:
n

i=1

2
i
,
Las condiciones de primer orden son:

i

i
= 0.

i

i
A
1i
= 0. . . . .

i

i
A
Ki
= 0
o, de forma equivalente, deniendo r
ji
=
_
A
ji
A
j
_
, , = 1. . . . . 1.
1
n

i

i
= 0 (media muestral de los residuos 0)
1
n

i

i
r
1i
= 0
.
.
.
1
n

i

i
r
Ki
= 0
_

_
(covarianza muestral 0 entre A
j
y )
Ntese que estas condiciones de primer orden son el anlogo muestral de las
condiciones de primer orden para el modelo de regresin clsico referido a los
,s en la poblacin:
1() = 0 (media poblacional de los errores 0)
C(A
1
. ) = 0
.
.
.
C(A
K
. ) = 0
_

_
(covarianza poblacional 0 entre A
j
y )
El sistema de ecuaciones normales es ahora:
_

_
:

,
0
+

,
1

i
A
1i
+

,
2

i
A
2i
+ +

,
K

i
A
Ki
=

i
1
i

,
1

i
r
2
1i
+

,
2

i
r
2i
r
1i
+ +

,
K

i
r
Ki
r
1i
=

i
r
1i
.
.
.

,
1

i
r
1i
r
Ki
+

,
2

i
r
2i
r
Ki
+ +

,
K

i
r
2
Ki
=

i
r
Ki
En general, para 1 variables, tendremos un sistema con 1 + 1 ecuaciones
lineales, donde las 1 + 1 incgnitas son los coecientes

,s de la regresin.
El sistema tendr solucin nica siempre que se cumpla el supuesto 4., es decir:
que no exista multicolinealidad exacta.
(Si existiera multicolinealidad exacta, el sistema tendra innitas soluciones)
10
3.1. Estimacin MCO en el modelo de regresin con dos vari-
ables
Podemos ver el lgebra de la estimacin MCO para el modelo con dos variables.
Los parmetros poblacionales tienen la forma:
,
0
= 1(1 ) ,
1
1(A
1
) ,
2
1(A
2
)
,
1
=
\ (A
2
)C(A
1
. 1 ) C(A
1
. A
2
)C(A
2
. 1 )
\ (A
1
)\ (A
2
) [C(A
1
. A
2
)]
2
,
2
=
\ (A
1
)C(A
2
. 1 ) C(A
1
. A
2
)C(A
1
. 1 )
\ (A
1
)\ (A
2
) [C(A
1
. A
2
)]
2
y aplicando el principio de analoga, tenemos que

,
0
= 1

,
1
A
1


,
2
A
2

,
1
=
:
2
2
:
1y
:
12
:
2y
:
2
1
:
2
2
:
2
12

,
2
=
:
2
1
:
2y
:
12
:
1y
:
2
1
:
2
2
:
2
12
donde
:
2
1
=
1
n

i
_
A
1i
A
1
_
2
:
2
2
=
1
n

i
_
A
2i
A
2
_
2
:
1y
=
1
n

i
_
A
1i
A
1
_ _
1
i
1
_
:
2y
=
1
n

i
_
A
2i
A
1
_ _
1
i
1
_
:
12
=
1
n

i
_
A
1i
A
1
_ _
A
2i
A
2
_
= :
21
Los estimadores

,
1
y

,
2
de las pendientes miden los efectos parciales estimados
de A
1
y A
2
, respectivamente, en el valor medio de 1 .
4. Propiedades de los estimadores MCO
Al igual que en el modelo de regresin simple, los estimadores MCO del modelo
de regresin mltiple verican las propiedades de:
Linealidad en las observaciones de 1 (por denicin del estimador MCO)
Insesgadez (bajo los supuestos 1. y 2. y 4.)
Teorema de Gauss-Markov: Bajo los supuestos 1. a 4.,

,
0
,

,
1
. .

,
K
son
los de menor varianza entre los estimadores lineales e insesgados.
11
Consistencia
La justicacin de estas propiedades es similar a la del caso del modelo de
regresin lineal simple.
4.1. Varianzas
Adems de los supuestos 1. y 2., utilizaremos el supuesto 3. (\ ([A
1
. A
2
. . . . . A
K
) =
o
2
para todo A).
\
_

,
j
_
=
o
2
:o
2
j
_
1 1
2
j
_ =
o
2

i
r
2
ji
_
1 1
2
j
_, (, = 1. . . . . 1) donde
o
2
j
=
1
:
_
i
r
2
ji
_
=
1
:
_

i
_
A
ji
A
j
_
2
_
1
2
j
es el coeciente de determinacin de la proyeccin lineal muestral de A
j
sobre las restantes variables explicativas A
1i
. A
2i
. . . . . A
(j1)i
. A
(j+1)i
. . . . A
Ki
:
A
ji
= o
0
+o
1
A
1i
. +o
2
A
2i
+ +o
j1
A
(j1)i
+o
j+1
A
(j+1)i
+ +o
K
A
Ki
+n
i
1
2
j
mide la proporcin de informacin de la variable A
j
que ya est
contenida en las dems variables.
Por tanto
_
1 1
2
j
_
mide la proporcin de informacin distinta de la
proporcionada por las restantes variables que aporta la variable A
j
.
No es posible que 1
2
j
= 1, porque en ese caso A
j
sera una combi-
nacin lineal exacta de las restantes variables (lo que se descarta
por el supuesto 4.).
Pero si 1
2
j
estuviera cercano a 1, \
_

,
j
_
se disparara.
Por el contrario, si 1
2
j
= 0, lo que ocurre si la correlacin de A
j
con
las restantes variables es 0, entonces la varianza sera la mnima
posible.
Intuitivamente:
Cuanto mayor es o
2
j
=
1
n

i
r
2
ji
, mayor es la variabilidad muestral de A
j
,
y mayor es la precisin del estimador.
12
Cuanto mayor es el tamao muestral :, mayor es la precisin del estimador
(al mejorar el grado de representatividad de la muestra).
Cuanto mayor es 1
2
j
, menor es la precisin del estimador.
Demostracin: Vase Wooldridge.
(Sin prdida de generalidad, dado que el orden de las variables explicativas es
arbitrario, la prueba es para

,
1
; la prueba para

,
2
. .

,
K
es anloga).
4.2. Estimacin de o
2
El problema de estimacin de o
2
es similar al caso del modelo de regresin lineal
simple.
El problema es que los errores
i
(i = 1. . . . . :) son inobservables.
Una vez estimado el modelo por MCO, observamos los residuos
i
:

i
= 1
i

,
0
+

,
1
A
1i
+

,
2
A
2i
+ +

,
K
A
Ki
_
Utilizando los residuos como anlogos muestrales de los errores (inobservables),
podemos calcular como estimador de o
2
:
o
2
=

i

2
i
:
.
Este estimador s es factible, pero es sesgado. La razn es que, los residuos
verican 1 + 1 restricciones lineales,

i

i
= 0.

i

i
A
1i
= 0. . . . .

i

i
A
Ki
= 0
de manera que slo hay (: 1 1) residuos independientes (lo que se conoce
como grados de libertad).
Alternativamente, podemos obtener un estimador insesgado (que para : grande
es muy similar a o
2
):
o
2
=

i

2
i
: 1 1
.
Tanto o
2
como o
2
son estimadores consistentes de o
2
.
En general, para tamaos muestrales moderados, es irrelevante cul de los dos
estimadores utilizar, porque siempre que : no sea muy pequeo, proporcionan
estimaciones numricas muy parecidas.
13
4.3. Estimacin de las varianzas de los estimadores MCO
De igual modo, hemos de emplear un estimador consistente de o
2
y sustituir en
la expresin de la varianza, obteniendo

\
_

,
j
_
=
o
2
:o
2
j
_
1 1
2
j
_
donde o
2
j
es la varianza muestral de la variable A
j
,
o
2
j
=
1
:

i
_
A
ji
A
j
_
2
.
5. Medidas de bondad del ajuste
5.1. Error estndar de la regresin
Tal y como argumentamos en la regresin lineal simple, podemos utilizar la raz
cuadrada de o
2
, o, que se denomina error estndar de la regresin, como
medida de la bondad del ajuste
5.2. El coeciente de determinacin
Al igual que en el modelo de regresin simple, el 1
2
o coeciente de deter-
minacin, se dene como
1
2
=

i

2
i

2
i
= 1

i

2
i

2
i
, 0 _ 1
2
_ 1
donde
i
= 1
i
1
i
,
i
=

1
i
1
i
,
i
= 1
i


1
i
.
(la segunda igualdad es cierta siempre que el modelo tenga trmino constante)
La interpretacin del 1
2
es similar a la del modelo de regresin lineal simple.se
interpreta como la proporcin de la variacin muestral de 1 explicada por el
modelo. (Vase Goldberger, pp. 82 y 83).
El 1
2
puede ser til para comparar distintos modelos para la misma variable
dependiente 1 .
El 1
2
aumenta siempre de valor al aumentar de nmero de regresores, sean
stos relevantes o no.
14
Para eliminar este problema, se dene el 1
2
, tambin llamado 1
2
corregido
1
2
ajustado de grados de libertad,
1
2
= 1
_
_
1 1
2
_
: 1
: 1 1
_
= 1

i

2
i
/ (: 1 1)

2
i
/ (: 1)
.
En cualquier caso, para tamaos muestrales grandes 1
2
1
2
.
6. Interpretacin de los parmetros del modelo de
regresin lineal
Captulos 7 (7.5) y 13 (13.2) de Goldberger
Captulos 2 (2.4), 3 (3.1) y 6 (6.2) de Wooldridge
Hasta ahora nos hemos centrado en relaciones lineales (tanto en parmetros
como en variables) entre la variable dependiente y las variables explicativas.
Sin embargo, en economa muchas relaciones no son lineales.
Es fcil incorporar relaciones no lineales en el anlisis lineal de regresin (man-
teniendo la linealidad en parmetros) deniendo adecuadamente la variable de-
pendiente y las explicativas.
Muy importante: Con carcter general, cuando decimos que el modelo de regre-
sin es lineal, queremos decir que es lineal en los parmetros, pudiendo ser
no lineal en las variables.
Con frecuencia, el modelo se expresa en trminos de transformaciones no
lineales de las variables originales.
Un concepto muy importante en economa es el concepto de elasticidad, que
es la variacin porcentual que experimenta una variable (1 ) en respuesta a la
variacin porcentual de otra (A).
En la mayora de las especicaciones, la elasticidad no es constante, depen-
diendo de los valores concretos de la variable explicativas (A) y la variable
respuesta (1 ).
Las transformaciones que se apliquen a las variables afectan a la expresin
que adopta la elasticidad.
15
Vamos a contemplar los ejemplos ms frecuentes en los trabajos aplicados.
Por simplicidad, ilustraremos las especicaciones con una o dos variables ex-
plicativas.
Utilizaremos el modelo lineal en parmetros y en variables como referencia.
6.1. Especicaciones ms usuales
6.1.1. Modelo lineal en variables
El modelo considerado es simplemente:
1 = ,
0
+,
1
A +,
donde 1([A) = 0 = 1(1 [A) = ,
0
+,
1
A.
Interpretacin de ,
1
:
,
1
=
1(1 [A)
A
= Si A vara 1 unidad, 1 vara en promedio
,
1
unidades de 1 .
Elasticidad de 1(1 [A) con respecto a A:
1 [(1,1 )[A]
A,A
= ,
1
A
1(1 [A)
Ntese que la elasticidad depende de los valores concretos de A y de 1 , y por
lo tanto no es constante.
Es habitual aproximar elasticidades para individuos concretos (usando sus
valores observados de A, 1 ) como
,
1
A
1
.
En otras ocasiones, se evalan las elasticidades para los valores medios de
A e 1
,
1
1 (A)
1 (1 )
.
16
6.1.2. Modelos semilogartmicos
Modelo con logaritmo en la variable exgena
En algunas situaciones queremos modelizar que variaciones en trminos por-
centuales en A producen variaciones constantes en trminos absolutos en 1 .
El modelo considerado sera:
1 = ,
0
+,
1
ln A +,
donde 1([A) = 0 = 1(1 [A) = ,
0
+,
1
ln A.
Interpretacin de ,
1
:
,
1
=
1(1 [A)
ln A

1(1 [A)
A,A
(ntese que si /(A) = ln A, como /
0
(A) =
d/(A)
dA
=
1
A
, entonces diferencian-
do tenemos que d/(A) = d ln A =
dA
A
).
,
1
es una semielasticidad.
La elasticidad de 1(1 [A) con respecto a A es igual a
,
1
1(1 [A)
,
que depende por tanto del valor concreto que tome 1(1 [A).
En todo caso, es habitual aproximar elasticidades para individuos concretos
(usando sus valores de A, 1 ) como
,
1
1
.
Multiplicando y dividiendo por 100 para expresar la variacin de A en trmi-
nos porcentuales:
,
1
,100
1(1 [A)
100 A,A
= Si A vara en un 1 %, 1 vara en promedio en ,
1
,100 unidades de 1 .
17
Ejemplo: Sean 1 = Consumo (en euros) y A = Renta.
Denimos la Propensin Marginal a Consumir (PMC) como d1,dA.
Modelo 1 Modelo 2
1 = ,

0
+,

1
A +

1 = ,
0
+,
1
ln A +
,

1
=
1(1 [A)
A
,
1
100

1(1 [A)
100 A,A
Si la renta 1 unidad, el consumo Si la renta 1 %. el consumo
en media en ,

1
euros en media en ,
1
,100 euros
La Propensin Marginal a Consumir d1,dA es:
,

1
(constante), en el Modelo 1.
es ,
1
,A (decreciente con la renta), en el Modelo 2.
Modelo con logaritmo en la variable endgena
En algunas situaciones, queremos modelizar que variaciones en trminos abso-
lutos en A producen variaciones constantes en trminos porcentuales en 1 .
El modelo considerado sera:
ln 1 = ,
0
+,
1
A +,
donde 1([A) = 0 = 1(ln 1 [A) = ,
0
+,
1
A.
Este modelo se expresara en trminos de las variables originales como:
1 = exp(,
0
+,
1
A +)
Interpretacin de ,
1
:
,
1
=
1(ln 1 [A)
A

1 [(1,1 ) [ A]
A
Si multiplicamos por 100 para expresar la variacin de 1 en trminos
porcentuales, tendremos que
,
1
100
1 [(100 1,1 ) [ A]
A
=Cuando A vara en un 1 unidad, 1 vara en promedio en un (,
1
100) %.
18
,
1
es una semielasticidad.
La elasticidad de 1(1 [A) con respecto a A es igual a ,
1
A
(y depende por tanto de los valores concretos que tome A).
Esta especicacin es de gran utilidad para describir curvas de crecimiento
exponencial.
En particular, supongamos que A = t (tiempo). Entonces, 1 = exp(,
0
+,
1
t+)
y como ,
1
=
1(ln 1 [A)
t
,
,
1
recoge la tasa de crecimiento medio de 1 a lo largo del tiempo.
Ejemplo: Sean 1 = Salario-hora (euros) y A = Educacin (aos).
Modelo 1 Modelo 2
1 = ,

0
+,

1
A +

ln 1 = ,
0
+,
1
A +
,

1
=
1(1 [A)
A
,
1
100
1 [(100 1,1 ) [ A]
A
Si la educ. 1 unidad, el salario Si la educ. 1 unidad, el consumo
en media en ,

1
euros en media en (,
1
100) %
El incremento medio del salario-hora por ao adicional de educacin es:
,

1
euros en el Modelo 1 (constante, no depende del nivel de educacin
considerado).
(,
1
1 ) euros en el Modelo 2 (no es constante: depende del nivel
salarial, que a su vez es creciente con la educacin).
6.1.3. Modelo doble logartmico
En algunas situaciones queremos modelizar que variaciones % en A producen
variaciones % constantes en 1 = Elasticidad constante.
De gran utilidad en estudios de demanda, produccin, costes, etc..
El modelo considerado sera:
ln 1 = ,
0
+,
1
ln A +,
donde 1([A) = 0 = 1(ln 1 [A) = ,
0
+,
1
ln A.
En
19
Interpretacin de ,
1
:
,
1
=
1(ln 1 [A)
ln A

1 [(1,1 ) [ A]
A,A
= Cuando A vara en un 1 %,
1 vara en promedio un
,
1
%.
(,
1
es una elasticidad)
Ejemplo: Sean 1 = Produccin, A
1
= Input 1 (Trabajo) y A
2
= Input 2
(Capital).
Modelo 1 Modelo 2
1 = ,

0
+,

1
A
1
+,

2
A
2
+

ln 1 = ,
0
+,
1
ln A
1
+,
2
ln A
2
+
,

j
=
1(1 [A
1
. A
2
)
A
j
,
j

1 [(1,1 ) [ A
1
. A
2
]
A
j
,A
j
Si el input , 1 unidad, permaneciendo el otro input constante,
la prod. en media en:
,

j
ud. de producto ,
j
%
elasticidad no constante: elasticidad constante:
Y=Y
X
j
=X
j
= ,

j
X
j
Y
,
j
El Modelo 2 tiene la siguiente representacin en trminos de las variables
originales:
1 = 1
0
A

1
1
A

2
2
exp() (Cobb-Douglas)
6.1.4. Modelo con trminos cuadrticos
En algunas situaciones queremos modelizar la relacin entre A e 1 considerando
la existencia de efectos marginales crecientes o decrecientes.
Es til en la especicacin de tecnologas o de funciones de gasto o de costes,
etc.
El modelo considerado sera:
1 = ,
0
+,
1
A +,
2
A
2
+
donde 1([A) = 0 = 1(1 [A) = ,
0
+,
1
A +,
2
A
2
.
En este contexto,
1(1 [A)
A
= ,
1
+ 2,
2
A,
20
es decir: Cuando A vara en 1 unidad, 1 vara en media en (,
1
+2,
2
A) unidades
de 1 ..
Ntese que ,
1
y ,
2
no tienen interpretacin por separado.
Dependiendo del signo de los efectos marginales sern crecientes (,
2
0)
o decrecientes (,
2
< 0).
Existe un valor crtico de A en el que el efecto de A sobre 1(1 [A) cambia
de signo. Dicho punto es A

= ,
1
,2,
2
.
Ejemplo: Sean 1 = Salario-hora (euros), A
1
= Educacin (aos) y A
2
=
Experiencia (aos).
Modelo 1 Modelo 2
ln 1 = ,

0
+,

1
A
1
+,

2
A
2
+

ln 1 = ,
0
+,
1
A
1
+,
2
A
2
+,
3
A
2
2
+
,

2
=
1((1,1 )[A
1
. A
2
)
A
2
(,
2
+ 2,
3
A
2
)
1 [(1,1 ) [ A
1
. A
2
]
A
2
Si la experiencia 1 ao, permaneciendo constante la educacin,
el salario-hora en media en:
(,

2
100) % 100 (,
2
+ 2,
3
A
2
) %
El rendimiento de 1 ao adicional de experiencia es:
constante no constante (depende de Experiencia)
6.1.5. Otros modelos
Modelo recproco
El modelo considerado sera:
1 = ,
0
+,
1
1
A
+,
donde 1([A) = 0 = 1(1 [A) = ,
0
+,
1
1
A
.
Permite una formulacin con curvatura hiperblica.
Se emplea, por ejemplo, para la curva de Phillips (inacin - desempleo).
Al variar A en una unidad, 1 vara en media en ,
1
1
A
2
unidades.
21
Modelos con interacciones
El modelo considerado sera:
1 = ,
0
+,
1
A
1
+,
2
A
2
+,
3
A
1
A
2
+,
donde:
1([A
1
. A
2
) = 0 = 1(1 [A
1
. A
2
) = ,
0
+,
1
A
1
+,
2
A
2
+,
3
A
1
A
2
.
Al variar (por ejemplo) A
1
en una unidad, 1 vara en media en ,
1
+,
3
A
2
unidades.
Ntese que los parmetros no tienen interpretacin por separado.
6.1.6. Especicaciones: Comentarios nales
Las caractersticas de los modelos anteriores pueden combinarse, de manera
que podemos tener modelos logartmicos o semilogartmicos con interacciones,
potencias, etc.
Ejemplo: Funcin de produccin translogartmica:
Sean 1 = Produccin, A
1
= Input 1 (Trabajo) y A
2
= Input 2 (Capital).
ln 1 = ,
0
+,
1
ln A
1
+,
2
ln A
2
+,
3
(ln A
1
)
2
+,
4
(ln A
2
)
2
+,
5
(ln A
1
) (ln A
2
) +
En este modelo, las elasticidades del output con respecto al trabajo o al
capital no son constantes, a pesar de estar expresadas las variables en
logaritmos. En particular:
1 [(1,1 ) [ A
1
. A
2
]
A
1
,A
1
,
1
+ 2,
3
ln A
1
+,
5
ln A
2
,
que depende de los logaritmos de los inputs.
La especicacin translogartmica se utiliza tambin para representar fun-
ciones de gasto y funciones de costes.
22
7. Inferencia en el modelo de regresin lineal: Con-
traste de hiptesis
Goldberger: Captulos 7, 10 (10.3), 11 y 12 (12.5 y 12.6).
Wooldridge: Captulos 4 y 5 (5.2).
Un contraste de hiptesis es una tcnica de inferencia estadstica que permite
evaluar si la informacin que proporcionan los datos (la muestra) avala o no una
determinada conjetura o hiptesis sobre la poblacin objeto de estudio.
Las hiptesis estadsticas pueden ser:
No paramtricas: sobre propiedades de la distribucin poblacional (ob-
servaciones independientes, normalidad, simetra, etc.)
Paramtricas: condiciones o restricciones sobre los valores de los parmet-
ros poblacionales.
La hiptesis a contrastar se denomina hiptesis nula (H
0
).
La negacin o el complementario de la hiptesis nula se denomina hiptesis
alternativa (H
1
)
El enfoque clsico de contraste, basado en Neyman-Pearson, consiste en dividir
el espacio muestral, dada H
0
, en dos regiones, una de regin de aceptacin y
otra regin de rechazo (o regin crtica). Si los datos observados caen en la
regin de rechazo, se rechazar la hiptesis nula.
La estrategia clsica para contrastar una hiptesis consiste en:
1. Denir la hiptesis nula (H
0
) y la hiptesis alternativa (H
1
).
2. Determinar un estadstico de contraste, que mide la discrepancia entre
la informacin muestral y la hiptesis H
0
.
Dicho estadstico de contraste:
es funcin de H
0
y de los datos muestrales, con lo que es una variable
aleatoria (que tomar valores distintos para cada muestra).
debe tener una distribucin conocida (exacta o aproximada) bajo H
0
(cuando H
0
sea cierta).
23
Si la discrepancia entre la informacin muestral y H
0
es notable,
el valor del estadstico estar dentro de un rango de valores poco
probable cuando H
0
es cierta, lo que sera evidencia contra H
0
.
Si la discrepancia entre la informacin muestral y H
0
es pequea,
el valor del estadstico estar dentro de un rango de valores muy
probable cuando H
0
es cierta, lo que sera evidencia a favor de H
0
.
3. Determinar qu discrepancias se consideran grandes (y por tanto, qu val-
ores del estadstico se consideran no plausibles bajo H
0
), es decir, deter-
minar la regin crtica o de rechazo. Dicha regin viene dada por un valor
crtico, dada la distribucin del estadstico.
4. Dada la muestra, calcular el valor muestral del estadstico y ver si se en-
cuentra en la regin de aceptacin o de rechazo.
Puesto que la muestra en que se basa el contraste es aleatoria, el estadstico de
contraste (que es una funcin de la muestra) es tambin una variable aleatoria.
Por tanto, el estadstico de contraste puede conducir a conclusiones dife-
rentes para distintas muestras.
Una vez realizado el contraste, habremos optado bien por H
0
, bien por H
1
,
y estaremos en alguna de las cuatro situaciones siguientes:
Realidad
H
0
cierta H
0
falsa
Conclusin Aceptamos H
0
X Error tipo II
del contraste Rechazamos H
0
Error tipo I X
Se dene tamao del contraste o nivel de signicacin =c = Pr (error de tipo I)
= Pr (Rechazar H
0
[H
0
).
En la prctica, no es posible minimizar la probabilidad de ambos tipos de error
para un tamao muestral dado
La nica forma de reducir la probabilidad de ambos errores es incremen-
tando el tamao muestral
El procedimiento clsico consiste en:
24
jar c (tamao o nivel de signicacin del contraste), es decir, establecer
la probabilidad mxima de rechazar H
0
cuando es cierta.
Se establece un valor tan pequeo como se desee (10 % o menor).
minimizar Pr (error de tipo II) = Pr (No rechazar H
0
[H
1
) o, de forma equiv-
alente, maximizar
1 Pr (error de tipo II) = potencia del contraste.
Como la potencia est denida bajo la hiptesis alternativa, su valor de-
pender del verdadero valor del parmetro (que es desconocido).
Un contraste es consistente si lm
n!1
[1 Pr (error de tipo II)] = 1.
Por tanto, dada H
0
:
se dene el estadstico de contraste C,
se determina la regin crtica (a partir de la distribucin de C bajo
H
0
) para un nivel de signicacin c prejado,
se evala el estadstico para los datos disponibles,

C.
Si el valor del estadstico

C est dentro de la regin crtica, se rechaza
H
0
al nivel de signicacin 100c%; en caso contrario, no se rechaza
H
0
.
Como procedimiento alternativo, podemos utilizar el nivel crtico o p-valor,
que se dene como
p-valor = j = Pr
_

C regin crtica

H
0
_
es decir, el p-valor es la probabilidad de obtener una discrepancia mayor o
igual que la obtenida cuando H
0
es cierta (dada la distribucin de H
0
).
Cuanto menor sea el p-valor, menos probable es que la distribucin obteni-
da para el estadstico bajo H
0
sea correcta, y por tanto es menos probable
es que estemos bajo H
0
.
El p-valor no proporciona una decisin entre H
0
y H
1
: nos indica cmo
de probable es que estemos bajo H
0
.
Una vez calculado el p-valor j para el valor muestral del estadstico, sabe-
mos que rechazaramos H
0
a cualquier nivel de signicacin igual o mayor
que j.
25
7.1. Ejemplo: contraste sobre la media poblacional
Dada una variable aleatoria 1 , queremos contrastar si 1 (1 ) = j = j
0
, donde
j
0
es cierto valor.
La hiptesis nula es H
0
: j = j
0
. La hiptesis alternativa es H
1
: j ,= j
0
.
Para evaluar esta hiptesis, disponemos de una muestra de tamao :, 1
i

n
i=1
,
donde las 1
i
s son independientes, con la que podemos estimar la media muestral
de 1 :
j = 1 =
1
:
n

i=1
1
i
donde la esperanza y la varianza de 1 son:
1
_
1
_
= 1
_
1
:
n

i=1
1
i
_
=
1
:
n

i=1
1 (1
i
) =
1
:
:j = j,
\
_
1
_
= \
_
1
:
n

i=1
1
i
_
=
1
:
2
n

i=1
\ (1
i
) =
1
:
2
:o
2
=
o
2
:
.
Supongamos que 1 ~ ` (j. o
2
), donde o
2
es conocida.
Si 1 tiene una distribucin normal, las observaciones muestrales de 1 , 1
i
,
que son realizaciones de 1 , seguirn la misma distribucin.
Como 1 es una combinacin lineal de variables aleatorias normales, ten-
dremos que 1 tendr tambin una distribucin normal,
1 ~ `
_
j.
o
2
:
_
En particular, bajo H
0
: j = j
0
, tenemos que 1 ~ `
_
j
0
.
o
2
:
_
.
Podemos denir el estadstico

C =
1 j
0
o,
_
:
. Este estadstico se distribuye
bajo H
0
como

C =
1 j
0
o,
_
:
=
_
:
1 j
0
o
~ ` (0. 1)
Por tanto, la distribucin de nuestro estadstico bajo H
0
es una normal
estndar.
26
El contraste consiste en evaluar si la discrepancia, medida por el estads-
tico, es estadsticamente grande en valor absoluto.
(nos interesa el tamao, no la direccin, de dicha discrepancia).
Si aplicamos el procedimiento clsico, determinamos un nivel de signi-
cacin c.
En este caso, se trata de un contraste de dos colas, con probabilidades
acumuladas respectivas iguales a
c
2
, en el que la regin de aceptacin
corresponde a discrepancias extremas, sean positivas o negativas.
Denotando 2
p
como el valor de la ` (0. 1) que deja una probabilidad acu-
mulada de j a su izquierda, la regin crtica es
_

C :

C < 2
2
_
'
_

C :

C < 2
1

2
_
=
_

C :

2
1

2
_
Si 1 ~ ` (j. o
2
), pero o
2
es desconocida, tendremos que estimar o
2
.
En ese caso, el estadstico factible es

C =
_
:
1 j
0
o
~ t
n1
donde o =
_
o
2
, siendo o
2
=
1
n1
n

i=1
_
1
i
1
_
2
un estimador consistente
de o
2
.
27
La distribucin de este estadstico es una t de Student con :1 grados de
libertad.
Si : es grande, el resultado del contraste ser similar, tanto si suponemos
que o
2
es conocida como si no, porque la distribucin t de Student se
aproxima a la normal estndar a medida que : aumenta.
Si desconocemos tanto la distribucin de 1 como o
2
, podemos seguir utilizando
el estadstico

C =
_
:
1 j
0
o
PERO ahora no tendremos una distribucin conocida (exacta) para el
estadstico

C.
Sin embargo, teniendo en cuenta que las observaciones de la muestra
1
i

n
i=1
son independientes y suponiendo que tienen idntica distribucin,
podemos aplicar el Teorema Central del Lmite, por el que la distribucin
asinttica del estadstico es una normal estndar

C =
_
:
1 j
0
o
`(0. 1),
de manera que podemos utilizar la normal para realizar el contraste de
forma aproximada.
En la prctica:
No conocemos habitualmente la distibucin de la(s) variable(s) consider-
adas.
Si el tamao muestral es grande, la aproximacin asinttica proporciona
conclusiones similares.
28
7.2. Distribuciones muestrales de los estimadores MCO
Vamos a centrarnos en el contraste de hiptesis caracterizadas por restricciones
lineales sobre los parmetros ,
0
, ,
1
. . ,
K
.
Para ello, construiremos estadsticos de contraste, de los que derivaremos sus
distribuciones.
Hemos derivado los estimadores MCO de los parmetros del modelo de regresin
lineal mltiple y sus propiedades, a partir de los supuestos 1. a 4.
Sin embargo, para hacer inferencia debemos caracterizar la distribucin mues-
tral de los estimadores MCO, para poder construir estadsticos de contraste de
los que podamos derivar sus distribuciones.
Para poder derivar distribuciones exactas, necesitaramos suponer que:
1
i
[ A
1i
. . . . . A
Ki
~ `(,
0
+,
1
A
1i
+ +,
K
A
Ki
. o
2
),
=
i
[ A
1i
. . . . . A
Ki
~ `(0. o
2
)
en cuyo caso es posible demostrar que los estimadores MCO

,
j
(, = 1. . . . . 1)
siguen una distribucin `
_
,
j
. \
_

,
j
__
.
Sin embargo, este supuesto no es en general vericable, y es difcil que se cumpla.
En ese caso, la distribucin de los estimadores

,
j
ser desconocida.
Habitualmente, trabajaremos bajo el supuesto de que desconocemos
la distribucin de 1 condicional a las As, de manera que nuestra
inferencia se basar en la aproximacin asinttica.
Por ello, trabajaremos con la distribucin asinttica de los estimadores

,
j
(, =
1. . . . . 1).
Puede probarse que

,
j
`(,
j
. \
_

,
j
_
)
y por tanto

,
j
,
j
_
\
_

,
j
_
`(0. 1)
29
Si sustituimos \
_

,
j
_
por un estimador consistente, \
_

,
j
_
=
o
2
:o
2
j
_
1 1
2
j
_,
este resultado se mantiene

,
j
,
j
_

\
_

,
j
_
`(0. 1)
7.3. Contrastes sobre el valor de un parmetro
Sea la hiptesis nula H
0
: ,
j
= ,
0
j
vs. la hiptesis alternativa, H
1
: ,
j
,= ,
0
j
.
Para evaluar esta hiptesis, construimos el estadstico t,
t =

,
j
,
0
j
_

\
_

,
j
_
=

,
j
,
0
j
:
b

j
donde :
b

j
=
_

\
_

,
j
_
se conoce como error estndar de

,
j
.
Dicho estadstico de distribuye aproximadamente bajo H
0
como:
t =

,
j
,
0
j
:
b

j
`(0. 1)
La mayora de los programas economtricos presentan el coeciente estimado
seguido de su error estndar, del estadstico t y del p-valor asociado al valor del
estadstico t.
Habitualmente, dichos programas calculan el p-valor en base a la distribu-
cin t de Student con : 1 1 grados de libertad.
Si : es moderadamente grande, utilizar la distribucin aproximada o la t
de Student no tiene consecuencias en la inferencia.
Por ejemplo, si en un contraste de dos colas consideramos el valor crtico
para un nivel de signicacin c, que determina una regin crtica [t[
t
1

2
, para : 1 1 = 120:
para c = 0.05, dicho valor crtico es 1.98 si consideramos la t de
Student y 1.96 si consideramos la ` (0. 1).
30
para c = 0.10, dicho valor crtico es 1.658 si consideramos la t de
Student y 1.645 si consideramos la ` (0. 1).
Por tanto, podemos tomar los p-valores que aparecen en las tablas de resul-
tados de los programas economtricos siempre que : no sea muy pequeo.
Por supuesto, a partir de estos resultados pueden tambin construirse intervalos
de conanza aproximados.
31
Ejemplo: Demanda de dinero y actividad econmica (Goldberger, p. 107).
Utilizando los datos para EE.UU. del archivo TIM1.GDT, hemos estimado la
siguiente regresin lineal:
Model 1: OLS, using observations 19591996 (1 = 38)
Dependent variable: Y
Coecient Std. Error t-ratio p-value
const 2.3296 0.2054 11.3397 0.0000
X1 0.5573 0.0264 21.1227 0.0000
X2 -0.2032 0.0210 -9.6719 0.0000
Mean dependent var 6.628638 S.D. dependent var 0.172887
Sum squared resid 0.080411 S.E. of regression 0.047932
1
2
0.927291 Adjusted 1
2
0.923137
1(2. 35) 223.1866 P-value(1) 1.20e20
donde:
1 = ln (100 \ 4,\ 3) = logaritmo de la cantidad real de dinero (M1)
A
1
=ln(\ 2) = logaritmo del PIB real
A
2
=ln(\ 6) = logaritmo del tipo de inters de las Letras del Tesoro
Interpretacin:


,
1
: estimacin de la elasticidad de la demanda de dinero con respecto
a la produccin (manteniendo el tipo de inters constante).
Si el PIB aumenta en un 1 % (y el tipo de inters no vara) se estima
que la demanda de dinero aumenta en promedio un 0.6 %.


,
2
: estimacin de la elasticidad de la demanda de dinero con respecto
al tipo de inters (manteniendo la produccin constante).
Si el tipo de inters aumenta en un 1 % (y el PIB no vara) se estima
que la demanda de dinero cae en promedio un 0.2 %.
Queremos contrastar dos hiptesis:
Que la demanda de dinero es inelstica al tipo de inters.
Que la elasticidad de la demanda de dinero resp. a la produccin es 1.
H
0
: ,
2
= 0 (la demanda de dinero es inelstica al tipo de inters)
frente a H
1
: ,
2
,= 0
32
Entonces, bajo H
0
, t =

,
2
0
:
b

2
`(0. 1) y [t[ =

0;2032
0;021

= 9.676 2

=
1.96
Ntese que, dado que [t[ 9.7, el p-valor es prcticamente 0 (para un
valor 2 = 3.09, el p-valor en la tabla de la normal es 0.001 = 0.1 %).
= se rechaza H
0
al nivel de signicacin del 1 %.
Intervalo de conanza al 95 % para ,
2
:

,
2
:
b

2
1.96 : = 0.2032 0.0210 1.96 = [0.244 ; 0.162]
H
0
: ,
1
= 1 (elasticidad unitaria de la demanda de dinero con respecto a
la produccin)
frente a H
1
: ,
1
,= 1
Entonces, bajo H
0
, t =

,
1
1
:
b

1
`(0. 1) y [t[ =

0;55731
0;0264

= 16.769 2

=
1.96
El p-valor asociado es prcticamente 0.
= se rechaza H
0
al nivel de signicacin del 1 %.
Intervalo de conanza al 95 % para ,
1
:

,
1
:
b

1
1.96 : = 0.5573 0.0264 1.96 = [0.505 ; 0.609]
33
7.4. Contrastes sobre una hiptesis lineal
Sea la hiptesis nula H
0
: `
0
,
0
+`
1
,
1
+ +`
K
,
K
= j
0
.
Para evaluar esta hiptesis, construimos el estadstico t,
t =
`
0

,
0
+`
1

,
1
+ +`
K

,
K
j
0

\
_
`
0

,
0
+`
1

,
1
+ +`
K

,
K
_
=
`
0

,
0
+`
1

,
1
+ +`
K

,
K
j
0
:

0
b

0
+
1
b

1
++
K
b

K
`(0. 1).
Empleando la aproximacin asinttica tenemos que bajo H
0
:
t =
`
0

,
0
+`
1

,
1
+ +`
K

,
K
j
0
:

0
b

0
+
1
b

1
++
K
b

K
`(0. 1).
Ejemplo: Tecnologa de produccin.

1 = 2.37 +0.632A
1
+0.452A
2
: = 31
(0.257) (0.219)
:
b

1
b

2
=

C(

,
1
.

,
2
) = 0.055
donde
1 = logaritmo de la produccin
A
1
= logaritmo del trabajo
A
2
= logaritmo del capital
Interpretacin:


,
1
: estimacin de la elasticidad de la produccin respecto al trabajo
(manteniendo el capital constante)
Si el trabajo aumenta en un 1 % (y el capital no vara) se estima que
la produccin aumenta en promedio en un 0.63 %.


,
2
: estimacin de la elasticidad de la produccin respecto al capital
(manteniendo el trabajo constante)
Si el capital aumenta en un 1 % (y el trabajo no vara) se estima que
la produccin aumenta en promedio en un 0.45 %.
34
Consideremos la hiptesis nula H
0
: ,
1
+,
2
= 1 (Rendimientos constantes
a escala)
frente a la hiptesis alternativa H
1
: ,
1
+,
2
,= 1.
Bajo H
0
:
t =

,
1
+

,
2
1
:
b

1
+
b

2
`(0. 1).
donde :
b

1
+
b

2
=
_

\ (

,
1
+

,
2
) =
_

\ (

,
1
) +

\ (

,
2
) + 2

C(

,
1
.

,
2
), y
[t[ =

0.632 + 0.452 1
_
(0.257)
2
+ (0.219)
2
+ 2 0.055

= 0.177 < 2

= 1.96
Por tanto, no se rechaza la hiptesis nula de rendimientos constantes
a escala.
7.5. Contrastes de varias restricciones lineales
Cmo se puede contrastar ms de una hiptesis sobre los parmetros del mod-
elo?
Por ejemplo. Cmo puedo contrastar hiptesis lineales como las siguientes:
H
0
: ,
1
= ,
2
= = ,
K
= 0
H
0
: ,
1
= 0
,
2
= 1
H
0
: ,
1
+,
3
= 0
,
2
= 1
,
4
2,
5
= 1
Conceptos previos:
Modelo no restringido: es aquel modelo sobre el que se desea efectuar
un contraste de hiptesis (bajo H
1
).
Modelo restringido: es aquel modelo en que se ha impuesto la hiptesis
que se desea contrastar (bajo H
0
).
35
Ejemplo 1: H
0
: ,
1
= ,
2
= 0 vs. H
1
: ,
1
,= 0 y/o ,
2
,= 0.
Modelo no restringido Modelo restringido
1 = ,
0
+,
1
A
1
+,
2
A
2
+ 1 = ,
0
+
Ejemplo 2: H
0
: ,
2
+ 2,
1
= 1 vs. H
1
: ,
2
+ 2,
1
,= 1
Modelo no restringido Modelo restringido
1 = ,
0
+,
1
A
1
+,
2
A
2
+ 1

= ,
0
+,
1
A

+
donde: 1

= 1 A
2
A

= A
1
2A
2
porque ,
2
+ 2,
1
= 1 = ,
2
= 1 2,
1
=
1 = ,
0
+,
1
A
1
+ (1 2,
1
)A
2
+ =
(1 A
2
) = ,
0
+,
1
(A
1
2A
2
) +
Deniciones:
Modelo Modelo
no restringido restringido
Coecientes de
determinacin: 1
2
S
1
2
R
Suma de cuadrados
de los residuos:

i

2
iS
= o1o

i

2
iR
= o11
Empleando la aproximacin asinttica tenemos que bajo H
0
[ hiptesis lin-
eales],
\
0
= :
o11 o1o
o1o

2
q
o de modo equivalente (siempre que en el modelo restringido la variable depen-
diente sea idntica a la del modelo sin restringir),
\
0
= :
1
2
S
1
2
R
1 1
2
S

2
q
Ntese que utilizamos : en vez de (: 1 1), lo que para tamaos muestrales
grandes no supone diferencias sustanciales.
La mayora de los programas economtricos permiten realizar el contraste de
forma automtica si se escribe la hiptesis nula..
Habitualmente, dichos programas proporcionan el estadstico 1, que supone
normalidad condicional de las observaciones.
36
Dicho estadstico tendra la forma:
1 =
o11 o1o
o1o

: 1 1

~ 1
q
.
nK1
y se relaciona por tanto con el estadstico asinttico \
0
como \
0
1.
De nuevo, si : es moderadamente grande, cul de los dos se utilice no
altera las conclusiones del contraste.
Pero nosotros aplicaremos contrastes asintticos.
Ntese que es fcil demostrar que (o11 o1o) _ 0 y que (1
2
S
1
2
R
) _ 0.
Todos los casos vistos anteriormente son casos particulares de este contraste.
7.6. Contraste de signicacin conjunta o global
Este contraste se conoce tambin como contraste de regresin.
H
0
: ,
1
= ,
2
= = ,
K
= 0
frente a
H
1
: ,
j
,= 0 para algn , = 1. . . . . 1.
Modelo sin restringir
1 = ,
0
+,
1
A
1
+,
2
A
2
+ +,
K
A
K
+
Modelo restringido
1 = ,
0
+ = 1
2
R
= 0
Empleando la aproximacin asinttica tenemos que bajo H
0
,
\
0
= :
1
2
S
1 1
2
S

2
K
Habitualmente, los programas economtricos proporcionan el estadstico 1 del
contraste de regresin,
1 =
1
2
S
1 1
2
S

: 1 1
1
~ 1
K
.
nK1
que se relaciona con el estadstico asinttico \
0
en la forma \
0
11 (para
: moderadamente grande).
37
De nuevo, utilizaremos el contraste asinttico.
Ejemplo: Demanda de dinero y actividad econmica (Goldberger, p. 107).
Utilizando los datos para EE.UU. del archivo TIM1.GDT, hemos estimado la
siguiente regresin lineal:
Model 1: OLS, using observations 19591996 (1 = 38)
Dependent variable: Y
Coecient Std. Error t-ratio p-value
const 2.3296 0.2054 11.3397 0.0000
X1 0.5573 0.0264 21.1227 0.0000
X2 -0.2032 0.0210 -9.6719 0.0000
Mean dependent var 6.628638 S.D. dependent var 0.172887
Sum squared resid 0.080411 S.E. of regression 0.047932
1
2
0.927291 Adjusted 1
2
0.923137
1(2. 35) 223.1866 P-value(1) 1.20e20
donde:
1 = ln (100 \ 4,\ 3) = logaritmo de la cantidad real de dinero (M1)
A
1
=ln(\ 2) = logaritmo del PIB real
A
2
=ln(\ 6) = logaritmo del tipo de inters de las Letras del Tesoro
Consideramos la hiptesis nula H
0
: ,
1
= ,
2
= 0 (la demanda de dinero es
inelstica a la produccin y a los tipos de inters) frente a la alternativa
H
1
: ,
1
,= 0 y/o ,
2
,= 0.
El contraste asinttico es
\
0
=
0.927
1 0.927
38 = 482.55
2
2
= 5.99
La salida de Gretl proporciona el estadstico 1 del contraste de regresin:
1(2. 35) = 223.1866, que est bastante cercano a \
0
,2.
Claramente, se rechaza H
0
(el p-valor es prcticamente 0).
38

You might also like