Professional Documents
Culture Documents
Econometría
Curso 2011-2012. Segunda parte
Esquemas de teoría
Profesores:
Jesús Cavero Álvarez
Carmen Lorenzo Lago
Mercedes Prieto Alaiz
Material Docente de Econometría
Segunda parte
Curso 2011-2012
TEMA 7: HETEROSCEDASTICIDAD
σ 12 0 .... 0
0 σ 22
( )
E εε ' =
.... 0
.... .... .... ....
0 0 .... σ N2
Si expresamos Var (ε i ) = σ i2 = σ 2 wi ∀i = 1,2, ,... N , entonces
w1 0 .... 0
E (εε ) = σ Ω , donde Ω =
' 2 0 w2 .... 0
.... .... .... ....
0 0 .... wN
Para explicar mejor la diferencia entre heteroscedasticidad y homoscedasticidad,
vamos a analizar un modelo de regresión de dos variables en el que la variable dependiente
Y es el ahorro personal y la variable explicativa la renta personal disponible (X). La Figura
1a) muestra que a medida que aumenta la renta personal disponible, también aumenta, de
media, el ahorro, pero la varianza del ahorro en torno a su valor medio permanece igual
para todos los niveles de renta personal disponible, (recuérdese que la recta de regresión
poblacional muestra el valor medio de la variable dependiente para determinados valores de
la variable explicativa). Este es el caso de la homoscedasticidad o igual varianza. Por otra
parte, como muestra la Figura 1b), aunque el nivel medio de los ahorros aumenta a medida
que lo hace la renta personal disponible, la varianza del ahorro no permanece igual para
todos los niveles de renta. Aquí aumenta con la renta personal disponible. Este es el caso de
la heteroscedasticidad o varianza desigual. Dicho de otra manera la figura b) muestra que la
1
Econometría Curso 201-12
gente de rentas elevadas ahorra, de media, más que la gente de rentas bajas, pero también
hay más variabilidad en sus ahorros.
Figura 11
corresponde [ Var ε h = ( ) σ2
Nh
].
1
Gujarati (2006): Principios de Econometría. McGraw Hill.
2
Econometría Curso 2011-12
3
Econometría Curso 201-12
Residuos
Variable explicativa X
2
Gujarati (2006): Principios de Econometría. McGraw Hill.
3
Dado que la perturbación ε i es inobservable, podemos considerar el residuo ei como una muestra de
tamaño 1 de la variable ε i . Dado que E (ε i ) = 0 , entonces,
r (ε ) = E (ε 2 ) = e 2
~
Va~ i i i
esto es, estimamos la media de las perturbaciones al cuadrado con la media de los cuadrados de la muestra de
residuos, pero como sólo se dispone de un valor muestral, ei , esta media será ei2 .
4
Econometría Curso 2011-12
Figura 34
Residuos al cuadrado
Variable explicativa X
La Figura 4 representa posibles patrones para ei2 y, por tanto, para Var (ε i ) . Así, la Figura
4c) siguiere una forma lineal, mientras que 4d) y 4e) cuadrática. Por su parte 4a) refleja la
no existencia de heteroscedasticidad y la forma en el caso de 4b) es más difícil de ajustar.
Figura 45
4
Gujarati (2006): Principios de Econometría. McGraw Hill.
5
Gujarati (2006): Principios de Econometría. McGraw Hill.
5
Econometría Curso 201-12
Variable explicativa X
6
Gujarati (2006): Principios de Econometría. McGraw Hill.
7
Es un test asintótico basado en los multiplicadores de Lagrange.
6
Econometría Curso 2011-12
que trata de explicar los residuos al cuadrado de la regresión inicial, ei 2 , a partir de los
regresores, sus cuadrados y sus productos cruzados dos a dos.
H0: Homoscedasticidad
H1: Heteroscedasticidad
El procedimiento es el siguiente:
1) Se estima el modelo por MCO calculando los residuos MCO: ei
2) Se estima una regresión auxiliar de los residuos MCO al cuadrado frente a cada uno
de los regresores, cada uno de los regresores al cuadrado y los productos cruzados
de los regresores dos a dos.
3) 2
Cuando N aumenta, se demuestra que N Raux → χ k2( aux ) . Siendo R aux
2
el coeficiente
de determinación de la regresión auxiliar realizada en 2) y la distribución χ 2k ( aux )
tiene como grados de libertad el nº de regresores de la regresión auxiliar excluido el
término constante.
Valores pequeños del estadístico indicarían que la regresión auxiliar no es
2
significativa ( Raux pequeño), que los residuos al cuadrado y, por tanto, las varianzas de las
perturbaciones, no dependen de los regresores. De este modo, valores pequeños de N ⋅ R 2
llevarían a no rechazar (aceptar) la homoscedasticidad. En cambio, valores grandes
llevarían a rechazar la homoscedasticidad.
Contrastes basados en regresiones
Estos contrastes siguen la misma idea del test de White y suponen que las varianzas
de las perturbaciones son función de una o varias variables, generalmente, variables
explicativas del modelo econométrico propuesto.
El procedimiento concreto de la prueba Park consiste en plantear regresiones de los
residuos al cuadrado en función de una o varias variables explicativas y analizar la
significación conjunta de la regresión. Las variables explicativas incluidas pueden aparecer
en sus niveles o como funciones de ellas, por ejemplo, al cuadrado, el inverso, etc.
Si la regresión es significativa indica que existe heteroscedasticidad y nos da la
pauta sobre la estructura de la varianza de las perturbaciones. En el caso de que existan
varias regresiones con significación conjunta se elige aquella que proporcione mejores
resultados.
Este contraste también se puede realizar utilizando como variable a explicar los
residuos en valor absoluto como aproximación de la raíz de la varianza de las
perturbaciones (la desviación típica). Este es el caso planteado por Glejser introduciendo
una sola variable explicativa y en él, como ya es sabido, la significación conjunta no es más
que la significación individual.
La ventaja de estos contrastes es que permiten detectar no sólo la existencia de
heteroscedasticidad sino también la forma. Esto último es importante para poder solucionar
el problema.
Contraste de Goldfeld y Quandt
Esta prueba supone que existe una relación creciente (o decreciente) entre la Var (εi) y el
1
valor de uno de los regresores: σ i2 = h( X ji ) , es decir, σ i2 = σ 2 X 2ji o bien σ i2 = σ 2 2 . De
X ji
7
Econometría Curso 201-12
esta forma para los valores grandes de Xji la varianza será mayor si la hipótesis es cierta (si
es decreciente la varianza será menor).
La hipótesis a contrastar es:
HO: Homocedasticidad σ i2 = σ 2 una constante
H1: Heteroscedasticidad σ i2 = h( X ji )
El procedimiento del test es el siguiente:
1) Se ordenan las observaciones según los valores crecientes de Xj.
2) Se suprimen un nº central de observaciones (c), generalmente un cuarto o un tercio
de todas las observaciones (esto no es imprescindible pero es más fácil detectar el
problema), dividiendo la muestra en dos submuestras del mismo tamaño, la primera
con los valores más pequeños de la variable y la segunda con los más grandes.
3) Se estima por MCO cada una de las submuestras con (N-c)/2 observaciones cada
una, siendo c el número de observaciones eliminadas.
4) Calculamos sus respectivas SCR
5) Se construye un estadístico F de la forma:
N −c N −c
mayorSCR − k −1 mayorS 2 − k −1
→ F N −2c o bien → F N −2c
menorSCR
2
− k −1 menorS 2 2
− k −1
Valores pequeños del estadístico indicarían que no hay grandes diferencias entre las
varianzas estimadas en las dos submuestras y, por tanto, las varianzas de las perturbaciones
serán constantes. De este modo, valores pequeños del estadístico llevarían a no rechazar la
hipótesis de homoscedasticidad8. En cambio, valores grandes llevarían a rechazarla.
Además, si mayorSCR corresponde a la segunda muestra, se rechazará frente a σ i2 = σ 2 X 2ji ,
mientras que si mayorSCR corresponde a la primera nos indica que la homoscedasticidad se
1
rechaza frente a σ i2 = σ 2 2 .
X ji
8
Nótese que si no se rechaza la hipótesis nula no significa que no exista heteroscedasticidad, dado que ésta
podría estar asociada a otra variable y, tal vez haya que repetir el proceso con otras variables.
8
Econometría Curso 2011-12
por tanto, damos más peso a las observaciones con menor desviación típica y menos a las
que tienen una desviación típica mayor.
Figura 69
9
Gujarati (2006): Principios de Econometría. McGraw Hill.
9
Econometría Curso 201-12
~
Forma alternativa de derivar el estimador β MCG :
La vía para obtener los estimadores de MCP consiste en transformar el modelo de
cara a que las varianzas de las perturbaciones del modelo transformado sean constantes. Si
eso se logra, el modelo transformado no presentará problemas de heteroscedasticidad y será
un MRLC con lo que la estimación por MCO proporcionará los mejores estimadores,
pudiéndose aplicar los procedimientos de inferencia habituales. De este modo, los
estimadores MCP son los estimadores MCO del modelo transformado.
Por ejemplo, si partimos de un modelo con dos variables explicativas,
Yi = β0 + β1 ⋅ X1i + β 2 ⋅ X 2i + ε i , i = 1,2,K, N
,
con heteroscedasticidad ( Var (ε i ) = σ i2 , suponemos que σ i2 es conocida) los mejores
estimadores (ELIO) son los estimadores MCP. Para obtenerlos transformaremos dicho
modelo dividiéndolo por la raíz cuadrada de la varianza de las perturbaciones, es decir, por
la desviación típica. El modelo transformado resultante será:
Yi 1 X 1i X 2i εi
= βo + β1 + β2 +
σ i2 σ i2 σ i2 σ i2 σ i2
O lo que es lo mismo,
Yi 1 X 1i X 2i
= βo + β1 + β2 + vi
σ i2 σ i2 σ i2 σ i2
donde la perturbación,
εi
vi =
σ i2
cumple la hipótesis de homoscedasticidad,
εi 1 σ i2
Var (v i ) = Var ( )= var(ε i ) = = 1 = cte
σ i2 ( σ i2 ) 2 σ i2
Yi 1 X 1i X ki
= βo + β1 + .......β k + vi
wi wi wi wi
donde la perturbación,
εi
vi =
wi
εi 1 σ 2 wi
Var (v i ) = Var ( )= var(ε i ) = = σ 2 = cte
wi ( wi ) 2 wi
10
Econometría Curso 2011-12
~
βF = X ' Ω(
ˆ −1 X )−1
ˆ −1Y
X'Ω
Donde se ha estimado la matriz de varianzas-covarianzas de las perturbaciones, es
decir, se han estimado los elementos de la diagonal principal, las varianzas de las
perturbaciones.
El conocimiento de la auténtica varianza de las perturbaciones es muy infrecuente.
Por ello es necesario plantearse ¿qué ocurre si no conocemos la auténtica varianza de las
perturbaciones? La respuesta es recurrir a algún supuesto o hipótesis sobre σ i y
2
11
Econometría Curso 201-12
O lo que es lo mismo
Yi 1 X X
= βo + β1 1i + .......β k ki + vi
X ji X ji X ji X ji
donde la perturbación,
εi
vi =
X ji
proporciona mejores estimadores que aplicar MCO al modelo original. Por ello, en estas
situaciones es conveniente seguir estimando el modelo original por MCO pero calculando
bien los estimadores de las varianzas de los estimadores para que la inferencia realizada a
partir de los resultados del modelo así estimado sea válida.
White ha desarrollado un procedimiento para calcular correctamente la desviación
típica de los estimadores MCO en presencia de heteroscedasticidad, que permite poder
seguir utilizando los test de la t y de la F, aunque sólo son válidos asintóticamente, es decir,
en muestras grandes.
e12
1
donde Vˆ = X ' O X , siendo ei el error mínimo cuadrático ordinario.
N 2
e N
12
Econometría Curso 2011-12
S2 sesgado, inconsistente S β~
MCG
= S *2 (X ' Ω −1
X)
−1
Asintóticamente Normal
13
Econometría Curso 201-12
14
Econometría Curso 2011-12
E (ε t ) = 0
E (ε t ε t − s ) ≠ 0 ∀s = 1, 2... .
E (ε )2 = σ 2
t
10
Como veremos posteriormente, las tres formas de introducir relaciones dinámicas están relacionadas y no
son tan diferentes como se podría pensar en un principio.
15
Econometría Curso 201-12
11
Esto significa, por ejemplo, que Cov( ε 1ε 2 ) = Cov( ε 2 ε 3 ) = Cov( ε 7 ε 8 ) = ... = Cov( ε t ε t +1 ) .
16
Econometría Curso 2011-12
∞
Por la condición de estacionariedad ρ ∞ → 0 y, entonces: ε t = ∑ ρ τ u t −τ
τ =0
Momentos:
∞
* E (ε t ) = ∑ ρ τ E (u t −τ ) = 0
τ =0
2
∞ ∞
= E ∑ ρ τ u t −τ = ..... = ∑ ρ 2τ σ u2 = σ u2 (1 + ρ 2 + ρ 4 + ...)
* γ 0 = Var (ε t ) = E (ε t )
2
τ =0 τ =0
σ u2
γ o = Var (ε t ) = σ ε = 2
= γ0
1− ρ 2
* γ 1 = Cov (ε t ε t +1 ) = E (ε t ε t +1 ) = E [ε t (ρε t + u t +1 )] = ... = ρσ ε2 = ργ 0 puesto que E (ε t u t +1 ) = 0
* γ 2 = Cov (ε t ε t + 2 ) = E (ε t ε t + 2 ) = ρ E (ε t ε t +1 ) = ρ 2σ ε2 = ρ 2 γ 0
En general:
* γ s = Cov(ε t ε t + s ) = E (ε t ε t + s ) = ρ s σ ε2 = ρ s γ 0 ∀s = 1,2 ,...
La matriz de varianzas-covarianzas será:
1 ρ ρ2 K ρ T −1 1 ρ ρ2 K ρ T −1
ρ 1 ρ K ρ T −2 ρ 1 ρ K ρ T −2
( )
' 2
E εε = σ ε ρ 2
ρ 1 K ρ T −3 = σ u
2 1 ρ2
ρ 1 K ρ T −3 = σ u Ω
2
1− ρ 2
K K K K K K K K K K
T −1 T −1
ρ ρ ρ ρ ρ T −2 ρ T −3
T −2 T −3
K 1 K 1
17
Econometría Curso 201-12
R*s
ρs =
•
Rs
FAS
ρ 0 = 1 s = 0
ρs =
ρ s = 1,2,...
s
Correlogramas (FAS)
ρ>0 ρ<0
ρs ρs
s s
FAP
ρ1 = ρ1
•
ρ 2 − ρ 12 ρ 2 − ρ 2
ρ2 = = =0
1 − ρ 12 1− ρ2
•
Así,
ρ 1 = ρ s =1
ρs =
s≥2
•
0
18
Econometría Curso 2011-12
Correlograma (FAP)
ρ>0 ρ<0
ρs • ρs •
s s
* γ 1 = Cov (ε t , ε t +1 ) = −θσ u2
* γ 2 = Cov(ε t , ε t + 2 ) = 0
* γ s = Cov(ε t , ε t + s ) = 0 ∀s ≥ 2
Por lo tanto la matriz de varianzas y covarianzas será:
(1 + θ 2 ) −θ 0 K 0
−θ (1 + θ 2 ) −θ K 0
E (εε ) = σ u
' 2
0 −θ (1 + θ )2
K 0 = σ u2 Ω
K K K K K
K (1 + θ 2 )
0 0 0
19
Econometría Curso 201-12
FAS:
1 s=0
γs γ1 θ
ρs = = =− s =1
γo γo 1+θ 2
γs
=0 ∀s ≥ 2
γo
Correlograma (FAS)
θ <0 θ >0
ρs ρs
s s
FAP
θ
ρ1 = − s =1
1+θ 2
ρs =
ρ 2 − ρ1 − θ 2 1 − θ 2
2
=
( ) s=2
•
1 − ρ 12 (
1−θ 6 )
(
−θ s 1−θ 2 ) ∀s
(
1 − θ 2 ( s +1) )
Correlograma (FAP)
θ <0 θ >0
ρs • ρs •
s s
20
Econometría Curso 2011-12
• Métodos gráficos
1. Representaciones gráficas de los residuos et frente al tiempo
Figura 112
12
Gujarati (2006): Principios de Econometría. McGraw Hill.
21
Econometría Curso 201-12
Figura 1113
∑ et et + s
ρ̂ s = t =1
T
∑e t =1
2
t
13
Gujarati (2006): Principios de Econometría. McGraw Hill.
22
Econometría Curso 2011-12
HA: ρ S ≠ 0
s
1
ρˆ s → N (0, Var ( ρˆ s )) donde Vaˆr ( ρˆ s ) = (1 + 2∑ ρˆ 2j )
T j =1
En un AR(p):
H0: ρ S• = 0 ∀s > p
HA: ρ S • ≠ 0
1
ρˆ s• → N ( 0 ,Var( ρˆ s . )) donde Vâr( ρˆ s• ) ≅
T
• Contrastes estadísticos
Todos ellos utilizan para su elaboración los residuos obtenidos en la estimación
mínimo cuadrática ordinaria y plantean en la hipótesis nula la ausencia de autocorrelación.
La hipótesis alternativa difiere de unos contrastes a otros planteando distintos procesos de
correlación entre las perturbaciones según los casos.
1.- Contraste de Durbin-Watson
La hipótesis nula del contraste plantea la ausencia de autocorrelación, mientras que
la alternativa considera la existencia de autocorrelación mediante un AR(1):
(ε t = ρε t −1 + u t ) . Es un contraste de una sola cola según se establezca que ρ < 0 o ρ > 0, es
decir:
H0 : ρ = 0
H1 : ρ < 0 o ρ >0
El estadístico del contraste se define como:
T
∑ (e t − et −1 )
2
d= t =2
T
∑e
t =1
t
2
23
Econometría Curso 201-12
0 dL dU 2 4-dU 4-dL 4
Inconvenientes:
1. No es válido cuando el modelo no tiene término constante.
2. No se puede utilizar si el modelo incluye regresores estocásticos y por lo tanto no se
puede utilizar en los llamados modelos autorregresivos (modelos en los que la
variable endógena retardada está entre los regresores). Para ese caso Durbin
propuso:
T
h = ρˆ
→
a
N (0,1)
1 − TVar ( βˆ i )
donde Var ( βˆi ) es la varianza del parámetro que acompaña al primer retardo de la
variable endógena (en la práctica se utiliza S β2ˆ ) y ρ̂ es el estimador de ρ obtenido a
i
∑ (e − et − 4 )
2
t
d4 = t =5
T
∑e
t =1
t
2
24
Econometría Curso 2011-12
ρYt −1 = ρβ 0 + ρβ 1 X 1t −1 + ... + ρβ k X kt −1 + ρε t −1
Si restamos, miembro a miembro, el modelo expresado en la observación t y el
modelo expresado en la observación t-1 multiplicado por ρ , obtenemos
25
Econometría Curso 201-12
Yt − ρYt −1 = (1 − ρ )β 0 + β1 ( X 1t − ρX 1t −1 ) + ... + β k ( X kt − ρX kt −1 ) + ε t − ρε t −1
Este modelo se conoce como el modelo en diferencias generalizado. Es un modelo
que cumple las hipótesis clásicas si realmente el esquema de las perturbaciones del modelo
original es un AR(1). Además está en función de los parámetros de interés ( β y ρ ).
A) Si ρ fuera conocido podríamos aplicar MCO sobre el modelo en diferencias
generalizado, obteniendo unos estimadores que son ELIO y consistentes. Al estimador del
vector paramétrico, se le denomina estimador de mínimos cuadrados generalizados.
B) Sin embargo, generalmente, ρ es desconocido y debe tratarse como un parámetro
adicional a estimar. En este caso se puede proceder de dos formas diferentes.
1.- Una forma es mediante algún método secuencial, con el que se estima primero
ρ y después β . El proceso se puede repetir hasta conseguir un determinado nivel de
precisión en las estimaciones. Ejemplos de este método secuencial son Cochrane-Orcutt y
el bietápico de Durbin.
2.- La otra forma de estimar el modelo es mediante algún método que proporcione
simultáneamente un estimador para β y para ρ . Para obtener los estimadores hay que
tener en cuenta que el modelo en diferencias generalizado se puede expresar como
Yt = ρYt −1 + (1 − ρ )β 0 + β 1 X 1t − β1 ρX 1t −1 + ... + β k X kt − β k ρX kt −1 + ε t − ρε t −1
Obtenemos una ecuación donde la perturbación cumple las hipótesis clásicas
(ε t − ρε t −1 = u t ) , pero que no es lineal en los k+2 parámetros de los que depende.
Este modelo se puede estimar minimizando la suma de cuadros de los errores
mediante de algún algoritmo de optimización no lineal. Precisamente, este es el
procedimiento que utiliza el programa Eviews.
Si la perturbación siguiera un esquema AR de mayor orden o un MA la forma de
proceder sería muy similar.
26
Econometría Curso 2011-12
8.5.- Predicción
27
Econometría Curso 201-12
28
Econometría Curso 2011-12
29
Econometría Curso 201-12
MA
30
Econometría Curso 2011-12
ARMA(1,1)
31
Econometría Curso 201-12
32
Econometría Curso 2011-12
33
Econometría Curso 201-12
AR(1)
34
Econometría Curso 2011-12
Llamando X t' al vector fila que recoge las observaciones de todos los regresores en
el momento t: X t' =(1 X1t X2t ... Xkt) la matriz ΣXX sería la siguiente:
1 1 E ( X 1t ) L E ( X kt )
Σ XX ( )
= E Xt Xt = E
'
X 1t
(1 X 1t
L X kt ) =
E ( X 1t ) ( )
E X 1t 2
L E ( X 1t X kt )
M M M M M
( )
E ( X kt ) E ( X 1t X kt ) L
2
X kt E X kt
35
Econometría Curso 201-12
Esta condición es mucho más fuerte que la anterior ya que suponemos que para cada t, el
valor esperado de εt, dadas las variables explicativas en todos los periodos, es cero.
C) Los regresores no son exógenos ni estricta ni contemporáneamente cuando:
E (ε t | X ) ≠ 0
Los supuestos A) y B) son muy importantes para definir las propiedades de los estimadores
de MCO en regresores estocásticos, especialmente cuando trabajamos con series
temporales:
1) Si se da el supuesto A) es decir, existe exogeneidad contemporánea entre los
regresores y las perturbaciones ⇒ el EMCO es consistente, pero no es insesgado.
2) Si se cumple el supuesto B) es decir, existe exogeneidad estricta entre los regresores
y las perturbaciones ⇒ el EMCO es insesgado, eficiente y consistente.
3) Si no se cumple ni siquiera el supuesto A), el estimador de MCO es sesgado e
inconsistente.
β̂ = (X’X)-1X’Y = β + (X’X)-1X’ε
36
Econometría Curso 2011-12
=EX[ (X’X)-1X’ E(εε’ |X)X(X’X)-1)] =σ2 EX[ (X’X)-1X’X(X’X)-1)] =σ2 EX[ (X’X)-1]
=σ2I
37
Econometría Curso 201-12
( )
−1
X ' X
Recordemos que T βˆ − β
→
a
N 0, σ 2 p lim
T
Esto implica que su distribución asintótica nos va a permitir justificar el uso de las
distribuciones habituales, aunque sólo tendrán validez de forma aproximada. En este
sentido, también podríamos utilizar los contrastes asintóticos de Wald, LM o RV.
Resumen:
A) Si los regresores son estrictamente exógenos los resultados son muy similares a los
del MRLC pero condicionado todo por X.
• β̂ es insesgado, eficiente y consistente y coincide con el estimador de MV.
• S2 es insesgado y consistente.
• Hablando de distribuciones condicionadas a X los test de hipótesis son válidos para
muestras finitas y no es necesario recurrir a la teoría asintótica.
B) Si los regresores son sólo contemporáneamente exógenos
• β̂ es sesgado, y, por tanto, no eficiente (ni óptimo), pero sí es consistente y
asintóticamente eficiente.
• S2 es sesgado pero consistente.
• Como S2 es sesgado entonces S βˆβˆ = S 2 ( X ' X ) −1 es sesgado, pero su utilización está
justificada en base a la distribución asintótica.
• Los contrastes son válidos asintóticamente.
• Hay que recurrir al comportamiento asintótico de los estimadores y contrastes.
C) Cuando ni siquiera se cumple la exogeneidad contemporánea, la estimación de MCO no
es válida porque no se cumple ninguna propiedad. En este caso, hay que recurrir a otro
método de estimación que se denomina de Variables Instrumentales.
• β̂ es sesgado e inconsistente.
• S2 es sesgado e inconsistente.
• No disponemos de una distribución asintótica, a partir del EMCO, para aproximar la
distribución exacta de los estadísticos cuando T tiende a infinito.
38
Econometría Curso 2011-12
Este método consiste en encontrar una matriz de variables, Z, tales que cumplan los
requisitos siguientes:
• Las variables Z están incorrelacionadas con las perturbaciones, es decir,
Z 'ε
p lim =0
T
• Las variables Z están fuertemente correlacionadas con las variables X, es decir,
Z' X
p lim = Σ ZX finita y no singular
T
Z'Z
• Las variables Z tienen buenas propiedades en el límite, es decir, p lim = Σ ZZ .
T
A estas variables Z1,...,Zk se las llama instrumentos o variables instrumentales.
Nota: Si algún regresor no está correlacionado con las perturbaciones puede utilizarse él
mismo como variable instrumental.
El estimador de variables instrumentales se define como:
βˆVI = (Z ' X )−1 Z ' Y = β + (Z ' X )−1 Z ' ε
Propiedades
• No es lineal en Y pues también depende de X y de Z (que son aleatorias).
• No es insesgado: X no es ni contemporáneamente exógena por lo que E (ε / X ) ≠ 0
y E ( βˆ ) ≠ β .
• Por lo anterior, no es eficiente ni óptimo.
−1
Z' X Z 'ε
• Es consistente: p lim βˆVI = p lim β + p lim p lim = β + Σ −ZX1 0 = β
T T
• Distribución asintótica: (
T βˆVI − β
→
a
)N (0,VVI )
donde VVI = σ 2 Σ ZX
−1
Σ ZZ (Σ −ZX1 )' es la matriz de varianzas-covarianzas asintótica de dicha
distribución.
−1 −1
Z' X Z'Z X 'Z
Un estimador de dicha matriz es: VˆVI = σˆ VI2
T T T
eVI' eVI
donde σˆ VI2 = es un estimador consistente de σ2 y eVI = Y − Xβ̂ VI
T − k −1
Una aproximación del estimador de VVI es: S βˆ = σˆ VI2 (Z ' X ) Z ' Z ( X ' Z )
−1 −1
VI
39
Econometría Curso 201-12
Yt* = β 0 + β 1 X t* + ε t + vt − β 1u t ⇒ Yt * = β 0 + β 1 X t* + wt ⇒ wt = ε t + vt − β 1u t
14 4244 3
wt
E (wt ) = E (ε t + vt − β 1u t ) = 0
[( )
Cov ( X t* , wt ) = E ( X t* , wt ) = E X t + u t (ε t + v t − β 1u t ) = ]
( ) ( )
E ( X t ε t ) + E ( X t vt ) − β 1 E ( X t u t ) + E (u t ε t ) + E (u t v t ) − β 1 E u t2 = − β 1 E u t2 = − β 1σ u2 ≠ 0
Por lo tanto, los estimadores de MCO son sesgados e inconsistentes y habría que
utilizar el método de variables instrumentales para obtener estimadores consistentes. Por
otra parte, si el error en los datos sólo afectase a la variable Y, no surgiría el problema
anterior.
(
T βˆ MCO − β
→
a
)
N (0,VMCO ) y (
T βˆVI − β
→
a
)
N (0,VVI )
40
Econometría Curso 2011-12
X 'ε
Bajo la hipótesis nula H 0 : p lim = 0 , tanto β̂ MCO como β̂ VI son consistentes,
T
X 'ε
sin embargo, bajo la alternativa H 1 : p lim ≠ 0 , sólo lo es β̂ VI . Si la hipótesis nula es
T
( ) ( )
cierta entonces p lim βˆ MCO − βˆVI = 0 y el valor de βˆ MCO − βˆVI debería ser pequeño; al
contrario, si la hipótesis nula no es cierta.
El estadístico de Hausman se define, bajo la H0 , como:
(
H Hausman = T βˆ MCO − βˆVI ) [Vˆ
'
VI − VˆMCO ] (βˆ
−1
MCO )
− βˆVI
→
a
χ H2
donde H es el número de regresores que se quiere ver si son o no exógenos, VˆVI y VˆMCO son
−1 −1
Z ' X Z 'Z X 'Z
estimadores consistentes de VVI y de VMCO, es decir, VˆVI = σˆ
2
T T T
−1
2 X'X
y VMCO = σˆ
ˆ y σˆ 2 el estimador consistente de σ utilizando el estimador de
2
T
VI para obtener los residuos.
Si el valor del estadístico de Hausman supera el valor crítico se rechaza la H0 de que
no hay correlación entre los regresores y la perturbación; en caso contrario, se acepta la no
existencia de correlación entre los regresores y la perturbación.
Este contraste se puede realizar también a partir de una serie de regresiones auxiliares:
1) Realizar la regresión de las variables que posiblemente sean endógenas sobre los
instrumentos y las exógenas del modelo y quedarnos o bien con los residuos o con el
valor estimado.
2) Introducir en la regresión original los valores estimados (o los residuos) y contrastar si
son o no significativos, de modo que si no lo son aceptaríamos la H0 y si lo son la
rechazaríamos.
41
Econometría Curso 201-12
42
Econometría Curso 2011-12
Los modelos estudiados hasta ahora eran modelos estáticos en los que todas las
variables estaban referidas al mismo periodo de tiempo. Estos modelos se plantean cuando
se considera que un cambio en X en el momento t ejerce un efecto inmediato en Y.
Sin embargo, la Teoría Económica sugiere que, en muchos casos, las relaciones
entre las variables son dinámicas, de forma que el efecto de una variable X j sobre Y no
tiene por qué ser instantáneo y se puede distribuir en distintos periodos de tiempo.
Vamos a distinguir dos tipos de modelos dinámicos:
a) Modelos autorregresivos.
b) Modelos de retardos distribuidos.
Nota: En este tema vamos a utilizar frecuentemente el llamado operador de retardo (que se
denota por L o B) y que retarda la variable a la que acompaña del siguiente modo:
Ls X t = X t − s
De esta forma: LX t = X t −1 ; L2 X t = X t − 2 ; Ls X t = X t − s ; (1 − L) X t = X t − X t −1 .
Son aquellos en los que se plantea como regresor la variable endógena retardada en
algún periodo de tiempo. Un ejemplo sería: Yt = β 0 + β 1 X t + β 2Yt −1 + ε t
Este tipo de modelos son estocásticos ya que la variable Yt-1 es aleatoria. Además, no
podemos considerar que los regresores sean estrictamente exógenos ya que podemos
comprobar que Yt-1 estará relacionada con ε t −1 , ε t −2 ,.... . Por tanto, no se va a cumplir que
E(εt | X)=0 ∀ t=1,...,T
Sin embargo, si εt cumple las hipótesis clásicas, podemos aceptar la exogeneidad
X 'ε
contemporánea, de tal forma que E (ε t | X t' ) = 0 y se cumple que p lim = 0 . Los
T
EMCO son sesgados y no eficientes, pero son consistentes y las distribuciones asintóticas
son válidas, es decir, los resultados habituales de inferencia estadística son válidos
asintóticamente.
Si εt está autocorrelacionada, ni siquiera se cumpliría el supuesto de regresores
X 'ε
contemporáneamente exógenos, p lim ≠ 0 y, por tanto, el EMCO no tiene ninguna
T
propiedad y la inferencia no es válida ni asintóticamente. El estimador consistente será el de
Variables Instrumentales donde podríamos tomar como instrumento de Yt-1 a Xt-1.
En la práctica, cuando nos encontremos con un modelo autorregresivo lo que hay
que analizar, en principio, es si la perturbación está autocorrelacionada o no (con el
contraste de la h de Durbin el de Breusch-Godfrey) y si existe relación contemporánea entre
los regresores y la variable endógena (con el contraste de Hausman).
En algunos modelos econométricos, la introducción de ciertas hipótesis teóricas
también da lugar a la aparición de la variable endógena retardada entre los regresores. Dos
ejemplos son los siguientes:
43
Econometría Curso 201-12
Yt* = β 0 + β1 X t + ε t
44
Econometría Curso 2011-12
( )
Sustituyendo Yt* en el modelo: Yt* = Yt −
δ
1 (1 − δ )
δ
Yt −1 = β 0 + β1 X t + ε t
Y, despejando: Yt = δβ 0 + δβ 1 X t + (1 − δ )Yt −1 + δε t
El modelo resultante, al igual que en expectativas adaptativas, es un modelo
autorregresivo, y por lo tanto, habrá que analizar si sus perturbaciones están o no
autocorrelacionadas y realizar el test de Hausman para elegir el método de estimación
adecuado.
Son aquellos en los que una o más variables exógenas influyen en la variable
endógena con algún retardo. Son modelos del tipo:
Yt = β 0 + β1 X 1t + β 2 X 1t −1 + β 3 X 1t −2 + ... + ε t
Dentro de estos modelos vamos a plantear dos posibilidades:
n
1) Modelos con estructura finita de retardos: Yt = α + ∑ β i X t −i + ε t
i =0
∞
2) Modelos con estructura infinita de retardos: Yt = α + ∑ β i X t −i + ε t
i =0
45
Econometría Curso 201-12
βi
En modelos con infinitos retardos β i* = ∞
∑ βi
i =0
46
Econometría Curso 2011-12
( )
n n n n
Yt = α + ∑ a 0 + a1i + a 2 i 2 X t −i + ε t = α + a 0 ∑ X t −i + a1 ∑ iX t −i + a 2 ∑ i 2 X t −i + ε t
i =0 i =0 i =0 i=0
1 23 1424 3 1 424 3
Z 0t Z 1t Z2t
Yt = α + a 0 Z 0 t + a1 Z 1t + a 2 Z 2 t + ε t
αˆ = αˆ
βˆ 0 = aˆ 0
βˆ1 = aˆ 0 + aˆ1 + aˆ 2
βˆ2 = aˆ 0 + aˆ1 2 + aˆ 2 2 2
....................................................
βˆ n = aˆ 0 + aˆ1n + aˆ 2 n 2
47
Econometría Curso 201-12
∞
Yt = α + ∑ β i X t −i + ε t
i=0
Obviamente, aún suponiendo que cumple las hipótesis clásicas, la estimación sin
restricciones de este modelo no es posible ya que necesitaríamos estimar infinitos
parámetros con una muestra siempre finita.
La forma de proceder en estos casos es establecer alguna hipótesis sobre los
coeficientes de retardo de modo que podamos reducir su número. Koyck propuso que los
coeficientes de retardo, aunque infinitos, decrecían en progresión geométrica de la forma:
β i = βλ i con 0 < λ < 1 para i=0,1,...
Introduciendo las restricciones, el modelo quedaría
Yt = α + ∑ βλ i X t −i + ε t ⇔ Yt = α + β (X t + λX t −1 + λ 2 X t − 2 + ...) + ε t
∞
i =0
y despejando Yt :
Yt = α (1 − λ ) + β X t + λYt −1 + ε t − λε t −1 ⇔ Yt = α * + β X t + λYt −1 + v t
1424 3 1424 3
α* vt
48
Econometría Curso 2011-12
49
Econometría Curso 201-12
50
Econometría Curso 2011-12
M L
=
M M M L M
=0
u gt
u gt u1s u gt u 2 s L u gt u gs 0 0 L 0
Significa que las perturbaciones correspondientes a distintos periodos de tiempo están
incorrelacionadas, sean perturbaciones de una misma ecuación (E (u1t u1s ) = 0 ) o de
distintas ecuaciones (E (u1t u 2 s ) = 0 ) .
4) u t → N (0, Σ ) ∀t
5) Las variables predeterminadas (Xt) no son aleatorias, o si lo son, serán
estrictamente exógenas o contemporáneamente exógenas.
6) La matriz Γ no es singular, es decir, Γ ≠ 0 .
Además las perturbaciones en la forma reducida ( vt ) tienen las mismas características
que las vistas para las perturbaciones en la forma estructural.
51
Econometría Curso 201-12
Las relaciones entre los parámetros de ambas formas están recogidas en el sistema
de ecuaciones Π = − β Γ −1 donde hay (gxk) parámetros de la forma reducida y
(gxg)+(gxk) parámetros de la forma estructural.
La identificación de un modelo de ecuaciones simultáneas consiste en saber, si a
partir de un conjunto de observaciones muestrales, que permite la estimación de la forma
reducida es posible estimar los parámetros de la forma estructural. El análisis se hace
para cada ecuación (de la forma estructural) y si es posible se dice que la ecuación está
identificada, y si no lo es, que no está identificada. Además, cuando la ecuación está
identificada se puede distinguir según que la solución sea única o no, entre identificación
exacta y sobreidentificación, respectivamente.
Para saber cómo es la identificación de la ecuación, sin necesidad de intentar
resolver el sistema, se utilizan las denominadas condiciones de orden (que es una
condición necesaria pero no suficiente) y condiciones de rango (que es una condición
necesaria y suficiente). Estas condiciones, si en el sistema existen restricciones de
normalización y de exclusión, es decir, si en cada ecuación existe una variable endógena
con coeficiente igual a 1 o –1 y algunos parámetros que acompañan a las variables
predeterminadas son cero en algunas ecuaciones, se pueden expresar como se muestra a
continuación.
Condición de orden
Para aplicar esta condición a una ecuación, se compara el número de variables, tanto
endógenas como predeterminadas, excluidas en la ecuación, g 2 y k 2 , con el número de
ecuaciones del sistema menos una (g-1), de modo que:
- Si g 2 + k 2 < g − 1 la ecuación no está identificada (no hace falta aplicar después la
condición de rango, pues no se va a cumplir).
- Si g 2 + k 2 = g − 1 la ecuación puede estar exactamente identificada. Lo estará si se
cumple la de rango.
- Si g 2 + k 2 > g − 1 la ecuación puede estar sobreidentificada. Lo estará si se cumple
la de rango.
Por lo tanto, la condición de orden es: g 2 + k 2 ≥ g − 1
Condición de rango
La aplicación de esta condición requiere obtener la matriz de coeficientes de la
forma estructural, A, que es igual a: A = (Γ' | β ') . Sea A* la submatriz de A formada por
los coeficientes que en las demás ecuaciones del sistema acompañan a las variables
excluidas de la ecuación que se quiere identificar, de modo que:
- Si rg ( A* ) ≠ g − 1 entonces la ecuación no está identificada
- Si rg ( A* ) = g − 1 entonces la ecuación está identificada, pero puede estar
exactamente identificada o sobreidentificada, para saberlo recurrimos a la
condición de orden.
Por tanto, la condición de rango es: rg ( A* ) = g − 1
Si todas las ecuaciones del sistema están identificadas se dice que el sistema está
identificado. Si sólo lo están algunas, sólo esas se pueden estimar.
52
Econometría Curso 2011-12
53
Econometría Curso 201-12
Como los resultados (cuando los haya) son funciones de estimadores consistentes y
asintóticamente eficientes, estos también lo serán.
2) Variables Instrumentales
- Si la ecuación está exactamente identificada, Variables Instrumentales proporciona
un resultado para cada estimador, pues disponemos del número exacto de
instrumentos necesarios.
- Si la ecuación está sobreidentificada, tenemos excesivos instrumentos y, por lo tanto,
obtenemos varios estimadores de Variables Instrumentales.
- Si la ecuación no está identificada, no hay instrumentos suficientes y no podemos
estimar por VI.
3) Mínimos Cuadrados en dos Etapas
Es el estimador de Variables Instrumentales que utiliza todos los instrumentos
disponibles, o un instrumento que es combinación lineal de ellos. Es el mejor de todos
los estimadores de Variables Instrumentales.
Aunque la ecuación esté sobreidentificada, este método proporciona una solución
única.
Comparación entre estos estimadores
- Si la ecuación está exactamente identificada
EMCI=EVI=EMC2E
Propiedades: consistentes y asintóticamente eficientes.
- Si la ecuación está sobreidentificada
Si por ejemplo para un parámetro obtenemos por MCI dos soluciones, una coincide con
una de VI (usando un instrumento) y la otra con la otra utilizando el otro instrumento.
El EMC2E combina las dos soluciones y propone un resultado que es el mejor, puesto
que todos los estimadores son consistentes, pero el más eficiente es el de MC2E que es
el de VI que usa como instrumento una combinación lineal de los instrumentos.
54