You are on page 1of 109

Notas aula de Econometria I, profa. Marina S.

Cunha

UNIVERSIDADE ESTADUAL DE MARING


CENTRO DE CINCIAS SOCIAIS APLICADAS
DEPARTAMENTO DE ECONOMIA
PROGRAMA DE PS-GRADUAO EM ECONOMIA

ECONOMETRIA I
PARTE 2

Prof. Marina Silva da Cunha

Notas aula de Econometria I, profa. Marina S. Cunha

SUMRIO
Cap.9 Modelo de regresso generalizado e heterocedasticidade

Cap. 20 Correlao serial

31

Cap. 11 Modelo para dados em painel

53

Cap.8 Endogeneidade e estimao com variveis instrumentais

75

Cap. 10 Sistemas de equaes

80

Cap. 14 Estimao por mxima verossimilhana

96

Lista de exerccios 2

104

Notas aula de Econometria I, profa. Marina S. Cunha

CAPTULO 9

Modelo de Regresso Generalizado e


Heterocedasticidade
9.1 Introduo
9.2 Estimao de Mnimos Quadrados e variveis instrumentais
9.3 Estimao Eficiente por MQG
9.4 Heterocedasticidade
9.5 Teste para Heterocedasticidade
9.6 Mnimos Quadrados Ponderados
9.7 Aplicaes
9.8 Sumrio e concluses

Notas aula de Econometria I, profa. Marina S. Cunha

9.1 Introduo
Neste e em vrios captulos a seguir, o modelo de regresso ser
estendido para incorporar distrbios que violam a suposio A4 do modelo
clssico de regresso linear. O modelo de regresso linear generalizado
y = X +
E[|X] = 0

(9-1)

E[|X] = 2 =
em que,
uma matriz definida positiva de covarincia

2 caso geral
2I caso particular

Vamos considerar dois casos: Heterocedasticidade e Autocorrelao

Notas aula de Econometria I, profa. Marina S. Cunha

HETEROCEDASTICIDADE:
Diferentes varincias
Comum em sries de tempo com alta freqncia e volatilidade como
dados dirios do mercado financeiro, e em dado de corte no tempo
Assumindo que os distrbios so no correlacionados, ento 2 ser

1 0

2
2
2 0
=
M
M

0 0

K 0 12 0

L 0 0 22
=
O M M
M

L 0
0

L 0
O M

L n2
K

AUTOCORRELAO:
Usual em dados de sries temporais, que possuem memria. Sries
temporais usualmente so homocedsticas
Ento 2 ser

1

2 = 2 1
M

n1

1
1
M

n2

K n1
L n2

O
M

L
1

Os valores da diagonal principal dependem do modelo, em muitos


casos so decrescente, o que consistente com a noo de memria
fraca.
Conjuntos de dados em Painel, que consistem em observaes de corte
para vrios pontos no tempo, podem exibir ambas caractersticas. Sero
considerados no Captulo 11.

Notas aula de Econometria I, profa. Marina S. Cunha

Os resultados dos captulos anteriores para o modelo clssico sero


modificados. Adotaremos a seguinte abordagem para os resultados gerais nos
casos especficos de heterocedasticidade e autocorrelao:
1. Primeiro, vamos considerar as conseqncias para o estimador de
mnimos quadrados da forma mais geral do modelo de regresso. Ser
discutido o efeito de se ignorar o modelo generalizado em uma
estratgia de estimao apropriada, ainda baseada em mnimos
quadrados.
2. Ser examinada uma estratgia de estimao alternativa que pode
utilizar melhor as caractersticas do modelo. Suposies mnimas sobre
so feitas neste ponto.
3. Ento, restries s suposies e mtodos de detectar as falhas no
modelo clssico so analisadas procedimentos para testes de
especificao do modelo clssico contra a regresso generalizada.
4. O passo final na anlise formular um modelo paramtrico que faa
suposies especficas sobre . Estimadores nesse contexto so aqueles
na forma dos mnimos quadrados generalizados ou de mxima
verossimilhana que so desenvolvidos no Captulo 16.

Notas aula de Econometria I, profa. Marina S. Cunha

O modelo examinado em termos gerais neste captulo. Maiores


aplicaes para dados em painel e sistemas de equaes mltiplas so
consideradas nos Captulos 10 e 11.

Notas aula de Econometria I, profa. Marina S. Cunha

9.2 Estimao ineficiente por Mnimos Quadrados e variveis


instrumentais
Os resultados essenciais para o modelo clssico com distrbios esfricos so:
E[|X] = 0
e

E[|X] = 2I

(9-2)

presentes nos Captulos 2 7. Novamente, encontramos que o Estimador de


Mnimos Quadrados Ordinrios (OLS)
b = (XX)1Xy = + (XX)1X

melhor

linear

no-viesado

(BLU),

consistente

(9-3)
e

distribudo

assintoticamente normal (CAN), alm disso, se os distrbios so


normalmente distribudos, como o estimador de mxima verossimilhana que
ser estudado no Captulo 16, so assintoticamente eficientes, considerando
todos os estimadores CAN.
Vamos verificar qual dessas propriedades se mantm no modelo (9-1)
Para resumir, o estimador de mnimos quadrados mantm somente
algumas de suas desejveis propriedades. Mnimos quadrados ainda so noviesados, consistentes e distribudos assintoticamente normal. No entanto,
no so mais eficientes como veremos e os usuais procedimentos de
inferncia no so mais apropriados.

Notas aula de Econometria I, profa. Marina S. Cunha

9.2.1 Propriedades em amostras finitas do EMQ


Tomando a esperana de ambos os lados de (9-3), se E[|X] = 0, ento
E[b] = EX[E[b|X]] =

(9-4)

ainda no viesado. Entretanto, temos o seguinte teorema.


TEOREMA 9.1 PROPRIEDADES DE AMOSTRAS FINITAS DE b NO
MODELO DE REGRESSO GENERALIZADO
Se os regressores e os distrbios so no-correlacionados, ento, a notendenciosidade dos mnimos quadrados no afetada pela violao da
suposio (9-2). O estimador de mnimos quadrados no-viesado no
modelo de regresso generalizado. Com regressores no-estocsticos, ou
condicionados sob X, a varincia amostral do estimador de mnimos
quadrados
Var[b|X] = E[(b- )(b- )|X]
= E[(XX)1XX(XX)1|X]
= (XX)1X(2)X(XX)1
2 1

=
X' X
n n

1
1

X ' X X ' X
n
n

(9-5)
1

Se os regressores so estocsticos, a varincia no-condicional


EX[Var[b|X]. Em (8-3), b uma funo linear de . Assim, se
normalmente distribudo, ento
b|X ~ N[, 2(XX)1(XX) (XX)1]

O resultado final que b possui propriedades similares queles do


caso de regresso clssica. Como a varincia do estimador de mnimos
quadrados no mais 2(XX)1, inferncias com base em s2(XX)1 podem
estar erradas. No somente porque a matriz est errada, mas s2 pode ser um
estimador viesado de 2. No h como saber se 2(XX)1 menor ou maior
que a varincia verdadeira. Com isto, as inferncias com as distribuies t e F
no sero apropriadas. Veremos o que acontece se (9-5) ignorado e
continuamos utilizando s2(XX)1.

Notas aula de Econometria I, profa. Marina S. Cunha

10

9.2.2 Propriedades Assintticas dos Mnimos Quadrados


TEOREMA 9.2 CONSISTNCIA DO ESTIMADOR DE MNIMOS
QUADRADOS NO MODELO DE REGRESSO
GENERALIZADO (GR)
Se Q = plim (XX/n) e plim (XX/n) so ambas as
matrizes definidas positivas, ento b consistente para .
Sob as condies assumidas,
plim b =

(9-7)

TEOREMA 9.3 DISTRIBUIO ASSINTTICA DE b NO MODELO GR


Se os regressores so bem comportados (suficientemente) e
os termos da diagonal principal em diminuem
suficientemente rpido, ento o estimador de mnimos
quadrados normal e assintoticamente distribudo com
mdia e matriz de covarincia dada em (9-9).

2 1
1

Asy. Var[b] = Q plim X' X Q 1


n
n

(9-9)

Notas aula de Econometria I, profa. Marina S. Cunha

11

9.2.3 Estimao robusta da matriz assinttica de covarincia


Se 2 so conhecidos, ento o estimador da matriz assinttica de
covarincia de b em (9-10) ser
V OLS

11

=
X 'X
nn

1
1

2
X ' [ ]X X 'X
n
n

As matrizes de somas de quadrados e produtos cruzadas do lado


direito e esquerdo so dados amostrais e facilmente estimados.
O problema a matriz central que envolve os termos desconhecidos
2. necessrio um estimador para n(n + 1)/2 elementos
desconhecidos na matriz

1 n n
plim Q* = plim ij x i x 'j
n i =1 j =1
O ponto que Q* uma matriz de somas de quadrados e produtos
cruzados que envolvem ij e as colunas de X. O estimador de mnimos
quadrados b um estimador consistente de , o que implica que o resduo de
mnimos quadrados ei um estimador consistente de i. A abordagem geral,
ento, utilizar X e e para obter um estimador de Q*.
Em muitas aplicaes assumida uma estrutura particular para . Os
casos de heterocedasticidade e autocorrelao so considerados na
Seo 9.4 e no Captulo 20, respectivamente, enquanto vrios
modelos para dados em painel so analisados no Captulo 11.

Notas aula de Econometria I, profa. Marina S. Cunha

12

9.2.4 Estimao com variveis instrumentais


9.3 Estimao eficiente por Mnimos Quadrados Generalizados

A estimao de no modelo de regresso generalizado requer o


conhecimento de . Para comear, til considerar casos em que
conhecida, simtrica e uma matriz definida positiva. Esta suposio em
muitos casos ser verdadeira, embora, em muitos modelos, ir conter
parmetros desconhecidos que devem ser estimados. Veremos isto na Seo
9.6.2

Notas aula de Econometria I, profa. Marina S. Cunha

13

9.3.1 Mnimos Quadrados Generalizados (MQG)


Como uma matriz definida positiva e simtrica, pode ser fatorada em,
= CC

C = vetores caractersticos de

= C1/21/2C

= matriz diagonal com razes caractersticas de


1/2 = matriz com ith elemento igual a

T = C1/2

= TT
e 1 = PP

P = C1/2

Pr-multiplicando o modelo em (9-1) por P [os pesos]


Py = PX + P
ou

y* = X* + *

(9-11)

A varincia condicional de *
E[**] = PP = P2P = 2PP = 2PP1P1P = 2I
2

Se conhecermos podemos obter y* e X* dos dados observados. No


modelo clssico, o estimador de mnimos quadrados eficiente, da
= ( X * ' X* ) 1 X*' y *
= (XPPX)1XPPy
= (X1X)1X1y
um estimador eficiente de . Este estimador o estimador de mnimos
quadrados generalizados (MQG) ou de Aitken (1935) de . Portanto,
enquanto o erro do modelo 9-1, heterocedstico, E[|X] = 2, o erro do
modelo 9-11 homocedstico, E[**] = 2I.

Notas aula de Econometria I, profa. Marina S. Cunha

14

O seguinte teorema para o modelo de regresso clssico em (9-11)


inclui o resultado para o modelo de regresso generalizado anlogos aos do
Cap. 4.

TEOREMA 9.4 PROPRIEDADES DO ESTIMADOR DE MNIMOS


QUADRADOS GENERALIZADOS
Se E[*|X*] = 0, ento

E[ | X* ] = E [( X*' X* ) X*' y * | X* ]
= E[(X*X*)X*(X* + *)|X*]
= + E[(X*X*)1X**)|X*]
=

o estimador de MQG no-viesado. Alm disso,


Assim,
plim [(1/n)X1X]1 = Q*1

(9-12)

em que necessitamos que a matriz de dados transformados X* =


PX, no a de dados originais X, seja bem comportada. O
estimador de MGQ assinttica e normalmente distribudo, com
mdia e varincia amostral.
Var[ | X* ] = 2 (X*' X* ) 1 = 2 (X' 1X) 1 (9-13)
O estimador de MQG o estimador linear no-viesado de
varincia mnima no modelo de regresso generalizado.

Notas aula de Econometria I, profa. Marina S. Cunha

15

Para testar hipteses podemos continuar utilizando o conjunto completo


de resultados do Captulo 5 para o modelo transformado dado em (9-11)
 Para testar J restries lineares, R = q, a estatstica apropriada

F[ j ,nk ]

(R q)'[R 2 ( X*' X* ) 1 R' ]1 (R q) ('c c ' ) J


=
=
J
2

em que o vetor de resduos

= y * - X*
e

'
(y X )' 1 ( y X )
=
=
nk
nk
2

(9-14)

Os resduos do GLS restrito, c = y * - X* c , so baseados em

c = [X' 1X]1 R'[R(X' 1X)R' ]1 (R q)


Para resumir, todos os resultados para o modelo clssico, incluindo os usuais
procedimentos de inferncia, so aplicados ao modelo transformado em (911).

Notas aula de Econometria I, profa. Marina S. Cunha

16

 No h uma contrapartida para o R2 no modelo de regresso generalizado.


H algumas alternativas propostas, mas devem ser utilizadas com cuidado
R2 do modelo transformado
- A regresso precisa ter um termo constante para o R2 estar entre 0
e 1.
- O ajustamento feito para o modelo de regresso transformado,
(9 -11), no para o modelo original, ou seja, a varivel
dependente y* e no y.
Uma medida baseada nos resduos do modelo original e o estimador GLS

RG2

(y X )' (y X )
=1
2
in=1 ( yi y )

No limitada pelo intervalo unitrio.


Com isso, no pode ser utilizada para comparar modelos.
Uma medida baseada na soma dos quadrados generalizada [Judge (1985),
Base (1973)]

*' * = ( y X)' 1 (y X)
O quadrado da correlao entre os valores previstos e observados

ry2, y = corr 2 ( y, y ) = corr 2 ( y, x' )

Notas aula de Econometria I, profa. Marina S. Cunha

17

9.3.2 Mnimos Quadrados Generalizados vivel (ou factvel)


Para utilizar os resultados da Seo 9.3,1, deve ser conhecida. Se
contm parmetros desconhecidos que devem ser estimados, ento mnimos
quadrados generalizados no so viveis. Com uma no restrita, h
n(n+1)/2 parmetros adicionais em 2. Este nmero de parmetros muito
grande para ser estimado com n observaes. Obviamente, alguma estrutura
deve ser imposta para o modelo se queremos dar prosseguimento.
Um problema tpico envolve um conjunto pequeno de parmetros ,
tal que = (). Por exemplo, uma frmula comumente utilizada em sries
de tempo

( ) =
M
n 1

1
M

n2

3 K n 1

2 K n2
O
K

que envolve apenas mais um parmetro. Um modelo heterocedstico que


tambm possui um novo parmetro

i2 = 2 zi

(9-15)

Notas aula de Econometria I, profa. Marina S. Cunha

18

Supondo que um consistente estimador de . Para fazer a

= ( ) no lugar de . Se
estimao GLS vivel, podemos utilizar

equivalente . Assim, o
plim = , ento assintoticamente
estimador de Mnimos Quadrados Generalizados Vivel denotado por

1X) 1 X'
1y
= ( X'

As condies para que seja assintoticamente equivalente a so

1 1 1

plim X'
X X' 1X = 0
n

(9-16)

1
1 1 X' 1 = 0
plim
X'

(9-17)

TEOREMA 9.6 EFICINCIA DO ESTIMADOR FGLS


Um estimador FGLS assintoticamente eficiente de no
necessita de um estimador eficiente de ; somente a
consistncia requerida para obter a completa eficincia
para o estimador FGLS

Em amostras pequenas o estimador OLS pode ser mais eficiente que o FGLS.

Notas aula de Econometria I, profa. Marina S. Cunha

19

9.4 Heterocedasticidade
Quando as varincias dos distrbios da regresso no so constantes
so denominadas heterocedsticas. Heterocedasticidade ocorre em vrias
aplicaes, em dados de corte temporal ou sries de tempo. Por exemplo,
- devido ao tamanho da firma  lucro varincia
- gastos das famlias  renda varincia
No modelo de regresso heterocedstico, tem-se:
Var [i|X] = i2

i = 1, ..., n

continuamos assumindo que os distrbios so no correlacionados. Ento,

1 0

2
2
2 0
E['| X] = =
M
M

0 0

0
0
M
0

L 0
L 0

O M

L n

em que i2 = 2i, que um escalar, que permite utilizar a normalizao


n

tr () = i = n
i =1

Com isto, o modelo clssico de regresso, com distrbios


homocedsticos, um caso especial em que i = 1, i = 1, ...,n. Intuitivamente,
podemos pensar que os i so pesos, que refletem a variabilidade da
varincia dos erros.
O fator escalar 2 est em todos os escalares.

Notas aula de Econometria I, profa. Marina S. Cunha

20

9.4.1 Estimao por Mnimos Quadrados Ordinrios


Ns mostramos na Seo 9.2 que na presena de heterocedasticidade,
o estimador de mnimos quadrados de b ainda no-viesado, consistente,
normal e assintoticamente distribudo. A matriz assinttica de covarincia
1

2
1
1
1

Assy.var[b] = plim X' X plim X' X plim X' X


n
n
n
n

A estimao da matriz assinttica de covarincia ser baseada em


1

var[b | X] = (X' X ) i x i x'i (X' X )1


i =1

(9-18)

Assumindo que os regressores so bem comportados, ento (XX/n)1


converge para uma matriz definida positiva [Q]. A consistncia em mdia
quadrtica de b depende do comportamento no limite da matriz

Q *n

X' X 1
=
=
n
n

i x i x'i

i =1

Quadrados da soma e produtos cruzados ponderados


de X, com peso i/n, cuja soma igual a 1
Se Q n
Q ento b
n
*

em mdia quadrtica

Em geral,
a

2 1 * 1
N , Q Q Q
n

com

A prova formal est baseada na seo 4.9 com Qi = ixixi

Q* = plim Q *n

Notas aula de Econometria I, profa. Marina S. Cunha

21

9.4.2 Ineficincia dos Mnimos Quadrados


Segue dos resultados anteriores que b relativamente ineficiente em
relao ao estimador de MQG, comparar (9-18) com (9-13).

9.4.3 A estimativa da Matriz de Covarincia de b


OLS  var [b|X] = 2(XX)1
OLS  var [b|X] = 2(XX)1(XX)(XX)1

inapropriada
apropriada

Considerando a diferena entre a estimativa da primeira e a segunda


Est. var [b|X] var [b|X] = s2(XX)1 2(XX)1(XX)(XX)1
1

2 X' X X' X X' X X' X


D=

n n n

Em grandes amostras s 

X' X X' X
=

=
n
n

1 '
x i x i
i =1 n

i '
x i x i =
i =1 n
n

1
( 1 i )x i x'i
i =1 n

so duas mdias ponderadas da matriz Qi = xixi, utilizando 1 como peso na


primeira e i para a segunda.

n ) = 1. Se os pesos no so
correlacionados com xixi, a diferena ser zero, caso contrrio, a diferena
pode ser considervel.
O escalar Tr() = n implica que

No seja to otimista 1 b obtido por OLS ineficiente


2 Assumimos que os pesos no esto
correlacionados com as observaes

Notas aula de Econometria I, profa. Marina S. Cunha

22

9.4.4 Estimando a matriz de covarincia apropriada para o


Estimador de Mnimos Quadrados
Estimador consistente de White para heterocedasticidade
1

1 X' X 1
Est. Asy. var[b] =

n n n

ei2 x i x i'

X' X

(9-27)

= n(XX)1S0(XX)1
em que,

S0 =

1
n

e x x

2
'
i i i

plim S0 = plim Q*

com

Q* =

1
n

2
'
i xi xi

Resultado extremamente importante e til, mas h problemas


especialmente para amostras pequenas.

Notas aula de Econometria I, profa. Marina S. Cunha

23

9.5 Teste para Heterocedasticidade


9.5.1 Teste geral de White
Considere a hiptese
H0: i2 = 2 para todo i [Homocedasticidade]
H1: no H0
Uma verso do teste diz que

nR 2 ~ 2p-1
n de regressores em X, incluindo a
constante
R2 obtido de regresso de ei2 = (x, x2, xixj)
Note
ei so os resduos da regresso de y = (X)
um teste geral, pois no necessrio fazer nenhuma
suposio sobre a natureza da heterocedasticidade
Portanto, um teste no-construtivo, pois quando rejeitamos H0:
no sabemos o que fazer depois.

Notas aula de Econometria I, profa. Marina S. Cunha

24

9.5.2 Teste LM de Breusch-Pagan/Godfrey


Considere a hiptese
H0: i2 = 2(0 + zi)
vetor das variveis independentes
Se = 0, ento o modelo homocedstico. O teste dado por,

LM =

1
2

S Q Regresso da regresso de ei2 (ee n ) sobre z i

Para fins computacionais, seja Z = (1, zi) uma matriz n x P e g um vetor de


observaes g i = ei2 (ee n ) 1. Ento,
1
LM = g'Z(Z'Z)-1Z'g ~ p 1
2
Lembrando que SQReg = bXy = yX(XX)1Xy. Em que,
H0: modelo homocedstico.

Mas este teste sensvel suposio de normalidade dos i. Com isto,


podemos utilizar uma estimativa mais robusta para a varincia de i
1
V =
n

i =1

2 e' e
e i n

Seja, u = {e12, e22, ..., en2} e i = {1, 1, ..., 1} um vetor de uns. Ento,
u = ee n . Assim,
1
LM= (u ui)'Z(Z' Z)-1Z' (u ui)
V

Sob normalidade este teste tem a mesma distribuio que o teste


Breusch-Pagan, sem normalidade, h evidncias de que mais poderoso.
Waldman (1983) mostrou que se zi igual do teste de White, so testes
algebricamente iguais.

Notas aula de Econometria I, profa. Marina S. Cunha

25

9.6 Mnimos Quadrados Ponderados


O estimador de Mnimos Quadrados Generalizados (GLS) :

= ( X' 1X) 1 ( X' 1y )

(9-29)

Considere um caso mais geral, var [i|X] = i2 = 2i. Ento, 1 uma


matriz diagonal, cujo i-simo elemento da diagonal 1 i . Com isto,
podemos obter o estimador de MQG
Regredindo

y1 1
x'1 1

y
x
'
2
2
2
2
sobre PX =

Py =

M
M

x
'

n
n
n
n
Aplicando mnimos quadrados no modelo transformado, obteremos o
estimador de mnimos quadrados ponderados (WLS):
1

n
n

'
= wi xi xi wi xi yi
i =1
i =1

em que, wi = 1 i
freqentemente utiliza-se wi = 1 i

 A lgica computacional que observaes com menor varincia recebam


pesos maiores, com isto passam a ter uma influncia maior na estimativa

Notas aula de Econometria I, profa. Marina S. Cunha

26

9.6.1 Mnimos quadrados ponderados quando conhecido


Uma especificao comum considerar que a varincia proporcional a
uma varivel independente ou seu quadrado. Em estudos dos gastos da
famlia, utiliza-se a renda e sobre o lucro da firma, o tamanho da mesma.
Se

i2 = 2 xik2
ento, o modelo de regresso transformado para MQG

x
x

y
= k + 1 1 + 2 2 + L +
xk
xk
xk
xk

(9-30)

Se a varincia proporcional a xk e no a xk , ento utilizamos 1

xk no

lugar de 1 xk

O estimador de mnimos quadrados ponderados

1
= X' V 1X X' V 1y

(9-31)

1
1
Var. Assint [ ] = 2 X' V 1X X' V 1V 1X X' V 1X

Est. Var. Assint [ ] = X' V X

ei2 '
1
2 x i x i X' V X
i =1 vi

)
n

(9-32)

(9-33)

Notas aula de Econometria I, profa. Marina S. Cunha

27

9.6.2 Estimao quando possui parmetros desconhecidos


A forma geral do modelo de regresso heterocedstico possui muitos
parmetros para serem estimados pelo mtodo ordinrio. Tipicamente, o
modelo restrito pela formulao como uma funo de poucos parmetros,
como i2 = 2xi ou i2 = 2[xi]2. Escrevendo isto como (). O novo
problema

encontrar

um

estimador

consistente

dos

parmetros

desconhecidos em (). Dois mtodos so usualmente utilizados, GLS em


duas etapas, que veremos a seguir e o Mtodo da Mxima Verossimilhana,
que ser visto no Captulo 16.
Para o modelo heterocedstico, o estimador GLS
1

n 1 ' n 1

= 2 x i x i 2 x i yi
i=1 i
i=1 i

(9-34)

O estimador em duas etapas obtido atravs, primeiro, de uma estimativa


para i2, usualmente alguma funo dos resduos de mnimos quadrados.
Ento, utiliza (8-34) e i2.
Os resduos de mnimos quadrados ei = (yi xib) tm as mesmas
propriedades assintticas que os distrbios verdadeiros i = (yi xi)

Notas aula de Econometria I, profa. Marina S. Cunha

28

Este resultado sugere uma regresso aproximada com zi que pode ou


no coincidir com xi. Ento,
E[i2|Zi] = i2
e
i2 = i2 + i,
em que i a diferena entre i2 e a mdia condicional. Como i no
observvel podemos utilizar ei
yi = ei xib
ei xib = i xi
yi = i xi

ei = i xi(b ) = i + ui

Ento,
ei2 = (i + ui)2 = i2 + ui2 + 2iui
Como b , ui ser negligencivel, aproximadamente, temos
P

ei2 = i2 + ui*
Por exemplo, se i2 = zi, ento o estimador consistente de vai
depender da inclinao de mnimos quadrados, a , no modelo,
ei2 = zi + ui*
Neste modelo, ui* heterocedstico e auto-correlacionado, ento a
consistente, mas no eficiente.

9.7 Aplicaes
Esta seo apresenta duas aplicaes comuns de modelos de regresso
heterocedsticos, o modelo de Harvey de Heterocedasticidade Multiplicativa
e o modelo de Grupos de Heterocedasticidade que estende para a varincia
dos distrbios alguns conceitos que so usualmente associados com a
variao na funo de regresso.

9.8 Sumrio e Concluses

Notas aula de Econometria I, profa. Marina S. Cunha


EXEMPLO 9.1 ; 9.2 e 9.3
Resultados so apenas similares (73 obs e no 72)
Table F8.1: Income and Expenditure Data. 100 Cross Section Observations
Source: Greene (1992)
MDR = Number of derogatory reports
Acc = Credit card application accepted (1=yes),
Age = Age in years+ 12ths of a year,
Income = Income, divided by 10,000 ,
Avgexp = Avg. monthly credit card expenditure,
Ownrent = OwnRent, individual owns (1) or rents (0) home.
Selfempl = Self employed (1=yes, 0=no)

clear
set more off
set matsize 800
set memory 56m
memory
insheet using c:\data\TableF81.txt
compress
describe
summarize
gen income2=income*income
drop if acc==0
regress avgexp age income income2 ownrent
/*exemplo 8.1 grfico dos resduos*/
predict e, residual
scatter e income
/*teste de White*/
imtest, white
/*teste Breusch-Pagan ???*/
estat hettest income income2
regress avgexp age income income2 ownrent, robust

29

Notas aula de Econometria I, profa. Marina S. Cunha

summarize
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------mdr |
100
.36
1.01025
0
7
acc |
100
.73
.446196
0
1
age |
100
32.08
7.828567
20
55
income |
100
3.3693
1.629013
1.5
10
avgexp |
100
189.0231
294.2446
0
1898.03
-------------+-------------------------------------------------------ownrent |
100
.36
.4824182
0
1
selfempl |
100
.05
.2190429
0
1
v8 |
0
v9 |
0
v10 |
0
-------------+-------------------------------------------------------v11 |
0
. gen income2=income*income
. drop if acc==0
(27 observations deleted)
. regress avgexp age income income2 ownrent
Source |
SS
df
MS
-------------+-----------------------------Model | 1816788.88
4
454197.22
Residual | 5433109.09
68 79898.6632
-------------+-----------------------------Total | 7249897.98
72 100693.027

Number of obs
F( 4,
68)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

73
5.68
0.0005
0.2506
0.2065
282.66

-----------------------------------------------------------------------------avgexp |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------age | -3.049219
5.460102
-0.56
0.578
-13.94468
7.846244
income |
235.3788
78.79648
2.99
0.004
78.14282
392.6147
income2 | -15.08389
7.339584
-2.06
0.044
-29.7298
-.4379772
ownrent |
27.90241
82.31317
0.34
0.736
-136.351
192.1558
_cons | -240.7363
193.0766
-1.25
0.217
-626.0147
144.5422
-----------------------------------------------------------------------------. /*exemplo 8.1 grfico dos resduos*/
. predict e, residual
. scatter e income
.
. /*teste de White*/
. imtest, white
White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity
chi2(12)
Prob > chi2

=
=

14.57
0.2660

Cameron & Trivedi's decomposition of IM-test


--------------------------------------------------Source |
chi2
df
p
---------------------+----------------------------Heteroskedasticity |
14.57
12
0.2660
Skewness |
7.90
4
0.0953
Kurtosis |
1.67
1
0.1966
---------------------+----------------------------Total |
24.13
17
0.1159
--------------------------------------------------.
. /*teste Breusch-Pagan ???*/

30

Notas aula de Econometria I, profa. Marina S. Cunha


.
. estat hettest income income2
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: income income2
chi2(2)
Prob > chi2

=
=

43.11
0.0000

. regress avgexp age income income2 ownrent, robust


Linear regression

Number of obs =
F( 4,
68) =
Prob > F
=
R-squared
=
Root MSE
=

73
12.52
0.0000
0.2506
282.66

-----------------------------------------------------------------------------|
Robust
avgexp |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------age | -3.049219
3.377757
-0.90
0.370
-9.789428
3.690989
income |
235.3788
90.06745
2.61
0.011
55.65196
415.1055
income2 | -15.08389
7.028738
-2.15
0.035
-29.10952
-1.058262
ownrent |
27.90241
95.50956
0.29
0.771
-162.684
218.4888
_cons | -240.7363
212.6349
-1.13
0.262
-665.0426
183.5701
-----------------------------------------------------------------------------.

-500

Residuals
500

1000

1500

Figura 9.1

6
Income

10

31

Notas aula de Econometria I, profa. Marina S. Cunha

32

CAPTULO 20

Correlao serial
20.1 Introduo
20.2 A anlise de dados de sries de tempo
20.3 Processos dos distrbios
20.4 Alguns resultados assintticos para a anlise de dados de sries de
tempo
20.5 Estimao por Mnimos Quadrados
20.6 Estimao GMM
20.7 Teste para Autocorrelao
20.8 Estimao eficiente quando conhecido
20.9 Estimao quando desconhecida
20.10 Heterocedasticidade Auto regressiva Condicional
20.11 Sumrio e concluses

Notas aula de Econometria I, profa. Marina S. Cunha

33

20.1 Introduo
Dados de sries de tempo freqentemente apresentam autocorrelao,
ou correlao serial nos distrbios ao longo do tempo. Considere, por
exemplo, o grfico dos resduos de mnimos quadrados no seguinte exemplo:
Exemplo 20.1 Equao de demanda por moeda

Figura 20.1  grfico sugere que o sinal do resduo no


perodo t igual ao do perodo t 1
Autocorrelao positiva

Notas aula de Econometria I, profa. Marina S. Cunha

34

 causa  omisso de uma varivel relevante


Exemplo 20.2 Autocorrelao causada por m especificao do modelo

Figura 20.2  Autocorrelao reduz com a especificao


correta do modelo

Notas aula de Econometria I, profa. Marina S. Cunha

35

Exemplo 20.3 Autocorrelao negativa na Curva de Phillips

- Mnimos quadrados
Ineficiente
 Problemas da Autocorrelao
- A inferncia fica
Comprometida

Similares
ao da
Heterocedasticidade

Heterocedasticidade  suposio  varincia


constante
 Diferena qualitativa
Autocorrelao  suposio  o modelo est
corretamente
especificado

Notas aula de Econometria I, profa. Marina S. Cunha

36

20.2 Anlise de dados de sries temporais


Um modelo de sries temporais ser usualmente descrito por:
yt = varivel dependente
xt = variveis explicativas [contemporneas ou defasadas]
t = erros
yt1 = varivel explicativa [varivel dependente defasada]
Por exemplo,
yt = 1 + 2xt + 3yt1 + t
 A seqncia de observaes uma srie de tempo que caracterizada
pela sua ordem no tempo e sua correlao sistemtica entre as
observaes na seqncia
 A caracterstica de um processo de sries de tempo que
empiricamente, o mecanismo gerador dos dados produz, exatamente,
uma realizao de uma seqncia
 Suposies familiares

E[t] = 0
Var [t] = 2
Cov [t, s] = 0 para t s

A distribuio dos t
covarincia estacionria
ou fracamente estacionria

Notas aula de Econometria I, profa. Marina S. Cunha

 Se 2 = 0

E[ yt ] = 1 + 3 E[ yt 1 ] + E[ t ] =

37

1
1 3

var[ yt ] = 32 var[ yt 1 ] + var[ t ]

0 =

32 0

2
0 =
1 32
Assim, estacionariedade
implica que | 3| < 1

 Alternativamente, podemos representar yt em termos de seus valores


defasados, primeiro substituindo por yt2, depois por yt3 ...
yt = 1 + 3 (1+ 3yt2 + t1)

(20-1)

Continuando o processo,

yt =

3i ( 1 + t i )

i =0

Quanto maior a defasagem menor a importncia, pois | 3| < 1


Podemos supor, tambm, que as condies iniciais [mdia e
varincia] no mudam
A correlao dos componentes do vetor [y1, ..., yT] chamada
autocorrelao.

Notas aula de Econometria I, profa. Marina S. Cunha

38

20.3 Processo dos Distrbios


20.3.1 Caractersticas do processo dos distrbios
Usualmente, admitimos em sries de tempo que os distrbios so
homocedsticos, mas as observaes so correlacionadas, ento:
E[|X] = 2
em que, 2 uma matriz completa e definida positiva, com 2 = Var[t|X]
na diagonal.
ts uma funo da distncia |t s| e no de t ou s, que uma suposio de
estacionariedade. Portanto, a covarincia uma funo da distncia |t s|.
Define-se, AUTOCOVARINCIA como
Cov[t, ts|X] = Cov[t+s, t|X] = 2t, ts = s = s
note que 2t, t = 0.
E que a correlao entre t e ts sua AUTOCORRELAO como

Corr[ t , t -s | X] =

cov[ t , t-s | X]

= s = s = s
Var[ t | X]Var[ t-s | X] 0

Podemos ento, escrever,


E[|X] = = 0R = 2
Matriz de autocorrelao
Matriz de autocovarincia
o t-simo elemento um coeficiente de autocorrelao

ts =
Diferentes processos
dos distrbios geram
diferenas nas
autocovarincias
e autocorrelaes

|t s |
0

AR(1) Processo Auto-regressivo de ordem 1


t = t1 + ut
AR() Processo Auto-regressivo de ordem
t = 1t1 + 2t2 + ... + ptp + ut
MA(1) Processo de Mdia Mvel de ordem 1
t = ut + ut1

Notas aula de Econometria I, profa. Marina S. Cunha

39

20.3.2 Distrbios AR (1)


O processo de sries de tempo caracterizado por
(1) ordem
(2) o valor dos parmetros
(3) comportamento das autocorrelaes
Distrbio auto-regressivo de primeira ordem, ou modelo AR(1),
representado na forma auto-regressiva como:
t = t1 + ut
(20-2)
em que
E[ut|X] = 0
ordens superiores so um refinamento
2
E[ut |X] = 2
e
cov[ut, us|X] = 0
se t s
Substituindo sucessivamente o termo defasado em (20-2), tem-se

t = ut + ut1 + 2ut2 + ...

(20-3)  forma de mdia


mvel infinita

Tem-se
Supondo

Var[t] = 2u + 22u + 42u + ...


|| < 1

(20-4)
(20-5)

que uma suposio de estacionariedade, que implica lim s = 0 e E[t] = 0


s

Reescrevendo (20-4)

u2
Var[ t ] =
= 2
2
1

(20-6)

Com a suposio de estacionariedade, h uma maneira fcil de obter a


varincia
Note que Cov[ut, t] = 0
Var[t] = 2Var[t1] + 2
e com estacionariedade
Var[t] 2Var[t1] = 2
Var[t] = Var[t1], o que
leva a (20-6)

Notas aula de Econometria I, profa. Marina S. Cunha

40

Procedendo da mesma forma,

Cov[ t , t 1 ] = E[ t t 1 ] = E[ t 1 ( t 1 + u t )]
= E[ t 1 t 1 ] + E[ t 1u t ] = Var[ t 1 ]

u2
=
1 2

(20-7)

Com sucessivas substituies em (20-2)

t = s t s +

s 1

i =0

i ut i

Por exemplo, t = 3t3 + ut + ut1 + 2ut2. Como t no est correlacionado


com ut subseqente (t > s), segue que

u2
Cov[ t , t s ] = E[ t t s ] =
1 2
s

(20-8)  (20-7) com s = 1

Dividindo por 0 = u (1 ) , a autocorrelao


2

Corr[ t , t s ] = s = s

(20-9)

Portanto,
1

2
u 2
2 =

1 2
M
T 1

Pode-se mostrar que

3 L T 1

2 L T 2
L T 3

T 2

T 3

M
1

(20-10)

Notas aula de Econometria I, profa. Marina S. Cunha

1
1 + 2

1+ 2
1 0
=
...
...
...
0
0
0

0
0
0

...

...
...

0
0

...
...
... 1 + 2
...

41

0
0

...

20.4 Alguns resultados assintticos para a anlise de sries de


tempo

ERGODICIDADE
A definio estabelece essencialmente que se eventos so separados
por um tempo suficiente, ento eles so assintticamente
independentes. Uma implicao que em sries de tempo, cada
observao ir conter pelo menos alguma informao que nica.
Ergodicidade um elemento importante na teoria da estimao. Esta
propriedade e a de estacionariedade sero requisitadas vrias vezes.

20.5 Estimao por Mnimos Quadrados


O estimador de Mnimos Quadrados :
1

X' X X'
b = ( X ' X ) X' y = +

T T
1

GLS  eficiente

Quanto maior a autocorrelao maior ser

OLS  no eficiente

o benefcio de se utilizar MQGeneralizados

Notas aula de Econometria I, profa. Marina S. Cunha

42

20.5.1 Propriedades assintticas de Mnimos Quadrados

Pnlim

Se Xt estacionrio e ergtico,

X'X

= Q aplica-se os teoremas 20.1 e 20.2.


T

Podemos aplicar o Teorema de


Slutsky para obter a inversa
b consistente

P lim
n

X'

=0
T

Se t no est correlacionado
serialmente, wt = xtt
uma seqncia de
martingale diferena (definio 20.4, p. 638)

ou se [Xt, t] so conjuntamente estacionrios


e ergticos, pelos teoremas 20.1 e 20.2 para as
matrizes com os momentos
 NORMALIDADE ASSINTTICA  ver referncias

b consistente

Notas aula de Econometria I, profa. Marina S. Cunha

43

 Uma exceo importante


varivel dependente defasada como regressor, ento o
EMQ no ser nem no-viesado ou consistente.
Um caso simples
yt = yt1 + t
t = t1 + ut
(20-12)
assumindo || < 1, || < 1. Neste modelo o regressor e os erros so
correlacionados. Subtraindo yt1 em (20-12)
yt yt1 = yt1 yt1 + t
yt = ( + )yt1 [yt2 + t1] + t
= ( + )yt1 yt2 + ut
(20-13)
que uma regresso com regressores estocsticos. ut uma inovao no
perodo t, no-correlacionado com ambos regressores. Nesta regresso
1 = +
yt = (yt1, yt2)
 estimamos

2 =
Seja
e

k = cov[yt, ytk] = cov[yt, yt + k]


Var[yt] = Var[ytk]
por estacionariedade
Cov[yt, yt1] = Cov[yt1,yt2]

De (20-13), multiplicando por yt, yt1 e yt2 alm de obter a covarincia,


0 = 11 22 + 2
1 = 10 21
(20-14)
2 = 11 20
que so as equaes de Yule-Walker, ver seo 21.2.3. Resolvendo (20-14)
para 0, 1 e 2 em termos de 1, 2 e 2 obtm-se

p lim b =

+
1 +

Este resultado varia entre [quando = 0] e 1 [quando e = 1]. Se 0,


mnimos quadrados inconsistente, o resultado persiste quando inclumos os
regressores xt.
Em geral, autocorrelao
+
Varivel dependente defasada
Como regressor

OLS
e
GLS

so inconsistentes

Notas aula de Econometria I, profa. Marina S. Cunha

44

20.5.2 Estimando a varincia do estimador de Mnimos


Quadrados
 O usual s2(XX)1

2(XX)1(X
X)1(XX)1

um estimador
incorreto de

pois s2 um estimador incorreto de e a matriz incorreta.


 Como proceder?
Se a forma da autocorrelao conhecida [
]  utilizamos GLS
Se a forma da autocorrelao no conhecida  utilizamos F GLS
Um estimador tipo
White
para
heterocedasticidade
A contrapartida natural de

*=1
Q
n

'
ijx i x j

i =1 j =1

da seo 8.2.3, ser

*= 1
Q
T

e e x x
t s t

t =1 s =1

'
s

(20-16)

Notas aula de Econometria I, profa. Marina S. Cunha

45

Mas este estimador possui problemas. No entanto, Newey & West


(1987a) sugerem um estimador robusto e consistente

* = S0 + 1
Q
T

wl = 1

wl et et l (x t x t' l +x t l x t' )

(20-17)

l =1 t =l +1

l
( L + 1)

ver (8-26). Este estimador fcil de ser implementado.


Exemplo 20.4 Autocorrelao com estimao consistente da covarincia

20.6 Estimao GMM


O estimador GMM para o modelo de regresso com autocorrelao
nas perturbaes o estimador de Mnimos Quadrados.

Notas aula de Econometria I, profa. Marina S. Cunha

46

20.7 Teste para Autocorrelao


Utiliza-se a autocorrelao nos resduos de Mnimos Quadrados para
realizar os testes de autocorrelao.
et = ret1 + ut
et = yt xtb
T
T 2
r = et et 1 et
t =2
t =1

20.7.1 Teste do multiplicador de Lagrange

H0: no h autocorrelao

versus

(20-19)

Breush (1978)
Godfrey (1978)

H1: t = AR() ou t = MA()

e' X 0 ( X '0 X 0 ) X '0e


= TR02 ~ (2 )
LM = T

e' e

(20-20)

em que X0 = [Xt, et1, ..., et] matriz X aumentada com colunas et1 ... et,
preencher com zeros os espaos sem valores (iniciais).
 utilizado para mudanas estruturais

Notas aula de Econometria I, profa. Marina S. Cunha

47

20.7.2 Teste Box & Pierce e um Refinamento de LJung


Para testar a hiptese H0: = 0, conforme Box & Pierce (1970),podese utilizar o teste Q,

Q =T
em que, r j =

T
t = j +1

et et j

P
j =1

r j2 ~ 2

(20-21)

) ( e ), correlao entre resduo em t e


T

2
t
t =1

resduo em t j . X no possui valores defasados de y.


Refinamento sugerido por Box & Pierce (1979)

Q ' = T (T + 2)

P
j =1 T

r j2
j

(20-22)

Assintoticamente os dois testes so equivalentes LM (seo 20.7.1) e esse


(seo 20.7.2). Quando a hiptese nula falsa o teste Q menos poderoso.

Notas aula de Econometria I, profa. Marina S. Cunha

48

20.7.3 Teste Durbin-Watson


A estatstica Durbin-Watson

e12 + eT2
Tt= 2 (et et 1 ) 2
d=
= 2(1 r ) T 2 2(1 r )
2
T
t = 2 et
t = 2 eT

(20-23)

Etapas:
1) Fazer a regresso e calcular o valor d, com os resduos estimados
2) Obter o valor de dL e dU, para o nmero de observaes (n) e a
quantidade de parmetros menos 1(k -1).
3) Analisar o resultado, considerando:

H0: ausncia de autocorrelao positiva


H0*: ausncia de autocorrelao negativa

20.7.4 Teste na presena de varivel dependente defasada


A estatstica h de Durbin (1970), dada por

h = r T (1 Tsc2 )

N (0,1)

(20-24)

Varincia do coeficiente yt1 na regresso


Em que r 1 d / 2 , conforme (20-23)
Se sc2> 1/T no pode ser calculado
Alternativamente, et = (Xt, yt, .., ytR, et1 ... etP)
H0: coeficiente dos resduos defasados iguais a zero ~ F(P, T K P)
Similar ao teste LM

20.7.5 Sumrio dos procedimentos de teste

Notas aula de Econometria I, profa. Marina S. Cunha

49

20.8 Estimao eficiente quando conhecida


Se conhecida, o estimador GLS

= ( X' 1X) 1 ( X' 1y )

(20-25)

E o estimador da varincia amostral

em que

Est. var[ ] = 2 [ X' 1X]1


( y X )' 1 (y X )
2
=
T

(20-26)
(20-27)

 Para o caso AR(1), os dados para o modelo de transformao so

1 2 y
1

y2 y1
y * = y3 y 2 ,

y y
T
T 1

1 2 X
1

X 2 X 1
X* = X 3 X 2

X X
T
T 1

(20-28)

 Essas transformaes so chamadas diferenas parciais, quase


diferenas ou pseudo diferena
1

2 2
(1 )
(1 )
 A primeira coluna de X transformada para

(1 )

 A varincia dos resduos transformados


Var[t t1] = Var [ut] = u2
A primeira varincia dos resduos tambm u2 (ver 20-6). Pode ser
2
2
estimado utilizando (1 ) .
 ver o caso AR(2)
As propriedades assintticas do estimador GLS [Consistncia e Normalidade
Assinttica] so obtidas assumindo que {Xt, t} so conjuntamente um processo
ergtico e estacionrio.

Notas aula de Econometria I, profa. Marina S. Cunha

20.9 Estimao quando desconhecida


20.9.1 Perturbaes AR(1)
 Estimador Prais & Winsten (1954)
 Estimador Cochrane & Orcutt (1949)
 Estimador Mxima Verossimilhana

20.9.2 Aplicao: Estimando um modelo com autocorrelao


Exemplo 6.7 Mercado de gasolina dos U.S.
Tabela F 2.2 e Figura 20.2

20.9.3 Estimao com varivel dependente defasada


Ver Hatanaka (1974, 1976)

20.10 Heterocedasticidade Auto-regressiva Condicional


20.11 Sumrio e Concluses

50

Notas aula de Econometria I, profa. Marina S. Cunha


clear
set more off
set matsize 800
set memory 56m
memory
insheet using c:\data\greeneTF22.txt
compress
describe
summarize
/*EXEMPLO 4.4 da pgina 55*/
gen
gen
gen
gen
gen
gen

lnGpop=ln(gasexp/(pop*gasp))
lnIncomepop=ln(income)
lnPG=ln(gasp)
lnPNC=ln(pnc)
lnPUC=ln(puc)
tend=year-1952

gen newt = y(1951) + t -1


format newt %ty
tsset newt
regress lnGpop lnIncomepop lnPG lnPNC lnPUC tend
predict e, residual
line e year
regress lnGpop lnIncomepop lnPG lnPNC lnPUC tend
dwstat
regress lnGpop lnIncomepop lnPG lnPNC lnPUC tend
bgodfrey
prais lnGpop lnIncomepop lnPG lnPNC lnPUC tend
prais lnGpop lnIncomepop lnPG lnPNC lnPUC tend, corc

51

Notas aula de Econometria I, profa. Marina S. Cunha

-.15

-.1

Residuals
-.05
0

.05

.1

FIGURA 19.4 RESDUOS DE MQO

1950

1960

1970

1980
Year

1990

2000

regress lnGpop lnIncomepop lnPG lnPNC lnPUC tend


Source |
SS
df
MS
-------------+-----------------------------Model | 2.80658066
5 .561316133
Residual | .101996656
46 .002217319
-------------+-----------------------------Total | 2.90857732
51 .057030928

Number of obs
F( 5,
46)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

52
253.15
0.0000
0.9649
0.9611
.04709

-----------------------------------------------------------------------------lnGpop |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lnIncomepop |
1.624962
.1951747
8.33
0.000
1.232096
2.017828
lnPG | -.0539223
.0421606
-1.28
0.207
-.1387871
.0309426
lnPNC | -.0834322
.1765335
-0.47
0.639
-.4387756
.2719112
lnPUC | -.0846749
.1024172
-0.83
0.413
-.29083
.1214801
tend | -.0139261
.0047732
-2.92
0.005
-.0235341
-.0043181
_cons | -26.67868
2.000292
-13.34
0.000
-30.70506
-22.6523
-----------------------------------------------------------------------------. predict e, residual
. line e year
. regress lnGpop lnIncomepop lnPG lnPNC lnPUC tend
Source |
SS
df
MS
-------------+-----------------------------Model | 2.80658066
5 .561316133
Residual | .101996656
46 .002217319
-------------+-----------------------------Total | 2.90857732
51 .057030928

Number of obs
F( 5,
46)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

52
253.15
0.0000
0.9649
0.9611
.04709

-----------------------------------------------------------------------------lnGpop |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lnIncomepop |
1.624962
.1951747
8.33
0.000
1.232096
2.017828
lnPG | -.0539223
.0421606
-1.28
0.207
-.1387871
.0309426
lnPNC | -.0834322
.1765335
-0.47
0.639
-.4387756
.2719112
lnPUC | -.0846749
.1024172
-0.83
0.413
-.29083
.1214801
tend | -.0139261
.0047732
-2.92
0.005
-.0235341
-.0043181
_cons | -26.67868
2.000292
-13.34
0.000
-30.70506
-22.6523
------------------------------------------------------------------------. dwstat
Durbin-Watson d-statistic(

bgodfrey

6,

52) =

.4250046

52

Notas aula de Econometria I, profa. Marina S. Cunha


Breusch-Godfrey LM test for autocorrelation
--------------------------------------------------------------------------lags(p) |
chi2
df
Prob > chi2
-------------+------------------------------------------------------------1
|
27.145
1
0.0000
--------------------------------------------------------------------------H0: no serial correlation
. prais lnGpop lnIncomepop lnPG lnPNC lnPUC tend
Iteration 0: rho = 0.0000
Iteration 1: rho = 0.7368

Iteration 12: rho = 0.9904


Prais-Winsten AR(1) regression -- iterated estimates
Source |
SS
df
MS
-------------+-----------------------------Model | 2.72870129
5 .545740257
Residual | .015099411
46 .000328248
-------------+-----------------------------Total |
2.7438007
51 .053800014

Number of obs
F( 5,
46)
Prob > F
R-squared
Adj R-squared
Root MSE

=
52
= 1662.58
= 0.0000
= 0.9945
= 0.9939
= .01812

-----------------------------------------------------------------------------lnGpop |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lnIncomepop |
.4656222
.1339286
3.48
0.001
.1960379
.7352064
lnPG | -.1387365
.0277144
-5.01
0.000
-.1945226
-.0829504
lnPNC | -.0967941
.1262128
-0.77
0.447
-.3508472
.157259
lnPUC | -.0013022
.051537
-0.03
0.980
-.1050408
.1024365
tend |
.0128809
.0045114
2.86
0.006
.0038
.0219619
_cons |
-16.2451
1.384229
-11.74
0.000
-19.03141
-13.45879
-------------+---------------------------------------------------------------rho |
.990442
-----------------------------------------------------------------------------Durbin-Watson statistic (original)
0.425005
Durbin-Watson statistic (transformed) 1.241458
.
. prais lnGpop lnIncomepop lnPG lnPNC lnPUC tend, corc
Iteration
Iteration

Iteration
Iteration

0:
1:

rho = 0.0000
rho = 0.7368

99: rho = 0.9567


100: rho = 0.9567

Cochrane-Orcutt AR(1) regression -- iterated estimates


Source |
SS
df
MS
-------------+-----------------------------Model | .016516714
5 .003303343
Residual |
.01084307
45 .000240957
-------------+-----------------------------Total | .027359785
50 .000547196

Number of obs
F( 5,
45)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

51
13.71
0.0000
0.6037
0.5597
.01552

-----------------------------------------------------------------------------lnGpop |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lnIncomepop |
.4624061
.1161981
3.98
0.000
.2283711
.6964412
lnPG | -.1325896
.0240923
-5.50
0.000
-.181114
-.0840651
lnPNC | -.0723031
.1086961
-0.67
0.509
-.2912282
.1466221
lnPUC |
.0096739
.0449029
0.22
0.830
-.0807652
.1001131
tend |
-.002429
.0049668
-0.49
0.627
-.0124327
.0075747
_cons | -15.55618
1.204619
-12.91
0.000
-17.98241
-13.12995
-------------+---------------------------------------------------------------rho |
.9566927
-----------------------------------------------------------------------------Durbin-Watson statistic (original)
0.425005
Durbin-Watson statistic (transformed) 1.631143
Convergence not achieved
r(430);

53

Notas aula de Econometria I, profa. Marina S. Cunha

CAPTULO 11

Modelo para Dados em Painel


11.1 Introduo
11.2 Modelos para Dados em Painel
11.3 Modelos de regresso Pooled
11.4 Modelo de Efeito Fixo
11.5 Efeitos Aleatrios
11.6 Distrbios no-esfricos e estimao robusta da covarincia
11.7 Autocorrelao espacial
11.8 Endogeneidade
11.9 Regresso no linear com Dados em Painel
11.10 Sistemas de Equaes
9.11 Parmetros heterogneo
9.12 Sumrio e concluses

54

Notas aula de Econometria I, profa. Marina S. Cunha

55

9.1 INTRODUO
Conjunto de dados que combinam sries de tempo e corte temporal
Exemplo: Dados da OCDE
Dados Longitudinais (Microdados indivduos ou famlias)

9.2 MODELOS PARA DADOS EM PAINEL


ou longitudinais

Estudos recentes:
1) National Longitudinal Survey of Labor Market Experience
2) Michigan Panel Study of Income Dynamics
6.000 famlias e 15.000 indivduos (desde 1968)
3)

British Household Panel Survey


5.000 famlias (desde 1991)

4) Dados na rea de sade


a) German Socioeconomic Panel
b) Medical Expenditure Panel Survey
5) The Current Population Survey
50.000 domiclios
Existem alguns temas que no deveriam ser estudados com dados de sries
temporais ou corte no tempo, como exemplo:
a) Ben-Porath (1973) oferta de trabalho das mulheres por cohort
b) Mudana de escala e tecnologia na funo de produo

Notas aula de Econometria I, profa. Marina S. Cunha

56

11.2.1 Estrutura Geral de modelos para anlise de dados em


Painel
 Vantagem fundamental de conjuntos de dados em painel sobre corte
temporal que permitem ao pesquisador grande flexibilidade,
modelando diferenas no comportamento entre indivduos
O arcabouo bsico para esta discusso o modelo de regresso na forma
yit = xit + zi + it
= xit + ci + it
(11-1)
Existem k regressores em xit (sem a constante)
zi Efeito individual (heterogeneidade)
[contm a constante e os conjuntos de variveis para os indivduos ou
grupos]

Se zi observvel no h problemas e podemos estimar (11-1) por MQO


Caso contrrio, dependendo das suposies sobre os efeitos no-observveis,
os efeitos parciais sero consistentes e eficientes [ = E[y it | x it ] / x it ]
Inicialmente, supomos exogeneidade estrita para as variveis independentes
E[it|xi1, xi2, ...] = 0
Os resduos so no-correlacionados com as
variveis includas (passado, presente e futuro)

Uma suposio conveniente mdia independente


E[ci|xi1, xi2, ...] =
uma suposio forte [utilizada em modelo com efeitos aleatrios]. Uma
alternativa,
E[ci|xi1, xi2, ...] = h(xi1, xi2, ...)
= h(Xi)
uma formulao mais geral e mais complicada e necessita de suposies
adicionais sobre a natureza da funo.

Notas aula de Econometria I, profa. Marina S. Cunha

57

11.2.2 Estruturas de Modelos (Tipos)


1. Regresso Pooled [empilhada]: zi contm apenas um termo constante
MQO consistente e eficiente
2. Efeito Fixo: zi no-observvel, mas correlacionado com Xit
obtido por MQO viesado e inconsistente devido ao
problema da varivel omitida
O modelo :
yit = Xit +i + it
zi efeitos observveis
Termo grupo-especfico constante
O termo fixo utilizado como a correlao entre ci e xit, ci no-estocstico.
3. Efeito aleatrio: Se a heterogeneidade individual no-observada no est
correlacionada com as variveis includas, ento o modelo pode ser
yit = xit + E[zi]+{ zi E[zi]} + it
= xit + + ui + it
A distino entre os efeitos fixos e aleatrios consiste no fato de que os
efeitos individuais no-observveis so ou no correlacionados com xit.
4. Parmetros aleatrios:
yit = xit( + hi) + ( + ui) + it
vetor aleatrio com a variao nos
parmetros para cada indivduo
Extenso (modelo hierrquico)  sero examinados posteriormente
yit = xit( + zi + hi) + ( + ui) + it
Conjunto observvel de parmetros
Matriz de parmetros estimados

Notas aula de Econometria I, profa. Marina S. Cunha

11.2.3 Extenses
Ver Captulo 17 Modelos de escolha binria
19 Modelos com dados censurados
18 Modelos com dados contveis

11.2.4 Painel balanceado e no-balanceado


n indivduos (i = 1, ..., n), com observaes

Painel

para cada perodo de tempo, [j = 1, ..., t]

Balanceado

nxt=T
Nem todos os indivduos so observados

Painel no

Em cada perodos de tempo T

Balanceado

Painel fixo  mesmos indivduos so observados durante o estudo.

11.2.5 Painel Bem comportado


11.3 O MODELO DE REGRESSO POOLED
Comeamos assumindo a verso simplista do modelo
yit = i + xit + it

i = 1, ..., n,

j = 1, ..., Ti

E[i|xi1, xi2, ..., xi Ti] = 0

(11-2)

Var[it|xi1, xi2, ..., xi Ti] = 2


Cov[it, js|xi1, xi2, ..., xi Ti] = 0
chamado de modelo da mdia populacional

se i j ou t s

58

Notas aula de Econometria I, profa. Marina S. Cunha

59

11.3.1 Estimao de Mnimos Quadrados do modelo Pooled


As suposies acima so improvveis
Quando a heterogeneidade difere entre os indivduos
Melhor seria o modelo com efeitos fixos
Quando h heterogeneidade e esta ignorada os
estimadores de MQO so inconsistentes
Quando o melhor seria o modelo de efeitos aleatrios, sua omisso leva
ao problema da autocorrelao.
yit = ci + xit + it
em que E[ci|Xi] = , assim
yit = + xit + it + (ci E[ci|Xi])
= + xit + it + ui
= + xit + it + wit
E[wit + wis] = 2 quando t s
autocorrelao

11.3.2 Estimao Robusta da matriz de covarincia


Para o i-simo indivduo, tem-se
yi = Xi + wi
inclui o termo constante

var[wi|Xi] = 2ITi + i =
o componente omitido

Considerando o estimador de MQO:

n ' n '
b = (XX) Xy = X i X i X i y i
i =1
i =1
1

podemos obter uma estimativa da Matriz de Covarincia, seguinte o


estimador de White,

1 1 n
Est. Ass. Var [b]= Xi X i
n n i =1

1 n
1 n

w
w

X
X

X
i i i i i i (11-3)
n i =1
n i =1

Exemplo 11.2 Estimativa da matriz de var por MQO


o melhor
por (11.3)
Pelo estimador de White (8-27)

2 coluna da Tabela 11.1


3 coluna da Tabela 11.1
4 coluna da Tabela 11.1

Notas aula de Econometria I, profa. Marina S. Cunha

60

11.3.3 Agrupamento e estratificao


Em especial, para reduzir custo
Utilizar o mesmo estimador dado em 11.3.2
G
A matriz de var[b] modifica-se um pouco x
G 1
G

E. A.Var [b]= X g X g
g =1

G G
G

X g w g w g X g X g X g
G

1
g =1

g =1

(11-4)

G
o nmero de grupos
ng componentes em cada grupo
g = 1, ..., G observaes

11.3.4 Estimao Robusta utilizando a mdia de grupos


1
Multiplique cada grupo por i '  vetor coluna de uns.
T
yi = Xi + wi
(1/T)iyi = (1/T)iXi + (1/T)iwi

ou

yi = xi + wi

mdia condicional zero


varincia heterocedstica
i2 = (1/T2) ii
pode ser utilizado
estimador White
utilizar a mdia dos grupos no resolve o problema da heterocedasticidade
 Alternativa  especificao de Mundlak (1978)
Pode conter erro de medida
Ver exemplo 11.3

Notas aula de Econometria I, profa. Marina S. Cunha

61

11.3.5 Estimao com as primeiras diferenas


Outra abordagem para a estimao
 Busca-se transformar a heterogeneidade
Caso base
yit = ci + xit + it
A equao nas primeiras diferenas
yit = ci + (xit) + it
ou
yit = (xit) + it i,t 1
= (xit) + it
Vantagem  remove a heterogeneidade latente ci
Desvantagem  remove variveis que no mudam no tempo

Educao
Sexo
Raa

Se essas variveis no so relevantes, as estimaes so consistentes,


no entanto, os efeitos de educao sobre salrio so importantes
Os erros possuem autocorrelao de 1 ordem  pode-se utilizar alguns
procedimentos
para
contornar o problema
OBSERVAO GERAL
mais indicado em apenas um caso especfico: quando o Painel
possui apenas 2 perodos.

Notas aula de Econometria I, profa. Marina S. Cunha

62

11.3.6 Estimao dentro e entre grupos

Formulaes para regresso Pooled

1) Formulao original
yit = + xit + it

(11-5a)

2) Considerando a mdia dos grupos


yi* = + x i* + i

(11-5b)

3) Desvios da media dos grupos

yit yi* = (x it x i* ) + it i

(11-5c)

 Assumimos que no h variveis tempo-invariantes como Educao


no Exemplo 11.1, pois seriam zero em (11.5c)

 11.5c com n observaes


 Estimveis por MQO

Notas aula de Econometria I, profa. Marina S. Cunha

 Soma dos quadrados e o produto cruzado

STotal
xx = i =1t =1(xit x)(xit x)'
n

STotal
= i =1 t =1 (xit x)( yit y )
xy
n

S Dentro
= in=1 Tt=1 (x it x i )(x it x i )'
xx
S Dentro
= in=1 Tt=1 (x it x i )( yit yi )
xy

S Entre
= in=1T ( x i x)(x i x)'
xx
S Entre
= in=1T ( x i x)( yi y )
xy
fcil verificar que

STotal
= S Dentro
+ S Entre
xx
xx
xx
STotal
= S Dentro
+ S Dentro
xy
xy
xy

x e y so mdias totais

(11-6)

63

Notas aula de Econometria I, profa. Marina S. Cunha

64

Com isto, existem 3 maneiras para obter os estimadores de


correspondente decomposio.
1) O estimador de MQO

1 Total
bTotal = STotal
S xy
xx

= S Dentro
+ S Entre
xx
xx
2) Estimador dentro dos grupos

(11-7)

]1[S Dentro
+ S Entre
xy
xy ]

(11-8)

]1

(11-9)

1 Dentro
b Dentro = S Dentro
S xy
xx

3) Estimador entre grupos

b Entre = S Entre
S Entre
xx
xy
que o estimador da mdia dos grupos
Considerando,
de (11-7)

S Dentro
= S Dentro
b Dentro
xy
xx
Entre
S Entre
= S Entre
xy
xx b

de (11-8)
Substituindo em (11-6)

]1

Entre
bTotal = S Dentro
+ S Entre
S Dentro
b Dentro + S Entre
xx
xx
xx
xx b
= F Dentrob Dentro + F Entreb Entre

em que,

Entre 1 Dentro
F Dentro = S Dentro
+
S
S xx
= I F Entre
xx
xx

Este estimador similar ao Baysiano [Captulo 16]

Exemplo 11.4 Decomposio da varincia dentro e entre grupos

(11-10)

Notas aula de Econometria I, profa. Marina S. Cunha

65

11.4 MODELO DE EFEITO FIXO


Suposio que os efeitos omitidos, ci, no modelo
yit = xit + ci + it
so correlacionados com as variveis includas. Em geral,
E[ci|Xi] = h(Xi)

(11-11)

Como a mdia condicional, h(Xi), a mesma em cada perodo


yit = xit + h(Xi) + it + [ci h(Xi)]
yit = xit + i

soma e subtrai h(Xi)

+ it + [ci h(Xi)]

por construo o termo entre parnteses no-correlacionado com Xi, que


pode ser absorvido nos resduos
yit = Xit + i + ij

(11-12)

Supomos ainda que, var[ci|Xi] constante. Com isto, o modelo pode


ser estimado por MQO.

(11-10)  o modelo de efeito fixo no significa que as variveis so fixas


ao invs de aleatrias.
 o modelo de efeito fixo implica que as diferenas entre os grupos
podem ser capturados por diferenas nos termos constantes.
Considere o exemplo 11.1 e 11.3
Modelo de Efeito Fixo
Ln Wageit = xit + [10Edi + 11Femi + 12Blki + ci] + it

Notas aula de Econometria I, profa. Marina S. Cunha

66

11.4.1 Estimao por Mnimos Quadrados


Seja
yi
Xi
i
i

= Vetor com T observaes para a i-sima unidade


= Matriz com T observaes para a i-sima unidade
= Vetor com T observaes para a (T 1) de uns.
= Vetor com T observaes para a (T 1)

Assim,

yi = Xi + ii + i
Colecionando esses termos, temos
y1 X1
i 0 L 0 1 1
y X
0 i L 0
2
2
= +
. 2 + 2
M M
M M O M M M


0 0 L i n n
y n X n

ou


y = [X d1 d 2 L d n ]. +

(11-13)

di = varivel binria indicando a i-sima unidade


D = [d1 d 2 L d n ] = matriz nT x n

Assim,
y = X + D +
Least Square Dummy Variable (LSDV) model
Modelo de mnimos quadrados com variveis binrias
Para n  pequeno  pode ser estimado por mnimos quadrados
 grande  utilizar regresso particionada [ver (11-14) (11-19)],
pois a capacidade do computador pode no suportar
a dimenso das matrizes.

Notas aula de Econometria I, profa. Marina S. Cunha

11.4.2

67

T Assintoticamente pequeno
Tamanho do grupo

N Aumenta a quantidade de grupos


T Fixo [tamanho do grupo]

O estimador de mnimos quadrados no-viesado, no entanto,


podemos esperar que a matriz de covarincia seja consistente?
H duas maneiras de obt-la:
2
Asy.Var[b] = [T Sxx, i ]1
n
2
Mas Asy.Var[ aii ] =
+ xi' { Asy. Var[b]}xi 
T
Limite
inferior

 consistente (11-20)

no consistente

(11-21)

Notas aula de Econometria I, profa. Marina S. Cunha

68

11.4.3 Teste de significncia para o efeito grupo


O teste t pode ser utilizado para testar a hiptese de que i igual a
zero. Para testar diferenas entre os grupos podemos utilizar a estatstica F.
2
2
( RLSDV
RPooled
) (n 1)
F( n 1, nT n K ) =
2
(1 RLSDV
) (nT n K )

2
RLSDV

R2 da regresso incluindo as binrias

2
RPooled

 R2 da regresso com apenas a constante

(11-21)

11.4.4 Efeito tempo e grupo


Podemos incluir o efeito tempo:
yit = xit + i + t + it
Incluindo T 1 binrias adicionais

Verso particionada quando o n de variveis grande


[(11-23) (11-26)]

Exemplo 11.4 Equao de salrios com Efeitos Fixos


11.4.5 Variveis tempo-invariante e Decomposio do vetor de EF

(11-22)

Notas aula de Econometria I, profa. Marina S. Cunha

69

11.5 EFEITOS ALEATRIOS


Considere a seguinte formulao
(11-28)
yit = xit + ( + ui) + it
Mdia da heterogeneidade no observvel, E[zi]
K regressores incluindo a constante

ui = heterogeneidade da i-sima observao, que constante no tempo


de 11.2.1
ui = {zit E[zi]}
Assume-se exogeneidade restrita
E[it|X] = E[ui|X] = 0
E[it2|X] = 2
E[ui2|X] = u2
E[ituj|X] = 0
para todo i, t, e j
E[itjs|X] = 0
se t s ou i j
E[uiuj|X] = 0
se i j

(11-29)

 Pode-se ver a formulao para T observaes do grupo i , yi, Xi, uii, e i


it = it + ui
e
i = [i1, i2, ..., iT]
nesta forma chamado de modelo de componente de erro. Para este modelo
E[i2|X] = 2 + u2
E[itis|X] = 2 t s;
E[itis|X] = 0 para todo t e s se i j

2 + 2
2 u

= E[ i i | X] = Mu

u2

u2

u2

2 + u2
M

u2
M

u2

u2

L
u2
= 2IT +u2iTiT

O
M

2
L + u2
(11-30)
L

u2

Para nT observaes, a matriz de covarincias dos distrbios

Notas aula de Econometria I, profa. Marina S. Cunha

0 0
0 0
=
M M M

0 0 0

L 0
L 0
= In
O M

70

(11-31)

11.5.1 Estimao por Mnimos Quadrados


11.5.2 Mnimos Quadrados Generalizados
O MMQG pode ser utilizado para estimar o modelo de efeitos
aleatrios.

11.5.3 Mnimos Quadrados Generalizados Factvel quando


desconhecido
11.5.4 Teste para Efeito Aleatrio
Teste do multiplicador de Lagrange para o modelo de efeitos
aleatrios, baseado no resduo de MQO :
H 0: u 2 = 0
(ou corr[it, is] = 0)
2
H 1: u 0
a estatstica de teste

2
n

T
nT i =1 t =1 eit

1
LM =

2(T 1) n T e 2

i =1 t =1 it

n (Te ) 2

nT i =1 i *
=
1 ~ (21) (11-42)
2(T 1) n T e 2
i =1 t =1 it
Exemplo 11.6 Teste para Efeito Aleatrio
LM = 3.881,34

(1)2 = 3,84  Rejeitamos H0 (Modelo de EA melhor)

Estimativa utilizando FGLS [ver 11.5.1]


Exemplo 11.7

Estimativa de

(11-33)

Notas aula de Econometria I, profa. Marina S. Cunha

71

Modelo de Efeito Aleatrio desenvolvido por Balestra e Nerlove (1996),


incluindo efeito tempo:
yit = + xit + it + ui + kt
efeito tempo
Ver mais em 11.8

11.5.5 Teste de especificao de Hausman para o modelo de


efeito aleatrio
Uma verso do teste dado por:

1
H ' = ( LSDV MEANS ) ' Asy.Var[ LSDV ] + Asy.Var[ MEANS ] ( LSDV MEANS )

(11-45)

H ' ~ [2K 1]
H0: modelo com efeito aleatrio
Uma vantagem dessa verso que a matriz de covarincia definida nonegativa.
Exemplo 11.8 Teste de Hausman para efeito fixo contra efeito aleatrio
H = 2.636,08

2 = 14,07
H0: rejeitada

11.5.6 Estendendo o modelo de efeito no-observvel: Abordagem de


Mundlak
11.5.7 Estendendo os modelos de EF e EA: Abordagem de Chamgerlain

Notas aula de Econometria I, profa. Marina S. Cunha

72

11.6 DISTRBIOS NO ESFRICOS E ESTIMAO


ROBUSTA DA MATRIZ DE COVARINCIA
A heterocedasticidade tratada seguindo o Captulo 9, pois o modelo
aqui uma extenso do MCRL.

11.6.1 Estimao Robusta do Modelo de Efeito Fixo


Utiliza-se o procedimento de White para construir um estimador da
matriz de covarincia, como no caso da heterocedasticidade.

11.6.2 Heterocedasticidade no Modelo de Efeitos Aleatrios


Como o modelo com efeitos aleatrios um modelo de regresso com
estrutura conhecida, OLS como um estimador robusto para a matriz de
covarincia assinttica no a melhor opo para os dados. O estimador GLS
eficiente enquanto o estimador OLS no .

11.6.3 Autocorrelao no modelo de dados de painel


Cap. 20 os testes so similares aos do MCRL, por exemplo o DW.

Notas aula de Econometria I, profa. Marina S. Cunha

73

11.7 AUTOCORREO ESPACIAL


Um modelo com correlao espacial pode ser formulado como segue:

yit = x it' + it + ui ,
Com i = 1, ..., n; t = 1 , ..., T. O termo comum ui o efeito unidade (por
exemplo o pas). A correlao espacial uma implicao da estrutura de
autocorrelao espacial
n

it = Wij jt + t
j =1

O escalar o coeficiente de autoregresso espacial. Os elementos Wij so


pesos espaciais (ou contiguo) que assumido serem conhecidos. Os
elementos que aparecem na soma acima so uma linha dos pesos espaciais ou
da matriz contigua W, que para as n unidades temos
t = W t + vt , vt = t i
A estrutura do modelo est em funo de uma matriz de pesos simtrica, W.
Considere pases ou estados arranjados geograficamente. Assim, para
vizinhos Wij ser igual a 1 e zero, caso contrrio. Essa matriz tambm pode
representar a distncia, em que Wij reduz com o aumento em |i - j|. Ser
similar a matriz de autocorrelao temporal. Assumindo que || menor que
um, e que os elementos de W so tal que (I - W) no-singular, podemos
escrever

t = (I n W) 1 v t
Ento, para n observaes para o perodo t
y t = X t + (I n W) 1 v t + u
Assumimos, que ui e vi tm mdia zero e varincias independentes entre os
pases. Segue que o modelo de regresso generalizado, que pode ser obtido
utilizando o captulo 8, para n observaes e t perodos, com conhecido, :

E[ y t | X t ] = X t
Var[y t | X t ] = (I n W) 1[ 2 ii ' ](I n W) 1 + u2 I n
VER EXEMPLO 11.12 (gastos com sade) e 11.13 (vendas imobilirias)

Notas aula de Econometria I, profa. Marina S. Cunha

74

11.8 ENDOGENEIDADE
11.9 REGREASSO NO LINEAR COM DADOS EM
PAINEL
11.10 SISTEMAS DE EQUAES
11.11 HETEROGENEIDADE DOS PARMETROS
At aqui os parmetros de inclinao do modelo foram tratados como
constantes fixas, e o intercepto variando aleatoriamente de grupo para grupo.
Uma formulao equivalente para o modelo empilhado, e de efeitos fixos e
aleatrios seria,

yit = ( + ui ) + x it'

+ it

Em que ui a varivel aleatria indivduo-especfica com varincia


condicional zero no modelo empilhado, positiva nos outros, e com mdia
condicional dependente de Xi, no modelo de efeito fixo e constante no
modelo de efeito aleatrio. H evidncias de que os demais parmetros
podem variar no modelo, alm do termo constante.

11.11.1 Modelo com coeficiente aleatrio


A heterogeneidade dos parmetros entre indivduos ou grupos pode ser
modelada como variao estocstica. Supondo
yi = Xii + i
(11-84)
E[i|Xi] = 0
E[ii|Xi] = 2IT,
em que
i = + ui
(11-85)
e
E[u
ui|Xi] = 0
(11-86)
E[uiui|Xi] =
Substituindo (11-48) em (11-47) e expandindo o resultado, obtemos o
modelo de regresso generalizado para cada bloco de observaes:

Notas aula de Econometria I, profa. Marina S. Cunha

75

yi = Xi + (i + Xiui)
ento,
ij = E[(yi Xi)(yi Xii)|Xi] = 2IT + XiXi

= (X' 1X)1X' 1y

Matriz de covarincia
(11-87)

 ver exemplo 11.19 (Tab. 11.14


Coeficiente fixo
Teste para selecionar modelo
Coeficiente aleatrio
11.11.2 Modelo linear hierrquico
11.11.3 Heterogeneidade dos parmetros e modelos de painel dinmico

11.11.3 Parmetros aleatrios e estimao baseada em simulao


11.12 SUMRIO E CONCLUSES

Notas aula de Econometria I, profa. Marina S. Cunha

76

CAPTULO 8

Endogeneidade e estimao com


variveis instrumentais

8.1 INTRODUO
8.2 SUPOSIES DO MODELO
8.3 ESTIMAO
8.4 DOIS TESTES DE ESPECIFICAO
8.5 ERRO DE MEDIDA
8.6 ESTIMAO NO-LINEAR COM VI
8.7 INSTRUMENTOS FRACOS
8.8 EXPERIMENTOS NATURAIS E FONTE DE EFEITOS CAUSAIS
8.9 SUMRIO E CONCLUSES

Notas aula de Econometria I, profa. Marina S. Cunha

77

8.1 INTRODUO
A suposio de que Xi e i so no correlacionados no modelo de regresso linear

yi = xi + i

(8-1)

tem sido crucial. Mas, existem muitas aplicaes em economia em que esta suposio
no atendida. Sem essa suposio no possvel demonstrar que os estimadores (OLS
e GLS) so no-viesados e consistentes.

EXEMPLO 8.1 Modelos com variveis endgenas do lado direito

O mtodo da varivel instrumental (IV) mais geral que o mtodo de mnimos


quadrados (OLS)

Notas aula de Econometria I, profa. Marina S. Cunha

78

8.2 SUPOSIES DO MODELO


As suposies do modelo clssico de regresso linear (Cap. 2 e 4) so:
A1. Linearidade
A2. Rank completo
A3. Exogeneidade das variveis independentes
A4. Homocedasticidade e no-autocorrelao
A5. Dados estocsticos ou no-estocsticos
A6. Distribuio normal

XX
Mantemos p lim
= Q xx
n
Modificamos A3. AI3. E [i | xi ]=i

[ou seja, os regressores contm


informaes sobre os erros]

uma implicao que

E [xi i]=
(8-2)
Com um nmero diferente de zero. Complementamos com
1

p lim X =
(8-3)
n

Note que o resultado original se mantm se i = 0. Portanto, os regressores no so mais


exgenos.
Existe um conjunto adicional de variveis, Z, que tem duas propriedades:
1. Exogeneidade: so no correlacionadas com os erros
2. Relevncia: so correlacionadas com as variveis independentes X
Variveis com essas propriedades so chamadas de instrumentos. Assumimos
AI7. [xi, zi e i ], i = 1, ..., n so uma sequncia de variveis aleatrias i.i.d.

[ ]
[ ]

2
AI8a. E xik
= Q xx,kk < , uma constante finita, k = 1, ..., K
2
AI8b. E z ik
= Q zz ,ll < , uma constante finita, l = 1, ..., L

AI8c. E z il xik = Q zx, lk < , uma constante finita, l = 1, ..., L e k = 1, ..., K.

AI9. E i | z i = 0
AI7. Ser relaxada na anlise de sries temporais. Considerando a mesma anlise da
seo 4.9, tem-se:
p lim(1 / n )ZZ = Q zz , uma matriz finita e definida positiva (dados bem comportados)
p lim(1 / n )ZX = Q zx , uma matriz finita, L x K, com rank K (relevante)
p lim(1 / n )Z = 0 , exogeneidade

Notas aula de Econometria I, profa. Marina S. Cunha

8.3 ESTIMAO
8.3.1 Mnimos Quadrados Ordinrios
Viesado
Inconsistente

8.3.2 Estimador de varivel instrumental


bIV = (ZX)-1 Zy

(8-6)

Z = matriz com as variveis instrumentais.

8.3.3 Motivaes
8.3.4 Mnimos Quadrados em 2 estgios
Se Z contm mais colunas (variveis) que X, ento no possvel obter ZX
= Z(ZZ)-1 ZX
X
= XZ(ZZ)-1 Z
X

Com isso,
X)-1 X
y
bIV = ( X

= (XZ(ZZ)-1 ZX)-1 XZ(ZZ)-1 Zy

(8-9)

79

Notas aula de Econometria I, profa. Marina S. Cunha


EXEMPLO 8.5
(dados do captulo 9)
Table F9.1: Cornwell and Rupert, Labor Market Data, 595 Individuals, 7 years
Source: Cornwell and Rupert (1988)
EXP =Work experience,
WKS =Weeks worked,
OCC =Occupation, 1 if blue collar,
IND =1 if manufacturing industry,
SOUTH =1 if resides in south,
SMSA =1 if resides in a city (SMSA),
MS =1 if married,
FEM =1 if female,
UNION =1 if wage set by union contract,
ED =Years of education,
BLK =1 if individual is black,
LWAGE=Log of wage.
Equao de salaries:

Wks it = 1 + 2 ln Wage it + 3 Ed it + 4Union it + 5 Fem it + u it

Z1= [1, Ind, Ed, Union, Fem]


Z2= [1, Ind, Ed, Union, Fem, SMSA]

PROGRAMA DO STATA
clear
set more off
set matsize 800
set mem 256m
memory
*/incluindo os dados
infile lwage exp wks occ ind south smsa ms union ed fem blk time households using
e:\TABLEF91.prn
*/OLS
regress wks lwage ed union fem
*/IV with Z1
ivreg wks (lwage = ind ed union fem) ed union fem
*/IV with Z2(Two-stage least squares)
svyset _n
svy: ivreg wks ed union fem (lwage = ind ed union fem smsa)

80

Notas aula de Econometria I, profa. Marina S. Cunha

81

CAPTULO 10

Sistemas de Equaes
10.1 Introduo
10. 2 Modelo de regresso aparentemente no correlacionada
10.3 Modelo generalizado
correlacionada

para

regresso

aparentemente

10. 3 Sistemas de regresso no linear


10.4 Sistemas no lineares de equaes
10.5 Sistemas de equaes de demanda: sistemas singulares
10.6 Modelos de equaes simultneas
10.7 Sumrio e concluses

no

Notas aula de Econometria I, profa. Marina S. Cunha

10.1 INTRODUO
Exemplos:
1) Funo Investimento
2) Modelo de precificao de ativos
3) Modelo para o produto de 48 estados dos EUA
4) Modelo dinmico para determinao dos salrios para 38 indstrias do UK
5) Conjunto de demanda por fator [minimizao de custos]

10.2 MODELO DE REGRESSO APARENTEMENTE NO


CORRELACIONADO
y 1 = X11 + 1
y 2 = X 2 2 + 2

(10-1)

...

y M = XM M + M

M equaes
T observaes
O modelo de regresso aparentemente no-correlacionado (SUR) :
i = 1, ..., M
y i = Xii + i
em que,

= [ 1 , 2 ,..., M ]
Assumimos exogeneidade estrita de Xi,
E [ | X 1 , X 2 ,..., X M ] = 0

e homocedasticidade
E [ m m | X 1 , X 2 ,..., X M ] = mm I T

(10-2)

82

Notas aula de Econometria I, profa. Marina S. Cunha

83

observaes totais T
equaes M
regressores de cada equao Ki
M

regressores totais K = i =1 K i
Necessita-se que T > Ki
Assumimos que os erros so no correlacionados entre as observaes, mas
correlacionados entre as equaes
E [ it js | X 1 , X 2 ,..., X M ] = ij

se t = s e 0 c.c.

Assim, tem-se
E [ i j | X 1 , X 2 ,..., X M ] = ij I T

ou

11 I 12 I ... 1M I
I I ...

21
22
2M I

E [| X 1 , X 2 ,..., X M ] = =

...

M 1I M 1I ... MM I

(10-3)

Notas aula de Econometria I, profa. Marina S. Cunha

10.3 Modelo generalizado


correlacionada

para

regresso

aparentemente

84

no

10. 3 Sistemas de regresso no linear


10.4 Sistemas no lineares de equaes
10.5 Sistemas de equaes de demanda: sistemas singulares
10.6 Modelos de equaes simultneas
Exemplos:
- Equilbrio de mercado
- Modelos macroeconmicos
- Conjunto de equaes de demanda por fator ou mercadorias

10.6.1 Sistemas de equaes


 Equaes estruturais:
Equaes de demanda: qd,t = 1pt + 2xt + d,t
+ s,t
Equaes de oferta:
qs,t = 1pt
Condio de equilbrio: qd,t = qs,t = qt
Variveis conjuntamente dependentes ou endgenas: q, p (so determinados
simultaneamente)
Variveis exgenas: x


Sistema de equaes completo: a completude do sistema requer que o


nmero de equaes seja igual ao
nmero de variveis endgenas.

Como regra geral  no possvel estimar um sistema incompleto


 Assume-se que d,t e s,t so bem comportados

Notas aula de Econometria I, profa. Marina S. Cunha

85

 Equaes na forma reduzida


Resolver o sistema para as variveis endgenas (p, q )
em funo das exgenas (xt) e dos erros (d,t, s,t)

p=

2x
s
+ d
= 1x + v1
( 1 1) ( 1 1)

q=

1 2 x
1 s
+ 1 d
= 2 x + v2
( 1 1)
( 1 1)

(13-41)

portanto 1 no pode ser igual 1.


MQO inconsistente pois Cov[ p, d ] = d2 / (1 1 ) e

Cov[ p, s ] = s2 / (1 1 )
temos que utilizar outros mtodos de estimao, tais como VI ou MQ2E

Exogeneidade x endogeneidade:
No h um consenso em econometria sobre qual varivel endgena e
qual exgena.
No sistema de oferta e demanda, enquanto as variveis preo e
quantidade so tratadas como endgenas, as demais so consideradas
exgenas. Por outro lado, em macroeconomia h uma interdependncia entre
as variveis do sistema. Por exemplo, na estimao da funo consumo por
MQO, a renda tratada como exgena.
Engle, Hendry e Richard (1983) definem o conjunto xt de variveis
como fracamente exgeno se o modelo pode ser escrito em termos da
distribuio de probabilidade marginal de xt e da distribuio condicional de
yt|xt tal que a estimao do conjunto completo da distribuio condicional
no menos eficiente que a estimao da distribuio conjunta.
No caso de sries de tempo, esse conjunto de variveis so
denominadas pr-determinadas se no modelo, xt independente de todas
estruturas subsequentes dos distrbios t+s.

Notas aula de Econometria I, profa. Marina S. Cunha

86

Causalidade de Granger:
No h causalidade no sentido de Granger se f(xt|xt1, yt1) com ou H0:t-1 = 0
igual a f(x|xt1)
Se xt fracamente exgena e se yt1 no causa no sentido de Granger
xt, ento xt fortemente exgena.

10.6.2 Notao geral para modelos lineares de equaes


simultneas
A forma estrutural do modelo :
11yt1 + 21yt 2 + L + M1 ytM + 11xt1 + L + k1xtk = t1
12 yt1 + 22 yt 2 + L + M 2 ytM + 12 xt1 + L + k 2 xtk = t 2
M
1M yt1 + 2M yt 2 + L + MM ytM + 1M xt1 + L + kM xtk = tM

(13-42)

M equaes
M variveis endgenas y1, ... yM
K variveis exgenas x1, ... xK (podem incluir valores predeterminados de y1, ... yM)
primeiro elemento de xt igual a constante 1.
t1, ... tM so erros estruturais
t ndice para as observaes t = 1, ..., T

Na forma matricial

11 12

[ y1 y2 L yM]t 21 22
M
M

M1 M2

L
L
O
L

1M
2M

11 12

+[x1 x2 L xK] 21 22
t
M
M
M

MM
M1 M2

L 1M
L 2M
=[1 2 L M]
t
O M

L MM

y t + x t' B = t'

ou,

Haver sempre um coeficiente igual a 1 em , a varivel dependente


O sistema na forma reduzida
y t' = [x 1

x2

xM

]t

11

21
M

M 1

12
22

L
L

1M
2M

MM

+ [v 1

vM

]t

Notas aula de Econometria I, profa. Marina S. Cunha

87

y t = x t B 1 + t 1
y t = x t + v t
Para que exista uma soluo para este sistema a condio de completude
precisa ser atendida: precisa ser no singular
Nota: Se for triangular (modelo recursivo) possvel resolver por MQO
Exemplo 10.4 Forma estrutural e reduzida por MQO.

10.6.3 O problema de identificao


Precede o problema da estimao
 Quando no h como obter a estimativa dos parmetros
a estrutura dita subidentificada

vrias teorias
podem ser
empregadas
equivalncia
observacional

 Equivalncia observacional
 O problema da identificao no um problema do tamanho da amostra
 O sistema na forma reduzida
y t' = x t' + v t

E[ v t v t '| x t ] =

em que as variveis predeterminadas no so correlacionadas com os erros.


Ento,
plim (1/n) XX= Q
plim (1/n) Xy= plim (1/n) X(X
=V)=Q

plim (1/n) yy= plim (1/n)( X+ V) = Q


+
A matriz dos coeficientes da forma reduzida, , observvel:

XX
= p lim

Xy
p
lim

Notas aula de Econometria I, profa. Marina S. Cunha

88

Este estimador a regresso de Y sobre X de cada equao. Como


observvel, :
1

yy
yX XX Xy
= p lim
p lim
n
n n n
e podem ser estimados de forma consistentes por uma regresso
de mnimos quadrados de y sobre X.
Agora, ns podemos deduzir os parmetros estruturais da forma
reduzida?
A correspondncia entre os parmetros da forma reduzida e os da
forma estrutural :
= B 1
= E [vv] = 1 1

B =
=

( )

Se conhecido
podemos obter B e

A forma reduzida pode levar a mais de uma estrutura diferente de [, B e ]?


Considerando outra estrutura

~
y t' + x t' B = ~t'
E ps multiplique por , uma matriz no singular, para obter uma nova
estrutura, em que escolhida arbitrariamente. Pode-se concluir que
transformao no singular na estrutura original tem a mesma forma
reduzida. Assim, necessitamos da teoria econmica para impor restries ao
modelo, para identific-lo corretamente.

Ver Exemplo 10.5


Duas estruturas  mesma forma reduzida
q
q

1
1

p
p

z
z

q
q

1
1

p
p

x
z

Notas aula de Econometria I, profa. Marina S. Cunha

89

Para identificar o sistema, temos a condio de ordem, que necessria,


e a condio de rank, que suficiente. Em geral, temos o modelo na forma
estrutural

y t + x t' B = t'
e o modelo na forma reduzida
y t' = x t' + v t
Se conseguirmos deduzir os parmetros da forma estrutura a partir da forma
reduzida, dizemos que a equao est identificada. Para uma equao
particular, a soluo est contida em

= B 1

o que implica que

= B

A j-sima equao matricial representa a j-sima equao

j = B j

Definio Condio de ordem para a identificao da equao j


Kj* Mj
O nmero de variveis exgenas excludas da equao j deve ser pelo menos
to grande quanto o nmero de variveis endgenas includas na equao j.
necessria, mas no-suficiente
Condio de rank
Tabela Modelo de Klein, coeficientes estruturais

Notas aula de Econometria I, profa. Marina S. Cunha

90

10.6.4 Estimao de uma equao e inferncia


y j = y j j + X j j + j
= Z j j + j

(10.48)

10.6.5 Mtodos de estimao


Estimadores so inconsistentes  em geral
Modelos recursivos [caso particular]  estimadores so consistentes
Exemplo:
+ 1,  clssico M MQO

(1)

y1 = x1

(2)

y2 = x2

+ 12y1

(3)

y3 = x3

+ 13y1 + 23y2 + 3,  ...

+ 2,  Cov(y1, 2) = Cov(x1+ 1, 2) = 0

O mtodo da varivel instrumental, como Zj e j esto correlacionados


em
y j = Z j j + j
Seja Wj uma matriz T (M j + Kj), que satisfaz as seguintes propriedades:
plim (1/T)WjZj = wz = uma matriz singular no finita
plim (1/T)Wj = 0,
plim (1/T)WjWj = ww = uma matriz definida positiva

Notas aula de Econometria I, profa. Marina S. Cunha

Ento, o estimador IV

91

W = Variveis predeterminadas
do sistema

j , IV = [ W 'j Z j ]1 W 'j y j
que consistente. A matriz de covarincia assinttica tambm pode ser
obtida de forma consistente, conforme (13-16).
O mtodo de estimao em 2 estgios. Esse mtodo consiste em utilizar
como instrumento para yj os valores estimados na de yj sobre todos os xs do
sistema
Estgio 1

Obter a estimativa de yj [varivel(is) endgena do 2


membro da equao j] por MQO de yj sobre X [todos as
variveis exgenas]

Estgio 2

Obter a estimativa da equao j substituindo yj por y j [do


Estgio 1]

Ver tambm o mtodo de estimao em 3 estgios.

10.6.6 Testando a presena de estimadores fracos

10. 7 SUMRIO E CONCLUSES

Notas aula de Econometria I, profa. Marina S. Cunha

92

EXEMPLO 10.1
Table F9.2: Munnell Productivity Data, 48 Continental U.S. States, 17 years,19701986
Dados dos exemplos 9.9 e 9.10 de Munnells (1990), um estudo sobre nvel da
produtividade do capital pblico para os Estados Unidos, considerando 48 estados,
divididos em 9 regies.
A equao bsica uma funo de produo Cobb-Douglas:

ln gsp jkt = + 1 ln p _ cap jkt + 2 ln hwy jkt + 3 waterjkt +


Variveis:

+ 4 ln util jkt + 5 ln emp jkt + 6uemp jkt + jkt + u jk + v j

STATE = State name,


ST ABB=State abbreviation,
YR =Year, 1970, . . . ,1986,
PCAP =Public capital,
HWY =Highway capital,
WATER =Water utility capital,
UTIL =Utility capital,
PC =Private capital,
GSP =Gross state product,
EMP =Employment,
UEMP =Unemployment rate,

Agrupamento em 9 regies:
Golfo = Alabama, Florida, Lousiana, Mississippi;
Meio Oeste = Illinois, Indiana, Kentucky, Michigan, Minnesota, Ohio, Winsconsin;
Meio Atlntico = Delavare, Maryland, Nova Jersey, Nova York, Pennsylvania,
Virginia;
Montanhas = Colorado, Idaho, Montana, Dakota do Norte, Dakota do Sul, Wyoming;
Nova Inglaterra = Connecticut, Maine, Massachusetts, Nova Haspshire, Rhode Island,
Vermont;
Sul = Gergia, Carolina do Norte, Carolina do Sul, Tennesse, Oeste da Virginia;
Sudoeste = Arizona, Nevada, Novo Mxico, Texas, Utah;
Tornado Alley = Arkansas, Iowa, Kansas, Missouri, Nebraska, Oklahoma;
Costa Oeste = Califrnia, Oregon, Washington.

Notas aula de Econometria I, profa. Marina S. Cunha

93

Notas aula de Econometria I, profa. Marina S. Cunha

EXEMPLO 10.8
Table F10.1: Cost Function Data, 145 U.S. Electricity Producers, 1955 Data; Nerlove
Source: Nerlove (1960) and Christensen and Greene (1976)
Equaes:
p
p
p
s K = K + KK ln K + KL ln L + KE ln E
pM
pM
pM
p
p
p
s L = L + KL ln K + LL ln L + LE ln E
pM
pM
pM
p
s E = E + KE ln K
pM

p
p
+ EL ln L + EE ln E

pM
pM

Variveis:
Firm = Observation,
Year = 1955 for all observations
Cost = Total cost,
Output = Total output,
Pl = Wage rate,
Sl = Cost share for labor,
Pk = Capital price index,
Sk = Cost share for capital,
Pf = Fuel price,
Sf = Cost share for fuel

PROGRAMA DO STATA
clear
*/set more off
set matsize 800
set memory 128m
memory
infile year cost k l e m pk pl pe pm order using c:\TABLEF102.prn
gen lk=log(pk/pm)
gen ll=log(pl/pm)
gen le=log(pe/pm)

sureg (k = lk ll) (l = ll) (e = le lk ll)


sureg (k l e = lk ll le), corr

94

Notas aula de Econometria I, profa. Marina S. Cunha


EXEMPLO 13.2 Kleins Model I
Table F13.1: Kleins Model I , 22 Yearly Observations, 1920-1941
Source: Klein (1950)
Year = Date,
C = Consumption,
P = Corporate profits,
Wp = Private wage bill,
I = Investment,
K1 = previous year capital stock,
X = GNP,
Wg = Government wage bill,
G = Government spending,
T = Taxes
Modelo

Funo consumo:
Funo Investimento:
Salrio privado:
Equilbrio da demanda:
Lucros privados:
Estoque de capital:

Ct = 0 + 1Pt + 3Pt1 +2 ( Wt + Wt )+ 1t
It = 0 + 1Pt + 2 Pt1 + 3Kt1 + 2t
p

Wt = 0 + 1 Xt + 2 Xt1 + 3At + 3t
Xt = Ct + It + Gt
p

Pt = Xt - Tt - Wt
Kt = Kt1 + It

95

Notas aula de Econometria I, profa. Marina S. Cunha

96

PROGRAMA DO STATA
clear
*/set more off
set matsize 800
set memory 128m
memory
use c:\klein.dta
*/gen t=_n
*/gen ano1 = y(1920y1) + t-1
*/format ano1 %ty
*/tsset ano1
format year %ty
summarize
tsset year
*/gen lp = l.p
*/gen lpso= l.pso
gen lpso1= l.pso1
gen lx= l.x
*/MODELO I DE KLEIN
*/MMO
regress c p lp wpwg
regress i p lp k1
regress wp pso1 lpso1 yr
more
*/MININOS QUADRADOS 2 ESTGIOS
ivreg c lp (p wpwg = t wg g yr lp lx k1)
ivreg i lp k1 (p = lp g wg t yr)
ivreg wp lpso1 (pso1 yr = p lpso1 lp k1 wpwg g wg t)
*/MINIMOS QUADRADOS 3 ESTGIOS
reg3 (c p lp wpwg) (i p lp k1) (wp pso1 lpso1 yr), endog (wpwg p pso1) exog(t wg g)

Notas aula de Econometria I, profa. Marina S. Cunha

97

CAPTULO 14

Estimao por mxima verossimilhana

14.1 Introduo
14.2 Funo Verossimilhana e a identificao dos parmetros
14.3 Estimao eficiente: O princpio da Mxima Verossimilhana
14.4 Propriedades dos estimadores de Mxima Verossimilhana
14.5 Verossimilhana condicional, modelos economtricos e o estimador
GMM
14.6 Testes de hiptese e de especificao e medidas de ajustamento
14.7 Estimao de Mxima Verossimilhana em duas etapas
14.8 Estimao de Pseudo-Mxima Verossimilhana e Matrizes
Robustas de Covarincia Assinttica
14.9 Aplicaes de estimao por Mxima Verossimilhana
14.10 Sumrio e concluses

Notas aula de Econometria I, profa. Marina S. Cunha

98

14.1 Introduo
O mtodo dos momentos generalizados discutido no Captulo 13 e os
estimadores semi-paramtricos, no-paramtricos e Baysianos discutidos nos
Captulos 12 e 16 so amplamente utilizados na construo de modelos. No
obstante, o estimador de Mxima Verossimilhana discutido neste captulo se
mantm como o estimador preferido em muito mais aplicaes que os
anteriores.

Notas aula de Econometria I, profa. Marina S. Cunha

99

14.2 A Funo Verossimilhana e a identificao dos parmetros


A funo densidade de probabilidade, ou F. D. P., para uma varivel
aleatria, y, condicionada a um conjunto de parmetros, , denotada por
(y|). Esta funo identifica o processo gerador dos dados que sustenta a
amostra observada de dados e, ao mesmo tempo, fornece uma descrio
matemtica dos dados que o processo ir produzir. A densidade conjunta de n
observaes independente e identicamente distribuda (i. i. d.) deste processo
o produto das densidades individuais;
n

(y1 ,L, y n | ) = ( yi | ) = L( | y )

(14-1)

i =1

Esta densidade conjunta a Funo Verossimilhana, definida como


uma funo do vetor de parmetros desconhecidos, , em que y utilizado
para indicar a coleo de dados amostrais.
Note
(yi|)  uma funo dos dados condicionados aos parmetros
L(|y)  uma funo dos parmetros condicionados aos dados
Embora as duas funes sejam iguais, para enfatizar que a Funo
Verossimilhana escrita desta maneira para chamar a ateno para o
interesse nos parmetros () e na informao sobre eles que est contida
nos dados observados (y). No caso de estimao clssica, os parmetros
so considerados constantes fixas que esperamos aprender sobre os dados.

Notas aula de Econometria I, profa. Marina S. Cunha

100

Para simplificar o trabalho utiliza-se o Log da funo verossimilhana:


n

LnL( | y ) = Ln( yi | )

(14-2)

i =1

Novamente, para enfatizar o interesse nos parmetros, dados os dados


observados, denota-se esta funo como L(|dados) = L(|y). Pode ser
representada ainda comum ou como L() e LnL() ou como L e LnL.

Usualmente, necessrio generalizar o conceito da funo


verossimilhana para permitir que a densidade dependa de outras variveis
condicionais:
n

LnL( | y , X) = Ln( yi|x i , )


i =1

1 n
= [Ln 2 + Ln(2 ) + ( yi -x i ) 2 2 ]
2 i =1

(14-3)

Considerando a funo densidade de probabilidade normal em que, X uma


matriz n x k de dados com a i-sima coluna igual a xi

O restante deste captulo ser dedicado a obteno de estimativas


dos parmetros, , e testar hipteses sobre eles e sobre o processo
gerador dos dados.

Notas aula de Econometria I, profa. Marina S. Cunha

101

IDENTIFICAO:
Um assunto para a formulao do modelo
Deve ser resolvido antes que a estimao seja considerada
Considerando todas as informaes disponveis.
Podemos determinar valores nicos de da amostra
DEFINIO 14.1 IDENTIFICAO
O vetor de parmetros identificado (estimvel) se
para qualquer outro vetor de parmetros, * , para
algum dado y, L(*|y) L(|y).

Notas aula de Econometria I, profa. Marina S. Cunha

102

Exemplo 14.2 Funo Log-verossimilhana e Equaes Verossimilhana


para a distribuio normal
Na amostragem de uma distribuio normal com mdia e varincia 2, a
funo Log-verossimilhana e as equaes verossimilhana para e 2 so
n ( y )2
n
n
2 1
LnL( , ) = Ln (2 ) Ln i

2
2
2 i =1 2
LnL
1
=
( y ) = 0
2 i

LnL

n
2

(14-5)
(14-6)

( yi ) 2 = 0

2 i =1
4

(14-7)

Para resolver estas equaes, multiplicamos (14-6) por 2, da

( yi ) = 0
yi n = 0
n = yi
y
= i = y
ML

n

O estimador de M.L. de a mdia aritmtica

substituindo este resultado em (14-7), tem-se:


n 2 + ( yi yn ) 2

=0
4
2
n
2 1
= ( yi yn ) 2
n i =1

(14-8)

Notas aula de Econometria I, profa. Marina S. Cunha

103

14.9.1 O modelo de regresso linear normal


O modelo de regresso linear
yi = xi + i
Considerando que o erro segue uma distribuio normal, tem-se

( i )2

1
2
e 2
2
Lembrando que i = yi xi e
f ( i | , 2 ) =
n

i2 =
i =1

A funo verossimilhana para uma amostra de n distrbios


independentes, identicamente e normalmente distribudos :
2
L = (2 2 ) n 2 e ' ( 2 )

(14-32)

Como = (y X )(y X ), encontramos a funo verossimilhana para n


observaes sobre as variveis aleatrias observadas
2 n 2 ( 1 2 2 )( y X )' ( y X )

L = (2 )

(14-33)

Precisamos maximizar esta funo com relao aos . Antes obtemos


a Log-verossimilhana:

n
n
(y X )' (y X )
LnL = Ln 2 Ln 2
2
2
2 2

(14-34)

A condio necessria que


X' (y X )
LnL


0
2


=
n
(
y

)'
(
y

)
Ln


0
+
2 2 2

2 4

(14-35)

Notas aula de Econometria I, profa. Marina S. Cunha

104

Os valores que satisfazem estas equaes so


ML = ( X' X) 1 X' y = b

e' e
(14-36)
n
2
M
.L. um estimador viesado da varincia, embora tenha boas
propriedades assintticas.
e' e
2
Lembre que OLS
que no-viesado.
=
nk
2
ML
=

Notas aula de Econometria I, profa. Marina S. Cunha

105

LISTA DE EXERCCOS 2
1) (Hoffmann, p.240) Considere o modelo
Yj = + Xj + uj
2
2
Considere que a E(u j)= X j . Com base nos seguintes dados
X
Y
1
13
2
10
5
20
5
15
10
50
Obtenha as estimativas de e de , utilizando o mtodo mais adequado.
2) (Hoffmann, p.241) Considere o modelo
Yj = + Xj + uj
Considere as informaes:
X

Diagonal a
matriz V
0
4
1
2
8
1
4
3
0,5
6
6
1
8
1
0,5
Obtenha as estimativas de e de , utilizando o mtodo mais adequado.
3) Considere dados de corte sobre 41 pases.
lnYi = 1 + 2 lnX2i + 3 lnX3i + ui
Sendo que Y representa a razo entre tributes sobre comrcio (impostos sobre importao e
exportao) e receita total do governo; X2 = razo entre a soma das importaes e exportaes e o PNB
e X3 = PNB per capita. A estimativa da regresso para realizar o teste de White

u i 2 = 5,8417 + 2,5629 ln Comrcioi + 0,6918 ln PNBi

0,4081 (ln Comrcioi)2 0,0491 (ln PNBi)2


+ 0,0015 (ln Comrcioi) (ln PNBi)
H heterocedasticidade no modelo?

R2 = 0,1148

4) (Hoffmann, exer. 7.1) Admite-se que X, Y esto relacionados de acordo com o modelo
Y j = + X j + uj
onde uj = 0,5 ut-1 + t e t so erros aleatrios independentes com mdia zero e varincia constante.
Xt
Yt
1
39
2
24
3
24

Notas aula de Econometria I, profa. Marina S. Cunha

106

4
12
5
15
Obtenha as estimativas lineares no-tendenciosas de varincia mnima de e de .
5) (Gujarati, p. 442) Dada uma amostra de 50 observaes e 4 variveis explicativas, o que voc pode
dizer sobre a autocorrelao se (a) d = 1,05 ?
(b) d = 1,40 ?
(c) d = 2,50 ?
(d) d = 3,97 ?
6) Considere o seguinte modelo estimado,
DPCPt = 1.242,169 + 0,6033 RPDPt + 0,4106 DPCPt - 1
t = (3,0855) (4,0155)
(2,6561)
d = 1,0056
h de Durbin = 5,119
R2 = 0,9926
Em que,

DPCPt = despesa pessoal de consumo per capita, 1970-99, EUA


RPDPt = renda pessoal disponvel per capita, 1970-99, EUA.
Aplique o teste h de Durbin, para um nvel de significncia de 5%.

7) (Hoffmann, p. 311) Consideremos o seguinte sistema


Y1t = 0 + 1Y 2t+ 2 X 1t + 1t

Y1t = 0 + 1Y2t + 2 X 2t + 2t
onde as variveis endgenas Y1t e Y2t so a quantidade transacionada e o preo do produto,
respectivamente, no perodo t. As variveis X1t e X2t so exgenas. Admite-se que 1t e 2t so erros
aleatrios independentes com mdia zero e varincia constante e que o erro de um perodo
independente dos erros em outros perodos. Com base nos seguintes dados

X1t

X2t

Y1t

Y2t

1
1
3
3
5
5
7
7

1
1
3
3
3
3
1
1

2
1
4
3
3
5
2
4

1
3
1
3
3
3
5
5

a) Verifique se as duas equaes so identificveis.


b) Resolva a primeira equao utilizando um dos mtodos indicados para o caso.
c) Idem para a segunda.
8. (Hoffmann, p. 310) Seja o sistema de equaes

Yt = + X t + ut

X t = + Z t + t

Notas aula de Econometria I, profa. Marina S. Cunha

107

onde ut e t so variveis aleatrias com mdia zero e varincia constante, que apresentam correlao
assinttica negativa e que no so correlacionadas com Zt. dado a seguinte amostra de valores:
Yt
10
19
16
22
33
45
48
61
70
76

Xt
5
8
6
7
10
12
13
15
20
24

Zt
2
4
3
5
8
11
12
15
14
16

a) Faa a identificao das equaes.


b) Obtenha as estimativas dos parmetros das duas equaes.
9. (Hoffmann, p. 312) Considere o seguinte sistema, constitudo pelas equaes de demanda e de
oferta de um produto, em certo mercado:
(demanda)
Y1t = 0 + 1Y 2t+ 2 X1t + 1t

(oferta)
Y1t = 0 + 1Y2t + 2 X 2t + 3 X 3t + 2t
As variveis endgenas Y1t e Y2t so a quantidade transacionada e o preo do produto, respectivamente,
no perodo t.
As variveis exgenas X1t, X2t e X3t so, respectivamente, a renda per capita, o montante de subsdios
recebidos pelos produtores e o preo da matria-prima.
Admite-se que 1t e 2t so erros aleatrias com mdia zero e varincia constante, e que os erros de um
perodo, embora correlacionados entre si, so no correlacionados com os erros relativos a outros
perodos. Considere as seguintes informaes:

X1t
5
6
7
7
8
9

X2t
130
110
120
120
110
130

X3t
30
20
26
26
30
24

Y1t
18,5
20,0
19,5
18,5
19,5
24,0

Y2t
7,5
8,0
7,5
8,5
12,5
10,0

a) A equao de demanda identificvel?


b) A equao de oferta identificvel?
c) Obtenhas as estimativas da equao de oferta.
d) Obtenha as elasticidades- preo da oferta e da demanda, e a elasticidade-renda da demanda para os
valores mdios de Y1t, Y1t e X1t.
10) (Greene, p. 328) Two samples of 50 observations each produce the following moment matrices:
(In each case, X is a constant and one variable.)

Sample 1

Sample 2

Notas aula de Econometria I, profa. Marina S. Cunha


50 300
XX

300 2100

108

50 300
300 2100

yX

[300 2000 ]

yy

2100

[300 2200 ]
2800

(a) Compute the least squares regression coefficients and the residual variances, s2, for each data set.
Compute the R2 for each regression.
(b) Compute the OLS estima12te of the coefficient vector assuming that the coefficients and
disturbance
variance are the same in the two regressions. Also compute the estimate of the asymptotic covariance
matrix of the estimator.
(c) Test the hypothesis that the variances in the two regressions are the same without assuming that the
coefficients are the same in the two regressions.
11) (Greene, p. 980) The following regression is obtained by ordinary least squares, using 21
observations. (Estimated asymptotic standard errors are show in parentheses)
Yt = 1.3 + 0.97 Yt-1 + 2.31 Xt
(0.3) (0.18) (1.04)

D-W =1.21

Test for the presence of autocorrelation in the disturbances.


12) (Greene 6a. ed, p. 396) Verify the rank and order conditions for identification of the second and
third behavioral equations in Kleins Model I.
13) (Greene 6a. ed , p. 396) Check the identifiability of the parameters of the following model:
13 13 14
0
0
0
1 12

24
1
0
21

1 23 24
[ y1 y2 y3 y4] 21
+ [ x1 x2 x3 x4 x5 ] 31 32 33
0 = [ 1 2 3 4]
0 32 1 34

43 44
0
0

1
41 42 0
0 52
0
0
14. Considere o seguinte modelo de demanda e oferta de um produto:
Demanda :

Qtd = 0 + 1 Pt + u1t

Oferta :
Qt = 0 + 1 Pt + 2Tt + u 2t
em que
Q = Quantidade; P = Preo; T = Tarifas; u1 e u2 = termo de erro. Suponha que Q e P
sejam endgenas e T exgena. Coloque o sistema na forma reduzida.
o

GABARITO
1) estimativa para 1 10 e para 2 2
2) estimativa para 1 6 e para 2 -0,5

Notas aula de Econometria I, profa. Marina S. Cunha


3) 4,7068, no rejeitamos H0, portanto os resultados sugerem que no h heterocedasticidade.
4) estimativa para 1 42 e para 2 -6
5)
6) 5,119, que sugere autocorrelao positiva.
7)
8)
9)
10)
11) h =3,201, rejeita-se a hiptese de no autocorrelao.

109

You might also like