You are on page 1of 41

DISCIPLINA ECONOMETRIA I

PARTE I: CAPTULO 4

Prof. Marina Silva da Cunha

_________________________Notas de aula de econometria I, Profa. Marina Silva da Cunha 1

4.
O ESTIMADOR DE MNIMOS QUADRADOS

4.1 INTRODUO
4.2 MOTIVANDO O USO DE MNIMOS QUADRADOS
4.3 PROPRIEDADES EM AMOSTRAS FINITAS DOS ESTIMADORES DE MQO
4.4 PROPRIEDADE EM GRANDES AMOSTRAS DOS ESTIMADORES DE MQO
4.5 INTERVALO DE CONFIANA
4.6 PREVISO
4.7 PROBLEMA COM OS DADOS
4.8 SUMRIO E CONCLUSES

_________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 2

4.1 INTRODUO

Cap 3

Regresso Linear foi tratada como um exerccio puramente


algbrico

Cap 4  Propriedades estatsticas do estimador de mnimos quadrados

Existem outros candidatos para ??


- Menor e maior valor dos dados para traar a reta
- a e b que minimizam os valores absolutos dos resduos

O estimador ideal deve atender a algumas propriedades estatsticas

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 3

4.2 MOTIVAES PARA O USO DE MNIMOS QUADRADOS

Fcil de ser obtido [computacional]

Outras
1) uma abordagem natural
2) mesmo no caso de modelos no-lineares, o estimador de
mnimos quadrados um timo preditor
3) considerando algumas suposies, o estimador de mnimos
quadrados ser o mais eficiente

___________________Notas de aula de econometria I, Profa. Marina Silva da Cunha 4

4.2.1 CONDIES DE ORTOGONALIDADE DA POPULAO

Seja x o vetor com as variveis independentes


Assumindo A5 exogeneidade na gerao dos dados
A3 Xs estocsticos e no-correlacionados com os resduos
Ento, pelo Teorema B.1 do apndice
Ex[E[|x]] = Ex[E
E[]] =E[] = 0
Podemos escrever:

ExE[x] = ExEy[x(y x)] = 0


ExEy[xy] ExEy[xx)] = 0
ExEy[xy] = ExEy[xx]

(4-1)
Equao
Populacional

Assim, temos as equaes normais


Xy = XXb
Dividindo (4-1) por n

1
1

xi yi = xi x i ' b
n i =1
n i =1

(4-2)
Equao
Amostral

Portanto, considerando as condies A5 e A3, pode-se aplicar a lei dos


grandes nmeros [apndice D], e a partir da soma do lado esquerdo e da soma
do lado direito de (4-2), obtemos b que o estimador de em (4-1). Ento, o
estimador de mnimos quadrados reproduz na amostra uma relao da
populao.

_________________________Notas
Notas de aula de econometria I Profa. Marina Silva da Cunha 5

4.2.2 PREDITOR COM O MENOR ERRO QUADRTICO MDIO


Uma abordagem alternativa,
A6 distribuio normal
ignore
A1 linearidade
Denote por x = Preditor de y com o menor erro quadrtico mdio
Esperana do erro quadrtico
MSE = EyEx[y x]2
= EyEx[y E[y|x] + E[y|x] x]2

= EyEx[y E[y|x]]2 + EyEx[E[y|x]] x]2 2 EyEx[y E[y|x]][E[y|x] x]

E y E x {[E [ y | x ] x ' ]}

= 2 E y E x {x [E [ y | x ] x ' ]} = 0
EyEx[xE[y|x]] EyEx[xx] = 0
EyEx[xE[y|x]] EyEx[xx] = 0
y

Qual o estimador que minimiza o erro quadrtico mdio?


R: , que veremos que ele igual a b, o estimador de mnimos quadrados .

_________________________Notas
Notas de aula de econometria I , Profa. Marina Silva da Cunha 6

Sabe-se que:
EyEx[xE(y|x)] = cov[x, E(y|x)] + E[x]
E Ex[E(y|x)]
= cov[x, y] + E[x] E[y]
E
= ExEy [xy]
Portanto, a condio necessria (quando a 1. derivada igual a zero) para
o mnimo
ExEy [xy
xy] = ExEy[xx]
que igual (4-1), ou seja

(4-3)

= b. Portanto, se as esperanas existem, podem ser

obtidas por (4-2), o que significa que, considerando a forma de mdia


condicional, o estimador de mnimos quadrados um estimador cujos
coeficientes produzem o preditor com o menor erro quadrtico mdio. Essa
condio necessria pode ser melhor explicitada:
explicitada

TEOREMA 4.1 PREDITOR COM O MENOR ERRO QUADRTICO MDIO


Se o mecanismo gerador dos dados (xi, yi) i = 1, ..., n tal que a
lei dos grandes nmeros se aplica ao estimador (4-2) na forma
matricial (4-1), ento o preditor linear de menor erro quadrtico
mdio de yi o estimador de mnimos quadrados.

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 7

4.2.3 ESTIMADOR LINEAR NO-VIESADO


NO
DE VARINCIA
MNIMA
(Seo 4.3.5)
4.3 PROPRIEDADES FINITAS DO ESTIMADOR DE MNIMOS
QUADRADOS
EXEMPLO 4.1 Distribuio amostral do estimador de mnimos quadrados
Gerar uma amostra aleatria de 10.000
000 observaes de Wi e Xi ~ N(0,1)
Depois, obter i e yi, a populao
i = 0,5Wi
yi = 0,5 + 0,5xi + i
Obter 500 amostras aleatrias, com 100 observaes cada dessa populao
Calcular b em cada amostra
Na figura 4.1:

b est prximo de 0,5 [no-viesado]

H varincia nos resultados, indicando que os dados so aleatrios

________________________Notas
Notas de aula de econometria I , profa. Marina Silva da Cunha 8

4.3.1 ESTIMADOR NO-VIESADO


VIESADO
b = (XX) 1Xy
= (XX) 1X(X
+ )
= (XX) 1XX
+ (XX) 1X
I
= + (XX) 1X
X

E[b|X] = + E[(XX) 1X]

por A3 exogeneidade dos Xs

E[b|X] =
Entretanto,
E[b] = Ex{E[b|X]}
]} = Ex[]=
Assim, para qualquer conjunto de observaes, o estimador de mnimos
quadrados tem esperana . Alm disso, atravs da mdia de b dos possveis
valores de X, obtemos a mdia incondicional de b que tambm .

__________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 9

4.3. 2 VIS CAUSADO PELA OMISSO DE VARIVEIS


RELEVANTES
Considere o modelo de regresso
y = X +

(4-7)

Supondo que o modelo corretamente especificado seja


y = X11 + X22 +
em que as duas partes de X tenham K1 e K2 colunas, respectivamente.
Se regredirmos y sobre X1 sem incluir X2, ento o estimador ser
b1 = (X1X1)1X1y = 1 + (X1X1)11X1X22 + (X1X1)1X1
Tomando a esperana, a menos que X1X2 = 0 ou 2 = 0, b ser
viesado, pois
E[b1|X] = 1 + P1.22

(4-10)

em que, P1.2 = (X1X1)1X1X2


Matriz K1 x K2 com as inclinaes em cada coluna da regresso de X2
sobre X1.
Exemplo 7.1 Varivel omitida (renda, cujo coeficiente b) na
equao de demanda
Cov[ price, income]
E [b | price, income] = +

Var [ price]
Quando h apenas uma varivel omitida ou includa fcil verificar a
direo do vis. No entanto, se mais que uma varivel includa ou
excluda fica mais difcil.

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 10

4.3.3 INCLUSO DE VARIVEL IRRELEVANTE


Se o modelo de regresso corretamente dado por
y= X11 +

(4-12)

mas estimamos (4-8)


y = X11 + X22 +
Estimar (4-8)
8) equivalente a estimar (4-12)
(4
com a restrio de que 2=0.


Com isto, = 1 ser um estimador no-viesado,
no
considerando a
2
restrio
Assim,


E [b | X] = 1 = 1
2 0

(4-13)

Ento, onde est o problema? Reduz a preciso das estimativas.


A incluso de X2 (quando a correlao entre X2 e X1 0) ir inflar a
varincia do estimador

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 11

4.3.4

VARINCIA

DO

ESTIMADOR

DE

MNIMOS

QUADRADOS
Anlise para
X no-estocstico ou [situao experimental em que o pesquisador escolhe X]
X estocsticos, utilizando a anlise condicional e a mdia dos valores
observados de X
Utilizando (4-4)
+ )
b = (XX) 1X(X
b = + (XX) 1X
X

b = (XX) 1X

b = + A
funo linear dos erros
estimador linear e no viesado de
V [b|X] = E[(b )) (b )|X]
= E[(XX) 1X X(XX) 1|X]
1
= (XX) 1XE[|X]X(XX)
X

= (XX) 1X(
X 2I)X(XX) 1
= 2(XX) 1XX(XX) 1
I
= 2(XX) 1

(4-15)

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 12

EXEMPLO 4.3 Varincia amostral para um modelo com 2 variveis, 2(XX) 1


:

var[b | x] = var[b | x] =

( xi x )

Quanto maior a variao de x, menor ser a var [b|x].


Agora, vamos obter um resultado geral para a classe dos estimadores
lineares no-viesados

4.3.5 O TEOREMA DE GAUSS-MARKOV


MARKOV
GAUSS
TEOREMA 4.2 TEOREMA DE GAUSS-MARKOV
No modelo clssico de regresso linear com matriz de
regressores X, o estimador de mnimos quadrados b um
estimador linear no-viesado
viesado de varincia mnima de . Para
qualquer vetor de constantes w, o estimador linear no-viesado
de varincia mnima de w no modelo clssico de regresso
linear wb, em que b o estimador de mnimos quadrados.
Seja, b0 = Cy

com C uma matriz k x n e b0 um outro estimador linear

no-viesado de .
Ento,
E[Cy|X] = E[(CX
+ C)|X] =
com y = X + e CX = I
Portanto, existem muitos candidatos, por exemplo, as primeiras k linhas de
X. ou seja:
C = [X01:0], em que X01 a inversa das k primeiras linhas de X

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 13

A matriz de covarincia pode ser obtida utilizando igual a:


var[b0 |X]= 2CC,
CC ou seja,
b0 = Cy = C(X
X + )
= CX + C
C
I

b0 = + C

b0 = C

Com isso,
var[b0 |X] = E[(b0 )(b0 )|X] = E[CC|X]
var[b0 |X] = 2CC
Agora, vamos construir a diferena entre b0 e b.
D = C (XX)11X ou C = D + (XX)1X
Alm disso,
Dy = (C (XX)11X)y = Cy (XX)1Xy = b0 b
Voltando,
var[b0 |X] = 2CC
= 2[(D + (XX)1X)) (D + X (XX)1)]
= 2[(DD + DX(XX
XX)1 + (XX)XD + (XX)1XX(XX)1)]
I
XX
mas, como CX = I CX = DX + (XX)1
.. DX = 0
I
Portanto,
] = 2(XX)1 + 2DD
var[b0 |X] = 2 [DD + (XX)1
= var[b |X] + 2DD
uma forma quadrtica (no-negativa)
DD = qDDq = ZZ 0
Ento,
var[b0 |X] var[b||X]
Assim, b o melhor estimador linear no-viesado de , a medida que
possui varincia mnima.

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 14

4.3.6 IMPLICAES DE REGRESSORES ESTOCTICOS

A anlise anterior condicional aos dados obtidos. Como obter as


propriedades no-condicionais de b?
- Primeiro obtemos o resultado condicional para X e, depois o
resultado no-condicional,
condicional, atravs da mdia da distribuio
condicional, por exemplo, por integrao.
A varincia condicional de b
var[b |X] = 2(XX
XX)1
Decompondo a varincia por B-69, p. 1008,
1008 temos a varincia no-condicional
var[b] = EX[var[b||X] + varX[E[b|X]]
o segundo termo zero, pois E[b|X] = e no varia. Assim,
var[b] = EX[2(XX
XX)1]
= 2EX[(XX
XX)1] A varincia no condicional de b
depende dos valores [mdia e
varincia] dos Xs.

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 15

Na seo 4.4, foi visto que


var[b|X] var[b0 |X]
|
para qualquer b b0 e, para um X especfico em nossa amostra.
var[b] = Ex[var[b|X
X]]
portanto, se essa caracterstica se mantm para um X especfico, se mantm os
valores mdios. Com isso, os resultados do Teorema de Gauss-Markov so
mantidos, se os regressores so ou no so estocsticos.

TEOREMA 4.3 TEOREMA DE GAUSS-MARKOV


GAUSS
(concluso)
No modelo clssico de regresso linear, o estimador de mnimos
quadrados, b, o estimador linear no-viesado de varincia
mnima de , se X estocstica ou no-estocstica, mantendo as
demais suposies do modelo.
modelo

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 16

4.3.7 ESTIMANDO A VARINCIA DO ESTIMADOR DE


MNIMOS QUADRADOS
Para realizar testes de hipteses e intervalos de confiana de precisamos
de uma estimativa para a matriz de varincias e covarincias

var[b|X] =

2(XX)1, precisamos de um estimador para o parmetro 2.


E[i2] = 2

i = ei
Por analogia

2 =

1
n

ei2

um estimador natural.

Mas os resduos de mnimos quadrados um estimador imperfeito para i, como


veremos
ei = yi xib
= xi
+ i xib
= i xi(b )
O resduo de mnimos quadrados
e = My = M [X + ] = M ,

pois MX = 0

Um estimador de 2 ser baseado na soma dos quadrados dos resduos


ee = M
M
Aplicando esperana
E[ee] = E[M]

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 17

Como M uma matriz 1 x 1, igual ao seu trao. Pela regra da permutao


(A-94)
E[tr(M)|X] = E[tr(
[tr(M)|X]
Da M uma funo de X, o resultado
M2I) = 2tr(M)
tr(M E[|X]) = tr(M
Mas,
tr(M) = tr(In X(XX)1X) = tr [In] tr [X(XX)1X]
= tr [In] tr [(XX)1X X]
= tr [In] tr [Ik] = n k
Ento,
E[ee|X] = (n k)2

assim, o estimador natural viesado, mas esse vis se reduz quadro n aumenta.
Um estimador no-viesado de 2 , portanto

s2 =

e' e
nk

(4-17)

estimador no-viesado e incondicional, pois

E[ s 2 ] = Ex {E[ s 2 | X]} = Ex
E[e' e | X] = Ex
(n k ) 2 = Ex { 2 } = 2
n k

n k

como, E[s2] = 2, ento a


estimativa da var[b|X] = s2(XX)1
O erro-padro do estimador de bk a raiz quadrada da diagonal principal de
s2(XX)1

sk = {[ s 2 ( X' X) 1 ]kk }1/ 2

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 18

4.3.8 A SUPOSIO DE NORMALIDADE

At o momento, a especificao e a anlise do modelo de regresso foi


semi paramtrica.


No foi assumido a suposio A6 [TABELA 4.1]

Essa suposio til para a construo de testes de hiptese

Em (4-4), b funo linear do vetor .

Assumindo que segue uma distribuio normal multivariada, tm-se


b|X ~ N(,
N( 2(XX)1)

(4-18)

Para cada bk
bk|X ~ N(k, 2(XX)kk1)

Na seo 4.4, veremos como obter uma distribuio aproximadamente


normal para os bs com ou sem a suposio A6, de normalidade em .

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 19

4.4 PROPRIEDADE DE GRANDES AMOSTRAS PARA OS


ESTIMADORES DE MNIMOS QUADRADOS
Ver a Tabela 4.1 com as propriedades de pequenas amostras para o estimador de
mnimos quadrados, em que os resultados gerais em pequenas amostras para

b e s2 os estimadores de e 2 :
E[b|X] = E[b] = o estimador de mnimos quadrados no viesado
E[s2|X] = E[s2] = 2
1]
Var[b|X] = 2(XX)1 e Var[b] = 2E[(XX)
E

Teorema de Gauss-Markov: o MVLUE de w wb, para qualquer vetor de


constantes, w.
Considerando a suposio de normalidade, que no essencial, tem-se que a
distribuio de
b|X ~ N[ , 2(XX
XX)1]
A suposio de normalidade ser retomada na Seo 4.4.6 e no Cap. 14.

Resultados desse tpico:


Consistncia de b
Normalidade de b
Consistncia de
Eficincia de b
assinttica

s2

plim b =
a
2 1
b ~ N , Q
n

plim s =
2

2 X' X

2 1
= Q
n

 plim s

Consistncia + Normalidade + menor varincia


assinttica

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 20

4.4.1

CONSISTNCIA DOS

ESTIMADORES

DE

MNIMOS

QUADRADOS DE
Seja o processo gerador de X no especificado, ou seja, X pode ser um misto
de constantes ou variveis aleatrias, gerados independentemente do processo que
gera .
Faamos 2 suposies:
1 Modificamos a suposio A5 {Tabela 4.1]
A5a. (xi, i) i = 1, ..., n uma seqncia de observaes independentes
2 Referente ao comportamento dos dados em grandes amostras
X' X
=Q
[uma matriz definida positiva] (4-20)
n

plim
n

Assim, o estimador de mnimos quadrados pode ser reescrito


1

X' X X'
b = +

n
n

(4-21)

Se Q1 existe, podemos aplicar o limite em probabilidade

X'
plim b = + Q 1plim

Rearranjando o ltimo termo

1
1 n
1
X' = xi i = w i =w
n
n i =1
n
Substituindo na equao anterior

plim b = + Q 1plim(w )

(4-22)

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 21

utilizando

A3

E[ w ] = 0

pois ,

E[w i ] = Ex [ E[w i | Xi ]] = Ex [xi E[ i | X]] = 0


uma vez que X exgena por A3

utilizando B-70

var[w ] = E[var[w | X]] + var[E[ w | X]]


O segundo termo zero, pois E [w | X] = 0.. Assim,

X 2 X' X
X' ' X X'
= E[var[w | X ]] = E
| X = E[' | X] =

n
n n
n n
n

2 X' X

lim var[w ] = lim n


n

= 0.Q = 0
n

Como a mdia de w igual a zero e sua varincia converge para zero,


dizemos que w converge em mdia quadrtica para zero e
Assim,
e, voltando

plimw = 0

X'
plim w = plim
=0
n
plim b = + Q -1 0 =

plim b =

(4-25)

Utilizando A1 A4 e a suposio adicional (4-21), mostramos que b um


estimador consistente de no modelo clssico de regresso linear.

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 22

4.4.2 NORMALIDADE ASSINTTICA DO ESTIMADOR DE


MNIMOS QUADRADOS
Utiliza D3 e A3 (observaes independentes dos distrbios)
Reescrevendo (4-22)

X' X X'
b = +

n
n

(4-21)

X' X 1 1
(n) 2 (b ) = ( n) 2
X'
n
n

X' X 1
n (b ) =
X'

X'
n
n

(4-26)

Se a matriz inversa uma funo contnua da matriz original, ento


1

X' X 1
1 1
p lim

X' = Q
X'
n
n
n

(4-27)

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 23

Precisamos estabelecer o limite em distribuio de

X' = n ( w E[ w ])
n
Ver (4-23), em que E[ w ] = 0 . Para obter a distribuio de

(4-28)

nw ,

w pode

ser

utilizado a verso multivariada do Teorema Central do Limite [D.19.A]. Assim,


a mdia de n vetores aleatrios w i = x i i

com mdia zero e varincia,

var[x i i ] = E[x i i i ' x i ' ] = 2 E[x i x i ' ] = 2Q i


varincia de

(4-29)

n w :

1
n

2 Qn = 2 [Q1 + Q 2 + K + Q n ]

(4-30)

Mas

lim
n

Qn = 2Q

(4-31)

Em termos matriciais [multivariado].


[multivariado] Se [xii], i = 1, ..., n so vetores
independentemente distribudos com mdia 0 e varincia 2Qi< , ento

X'
n

N [0, 2Q]

(4-32)

E, segue que
1

d
1
1
1
2
1
Q
X' N [Q 0, Q ( Q)Q ]
n

(4-33)

Combinando os termos
d

n (b ) N [0, 2Q 1 ]

(4-34)

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 24

Utilizando a tcnica da seo D3, obtemos a distribuio assinttica de b.

TEOREMA 4.4 DISTRIBUIO ASSINTTICA DE b COM OBSERVAES


INDEPENDENTES
Se {i} so distribudos independentemente com mdia zero e
varincia finita 2 e xik so tais que as condies de Grenander
so obedecidas, ento

2 1
b ~ N , Q
n

(1n )Q1 com


Na prtica, necessrio estimar

(4-35)

(XX)1

e
2

com

e' e
nk

Se normalmente distribudo, o resultado 4-18 mantm-se em cada


amostra e, ento, assintoticamente ele se mantm tambm. A importante
implicao dessa derivao que se os regressores so bem comportados e as
observaes so independentes, ento a normalidade assinttica do estimador de
mnimos quadrados no depende da normalidade dos erros, uma conseqncia do
Teorema Central do Limite. Sero considerados casos mais gerais nas sees
seguintes.

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 25

4.4.3 CONSISTNCIA DE s2 E O ESTIMADOR DA VARINCIA


ASSINTTICA [b]
Para completa derivao das propriedades assintticas de b necessrio um
estimador da var. assi. [b] =

n
1
s =
' M
nK

Q 1 dado por:

, veremos que consistente

ou

s2 =

1
[ '[I X( X' X) 1 X' ]]
nK

1
n
[' ' X( X' X) 1 X' ]
nK
n

1
n ' ' X X' X X'
=

n k n
n n n

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 26

Considerando algumas suposies [(4-21),(4-24)] e a regra do produto para


o limite em probabilidade [Teorema D..14], o segundo termo converge para 0.

n
Alm disso, a constante

n K

primeiro termo

converge para 1. Assim, considerando o

2 =

1
i2

2
o qual converge em probabilidade
para
plim
s 2=,ou2 seja

Q1

2 X' X

2 1
= Q
n

Ps-multiplicando porplim s

ou

Por fim, o

2 X' X

2 1
s
= Q
n

Est. Assin. var[b] = s2(XX)1

estimador da matriz de covarincia assinttica de b

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 27

4.4.4 DISTRIBUIO ASSINTTICA DE UMA FUNO DE b:


O MTODO DELTA
TEOREMA 4.5 DISTRIBUIO ASSINTTICA DE UMA FUNO DE b
Se (b) um conjunto contnua e uma funo continuamente
diferencivel de b tal que =
mantm, ento

f ( )
'

e o Teorema 4.4 se

2 1
f (b) ~ N f ( ), Q '
n

(4-36)

Na prtica, o estimador da matriz de covarincia assinttica ser


Est. Assint. Var[(b)] = C[s2(XX)1]C

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 28

4.4.5 EFICINCIA ASSINTTICA


DEFINIO 4.1 EFICINCIA ASSINTTICA
Um estimador assintoticamente eficiente se ele consistente, com distribuio
assintoticamente normal e tem uma matriz assinttica de covarincia que no
maior que a matriz assinttica de covarincia de qualquer outro estimador
consistente e normalmente distribudo.

4.4.6 ESTIMADOR DE MXIMA VEROSSIMILHANA

Gauss- Markov:
ML:

Estimador Linear e No-viesado


Com distribuio normal dos erros, estimador com
distribuio assintoticamente normal.

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 29

4.5 ESTIMAO POR INTERVALO


A estimao por intervalo tem como objetivo obter a melhor estimativa
de um parmetro como uma expresso explicita da incerteza dessa estimativa.

variabilidade da amostra
Nvel de confiana: (1- )

4.5.1 FORMANDO O INTERVALO DE CONFIANA DE UM


COEFICIENTE
Para 2 conhecida, assumindo normalidade, de (4-18)

b|X ~ N[ , 2(XX)1]
Para qualquer elemento de b,

zk =

bk k

(4-38)

2 S kk
elemento da diagonal principal

Com um nvel de confiana de 95% sabemos que

Prob ( 1,96 zk +1,96 )

Prob bk 1,96 2 S kk k bk + 1,96 2 S kk = 0,95

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 30

Para 2 desconhecida, utilizamos s2 e a estatstica:

tk =

bk k
~ t(1 / 2 ,nk )
2
kk
sS

(4-41)

Que pode ser empregada em testes de hiptese e intervalos de confiana de :

Prob bk t(1 ,n K ) s 2 S kk k bk + t(1 ,n K ) s 2 S kk = 1


2
2

(4-42)

EXEMPLO 4.8 Intervalo de confiana para a elasticidade renda da


demanda por gasolina
Exemplos 4.2
e 4.4

n = 52
 n k = 47
k=5

t(47,5%) = 2,012
bilateral

Para o coeficiente da renda


012(0,07771)  [0,9395; 1,2522]
1,095874 2,012
ou seja, com 95% de confiana, 3 est nesse intervalo

4.5.2 INTERVALO DE CONFIANA PARA AMOSTRAS


GRANDES

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 31

4.5.3 INTERVALO DE CONFIANA PARA UMA COMBINAO


LINEAR DE COEFICIENTES:
COEFICIENTES A DECOMPOSIO E
OAXACA
Estendendo o resultado anterior, pode-se mostrar como formar um
intervalo de confiana para uma funo linear dos parmetros.
Aplicao

freqente:

decomposio de Oaxaca
(1973) e Blinder (1973)
Seja w um vetor k x 1 de constantes conhecidas
Ento, a combinao linear c = wb normalmente distribuda
c = wb ~ N( = wb, c2 = w[
w 2(XX)1]w)

c2 = sc2 = w[ s 2 ( X X) -1 ]w
Portanto, o intervalo de confiana para :

Prob c t sc c + t sc = 1

2
2
ver aplicao.

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 32

4.6 PREVISO
4. 6. 1 INTERVALO DE PREVISO
Aps a estimao dos parmetros, um uso comum da regresso para a previso.
Supondo que vamos prever o valor de y0 associado ao vetor x0. Este valor ser
y0 = X0 + 0
e segue o Teorema de Gauss-Markov que
0 = X0b

(4-45)

o estimador linear no-viesado de varincia mnima de E = [y0|x0]. O erro de


previso :
e0 = y0 0 = X0 + 0 X0b
= ( b)X0 + 0
A varincia da previso para ser aplicada ser, se a regresso possui intercepto
var [e0 |X, X0] = 2 + var[( b)X0 |X, X0]
= 2 + X0 [2(XX) 1] X0
Se a regresso no possui o intercepto tem-se:
tem

1 K 1K 1 0

0
0
jk
var[e ] = 1 + + ( x j x j )( xk xk )(Z' M Z)
n j =1 k =1

em que Z possui K 1 colunas [sem a constante], que mostra que o intervalo


depende da distncia de X0 da mdia dos dados.
O intervalo de previso dado por
intervalo de previso = 0 t/2 se(e0)

(4-48)

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 33

4.6.2 PREVISO DE Y QUANDO


REGRESSO UTILIZA LOG Y

MODELO

DE

4.6.3 INTERVALO DE PREVISO QUANDO O MODELO DE


REGRESSO UTILIZA LOG Y
4.6.4 PREVISO
Se x0 tambm desconhecido, existem outras medidas da previso
Raiz do erro quadrado mdio =

1
2

(
y

y
)

i
i
n0 i

RMSE =
e do erro absoluto mdio

MAE =

1
( yi y i )
0
n

Estatstica U de Theil

U =

(1

n so os perodos na previso

) ( y y )
(1 n ) y

n0

ou esta medida nas diferenas

(1 n ) ( y y )
(1 n ) ( y )
0

U =

i
0

y = y i y i 1

ou em %

y = y i y i 1 / y i 1

idem para y

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 34

4.7 PROBLEMAS NOS DADOS


Multicolinearidade; valores perdidos;
perdidos erros de medida.

4.7.1 MULTICOLINEARIDADE
O Teorema de Gauss-Markov estabelece que entre todos os estimadores
lineares no-viesados, o estimador de mnimos quadrados tem a menor varincia


til, mas no garante uma menor varincia em sentido absoluto

Para um modelo com duas variveis explicativas


A varincia de qualquer coeficiente de inclinao :

Var[bk | X] =

2
(1 r122 )

n
(x
i =1 ik

xk )

2
(1 r122 ) S kk

(4-52)

Se as duas variveis so perfeitamente correlacionadas (r12 = 1),


ento, a varincia infinita.
infinita H a violao de um pressuposto do
modelo de que no h problemas nos dados (posto completo).

Se as duas variveis so altamente, mas no perfeitamente


correlacionadas, o que mais comum, o modelo no viola nenhum
pressuposto, mas ocorrem vrios problemas estatsticos:

Pequenas mudanas nos dados produzem grandes mudanas nos


parmetros estimados

Erro-padro alto, nveis de significncia baixo e R2 alto

Os coeficientes podem ter um sinal errado

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 35

Para um modelo com duas ou mais variveis explicativas

var[bk | X] =

2
(1 Rk2 )

i =1( xik xk ) 2
n

(4-20)

R2 de uma regresso de xk (uma varivel


explicativa)

contra as

demais

variveis

explicativas
explicativas.
Ingredientes para a preciso dos estimadores de mnimos quadrados

Mantendo as demais caractersticas constantes


a

correlao

de

xk

com

as

demais

variveis,

varincia,

multicolinearidade.

Mantendo as demais caractersticas constantes


a variao em xk,

a varincia.
varincia

Mantendo as demais caractersticas constantes


o ajustamento,

varincia.

Como dados ortogonais so raros (Rk2 = 0), comum alguma


multicolinearidade.

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 36

EXEMPLO 4.11

Multicolinearidade nos dados de Longley

O que ocorre com as estimativas quando uma observao retirada!

Quando a multicolinearidade ser um problema?


Diagnosticar multicolinearidade para cada varivel com

VIF =

1
(1 Rk2 )

Fator de Inflao da Varincia

Outra medida o nmero condicional de XX = Raiz quadrada da maior


raiz caracterstica de XX. No deve exceder 20.
No Exemplo 4.11 foi igual a 15.000
O que fazer na presena de multicolinearidade

Obter mais informaes [no necessariamente mais observaes]

Retirar uma varivel colinear

Utilizar componentes principais

O diagnstico permite distinguir

Mau modelo (foi includo variveis colineares)

Mau conjunto de dados (pouca variabilidade)

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 37

4.7.2 ESTIMAO PR TESTE


Supondo que o modelo corretamente especificado seja
y = X11 + X22 +
em que as duas partes de X tenham K1 e K2 colunas, respectivamente. Se
regredirmos y sobre X1 sem incluir X2, ento o estimador ser
b1 = (X1X1)1X1y = 1 + (X1X1)1X1X22 + (X1X1)1X1
Tomando a esperana, apenas se X1X2 = 0 ou 2 = 0, b1 ser no-viesado, ou seja
E[b1|X] = 1 + P1.22
em que, P1.2 = (X1X1)1X1X2 , uma matriz K1 x K2 com as inclinaes em cada
coluna da regresso de X2 sobre X1.
A varincia de b1 dada por
Var[b1|X] = 2(X1X1)1
mas a correta varincia de b1, quando inclumos X1 e X2
Var[b1.2|X] = 2(X1M2X1)1
onde

M2 = [I X2(X2X2)1X2]

X X ] 1
ou var[b1.2|X] = 2[X1X1 X1X2(X2X2)1
2
1

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 38

Comparando as duas matrizes [ mais fcil pelas suas inversas, ver A-120]
A
Var[b1|X] var[b1.2|X] 1 = (1/2)X1X2(X2X2)1X2X1
que definida no-negativa.. Assim, embora b1 seja viesado, sua varincia
menor que a de b1.2.
Supondo que X1 e X2 so cada uma, uma simples coluna ou apenas uma varivel,
mensuradas como desvios da mdia. Ento,
em que
e

Var[b1.2|X] = 2[x1x1 x1x2(x2x2)1x2x1] 1

S11 1 r122
em que aparece o quadrado do coeficiente de correlao linear entre x1 e x2.
Quanto maior a correlao de x1 e x2 maior a varincia de b1.2 comparado com b1.
possvel que b1 seja um estimador mais preciso de b1.2, pelo critrio do erro
quadrado mdio.

O que fazer?
Estimador Pr teste

- Se o teste t da varivel includa alto,


ento a mesma fica
- Se o teste t baixo, deve ser omitida

Os pesquisadores adotam, especialmente quando h suspeita de multicolinearidade

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 39

4.7.3 COMPONENTES PRINCIPAIS


4.7.4 VALORES PERDIDOS E CORREO
Falta alguma observao
Algumas variveis com dados mensais e outras variveis com dados
trimestrais [exemplo]
2 casos
1) caso ignorado
entrevistado se recusa a dar alguma informao]
2) dado no declarado [entrevistado

Na regresso mltipla
Na regresso simples [X = coluna de 1s + varivel]
 Colocar a mdia de X,

x , quando no h informao
1 para x = 0

 X (com zeros) + coluna


0 para o caso contrrio
 Colocar valores estimados p/ x [

x ], obtidos de uma regresso de x contra y


no um bom procedimento

________________________Notas
Notas de aula de econometria I, Profa. Marina Silva da Cunha 40

4.7.5 ERRO DE MEDIDA


Erro de medida em y
Erro de medida em X
4.7.6 OBSERVAES DISCREPANTES

Observaes influentes: fonte de impacto no coeficiente estimado, altera


a inclinao.
inclinao
Obter

h ii= xi (Xi Xi) 1 xi

observao i

(4-60)

Em que Xi no inclui a observao .


se h ii > 2 (k-1)/n

ento a observao pode ser excluda

Outliers: aparentemente gerado por outro conjunto de dados


ei
e(i) =
(1 hii )

se e(i) > 2

ee ei2 /(1 hii )


n 1 k

~ t (n-1-k )

ento a observao pode ser excluda

You might also like