You are on page 1of 31

Noes de Econometria com Gretl

Carlos Antnio Soares de Andrade Professor de Economia Universidade Federal de Campina Grande prf.cantonio@gmail.com 2011

Sumrio
1 Introduo 1.1 O que econometria . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Caractersticas dos dados econmicos . . . . . . . . . . . . . . . 1.3 Fonte dos dados . . . . . . . . . . . . . . . . . . . . . . . . . . . Introduo ao Gretl 2.1 Instalao . . . . . . . . . . 2.2 Entrada de dados . . . . . . 2.3 Importao de dados . . . . 2.4 Anlise dos dados . . . . . . 2.4.1 Estatstica descritiva 2.4.2 Correlao . . . . . 2.4.3 Exerccio prtico . . 1 1 4 5

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

6 . . 6 . . 7 . . 8 . . 8 . . 9 . . 15 . . 17

Regresso linear simples 19 3.1 Uma aplicao no Gretl . . . . . . . . . . . . . . . . . . . . . . . 20 3.1.1 Diagnstico da regresso . . . . . . . . . . . . . . . . . . 21 27

Bibliograa

Lista de Figuras
2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11 2.12 2.13 3.1 3.2 Tela inicial do Gretl . . . . . . . . . . . . . . . . . Menu Arquivo do Gretl . . . . . . . . . . . . . . . Selecionando a entrada manual de dados . . . . . . Janela para informar nmero de observaes . . . . Janela para informar a estrutura dos dados . . . . . Tela para conrmao da estrutura de dados. . . . . Tela para informar o nome da primeira varivel . . Tela de insero dos dados . . . . . . . . . . . . . Seqencia para importao de dados . . . . . . . . Dados da Companhia MB importados para o Gretl . Estatsticas descritivas da varivel salrio . . . . . Histograma da varivel salrio . . . . . . . . . . . Diagrama de caixa com as variveis salrio e idade. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 8 9 9 9 10 10 10 11 12 12 15 15

Resultados do Modelo de Mnimos Quadrados Ordinrios. . . . . 20 Intervalos de conana para os coecientes. . . . . . . . . . . . . 21

ii

Lista de Tabelas
2.1 2.2 2.3 3.1 3.2 Dados hipotticos. . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Valores do coeciente de correlao e qualicao da correlao. . 17 Dados para exerccio prtico . . . . . . . . . . . . . . . . . . . . 18 Mdia de notas escolares e renda familiar . . . . . . . . . . . . . 20 Esquema de asteriscos e nveis de signicncia no Gretl. . . . . . 23

iii

Captulo 1 Introduo
O presente texto rene notas de aula da disciplina Econometria I, ministrada no curso de Cincias Econmicas da Universidade Federal de Campina Grande. Voltado no s para os alunos que se matriculam nesta disciplina, mas tambm para qualquer pessoa interessada em aprender a interpretar dados estatsticos sobre a realidade econmica do Brasil e internacional. A ferramenta bsica um modelo economtrico que alia fundamentos da teoria econmica com a tcnica estatstica da anlise de regresso. O modelo explica o comportamento de uma ou diversas variveis econmicas. O curso tem um carter eminentemente aplicado, onde exemplos prticos servem para introduzir conceitos de anlise emprica e economtrica. Um aspecto importante do curso que os alunos so treinados no uso de um software economtrico: o pacote economtrico Gretl, que usa licena open source e que vem sendo adotado nos principais centros de ensino e laboratrios de econometria do mundo. No h pretenso de substituir os manuais consagrados de econometria, mas servir de auxiliar ao processo de aprendizagem. Os exemplos sero resolvidos passo-a-passo com o pacote economtrico referido acima.

1.1

O que econometria
O principal objetivo da econometria dar contedo emprico ao raciocnio econmico apriorstico. Este raciocnio apriorstico composto, principalmente, pelo que chamamos de teoria econmica. Mas podem servir tambm como estrutura e objeto da anlise econmica as descries gerais no quantitativas das instituies econmicas e 1

Segundo o prmio Nobel de Economia, Lawrence Klein [8],

CAPTULO 1. INTRODUO seu funcionamento inter-relacionado, desde que as proposies apriorsticas possam ser colocadas em forma matemtica. Conforme o economista Jeffrey M. Wooldridge [11], A econometria baseada no desenvolvimento de mtodos estatsticos para estimar relaes econmicas, testar teorias, avaliar e implementar polticas de governo e de negcios. A aplicao mais comum da econometria a previso de importantes variveis macroeconmicas, tais como taxas de juros, taxas de inao e produto interno bruto (PIB). Ainda que as previses de indicadores econmicos sejam bastante visveis e, muitas vezes, extensamente publicadas, os mtodos economtricos podem ser usados em reas econmicas que no tm nada a ver com previses macroeconmicas.

A econometria tem sido usada em campos de estudo da cincia poltica (efeitos de gastos em campanhas polticas sobre os resultados de eleies), da educao (efeito de gastos pblicos com escolas sobre o desempenho de estudantes) e outros. ,portanto, a combinao de teoria econmica, estatstica e, nos dias atuais, cincia da computao [5]. A teoria econmica proporciona a base para identicar as variveis econmicas importantes. Para se estruturar uma anlise econmica emprica, o primeiro passo a formulao cuidadosa da questo de interesse, segundo Wooldridge [11]. A questo de interesse ou problema pode se referir a um aspecto da teoria para ser testado ou os efeitos de uma poltica governamental. Os mtodos economtricos podem ser aplicados para responder a uma gama de questes. Um estudo de economia aplicada segue um uxo de tarefas constitudas das seguintes etapas: formulao do problema, coleta de dados, especicao do modelo economtrico, estimao dos parmetros desconhecidos do modelo, diagnstico do modelo estimado, re-especicao do modelo se necessrio e, por m, aplicao do modelo. Formulao do problema. A formulao do problema muito importante para a especicao do modelo economtrico: denio das variveis dependente e independente, forma funcional do relacionamento entre estas variveis e quantidade e disponibilidade dos dados para a anlise. Na opinio do professor Philip Hans Franses [4], a econometria no se restringe a validar ou testar teorias. O econometrista tambm pode descobrir novas regularidades estatsticas de dados econmicos. Na tarefa de validar ou no uma teoria, os dados disponveis podem no permitir rejeitar a hiptese. A teoria econmica frequentemente se refere ao longo prazo, contudo

CAPTULO 1. INTRODUO

focar no curto-prazo pode ser mais frutfero. Para a questo so os carros mdios igualmente caros no Japo e nos Estados Unidos, aps o ajuste da taxa de cmbio ente esses dois pases?, parece ser uma formulao melhor do que a hiptese da paridade do poder de compra permanece para o Japo e os EUA?. Coleta dos dados. Nesta etapa alguns cuidados so necessrios. Concentrarse em coletar dados estatsticos relevantes para a soluo da questo de interesse. Atentar para o fato de que diferentes denies embasam a coleta e publicao de dados por diferentes instituies pblicas e privadas como IBGE, FIESP, FGV, IPEA, e outras. H problemas tambm concernentes disponibilidade dos dados: dados faltantes, interrupo da srie de coleta, credibilidade da fonte. Especicao do modelo economtrico. Esta etapa depende das duas anteriores. Aps a reviso da teoria e da coleta dos dados relevantes questo de interesse, passa-se declarao da hiptese de pesquisa e especicao matemtica e estatstica do modelo. Segundo Hill [5], a teoria econmica no objetiva prever o comportamento especco de um indivduo ou rma, mas descreve o comportamento mdio ou sistemtico de muitos indivduos. Um exemplo a clssica formulao de Keynes [7] da relao entre consumo e renda: A lei psicolgica fundamental em que podemos basear-nos com inteira conana, tanto a priori, partindo do nosso conhecimento da natureza humana, como a partir dos detalhes dos ensinamentos da experincia, consiste em que os homens esto dispostos, de modo geral e em mdia, a aumentar o seu consumo medida que a sua renda cresce, embora no em quantia igual ao aumento de sua renda Embora Keynes no tenha especicado a relao funcional entre renda e consumo, cou estabelecida nos estudos economtricos a relao linear entre as duas variveis, como na equao Y = 1 + 2 X + (1.1)

Onde Y a despesa de consumo, X a renda e 1 e 2 so os parmetros a serem estimados, respectivamente, coeciente de intercepto e coeciente de inclinao. O parmetro o componente aleatrio, chamado tambm erro aleatrio. Esse componente incorpora as demais variveis no consideradas na funo e outros fatores.

CAPTULO 1. INTRODUO Estimao dos parmetros do modelo.

A equao 1.1 acima um modelo economtrico cujos parmetros 1 e 2 , desconhecidos sero estimados por algum mtodo da estatstica matemtica. Dentre os mais utilizados tem-se o mtodo da anlise de regresso e o mtodo dos mnimos quadrados ordinrios. Dada a evoluo recente da econometria e a disponibilidade de computadores para cada pesquisador individual, esta tarefa vem sendo realizada com o auxlio dos softwares chamados pacotes estatsticos. Dentre eles o Gretl. Diagnstico do modelo. Uma vez especicado o modelo, e tendo os valores estimados dos parmetros o momento de avaliar se o modelo coerente com os pressupostos tericos e a percepo do analista. Consiste esta etapa na aplicao de vrios testes de hipteses sobre os parmetros estimados e no modelo completo, objetivando vericar se foi bem especicado. Enm, busca-se responder s questes: as variveis explicativas eram todas importantes? Utilizou-se a forma funcional correta? Qual o grau de explicao do modelo? No se obtendo respostas satisfatrias, procede-se mudana do modelo aproveitando o conhecimento obtido da primeira anlise. Aplicao do modelo. Chegando-se ao modelo mais adequado, depois de todos os testes e confrontos com os pressupostos tericos,passa-se aplicao do modelo para tarefas de previso ou avaliao dos efeitos de uma poltica.

1.2

Caractersticas dos dados econmicos

Diferentemente de estudos das reas das cincias exatas e naturais, onde os dados para anlise so gerados em experimentos controlados em laboratrio, em economia e na anlise emprica economtrica os dados so obtidos da observao dos fenmenos econmicos e sociais, so dados no experimentais. Segundo Hill . et. al.(1999), a maioria dos dados econmicos coletada para ns administrativos e no como objeto de pesquisa. Os dados econmicos podem ser quanto ao tipo dados quantitativos, quando assumem valores numricos sejam monetrios, volume, extenso e propores; ou dados qualitativos quando assumirem valores expressos por atributos como sexo (masculino, feminino), respostas binrias (sim e no ou 0 e 1). Conforme Wooldridge(2006), quanto apresentao os dados podem corresponder s seguintes estruturas:

CAPTULO 1. INTRODUO

Dados de corte transversal Consiste em uma amostra de indivduos, consumidores, empresas, cidades, estados, pases ou uma variedade de outras unidades, tomada em um determinado ponto no tempo. Ignoram-se quaisquer diferenas de tempo. Dados de sries de tempo consiste em observaes sobre uma ou muitas variveis ao longo do tempo. Normalmente referindo-se a cronologias como anos, trimestres, meses e dias. So exemplos de sries temporais produto interno bruto, ndice de preos ao consumidor e volume de vendas de automveis. Cortes transversais agrupados uma combinao de dados de corte transversal e de sries temporais. Um exemplo quando se utilizam duas amostra de dados da PNAD (Pesquisa Nacional por Amostra de Domiclios),efetuada anualmente pelo IBGE, uma para o ano de 2005 e outra para o ano de 2009. As mesmas variveis so estudadas como renda, anos de estudo, condio do domiclio, etc. O detalhe que os indivduos amostrados no so os mesmos. Dados de painel ou longitudinais Consiste em uma srie de tempo para cada membro do corte transversal do conjunto de dados. Como exemplo temos quando coletamos dados de investimento e nanceiros sobre um conjunto de empresas ao longo de um perodo de cinco anos. Aqui as mesmas empresas so acompanhadas ao longo de um determinado perodo.

1.3

Fonte dos dados

A compilao dos dados para um estudo economtrico uma tarefa crtica. Depende da acessibilidade, da periodicidade em que so colocados disposio do pblico e do formato de apresentao (impressos em relatrios ou boletins, gravados em meio digital como arquivo de planilhas ou texto no formatado). No Brasil, fontes de dados econmicos e sociais podem ser obtidos das pginas de internet de instituies como o IBGE (http://www.ibge.gov.br), Banco Central do Brasil (www.bcb.gov.br/) e do IPEA ( Instituto de Pesquisa Econmica Aplicada) que mantm uma pgina de dados econmicos intitulada IPEADATA (www.ipeadata.gov.br). Alguns livros e manuais de economia (micro, macro, economia brasileira e economia internacional) trazem tabelas com dados, mas para utiliz-los h o inconveniente de manualmente inseri-los nas planilhas.

Captulo 2 Introduo ao Gretl


2.1 Instalao

O software Gretl 1 gratuito e est disponvel no site ocial em portugus http://gretl.sourceforge.net/gretl_portugues.html. A verso para instalao no sistema operacional Windows est no link http://gretl. sourceforge.net/win32/index_pt.html. Baixar o arquivo gretl_install.exe. Para executar o arquivo de instalao basta clicar duas vezes com o boto esquerdo do mouse sobre este arquivo. Grande parte do software est em portugus do Brasil, mas ainda h muitas pginas de ajuda em ingls. um projeto colaborativo e aos poucos essas lacunas vo sendo preenchidas pela colaborao voluntria 2 . Depois de instalado o programa aparecer na rea de trabalho um cone com o desenho de uma gura feminina, uma camponesa. Clicando duas vezes neste cone com o mouse ou seguindo a seqencia na barra de comandos do Windows Iniciar > Todos os programas > gretl > gretl, ser iniciado o programa apresentando a janela reproduzida na Figura 2.1. Como ainda no foi carregado nenhum arquivo de dados apenas as opes de menu esto disponveis Arquivo e Ferramentas, as demais opes aparecem em cinza indicando que no esto disponveis.
Gretl um acrnimo para Gnu Regression, Econometrics and Time-series Library. Trata-se de uma biblioteca de funes estatsticas e economtricas para anlise de regresso e de sries temporais. Segundo Adkins(2007), de fcil uso e razoavelmente poderoso. 2 Para se informar sobre os aspectos de colaborao e voluntariado na comunidade de software aberto o leitor poder comear pelo link http://pt.wikipedia.org/wiki/Software_ livre.
1

CAPTULO 2. INTRODUO AO GRETL

2.2

Entrada de dados

A entrada manual de dados no gretl realizada atravs do comando Novo conjunto de dados do menu Arquivo, como mostram a Figura 2.2 e a Figura 2.3.

Figura 2.1: Tela inicial do Gretl Surgir uma pequena janela Figura 2.4 solicitando a informao de quantas observaes sero inseridas. Aps ser informada a quantidade de observaes, deve-se informa a estrutura dos dados, conforme a Figura 2.5: Dados de corte referindo-se a dados de corte transversal, Srie temporal indicando se os dados so de srie temporal e Painel se os dados esto na estrutura Painel. Em seguida, pede-se para conrmar a estrutura do conjunto de dados conforme a Figura 2.6. Antes de clicar no boto Aplicar, clicar com o mouse no quadrado, assinalando-o, onde se l Inicie a introduo de valores. Como mostra a Figura 2.7, pede-se um nome para a primeira varivel. No gretl as variveis sero nomeadas com um mximo de 15 caracteres; iniciar com uma letra e depois nmeros e letras e o caractere sublinhado _ ; no usar acentos como em salrio; no ter espaos como em Segundo Grau completo; A janela de insero de dados na Figura 2.8 tem no canto superior esquerdo trs cones:+, ,. Correspondem respectivamente s aes inserir mais uma

CAPTULO 2. INTRODUO AO GRETL

Figura 2.2: Menu Arquivo do Gretl varivel, conrmar os dados inseridos e fechar a janela de insero de dados.

2.3

Importao de dados

A outra maneira de inserir dados no gretl atravs da seqencia Arquivo Abrir dados - Importar. Como se v na Figura 2.9. Nota-se que h uma variedade de formatos de dados, mas neste texto faremos referncia apenas s opes texto/CSV e Excel.

2.4

Anlise dos dados

O software Gretl tem como foco a anlise de regresso e de sries temporais, mas tem ferramentas que auxiliam na descrio estatstica sumria de variveis. Na barra de menu superior h duas formas de se obter o resumo estatstico de uma varivel ou um conjunto selecionado: o comando Ver com a opo Estatsticas descritivas e o comando Varivel tambm com a opo Estatsticas descritivas. A resposta ao comando uma janela de resultados informando mdia, mediana, mnimo, mximo, desvio padro, coeciente de variao, enviesamento(assimetria) e excesso de curtose.

CAPTULO 2. INTRODUO AO GRETL

Figura 2.3: Selecionando a entrada manual de dados

Figura 2.4: Janela para informar nmero de observaes

Figura 2.5: Janela para informar a estrutura dos dados

2.4.1

Estatstica descritiva

O objetivo da anlise descritiva resumir um conjunto de dados, extraindo as caractersticas e informaes mais relevantes para o estudo.

CAPTULO 2. INTRODUO AO GRETL

10

Figura 2.6: Tela para conrmao da estrutura de dados.

Figura 2.7: Tela para informar o nome da primeira varivel

Figura 2.8: Tela de insero dos dados Sejam os dados da empresa ctcia Companhia MB, apresentados no livro Estatstica bsica, de Bussab e Morettin(2005), pgina 11, Tabela 2.1. Para serem

CAPTULO 2. INTRODUO AO GRETL

11

Figura 2.9: Seqencia para importao de dados lidos pelo Gretl, os dados foram digitados em uma planilha adaptando os ttulos das colunas extraindo os caracteres til, circunexo e cedilha. Salva a planilha, ento procedeu-se importao dos dados pelo Gretl usando a seqncia de comandos utilizando o mouse: Arquivo > Abrir dados > Importar > Excel. Abre-se uma janela onde o usurio deve informar o caminho da planilha que contm os dados para anlise. O software solicita a conrmao da estrutura de dados, no caso Corte transversal. Para se obter uma descrio numrica da distribuio da varivel salrio, procedese seqncia : selecionar a varivel salrio clicando com o mouse deixando-a destacada. Clicar com o mouse no comando Ver ou Varivel e clicar em Estatsticas descritivas e uma janela com os resultados surgir na tela do computador, como se v na Figura 2.11.

CAPTULO 2. INTRODUO AO GRETL

12

Figura 2.10: Dados da Companhia MB importados para o Gretl

Figura 2.11: Estatsticas descritivas da varivel salrio Medidas descritivas da distribuio A mdia e a mediana so medidas de posio. O desvio padro e o coeciente de variao (C.V.) so medidas de disperso. Com o nome de Enviesamento tem-se o coeciente de assimetria da distribuio e com o nome de Curtose Ex. o excesso de curtose. Segundo Merrill e Fox(1980) 3 , dene-se a mdia aritmtica de um conjunto de dados como
3

Fonte das denies seguintes.

CAPTULO 2. INTRODUO AO GRETL


n

13

X=

1 n

Xi
i=1

No clculo da mdia, leva-se em conta cada nmero do conjunto de observaes, com igual peso. Cada conjunto de nmeros tem uma nica mdia. A mdia tem como desvantagem sofrer alterao em seu valor com a presena de observaes de valores extremamente grandes ou extremamente pequenos. A mediana o valor central de um conjunto de observaes dispostas por ordem de grandeza. A mediana no afetada por valores extremos. A estas medidas de posio deve-se acrescentar a informao sobre a variabilidade em trono da mdia. So as medidas de disperso. Com os valores Mnimo e Mximo, fornecidos pelo Gretl, obtemos a Amplitude Total, ou seja, Amplitude T otal = M aximo M inimo As medidas de disperso mais utilizadas so desvio padro e varincia. O desvio padro denido como a raiz quadrada positiva da varincia. A varincia de um conjunto de dados se dene como a mdia dos quadrados dos desvios dos dados com relao mdia. Gretl calcula a varincia como var(X) = Portanto o desvio padro ser dp(X) = var(X) 1 N 1
N

(xi x)2
i=1

A varincia e o desvio padro tero valor zero quando todos os dados de uma varivel assumirem o mesmo valor. Assim, quanto mais prximo de zero indica que o conjunto de valores bastante concentrado e homogneo. A outra medida de disperso informada pelo Gretl o coeciente de variao (C.V.). Relaciona o desvio padro com a mdia e se dene como dp(X) X O coeciente de variao comumente expresso como uma percentagem, assim deve-se multiplicar por 100 o valor informado pelo Gretl. A disperso dos dados ser tanto maior quanto o valor do C.V. se aproxime de 1 ou de 100%. As duas ltimas medidas fornecidas pelo Gretl informam a respeito da forma da distribuio: Enviesamento (assimetria) e Curtose Ex (excesso de curtose). C.V. =

CAPTULO 2. INTRODUO AO GRETL

14

Uma distribuio dita assimtrica se no simtrica em relao mdia. Segundo Merrill e Fox (op. cit.), o coeciente de assimetria 3 a medida de assimetria mais usada, e se dene como 3 =
1 n n i=1 (Xi s3

X)3

onde s3 o cubo do desvio padro. Para uma distribuio simtrica, 3 zero. Valores positivos de 3 indicam que a distribuio positivamente assimtrica, ou seja, seu grco (histograma) apresenta uma longa cauda direita. Para valores negativos, apresentar uma cauda longa esquerda. O coeciente de curtose a medida de achatamento da distribuio. A medida da curtose fornecida pelo clculo de 4 , denido como 4 =
1 n n i=1 (Xi s4

X)4

onde s4 a quarta potncia do desvio padro. A distribuio normal muito utilizada como referncia para medida do achatamento. Para a distribuio normal, 4 igual a 3. Desta forma, se 4 excede 3 (Curtose Ex. positiva) , a distribuio dita leptocrtica (mais apontada do que a distribuio normal), e se 4 menor do que 3 (Curtose Ex. negativa), a distribuio dita platicurtica (menos apontada do que a distribuio normal). Representao grca da distribuio A representao grca de uma distribuio de freqncia chama-se histograma e no Gretl pode ser obtido pela seqncia, usando o mouse: Varivel > Distribuio de freqncia, informar o nmero de classes que se deseja (o Gretl sugere 7), clicar na caixa mostrar grfico e clicar em OK. O grco ser exibido em uma janela como a da Figura 2.12. Clicando com o boto direito do mouse sobre a janela do grco surgir um menu com as opes de salvamento do grco para insero no texto de um relatrio ou no corpo de um artigo para publicao. Outro grco utilizado para descrever uma distribuio de freqncia conhecido como grco de caixa, tambm chamado de desenho esquemtico em Bussab e Morettin(2005). Pode ser obtido no Gretl pela seqncia: clicar em Varivel, Grfico das variveis, Diagramas de caixa, informar o nome de uma varivel ou mais de uma varivel (neste caso separadas por espao) e OK. O resultado aparece em uma janela como a Figura 2.13. Clicando com o boto direito do mouse sobre a janela do grco surgir um menu com as opes de salvamento do grco para insero no texto de um relatrio ou no corpo de um artigo para publicao.

CAPTULO 2. INTRODUO AO GRETL

15

Figura 2.12: Histograma da varivel salrio

Figura 2.13: Diagrama de caixa com as variveis salrio e idade.

2.4.2

Correlao

Um tpico importante na anlise de variveis scio-econmicas diz respeito ao grau de associao entre elas. A resposta fornecida pelo clculo do coeciente de correlao que informa o grau de associao, mas no pode ser usado para determinar a existncia de um vnculo de causalidade entre as variveis. Segundo Hoffman(1980), para uma amostra de n pares de valores Xi , Yi (com i = 1, ..., n)

CAPTULO 2. INTRODUO AO GRETL a estimativa de correlao linear entre X e Y dada por r= xi y i x2 i


1 n 2 yi

16

onde xi = Xi X e yi = Yi Y , com X = Considere os dados da tabela 2.1

Xi e Y =

1 n

Y i.

Tabela 2.1: Dados hipotticos. X Y 1 1 2 9 3 2 4 7 5 6 Para calcular o coeciente de correlao entre X e Y no Gretl utiliza-se a seqncia de menus Ver - Matriz de correlao - Variveis selecionadasOK. A sada ser igual ao contedo do quadro abaixo

Coecientes de correlao, usando as observaes 1 5 5% valor crtico (bilateral) = 0,8783 para n = 5 X 1, 0000 Y 0, 3730 X 1, 0000 Y

Segundo Levin(1987), o coeciente de correlao oscila entre os valores 1, 00 e +1, 00 e sendo interpretados segundo a Tabela 2.2.

CAPTULO 2. INTRODUO AO GRETL

17

Tabela 2.2: Valores do coeciente de correlao e qualicao da correlao. Valor do coeciente Interpretao 1, 00 correlao negativa perfeita : 0, 95 correlao negativa forte : 0, 50 correlao negativa moderada : 0, 10 correlao negativa fraca : 0, 00 ausncia de correlao : +0, 10 correlao positiva fraca : +0, 50 correlao positiva moderada : +0, 95 correlao positiva forte : +1, 00 correlao positiva perfeita Logo, o coeciente de correlao entre X e Y sendo igual a 0, 03730 pode ser interpretado como uma correlao positiva entre fraca e moderada.

2.4.3

Exerccio prtico

1. A Tabela 2.3 traz informaes sobre 50 alunos distribudas nas variveis Idade (em anos), Altura (em metros), Peso (em quilogramas), TV (horas gastas assistindo TV , por semana) e IMC (ndice de Massa Corprea, calP eso culado pela frmula: IM C = Altura2 ). Usando o Gretl, realize as tarefas a seguir. (a) Obtenha as estatsticas descritivas das variveis e relate sobre o formato de cada distribuio e a disperso dos dados. (b) Obtenha para cada varivel os grcos histograma e diagrama de caixa. O que informam estes grcos? (c) Obtenha a matriz de correlao entre as variveis e comente o resultado.

CAPTULO 2. INTRODUO AO GRETL Tabela 2.3: Dados para exerccio prtico Aluno Idade Altura Peso TV IMC 1 17 1.60 60.5 16 23.630 2 18 1.69 55.0 7 19.255 3 18 1.85 72.8 15 21.275 4 25 1.85 80.9 20 23.638 5 19 1.58 55.0 5 22.030 6 19 1.76 60.0 2 19.367 7 20 1.60 58.0 7 22.650 8 18 1.64 47.0 10 17.471 9 18 1.62 57.8 12 22.029 10 17 1.64 58.0 10 21.537 11 18 1.72 70.0 8 23.655 12 18 1.66 54.0 0 19.516 13 21 1.70 58.0 30 20.022 14 19 1.78 68.5 2 21.617 15 18 1.65 63.5 10 23.369 16 19 1.63 47.4 18 17.862 17 17 1.82 66.0 10 19.952 18 18 1.80 85.2 10 26.263 19 20 1.60 54.5 5 21.200 20 18 1.68 52.5 14 18.662 21 21 1.70 60.0 5 20.747 22 18 1.65 58.5 5 21.458 23 18 1.57 49.2 10 19.948 24 20 1.55 48.0 28 19.955 25 20 1.69 51.6 4 18.069 26 19 1.54 57.0 5 24.013 27 23 1.62 63.0 5 24.084 28 18 1.62 52.0 10 19.859 29 18 1.57 49.0 12 19.805 30 25 1.65 59.0 2 21.649 31 18 1.61 52.0 6 20.085 32 17 1.71 73.0 20 24.993 33 17 1.65 56.0 14 20.502 34 17 1.67 58.0 10 20.735 35 18 1.73 87.0 25 29.009 36 18 1.60 47.0 14 18.300 37 17 1.70 95.0 12 32.883 38 21 1.85 84.0 10 24.513 39 18 1.70 60.0 12 20.747 40 18 1.73 73.0 2 24.393 41 17 1.70 55.0 10 19.085 42 23 1.45 44.0 25 20.908 43 24 1.76 75.0 14 24.284 44 18 1.68 55.0 8 19.412 45 18 1.55 49.0 10 20.360 46 19 1.70 50.0 8 17.323 47 19 1.55 54.5 3 22.639

18

Captulo 3 Regresso linear simples


Como ensina Kmenta(1988), a teoria econmica preocupa-se sobretudo com relaes entre variveis. Relaes de oferta e procura, funo custo, funo produo e muitas outras (...), a econometria se preocupa em testar as proposies tericas incorporadas nestas relaes e em estimar os parmetros nelas envolvidos. Sendo x e y duas variveis relacionadas em alguma proposio terica ou emprica, a tarefa estudar como y varia com variaes em x? Conforme Wooldridge (op.cit), Ao escrever um modelo que explicar y em termos de x, defrontamonos com trs questes. Primeira, como nunca h uma relao exata entre duas variveis, como consideramos outros fatores que afetam y ? Segunda, qual a relao funcional entre y e x? E terceira, como podemos estar certos de que estamos capturando uma relao ceteris paribus entre y e x (se esse for um objetivo desejado)? As ambigidade resolve-se com a especicao do modelo que relaciona y a x. Uma equao tal como y = 0 + 1 x + u (3.1)

A equao 3.1 chamada de modelo de regresso ou equao de regresso. As variveis x e y tm vrios nomes mas os mais descritivos so varivel explicada para y e varivel explicativa para x. A varivel u , que em alguns livros representada por , chamada de termo de erro ou perturbao da relao, representa outros fatores alm de x que afetam y como no observados. O parmetro 1 chamado de parmetro de inclinao da relao entre x e y e muito importante na anlise em economia aplicada. O parmetro de intercepto 0 tem seus usos mas raramente central para uma anlise (Wooldridge, 2006). 19

CAPTULO 3. REGRESSO LINEAR SIMPLES

20

3.1

Uma aplicao no Gretl

Sejam os dados da tabela 3.1, retirados do livro de Pindyck e Rubinfeld (op. cit.). Entrando esses dados no Gretl, tal como descrito na seo 2.4.1, procede-se seqncia de menus Modelo -> Mnimos Quadrados Ordinrios e na janela que se abre informar como varivel dependente a varivel Y selecionandoa com o mouse e clicando na seta azul. Depois selecionar a varivel X e clicar na seta verde inserindo-a como varivel independente. Notar que o Gretl j colocou a constante como const. Por m, clicar no boto OK e aparecer a janela com os resultados, indicados a seguir na Figura 3.1. Tabela 3.1: Mdia de notas escolares e renda familiar Y X (mdia das notas) (renda dos pais em US$ 1000,00) 4,0 21,0 3,0 15,0 15,0 3,5 2,0 9,0 12,0 3,0 3,5 18,0 6,0 2,5 2,5 12,0

Figura 3.1: Resultados do Modelo de Mnimos Quadrados Ordinrios. Lendo os resultados do Gretl, temos na primeira coluna o termo const que se refere ao intercepto da equao e X a varivel independente. Na segunda co-

CAPTULO 3. REGRESSO LINEAR SIMPLES

21

luna os valores estimados dos coecientes 0 e 1 , respectivamente 1,37500 e 0,120370, desta forma o modelo estimado ca como na equao 3.2 Y = 1, 375 + 0, 12X (3.2)

Segundo a equao 3.2, para cada unidade de X a mais, Y aumenta em 0,12. Os demais itens da janela de resultados servem para diagnosticar se o modelo signicativo nos parmetros e se a equao tem um bom ajuste com relao aos dados da amostra.

3.1.1

Diagnstico da regresso

O pressuposto do Modelo 1 que a renda dos pais explica a mdia de notas dos alunos. Tendo o modelo estimado, procede-se vericao da signicncia dos parmetros, em especial de 1, o coeciente de X, renda dos pais. Assim, para vericar se a renda dos pais signicativa para explicar a mdia de notas dos alunos efetua-se a vericao do intervalo de conana dos parmetros e o teste da nulidade H0 : 1 = 0. Signicncia dos parmetros Para se obter os intervalos de conana no Gretl, ativar a janela de resultados Modelo 1 e clicar no menu Anlise -> Intervalos de confiana para os coeficientes. Surgir a janela da gura 3.2.

Figura 3.2: Intervalos de conana para os coecientes. O nvel de conana padro = 0, 95, que pode ser modicado clicando no boto com o na barra de comandos. Observando os resultados, o intervalo de conana para 0 [0, 472639 ; 2, 27736] e para 1 [0, 0569589 ; 0, 183782]. O zero no est includo, ento para esta amostra os parmetros no so zero com 95% de probabilidade.

CAPTULO 3. REGRESSO LINEAR SIMPLES

22

Para o teste de hiptese Hill et. al.(op.cit.) sugerem as quatro etapas a seguir: 1. Determine as hipteses nula (H0 ) e alternativa (H1 ). 2. Especique a estatstica de teste e sua distribuio se a hiptese nula verdadeira. 3. Escolha e determine a regio de rejeio. 4. Calcule o valor amostral da estatstica de teste. Aplicando ao estudo das mdias de notas e renda dos pais. 1. A hiptese nula H0 : 1 = 0 . A hiptese alternativa H1 : 1 = 0. Se a hiptese nula verdadeira, no h relao entre a renda dos pais e as mdias de notas. Se a hiptese alternativa verdadeira, ento h relao entre a renda dos pais e as mdias de notas.
k 2. Estatstica de teste tc = dp(k ) t(T 2) se a hiptese nula verdadeira. Onde dp(k ) o erro-padro do coeciente e T o nmero de observaes. Os graus de liberdade da distribuio tc igual a T menos o nmero de parmetros envolvidos.

3. O um valor de probabilidade, em geral utiliza-se = 0, 01 ou = 0, 05. Neste caso = 0, 05. A regio de rejeio dada pelos valores de e graus de liberdade ( 8 observaes menos dois parmetros = 6). Assim o valor crtico de tc ser dado em uma tabela estatstica da distribuio t de Student para tgl=6,=0,05/2 , pois o teste bicaudal se a hiptese alternativa H1 : 1 = 0. No Gretl o valor crtico de tc pode ser obtido de forma automtica pela seqncia de menus da janela principal: Ferramentas -> Tabelas estatsticas -> t e preencher as janelas gl com os graus de liberdade e probabilidade da cauda direita com o valor de escolhido. O valor de tc crtico para a amostra de mdias de notas igual a 2,447. A regra de rejeio da hiptese nula em favor da hiptese alternativa dada pela condio do valor amostral de t 2, 447 ou t 2, 447, ou, equivalente, se |t| 2, 447. 4. Por m, o valor amostral da estatstica t de cada parmetro dado na janela de resultados do Modelo 1 na coluna razo - t, que o resultado da diviso do valor do coeciente pelo erro padro. Verica-se que a razo - t de cada um dos coecientes supera o valor crtico da estatstica t da amostra (2,447). Portanto para cada um dos parmetros a hiptese de nulidade foi rejeitada ao nvel de = 0, 05. Mais importante, no caso

CAPTULO 3. REGRESSO LINEAR SIMPLES

23

de 1 ter sido rejeitada a hiptese de nulidade, signica que a varivel X, rendimento dos pais, signicativa no modelo. Outra forma de avaliar a signicncia dos parmetros observar a coluna p-valor. Segundo Hill et. al.(op.cit), podemos decidir se rejeitamos uma hiptese nula comparando-o com o nvel de signicncia . A regra : Regra de rejeio para um teste de hiptese: Quando o P-valor de um teste de hiptese menor do que o valor escolhido , o procedimento de teste conduz rejeio da hiptese nula.

A consequncia prtica que conhecendo o P-valor do teste, a deciso de rejeio da hiptese nula vai resultar da comparao do P-valor com o nvel de signicncia escolhido. Outra facilidade fornecida pelo Gretl so os asteriscos () ao lado dos pvalores. O esquema da Tabela 3.2 demonstra que quanto mais asteriscos melhor ou mais signicante a estimativa. Tabela 3.2: Esquema de asteriscos e nveis de signicncia no Gretl. Asteriscos Valor do Interpretao 0,01 Muito signicativo 0,05 Signicativo 0,10 Pouco signicativo

Qualidade do ajustamento Conforme Pindyck e Rubinfeld(op.cit), uma boa regresso aquela que ajuda a explicar uma grande proporo da varincia de Y . A medida desse grau de explicao dada pelo R2 ou R-quadrado. O R2 d a proporo da variao total de Y explicada pela regresso de Y contra X. Varia entre 0 e 1 e normalmente se interpreta em porcentagem. Se R2 0 indica um ajuste fraco, mas ao contrrio, quanto mais prximo de 1 melhor ser o ajuste. O caso de R2 = 1 ocorre apenas quando todos os pontos esto sobre a linha de regresso. Na Figura 3.1, o valor de R-quadrado 0,782407 ou 78,24% o que indica um bom ajuste, ou seja que a renda dos pais ajuda a explicar a 78% da variao nas mdias de notas da amostra de 8 pessoas. Mas Wooldridge (op.cit) adverte que um R-quadrado aparentemente baixo no signica, necessariamente, que uma equao de regresso de MQO intil. (...) usar o R-quadrado como o principal padro de medida de sucesso de uma anlise economtrica pode levar a confuses.

CAPTULO 3. REGRESSO LINEAR SIMPLES Resumindo os resultados da regresso

24

Os resultados da estimao do modelo de regresso podem ser apresentados de forma resumida na forma de uma equao de regresso ajustada

Y = 1, 37500 + 0, 120370 X
(0,36878) (0,025915)

T = 8 R = 0, 7461 (erros padro entre parnteses) Intervalo de conana da previso Aps a obteno do modelo estimado e da vericao do seu alcance explicativo atravs dos testes de hiptese, pode-se utilizar a equao estimada para realizar previses de Y para dado X. Porm assim como os valores estimados de 0 e 1 tm um intervalo de conana, o valor previsto y0 para um dado x0 no observado, mas com valor no muito distante de X, tambm tem um intervalo de conana. Para isto ser necessrio conhecer o desvio padro da previso dado pela equao 3.3(Hill et.al.) dp(f ) = 2 1 + 1 (x0 x)2 + T (xt x)2 (3.3)

Assim, o intervalo de conana da previso ser dado por y0 tc dp(f ) (3.4)

Para o modelo de mdia de notas em funo da renda dos pais, considere-se a equao estimada Y = 1, 375 + 0, 12X e desejamos prever a mdia de nota y0 para uma renda de x0 = U S$20 mil. Temos y0 = 1, 375 + 0, 12 (20) = 3, 7824 A obteno do intervalo de conana da previso no Gretl no feita de forma direta. No livro de Adkins(2010) h uma sugesto de cdigo com base na frmula 3.5 var(f ) = 2 + 2 + (x0 x)2 var(b2 ) T (3.5)

CAPTULO 3. REGRESSO LINEAR SIMPLES

25

Antes de apresentar o cdigo sugerido deve-se informar o leitor que o software Gretl tem mais de um ambiente de operao. O ambiente at agora comentado chamado de ambiente grco ou interface grca com o usurio (sigla GUI em ingls), onde a interao realizada atravs de menus acionados com cliques do mouse. Outros dois ambientes esto disponveis. Um chamado de console e acionado clicando com o mouse no terceiro cone , da esquerda para a direita, na barra inferior de comandos na janela principal do Gretl. O console tambm acionado digitando o comando gretlcli seguido de Enter na janela do DOS do Windows, que est em Iniciar - Programas - Acessrios. No console os comandos so digitados informando parmetros e variveis de sada. O outro ambiente no tem um nome mas acionado clicando com o mouse no segundo cone, antes do cone do console. Seu cone parecido com o Bloco de Notas do Windows, uma folha e um lpis. Neste ambiente os comandos so digitados em uma seqncia e depois so todos executados de uma vez clicando-se no cone com uma roda dentada na barra de menus da janela. Ao executar um modelo, em qualquer dos ambientes, o Gretl salva os resultados de alguns clculos em variveis do sistema. Assim, os valores estimados dos coecientes da regresso so salvos na varivel $coeff. Ento para acessar o valor estimado do coeciente da constante digita-se no console o comando adequado informando o parmetro $coeff(const). A soma dos quadrados dos resduos salva na varivel $ess. Os graus de liberdade e o nmero de observaes esto nas variveis $df e $nobs. Para computar x utiliza-se a funo interna mean(x) e para se obter o valor crtico de uma distribuio a funo critical. Abaixo o cdigo sugerido seguido de comentrios. ols Y const X genr yhat0 = $coeff(const)+$coeff(X)*20 genr sig2 = $ess/$df genr f = sig2 + sig2/$nobs + ((20 - mean(X))^2)*($stderr(X)^2) genr l_inf = yhat0 - critical(t,$df,0.025)*sqrt(f) genr l_sup = yhat0 + critical(t,$df,0.025)*sqrt(f) Comentrio do cdigo: 1. Na primeira linha o comando ols informa que o mtodo dos mnimos quadrados ordinrios ser utilizado para estimar a equao de regresso de Y em X 1 . A partcula const instrui que a reta tem um intercepto. 2. Na segunda linha feito o clculo do Y previsto com o valor de X = 20 utilizando-se dos valores estimados dos coecientes salvos nas variveis
1

O Gretl faz distino entre maisculas e minsculas. Assim X diferente de x.

CAPTULO 3. REGRESSO LINEAR SIMPLES

26

$coeff(const) para 0 e $coeff(X) para 1 . O valor previsto ser salvo na varivel yhat0. 3. Na terceira linha gerado o 2 da equao 3.5. Que o resultado da diviso da Soma resid. quadrados informada na janela de resultados do modelo (salvo na varivel $ess) pelos graus de liberdade do modelo nmero de observaes menos o nmero de parmetros salvo na varivel $df. 4. Na quarta linha calculada a var(f ). Descrevendo: $nobs o nmero de observaes da amostra; mean(X) calcula a mdia da varivel X; $stderr(X)2 calcula o erro padro de 1 , o coeciente de X. 5. Na quinta linha calculado o limite inferior do intervalo de previso,salvo na varivel l_inf. Aqui usado o comando critical: critical(t, $ df,0.025) d o valor crtico da distribuio t com graus de liberdade salvo na varivel $df com o = 0, 05/2 = 0, 025; sqrt(f) a raiz quadrada do f calculado na quarta linha. 6. Na ltima linha do cdigo calculado o limite superior do intervalo de previso, salvo an varivel l_sup. Ento o valor previsto da mdia para X = 20 yhat0=3,7824 com o seguinte intervalo de predio, considerando o nvel = 0, 05 de conana: valor mnimo da mdia igual l_inf=2,832 e valor mximo da mdia igual a l_sup=4,723 ou [2.832, 4.723].

Bibliograa
[1] ADKINS, L. C. Using gretl for Principles of Econometrics. 3rd Edition, Version 1.3131, 2010. Disponvel em : http://www. learneconometrics.com/gretl/. Acessado em :28 de setembro de 2011. [2] BUSSAB, W. O.; MORETTIN, P. A. Estatstica bsica. 5. ed. So Paulo: Saraiva, 2005. [3] COTTRELL, A.; LUCCHETTI, R. Gretl Users Guide. Disponvel em: http://gretl.sourceforge.net/gretl_portugues. html. Acessado em: 15/02/2011. [4] FRANSES, P. H. A concise introduction to econometrics: an intuitive guide. Cambridge-UK : Cambridge University Press, 2002. [5] HILL, R. C.; GRIFFITHS, W. E.; JUDGE, G. G. Econometria. So Paulo:Saraiva, 1999. [6] LEVIN, J. Estatstica aplicada a cincias humanas. 2. ed. So Paulo: Harbra, 1987. [7] KEYNES, J. M. A teoria geral do emprego, do juro e da moeda. 2. ed. So Paulo: Nova Cultural, 1985. [8] KLEIN, L. R. Introduo econometria. So Paulo: Atlas, 1978. [9] MERRIL, W. C.; FOX, K. A. Estatstica econmica: uma introduo. So Paulo: Atlas, 1980. [10] PINDYCK, R. S.; RUBINFELD, D. L. Econometria: modelos e previses. Rio de Janeiro: Elsevier, 2004. [11] WOOLDRIDGE, J. M. Introduo Econometria: uma abordagem moderna. So Paulo: Thomson Pioneira, 2006.

27

You might also like