You are on page 1of 3

Aspectos que norteiam a escolha da modelagem adequada : contexto da tomada de decisão , a

precisão requerida , a disponibilidade de dados adequados , o estado da arte da modelagem ,


os recursos disponíveis para o estudo e a necessidade de processamento de dados .

Os autores optaram por um modelo multiplicativo , do tipo gravitacional, modificado de forma


a incorporar diversas variáveis socioeconômica ,sem aumentar demasiadamente a
complexidade do mesmo.

Ponto de partida para a calibração: a equação 1 é feita uma primeira regressão linear múltipla
com todas a variáveis e , a seguir, com o auxilio do software Minitab, identifica-se o melhor
conjunto de variáveis para a especificação final do modelo. Para isso é usado um algoritmo
para seleção de variáveis passo a passo, que testa se a nova variável apresenta contribuição
adicional. No conjunto final de variáveis selecionadas , não se espera que fiquem variáveis
independentes que sejam correlacionadas.

Para que o modelo seja eficaz na determinação da variável preditora, os seguintes


pressupostos devem ser verificados : a normalidade dos resíduos ,ou seja, os erros devem ser
normalmente distribuídos ;

Os erros devem possuir media zero ;

A homocedasticidade de ser verificada,i.e, os erros devem possuir variância cte ;

As variáveis explicativas não podem ser correlacionadas;

EXPLICAR O COEFICIENTE DE VARIAÇÃO

EXPLICAR A REGRESSÃO MULTIPLA

Uma possibilidade mais robusta é o coeficiente de dispersão quartil, isto é, a metade

da amplitude interquartil dividida pela média dos quartis (o midhinge), .

O coeficiente de variação é uma medida relativa de variabilidade. É


independente da unidade de medida utilizada, sendo que a unidade
dos dados observados pode ser diferente que seu valor não será
alterado.

Vejamos um exemplo onde se pretende comparar dois conjuntos de


dados quanto às suas variabilidades. O primeiro conjunto de 84
famílias possui um desvio padrão para o salário de casa de s1 = R$
28,04. O segundo conjunto composto também por 84 famílias possui
um desvio padrão para o gasto diário de s2 = R$ 61,00. É difícil uma
comparação racional entre esses valores, pois os desvios só podem
ser devidamente avaliados quando comparados sob a mesma
grandeza. Assim, sabendo-se que a média de salário das 84 famílias
foi de Média1 = R$ 405,83 e considerando que o gasto médio diário
no segundo conjunto foi de R$ 241,00, os coeficientes de variação
são respectivamente:

CV1 = 100 x 28,04/405,83 = 6,91%


CV2 = 100 x 6/24 = 25%

Verifica-se que o CV para o gasto médio diário é muito maior do que


para o salário de casa. Logo concluímos através do CV de cada grupo,
que o CV do grupo 2 é muito maior que do grupo 1.

O coeficiente de variação tem, portanto, aplicações na pesquisa para


comparar a precisão de diferentes experimentos. Entretanto, a
qualificação de um coeficiente como alto ou baixo requer
familiaridade com o material que é objeto de pesquisa.

 Pj- variável dependente ou explicada , regressando


 Cj,OVj, KPk e NMj = variável independente , explicativa ,regressor .

A análise de regressão múltipla é mais receptiva à análise “ceteris paribus” , pois ela nos
permite controlar explicitamente muitos outros fatores que , de maneira simultânea ,afetam a
variável dependente.

Naturalmente , se adicionarmos ao nosso modelo mais fatores que são uteis para explicar y
,então mais da variação da y poderá ser explicada .Assim, análise de regressão múltipla pode
ser usada para construir modelos melhores para prever a variável dependente .

Slide 14 :

Resultado em termos de elasticidade ,

p-valor maior que o nível de significância = não rejeitamos a hipótese nula

Além disso, quanto menor for o p-valor, mais distante estamos da hipótese nula H0.

Homocedasticidade –

Erros normalmente distribuídos –

Problema : após as divisões constatou-se que tanto o r² como a normalidade dos resíduos se
mostraram insatisfatórios . Isso pode acontecer devido a presença de algum dado que destoa
demasiadamente dos demais , é que se chama de “outlier” . Com a retirada deste observou-se
uma melhora nesses dois pontos.

CALIBRAÇÃO DO MODELO E RESULTADOS OBTIDOS:

Usou-se a estatística Índice de Dissimilaridade. A minimização de uma estatística que


considera os módulos das diferenças (ID) entre os valores observados e estimados é menos
sensível a valores aberrantes.
A nova regressão realizada leva em consideração os erros absolutos para análise da
significância estatística dos coeficientes encontrados .

Por isso é necessário a adoção de uma nova estatística que substitui t de student, utilizada na
regressão de mínimos quadrados,já que esta se baseia na soma de quadrados .

O teste t de student não é adequado em uma regressão de erros absolutos

 Importante : a correlação de variáveis foi evitada através do algoritmo de seleção de


variáveis passo a passo e a homocedasticidade foi testada para todos os grupos. Isso
foi feito observando-se se os resíduos têm variância relativamente constante e com
distribuição próxima do normal.
 QUAIS AS CONDIÇÕES DE USSO DA REGRESSÃO LINEAR MULTIPLA:

You might also like