You are on page 1of 5

Estimacin y validacin de un modelo economtrico

http://www.ugr.es/~romansg/material/softlibre/gretl2_es.html

A continuacin se va a abordar el anlisis de factores que influyen en el precio del oro. Las
observaciones son obtenidas a partir de la base de datos que posee Gretl, ms concretamente,
se trata de un ejemplo de Gujarati donde el precio del oro, PRICE, se estima a partir del ndice
de consumo del mismo, CPI, y el de la bolsa de Nueva York, NYSE. La estimacin obtenida
es:

PRICE = 5'81097 CPI + 1'89673 NYSE, R-cuadrado = 0'9455, R-ajustado = 0'9413.

Tras dicha estimacin podemos observar los valores reales del precio del oro, los estimados y
los residuos de la estimacin, de forma que se pueden representar los dos primeros de forma
conjunta as como los terceros.

A continuacin se realiza el contraste de normalidad de los residuos. En este caso, puesto que
el p-valor es inferior a 0.05, se rechaza la hiptesis nula de normalidad. Por tanto, en este
caso no hay normalidad en el modelo, por lo que no se podra abordar realizar inferencia en el
mismo y, por tanto, no sera factible obtener conclusiones legtimas a partir del ajuste realizado.

Sin embargo, a modo de ejemplo, supongamos que si se ha obtenido normalidad en los residuos
y pasemos a interpretar los distintos test sobre los parmetros y el modelo. Con respecto a los
p-valores asociados a los contrastes de significacin individual tenemos que ambos son
inferiores a 0.05, por lo que se rechaza la hiptesis nula de que los coeficientes de las
variables independientes sean nulos. Es decir, tanto el ndice de consumo como el de la bolsa
influyen en el precio del oro. Adems, como los coeficientes estimados son positivos, conforme
aumentan las variables independientes tambin lo hace la dependiente. A estas conclusiones se
pueden llegar tambin a partir de los intervalos de confianza de cada coeficiente, ya que, como
se puede observar, ninguno de los intervalos contiene al cero. Finalmente, el p-valor asociado
al contraste ANOVA tambin es inferior a 0.05, por lo que se rechazara la hiptesis nula de
que todos los regresores son nulos de forma simultnea. Por tanto, se podra afirmar que el
modelo es vlido ya que se puede afirmar que existe algn tipo de asociacin no debida al azar
entre las variables independientes y la dependiente. Destacar tambin que tanto el coeficiente
de determinacin como el corregido son bastante altos, el ajuste realizado explica alrededor de
un 94% de la variabilidad del precio del oro.

Advirtase que en este ejemplo se pone de manifiesto que las conclusiones obtenidas son
vlidas siempre y cuando se verifiquen las hiptesis bsicas. En este caso no se verifica la
hiptesis no normalidad de los residuos, pero aun verificndose, habra que analizar la posible
existencia de heteroscedasticidad y autocorrelacin. Mientras que no se verifiquen todas las
hiptesis bsicas las conclusiones obtenidas estarn en entredicho.

Deteccin heteroscedasticidad: Test de White.


A continuacin vamos a analizar si la renta, R, de una familia influye en sus gastos en viajes,
GV. En este caso se tienen los datos previamente almacenados en un archivo .txt, por lo que el
primer paso ser importarlos. Los resultados del ajuste realizado son:

GV = 1'96 + 0'026 R, R-cuadrado = 0'435,

siendo la constante no significativa (no se rechaza la hiptesis nula de que pueda ser cero),
mientras que la renta si lo es (se rechaza la hiptesis nula de que sea cero). Adems, influye
positivamente, es decir, a ms renta mayor gastos en viajes. Finalmente, tambin se rechaza la
hiptesis nula del test ANOVA, por lo que el modelo es vlido.

Aplicaremos el test de White para estudiar la presencia de heteroscedasticidad en el modelo


considerado. Puesto que se trata de un test asinttico, es decir, un test enfocado a muestras
grandes, y la muestra considerada es muy reducida, los resultados obtenidos mediante este test
han de interpretarlos con mucha cautela.

Tras estimar el modelo original por MCO y obtener sus residuos, planteamos la regresin de
los cuadrados de los residuos frente a todas las variables del modelo original, sus cuadrados y
sus productos cruzados (omitiendo los elementos repetidos). En este caso, la estimacin de esta
regresin auxiliar es:

u(t)^2 = -21'3268 + 0'0810927 * R - 0'00000669 * R^2.

En este caso, de la regresin auxiliar anterior nos interesa su coeficiente de determinacin, es


decir, su R cuadrado (Ra^2). Ya que para contrastar la hiptesis nula de presencia de
heteroscedasticidad usaremos que n * Ra^2 se distribuye segn una chi-cuadrado con q grados
de libertad, donde q es el nmero de regresores de la regresin auxiliar excluida la constante y
n el nmero de observaciones del modelo. Entonces, si n * Ra^2 es mayor que el valor de las
tablas a un nivel de significacin dado, rechazaremos la hiptesis nula. En este caso, puesto
que

n * Ra^2 = 10 * 0'375971 = 3'75971 < 5'99146 = chi(2, 0'05),

siendo chi(2, 0'05) el valor de una chi-cuadrado con 2 grados de libertad que deja por debajo
suya (a su izquierda) una probabilidad de 0'95, se tiene que no se rechaza la hiptesis nula. Es
decir, no se rechaza que la perturbacin aleatoria del modelo original sea homocedstica. Por
tanto, las conclusiones obtenidas seran vlidas.

Finalmente, advertir que el test de Breusch-Pagan es un test muy parecido a este, siendo la
nica diferencia que en su regresin auxiliar no hay que incluir los trminos cruzados ni las
variables originales al cuadrado. Por todo lo dems, se tratan de los mismos pasos a seguir. Es
tambin un test idneo para muestras grandes.

Correccin de la heteroscedasticidad
Teniendo en cuenta la informacin mostrada en el siguiente video, donde a partir de los datos
de 20 empresas sobre beneficios (B) y ventas (V) se estima un modelo lineal para explicar los
beneficios en funcin de la ventas, se contrasta la presencia de heteroscedasticidad y se aplican
Mnimos Cuadrados Ponderados (MCP).

Es inmediato que el modelo estimado por MCO es B(t) = 10'2229 + 0'0112223 * V(t) para
t=1,2,3...,20. Adems se obtiene un coeficiente de determinacin de 0'642619.

Al representar los residuos por nmero de observacin se observa que para distintos grupos de
observaciones (por ejemplo, de la 1 a la 7, de la 8 a 16 y de la 17 a la 20) se obtiene una
dispersin distinta, lo cual nos hace pensar en que las perturbaciones tienen varianza no
constante. De igual forma, en el grfico de los residuos frente a la variable que suponemos que
produce la heteroscedasticidad (las ventas) observamos que conforme aumenta las ventas
aumenta la dispersin de los residuos. Todo lo anterior me indica que, basndome en los
mtodos grficos, hay presencia de heteroscedasticidad en el modelo considerado.

A partir del test de White (mtodo analtico), decidimos rechazar la hiptesis nula de
homocedasticidad en el modelo ya que el p-valor obtenido es de 0'04256. Esto se debe a que
el p-valor se define como el mnimo valor de significatividad a partir del cual se rechaza la
hiptesis nula. Es decir, para valores mayores que 0'04256 se rechaza la hiptesis nula y para
valores menores no se rechaza. Puesto que en este caso estamos trabajando a un 5% de
significacin, es evidente que 0'05 es mayor que 0'04256, por lo que la decisin a tomar es
rechazar la hiptesis nula, lo cual conduce a que hay presencia de heteroscedasticidad en el
modelo.

Como es sabido, para aplicar el test de White es necesario plantear una regresin auxiliar donde
se expliquen los residuos al cuadrado a partir de las variables originales, sus cuadrados y sus
productos cruzados omitiendo las repeticiones. En este caso, los regresores de la variable
auxiliar sern una constante, las ventas y su cuadrado (todas las dems posibilidades son
repeticiones de estas). De esta forma la estimacin por MCO de esta regresin ser B(t) = -
5'17545 + 0'0833682 * V(t) - 0'000132827 * V(t)^2 para t=1,2,...,20, con un coeficiente de
determinacin de 0'315679. Por ltimo, puesto que el estadstico experimental se obtiene
multiplicando el nmero de observaciones por el coeficiente de determinacin de la regresin
auxiliar, es claro que dicho valor corresponde a 20 * 0'315679 = 6'313575.

Puesto que hay presencia de heteroscedasticidad en el modelo, la estimacin realizada por


MCO no es ptima. Por tanto, para corregir este problema, como es sabido, hay que transformar
los datos originales. Observando el video, es evidente que la manera de transformar los datos
es dividiendo entre la raz cuadrada de V. A partir de estos datos transformados, se vuelve a
realizar la estimacin por MCO obtenindose que B(t) = 10'2147 + 0'063917 * V(t) con un
coeficiente de determinacin de 0'993125. Adems, realizando una vez ms el test de White se
obtiene un p-valor de 0'197533, que al ser mayor que 0'05 nos indica que no rechazamos la
hiptesis nula de homocedasticidad en las varianzas en las perturbaciones. Por tanto, el
problema ha sido corregido.

Deteccin de la autocorrelacin
En el presente ejercicio estimamos por MCO un modelo que pretende explicar el Consumo en
funcin del PIB. Tras introducir los datos, en primer lugar representamos el grfico de
dispersin del Consumo frente al PIB (que adems nos ofrece en su parte superior la
estimacin del modelo). Observamos que la relacin lineal es idnea para el modelo
considerado. Tras esta representacin grfica, estimamos el modelo por MCO, obtenindose
los siguientes resultados:

Consumo(t) = 2'1864 + 0'0796 * PIB(t), t=1989,...,1994,

siendo ambos coeficientes significativos y con un R cuadrado de 0'9923. Por tanto, parece que
estamos ante un buen ajuste.

Sin embargo, consideramos la opcin de estudiar la existencia de autocorrelacin en el modelo.


Con tal objetivo, vemos que en la pantalla de resultamos tenemos tambin el estadstico de
Durbin-Watson (3'05). Adems tambin se nos facilita el nmero de observaciones
consideradas (6) y es evidente que el nmero de regreseros excluidos la constante es uno. Por
tanto, con esta informacin recurrimos a las tablas de Durbin-Watson, de forma que obtenemos
los lmites: du = 0'6102 y dl=1'4002. Entonces, obtenemos que el contraste de Durbin-Watson
es inconcluyente.

A continuacin recurrimos a los mtodos grficos. De forma que en la pantalla donde tenemos
la estimacin del modelo podemos representar el grfico temporal de los residuos, observando
una alternancia en el signo de los mismos. Lo cual nos hace pensar en la posible existencia de
autocorrelacin negativa. Otra representacin posible es el grfico de dispersin de los residuos
frente a alguno de sus retardos. Con tal objetivo guardo los residuos, obtengo la serie retardada
una vez y los represento, observando una tendencia decreciente lo cual me vuelve a hacer
considerar la posibilidad de existencia de autocorrelacin negativa.

Luego, a partir de los mtodos grficos parece ser que el modelo presenta autocorrelacin
negativa, si bien el contraste de Durbin-Watson es inconcluyente. En este caso habra que
recurrir a otros mtodos para estudiar la posibilidad de autocorrelacin en el modelo, aunque
en cualquier caso sera muy interesante aumentar el nmero de observaciones del modelo.

Correccin de la autocorrelacin
Consideramos en este caso el ejemplo de la pgina 242 del libro Econometra de Alfonso
Novales en el que se estudia un modelo de regresin del consumo total (pblico ms privado)
en funcin del PIB.

En primer lugar introducimos los datos en formato ASCII para que posteriormente sean
importados con Gretl. Consideramos pues dos columnas de datos, la primera para el PIB y la
segunda para el consumo, cuya separacin viene determinada por el tabulador.

Una vez recuperados los datos con el software economtrico Gretl, en primer lugar
representamos el diagrama de dispersin del consumo frente al PIB de manera que observamos
que ajustar el modelo por MCO es una opcin idnea. Por lo que procedemos a la estimacin
del modelo mediante dicho mtodo. Los resultados obtenidos son:

Consumo(t) = 76'53 + 0'7689 * PIB(t), t = 1954,...,1988,

con un R cuadrado de 0'9973 y siendo significativo el coeficiente de la pendiente.


Para estudiar la posibilidad de existencia de autocorrelacin en el modelo, recurrimos a los
mtodos grficos y representamos el grfico temporal de los residuos y el diagrama de
dispersin de los mismos frente a un retardo suyo. n el primero observamos rachas por encima
y debajo de su media (cero) y en el segundo una clara tendencia creciente, luego consideramos
la opcin de que el modelo presente autocorrelacin positiva.

Para tomar una decisin sobre la existencia o no de autocorrelacin en el modelo, recurrimos


al contraste de Durbin-Watson, de forma que en la pantalla donde se obtuvo la estimacin del
modelo tenemos el valor del estadstico de Durbin-Watson (0'3388). Teniendo en cuenta el
nmero de observaciones (35) y el nmero de regresores excluida la constante (1), los lmites
obtenidos a partir de la tabla de Durbin-Watson son: du=1'5191 y dl=1'4019. Luego claramente
en el modelo hay autocorrelacin positiva.

Para corregir la autocorrelacin hay que transformar el modelo:

Yestrella(t) = Consumo(t) - ro * Consumo(t-1), Xestrella = PIB(t) - ro * PIB(t-1),

luego hay que determinar el valor de ro. Con tal objetivo estimamos el modelo u(t) = ro * u(t-
1) + e(t), obteniendo que ro = 0'824911.

Con esta informacin transformamos los datos y estimamos el nuevo modelo por MCO
obteniendo:

Yestrella(t) = 3'51579 + 0'772551 * Xestrella(t), t = 1955,...,1988,

con un R cuadrado de 0'997151 y siendo significativo el coeficiente de la pendiente. Adems,


sabemos que la estimacin de la constante del modelo original no es equiparable a la del
segundo modelo. Para obtener la primera hay que dividar la segunda entre 1 - ro.

Por otro lado, a partir del grfico temporal de los residuos y el diagrama de dispersin de los
mismos observamos que se distribuyen de forma aleatoria, lo cual nos hace pensar que los
residuos estn incorrelados. Hiptesis que se confirma al tener en cuenta el valor del estadstico
de Durbin-Watson (1'808495) y los lmites du=1'5136 y dl=1'3929.

Finalmente, se muestran los procedimientos iterativos de Cochrane-Orcutt y Prais-Winsten


para estimar modelos con presencia de autocorrelacin. Hay que advertir que hay que
introducir las variables originales y que la diferencia entre uno y otro consiste en la manera de
transformar los datos. Mientras que el primero prescinde de la primera observacin, el segundo
la considera tratndola como ya sabemos de forma distinta a las dems. Vemos que ambos
mtodos convergen rpidamente y proporcionan valores parecidos para la pendiente de la
regresin y el estadstico de Durbin-Watson (corrigindose evidentemente la autocorrelacin).

You might also like