Professional Documents
Culture Documents
http://www.ugr.es/~romansg/material/softlibre/gretl2_es.html
A continuacin se va a abordar el anlisis de factores que influyen en el precio del oro. Las
observaciones son obtenidas a partir de la base de datos que posee Gretl, ms concretamente,
se trata de un ejemplo de Gujarati donde el precio del oro, PRICE, se estima a partir del ndice
de consumo del mismo, CPI, y el de la bolsa de Nueva York, NYSE. La estimacin obtenida
es:
Tras dicha estimacin podemos observar los valores reales del precio del oro, los estimados y
los residuos de la estimacin, de forma que se pueden representar los dos primeros de forma
conjunta as como los terceros.
A continuacin se realiza el contraste de normalidad de los residuos. En este caso, puesto que
el p-valor es inferior a 0.05, se rechaza la hiptesis nula de normalidad. Por tanto, en este
caso no hay normalidad en el modelo, por lo que no se podra abordar realizar inferencia en el
mismo y, por tanto, no sera factible obtener conclusiones legtimas a partir del ajuste realizado.
Sin embargo, a modo de ejemplo, supongamos que si se ha obtenido normalidad en los residuos
y pasemos a interpretar los distintos test sobre los parmetros y el modelo. Con respecto a los
p-valores asociados a los contrastes de significacin individual tenemos que ambos son
inferiores a 0.05, por lo que se rechaza la hiptesis nula de que los coeficientes de las
variables independientes sean nulos. Es decir, tanto el ndice de consumo como el de la bolsa
influyen en el precio del oro. Adems, como los coeficientes estimados son positivos, conforme
aumentan las variables independientes tambin lo hace la dependiente. A estas conclusiones se
pueden llegar tambin a partir de los intervalos de confianza de cada coeficiente, ya que, como
se puede observar, ninguno de los intervalos contiene al cero. Finalmente, el p-valor asociado
al contraste ANOVA tambin es inferior a 0.05, por lo que se rechazara la hiptesis nula de
que todos los regresores son nulos de forma simultnea. Por tanto, se podra afirmar que el
modelo es vlido ya que se puede afirmar que existe algn tipo de asociacin no debida al azar
entre las variables independientes y la dependiente. Destacar tambin que tanto el coeficiente
de determinacin como el corregido son bastante altos, el ajuste realizado explica alrededor de
un 94% de la variabilidad del precio del oro.
Advirtase que en este ejemplo se pone de manifiesto que las conclusiones obtenidas son
vlidas siempre y cuando se verifiquen las hiptesis bsicas. En este caso no se verifica la
hiptesis no normalidad de los residuos, pero aun verificndose, habra que analizar la posible
existencia de heteroscedasticidad y autocorrelacin. Mientras que no se verifiquen todas las
hiptesis bsicas las conclusiones obtenidas estarn en entredicho.
siendo la constante no significativa (no se rechaza la hiptesis nula de que pueda ser cero),
mientras que la renta si lo es (se rechaza la hiptesis nula de que sea cero). Adems, influye
positivamente, es decir, a ms renta mayor gastos en viajes. Finalmente, tambin se rechaza la
hiptesis nula del test ANOVA, por lo que el modelo es vlido.
Tras estimar el modelo original por MCO y obtener sus residuos, planteamos la regresin de
los cuadrados de los residuos frente a todas las variables del modelo original, sus cuadrados y
sus productos cruzados (omitiendo los elementos repetidos). En este caso, la estimacin de esta
regresin auxiliar es:
siendo chi(2, 0'05) el valor de una chi-cuadrado con 2 grados de libertad que deja por debajo
suya (a su izquierda) una probabilidad de 0'95, se tiene que no se rechaza la hiptesis nula. Es
decir, no se rechaza que la perturbacin aleatoria del modelo original sea homocedstica. Por
tanto, las conclusiones obtenidas seran vlidas.
Finalmente, advertir que el test de Breusch-Pagan es un test muy parecido a este, siendo la
nica diferencia que en su regresin auxiliar no hay que incluir los trminos cruzados ni las
variables originales al cuadrado. Por todo lo dems, se tratan de los mismos pasos a seguir. Es
tambin un test idneo para muestras grandes.
Correccin de la heteroscedasticidad
Teniendo en cuenta la informacin mostrada en el siguiente video, donde a partir de los datos
de 20 empresas sobre beneficios (B) y ventas (V) se estima un modelo lineal para explicar los
beneficios en funcin de la ventas, se contrasta la presencia de heteroscedasticidad y se aplican
Mnimos Cuadrados Ponderados (MCP).
Es inmediato que el modelo estimado por MCO es B(t) = 10'2229 + 0'0112223 * V(t) para
t=1,2,3...,20. Adems se obtiene un coeficiente de determinacin de 0'642619.
Al representar los residuos por nmero de observacin se observa que para distintos grupos de
observaciones (por ejemplo, de la 1 a la 7, de la 8 a 16 y de la 17 a la 20) se obtiene una
dispersin distinta, lo cual nos hace pensar en que las perturbaciones tienen varianza no
constante. De igual forma, en el grfico de los residuos frente a la variable que suponemos que
produce la heteroscedasticidad (las ventas) observamos que conforme aumenta las ventas
aumenta la dispersin de los residuos. Todo lo anterior me indica que, basndome en los
mtodos grficos, hay presencia de heteroscedasticidad en el modelo considerado.
A partir del test de White (mtodo analtico), decidimos rechazar la hiptesis nula de
homocedasticidad en el modelo ya que el p-valor obtenido es de 0'04256. Esto se debe a que
el p-valor se define como el mnimo valor de significatividad a partir del cual se rechaza la
hiptesis nula. Es decir, para valores mayores que 0'04256 se rechaza la hiptesis nula y para
valores menores no se rechaza. Puesto que en este caso estamos trabajando a un 5% de
significacin, es evidente que 0'05 es mayor que 0'04256, por lo que la decisin a tomar es
rechazar la hiptesis nula, lo cual conduce a que hay presencia de heteroscedasticidad en el
modelo.
Como es sabido, para aplicar el test de White es necesario plantear una regresin auxiliar donde
se expliquen los residuos al cuadrado a partir de las variables originales, sus cuadrados y sus
productos cruzados omitiendo las repeticiones. En este caso, los regresores de la variable
auxiliar sern una constante, las ventas y su cuadrado (todas las dems posibilidades son
repeticiones de estas). De esta forma la estimacin por MCO de esta regresin ser B(t) = -
5'17545 + 0'0833682 * V(t) - 0'000132827 * V(t)^2 para t=1,2,...,20, con un coeficiente de
determinacin de 0'315679. Por ltimo, puesto que el estadstico experimental se obtiene
multiplicando el nmero de observaciones por el coeficiente de determinacin de la regresin
auxiliar, es claro que dicho valor corresponde a 20 * 0'315679 = 6'313575.
Deteccin de la autocorrelacin
En el presente ejercicio estimamos por MCO un modelo que pretende explicar el Consumo en
funcin del PIB. Tras introducir los datos, en primer lugar representamos el grfico de
dispersin del Consumo frente al PIB (que adems nos ofrece en su parte superior la
estimacin del modelo). Observamos que la relacin lineal es idnea para el modelo
considerado. Tras esta representacin grfica, estimamos el modelo por MCO, obtenindose
los siguientes resultados:
siendo ambos coeficientes significativos y con un R cuadrado de 0'9923. Por tanto, parece que
estamos ante un buen ajuste.
A continuacin recurrimos a los mtodos grficos. De forma que en la pantalla donde tenemos
la estimacin del modelo podemos representar el grfico temporal de los residuos, observando
una alternancia en el signo de los mismos. Lo cual nos hace pensar en la posible existencia de
autocorrelacin negativa. Otra representacin posible es el grfico de dispersin de los residuos
frente a alguno de sus retardos. Con tal objetivo guardo los residuos, obtengo la serie retardada
una vez y los represento, observando una tendencia decreciente lo cual me vuelve a hacer
considerar la posibilidad de existencia de autocorrelacin negativa.
Luego, a partir de los mtodos grficos parece ser que el modelo presenta autocorrelacin
negativa, si bien el contraste de Durbin-Watson es inconcluyente. En este caso habra que
recurrir a otros mtodos para estudiar la posibilidad de autocorrelacin en el modelo, aunque
en cualquier caso sera muy interesante aumentar el nmero de observaciones del modelo.
Correccin de la autocorrelacin
Consideramos en este caso el ejemplo de la pgina 242 del libro Econometra de Alfonso
Novales en el que se estudia un modelo de regresin del consumo total (pblico ms privado)
en funcin del PIB.
En primer lugar introducimos los datos en formato ASCII para que posteriormente sean
importados con Gretl. Consideramos pues dos columnas de datos, la primera para el PIB y la
segunda para el consumo, cuya separacin viene determinada por el tabulador.
Una vez recuperados los datos con el software economtrico Gretl, en primer lugar
representamos el diagrama de dispersin del consumo frente al PIB de manera que observamos
que ajustar el modelo por MCO es una opcin idnea. Por lo que procedemos a la estimacin
del modelo mediante dicho mtodo. Los resultados obtenidos son:
luego hay que determinar el valor de ro. Con tal objetivo estimamos el modelo u(t) = ro * u(t-
1) + e(t), obteniendo que ro = 0'824911.
Con esta informacin transformamos los datos y estimamos el nuevo modelo por MCO
obteniendo:
Por otro lado, a partir del grfico temporal de los residuos y el diagrama de dispersin de los
mismos observamos que se distribuyen de forma aleatoria, lo cual nos hace pensar que los
residuos estn incorrelados. Hiptesis que se confirma al tener en cuenta el valor del estadstico
de Durbin-Watson (1'808495) y los lmites du=1'5136 y dl=1'3929.