Professional Documents
Culture Documents
Alfonso Novales
April 29, 2003
Contents
1 Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 Algunos conceptos estadsticos bsicos . . . . . . . . . . . . . . . . . .
2.1 Medidas de posicin y medidas de dispersin . . . . . . . . . . . .
2.1.1 La media muestral como predictor . . . . . . . . . . . . . .
2.1.2 La desviacin tpica como indicador de volatilidad . . . . .
2.2 Medidas de asociacin . . . . . . . . . . . . . . . . . . . . . . . .
3 Contrastacin de hiptesis estadsticas . . . . . . . . . . . . . . . . . .
3.1 Contrastes de Normalidad . . . . . . . . . . . . . . . . . . . . . .
3.2 Contrates de asociacin . . . . . . . . . . . . . . . . . . . . . . . .
4 Tratamiento de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1 Ajuste estacional . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Tasas de variacin . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3 Estimacin de componentes . . . . . . . . . . . . . . . . . . . . .
5 El modelo lineal simple de regresin . . . . . . . . . . . . . . . . . . . .
5.1 Descripcin del modelo . . . . . . . . . . . . . . . . . . . . . . . .
5.1.1 Nube de puntos . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Estimacin por mnimos cuadrados (ordinarios) . . . . . . . . . .
5.2.1 Representacin grfica de la recta de regresin estimada .
5.3 Propiedades del estimador de mnimos cuadrados ordinarios . . .
5.4 Residuos del modelo. Grficos de residuos . . . . . . . . . . . . .
5.4.1 Estimacin de la varianza del trmino de perturbacin . .
5.5 Cuando los coeficientes del modelo de regresin cambian a lo largo
de la muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.5.1 Cambio estructural en los coeficientes del modelo de regresin
5
5
5
5
7
9
9
14
14
15
15
15
15
15
15
15
15
15
15
16
17
17
18
21
21
21
23
24
25
26
26
27
27
27
30
30
32
32
32
32
32
33
36
38
39
42
44
44
45
45
45
47
47
48
49
51
8.8.7
10
11
12
13
14
15
16
17
18
51
51
54
54
54
54
54
54
54
54
59
60
68
68
74
75
77
77
78
80
81
84
85
85
87
87
88
88
88
88
88
88
88
88
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
88
88
88
88
88
88
88
88
88
88
88
88
88
88
88
88
88
88
88
88
88
88
1. Introduccin
Ha sido tradicional dejar muchas decisiones a los mtodos estadsticos.
La discusin importante es si el investigador debe plantear su investigacin
incorporando sus creencias a priori o, por el contrario, la investigacin ha de ser
asptica en ese sentido, no debiendo estar condicionada en ningn aspecto por las
creencias iniciales del investigador.
M in F (a) M in E (X a)2
a
n
X
(Xi a)2
M in E (xt0 xt0 )2
x
t0
(2.1)
M in E | xt0 xt0 |
x
t0
(2.2)
probabilidad poblacional es conocido, por ejemplo, Normal. Este tipo de contrastes son contrastes paramtricos, puesto que se basan en la estimacin de algunos parmetros de la distribucin de probabilidad poblacional. El investigador
no debe olvidar nunca que las propiedades de estos contrastes dependen de que
sea correcta la hiptesis que se haya establecido acerca del tipo de distribucin
poblacional de la que se extrajo la muestra disponible, as como del carcter de
dicha muestra (muestra aleatoria simple). Un contraste que tiene muy buenas
propiedades XXXX
Existen contrastes no paramtricos, que no precisan de la estimacin de parmetros poblaiconales, ni descansan en ningn supuesto acerca de la distribucin de
probabilidad poblacional, que son de un enorme inters en el anlisis de datos
econmicos, a pesar de ser poco habituales. Son contrastes cuyas propiedades son
muy robustas (es decir, continan siendo vlidas total o aproximadamente) con independencia del tipo de distribucin poblacional. Una segunda razn que confiere
enorme inters a los contrates no paramtricos es que nos permiten discernir el
grado en que son vlidas hiptesis que no pueden representarse en trmios de valores numricos para los parmetros de la distribucin de probabilidad poblaiconal.
As, en el primero de los ejemplos mantes mencionados, queremos contrastar la
hiptesis de que la poblacin de la que se extrajo la muestra sigue una distribucin Normal. Por supuesto, que tambin podra contrastarse la hiptesis nula
de que obedecve una distribucin t de Student, o chi-cuadrao, o cualquier otra.
Asimismo, podemos contrastar la hiptesis de que dos muestra proceden de igual
distribucin de probabilidad, sin necesidad de especficar de qu tipo es ninguna
de ellas.
Un tipo de contraste de gran inters para las cuestiones examinadas en el
trabajo especfico economtrico estriba en el grado de asociacin entre variables.
Precisamente la Econometra consiste en el cnojunto de mtodos estadsticos que
permiten asignar valores numricos a los coeficientes de un modelo que trata de
representar la relacin existente entre un conjunto de variables econmicas. Es,
por tanto, un anlisis de tipo paramtrico; una vez asigndaos valores numricos a
los parmetros del modelo, generalmente se llevarn a cabo contrastes paramtricos de hiptesis, utilizando los valores numricos estimados. Existen, asimismo,
contrates no paramtricos que, sin necesidad de pasar por una fase de estimacin,
permiten discutir si la evidencia muestral es consistente con la hiptesis de que dos
variables determinadas estn relacionadas entre s. Es tan fcil llevar a cabo este
tipo de contrastes que deberan formar parte, como paso previo a la estimacin
de todo modelo econmtrico. No sera razonable que las conclusiones de tales
10
= P a g (X) , b
(3.1)
donde , un nmero positivo prximo a 1, es el nivel de confianza del contraste.
El contraste se resuelve despejando el valor terico del parmetro desconocido
dentro de la expresin anterior, para obtener una igualdad del tipo,
h
i
= P h1 ( (X)) f () h2 ( (X))
(3.2)
donde h1 ( (X)), h2 ( (X)) son nmeros reales que dependen de: i) el valor
numrico del estimador (x1 , x2 , ..., xn ) en la muestra disponible, ii) el supuesto
acerca de la distribucin poblacional, iii) el nivel de confianza (o el nivel de signifcacin) escogidos para el contraste.
En esta expresin, dada una determinada muestra, el valor numrico del estimador (X) es conocido, por lo que puede comprobarse si se satisfacen o no las
desigualdades,
h1 ( (X)) f 0 h2 ( (X))
(3.3)
x
0, 95 = P 1, 96 1, 96
5/ n
donde hemos utilizado el hecho de que x N (0, 25
) y x N(0, 1).
n
25/n
5
5
5
5
0, 95 = P 1, 96 x 1, 96 x = P x 1, 96 x + 1, 96
n
n
n
n
que es una igualdad anloga a (3.2) , con h1 (
x) = x 1, 96 5n , h2 (
x) = x +
5
1, 96 n , f () = .
En definitiva, nos queda comprobar si cuando se introduce en esta ltima
igualdad el valor de que define la hiptesis nula, la cadena de desigualdades
se satisface o no. Supongamos que en la muestra disponible, de tamao 400, se
ha calculado para la variable X una media muestral x = 7, 5;en consecuencia, el
intervalo anterior es: 0, 95 = P [7, 0 8, 0] .
3.1. Contrastes de Normalidad
3.2. Contrates de asociacin
Antes de proceder a la estimacin de un modelo especfico que establezca una
relacin paramtrica entre dos variables, conviene explorar la posible existencia
14
de una relacin entre ellas por los procedimientos estadsticos disponibles. Uno
de ellos son los contrastes no paramtricos. Como ya hemos comentado anteriormente, una de las virtudes de este tipo de anlisis es que su validez y, en
particular, los umbrales crticos que debe sobrepasar el estadstico que define el
contraste, no dependen de ningn supuesto acerca de la distribucin de probabilidad seguida por las variables cuya relacin se trata de caracterizar. Frente
a otros procedimientos que forman el ncleo tradicional de la Econometra, esto
es una ventaja pues, en el caso de los ltimos, la Normalidad de la variable cuyo
comportamiento se pretende explicar es clave. Como, adems, el supuesto de Normalidad acerca de la distribucin de probabilidad de una variable econmica es
mucha veces rechazado, resulta que las buenas propiedades de las estimaciones de
un modelo economtrico quedan muchas veces en cuestin. Por eso es conveniente
su uso en combinacin con otro tipo de procedimientos estadsticos, especialmente
si sus propiedades no precisan tal hiptesis.
4. Tratamiento de datos
4.1. Ajuste estacional
4.2. Tasas de variacin
4.3. Estimacin de componentes
utilizar, son aleatorias, pues son funcin de la muestra que utilicemos, que es
aleatoria. Si el modelo que estamos estimando es correcto, como hemos de
suponer, la perturbacin aleatoria del mismo, ut , otorga naturaleza asimismo
aleatoria a la variable dependiente, yt . Esto significa que si cambiamos por ejemplo el perodo muestral que utilizamos en la estimacin, la realizacin de dicha
perturbacin, es decir, sus valores numricos, sern diferentes, con lo que las observaciones de yt tambin los ern, y la estimacin de los parmetros diferir de
la obtenida con otro perodo muestral. Asimismo, si cambiamos la frecuencia de
observacin de los datos, de diaria a mensual, por ejemplo tomando el ltimo dato
de cada mes, la muestra cambia, y con ella, las estiamciones de los coeficientes de
las variables explicativas en el modelo.
Siendo variables aleatorias, nos interesa que los estimadores tengan ciertas
propiedades deseables, lo cual depender del procedimiento de estimacin utilizado, y de lasc aractersticas del modelo que estamos estimando. Las principales
propiedades en que podemos estar interesados son: insesgo, eficiencia y consistencia.
El insesgo consiste en que la esperanza matemtica del estimador coincida
con el verdadero valor numrico del coeficiente que estamos estimando. Un estimador eficiente es un estimador de mnima varianza. El procedimiento de mnimos
cuadrados proporciona el estimador lineal de mnima varianza, si bien pueden existir otros estimadores no lineales de varianza todava menor. Un estimador es
consistente si, al aumentar el tamao muestral, converge en probabilidad al verdadero valor del parmetro desconocido que se est estimando. Se dice entonces
que su lmite en probabilidad es dicho parmetro. Bien podra ocurrir que el estimador fuese sesgado en muestra pequeas, pero si es consistente, dicho sesgo ir
reducindose si ampliamos el tamao muestral. El estimador de mnimos cuadrados no es siempre consistente. El estimador de mxima verosimilitud lo es, pero
siempre que la hiptesis acerca de la distribucin de probabilidad en que se basa,
sea correcta, sobre lo que no se puede tener seguridad.
5.4. Residuos del modelo. Grficos de residuos
Los residuos del modelo, a veces denominados los errores del modelo de regresin,
son aqul componente de la variable dependiente que no est explicado por los
valores que toma la variable independiente o explicativa. En consecuencia, los
residuos ut se calculan a partir de la expresin,
yt = 0 + 1 xt + ut
16
de la que se obtiene,
ut = yt 0 1 xt
en el caso de datos de serie temporal, y
ui = yi 0 1 xi
en el caso de datos de seccin cruzada.
Grficamente, si volvemos a la nube de puntos que representa la posible
relacin entre x e y, y dibujamos sobre ella la recta de regresi n, el residuo
no es sino la distancia vertical entre la altura (ordenada) de cada punto de la
nube, y la altura que le correspondera de acuerdo con la recta de regresin estimada. Dicha altura debe tomarse con signo, de modo que el residuo es positivo
cuando el punto de la nube est por encima de la recta de regresin estimada, y
negativo cuando el punto queda por debajo de la recta de regresin estimada.
5.4.1. Estimacin de la varianza del trmino de perturbacin
5.5. Cuando los coeficientes del modelo de regresin cambian a lo largo
de la muestra
Supongamos que se dispne de datos de serie temporal, y que el coficiente que
mide la relacin entre las variables x e y, es decir, la pendiente del modelo, ha
variado a lo largo del tiempo. Es claro que un procedimiento de estimacin como
mnimos cuadrados nos proporcina un nico valor numrico de dicho coeficiente
y, por tanto, cobra pleno inters nicamente bajo el supuesto de que dicho valor
nmrico ha permanecido constante a lo largo del perodo muestral.
Sin embargo, en la mayora de las aplicaciones econmicas que pueden considerarse, tal supuesto parece demasiado restrictivo pues, ms bien, el valor numrico
de dicha elasticida habr variado a lo largo de la muestra. Qu proporciona en
tal caso el mtodo de mnimos cuadrados? Lo primero que debemos entender es
que el investigador no observa en ningn caso si el coeficiente ha variado en el
tiempo o no, dado que no observa el valor numrico de dicho coeficiente. Esta es,
precisamente, la razn que le mueve a estimar su valor numrico.
En muchas situaciones, sin embargo, el investigador puede tener fundadas
creencias acerca de que se han producido variaciones en el mismo. Por ejemplo,
muchas veces se afirma que la capacidad de la poltica monetaria para controlar la
inflacin se ha reducido significativamente recientemente; tal afirmacin se debe
17
18
Ejercicios de simulacin
Ejercicio 1: Simule 300 observaciones de un camino aleatorio N(10,25) como
datos muestrales de la variable explicativa x. Utilizando un valor numerico
de -1,0 para la pendiente, e ignorando el trmino de preturbacin del modelo, simule los 100 primeros datos para la variable dependiente y. Luego,
utilice un valor igual a 1,0 para la pendiente y genere los datos ficticios
correspondientes a las observaciones 101 a 300 de la variable dependiente.
Estime el modelo de regresin simple con dichos datos.
Comentario: Al ejecutar el programa XXX, el lector comprobar que la estimacin de la pendiente del modelo se comporta de acuerdo con lo comentado en
la seccin previa.
Es recomendable ejecutar el programa varias veces, para obtener as un conjunto de estimaciones numricas de dicho parmetro. En ningn caso se obtendr
estimaciones prximas al verdadero valor de la pendiente, que es de +1,0 en una
parte de la muestra, y de -1,0 en la otra, sino ms bien un promedio, ponderado de
acuerdo con el nmero de datos u observaciones en el que la pendiente ha tomado
uno u otro valor numrico.
El lector puede comprobar que, si aumenta la longitud muestral, las estimaciones que obtiene al ejecutar repetidas veces el programa, se aproximan an ms
al promedio que cabra esperar, dado el porcentaje de datos con pendiente igual
a +1,0 -1,0.
Los estadsticos resultantes de la estimacin presentan toda la apariencia de
proceder de un problema estadstico de relacin entre dos variables aleatorias. Sin
embargo, es muy importante observar que el problema que acabamos de estimar
es, en realidad, puramente determinista. No hay en el mismo ningn componente
estocstico o aleatorio pues, no hemos utilizado un lemento de perturbacin. En
nuestra simulacin, la relacin entre las variables x e y es, en todos los perdos
exacta, no faltando ninguna otra variable, ni estando sujeta a ningn elemento de
error impredecible.
Es precisamente el hecho de tratar como constante un coeficiente del modelo que no lo es, lo que produce la apariencia de ser un problema de naturaleza
estocstica. Considerar tal supuesto (errneo, aunque no lo sabamos), es comparable a introducir una perturbacin estocstica en el verdadero modelo, que
incorporara la variacin temporal en la pendiente.
En dicha estimacin, aparentemente estadstica, obtenemos un R-cuadrado
reducido, junto con una pendiente estimada que resulta estadsticamente significativa, si juzgamos por su estadstico tipo-t.
19
10T y
ut = yt 0 = yt y
es decir, el dato correspondiente, en la forma de desviacin respecto a la media
muestral. Por tanto, la Suma Residual, o suma de los residuos al cuadrado es,
SR =
u2t
t=T
X
t=1
21
t=T
X
t=1
SR
SE
=
=0
ST
ST
Esto puede parecer paradjico a primera vista; sin embargo, tiene una interpretacin totalmente acorde con la naturaleza del modelo de regresin. Como
discutimos en la Seccin XX, aunque el modelo de regresin se especifica generalmente para relacionar los valores numricos observados para variables yt , xt ,
en realidad, su utilizacin fundamental en Economa estriba en establecer alguna
inferencia acerca de la relacin que pueda existir entre las variaciones que experimentan las variables explicativas por un lado, y la variable dependiente por otro.
Son las fluctuaciones en ambas variables lo que fundamentalmente pretendemos
caracterizar. Como vimos al caracterizar el estimador MCO, una vez que tenemos
estimaciones numricas para los coeficientes aosicados a las variables explicativas
del modelo, obtenemos la estimacin numrica de la constante del modelo mediante,
0 = y 1 x 0 0
que relaciona las medias muestrales de todas las variables del modelo. Por
tanto, la relevancia de la constante en el modelo estriba en ajustar las distintas
medias muestrales de las variables del mismo, corrigido cada una de ellas por el
coeficiente asociado. Pero este es un ajuste generalmnente poco relevante para
el investigador, que se interesa bsicamente en el modo en que variacioens en las
variables xt generan fluctuaciones en yt . Por tanto, en este modelo constante, en
que no se explican las fluctuacioens de yt , llevndose nicamente a cabo el ajuste
de medias muestrales a travs de (5.1) ,es lgico que el indicador de ajuste R2
22
resulte igual a cero. Ntese, por ltimo, que no hemos impuesto esta condicin,
sino que estamosminterpretan la propiedad del modelo constante, de tener un R2
igual a cero.
5.6.2. El modelo con variables en desviaciones respecto a la media
Consideremos un modelo lineal,
(5.2)
yt = 0 + 1 x1t + 2 x2t + ut
cuya versin estimada es,
2 x2t + ut
yt = 0 + 1 x1t +
(5.3)
yt =
t=T
X
0 + 1
t=1
t=T
X
x1t + 2
t=1
t=T
X
t=1
x2t +
t=T
X
ut
(5.4)
t=1
(5.5)
las variables explicativas, cada una de ellas corregida por el coeficiente asociado.
Pero en el modelo con variables en desviaciones respecto a la media, todas las
vriables, dependiente y explicativas, tiene media muestral igual a cero. Por tanto,
la estimacin MCO de una hipottica constante en dicho modelo sera igual a
cero. incluso si incluimos dicha constante, su estimacin de mnimos cuadrados
ser numricamente igual a cero.
5.6.3. El modelo con tendencia determinista lineal y cuadrtica
Un modelo sencillo interesante es aqul que incluye una tendencia determinista
como nica variable explicativa, adems del trmino constante,
ln yt = 0 + 1 t + ut
(5.6)
(5.7)
que ste est bien representado por el supuesto de una tasa de crecimiento constante. As, una vez estimado el modelo (5.6) , los residuos ut nos proporcionan el
logaritmo de la variable yt desprovisto de tendencia, es decir, ut = ln yt 0 1 t,
recogiendo as el comportamiento de la variables segn flucta alrededor de su
tendencia de largo plazo. Diremos tambin que esta es la representacin de la
variable corregida de tendencia lineal. Como hemos visto, este ejercicio, efectuado sobre el logaritmo de la variable original, incorpora el supuesto implcito de
que la tasa de crecimiento de dicha variable es constante.
5.6.4. Modelos no lineales en las variables
Algunos modelos no lineales pueden tratarse de modo muy sencillo, sin necesidad
de desarrollar mtodos distintos de los estudiados en los captulos anteriores. Ello
ocurre en muchas situaciones en que el modelo presenta no linealidades exclusivamente en las variables que aparecen en la relacin que se pretende estimar,
como,
yt = 0 + 1 xt + 2 x2t + ut
(5.8)
que es un modelo con una nica variable explicativa, que aparece tanto en su
forma original, como al cuadrado. Es interesante observar que, en este modelo,
la derivada parcial, que recoge la magnitud de los cambios inducidos en yt por un
cambio en el valor numrico de xt viene dada por,
dyt
= 1 + 2 2 xt
dxt
A diferencia de la que tenamos en el caso del modelo de regresin lineal simple,
que era,
dyt
= 1
dxt
y, por tanto, constante, la derivada parcial del modelo (5.8) depende del valor
numrico de la variable explicativa. Esto puede ser muy interesante en muchas
relaciones econmicas, en las que es lgico pensar que el impacto que sobre yt tiene
una variacin unitaria en xt depende del valor numrico de xt a partir del cual
se produce dicha variacin unitaria. As, no tendra el mismo impacto negativo
sobre el consumo un incremento de un punto en el tipo impositivo del IVA si ste
25
se produce cuando dicho tipo es del 3%, que si dicho incremento se produce a
partir de un tipo del 15%. Parece lgico que as sea.
Si las variables utilizadas en la regresin son los logaritmos naturales de las
variables para las que inicialmente obtuvimos datos, como consumo y renta,
yt = ln(Yt ), xt = ln(Xt ), estaramos recogiendo en (5.8) la creencia en una elasticidad no constante, como aparece en muchos modelos tericos econmicos. Si el
valor numrico del coeficiente 2 es negativo, tendremos que la variable yt crece
menos que proporcionalmente con un aumento en xt , lo que correspondera a una
nube de puntos en la forma de una funcin cncava, mientras que si estimamos
un valor numrico positivo para 2 , tendremos que la variable yt crece ms que
proporcionalmente con un aumento en xt , lo cual correspondera a una nube de
puntos convexa. Por contraposicin, en el modelo lineal incorporamos a priori
la hiptesis de elasticidad constante, es decir, el supuesto de que la variable yt
crece proporcionalmente con xt .Sin duda que, aunque no se considera habitualmente, parece conveniente permitir en un priemr anlisis la posibilidad de una
relacin cuadrtica contrastando, si se desea, la significatividad estadstica del
coeficiente 2 , si bien dicho contraste habra que verlo a la luz de la discusin
de la Seccion XX. As, en muchas ocasiones (como puede ser si se quiere utilizar
el modelo estimado con fines predictivos) puede resultar conveniente mantener
un posible trmino cuadrtico incluso si el coeficiente 2 asociado aparece como
estadsticamente no significativo, en trminos del habitual contraste de la t de
Student.
Queda por discutir cmo obtener estimaciones de mnimos cuadrados para este
modelo, a pesar de ser una relacin no lineal entre variables. Pero este tipo de
modelos es muy sencillo de estimar, pues basta definir una nueva variable x2t = x2t
para tener el modelo de regresin,
yt = 0 + 1 xt + 2 x2t + ut
(5.9)
que, como modelo lineal que es en las variables explicativas xt y x2t , estimamos
por medio de los procedimientos descritos en la Seccin XX, teniendo el estimador
MCO de este modelo las propiedades habituales.
5.7. Cmo especificar un modelo de regresin?
5.7.1. Debe incluirse una constante en el modelo de regresin?
Consideremos el modelo de regresin simple,
26
27
trimestre
trimestre
estn relacionados. Sin embargo, debe apreciarse que la relacin ser entre
lso datos de x e y correspondientes ambos al primer trimestre. En consecuencia,
una relacin que con datos mensuales tena una naturaleza dinmica, pasa a ser
estrictamente contempornea con datos triemstrales.
As, es importante recordar que algunas de las propiedades de una relacin
economtrica dependen de la frecuencia de observacin de los datos, no siendo,
por tanto, propiedades de carcter absoluto de la relacin entre x e y.
DT ()
tT k
31
puramente transitorios; pueden durar varios perodos, pero sus efectos terminan
desapareciendo. Los valores sucesivos de su funcin de auocorrelacin convergen
rpidamente hacia cero, excepto quiz en los retardos de carcter estacional. la
serie temporal correspondiente a una variable estacionaria no deambula durante
perodos largos de tiempo a un mismo lado de su media muestral, sino que cruza
frecuentemente dicho nivel medio. El nmero medio de perodos que transcurre
entre dos cruces consecutivos del nivel medio muestral es pequeo.
Por el contrario, una perturbacin de carcter transitorio sobre una variable
no estacionaria tiene efectos permanentes. La funcin de autocorrelacin de una
variable no estacionaria converge a cero muy lentamente, y su serie temporal
muestra claramente largos perodos de tiempo en que deambula sin cruzar su
nivel medio.
8.2. Tendencias deterministas y tendencias estocsticas
La ausencia de estacionariedad en variables econmicas puede reflejarse mediante
la presencia de tendencias estocsticas o de tendencias deterministas en los precios
de mercado, a travs de volatilidad cambiante en el tiempo, etc.. Una tendencia
estocstica es un componente estocstico cuya varianza tiende a infinito con el
paso del tiempo. Una tendencia determinista es una funcin exacta del tiempo,
generalmente lineal o cuadrtica, lo que hace que el valor de la variable crezca o
disminuya constantemente; si la tendencia es lineal, la variable tender a ms o
menos infinito; si la tendencia es cuadrtica o de orden superior, la variable puede
estar acotada.
Si una variable presenta una tendencia determinista lineal, su valor esperado
tender a aumentar o disminuir continuamente, con lo que ser imposible mantener el supuesto de que la esperanza matemtica de la sucesin de variables
aleatorias que configura el proceso estocstico correspondiente a dicha variable,
es constante. En consecuencia, tampoco podr mantenerse que la distribucin de
probabilidad de dichas variables es la misma a travs del tiempo. Sin embargo, si
efectuamos una correcta especificacin de la estructura de dicha tendencia, podr
estimarse y extraerse del precio, para obtener una variable estacionaria, que no
presentara las dificultades antes mencionadas.
Mayor dificultad entraa el caso en que una variable precio incluye una tendencia estocstica pues, en tal caso, su esperanza y varianza no estn definidas.
La presencia de una tendencia estocstica requiere transformar la variable, generalmente en primeras diferencias temporales, o tomando las diferencias entre las
33
t
X
s=1
j ytj = (L) yt
s=1
X
1 t1
yt = 0
+ s1 y0 +
ts
1 s
1 1
s=1
y si consideramos que el proceso ha durado infinitos perodos,
E(yt ) =
0
2
; V ar(yt ) =
1 1
1 21
estaran bien definidas, son constantes, y el proceso es estacionario. Este proceso se denomina proceso autoregresivo de primer orden y en l hay que distinguir
entre momentos incondicionales, cuyas expresiones analticas acabamos de calcular en el caso de esperanza matemtica y varianza, y momentos condicionales.
donde suponemos que ut es un proceso sin autocorrelacin (correlacin temporal consigo mismo). Es decir, Corr(ut , utk ) = 0 k.
En estas condiciones, si ut sigue una distribucin Normal ut N(0, 2u ), entonces yt sigue una distribucin
35
yt N (
0
2u
,
)
1 1 1 21
0
1 1
estructura estocstica que xt , yt , por lo que ambas relaciones deberan proporcionar resultados anlogos. Esta apariencia ficticia de capacidad explicativa es lo
que se conoce como regresin esprea.
El grado de correlacin observado entre yt , xt depende de dos factores: la
similitud entre las constantes a y b, y la relacin entre ambas y las desviaciones
tpicas de los ruidos blancos originales, xt , yt . Si, por ejemplo, fijamos el valor
numrico de b en b = 1, y vamos tomando en cada ejercicio de simulacin valores: a = [0, 1; 0, 5; 0, 9; 1; 3; 10; 100] el coeficiente de determinacin resultante,
R2 aumenta montonicamente con el valor de a. Es decir, la mayor correlacin
no se obtiene cuando hay a ambos lados de la igualdad la misma pendiente, lo
que equivaldra a utilizar a = 1, sino que dicha correlacin aumenta con a. Esto
se debe a que, segn aumenta a, cada vez hay ms tendencia determinista en
yt , en el sentidod e ques sta predomina sobre el componente estocstico yt , y
dicha tendencia determinista puede explicarse muya decuadamente mediante el
componente anlogo de xt .
8.3.2. Regresin esprea bajo tendencias estocsticas
En su trabajo pionero, Granger y Newbold (1974) trataron el problema de no
estacionariedad producido por la presencia de tendencias estocsticas o races
unitarias. Para ello, realizaron el siguiente ejercicio: a partir de la simulacin de
dos ruidos blancos independientes que tendrn, por construccin, como antes, un
coeficiente de correlacin muestral muy reducido, aadieron una raz unitaria o
tendencia estocstica a cada uno de ellos,
yt = yt1 + yt
xt = xt1 + xt
obteniendo que el coeficiente de correlacin entre xt e yt era muy prximo a
la unidad. Esto es sorprendente, por cuanto que, a partir de condiciones iniciales
conocidas, los valores de ambas variables en cada instante de tiempo pueden
escribirse como,
yt = y0 +
t
X
ys
s=1
que indican que la evolucin temporal de cada una de las variables se debe a la
acumulacin temporal de sus innovaciones. Por tanto, la naturaleza estocstica de
39
en las variables. Esta sera uno de los elementos del anlisis; el segundo consistira
en evaluar la relacin entre los componentes estocticos en variables dependiente
y explicativas; ste elemento es importante, pues nos proporciona informacin acerca del impacto que sobre la variable dependiente puede tener una intervencin
sobre alguna de las variables explicativas, o una alteracin exgena en su valor
numrico. La dificultad con la regresin anterior estriba en que si no se lleva a
cabo este anlisis por componentes, el examen mecnico de los resultados de la regresin sugerira que la variable dependiente reacciona a fluctuaciones inesperadas
en la variable explicativa, cuando no es as; tal conclusin sera un error.
Posteriormente, hemos mantenido los mismos elementos tendenciales de ambas
variables, pero hemos incrementado de manera apreciable el componente aleatorio
en ellas. Siendo tales componentes variables aleatorias de esperanza matemtica
igual a cero, su tamao queda representao por su desviacin tpica, que era unitaria
para ambas en las regresiones anteriores. En la hoja Datos hemos generado otras
dos variables con desviaciones tpicas 20 y 30; la correlacin entre ellas desciende, si
bien no de manera dramtica, situndose en 0,9349. Por ltimo, hemos mantenido
estos compoenntes estocsticos, pero reduciendo el incremento perodo a perodo
de la tendencia, que pasa de ser 1,0 a ser ahora 0,10. El coeficiente de correlacin
entre ambas variables se reduce ahora a 0,2446; la regresin entre ambas variables
todava muestra una pendiente significativamente diferente de cero de acuerdo
con el uso habitual del estadstico t, pero de manera menos evidente que antes;
el coeficiente de determinacin es iguala 0, 24462 = 0, 0598, bastante reducido.
El grfico que muestra la nube de puntos, junto con la recta ajustada, ilustra la
dificultad de precisar la pendiente de la recta que mejor se ajusta a dicha nube
de puntos, es decir, la dificultad de estimar con precisin dicha pendiente.
8.4. Tratamiento de tendencias deterministas
De las dos situaciones descritas en el apartado anterior, es algo ms sencilla de
tratar la presencia de tendencias deterministas, cuando se anticipa correctamente
que la presencia de las mismas es la nica causa de no estacionariedad de las variables que se pretende relacionar, es decir, cuando las variables tienen estructura,
yt = 0 + 1 t + yt
xt = 0 + 1 t + xt
(8.1)
(8.2)
yt = + t + xt + ut
(8.3)
en la que el coeficiente estimado y su desviacin tpica sern, aproximadamente, los mismos que habramos estimado en la regresin,
yt = 0 + 1 xt
(8.4)
(8.5)
cuando las variables tienena estructura (8.2), (8.1), en la que se tendra un Rcuadrado muy elevado, una estimacin numrica de relativamente elevada, y un
estadstico t para dicho coeficiente, claramente por encima de 2,0 en valor absoluto,
sugiriendo que la capacidad de xt para explicar yt es significativa, contrariamente
a lo que, en realidad, ocurre.
La dificultad con el procedimiento que hemos sugerido es que todava mantendr un R-cuadrado muy elevado, debido a la capacidad explicativa que el trmino
t tiene sobre yt , debido a la presencia de una tendencia determinista en esta
ltima variable. este trmino aparecer como claramente significativo, con un
estadstico t muy elevado.
La diferenciacin elimina asimismo las tendencias deterministas, como fcilmente puede comprobarse algebraicamente. De este modo, si el precio de un
determinado activo tiene una tendencia temporal determinista lineal, su primera
diferencia estar libre de dicha tendencia. Un proceso con una tendencia determinista cuadrtica sigue trayectorias con formas parablicas, cncavas o convexas.
Su primera diferencia presentar una tendencia lineal, mientras que su segunda
diferencia estar libre de tendencia. Un proceso con una tendencia determinista representada por un polinomio de grado tres puede tener ciclos. La primera
diferencia de este proceso tendr una tendencia cuadrtica.
Como ejemplo, consideremos:
yt = 0 + 1 t + 2 t2 + t
cuya primera diferencia es:
43
yt = yt yt1 = ( 1 2 ) + 2 2 t + (t t1 )
y su segunda diferencia:
2 yt = yt yt1 = yt 2yt1 + yt2 = 2 2 + (t 2t1 + t2 )
Por tanto, aparentemente, una solucin en el caso en que sospechamos que
puede haber tendencias deterministas en las variables que pretendemos relacionar,
consistira en estimar la posible relacin entre ellas despus de haber tomado
diferencias temporales. Sin embargo, con dicha transformacin perdemos bastante
informacin acerca de las fluctuaciones de corto plazo en las variables, por lo que
los procedimientos anteriormente descritos son ms recomendables.
8.5. Ejercicios de simulacin
Ejercicio 1: Simule 300 observaciones de dos ruidos blancos independientes,
con distribuciones N (x, 2x ), N(y , 2y ), como observaciones muestrales para
las innovaciones xt , yt . A continuacin, genere observaciones para una tendencia determinista t. Los valores numricos para las variables x e y se
obtienen aadiendo la tendencia t, multiplicada por sendas constantes a, b,
a las respectivas innovaciones, para reproducir las estructuras (8.2) , (8.1).
El ejercicio consiste en comparar el coeficiente de correlacin que se obtiene
para xt , yt , que ser muy reducido, con el que se obtiene entre xt e yt , que
debera ser similar, pero ser, sin embargo, muy elevado. En segundo lugar,
deben estimarse regresiones anlogas a (8.4) , (8.5) , (8.3) .
8.6. Tendencias estocsticas y races unitarias
De modo anlogo, un proceso puede tener asimismo varias races unitarias. Los
tipos de inters ya son rentabilidades, por lo que tienen, generalmente, un orden de no estacionariedad (es decir, un nmero de tendencias) menos que las
series de ndices burstiles o de precios de derivados, por ejemplo. En ocasiones,
sin embargo, algunas series de precios son no estacionarias de orden 2 (tienen 2
races unitarias), por lo que incluso las rentabilidades pueden ser no estacionarias,
presentando una raz unitaria.
44
(8.6)
Si los residuos de esta regresin resultan ser estacionarios, decimos que las
variables yt , xt estn cointegradas, siendo (8.6) la relacin de cointegracin entre
ambas. Esta relacin sera el producto 0 z anterior despus de normalizar una
de las coordenadas del vector lo cual, evidentemente, siempre es posible. Se
interpreta como la relacin de largo plazo entre ellas, alrededor de la cual experimentan desviaciones a corto plazo que revierten posteriormente. Es decir, si en
un determinado perodo, yt est por encima del valor numrico de 0 + 1 xt para
ese mismo perodo, generalmente yt crecer por encima de 0 + 1 xt , de manera
que yt+1 tender a acercarse a 0 + 1 xt+1 . En el caso de dos variables yt , xt ,
decimos que 1 es la constante de cointegracin entre ambas.
En el anlisis de simulacin anterior, en el que generamos ambas series temporales a partir de procesos independientes, este contraste nos sugerir en una
mayora de simulaciones que yt , xt no estn cointegradas, lo que aparecer en la
forma de residuos de naturaleza I(1) en (8.6). En tal caso, habramos de estimar
un modelo en diferencias de ambas variables,
yt = 0 + 1 xt + vt , t = 1, 2, ..., T
que arrojar un coeficiente 1 no significativo y un coeficiente de determinacin
muy reducido.
Al contrastar cointegracin, estamos tratando de detectar la posible existencia
de relaciones de largo plazo entre las variables del modelo. En ese sentido, la
naturaleza del contraste sugiere el uso de una datos no necesariamente frecuentes,
y una muestra temporal suficientemente amplia. De lo contrario, predominar en
la muestra, en trminos relativos, la informacin acerca de las fluctuaciones de
corto plazo en las variables, frente a la de su evolucin tendencial, que es lo que
tratamos de detectar. Por tanto, una eleccin inapropiada de la muestra, ya sea
por una frecuencia alta de observacin de los datos, o por el uso de un perodo
muestral no muy amplio, sesgar el resultado del contraste hacia la no deteccin
de relaciones de cointegracin.
Efectuar un anlisis de cointegracin significa relacionar los niveles de variables
como oferta monetaria y precios, y no sus tasas de variacin. Por el contrario,
basar la caracterizacin de la relacin entre variables como las citadas utilizando
coeficientes de correlacin estndar es delicado, pues puede conducir a la deteccin
de regresiones espreas. El concepto de cointegracin generaliza el concepto de
correlacin en la direccin adecuada. La existencia de una tendencia estocstica
comn generara una relacin sostenible a largo plazo entre ambas variables, lo que
har que sus diferenciales reviertan a travs del tiempo, es decir, que sean mean46
reverting. No tiene sentido analizar las relaciones entre los niveles de variables
I(1) si no estn cointegradas.
8.8.2. Contraste de hiptesis sobre la relacin de cointegracin estimada
por mnimos cuadrados
Al estimar la relacin anterior por mnimos cuadrados hay que tener en cuenta
que las propiedades de dicho estimador son vlidas nicamente en el caso de variables estacionarias. Cuando las variables estn cointegradas, el uso de mnimos
cuadrados en la estimacin de la regresin esta justificado estadsticamente, pero
la distribucin de probabilidad del estimador MCO no es la habitual. Por tanto,
aunque el programa de estimacin que utilicemos nos proporcionar las desviaciones tpicas estimadas y los ratios tipo-t de cada coeficiente, estos no son vlidos
en este caso, y no deben utilizarse, por ejemplo, para contrastar hiptesis sobre
los coeficientes de la relacin de cointegracin.
Hay muchos casos, sin embargo, en que el modelo terico sugiere que las variables yt , xt deben estar relacionadas con un determinado valor numrico del coeficiente, por ejemplo, 0 = 1, por lo que el investigador estar interesado en
contrastar dicha hiptesis. Esto puede hacerse por un procedimiento indirecto,
sustituyendo el valor terico de , = 0 en la relacin entre ambas variables.
Ello significa que construimos la variable auxiliar wt = yt 0 xt , y contrastamos
la estacionariedad de esta variable.
Cuando se procede de este modo, es improtante repetir el contraste para valores de 0 en un entorno de 0 , con el objeto de analizar la precisin con que
hemos identificado la constante de cointegracin.
8.8.3. Correlacin y cointegracin
Sin embargo, correlacin y cointegracin no son sinnimos. El problema de correlacin esprea surge entre variables no estacionarias, con independencia de que
estn o no cointegradas, luego puede haber alta correlacin (de hecho, muy elevada) sin cointegracin. Alternativamente, el hecho de que exista una relacin
de largo plazo entre variables no estacionarias no impide que stas experimenten
desviaciones respecto de la misma que, si son de apreciable magnitud, reducirn la
correlacin existente entre dichas variables. Un ejemplo sera la evolucin temporal de la cotizacin de un valor en Bolsa, analizada conjuntamente con un ndice
que lo incluya, ya sea el ndice de mercado, un ndice de los valores ms capitalizados, o un ndice sectorial; dado que todo ndice es un promedio ponderado
47
de las cotizaciones de los valores en l incluidos, cabra esperar que ambas series
temporales estuvieran correlacionadas. Sin embargo, las fluctuaciones que ambos experimentan a corto plazo pueden ser suficientes para que su coeficiente de
correlacin sea reducido.
8.8.4. Variables cointegradas: un ejemplo
Un ejemplo tpico de variables posiblemente correlacionadas pero habitualmente
no cointegradas lo constituye algunos tipos de cambio. A partir de dos variables no estacionarias, pero cointegradas, es sencillo construir dos variabls no
cointegradas, sin ms que aadir en cada perodo a una de ellas, un incremento
no correlacionado temporalmente. Si la varianza de este componente no es muy
grande, mantendremos una correlacin anloga a la inicial, que poda ser elevada;
sin embargo, por construccin, las dos variables no estn cointegradas.
Ejemplo de variables cointegradas es,
xt = x + x wt + xt
yt = y + y wt + yt
wt = wt1 + t
donde zt es la tendencia comn a xt e yt , siendo xt , yt variables aleatorias
N (0, 2x ), N (0, 2y ), sin autocorrelacin. Las variables xt e yt estn cointegradas,
puesto que
y
y
yt y / x xt = y x + yt xt
x
x
de las posibles relaciones de cointegracin existentes entre las variables que componen el vector. De hecho, la estimacin resultante depender de la normalizacin
de coeficientes utilizada en (8.6), a diferencia de lo que ocurre en el caso de dos
variables.
8.8.5. El modelo de correccin de error
Teorema de representacin de Engle y Granger
Este teorema afirma que si dos variables yt , xt de naturaleza I(1),estn cointegradas, sus relaciones dinmicas estn caracterizadas por el modelo de correccin
de error,
yt = y +
xt = x +
m
X
i=1
p
X
y1i xti
x1i xti +
i=1
n
X
i=1
q
X
y2i yti + y t1 + yt
(8.7)
x2i yti + x t1 + xt
i=1
p1
X
i yti + Bxt + t
i=1
con
=
p
X
i=1
Ai I, i =
p
X
Aj
j=i+1
8.8.7. Aspectos comunes a varias variables temporales: tendencias comunes, volatilidad comn.
8.8.8. Qu hacer en presencia de variables con tendencias estocsticas
(races unitarias)?
De acuerdo con la discusin que hemos llevado a cabo en las secciones anteriores,
el procedimiento a seguir en caso de presencia de races unitarias en las variables
de una regresin lineal simple es claro. Si tanto xt como yt son variables I(1),
es decir, tienen una raz unitaria, entonces el tratamiento que hemos de aplicar
depende de si estn o no cointegradas. Si lo estn, hemos de especificar estimar
un modelo de correccin de error. Si no estn cointegradas, hemos de estimar un
51
53
situacin, slo explicitamos una de ellas como variables expliactivas, las restantes
estarn incluidas en el trmino de error, con lo que ste recoger, adems de otros
componentes, la evolucin de las variables explicativas omitidas del modelo de
regresin. Con ello, su fluctuacin ser importante, por lo que tendr una varianza notable. La nica manera de reducir dicha varianza del trmino de error es
haciendo explcitas todas las variables potencialmente explicativas.
El investigador nunca tiene convencimiento acerca de la capacidad explicativa de un detemrinado conjunto de variables. Lo que debe hacer es estimar el
modelo con ellas, y proceder a contrastar la significacin de cada una de ellas
por separado, del modo que describimos en este captulo. En este proceso incide
negativamente la dificultad en estimar por separado el efecto de cada una de las
variables explicativas sobre la variable endgena, por lo que no puede sorprender
que dediquemos a este asunto una buena parte del captulo.
Si, queriendo caracterizar la determinacin de tipos de inters, estimamos el
modelo,
rt = 0 + 1 mt + 2 t + ut
(10.1)
en el que aparecen el crecimiento monetario y la tasa de inflacin como variables explicativas. El coeficiente 1 mide el efecto sobre los tipos de inters de
un incremento (o disminucin) unitario en la tasa de expansin monetaria, dada
una determinada tasa de inflacin, es decir, manteniendo la tasa de inflacin constante. Aunque indudablemente esta es una evaluacin interesante, el hecho de
que slo sea vlida en ausencia de variaciones en la tasa de inflacin limita algo
su uso. En todo caso, es claro que junto con este tipo de estimaciones, nos interesara disponer asimismo de una estimacin del efecto que tendra dicha variacin
en el crecimeinto monetario teniendo en cuanta asimismo el impacto que dicha
variacin puede tener sobre la tasa de inflacin.
Podra pensarse que si lo que se pretende es estimar el impacto que sobre los
tipos de inters tiene una variacin unitaria en la tasa de crecimiento monetario,
podemos estimar el modelo de regresin lineal simple,
rt = 0 + 1 mt + vt
(10.2)
(10.3)
(10.4)
(10.5)
seguridad.
Por construccin, el estimador MCO proporciona aqul conjunto de valores
numricos para los coeficientes del modelo de regresin que generan unos residuos
cuya suma de cuadrados es menor. Como este es el criterio seguido para calcular
el estimador de mnimos cuadrados, tal propiedad es incuestionable, y caracteriza
a dicho estimador.
Propiedad 1: No puede hallarse otro conjunto de valores numricos para los
coeficientes del modelo que generen unos residuos con una suma de cuadrados inferior a la obtenida a partir del estimador MCO.
Adems de esta propiedad el estimador posee otras caractersticas, que examinamos a continuacin. En todo modelo lineal de regresin, los residuos generados
por el estimador de mnimos cuadrados satisfacen las propiedades:
Propiedad 2: Los residuos de mnimos cuadrados se relacionan con el trmino
de perturbacin del modelo mediante,
u = M u
siendo M = IT X (X 0 X)1 X 0 , una matriz cuadrada de orden T .
Propiedad 3: La matriz M es simtrica e idempotente
Demostracin.- Inmediata, a partir de la definicin de la matriz M. Por ejemplo,
1
1
M 0 M = M M = IT X (X 0 X) X 0 IT X (X 0 X) X 0 =
1
= IT X (X 0 X)
X 0 X (X 0 X)
X 0 + X (X 0 X)
X 0 X (X 0 X)
X 0 = IT X (X 0 X
= E (X 0 X)1 X 0 y = E (X 0 X)1 X 0 (X + u) =
E()
0
= E E()
E()
V ar()
= E
=
0 1 0 0
63
= E
V ar()
0
h
0
i
0
1 0
0
1 0 0
= E D + (X X) X uu D + (X X) X
= 2u (X 0 X)1 + 2u DD0
64
1
1
1 0 1
f () =
exp
2
(2)T /2 | |1/2
de modo que, si suponemos Normalidad del trmino de perturbacin, tenemos,
1
1
1 0
f (u) =
exp 2 u u
2 u
(2)T /2 ( 2u )T /2
y la verosimilitud del vector de observaciones de la variable dependiente y
resulta,
1
1
1
0
2
exp 2 (y X) (y X)
L(y, X/, u ) =
2 u
(2)T /2 ( 2u )T /2
donde hemos utilizado el hecho de que el Jacobiano de la transformacin que
convierte el vector u en el vector y es igual a la matriz identidad de orden T , por
lo que tiene determinante igual a 1.
Por tanto, dada una muestra y, X,maximizar la funcin de verosimilitud respecto a los valores paramtricos , 2u , equivale a minimizar la suma de cuadrados
de los residuos del modelo.
La nica diferenciae striba en que el estimador M V del parmetro resulta ser,
2u =
SR
T
2u =
SR
T k
E(/X)
= E (X 0 X)1 X 0 y/X = E (X 0 X)1 X 0 (X + u)/X =
1 0
Xu=0
T
Como
0 1
XX
X 0u
p lim = + p lim
p lim
)
T
T
0
y si se existe el lmite p lim XTX y la matriz X 0 X es invertible, entonces un
0 1
argumento de continuidad garantiza la existencia de p lim XTX
. En tal caso,
1
0
p lim T X u = 0 garantiza la consistencia del estimador M CO, puesto que se tiene,
p lim =
0
1
T ( ) N (0, 2u (X 0 X) )
d
mediante aplicacin del teorema central del lmite al caso en que el trmino
de perturbacin presenta la misma distribucin de probabilidad para todas las
observaciones, con esperanza nula y varianza finita, y las variables explicativas
satisfacen condiciones de existencia de moemtnos como la que antes discutimos.
sonde SR denota la suma de los cuadrados de los residuos, y ST lo que conocemos como Suma Total, la suma de las desviaciones al cuadrado de la variable
dependiente respecto de su media muestral. Esta suma es igual a la varianza de
yt multiplicada por el tamao muestral.
en cutyo caso, cada uno de los coeficientes del modelo sigue asimismo una
distribucin Normal,
i N ( i , 2u aii ) 1 i k
donde aii denota el elemento i-simo en la diagonal de la matriz (X 0 X)1 , que
tiene dimensin kxk.
Si queremos contrastar una determinada hiptesis acerca del valor numrico
del coeficiente asociado a una determinada variable xi , 1 i k,
H0 : i = 0i
podramos utilizar esta propiedad, pues tendremos que,
i 0i
p
N(0, 1)
2u aii
i
i
el valor numrico del estadstico
con dicho umbral critico. Por supuesto
2 ii
u a
que el nivel crtico que obtengaos en la tabla de la N (0, 1) debe depender de que
el contraste sea de una o de dos colas, es decir, de que la hiptesis alternativa sea
del tipo,
H1 : i 6= 0i
o de alguno de los tipos,
69
H1 : i < 0i
,
H1 : i > 0i
La hiptesis de significacin de la variable xi , 1 i k consiste en contrastar
H0 : i = 0
frente a una alternativa,
H1 : i 6= 0
aunque tambin podra ser de una sla cola, si tenemos informacin a priori
restringiendo el signo de dicho coeficiente.
Sin embargo, el contraste de hiptesis no puede llevarse a cabo de este modo
porque desconocemos el valor numrico de la varianza del trmino de error. Puede
sin embargo estimarse, lo cual hacemos mediante la expresin,
2u =
SR
T k
Ahora bien, si sustituimos su valor terico por su valor estimado, las propiedades
estadsticas del contraste de hiptesis cambian. Concretamente, habremos de utilizar la propiedad,
2u
(T k) 2 T k
u
Como consecuencia, tenemos que,
independiente de .
i i
2 ii
u a
(T k) u2 /(T k)
es decir,
i 0i
p 2
tT k
u aii
70
tT k
q
i 0i
0
2 ii
0, 95 = P p 2
tn, = P i i + tn,
ua
u aii
z
N (0, 1)
DT (z)
y si sustituimos en esta expresin el verdadero valor de 2u por su estimacin,
z5
tendremos DT
tT k y podremos proceder a contrastar H0 .
(z)
Lo que estamos haciendo es comparar la magnitud de la holgura o incumplimiento de una restriccin, utilizando su desviacin tpica como unidad de medida,
para poder decidir si dicha holgura es grande o pequea.
Este argumento puede extender al contraste simultneo de varias restricciones.
Calculamos para cada una de ellas su holgura, obteniendo as un vector de dimensin igual al nmero de restricciones, cuyas coordenadas pueden ser positivas o
negativas. Igualmente, podemos pensar en obtener la matriz de covarianzas de
las restricciones, una vez que tratamos cada una de ellas como una sla variable
aletoria, como hemos hecho en el ejemplo anterior. Finalmente, decidimos si el
vector de holguras es grande o pequea calculando su tamao utilizando la matriz
de covarianzas como unidad de medida,
(V ector de ho lg uras) [V ar (V ector de ho lg uras)]1 (V ector de ho lg uras)0
que puede probarse que sigue una distribucin Fq,T k , siendo q el nmero de
restricciones que se contrastan.
Por ejemplo, si contrastamos las hiptesis,...
Para contrastar un conjunto de hiptesis lineales de la forma,
H0 : R = r
frente a la alternativa,
H1 : R 6= r
el estadstico,
0
0
1 0 1
R r [R(X X) R ]
R r /q
u0 u/(T k)
Fq,T k
Utilizar este estadstico matricial es equivalente al ejercicio que hemos propuesto arriba. De hecho, no es dificil ver en el corchete central de este estadstico
73
(14.1)
(14.2)
que, como vimos en XX, tendrn, entre otras, la propiedad Corr(2t , x1t ) = 0.
Si, a continuacin, estimamos el modelo de regresin simple de la variable
dependiente de inters sobre los residuos de esta regresin auxiliar,
yt = 0 + 22t + vt
tendremos (como vimos en XX),
PT
2t yt
22t
t=1
2 = Pt=1
T
Resulta sorprendente que, como puede probarse sin mucha dificultad, este
estimador coincide con el estimador de mnimos cuadrados ordinarios de 2 en
(10.4),
MCO
2
=
2
Lo que hemos hecho es extraer de x2t el efecto de x1t debido a la correlacin que,
en general, existir entre estas variables. As, el residuo 2t mide el componente
de x2t que no tiene nada en comn con x1t y, de hecho, tiene correlacin nula con
esta variable.
75
(14.3)
(14.4)
(14.5)
Pero hemos dicho que la estimacin de mnimos cuadrados de 1 en esta regresin coincide con la estimacin de mnimos cuadrados de 1 en (10.3). Por
tanto, cuando una variable explicativa est incorrelacionada con todas las dems,
su coeficiente puede estimarse igualmente bien en la regresin multiple completa,
o en la regresin simple de yt sobre esta nica variable.
Una segunda situacin en que se produce este mismo resultado es cuando la
correlacin muestral entre cada una de las variables explicativas e yt es cero. La
razn es que en tal caso, las estimaciones tericas de los coeficienets asociados a
cada una de estas variables sera cero, por lo que estimar el modelo (10.3) equivale,
al menos tericamente, a estimar (14.5).
Es interesante saber que neste resultado puede asimismo aplicarse a bloques de
variables. As, supongamos que en el modelo de regresin mltiple, las k variables
explicativas pueden agruparse en dos bloques, con la condicin de que ninguna
variable de un bloque est correlacionada con ninguna variable del otro bloque.
Permitimos, sin embargo, que variables de un mismo bloque estn correlacionadas,
76
2u =
n
2
Sy.123
1 X 2
Su2
ui =
=
n 3 i=1
n3
n3
donde la notacin que hemos introducido enla ltima igualdad hace referencia
a que se trata de la suma residual que resjulta al estimar una regresin en que la
variable dependiente Y aparece explicada por x1 , x2 , x3 . La Suma Residual puede
expresarse,
2
Sy.123
n
X
i=1
yi2
n
X
i=1
yi 1
n
X
i=1
yi x1i 2
n
X
i=1
yi x2i 3
n
X
yi x3i
(15.1)
i=1
n
X
i=1
(
yi y)2
(15.2)
2
Sy.123
=1
Sy2
y1.2 = q
y2.1 = q
y1 y2 12
1 2y2 (1 212 )
y2 y1 12
1 2y1 (1 212 )
2
2
2
Sy.12
Sy.2
Sy.12
=
2
2
Sy.2
Sy.2
2
2
2
Sy.12
Sy.12
Sy.1
= 1 2 =
2
Sy.1
Sy.1
2
Ry1.2
= 1
2
Ry2.1
(x3t , x3t ) =
23
2 3
var(x1 ) cov(x1 , x2 )
a b
V ar(X) =
=
, a, c > 0, b Q 0,
cov(x1 , x2 ) var(x2 )
b c
obtenemos la matriz de covarianzas de los estimadores MCO del modelo de
regresin mltiple,
1 2 c
b
1
acb2 2 acb
a b
c b
2
2
2
=
=
V ar( MCO ) =
b
a
b c
2 acb
2 acb
ac b2 b a
2
2
1. Que las variables explicativas del modelo de regresin estn altamente correlacionadas significa que, en valor absoluto, su coeficiente de correlacin
(covarianza dividido entre producto de desviaciones tpicas) sea prximo a
b2
la unidad o, lo que es equivalente, que ac
est prximo a la unidad. Esto
2
implica, evidentemente, que b es aproximadamente igual al producto ac.
Una primera consecuencia es que el determinante de la matriz de covarianzas
de las variables explicativas, ac b2 , ser prximo a cero, es decir, dicha matriz
de covarianzas es prxima a ser singular. Como el inverso de dicho determinante
MCO ), se tiene que tanto las varianzas
aparece como un factor comn en V ar(
de los estimadores MCO como sus covarianzas, son numricamente elevadas. Por
ejemplo, con una matriz de covarianzas entre variables,
81
V ar(X) =
4 6.2
6.2 10
6.2
= . 98031
, Corr(x1 , x2 ) = p
(4) (10)
4
6.2
19.
231
11.
923
V ar( MCO ) = 3.0
=
6.2 10
11. 923 7. 6923
con,
DT ( 1 ) =
1. Por tanto, se produce una prdida de precisin en las estiamciones, al aumentar las desviaciones tpicas de los estimadores MCO. En este caso, por
tanto, estimamos con una baja precisin no porque existan variaciones en el
valor de los coeficientes, sino porque las variables asociadas estn altamente
correlacionadas, positiva o negativamente.
2. Como discutimos en la Seccin XX al hablar de los contrastes de hiptesis estadsticas, la prdida de precisin tiene implicaciones importantes en
cuanto a efectuar contrastes acerca de valores numricos con dichos coeficientes, por cuanto que la menor precisin, que es equivalente a una mayor
varianza estimada termina plasmndose en intervalos de confianza ms amplios. Esto hace mucho ms fcil que el valor numrico que se contrasta en
una hiptesis nula simple caiga dentro de dicho intervalo, no rechnzadose,
en consecuencia, dicha hiptesis nula. En este caso, que mla hiptesis nula
no se rechace no se debe necesariamente a que el valor hipottico del coeficiente sea muy similar al valor estimado, sino a que la desviacin tpica
asociada a este ultimo es muy grande, lo que puede ampliar el intervalo de
confianza asociado de manera muy importante. En definitiva, como vimos
en su momento, la menor precisin en la estimacin viene asociada a una
prdida de potencia en la contrastacin de hipotesis estadsticas.
3. Otra consecuencia de la correlacin entre variables explicativas es que la
correlacin entre coeficientes estimados, bac tendr signo contrario al de
la correlacin entre las variables explicativas x1 , x2 , y ser cercano a 1 en
valor absoluto. Si las variables explicativas estn positivamente correlacionadas, entonces los estimadores MCO de sus coeficientes asociados estn
negativamente correlacionados. En el ejemplo anterior,
82
Corr 1 , 2 = p
11. 923
= . 98029
(19. 231) (7. 6923)
Ello quiere decir que, mientras que, a lo largo de la muestra, las dos variables
tienden a estar simultneamente por encima o por debajo de sus respectivas medias muestrales, las estimaciones numricas de sus coeficientes estarn una por
encima de su media, y otra por debajo. Esto significa que el procedimiento tiende
a sobre-estimar uno de dichos coeficientes y a sub-estimar el otro, sin que, por
supuesto, sepamos cul de ellos est en cada situacin. Pero adems, que su
correlacin sea elevada implica que tendremos una seria
en distinguir
dificultad
83
(16.1)
85
(16.2)
(16.3)
2t = x2t 0 + 1 x1t ,
(16.4)
3t = x3t
0
1 x1t +
2 x2t ,
(16.5)
Sin emabrgo, no todo est perdido: supongamos que, una vez estimada (16.2) el
investigador dispone de datos yt , x1t ,x2t y x3t . Sustituira,
x2t = 0 + 1 x1t + 2t
3t = x3t (
0 +
1 x1t +
2 x2t )
(16.6)
(16.7)
17. Prediccin
Como mnimo, una variable puede predecirse a partir de su valor medio muestral.
87
88
20.2.1. Perturbacin sin autocorrelacin
20.2.2. Perturbacin con autocorrelacin
21. Simultaneidad
21.1. Identificacin
21.2. Estimacin de una ecuacin del sistema