You are on page 1of 41

Tema6: Modelizacincondatos

deseriestemporales
UniversidadComplutensede
Madrid
2013
1

Introduccin(I)
Una caracterstica que distingue los datos de series temporales de los
datos de seccin cruzada, es que los datos temporales estn
ordenados de una forma natural cronolgicamente (primero va enero
de un ao, despus febrero de ese ao, etc.)
Este hecho es muy importante, ya que determina qu tipo de
relaciones son posibles entre un tipo de datos y otros. As:
(1) El orden de las observaciones en una seccin cruzada es
irrelevante. Por ejemplo, en una seccin de datos de salarios, primero
podemos tener al individuo que ms gana hasta el que menos gana o a
la inversa. Ningn resultado de la estimacin cambiara al cambiar el
orden de los datos. En cambio, en una serie temporal el orden es
cronolgico y nico. El IPI trimestral de un pas ir ordenado en el
tiempo, por ejemplo, tendremos una muestra desde el primer
trimestre de 1990 hasta el segundo de 2010.

Introduccin(II)
(2) En una serie temporal es ms razonable suponer que existe
correlacin serial. Por ejemplo, el IPI de un trimestre de un ao
puede estar correlacionado con el valor de IPI del trimestre
anterior; las ventas de una semana de una empresa tendrn
relacin con las ventas de la(s) semana(s) anterior(es). Es ms
difcil que el peso de un nio tenga correlacin con el peso de
otros nios de la muestra.
(3) Con datos temporales, existe un fundamento emprico a lo
que entendemos por causalidad. Es decir, una variable X causa a
otra variable Y, si los valores pasados de la X estn
correlacionados con los valores presentes de la Y. Con datos de
seccin cruzada, la causalidad entre variables puede existir, pero
no tenemos una manera emprica de detectar la direccin de la
causalidad (qu variable causa a qu otra variable).
3

Caractersticascomunesdelasseries
temporales
700

Rendimiento%IBEX35

15

600

Airline

500

400

10
5
0
5
10

300

100
1950

1952

1954

1956

1958

1960

180106

290104

280102

270100

260198

190196

120194

200

090192

291289

15

Da

En una serie temporal de baja frecuencia (es decir, con datos mensuales, trimestrales,
etc) las caractersticas ms habituales son: (a) una tendencia (en el caso del n de
pasajeros a crecer); (b) estacionalidad (en el caso de los pasajeros, vuelan ms
personas siempre en vacaciones de verano) y (c) una varianza (dispersin alrededor
de la media) que crece con la media.
En una serie temporal de alta frecuencia (es decir, con datos diarios, horarios, etc.) se
encuentra: (a) una media estable a lo largo del tiempo; (b) no hay estacionalidad y (c)
una varianza que cambia con el tiempo, de modo que se alternan perodos de alta
volatilidad (alta varianza) con perodos de baja volatilidad (baja varianza). La varianza
cambia de forma no sistemtica.
4

Objetivosdelanlisisdeseriestemporales(I)
En este tema, nos centramos en datos temporales de baja
frecuencia (series anuales, trimestrales o mensuales). Las
variables medidas en alta frecuencia suelen ser financieras y su
modelizacin es ms complicada.
El objetivo es modelizar las caractersticas ms habituales que
hemos visto. Es decir:
Capturar la tendencia y el comportamiento estacional
observado
Tratar la varianza no constante (heterocedasticidad)
Modelizar la autocorrelacin serial. Es decir, encontrar un
modelo estadstico que sea capaz de reproducir esa inercia
o autocorrelacin que tienen muchas variables econmicas
temporales.
5

Objetivosdelanlisisdeseriestemporales(II)
Este objetivo se puede conseguir usando distintos enfoques:
(1) Usar un modelo univariante: Es decir, intentamos explicar la
correlacin de una variable temporal usando para ello slo su
propia historia pasada y reciente. No incluimos variables
explicativas adicionales. Puede parecer una restriccin, pero si el
objetivo es predecir a corto plazo el futuro de la variable, estos
modelos funcionan muy bien o mejor que otras especificaciones
alternativas.
(2) Usar un modelo de relacin (en este curso, un modelo de
regresin). En este caso, se pueden usar ideas del anlisis
univariante para que el modelo de regresin est bien
construido. Si el objetivo es predecir a medio y largo plazo, es
evidente que hay que tener en cuenta la correlacin
contempornea y dinmica de unas variables sobre otra (que es la
variable de inters, la que hay que predecir).
6

Modelosdeterministasdeseriestemporales(I)
Dada una serie temporal denotada por yt, se supone que puede
descomponerse de modo aditivo como:
yt = tt + st + ct + et

dondeeslatendencia,eselcomponenteestacional,
tt
ct
st
eselcomponentecclico(ciclo)yelerror.
et
Es difcil definir cada una de estas componentes. No hay
consenso en la literatura sobre el tema.
La tendencia debe recoger el movimiento a largo plazo de una
serie, independientemente de otros componentes irregulares. Es
decir, debe recoger el nivel subyacente y regular de la serie.
7

Modelosdeterministasdeseriestemporales(II)
El componente estacional debe recoger las oscilaciones que se
producen con un perodo inferior o igual al ao. Es decir, son
oscilaciones a corto plazo que se repiten en aos sucesivos. Las
razones por las que una serie presenta estacionalidad pueden
ser de tipo fsico (el clima, etc.) o de tipo institucional
(vacaciones, festividades varias, etc.).
El error debe recoger movimientos transitorios e irregulares de
la serie. Esta componente puede descomponerse en una parte
claramente aleatoria e imprevisible y en otra parte no siempre
previsible, pero que se puede identificar a posteriori (como una
huelga, una catstrofe natural, un cambio poltico, etc.)
8

Modelosdeterministasdeseriestemporales(III)
Enlaprcticasiempresesuponeque:
E [ et ] = 0 , " t

E [ et es ] = 0, "t s

E [ et2 ] = s 2 , " t

e N [ 0 , s 2I ]

El ciclo se define de diversas formas. Desde el punto de vista


macroeconmico deben ser oscilaciones en torno a la tendencia
que se deben a la alternancia entre perodos de crisis y de
prosperidad. Desde el punto de vista estadstico, el ciclo incluye
cualquier caracterstica que no sea tendencia, estacionalidad y
ruido.
Si se han tomado logaritmos a la serie, la descomposicin de la
variable original ser de tipo multiplicativo, es decir:
y t = e tt e s t e c t e et

Modelosdeterministasdeseriestemporales(IV)
Los modelos ms simples para la tendencia
son regresiones de la variable con respecto
al tiempo. Un modelo de tendencia lineal
sera (cuando la misma crece o decrece):
t t = a 0 + a 1 t , " t = 1 , 2 , ..., n

y un modelo de tendencia cuadrtico:


t t = a 0 + a 1t + a 2 t 2 , " t = 1, 2 ,..., n
Los grficos de la derecha muestran el resul
tado de ajustar una tendencia lineal (arriba) a
la serie del n de pasajeros (en logs) y una
tendencia cuadrtica (abajo) a la misma
serie.
Estos modelos explican la evolucin pasada
de una serie en funcin de pautas simples,
pero tienen problemas y limitaciones.

6.6
6.4

l_Airline
Tend_lineal

6.2
6
5.8
5.6
5.4
5.2
5
4.8
4.6
1950
6.6
6.4

1952

1954

1956

1958

1960

1952

1954

1956

1958

1960

l_Airline
Tend_Cuadratica

6.2
6
5.8
5.6
5.4
5.2
5
4.8
4.6
1950

10

Modelosdeterministasdeseriestemporales(V)
Los modelos de tendencia determinista son una extensin inmediata de los
mtodos de regresin. Aunque son tiles para describir las pautas que sigue
una serie temporal, las predicciones que proporcionan suelen ser muy malas
(es decir, con un gran error asociado).
La razn de esto es que en una serie temporal la observacin ms reciente
depende, en general, de sus valores pasados, pero esta dependencia suele
ser ms fuerte con los datos ms recientes y ms dbil con los ms alejados.
Los modelos de tendencias deterministas proporcionan predicciones que no
utilizan esta propiedad.
Si la serie no tiene estacionalidad, el modelo es: y t = a0 + a1t + et donde t es
el tiempo. El parmetro a1 representa la pendiente de la recta que describe
la evolucin de la serie (crecimiento esperado entre dos perodos). La
previsin de la variable en el perodo T+k es: yT (k ) = a 0 + a1 (T + k )
11

Modelosdeterministasdeseriestemporales(VI)
t t = e x p [ a 0 + a 1t ]
Siseobservaraunatendenciaexponencial,deltipo,
tendramostomandologaritmos:

ln y t = a 0 + a 1 t + e t
a1
dondelosparmetrosyseestimanporMCOyteseltiempo.
a0

Estacionalidad: es un cambio en la media de la serie que se repite


peridicamente cada s estaciones. Si la serie es mensual, s=12; si es trimestral,
s=4; si es semanal, s=52 53, etc.
Una forma determinista de captar la estacionalidad consiste en definir
variables dummies (con valores 0 1). Por ejemplo, para una serie mensual
definir las doce dummies correspondientes a Enero (S1), Febrero (S2), ., hasta
Diciembre (S12). Se puede escribir como:

st = b1S1t + b2S 2t + ... + b12S12t


12

Modelosdeterministasdeseriestemporales(VII)
Si a la serie mensual del n de pasajeros (en logaritmos) le
ajustamos un modelo de tendencia cuadrtica y una
estacionalidad determinista mensual, se escribira como:

ln(Airlinet ) = a0 + a1t + a2t 2 + b1S1t + b2S2t + ... + b11S11t + et


La figura de la derecha muestra el
resultado del ajuste del modelo de
tendencia + estacionalidad anterior a
los datos de pasajeros.

6.6
6.4

l_Airline
Trend_Season

6.2
6
5.8
5.6

En color azul se muestra la evolucin


de la serie real (en logaritmos)

5.4
5.2
5

En color rojo la evolucin de la serie


ajustada al estimar por MCO el modelo

4.8
4.6
1950

1952

1954

1956

1958

1960

13

Otraaproximacin(I)
Otra forma de capturar los cambios en la media (tendencia creciente,
decreciente, etc) y los cambios en la varianza (crece la dispersin conforme
crece la media) en una serie temporal, consiste en realizar una serie de
transformaciones en los datos que eliminan estas caractersticas tpicas.
Por ejemplo, si la varianza crece a medida que crece la media (ver la figura de
la izquierda) bien, el grfico rangomedia de la derecha (se dibujan pares de
valores de la media local y la desviacin tpica local, calculados para
submuestras de igual tamao de la serie).
La transformacin logartmica hace que la dispersin sea ms o menos
constante a medida que crece la media.
range-mean plot for l_Airline with least squares fit

700

0.5
0.48

600

0.46
0.44

500

range

Airline

0.42
400

0.4
0.38

300

0.36
0.34

200

0.32
0.3
4.8

100
1950

1952

1954

1956

1958

1960

5.2

5.4

5.6
mean

5.8

6.2

14

Otraaproximacin(II)
Sitomamoslogaritmosalaseriedelndepasajeros(verFiguradeabajo)
comprobamosque:
6.6

La dispersin de la serie es ms o
menos constante a medida que crece
la media
La transformacin logartmica no
consigue que la media de la serie sea
constante (se sigue apreciando una
tendencia creciente).

6.4

6.2

5.8
l_Airline

5.6

5.4

5.2

4.8

4.6
1950

1952

1954

1956

1958

1960

Si una serie temporal tiene una media constante a lo largo del tiempo, decimos
que es estacionaria con respecto a la media. Si tiene varianza constante con
respecto al tiempo, decimos que es estacionaria en varianza. Si una serie
temporal es estacionaria (en media y en varianza) encontrar un modelo que
explique su autocorrelacin es mucho ms fcil.
15

Otraaproximacin(III)
La transformacin que elimina la tendencia (o lo que es lo mismo, induce
estacionariedad en media) es la diferenciacin. Tomar una diferencia regular
consiste en calcular la diferencia entre cada dato (por ejemplo, mensual) y el
anterior. Siempre se pierde el primer dato de la serie.

yt yt yt 1

0.25

0.2

0.15

0.1

0.05
d_l_Airline

La primera diferencia de la serie de


pasajeros (en log) se representa en la
figura de la derecha.
Se observa que la serie flucta alrededor
de una media estable y finita.
No obstante, todava es estacional esta
variable. Es decir, los picos altos (por
encima de la media) son meses de
verano y los bajos, son meses en donde
se vuela mucho menos.

-0.05

-0.1

-0.15

-0.2

-0.25
1950

1952

1954

1956

1958

1960

16

Otraaproximacin(IV)
6.6

6.4

6.2

5.8
l_Airline

De nuevo, tenemos la serie en logaritmos,


para mostrar el marcado comportamiento
estacional de la misma (picos que se repiten
cada 12 meses).

5.6

5.4

Una forma de desestacionalizar es tomar


una diferencia estacional. Es decir, calcular
la diferencia entre el valor de la serie en un
mes de un ao con respecto al dato de ese
mismo mes, pero del ao anterior. Se
representa como: y y y
t

4.8

4.6
1950

1954

1956

1958

1960

0.3

0.25

ts

donde s es el perodo estacional (s=12). La


figura de abajo representa la diferencia
estacional de la serie. No se observa
estacionalidad, aunque localmente la serie
no es estacionaria sino que deambula.

1952

0.35

0.2
sd_l_Airline

5.2

0.15

0.1

0.05

-0.05
1950

1952

1954

1956

1958

1960

17

Otraaproximacin(V)
Al final, hay que tomar todas las transformaciones que induzcan
estacionariedad, es decir, el logaritmo (para que la varianza sea constante), la
diferencia regular (para eliminar la tendencia) y la diferencia estacional (para
eliminar el componente estacional). Se presenta el grfico de la serie con todas
las transformaciones tomadas secuencialmente. Se escribira como:
0.15

12 ln NPt zt

0.1

sd_d_l_Airline

0.05

donde NP es el nmero de pasajeros.

-0.05

-0.1

-0.15
1950

1952

1954

1956

1958

1960

Estas transformaciones son tiles para


estabilizar la media y la varianza de
una serie temporal econmica
18

Otraaproximacin(VI)
Adems, estas transformaciones tienen una interpretacin econmica sencilla,
que se resume en la siguiente tabla:
Transformacin

zt yt yt yt 1

Interpretacin

yt
CambioenEsunindicadordecrecimiento
absoluto.
Es la tasa logartmica de variacin de una variable. Es un

y y
zt ln yt ln yt1 t t1 indicador de crecimiento relativo. Si se multiplica por 100 es
yt1
la tasa de crecimiento porcentual de la variable.
zt [ln y t ln y t 1 ]

Es el cambio en la tasa logartmica de variacin de una


variable. Es un indicador de la aceleracin de la tasa de
crecimiento relativo de una variable.

yt yts Es la tasa de crecimiento (en log) acumulada durante s


zt ln yt ln yts
perodos. Si el perodo estacional es un ao, se interpreta
yts
como la tasa de crecimiento anual de una variable.
19

Modelosdeautocorrelacin (I)
Los modelos deterministas son tiles para descomponer una serie temporal,
pero no sirven para predecir.
Si el objetivo es predecir a corto plazo, se adopta otra aproximacin
consistente en los siguientes pasos.
(1) Decidir qu transformaciones tomar a los datos para inducir
estacionariedad en media y/o en varianza.
(2) Encontrar qu estructura de autocorrelacin (modelo estocstico)
explica mejor esa serie ya transformada. Para ello, se definen los
modelos ARMA (familia de modelos estadsticos sencillos que son
capaces de reproducir una gran variedad de series estacionarias).
Estacionariedad: Se dice que una serie es estacionaria si sus propiedades
estadsticas permanecen constantes a lo largo del tiempo. Si yt es una
serie estacionaria (en media y varianza) se cumple que:
E [ yt ] = m,

E [( y t - m ) 2 ] = g 0 ,

donde m , g 0 , g

E [( y t - m )( y t - k - m )] = g k , " t , " k

son momentos finitos que no dependen del tiempo.

20

Modelosdeautocorrelacin (II)
El modelo de autocorrelacin ms sencillo es un AR(1), es decir, un modelo
autorregresivo de orden 1 (el orden del modelo se escribe entre parntesis). Si una serie
temporal estacionaria sigue un modelo AR(1), entonces:

y t c 1 y t 1 a t
donde c es una constante, f1 es el parmetro autorregresivo y a t es un error con
esperanza cero, varianza constante (igual a sa2 ) y ausencia de autocorrelacin con
cualquier otro error fechado en otro instante. La interpretacin es como en una
regresin, salvo que a la variable dependiente le influye slo su pasado ms inmediato
y no existen otras variables explicativas.
Recurdese que stas eran las hiptesis habituales (y deseables) de las perturbaciones
aleatorias en un modelo de regresin lineal.
Cuando una variable aleatoria tiene estas propiedades en el anlisis de series
temporales se le denomina ruido blanco. Si, adems, la distribucin que sigue es
normal, entonces hablamos de un ruido blanco gaussiano.
21

Modelosdeautocorrelacin (III)
LosmomentosdeunAR(1)son: y t c 1 y t 1 a t
Media: E [ y t ] c 1 E [ y t 1 ] ybajoestacionariedad,porloquela
E[ yt ] E[ yt 1 ]
c
mediadelprocesoes:
E[ y ]
t

1 1

Varianza: var[ y t ] 12 var[ y t 1 ] a2 ybajoestacionariedad var[ yt ] var[ yt 1 ]


porloque:
2
0 var[ y t ]

a
1 12

Autocovarianzas: 1 cov[ y t y t 1 ] E [ y t y t 1 ] E [(1 y t 1 a t ) y t 1 ] 1 0


dondelatildeenlasvariablesindicaqueestndesviadasconrespectoasu
media:
2
2 cov[ y t y t 2 ] E [ y t y t 2 ] E [(1 y t 1 a t ) y t 2 ] 1 1 1 0

y por induccin se tiene que j c o v [ y t y t j ] 1 j 0 Se ha tenido en cuenta


estacionariedad en covarianza, es decir, la covarianza entre dos variables slo
depende del desfase que hay entre ellas y no del tiempo. Por ello:
E[ yt yt 1 ] E[ yt 1 yt 2 ] 1 obien, E [ y y ] E [ y y ]
t 1 t 3
t2 t4
2
22

Modelosdeautocorrelacin (IV)
A partir de las autocovarianzas, se calcula lo que se denomina la Funcin de
Autocorrelacin Simple o ACF de un modelo, cuyos valores no son ms que
coeficientes simples de autocorrelacin de distinto orden:
ACFdeunAR(1):

r1 1 1 0 1
0
0

2 12 0
r2
12
0 0

j
1 j
y,porinduccin,
0
Adems de la ACF, se suelen calcular las autocorrelaciones parciales o valores
de la PACF del modelo. Cmo se obtienen los valores de la PACF para cualquier
modelo de autocorrelacin? El primero es el estimador MCO del coeficiente
que relaciona el valor de la variable con su primer retardo, es decir:
rj

y t 10 11 y t 1 t
23

Modelosdeautocorrelacin (V)
El segundo valor de la PACF, mide la relacin lineal entre la variable y su
segundo retardo, pero teniendo en cuenta la influencia del primer retardo. Es
decir, la regresin que hay que construir es:

yt 20 21 yt 1 22 yt 2 t
22
yelestimadorMCOdelparmetroeselsegundocoeficientedelaPACF.
Portanto,elcoeficientejsimo secalcularaatravsdelaregresin:

y t j 0 j1 y t 1 j 2 y t 2 ... jj y t j t
En el caso de un AR(1), el nico coeficiente de la PACF distinto de cero es el
primero (y adems coincide con el parmetro autorregresivo en cuanta y
signo), siendo los dems nulos. Esto es una pista importante a la hora de
identificar si una serie temporal estacionaria sigue una estructura AR(1) o no.
Para facilitar el anlisis, se suelen dibujar los valores de la ACF y PACF
tericas de cada modelo.
24

Modelosdeautocorrelacin (VI)
En la prctica, cuando tenemos una serie estacionaria (ya transformada) sus
autocorrelaciones simples y parciales son desconocidas y hay que
estimarlas.
Los correlaciones tericas de la ACF hay que sustituirlas por correlaciones
muestrales. Es decir:
n
( y t - y )( y t - j - y )

t = j +1
rj =
n
t =1 (y t - y )2

t=1 yt
=
y
dondeeslamediamuestral
delaserie.
n
n

Los valores muestrales de la PACF se obtienen estimando por MCO el


correspondiente coeficiente ( f jj ) .Es necesario estimar cada coeficiente en
un modelo diferente, en donde cada vez que se quiere estimar un coeficiente
nuevo, se aade a la regresin un nuevo retardo de la serie.

y t j 0 j 1 y t 1 j 2 y t 2 ... jj y t j t
25

Modelosdeautocorrelacin (VII)
FAC de AR_1
1

+- 1.96/T^0.5

0.5
0
-0.5
-1
0

10

12

14

16

retardo
FACP de AR_1
1

En estas figuras se muestra el perfil


de la ACF y PACF de un proceso
AR(1) simulado donde el valor del
parmetro autorregresivo es 0.7
(positivo y menor que uno).
Notad que la ACF es positiva y va
decayendo porque el parmetro es
positivo y menor que uno.

+- 1.96/T^0.5

0.5
0
-0.5
-1
0

10

12

14

16

retardo

Cuando se tiene una serie temporal estacionaria


se estiman los valores de la ACF y PACF y se
dibujan. Se calculan unas bandas de significacin
para saber qu coeficientes son distintos de cero
(fuera de bandas) y cales no (dentro de bandas)

En la PACF slo el primer valor es


distinto de cero estadsticamente,
indicando el orden del AR.
La identificacin de un modelo
consiste en comparar la ACF y PACF
terica de un modelo con la ACF y
PACF estimada de una serie
26
estacionaria.

Autocorrelacin enelmodeloderegresin(I)
Enelcontextodelmodeloderegresinlinealgeneral:

y t = x tT b + et

" t = 1 , 2 , ..., n

decimos que las perturbaciones tienen autocorrelacin si existen


observaciones distintas t s , tales que los errores asociados tienen una
covarianza distinta de cero (y por tanto, correlaciones distintas de cero):

E [ et es ] 0

"t s

En este caso, la matriz de varianzas y covarianzas de los errores no es


diagonal.

Y = Xb +e

E[eeT ] =W

Las consecuencias sobre las propiedades del estimador MCO de b son las
mismas que si el problema es la heterocedasticidad. Es decir, el estimador
MCO sigue siendo lineal e insesgado, pero deja de ser eficiente.
27

Autocorrelacin enelmodeloderegresin(II)
Al igual que en el caso de heteroscedasticidad, si existe autocorrelacin en los
errores de una regresin, sabemos que los contrastes habra que llevarlos a
cabo usando una estimacin de la matriz de varianzas siguiente:

var[ ] ( X T X ) 1 X T X ( X T X ) 1
donde la matriz W no es diagonal y es desconocida. Si la estructura de
autocorrelacin es desconocida, se puede usar una idea similar a la de la
correccin de White cuando el problema es la heteroscedasticidad. As,
Newey y West (1987) proponen el siguiente estimador de la matriz anterior:

( X T X ) 1
] ( X T X ) 1 X T VX
var[
donde

=
X VX
T

w j et et - j [ x t x tT- j + x t - j x tT ]

j = 0 t = j +1
j
wj = 1yPorltimo,peselordenmximodelaautocorrelacin
en
p +1
elerrordelmodelo.
28

Autocorrelacin enelmodeloderegresin(III)
Obsrvese que decidir el ordende autocorrelacin p es a veces difcil, ya que
si este valor es alto la autocorrelacin entre los errores es larga y si es bajo, la
estructura de autocorrelacin es ms bajo.
Un procedimiento diferente para trabajar con autocorrelacin, supone
conocer el tipo de relacin que hay entre el error de un modelo en un
instante de tiempo y otro. Por ejemplo, supongamos que queremos estimar
eficientemente los parmetros de la siguiente regresin simple:

yt = b0 + b1xt + et
donde sabemos que el error sigue una estructura de autocorrelacin AR(1).
Es decir:

e t = f1 e t -1 + a t

donde f 1 es el parmetro autorregresivo y a t es un proceso de ruido blanco


(con esperanza nula, varianza constante y ausencia de autocorrelacin serial)
29

Autocorrelacin enelmodeloderegresin(IV)
El objetivo es encontrar una transformacin del modelo original en el que en
lugar del error con autocorrelacin, aparezca un ruido blanco (que por
definicin no tiene autocorrelacin). En el ejemplo anterior, la transformacin
es fcil:

yt = b0 + b1 xt + et

yt-1 =b0 +b1xt-1 +et-1


(1)

(2)

f1yt-1 =fb
1 0 +fb
1 1xt-1 +fe
1 t-1

e t = f1 e t -1 + a t
(3)

(4)

Restandolasexpresiones(1)y(3)setiene:

yt 1 yt 1 (1 1 ) 0 1 xt 1 1 xt 1 t 1 t 1
Obien:

yt 1 yt 1 (1 1 ) 0 1 ( xt 1 xt 1 ) at

ElproblemaesquesielparmetroAResdesconocido,nopodemosobtenerlos
datostransformadosdelavariabledependienteydelaindependiente.
30

Autocorrelacin enelmodeloderegresin(V)
1
Enelcasodequeelparmetroseadesconocido,esnecesarioestimar
conjuntamenteelmismoconlosparmetros.Evidentemente,elcriteriode

estimacinnoesMCO.Enelcasodelqueelparmetroseaconocido(algo
1
raroenlaprctica)sepuedentransformarlosdatosdelaregresinanteriory
1 0.5
estimareficientementeporMCO.Porejemplo,supongamosque.El
modelotransformadodondeelerroresruidoblancoes:

yt 0.5 yt 1 (1 0.5) 0 1 ( xt 0.5 xt 1 ) at


0* 0.5 0
AlaplicarMCOalaregresinanteriorseobtieneunaestimacinde
1
1 1
yde.Enelcasodeque,enelmodelotransformadotrabajamoscon
datosdiferenciados,esdecir:

yt yt 1 (1 1) 0 1 ( xt xt 1 ) at
Observadqueeltrminoconstantedesapareceenestecasoyque yt yt yt 1

xt xt xt 1

31

Ejemplo(I)
En el Tema 2 ya veamos la relacin entre Consumo y Renta con datos
temporales en la economa americana en trminos per cpita
Modelo 3: MCO, usando las observaciones 1959-1995 (T = 37)
Variable dependiente: c
Coeficiente
Desv. Tpica
Estadstico t
Valor p
----------------------------------------------------------------const
463,177
98,7912
4,688
4,10e-05 ***
y
0,779419
0,00691064
112,8
1,99e-046 ***
Media de la vble. dep. 11328,65
Suma de cuad. residuos 619971,4
R-cuadrado
0,997256
F(1, 35)
12720,51
Log-verosimilitud
-232,4412
Criterio de Schwarz
472,1042

D.T. de la vble. dep.


D.T. de la regresin
R-cuadrado corregido
Valor p (de F)
Criterio de Akaike
Crit. de Hannan-Quinn

2505,241
133,0920
0,997178
1,99e-46
468,8824
470,0182

32

Ejemplo(II)
Los residuos MCO resultantes de dicho modelo tienen la siguiente evolucin a lo
largo del tiempo (grfico de la izquierda) junto con la siguiente ACF y PACF
(grficos de la derecha). Parece claro un modelo AR(1) con parmetro positivo.
Residuos de la regresin (= c observada - estimada)
300

FAC de los residuos


1

+- 1,96/T^0,5

0,5

200

100
-0,5

-1

residuo

retardo

-100

FACP de los residuos


1

+- 1,96/T^0,5

0,5

-200

-300

-0,5

-1

-400

1960

1965

1970

1975

1980

1985

1990

1995

retardo

33

Ejemplo(III)
Si el trmino de error de la regresin de Consumo sobre Renta sigue una estructura
autorregresiva de orden 1, la estimacin del modelo que recoge sta es:
Modelo: ARMAX, usando las observaciones 1959-1995 (T = 37)
Estimado usando el filtro de Kalman (MV exacta)
Variable dependiente: c
Desviaciones tpicas basadas en el Hessiano
Coeficiente
Desv. Tpica
z
Valor p
---------------------------------------------------------const
2127,76
1031,52
2,063
0,0391
**
phi_1
0,978174
0,0409301
23,90
3,17e-126 ***
y
0,663438
0,0666839
9,949
2,55e-023 ***
Media de la vble. dep. 11328,65
media innovaciones
14,83765
Log-verosimilitud
-226,1832
Criterio de Schwarz
466,8100

D.T. de la vble. dep.


D.T. innovaciones
Criterio de Akaike
Crit. de Hannan-Quinn

2505,241
104,7581
460,3663
462,63

La estimacin del parmetro autorregresivo es muy cercana a la unidad, lo que indica


que se podran tomar las primeras diferencias de Consumo y Renta.
Si adems tomamos logaritmos, la conclusin es que relacionaramos la Tasa log de
variacin del Consumo en funcin de la Tasa log de variacin de la Renta.
34

Correlacinespuria(I):Concepto
Una correlacin espuria es una relacin emprica entre dos acontecimientos sin
conexin lgica
Las correlaciones espurias pueden producirse con datos de corte transversal o series
temporales
Ejemplo: En 1952 J. Neyman analiz la relacin entre la tasa de nacimientos y la
poblacin de cigeas en varias regiones, encontrando un elevado coeficiente de
correlacin entre ambas variables
Ejemplo: Utilizando datos anuales para el perodo 18661911, G. Udny Yule
encontr que el coeficiente de correlacin entre la tasa de mortalidad en
InglaterraGales y el porcentaje de matrimonios en la iglesia de Inglaterra era de
0.95
Al estimar regresiones entre series no estacionarias es muy fcil que la relacin sea
espuria, ya que basta con que ambas series tengan algo de tendencia para que
surja una aparente relacin entre ellas
Al suprimir la tendencia, por ejemplo, diferenciando los datos, la relacin espuria
desaparece
35

Correlacinespuria(II):Losdatos
6

900

Los grficos muestran las series anuales


(19361972) de:

800
5
700

GNP

PNB nominal en Estados Unidos (datos en


miles de millones de dlares), y la
Incidencia del melanoma en la poblacin
masculina (datos ajustados de edad) en el
estado de Connecticut.

500
3
400

Melanoma

600

300
200

1
100
0

0
1936

1941

1946

1951
GNP

900

1956

1961

1966

1971

Melanoma

800
700
600
GNP

Aparentemente, ambas series mantienen


una fuerte y clara relacin lineal, aunque
conceptualmente
resulte
absurdo
relacionarlas.

500
400
300
200

En el grfico de abajo se muestra la nube


de puntos real de PNB versus Incidencia
del melanoma.

100
0
0

3
Melanoma

36

Correlacinespuria(III):Relacinestticaen
niveles
El cuadro muestra los resultados de una regresin en donde el PNB acta como variable
endgena y la incidencia de melanoma como variable explicativa
Resulta inmediato ver que:
Todos los coeficientes son estadsticamente significativos y
El R2 es muy elevado, de cerca del 87%
El coeficiente estimado implica que, si aumentara la incidencia de melanoma en un
caso, cabra esperar un aumento del PNB de 118.981 millones de dlares (???)

37

Correlacinespuria(IV):Relacinenprimeras
diferencias
2

60

Sirelacionamoslasvariablesenprimeras
diferencias,estoes:

20
0.5
0

0
1936

1941

1946

1951

1956

1961

1966

1971
-0.5

-20

Variacin en Melanoma

Melanomat = Melanomat - Melanomat -1

Variacin en GNP

GNPt = GNPt - GNPt -1

1.5
40

-1
-40
-1.5

la tendencia suele desaparecer y, con


ella, la relacin espuria (vase el grfico
de arriba).

-60

-2
Variacin en GNP

Variacin en Melanoma

Consecuentemente, la relacin de
regresin entre las variables diferenciadas
no resulta significativa y lgicamente, el
coeficiente de bondad de ajuste es muy
pequeo (del 0.0338%)
38

Cointegracin (I):Concepto
A diferencia de la correlacin espuria, la cointegracin es un concepto que
caracteriza las relaciones vlidas entre series no estacionarias.
Se dice que un conjunto de series est cointegrado si cada una de ellas
necesita d diferencias para ser estacionaria, esto es, son integradas de
orden d o I(d), pero existe una combinacin lineal de las mismas que es
integrada de menor orden, es decir, I(dm).
La situacin ms habitual es que dos series sean I(1) y su diferencia (o una
combinacin lineal de las mismas) sea I(0)
La presencia de cointegracin supone que parte de la tendencia de las series
es un componente comn (cofeature) y existe una combinacin lineal de las
series que carece de esta caracterstica comn.
Otra forma de entender la cointegracin es que existe un equilibrio a largo
plazo entre las series, de manera que las desviaciones de este equilibrio
tienden a desaparecer a corto plazo.
39

Cointegracin (II):Deteccinvisualderaces
unitarias

Lasfigurasmuestranelperfildelosrendimientosporcentualesdeactivosde
deudapblicaalargoplazo(20aos)ycortoplazo(91das)enelReinoUnido
entre1952(segundotrimestre)y1979(cuartotrimestre).

Ambasseriesmuestranunatendenciacreciente,porloqueson,evidentemente,
noestacionarias.

Esfcilcomprobarquesuprimeradiferenciaesestacionaria,porloquesetrata
deseriesI(1),esdecir,integradasdeordenuno.
10

Long

Short

3
1952

1
1952

1954

1956

1958

1960

1962

1964

1966

1968

1970

1954

1956

1958

1960

1962

1964

1966

1968

1970

40

Cointegracin (III):Spread
3

2.5

1.5
Spread

La figura de la derecha muestra el


diferencial o spread entre ambas series:

0.5

st = long t - short t
Como puede observarse, el spread
muestra fluctuaciones amplias a corto
plazo, pero retorna sistemticamente a
una media estable (de 1.18 puntos).

-0.5

-1
1952

1956

1958

1960

1962

1964

1966

1968

1970

ACF for Spread


1

+- 1.96/T^0.5

0.5
0
-0.5
-1
0

Asimismo,
las
funciones
de
autocorrelacin simple (ACF) y parcial
(PACF) muestran la pauta caracterstica
de un proceso AR(1) con parmetro
positivo.

1954

10

12

14

16

lag
PACF for Spread
1

+- 1.96/T^0.5

0.5
0
-0.5
-1
0

8
lag

10

12

14

16

41

You might also like