Professional Documents
Culture Documents
COLOMBIANA*
Norberto Rodrguez N. y Patricia Siado C.**
Bogot, junio de 2003
RESUMEN
En este trabajo se presentan los resultados de un ejercicio de pronstico no paramtrico
mltiples pasos adelante para la inflacin colombiana mensual. En particular, se usa estimacin
Kernel para la media condicional de los cambios de la inflacin dada su propia historia. Los
resultados de pronstico se comparan con un modelo ARIMA estacional y un modelo tipo
STAR. Se encuentra que, excepto para el pronstico un mes adelante, el pronstico no
parametrito mejora a las otras dos metodologas que le compiten; adems, de entre las tres
alternativas consideradas el no paramtrico es el nico pronstico que estadsticamente mejora
al pronstico que se hace con un modelo de caminata aleatoria.
Palabras Claves: Pronstico No Paramtrico. Evaluacin y Comparacin de Pronsticos.
Ancho de Banda (bandwidth). Estimacin Kernel. Pronstico Rolling.
SUMMARY
This paper contains the results of a non parametric multi-step ahead forecast for the monthly
Colombian inflation, using Mean conditional kernel estimation over inflation changes, with no
inclusion of exogenous variables. The results are compared with those from an ARIMA and a
non-linear STAR. The nonparametric forecast over perform the others two, as well as being the
only, from the three, that statistically improved the nave forecast given by a random-walk
model.
Key Words: Nonparametric forecast, Kernel Estimation, Forecast Evaluation, Bandwidth
Selection, Rolling Forecast.
Este documento se basa en el trabajo de grado presentado por Patricia Siado para obtener el ttulo de
Estadstica, del Departamento de Estadstica de la Universidad Nacional. Se agradecen los comentarios
de los jurados calificadores y la ayuda del profesor Fabio H. Nieto. De mucha ayuda fue el curso
Estimacin No Paramtrica y Robusta en Series de Tiempo" dictado por Dr. Siegfred Heiler, profesor
de la Universidad de Konstanz, Alemania, para el doctorado de Estadstica de la Universidad Nacional
de Colombia, Bogot, agosto a septiembre de 2001. No obstante, cualquier error que persista es de
nuestra exclusiva responsabilidad. Esta versin del trabajo se vio nutrida de las discusiones con Hctor
Zarate, a quien tambin se le agradece. Los errores y omisiones son nicamente nuestro. Cualquier
posible opinin expresada aqu no compromete la posicin oficial del Banco de la Repblica ni
tampoco la de ninguno de los miembros de su Junta Directiva.
**
Econometrista Asociado de la Unidad de Econometra del Banco de la Repblica y Estadstica de la
Universidad Nacional de Colombia, respectivamente. Correspondencia nrodrini@banrep.gov.co.
1. INTRODUCCIN
Para el estudio de la inflacin se han usado varias herramientas estadsticas entre las
cuales se encuentran los modelos de series de tiempo a travs de mtodos paramtricos,
con bsicamente dos propsitos, uno es construir un modelo que ajuste adecuadamente
los datos con la estimacin de los parmetros del modelo y as hacer anlisis de
poltica; el segundo propsito es usar el modelo identificado y estimado para realizar
pronsticos. El presente trabajo se centra exclusivamente en este ltimo objetivo.
Los mtodos no paramtricos tienen ventajas sobre los paramtricos. Los mtodos
paramtricos en muchas ocasiones no cumplen con los supuestos acerca de la forma
funcional del conjunto de variables aleatorias de las cuales provienen los datos,
produciendo as modelos no muy confiables que generan sesgos en y deterioran la
calidad de los pronsticos; en el campo no paramtrico se evita este problema al
permitir una forma funcional flexible, y no un conjunto pequeo de modelos rgidos
como lo hacen los paramtricos. Sin embargo, se les hace dos crticas, la primera se
refiere a la demora en el trabajo computacional y la segunda al amplio error cuadrtico
medio de prediccin. Gracias a desarrollos tecnolgicos en el mbito computacional y
su disponibilidad a bajo costo queda sin peso la primera crtica. La segunda ha sido
estudiada en la literatura; se ha demostrado que los pronsticos del mtodo no
paramtrico de la mediana condicional al ser comparados con los de modelos ARIMA
dan resultados favorables en trminos del error cuadrtico medio2, resultados similares
son mostrados para la media condicional3.
Puesto que se plantea el uso una nueva tcnica de pronstico, es deseable comparar sus
resultados con los de otros modelos existentes. Con eso en mente y por ubicar al lector,
2
3
seguido a esta introduccin se presenta una breve sintaxis de dos de los modelos usados
por el Banco de la Repblica para generar pronsticos de la inflacin. En la seccin 3
se introducen los primeros conceptos de estimacin no-paramtrica de densidades
condicionales o funciones de regresin, junto a un ejemplo de datos simulados, para
terminar dicha seccin, con una descripcin de algunas de las funciones kernel mas
usadas en aplicaciones estadsticas de mtodos no-paramtricos de suavizamiento. Se
pasa a la seccin 4, donde se resume la metodologa de pronsticos no-paramtricos
mltiples pasos adelante, basados en suavizamiento kernel, y las especificaciones que
se requieren del mismo. La seccin 5 presenta los resultados del pronstico no
paramtrico de la inflacin colombiana, as como los resultados de la evaluacin de los
mismos. La seccin 6 concluye y enuncia algunas recomendaciones para futuro trabajo
de aplicacin en el rea.
Actualmente el Banco de la Repblica utiliza, entre otros, dos tipos de modelos para
pronosticar mensualmente la inflacin, son ellos los tradicionales modelos ARIMA y
los modelos no-lineales tipo STAR, una breve descripcin de ellos se presenta
enseguida.
(L ) (L 12
)(1 L )(1
L 12 ln (IPC
) = (L ) (L 12
)e
(1)
{e t }
es un proceso
(2)
]}
(3)
(4)
El operador
2.3.
OTROS MODELOS
6
7
3. REGRESIN NO PARAMTRICA
xR
( x ) = yf ( x, y )dy
entonces, la esperanza condicional de Yi dado Xi=x es,
r (x ) =
Un
estimador
f n (x ) =
1
nhn
kernel
x Xi
hn
K
i =1
de
f ( x, y ) y
(x )
dy =
, xR.
f (x )
f (x )
f (x ) ,
basado
en
las
observaciones,
es:
n (x ) =
1
nhn
x Xi
hn
K
i =1
Yi , x R .
rn ( x ) =
n (x )
f n (x )
x R,
donde8
x Xi
K
hn
Wni ( x ) =
n
x Xs
s =1
hn
Yi
i =1
,
rn ( x ) =
n
x Xi
i =1
hn
n
xR.
(5)
El cual puede verse como un promedio ponderado de los Y, donde el peso depende de
la distancia entre X i y x , la cual es cuantificada por la funcin K (.) ; en general el
procedimiento de ponderacin asigna el mayor peso a puntos cercanos a x , y menor o
ningn peso a puntos apartados de x . Este es precisamente el estimador de NadarayaWatson; vase Bosq (1998) para detalles adicionales.
Las ponderaciones kernel definen una vecindad de puntos alrededor de x . El
suavizador kernel puede ser entendido como un polinomio de ajuste local constante.
Extensiones naturales a esta idea son las regresiones polinmicas locales, esto es,
ajustar una regresin lineal local, un ajuste cuadrtico local, etctera. Propiedades
tericas deseables son obtenidas con esta estrategia. En la prctica, muchas veces
resulta suficiente con la regresin lineal local. Vase Fan y Gijbels (1996).
( x + 2) 2 / 2
si 0.5 x < 0,
x / 2 + 0.875
r ( x) =
2
5( x 0.2) + 1.075 si 0 x < 0.5
si 0.5 x < 1
x + 0.125
-1
-0.5
0.5
11
-1
-0.5
0.5
Grfico 2. Datos simulados, lnea continua relacin simulada, lnea a trazos ajuste lineal
(suavizamiento excesivo). El Grfico 4 muestra, junto a la relacin terica el ajuste
kernel con seleccin de ancho de banda que seala el mtodo plug-in, en el que se
sugiere h = x n 1 / 5 , en este caso h=0.1527. Los expertos recomiendan, en cuanto sea
posible, recurrir a la inspeccin visual del ajuste obtenido para varios anchos de banda
y tener en cuenta que es menos daino excederse un poco en suavizamiento que en
sobre-ajuste.
-1
-0.5
0.5
12
-1
-0.5
0.5
practicas. Con fines ilustrativos se presentan los kernel estndar, K (u ) , pero se debe
u
tener en cuenta que en la practica se utiliza K h (u ) = h 1 K ( ) .
h
1
por igual a todas las observaciones que estn a
h
13
K (u ) =
1
I [1,1] (u )
2
0.6
0.5
0.4
0.3
0.2
0.1
0
-1.1
-0.6
-0.1
0.4
0.9
1
a observaciones coincidentes y el peso de las
h
otras decrece linealmente hasta un peso de cero a las que estn a h o mas lejos.
K (u ) = (1 u )I [1,1] (u )
1
0.8
0.6
0.4
0.2
0
-1
-0.8
-0.6
-0.4
-0.2
0.2
0.4
0.6
0.8
K (u ) =
3
(
1 u 2 )I [1,1] (u )
4
14
0.8
0.6
0.4
0.2
0
-1
-0.8
-0.6
-0.4
-0.2
0.2
0.4
0.6
0.8
Kernel Bicuadrado: Los pesos para observaciones cercanas son cuando mas de 0.93
con decrecimiento polinomial curtico hasta llegar a cero, cuando la distancia es de h
o mayor.
K (u ) =
15
(1 2u 2 + u 4 )I [1,1] (u )
16
1
0.8
0.6
0.4
0.2
0
-1
-0.8
-0.6
-0.4
-0.2
0.2
0.4
0.6
0.8
Kernel
Observaciones cuya distancia oscila entre cero y 1 reciben peso entre 0.4 y 0.2, las que
estn a distancia 3 reciben peso de 0.0039 y prcticamente cero el resto de
observaciones. Es un Kernel muy popular, con soporte no compacto y diferenciable en
15
1
1
exp u 2
2
2
0.5
0.4
0.3
0.2
0.1
0
-2
-1.5
-1
-0.5
0.5
1.5
70
(1 | u |3 ) 3 I [ 1,1] (u )
81
1.2
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-1
-0.5
0.5
16
Kernel Dirichlet: Los pesos son asignados segn ondas senosoidales de magnitud
decrecientes, con un lbulo principal o mayor alrededor de cero y lbulos laterales o
menores a los dos lados. Este kernel resulta de soporte no acotado. Tiene la
particularidad de no ser siempre positiva y es usada en anlisis espectral, vase
Prietsley (1984).
K (u ) =
-4
-3
-2
-1
sen[( M + 0.5)u ]
2sen(0.5u )
De las anteriores funciones kernel y de otras que existen en la literatura las mas usadas
son la funcin Tri-cbico, Epanechnikov y la Gaussiana soportado en sus propiedades
estadsticas y asintticas. Dado que la eleccin de la funcin kernel no afecta
marcadamente los resultados, como es aceptado ampliamente en la literatura, en este
trabajo se usa el Kernel Gaussiano, como se explica mas adelante. Vase Hastie et al
(2002).
17
{Z t }
Acerca de la utilizacin de las tcnicas para datos dependientes o series de tiempo vase Heiler (1999).
Ver Bosq (1998, Pg. 88), donde se menciona el mtodo cynical que consiste en ignorar el
componente determinstico de la serie observada, siendo este componente el que podra inducir la no
estacionaridad.
10
11
Por definicin
Z t es estrictamente estacionario si (Z t , , Z t + n )
distribucin
(Z
t+g
, , Z t + n+ g ) para
todo entero t, g, n 1 . Donde esto indica que los dos vectores aleatorios tienen la misma funcin de
distribucin conjunta.
18
13
Dado la realizacin z1 , z 2 ,
, Z t d +1 )
(6)
Yt = Z t + m , t {d , , n}
(7)
rn ( x ) = E (Yn X n ) = Wt m ( x )Yt
t =d
donde
x Xt
K d
hn
m
Wt ( x) =
, x Rd .
nm
x Xt
K d
t =d
hn
12
Vase Anexo B.
Demostrado por Ibraginov y Rosanov (1978).
14
Estudiado por Pham y Tran (1985).
15
Por definicin para un proceso Z t de Markov se cumple: F (Z t | Z t s s 1) =
13
(8)
Ntese que la fijacin del ancho de banda hn controla el tamao de la vecindad local y
debe ser un valor real positivo que debe tender a cero cuando n tiende a infinito. La
funcin de K d (.) es una funcin Kernel d-variada, con integral mltiple igual a uno y
ella controla la forma de los pesos. Finalmente, x = X n = (Z n ,, Z n d +1 ) , se llamar el
bloque de referencia con el cual se comparan los otros bloques. As, una secuencia de
observaciones o bloque, tendr mayor peso en el pronstico si es ms parecido en
trminos de distancia al bloque de referencia, que un bloque que no lo sea.
El grfico 12 ilustra esas ideas, cuando se tiene un proceso Markoviano de orden d=3.
Dependiendo de la amplitud de banda, hn , y si el soporte del kernel es acotado, las
secuencias en negrilla sern consideradas en la generacin del pronstico, las dems
no. Ahora, fijado un h, las secuencias pasadas que se han de considerar en el pronstico
son aquellas que caen completamente dentro de la banda a trazos que se muestra en el
Grfico 13, y los pesos son asignados acordemente con la funcin Kernel usada.
12.6
12.5
12.4
12.3
12.2
12.1
12
11.9
11.8
11.7
20
12.5
12.4
12.3
12.2
12.1
12
11.9
kernel
11.8
11.7
11.6
n-2
n-1
r( x) = arg min E (l (Y a) / X = x)
a R
16
21
r( x) = E (Y X = x).
rn ( x) = Wt m ( x)Yt .
(9)
t =d
m
Z nmed
+ m = Wt ( X n )Yt .
(10)
t =d
de
r( x )
lleva
la
funcin
mediana
condicional
n m
rn ( x) = inf y : Wt m ( x) I {Yt y} 1
2
t =d
(11)
Aqu el estimador no paramtrico para m pasos adelante de la mediana esta dado por:
17
Collomb (1984).
22
nm m
inf
=
Z nmediana
y : Wt ( X n ) I {Yt y } 12
+m
t =d
(12)
la solucin de
r( x)
obtiene:
nm
y Yt
rn ( x) = arg max h 1 Wt m ( x) K
yR
t =d
hn
(13)
Z nmoda
+ m = arg max Wt ( X n ) K
yR
t =d
hn
(14)
Todos los predictores dados, pueden ser interpretados con respecto a los pesos
Wt m ( X n ). Una observacin con peso grande juega un rol ms importante en la
elaboracin de los predictores. Los pesos estarn cerca de cero si el correspondiente
bloque X t contiene un outlier; se este, Z t ' (t {t ,
18
23
donde la funcin Kernel K (.) est definida en la recta real. Ser usado el kernel
gaussiano, definido como:
d
K d ( x1 , , x d ) = (2 ) d 2 exp( xi 2), xi R
2
(15)
i =1
Esta funcin corresponde a la idea de dar pesos grandes a X t cuando esta cercano a
X n , usando la norma
Xn Xt
20
. En este caso, de no
19
20
24
, d mx } se define:
f1 (d ) = p 1 Z t Z t (d , hnd )
(16)
2
f 2 (d ) = p 1 {Z t Z t (d , hnd )}
(17)
f 3 (d ) = sup Z t Z t (d , hnd )
Donde t = n p,
(18)
valor de p se toma como p = [n 4], para series de tiempo con n < 100 y para series
con tamao igual o superior a cien se usa p = [n 5 ] , donde [] representa la parte entera
del argumento. Si las funciones f j (d ), j {1,2,3} no se incrementan despus de cierto
valor d , se escoge el valor de f j (d ) con el cual ocurre la estabilizacin.
En otro caso se escoge arg mind f j (d ), de esta forma se encuentran tres valores
d1 , d 2 , d 3 y se toma d = max j d j . Esta aproximacin es rpida pero puede ocasionar
problemas para series de tiempo que tienen pocas observaciones21.
4.4.3. Eleccin del ancho de banda hn
El ancho de banda determina el suavizamiento del pronstico. Un ancho de banda
pequeo prcticamente reproduce los datos, mientras que uno extremadamente grande
produce como estimacin una constante.
21
25
(19)
(20)
(Z
nm
t=d
22
23
26
(c ) Z t + m )
t+m t
(21)
y
VCG (c ) = (n M k + 1)
nM
t =k
m =1
M 1 Z t + m t (c ) Z t + m
(22)
nm
Z t + m (c ) Z t + m
t = n p m +1
Z t+m
100
(23)
MEG (c ) = p
nM
t = n p M +1
1
M
Z t + m (c ) Z t + m
m =1
Zt+m
100
(24)
EM (m) = ( p m + 1) 1 (Z n p + r + m Z n p + r + m )
r =0
27
(25)
pm
EAM (m) = ( p m + 1) 1 Z n p + r + m Z n p + r + m
(26)
r =0
pm
Z n p + r + m Z n p + r + m
r =0
Z n p+ m+ r
EAPM (m) = ( p m + 1) 1
RECM (m) = ( p m + 1)
p m
*100
2
(
r =0
Z n p + r + m Z n p + r + m
Z n p + r + m Z n p + r + m
RECMP(m) = ( p m + 1)
* 100
Z n p+ r + m
r =0
pm
U Theil (m) =
r =0
n p + r +m
(29)
(Z
Z n p + r + m
pm
r =0
(28)
p m
(Z
(27)
n p + r +m
Z n p+r
(30)
DM 2 = O PN O PE
DM 3 =
PN
PE
obs PN 1 obs PE 1
28
29
5. APLICACIN PRCTICA
5.2. ESTACIONARIZACIN
En el Grfico 14 se presenta la evolucin de la inflacin colombiana, se puede apreciar
que la serie no tiene media constante y aunque parece presentar cambio de varianza se
ha considerado que de existir y modelar los mismos25, esto no afecta significativamente
los pronsticos bajo los mtodos no paramtricos, al igual que no lo hace en los
mtodos paramtricos tipo GARCH.
30
30
25
20
15
10
5
0
Ene-80
Ene-83
Ene-86
Ene-89
Ene-92
Ene-95
Ene-98
Ene-01
Ene-98
Ene-01
3
1
-1
-3
-5
-7
Ene-80
Ene-83
Ene-86
Ene-89
Ene-92
Ene-95
31
siguiendo
f1(d)
4.70
4.68
4.66
4.64
4.62
0
10
15
20
32
f2(d)
41.8
41.6
41.4
41.2
41.0
40.8
40.6
40.4
40.2
40.0
0
10
15
20
f3(d)
16.0
15.8
15.6
15.4
15.2
15.0
0
10 d
15
20
33
pm
z
r =0
n p+r +m
(hn , m, d ) z n p + r + m
Esta medida permiti hacer un resumen para todos los tamaos de muestra y encontrar
los d y hn en cada horizonte de prediccin para los cuales esta medida era mnima, los
resultados se encuentran en la siguiente tabla:
m
1
2
3
4
5
6
7
8
9
10
11
12
dm
12
11
10
9
8
14
6
15
4
13
2
2
Tabla 1. Resultados d m y hnm
hnm
0,007
0,007
0,007
0,007
0,006
0,009
0,006
0,009
0,004
0,008
0,005
0,005
ptimos
Llama la atencin el hecho de que para horizontes largos, lase 11 y 12 meses, el orden
del proceso Markoviano resulta extremadamente pequeo, esto puede estar siendo
34
causado por que para dicha cantidad de rezagos comienza a ser evidente el problema
de el curso de la dimensionalidad, dicho de otra forma se disponen de pocas
observaciones para estimar esas relaciones, haciendo que la porcin de puntos que caen
en los limites sea muy grande cuando d crece, vase, entre otros, Hastie et al (2002).
35
36
MODELO
NP
ARIMA
STR
m
1
1
1
Obs.
41
41
41
EM
0.01
-0.16
0.02
EAM
0.22
0.27
0.34
EAPM
3.01
3.48
4.50
RECM
0.30
0.35
0.42
RECMP
4.20
4.51
5.52
U-THEIL
0.89
1.05
1.27
NP
ARIMA
STR
2
2
2
40
40
40
0.01
-0.38
0.03
0.38
0.54
0.57
5.23
7.00
7.59
0.50
0.69
0.70
7.44
9.08
9.41
0.87
1.20
1.22
NP
STR
ARIMA
3
3
3
39
39
39
0.00
0.05
-0.64
0.51
0.77
0.83
7.24
10.11
10.96
0.68
0.93
1.01
10.35
12.43
13.73
0.92
1.25
1.37
NP
STR
ARIMA
4
4
4
38
38
38
-0.04
0.04
-0.94
0.63
0.84
1.12
9.00
11.11
14.62
0.83
1.02
1.34
12.65
13.82
18.09
0.97
1.19
1.56
NP
STR
ARIMA
5
5
5
37
37
37
-0.09
0.06
-1.20
0.77
0.92
1.39
11.03
12.30
18.30
0.99
1.11
1.63
14.98
15.08
22.07
1.03
1.15
1.69
STR
NP
ARIMA
6
6
6
36
36
36
0.09
-0.12
-1.47
1.07
0.94
1.67
14.35
13.24
22.23
1.22
1.17
1.93
16.80
17.21
26.13
1.13
1.08
1.79
STR
NP
ARIMA
7
7
7
35
35
35
0.17
-0.11
-1.71
1.13
1.05
1.93
15.28
14.68
25.95
1.33
1.28
2.21
18.37
18.63
30.05
1.10
1.06
1.82
STR
NP
ARIMA
8
8
8
34
34
34
0.25
-0.15
-1.98
1.25
1.21
2.20
16.90
16.67
29.85
1.45
1.46
2.48
20.00
20.31
34.03
1.11
1.11
1.89
NP
STR
ARIMA
9
9
9
33
33
33
-0.19
0.33
-2.29
1.26
1.35
2.49
17.30
18.41
34.03
1.51
1.57
2.77
20.68
21.82
38.03
1.10
1.15
2.01
NP
STR
ARIMA
10
10
10
32
32
32
-0.23
0.40
-2.61
1.33
1.41
2.75
18.09
19.53
37.78
1.62
1.71
3.07
21.61
23.72
42.29
1.13
1.20
2.15
NP
STR
ARIMA
11
11
11
31
31
31
-0.29
0.48
-2.95
1.33
1.54
3.03
18.21
21.41
42.05
1.65
1.83
3.36
22.00
25.63
46.77
1.11
1.23
2.27
NP
STR
ARIMA
12
12
12
30
30
30
-0.33
0.57
-3.28
1.33
1.62
3.34
18.21
22.69
46.62
1.65
1.96
3.68
22.08
27.54
51.48
1.08
1.29
2.41
37
MODELO
NP
ARIMA
STR
m
1
1
1
DM1
-1.49
-0.42
1.68
P_DM1
0.07
0.34
0.95
DM2
-1.92
-0.35
1.85
P_DM2
0.03
0.36
0.97
DM3
-1.88
-0.35
1.83
P_DM3
0.03
0.36
0.97
NP
ARIMA
STR
2
2
2
-0.22
1.13
1.70
0.41
0.87
0.96
-0.38
1.28
1.83
0.35
0.90
0.97
-0.40
1.26
1.88
0.34
0.90
0.97
NP
STR
ARIMA
3
3
3
0.05
1.82
3.05
0.52
0.97
1.00
-0.49
1.89
3.10
0.31
0.97
1.00
-0.37
1.91
3.02
0.36
0.97
1.00
NP
STR
ARIMA
4
4
4
0.28
1.64
3.67
0.61
0.95
1.00
-0.23
1.46
3.66
0.41
0.93
1.00
-0.04
1.47
3.61
0.48
0.93
1.00
NP
STR
ARIMA
5
5
5
0.79
1.35
3.94
0.78
0.91
1.00
0.06
1.07
3.77
0.53
0.86
1.00
0.25
1.16
3.71
0.60
0.88
1.00
STR
NP
ARIMA
6
6
6
1.08
1.34
3.88
0.86
0.91
1.00
1.10
0.43
3.65
0.86
0.66
1.00
1.03
0.46
3.67
0.85
0.68
1.00
STR
NP
ARIMA
7
7
7
0.11
0.26
3.91
0.54
0.60
1.00
0.26
-0.33
3.51
0.60
0.37
1.00
0.08
-0.38
3.51
0.53
0.35
1.00
STR
NP
ARIMA
8
8
8
-0.31
0.35
4.14
0.38
0.64
1.00
-0.06
-0.01
3.44
0.48
0.50
1.00
-0.13
-0.24
3.55
0.45
0.40
1.00
NP
STR
ARIMA
9
9
9
0.49
-0.26
4.34
0.69
0.40
1.00
-0.04
0.00
3.93
0.49
0.50
1.00
-0.34
-0.22
4.10
0.37
0.41
1.00
NP
STR
ARIMA
10
10
10
0.24
0.18
4.35
0.59
0.57
1.00
-0.06
-0.06
3.88
0.48
0.48
1.00
-0.39
-0.18
4.12
0.35
0.43
1.00
NP
STR
ARIMA
11
11
11
-0.11
0.85
4.35
0.45
0.80
1.00
-0.52
0.38
3.98
0.30
0.65
1.00
-0.96
0.30
4.21
0.17
0.62
1.00
NP
STR
ARIMA
12
12
12
-0.85
0.20
-0.92
0.18
1.52
0.94
0.79
0.79
4.38
1.00
4.12
1.00
Tabla 3. Comparacin estadstica de los mtodos.
-1.29
0.66
4.29
0.10
0.75
1.00
38
Mes
Jun-03
Jul-03
Ago-03
Sep-03
Oct-03
Nov-03
Dic-03
Ene-04
Feb-04
Mar-04
Abr-04
May-04
m
dm
hm
Pronstico
1
12
0.007
7.6
2
11
0.007
7.5
3
10
0.007
7.4
4
9
0.007
7.3
5
8
0.006
7.1
6
14
0.009
7.0
7
6
0.006
6.8
8
15
0.009
6.7
9
4
0.004
6.6
10
13
0.008
6.5
11
2
0.005
6.4
12
2
0.005
6.3
Tabla 4. Pronsticos usando la serie completa.
Abr-02
Jul-02
Oct-02
Ene-03
Abr-03
Jul-03
Oct-03
Ene-04
39
Abr-04
6. CONCLUSIONES Y RECOMENDACIONES
En este trabajo se aplicaron tcnicas no paramtricas tipo kernel para generar y evaluar
pronsticos de la inflacin colombiana. Los resultados de la evaluacin de pronsticos
son alentadores, pues en general mejoran, en sentido estadstico y computacional, a los
de las metodologas actualmente aplicadas.
La eleccin del ancho de banda h y del coeficiente de Markov d juega un papel muy
importante en los pronsticos de series de tiempo, en particular para la inflacin
colombiana, usando mtodos no paramtricos basados en kernel; se encontr que la
eleccin final de los coeficientes para cada horizonte de prediccin permite mejorar
los pronsticos dados bajo los modelos paramtricos ARIMA y no lineal STAR.
En la literatura especializada se encuentran diversas ideas para encontrar intervalos de
pronsticos bajo estos mtodos no paramtricos, los cuales pueden aplicarse para tener,
adems del pronstico puntual, un rango de su confiabilidad. (Johnston (1982) usando
Bickel y Rosenblatt (1973), los Bootstraping son otra alternativa aunque intensiva en
computo)
Existen tambin en la literatura no paramtrica, reportes de los efectos adversos de las
condiciones de borde (boundary conditions) o agrupamiento en alguno(s) de los
limites internos de las bandas de suavizamiento, lo cual puede generar sesgos en las
estimaciones. El kernel especial de Gasser-Muller (1979) puede ser usado para
sobrellevar este problema; otra alternativa de solucin es usar regresin lineal local o
ms aun polinmica local, se puede consultar Fan y Gijbels (1996). Una opcin mas,
sera usar funciones kernel, aunque normales, no independientes.
No se desea terminar sin antes resaltar el hecho de que el tema de anlisis no
paramtrico de series en el Tiempo es un rea de extensa aplicacin no explotada aun
en nuestro pas; invitando as a otros investigadores y acadmicos a examinar en esta
prometedora rea.
40
BIBLIOGRAFA
41
42
43
LIU, R. Y. Y SINGH 1992. Moving blocks jackknife and bootstrap capture weak
dependence. Exploring the Limits of Bootstrap. R. Lepage & L. Billard (eds.). New
York: Wiley, 225-248.
MATZNER-LBER, E., GANNOUN, A. y DE GOOIJER, J. G. 1998. Nonparametric
forecasting: a comparison of three kernel-based methods. Communications in
Statistics: Theory and Methods, 27, 1593-1617.
MELO V., L. F. y MISAS A., M. A., 1998. Anlisis del comportamiento de la inflacin
trimestral en Colombia bajo cambios de rgimen: una evidencia a travs del modelo
Switching de Hamilton. Borradores de economa, 086, febrero. Bogot.
MISAS, M., LOPEZ, E. y QUERUBN, P. 2002. La inflacin en Colombia: Una
aproximacin desde las redes neuronales. Borradores de economa Banco de la
Repblica. Bogot. #199, febrero.
NUEZ M., J. y JIMENEZ C., J. 1998. Correcciones a los ingresos de las Encuestas
de Hogares y Distribucin del Ingreso Urbano. En: SANCHEZ, F. (compilador) La
Distribucin del Ingreso en Colombia, DNP, Tercer Mundo Editores. Bogot.
PAGAN, a. and ULLAH, A. 1999.
Nonparametric
Econometrics.
Cambridge
44
ANEXO A
distribucin de la cual provienen los datos, sino que se puede estimar directamente la
funcin de densidad a partir de los datos siempre y cuando se tenga una muestra
grande.
A continuacin se muestra la construccin
(A.1)
h
h
donde n( 0 ) es el nmero de datos en el intervalo [ x , x + ) , donde x es una marca
2
2
de clase, h es la amplitud de intervalo y n el tamao total de la muestra.
Esta estimacin es fcil de calcular pero tiene la desventaja de ser constante dentro del
intervalo y las estimaciones son muy dependientes del origen y de la amplitud del
intervalo, pues considera nicamente los datos dentro de cada uno ignorando los datos
45
adyacentes por prximos que estn; para resolver este ltimo problema se da cierto
peso a los datos de intervalos contiguos al que se est estimando.
h
, n(h ) y n( h ) al nmero
2
h
h
de datos en los intervalos adyacentes ( x + h ) y ( x h ) , respectivamente; se
2
2
construye un estimador que asigna cierto peso a los datos que estn en estos intervalos
y para los intervalos adyacentes el peso es el mismo, por simetra, obtenindose
1
f ( x) =
0 n(0 ) + 1 {n(h ) + n(h ) }
hn
h
h
para x [ x , x + ) , donde 0 , 1 > 0 y 0 + 2 1 = 1 .
2
2
Esta idea puede generalizarse incluyendo el resto de los intervalos con peso decreciente
para obtener:
m
1
f ( x) =
a
n
+
i [n(hi ) + n(hi ) ]
0 (0)
hn
i =1
(A.2)
46
Este proceso equivale a calcular la frecuencia absoluta en cada punto dando ciertos
coeficientes de ponderacin a cada uno de los datos, la cual depende de la distancia a
dicho punto.
perteneciente a alguna
familia .
Si es grande (por ejemplo si contiene las densidades continas) se sabe que el
estimador insesgado de f puede no existir y que el supremo de la funcin mximo
verosmil es infinito.27
Entonces un estimador de densidad primario es el del histograma mencionado en el la
seccin anterior, definido formalmente como:
fn ( x ) =
v nj
n(a n , j a n , j 1 )
, x I nj , j
27
47
Dado que este estimador no utiliza la informacin de toda la muestra, solamente los
datos contenidos en el intervalo I nj , se construye el estimador histograma adaptable
definido como:
f n* ( x ) =
v n (x )
, xR
nhn
vn ( x ) = I
donde
i =1
hn
hn
x ,x+
2
2
(X i )
1
nhn
x Xi
hn
K
i =1
, x R
(A.3)
f n (x ) =
1
nhnd
x Xt
K d
t =1
hn
n
1
= d
nhn
K
t =1
x1 X 1t
x X dt
,, d
hn
hn
, x R d
(A.4)
donde K d (.) es una funcin kernel d-variada.
28
48
ANEXO B
CONDICIONES MIXING
[{X s }, s t ] y
B un elemento
k , k + s
Donde k 0 cuando k
Condicion uniformly mixing o -mixing
Se dice que una secuencia es -mixing si:
P( A B) P( A) P( B) k P( A)
Donde k 0 cuando k .
29
Afirmacin hecha por Hrdle W., Ltkepohl H. y Chen R. en su artculo A Review of Nonparametric
Time Series Analysis. Pg 53, 54.
49