Professional Documents
Culture Documents
1.- GENERALIDADES
La robustez de un mtodo de estimacin se refiere a su condicin para obtener estimaciones insensibles
ante posibles violaciones de alguno de los supuestos fijados al especificar un modelo, en particular, el
relativo a la distribucin admitida para la perturbacin aleatoria.
Un estimador robusto produce buenas estimaciones (en algn sentido), ante una amplia variedad de
posibles procesos generadores de datos.
De acuerdo con la formalizacin habitual en la estadstica matemtica, se supone que las observaciones
del fenmeno en estudio son generadas a partir de un proceso aleatorio, representado por un miembro
F de la familia paramtrica F de funciones de distribucin:
{F ; }
, que
zando un estimador , con las propiedades desables conocidas: insesgadez y eficiencia. En general el
mtodo de Mxima Verosimilitud (MV) satisface tales requerimientos y en gran parte de las aplicaciones
se admite la distribucin normal gaussiana como modelo terico de distribucin.
En el modelo lineal general: yi = xi + i , con errores normales, independientes e idnticamente distribuidos, el estimador mnimo cuadrtico clsico (MCC) es el ms eficiente de los estimadores insesgados ( best unbiased estimator). Cuando los errores no estn normalmente distribuidos, sigue siendo
el ms eficiente, pero dentro de una clase ms restringida de estimadores, esto es, dentro de la clase de
estimadores lineales insesgados (best linear unbiased estimator).
Ahora bien; si la distribucin de los errores es leptocrtica, en el sentido de generar frecuentemente errores grandes, la linealidad es una condicin extremadamente restrictiva: se prueba que los estimadores
MCC resultan inferiores a otros estimadores no lineales insesgados, que se denominan estimadores
robustos.
Es sabido que la distribucin subyacente de la perturbacin aleatoria no se conoce con certeza; de ah
que el rea de la estimacin robusta que ha merecido mayor atencin, dentro del campo economtrico,
se refiere a estimadores que si bien son algo menos
eficientes que los MCC cuando los errores se
hallan normalmente distribuidos, resultan considerablemente ms eficientes que los MCC para errores
no normales. Otros desarrollos referentes a la robustez incluyen estimadores que son robustos ante especificaciones alternativas de la matriz de varianza-covarianza de los errores y estimadores que son robustos con respecto a la especificacin de la forma funcional; tambin en la Inferencia Bayesiana la eleccin de un estimador robusto con respecto a la especificacin de la distribucin a priori, ha sido tema de
inters para los econometristas bayesianos.
La robustez de las estimaciones constituye actualmente un tema preocupante entre economistas tericos y aplicados, dada la extrema sensibilidad de algunos procedimientos de estimacin ante la no normalidad del trmino de error.
2.- OBSERVACIONES ATPICAS. OBSERVACIONES INFLUYENTES.
Cuando se analizan datos muestrales es fcil captar visualmente discrepancias respecto a una distribucin normal: en datos microeconmicos financieros de alta frecuencia, se observan a menudo distribuciones empricas con colas ms densas que la normal.
La falta de normalidad obedece a la presencia de datos anmalos (outliers)1 : puede ocurrir que una
pequea fraccin de la muestra, digamos entre el 2% y el 10% aparezca como atpica, debido a errores
de medicin, alteraciones en la metodologa de recoleccin de datos, etc.
Valores extremos en la muestra pueden tener, a priori, una incidencia desproporcionada en las estimaciones MCC; estos valores se denominan observaciones de efecto palanca, que debern ser analizados
a los efectos de decidir sobre el tratamiento ms adecuado al objetivo del modelo. Con frecuencia, la
funcin estimada resulta desplazada en exceso, con el correspondiente aumento de los errores estndar de las estimaciones. En este caso se habla de valores influyentes y su identificacin puede realizarse corriendo dos regresiones: una con la muestra completa y otra quitando la i -sima observacin.
Todo dato cuya eliminacin altera marcadamente la estimacin MCC se considera observacin influyente.
2.1.- DETECCION DE OBSERVACIONES INFLUYENTES.
La metodologa para identificar
(1980 ) ;
los autores utilizan medidas de diagnstico que apuntan a cuantificar el impacto de observacio-
se define como:
( X X ) xi i
DFBETA = ( i ) =
1 hi
1
la observacin i .
Del mismo modo, la expresin
DFFIT = yi yi ( i ) =
hii
1 hi
mide diferencias entre valores ajustados y : i) con la totalidad de la informacin ; ii) quitando la observacin i .
Dado que estas diferencias dependen de las unidades de medicin, es conveniente normalizarlas dividiendo cada una de ellas por sus correspondientes errores estndar. Las medidas estandarizadas se
indican como DFBETAS y DFFITS .
Por tanto, si se desea medir el cambio en la estimacin del coeficiente
DFBETASki =
k k ( i )
( i )
( X X )kk
DFFITS =
xi xi ( i )
hi1 2 i
=
( i ) hi1 2
( i )(1 hi )
Toda observacin que no parece seguir el patrn de agrupamiento de la mayora de los datos recibe el nombre de
observacin anmala atpica.
hi
es el
Hat ;
H = X ( X X ) X , denominada Matriz
h = K .
i
El
i =1
K n.
Como regla prctica valor de corte, los autores consideran observaciones influyentes cuando:
DFBETAS ki >
12
K
DFFITSi > 2
n
La deteccin de valores influyentes no implica que deban ser desechados del grueso de la informacin. A
menudo, tales valores pueden ser indicio de cambios estructurales cuyos efectos deben ser detectados a
partir de las estimaciones del modelo.
Completada la etapa de identificacin, efectuadas la correcciones que correspondan, por ejemplo, por
fallas en la carga de datos errores de medicin, se proceder a la bsqueda de estimadores robustos
que permiten la inclusin de toda observacin influyente considerada por el investigador como informacin confiable y valiosa.
yi = 0 + 1 xi1 + 2 xi 2 + ... + K xi K + i = xi + i
Estimadores M: Esta clase de estimadores pueden considerarse como generalizacin de los de Mxima
Verosmil; de ah la denominacin estimadores- M. Consisten en minimizar la funcin suma ponderada
n
de errores absolutos:
i =1
Por ejemplo:
i) Fijando todas las ponderaciones iguales, esto es
MAD = yi xi
i =1
ii) Utilizando un esquema de ponderaciones que dependa de la magnitud del error en trminos absolutos: si ste es menor a un valor arbitrario b , se lo toma como ponderacin; en caso contrario, la ponderacin se estabiliza en b :
wi = yi xi
si
yi xi < b
wi = b sgn ( yi xi )
si
yi xi b
yi xi b ; cuando yi xi
En este sentido, los estimadores MCC utilizan como ponderacin la magnitud de cada error absoluto.
i =1
lutos elevados a la potencia p. Si p = 2, estamos ante los Estimadores MCC; si p = 1, el estimador coincide con el MAD. Como regla prctica para decidir sobre el valor de p , debe tenerse en cuenta que,
cuanto ms densas son las colas de la distribucin emprica, menor debe ser p.
4
mente:
F ( y ) . Formal-
q( ) = inf { y : F ( y ) }
Fn ( y ) = I (Yi y )
k
donde I ( z ) es una funcin indicativa que toma valor 1 cuando el argumento es cierto y 0 en los dems
casos.
La correspondiente funcin emprica de los cuantiles viene dada por la expresin:
q( )n = inf { y : Fn ( y ) }
o lo que es lo mismo, considerado como un problema de optimizacin:
qn ( ) = arg min Yi +
i:Y
(1 ) Yi
i:Y <
donde
(u ) = u ( I (u < 0))
y(1) , y( 2) ,..., y( n)
siendo
de la muestra.
Mnimos Cuadrados Recortados: El mtodo consiste, bsicamente en desechar algunas observaciones. Por ejemplo, despus de calcular los cuantiles 0.05 y 0.95, se descartan observaciones con residuos negativos respecto a q% ( 0.05 ) y positivos respecto a q% ( 0.95 ) . En total se elimina el 10% de las
observaciones; se practica una regresin mnimo- cuadrtica con las observaciones remanentes y se
obtiene un estimador MCC -recortado, siendo en este caso = 0.10 .
Estimadores con influencia acotada : Estos estimadores se disean de modo de limitar la incidencia
que una observacin anmala pueda tener sobre las estimaciones MCC. Se trata de minimizar la suma
ponderada de errores cuadrticos, disminuyendo el peso otorgado a la observacin atpica, respecto de
las restantes, las que conservan ponderacin unitaria. La cota se elige generalmente, admitiendo que la
eficiencia del nuevo estimador resulte hasta, por ejemplo, un 5% menor que la correspondiente a los
estimadores MCC.
que:
i) Mnimos Cuadrados Clsicos minimiza la funcin objetivo
ii) La regresin por la mediana
2
i
i
iii) La regresin por quintiles considera como funcin objetivo una suma que pondera asimtricamente los
errores absolutos: otorga ponderacin a errores por subestimacin y ponderacin (1 ) para errores
por sobreestimacin.
5.- EL MODELO DE REGRESIN POR CUANTILES
Como ya dijimos, en un anlisis clsico de regresin lineal, formalizado mediante el modelo yi = xi + i ,
En la regresin por cuantiles, en cambio, se analiza la incidencia de las variables explicativas sobre cada
uno de los cuantiles de la distribucin de y ; se obtiene entonces un vector de estimaciones por cada
cuantil, que simbolizamos como % .
GRAFICO I
Regresin Cuantlica (Normal)
x : x1, x2
la distribucin condicionada de y
que supondremos en ambos casos normal pero con distinta media y varianza (ambas crecientes con x ).
La recta central representa la recta de regresin mnimo cuadrtica, es decir, la esperanza condicional
de y dado x , que coincide en este caso con la mediana Q0.50 . Las lneas punteadas son las regresiones cuantilicas
0.05 = 0.95
, lo
x.
La regresin por cuantiles condicionales estndar supone una especificacin lineal en las variables regresoras x :
Q( / xi , ) = xi
siendo el vector de coeficientes asociado al
cuantil .
La funcin objetivo del prrafo anterior se modifica de manera que el vector cuantlico % resulta de minimizar, respecto a , la expresin
n
n
min yi xi + (1 ) yi xi
( )
i: yi < xi
i:yi xi
Obsrvese que se utiliza la notacin , y no como en el caso de MCC, para destacar que diferentes
generan distintas estimaciones de . Por otra parte, si es 0.90, por ejemplo, la pon-
elecciones de
deracin asimtrica opera con mayor intensidad para observaciones y x que para observaciones
donde y < x
La funcin objetivo no es diferenciable, por lo que se utilizan mtodos de programacin lineal para la
bsqueda de la solucin.
Desde el momento que este enfoque no requiere supuestos fuertes en lo que respecta a la distribucin
de los errores se lo considera un mtodo robusto para modelizar esas relaciones. Los autores Koenker y
Bassett demuestran adems la consistencia y normalidad asinttica.
Decil
Equip
Salud
Transp
Esparc
Educ
0.7783
0.9020
0.8199
1.1413
0.8772
1.4721
0.9781
1.7017
1.8846
2.9341
0.7627
0.9035
0.8410
1.1277
0.8793
1.4197
0.9766
1.6152
1.7588
2.3438
0.7479
0.8940
0.8626
1.1287
0.8860
1.3806
0.9758
1.5608
1.6309
2.5217
0.7363
0.8998
0.8410
1.1101
0.8775
1.3968
0.9758
1.4916
1.6017
2.0723
0.7251
0.8922
0.8238
1.1081
0.8765
1.3610
0.9711
1.4300
1.5328
2.0145
0.7088
0.9013
0.8368
1.1129
0.8819
1.3610
0.9732
1.3987
1.5302
1.7087
0.6902
0.8904
0.8346
1.1040
0.8734
1.3152
0.9751
1.4033
1.4566
1.6719
0.6670
0.8904
0.8299
1.1101
0.8630
1.3122
0.9756
1.3218
1.4329
1.5981
0.6397
0.8792
0.7921
1.1058
0.8541
1.2863
0.9771
1.3070
1.4014
1.4609
10
0.5590
0.8769
0.7205
1.1083
0.8358
1.2149
0.9758
1.2904
1.2773
1.3702
Paralelamente se muestran en los Grficos que siguen, estimaciones de regresin por cuantiles de las
Curvas de Engel del tipo:
w = ln G
i, j
j
representa la proporcin del gasto en el rubro i efectuado por el hogar j y G j
w
i, j
el gasto total del hogar. Se consideraron los rubros Alimentos, Bebidas Alcohlicas y Cigarrillos. Por
razones de claridad visual, slo se exiben Q0.10 Q0.50 Q0.90 .
En las que:
GRFICO II
Regresin Cuantl ica 10th
Regresin Cuantl ica 90th
1.20053
-.013422
.733569
8.52231
Log Ingreso Per Cpi ta
.242588
Proporcin del Gasto destinado a Alcohol
.2494
.000094
-.003 002
.7335 69
1.02185
8.5223 1
8.52231
Log Ingreso Per Cpi ta
Las regresiones cuantlicas, muestran en la generalidad de los casos, una reduccin pronunciada de la
heterocedasticidad a medida que aumenta el ingreso. Sin embargo esta reduccin no es idntica para
todos los bienes, sino que defiere segn el tipo de bien.
Respecto a los coeficientes
Bebidas Alcohlicas
Cigarrillos
0.10
-0.0789
-0.0022
-0.0047
0.50
-0.1193
-0.0044
-0.1139
0.90
-0.1264
-0.0132
-0.0292
Para alimentos, podemos ver una pendiente ms pronunciada, en el sentido de que la saciedad opera
ms rpidamente que para otro tipo de bienes.
BIBLIOGRAFA
Belsley, D.A., E.Kuh and R.E.Welsch [1980]: Regression Diagnostics: Identifying Influential
Data and Sources of Collinearity. New York. J.Wiley &Sons.
Cameron, A.C. & P.K.Trivedi [2010]: Microeconometrics using Stata. Revised Edition. Texas,
USA, Stata Press.
Hampel, F: [2001]: Robust Statistics: A Brief Introduction and Overview. Research Report N 94.
Seminar fr Statistik. Eidgenssische Technische Hochschule (ETH). Zrich. Switzerland
Hansen, L. & T. Sargent [2007]: Robustness. Princeton, N.J. Princeton University Press.
Huber, P.J. [1964]: Robust estimation of a location parameter. Annals of Mathematical Statistics. Vol.35;
73-101.
Huber, P.J. [1981]: Robust Statistics. New York. Wiley & Sons.
nd
Judge, G.G. et al. [1985]: The Theory and Practice of Econometrics. 2 . Ed. New York. John Wiley &
Sons.
Kennedy, P. [2008]: A Guide to Econometrics. Oxford. Blackwell Publishing.
Koenker, R. [2005]: Quantile Regression. Cambridge. Cambridge University Press
Koenker, R. and K.F.Hallock [2001]: Quantile Regression. Journal of Economic Perspectives. Vol.15; 4;
143-156.
Koenker, R. and G.Bassett [1978]: Regression quantiles. Econometrica, 46 (1), 33-50.
Sosa Escudero, W. [2005]: Perspectivas y Avances Recientes en Regresin por Cuantiles. En:
Progresos en Econometra. Asociacin Argentina de Economa Poltica.
Spanos A. [1999]: Probability Theory and Statistical Inference. Econometric Society Monographs.
Cambridge .Cambridge University Press.
Urbisaia, H. y J.Brufman [2005]: La Reforma Tributaria. Implicancias sobre la Distribucin del Ingreso y
el Bienestar. Buenos Aires, Ediciones Cooperativas.
Paquetes Informticos: STATA 8.0 y E-VIEWS 7.1
10