Regresion Cuantílica 00

ESTIMACION ROBUSTA
HERIBERTO L. URBISAIA y JUANA Z. BRUFMAN (UBA)
1.- GENERALIDADES
La robustez de un mtodo de estimacin se refiere a su condicin para obtener estimaciones insensibles
ante posibles violaciones de alguno de los supuestos fijados al especificar un modelo, en particular, el
relativo a la distribucin admitida para la perturbacin aleatoria.
Un estimador robusto produce buenas estimaciones (en algn sentido), ante una amplia variedad de
posibles procesos generadores de datos.
De acuerdo con la formalizacin habitual en la estadstica matemtica, se supone que las observaciones
del fenmeno en estudio son generadas a partir de un proceso aleatorio, representado por un miembro
F de la familia paramtrica F de funciones de distribucin:
{F ; }
Se admite que el mecanismo es totalmente conocido salvo el parmetro
, que
debe ser estimado utili-
zando un estimador , con las propiedades desables conocidas: insesgadez y eficiencia. En general el
mtodo de Mxima Verosimilitud (MV) satisface tales requerimientos y en gran parte de las aplicaciones
se admite la distribucin normal gaussiana como modelo terico de distribucin.
En el modelo lineal general: yi = xi + i , con errores normales, independientes e idnticamente distribuidos, el estimador mnimo cuadrtico clsico (MCC) es el ms eficiente de los estimadores insesgados ( best unbiased estimator). Cuando los errores no estn normalmente distribuidos, sigue siendo
el ms eficiente, pero dentro de una clase ms restringida de estimadores, esto es, dentro de la clase de
estimadores lineales insesgados (best linear unbiased estimator).
Ahora bien; si la distribucin de los errores es leptocrtica, en el sentido de generar frecuentemente errores grandes, la linealidad es una condicin extremadamente restrictiva: se prueba que los estimadores
MCC resultan inferiores a otros estimadores no lineales insesgados, que se denominan estimadores
robustos.
Es sabido que la distribucin subyacente de la perturbacin aleatoria no se conoce con certeza; de ah
que el rea de la estimacin robusta que ha merecido mayor atencin, dentro del campo economtrico,
se refiere a estimadores que si bien son algo menos
eficientes que los MCC cuando los errores se
hallan normalmente distribuidos, resultan considerablemente ms eficientes que los MCC para errores
no normales. Otros desarrollos referentes a la robustez incluyen estimadores que son robustos ante especificaciones alternativas de la matriz de varianza-covarianza de los errores y estimadores que son robustos con respecto a la especificacin de la forma funcional; tambin en la Inferencia Bayesiana la eleccin de un estimador robusto con respecto a la especificacin de la distribucin a priori, ha sido tema de
inters para los econometristas bayesianos.
La robustez de las estimaciones constituye actualmente un tema preocupante entre economistas tericos y aplicados, dada la extrema sensibilidad de algunos procedimientos de estimacin ante la no normalidad del trmino de error.
2.- OBSERVACIONES ATPICAS. OBSERVACIONES INFLUYENTES.
Cuando se analizan datos muestrales es fcil captar visualmente discrepancias respecto a una distribucin normal: en datos microeconmicos financieros de alta frecuencia, se observan a menudo distribuciones empricas con colas ms densas que la normal.
La falta de normalidad obedece a la presencia de datos anmalos (outliers)1 : puede ocurrir que una
pequea fraccin de la muestra, digamos entre el 2% y el 10% aparezca como atpica, debido a errores
de medicin, alteraciones en la metodologa de recoleccin de datos, etc.
Valores extremos en la muestra pueden tener, a priori, una incidencia desproporcionada en las estimaciones MCC; estos valores se denominan observaciones de efecto palanca, que debern ser analizados
a los efectos de decidir sobre el tratamiento ms adecuado al objetivo del modelo. Con frecuencia, la
funcin estimada resulta desplazada en exceso, con el correspondiente aumento de los errores estndar de las estimaciones. En este caso se habla de valores influyentes y su identificacin puede realizarse corriendo dos regresiones: una con la muestra completa y otra quitando la i -sima observacin.
Todo dato cuya eliminacin altera marcadamente la estimacin MCC se considera observacin influyente.
2.1.- DETECCION DE OBSERVACIONES INFLUYENTES.
La metodologa para identificar
(1980 ) ;
valores influyentes ha sido formalizada por Belsley, Kuh y Welsch,
los autores utilizan medidas de diagnstico que apuntan a cuantificar el impacto de observacio-
nes potencialmente influyentes en la estimacin MCC del Modelo de Regresin.

Sea el Modelo y = X + , con K variables explicativas, a ser estimado con n observaciones. La contribucin de la observacin i -sima en la estimacin
se define como:
( X X ) xi i
DFBETA = ( i ) =
1 hi
1
expresin que mide diferencias entre los coeficientes
estimados: i) con la totalidad de la informacin ;
ii) quitando la observacin i .

En esta expresin
xi es la fila i -sima de la matriz X y hi = xi ( X X ) xi mide la influencia a priori de

1
la observacin i .
Del mismo modo, la expresin
DFFIT = yi yi ( i ) =
hii
1 hi
mide diferencias entre valores ajustados y : i) con la totalidad de la informacin ; ii) quitando la observacin i .
Dado que estas diferencias dependen de las unidades de medicin, es conveniente normalizarlas dividiendo cada una de ellas por sus correspondientes errores estndar. Las medidas estandarizadas se
indican como DFBETAS y DFFITS .
Por tanto, si se desea medir el cambio en la estimacin del coeficiente
k , originado por la supresin de
la informacin i , se deben calcular:
DFBETASki =
k k ( i )
( i )
( X X )kk
DFFITS =
xi xi ( i )
hi1 2 i
=
( i ) hi1 2
( i )(1 hi )
Toda observacin que no parece seguir el patrn de agrupamiento de la mayora de los datos recibe el nombre de
observacin anmala atpica.
hi
es el
Hat ;
i -simo elemento diagonal
de la matriz de proyeccin MCC:
H = X ( X X ) X , denominada Matriz
H es matriz idempotente; por tanto 0 hi 1 . Adems, la traza de H = K , por lo que
h = K .
i
El
i =1
tamao promedio de un elemento diagonal es
K n.
Como regla prctica valor de corte, los autores consideran observaciones influyentes cuando:
DFBETAS ki >
12
K
DFFITSi > 2
n
La deteccin de valores influyentes no implica que deban ser desechados del grueso de la informacin. A
menudo, tales valores pueden ser indicio de cambios estructurales cuyos efectos deben ser detectados a
partir de las estimaciones del modelo.
Completada la etapa de identificacin, efectuadas la correcciones que correspondan, por ejemplo, por
fallas en la carga de datos errores de medicin, se proceder a la bsqueda de estimadores robustos
que permiten la inclusin de toda observacin influyente considerada por el investigador como informacin confiable y valiosa.
3.- ESTIMADORES ROBUSTOS

Existen propuestas alternativas para la estimacin robusta de medidas de posicin y de escala. Una clasificacin apropiada, efectuada por Huber (1964) es la siguiente:
1.- Estimadores M
2.- Estimadores Lp
3.- Estimadores L
4.- Mnimos Cuadrados Recortados
5.- Estimadores con influencia acotada
En lo que sigue ejemplificamos cada uno de los estimadores refirindonos al campo economtrico, especficamente al Modelo de Regresin:
yi = 0 + 1 xi1 + 2 xi 2 + ... + K xi K + i = xi + i
Estimadores M: Esta clase de estimadores pueden considerarse como generalizacin de los de Mxima
Verosmil; de ah la denominacin estimadores- M. Consisten en minimizar la funcin suma ponderada
n
de errores absolutos:
yi xi utilizando diferentes ponderaciones, segn la magnitud del error. 3.
i =1
Por ejemplo:
i) Fijando todas las ponderaciones iguales, esto es
wi = 1 , i ; en este caso el estimador minimiza la
suma de errores absolutos; el estimador se denomina Desviacin Absoluta Mnima:

n
MAD = yi xi
i =1
ii) Utilizando un esquema de ponderaciones que dependa de la magnitud del error en trminos absolutos: si ste es menor a un valor arbitrario b , se lo toma como ponderacin; en caso contrario, la ponderacin se estabiliza en b :
iii) Aplicando un esquema
wi = yi xi
si
yi xi < b
wi = b sgn ( yi xi )
si
yi xi b
similar al anterior, pero con valores wi decrecientes hacia cero si
yi xi b ; cuando yi xi
alcance un valor arbitrario d , wi se tomar =0. Esta opcin implica
desechar observaciones que generen errores absolutos mayores que d .
En este sentido, los estimadores MCC utilizan como ponderacin la magnitud de cada error absoluto.
Estimadores Lp : Resultan de minimizar la funcin
yi xi ; es decir, la suma de errores abso-
i =1
lutos elevados a la potencia p. Si p = 2, estamos ante los Estimadores MCC; si p = 1, el estimador coincide con el MAD. Como regla prctica para decidir sobre el valor de p , debe tenerse en cuenta que,
cuanto ms densas son las colas de la distribucin emprica, menor debe ser p.
4
Estimadores L: Son combinaciones lineales de estadsticos de orden muestrales.

As, el estadstico de orden 0.25 primer cuartil: qY ( 0.25 ) , separa la distribucin de modo que el 25%
de las observaciones son menores que qY ( 0.25 ) y el 75% mayores que qY ( 0.25 ) ; la mediana es el segundo cuartil cuantil de orden 0.50, etc.
Se recordar que, dada una variable aleatoria
define el cuantil de orden
Y , con funcin de distribucin F ( y ) = P (Y y ) , se
( 0 < < 1) , como el menor y
mente:
que satisface la relacin
F ( y ) . Formal-
q( ) = inf { y : F ( y ) }
n , la funcin de distribucin emprica tradicional vie-
Si se dispone de una muestra aleatoria de tamao

ne dada por:
Fn ( y ) = I (Yi y )
k
donde I ( z ) es una funcin indicativa que toma valor 1 cuando el argumento es cierto y 0 en los dems
casos.
La correspondiente funcin emprica de los cuantiles viene dada por la expresin:
q( )n = inf { y : Fn ( y ) }
o lo que es lo mismo, considerado como un problema de optimizacin:
qn ( ) = arg min Yi +
i:Y
(1 ) Yi
i:Y <
qn ( ) = arg min (Yi )
donde
(u ) = u ( I (u < 0))
se denomina funcin de chequeo (check function) que pondera asimtri-
camente valores positivos y negativos.

Los estimadores L se obtienen combinando linealmente cuantiles de diferente orden; de este modo es
posible construir estimadores robustos de una medida de posicin. Se han propuesto, por ejemplo, las
combinaciones:
0.30q% ( 0.25 ) + 0.40q% ( 0.50 ) + 0.30q% ( 0.75 )
bien:
0.25q% ( 0.25 ) + 0.50q% ( 0.50 ) + 0.25q% ( 0.75 )
Las observaciones ordenadas de la muestra aleatoria
( y1 , y2 ,..., yn ) se indican como:
y(1) y( 2) ... y( n) . Entonces y(i ) , i = 1,2,..., n , se denomina estadstico de orden i
y(1) , y( 2) ,..., y( n)
siendo
de la muestra.
Mnimos Cuadrados Recortados: El mtodo consiste, bsicamente en desechar algunas observaciones. Por ejemplo, despus de calcular los cuantiles 0.05 y 0.95, se descartan observaciones con residuos negativos respecto a q% ( 0.05 ) y positivos respecto a q% ( 0.95 ) . En total se elimina el 10% de las
observaciones; se practica una regresin mnimo- cuadrtica con las observaciones remanentes y se
obtiene un estimador MCC -recortado, siendo en este caso = 0.10 .
Estimadores con influencia acotada : Estos estimadores se disean de modo de limitar la incidencia
que una observacin anmala pueda tener sobre las estimaciones MCC. Se trata de minimizar la suma
ponderada de errores cuadrticos, disminuyendo el peso otorgado a la observacin atpica, respecto de
las restantes, las que conservan ponderacin unitaria. La cota se elige generalmente, admitiendo que la
eficiencia del nuevo estimador resulte hasta, por ejemplo, un 5% menor que la correspondiente a los
estimadores MCC.
4.- REGRESIN POR CUANTILES REGRESIN CUANTLICA

La regresin cuantlica, introducida por Koenker y Bassett en 1978, constituye actualmente una metodologa de aplicacin corriente en estudios socioeconmicos orientados al anlisis de la desigualdad. Ello
ha sido posible gracias a la mayor disponibilidad de informacin microeconmica, unida a su procesamiento electrnico a travs de paquetes informticos cada vez ms sofisticados.
En la mayora de los estudios economtricos se modelan momentos condicionales; al especificar por
ejemplo, la relacin yi = xi + i , se estima especficamente la funcin media condicional de y , condicionada a las variables regresoras x . Sin embargo, existe actualmente un inters creciente en mtodos que permitan apreciar otros aspectos de la distribucin de y . En esta direccin la regresin por
cuantiles apunta a una descripcin ms detallada al modelizar, no slo el valor medio condicional, sino la
mediana, cuartiles, percentiles, etc., condicionados a los niveles de las variables regresoras.
Si se consideran cuantiles equiespaciados, por ejemplo, cada 5% 1% de la poblacin, es posible modelizar cada una de las posiciones predeterminada de la distribucin de y . Por tanto, la regresin por
cuantiles amplifica notablemente el anlisis de la distribucin de la variable respuesta, condicionada al
conjunto de variables regresoras.
Un caso importante de la regresin por cuantiles es el estimador Desviacin Absoluta Mnima (MAD),
que corresponde al ajuste de la mediana condicional de la variable respuesta.
Retomando el modelo
yi = xi + i , donde i es el error correspondiente a la observacin i , resulta
que:
i) Mnimos Cuadrados Clsicos minimiza la funcin objetivo
ii) La regresin por la mediana
(estimador MAD) minimiza

i
2
i
i
iii) La regresin por quintiles considera como funcin objetivo una suma que pondera asimtricamente los
errores absolutos: otorga ponderacin a errores por subestimacin y ponderacin (1 ) para errores
por sobreestimacin.
5.- EL MODELO DE REGRESIN POR CUANTILES
Como ya dijimos, en un anlisis clsico de regresin lineal, formalizado mediante el modelo yi = xi + i ,
xi sobre el valor medio condicional de

y ; la incidencia resulta cuantificada al obtener las estimaciones .
se intenta determinar la incidencia de las variables explicativas
En la regresin por cuantiles, en cambio, se analiza la incidencia de las variables explicativas sobre cada
uno de los cuantiles de la distribucin de y ; se obtiene entonces un vector de estimaciones por cada
cuantil, que simbolizamos como % .
GRAFICO I
Regresin Cuantlica (Normal)
En el grafico adjunto se ha representado para dos valores de
x : x1, x2
la distribucin condicionada de y
que supondremos en ambos casos normal pero con distinta media y varianza (ambas crecientes con x ).
La recta central representa la recta de regresin mnimo cuadrtica, es decir, la esperanza condicional
de y dado x , que coincide en este caso con la mediana Q0.50 . Las lneas punteadas son las regresiones cuantilicas
Q para = 0.05 y = 0.95 .
Como puede observarse, las pendientes dadas por los coeficientes

que muestra la presencia de heterocedasticidad a medida que crece
Si las rectas punteadas fuesen paralelas,
0.05 = 0.95
resultan crecientes con
, lo
x.
estaramos en el caso homocedstico.
La regresin por cuantiles condicionales estndar supone una especificacin lineal en las variables regresoras x :
Q( / xi , ) = xi
siendo el vector de coeficientes asociado al
cuantil .
La funcin objetivo del prrafo anterior se modifica de manera que el vector cuantlico % resulta de minimizar, respecto a , la expresin
n
n
min yi xi + (1 ) yi xi
( )
i: yi < xi
i:yi xi
Obsrvese que se utiliza la notacin , y no como en el caso de MCC, para destacar que diferentes
generan distintas estimaciones de . Por otra parte, si es 0.90, por ejemplo, la pon-
elecciones de
deracin asimtrica opera con mayor intensidad para observaciones y x que para observaciones
donde y < x
La funcin objetivo no es diferenciable, por lo que se utilizan mtodos de programacin lineal para la
bsqueda de la solucin.
Desde el momento que este enfoque no requiere supuestos fuertes en lo que respecta a la distribucin
de los errores se lo considera un mtodo robusto para modelizar esas relaciones. Los autores Koenker y
Bassett demuestran adems la consistencia y normalidad asinttica.
6.- UNA APLICACIN AL CLCULO DE ELASTICIDADES DEL GASTO

En Urbisaia y Brufman (2005), se estimaron elasticidades del Gasto por Deciles de Ingreso. El trabajo se
realiz en el marco del Proyecto UBACyT E036 Programacin 2001-2004: La Reforma Tributaria. Implicancias sobre la Distribucin del Ingreso y el Bienestar.
Se utilizaron datos de la Encuesta Nacional de Gastos de los Hogares 1996-1997, INDEC, correspondientes a la Regin Metropolitana del Gran Buenos Aires, (Capital Federal y Conurbano Bonaerense),
considerndose diversos rubros que componen el presupuesto familiar: Alimentos, Bebidas Alcohlicas,
Indumentaria, Vivienda, Equipamiento del Hogar, Salud, Transporte, Esparcimiento, Educacin, Bienes y
Servicios varios.
El anlisis y procesamiento de la base de datos estuvo a cargo del Lic. Luis A. Trajtenberg aplicando el
programa STATA 8.0.
6.1.- RELEVANCIA DEL TEMA
El conocimiento de las elasticidades resulta fundamental para analizar el comportamiento de la demanda
ante variaciones de precios e ingresos. La posibilidad de segmentar los estudios segn cuantiles de ingreso permite diferenciar aun ms las elasticidades y determinar el rango dentro del cul los bienes se
comportan como necesarios o superfluos; en sntesis, en estos casos tendremos, para un mismo bien, el
comportamiento de la demanda segn tramos de ingreso.
Una de las aplicaciones ms interesantes de este instrumental se refiere al estudio de la repercusin de
los impuestos al consumo (ejemplo el valor agregado), sobre la demanda y finalmente sobre la recaudacin fiscal.
En efecto; un aumento de impuestos, es visto por el consumidor como un aumento de precios, y por
ende, una baja en los consumos. La magnitud de este efecto viene dado por las respectivas elasticidades.
Un incremento de precios va un aumento de impuesto, tiene un efecto doble sobre las cuentas fiscales:
uno positivo y otro negativo. El positivo viene dado por la mayor tasa de impuesto, pero dado que simultneamente se da el efecto contrario (negativo) por la baja en los consumos, el resultado final puede ser
incierto. En este caso, puede establecerse un nuevo nivel del equilibrio de las variables precioconsumo, segn elasticidades. Por tanto, el hecho de poder desagregar la demanda por cuantiles, con
sus respectivas elasticidades, nos da el instrumento necesario para analizar en forma cuantitativa el
resultado final y el impacto social de este tipo de impuestos.
6.2.- CASOS EMBLEMTICOS
El comportamiento de las elasticidades dentro de cada grupo tiene que ver con el grado de saciedad
(medida en unidades fsicas) y rapidez y forma con que se llega a la misma, an cuando luego puede
haber un cambio de calidad, que lleva a una extensin de la misma en trminos de valor. A partir de estos conceptos, cada grupo de bienes sigue su propia dinmica. As para algunos bienes, la saciedad
fsica llega mas rpidamente que en otros, por ejemplo alimentos respecto a indumentaria, aunque en
valores puede la misma puede ser mas extensa.
Debemos tener en cuenta, que las elasticidades se refieren al gasto por tipo de bien, lo que implica el
efecto conjunto de la cantidad y la calidad. Es decir que al llegar a estratos superiores del ingreso, las
cantidades compradas siguen siendo las mismas o aumentan levemente, pero las calidades pueden aumentar significativamente el valor, acarreando variaciones ms pronunciadas en el gasto.
Para el rubro Alimentos, como era de esperar, la proporcin dedicada a este gasto disminuye a medida
que aumenta el ingreso, proporcin que no puede ser alterada significativamente por la calidad; ello im-
plica que su valor es ms o menos cercano al de saciedad: la elasticidad sufre un aplanamiento ms

pronunciado a medida que aumentan los deciles.
Para Bebidas Alcohlicas y Cigarrillos, en virtud de que se trata de consumos que son ms bien vicios,
tiene un nivel de saciedad elevado, y por ende, su elasticidad se mantiene constante a travs de toda la
escala. Un aumento de precios, por aplicacin de un impuesto, difcilmente tendr impacto sobre la demanda. No obstante en este caso el impuesto tendr un efecto diferente segn se lo aplique a las unidades consumidas (botellas, atados de cigarrillos) al valor de los mismos (unidades x calidad).
En los restantes bienes, como transporte, esparcimiento y educacin, las elasticidades son notoriamente decrecientes, se trata de consumos con alto contenido de servicios.
El Cuadro adjunto resume los resultados obtenidos en dicha oportunidad
ELASTICIDADES POR DECILES DE INGRESO
Decil
Aliment. B.Alcoh Cigarril. Indumen Viviend
Equip
Salud
Transp
Esparc
Educ
0.7783
0.9020
0.8199
1.1413
0.8772
1.4721
0.9781
1.7017
1.8846
2.9341
0.7627
0.9035
0.8410
1.1277
0.8793
1.4197
0.9766
1.6152
1.7588
2.3438
0.7479
0.8940
0.8626
1.1287
0.8860
1.3806
0.9758
1.5608
1.6309
2.5217
0.7363
0.8998
0.8410
1.1101
0.8775
1.3968
0.9758
1.4916
1.6017
2.0723
0.7251
0.8922
0.8238
1.1081
0.8765
1.3610
0.9711
1.4300
1.5328
2.0145
0.7088
0.9013
0.8368
1.1129
0.8819
1.3610
0.9732
1.3987
1.5302
1.7087
0.6902
0.8904
0.8346
1.1040
0.8734
1.3152
0.9751
1.4033
1.4566
1.6719
0.6670
0.8904
0.8299
1.1101
0.8630
1.3122
0.9756
1.3218
1.4329
1.5981
0.6397
0.8792
0.7921
1.1058
0.8541
1.2863
0.9771
1.3070
1.4014
1.4609
10
0.5590
0.8769
0.7205
1.1083
0.8358
1.2149
0.9758
1.2904
1.2773
1.3702
Paralelamente se muestran en los Grficos que siguen, estimaciones de regresin por cuantiles de las
Curvas de Engel del tipo:
w = ln G
i, j
j
representa la proporcin del gasto en el rubro i efectuado por el hogar j y G j
w
i, j
el gasto total del hogar. Se consideraron los rubros Alimentos, Bebidas Alcohlicas y Cigarrillos. Por
razones de claridad visual, slo se exiben Q0.10 Q0.50 Q0.90 .
En las que:
GRFICO II
Regresin Cuantl ica 10th
Regresin Cuantl ica 90th
Regresin Cuantlica 50th

A li mentos Share
Proporcin del Gasto destinado a Alimentos
1.20053
-.013422
.733569
8.52231
Log Ingreso Per Cpi ta
Curva de Engel Regresin Cuantlica
Regresi n Cuantlica 10th

Regresi n Cuantlica 90th
Re gre sin Cuan tlica 5 0th
Cigarril lo Share
Regresin Cuantlica 50th

Alcohol Share
.242588
Proporcin del Gasto destinado a Alcohol
Regresi n Cua ntl ica 10th

Regresi n Cua ntl ica 90th
Proporcin del Gasto destinado a Cigarrillos
.2494
.000094
-.003 002
.7335 69
1.02185
8.5223 1
8.52231
Las regresiones cuantlicas, muestran en la generalidad de los casos, una reduccin pronunciada de la
heterocedasticidad a medida que aumenta el ingreso. Sin embargo esta reduccin no es idntica para
todos los bienes, sino que defiere segn el tipo de bien.
Respecto a los coeficientes
(pendientes) de cada una de las regresiones, se obtuvieron:

Alimentos
Bebidas Alcohlicas
Cigarrillos
0.10
-0.0789
-0.0022
-0.0047
0.50
-0.1193
-0.0044
-0.1139
0.90
-0.1264
-0.0132
-0.0292
Para alimentos, podemos ver una pendiente ms pronunciada, en el sentido de que la saciedad opera
ms rpidamente que para otro tipo de bienes.
BIBLIOGRAFA
Belsley, D.A., E.Kuh and R.E.Welsch [1980]: Regression Diagnostics: Identifying Influential
Data and Sources of Collinearity. New York. J.Wiley &Sons.
Cameron, A.C. & P.K.Trivedi [2010]: Microeconometrics using Stata. Revised Edition. Texas,
USA, Stata Press.
Hampel, F: [2001]: Robust Statistics: A Brief Introduction and Overview. Research Report N 94.
Seminar fr Statistik. Eidgenssische Technische Hochschule (ETH). Zrich. Switzerland
Hansen, L. & T. Sargent [2007]: Robustness. Princeton, N.J. Princeton University Press.
Huber, P.J. [1964]: Robust estimation of a location parameter. Annals of Mathematical Statistics. Vol.35;
73-101.
Huber, P.J. [1981]: Robust Statistics. New York. Wiley & Sons.
nd
Judge, G.G. et al. [1985]: The Theory and Practice of Econometrics. 2 . Ed. New York. John Wiley &
Sons.
Kennedy, P. [2008]: A Guide to Econometrics. Oxford. Blackwell Publishing.
Koenker, R. [2005]: Quantile Regression. Cambridge. Cambridge University Press
Koenker, R. and K.F.Hallock [2001]: Quantile Regression. Journal of Economic Perspectives. Vol.15; 4;
143-156.
Koenker, R. and G.Bassett [1978]: Regression quantiles. Econometrica, 46 (1), 33-50.
Sosa Escudero, W. [2005]: Perspectivas y Avances Recientes en Regresin por Cuantiles. En:
Progresos en Econometra. Asociacin Argentina de Economa Poltica.
Spanos A. [1999]: Probability Theory and Statistical Inference. Econometric Society Monographs.
Cambridge .Cambridge University Press.
Urbisaia, H. y J.Brufman [2005]: La Reforma Tributaria. Implicancias sobre la Distribucin del Ingreso y
el Bienestar. Buenos Aires, Ediciones Cooperativas.
Paquetes Informticos: STATA 8.0 y E-VIEWS 7.1
10

Regresion Cuantílica 00

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Regresion Cuantílica 00

Uploaded by

Copyright:

Available Formats

ESTIMACION ROBUSTA

HERIBERTO L. URBISAIA y JUANA Z. BRUFMAN (UBA)

Se admite que el mecanismo es totalmente conocido salvo el parmetro

debe ser estimado utili-

valores influyentes ha sido formalizada por Belsley, Kuh y Welsch,

nes potencialmente influyentes en la estimacin MCC del Modelo de Regresin.

expresin que mide diferencias entre los coeficientes

estimados: i) con la totalidad de la informacin ;

ii) quitando la observacin i .

xi es la fila i -sima de la matriz X y hi = xi ( X X ) xi mide la influencia a priori de

k , originado por la supresin de

la informacin i , se deben calcular:

i -simo elemento diagonal

de la matriz de proyeccin MCC:

H es matriz idempotente; por tanto 0 hi 1 . Adems, la traza de H = K , por lo que

tamao promedio de un elemento diagonal es

3.- ESTIMADORES ROBUSTOS

yi xi utilizando diferentes ponderaciones, segn la magnitud del error. 3.

wi = 1 , i ; en este caso el estimador minimiza la

suma de errores absolutos; el estimador se denomina Desviacin Absoluta Mnima:

iii) Aplicando un esquema

similar al anterior, pero con valores wi decrecientes hacia cero si

alcance un valor arbitrario d , wi se tomar =0. Esta opcin implica

desechar observaciones que generen errores absolutos mayores que d .

Estimadores Lp : Resultan de minimizar la funcin

yi xi ; es decir, la suma de errores abso-

Estimadores L: Son combinaciones lineales de estadsticos de orden muestrales.

Y , con funcin de distribucin F ( y ) = P (Y y ) , se

( 0 < < 1) , como el menor y

que satisface la relacin

n , la funcin de distribucin emprica tradicional vie-

Si se dispone de una muestra aleatoria de tamao

qn ( ) = arg min (Yi )

se denomina funcin de chequeo (check function) que pondera asimtri-

camente valores positivos y negativos.

0.25q% ( 0.25 ) + 0.50q% ( 0.50 ) + 0.25q% ( 0.75 )

Las observaciones ordenadas de la muestra aleatoria

( y1 , y2 ,..., yn ) se indican como:

y(1) y( 2) ... y( n) . Entonces y(i ) , i = 1,2,..., n , se denomina estadstico de orden i

4.- REGRESIN POR CUANTILES REGRESIN CUANTLICA

yi = xi + i , donde i es el error correspondiente a la observacin i , resulta

(estimador MAD) minimiza

xi sobre el valor medio condicional de

se intenta determinar la incidencia de las variables explicativas

En el grafico adjunto se ha representado para dos valores de

Q para = 0.05 y = 0.95 .

Como puede observarse, las pendientes dadas por los coeficientes

resultan crecientes con

estaramos en el caso homocedstico.

6.- UNA APLICACIN AL CLCULO DE ELASTICIDADES DEL GASTO

plica que su valor es ms o menos cercano al de saciedad: la elasticidad sufre un aplanamiento ms

Aliment. B.Alcoh Cigarril. Indumen Viviend

Regresin Cuantlica 50th

Proporcin del Gasto destinado a Alimentos

Curva de Engel Regresin Cuantlica

Regresi n Cuantlica 10th

Regresin Cuantlica 50th

Regresi n Cua ntl ica 10th

Log Ingreso Per Cpi ta

Curva de Engel Regresin Cuantlica

Curva de Engel Regresin Cuantlica

(pendientes) de cada una de las regresiones, se obtuvieron:

You might also like