Professional Documents
Culture Documents
Facultad de Economa
Departamento de Macro-Microeconoma
MODELOS Y MTODOS
MICROECONOMTRICOS
TESIS DE MAESTRA
A mi tutora, a mis padres, a todos los que me ayudaron a realizar este trabajo.
2
ndice
3
4.2. Truncamiento........................................................................................................ 52
4.2.2. El modelo de regresin truncado, especificacin y estimacin .... 54
4.3. Datos censurados................................................................................................ 55
4.3.1. Modelo de regresin censurada: Anlisis Tobit .................................. 56
4.3.2 El modelo de regresin censurada, el problema de la estimacin.. 57
4.4. Validacin y contrastes de hiptesis ............................................................. 58
4.5. Modelos censurados y truncados, un ejemplo didctico......................... 58
4.5.1. Anlisis del modelo truncado ................................................................... 59
4.5.2. Anlisis del modelo censurado ................................................................ 62
Conclusiones ....................................................... 65
Recomendaciones ............................................... 67
Bibliografa utilizada ............................................ 68
Anexos .................................................................. 70
4
Introduccin general y objetivos
La Economa, como ciencia ligada al estudio de la forma en que los agentes
utilizan los recursos escasos, est sujeta a continuos procesos de decisin entre
las diferentes alternativas que se presentan, tanto a nivel macro como
microeconmico. Es por eso que una de las tareas ms importantes para los
economistas es la bsqueda de herramientas que permitan dar un carcter
objetivo al proceso de toma de decisiones.
5
El tercer captulo se dedica a los modelos multinomiales o de eleccin mltiple. En
l se presenta por primera vez el enfoque de variable latente, idea importante
dentro del anlisis microeconomtrico. Adems de los aspectos metodolgicos, se
efecta un ejemplo con fines didcticos.
6
1. Captulo Introductorio
7
tcnica de estimacin de referencia es el mtodo de Mxima Verosimilitud. La
Microeconometra se ocupa tambin de los diagnsticos que permiten validar los
resultados del modelo y de los supuestos establecidos en su fundamentacin
terica. La parte de la Econometra que estudia los problemas tericos inherentes
a este tipo de modelos se denomina Mtodos Microeconomtricos.
1.2. Antecedentes
8
economa laboral, economa de la fecundidad, pensiones y otras muchas
situaciones.
En 1970 Theil generaliz los modelos al caso en que los agentes se enfrentasen a
ms de dos alternativas en su decisin surgiendo as los modelos de eleccin
mltiples. Estos modelos requieren un tratamiento especfico, su objetivo no es
tanto la determinacin del comportamiento medio de la poblacin sino la obtencin
9
del valor de la probabilidad de que el individuo adopte una eleccin determinada
segn el valor de las variables explicativas.
Los modelos censurados son modelos hbridos que anan de cierta forma las
caractersticas de los modelos dicotmicos junto con los modelos lineales, la
variable dependiente en este caso es de tipo mixto, presenta valores de variable
discreta y continua a la vez. Dentro de una gran variedad los ms utilizados son
los llamados modelos Tobit donde se presentan procesos de eleccin secuencial.
Los modelos de panel de datos tienen una doble vertiente de corte transversal y
de informacin temporal. Permiten analizar las variaciones en el tiempo de las
decisiones de los individuos segn van cambiando sus condiciones iniciales,
considerando el carcter dinmico de los modelos. Posibilitan captar la trayectoria
dinmica de los individuos, con lo que es posible obtener resultados superiores a
los modelos que slo consideran la vertiente transversal.
10
Captulo 2
11
Ui0 = U i0 + i0 = 0 + X i0 '
+ i0
( 2.1 )
U i1 = U i1 + i1 = 1 + X i1 '
+ i1
1 si U i1 > U i 0
Yi = ( 2.2 ).
0 si U i0 > U i1
12
2.2. El modelo de probabilidad lineal (MPL)
+ i = [1 X 2i X 3i .... X ki ][ ] + i
'
Yi = X i '
1 2 3 ..... ki ( 2.5 )
E(Yi /X i ) = X i '
( 2.6 ).
E(Yi / X i ) = X i '
= Pi = P(Yi = 1) ( 2.8 ).
P(Yi = 1) = X i '
( 2.9 ).
+ i = [1X 2i X 3i .... X ki ][ ] + i
'
Yi = X i '
1 2 3 ..... k ,
13
puede acarrear diferentes consecuencias negativas debido a algunos problemas
especiales que ste posee y que se enumeran a continuacin.
i = Yi Xi '
( 2.10 )
y como consecuencia
i = 1 X i '
si Yi = 1 , lo cual ocurre con probabilidad Pi ,
i = X i '
si Yi = 0 , lo cual ocurre con probabilidad ( 1 Pi ).
i Probabilidad
Xi '
1 Pi
1 Xi '
Pi
Ahora:
1
El resultado es una consecuencia del teorema central del lmite, su prueba aparece en [12] E.
Malinvaud, Statistical Methods of Econometrics, Rand Mc Nally & Company, Chicago 1966.
14
V( i ) = E( i E( i )) 2 = E( i ) , dado que se supone que E ( i ) = 0 ,
2
y se obtiene que
V( i ) = E( i ) = ( X i ' )2 (1 Pi ) + (1 X i ' ) 2 Pi
2
( 2.11 ).
V( i ) = X i (1 X i ) = Pi (1 Pi )
' '
Por tanto, la varianza del trmino de error depende de X i con lo que se presenta
un problema de heteroscedasticidad. La heteroscedasticidad provoca que los
estimadores de MCO aunque son insesgados, no sean eficientes. Este problema
no es insoluble, una posible solucin la constituye la tcnica de Mnimos
Cuadrados Ponderados. Es posible transformar la ecuacin ( 2.5 ) dividiendo
ambos lados del modelo por
E(Yi / X i ) [1 E(Yi / X i )] = Pi (1 Pi ) = wi
Yi X 2i X ki
= 1
+ 2 + ... + k + i ( 2.12 ).
wi wi wi wi wi
15
Pi estimado es cero o uno ya que en cualquiera de los casos wi = 0 y no podr
usarse para dividir las ecuaciones en la etapa 2. El eliminar las observaciones
donde se manifiesta esta situacin, ocasiona una prdida de grados de libertad,
por lo que los estimadores obtenidos podran no ser robustos. Este problema es
especialmente grave si el tamao de la muestra no es grande.
3) No cumplimiento de 0 E(Yi / X i ) 1
16
explicar esta relacin, el resultado obtenido considerar que un aumento unitario
de la renta tendr el mismo efecto marginal sobre la probabilidad de que la familia
sea propietaria, cualquiera sea el nivel de renta inicial de la misma. Este resultado
carece de sentido. Lo lgico es pensar que si el nivel de renta es muy bajo, un
aumento unitario de la renta no provocar un aumento significativo en la
probabilidad de que la familia sea propietaria. As mismo, un aumento unitario de
la renta cuando el nivel de renta es muy alto no debe provocar aumentos
significativos en la probabilidad de que la familia sea propietaria.
17
1) El modelo Logit:
'
e Zi e Xi
P(Yi = 1) = ( Z i ) = = ( X i
'
) = ' .
1 + e Zi 1 + e Xi
2) El modelo Probit:
' '
Zi Zi s2 Xi Xi s2
1 1
P(Yi = 1) = (Zi ) = ( s )ds = e 2
ds = ( s )ds = e 2
ds .
2 2
-Zi Xi '
P(Yi = 1) = (Zi ) = e-e = ( X i ' ) = e e
.
18
2.3.1. Especificacin de los modelos
1) Modelo Logit
1
Yi = 1 + 2 X 2 i +.....+
+ i ( 2.13 ),
1+ e ( k X ki )
1
P(Yi = 1) = E(Yi / X i ) = 1 + 2 X 2 i +.....+
( 2.14 ).
1+ e ( k X ki )
2) Modelo Probit
Zi s2
1
Yi = e 2
ds + i ( 2.15 ).
2
Zi s2
1
P(Yi = 1) = E(Yi /X i ) = e 2
ds ( 2.16 ).
2
( 1+ 2 X 2 i +...+ k X ki )
Yi = e e
+ i ( 2.17 ).
19
( 1 + 2 X 2 i + ... + k X ki )
P(Yi = 1) = E(Yi / X i ) = e e
( 2.18 ).
Los modelos Logit, Probit y Valor Extremo son no lineales en los parmetros. El
mtodo de estimacin ms utilizado para los mismos es el mtodo de mxima
verosimilitud. Si se tiene una muestra de tamao I (i = 1...I ) y bajo la hiptesis de
que las observaciones Yi son independientes, entonces se obtiene la siguiente
relacin
I
P(Y1 , Y2 ,...., YI ) = P(Y1 )P(Y2 )....P(Yi )....P(YI ) = P(Yi ) ,
i =1
I I
I Yi (1 Yi )
L= P(Yi ) = Pi i=1 (1 Pi ) i=1 ( 2.19 ).
i =1
I I
ln( L) = Yi ln Pi + (1 Yi ) ln(1 Pi ) ( 2.20 ).
i =1 i =1
20
2.4. Medidas de la bondad del ajuste en los modelos dicotmicos
ln LSR
ICV = R 2 McFadden = 1 ( 2.21 ).
ln LCR
Este estadstico toma valores entre cero y uno. Si todos los estimadores de las
pendientes son cero (modelo imperfecto), entonces el ICV toma el valor
cero porque las funciones de verosimilitud LCR y LSR seran iguales. En los
modelos habituales el ICV nunca llega a valer uno (lo cul sera indicio de un
ajuste perfecto ya que ello ocurre slo si LSR = 1 ), aunque es posible que
llegue a acercarse a esta cifra.
Fuera de estos valores no est tan clara la interpretacin del R 2 propuesto por Mc
Fadden. Algunos autores sealan que lo que mide ste, es el porcentaje de
incertidumbre en los datos explicado por el modelo.
#L
LR = 2 ln !! CR = 2(ln LCR - ln LSR ) ( 2.22 )
" LSR
21
Yi = 1 . Luego, es posible contrastar dichos pronsticos con los verdaderos valores
de Yi con el objetivo de determinar que tan bien el modelo explica la realidad a
partir del clculo del coeficiente
nmero de aciertos
Pseudo R 2 de prediccin = ( 2.23 ).
total de predicciones
= [1X 2i X 3i .... X ki ][ ]
'
P (Yi = 1) = F ( X i ' ) = X i '
1 2 3 ..... ki , por tanto
%F ( X i ' ) % ( X i ' )
= = k ( 2.24 ).
%X ki %X ki
22
2.5.2. Interpretacin del modelo Logit
respecto a X ki ser:
'
% (Xi ') e Xi
= k = &(Xi ' ) k ( 2.25 ),
%X ki
'
(1 + e X i ) 2
% (Xi ')
%X ki &( Xi ' )
= k
= k
( 2.26 )
% ( Xi ' ) &( Xi ' ) k +1 k +1
%X ( k +1)i
23
La interpretacin de los parmetros se efecta a travs de las derivadas parciales,
si el modelo es derivable respecto a X ki entonces:
% (Xi ')
= (Xi ') k ( 2.27 ),
%X ki
Aqu y al igual que en el caso del modelo Logit, el coeficiente k indica el sentido
del cambio en la probabilidad de elegir la opcin 1 ante un incremento marginal en
la variable X ki . No obstante, la magnitud del cambio depende, adems del valor
de k , del valor de la funcin de densidad evaluada en el ndice, o sea ( X i ' ) .
% (Xi ')
%X ki (Xi ')
= k
= k
( 2.28 ).
% (Xi ') (Xi ') k +1 k +1
%X ( k +1) i
-Zi Xi '
P(Yi = 1) = (Zi ) = e-e = ( X i ' ) = e e
.
( 1+ 2 X 2 i +...+ X )
% ( X i ' ) % (e e k ki
)
= = '( X i ' ) k ( 2.29 )
%X ki %X ki
24
Aqu y al igual que en los casos anteriores, el signo del coeficiente k indica el
sentido del cambio en la probabilidad de elegir la opcin 1 ante un incremento
marginal en la variable X ki y la magnitud del cambio depende, adems del valor
de k , del valor de la funcin de densidad evaluada en el ndice, o sea ' ( X i ' ) .
% (Xi ')
%X ki '( X i ' )
= k
= k
( 2.30 ).
% ( X i ' ) '( X i ' ) k +1 k +1
%X ( k +1)i
En general, los modelos Logit, Probit y Valor Extremo tienden a arrojar resultados
similares, las estimaciones de los parmetros no son directamente comparables,
hecho que se deduce implcitamente de los acpites anteriores. La metodologa
que se propone, para elegir entre los tres modelos, es realizar las tres
estimaciones en cada caso particular y luego comparar los resultados obtenidos
en base a la funcin de verosimilitud o los estadsticos de Akaike, Schwarz o
Hannan Quinn con vistas a determinar cul estimacin es ms apropiada para el
caso analizado.
1) Omisin de variables:
2) Heteroscedasticidad:
25
la hiptesis nula de homoscedasticidad frente a heteroscedasticidad a travs del
siguiente patrn:
'
V( i ) = e 2( Si ( 2.31 )
donde:
^ ^ ^ ^
' ' '
Yi Pi f (Xi ) ' f (Xi )( X i ) '
= Xi *
+ Si **
( 2.32 ).
^ ^ ^ ^
^ ^
Pi (1 Pi ) Pi (1 P i )
Pi (1 Pi )
2
Los datos aparecen contenidos en el fichero Pract_3 anexo al libro Microeconometra y decisin
[ 4] de los autores Bernard Cabrer Borrs, Amparo Sancho Prez y Guadalupe Serrano Domingo.
26
La concesin o no del crdito por parte de los bancos es recogida a travs de la
variable dicotmica PRESTAM que toma el valor 1 si al hogar le fue concedido el
prstamo y 0 si no.
Las variables que se supone explican la decisin de los bancos son las siguientes:
27
el cual, como se sabe, es homoscedstico. Adems, es importante observar que la
regresin por MCO del modelo dado por ( 2.33 ) es una regresin a travs del
origen.
En este proceso hay una prdida de 234 observaciones de una etapa a otra,
correspondientes a hogares que en la primera regresin su probabilidad estimada
de recibir prstamos se encontraba fuera del rango de 0 a 1 . La salida en el
programa Eviews 3.1 a la estimacin por mnimos cuadrados del modelo ( 2.33 ) es
la siguiente:
Tabla 1
Dependent Variable: PRESTAM/WS
Method: Least Squares
Date: 11/20/05 Time: 14:10
Sample: 1 1000
Included observations: 766
Excluded observations: 234
Variable Coefficient Std. Error t-Statistic Prob.
1/WS -0.036714 0.022902 -1.603079 0.1093
RENTA/WS 0.014851 0.001895 7.837509 0.0000
PARADO/WS -0.059668 0.016204 -3.682241 0.0002
VIVPROP/WS 0.024771 0.012842 1.928879 0.0541
R-squared 0.046296 Mean dependent var 0.301720
Adjusted R-squared 0.042541 S.D. dependent var 0.960961
S.E. of regression 0.940298 Akaike info criterion 2.719969
Sum squared resid 673.7307 Schwarz criterion 2.744205
Log likelihood -1037.748 Durbin-Watson stat 2.103730
Fuente: Elaboracin propia.
(La serie WS es la serie de los trminos wi ).
En principio se puede constatar que las expectativas a priori con respecto a los
signos de los coeficientes fueron satisfechas. En la estimacin obtenida
^ ^ ^ ^
^
PRESTAM i = -0.036714 + 0.014851*RENTAi + -0.059668* PARADOi + 0.024771*VIVPROPi
28
normalidad de las perturbaciones. El resultado es consistente con los
planteamientos tericos expuestos.
Dado que para muestras grandes es posible efectuar las pruebas de inferencia
habituales, (resultado mencionado previamente en el epgrafe ( 2.2.1 )), como se
trabaj con una muestra de 766 observaciones, en este caso es posible contrastar
la significatividad de los coeficientes individuales a partir del estadstico t .
# ^
se ! i
"
t-Student con n k grados de libertad. En este caso 766 4 = 762 , grados de
libertad. El valor crtico t / 2 (762) para = 0.05 es aproximadamente 1,96 , por tanto
# ^
!
se debe verificar si se cumple que ! t /2 < i
<t /2 , o lo que es lo mismo
se !#
^
!
! i
" "
# ^
!
! 1, 96 < i
< 1,96 .
! # ^
! se ! i
" "
Para 2 :
2
= 7.837509 ) (-1,96 ; 1,96) , por lo que se rechaza la hiptesis nula 2 =0.
# ^
se ! 2
"
Para 3 :
3
= -3.682241 ) (-1,96 ; 1,96) , por lo que se rechaza la hiptesis nula 3 = 0.
# ^
se ! 3
"
Para 4 :
# ^
se ! 4
"
En resumen, mediante el anlisis anterior se percibe que las variables RENTA y
PARADO explican el regresando y la variable VIVPROP no explica el regresando.
29
(A estas conclusiones se poda arribar a partir de la comparacin de los p valores
de la Tabla1 con el nivel de prefijado).
ln LSR
ICV = R 2 McFadden = 1 .
ln LCR
ln LSR -1037.748
ICV = R 2 McFadden = 1 =1 = 0.04 .
ln LCR -1080.396
#L
LR = 2 ln !! CR = 2(ln LCR - ln LSR ) .
" LSR
Como ya se haba visto, ln LSR = -1037.748 y ln LCR = -1080.396 por tanto
30
3) Proporcin de predicciones correctas calculadas a partir del
Pseudo R 2 de prediccin:
678
Pseudo R 2 de prediccin = = 0.885 ,
766
Adems, otros estadsticos que sirven para comparar este modelo con los
restantes a analizar, son: la funcin de verosimilitud estimada (Log Likelihood), el
estadstico de Akaike (AIC) y el estadstico propuesto por Schwarz (Ver anexo 1).
Los resultados de dichos estadsticos para este caso aparecen en la siguiente
tabla:
Tabla 2
Estimacin Probit:
Zi s2
1
PRESTAM i = e 2
ds + i = ( 1 + 2 RENTAi + 3 PARADOi + VIVPROPi ) + i
4
2
( 2.34 ).
31
Los resultados obtenidos de la estimacin por mxima verosimilitud del modelo
anterior mediante el programa Eviews 3.1 son los siguientes:
Tabla 3
Dependent Variable: PRESTAM
Method: ML - Binary Probit
Date: 11/21/05 Time: 14:38
Sample: 1 1000
Included observations: 1000
Convergence achieved after 6 iterations
Covariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C -2.236327 0.227841 -9.815287 0.0000
RENTA 0.077441 0.009810 7.894422 0.0000
PARADO -0.454440 0.134781 -3.371684 0.0007
VIVPROP 0.263338 0.207497 1.269117 0.2044
Mean dependent var 0.086000 S.D. dependent var 0.280504
S.E. of regression 0.253917 Akaike info criterion 0.470024
Sum squared resid 64.21618 Schwarz criterion 0.489655
Log likelihood -231.0119 Hannan-Quinn criter. 0.477485
Restr. log likelihood -293.1843 Avg. log likelihood -0.231012
LR statistic (3 df) 124.3447 McFadden R-squared 0.212059
Probability(LR stat) 0.000000
Obs with Dep=0 914 Total obs 1000
Obs with Dep=1 86
Fuente: Elaboracin propia.
^
PRESTAM i = ( -2.236327 + 0.077441* RENTAi + -0.454440*PARADOi + 0.263338*VIVPROPi )
Estimacin Logit:
1
PRESTAM i = 1+ 2 RENTAi + 3 PARADOi + 4VIVPROPi )
+ i ( 2.35 ).
1+ e (
Los resultados de la estimacin por mxima verosimilitud del modelo dado por
( 2.35 ) mediante el programa Eviews 3.1 son los siguientes:
32
Tabla 4
Dependent Variable: PRESTAM
Method: ML - Binary Logit
Date: 11/21/05 Time: 15:33
Sample: 1 1000
Included observations: 1000
Convergence achieved after 7 iterations
Covariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C -4.214824 0.516033 -8.167736 0.0000
RENTA 0.142950 0.018250 7.832665 0.0000
PARADO -0.969263 0.270492 -3.583334 0.0003
VIVPROP 0.719559 0.488548 1.472853 0.1408
Mean dependent var 0.086000 S.D. dependent var 0.280504
S.E. of regression 0.253246 Akaike info criterion 0.468089
Sum squared resid 63.87690 Schwarz criterion 0.487720
Log likelihood -230.0446 Hannan-Quinn criter. 0.475550
Restr. log likelihood -293.1843 Avg. log likelihood -0.230045
LR statistic (3 df) 126.2794 McFadden R-squared 0.215358
Probability(LR stat) 0.000000
Obs with Dep=0 914 Total obs 1000
Obs with Dep=1 86
Fuente: Elaboracin propia.
En principio se observa que los signos de los parmetros estimados satisfacen las
^ ^
expectativas a priori. En la estimacin obtenida 1 = -4.214824 , 2 = 0.142950 ,
^ ^
3 =-0.969263 y 4 = 0.719559 .
^ 1
PRESTAM i = (-4.214824 + 0.142950*RENTAi + -0.969263*PARADOi + 0.719559*VIVPROPi )
1+ e
33
Tabla 5
Dependent Variable: PRESTAM
Method: ML - Binary Extreme Value
Date: 11/21/05 Time: 15:46
Sample: 1 1000
Included observations: 1000
Convergence achieved after 5 iterations
Covariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C -1.524288 0.158327 -9.627459 0.0000
RENTA 0.063026 0.008406 7.497409 0.0000
PARADO -0.309932 0.101934 -3.040517 0.0024
VIVPROP 0.136117 0.134893 1.009076 0.3129
Mean dependent var 0.086000 S.D. dependent var 0.280504
S.E. of regression 0.254942 Akaike info criterion 0.473116
Sum squared resid 64.73560 Schwarz criterion 0.492747
Log likelihood -232.5579 Hannan-Quinn criter. 0.480577
Restr. Log likelihood -293.1843 Avg. log likelihood -0.232558
LR statistic (3 df) 121.2528 McFadden R-squared 0.206786
Probability(LR stat) 0.000000
Obs with Dep=0 914 Total obs 1000
Obs with Dep=1 86
Fuente: Elaboracin propia.
Tabla 6
Modelo Log likelihood Akaike info Schwarz Hannan-
criterion criterion Quinn criter.
Probit -231.0119 0.470024 0.489655 0.477485
Logit -230.0446 0.468089 0.487720 0.475550
Valor -232.5579 0.473116 0.492747 0.480577
Extremo
Fuente: Elaboracin propia.
34
Evidentemente, los resultados de las tres estimaciones son muy similares, pero
en el caso del modelo Logit la funcin de verosimilitud estimada es ligeramente
superior y los estadsticos de Akaike, Schwarz y Hannan Quinn son ligeramente
menores, as que el modelo Logit es el ms apropiado para el caso en estudio.
Tabla 7
Modelo R 2 Mc Fadden LR statistic (3 df) Pseudo R 2 de
prediccin.
Se puede observar el alto poder predictivo de los tres modelos, en especial del
modelo Logit, que en el 91.5% de los casos proporciona un pronstico acertado
(ver el Pseudo R 2 de prediccin). Adems, los estadsticos LR obtenidos en cada
una de las tres estimaciones satisfacen la desigualdad LR > $ 0.05
2
(3) = 7.81473 lo
cual lleva a rechazar la hiptesis nula H 0 : 2 = 3 = 4 = 0 , indicando que los
modelos estimados son significativos.
Cuando se analizan las medidas de bondad del ajuste de las tres estimaciones
realizadas a travs de los modelos Probit, Logit y Valor extremo con las del MPL,
salta a las claras la desventaja de este ltimo.
35
Se haba comentado tambin que las estimaciones de los parmetros i
obtenidas en los modelos MPL, Logit, Probit y Valor extremo no son directamente
comparables, ya que poseen diferente interpretacin. En el caso del MPL el
coeficiente K mide el incremento en la probabilidad ante un incremento marginal
de la variable X k . Sin embargo en los modelos Logit, Probit y Valor Extremo, el
incremento en la probabilidad depende tambin de la funcin de densidad
correspondiente, evaluada en el valor inicial del ndice. Ms especficamente, en
%P( X i ' )
cada caso = f ( X i ' ) k , donde f es la funcin de densidad logstica,
%X ki
Normal estandarizada o de valor extremo respectivamente. Con vistas a efectuar
comparaciones entre los parmetros obtenidos, cuando las muestras son grandes,
suele analizarse el efecto que un incremento marginal de la variable explicativa
correspondiente al parmetro, provoca sobre la probabilidad de eleccin del
individuo medio (el individuo medio se considera aquel cuyos valores de cada una
de sus variables explicativas son la media de dicha variable explicativa en la
muestra analizada).
# ^
se ! i
"
Distribucin Normal (0,1). El valor crtico N / 2 para = 0.05 es aproximadamente
1,96 , por tanto en cada caso se debe verificar si se cumple que
# ^
# ^
! !
! N /2 < i
<N /2 , o lo que es lo mismo ! 1,96 < i
< 1,96 .
se #!
!
^
! # ^
! i ! se ! i
" " " "
Para 2 :
36
^
2
= 7.832665 ) (-1,96 ; 1, 96) , por lo que se rechaza la hiptesis nula 2 =0.
# ^
se ! 2
"
Para 3 :
3
= -3.583334 ) (-1,96 ; 1, 96) , por lo que se rechaza la hiptesis nula 3 = 0.
# ^
se ! 3
"
Para 4 :
^
4
= 1.472853 (-1,96 ; 1,96) , por lo que se acepta la hiptesis nula 4 = 0 .
# ^
se ! 4
"
En resumen mediante el anlisis anterior y al igual que ocurri en el MPL
ponderado, se percibe que en el modelo Logit las variables RENTA y PARADO
explican el regresando y la variable VIVPROP no explica el regresando (al mismo
resultado se arriba en el resto de los modelos).
Tabla 8 .
Dependent Variable: PRESTAM
Method: ML - Binary Logit
Date: 11/23/05 Time: 16:58
Sample: 1 1000
Included observations: 1000
Convergence achieved after 6 iterations
Covariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C -3.661018 0.320030 -11.43961 0.0000
RENTA 0.150178 0.017821 8.426907 0.0000
PARADO -0.995537 0.269990 -3.687314 0.0002
Mean dependent var 0.086000 S.D. dependent var 0.280504
S.E. of regression 0.253893 Akaike info criterion 0.468632
Sum squared resid 64.26825 Schwarz criterion 0.483355
Log likelihood -231.3159 Hannan-Quinn criter. 0.474228
Restr. log likelihood -293.1843 Avg. log likelihood -0.231316
LR statistic (2 df) 123.7367 McFadden R-squared 0.211022
Probability(LR stat) 0.000000
Obs with Dep=0 914 Total obs 1000
Obs with Dep=1 86
Fuente: Elaboracin propia.
37
^ ^ ^
En la estimacin obtenida 1 = -3.661018 , 2 = 0.150178 y 3 =-0.995537 .
^ 1
PRESTAM i = (-3.661018 + 0.150178*RENTAi + -0.995537*PARADOi )
.
1+ e
2) Heteroscedasticidad.
Grfico 1
1.0
0.8
ABS(RESID)
0.6
0.4
0.2
0.0
0 10 20 30 40
RENTA
Este parece sugerir que a medida que la renta aumenta, la varianza de los
residuos tambin. Se puede intentar realizar el test de Davidson y Mc Kinnon bajo
la sospecha de que la variable renta causa la heteroscedasticidad.
Para realizar este test, es necesario efectuar la regresin por mnimos cuadrados
ordinarios de la siguiente ecuacin auxiliar:
38
^ ^ ^ ^
' ' '
Yi Pi f (Xi ) f (Xi ) f (Xi )
= *
1 + *
2 ( RENTA)i + *
3 ( PARADO)i +
^ ^ ^ ^ ^ ^
^ ^
Pi (1 Pi ) Pi (1 Pi ) Pi (1 Pi )
Pi (1 Pi )
^ ^
' '
f (Xi )( X i )
+ **
( RENTA)i
^ ^
Pi (1 Pi )
( 2.37 ).
^
Donde el trmino X i ' se refiere al ndice estimado de la regresin logstica, es
decir, el producto vectorial del vector de variables explicativas del individuo por el
^
vector de coeficientes estimados mediante la regresin, f ( X i ' ) se refiere a la
funcin de densidad logstica evaluada en dicho ndice y Yi se est empleando en
lugar de PRESTAM i . La suma explicada de cuadrados de la regresin anterior
bajo la hiptesis nula de homoscedasticidad, se distribuye asintticamente como
una $ 2 con un grado de libertad (en este caso uno, ya que es el nmero de
variables que se supone generan la heteroscedasticidad). Los resultados de la
regresin por mnimos cuadrados del modelo dado por ( 2.37 ) son los siguientes:
Tabla 9
Dependent Variable: ESTANDARES
Method: Least Squares
Date: 12/09/05 Time: 19:09
Sample: 1 1000
Included observations: 1000
Variable Coefficient Std. Error t-Statistic Prob.
FAC -0.158228 0.466842 -0.338934 0.7347
FAC*RENTA 0.004155 0.020103 0.206691 0.8363
FAC*PARADO -0.078180 0.320043 -0.244280 0.8071
FAC*INDEXLOGI*RE -0.007014 0.014880 -0.471376 0.6375
NTA
R-squared 0.000222 Mean dependent var 0.001136
Adjusted R-squared -0.002790 S.D. dependent var 1.012385
S.E. of regression 1.013796 Akaike info criterion 2.869272
Sum squared resid 1023.671 Schwarz criterion 2.888903
Log likelihood -1430.636 Durbin-Watson stat 2.032836
Fuente: Elaboracin propia.
39
^
Yi Pi
Donde el trmino ESTANDARES se refiere a , el trmino FAC se
^ ^
Pi (1 Pi )
^
'
f (Xi )
refiere a y el trmino FAC*INDEXLOGI*RENTA se refiere a
^ ^
Pi (1 Pi )
^ ^
' '
f (Xi )( X i )
( RENTA)i .
^ ^
Pi (1 P i )
40
Captulo 3
Modelo ordenado jerarquizado: Este tipo de modelo nace cuando las decisiones
del individuo se pueden jerarquizar. En l, se plantea la necesidad de estar en
posesin o de cumplir una determinada condicin para aspirar a otra superior. Un
ejemplo puede ser el de los modelos que explican el nivel de instruccin de los
trabajadores, educacin primaria, secundaria o superior en funcin de un conjunto
de caractersticas socioeconmicas del individuo y su familia.
41
3.2. Interpretacin econmica del proceso de eleccin mltiple
En sentido general el enfoque terico de estos modelos se fundamenta en la
teora de la utilidad del agente econmico. Si se supone que el individuo decide
entre M posibles alternativas la variable dependiente suele construirse
asignndole el valor 0 si el individuo elige la primera alternativa, 1 si elige la
segunda, y as sucesivamente hasta el nmero de categoras o alternativas menos
uno. Los trminos en los que se plantea la situacin son los siguientes:
U i1 = U i1 + i1 = 1 + X , + X ( + i1
*
i1
' ** '
i 1
... ( 3.1 )
, ' + X i**( m + im
'
U im = U im + im = m + X im *
...
U i ( M 1) = U i ( M 1) + i ( M 1) = ( M 1) + X i*( M 1), ' + X i** (( ( M 1) )' + i ( M 1)
0 si U i 0 > U im /m . 0
-1 si U > U
- i1 im /m . 1
Yi = ( 3.2 )
- ...
-( M 1) si U i ( M 1) > U im /m . ( M 1)
42
eleccin, que es el enfoque de la variable latente. En l, se supone la existencia
de una variable no observable o latente Yi * no limitada en su rango de variacin,
que depende del vector de caractersticas propias de las decisiones X i* y de las
caractersticas X i** del individuo i . Sobre esta variable latente se aplica una regla
de observabilidad que genera las alternativas que se observan en la realidad. De
esta forma, los valores de la variable real Yi se fundamentan de acuerdo al
siguiente esquema:
0 si Yi*
c1
-
-1 si c1 < Yi c2
*
Yi = ( 3.3 )
- ...
-( M 1) si Y * > c
i (M 1)
Yi* = X i '
+ i ( 3.4 ).
Donde
No resulta difcil determinar que ahora las probabilidades de eleccin del individuo
vendrn dadas por:
43
3.3.1. Estimacin Mximo -Verosmil del Modelo de Respuesta
Mltiple Ordenado
I
P (Y1Y2 ...Yi ...YI ) = P (Yi ) = P (Yi = 0) P (Yi = 1) ... P (Yi = M 1) ,
i =1 i {i / Yi = 0} i {i / Yi =1} i {i / Yi = ( M 1)}
I
L= P (Yi ) = P (Yi = 0) P (Yi = 1) ... P (Yi = M 1) ( 3.6 ).
i =1 i {i / Yi = 0} i {i / Yi =1} i {i / Yi = ( M 1)}
ln L = ln( P(Yi = 0)) + ln( P(Yi = 1)) + ... + ln( P(Yi = M 1))
i {i / Yi =0} i {i / Yi =1} i {i / Yi = ( M 1)}
( 3.7 ).
Sustituyendo ahora las diferentes probabilidades P(Yi = ...) por sus respectivas
expresiones segn ( 3.5 ) y determinando para la funcin F (.) su especificacin
(distribucin logstica, normal o de valor extremo), es posible, aplicando algoritmos
de optimizacin, estimar los parmetros del modelo, en cualquiera de los casos.
Los estimadores obtenidos por el proceso de mxima verosimilitud son
consistentes y asintticamente eficientes. Igualmente son asintticamente
normales, con lo que cuando el tamao de la muestra es grande, el contraste de
significatividad de los parmetros puede efectuarse a travs de una distribucin
Normal. En este caso, todos los tests propuestos para estudiar la bondad del
ajuste en los modelos de respuesta dicotmica, pueden ser utilizados para los
modelos ordenados.
44
%P(Yi = 0)
= f (c1 Xi ') k
%X ki
%P(Yi = 1)
= f (c2 X i ' ) + f (c1 Xi ') k
%X ki
%P(Yi = 2)
= f (c3 X i ' ) + f (c2 Xi ') k ( 3.8 )
%X ki
...
%P(Yi = ( M 1))
= f (c( M 1) Xi ') k
%X ki
TV: Nmero de televisores en el hogar. Puede tomar los valores uno, dos o
tres para aquellas familias que posean hasta tres o ms televisores.
3
Los datos aparecen contenidos en el fichero ejer6-2 anexo al libro Microeconometra y decisin
[ 4] de los autores Bernard Cabrer Borrs, Amparo Sancho Prez y Guadalupe Serrano Domingo.
45
NI: Nivel de instruccin del cabeza de familia, codificado en cuatro
niveles, 1 - Educacin bsica, 2 - Bachiller Superior, 3 - Universitaria
media, 4 - Universitaria Superior.
Donde
1 si TVi * c1
-
TV = 2 si c1 < TVi* c2 ( 3.10 ).
-
3 si TVi * > c2
Ahora c1 y c2 son dos nuevos parmetros a estimar que constituyen los valores
umbrales o barreras.
P(TVi = 1) = F ( c1 ( IFi 1 + NI i 2 ))
46
P(TVi = 3) = 1 F ( c2 ( IFi 1 + NI i 2 )) ,
ln L = ( ln F ( c1 ( IFi 1 + NI i 2 )) )
i {i / TVi =1}
+ ln F ( c2 ( IFi 1 + NI i 2 ) ) F ( c1 ( IFi 1 + NI i 2 ))
i {i / TVi = 2}
+ ln 1 F ( c2 ( IFi 1 + NI i 2 )) ( 3.12 )
i {i / TVi =3}
Tabla 10
Dependent Variable: TV
Method: ML - Ordered Probit
Date: 11/29/05 Time: 17:49
Sample: 1 940
Included observations: 940
Number of ordered indicator values: 3
Convergence achieved after 9 iterations
Covariance matrix computed using second derivatives
Coefficient Std. Error z-Statistic Prob.
IF 0.852461 0.066782 12.76488 0.0000
NI 0.517980 0.094179 5.499925 0.0000
Limit Points
LIMIT_2:C(3) 4.248920 0.281436 15.09729 0.0000
LIMIT_3:C(4) 12.75944 0.869698 14.67112 0.0000
Akaike info criterion 0.241968 Schwarz criterion 0.262589
Log likelihood -109.7252 Hannan-Quinn criter. 0.249829
Restr. log likelihood -898.4508 Avg. log likelihood -0.116729
LR statistic (2 df) 1577.451 LR index (Pseudo-R2) 0.877873
Probability(LR stat) 0.000000
Fuente: Elaboracin propia.
47
^ ^ ^ ^
En la estimacin obtenida 1 = 0.852461 , 2 = 517980 , c1 = 4.248920 y c2 = 12.75944 .
Tabla 11
Dependent Variable: TV
Method: ML - Ordered Logit
Date: 11/29/05 Time: 17:59
Sample: 1 940
Included observations: 940
Number of ordered indicator values: 3
Convergence achieved after 9 iterations
Covariance matrix computed using second derivatives
Coefficient Std. Error z-Statistic Prob.
IF 1.686776 0.152682 11.04765 0.0000
NI 0.820545 0.174598 4.699630 0.0000
Limit Points
LIMIT_2:C(3) 8.010554 0.625440 12.80788 0.0000
LIMIT_3:C(4) 24.75738 2.011020 12.31085 0.0000
Akaike info criterion 0.237367 Schwarz criterion 0.257988
Log likelihood -107.5627 Hannan-Quinn criter. 0.245228
Restr. log likelihood -898.4508 Avg. log likelihood -0.114428
LR statistic (2 df) 1581.776 LR index (Pseudo-R2) 0.880280
Probability(LR stat) 0.000000
Fuente: Elaboracin propia.
^ ^ ^
En la estimacin obtenida 1 = 1.686776 , 2 = 0.820545 , c1 = 8.010554 y
^
c2 = 24.75738 .
Tabla 12
48
Los resultados de las estimaciones son muy similares, pero en el caso del
modelo Logit, la funcin de verosimilitud estimada es ligeramente superior y los
estadsticos de Akaike, Schwarz y Hannan Quinn son ligeramente menores, as
que el modelo Logit resulta ms adecuado en este caso.
Tabla 13
prediccin.
TV * = 1.686776349*IF + 0.8205452656*NI
1
P(TV = 1) = (8.010553931 (1.686776349*IF + 0.8205452656*NI) )
1+ e
1 1
P(TV = 2) = ( 24.75737842 (1.686776349*IF + 0.8205452656*NI) ) (8.010553931 (1.686776349*IF + 0.8205452656*NI) )
1+ e 1+ e
1
P(TV = 3) = 1 ( 24.75737842 (1.686776349*IF + 0.8205452656*NI) )
( 3.13 )
1+ e
49
Si se desea conocer el valor de la variable latente y las probabilidades anteriores
para un hogar donde el nivel de instruccin del cabeza de familia sea el bsico y
de los ingresos familiares sean de 7 millones de pesetas anuales se debe
sustituir en las expresiones anteriores a NI por 1 y a IF por 7 . Obtenindose
que TV * = 1.686776* 7 + 0.820545 *1 =12.628 .
1
P (TV = 1) = (8.010553931 (1.686776349*7 + 0.8205452656*1) )
= 0.00978156781772
1+ e
1 1
P (TV = 2) = ( 24.75738 (1.686776 *7 + 0.820545*1) ) ( 8.010554 (1.686776 *7 + 0.820545*1) )
= 0.990213033762
1+ e 1+ e
1
P (TV = 3) = 1 ( 24.75737842 (1.686776349*7 + 0.8205452656*1) )
= 5.39842 *10 6 .
1+ e
1 # 1
1 ( 24.75737842 (1.686776349*7 + 0.8205452656*2) ) !1 ( 24.75737842 (1.686776349*7 + 0.8205452656*1) )
1+ e " 1+ e
50
Captulo 4
4. Modelos censurados y truncados
Algunos autores definen como modelos censurados a aquellos en los que los
valores inferiores a cierta cantidad son sustituidos por una cantidad fija (por
ejemplo cero), otros los definen como modelos en los que no se conocen algunos
valores del regresando. En general, los modelos censurados son aquellos en los
que los valores de la variable endgena superiores o inferiores a un determinado
valor no se conocen, es decir, estn sometidos a una barrera o lmite (por los que
son sustituidos). En el ejemplo previo, sobre el estudio de los niveles de ingreso, si
los datos por debajo del nivel del umbral de pobreza aparecen en la muestra como
si fueran iguales al nivel umbral de pobreza, entonces hay presencia de censura.
A diferencia del truncamiento, la censura es un defecto de los datos de la muestra,
si los datos no estuvieran censurados constituiran una muestra representativa de
la poblacin de inters.
51
4.2. Truncamiento
1 #x
!
2 " 2
f ( x / x > a) = ( 4.1 ).
#a
1 !
" 2
E( x / truncamiento) = + 2& ( ),
( 4.2 )
Var( x / truncamiento) = 2 2 [1 , ( )],
a
siendo = ,
2
( )
&( ) = si el truncamiento es x > a ,
1 ( )
52
( )
&( ) = si el truncamiento es x < a ,
( )
y
, ( ) = & ( )[& ( ) ].
Un resultado importante es que 0 < , ( ) < 1 para cualquier valor de .
Yi = X i '
+ i ( 4.3 )
con i ~ N(0, 2 2 ) .
# a Xi '
!
E (Yi / Yi > a ) = X i ' + 2 " 2 ( 4.4 ).
# a Xi '
1 !
" 2
Por lo tanto, la esperanza condicional no es una funcin lineal ni en X ni en .
Los efectos marginales en la subpoblacin pueden obtenerse teniendo en
cuenta que
'
a Xi
E (Yi / Yi > a ) = X i '
+ 2& ( i ) , donde = . Entonces
2
i
53
%E (Yi / Yi > a) # d&( i ) % i
= +2 !
%X i " d i %X i
#
= + 2 (& 2 ( i ) &( i )) ! ( 4.5 ) .
" 2
i
= (1 & 2 ( i ) + i & ( i ) ) = (1 , ( i ))
siendo i = Yi E (Yi / Yi > a ) . Por la construccin del modelo i tiene media cero,
pero su varianza, V( i ) = 2 2 (1 , ( i )) , depende de X i , presentndose entonces
heteroscedasticidad.
N N 1 N N
# a Xi '
ln L = ln 2 ln 2 2 (Yi Xi ' 2
) ln 31 ! 4 ( 4.7 ).
2 2 22 2 i =1 i =1 " 2
54
El proceso de maximizacin de esta funcin, an siendo muy complicado, dada la
poca linealidad de la misma, es realizable y est incluido en muchos paquetes
estadsticos, incluyendo Eviews.
Los resultados tericos que se utilizan para el estudio de las variables censuradas
son similares a los ya utilizados para variables truncadas. Como en el caso
anterior, se utilizar la distribucin Normal ya que la inmensa mayora de las
aplicaciones prcticas realizadas, suponen normalidad para las distribuciones.
Cuando hay censura, la distribucin que siguen los datos de la muestra es una
mezcla entre una distribucin continua y una discreta. Para entender mejor lo
anterior se puede analizar el siguiente modelo de variable censurada:
*
-0 si y 0
y= * ( 4.8 )
- y si y > 0
*
con y * ~ N ( , 2 2 ) .
# #
Entonces la distribucin que sigue y es: P ( y = 0) = P ( y * 0) = ! =1 !
" 2 "2
Observar que ahora la probabilidad total sigue siendo 1 pero en vez de introducir
un factor de escala en la segunda parte, como ocurre en el modelo truncado lo
que se hace es asignar toda la probabilidad contenida en la regin censurada al
punto de corte.
55
Teorema 3: Momentos de la variable Normal censurada. Sea y * ~ N ( , 2 2 ) ; se
define y = a si y * a , y = y * en caso contrario, entonces:
a ( )
siendo = , &( ) = y , = & ( )[& ( ) ].
2 1 ( )
yi* = X i '
+ i ( 4.11.a ).
-0 si y i* 0,
yi = * ( 4.11.b ).
- y i si y > 0.
*
i
# Xi '
3 ! 4
# Xi " 2
'
E( yi / X i ) = 3X '
+2 4 ( 4.12 )
! 3 i 4
" 2 # Xi '
3 ! 4
3 " 2 4
56
Si el objetivo es el estudio de la variable no censurada, se debe utilizar la media
de la variable latente, es decir X i ' , pero si el objetivo es el estudio de la variable
censurada, se debe utilizar ( 4.12 ).
Los efectos marginales tambin difieren si se usa una u otra funcin de esperanza
condicional, si se usa la media del ndice se obtiene:
% E( y i* / X i )
= ( 4.13 ),
%X i
% E( yi / X i ) # Xi '
= ! ( 4.14 ).
%X i " 2
% E( yi / X i )
Pero la siguiente descomposicin de propuesta por Mc Donald y Moffit
%X i
(1980), es la que determina el verdadero efecto marginal sobre E ( y i / X i ) cuando
hay censura:
% E( y i / X i )
= [ ( i )( i + & ( i )) + ( i )(1 & ( i )( i + & ( i )))] ( 4.15 ),
%X i
'
Xi ( i)
donde = y &( i ) = .
i
2 ( i)
57
j N
P ( y1 , y 2 ,..., y j ,... y N ) = P ( y i = 0) P ( y i / y i > 0)
j =1 i = j +1
Ms concretamente:
j
# # Xi ' N
# yi X i '
L= !1 ! ! ( 4.17 )
i =1 " " 2 i = j +1 " 2
y su logaritmo es
j
# Xi ' N
1 ( yi X i ' ) 2
ln L = ln 31 ! 4 + 3 ln 2 + ln 2 2
+ 4 ( 4.18 ).
i =1 " 2 i = j +1 2 22
58
compra de viviendas para diferentes familias. El objetivo es estimar la relacin
existente entre el gasto en viviendas y el nivel de ingresos del sustentador
principal de la familia, as como los aos de experiencia del mismo y el hecho de
que ste ocupe o no cargos directivos. Las variables involucradas son:
con i ~ N(0, 2 2 ) .
Pero como en este caso se va a trabajar con una muestra truncada de las 745
observaciones para las cuales la variable dependiente es diferente de cero, se
debe utilizar el modelo de regresin truncado especificado en ( 4.6 ) y que para el
caso particular en estudio toma la forma:
59
# 1.87 Z i
!
" 2
(VIVIENDA i / VIVIENDA i > 1.87) = Z i + 2 + i ( 4.20 ),
# 1.87 Zi
1 !
" 2
El punto de corte elegido fue 1.87 , que es un valor muy prximo a 1.871802 , el
menor valor de la variable dependiente que aparece en la submuestra. Como es
conocido, el trmino de perturbacin i tiene media cero, pero su varianza
# # 1.87 Z i
V(i ) = 2 2 !1 , ! depende del vector de variables explicativas del
" " 2
individuo, presentndose entonces heteroscedasticidad.
La estimacin de los parmetros del modelo puede efectuarse a travs del mtodo
de mxima verosimilitud a partir de la maximizacin de una funcin ln L tal como
en ( 4.7 ). El resultado de dicho proceso mediante el paquete Eviews 3.1 para el
caso en estudio es el siguiente:
Tabla 14
Dependent Variable: VIVIENDA
Method: ML - Censored Normal (TOBIT)
Date: 12/03/05 Time: 18:17
Sample: 1 745
Included observations: 745
Truncated sample
Left censoring (value) series: 1.87
Convergence achieved after 6 iterations
Covariance matrix computed using second derivatives
Coefficient Std. Error z-Statistic Prob.
C 1.165494 0.098851 11.79045 0.0000
INGRES 0.015998 0.005999 2.667038 0.0077
ANYOS 0.098026 0.006707 14.61627 0.0000
TRABAJO -0.098723 0.034601 -2.853202 0.0043
Error Distribution
SCALE:C(5) 0.387484 0.014581 26.57469 0.0000
R-squared 0.309021 Mean dependent var 2.496442
Adjusted R-squared 0.305286 S.D. dependent var 0.390144
S.E. of regression 0.325183 Akaike info criterion 0.457083
Sum squared resid 78.25065 Schwarz criterion 0.488046
Log likelihood -165.2635 Hannan-Quinn criter. 0.469018
Avg. log likelihood -0.221830
Left censored obs 0 Right censored obs 0
Uncensored obs 745 Total obs 745
Fuente: Elaboracin propia.
60
^ ^
Los resultados de la estimacin de los parmetros son 1 = 1.165494 , 2 = 0.015998
^ ^ ^
, 3 = 0.098026 , 4 = -0.098723 , 2 = 0.387484 .
Si se desean hacer predicciones sobre toda la poblacin del efecto sobre el gasto
de un aumento marginal del nivel de ingreso del sustentador principal, ste puede
^
ser medido por 2 = 0.015998 , sin embargo dicho efecto para un individuo de la
subpoblacin analizada, vendr medido por:
1.87 Z i 1.87 Z i
con i = ^
=
2 0.387484
y
^ ^ ^ ^
Zi = 1 +INGRESi 2 + ANYOSi 3 + TRABAJOi 4
y
, ( i ) = & 2 ( 0.835513411289) ( 0.835513411289) * & ( 0.835513411289)
= 0.418782102397
2 (1 , ( i )) = 0.015998*(1-0.418782102397)=0.00929854034815 ,
61
observar que el efecto marginal es menor que el efecto que tendra el aumento del
nivel de ingresos si la familia se tomara de la poblacin y no de una parte de ella.
Para analizar la muestra con las 800 observaciones, incluyendo las 55 en las
cuales el gasto en vivienda toma el valor cero, lo correcto es analizar al modelo
como un modelo censurado, en este caso el enfoque sera a partir de la variable
latente tal como en ( 4.11 )
con i ~ N (0, 2 2 )
*
-0 si VIVIENDA i 0,
VIVIENDAi = ( 4.22.b )
-VIVIENDAi si VIVIENDA i > 0.
* *
# Zi
!
# Zi 3 "2 4
4
E(VIVIENDAi ) = ! 3 Zi + 2 ( 4.23 ),
"2 3 # Zi 4
3 !
"2 4
donde Zi = 1 +INGRESi 2 + ANYOSi 3 + TRABAJOi 4 .
La estimacin de los parmetros del modelo puede efectuarse a travs del mtodo
de mxima verosimilitud a partir de la maximizacin de una funcin ln L tal como
en ( 4.18 ). El resultado de dicho proceso mediante el paquete Eviews 3.1 para el
caso en estudio es el siguiente
62
Tabla 15
Dependent Variable: VIVIENDA
Method: ML - Censored Normal (TOBIT)
Date: 12/03/05 Time: 23:13
Sample: 1 800
Included observations: 800
Left censoring (value) at zero
Convergence achieved after 4 iterations
Covariance matrix computed using second derivatives
Coefficient Std. Error z-Statistic Prob.
C 0.773018 0.119903 6.447056 0.0000
INGRES 0.041137 0.009420 4.367083 0.0000
ANYOS 0.099962 0.008930 11.19432 0.0000
TRABAJO 0.240470 0.051454 4.673511 0.0000
Error Distribution
SCALE:C(5) 0.706041 0.018811 37.53400 0.0000
R-squared 0.193831 Mean dependent var 2.324812
Adjusted R-squared 0.189775 S.D. dependent var 0.735692
S.E. of regression 0.662215 Akaike info criterion 2.231187
Sum squared resid 348.6299 Schwarz criterion 2.260466
Log likelihood -887.4747 Hannan-Quinn criter. 2.242434
Avg. log likelihood -1.109343
Left censored obs 55 Right censored obs 0
Uncensored obs 745 Total obs 800
Fuente: Elaboracin propia.
^
Los resultados de la estimacin de los parmetros son 1 = 0.773018 ,
^ ^ ^ ^
La estimacin del gasto esperado para una familia, que puede estar censurada o
no, ser:
# Zi
3 ! 4
# Zi " 0.706041 4
E(VIVIENDAi ) = ! 3 Z i + 0.706041 ( 4.24 )
" 0.706041 3 # Zi 4
3 ! 4
" 0.706041
con
63
% E( yi / X i )
vendr dado por la descomposicin de propuesta por Mc Donald y
%X i
Moffit tal como en ( 4.15 ) y como puede notarse all, este efecto no es el mismo
para todos los individuos, puesto que depende de los valores iniciales de las
variables explicativas del individuo en cuestin.
64
Conclusiones
La aplicacin del conjunto de medios y tcnicas analizados debe ser vista como
una poderosa herramienta para objetivar el proceso de decisin. Pudindose
arribar a las siguientes conclusiones:
65
4) Los conocimientos tericos sobre los modelos microeconomtricos son
indispensables para el trabajo con los mismos. Si bien hoy da existen softwares
especficos que permiten realizar la estimacin de tales modelos sin muchas
dificultades, las interpretaciones de los resultados que se obtengan, as como la
comprensin del sentido econmico de lo que se ha modelado, no pueden
ofrecerlas los programas informticos. Es por ello que en los ejemplos
desarrollados en este trabajo se hizo especial nfasis en la interpretacin de los
resultados obtenidos y en el sentido de lo modelado.
66
Recomendaciones
67
Bibliografa utilizada
[ 5]
Colectivo de autores. Anlisis de regresin y series cronolgicas . Editorial
ENPES, La Habana, 1983.
[9] Hernndez Luis M, del Castillo Alfredo, Bofill Arturo, Pons Juan,
Probabilidades. Editorial Pueblo y Educacin, Ciudad de la Habana, 1980.
[10] Hsiao Cheng. Analysis of Panel Data. Cambridge University Press. Segunda
Edicin. California 2003.
68
[13] Novales A. Econometra, Mc Graw Hill, Madrid, 1988.
[14] Pulido San Romn Antonio, Prez Garca Julin. Modelos economtricos.
Ediciones Pirmide. Madrid, 2001.
[15] Wooldridge, J. Econometric Analysis of cross Section and Panel Data. The
MIT Press Cambridge, Massachusetts (2002).
http:/www.ucm.es/info/ecocuan/microectr/
http:/www.microeconometri.com/
http:/www.uam.es/departamentos/economicas/ecocuan/
http:/www.revistasice.com/
http:/www.uc3m.es/uc3m/inst/fl/boletin/espanol/pdfdebate/
69
Anexos
Anexo 1
Pruebas estadsticas basadas en la funcin de verosimilitud y en el
logaritmo de la funcin de verosimilitud
2K 2 ln ( L( , 2 2 ))
AIC = .
I I
k * lnI 2 ln (L( , 2 2 ) )
SC = .
I I
70
Segn este criterio ser preferible aquel modelo que presente un valor de SC
menor.
2 * k * ln( ln I ) 2 ln( L( , 2 2 ))
H-Q = .
I I
Segn este criterio ser preferible aquel modelo cuyo valor H - Q sea menor.
Anexo 2
Histograma y estadsticas de los residuos de la regresin dada por la ecuacin
( 2.33 ):
400
Series: RESID
Sample 1 1000
Observations 766
300
Mean -0.014998
Median -0.243029
Maximum 7.981035
200
Minimum -0.874680
Std. Dev. 0.938333
Skewness 4.144782
100 Kurtosis 25.19531
Jarque-Bera 17916.38
Probability 0.000000
0
0.00 1.25 2.50 3.75 5.00 6.25 7.50
71
Anexo 3
PRESTAM i 1 1
Tabla de resultados de la regresin de sobre = en el
wi wi ws
ejemplo del epgrafe 2.8
Anexo 4
Pasos necesarios en Eviews 3.1. para la aplicacin del MPL ponderado del
ejemplo del epgrafe 2.8.
Este paso realiza la estimacin del modelo de probabilidad lineal sin ponderar.
2) forecast prestamf
^
Este paso permite obtener la serie prestamf de los valores estimados de Pi .
^
Este paso permite obtener la serie de los Pi que estn entre cero y uno,
eliminando las observaciones que no satisfacen esta condicin.
4) genr ws=(prestamfa*(1-prestamfa))^0.5
72
5) ls (prestam/ws) (1/ws) (renta/ws) (parado/ws) (vivprop/ws)
Mediante este paso se realiza la regresin por MCO del modelo ponderado dado
por la ecuacin ( 2.33 ).
6) ls (prestam/ws) (1/ws)
PRESTAM i 1 1
Mediante este paso se realiza la regresin de slo sobre = ,
wi wi ws
necesaria para obtener el valor de su verosimilitud estimada y poder obtener el
estadstico LR y el ndice de cociente de verosimilitudes o R 2 de Mc Fadden.
7) genr probestimada=c(1)+c(2)*renta+c(3)*parado+c(4)*vivprop
8) genr probestimadaacep=log((0<probestimada)and(probestimada<1))
+1*probestimada
9)
genr aciertos=((0<=probestimadaacep)and(probestimadaacep<0.5))*
(1-prestam)
+ ((0.5<=probestimadaacep) and (probestimadaacep<=1))*prestam
Esta instruccin genera una serie denominada aciertos. Para cada i dicha serie
toma el valor 1 si el pronstico para PRESTAM segn la probabilidad estimada
concuerda con el valor real de PRESTAM, en caso contrario toma el valor cero.
9) scalar numeroaciertos
10) numeroaciertos=@sum(aciertos)
73
Anexo 5
3) forecast prestamflog
^
Genera la serie prestamlog de los valores de Pi estimados mediante la regresin
logstica.
4) genr indexlogi=c(1)+c(2)*renta+c(3)*parado
^
'
Genera la serie X i del ndice estimado mediante la regresin logstica.
5) genr denslog=(exp(indexlogi))/((1+exp(indexlogi))^2)
^
'
Genera la serie de los trminos f ( X i ) de la funcin de densidad logstica
evaluada en el ndice.
^
'
f (Xi )
Genera la serie FAC de los trminos .
^ ^
Pi (1 Pi )
74
Despus de todos los pasos anteriores, a travs de la orden anterior es posible
estimar mediante MCO la ecuacin ( 2.37 ) obtenindose los resultados presentes
en la Tabla 9.
8) forecast estandaresf
^
Mediante esta instruccin se genera la serie de los ESTANDARES , la cual se
necesita para hallar la suma explicada de cuadrados de de la regresin ( 2.37 ).
9) scalar estandaresmedia
10) estandaresmedia=(@sum(estandares))/1000
^
Genera la serie de los trminos ESTANDARES ESTANDARES .
75