Binary

Modelos de elecci on binaria
Prof.: Bego na Alvarez Garc ia Econometr ia II 2007-2008
Estamos interesados en la ocurrencia o no-ocurrencia de un cierto evento (ej: participaci on en el mercado laboral; inversi on de una empresa en I+D; matriculaci on en un m aster, etc.) y en c omo ese evento depende de un vector de k variables explicativas xi = (1, x2i , ..., xki )0 ; disponemos para ello de n observaciones. Para formalizar el evento que es objeto de estudio, denimos una variable binaria yi tal que yi = 1 si el evento y = 0 si el evento no ocurre i
Supondremos que la variable dependiente es aleatoria y que los regresores son no aleatorios. En principio, podr ia utilizarse un modelo de regresi on lineal para modelar estas decisiones. Sin embargo, como veremos en el apartado siguiente, el uso del modelo de regresi on lineal cuando la variable dependiente es discreta presenta diversos problemas y, en la mayor ia
de los casos, no es el m as adecuado para estudiar estos datos. Como alternativa se han formulado otro tipo de modelos conocidos con el nombre de modelos de elecci on binaria. 1. MODELO DE PROBABILIDAD LINEAL Podr iamos empezar planteando un modelo de regresi on lineal para estudiar esta relaci on yi = x0 i + i i = 1, ..., n (1)
ermino de error siendo un vector k dimensional de par ametros desconocidos y ui un t con esperanza nula. Ahora bien, como la variable dependiente toma s olo valor 1 o 0, 1
formular una relaci on de este tipo tiene diversas consecuencias, la mayor ia no deseables, que examinamos a continuaci on: olo puede valer 1 o 0, entonces 1. Como la variable dependiente yi s E (yi ) = Pr(yi = 1) 1 + Pr(yi = 0) 0 = Pr(yi = 1) Al formular una relaci on lineal como (1) donde E (i ) = 0, i, tendremos que E (yi ) = x0 i = Pr(yi = 1) = x0 i
Es decir, decimos que la probabilidad de que la variable dependiente tome el valor 1 depende linealmente de los regresores. Por esta raz on, cuando la variable dependiente es binaria, al modelo de regresi on se le denomina modelo de probabilidad lineal. La primera consecuencia de este resultado es que, como las probabilidades han de estar siempre en el intervalo [0, 1], entonces 0 x0 i 1, i; luego, no todos los n desigualdades. 2. Las predicciones que se obtienen con el modelo de probabilidad lineal pueden salirse fuera del rango observado de valores [0, 1] . Supongamos que, para un determinado vector de variables explicativas x0 n+1 y un vector de estimaciones del vector de par ametros , queremos predecir el valor de la variable dependiente. Parece l ogico calcular esta predicci on como y n+1 = x0 n+1 Es evidente que, en general, el valor predicho no ser a 0 ni 1. Pero, en realidad, la e?). La predicci on debe interpretarse como una estimaci on de Pr(yn+1 = 1) (por qu cuesti on es que este m etodo no nos garantiza que esas predicciones vayan a estar acotadas en el intervalo [0, 1] y, por tanto, podr iamos obtener predicciones absurdas. 3. Al ser binaria la variable dependiente, el t ermino de error ui del modelo (1) es hete-
alidos, sino s olo aqu ellos para los cuales se satisfacen estas vectores de en Rk son v
roced astico. Ve amoslo: ui = 1 x0 cuando yi = 1 i u = x0 cuando y = 0 i i i
por tanto
0 2 0 2 V ar(ui ) = E (u2 i ) = (1 xi ) Pr(yi = 1) + (xi ) Pr(yi = 0) = 2 0 0 2 0 = (1 x0 i ) (xi ) + (xi ) (1 xi ) = 0 0 0 = (1 x0 i )(xi ) (1 xi ) + (xi ) = 0 = (1 x0 i )(xi )
que, en general, es diferente para cada observaci on. Por lo tanto, la estimaci on por MCO del modelo (1) es ineciente y, lo que es m as grave, no permite hacer inferencias v alidas (por qu e?). Este u ltimo problema podr ia resolverse utilizando M inimos Cuadrados Generalizados Factibles. Pero tambi en existen problemas.
Veamos cu ales ser ian los pasos para estimar el modelo por M inimos Cuadrados Generalizados: Se estima el modelo (1) por MCO, sin tener en cuenta la heterocedasticidad. Se obtienen las predicciones y i para toda la muestra (recordar que estas predicciones representan estimaciones de la probabilidad condicional de que yi = 1) Las estimaciones y i se utilizan para estimar la varianza de las perturbaciones aleatorias i (1 y i ). para cada individuo mediante la expresi on w i = y Si los valores estimados y i son mayores que la unidad, se deben sustituir por la unidad (si son menores que 0, se sustituyen por 0), para que sean coherentes. Pero esto ian 0, y provoca otro problema: los valores correspondientes de w i en esos casos ser como estos valores se utilizan como ponderadores en el m etodo de estimaci on por MCG, eso supone que tendr iamos que dividir los valores de las variables del modelo por 0. Para evitar estos problemas se puede proceder de dos formas: 3
Se eliminan estas observaciones de la muestra y, por tanto, se pierde informaci on. Se sustituyen los valores mayores o iguales a la unidad por 0.999 y los menores o iguales a cero por 0.001. Se pondera el modelo (1) dividiendo ambos miembros de la ecuaci on por p y i (1 y i ), con el n de transformar el modelo en homoced astico. w i =
Finalmente se estima el modelo transformado por MCO, y esas ser an las estimaciones por MCG. Las estimaciones son ecientes. Sin embargo queda sin resolver un problema importante: las probabilidades predichas a partir de las estimaciones MCG no tienen por qu e estar acotadas en [0,1]. Todos estos inconvenientes vienen originados porque, en realidad, la formulaci on misma del modelo de probabilidad no es totalmente l ogica: las funciones lineales no est an acotadas ni inferior ni superiormente, mientras que las probabilidades s i lo est an. A continuaci on, vamos a revisar otros modelos de elecci on binaria que no presentan estos problemas. BINARIA: PROBIT Y LOGIT 2 MODELOS DE ELECCION Dado que la mayor ia de problemas que nos encontramos con el modelo de probabilidad lineal se derivan de que intentamos expresar una probabilidad, que ha de estar comprendida entre 0 y 1, a trav es de una forma lineal, que en principio no est a acotada, una soluci on es acotar esa forma funcional. Es decir, en lugar de proponer una relaci on yi = x0 i + ui , formulamos la siguiente relaci on yi = F (x0 i ) + ui (2)
donde F (.) es una funci on de R en R, un vector de par ametros desconocidos kdimensional ermino de error con E (ui ) = 0. Esta formulaci on implica que y ui un t E (yi ) = F (x0 i) (3) (4)
= Pr(yi = 1) = F (x0 i) 4
Las igualdades (2) y (3) son totalmente equivalentes por ser yi una variable binaria. En la pr actica, es m as habitual formular los modelos para variables binarias utilizando la forma de la ecuaci on (3). Obs ervese que esta formulaci on implica suponer que la variable dependiente sigue una distribuci on binomial tal que yi = 1 Pr(yi = 1) = F (x0 i) y =0 Pr(yi = 0) = 1 F (x0 i i)
Estos modelos son siempre heteroced asticos, es decir, las observaciones no tienen todas la misma varianza ya que
0 V ar(yi ) = (1 F (x0 i ))F (xi )
Para que un modelo de elecci on binaria est e totalmente especicado, debe decirse qu e funci on F (.) se utiliza. Las especicaciones habituales son: a) Funci on identidad (Modelo de probabilidad lineal) b) Distribuci on normal est andar (Modelo probit) c) Distribuci on log istica (Modelo logit) Aunque en la literatura se han sugerido otras distribuciones diferentes a la normal y la log istica, en las aplicaciones econom etricas estas han sido pr acticamente las u nicas que se han utilizado. Como puede observarse, bajo las especicaciones Logit o Probit la funci on de regresi on es no lineal en los par ametros , por tanto el modelo no puede estimarse por m inimos cuadrados ordinarios, sino que debemos recurrir a la estimaci on por m axima verosimilitud. Esto se analiza en m as detalle en la Secci on 2.4.
0 F (x0 i ) = (xi ) = 0 F (x0 i ) = (xi ) = 0 F (x0 i ) = xi
R X0
1 i 2
exp(t2 /2)dt =
1 1+exp(x0 i )
exp(x0 i ) 1+exp(x0 i )
BINARIA COMO MODELOS CON VARI3 LOS MODELOS DE ELECCION ABLE LATENTE Hasta aqu i, los modelos de elecci on binaria se han introducido como generalizaci on de los modelos lineales, introduciendo una funci on F (.) que tome valores en [0, 1] para asegurar que las predicciones obtenidas con esta modelizaci on se puedan interpretar como probabilidades. Pero existe una interpretaci on de estos modelos mucho m as atractiva para los economistas. En muchos casos, la variable dependiente binaria que queremos analizar es el resultado de una decisi on: el decisor (persona, empresa, pa is) tiene que optar entre realizar una determinada acci on o no; para ello compara la utilidad (benecios, bienestar, etc.) que, dadas sus caracter isticas, le reporta esa acci on. Si esa utilidad (benecios, bienestar, etc.) es positiva, realiza la acci on y en caso contrario no. Para ilustrar esta idea, utilizaremos el siguiente ejemplo: on de participaci on en EJEMPLO : Supongamos que yi representa la decisi el mercado laboral de una mujer (yi = 1 si la mujer trabaja, 0 en otro caso) y consideremos que estos dos posibles resultados, trabajar o no trabajar, van asociados a dos niveles de utilidad diferentes
0 Uy =1 = xi 1 + ui1 0 Uy =0 = xi 0 + ui0
donde xi representa el vector de variables de control que determinan las preferencias por participar en el mercado laboral (edad, estado civil, hijos, renta ametros defamiliar, tasa de desempleo local, etc.), 1 y 0 son vectores de par sconocidos y ui1 y ui0 representan una serie de componentes de inobservables de las preferencias (gustos) espec icos de cada una de las opciones. Bajo esta caracterizaci on, una mujer decidir a participar en el mercado laboral si la utilidad de trabajar es mayor que la de no hacerlo. Es decir, la elecci on de participar
Uy se realiza cuando Uy =1 > Uy =0 = =1 Uy=0 > 0. Denotemos por yi a la
U . La variable y no es observable, por eso recibe el nombre diferencia Uy =1 y=0 i
de variable latente. Ahora podemos describir la decisi on

> 0) yi = 1(yi 0 = 1(x0 i 1 + ui1 xi 0 + ui0 > 0) = 1 x0 i ( 1 0 ) + ui1 ui0 > 0
donde 1(.) es la funci on indicador que toma valor 1 si el evento entre par entesis se cumple y 0 en otro caso. Aqu i no podemos identicar ambos conjutos de i su diferencia ( 1 0 ). De modo que podemos par ametros 1 y 0 , pero s reparametrizar la variable latente de la siguiente forma:
0 = x0 yi i ( 1 0 ) + ui1 ui0 = xi + ui
siendo u un i una variable aleatoria con media 0. Distinguiremos varios casos seg qu e hip otesis hagamos sobre este t ermino de error. Caso 1: Suponemos que el t ermino de error tiene distribuci on normal est andar, es decir u i v N (0, 1). Entonces, la variable observada yi satisface que
> 0) = Pr(x0 Pr(yi = 1) = Pr(yi i + ui > 0) 0 0 0 = Pr(u i > xi ) = 1 (xi ) = (xi )
Obs ervese que, de nuevo, hemos llegado a un modelo Probit. Caso 2: Suponemos que el t ermino de error tiene distribuci on normal
2 2 ametros del modelo son ahora y u i v N (0, ), con desconocida. Los par
2 . Razonando como antes, obtenemos:

> 0) = Pr(x0 + u Pr(yi = 1) = Pr(yi i > 0) i x0 ui 0 i > = = Pr(ui > xi ) = Pr = 1 x0 = x0 i i
El problema que tenemos en este caso es que no podemos identicar los par ametros y de forma separada. Qu e signica esto? Signica que existen innitas combinaciones de valores de y que dan lugar a un mismo valor del ratio / . Por ello, generalmente suele suponerse que = 1 (con lo cual estar iamos en el Caso 1). Si no quiere hacerse expl icita esta hip otesis, podemos denotar por = / y suponer que la variable observada sigue un modelo Probit con coeciente . En la pr actica, este supuesto no plantea ning un inconveniente pues, por ejemplo, la signicatividad de la j- esima variable explicativa se estudia contrastando j = 0, lo que equivale a contrastar j = 0. Caso 3: Suponemos que el t ermino de error tiene distribuci on log istica. Siguiendo el mismo razonamiento que en los casos anteriores
> 0) = Pr(x0 Pr(yi = 1) = Pr(yi i + ui > 0) 0 0 0 = Pr(u i > xi ) = 1 xi = xi
En este caso, tenemos un modelo Logit.
POR MAXIMO 4. ESTIMACION VEROSIMILITUD DE LOS MODELOS DE BINARIA ELECCION Los economistas aplicados est an interesados en la utilizaci on de los modelos de elecci on binaria para explicar comportamientos observados. Para ello, necesitan estimar los par ametros de estos modelos utilizando una muestra de datos. Sin embargo, como hemos visto anteriormente, excepto el modelo de probabilidad lineal, los modelos de elecci on binaria son fundamentalmente no-lineales en par ametros, lo cual inmediatamente excluye el m etodo de m inimos cuadrados ordinarios como estrategia de estimaci on. Este problema se resuelve utilizando m axima verosimilitud como m etodo de estimaci on. La t ecnica de m axima verosimilitud se centra en la probabilidad de observar ciertas realizaciones de las decisiones objeto de estudio y las caracter isticas de los individuos que ida de la poblaci on, las toman. Consideremos una muestra de n observaciones {yi , xi } extra 8
donde yi es una variable binaria. Suponiendo

yi = 1(yi > 0) = 1(x0 i + ui > 0)
enticamente distribuidas, el procedimiento y suponiendo que las ui son idependientes e id de m axima verosimilitud permite encontrar el valor de los par ametros que con mayor probabilidad han generado los datos {yi , xi } . Para cualquier vector , la probabilidad de observar los valores de yi , dados los valores de xi (y suponiendo que las observaciones son independientes) puede escribirse como L( | xi ) =
n Y i=1
Pr(yi | xi ; ) =
n Y i=1
Pr(yi = 0 | xi ; )1yi . Pr(yi = 1 | xi ; )yi
Es decir, la probabilidad total de observar los valores de yi que tenemos en la muestra es igual al producto de probabilidades individuales asociada con cada una de las realizaciones. Tomando logaritmos tenemos la funci on de log-verosimilitud
n n X X [(1 yi ). ln Pr(yi = 0 | xi ; )] + yi . ln Pr(yi = 1 | xi ; ) ln L( | xi ) = i=1 i=1
El estimador m aximo veros imil (MV) se dene como el valor MV que maximiza esta funci on, suponiendo que este m aximo existe y es u nico. Modelo Probit: Pr(yi = 1 | xi ; ) = (x0 i) Pr(yi = 0 | xi ; ) = 1 (x0 i) y, por tanto L( | xi ) = Modelo Logit: Pr(yi = 1 | xi ; ) = (x0 i) = Pr(yi exp(x0 i) 1 + exp(x0 i) 1 = 0 | xi ; ) = 1 (x0 i) = 1 + exp(x0 i) 9
n n X X [(1 yi ). ln(1 (x0 ))] + yi ln (x0 i i) i=1 i=1
y, por tanto ln L( | xi ) =
n n X X [(1 yi ). ln(1 (x0 ))] + yi ln (x0 i i) i=1 i=1
Las condiciones de primer orden que permiten obtener el estimador MV se obtienen derivando la funci on de log-verosimilitud respecto a e igualando a cero. Tanto en el caso Probit como en el Logit, la funci on de log-verosimilitud es globalmente c oncava, por tanto estos modelos tienen, a lo sumo, una u nica soluci on que dene expl icitamente al estimador MV del modelo. 5. INTERPRETACION DE LOS COEFICIENTES Y COMPARACION DE LOS MODELOS 5.1 Interpretaci on de los par ametros Dada una variable dependiente binaria yi y un vector (k 1) de variables explicativas xi , hemos visto tres especicaciones alternativas para modelar la probabilidad condicional: Modelo de probabilidad lineal : Probit : Logit : Pr(yi = 1 | xi ; ) = x0 i Pr(yi = 1 | xi ; ) = (x0 i) Pr(yi = 1 | xi ; ) = (x0 i)
Todas estas funciones son mon otonas crecientes en sus argumentos, esto aporta una primera interpretaci on intuitiva de los par ametros: Si el par ametro j asociado con la variable xj es positivo (negativo), entonces a (disminuir a) cuando la probabilidad condicional Pr(yi = 1 | xi ; ) aumentar xj crece. Pero, generalmente, los economistas est an interesados no s olo en el signo del efecto, sino tambi en en su magnitud. La medida m as habitual que se utiliza en los modelos de elecci on binaria es el efecto marginal sobre la probabilidad condicional Pr(yi = 1 | xi ; ) de un 10
aumento en una unidad en la variable xj . Cada uno de los modelos de elecci on binaria que hemos visto conllevan diferentes representaciones de estos efectos marginales:
Modelo de probabilidad lineal : Probit : Logit :
Pr(yi = 1 | xi ; ) = j xij Pr(yi = 1 | xi ; ) = (x0 i ) j xij Pr(yi = 1 | xi ; ) exp(x0 i) = 2 j xij [1 + exp(x0 i )]
Lo que sugieren estos resultados es que las estimaciones puntuales de los par ametros poblacionales no son directamente comparables. Obs ervese que, mientras el efecto marginal en el modelo de probabilidad lineal es constante, los efectos marginales en el Probit y Logit dependen del valor de las variables explicativas. Determinar el efecto marginal de una variable explicativa tiene sentido cuando dicha variable es continua. Si el regresor es una variable discreta, lo natural es determinar la probabilidad de exito que se obtiene para cada posible valor del regresor y comparar despu es esas probabilidades. Vamos a ilustrar esto con un ejemplo.
EJEMPLO: Formulamos un modelo logit para analizar c omo afectan los ingresos familiares y el tipo de poblaci on (rural o urbana) donde reside la familia en la decisi on de vivir en casa propia o alquilada. Las variables son: yi = 1 si la familia vive en casa propia, 0 si vive de alquiler ltimo a no (medidos x2i = ingresos mensuales (medios) de la familia en el u en diez miles de euros) as de 10.000 habitantes, 0 en x3i =1 si la familia vive en una ciudad con m caso contrario. Estamos formulando el siguiente modelo: Pr(yi = 1 | x2i , x3i ) = ( 1 + 2 x2i + 3 x3i ) = 11 exp( 1 + 2 x2i + 3 x3i ) 1 + exp( 1 + 2 x2i + 3 x3i )
= 4, = 30 y = Supongamos que estimamos el modelo y obtenemos 1 2 3 0.05. Veamos qu e tipo de informaci on podemos extraer con estos datos: a) Predicci on de probabilidades : Supongamos una familia A urbana, con unos ingresos de 1000 euros al mes, la probabilidad de vivir en una casa de propiedad es (4 + 30 0.1 + (0.5) 1) = 0.182 b) Efecto de la variaci on en una variable explicativa continua : Si la familia A aumenta sus ingresos mensuales en 100 euros, la probabilidad de que sea propietaria de la casa donde reside es (4 + 30 0.11 + (0.5) 1) = 0.231 es decir, la probabilidad aumenta 0.049. Pero veamos c omo el efecto de este cambio no es el mismo si los ingresos de partida son diferentes: Supongamos una familia B , urbana, y con ingresos de 2500 euros al mes. La probabilidad de que resida en casa de propiedad es (3) = 0.952. Si sus ingresos aumentan en 100 euros, la probabilidad pasa a ser (3.3) = 0.964, es decir, aumenta 0.012. En general, para cualquier familia urbana, el efecto marginal de la variable ingresos mensuales se puede calcular de forma m as directa aplicando la expresi on que se present o m as arriba, esto es exp(4.5 + 30x2i ) Pr(yi = 1 | x2i , x3i ) = 30 xij [1 + exp(4.5 + 30x2i )]2 c) Efecto de la variaci on en una variable articial : Se trata de comparar la probabilidad de poseer la casa donde se reside, seg un la familia sea urbana o rural. En esta comparaci on tambi en hay que tener en cuenta los ingresos mensuales de la familia. Para ello, o bien se ja un valor de los ingresos, o bien se ofrece un gr aco en el que, para cada uno de los posibles valores de los ingresos, se puede observar cu al es la probabilidad de ser propietario cuando se reside en un n ucleo rural o urbano. En este segundo caso, se elabora un gr aco 12
con los ingresos mensuales en el eje de abscisas y las probabilidades en el eje de ordenadas, y se representan dos curvas: Probabilidad de que una familia urbana con ingresos mensuales x2 posea la casa en la que reside=(4.5 + 30x2 0.5); y Probabilidad de que una familia rural con ingresos mensuales x2 posea la casa en la que reside=(4.5 + 30x2 ). Si el modelo que se especica es un Probit, el procedimiento para derivar los efectos marginales de las variables y los cambios en la probabilidad inducidos por alguna variable articial es similar. De hecho, aunque las estimaciones de los par ametros que se obtienen en un Probit no son directamente comparables con las correspondientes al Logit, los efectos marginales de las variables explicativas que se obtienen a partir de estos dos modelos s i son muy parecidos. Tambi en existe una transformaci on bastante popular para poder comparar directamente los par ametros estimados a partir de un Logit y un Probit. Esta transformaci on es: Probit t 0.625 Logit . 5.2 El odds-ratio El odds es el cociente entre la probabilidad de elegir una opci on y la probabilidad de elegir la otra, es decir Odds= Pr(yi = 1 | xi ; ) 1 Pr(yi = 1 | xi ; )
Veamos cu al es su expresi on en las especicaciones Logit y Probit: Logit:

1 1+exp(x0 i) Odds= 1 1 1+exp(x0 ) i
1 = exp(x0 i) exp(x0 ) i
Probit: Odds= (x0 i) 1 (x0 i) 13
Si el Odds>1 signica que, para el individuo i, la opci on yi = 1 es m as probable que la on 1 opci on yi = 0 o, en otras palabras, que el individuo i obtiene mayor utilidad de la opci que de la opci on 0. Si el Odds<1 la interpretaci on ser ia la contraria. Y si Odds=1, ambas opciones son igual de probables, es decir, el individuo es indiferente ante ambas opciones. En muchas ocasiones, puede resultar ilustrativo comparar el Odds entre dos situaciones diferentes. Por ejemplo, supongamos un individuo de referencia j en el cual se jan todas las variables contenidas en xi en su valor medio y se compara su Odds con el de otro individuo i que diere de j en el valor de una o m as variables explicativas. Podemos construir el Odds-ratio o Cociente entre Odds de esos individuos como Odds ratio o cociente entre
Pi 1Pi Odds= Pj 1Pj
Si el Odds-ratio>1 signica que el individuo i tiene una preferencia mayor por la opci on yi = 1 frente a la yi = 0 que el individuo j. Siguiendo el mismo razonamiento, podemos deducir la interpretaci on de los valores del Odds-ratio menores o iguales que 1. BINARIA 6. INFERENCIA ESTAD ISTICA EN MODELOS DE ELECCION Para realizar inferencias sobre los par ametros de los modelos de elecci on binaria, necesitamos disponer de estimaciones de las varianzas de dichos par ametros en cada modelo. En el modelo de probabilidad lineal son f aciles de obtener puesto que la estimaci on se puede llevar a cabo por MCO. En el caso de los modelos Probit y Logit, la distribuci on de los estimadores MV para una muestra de tama no n es a ) v )1 ) n( N (0, I ( )1 est a denotando la inversa de la matriz de informaci on. Existen varias formas donde I ( de estimar esta matriz. Afortunadamente, los programas econom etricos calculan directa , as mente la matriz de varianzas y covarianzas de i como los errores est andar. La inferencia estad istica y los contrastes de hip otesis se pueden llevar a cabo utilizando las t ecnicas habituales. 14
6.1 Medidas de bondad de ajuste. Para juzgar cu ando un modelo de elecci on binaria ajusta bien los datos observados existen varias medidas que se basan en los principios del R2 utilizado en los modelos lineales estimados por MCO (esta medida, obviamente, no puede ser utilizada en los modelos de elecci on binaria). Existen dos medidas bastante populares que se construyen a partir de la verosimilitud del modelo completo LSR (evaluada en los estimados) y la verosimilitud de on de dicha un modelo en el que s olo incluimos una constante LR (evaluada en la estimaci constante). Estas medidas fueron desarrolladas por Cragg y Uhler (1970) y McFadden (1974). La formulaci on de estas medidas es la siguiente: Cragg y Uhler McFadden : : pseudo -R2 = (LSR LR )/(1 LR ) pseudo -R2 = 1 ln LSR / ln LR
2/n 2/n 2/n
Una forma alternativa de evaluar la bondad de ajuste de un modelo de elecci on binaria es la que se basa en la comparaci on de las predicciones del modelo con los valores observados. Para hacer esto, necesitamos establecer previamente qu e consideramos una predicci on ), es decir, la predicci i = Pr(yi = 1 | xi ; on correcta. La idea es la siguiente: denotemos P on binade la probabilidad de que yi tome valor 1 obtenida a partir del modelo de elecci ria estimado (Probit o Logit). Pero esta probabilidad est a entre 0 y 1, a partir de qu e valor consideramos que el modelo predice una realizaci on de yi = 1 para el individuo? Una posibilidad es suponer i > 0.5). y i = 1(P La proporci on de predicciones correctas se dene entonces como 1X 1(yi = y i ) P= n
i=1 n
y constituye una medida de bondad de ajuste del modelo, aunque no siempre es able. 6.2 Contraste de signicaci on de la regresi on. Para contrastar la signicatividad conjunta de todas las variables explicativas en un modelo estimado por MV, podemos utilizar el contraste de ratio de verosimilitudes. Es 15
decir, estamos contrastando H0 : 2 = 3 = ... = k H1 : al menos un j = 0, j = 2, ..., k El modelo restringido ser ia un modelo en el que s olo hubiera t ermino constante, y el modelo sin restringir, el modelo con todas las variables explicativas. Para implementar este contraste, necesitamos disponer de las funciones de verosimilitud evaluadas en su m aximo, para estos dos modelos. El estad istico de contraste es el siguiente: 2 ln(LR /LSR ) = 2(ln LSR ln LR ) v 2 r donde r es igual al n umero de restricciones (en este caso, n umero de variables explicativas del modelo). Como siempre, la regla de decisi on del contraste viene determinada por la comparaci on del valor del estad istico de contraste con el valor cr itico de una 2 r para un nivel de signicaci on determinado (0.05, 0.01 habitualmente). Este contraste puede ser utilizado tambi en para contrastar la signicatividad de un subconjunto de variables explicativas.
N otese la similitud de este contraste con el contraste F de restricciones lineales en un modelo estimado por MCO. Recordemos: el estad istico F mide el aumento de la suma de cuadrados de los residuos cuando se eliminan las variables del modelo. El ratio de verosimilitudes se basa en la diferencia de las funciones de log-verosimilitud para los modelos restringido y sin restringir. La idea es que, como el estimador MV maximiza la funci on de log-verosimilitud, cuando se eliminan variables obtenenmos logverosimilitudes m as peque nas -o al menos no m as grandes-. El estad istico, entonces, trata de revelar si la disminuci on en la log-verosimilitud es lo bastante grande como para llegar a la conclusi on de que las variables eliminadas son importantes.
6.3 Contrastes de especicaci on en modelos de elecci on binaria. Consideremos dos importantes problemas de especicaci on con los que podemos encontrarnos: omisi on de variables relevantes y heterocedasticidad. En el contexto de los modelos de elecci on binaria, las consecuencias de estos problemas son todav ia m as graves: 16
1. Si omitimos una variable relevante del modelo, incluso en el caso en que esta variable est e incorrelacionada con las otras variables explicativas incluidas en el modelo, los par ametros estimados ser an inconsistentes. 2. Si las perturbaciones del modelo de regresi on latente son heteroced asticas, los estimadores MV son inconsistentes y la matriz de varianzas y covarianzas incorrecta. Este resultado es especialmente preocupante porque, en la mayor ia de aplicaciones de modelos de elecci on binaria, se trabaja con datos microec omicos que suelen tener naturaleza heteroced astica.
17

Binary

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Binary

Uploaded by

Copyright:

Available Formats

Modelos de elecci on binaria

Prof.: Bego na Alvarez Garc ia Econometr ia II 2007-2008

roced astico. Ve amoslo: ui = 1 x0 cuando yi = 1 i u = x0 cuando y = 0 i i i

U . La variable y no es observable, por eso recibe el nombre diferencia Uy =1 y=0 i

de variable latente. Ahora podemos describir la decisi on

2 . Razonando como antes, obtenemos:

En este caso, tenemos un modelo Logit.

donde yi es una variable binaria. Suponiendo

Pr(yi = 0 | xi ; )1yi . Pr(yi = 1 | xi ; )yi

Modelo de probabilidad lineal : Probit : Logit :

Pr(yi = 1 | xi ; ) = j xij Pr(yi = 1 | xi ; ) = (x0 i ) j xij Pr(yi = 1 | xi ; ) exp(x0 i) = 2 j xij [1 + exp(x0 i )]

Veamos cu al es su expresi on en las especicaciones Logit y Probit: Logit:

Probit: Odds= (x0 i) 1 (x0 i) 13

You might also like