Professional Documents
Culture Documents
Sumatoria
l Valor de Funcin de Mxima Verosimilitud
l Valor de Funcin de Mxima Verosimilitud
Restringido
Desviacin estndar
E[y|X] Esperanza condicional
[ ]
X
X y E
n
L
i
b
r
e
S
e
p
a
r
a
d
o
No S
REALIZADO POR: LEONARDO CALLE HURTADO
FUENTE: HIJDR
2.2.4. Inclinacin Sexual vs. Mejora
En la variable Inclinacin Sexual se encontr que en los grupos
Heterosexual y Homosexual la mayora de los pacientes
tuvieron mejora clnica tras los tratamientos. Y slo en el grupo
Bisexual hubo el 75 % de pacientes que no tuvieron dicha
mejora.
Grfico IV
Diagrama Porcentual entre las Variables Inclinacin Sexual y Mejora
27%
40%
75%
73%
60%
25%
0.00%
10.00%
20.00%
30.00%
40.00%
50.00%
60.00%
70.00%
80.00%
Heterosexual Homosexual Bisexual
No S
REALIZADO POR: LEONARDO CALLE HURTADO
FUENTE: HIJDR
2.2.5. Nivel de Instruccin vs. Mejora
Como se observa en el Grfico V, la mayora de los pacientes de
los 4 grupos de la variable Nivel de Instruccin (Primaria,
Secundaria, Superior y Ninguna) tuvieron mejora clnica luego de
los tratamientos antirretrovirales.
Grfico V
Diagrama Porcentual entre las Variables Nivel de Instruccin y Mejora
17%
38%
35%
0%
83%
62%
65%
100%
0.00%
20.00%
40.00%
60.00%
80.00%
100.00%
120.00%
Primaria Secundaria Superior Ninguna
No S
REALIZADO POR: LEONARDO CALLE HURTADO
FUENTE: HIJDR
2.2.6. Tratamiento vs. Mejora
La variable Tratamiento tiene en TRAT1 (Combivir + Strocrin),
TRAT2 (Combivir +Viracept), TRAT3 (Videx + Zerit +Stocrin), y
TRAT5(Combivir +Crixivan) resultados de evidente mayora con
respecto a la mejora clnica de dichos pacientes en cada uno de
stos grupos.
Grfico VI
Diagrama Porcentual entre las Variables Tratamiento y Mejora
27%
43%
21%
10%
73%
79%
0% 0% 0% 0%
100%
100% 100%
100%
90%
57%
0%
20%
40%
60%
80%
100%
120%
TRAT1 TRAT2 TRAT3 TRAT4 TRAT5 TRAT6 TRAT7 TRAT8
No S
REALIZADO POR: LEONARDO CALLE HURTADO
FUENTE: HIJDR
2.2.7. Tiempo en Tratamiento vs. Mejora
Cada tratamiento tiene un intervalo de tiempo, as que en el Grfico VII
se dividi a esta variable en 5 grupos (entre 1 y 6 meses, entre 7 y 12
meses, entre 13 y 18 meses, entre 19 y 24 meses, y entre 25 y 30
meses de duracin), dependiendo de la duracin de los tratamientos a
los cuales fueron sometidos los pacientes
As, se observa que con el paso del tiempo la propensin a mejorar
aumenta, pero se puede decir que dichos porcentajes son de inters
hasta los 18 meses; ya que los pacientes que han recibido tratamientos
por ms de se lapso representan el 8 % del total de pacientes
observados.
Grfico VII
Tabla Porcentual entre Tiempo en Tratamiento por Grupos y Mejora
35%
31%
25%
0%
75%
100%
50%
50% 65%
69%
0%
20%
40%
60%
80%
100%
120%
1-6 7-12 13-18 19-24 25-30
Tiempo en Tratamiento
No S
REALIZADO POR: LEONARDO CALLE HURTADO
FUENTE: HIJDR
2.2.8. Tipo de Enfermedad vs. Mejora
En cuanto a la variable Tipo de Enfermedad en sus 3 grupos (Universal,
Primaria y Secundaria), la mayora de los pacientes tuvieron mejora
clnica luego de los tratamientos. Teniendo el ms alto porcentaje de
mejora (82 %) al grupo de pacientes que tenan el Tipo de Enfermedad
1 (Universal).
Grfico VIII
Diagrama Porcentual entre las Variables Tipo de Enfermedad y Mejora
18%
40%
36%
82%
60%
64%
0.00%
10.00%
20.00%
30.00%
40.00%
50.00%
60.00%
70.00%
80.00%
90.00%
ENF1 ENF2 ENF3
No S
REALIZADO POR: LEONARDO CALLE HURTADO
FUENTE: HIJDR
2.2.9 Diferencia de Peso vs. Mejora
En el grfico IX, es evidente que el aumento de peso de los pacientes
durante el tratamiento es un indicador de mejora.
Grfico IX
Diagrama Porcentual entre las Variables Diferencia de Peso y Mejora
60%
19%
40%
81%
0.00%
20.00%
40.00%
60.00%
80.00%
100.00%
Baj Subi
No S
REALIZADO POR: LEONARDO CALLE HURTADO
FUENTE: HIJDR
CAPTULO 3
3. ESTIMACIN DEL MODELO
3.1. El Modelo
El modelo utilizado es una tcnica no lineal, que nos permite explicar
una variable binaria en trminos de otras variables cualitativas y
cuantitativas. El modelo est conformado por la variable dependiente
MEJ ORA y las variables explicativas SEXO, EDAD, ESTADO CIVIL,
NIVEL DE INSTRUCCIN, INCLINACIN SEXUAL, TRATAMIENTO,
TIEMPO EN TRATAMIENTO, ENFERMEDAD y DIFERENCIA DE
PESO. Es decir: MEJ ORA =f(SEXO, EDAD, ESTADO CIVIL, NIVEL
DE INSTRUCCIN, INCLINACIN SEXUAL, TRATAMIENTO, TIEMPO
EN TRATAMIENTO, ENFERMEDAD, DIFERENCIA DE PESO).
En el anlisis de la mejora clnica de los pacientes, la variable
dependiente representa una de dos alternativas. En este caso, se
interpreta 1 como la mejora del paciente y 0 en caso contrario.
En el estudio de variables de naturaleza discreta, es conveniente utilizar
los modelos de respuesta cualitativa, estimados usualmente por mxima
verosimilitud. En este estudio se considera a cada paciente que est en
el grupo de personas infectadas con VIH del Hospital de Infectologa
J os Daniel Rodrguez quienes tiene dos alternativas despus del
tratamiento antirretroviral (mejora clnica no).
3.2. Regresin Logstica y Probit
Inicialmente se pretendi utilizar los dos modelos: Probit y Logit,
pero dado que la representacin de ambas funciones, as como
los resultados obtenidos con la modelizacin de sus
correspondientes mtodos, son muy similares, por una mayor
simplicidad en trminos interpretativos y computacionales el
modelo Logit suele ser el preferido en la mayora de las
aplicaciones prcticas.
De manera que:
=
contrario caso en
clnica mejora hay si
y
j
0
1
La variable dependiente, al tomar los valores de 1 y 0, indica si
este evento ocurre o no, y
>
=
contrario caso en CV
mejora de evidencia existe LE INDETECTAB CV
y j
, 0
,
*
CV: Carga Viral
Se denota como
j
P la probabilidad (condicional) de ocurrencia
del evento. As, lo que el modelo de respuesta binaria intenta
representar es la probabilidad
j
P condicionada a un set de
informacin
j
, el cual consiste de variables explicativas y
predeterminadas
( ) ( )
j j j j j
y E 1 y Pr P = = (1)
Se tiene un vector
j
X que denote un vector de k variables que
pertenecen al set de informacin
j
, incluyendo el trmino
constante. Entonces, un modelo de regresin lineal especificara
( )
j j
y E como
j
X ,
j j j
u X y + =
*
(2)
donde ( )
2
0, N ~
j
u
Las variables contenidas en el vector
j
X explican a la variable
MEJ ORA (Y), de manera que,
) , X ( F 1 ) 0 Y Pr(
) , X ( F ) 1 Y Pr(
= =
= =
(3)
donde el vector de parmetros refleja el impacto que X tiene
sobre la probabilidad. Dado que ( )
j j
y E es una probabilidad,
sta se restringe a la distribucin normal acumulada,
determinando el modelo de regresin PROBIT.
( ) dX X
2
1
exp
2
1
x
2
x
(4)
Tal especificacin resuelve los problemas de utilizar el modelo de
probabilidad lineal, cumplindose,
0 ) 0 Y Pr( lm
1 ) 1 Y Pr( lm
X '
X '
= =
= =
+
(5)
Los modelos de eleccin binaria se estiman habitualmente por
mxima verosimilitud. En el caso de la variable MEJ ORA, se
tiene:
( ) ( )
=
n
i
j
j
j
j
X
y
X
y y
1
1 ln 1 ln ,
l (6)
siendo esta ecuacin la funcin de log-verosimilitud a utilizarse en
las estimaciones de los modelos PROBIT, donde ( ) es la
distribucin normal acumulada.
Es importante observar que los parmetros estimados, as
como los de cualquier otro modelo de regresin no lineal, no son
necesariamente los efectos marginales. Sin embargo, una
aproximacin es:
[ ]
( )
i
X
X
X y E
'
=
(7)
siendo ( ) la funcin de densidad normal estndar. La ecuacin
7 se interpreta como el efecto marginal de la variable X sobre la
probabilidad condicional.
En trminos generales, los coeficientes de una regresin PROBIT
son insesgados y eficientes en relacin con el trmino de
perturbacin estocstica, y similares a los de las regresiones
LOGIT.
) 1 /( ) 1 /( 1 ) , 1 Pr(
/ / / /
x x x x
i i
e e e e x y + = + = =
(8)
El cual est basado en la funcin de distribucin logstica
acumulada. Existen distintos tipos de modelos Logit en funcin de
las caractersticas que presenten las alternativas que definen a la
variable endgena, que es la variable que va a medir el nmero
de grupos existentes en el anlisis discriminante. De manera que
se utilizar el modelo Logit de tipo dicotmico.
Es menester definir lo siguiente:
Valor p (Prob.): es el mayor nivel de significancia bajo el cual se
rechaza o no la hiptesis nula Ho.
Funcin Log Verosimilitud ( l ): es el mximo valor de la log
funcin de verosimilitud.
Funcin Log Verosimilitud Restringido ( l ): es el mximo valor
de la log funcin de mxima verosimilitud, donde todos los
coeficientes (excepto el coeficiente) se restringuen a cero.
Estadstico R/V: prueba que bajo la hiptesis nula de que todos
los coeficientes son cero, con excepcin de la constante. Este es
el anlogo al estadstico F, que se plantea en regresin lineal el
cual prueba la significancia global del modelo.
3.2.1. Representacin de la Funcin Logstica
Para el caso ms sencillo de utilizar una nica variable
explicativa se trata de encontrar la relacin que existe entre
la variable explicativa y la endgena. Las posibilidades que
se plantean son:
1. Que la funcin que relaciona ambas variables sea una
funcin lineal.
Se tiene el siguiente caso:
Y
i
= +X
i
+
i
(9)
Donde:
1 si ocurre el acontecimiento objeto de estudio
Y
i
0 en caso contrario
X
i
=Variable explicativa
i
=Variable aleatoria con E(
i
j
) =0 y E(
i
) =0
La estimacin de este modelo plantea problemas de:
No normalidad de la perturbacin aleatoria.
Heterocedasticidad (varianza variable).
El rango de variacin de la estimacin no est
acotado entre 0 y 1, lo cual carece de sentido
cuando lo que se pretende estimar es una
probabilidad.
2. Para solucionar los problemas que plantea el modelo de
probabilidad lineal de probabilidad se realiza la
modelizacin a travs del uso de funciones no lineales
que permitan acotar el rango de la estimacin. Esto se
consigue a travs del uso de cualquier funcin de
distribucin. Las funciones ms comnmente utilizadas
han sido la funcin logstica, que da lugar a la
modelizacin Logstica, y la funcin de distribucin de la
normal tipificada, que da lugar a la modelizacin Probit.
La funcin logstica es una correcta aproximacin a la
situacin en que:
E(yi) ->0 cuando Xi ->-
E(yi) ->1 cuando Xi ->+
Grfico X
Curva de la Funcin de Distribucin Logstica
+X
i
(+X
i)
REALIZADO POR: LEONARDO CALLE
HURTADO
La expresin del modelo Logit para el caso de una
nica variable explicativa es la siguiente:
i i i X
X
i X i
X
e
e
e
Y
i
i
i
+ = +
+
= +
+
=
+
+
) (
1 1
1
(10)
De manera que los valores ahora si variarn en el
rango (0 1) y se interpretarn como la probabilidad
de ocurrencia del acontecimiento objeto de estudio.
3.2.2. Interpretacin de los Parmetros Estimados
La funcin logstica puede fcilmente ser expresada como una funcin lineal
quedando como sigue:
i
X
i
i
X e Ln
Y
Y
Ln
i
+ = =
+
) (
1
(11)
Con lo cual, la interpretacin del coeficiente estimado se
debe realizar como sigue:
El signo del coeficiente indica la direccin en que se
mueve la probabilidad al aumentar la variable
explicativa correspondiente.
El valor e