Professional Documents
Culture Documents
LECTURA OBLIGATORIA
Regresin Logstica. En Rial, A. y Varela, J. (2008). Estadstica Prctica para la Investigacin en Ciencias de la Salud. Corua: Netbiblo. Pginas 223-246.
Modelos Multivariantes
INTRODUCCIN
Predecir la probabilidad de que un evento ocurra
Gran utilidad en medicina y Ps. Clnica: identificar factores de riesgo y factores de proteccin, estimar cunto aumenta la probabilidad de sufrir una patologa si se dan una serie de caracterstica o condiciones, Logstica Binaria y Logstica Multinomial
Modelos Multivariantes
EJEMPLOS
ESTIMAR LA PROBABILIDAD DE QUE UN INDIVIDUO SUFRA UN INFARTO A PARTIR DE: Nivel de colesterol Edad Presin arterial Sexo Antecedentes familiares ESTIMAR LA PROBABILIDAD DE QUE UN DETERMINADO SUJETO SUFRA ESQUIZOFRENIA, EN FUNCIN DE UNA SERIE DE VIs PREDECIR EL XITO O FRACASO DE UNA TERAPIA CONOCER LAS VARIABLES QUE EXPLICAN LA ABSTENCIN ELECTORAL, el absentismo laboral, el burnout, etc.
Modelos Multivariantes 4
FILOSOFA
Qu hace la RL?
A partir de las puntuaciones de los sujetos en diferentes VIs, se estiman probabilidades para poder hacer pronsticos. Se estima la probabilidad (P) de que la VD presente uno de los dos valores posibles ( 0= No se rehabilita; 1= Se rehabilita) en funcin de cmo se comporta en determinadas VI. Si la probabilidad estimada es menor de 0.5 la prediccin ser No se rehabilita.
Modelos Multivariantes 5
P (Y 1) 1 P (Y 1)
Se trata de identificar aquellas variables que implican cambios en ese ratio de probabilidad, aumentndolo o disminuyndolo de forma significativa. La ODD RATIO sera la razn o cociente entre dos ODDs. Permite comparar el pronstico realizado bajo dos situaciones o condiciones distintas (Ej: La proporcin de xito/fracaso escolar es 5 veces menor en familias desectructuradas que en familias estructuradas). Lo que la regresin logstica pretende es identificar aquellas VI que hacen variar esa ODD.
Modelos Multivariantes 6
P (Y 1) Ln 1 P (Y 1)
El LOGIT es, precisamente, la VD en la Regresin Logstica.
Modelos Multivariantes 7
EL MODELO
Dado que debemos llegar a un cociente de Probabilidades, el modelo debe asumir una expresin matemtica particular, concretamente logartmica:
Ln
P (Y 1 P (Y
1) 1)
1 X1
2X2
...
nXn
La regresin logstica utiliza una Funcin de Enlace Logartmica, para pasar de los valores cualesquiera en las VI a predicciones en trminos de un cociente probabilidades y, de ah a una Probabilidad (entre 0 y 1) y , finalmente a un pronstico concreto. El modelo de regresin logstica asume que existe una relacin lineal entre los predictores y el logaritmo de la probabilidad de ocurrencia de un evento, frente a la no ocurrencia de dicho evento (LOGIT).
Modelos Multivariantes 8
SUPUESTOS
Menos exigente que el A.D. No es necesario que las VI
sean mtricas, normales, y ni siquiera cuantitativas. 1. El modelo debe estar especificado correctamente, con las VI relevantes 2. La relacin entre cada VI y el Logaritmo de las ODD debe ser lineal 3. Que no exista multicolinealidad
Modelos Multivariantes
Al igual que en la Regresin Lineal disonemos del mtodo directo (ENTER) y el de Pasos (STEPWISE: Adelante Wald).
Modelos Multivariantes
10
INTERPRETACIN
Qu VI son buenos predictores?
En la Regresin Lineal se recurra a un contraste t para saber si cada uno de los predictores eran o no significativamente distintos de cero. En la RL se recurre al Estadstico de Wald. Un coeficiente positivo implica un aumento en la probabilidad de ocurrencia del evento y negativo una disminucin. Adems Un negativo se corresponde con un ODD RATIO menor de 1 (una desventaja). El SPSS le llama Exp(b) Justamente el valor de Exp(b) indica cunto mejor o peor es el pronstico en funcin de los valores que asume la VI. La VENTAJA o desventaja de una poseer una determinada caracterstica, condicin o factor. Nos permite identificar: FACTORES DE RIESGO y FACTORES DE PROTECCIN Modelos Multivariantes 12
Contrastes particulares
t Student Wald
Mtodo de estimacin
Mnimos cuadrados Mxima verosimilitud
Modelos Multivariantes 13
EJEMPLO
70 pacientes vctimas de accidentes de trfico y con dao cerebral (TCE) Se desea saber si variables como el Tipo de Lesin, la Atencin, el Apoyo Familiar, o laEdad del sujeto influyen en la rehabilitacin del paciente
VD dicotmica: REHABILITACIN
0 (NO SE REHABILITA) 1 (SE REHABILITA)
ATENCIN
0 (NO INMEDIATA) 1 (INMEDIATA)
EJEMPLO
Sea 0= No se rehabilita y 1= Se rehabilita. A partir de los datos de una tabla de contingencia podemos calcular 4 probabilidades:
La probabilidad de que el sujeto se rehabilite frente a la probabilidad de que no se rehabilite (ODD para la rehabilitacin) La probabilidad de que el sujeto se rehabilite frente a la probabilidad de que no se rehabilite, si es que se trata de una lesin focalizada (ODD para la rehabilitacin con lesin focalizada) La probabilidad de que el sujeto se rehabilite frente a la probabilidad de que no se rehabilite, si es que se trata de una lesin difusa (ODD para la rehabilitacin con lesin difusa) El cociente entre las dos ODD, la obtenida para una lesin focalizada y la obtenida para una lesin difusa (ODD RATIO).
Modelos Multivariantes 15
EJEMPLO
Tabla de contingencia REHABILITACAIN * LESIN LESIN DIFUSA REHABILIT ACAIN NO SE REHABILITA Recuento % de LESIN SE REHABILITA Recuento % de LESIN T otal Recuento % de LESIN 19 57,6% 14 42,4% 33 100,0% FOCALIZADA 8 21,6% 29 78,4% 37 100,0% T otal 27 38,6% 43 61,4% 70 100,0%
La probabilidad de que el sujeto se rehabilite frente a la probabilidad de que no se rehabilite (ODD para la rehabilitacin). P/1-P 43/27=1.59, o lo que es lo mismo 43/70 27/70 Es decir, por cada individuo no rehabilitado encontramos 1.59 rehabilitados
Modelos Multivariantes 16
EJEMPLO
Tabla de contingencia REHABILITACAIN * LESIN LESIN DIFUSA REHABILIT ACAIN NO SE REHABILITA Recuento % de LESIN SE REHABILITA Recuento % de LESIN T otal Recuento % de LESIN 19 57,6% 14 42,4% 33 100,0% FOCALIZADA 8 21,6% 29 78,4% 37 100,0% T otal 27 38,6% 43 61,4% 70 100,0%
La probabilidad de que el sujeto se rehabilite frente a la probabilidad de que no se rehabilite, si es que se trata de una lesin FOCALIZADA (ODD para la rehabilitacin con lesin focalizada) 29/8= 3.62 PRIMER DATO: como la ODD focalizada es mayor que la ODD global (ese nivel de la variable hace que aumente la probabilidad de rehabilitacin), se tratara de un FACTOR DE PROTECCIN
Modelos Multivariantes 17
EJEMPLO
Tabla de contingencia REHABILITACAIN * LESIN LESIN DIFUSA REHABILIT ACAIN NO SE REHABILITA Recuento % de LESIN SE REHABILITA Recuento % de LESIN T otal Recuento % de LESIN 19 57,6% 14 42,4% 33 100,0% FOCALIZADA 8 21,6% 29 78,4% 37 100,0% T otal 27 38,6% 43 61,4% 70 100,0%
La probabilidad de que el sujeto se rehabilite frente a la probabilidad de que no se rehabilite, si es que se trata de una lesin difusa (ODD para la rehabilitacin con lesin DIFUSA) 14/19= 0.73 SEGUNDO DATO: si la ODD difusa es menor que la global, ese nivel de la variable hace que disminuya la probabilidad de rehabilitacin y, por tanto, se tratara de un FACTOR DE RIESGO
Modelos Multivariantes 18
EJEMPLO
El cociente entre las ODDs obtenidas con LESIN FOCALIZADA Vs. DIFUSA es 3.62/0.73=4.92; esto es, La ODD RATIO par la variable tipo de lesin sera 4.92. La proporcin de rehabilitados es CASI 5 VECES MAYOR en el caso de una lesin focalizada que de una difusa. Variables en la ecuacin
B Paso a 1 LESIN Constante 1,593 -,305 E.T . ,532 ,352 Wal d 8,952 ,752 gl 1 1 Sig. ,003 ,386 Exp(B) 4,920 ,737
ODD RATIO
TERCER DATO: si para una determinada caracterstica la ODD RATIO>1, poseer dicha caracterstica supondra una ventaja de cara a la probabilidad de ocurrencia de un evento, en este caso rehabilitarse. Si fuese similar a 1, se tratara de una variable irrelevante en trminos de pronstico.
Modelos Multivariantes 19
a. Vari able(s) i ntroducida(s) en el paso 1: EDAD. b. Vari able(s) i ntroducida(s) en el paso 2: LESIN.
Modelos Multivariantes
20
a. Vari able(s) i ntroducida(s) en el paso 1: EDAD. b. Vari able(s) i ntroducida(s) en el paso 2: LESIN.
ln[ odd (Y
Para el Sujeto n 1 (de 19 aos y con lesin difusa) el logaritmo de la ODD de rehabilitarse sera:
ln[ odd (Y
ODD
P 1 P
3
Modelos Multivariantes
3 4
0.75
22
ln[ odd (Y
2.87
INTERPRETACIN: En el caso de UNA LESIN FOCALIZADA por cada paciente no rehabilitado tendramos 17 rehabilitados. En el caso de LESIN DIFUSA por cada paciente no rehabilitado tenemos 3 rehabilitados. Los ingleses apostaran: Si es difusa, 3 a 1 a que se rehabilita; si es focalizada 17 a 1. Existe una manera de cuantificar esa ventaja: la ODD RATIO
Modelos Multivariantes 23
17.6 / 3= 5.87
que es exactamente el valor de EXP(B)
Variables en la ecuacin B Paso a 1 Paso b 2 EDAD Constante LESIN EDAD Constante -,152 4,697 1,770 -,154 3,950 E.T . ,040 1,130 ,665 ,041 1,177 Wal d 14,808 17,272 7,086 13,736 11,258 gl 1 1 1 1 1 Sig. ,000 ,000 ,008 ,000 ,001 Exp(B) ,859 109,623 5,872 ,858 51,915
Modelos Multivariantes
24