You are on page 1of 54

EPIDEMIOLOGIA ANALITICA

Estudios de cohortes
Introduccin
A lo largo de su desarrollo, la epidemiologa se ha
preocupado de dos objetivos fundamentales:

Probar causalidad e,
Identificar riesgo.

La preeminencia de cada uno de estos objetivos ha estado


determinada por el modelo conceptual de saludenfermedad imperante.
Es as como la causalidad encuentra su mayor
protagonismo en las relaciones mrbidas, entre agente y
husped, formuladas en los modelos de las enfermedades
infecciosas.
El nfasis en el riesgo, en cambio, se desarrolla
fuertemente con relacin al concepto de enfermedades
crnicas.
El logro de los dos objetivos sealados ha obligado a la
epidemiologa a formular diseos de investigacin de
distinto grado de complejidad. Entre estos diseos el
estudio experimental es reconocido como el nico capaz de
probar causalidad.
En cambio una buena aproximacin al riesgo puede
obtenerse con los estudios observacionales de casos y
controles y, ms rigurosamente desde el punto de vista
conceptual, con los estudios de cohorte.
Los estudios de cohorte son planteados una vez que se
dispone de informacin acerca de eventuales factores
asociados al dao a investigar. Por lo tanto, previamente
deben haberse recorrido las etapas propias del ciclo de
investigacin epidemiolgica.

Definicin:
Los estudios de cohorte 1 consisten en el seguimiento de
una o ms cohortes de individuos sanos que presenta
diferentes grados de exposicin a un factor de riesgo en
quienes se mide la aparicin de la enfermedad o condicin
en estudio.
Estos diseos de investigacin se clasifican, segn los
criterios taxonmicos clsicos, como estudios
observacionales, analticos y longitudinales prospectivos.
La categora observacional se refiere a la imposibilidad que
el investigador tiene de manipular la(s) variable(s)
independiente(s), lo cual los distingue de los estudios
experimentales.
Por tratarse de estudios cuyos resultados permiten un
anlisis ms sofisticado que el de los estudios descriptivos,
son considerados estudios analticos. Por definicin, deben
permitir la verificacin de hiptesis de trabajo.
Finalmente, los estudios de cohorte se basan en un
seguimiento en el tiempo de uno o ms grupos humanos
que difieren entre s por la presencia de una o ms
variable(s) independiente(s).
Por esta razn se les denominan estudios prospectivos,
concepto incorpora implcitamente el carcter longitudinal
de los mismos. Otros estudios longitudinales son los de
casos y controles, sin embargo en stos el sentido de la
observacin es retrospectivo.
Diseo
Los estudios de cohorte tienen un diseo o formato
fundamental. Se trata del seguimiento de individuos
caracterizados por estar libres del dao en estudio al inicio
de la observacin.
En estos individuos se observa, a medida que pasa el
tiempo, la aparicin de casos de enfermedad (outcome) a lo
largo del tiempo segn posean o no estos un atributo
(variable independiente o exposicin) que se cree asociado
al desenlace (outcome) en estudio.

Slo en contadas ocasiones la constitucin de los grupos


considera la exposicin como un suceso dicotmico (s/no o
expuesto/no-expuesto). Por su estructura y complejidad el
investigador aprovecha este diseo para evaluar con mayor
detalle el resultado de una exposicin, lo que supera las
limitaciones de exposiciones dicotmicas del tipo
Expuesto/no expuesto.
Lo habitual es que el estudio permita la subdivisin de la
cohorte expuesta segn diferentes niveles de exposicin
(ejemplo de exposicin : tabaquismo, el que puede ser
categorizado en diferentes niveles de consumo o tiempo de
exposicin; exposicin laboral a elementos txicos, que
pueden categorizarse en magnitud y tiempo de exposicin)
Para estos efectos los individuos son agrupados de tal
manera que los grupos tengan el mximo de caractersticas
similares entre y puedan ser comparables y as difieran,
idealmente, slo en la variable independiente en estudio.
(Figura 1).
Figura 1. Esquema bsico de estudios de cohorte

Lo habitual en un estudio de cohorte es que el investigador


sea contemporneo con el inicio del seguimiento de los
grupos, vale decir, asista a la agrupacin de los individuos
sanos. En este caso se acua el trmino de estudio
concurrente.
Por el contrario, si el investigador no participa en forma
contempornea de la formacin de las cohortes y sta se
form en el pasado pero es susceptible de ser seguida en el
tiempo, se habla de un estudio no concurrente (Historical
cohort studies) (figura 2).

Figura 2.
Esquemas de estudios prospectivos no-concurrente y
concurrente

Los elementos bsicos de un estudio de cohorte pueden


resumirse en el siguiente listado:

Formulacin clara de una hiptesis de trabajo a


investigar
Identificacin de los grupos a ser estudiados

Definicin de la exposicin y de la forma en que sta


ser medida

Definicin y medicin de las posibles variables


confundentes involucradas

Definicin de la(s) variable(s) dependiente(s)


(outcomes), as como de la forma en que ser(n)
medida(s)

Anlisis de datos

Interpretacin de resultados

Estructura adoptada por los estudios de cohortes


Los estudios de cohorte pueden adoptar algunas
variaciones en su diseo bsico, dependiendo del nmero
de cohortes involucradas y su origen. Se reconocen en
general las siguientes variaciones:
1. Cohorte nica (antes y despus): el ejemplo ms
citado para ilustrar esta variante lo constituye el
estudio de incidencia (casos nuevos) de leucemia

linftica aguda en la poblacin Japonesa residente en


Hiroshima despus de la explosin nuclear.
La frecuencia de casos nuevos se compar con la
existente en el mismo grupo de personas antes de
ocurrida la explosin y posterior exposicin masiva a
radiacin. Como se advierte en el ejemplo, la cohorte
nica corresponde a un grupo de individuos que
comparten (o compartieron) una misma condicin
(exposicin) en los cuales se mide la presencia de una
variable dependiente predefinida (outcome). En este
caso se compara la incidencia (casos nuevos) de la
enfermedad en los mismos individuos antes y despus
de ocurrida la exposicin a la variable independiente.
2. Dos cohortes: corresponde al formato clsico ya
descrito en el cual se seleccionan dos grupos de
individuos sanos que slo difieren en que uno presenta
el factor de exposicin (cohorte expuesta) y el otro no
lo presenta (cohorte no expuesta).
3. Cohortes mltiples: en este caso se trata de generar
mltiples grupos, de individuos sanos, con diferentes
grados de exposicin al factor de riesgo. En este caso
se compara la incidencia de enfermedad de cada
grupo en relacin a una cohorte de control, de
preferencia la de menor o con nula exposicin al factor
de riesgo. Son tiles en la evaluacin de relaciones de
dosis-respuesta.
4. Estudio de casos y controles anidados (nested case
control studies). Los estudios de cohorte permiten la
identificacin de un pool de sujetos enfermos
concluido el periodo de observacin o seguimiento
(follow- up).
El investigador conoce detalladamente las
caractersticas ms relevantes de este grupo de
personas en cuanto a eventuales exposiciones y otras
covariables. Aprovechando este hecho, es posible
constituir un esquema de diseo de casos y controles
seleccionando aleatoriamente controles entre el grupo
de sujetos no afectados despus del periodo de
seguimiento (Figura 3). Tiene especial aplicacin en

aquellas situaciones en que los procedimientos


diagnsticos para detectar casos son de elevado costo,
en particular en el estudio de enfermedades
ocupacionales.
Este diseo hbrido contribuye al control de sesgos,
particularmente los vinculados con medicin, problema
frecuente de los estudios de caso y controles.
Figura 3. Esquema de un estudio de casos y controles
anidados (nested case control studies)

Principales usos de los estudios de cohorte

Ensayar hiptesis de causalidad y de riesgo: los


estudios de cohorte son, entre los diseos
observacionales, los que proveen la ms rigurosa
informacin en favor de la causalidad y del riesgo.
Como ya se ha mencionado, la certeza absoluta del
proceso causal slo es capaz de proporcionarla el
diseo experimental. Tienen la ventaja adicional de
seguir el mismo sentido de la lgica del pensamiento
clnico (la exposicin precede al desenlace).
Medir la incidencia de una enfermedad o condicin:
uno de los productos de mayor inters en un estudio
de cohorte es la obtencin de tasas de incidencia de la
enfermedad o condicin en estudio.
La tasa de incidencia de una enfermedad corresponde
al total de casos nuevos de enfermedad que se
presentan en un grupo de individuos en un perodo de
tiempo determinado. Dado que una condicin
indispensable en estos diseos es que las cohortes

estn constituidas por individuos sanos, en la prctica


un estudio de esta naturaleza permite medir tres tipos
de tasas de incidencia : tasa de incidencia de la
enfermedad para la cohorte expuesta al factor de
riesgo, para la cohorte no expuesta y para ambos
grupos en conjunto.

Permiten la cuantificacin del riesgo: la relacin entre


tasa de incidencia de sujetos expuestos con relacin a
la de los no expuestos da origen al llamado riego
relativo que permite establecer la magnitud de riesgo
asociado a la exposicin analizada.

Estudiar la historia natural de la enfermedad: los


estudios de cohorte permiten realizar un seguimiento
de individuos sanos con criterios y mtodos
diagnsticos estandarizados. De sta manera es
posible reconocer precozmente los elementos
caractersticos de una enfermedad, as como tambin
factores asociados a sus etapas ms tempranas.

Explorar el efecto de exposiciones de baja frecuencia


poblacional: en el campo de enfermedades
ocupacionales, es posible observar el comportamiento
de cohortes de sujetas sometidos a exposiciones de
rara ocurrencia en la poblacin general.

Estudiar mas de una consecuencia para la salud


derivado de exposiciones: en un estudio de cohorte el
investigador puede definir mas de un outcome de
inters. Por ejemplo, en la determinacin del efecto de
un factor de riesgo se puede emplear medidas de
incidencia o de mortalidad. En estudios prospectivos
destinados a evaluar el rol de parmetros
antropomtricos al nacer y asma bronquial, pueden
utilizarse diferentes formas (fenotipos) para evaluar
dicho outcome (sibilancias, sibilancias nocturnas,
valores espiromtricos o combinaciones entre stos).

Algunas limitaciones propias de estos diseos

No prueban necesariamente causalidad (recordar que


la exposicin no es asignada aleatoriamente en la(s)
cohorte(s) estudiadas).
Pueden requerir de un largo perodo de seguimiento
de la(s) cohorte(s). Esto conspira contra la integridad
del estudio pues durante el seguimiento individuos
pueden perderse y/o puede alterarse su condicin de
exposicin (el sujeto que no fumaba al inicio del
seguimiento, comenz a hacerlo posteriormente).

Tienen utilidad limitada en el estudio de enfermedades


de baja prevalencia o de prolongado perodo de
incubacin pues el seguimiento debe ser ms
prolongado.

Son generalmente estudios de mayor complejidad (en


cuanto a diseo, costo y anlisis) comparados con
otros estudios analticos.

Pueden ser negativamente afectados por la prdida de


sujetos en el seguimiento. Adems de la reduccin en
la potencia del estudio, si la prdida de sujetos afecta
heterogneamente a las cohortes, puede generarse
sesgo de seleccin.

Pueden ser afectados por otras exposiciones,


eventualmente no consideradas en el diseo que
puedan influir en un mayor o menor riesgo de
presentacin del desenlace u outcome.

1. Palabra derivada del Latn, referida a una de las 10


divisiones de las antiguas legiones Romanas.
| Volver al texto |

Estudios de cohortes II
Medidas a las que dan origen los estudios de cohorte
Un estudio de cohorte permite obtener informacin sobre
incidencia y a partir de sta, indicadores de riesgos
absoluto y relativo.

Tipos de cohorte
Se denomina cohorte cerrada a aquella cuyos miembros
son reclutados en el mismo periodo de tiempo y a la cual
no ingresan personas durante el periodo de seguimiento. En
consecuencia, en esta modalidad el total de miembros de la
cohorte tiene perodos de seguimiento que comienzan al
mismo tiempo.
Cohorte abierta o dinmica es aquella en la cual sus
integrantes pueden ingresar a seguimiento en diferente
momento durante el periodo que este dure. Por tanto, los
miembros de esta cohorte pueden tener tiempos de
exposicin heterogneos.
Incidencia
El seguimiento de individuos sanos por un perodo
determinado de tiempo permite medir el nmero de casos
de una enfermedad que aparecen en dicho perodo. Esta
cifra constituye la tasa de incidencia de la enfermedad en
estudio que puede ser medida para la cohorte expuesta (Ti
exp), la no expuesta (Ti noexp) y para ambas en conjunto
(Ti.).
La incidencia acumulada se calcula considerando todos los
sujetos que presentaron el outcome en estudio
independientemente del momento en el cual lo presentaron
(cumulative risk). Su clculo aplica cuando se trate de una
cohorte cerrada.
Para el caso particular de un diseo de cohorte en que se
permita eliminar o ingresar individuos a las cohortes
despus de haber iniciado el seguimiento (cohortes
abiertas) seguimiento), se prefiere el trmino densidad de
incidencia. (incidence rate)
La densidad de incidencia suma todos los tiempos con que
efectivamente contribuyeron los individuos estudiados. El
indicador se construye dividiendo el total de enfermos
encontrados a lo largo del estudio por el total del tiempo de
seguimiento (tiempo -persona) y amplificando segn
corresponda.

Riesgo
El clculo de incidencia de la enfermedad en expuestos y no
expuestos permite evaluar riesgo asociado a la condicin de
exposicin.
La relacin matemtica que se establezca entre estas dos
medidas permite el clculo de a lo menos seis expresiones
de riesgo:

Riesgo Relativo (en la literatura anglosajona el trmino


Risk Ratio corresponde al clculo utilizando incidencia
acumulada)
El trmino Rate ratio se utiliza cuando se utiliza
densidad de incidencia en el clculo,

Riesgo Atribuible,

Riesgo Atribuible Porcentual (fraccin etiolgica)

Riesgo Atribuible Poblacional.

Riesgo Atribuible Poblacional Porcentual

Para explicar el sentido de cada una de estas medidas se


puede recurrir a la tabla tetracrica o de doble entrada, en
este caso, utilizando incidencia acumulada como medida de
riesgo:

expuestos
no expuestos

enfermos
A
C
A+C

sanos
B
D
B+D

A+B
C+D
A+B+C+D

Observe que en este diseo el sentido de lectura de esta


tabla de 2 x 2 es horizontal (filas), a diferencia del diseo
de casos y controles, que en este caso sera vertical
(columnas).
Se debe notar que a diferencia de los estudios de caso y
controles, el investigador fija el total de ambas filas, (A +
B) y (C + D) respectivamente)

Celda A: expuestos que desarrollan la enfermedad


(outcome positivo)
Celda B: expuestos que no desarrollan la enfermedad
(outcome negativo)

Celda C: no expuestos que desarrollan la enfermedad


(outcome positivo)

Celda D: no expuestos que no desarrollan la


enfermedad (outcome negativo)

- Tasa de incidencia en expuestos: Casos nuevos


detectados en el seguimiento en la cohorte de personas
expuestas.
T I Exp = A / A + B
- Tasa de incidencia en no expuestos. Corresponde al
cuociente entre el total de casos detectado en relacin en la
cohorte no expuesta a. factor.
T I No Exp = C / C + D
- Riesgo Relativo: Es el cuociente entre la tasa de incidencia
de la enfermedad en expuestos y la incidencia en no
expuestos. Permite conocer la magnitud de riesgo o
proteccin asociada a la exposicin estudiada. Carece de
unidades de medida.
RR= (A /A+B)
(C /C+D )
Clculo del Intervalo de confianza para el valor del
Riesgo Relativo:

- Riesgo Atribuible (RA): Es la diferencia aritmtica entre la


incidencia de la enfermedad en expuestos y la incidencia en
no expuestos. Expresa la magnitud de la tasa de incidencia
en los expuestos que es atribuible slo al factor en estudio.
Tiene unidades de medidas.
RA = ( A / A +B ) - ( C / C + D )
- Riesgo Atribuible Porcentual o fraccin etiolgica:(RA%):
es el cuociente entre el Riesgo Atribuible y la incidencia de
la enfermedad en expuestos, amplificado por 100. Expresa
el porcentaje que representa el Riesgo Atribuible respecto
de la incidencia de enfermedad en expuestos.
RA% = (( A / A+B ) - ( C / C+D )) X 100
( A / A+B )
O bien:
RA% = RA / ( A/ A+B)
- Riesgo Atribuible Poblacional (RAP): es la diferencia
aritmtica entre la incidencia de la enfermedad en la
poblacin general y la incidencia en la poblacin no
expuesta al factor de riesgo. Expresa el valor terico de
incidencia imputable al factor de riesgo en la poblacin.
R.A.P.= ( A+C / A+B+C+D ) - ( C / C+D )
- Riesgo Atribuible Poblacional Porcentual: Es el cuociente
entre el Riesgo Atribuible Poblacional (RAP) y la incidencia
de la enfermedad en la poblacin total, amplificado por
100.
Expresa el porcentaje que representa el Riesgo Atribuible
Poblacional respecto de la incidencia de la enfermedad en el
total de individuos.
RAP%= ( A + C / A+B+C+D ) - ( C / C+D ) X 100
A+C / A+B+C+D

Ejemplo:
Un Estudio de cohorte diseado para estudiar en 200
sujetos el riesgo de desarrollo de cncer del pulmn segn
el hbito de fumar de ellos, arroj los siguientes resultados
despus del seguimiento:

Exposicin +
Exposicin -

cncer
20
5
25

sanos
80
95
175

100
100
200

De acuerdo a estos valores se obtienen los siguientes


resultados:
Riesgo Relativo= 20/100 = 4
5/100
Observe una salida del programa Epi-Info con los valores de
intervalo de confianza calculados con un 95% de confianza.

Riesgo atribuible = (20/100) - (5/100)


= 15 casos por cada 100 personas
Riesgo Atribuible porcentual (RA%)
RA% = (20/100) - (5/100) = 0,75 (75%)
20/100

Riesgo Atribuible Poblacional (RAP)


RA = (25/200) - (5/100) = 0,075
Riesgo atribuible poblacional porcentual (RAP%)
RAP% = (25/200) - (5/100) = 0,60
(60%)
(25/200)
Observe una salida del programa Epi-Info calculando los
valores anteriores.

Si se utiliza en el seguimiento de los individuos el concepto


de tiempo-persona, se puede calcular densidad de
incidencia para los grupos expuestos y no expuestos
respectivamente. La estructura de la tabla tetracrica
adopta una forma diferente a la del caso de incidencia
acumulada.
Casos
Exposicin +
Exposicin -

A
B

Total tiempo-persona
seguimiento
T1
T2

En este caso el clculo de densidad de incidencia


corresponde a:
Densidad de incidencia en expuestos = a/ T1
Densidad de incidencia en no expuestos = b/ T2

Rate Ratio = a/T1


b/T2
Otra forma de presentar los resultados de un estudio de
cohortes es mediante la utilizacin de la razn de
mortalidad estandarizada (RME).
La RME compara el nmero de casos o de muertes por
enfermedad con una poblacin de referencia o estndar y
representa la razn entre el nmero de casos observados
respecto del nmero de casos esperados de tener la
poblacin estudiada el mismo riesgo de morbilidad o
mortalidad de la poblacin de referencia.
A modo de ejemplo, en el siguiente hipottico ejemplo se
tiene la informacin acerca de las tasas de incidencia,
medidas en tiempo-persona de trabajadores expuestos a un
determinado agente ambiental, segn tres categoras de
edad:
Tabla 1. Casos observados despus de un periodo t
de seguimiento en trabajadores varones, segn
grupo de edad
Grupos de
edad
30 a 39
40 a 49
50 a 59
Total

Muertes
observadas
6
12
35
53

Aos-persona de
seguimiento
10,000
10,000
10,000

Si se utiliza una poblacin de referencia, por ejemplo,


proveniente de la poblacin general, de la cual se conoce
las tasas de incidencia, es posible estimar el nmero
esperado de muertes en la poblacin estudiada (Tabla 2)
Tabla 2. Casos esperados de enfermedad de acuerdo
a tasas de incidencia de poblacin de referencia,
segn grupo de edad

Tasa
Grupos Muertes
Aosmortalidad Muertes
de
observadas persona de poblacin esperadas
edad
seguimiento ref ( 10 )
(C x
(A)
(B)
(C)
B)/1000
30 a
6
10,000
0,5
5
39
40 a
12
10,000
1,0
10
49
50 a
35
10,000
2,5
25
59
Total
53
40
Para este ejemplo, la RME corresponder a:
RME = 53 x 100 = 132,5
40
En este caso, en comparacin con la poblacin de
referencia, la poblacin estudiada presenta un exceso de
riesgo de 32,5%, controlado el efecto de la edad en esta
comparacin

Estudios de Casos y controles


Diseos de investigacin casos y controles
Sinnimos: estudios retrospectivos, casos y controles,
casos y testigos, casos no casos.
Este tipo de diseo de investigacin epidemiolgica se
inscribe dentro de la vertiente epidemiolgica analtica, vale
decir, plantean una hiptesis de estudio explcita que el
investigador desea poner a prueba.
Se trata de un diseo observacional, pasivo en cuanto a la
participacin del investigador, el que ordena la informacin
habiendo ya ocurrido los hechos que le dieron origen.

Se requiere previamente que se hayan cumplido los pasos


propios de una investigacin epidemiolgica. Esto es; a la
luz de los hallazgos de la descripcin epidemiolgica
deberan haber surgido hiptesis de trabajo. Es posible
tambin que un estudio descriptivo previo permita
caracterizar adecuadamente el problema de acuerdo a las
variables epidemiolgicas clsicas (tiempo, lugar y
persona).
La(s) hiptesis de trabajo debe ser claramente definida en
las etapas tempranas del diseo del estudio.
Los estudio de casos y controles son de mxima utilidad
para el estudio de enfermedades de baja frecuencia
poblacional y entregan como medida epidemiolgica
especfica un estimador de riesgo 1 , denominado odds
ratio o razn de chances.
Estructura bsica de los estudios de casos y controles
Este esquema analtico se inicia a partir de un grupo,
denominado "casos", constituido por un grupo de sujetos (u
otras entidades) caracterizados por presentar el desenlace,
enfermedad o variable dependiente que se desea estudiar.
Se entiende que el carcter probatorio de esta condicin
debe ser de la mxima rigurosidad, utilizndose para tales
efectos, diferentes mtodos diagnsticos, que pueden ir
desde mediciones de cierta simplicidad (peso, talla, presin
arterial,), hasta sofisticados exmenes o tests diagnsticos.
El sujeto "caso" puede ser un individuo portador de una
enfermedad o incluso una persona que haya fallecido por
tal condicin. Si se trata de sujetos fallecidos, se pueden
utilizar como fuentes de informacin la mejor evidencia
clnica o anatomo-patolgica de la enfermedad en estudio.
Entre estos sujetos "casos" el investigador explora el
antecedente de presencia (o exposicin) en el pasado a una
o ms variables relacionadas con la variable dependiente en
estudio.
Este diseo busca determinar la frecuencia de exposicin a
la(s) variable(s) independientes(s) entre individuos
afectados, la que se comparar con similar frecuencia entre

un grupo de individuos libres de la presencia de


enfermedad, grupo que denominaremos "controles" (Figura
1)
Figura 1. Estructura bsica de un estudio de casos y
controles

La medicin retrospectiva de la exposicin expone a estos


estudios a ocurrencia de sesgos de diferente naturaleza
(Ver error y sesgo).
Si la variable independiente est relacionada con la
enfermedad, esto podra evaluarse mediante la siguiente
formulacin de hiptesis:
H0: Tasa Exposicin en casos = Tasa Exposicin en
controles
H1: Tasa Exposicin en casos Tasa Exposicin en controles
Relaciones de temporalidad entre las variables
estudiadas
El sentido de la evaluacin a la exposicin entre los casos y
los controles es retrospectivo 2 . Esto significa indagar
entre los sujetos por el antecedente de exposicin previo a
la aparicin del desenlace. El establecimiento de un orden
cronolgico entre la presencia de eventuales factores
causales y desenlace pareciera ser intuitivamente sencillo
mediante esta aproximacin metodolgica, sin embargo ello
no es as.
En primer lugar, el conocimiento de las condiciones y
caractersticas en las cuales se produjo la eventual
exposicin son habitualmente desconocidas por el
investigador, dado que no ejerci ningn control o
manipulacin sobre la ocurrencia de las variables (estudio

observacional).
No es posible, por tanto, aseverar categricamente que la
exposicin en estudio precede realmente al efecto o
desenlace estudiado, y, an si esto fuera conocido, este
hecho por s slo no necesariamente lo explicara 3 .
Utilidad de los estudios de casos y controles
Algunas situaciones se prestan mejor que otras para ser
estudiadas con esta metodologa. Se ha hecho mencin ya
que estos estudios requieren de fundamento terico que
permita su sustentacin como alternativas de investigacin.
Entre las ventajas de estos estudios se alude con frecuencia
a su simplicidad. Sin embargo un estudio de casos y
controles puede alcanzar ribetes de alta complejidad
dependiendo del problema estudiado y del grado de control
que el investigador desee tener sobre las fuentes de error y
sesgo que suelen amenazar estos diseos.
El anlisis de un estudio de casos y controles es tambin un
elemento de complejidad variable en el que se puede
requerir de tcnicas de cierta sofisticacin para extraer el
mximo de informacin.. El trabajo de terreno de estos
estudios puede ser extremadamente difcil, particularmente
por la dificultad de encontrar o seleccionar sujetos "control"
adecuados para el estudio.
En trminos generales, estos estudios son de utilidad en las
siguientes circunstancias:

Estudio de enfermedades de baja frecuencia


poblacional (tanto en trminos de incidencia como
prevalencia),
Cuando se requiere un estimador de riesgo como
Riesgo Relativo riesgo previo al desarrollo de un
estudio prospectivo,

Estudio de enfermedades con mas de un agente


etiolgico,

Evaluacin de procedimientos o intervenciones de base


poblacional (programas de screening,
inmunizaciones),

Problemas de salud que requieren un abordaje


relativamente rpido.

Identificacin de casos y seleccin de controles


La definicin de casos es esencial para todos los diseos de
investigacin epidemiolgica pero lo es en particular para
los estudios de casos y controles puesto que es ste su
punto de partida.
Pueden ser identificados y seleccionados de series clnicas o
de registros. Dichos registros facilitan la tarea del
investigador en el sentido de reunir o concentrar a los
sujetos en estudio y explican la tendencia observada de
utilizar centros de atencin de salud como fuente habitual
de provisin de casos.
En oportunidades, sin embargo, puede existir dificultad
para reunir el nmero mnimo de sujetos con determinada
enfermedad 4 . El investigador debe incluir en el estudio
sujetos que tengan la condicin (evitando la ocurrencia de
falsos positivos), considerando la fase y severidad de la
enfermedad que los sujetos tienen al ingresar al estudio.
La inclusin de sujetos en diferentes etapas de la historia
natural de la enfermedad aumenta la probabilidad incluir
sujetos con grados de exposicin heterogneo
exponindose a la ocurrencia de sesgo de seleccin.
Seleccin de los casos

Deben representar adecuadamente la historia natural


de la enfermedad,
Idealmente, seleccionar todos los casos de una
poblacin determinada,
Todos los sujetos portadores de la enfermedad deben
tener igual probabilidad de ser escogido.

Fuente de obtencin de casos: se pueden utilizar diversos


registros mdicos, como ser:

Historias clnicas
Egresos hospitalarios

Estadsticas de morbilidad

Registros mdicos especiales (cncer, otras


enfermedades crnicas)

Registros de sistemas de vigilancia epidemiolgica

Certificados de defuncin o equivalente

Pueden usarse otras fuentes cuando no hay registros


disponibles y se conoce la existencia de casos en la
comunidad. Tal fue el caso de un estudio de casos y
controles destinado a establecer las eficacia de una nueva
tcnica diagnstica en la deteccin de trastornos
extrapiramidales asociado a alta exposicin a manganeso
en mineros del norte de Chile.
Ante la inexistencia de casos nuevos (incidentes) por las
actuales medidas de control ambiental, los casos debieron
ser rastreados en la comunidad en sujetos de avanzada
edad an vivos.
Ocasionalmente la enfermedad a estudiar tiene muy baja
incidencia y slo puede ser estudiada en cohortes 5 de
individuos que deben ser identificadas en la comunidad.
En la literatura anglosajona, los estudios que utilizan casos
obtenidos a partir de registros mdicos de pacientes
hospitalizados o relacionados con la internacin de
pacientes son conocidos como hospital-based studies y
aquellos que identifican casos a partir de la poblacin a
estudiar se denominan population or community-based
studies.
Casos prevalentes y casos incidentes
Los casos obtenidos a partir de registros habituales y que
ya han sido detectados corresponden a los casos
prevalentes pudiendo ser muy variable entre los enfermos
el tiempo transcurrido entre el diagnstico de la condicin.
Alternativamente, los casos pueden ser obtenidos a partir
de los nuevos casos que son detectados a partir del
momento en que se inicia la investigacin (casos
incidentes).

Si se trabaja con casos prevalentes, debe tomarse en


cuenta que los sujetos casos podran haber modificado sus
hbitos o estilos de vida, algunos de los cuales pueden ser
importantes en trminos de exposicin generando sesgo
(ej. Sujetos con cncer de pulmn, en tratamiento, que
dejan de fumar o cambian su lugar de residencia). En este
caso, no debiera llamar la atencin una muy baja tasa de
tabaquismo actual en sujetos con cncer del pulmn,
producto de la modificacin del hbito derivada del
diagnstico.
Seleccin de controles
Las condiciones generales mas relevantes para la seleccin
de los controles son las siguientes:

Deben provenir de la misma poblacin de la cual


fueron seleccionados los casos,
Con la misma probabilidad de exposicin que la de los
sujetos casos,

Exposicin comparable en relacin con otros atributos


generales de la poblacin control (sexo, edad, por
ejemplo),

Mas de un sujeto control puede ser escogido con


relacin a cada caso.

Un sujeto es elegible como control cuando ha tenido la


misma probabilidad de exposicin a la variable
independiente en estudio que la experimentada por el caso,
tanto en cantidad como en oportunidad. Por ejemplo, si se
estudia la relacin existente entre diabetes (variable
dependiente) y embarazo (variable independiente), los
sujetos controles (mujeres, no diabticas), deben tener o
haber tenido la misma probabilidad de embarazarse que las
mujeres-casos.
Nmero de controles
Habitualmente un control es seleccionado por cada caso,
definiendo una relacin 1:1. As, ambos grupos estarn
constituidos por un nmero equivalente de individuos. Sin
embargo, es posible incorporar un nmero mayor de

controles por cada caso, lo que redunda en beneficios


estadsticos (potencia) 6 . Sin embargo, la complejidad del
estudio, su duracin y su costo se ven incrementados por
esta decisin si la relacin casos- controles es 1:2, 1:3 o
mayor. Tambin puede darse el caso de encontrar
relaciones del orden de 1:1,5 o 1:2 ,3 entre casos y
controles.
Tambin pueden utilizarse ms de un tipo de controles,
generando grupos de referencia representativos de
diferentes poblaciones, lo que permite analizar gradientes
de riesgo.
El investigador debe seleccionar basndose en estas
premisas, un nmero mnimo de controles por cada caso,
los que deben ser lo ms parecidos en cuanto a compartir
atributos comunes como sexo, edad, residencia o lugar
geogrfico de vida comn o grupo tnico.
1. Este indicador es un buen estimador del Riesgo
Relativo, La mayor parte de los textos de
epidemiologa sealan que esta estimacin es ms
precisa cuando el outcome o enfermedad estudiada es
de "baja frecuencia" poblacional. Sin embargo no
indican cual es el punto de corte adecuado. Como
orientacin es de utilidad considerar como de "baja
frecuencia" eventos de frecuencia menor o igual a
20% en la poblacin en estudio.
| Volver al texto |
2. Retrospectivo : relativo a tiempo pasado. | Volver al
texto |
3. Para mayor comprensin de esta terminologa revisar
el concepto de Causalidad en epidemiologa.
| Volver al texto |
4. En estricto rigor, esta situacin es de frecuente
ocurrencia en estos estudios puesto que
metodolgicamente ellos tienen especial aplicacin en
el estudio de enfermedades o condiciones de baja
frecuencia poblacional. | Volver al texto |

5. Grupos que comparten caractersticas comunes, como


ser, haber nacido en un mismo periodo o haber tenido
exposicin en un periodo de tiempo similar | Volver al
texto |
6. El incremento del nmero de controles aumenta la
potencia del estudio.Una razn de 1 : 4 (4 controles
por cada caso) produce la mxima ganancia en cuanto
a potencia. (Ver: Epidemiological Reviews 1994 16(1)
y Journal of Chronical Diseases 1976, 29:723-731). |
Volver al texto |

Estudios de Casos y controles II


Comparabilidad de grupos
La comparabilidad de estas caractersticas en ambos grupos
puede ser dejada al azar, asumiendo el riesgo de que
ambos grupos puedan no ser enteramente comparables 1 .
En el caso de que los grupos difieran respecto a algunas de
estas variables, es posible controlar este efecto a posteriori
mediante un procedimiento de ajuste o estandarizacin.
Pareamiento o matching
Otra opcin metodolgica para el control a priori del
efecto de variables de confusin lo constituye el
pareamiento o matching 2 . Este procedimiento consiste en
igualar ambos grupos con relacin a alguna(s)
caracterstica(s), hacindola homognea en ambos grupos
(como ser por ejemplo sexo, edad, su lugar de vivienda o el
nmero de hijos).
As, si se encuentra una asociacin positiva entre un
outcome y una variable de exposicin, se descarta de esta
forma que tal asociacin pueda explicarse, por ejemplo, por
una diferente conformacin de los grupos respecto a sexo,
edad u ocupacin.
Un efecto importante del matching es el aumento en la
eficiencia del estudio, ya que permite circunscribir la
poblacin a estudiar a aquella en la cual la exposicin es
ms representativa.

Por ejemplo, en el estudio de accidentes vasculares y uso


de anticonceptivos orales, el matching por edad podra
restringir el ingreso de un control de edad avanzada (65
aos), en el cual la probabilidad de exposicin a
anticonceptivos orales es baja o cero.
Conceptualmente el matching corresponde a un
procedimiento empleado a priori, en la fase de diseo del
estudio. Ocasionalmente se puede efectuar pareamiento a
posteriori, cuando el investigador decide parear
observaciones una vez recogidos los datos, a partir de un
conjunto de individuos controles que previamente no fueron
sometidos a matching. Sin embargo se prefiere reservar el
trmino matching para aquellos casos en que el
procedimiento se emplea a priori.
El matching se usa tambin cuando se trabaja con variables
confundentes de difcil definicin o medicin, como ser por
ejemplo, las de tipo gentico, psicosocial o relacionada a
comportamientos humanos. En estos casos, los
investigadores suelen utilizar "pares" de sujetos (hermanos,
gemelos, miembros de una familia o grupo social
especfico), con la finalidad de poder estudiar aisladamente
el efecto de la variable de inters habiendo controlado la
influencia de las variables sometidas a pareamiento, las que
se asumen comunes.
Los tipos de variables sometidas a matching pueden ser
variados, y dependern lgicamente del problema a
investigar. Entre las ms frecuentes controladas mediante
este procedimiento las siguientes:

Sexo
Edad

Lugar de residencia

Nivel socioeconmico

Ocupacin

Sistemas de atencin de salud

Antecedentes familiares

Modalidades de matching
Existen varias modalidades de pareamiento o matching.
Dos de las ms utilizadas, dependiendo si este
procedimiento se aplica colectivamente o a observaciones
especficas, son el matching de grupos o de frecuencia y el
matching individual
Figura 1. Modalidades de matching o pareamiento en
estudios de casos y controles

En la modalidad de matching de grupo o de frecuencia se


restringe a priori el ingreso de sujetos en ambos grupos
buscando estudiar a sujetos que representen
adecuadamente tanto la exposicin como el outcome en
estudio (criterios de inclusin).
As, el ingreso al estudio puede estar regulado por
caractersticas tales como sexo, grupo de edad, ocupacin,
lugar de residencia o modalidad de cuidados mdicos. La
contribucin de los grupos en cuanto a eventuales factores
confundentes tiende a ser homognea en casos y controles,
lo que incrementa la potencia del estudio.
En el matching individual, la(s) caracterstica(s) a parear se
definen especficamente para cada caso y cada control
simultneamente. Se podr apreciar que el efecto de este
procedimiento tiene implicancias directas en:

La modalidad de anlisis de la informacin: en este


caso el anlisis se efecta por "pares"o "tros"de
observaciones, a diferencia de la modalidad de

matching por grupos o de frecuencia, en la que se


comparan grupos.
La factibilidad de encontrar adecuados sujetos
controles que ajusten a los requerimientos exigidos en
el matching. A mayor cantidad de variables a "parear",
mayor dificultad de encontrar controles adecuados

En ambos casos, el matching puede considerar mas de un


control por cada caso
Desventajas del matching o pareamiento
Este procedimiento involucra dificultades tcnicas y tericas
en el desarrollo del estudio. El investigador se expone a
encontrar dificultades para encontrar controles adecuados y
en muchos casos debe descartar controles con el
consiguiente riesgo de sesgar las mediciones en el caso de
que la(s) variable(s) a parear no sean de valor
epidemiolgico.
El investigador puede verse enfrentado a la realidad de
encontrar en su base de una alta frecuencia de valores
missing 3, debiendo descartar dichas observaciones o
aplicar procedimientos de estimacin de ellos usando
procedimientos de poca aceptacin epidemiolgica. El
estudio se hace tambin ms largo y por ende, de mayor
costo.
El trmino de overmatching o matching innecesario
(sobrepareamiento) se refiere al uso de esta tcnica
incluyendo innecesariamente variables que pueden no ser
necesariamente variables confundentes.
Por definicin una variable confundente debe estar
relacionada simultneamente con el outcome y la
exposicin. Si este requisito n o se cumple se puede afectar
la eficiencia para detectar diferencias entre ambos grupos
(error de tipo II o ).
Supongamos que en un estudio se efecta matching por
una variable que est relacionada con la exposicin pero no
con el outcome o desenlace. En estricto rigor, no cumple

con los requisitos para ser considerada como variable


confundente.(Figura 2)
Figura 2: Variable de tipo no confundente

El efecto de este matching ser la observacin de una


mayor tendencia a encontrar pares de casos y controles
concordantes para la exposicin en estudio. Ya que la
variable V pareada no se relaciona con el outcome, el
resultado subestimar el efecto real de exposicin, ya que
habr un menor nmero de pares de sujetos que
contribuirn positivamente a identificar la asociacin.
El pareamiento de variables debe efectuarse cuando se
conoce o sospecha de su relacin con la exposicin
(aumenta la validez de los hallazgos). Ejemplo; edad y
cncer del pulmn, al estudiar la exposicin a asbesto. En
este caso la variable exposicin est vinculada con la edad
del sujeto. Simultneamente la variable cncer pulmonar
tambin se relaciona con la edad (Figura 3).
Figura 3. Efecto de confusin

El control a priori de este tipo de variables de pareo no es


la nica opcin metodolgica de controlar su efecto. Se
puede efectuar a posteriori, un anlisis estratificado o
estandarizar o ajustar la informacin, utilizar metodologa
de anlisis estadstico multivariado.

1. En estudios experimentales, la randomizacin o


asignacin aleatoria de los sujetos a los grupos control
o experimental es otro procedimiento que se utiliza
para neutralizar el efecto de potenciales variables
confundentes.
| Volver al texto |
2. John Last; matching: "proceso de hacer un grupo en
estudio comparable con otro, con respecto a factores
extraos".
| Volver al texto |
3. Missing values: valores perdidos. Corresponden a
sujetos de los que no se tiene informacin acerca de
determinada variable, debiendo esperarse respuesta.
Cuando no se cuanta con respuesta a una variable
porque no corresponde tenerla (embarazos, en el sexo
masculino o aos de consumo de cigarrillos en sujetos
no fumadores), la categora de respuesta existe y
puede ser tratada en forma especfica en el anlisis.
| Volver al texto |

Estudios de Casos y controles III


Estructura y anlisis de la informacin en los estudios
de casos y controles
La lgica de este diseo consiste en comparar la frecuencia
de exposicin a la(s) variable(s) independiente(s)
estudiadas en casos y controles. Esta comparacin,
apoyada por la hiptesis de trabajo, busca encontrar
evidencia de una mayor tasa de exposicin entre los
sujetos casos en comparacin con los controles si el factor
estudiado se comporta como un "factor de riesgo" 1
Si la presencia del factor de exposicin reduce el riesgo
(factor protector), la frecuencia de exposicin entre los
controles debiera ser mayor que la encontrada entre los
casos.

El anlisis depender de la existencia de matching en el


diseo. En el caso no pareado, la unidad de anlisis
corresponde a cada individuo en ambos grupos y la
comparacin de individuos de uno y otro grupo se efecta
libremente.
Si hay matching la comparacin de las unidades de anlisis
se establece entre pares de observaciones (un caso, un
control), tros si la relacin entre casos y controles es 1:2
( un caso, dos controles) y as sucesivamente.
El esquema general de anlisis en una tabla tetracrica en
un estudio de casos y controles es el siguiente
Esquema bsico de informacin en un estudio de
casos y controles
Variable
Variable dependiente
independiente
Presente
Ausente
Presente
a
b
Ausente
c
d
Total
C1 (a+c) C2 (b+d)

TOTAL
F1 (a+b)
F2 (c+d)
n

En este caso, cada celda corresponde a:


Celda
Celda
Celda
Celda
Celda
Celda
Celda
Celda

a: Sujetos enfermos con antecedente de exposicin


b: Sujetos sanos con antecedente de exposicin
c: Sujetos enfermos sin antecedente de exposicin
d: Sujetos sanos sin antecedente de exposicin.
C1: Total de casos
C2: Total de controles
F1 : Total de sujetos expuestos
F2 : Total de sujetos no expuestos.

Ntese que el nmero total de sujetos en ambos grupos


(Casos y Controles) son fijados a priori por el investigador
(C1 y C2).

Un primer anlisis de esta tabla, considerando la hiptesis


de trabajo, permite una rpida evaluacin de la tendencia
de los resultados.
Si la exposicin estudiada confiere riesgo, se espera
encontrar una concentracin de individuos en la celda a
(expuestos y enfermos) y celda d (no expuestos y sanos).
En estas celdas se produce concordancia con la hiptesis de
trabajo (exposicin/dao, no exposicin/no dao).
Caso no pareado: estructura de la tabla tetracrica
En este caso, la comparacin de individuos se realiza
libremente, comparando la totalidad de los casos con la
totalidad de los controles. Esto es vlido
independientemente del nmero de controles
seleccionados por cada caso. Veamos la estructura de los
datos en situaciones hipotticas de estudios con relacin
1:1 y 1:2 entre casos y controles respectivamente:
Caso no pareado, relacin 1:1 entre casos y
controles.

1
2
3
4
5
6
7
8
9
10

Casos
E
E
N
N
E
E
E
E
N
N

Controles
N
N
N
N
E
N
N
N
E
E

(E = expuesto N = No expuesto)
Exposicin
Positiva
Negativa

Casos
6
4

Controles
3
7

9
11

10

10

20

Caso no pareado, relacin 1:2 entre casos y


controles.
Casos
1
E
2
E
3
N
4
N
5
E
6
E
7
E
8
E
9
N
10
N
Exposicin
Positiva
Negativa

Casos
6
4
10

Controles
1-N
11-N
2-N
12-E
3-N
13-E
4-N
14-N
5-E
15-N
6-N
16-N
7-N
17-E
8-N
18-N
9-N
19-N
10-E
20-N
Controles
5
15
20

11
19
30

En la situacin de pareamiento o matching, cambia: la


estructura de la base de datos, las tablas de distribucin de
frecuencias, as como las tablas de contingencia (que slo
es de 2 x 2 para el caso de matching 1 : 1), varan en su
estructura general. Se presentan figuras con la apariencia
en casos de matching 1 : 1 y ms de un control por cada
caso:
Caso pareado, relacin 1:1 casos-controles

1
2
3

Casos-Controles
E-N (Caso Expuesto; Control No
expuesto)
E-N
N-N (Caso y control No expuestos)

4
5
6
7
8
9
10

N-N
E-E (Caso y Control expuestos)
E-N
E-N
E-N
N-N
N-E

Originando la siguiente tabla tetracrica:

Casos Exp +
Exp -

Controles
Exp +
Exp 1
5
1
3
2
8

6
4
10*

(*): 10 pares de comparaciones, equivalentes a 20 sujetos


Caso pareado, relacin 1:2 entre casos y controles.

1
2
3
4
5
6
7
8
9
10

Casos-Controles
E-N-N
E-N-E
N-N-N
N-N-N
E-E-E
E-N-N
E-N-N
E-N-N
N-N-E
N-E-N

Distribuyndose de esta manera en la tabla de contingencia


Controles expuestos
0 indiv 1 indiv 2 indiv Total

Casos

Exp
+
Exp
-

10*

(*): 10 tros de observaciones (30 observaciones)


Clculo de la tasa de exposicin
El primer clculo a desarrollar es el de las tasas de
exposicin entre los sujetos casos y los controles, de
acuerdo al siguiente planteamiento:
Esquema bsico de informacin en un estudio de
casos y controles
Variable
Variable dependiente
independiente
Presente
Ausente
Presente
a
b
Ausente
c
d
Total
C1 (a+c) C2 (b+d)

TOTAL
F1 (a+b)
F2 (c+d)
N

Tasa Exposicin en casos = a / C1 x 100 o bien = a/(a+c)


Tasa Exposicin en controles = b / C2 x 100 o bien = b/
(b+d)
La valoracin estadstica de las tasas de exposicin
encontradas puede efectuarse mediante la aplicacin de un
test de comparacin de proporciones, la que determinar si
la diferencia existente puede o no se explicada por el azar
(H0) o por la presencia de la variable independiente en
estudio (H1).
Establecimiento de asociacin entre las variables en
estudio
Luego del paso anterior se procede a establecer la
existencia de asociacin utilizando el test de de Mantel -

Haenszel, con su correspondiente correccin de continuidad


de Yates si fuera el caso 2 .
= (| ad * bc| n)
C1 C2 F1 F2
El valor obtenido tiene un grado de libertad:
( gl = [columnas - 1] x [filas - 1])
Teniendo como punto de corte 5,991 para este valor, con un
95% de confianza.
Vale decir, si el valor de Chi cuadrado calculado excede este
valor, se est en condiciones de poder rechazar la hiptesis
de nulidad H0 (falta de asociacin) en favor de H1
(asociacin), con 95% de confianza.
Habitualmente en todo caso, la hiptesis de asociacin
suele haber sido comprobada previamente al desarrollo del
protocolo. El paso siguiente es el clculo del odds ratio. El
odds ratio tiene la caracterstica de cuantificar la magnitud
de riesgo.
Clculo de la razn de chances u Odds Ratio (OR)
En la literatura epidemiolgica esta medida de riesgo es
reconocida con las siguientes denominaciones: odds ratio,
razn de disparidad, razn de desigualdades, razn de
productos cruzados, riesgo relativo estimado, desigualdad
relativa, razn de momios y otras ms 3 .
- Elaboracin de los componentes de esta razn:
- La "chance" (odds) de tener la enfermedad (Odds1),
segn se est o no expuesto al factor corresponde a:
Odds1 = a/C1 (enfermos expuestos en relacin con el total
de enfermos)
c/C1 (enfermos no expuestos en relacin con el
total de enfermos)

Lo que equivale a :
Odds1 = a/ ( a+c )
c/ ( a+c )
- Equivalentemente la "chance" de no tener la enfermedad,
segn se est o no expuesto al factor (Odds2) corresponde
a:
Odds1 = b/ C2 (sanos expuestos en relacin con el total de
sanos).
d/ C2 (sanos no expuestos en relacin con el total
de sanos)
Equivalente a:
Odds2 = b/ (b+d )
d/ ( b+d )
- Por tanto, el valor del odds ratio, que corresponde al
cuociente (razn ) entre estas dos "chances (u Odds),
corresponde a:

OR = a x d
axc
Este indicador de riesgo es llamado tambin "razn de
productos cruzados", aludiendo as a la distribucin que
adoptan en la tabla 2 x 2 los trminos del numerador y
denominador 4 . El valor calculado carece de unidades de
medidas.

Interpretacin del valor de OR calculado


Estrictamente hablando el odds ratio indica la magnitud de
asociacin entre exposicin y outcome (en otras palabras,
el riesgo de haber estado expuesto dada la enfermedad).
Esta interpretacin es compleja y difcil de entender, por lo
que se permite su interpretacin considerando el riesgo
asociado o no a la exposicin.
Como el odds ratio es un buen estimador del riesgo relativo
(calculado en estudios prospectivos), se utiliza esta
propiedad para facilitar la comprensin del indicador.
Si el cuociente calculado determina un valor de 1, esto
significa que no hay asociacin entre las variables
analizadas (la exposicin positiva o negativa no hace
diferencia respecto al riesgo de enfermar).
Un valor mayor que 1 indica una mayor frecuencia de
exposicin de la variable independiente entre los enfermos
(casos). Por tanto, el factor acta asocindose con un
mayor riesgo de enfermar.
Finalmente, si el valor del OR calculado es inferior a 1, esto
indica mayor frecuencia de exposicin entre los sujetos
sanos (controles). En este caso, la presencia del factor se
asocia reduce el riesgo de enfermar (actuando como un
factor de proteccin).
La valoracin estadstica de las asociaciones encontradas
debe realizarse mediante el clculo de los correspondientes
intervalos de confianza.
De acuerdo con esto, la interpretacin final del OR queda
dada por el siguiente esquema:
- Interpretacin del valor de odds ratio
Valor
odds ratio

Intervalo de confianza
Inferior
Superior

1
Mayor de 1

>1

>1

Tipo de
asociacin
No evidencia
de asociacin
Significativa,

Mayor de 1

<1

>1

Menor de 1

< de 1

< de 1

Menor de 1

< de 1

> de 1

riesgo
No
significativa
Significativa,
proteccin
No
significativa

Para el clculo del intervalo de confianza se recurre a


diferentes mtodos. Uno de los ms utilizado es el Woolf
que utiliza la siguiente frmula;
IC OR = (Ln OR) Z

1/a+1/b+1/c+1/d

Ejemplo: Contreras 5 y colaboradores estudian y difunden


el resultado de una investigacin destinada a valorar el
nivel de proteccin conferido por la vacuna antisarampin
utilizando un diseo de estudio de casos y controles. Para
ello, los autores identifican a 48 nios con el antecedente
de sarampin y 48 controles, en quienes indagan por el
antecedente de vacunacin previa, obteniendo los
siguientes resultados:
- Asociacin sarampin con antecedente de
vacunacin: casos y controles
Exposicin
Vacunacin
+
Vacunacin
-

Sarampin
SI
NO
34

46

80

14

16

48

48

96

En este caso, la "tasa de exposicin a la vacuna" equivale


a:
- Entre los casos : ( 34/48) * 100 = 71%
- Entre los controles : (46/48) * 100 = 96%

El clculo del valor de odds ratio (OR) para este caso en


particular est dado por la expresin:
OR = a x d
bxc
vale decir = 34 x 2 = 68 = 0,10
46 x 14

644

O bien:
Odds Exposicin en Enfermos : 34/48 / 14/48 = 2,42 Odds
Exposicin entre Controles : 46/48 / 46/48 = 23
OR = 0,10
-Clculo del intervalo de confianza para el OR
calculado.
Ln OR : -2.30
Error standard : Ln OR =

1/a+1/b+1/c+1/d

(ES) = 0.62
= 0.789
Intervalo de confianza calculado al 95%, equivale a:
IC OR = (Ln OR) Z Ln ES
IC OR = (Ln OR) 1,96 (0,789)
IC OR = (Ln OR) 1,55
= -2.30 1,55
IC OR =
IC OR = 0,021- 0,47
Luego el intervalo en el cual se mueve el valor de OR
calculado flucta entre 0,021 y 0,47, ambos valores
inferiores a 1, con un 95% de confianza.
Por tanto la asociacin encontrada es de carcter
significativo y su lectura correspondera a una disminucin

significativa del riesgo de contraer sarampin en presencia


del factor "vacunacin" antisarampionosa.
El test de Chi cuadrado ( ),efectuado entre la variable
vacunacin y sarampin (medidas dicotmicamente ambas)
arroja un valor de p 0,002 (valor de 10,8, con un grado de
libertad), lo que permite rechazar H0 (variables no
asociadas) en favor de H1 (las variables estn asociadas).
Finalmente, si quisiramos calcular el nivel de proteccin
conferido por esta vacuna en la poblacin estudiada, sta
estara dada por la siguiente expresin:
Porcentaje de proteccin = 1 - OR,
- siendo el valor 1 el valor basal asumiendo que la vacuna
no ejerce ningn tipo de proteccin. En nuestro caso, se
obtiene un valor de 0,9 equivalente a un 90% de proteccin
entre los nios estudiados en presencia del antecedente de
vacunacin. Los lmites del intervalo de confianza
corresponderan a:
Lmite inferior: 1 - 0,47 = 53% de proteccin
Lmite superior: 1 - 0,021 = 97,9% de proteccin
En trminos de notacin, este resultado se expresa en
trminos de nivel de proteccin, como 90% (Intervalo de
confianza al 95%: entre: 53% - 97,9%)
Direccionalidad de la asociacin estudiada
Dado que este diseo se inicia a partir de la variable
dependiente y explora retrospectivamente en el tiempo la
presencia o ausencia de exposicin en ambos grupos, no es
posible conocer entre los casos la tasa de incidencia de la
enfermedad o dao en cuestin 6 . Para conocer el nmero
de casos nuevos de la enfermedad o condicin en estudio
en un perodo de tiempo determinado se requiere iniciar un
seguimiento de individuos sanos o libres de la condicin en
estudio, observando la aparicin de eventos a lo largo de
un perodo de tiempo preestablecido.

En el diseo de casos y controles, el estudio se inicia a


partir de un nmero fijo de sujetos enfermos o portadores
de la condicin a estudiar, ignorndose el momento en el
cual apareci la enfermedad.
Por tanto, por definicin, dada la direccionalidad del estudio
(retrospectiva), no es posible el clculo de tasas de
incidencia.
Consideracin de variables de confusin.
Siendo el objetivo de este diseo establecer la existencia de
asociaciones entre variables, es de suma importancia
descartar que las asociaciones evaluadas no estn dadas
por variables independientes que participan indirectamente
en la cadena causal pero que en ltimo tiempo, no la
explican.
Nos referimos especficamente a aquellas variables que se
encuentran vinculadas simultneamente con la variable
dependiente e independiente en estudio. Estas variables de
confusin pueden dar origen al establecimiento de
asociaciones spreas, derivadas del efecto de estas
variables. Para su control, se puede recurrir a:

Control a priori de las variables, en la etapa de diseo


del estudio (matching)
Anlisis de la exposicin y el outcome de acuerdo a los
niveles o estratos que adopte la variable de confusin
(anlisis estratificado),

Ajustando los datos, a posteriori utilizando ajuste


directo o indirecto,

Utilizando tcnicas de multivariadas (anlisi


multivariado),

En diseos experimentales, asignando aleatoriamente


la exposicin entre los sujetos participantes.

Anlisis de datos en estudios casos y controles con


matching
Si el estudio ha incorporado la modalidad de matching de
frecuencia, es decir, el ingreso al estudio de los controles

estuvo condicionado por algunas restricciones generales


previas (igual sexo, similar grupo etario, vecindario comn
u otras), se puede aplicar el mismo procedimiento utilizado
en la modalidad no pareada o sin matching.
En el caso de matching individual utilizando un control por
cada caso, la informacin se distribuye de acuerdo a pares
de observaciones segn el esquema previamente
comentado.
Controles
No
Expuestos
expuestos
Casos Expuestos 1 (n11)
No
1 (n01)
expuestos
2

5 (n10)

3(n00)

10*

(*): 10 pares de comparaciones, equivalentes a 20 sujetos


Correspondiendo cada celda a:

Celda n11: caso y control expuestos


Celda n10: Controles no expuestos, casos s.

Celda n01: caso no expuesto, control s.

Celda n00 : Caso no expuesto, control no expuesto

En esta modalidad se asume que las celdas que muestran


concordancia no aportan informacin respecto al estudio de
asociacin, por lo que se utilizan solamente las celdas n10
y n01.
OR = n10 / n01 = 5/1
Si la informacin no es correctamente distribuida en las
correspondientes celdas, la tabla tetracrica presentara la
siguiente conformacin:

Exp +
Exp -

Casos
6
4
10

Controles
2
8
10

Originando un valor errneo de odds ratio dado por:


OR = 6 x 8

=6

2x4
Test de para el caso pareado
Su clculo corresponde a la siguiente expresin:
= ( n10 - n01)
(n10 + n01)
Cuando el nmero de estratos es mayor a uno, los clculos
se hacen de mayor complejidad, siendo conveniente la
utilizacin de software especfico.
Clculo del intervalo de confianza
Existen diversos mtodos para su clculo. Se presentan a
continuacin otros mtodos corrientemente utilizados:
a) ICOR = ( 1 1,96/

b) ICOR = e (OR 1,96 x

varianza)

La varianza se calcula de acuerdo a :


Varianza OR = (1/ n10 + 1/ n01 )
1. Factor de riesgo: atributo o caracterstica de un sujeto
o un grupo de ellos que les confiere un mayor riesgo
particular de adquirir una determinada enfermedad o
condicin.
| Volver al texto |
2. El test de chi cuadrado tiene algunas restricciones
para el caso de variables categricas. La correccin de

continuidad de Yates se usa en el caso de tablas de


contingencia en las que se encuentran celdas con bajo
nmero de observaciones.
| Volver al texto |
3. An cuando la acepcin ms correcta es "Razn de
Chances" puesto que establece la diferencia entre
probabilidad y "chance", se usar la denominacin OR,
por su frecuente utilizacin en literatura biomdica.
| Volver al texto |
4. Esta medida de riesgo puede tambin calcularse en
estudios prospectivos y su derivacin es simple
| Volver al texto |
5. Contreras R y cols. Efectividad de la vacuna
antisarampin en el terreno: un estudio de casos y
controles. Rev. Chil. Pediatra;61(1):3-7, 1990.
| Volver al texto |
6. De hecho, se ignora cuando los casos portadores de la
enfermedad o condicin en estudio aparecieron y, por
cierto, las poblaciones a partir de las cuales pudiera
calcularse una tasa de incidencia
| Volver al texto |

Variables confundentes
Parte crucial de la etapa de interpretacin de los resultados
y de evaluacin de los hallazgos es analizar crticamente la
posibilidad de que eventuales factores pudieran estar
invalidando metodolgicamente los resultados. El
investigador debe ser consciente de que los resultados
obtenidos pueden deberse a otros factores que no
corresponden a la intervencin en estudio y que de no ser
consideradas pudieran llevar a conclusiones equivocadas.
En trminos generales, frente a los resultados obtenidos el
investigador debe estar en condiciones de poder evaluar si
los resultados pueden ser originados por:
1. Simple azar o chance

2. Ocurrencia de error sistemtico


3. Presencia de variables confundentes
4. Fenmenos de interaccin entre variables estudiadas.
5. Asociaciones causales
1. Simple azar o chance
Estadsticamente es posible conocer y controlar la
probabilidad de ocurrencia de error en la investigacin
desde fases tan tempranas en la investigacin como puede
ser la etapa de muestreo. Subsecuentemente, la revisin y
anlisis preliminar de la informacin permite verificar la
magnitud real de error proveniente de los datos recogidos.
Aunque el error aleatorio es imposible de eliminar, el
conocimiento de su cuanta permite emitir juicios
considerando su magnitud al evaluar los resultados de la
investigacin. Dependiendo del problema en cuestin y el
nivel de conocimientos imperantes el investigador debe
decidir cul es el nivel mximo de error tolerable para, por
ejemplo, implementar una medida preventiva o una de
control en una poblacin.
2. Ocurrencia de error sistemtico
La participacin del sesgo en los resultados obtenidos en
una investigacin puede ser muchas veces abortada
sometiendo a una cuidadosa revisin y anlisis las
caractersticas del diseo de la investigacin, en particular
aquellos aspectos referidos a la medicin de las principales
variables independientes del estudio (variables de
exposicin y covariables). Es esencial adems minimizar la
probabilidad de existencia de errores sistemticos derivados
de la aplicacin de instrumentos de medicin optimizando
las condiciones de aplicacin de dichos instrumentos
mediante su evaluacin previa y su control permanente
durante la fase de trabajo de terreno y recoleccin de
informacin.
3. Presencia de variables confundentes e interaccin
entre variables estudiadas.
Un captulo importante en la investigacin epidemiolgica

corresponde al anlisis de resultados considerando la


participacin de variables que pudieran ejercer algn efecto
sobre la relacin encontrada. Esto podra manifestarse a
travs de una distorsin del efecto observado respecto al
efecto real debido a una desigual distribucin de una
variable extraa en los grupos estudiados (efecto de
confusin). Tambin es posible la obtencin de un efecto
no esperado, pero real, producto de la interrelacin
simultnea de dos o ms factores participantes en el efecto
estudiado (interaccin).
4. Asociaciones causales
En el anlisis de relaciones de causalidad, el investigador
debe tener la certeza absoluta acerca de la direccionalidad
de las asociaciones observadas (prospectiva o no) y
considerar que la exposicin estudiada pudiera
corresponder en realidad a un outcome o variable
dependiente al estudiar una cadena causal.
Variables confundentes
El efecto de confusin se produce cuando en el anlisis de
una relacin, existe distorsin en el efecto estimado, el que
es producido por la presencia de una variable extraa en el
estudio de la asociacin.
El efecto que puede tener la presencia de esta variable
extraa en el resultado puede ser diverso: en ocasiones
determina la existencia de asociaciones positivas, las que
en la prctica no son reales (error de tipo I o ) o bien,
pueden esconder asociaciones reales, las que en presencia
de esta variable extraa, quedan enmascaradas (error de
tipo II o ).
El concepto de confusin es crtico en el anlisis
epidemiolgico, siendo ms importante en el terreno de la
investigacin epidemiolgica observacional o no
experimental que en el campo experimental. Esto se debe a
que los estudios experimentales permiten un mejor control
de este efecto por caractersticas inherentes a su tipo de

diseo (randomizacin, control a priori de eventuales


variables confundentes o el uso de matching o pareamiento
de variables).
Conceptualmente deben cumplirse algunos requisitos para
considerar a una variable como potencialmente
confundente:

La variable incriminada debe estar simultneamente


asociada con la enfermedad (variable dependiente) en
estudio y con la exposicin,
Por tanto, debe ser un factor de riesgo para la
enfermedad estudiada,
El factor extrao si bien es cierto debe estar asociado
con la exposicin (o variable independiente), no debe
ser consecuencia de sta ltima.

Grficamente lo anterior corresponde a la siguiente


representacin:
Figura 1:
Variables confundentes.

Por ejemplo, en el anlisis del efecto protector del Beta


Caroteno en relacin con el cncer del sistema digestivo, se
encuentra evidencia favorable acerca del consumo de
vegetales en la reduccin del riesgo del cncer,
concluyndose que el consumo de Beta Caroteno en la
dieta rica en vegetales es una medida especfica de
proteccin contra el cncer.
Sin embargo, en este ejemplo pueden existir al menos dos
posibles variables confundentes a considerar. La primera, es
la edad, variable que se asocia con la incidencia de cncer,

y que podra asociarse con el nivel de consumo de verduras


y hortalizas, lo que podra verificarse si en el estudio se
contara con informacin acerca de la constitucin por edad
de los sujetos estudiados.
Otra variable confundente podra ser el consumo de fibra
en la dieta. En este caso, el nivel de consumo y tipo de
fibra est relacionada simultneamente con la variable
consumo de vegetales y con la variable cncer. Para
ambos ejemplos de posibles variables confundentes, se
cumplen las condiciones previamente sealadas para poder
considerarlas como tales. De no considerarse en el anlisis
la presencia de ellas pudiera concluirse una recomendacin
errnea basndose en una relacin esprea o ficticia.
Para mayor claridad respecto a las caractersticas de las
variables confundentes se plantearn tres situaciones
hipotticas (Figura 2):
Figura 2.
Ejemplos de posible variables confundentes

1. En este caso, el tabaquismo se relaciona


simultneamente con la exposicin y con el desenlace u
outcome. Corresponde realmente a una variable
confundente.

2. En esta situacin, el nivel de colesterol srico


corresponde a una variable intermedia, vale decir, en la
cadena causal precede al dao y es consecuencia de la
exposicin principal en estudio. En este caso, la variable no
corresponde a una variable confundente.

3. Finalmente se da ac el caso en que la variable de


exposicin (tabaquismo) est asociada con una tercera
variable (consumo de alcohol). Si embargo, esta ltima, no
corresponde a una variable confundente, puesto que slo se
asocia con la exposicin y no con el desenlace.
No siempre es fcil saber si se cumplen los requisitos para
que una variable sea considerada confundente. Por
ejemplo, cmo saber si una variable es factor de riesgo
para el desenlace estudiado si se desconocen antecedentes
al respecto?
Para tales efectos, es posible que en el anlisis se pueda
obtener informacin desagregando la informacin recogida.
En un hipottico ejemplo de estudio de casos (enfermos) y
controles (sanos) destinados a establecer la existencia de
asociacin entre la exposicin al consumo de caf y el
riesgo de cncer del pncreas, se estudian 100 casos y 100
controles, con el siguiente resultado:
Tabla 1.
Ejemplo: Consumo de caf y cncer de pncreas
Consumo de
caf
Exposicin +
Exposicin Total

Pacientes con
cncer
30
70
100

Sujetos sanos

El valor de Odds ratio correspondiente es:


OR = 30 x 82 = 1.95
18 x 70

18
82
100

Con lo cual se concluye que el consumo de caf esta


asociado con un mayor riesgo de padecer de cncer del
pncreas.
Una posible variable de confusin en este estudio pudiera
estar dada por la edad de los sujetos participantes en el
estudio. Si as fuera, primeramente se debera estudiar si
se cumplen los requisitos para considerar a esta variable
como una variable de confusin:

En primer lugar se analizar la relacin existente entre la


variable edad y la variable dependiente en estudio (cncer
de pncreas), utilizando para ello informacin desagregada
de la edad, considerada sta dicotmicamente en menores
o mayores de 40 aos de edad:
Tabla 2.
Ej. Consumo de caf y cncer del pncreas: casos y
controles segn grupo de edad
Edad (aos) Pacientes con cncer Sujetos sanos
Menos de 40
50
80
Ms de 40
50
20
Total
100
100
Luego, el porcentaje de sujetos mayores de 40 aos con
cncer es claramente superior (50%) al de sujetos sanos
(20%).
Esto se puede validar mediante un test de chi cuadrado
( =19,78 , p < 0.0001)

En una segunda etapa, se estudiar la asociacin entre esta


variable (edad) con la variable exposicin.
Tabla 3.

Ej. Antecedente de exposicin de acuerdo a categora de edad, casos y


controles

Consumo de Caf
Edad (aos) Expuestos No expuestos Total % Expuesto
Menores de 40
13
117
130
10
Mayores de 40
35
35
70
50
Se aprecia que la frecuencia de exposicin no es uniforme
en los estratos de edad, teniendo los mayores de 40 aos
un mayor porcentaje de exposicin. Evaluado esto
mediante un test de chi cuadrado, se tiene =39.91, p <
0.0001
Finalmente, est claro que la edad de los sujetos, as
categorizada, no es consecuencia del consumo de caf, con
lo cual se establece el cumplimiento de los requisitos para
que la variable edad pueda considerarse como
eventualmente confundente

Anlisis estratificado
En el tema anterior hemos visto que los resultados
obtenidos en un estudio pueden deberse a factores
extraos y no necesariamente a la variable de inters. Si
bien este tipo de problema es ms importante en los
estudios observacionales, los experimentales no se
encuentran, de ninguna manera, exentos de este tipo de
factores.
Continuando con el anlisis de variables confundentes
Anlisis por estratos
Una manera de poder superar la heterogeneidad en la
distribucin de una variable extraa en el estudio de la
asociacin es el anlisis considerando los diferentes

estratos en los que esta variable est categorizada.


Obviamente, si en la investigacin esta variable no fue
contemplada en el diseo del estudio, no se podr contar
con esta informacin. (En este caso, la variable edad es una
caracterstica raramente omitida en la investigacin
epidemiolgica, pero pudiera ser el caso de otra variable
confundente no tan conocida).
En el anlisis estratificado se calculan las medidas de riesgo
de acuerdo con los estratos, comparando el resultado con el
anlisis no estratificado (crudo). Para nuestro ejemplo, se
tiene:
Tabla 4.
Ej. Creacin de estratos de acuerdo a grupo de edad
Cncer de
pncreas

Controles

Odds ratio

Exposicin -

45

72

(5 x 72)
=1, 0
(8 x45)

Total
Mayores de 40
Exposicin +

50

80

25

10

Exposicin -

25

10

Total

50

20

Menores de 40
Exposicin +

(25 x 10)
=1, 0
(10 x 25)

Se aprecia que el valor de odds ratio en el anlisis de


ambos estratos arroja el mismo resultado, lo que est
indicando que el efecto de la variable edad, en relacin con
el estudio de la asociacin exposicin a caf y cncer del
pncreas, ejerca un efecto distorsionador con respecto al
odds ratio originalmente calculado (crudo) que era de 1.95.
Anlisis estratificado utilizando el procedimiento de
Mantel-Haenszel

En el caso anterior, es posible obtener una medida de


riesgo, en este caso odds ratio, considerando
simultneamente la variable independiente de inters
(exposicin) y la variable potencialmente confundente. A
diferencia del anlisis estratificado anterior, este
procedimiento permite el clculo de un slo valor de odds
ratio, ajustado por la variable confundente. El elemento
bsico para poder efectuar el procedimiento de MantelHaenszel es conocer la distribucin de esta variable de
acuerdo a los estratos de la variable exposicin.
La formulacin general del procedimiento es la siguiente:

Cada estrato esta representado por la letra subndice i en


esta frmula.
Para el ejemplo anteriormente desarrollado, el
procedimiento se establece basndose en la informacin de
la siguiente tabla:
Tabla 5.
Ej. Tabla Anlisis estratificado

Menores de 40
Exposicin +
Exposicin Total
Mayores de 40
Exposicin +
Exposicin Total

Cncer de
pncreas

Controles

Odds ratio

5
45
50

8
72
80

13
117
130

25
25
50

10
10
20

35
35
70

Es posible calcular el correspondiente valor de chi cuadrado


considerando la distribucin de la variable confundente en
los diferentes estratos, para lo cual se recurre a la siguiente
frmula general:

Siendo ni1 y ni2 el total de ambas columnas


respectivamente.y
mi1 y mi2 los totales de ambas filas.

You might also like