Professional Documents
Culture Documents
Notas
ndice
1. INTRODUCCIN .............................................................................................................2
2. TIPOS DE REVISIONES BIBLIOGRFICAS CUANTITATIVAS .....................................3
2.1. Conteo de votos (vote-counting) ................................................................................................................ 3
2.2. Mtodos de probabilidad combinada ......................................................................................................... 3
2.3. Mtodo del mnimo valor de p .................................................................................................................... 4
2.4. Test de probabilidad combinada (2) ........................................................................................................... 4
2.5. Transformacin z (3)................................................................................................................................... 4
2.6. Transformacin z ponderada (4) ................................................................................................................ 4
2.7. Metaanlisis moderno (5) ........................................................................................................................... 5
2.8. Claroscuros (6) ........................................................................................................................................... 5
3. QU ES EL METAANLISIS?.......................................................................................5
3.1. Objetivos..................................................................................................................................................... 6
3.2. Justificacin ................................................................................................................................................ 6
1. Introduccin
A mediados del siglo XIX Bichat y Magendi preconizaban un cambio sustancial en la manera de establecer
las bases clnicas del diagnstico precoz, el pronstico y el tratamiento de las enfermedades que podemos
considerar como la base de lo que hoy conocemos como medicina basada en la evidencia (MBE) que surgi
formalmente hace 20 aos en el seno de la gestin sanitaria como mtodo para facilitar la toma de
decisiones y consecuentemente racionalizar la prctica clnica.
El rpido avance de las tcnicas diagnsticas y teraputicas producido en los ltimos aos dificulta
alcanzar una experiencia personal vlida y segura como "patrn" en la toma de decisiones clnicas. De ah
la necesidad de disponer de mtodos que faciliten la puesta en prctica con cotidianidad de la MBE. Un
mtodo bsico es el metaanlisis que, a travs de mtodos estadsticos, sintetizando los resultados de
estudios independientes puede proporcionar estimaciones de los efectos de la atencin sanitaria ms
precisas y conclusiones ms contundentes que las derivadas de los estudios individuales incluidos en una
revisin tradicional de la literatura mdica.
El trmino metaanlisis fue empleado por primera vez por G.V. Glass en 1976, para referirse al anlisis
estadstico del conjunto de resultados obtenidos en diferentes ensayos clnicos sobre una misma cuestin,
con la finalidad de evaluarlos de manera conjunta. Fue inicialmente aplicado en ciencias sociales y
psicologa. A partir de la dcada de los ochenta se comenz a aplicar de manera creciente en medicina, y
en la actualidad son muy frecuentes los artculos que describen resultados de metaanlisis en publicaciones
mdicas.
En medicina el metaanlisis se aplica sobre todo en las siguientes situaciones:
para comprobar la consistencia de los ensayos en los que se ha evaluado una intervencin determinada
y generar un estimador del efecto, que en principio debe tener mayor poder estadstico que el obtenido
en cada ensayo por separado;
para comprobar la consistencia de los resultados de diferentes ensayos clnicos sobre una misma
intervencin en una misma patologa;
para identificar con mayor precisin los subgrupos de pacientes con posibilidades de responder de
manera diferente del promedio a una determinada intervencin;
para calcular cuntos pacientes sera necesario incluir en futuros ensayos clnicos sobre un problema
determinado; y
para cuantificar la incidencia de efectos no deseados, que, por ser baja, requiere un nmero elevado de
pacientes.
La idea de agregar los datos de diferentes ensayos para examinar este tipo de problemas es sugerente, y
ha permitido grandes avances en el conocimiento de la historia natural de numerosas patologas y de sus
posibles tratamientos. La Colaboracin Cochrane (vase Colaboracin Cochrane en el Glosario) desarrolla
2
una labor de recopilacin y anlisis de ensayos clnicos tan imprescindible como ejemplar, y en su web se
puede encontrar amplia informacin sobre sus mtodos de trabajo y una extraordinaria base de datos, en
forma de metaanlisis, sobre numerosos aspectos de la teraputica farmacolgica y de otras intervenciones
preventivas y educativas en salud.
ao
desarrollo
autor
evento
1932
Fisher
1937
Cochan
1959
1972
1976
1977
Mantel y Haenszel
Peto y Peto
Glass
Peto y cols.
utilizacin
1974
Stjernsward
3. Hay al menos 18 mtodos que usan diferentes distribuciones estadsticas (uniforme, normal, t de
Student,
2 , logstica).
= 1 (1 *)
* = 0, 05
2.4. Test de probabilidad combinada (2)
1. Sean n estudios con valores de significacin individuales p i ;
F2 = 2 log ( p i )
i =1
3.
2
F
los datos.
Inconveniente: es muy sensible a valores de p i bajos (asimetra).
zs =
zi
k
i =1
zw =
zi
i =1
i =1
2
i
3. Las ponderaciones w i se calculan como el recproco del error estndar cuadrtico del tamao del
efecto;
4. As, se tiene en cuenta los grados de libertad especficos de cada estudio.
La puntuacin z se halla a partir de una distribucin normal con media x = 0 y desviacin tpica s = 1 y
corresponde a los valores correspondientes a una probabilidad dada].
Usar z s o z w es un poco cuestin de gusto, ya que los valores de la p estn ya ponderados por el
tamao muestral. Si la hiptesis nula es globalmente cierta, entonces todos los valores de la p
deberan estar uniformemente distribuidos entre 0 y 1 independientemente del tamao muestral.
Inconvenientes:
3. Qu es el metaanlisis?
El metaanlisis es la sntesis formal, cualitativa y cuantitativa, de diferentes investigaciones clnicas
controladas aleatorizadas, como por ejemplo los ensayos clnicos, que poseen en comn una misma
intervencin y un mismo punto final de resultado y que se agrupan con la intencin de sintetizar la evidencia
cientfica con respecto a la direccin del efecto producido por la intervencin en anlisis. Expresado de otra
manera, el metaanlisis es una estrategia de revisin sistemtica que pretender responder a diversas
cuestiones y que es especialmente til cuando los resultados de varios estudios son discordantes con
respecto a la magnitud de la direccin de un efecto, cuando los tamaos muestrales de los estudios
individuales es demasiado pequeo para detectar dicho efecto como significativo, o cuando un ensayo
clnico de gran tamao es demasiado costoso en trminos econmicos o de tiempo. El metaanlisis es un
procedimiento de investigacin que mejora la calidad de las revisiones bibliogrficas, dado que provee los
elementos para realizarlas metdicamente y arrojar resultados claramente interpretables.
El metaanlisis es una aproximacin ms estructurada a la revisin de la literatura de lo que lo son las
revisiones tradicionales y en esta medida pueden ser de ms ayuda para establecer principios cientficos.
Los resultados del metaanlisis permiten planificar futuros ensayos clnicos sobre temas similares, ya que
proporcionan la evidencia de los efectos que se pueden esperar de una intervencin, permitiendo por ello
mejores clculos del tamao muestral. Aportan tambin elementos de juicio para generar nuevas hiptesis o
decidir si hacen falta nuevos ensayos clnicos sobre el tema.
Los metaanlisis pueden ser utilizados en la aprobacin del uso de intervenciones por parte de organismos
reguladores y en la docencia, ya que posee capacidad de mostrar sintticamente la evidencia cientfica
disponible.
Otros trminos que se han utilizado para los metaanlisis incluyen, overview, summary studies, evaluation
research y quantitative synthesis. En general, parece que debera reducirse el uso de estos trminos, dada
la confusin que pueden generar.
3.1. Objetivos
Cualquier problema clnico es susceptible de ser analizado mediante el metaanlisis. Los objetivos, en
cualquier caso, deben estar planteados con mucha claridad. Es obligatorio establecer en la fase del diseo
un protocolo de trabajo que formalice el desarrollo del estudio. En la tabla 2 se detallan los objetivos
generales y especficos del metaanlisis.
1. Comprobar la hiptesis relacionada con el efecto (en particular, su direccin) de la intervencin
bajo anlisis;
2. Aumentar la precisin de los estimadores del efecto (en particular, su magnitud) de la
intervencin bajo anlisis, intervalos de confianza ms reducidos;
3. Evaluar la consistencia entre los ensayos clnicos de similares intervenciones inherentes al tema
y generar un estimador del efecto ms eficiente;
4. Evaluar la consistencia entre ensayos clnicos de diferentes intervenciones realizadas con el
mismo fin y generar un estimador del efecto de esos cuidados;
5. Identificar con mayor precisin subgrupos de pacientes que tendran mayor probabilidad de verse
afectados por la intervencin, ya sea en sentido favorable o desfavorable;
6. Calcular los requerimientos, en cuanto a tamao muestral, de los futuros ensayos clnicos a
realizar en el mismo campo.
Tabla 2. Objetivos generales y especficos del metaanlisis.
3.2. Justificacin
Aunque es poco probable que dos ensayos clnicos tengan la misma magnitud, si es frecuente que el efecto
de la intervencin lleve, por azar, la misma direccin. Por ello, es til resumir en un anlisis conjunto las
evidencias presentadas por estudios independientes, para reducir la probabilidad de que el azar conduzca a
conclusiones errneas. Esto ocurre porque los efectos de las intervenciones suelen ser solo moderados,
con lo que la probabilidad de apreciarlos equivocadamente es grande (las intervenciones que se prueban
actualmente no tienen efectos superiores al 1530 % de reduccin de dao o aumento del beneficio). Estas
pequeas modificaciones obligan a ser muy cautos en la interpretacin de los resultados, dado que con
estas cifras todos los factores capaces de originar sesgos en la estimacin de los efectos pueden ser causa
de importantes errores en las apreciaciones, ya que con efectos de escasa magnitud, stos pueden pasar
fcilmente inadvertidos o ser engaosamente magnificados.
Los errores que se pueden cometer en metaanlisis son iguales que en cualquier otro tipo de estudio
epidemiolgico: aleatorios y sistemticos. El sesgo del azar se produce cuando no se incluyen suficientes
pacientes en el estudio.
Dado que se trata de estudios retrospectivos, existe la posibilidad de cometer todos los sesgos inherentes a
este tipo de diseo, ya que cuando conocemos los resultados es fcil cometer sesgos. Tambin hay
grandes posibilidades de cometer sesgo de seleccin, tanto por el hecho de que no hayamos hecho una
revisin exhaustiva como por la tendencia que existe a publicarse solamente aquellos resultados que
coinciden con la tendencia ms vigente (son responsables tanto los autores que no envan sus resultados
como los editores que no los consideran para su inclusin en las revistas mdicas).
Cuando las publicaciones son escasas, pueden incluirse en el metaanlisis poblaciones e intervenciones
muy diferentes, siendo el estudio criticable; sin embargo, debe considerarse que lo que interesa conocer es
la direccin de los efectos ms que su magnitud y esta direccin se alterar poco porque se aplique la
intervencin a diferentes poblaciones o las condiciones sean distintas en los estudios. Lo que pretende el
metaanlisis es evaluar tendencias en el conjunto de los estudios, que por separado podran no apreciarse.
4. Etapas de un metaanlisis
Los metaanlisis deben considerarse como verdaderos proyectos de investigacin en los que las unidades
de observacin son los estudios originales y que requieren una adecuada planificacin, una considerable
dedicacin de recursos (especialmente humanos) y la elaboracin de un protocolo en el que se detalle cada
una de las etapas del proceso que se describen a continuacin (vase figura 1).
(a) Establecimiento del problema y la hiptesis que se desea valorar. La formulacin del problema es
crucial en estudios clnicos y observacionales, definiendo de forma clara y precisa tanto la respuesta
como los posibles factores de confusin. Las mejores preguntas son aquellas que se refieren a algn
tema para el cual existe incertidumbre colectiva, y cuya respuesta puede cambiar conductas futuras.
Para formular correctamente una pregunta destinada a una revisin sistemtica deben incluirse en la
misma cuatro componentes: el tipo de sujeto o situacin sanitaria o administrativa a estudiar, el tipo de
estudio (teraputico, diagnstico, de riesgo, de pronstico o preventivo), el tipo de control utilizado para
la comparacin y el resultado o efecto a considerar.
El investigador debe extraer de los trabajos datos consistentes y elegir las tcnicas estadsticas ms
adecuadas para su anlisis. De este modo, el protocolo de un metaanlisis debe incluir una breve
resea de los antecedentes del problema que se pretende abordar con la investigacin, plantear
claramente el problema cientfico, que a menudo se expresa en forma de preguntas e hiptesis,
formular los objetivos y delimitar todas aquellas especificaciones sobre la recogida de la informacin y
de datos, as como su anlisis. Una correcta definicin y delimitacin de cada uno de estos aspectos
facilitar enormemente las siguientes etapas del proceso.
(b) Cuantificacin de los efectos. Antes de realizar el metaanlisis, el investigador ha de establecer las
medidas que se van a utilizar para describir y representar los efectos, y as poderlos agregar.
Obviamente, estas medidas van a depender tanto del tipo de respuesta (binaria o continua) como del
diseo del estudio (experimental u observacional) utilizados en los estudios primarios.
Respuesta binaria. Este tipo de respuesta solamente presenta dos categoras de resultado (muerte o
supervivencia, enfermos o sanos, etc.). En estudios con este tipo de respuesta, las medidas de efecto
ms comnmente utilizadas son la tasa de riesgos (o riesgo relativo), la razn de ventajas (odds ratio), o
la diferencia de riesgos.
Respuesta continua. En la literatura mdica existen multitud de estudios en los cuales la variable
respuesta est medida en escala continua (tensin sistlica, nivel de colesterol, etc.). Si las respuestas
de todos los estudios estn medidas en la misma escala, entonces la medida del efecto (o tamao del
efecto, effect size) ser simplemente la diferencia entre las medias de los grupos. Si no fuese as, es
decir, si los estudios miden la respuesta en diferente escala, habr que considerar en su lugar una
diferencia estandarizada de medias.
(c) Bsqueda de la informacin. En general, de cada uno de los estudios que pueden intervenir en el
metaanlisis, interesa extraer informacin referente a los siguientes aspectos:
Las caractersticas de los estudios: tales como tipo de diseo, caractersticas de la muestra de
estudio (edad, gnero, factores pronsticos, etc.), tipo de intervencin (principio activo, pauta,
dosis, etc.), medidas del resultado consideradas, tiempo de seguimiento y otras caractersticas
que permitan valorar el grado de homogeneidad o heterogeneidad de los estudios que han de
combinarse.
La calidad metodolgica de los estudios: existen distintos instrumentos que permiten valorar
cualitativamente o cuantitativamente la posible existencia de sesgos y, por lo tanto, la llamada
validez interna de los estudios originales.
Los resultados de los estudios: medidas del efecto observadas (odds ratio, riesgo relativo,
diferencia de riesgos, diferencia de medias, etc.) con sus indicadores de variabilidad (intervalos
de confianza) y nivel de significacin estadstica.
(d) Localizacin de los estudios de investigacin. La validez de un metaanlisis depende, en buena medida,
de lo exhaustivo con que se identifique y localice los trabajos originales.
Fuentes de informacin. Para la realizacin de bsquedas bibliogrficas puede partirse de fuentes
informales, fuentes primarias y fuentes secundarias.
Las fuentes informales estn constituidas por archivos personales, libros, artculos de revisin,
contactos con expertos, trabajos en congresos, etc.;
Las fuentes primarias son las revistas conocidas relacionadas con el tema y la realizacin de
revisiones ascendentes (a partir de las citas bibliogrficas de los artculos que ya se tienen y,
as, sucesivamente);
Las fuentes secundarias las constituyen las bases de datos automatizadas, que son
fundamentales para la realizacin de cualquier bsqueda bibliogrfica, pero, a pesar de su gran
importancia no son perfectas porque slo incluyen revistas dejando a un lado todo lo que se
denomina "literatura gris" (tesis doctorales, comunicaciones a congresos, informes hechos para
administraciones pblicas, trabajos no publicados, etc.).
Bases de datos bibliogrficas. Hay mucha literatura especializada en bases de datos bibliogrficas y
cmo acceder a ellas. Dickersin (7) elabor un algoritmo para encontrar todos los artculos que se
publican de ensayos clnicos, aunque por este mtodo se obtienen muchos falsos positivos, lo que
obliga a la revisin posterior de todo lo encontrado como nica manera de excluir lo que no interesa.
Las bases automatizadas ms importantes son MEDLINE, EMBASE, SCISEARCH o Science citation
index (base de citaciones tiles para aquellas no incluidas en MEDLINE) y las bases COCHRANE 5,
surgidas a partir de la Colaboracin Cochrane, formada por grupos de expertos que revisan temas
concretos y lo envan al Centro de Baltimore, que mantiene un registro internacional de ensayos
clnicos.
La recuperacin de la bibliografa es una tarea larga y laboriosa. Requiere la recopilacin de todos los
trabajos localizados, lo cual puede ser ms o menos complejo ya que los artculos pueden ser lenta
pero eficazmente recuperados en bibliotecas nacionales, extranjeras o a travs de peticiones al autor,
pero la literatura gris suele ser ms difcil de conseguir.
(e) Criterios de inclusin/exclusin de los estudios. No todos los trabajos recuperados podrn incluirse en el
metaanlisis. Habr que establecer, pues, los requisitos que se van a exigir a un estudio para consentir
su inclusin.
Como en cualquier estudio estadstico, el diseo muestral es un determinante de la utilidad y validez
cientfica de los resultados. En un metaanlisis, las unidades muestrales son los resultados de estudios
publicados o no publicados. Los criterios de inclusin y exclusin dan una definicin de caso para los
resultados que se van a utilizar en la sntesis.
En este paso de realizacin de un metaanlisis es donde puede incurrirse en el segundo de los sesgos
importantes, el sesgo de seleccin. Para disminuir el riesgo de cometerlo se ha de procurar que la
revisin de los estudios la realicen varios evaluadores de forma ciega o enmascarada (sin conocer la
revista, ao de publicacin, los autores, las instituciones, etc.) elaborando una lista de criterios de
inclusin e exclusin, que sern siempre analizables objetivamente, y de carcter metodolgico y no de
resultados, de modo que su fiabilidad y precisin sean mximas.
(f) Evaluacin de la calidad de los estudios incluidos. Es importante porque la validez de los resultados del
metaanlisis es consecuencia de la calidad de los trabajos originales incluidos.
Hay muchas escalas para medir la calidad de estudios, que van asignando distintas puntuaciones a
cada uno de ellos. Este proceso puede complicarse todo cuanto se quiera pero ay algunos aspectos
bsicos que hay que controlar a partir de la informacin metodolgica obtenida: el diseo del estudio, la
posibilidad de combinar los distintos trabajos, el control de sesgos (mediante determinacin del tamao
muestral mnimo, la duracin de seguimiento ms breve admitida, que la asignacin sea realmente
aleatoria o que se efecte realmente doble ciego cuando sea necesario, etc.), y que el anlisis
estadstico de cada estudio se haya realizado correctamente.
Existen distintos instrumentos que permiten, a travs de asignacin de puntuaciones, valorar cualitativa
y cuantitativamente la validez interna de los distintos estudios originales. La utilizacin ms usual de las
puntuaciones de calidad es la de asignar un mayor peso a unos estudios que a otros a la hora de
combinarlos. Otro uso interesante de estas medidas sera el de realizar agrupaciones de estudios segn
su calidad, y as determinar si el grado de sta se relaciona con las estimaciones de los efectos. Esta
utilizacin es, sin embargo, un tema controvertido, pudindose encontrar ejemplos en la literatura en los
cuales no se contempla dicha relacin. De todas formas, algn aspecto particular de calidad (como por
ejemplo, la adherencia al esquema de aleatorizacin en ensayos clnicos controlados), s se ha
mostrado asociado al tamao del efecto.
(g) Anlisis de la heterogeneidad. Existen varios mtodos estadsticos y grficos para evaluar el grado de
heterogeneidad que permiten valorar hasta qu punto los resultados que provienen de diferentes
estudios pueden ser resumidos en una nica medida.
En general, todas las pruebas estadsticas diseadas para comprobar la existencia de heterogeneidad
se basan en la hiptesis de que la variabilidad entre estudios es nula. Una de las pruebas ms
convenientes para valorarla es la prueba Q propuesta por DerSimonian y Laird (8), preferida por
cuestiones de validez y sencillez informtica. A pesar de sus ventajas, esta prueba estadstica presenta
baja potencia, debido principalmente a que el nmero de estudios primarios que se suelen considerar
(por ejemplo, el tamao muestral efectivo) es en general pequeo (no sobrepasa en general el valor de
30 estudios). De ello se deduce que la falta de heterogeneidad estadstica no se puede considerar como
evidencia de homogeneidad, ya que pudieran no detectarse diferencias estadsticamente significativas
incluso en metaanlisis con niveles moderados de heterogeneidad.
Debido a la poca potencia de las pruebas estadsticas existentes, stas pueden complementarse con
alguna representacin grfica que permita la inspeccin visual de la magnitud de la variabilidad entre
estudios. Las representaciones ms utilizadas son el grfico de Galbraith (9), recomendado por ser
aplicable a cualquier tipo de estudio (observacional y experimental) y el grfico de LAbb (10), ms
restrictivo, aplicable nicamente a metaanlisis de ensayos clnicos.
El grfico de Galbraith representa la precisin de cada estudio (el inverso del error estndar) frente al
efecto estandarizado; asimismo, representa la lnea de regresin ajustada a estos puntos y una banda
de confianza. Los estudios que caen fuera de esta banda son los que ms contribuyen a la
heterogeneidad. Por otra parte, la posicin de los estudios en el eje de abscisas permite identificar
visualmente aquellos que tienen un mayor peso en el metaanlisis. Este grfico tambin se puede
utilizar para detectar fuentes de heterogeneidad al etiquetar los estudios por diferentes variables, tales
como el ao de publicacin.
El grfico de LAbb representa la tasa de eventos del grupo tratamiento frente a la tasa del grupo
control, por tanto, este grfico slo se presenta cuando la variable respuesta es binaria.
estudio
1 Porter
2 Rusell
3 Wilson
4 Stewart
5 Rusell
6 Jamrozik
7 McDowell
8 Page
9 Janz
10 Slama
11 Wetter
12 Demers
13 Wilson
14 Haug
15 Higashi
16 Slama
ref.
ao de
publicacin
grupo de intervencin
dejaron
no dejaron
de fumar
de fumar
grupo control
dejaron no dejaron
de fumar de fumar
(12)
1972
5
96
4
(13)
1979
34
997
8
(14)
1982
21
85
11
(15)
1982
11
493
4
(16)
1983
43
718
35
(17)
1984
77
435
58
(18)
1985
12
73
11
(19)
1986
8
106
5
(20)
1987
28
116
12
(21)
1990
1
103
1
(22)
1990
34
203
20
(23)
1990
15
277
5
(24)
1990
43
534
17
(25)
1994
20
134
7
(26)
1995
53
415
35
(27)
1995
42
2157
5
Tabla 3. Metaanlisis de diecisis ensayos clnicos aleatorizados que analizan
los efectos del consejo mdico para dejar de fumar (11).
86
1099
94
183
624
491
67
63
94
105
214
287
515
102
451
924
Esta revisin incluye 16 ensayos clnicos aleatorizados publicados entre 1972 y 1995, que investigan los
efectos del consejo mdico para dejar de fumar. En todos los estudios los pacientes fueron asignados
aleatoriamente al grupo intervencin, en el que se realiz consejo mdico, o al grupo control. La variable
respuesta es el abandono del tabaco, y la medida de efecto el riesgo relativo. En la figura 2 se muestran
los datos obtenidos con Epidat 3.12.
Figura 2.
La prueba de DerSimonian y Laird indica, con un nivel de confianza del 95 %, que no hay evidencia
estadstica de heterogeneidad
( p = 0,1280 ) .
manifiesto que los estudios no son homogneos. Asimismo, el grfico de LAbb confirma esta
hiptesis de heterogeneidad, con una nube de puntos que no se alinean en torno a una recta. Estos
resultados contradictorios no hacen ms que confirmar la poca potencia de la prueba para detectar
heterogeneidad. Por esta razn, se ha recomendado reducir el nivel de confianza, al 90 % o incluso
al 80 %, a fin de aumentar la potencia.
La inspeccin visual del grfico de Galbraith conduce a las siguientes conclusiones:
Hay evidencia de heterogeneidad entre los estudios, con una clara influencia del estudio 2Rusell (16), que es el que ms contribuye a la heterogeneidad, por caer fuera de las bandas de
confianza del grfico. Este estudio, el segundo en tamao, es el que proporciona la mayor
estimacin del efecto. La repeticin del anlisis sin este estudio produce un resultado de la
prueba de heterogeneidad no significativo ( Q = 13,91; g . de l. = 14; p = 0, 4563) .
Se pueden identificar dos grupos de estudios diferentes entre s pero que internamente
muestran mayor grado de homogeneidad. En el grfico, los dos grupos quedan separados por
la recta horizontal en y = 1 . Un primer grupo est constituido por los estudios 1 Porter (12), 4
Stewart (15), 5 Rusell (16), 7 McDowell (18), 8 Page (19) y 10 Slama (21) efecto estandarizado
en torno a cero, aunque la precisin vara de unos a otros. El estudio Rusell (16) es el ms
preciso y, por tanto, el de mayor peso en el metaanlisis. En el grfico de LAbb estos estudios
corresponden a los puntos que se sitan sobre la diagonal del cuadrado, pues un efecto
prximo a cero se traduce en tasas similares en los grupos tratamiento y control. Los restantes
estudios constituyen un segundo grupo con efecto estandarizado variable, pero muy por encima
del estimado en los del primer grupo.
Todas estas evidencias de heterogeneidad deben tenerse en cuenta en la combinacin de resultados.
(h) Combinacin de resultados
Existen diversas tcnicas estadsticas para la combinacin y presentacin de resultados en un
metaanlisis. La eleccin del mtodo depende fundamentalmente del tipo de medida de resultado/efecto
utilizada y de la valoracin del grado de heterogeneidad de los resultados de los estudios.
11
Estimacin del efecto combinado. Modelo de efectos fijos. Modelo de efectos aleatorios. Para la
obtencin de la medida resumen, los resultados de los estudios individuales son ponderados,
generalmente por la inversa de su varianza o por el tamao muestral, aunque tambin pueden aplicarse
otros criterios adicionales como la calidad del estudio. Epidat 3.1 pondera los estudios por la inversa de
la varianza.
La heterogeneidad entre los estudios puede tenerse en cuenta en el anlisis al utilizar los modelos de
efectos aleatorios (random-effects model), o no ser incluida, si se utiliza un modelo de efectos fijos
(fixed-effects model).
El modelo de efectos fijos asume que existe un nico efecto en la poblacin y no tiene en cuenta la
variabilidad de los resultados entre los distintos estudios. As, el tamao del estudio y su propia varianza
(variabilidad intra-estudio) son los nicos determinantes de su peso en el metaanlisis. El modelo de
efectos aleatorios, por el contrario, tiene en cuenta la posible heterogeneidad al considerar que los
efectos de la exposicin/intervencin en la poblacin son diversos y que los estudios incluidos en la
revisin son slo una muestra aleatoria de todos los posibles efectos. As, la ponderacin de los
estudios bajo este tipo de modelos considera no slo su propia varianza (variabilidad intra-estudio), sino
tambin la que pueda existir entre los estudios (variabilidad entre-estudios).
Al comparar ambos modelos, en general se puede decir que:
Los modelos de efectos aleatorios deben utilizarse siempre que se determine, tras un anlisis
de heterogeneidad, que los estudios no son homogneos y no puedan identificarse claramente
las causas, lo que suele ser habitual, especialmente en estudios epidemiolgicos.
Una limitacin de los modelos de efectos aleatorios es que se asume que los estudios incluidos
son representativos de una poblacin hipottica de estudios, y que la heterogeneidad entre los
ensayos puede ser representada por una sola varianza. Otra desventaja es que conceden un
peso excesivo a los estudios con pequeo tamao muestral.
Representacin grfica de los resultados. La representacin grfica de los resultados de un
metaanlisis contribuye a una fcil y rpida interpretacin. Para ello se construye una grfica en la que
en el eje de abscisas (eje X ) se representa la medida de efecto considerada (odds ratio, riesgo
relativo, etc.) y a lo largo del eje de coordenadas (eje Y ) se sitan los diferentes estudios,
generalmente ordenados por el ao de publicacin o cualquier otro criterio de ordenacin. Para cada
estudio y para la estimacin global del efecto, se representa su estimacin puntual y tambin el intervalo
de confianza que le corresponde (asumiendo un modelo de efectos fijos y/o efectos aleatorios).
Ejemplo. El anlisis de heterogeneidad en el ejemplo anterior indica que es aconsejable utilizar el
modelo de efectos aleatorios para obtener la estimacin global del efecto. El resultado permite concluir
que la intervencin mdica es significativamente beneficiosa para que los pacientes dejen de fumar.
(Resultados con Epidat 3.1.)
12
Figura 3.
(i) Identificacin del sesgo de publicacin. Todo metaanlisis debera valorar la posibilidad de la existencia
de un sesgo de publicacin que pudiese comprometer sus resultados y conclusiones. Se han propuesto
varios mtodos para la exploracin de la posibilidad y la cuanta del sesgo de publicacin. El ms simple
consiste en realizar un anlisis de sensibilidad, y calcular entonces el nmero de estudios negativos
realizados y no publicados que debera haber para modificar el sentido de una eventual conclusin
positiva obtenida con un metaanlisis. Si este nmero es muy elevado, se considera que la probabilidad
de que el sesgo de publicacin haya modificado sustancialmente los resultados es baja, y se acepta la
existencia de las diferencias sugeridas por el metaanlisis.
Tambin se puede examinar la posibilidad de sesgo de publicacin con el mtodo conocido como el
grfico en embudo (funnel plot). Se parte del supuesto de que los estudios que tendran mayor
probabilidad de no ser publicados seran los que no muestran diferencias (estudios "negativos"), sobre
todo si eran de pequeo tamao. Inversamente, si hubiera sesgo de publicacin, entre los estudios
pequeos (en los que hay mayor probabilidad de que se alteren los resultados por azar) se tendera a
publicar los que mostraran diferencias. En principio, en una comparacin entre dos opciones
teraputicas, los diferentes ensayos clnicos realizados sobre una misma cuestin deberan producir
estimadores de diferencias (en forma de razn de ventajas o de riesgo relativo) para cada ensayo que
se agrupasen alrededor de un estimador central, y mostraran tanta mayor dispersin alrededor de este
valor cuanto ms pequeo fuera su tamao, de modo que si se representara una grfica que en el eje
de ordenadas se registre el nmero de pacientes en cada ensayo y en el de abscisas la magnitud del
riesgo relativo, la nube de puntos se distribuira en forma de embudo invertido. Si hubiera sesgo de
publicacin en el sentido descrito anteriormente (de los ensayos pequeos, se tendera a haber
publicado los que hubieran mostrado diferencias favorables al tratamiento evaluado), la nube de puntos
resultara "deformada" y el embudo perdera su simetra, porque los estudios de pequeo tamao
tenderan a disponerse hacia la parte derecha respecto al estimador central.
Entre las limitaciones de estos grficos se destaca el hecho de tratarse de una tcnica visual, y por
tanto subjetiva, y de difcil interpretacin en el caso de que existan pocos estudios, lo que suele ser una
circunstancia habitual. Es aconsejable, entonces, complementar siempre el estudio de sesgo con
pruebas estadsticas ms objetivas, como las prueba de Begg (28) o de Egger (29) que contrastan la
hiptesis nula de ausencia de sesgo de publicacin.
Ejemplo. Considrese ahora como ejemplo un metaanlisis de estudios epidemiolgicos. Se trata de
diez estudios que evalan el efecto del consumo de anticonceptivos orales como factor de riesgo frente
al cncer invasivo de cuello uterino. Los datos se presentan en la tabla 4.
13
estudio
ref.
ao de
publicacin
odds
ratio
1 Brinton
(30)
1986
1268
1,49
1,10
2,10
2 Celentano
(31)
1987
306
0,69
0,25
1,89
3 Ebeling
(32)
1987
404
1,51
0,78
2,92
4 OMS
(33)
1993
4612
1,31
1,19
1,45
5 Parazzini
(34)
1990
556
1,85
1,00
3,14
6 Beral
(35)
1988
432222
1,80
1,00
3,30
7 Brinton
(36)
1990
2072
1,21
0,90
1,60
8 Kjaer
(37)
1993
1190
1,30
0,50
3,30
9 Daling
(38)
1996
687
1,00
0,60
1,60
10 Eluf Neto
(39)
1994
415
1,65
0,80
3,37
Tabla 4. Metaanlisis de diez estudios sobre el efecto del consumo de anticonceptivos orales
como factor de riesgo frente al cncer invasivo de cuello uterino.
Todos son estudios de casos y controles, salvo el de Beral (35), que es de cohortes. La prueba de
Dersimonian y Laird indica que no hay evidencia estadstica de heterogeneidad
( Q = 6, 4201; g. de l. = 9;
4). Este grfico permite identificar un estudio, el OMS, que destaca claramente por su mayor precisin
frente a los dems y, por tanto, por su mayor peso en el metaanlisis. La estimacin global de la odds
ratio (odds ratio = 1,32 e intervalo de confianza al 95 %: [1,22;1,44]) indica un efecto significativo del
consumo de anticonceptivos orales como factor de riesgo en el cncer invasivo de crvix.
la recta ajustada. Con los datos del ejemplo, la prueba de Egger confirma la hiptesis de ausencia de
sesgo (Resultados obtenidos con Epidat 3.1):
Figura 5.
Figura 6.
(j) Anlisis de sensibilidad. El anlisis de sensibilidad pretende estudiar la influencia de cada uno de los
estudios en la estimacin global del efecto y, por lo tanto, la robustez o estabilidad de la medida final
obtenida.
Este anlisis consiste en la repeticin del metaanlisis tantas veces como estudios seleccionados, de
forma que cada vez se omite un estudio combinndose todos los restantes. Si los resultados de los
distintos metaanlisis son similares, esto es, el efecto tiene una misma direccin, magnitud y
significacin estadstica, se puede concluir que los resultados son robustos. En caso contrario no se
tendra un estimador robusto, lo cual exigira cierta precaucin en la interpretacin de los resultados o
podra ser motivo para generar nuevas hiptesis. El anlisis de sensibilidad tambin puede utilizarse
para estudiar la influencia en los resultados del metaanlisis de ciertos aspectos relacionados con la
validez de los estudios, como por ejemplo la exclusin de: (a) estudios que no superan un determinado
umbral de calidad; (b) trabajos no publicados; o bien (c) estudios en los que hay incertidumbre sobre el
cumplimiento de los criterios de seleccin.
Ejemplo. El anlisis de sensibilidad realizado con los estudios del ejemplo anterior pone de manifiesto la
robustez del metaanlisis. Cuando se elimina cualquiera de los estudios incluidos no cambia la direccin
ni la significacin del efecto global. Sin embargo, s conviene destacar la influencia del estudio OMS, ya
detectada con el grfico de Galbraith, que por ser mucho ms preciso que los dems, al ser eliminado
produce una prdida de precisin en la estimacin global. (Resultados del anlisis de sensibilidad con
Epidat 3.1):
15
Figura 7.
(k) Publicacin. Se sugiere publicar primero y presentar personalmente despus, para que quede protegida
la autora intelectual del metaanlisis. Se debe intentar la publicacin en revistas mdicas de amplia
difusin y con comit de revisores. El ttulo del artculo debe contener la palabra metaanlisis, para
agilizar las bsquedas bibliogrficas futuras, e indicar la intervencin evaluada y su intencin.
El resumen contendr, en unas 200 palabras, el objetivo del metaanlisis, mtodo de bsqueda,
cantidad de ensayos clnicos identificados, incluidos y excluidos, con las razones de estas decisiones.
Mtodos de anlisis empleados y conclusiones alcanzadas.
El cuerpo del artculo tendr las siguientes secciones: Introduccin, con razones para requerir la sntesis
de la evidencia y el disenso existente. Material y mtodos, tipificando los criterios de elegibilidad de los
ensayos clnicos. Mtodos de bsqueda empleados. Listado de los ensayos clnicos encontrados,
aclarando incluidos y excluidos. Razones para su seleccin. Caractersticas de diseo y operativas de
los ensayos clnicos aclarando, criterios de elegibilidad de los participantes, caractersticas
demogrficas de los mismos, tamao muestral alcanzado, caractersticas de las intervenciones,
cumplimiento del protocolo, datos faltantes, control del sesgo de seleccin, evaluacin del punto final
(uso de enmascaramiento), acciones para certificar los datos presentes o lograr los faltantes en las
publicaciones y por ltimo mtodos de anlisis empleados. Anlisis de resultados y discusin, con la
evaluacin cualitativa y cuantitativa de los ensayos clnicos incluidos. Por ltimo, conclusin, sobre la
seguridad y eficacia de la intervencin analizada, sobre las limitaciones y problemas de las conclusiones
referidas y recomendaciones para el futuro de las investigaciones al respecto.
tambin puede introducir un sesgo, que favorece la tendencia de los resultados de los estudios que han sido
objeto de publicacin duplicada. Adems, se ha comprobado que en una proporcin importante de
metaanlisis se ignoran los trabajos publicados en idiomas distintos del ingls, y se ha visto que la
proporcin de estudios "negativos" es mayor en otras lenguas. Dada su naturaleza, es muy difcil impedir el
sesgo de publicacin, o por lo menos hacerse una idea de su magnitud.
6. Metaanlisis cualitativo
Valoracin de la validez de los estudios primarios: mtodo seguido para la extraccin de la informacin
relevante y pertinente de cada investigacin. El aspecto central en el metaanlisis cualitativo es la
valoracin de la calidad de una investigacin. La valoracin de la calidad es importante ya que los estudios
de alta calidad reducen sesgos y tienen mayor precisin para estimar el efecto que calculan. Se ha de
realizar una comparacin vertical de todos los estudios realizados.
7. Metaanlisis cuantitativo
El metaanlisis cuantitativo valora:
1. Los mtodos estadsticos empleados para la combinacin de resultados:
Comprobar que el modelo es continuo, hay distintos niveles exposicin y distintos niveles de riesgo;
Modelo de efectos fijos: cuando se asume que el efecto producido por la exposicin es constante de
estudio en estudio. Es el ms usual cuando se estudia toda la poblacin de artculos;
Modelo de efectos aleatorios: se asume una distribucin al azar a lo largo de distintos estudios. Cuando
slo se estudia un estrato de la poblacin de artculos.
y = a+b x
donde: y
b
a
es la exposicin;
es un coeficiente;
es el efecto aditivo sobre el riesgo.
exposicin
: relacin
riesgo
En el modelo de efectos fijos los estudios se combinan considerando que no existe heterogeneidad entre
ellos, y que por lo tanto todos ellos constituyen estimaciones de un efecto real, cuya magnitud se desea
conocer. As pues, la inferencia realizada est condicionada a los estudios que se han efectuado.
En el modelo de efectos aleatorios la inferencia se basa en suponer que los estudios incluidos en el anlisis
constituyen una muestra aleatoria del universo de estudios posibles, y sus resultados son ms
conservadores al tener en cuenta una fuente extra de variacin, ya que ahora se incluyen dos posibles
fuentes de variacin: la existente dentro de los estudios y la variacin entre los estudios.
La utilizacin de modelos bayesianos constituye, como ya se coment en el correspondiente tema, una
alternativa interesante a la estadstica inferencial clsica, pero por su complejidad no los comentaremos en
este artculo sobre metaanlisis.
Dado que una gran mayora de metaanlisis se efecta sobre resultados dicotmicos (fallece, fracasa el
tratamiento, efecto secundario, etc.) se centrar la exposicin en este tipo de variable, aunque la lgica
subyacente es similar para otro tipo de datos.
Si tenemos estudios que comparan dos grupos, por ejemplo un tratamiento nuevo con un grupo control, y
en los que el resultado es binario, por ejemplo efectivo no/s, podemos construir una tabla 2 x 2 para
presentar los datos de cada estudio y en ella calcular alguna de las medidas habituales (odds ratio, riesgo
relativo, diferencia de riesgo). Es importante tener en cuenta que no es correcto juntar sin ms todas esas
tablas para crear una tabla global y calcular en ella el dato medido, por ejemplo odds ratio. Esta situacin
errnea que se conoce con el nombre de paradoja de Simpson ya fue comentada anteriormente.
T =
w T
i =1
k
w
i =1
donde w i
s i2
s i2
var (T ) =
1
k
w
i =1
Y si se admite que T sigue una distribucin normal se puede calcular un intervalo de confianza del 95 %
( )
para ese efecto global sumando y restando al efecto global la raz cuadrada de var T
multiplicada por
1,96.
Para intervenir en el metaanlisis algunas medidas es preciso transformarlas, fundamentalmente tomando
logaritmos, antes de que puedan ser combinadas, con el fin de que su distribucin se aproxime a la normal.
Es lo que ocurre con la odds ratio y el riesgo relativo, con los que se trabajar siempre usando sus
logaritmos.
19
Ti = i + e i
donde e i
i .
var (Ti ) = 2 + i
donde
Existen diferentes mtodos matemticos para estimar los parmetros de este modelo. Se presentar aqu
unas frmulas sencillas para estimar un modelo de efectos aleatorios cuando se pondera con la inversa de
la varianza. Para estimar la varianza debida a la variacin entre estudios, se definen las siguientes
expresiones:
k
w
i =1
w =
s w2 =
1 k 2
2
wi k w
k 1 i =1
s w2
U = ( k 1) w
k
w
2 =
donde Q
Q ( k 1)
U
cuando Q > k 1
Si Q k 1 entonces la variacin entre estudios se considera 0 y el modelo coincide con el de efectos fijos
descrito anteriormente.
Seguidamente se calcularn unas ponderaciones ajustadas para cada estudio:
w i* =
1
1
+ 2
wi
T =
w
i =1
k
*
i
w
i =1
var (T ) =
Ti
*
i
1
k
w
i =1
20
*
i
Hay que destacar que no es correcto pensar que la utilizacin del modelo de efectos aleatorios elimina el
efecto de la heterogeneidad en los estudios y se debe tener claro que si la heterogeneidad es acusada el
objetivo primordial del metaanlisis debe centrarse precisamente en el estudio de esa variabilidad.
8.3. Heterogeneidad
Puede ocurrir que la variabilidad entre estudios sea superior a la que es de esperar por puro azar, y por ello
interesa contrastar la hiptesis de homogeneidad. Existe una prueba sencilla y utilizada habitualmente que
fue originalmente desarrollada por Cochran en 1954, sin embargo hay que llamar la atencin sobre la baja
potencia de sta para detectar diferencias, agravado por el hecho de que el nmero de estudios que se
combinan suele ser pequeo, por lo que no se debe contentar con aplicar la prueba y darla por buena si el
resultado ha sido no significativo. Siempre se debe intentar verificar la homogeneidad de los resultados
tambin por otros cauces, como puede ser un anlisis por subgrupos, que se describe ms adelante.
En esta prueba se trata en esencia de calcular una suma ponderada de las desviaciones del efecto
determinado en cada estudio con respecto a la media global:
Q =
w (T T )
i =1
2 con k 1
grados de
zi =
Ti T
es (Ti )
ya que bajo la hiptesis de homogeneidad, es decir de existencia slo de diferencias aleatorias entre los
estudios, stos valores estandarizados debieran seguir una distribucin normal N ( 0,1) .
Otro enfoque para determinar la presencia de heterogeneidad entre estudios es tratar de localizar la posible
causa de sta. Una pregunta que resulta natural en este contexto es si existe relacin entre la tasa de
respuesta y el riesgo base. Una buena herramienta grfica para verificarlo la constituye el grfico de l'Abb,
en el que, para cada estudio, se representa en el eje de ordenadas el resultado en el grupo de tratamiento
frente al resultado en el grupo de control en el eje de abscisas, y una lnea a 45 que divida el grfico en
dos secciones: a un lado de esta lnea quedarn los estudios en los que fue favorable el grupo de
tratamiento y al otro lado los estudios en los que fue favorable al grupo de control. Se suele representar los
puntos de tamao variable con un rea inversamente proporcional a la varianza de la estimacin del efecto
en cada estudio (directamente proporcional a la precisin de la estimacin), de tal manera que cuanto ms
grande es un punto mayor precisin tiene el estudio que representa. La presencia de puntos dispersos en el
grfico de l'Abb indica heterogeneidad, mientras que si se agrupan en una zona estrecha es seal de
resultados ms homogneos.
Figura 8.
21
La presencia de patrones en este grfico puede orientar sobre lo que est ocurriendo. Si la eficacia depende
del riesgo base, podra ocurrir que para riesgos base bajos los puntos estn muy prximos a la lnea
divisoria o incluso del lado de la no eficacia, y a medida que nos vamos moviendo hacia riesgos base
mayores los puntos se vayan alejando de esa lnea hacia valores de mayor eficacia como se ve en la figura
anterior.
Se puede llevar ms lejos la idea de que alguna caracterstica subyacente en los estudios puede estar
afectando a la heterogeneidad de los resultados, no slo el riesgo base, sino cualquiera otra caracterstica.
Una herramienta estadstica que se emplea para analizar esa posibilidad es la meta-regresin.
8.4. Meta-regresin
El trmino meta-regresin describe el anlisis en el que las caractersticas de los estudios o de los sujetos
incluidos en cada estudio se usan como variables explicativas en un modelo de regresin multivariante, en
el que la variable dependiente es el efecto medido o alguna medida de la desviacin del efecto de cada
estudio respecto del efecto global.
Aqu la unidad de observacin es cada estudio o cada subgrupo de estudios, y a la hora de estimar los
coeficientes de la ecuacin de regresin se emplean mtodos que ponderan la intervencin de cada estudio
en esa estimacin, de acuerdo a su precisin (proporcional al tamao del estudio, inversamente
proporcional a la variabilidad del estudio).
Puesto que la muestra es pequea (nmero de estudios), el nmero de variables independientes que
intervienen en la ecuacin de regresin debe ser pequeo. Al igual que en el anlisis de regresin
tradicional se usa la regla orientativa de 5 10 casos por cada variable, y dado que el nmero de estudios
en un metaanlisis suele ser pequeo no se debe utilizar muchas variables en la ecuacin de regresin.
En la figura 9 puede verse una grfica tpica de meta regresin de un ejemplo ya clsico, en la que se
presenta el logartmo de la odds ratio (eficacia de la vacuna BCG contra la tuberculosis) frente a la latitud
del pas en el que se efectu el estudio. El rea de los puntos es inversamente proporcional a la varianza
del ln odds ratio. Tambin se puede ver representada la ecuacin de meta-regresin, que a diferencia de
una ecuacin de regresin normal en la que todos los puntos intervienen por igual, aqu atraen la recta
hacia s en razn directa a su masa. En este caso se puede ver que probablemente el riesgo de ineficacia
de la vacuna tiende a aumentar cuando se acerca al ecuador.
Figura 9.
combinan son ensayos clnicos aleatorizados y sus resultados son homogneos, aunque el tamao de
muestra original era insuficiente para obtener resultados concluyentes. En el resto de los casos, estudios
discrepantes, la investigacin de la presencia y causas de la heterogeneidad de los resultados puede pasar
a convertirse en el principal objetivo del metaanlisis y desplazar al otro objetivo de obtener un valor global
medio.
Cuando las discrepancias entre los estudios son moderadas no ser adecuado utilizar un modelo de efectos
fijos y ser preciso acudir al modelo de efectos aleatorios o incluso a un modelado ms complejo, y en
cualquier caso los resultados tendrn que ser interpretados con cautela.
El primer paso de un anlisis de subgrupos, que tambin se conoce como anlisis de sensibilidad, consiste
en repetir los clculos extrayendo uno de los estudios cada vez. Podemos representar grficamente el
resultado del anlisis repetido excluyendo un estudio, frente al efecto global calculado con todos los
estudios y su intervalo de confianza. Esto permite visualizar como afecta cada estudio al resultado global.
Figura 10.
23
Figura 11.
0,96
0,96
0,70
0,40
1,00
0,70
0,82
0,69
0,73
0,25
0,21
0,26
0,10
0,06
0,21
0,25
0,17
0,45
3,73
4,29
1,92
1,60
16,65
2,28
2,69
2,85
1,16
varianza
0,478
0,585
0,265
0,506
2,059
0,365
0,369
0,524
Tabla 5.
Para finalizar despus de reconocer que una buena revisin sistemtica es una excelente herramienta para
valorar los conocimientos y conclusiones sobre un asunto, es una valiossima herramienta para ayudar a
tomar decisiones y para definir nuevas lneas de trabajo, y que adems est sirviendo para que mejore la
calidad y homogeneidad en la presentacin de los datos en los estudios bsicos, pero no est de ms
recordar el proverbio popular de que mil conejos blancos no hacen un caballo blanco, ni siquiera en un
metaanlisis!
Hiptesis nula : odds ratio1 = odds ratio 2 = = odds ratio k = odds ratio ajustado
donde: k
es el nmero de estratos.
tratamiento experimental
presente
ausente
efecto
presente
ai
bi
m1i
ausente
ci
di
m 2i
totales
n1i
n 2i
Ni
24
Para cada estrato i se calcula la odds ratioi , que es la odds ratioespecfica por estrato.
Para el estrato i :
ai d i
odds ratio i =
bi c i
ai d i
ln ( odds ratio i ) = ln
bi c i
s i2 =
1
1
1
1
+
+
+
a i bi c i d i
y
k
ln ( odds ratioPOND ) =
i =1
2
i
ln ( odds ratio i )
k
s
i =1
2
i
El ln ( odds ratioPOND ) es el logaritmo neperiano del promedio ponderado de la odds ratio, igual que el
logaritmo neperiano de la odds ratio, ajustado de Mantel-Haenszel.
Finalmente, el test de Homogeneidad de Woolf se distribuye como una con k 1 grados de libertad (si
el valor del estadstico es pequeo, no se puede rechazar la hiptesis nula y se ha de aceptar que los
estratos son homogneos):
2
2
Woolf
=
i =1
POND
))
2
i
Si se acepta la hiptesis nula de homogeneidad, tiene sentido calcular una medida de magnitud, resumen
del efecto del tratamiento utilizado, a lo largo de los diferentes estratos, que sera la odds ratio ajustado de
Mantel-Haenszel.
ai d i
a1 d 1 a 2 d 2
a dk
+
++ k
Ni
N1
N2
Nk
i =1
=
=
k b c
b1 c1 b 2 c 2
bk c k
i
i
+
+
+
N1
N2
Nk
N i
i =1
k
odds ratio M H
La divisin por N i sirve para ponderar por los tamaos de los diferentes estratos (tamaos de los distintos
estudios). Mediante la frmula de Woolf se pueden obtener resultados similares.
El estadstico de Mantel-Haenszel es una generalizacin directa del anlisis sencillo de la . Esta prueba
puede aplicarse tanto a datos independientes como apareados. Se basa en una distribucin
hipergeomtrica para estudios de seguimiento acumulados, de casos y controles (densidad y acumulados) y
de corte transversal. Para estudios de cohortes con densidad de incidencia se utiliza una distribucin
binomial. La hiptesis nula es, como habitualmente, que la odds ratio sea 1.
2
25
El diseo general (para variables dicotmicas, exposicin y enfermedad) es una prueba para grandes
muestras que utiliza el estadstico
M2 H =
(a E )
var ( E )
donde a
Ea
var ( E a ) es la varianza del total de casos expuesto tambin bajo la hiptesis nula.
La forma especfica de estos dos ltimos valores depende del diseo del estudio.
En tabla anterior, la casilla principal es la superior izquierda, a, ya que los marginales vienen dados por los
datos del estudio y conociendo una casilla, se derivan las tres restantes. Asumiendo que los valores en
cada estrato son independientes, los valores esperados para todos los estratos y sus varianzas se calculan
con las siguientes frmulas:
Ea
M2 H
M2 H
ai =
n1i m1i
i =1
Ni
i =1
var ( E a ) =
en consecuencia, la
n1i n 2 i m1i m 2 i
(N
i =1
1) N i2
N
i
i
=
=
1
1
i
= k
n1i n 2 i m1i m 2 i
(N
i =1
k a i d i bi c i
Ni
i =1
= k
n1i n 2 i m1i
(N
1) N i2
i =1
m 2i
1) N i2
que puede ser comparado con los valores de una tabla con un grado de libertad. Debe tenerse en
cuenta que aunque los estratos tengan pocos casos en las celdas, lo que interesa son los totales
marginales para considerar la utilizacin de esta prueba estadstica.
La precisin del estimador odds ratioM H puede calcularse por varios mtodos. El mtodo de Miettinen (40)
es sucio y rpido. Calcula un estimador aproximado del error estndar mediante el test based, basado en
2
la prueba
2:
intervalo de confianza = odds ratio
donde:
M H =
1 z 1
2
M H
M H
M2 H
Los mtodos exactos de Flanders (41) y de Robins (42) son ms seguros y complejos. El mtodo de
es ln ( odds ratio M H ) =
k
bi c i
i =1 N i
p
bi c i
N i2
i =1
ai d i + 1
+ ( bi c i )
odds ratio M H
Coeficientes de correlacin.
var ( )
Inconveniente:
x E xC
sC
nC + n E
nC n E
2
+
2 ( n C 1)
Slo la varianza del grupo control se usa para estandarizar la diferencia entre medias.
donde: S =
(n
var ( d )
1) s C2 + ( n E 1) s E2
nC + n E 2
27
x E xC
s
nC + n E
nC n E
J
+
g2
2 ( nC + n E 2)
J = 1
3
4 ( nC + n E 2) 1
d
var ( d )
donde:
(n
=
=
x E xC
nC + n E
nC n E
nC + n E
d2
+
2 ( nC + n E 2) nC + n E 2
1) s C2 + ( n E 1) s E2
nC + n E
Ventaja:
no se afecta por varianzas muestrales distintas.
Inconveniente: sesgada por tamaos muestrales pequeos.
ln ( R )
var ( ln ( R ) )
xE
= ln
xC
s E2
s C2
=
+
n E x E2 n C x C2
control
respuesta
experimental
a
total
a+b
no respuesta
c+d
total
nE = a + c
nC = b + d
N = a +b+c+ d
28
A
b
y
, respectivamente:
nE
nC
PE =
a
nE
PC =
b
nC
= PE PC
RD
var ( RD ) =
PE (1 PE )
nE
PC (1 PC )
nC
odds ratio
var ( RD ) =
PE (1 PE )
PC (1 PC )
PE (1 PC )
PC (1 PE )
ad
bc
1 1 1 1
+ + +
a b c d
9.10. Correlaciones
1. A veces los datos originales estn en diferentes fuentes ( F , t ,
2 , ...);
2. Es til transformar todo estos estadsticos en correlaciones de Pearson y calcular el tamao del efecto a
partir de ellas;
3. Estas transformaciones se pueden hacer con una meta-calculadora. Las transformaciones ms
frecuentes son:
r =
r =
z
N
12
N
r =
t2
t 2 + gl
r =
F
F + gl
29
1 1+ r
ln
2 1 r
1
=
n 3
=
z
var ( z )
donde n
2.
es el tamao muestral.
Ventaja:
Inconvenientes:
puede incluir estudios tomados de forma diferente, por lo que puede aumentar la
cantidad de estudios metaanalizados.
est sesgado ligeramente cuando el tamao muestral es bajo;
hay que tener cuidado con no incluir estudios demasiado heterogneos
(F
1,12
are
quoted
even
when
non-significant,
e.g.
t 23 = 0.25, p = 0.34 ,
or
F2,32 = 1.12, p = 0.55 . However, non significant tests (i.e. p > 0.05 ) should always be
interpreted as such.
(see Instructions for Authors, JEB inside back cover, or
http://www.blackwellpublishing.com/journals/jeb/submiss.htm)
w
i =1
n
w
i =1
var ( E )
1
n
w
i =1
30
Ei
1
.
s i2
donde w i
Ventaja:
E t 2 n 1 s E
donde
2. Una vez establecido el intervalo de confianza, se puede evaluar estadsticamente el efecto global del
conjunto de estudios. Se admite un efecto acumulado significativo cuando el intervalo de confianza no
incluye el valor cero.
QT =
w
i =1
E
2
i
w
i =1
E i2
=
w
i =1
(E
i =1
E)
nula es que todos los tamaos de efecto son iguales. Una QT significativa indica que la varianza entre
tamaos de efecto es mayor que la esperada por azar].
3.
Ej
w
i =1
Ei j
w
i =1
31
ij
ij
var ( E j ) =
w
i =1
donde k j
ij
wi j
Ei j
E j t 2 k j 1 s E j
3. Se admite que E j es significativo cuando el intervalo de confianza no incluye el valor cero.
Q wi =
2. Se contrasta frente a una
w (E
ij
i =1
Ej)
ij
3. Se puede adems comprobar si la los grupos difieren entre ellos en tamao de efectos. Para ello, se
descompone la heterogeneidad total QT en heterogeneidad o variacin en tamaos del efecto debida al
modelo Q M y heterogeneidad debida al error Q E :
QT = Q M + Q E
4. Para datos categricos Q M describe la diferencia entre grupos en los tamaos de efectos acumulados
y se calcula como:
QM =
donde: m
kj
w ( E
i = 1 j =1
ij
E)
es el nmero de grupos;
es el numero de estudios en el grupo j ;
Q
i =1
mi
w ( E
i =1 j =1
ij
ij
Ej)
es el nmero de grupos;
E i = b 0 + b1 X i +
j
donde b 0 =
wi E i b1 wi E i
i =1
i =1
es la interceptacin de la ordenada; y
w
i =1
i
j
w
i =1
b1 =
X i Ei
wi X i
i =1
w
i =1
Ei
w
i =1
w
X
i
i
j
i =1
2
wi X i
j
i =1
wi
es la pendiente
i =1
4. Sin embargo, sus errores estndares no pueden calcularse mediante el procedimiento de mnimos
cuadrados, sino como:
s b0 =
1
j
wi wi X i
i =1
i =1
w
i =1
s b1 =
Xi
1
j
w
i =1
wi X i
i =1
2
i
w
i =1
5. Dividiendo la pendiente y la ordenada en el origen por sus errores estndares, se halla la puntuacin z .
Este valor se compara al de una distribucin normal para ver si son significativas [si la variable
independiente explica significativamente la variacin en tamaos de efectos].
6.
Q M y Q E se calculan como:
QM =
b12
s 2b1
Q E = QT Q M
33
7.
Q M se comprueba con una 2 con un grado de libertad y su nivel de significacin ser idntico al
nivel de significacin de b1 .
8. Un Q M significativo significa que X i explica una porcin significativa de la variacin en tamaos del
efecto.
9.
Q E se contrasta frente a una 2 con n 2 grados de libertad, y si sale significativo implica que hay
an heterogeneidad no explicada por el modelo.
pooled .
w i ( rand ) =
2
v i + pooled
7. La varianza entre estudios se calcula usando la siguiente frmula cuando no hay estructura:
2
=
pooled
QT ( n 1)
j
w
i =1
w
i =1
j
2
i
w
i =1
QE (n m)
m j
wi
j =1 i =1
i =1
wi j
i =1
2
ij
10. El numerador es de nuevo la varianza no explicada en tamaos de efecto menos el nmero de grados
de libertad. El denominador es una funcin sumatoria de las ponderaciones.
11. Este modelo se denomina a veces modelo de efectos mixtos porque incluye variacin aleatoria entre
estudios dentro de un grupo y diferencias fija entre grupos.
34
12. Cuando hay estructura subyacente en los datos, y los predictores son continuos, la varianza se calcula
como:
Q E ( n 2)
2
=
pooled
w
i =1
wi X i2 2 X i wi X i ii + X i2 wi
i =1
i =1
w w X
i
i =1
i =1
2
ii
w i X i2
i =1
i =1
2
13. El numerador es de nuevo la varianza no explicadas en tamaos de efecto menos el nmero de grados
de libertad. El denominador es una funcin sumatoria de las ponderaciones.
E1
E
E = 2
E n
y sea X la matriz de dimensiones p n de variables dependientes
1 X 11
1 X
12
X =
1 X 1n
X p1
X p 2
X p n
X 21
X 22
X 2n
donde la primera columna es la nica columna incluida para un metaanlisis no estructurado, y las dems
columnas son aadidas cuando existe estructura.
Segn el modelo lineal general, la relacin entre variables dependientes e independientes se determina de
acuerdo con la ecuacin:
E = X +
donde
es un vector de coeficientes (0 a p ); y
es el error del modelo.
En el metaanlisis, los tamao de efecto varan en precisin alrededor del tamao de efecto acumulado
verdadero, por lo que se necesita una estimacin ponderada de :
= ( X W X ) X W E
1
donde W
E i = 0 + 1 X 1i + 2 X 2 i + + p X pi
2. La varianza de los coeficientes se hallan como:
= ( X W X )
35
3. Usando el modelo lineal general se pueden tambin hallar la heterogeneidad explicada por el modelo
QM, la heterogeneidad residual QE y por ende la heterogeneidad total QT (frmulas no mostradas):
Figura 12.
Diagrama de embudo
Otra forma simple de evaluacin son los diagramas de embudo (funnel plot), un grfico que representa los
tamaos de los efectos frente al tamao muestral. En ausencia de sesgo debe cumplirse:
Estudios con tamao muestral bajo deben tener error de muestreo alto, y por lo tanto la variacin
alrededor del tamao de efecto debe disminuir cuando aumento el tamao muestral;
Para un tamao muestral dado, los estudios deben estar distribuidos segn una normal de media el
tamao de error acumulado.
Si estas tres condiciones se cumplen, se obtendr un grfico en forma de embudo (figura 13):
Grfico de cuantiles normales (54)
El grfico de cuantiles normales (54) es un tipo especial del grfico cuantil-cuantil, donde se representan los
cuantiles de nuestra distribucin (el tamao de efecto estandarizado) con una distribucin normal. Si son
iguales, los puntos deben caer en la recta y = x . Este mtodo tiene la ventaja de que es ms fcil de
interpretar, y adems comprueba el supuesto de normalidad bsico a todo estudio metaanaltico.
36
La pendiente de la regresin lineal indica la desviacin tpica de los datos (debera ser igual a 1) y la
interseccin con el eje Y indica la media. La presencia de sesgo de publicacin produce huecos extraos o
extrema no linealidad.
2.22
Tamao de efecto
0.50
-1.23
-2.95
-4.67
2.00
Tamao muestral
6.50
11.00
15.50
20.00
Figura 13
5.53
3.29
1.05
-1.18
-3.42 -2.27
-1.13
0.00
1.1
3
2.27
Normal Quantile
Figura 14
E* =
E)
v*i
1
j =1 v i
donde v i = v i
*
(E
37
Fail-safe number
Este mtodo calcula el nmero adicional de estudios con tamao de efecto cero que se tiene que aadir
para cambiar los resultados de significativo a no significativo. Existen varios procedimientos para calcularlo.
El ms clsico es el propuesto por Rosenthal (56):
2
NR
donde: n
z( pi )
i =1
n
=
2
z
es el nmero de estudios;
z(p )
1
NO =
donde: n
n ( E0 Em )
Em En
es el nmero de estudios;
E0
Em
En
N =
n W
n
w
i =1
donde: n
wi =
es el nmero de estudios;
1
vi
Ei
i =1
W = 2
t (v)
12
w
i =1
El safe number en todo caso debe ser inferior a un valor umbral 2 N + 10 , siendo N el nmero de
estudios.
38
recomendacin
1
grado A
metaanlisis
ensayos clnicos aleatorizados con errores y bajos
grado B
3
4
grado C
grado C
grado C
Menos sesgos;
Ms difciles de realizar.
39
17. Conclusiones
El metaanlisis debe ser visto como la estructuracin del proceso a travs del cual se realiza una revisin
de la investigacin existente. La exhaustividad de la revisin y el grado de "combinabilidad", que deben ser
considerados en cualquier revisin, se abordan de forma explcita. Fue razonable combinar los ensayos
individuales que componen un metaanlisis? Es el resultado robusto en relacin con los cambios en las
asunciones? La conclusin alcanzada, tiene sentido desde el punto de vista clnico y fisiopatolgico?
40
18. Glosario
anlisis de sensibilidad (sensitivity analysis): existen diferentes tipos. En la valoracin de la
heterogeneidad, el anlisis de sensibilidad trata de la inclusin/exclusin de estudios especficos. En el uso
de tcnicas estadsticas de combinacin, consiste en la repeticin del anlisis de combinacin mediante
varios mtodos, para valorar si se alcanzan los mismos resultados y si stos se alteran por la calidad de los
estudios individuales y el sesgo de publicacin.
calidad de un estudio (study quality): valoracin global de un estudio segn un protocolo probado y
validado. Dado que las diferentes escalas de calidad dan resultados divergentes, deben interpretarse con
precaucin los anlisis basados en una puntuacin global de la calidad. Resulta ms fcil en los ensayos
clnicos que en los estudios de observacin. Los evaluadores deberan utilizar procedimientos que los
mantuvieran enmascarados con respecto a la informacin que puede influir en la evaluacin.
Colaboracin Cochrane (Cochrane Collaboration): organizacin internacional llamada as en honor a
Archibald Cochrane y cuyo objetivo es ayudar a los profesionales a adoptar decisiones bien informadas
sobre la asistencia sanitaria por medio de la preparacin, diseminacin y actualizacin continua de
revisiones sistemticas de ensayos clnicos sobre los efectos de las intervenciones sanitarias. Estas
revisiones se publican en la Cochrane Database of Systematic Reviews, disponible en CDROM. Se pueden
encontrar ms detalles en la siguiente direccin de Internet: www.cochrane.org.
combinacin (pooling): estimacin de una magnitud de efecto resumen (o combinada) tras la agregacin
de las magnitudes de efecto de los estudios individuales.
estadstico Q (Q statistic): prueba de la ji al cuadrado para valorar la heterogeneidad de los estudios
incluidos en un metaanlisis, en la que la magnitud del efecto de cada estudio individual se compara con el
estimador combinado. Por su validez, potencia estadstica y facilidad de clculo, esta prueba de
heterogeneidad es la mejor eleccin.
Glass, Gene V.: psiclogo de la educacin que acu el trmino metaanlisis en 1976.
grficos en rbol de Navidad (Christmas tree plots): grfico que se utiliza para detectar
el sesgo de publicacin, en el que en el eje de ordenadas se representa el tamao del estudio (o el error
estndar del parmetro que se pondera en sentido decreciente) y en el de abscisas el parmetro que mide
la magnitud del efecto. Se traza un eje vertical que pasa por el valor ponderado global. La asimetra con
relacin al eje (sobre todo en la parte baja del rbol) indica sesgo de publicacin.
grficos en embudo (funnel plots): conjunto de mtodos grficos para representar la existencia de un
posible sesgo de publicacin. Muestra la relacin entre la magnitud del efecto (eje de ordenadas) y el
tamao del estudio (eje de abscisas), que se puede medir de distintas maneras (error estndar de la
magnitud del efecto, su inverso, el tamao de la muestra o el nmero de efectos observados). Se dibuja una
lnea horizontal que pasa por el valor ponderado global. Si no hay sesgo de publicacin aparece la forma de
un embudo tpico (simetra con relacin a la lnea dibujada).
heterogeneidad (heterogeneity): significa que hay variabilidad estadstica entre los estudios que se
combinan. Puede proceder de muchas fuentes (ms numerosas en los estudios de observacin que en los
diseos experimentales): caractersticas de la poblacin del estudio (por ejemplo, el riesgo subyacente del
efecto o subgrupos diferentes de alto o bajo riesgo), variaciones en el diseo del estudio (tipo de diseo,
mtodos de seleccin, fuentes de informacin, manera de reunir la informacin), diferentes mtodos
estadsticos y distintos esquemas de ajuste de los factores de confusin. Dado que las pruebas estadsticas
de heterogeneidad tienen poca potencia estadstica, se recomienda utilizar como punto de corte una p < 0,1
(no 0,05). Si hay heterogeneidad, el estimador ponderado no tiene sentido, ya que ello significa que hay
ms de una magnitud de efecto verdadera en los estudios que se combinan.
homogeneidad (homogeneity): lo opuesto a heterogeneidad.
inverso de la varianza (inverse of variance): el tipo ms comn de ponderacin utilizado para combinar
diferentes estudios individuales en un estimador ponderado. Se puede aplicar a muchas medidas de
magnitud del efecto.
magnitud del efecto (effect size): estimador estandarizado no escalar de la relacin entre
una exposicin y un efecto. En sentido general, este trmino se aplica a cualquier medida de la diferencia
en el resultado entre los grupos de estudio; de tal manera que el riesgo relativo (relative risk), la razn de
odds (odds ratio) y la diferencia de riesgos (risk difference) son magnitudes de efecto. Cuando la
magnitud del efecto se aplica a mediciones de variables continuas (como la media), su estimador comn
41
ms usado es la diferencia media estandarizada, que se calcula como la diferencia de medias dividida por la
desviacin estndar. Esto es sobre todo til cuando no hay una medida comn a todos los estudios.
metaanlisis (meta-analysis, overview): el prefijo meta (del griego ) significa despus de. Se puede
definir como la sistemtica identificacin, valoracin, sntesis y, si es pertinente, la agregacin estadstica de
todos los estudios sobre el mismo tema, siguiendo un mtodo explcito y predeterminado.
metaanlisis acumulado (cumulative metaanalysis): tipo de metaanlisis en el que los estudios se
combinan secuencialmente mediante la adicin cada vez de un estudio nuevo segn una variable ordinal.
Por ejemplo, si la variable ordinal es el ao de publicacin, los estudios se ordenarn por ella, y a
continuacin se realizar un anlisis combinado cada vez que aparezca un estudio. Muestra la evolucin del
estimador ponderado segn la variable ordinal. Otras variables frecuentemente usadas en el metaanlisis
acumulado son la calidad del estudio, la frecuencia del efecto en el grupo de referencia, el tamao de la
diferencia entre los grupos y otras variables (por ejemplo, el tiempo medio transcurrido hasta el tratamiento).
Mide la contribucin de un nuevo estudio a lo ya existente y tambin se puede utilizar como procedimiento
para explicar la heterogeneidad.
metaanlisis cualitativo (qualitative metaanalysis) : parte del metaanlisis que se refiere a la valoracin de
los mtodos utilizados en cada estudio individual. En la actualidad se considera prcticamente sinnimo del
concepto de revisin sistemtica.
metarregresin (meta-regression): coleccin de mtodos estadsticos (regresin lineal ponderada o no,
regresin logstica) para valorar la heterogeneidad, en los que la magnitud del efecto se enfrenta a una o
ms covariables. Es un procedimiento que se puede utilizar cuando el nmero de estudios no es muy
abundante (< 20).
mtodo de De Simonian-Laird (DerSimonian- Lairds method): fue descrito por vez primera por Cochrane
en 1954. Fue el primer modelo de efectos aleatorios y se aplic a un modelo aditivo (diferencia de riesgos),
ponderado por el inverso de la varianza.
mtodo de Egger (Eggers method): procedimiento para detectar un sesgo de publicacin. Consiste en una
regresin lineal simple de la magnitud del efecto dividida por su error estndar sobre el inverso del error
estndar, en la que se prueba si la ordenada en el origen es estadsticamente significativa con p < 0,1.
mtodo de Macaskill, Walter e Irwig (Macaskill et als method (58)): es mejor que el mtodo de Egger para
detectar un sesgo de publicacin. Se realiza una regresin lineal simple entre la magnitud del efecto y el
tamao del estudio (el clsico funnel plot). Se recomienda ponderar la regresin por el inverso de la
varianza del efecto global observado en cada estudio individual. Se investiga si la pendiente de la recta de
regresin es distinta de cero o no. En el caso de estudios experimentales o de cohortes, el efecto es la
enfermedad (curacin, etc.); en estos casos se suman los efectos observados en los grupos que se
comparan y el resultado se divide por el tamao total del estudio (incidencia acumulada o tasa total).
mtodo de Mantel-Haenszel (Mantel-Haenszels method): mtodo estadstico de combinacin de riesgos
relativos y razn de odds de estudios individuales, que se describi para combinar estratos de un mismo
estudio. Hay que conocer la distribucin cruda de los datos, por lo que suele ser apropiado para los estudios
experimentales aleatorizados, pero si los autores de los estudios originales proporcionan la informacin
necesaria, puede aplicarse a cualquier tipo de estudio.
mtodo de Peto (Petos method): mtodo estadstico para combinar estudios individuales, derivado del
mtodo de Mantel-Haenszel, en el que los efectos observados en el grupo ndice se comparan con los
esperados, ponderando por la varianza. Debera usarse slo cuando el tamao de muestra de las ramas de
un estudio es similar y cuando la magnitud de efecto es prxima al valor nulo; en otras situaciones da un
resultado sesgado (que es lo ms habitual).
modelo de efectos aleatorios (random effects model): mtodo de combinacin de magnitudes de efecto
individuales en el que la heterogeneidad se incorpora al estimador
resumen mediante la inclusin de un componente de la variabilidad entre los estudios. Supone que la
muestra de estudios incluidos en el anlisis se extrae de una poblacin de estudios. Este modelo no supone
homogeneidad en las magnitudes de efecto de los estudios que se combinan; esto es, cada muestra de
estudio tiene una verdadera magnitud de efecto. No hay acuerdo sobre si este modelo es ms apropiado
que el de efectos fijos para combinar estudios. Se recomienda cuando el nmero de estudios es pequeo,
siempre y cuando no haya sesgo de publicacin, ya que es un mtodo que da ms importancia a los
estudios pequeos.
modelo de efectos fijos (fixed effects model): cualquier modelo estadstico en el que se asume
homogeneidad del efecto en los diferentes estudios que se combinan, esto es, en el que la verdadera
magnitud del efecto tiene un valor comn y real para todos los estudios. En el estimador ponderado slo se
considera la varianza de cada estudio individual.
42
peso (weighting): la influencia dada a cada estudio individual en el anlisis combinado. Hay diferentes tipos
de ponderaciones: inverso de la varianza, por la distribucin de los datos (Mantel-Haenszel), por la varianza
de los casos esperados en la referencia (Peto), etctera.
problema de la extraccin de archivos (file drawer problem): trmino acuado por Rosenthal para
referirse al nmero de estudios con resultados no significativos estadsticamente (p > 0,05) que no se han
publicado.
revisin sistemtica (systematic review): sntesis de los resultados de varios estudios primarios mediante
tcnicas que limitan los sesgos y el error aleatorio. Estas tcnicas incluyen la bsqueda de todos los
estudios potencialmente relevantes y el uso de criterios explcitos y fiables en la seleccin de las
investigaciones. La revisin sistemtica cualitativa resume las investigaciones primarias u originales sin
combinacin estadstica (metaanlisis cualitativo). La revisin sistemtica cuantitativa es sinnimo de
metaanlisis.
sesgo de bsqueda (bias, search): error sistemtico introducido cuando la bsqueda se centra en una sola
base de datos (normalmente Medline). Las revistas escritas en ingls estn ms representadas en Medline;
adems, las revistas de un pas (y de pases vecinos o de similar idioma o cultura) donde se confecciona la
base de datos tambin estn proporcionalmente ms representadas. Es recomendable consultar ms de
una base de datos, junto con una bsqueda manual de las referencias localizadas en cada estudio.
sesgo de idioma (bias, language): error sistemtico introducido cuando la bsqueda de estudios
potenciales de un metaanlisis se centra en un solo idioma, en general el ingls. Es posible que los
resultados significativos alcanzados en pases de habla no inglesa se publiquen ms frecuentemente en
ingls que en su idioma nativo, por la mayor difusin alcanzada.
sesgo de publicacin (bias, publication): sesgo introducido cuando los estudios publicados no representan
adecuadamente todos los estudios realizados sobre un tema especfico. Puede deberse a muchos hechos,
aunque el mejor conocido es la tendencia a publicar resultados estadsticamente significativos (p < 0,05) o
clnicamente relevantes (magnitud del efecto alta, aunque no significativa). Otras variables que influyen en
el sesgo de publicacin son el tamao de muestra (mayor sesgo en estudios pequeos), tipo de diseo
(menor en los ensayos clnicos aleatorizados), financiacin, conflicto de intereses, prejuicio frente a una
asociacin y el patrocinio.
19. Bibliografa
1.
Dickersin K, Higgins K, Meinert CL. Identification of meta-analyses. The need for standard
terminology. Control Clin Trials. 1990;11(1):52-66.
2.
Fisher RA. Statistical methods for research workers. 4 ed. Londres: Oliver and Boyd; 1932.
3.
Stouffer SA, Suchman EA, DeVinney LC, Star SA, Williams RM. The American soldier: Adjustment
during army life. Princeton: Princeton University Press; 1949.
4.
Mosteller F, Bush RR. Selected quantitative techniques. In: Lindsey G, editor. Handbook of social
psychology. Vol 1. Theory and method. Cambridge: Addison-Wesley; 1954. p. 289-334.
5.
Smith ML, Glass GV. Meta-analysis of psychotherapy outcome studies. American Psychologist
1977;32:752760.
6.
Lipsey MW, Wilson DB. Practical meta-analysis. Londres: Sage Publications; 2001.
7.
Dickersin K, Scherer R, Lefebvre C. Identifying relevant studies for systematic reviews. Bmj.
1994;309(6964):1286-91.
8.
DerSimonian R, Laird N. Meta-analysis in clinical trials. Control Clin Trials. 1986;7(3):177-88.
9.
Galbraith RF. A note on graphical presentation of estimated odds ratios from several clinical trials.
Stat Med. 1988;7(8):889-94.
10.
L'Abbe KA, Detsky AS, O'Rourke K. Meta-analysis in clinical research. Ann Intern Med.
1987;107(2):224-33.
11.
Silagy C, Ketteridge S. Physician advice for smoking cessation. In: Lancaster T, Silagy C, Fullerton
D, editors. Tobacco addiction module. The Cochrane Database of Systematic Reviews. N 4. (1 Septiembre
1997). Oxford: The Cochrane Collaboration. Disponible en Cochrane Library.; 1997.
12.
Porter AM, McCullough DM. Counselling against cigarette smoking. A controlled study from a
general practice. Practitioner. 1972;209(253):686-9.
13.
Russell MA, Wilson C, Taylor C, Baker CD. Effect of general practitioners' advice against smoking.
Br
Med
J.
1979;2(6184):231-5.
43
14.
Wilson D, Wood G, Johnston N, Sicurella J. Randomized clinical trial of supportive follow-up for
cigarette smokers in a family practice. Can Med Assoc J. 1982;126(2):127-9.
15.
Stewart PJ, Rosser WW. The impact of routine advice on smoking cessation from family physicians.
Can Med Assoc J. 1982;126(9):1051-4.
16.
Russell MA, Merriman R, Stapleton J, Taylor W. Effect of nicotine chewing gum as an adjunct to
general practitioner's advice against smoking. Br Med J (Clin Res Ed). 1983;287(6407):1782-5.
17.
Jamrozik K, Vessey M, Fowler G, Wald N, Parker G, Van Vunakis H. Controlled trial of three different
antismoking interventions in general practice. Br Med J (Clin Res Ed). 1984;288(6429):1499-503.
18.
McDowell I, Mothersill KJ, Rosser W, Hartman R. A randomized trial of three approaches to
smoking cessation. Can Fam Phys 1985;31:351-355.
19.
Page AR, Walters DJ, Schlegel RP, Best JA. Smoking cessation in family practice: the effects of
advice and nicotine chewing gum prescription. Addict Behav. 1986;11(4):443-6.
20.
Janz NK, Becker MH, Kirscht JP, Eraker SA, Billi JE, Woolliscroft JO. Evaluation of a minimalcontact smoking cessation intervention in an outpatient setting. Am J Public Health. 1987;77(7):805-9.
21.
Slama K, Redman S, Perkins J, Reid AL, Sanson-Fisher RW. The effectiveness of two smoking
cessation programmes for use in general practice: a randomised clinical trial. Bmj. 1990;300(6741):1707-9.
22.
Wetter DW, Remington PL, Pezzino G. The smoking continuum in Wisconsin, 1990. Wis Med J.
1992;91(4):183, 185-6.
23.
Demers RY, Neale AV, Adams R, Trembath C, Herman SC. The impact of physicians' brief smoking
cessation counseling: a MIRNET study. J Fam Pract. 1990;31(6):625-9.
24.
Wilson PA. Effectiveness of anti-smoking advice from doctors who smoke. J R Coll Gen Pract.
1989;39(326):388.
25.
Haug K, Fugelli P, Aaro LE, Foss OP. Is smoking intervention in general practice more successful
among pregnant than non-pregnant women? Fam Pract. 1994;11(2):111-6.
26.
Higashi A, Ozasa K, Watanabe Y, Hayashi K, Aoike A, Kawai K, et al. [Efficacy of smoking cessation
instruction for general smokers at an annual physical examination]. Nippon Koshu Eisei Zasshi.
1995;42(5):313-21.
27.
Slama K, Karsenty S, Hirsch A. Effectiveness of minimal intervention by general practitioners with
their smoking patients: a randomised controlled trial in France. Tobacco Control 1995;4:162-169.
28.
Begg CB, Mazumdar M. Operating characteristics of a rank correlation test for publication bias.
Biometrics. 1994;50(4):1088-101.
29.
Egger M, Davey Smith G, Schneider M, Minder C. Bias in meta-analysis detected by a simple,
graphical test. Bmj. 1997;315(7109):629-34.
30.
Brinton LA, Huggins GR, Lehman HF, Mallin K, Savitz DA, Trapido E, et al. Long-term use of oral
contraceptives and risk of invasive cervical cancer. Int J Cancer. 1986;38(3):339-44.
31.
Celentano DD, Klassen AC, Weisman CS, Rosenshein NB. The role of contraceptive use in cervical
cancer: the Maryland Cervical Cancer Case-Control Study. Am J Epidemiol. 1987;126(4):592-604.
32.
Ebeling K, Nischan P, Schindler C. Use of oral contraceptives and risk of invasive cervical cancer in
previously screened women. Int J Cancer. 1987;39(4):427-30.
33.
Invasive squamous-cell cervical carcinoma and combined oral contraceptives: results from a
multinational study. WHO Collaborative Study of Neoplasia and Steroid Contraceptives. Int J Cancer.
1993;55(2):228-36.
34.
Parazzini F, la Vecchia C, Negri E, Maggi R. Oral contraceptive use and invasive cervical cancer. Int
J Epidemiol. 1990;19(2):259-63.
35.
Beral V, Hannaford P, Kay C. Oral contraceptive use and malignancies of the genital tract. Results
from the Royal College of General Practitioners' Oral Contraception Study. Lancet. 1988;2(8624):1331-5.
36.
Brinton LA, Reeves WC, Brenes MM, Herrero R, de Britton RC, Gaitan E, et al. Oral contraceptive
use and risk of invasive cervical cancer. Int J Epidemiol. 1990;19(1):4-11.
37.
Kjaer SK, Engholm G, Dahl C, Bock JE, Lynge E, Jensen OM. Case-control study of risk factors for
cervical squamous-cell neoplasia in Denmark. III. Role of oral contraceptive use. Cancer Causes Control.
1993;4(6):513-9.
44
38.
Daling JR, Madeleine MM, McKnight B, Carter JJ, Wipf GC, Ashley R, et al. The relationship of
human papillomavirus-related cervical tumors to cigarette smoking, oral contraceptive use, and prior herpes
simplex
virus
type
2
infection.
Cancer
Epidemiol
Biomarkers
Prev.
1996;5(7):541-8.
39.
Eluf-Neto J, Booth M, Munoz N, Bosch FX, Meijer CJ, Walboomers JM. Human papillomavirus and
invasive cervical cancer in Brazil. Br J Cancer. 1994;69(1):114-9.
40.
Schiaffino A, Rodrguez M, Pasarn MI, Regidor E, Borrell C, Fernndez E. Odds ratio o razn de
proporciones?: Su utilizacin en estudios transversales. Gac Sanit. [online] [citado 2007-11-20]
2003;17(1):51.
41.
Flanders WD. A new variance estimator for the Mantel-Haenszel odds ratio. Biometrics 1985;41:637642.
42.
Robins J, Breslow N, Greenland S. Estimators of the Mantel-Haenszel variance consistent in both
sparse data and large-strata limiting models. Biometrics. 1986;42(2):311-23.
43.
Cohen J. Statistical power analysis for the behavioral sciences. 2 ed. Nueva York: Academic Press.;
1988.
44.
Glass GV. Primary, Secondary, and Meta-Analysis of Research. Educational Researcher
1976;5(10):3-8.
45.
Hedge LV. Distribution theory for Glass's estimator of effect size and related estimator. J Ed Stat
1981;6:107-128.
46.
Cohen J. Statistical power analysis for the behavioural sciences. Nueva York: Academic Press;
1969.
47.
Hedges LV, Gurevitch J, Curtis PS. The meta-analysis of response ratios in experimental ecology.
Ecology 1999;80:1150-1156.
48.
Normand SL. Meta-analysis: formulating, evaluating, combining, and reporting. Stat Med.
1999;18(3):321-59.
49.
Sokal RR, Rohlf FJ. Biometry. 3 ed. San Francisco: Freeman; 1995.
50.
Hedges LV, Olkin I. Statistical methods for meta-analysis. Nueva York: Academic Press; 1985.
51.
Greenland S. Quantitative methods in the review of epidemiologic literature. Epidemiologic Reviews
1987;9:1-30.
52.
Gurevitch J, Hedges LV. Statistical isues in ecological meta-analysis. Ecology 1999;80(1142-1149).
53.
Begg CB, Berlin JA. Publication bias: a problem in interpreting medical data. J Roy Stat Soc, Ser A
1988;151:419-463.
54.
Wang MC, Bushman BJ. Using the normal quantile plot to explore meta-analytic data sets.
Psychological Methods 1998;3:46-54.
55.
Begg CB. Publication bias. In: Cooper H, Hedge LV, editors. The Handbook of research synthesis.
Nueva York: Russell Sage Fundation; 1994. p. 399-409.
56.
Rosenthal R. The "file drawer problem" and tolerance for null results. Psychological Bulletin
1979;86:638-641.
57.
Rosenberg MS. The file-drawer problem revisited: a general weighted method for calculating fail-safe
numbers in meta-analysis. Evolution 2005;59(464-468).
58.
Macaskill P, Walter SD, Irwig L. A comparison of methods to detect publication bias in meta-analysis.
Stat Med. 2001;20(4):641-54.
45
5. Brockwell SE, Gordon IR. A comparison of statistical methods for meta-analysis. Stat Med 2001; 20: 82540.
6. Ceballos C., Crdoba E ,Valdizn JR, Garca Campayo J, Artal A, Giraldo P. Medicina nuclear basada en
la
evidencia:
20
aos
de
metaanlisis.
Alasbimn
Journal
2000;
2(7).
http://www.alasbimnjournal.cl/revistas/7/ceballostotal.html
7. Colditz GA, Burdick E, Mosteller F. Heterogeneity in meta-analysis of data from epidemiologic studies: a
comentary. Am J Epidemiol 1995; 142: 371-82.
8. Cook DJ, Mulrow CD, Haynes RB. Systematic reviews: synthesis of best evidence for clinical decisions.
Ann Intern Med 1997; 126: 376-80.
9. Delgado-Rodrguez M. Glossary on meta-analysis. J Epidemiol Commun Health 2001; 55: 534-6.
10. Egger M, Zellweger-Zhner, Schneider M, Junker C, Lengeler C, Antes G. Language bias in randomised
controlled trials published in English and German. Lancet 1997; 350: 326-9.
11. Escrig-Sos J, Molina Martnez J Interpretacin de los resultados de un ensayo clnico o metaanlisis en
angiologa y ciruga vascular: odds ratios, riesgo relativo, intervalos de confianza y credibilidad. Angiologa
2007; 59; 3-11.
12. Felson DT. Bias in meta-analytic research. J Clin Epidemiol 1992; 45: 885-92.
13. Fleiss JL. The statistical basis of meta-analysis. Stat Methods Med Res 1993; 2: 121-45.
14. Gibaldi M. Meta-analysis. A review of its place in therapeutic decision-making. Drugs 1993; 46: 805-18
15. Greenland S, Salvan A. Bias in the one-step method for pooling study results. Stat Med 1990; 9: 247-52.
16. Greenland S. Meta-analysis. En: Rothman KJ, Greenland S, eds.: Modern epidemiology, 2. ed. Boston:
Lippincott-Raven; 1998, 643-73.
17. Guallar E, Banegas JR, Martn-Moreno JM, del Ro A. Metaanlisis: su importancia en la toma de
decisiones clnicas en cardiologa. Rev Esp Cardiol 1994; 47: 509-17
18. Hardy RJ, Thompson SG. A likelihood approach to meta-analysis with random effects. Stat Med
1996;15:619-29
19. Katerndahl DA, Lawler W R. Variability in meta-analytic results concerning the value of cholesterol
reduction in coronary heart disease. A meta-analysis. Am J Epidemiol 1999; 149: 429-41.
20. Jenicek M. Mta-analyse in medecine. Qubec: Edisem 1987.
Jenicek M. Mta-analyse en mdecine. valuation et synthse de linformation clinique et pidmiologique.
St. Hyacinthe, y Paris: EDISEM y Maloine d., 1987.
21. Jenicek M. Meta-analysis in medicine: where we are and where we want to go. J Clin Epidemiol 1989;
42: 35-44.
22. Jni P, Witschi A, Bloch R, Egger M. The hazards of scoring the quality of clinical trials for meta-analysis.
JAMA 1999; 282: 1054-60.
23. Leandro G. Meta-analysis. Meta-analysis in medical research : the handbook for the understanding and
practice of meta-analysis. Malden, Mass: BMJ books: Blackwell, 2005.
24. Lau J, Schmid CH, Chalmers TC. Cumulative meta-analysis of clinical trials builds evidence for
exemplary medical care. J Clin Epidemiol 1995; 48: 45-57.
25. Marn-Martnez, F., Snchez-Meca, J., & Huedo-Medina, T. (2004). El coste de la dicotomizacin en
meta-anlisis [The cost of dichotomizing in meta-analysis]. Metodologa de las Ciencias del
Comportamiento, Volumen Especial, 367-375.
26. Molinero LM. Metaanlisis: claves para interpretar una herramienta de investigacin controvertida.
Hipertensin 2001; 18: 232-40.
27. Moher D, Cook DJ, Eastwood S, Olkin I, Rennie D, Stroup DF. Improving the quality of reports of metaanalysis of randomised controlled trials: the QUOROM statement. Lancet 1999; 354: 1896-900.
28. Prtega Daz S, Pita Fernndez S. Revisiones sistemticas y metaanlisis. Cad Aten Primaria 2005; 12:
109-12.
29. Petitti DB. Meta-analysis, decision analysis and cost-effectiveness analysis. Methods for quantitative
synthesis in medicine. New York: Oxford University Press, 1994.
30. Ruano-Ravina A, Figueiras A, Barros-Dios JM. El metaanlisis a debate. Med Clin (Barc) 2002; 119:
439.
31. Snchez-Meca J, Marin-Martnez F y Huedo-Medina T. Modelo de efectos fijos y modelo de efectos
aleatorios. En Matas JLR, Tobias A, Seoane T, eds.: Revisiones sistemticas en ciencias de la vida.
Toledo: FISCAN, 2006; 189-204
46
47