You are on page 1of 6

GUA ACADMICA

UNIVERSIDAD
NACIONAL
DECOLOMBIA
Revista de la Facultad de
Medicina 2001; 49 (3):175-180
Aspectos sobre diseo y tamao de muestra en estudios de pruebas
d st
13gn c as
Ricardo Snchez Pedraza, Profesor Asociado, Departamento de Psiquiatra y Centro de Epidemiologa Clnica. Iairo Echeverry Raad, Profesor
Asociado, Departamento de Pediatra y Centro de Epidemiologa Clnica, Facultad de Medicina, Universidad Nacional Direccin para
SUMMARY
This articledeals withgeneral and parti-
cular aspectsrelatedwiththemeaningand
development of diagnostictests. Its main
subject is about the elements neededfor
theappropriate samplesizeinthesekind
of studies.
En este artculo sepresentan algunas
consideraciones generales y particula-
res conrespecto al significado y desa-
rrollo de los estudios sobre pruebas
diagnsticas. El centro del mismo se
dedicaalaformulacin deloselemen-
tos necesarios quesubyacen al clculo
del tamao demuestraenestetipopar-
ticular dediseos.
INTRODUCCIN
En Medicina, una Prueba Diagnstica
(Px.Dx.) es cualquier dato que, perci-
bidoatravsdealgunodenuestros sen-
tidos, puedemodificar lasprobabilida-
des deundiagnstico. Dentro deestos
trminos unaPx.Dx. nosloesaquella
quepuede ser verificada enunlabora-
torio, saladerayos X, ounidad depa-
tologa, despus deun proceso tecno-
lgicocomplejo, sinotambin, mediante
lo observado, lo auscultado, lo palpa-
do, lopercutido ydems elementos del
ejercicio semiolgico cotidiano (1). En
este sentido, y como elementos para
efectuar unmismo diagnstico, sepue-
den tener al alcance, por un lado unas
pruebas sofisticadas, costosas e
invasivas, y por el otro, sencillas pre-
guntas, laobservacin o medicin del
tamao, color uolor deunindividuo o
deunaparte desuanatoma, laforma
de saludar, la descripcin de su com-
portamiento, etc.
En forma habitual las Px.Dx. se han
utilizadoenel intentode establecer con
exactitud y precisin la presencia de
alguna enfermedad o condicin; sin
embargo, tambinjuegan papel impor-
tanteenel establecimiento defactores
de riesgo, estado o evolucin clnica
de las enfermedades, respuesta a las
terapias eintervenciones, o en lapre-
diccin delos desenlaces intermedios
o finales (2,3).
Los datos obtenidos para establecer la
situacinpasadaoactual suelenllamar-
se pruebas diagnsticas y los que
proyectan sus resultados, con predic-
cin delo quepuede suceder secono-
cencomo pruebas pronsticas (4).
El diagnstico vaenunsentido(del cl-
nico hacia supaciente), y laenferme-
dad en otro (del paciente al mdico).
Dicho de otra manera, el diagnstico
esloqueunocreequeel pacientetiene
y laenfermedad esloquerealmente el
individuotiene. Undiagnsticoesapro-
piado si ambos sentidos coinciden (4).
Dado queesto esunasunto difcil, y a
lavez esencia del proceso diagnstico,
el establecimientodelapresenciadeuna
enfermedad serealizams entrminos
deprobabilidades desuocurrencia.
El proceso en el que se construye la
probabilidad de decirle a alguien que
estenfermo oquepadece algunacon-
dicin, medianteel acopionecesario de
Px.Dx. sedenomina proceso diagns-
tico (1). Diagnosticar significa clasifi-
car alos individuos en alguna condi-
cin (5), sea esta una taxonoma
nosolgica, unsndrome, unaenferme-
dad, el estado evolutivo, etc.
Cada Px.Dx, sinimportar sus caracte-
rsticas, mtodos utilizados, costos o
sitio en lahistoria natural delaenfer-
medad enlaqueseejecute, es suscep-
tible de ser medida en surendimiento
operativo (1).
Caractersticas operativas de las
pruebas diagnsticas
En el proceso demejoramiento conti-
nuo decalidad, latecnologa delasa-
lud est alacaza deelementos diag-
nsticos o pronsticos que cada da,
con mayor validez y precisin, y me-
nor costo y riesgo, sean ms costo-
175
SNCHEZ R, ECHEVERRY J .
efectivos en el establecimiento odeter-
minacin del estado de las cosas.
Esto se logra mediante el proceso de
validacin en el que un grupo de indivi-
duos se somete tanto a una prueba
diagnstica nueva como ante el estndar
dereferencia (patrn deoro o"Gold Stan-
dard"), que no es otra cosa que lamejor
prueba diagnstica disponible para esta-
blecer laverdadera condicin osituacin
de un paciente.
Fruto de este proceso de validacin se
establece para la prueba en cuestin un
conjunto deindicadores deexactitud que
han sido llamados Caractersticas
Operativas de las Pruebas Diagnsticas
(COPD).
Las COPD tradicionales sonlaSensibili-
dad (capacidad de laprueba en detectar
los enfermos), la Especificidad (capaci-
dad delaprueba dedetectar alos sanos),
el Valor Predictivo Positivo (A lapreva-
lencia del estudio, cul es laprobabilidad
de enfermedad si laprueba resultara po-
sitiva?), y el Valor Predictivo Negativo
(A la prevalencia del estudio, cul es la
probabilidad de estar sano si la prueba
resultara negativa?).
ltimamente sehan utilizado resmenes
delos anteriores indicadores (6,7), como
las razones de verosimilitud positivas,
del ingls positive likelihood ratios (+)
LR, las razones de verosimilitud negati-
vas, del ingls negative likelihood ratios
(-)LR, Y ms recientemente las razo-
nes de ventaja diagnstica, del ingls
Diagnostic Odds Ratio (DOR) (2). Es-
tos indicadores sehan convertido enme-
didas deresumen delasCOPD, consuma
utilidad en el establecimiento ms slido
y depurado de las caractersticas intrn-
secas deellas, enlas seleccin ms apro-
piada de un punto de corte en laprueba,
en la escogencia de la prueba ms ade-
cuada entre homlogas o en la determi-
nacin deprobabilidades pos-prueba (1).
El estudio de una prueba diagnstica
El diseo general de una prueba
176
diagnstica es el de un estudio transver-
sal comparativo (8). En general, para su
desarrollo se toma un grupo de indivi-
duos enfermos y otro de sanos (selec-
cionados enforma ideal, deun universo,
tras un proceso aleatorio), definidos en
tales condiciones a la luz de un mismo
estndar de referencia. A continuacin
unos y otros son sometidos, en forma
enmascarada eindependiente, alalectu-
radelaprueba bajo investigacin (9).
La calidad de un estudio de Px.Dx. se
relaciona con aspectos del diseo, con
los mtodos para reclutar lamuestra (en
laseleccin), conlaejecucin delasprue-
bas (en la medicin) y con lo completo
del reporte del estudio (10,11). Un as-
pecto trascendente, pero un tanto des-
cuidado anuestro juicio, como es el n-
mero mnimo necesario depacientes para
la obtencin de indicadores precisos,
ser discutido ms adelante.
De manera ms especfica, con respec-
to alamuestra depacientes (1,2,4,9,12),
esta debe ser seleccionada consecutiva o
aleatoriamente, reclutada como una
cohorte no clasificada segn su estado
de enfermedad, en escenarios en donde
laprueba bajo estudio pudiera ser reali-
zada en el futuro. El proceso de selec-
cin y referencia utilizado y las caracte-
rsticas demogrficas y clnicas de los
pacientes deben ser completamente des-
critas. Es ptimo incorporar en lamues-
tratodo el espectro deenfermedad: Si en
lamuestra slo seincluyen individuos se-
veramente enfermos y claramente sanos,
la prueba puede no detectar enfermos
cuando se aplica en poblaciones en las
cuales hay estadas menos severos de la
enfermedad. Esto cobra especial impor-
tancia cuando el resultado de la prueba
que seestudia secorrelaciona con lase-
veridad delaenfermedad; cuando el ren-
dimiento operativo de una prueba se
modifica en lamedida en que semodifi-
ca el espectro de enfermedad, esa prue-
barevela Sesgo de Espectro (l3).
En lo referente al diagnstico por el.Q=
trn de referencia (1,2,4,9,14), los m-
todos y las pruebas deben ser descritos
endetalle. El diagnstico delacondicin
debe ser el ms cercano alaverdad, y el
mismo estndar de referencia debe ha-
ber sido aplicado a todos los pacientes
por igual, desconociendo cualquier dato
adicional de ellos, incluso cmo resulta-
ron en laprueba bajo estudio. Es funda-
mental disponer deunpatrn deoro ade-
cuado: Para evaluar una nueva Px.Dx.
es necesario que en la muestra se inclu-
yan individuos en los que sehaya iden-
tificado con buen grado de certeza el
desenlace deinters. Si el patrn deoro
que me ha definido dicho desenlace es
imperfecto se corre el riesgo de califi-
car como falsos positivos aindividuos
no detectados por el patrn de oro o
como falsos negativos a los errnea-
mente detectados positivos por el pa-
trn de oro.
Eh relacin con la prueba bajo estudio
(1,2,4,9,14), su aplicacin debe ser
descrita con detalle. A los miembros
de la muestra se les deben efectuar las
evaluaciones de forma enmascarada, o
sea que el investigador que evala la
prueba debe desconocer el resultado del
patrn de oro y el que aplica el patrn
de oro debe ignorar el resultado de la
prueba que se estudia. Se deben haber
reportado todos los resultados incluso
aquellos con resultados indeterminados
o en "zona gris" y haberse realizado
antes de iniciar cualquier tratamiento.
Evidencia emprica reciente (16,17),
ha revelado que los sesgos ms impor-
tantes en los estudios de PxDx., radi-
can en el diseo y muy particularmen-
te en los siguientes, en su orden:
i. Reclutar por separado a "enfermos"
y a "sanos" (Sesgo de seleccin).
ii.Dada una informacin preliminar
arrojada por la prueba bajo estudio,
ejecutar diferentes patrones de refe-
rencia a enfermos y a sanos (Sesgo
de medicin en la verificacin).
iii.Determinar la prueba bajo estudio
siendo conocedor (no enmascarado)
de la real condicin de salud de los
individuos, o viceversa, establecer la
situacin real del individuo mediante
ASPECTOS SOBRE DISEO Y TAMAO DE MUES1RA
el estndar dereferencia conociendo
el resultado arrojado por la prueba
bajo estudio (Sesgo demedicin por
un diagnstico conocido).
Resultados de una prueba
diagnstica
Al culminar el proceso secontar con
cuatro posibles pares deresultados in-
herentes alas pruebas, dos aciertos y
dos errores: En los pares de aciertos,
lapruebaresultapositivayel individuo
se encuentra realmente enfermo (ver-
daderopositivo) olapruebaresultane-
gativayel individuo realmente essano
(verdadero negativo). En los errores,
lapruebaresultapositivayel individuo
seencuentra realmente "sano" o libre
delacondicin bajo estudio (falsopo-
sitivo) olapruebaresultanegativa yel
individuo realmente est enfermo (fal-
so negativo).
Lasobservaciones epidemiolgicas tie-
nen dos fuentes de error (18-20): El
error sistemtico yel aleatorio. El error
sistemtico es ladesviacin sistemti-
ca dela verdad y por ello es llamado
tambin sesgo (21). El sesgo suele
introducirse ya sea en la seleccin de
los individuos oenlos procesos y ele-
mentos para medicin de ellos, sean
estos losinstrumentos demedida olos
observadores. Exactitud, ausencia de
sesgo ovalidez, sonconceptos simila-
res, aunque no idnticos.
El error aleatorio es aquel que sepre-
sentadebido al azar y puedeproducir-
sepor efectos de lavariabilidad biol-
gicadel individuo, del observador yde
los instrumentos de medida (22).
Reproducibilidad, confiabilidad, con-
fianza, consistencia o precisin son
palabras que sugieren un escaso error
aleatorio.
La ausencia de sesgos no excluye los
errores aleatorios y viceversa. Por
ejemplo, si un bscula se encuentra
descalibrada conunexceso de200gra-
mos en cada medida, pero de manera
consistente en los mismos sujetos,
medidatras medida, losresultados ob-
tenidos muestran pocavariabilidad, di-
ramos que dicha bscula es inexacta
pero precisa. El instrumento est ses-
gado(descalibrado) peroconpocoerror
aleatorio (preciso). El inters
epidemiolgico es la obtencin de
indicadores de frecuencia o de efecto
que sean ante todo vlidos y precisos
(23).
Aunque suenereiterativo, si unestudio
tomaun gruposignificativoysuficiente
de individuos sanos y enfermos, con
unperfil similar al quepresenciaramos
enel ejercicioclnico, yatodosloscon-
fronta demanera enmascarada einde-
pendiente atravs tanto deunaprueba
bajo estudio como del estndar dere-
ferencia, diramos que eseestudio de
pruebas diagnsticas es vlido (o sea
que no secometieron errores sistem-
ticos o sesgos en el proceso de selec-
cin y medicin), y por lo tanto no se
desautorizan los resultados obtenidos
(22).
Pero loanterior noanulalaposibilidad
de que se hayan introducido errores
aleatorios enel estudio, y quepor esto
los resultados puedan haberse presen-
tado slopor efectodel azar. Esteefec-
to no permite tener la suficiente con-
fianza y precisin en los estimadores
del indicador operativo de la prueba
diagnstica en consideracin.
Noexistenpruebas perfectas; cadauna
posee un grado relativo de aciertos y
errores. Unapruebatil seraquellaen
la que la relacin entre los aciertos y
sus costos, supere el de los errores y
sus costos (6).
Teniendo como referente el diseo ge-
neral presentado previamente, sepue-
denplantear diferentes modalidades de
estudio deunaprueba diagnstica:
1. Setieneunpatrn deoro robusto y
se quieren conocer las caractersti-
cas operativas deunanuevaprueba,
contrastando sus resultados con ese
patrn de oro.
Rev Fac Med UN Col 2001 Vol.49 N3
ii. Se quieren comparar dos pruebas,
una de las cuales tiene caractersti-
cas operativas reconocidas.
iii,Se quieren comparar dos pruebas,
contrastando su exactitud.
iv.Se desea evaluar la concordancia
entre dos pruebas diagnsticas.
El tamao delamuestra (TM)
Unadelasmaneras dedisminuir lapo-
sibilidaddeerrores aleatorios enunes-
tudio, es calcular el nmero mnimo
necesario de observaciones o indivi-
duos para obtener unos resultados
precisos y consistentes.
Pararesumir, el calcular untamao de
muestra (TM) permite establecer de
manera precisa el verdadero estimador
del rendimiento operativo deunaprue-
badiagnstica odeladiferencia en el
funcionamiento dedospruebas, conun
nivel tolerabledeerror aleatorio. Llama
laatencinlaescasez deliteratura alre-
dedor deestetpico, as como lafalta
deunconsenso, evidente enlos mlti-
ples enfoques que seplantean en dife-
rentes artculos sobre evaluacin de
PX.Dx.
Teniendoencuentalosdiversosdiseosque
puedenplantearseparael estudiodeuna
Px.Dx,notienesentidoestablecerunnico
mtodoparael clculodel TM. Por esta
razn, antelapregunta: Qutamaode
muestranecesito?, larespuestaser: De-
pendeel diseoquetengael estudio.
Si setienen en cuenta las caractersti-
cas especficas del diseo del estudio,
considerando cmo seefecte el plan-
teamiento de hiptesis, se pueden te-
ner presentes las siguientes opciones:
l. Setieneunpatrn deoro robusto
y sequieren conocer las caracters-
ticas operativas deuna nueva prue-
ba, contrastando sus resultados con
esepatrn deoro: Teniendo encuen-
taquealgunos estudios dePX.Dx. con
estaestructurapueden semejar undise-
oenel cual seanalizaunaeventual aso-
ciacinentreunacondicin(enfermedad
o diagnstico) y un mtodo para
177
SNCHEZ R, ECHEVERRY J .
detectarla omedirla (prueba), unaaproxi-
macin muy general estima que un ta-
mao debe ser suficiente cuando quiera
que hay mnimo 10 individuos en cada
casilla marginal de latabla de 2x2
4
Es-
tos valores debern ser ajustados de
acuerdo con el nmero de individuos
con y sin la condicin que se busca
diagnosticar, aspecto que se mostrar
posteriormente.
2. Se quiere evaluar una hiptesis
sobre caractersticas de una nueva
prueba: En estos casos lo que sequie-
re evaluar es si las caractersticas de la
nueva prueba (sensibilidad, especifici-
dad o valores predictivos) difieren de
las de la prueba convencional. Esto se
ilustra con el siguiente ejemplo:
Existe una prueba de referencia "A" y
despus de varios estudios se sabe que
su sensibilidad es del 90%. Se desarro-
ll una nueva prueba "B" cuya sensibi-
lidad se quiere comparar con la de la
prueba dereferencia. se puede demos-
trar que es diferente la sensibilidad de
la nueva prueba?
De acuerdo con el procedimiento de
una prueba dehiptesis, el planteamien-
to sera el siguiente:
~: SensibilidaddeA =SensibilidaddeB
Ha:Sensibilidad deA toSensibilidaddeB
Dichas hiptesis estarn planteadas
en trminos de proporciones.
Si se considera que los pacientes o las
observaciones en las cuales se va a
aplicar la nueva prueba son muy simi-
lares a los utilizados en otros estudios
para evaluar la prueba de referencia,
puede no ser necesario volver aaplicar
esta ltima prueba. En tal caso se asu-
me que la sensibilidad de la prueba de
referencia "A", expresada como pro-
porcin, es conocida y que el objetivo
del estudio es estimar lasensibilidad de
lanueva prueba "B".
Para el clculo del tamao de lamues-
tra se utiliza la siguiente funcin que,
con un nivel de significacin a y un
poder de 1-B, permite comparar una
178
proporcin conocida 1t1 con una pro-
porcin 1t
2
que se va a estimar (24):
N={Z'al2" [1t(1-1t)] +Z.B" [1tP-1t
2
)]}2
02
En esta funcin 1t1es el valor conocido
delasensibilidad, especificidad ovalo-
res predictivos de la prueba patrn, 1t
2
es el valor que se espera tenga la prue-
baendichos parmetros, y s- 1t
2
-1ti"
En el ejemplo que seha mencionado, si
se anticipa que la nueva prueba puede
tener una sensibilidad del 95%, los va-
lores dentro de lafuncin para calcular
la muestra seran los siguientes:
1t1=0.9
1t
2
=0.95
8 =0.05
Los valores de Z l-u/2 y Z I-B son trmi-
nos constantes derivados de la distri-
bucin normal y se presentan en las
tablas 1y 2. El valor ex,tambin deno-
minado significacin oprobabilidad de
error tipo 1, corresponde ala probabi-
lidad que asignamos al error de recha-
zar lahiptesis nula cuando esta es cier-
ta. En investigacin clnica suele fijar-
seen el 5% (0.05), aunque, dependien-
do del caso, pueden asignarse valores
menos estrictos (10% 0.1) o ms es-
trictos (1% 0.01). El valor B corres-
ponde alaprobabilidad decometer error
tipo 2, es decir deno rechazar lahiptesis
nula cuando esta es falsa. Usualmente se
establece enun 10 20% (O.l 0.2).
Al reemplazar los valores correspon-
dientes en lafuncin seobtiene un TM
de 238 individuos, que es el nmero de
pacientes a los cuales hay que aplicar
la nueva prueba para encontrar una di-
ferencia significativa en los valores de
sensibilidad.
Tabla 1. Valores Zpara diferentes niveles de
alfa, pruebas a dos colas.
a a/2 l-a/2
Z l-al2
0.1 0.05 0.95 1.6449
()n~
OO?'i oQ7'i 1 Q;
0.025 0.0125 0.9875 2.2414
0.01 0.005 0.995 2.5758
Tabla 2. Valores Z para dos niveles de beta.
B 1-B
Z .S
0.2 0.8 0.84162
0.1 0.9 1.2816
Dado que en la prctica clnica los va-
lores predictivos dependen fuertemen-
tedelaprevalencia delacondicin que
lapruebamide, sedebehacer laestimacin
dedichosvalores conbaseenel teorema de
Bayes, delasiguientemanera (25):
Sensibilidad x Prevalencia
Vpp=- - - - - - - - - - - - - - - - - - - - - - - -
Sensibilidad x Prevalencia +(l-Sensibilidad) x (l-Prevalencia)
VPN =__ Es-,-p_ ec...: : .ifi_ lc_ id_ ad_ x _ : (_ l-_ P_ re_ v al _ _ en...: .c ia: _ ! _
Especificidad x(l-Prevalencia) +(1-Especificidad) xPrevalencia
El tamaodelamuestranecesarioseraquel
queresultemayor luego decalcularlo para
losescenarios desensibilidad, especificidad
o valores predictivos, o aquel dependiente
delacaracterstica queresulte ms impor-
tanteparalaprueba queseestevaluando,
por ejemplo lasensibilidad si setratadeuna
pruebadetamizaje.
3. S e desea evaluar una hiptesis sobre
diferencia de proporciones: En estecaso
se aplican simultneamente dos pruebas
diagnsticas a los mismos individuos. Se
quiereevaluar lahiptesis nuladenodife-
renciaenlasexactitudes quearrojalaprue-
bay el estndar dereferencia. Hay quete-
ner encuentaqueental situacin losdatos
no sonindependientes, razn por lacual el
clculo del tamao de lamuestra sobre la
premisa de diferencia de proporciones en
muestras independientes resulta errneo.
Cuando seplantean hiptesis sobre dife-
rencia de proporciones en pruebas
diagnsticas que seaplican en un mismo
individuo, seutilizalaexactitud delaprue-
ba. Recordemos que la ex actitud es el
total de verdaderos positivos y verdade-
ros negativos que arroja laprueba, y que
puede expresarse como una proporcin.
En tal caso las hiptesis seplantean dela
siguiente manera:
Ho: Exactitud de A =Exactitud deB
H,,: Exactitud deA -: f : . Exactitud deB
ASPECTOS SOBRE DISEO Y TAMAO DE MUESTRA
Plantear las hiptesis de esta manera
supone que sedispone de un patrn de
oro demuy buena calidad, contra el cual
seestn contrastando las dos pruebas.
La tabla 2x2 correspondiente podra
tener esta estructura:
Resultados exactos*
Si No
Prueba A
Prueba B
*Resultados exactos: Corresponden ala
suma de verdaderos positivos y negati-
vos. En cada celda delacolumna corres-
pondiente a"Si", seincluye el nmero de
casos verdaderos positivos y verdade-
rosnegativosparacadaunadelaspruebas.
Teniendo en cuenta la situacin de no
independencia, la anterior tabla 2x2
puede construirse de tal modo que las
unidades quequeden encada celda sean
los pares de observaciones efectuados
sobre un mismo individuo. El diseo
delatabla es ahora el siguiente:
Prueba A
Resultados exactos
Si No Total
v
Si r s r+s
:o.g
'"
ro .c:! o
..0-
-g No
<l) ::1
2 :c
>(
o...~
<l)
t u t-i-u
Total r+t s+u N pares
Esta tabla tiene la estructura utilizada
en laprueba deMcNemar (26). En este
tipo de estadstico se trabaja con los
denominados pares discordantes, que
son los correspondientes alas celdas s
y t, ya que los pares concordantes (cel-
das r y u) no dan informacin sobre
las diferencias que se estn evaluando
(27). La proporcin de discordantes
(1tDiscordantes) puede calcularse as:
Rev Fac Med UN Col 2001 Vo1.49 N"3
(s+t)
1tDiscordante = N pares
El cociente'J I dicequtantomayor esladiscordanciadelapruebaB enrelacinconla
discordanciadelapruebaA. Enlatabladeparesequivaleadividir sentret:
'J I =s/t
Paracalcular el tamao delamuestraesnecesario anticipar laproporcin dediscordancia
entrelasdospruebas y el cociente'J I. Lafuncinqueseaplicaeslasiguiente:
N={Z OI2(\jI+1)+Z_B--J [ (\ j I+ 1)2-(\jI-l )ZreDiSCOrdanCiaW
('J I -1Y re
2
Discordancia
Si sequierencomparar dospruebasconunaprobabilidaddediscordanciade0.15, teniendo
una discordancia tres veces mayor en una prueba que en otra, setienen los siguientes
valoresparareemplazar enlafuncin:
reDiscordancia =0.15
' J I= 3
Z l-an =1.96
Z lB =0.841
Conlosanterioresvaloresserequiereunamuestrade207individuosaloscualesaplicarlas
dos pruebas.
4 Se quiere evaluar una hiptesis de concordancia: En tal caso seasume que hay N
sujetosevaluadospor dospruebas diferentes. As, laprobabilidadestimadadedesacuerdo
entrelasdos pruebas es:
1ttne: d+N
Donde des el nmero dedesacuerdos entrelasdos pruebas. Como puedeverse, aqu se
aplicaun criterio similar al del caso en el que seplantea laevaluacin dediferencia de
proporciones.
ParaunaamplituddeterminadaW 1tdeunintervalodeconfianzaal100(1a)%, el tamaode
lamuestraser:
N=41t Dis (1- 1tDis) Z21-a/2
W Z1t
Cuntos enfermos y cuntos sanos?
Para definir el nmero depacientes en lamuestra con y sinlacondicin que seest
midiendo, el criterioesincluir unnmero similar depacientes dentro decadauno delos
posiblesespectrosdelaenfermedad, estoes, intentarenloposiblereproducir laprevalencia
otodoel espectrodelaenfermedad, similar al queseverifIcaraenlaprcticaclnica. Por
ejemplo, si laenfermedad tienetres niveles de severidad (leve, moderado y grave), y el
tamao calculado demuestra son400 pacientes, sedeberan incluir 100pacientes sinla
enfermedad, 100leves, 100moderados y 100severos.
Otrocriterio, fundamental cuando seevalan caractersticasoperativas, esquelapropor-
cindeenfermos y sanos enmuestrareflejelaprevalencia delacondicin quesebusca
diagnosticar, enlapoblacinenlacual seaplicarlaprueba. Engeneral, esrecomendable
incluir ms individuos enfermos que sanos, aunque se estn creando artifIcialmente
prevalencias superiores al 50%, ya que de esta manera setendra ms oportunidad de
incluirpacientesconespectrosdeenfermedaddesconocidos oposiblementenodetectables.
179
sNCHEZ R, ECHEVERRY J .
1. Echeverry J , Ardila E. Pruebas
diagnsticas y proceso diagnstico. En:
Ardila E, Snchez R, Echeverry J . Estra-
tegias de Investigacin en Medicina Cl-
nica. Bogot: Editorial Manual Moderno:
2001.
2. Deeks JJ. Systematic reviews on
evaluations of diagnostic and screening
test. BMJ 2001;323: 157-162.
3. Ruiz A, Ruiz J G. Fundamentos de In-
vestigacin Clnica. Exmenes diagnsti-
cos: Aproximacin asu uso racional. Pe-
diatra 1993;28(2):111-119.
4. Kramer HC. Medical Test: Objective and
Quantitative Guidelnes. SAGE
Publications, Inc. Newburry Park, Cal,
USA. 1992. Chapter: 14.
5. De Almeida N. Epidemiologa sin N-
meros: Una introduccin crtica alacien-
cia epidemiolgica. Serie Paltex N.28.
OMS-OMS. 1992.
6. Suchman AL, Dolan J G. Odds and
Likelihood Ratio. In: Griner, Panzer RJ ,
Greenland P, eds. Clinical diagnosis and
the laboratory. Logical strategies for
cornmon medical problems. Chicago: Year
Book Medical Publisher., 1986:36-43.
7. Zweig MH, Campbell G. Receiver -
Operating Characteristic Curve (ROC)
Plots: A fundamental Evaluation Tool in
Clnical Medicine. Clin Chem
1993;39(4):561-77.
8. Lpez F. Interpretacin de Pruebas
Diagnsticas. En: Lpez F. Manual de
Medicina Basada en la Evidencia. Edito-
rial Manual Moderno &J GH Editores,
2000.
9. Dawson-Sanders B, Trapp RG. Proce-
dimientos para valorar diagnsticos. En:
Dawson-Sanders B, Trapp RG.
Bioestadstica Mdica. Manual Moder-
no, Mxico 1990:265 -82.
10. Cochrane Methods Group on Systematic
REFERENCIAS BIBLIOGRFICAS
Review of Screening andDiagnostic Test.
Recommended methods [update 6 jun
1986]. www.cochrane.org/cochrane/
sadtdoc l.htm
11. Reid MC, Lachs MS, Feinstein AR. Use
of methodological standards indiagnostic
test research. Getting better but still no
good. J AMA 1995;274:645 - 651.
12. Knapp RG, Miller mMC. Clnical
Epidemiology and Biostatistics.
Baltimore:W illiams &W ilkins: 1992. p
42-43.
13. Lachs MS, Nachamkin 1, Edelstein PH,
et al. Spectrum Bias in the Evaluation of
a Diagnostic Tests: Lessons from the
rapid Dipstick Test for Urinary Tract
infection. Ann Int Med 1992;117:135 -
140.
14. Knapp RG, Miller MC. Describing the
Performance of a Diagnostic Test In:.
Knapp RG, Miller MC. Clinical
epidemiology and biostatistics. Malvern
(Pennsylvania): Harwal Publishing
Company, Baltimore,W illiams &W ilkins:
1992: 31-51.
15.Bates AS, Margolis PA, Evans A.
Verification bias in paediatric studies
evaluating diagnostic tests J Pediatr
1993;122: 585 -90.
16. Lijmer J G, Mol BW , Heisterkamp S,
Bonsel GJ , Prins MH, Van der
Maeulen J HP et al. Empirical evidence
of design-related bias in studies of
diagnostic test. J AMA 1999;282:1061-
66.
17. Begg CB. Biases in the assessment of
the diagnostic tests. Stat in Med
1987;6:411 -23.
18. Knapp RG, Miller MC. Describing the
Performance of a Diagnostic Test In:.
Knapp RG, Miller MC. Clinical
epidemiology and biostatistics. Malvern
(Pennsylvania): Harwal Publishing
Company, 1992: 31-51.
19. Sox HC, Blatt MA, Higgins MC,
Marton KI. Probability: Quantifying
Uncertainty. In: Sox HC, Blatt MA,
Higgins MC, Marton KI. Medical
Decision Making. Boston: Butterworth
Publishers, 1988: 103 -46.
20. Riegelman RK. Hirscb RP. Cmo estu-
diar un estudio y probar una prueba: lec-
tura crtica de la literatura biomdica. 2
a
.
Ed. W ashington, DC. : OPS, 1992. Publi-
cacin cientfica: 531.
21. Ransohoff DF, Feistein AR. Problems
of spectrum and bias in evaluating the
efficacy of diagnostic test. N Eng J
MedI978;299:926 -30.
22. Rothman KJ , Greenland S. Precision
and validity in aEpidemiologic Studies.
In: Rothman KJ , Greenland S. Modern
Epidemiology. Second Edition.
Lippincott Raven publishers,
Philadelphia, 1998: 115- 134.
23. Rotmnan KJ , Greenland S. Precision
and validity inEpidemiologic Studies. In:
Modern Epidemiology Rotmnan KJ ,
Greenland S. 2
a
Edition. Lippincott-Raven
publishers. Philadelphia. 1998:115-34.
24. Machin D, Campbell M, Fayers P,
Pinol A. Sample size tables for clinical
studies, 2nd ed.Oxford: Blackwell
Science: 1997. p. 21.
25. Tobias A. Summary statistics report for
diagnostic tests. Stata Technical Bulletin
2000;56: 16-18.
26. Norman GR, Streiner DL.
Bioestadstica. Madrid: Mosby/Doyma
Libros: 1996. pp. 155.
27. Rosner B. Fundamentals of Biostatistics.
4th ed. Belmont: Duxbury Press: 1995. pp.
378-379.
28. Machn D, Campbell M, Fayers P, Pinol A.
Sample size tables for clinical studies, 2nd
ed.Oxford: Blackwell Science: 1997.p.71.
Correspondencia: Ricardo Snchez Pedraza (risanche@bacata.usc.unal.edu.co), Iairo Echeverry Raad
Uechever@bacata.usa.unal.edu.co); Centro de Epidemiologa Clnica, Instituto Materno Infantil
180

You might also like