You are on page 1of 10

ESTADISTICA PARA LOS CLNICOS. III.

PRUEBAS ESTADSTICAS PARA EL CONTRASTE DE HIPTESIS(


1
,
2
)..
Introducc!n
A la hora de contrastar nuestra hiptesis nula de partida, varios factores van a
determinar la prueba estadstica que utilizaremos y se refieren al nmero, tipo y
distribucin de las variables y a la forma en que se eligi a los sujetos del estudio.
Cuando trabajamos con una sola variable, sta podr! ser cualitativa o
cuantitativa, por ejemplo, tal y como indicamos en los nmeros anteriores, la
prevalencia de demencia o la cifra media de tensin arterial "#A$ de nuestra
muestra, respectivamente. %i slo tenemos un" #u$%tr" d$ %u&$to%, nuestro
inters ser! saber si dicha muestra difiere en los valores de la variable de los de una
poblacin u otra muestra de referencia. &o obstante, es m!s habitual que
dispongamos de do% #u$%tr"% o 'ru(o% d$ %u&$to%, por ejemplo, hombres y
mujeres, sanos y enfermos, pacientes con la enfermedad A y pacientes con la
enfermedad ', etc. (n este caso queremos saber tambin si e)isten diferencias
entre los dos grupos con respecto a alguna de las variables que hemos estudiado,
tal como la media de #A o la frecuencia de diabetes. Aunque el planteamiento
estadstico en este caso es el de si dos muestras pertenecen a la misma poblacin
de referencia "por ejemplo, los hombres y las mujeres pertenecen a la misma
poblacin con respecto a las cifras de #A$, los clnicos entendemos mejor el
razonamiento anterior* si e)isten diferencias en la media de #A entre los hombre y
las mujeres. +e manera similar podemos comparar los valores de la variable de
inters para el caso de que se trate de #)% d$ do% #u$%tr"%.
Pru$*"% P"r"#+trc"% , Pru$*"% no P"r"#+trc"%
,a distribucin de la variable que nos interesa comparar tambin es
importante a la hora de establecer la prueba estadstica que nos permita evaluar la
hiptesis nula de igualdad, de forma que si la distribucin es normal y cumple
algunas otras condiciones, utilizaremos los denominados t$%t ("r"#+trco% y si no
cumple dichos criterios tenemos la opcin de usar los llamados t$%t no
("r"#+trco% o de distribucin libre, que se basan en los rangos de distribucin de
'ases de la estadstica
la variable. ,as pruebas no paramtricas son menos potentes, es decir, son m!s
e)igentes al rechazar la hiptesis nula de igualdad y por tanto tienen menos
posibilidades de acertar cuando no la rechazan "mas posibilidades de cometer un
error tipo beta$. -or otro lado, la potencia de un test estadstico aumenta cuando lo
hace el tama.o de la muestra/ de esta forma, para conseguir la misma potencia con
una prueba no paramtrica, necesitaremos aumentar el tama.o de la muestra en
una cantidad determinada. As, la potencia de una prueba no paramtrica suele
calcularse en referencia a su homloga paramtrica. -or ejemplo, la 0 de 1ann2
3hitney tiene una potencia relativa del 456 con respecto a la prueba paramtrica t
de %tudent "significa que con una muestra de 788 sujetos, se consigue la misma
potencia con la 0 de 1ann23hitney que con 45 sujetos para la t de %tudent$.
-u$%tr"% "("r$"d"% o d$($nd$nt$%
%i los sujetos de las muestras han sido elegidos de forma que se parecen en
bastantes de sus caractersticas "el prototipo seran los gemelos, pero tambien pueden
ser compa.eros de habitacin en un colegio, etc$ o se trata de los mismos indivduos
evaluados en dos momentos diferentes del tiempo, se habla de #u$%tr"% "("r$"d"%.
(n este caso se utilizan pruebas estadsticas especiales para muestras apareadas. ,o
que sucede es que, a la hora de valorar las diferencias que se presentan entre dos
muestras, el investigador debe de ser muy prudente y, en consecuencia, e)igente,
cuando considera la importancia del error aleatorio, por si se diera el caso de que los
sujetos de ambas muestras fueran muy diferentes con respecto a otras muchas
variables presuntamente confundentes "error sistem!tico$. -ara el caso de muestras
apareadas, es decir aquellas que suponemos muy parecidas con respecto a las
referidas variables confundentes "se debe pensar que un sujeto al que se le hacen dos
valoraciones, antes2despus, de una intervencin did!ctica, sobre sus conocimientos
respecto a una materia, no ha podido cambiar demasiado con respecto a su
coeficiente intelectual, estado de !nimo, nivel de alerta, etc., y no digamos sus
caractersticas demogr!ficas, como edad, se)o, nivel cultural, etc.$, esta situacin no
se presenta y el investigador puede ser menos estricto al considerar la importancia del
error aleatorio.
2
'ases de la estadstica
."r"*/$ d$($nd$nt$ , ."r"*/$ Ind$($nd$nt$
(l esquema que se sigue en la situacin en que comparamos dos o m!s
muestras o grupos es que la variable de clasificacin de los sujetos en cada una de las
muestras se denomina 0"r"*/$ nd$($nd$nt$ o (r$dctor", de forma que es la
pertenencia a uno de dichos grupos lo que biolgica o clnicamente determina los
valores que toma la variable que estamos analizando, a la que denominamos 0"r"*/$
d$($nd$nt$ o r$%u/t"do. -or ejemplo, en un estudio de seguimiento de una cohorte
de de sujetos atendidos en el %ervicio de &eurologa de un 9ospital, el hecho de
padecer +iabetes 1ellitus puede conllevar una mayor incidencia de ictus trombtico o
el hecho de ser hipertenso significar mayor incidencia de demencia. (n estos
ejemplos, la +iabetes 1ellitus o la 9#A "variables categricas dicotmicas* los sujetos
son o no diabticos, son o no hipertensos$ actan como variables independientes o
predictoras, responsables de la frecuencia de ictus trombtico o demencia,
respectivamente. (stas ltimas, siendo tambin variables dicotmicas, resultan ser las
variables dependientes o resultado del efecto de las anteriores.
Pru$*"% d$ do% co/"% , (ru$*"% d$ un" co/"
3
'ases de la estadstica
(n las pruebas de hiptesis se puede partir de la idea de que uno de
los grupos de estudio va a tomar valores mayores o menores de la
variable resultado que el otro grupo. -or ejemplo, los pacientes
hipertensos tendran mayor frecuencia de demencia que los pacientes
normotensos. (n este caso utilizaramos (ru$*"% d$ 1(!t$%% d$
un" co/". (sta no es una actitud prudente en investigacin y es m!s
razonable plantear lo que se denominan (ru$*"% d$ do% co/"%, es
decir, considerar la hiptesis :a priori; de que la hipertensin puede
conllevar tanto una mayor frecuencia como una menor frecuencia de
demencia cuando comparamos con la situacin que se presentara en
los pacientes normotensos. ,a consecuencia ser! que las diferencias
en la frecuencia de demencia entre los grupos deber!n ser mayores
para que podamos atrevernos a rechazar la hi ptesis nula de
igualdad, es decir, el valor del estadstico terico es mayor para el
mismo riesgo alfa "no obstante, debemos recordar siempre que esto
conlleva mayor posibilidad de cometer un error de tipo beta$.
,os test estadsticos de an!llisis univariante mas importantes se detallan en
la tabla <. ,os paquetes estadsticos disponibles en la actualidad permiten aplicar las
diferentes pruebas sin mayor dificultad para el investigador. &o obstante, debe
recordarse que estos paquetes no piensan por nosotros y suelen dar resultados que
debemos interpretar con cautela y siempre con un adecuado sentido clnico.
T"*/" I. T(o d$ t$%t $%t"d2%tco ("r" 1"c$r n3$r$nc"% (co#("r"con$% $ntr$ #u$%tr"%).
DISTRIBUCION .ARIABLE
INDEPENDIENTE
(PREDICTORA)
.ARIABLE
DEPENDIENTE
(RESULTADO)
RELACIN ENTRE
LAS -UESTRAS
PRUEBA ESTADSTICA
Nor#"/
"-aramtricos$
0na sola muestra
"se compara con
valor terico$
+icotmica
-olicotmica
Cuantitativa
Categrica
Cuantitativa
Categrica
Cuantitativa

&o relacionadas
=elacionadas
&o relacionadas
=elacionadas
&o relacionadas
&o relacionadas
=elacionadas
t2student para una muestra
&o e)iste "usar Chi2cuadrado de
-earson$
&o e)iste "usar no paramtricos$
t2student muestras independientes
t2student muestras relacionadas
&o e)iste "usar Chi2cuadrado de
-earson$
A&>?A de una va
A&>?A de medidas repetidas
4
'ases de la estadstica
No nor#"/
"&o paramtricos$
0na sola muestra
"se compara con
valor terico$
+icotmica
-olicotmica
Categrica
Cuantitativa
Categrica
Cuantitativa
=elacionadas
&o relacionadas
=elacionadas
&o relacionadas
&o relacionadas
=elacionadas
&o relacionadas
'inomial
Chi2cuadrado de -earson
Chi2cuadrado de 1antel29aenzsel
-rueba de @olmogoroA2%mirnov
-rueba de las =achas
#est e)acto de 1c&emar
-rueba de los %ignos
Chi2cuadrado de -earson
#est e)acto de Bisher
#est de 3ilco)on
-rueba de los signos
1ann23hitney
1ediana
C @olmogorov2%mirnov
=achas de 3ald23olfoAitz
?alores e)tremos de 1oses
-rueba D de Cochran
-rueba de Briedman
3 de @endall "concordancia$
-rueba de @rusEal23allis
1ediana @ variables
A&>?A de dos vas por rangos
CO.ARIACION "medidas de dos variables en los mismos sujetos o unidades de an!lisis del estudio$
-aramtrico Cuantitativa Cuantitativa Correlacin de -earson
&o paramtrico Cuantitativa Cuantitativa Correlacin de %pearman
CO-PARACIN DE DATOS CUANTITATI.OS ENTRE DOS O -AS 4RUPOS
Como se puede ver en la tabla <, la prueba estadstica que se utiliza para
contrastar la hiptesis nula de igualdad de medias para una muestra o entre dos
muestras o grupos es la t d$ Stud$nt. -ara la aplicacin de la t de %tudent se requiere
que la distribucin de la variable cuantitativa sea normal en ambos grupos de
comparacin. ()iste la posibilidad de que las varianzas de ambos grupos sea iguales
o desiguales o que las muestras sean apareadas o no apareadas.
Cuando no se cumplen los criterios de normalidad, se utilizan test no
paramtricos, tal como la prueba de -"nn561tn$,, para el caso de muestras
independientes y la prueba de 6/co7on para muestras apareadas, entre otras.
Cuando hacemos comparaciones de datos cuantitativos entre m!s de dos
grupos se utiliza el denominado An)/%% d$ /" ."r"n8" "A&>?A$. A&>?A evala la
posible igualdad de medias de una variable cuantitativa entre varias muestras sin
aumentar la tasa de error tipo < "resuelve el problema de las mltiples comparaciones$.
(l funcionamiento de A&>?A se basa en la descomposicin de la variabilidad total de
una variable en sus diferentes partes, la debida a las diferencias entre los grupos
"efectos principales$ y la debida a las diferencias entre los indivduos de cada grupo
5
'ases de la estadstica
"residuales$. ,os estudios e)perimentales, aquellos en los que los sujetos son
asignados aleatoriamente a un grupo de tratamiento, son los que utilizan con m!s
frecuencia A&>?A. (ste dise.o est! muy ligado al mtodo e)perimental y es la base
del an!lisis multivariante. (s posible analizar la informacin sobre medidas repetidas
en los mismos sujetos con A&>?A.
Cuando no se cumplen las condiciones necesarias para aplicar A&>?A, la
alternativa no paramtrica que se utiliza de manera m!s habitual es la prueba de
9ru%:"/56"//% para muestra independientes y la prueba de ;r$d#"n para muestras
apareadas, entre otras.
CO-PARACIN ENTRE DOS 4RUPOS DE DATOS CUALITATI.OS
%i deseamos comparar la frecuencia de presentacin de una variable
categrica, ya sea dicotmica o policotmica, en dos o m!s grupos, es decir, en el
caso en que la variable de comparacin sea una variable cualitativa, los datos se
resumen o agrupan en las denominadas t"*/"% cru8"d"% o t"*/"% d$ contn'$nc".
(n la situacin m!s sencilla, cuando comparamos la frecuencia de presentacin de
una variable dicotmica "padecer o no padecer demencia$ en dos grupos, por ejemplo,
hipertensos y normotensos, la informacin se distribuye en una tabla que tiene cuatro
celdas, en cada una de las cuales se disponen los sujetos que reunen o no reunen las
condiciones de ambas variables. ,a prueba estadstica que se utiliza para contrastar la
hiptesis nula de independencia de ambas variables es la prueba c15cu"dr"do d$
P$"r%on u otras similares. Cuando los sujetos est!n apareados por otras variables
presuntamente confundentes, se suele utilizar la prueba e)acta de -cN$#"r. ,a
prueba de chi2cuadrado se basa en que las diferencias e)istentes entre lo observado
en nuestra muestra y lo que sera de esperar bajo la hiptesis nula de independencia
de ambas variables "en nuestro ejemplo, la frecuencia de demencia no cambiara por
el hecho de ser o no hipertenso$ sean o no suficientemente grandes como para
rechazar la hiptesis de independencia de ambas variables.
E.ALUACIN DE LAS RELACIONES ENTRE DOS .ARIABLES CUANTITATI.AS
EN UN 4RUPO DE SU<ETOS= CORRELACIN > RE4RESIN.
6
'ases de la estadstica
(n otras ocasiones se trata de establecer si e)iste relacin entre los valores de
dos variables cuantitativas en un grupo de sujetos. -or ejemplo, la edad de una
muestra de pacientes y las cifras de su tensin arterial. %i la relacin entre ambas
variables conlleva que una de ellas es la responsable de los valores que toma la otra,
hablamos de r$'r$%!n. %i ambas variables estan relacionadas pero no podemos
establecer cual es la responsable, hablamos de corr$/"c!n. (l hecho de establecer la
relacin entre dos variables contnuas puede tener uno de tres objetivos* evaluar el
grado de asociacin entre ambas variables "mediante el coeficiente de correlacin de
-earson o el de %pearman para el caso de que no se cumplan las condiciones de
distribucin normal$, predecir el valor de una variable conociendo el valor de la otra
"mediante los coeficientes de regresin$ y, por ltimo, se puede intentar establecer el
'r"do d$ "cu$rdo entre los valores de dos variables cuantitativas, por ejemplo
cuando se lleva a cabo la misma determinacin de un par!metro analtico sanguneo
con dos mtodos diferentes con el objetivo de sustituir uno m!s costoso por otro m!s
sencillo o barato. ()isten mtodos para establecer la asociacin entre variables
categricas que derivan de las anteriormente referidas tablas de contingencia, tal
como el coeficiente Eappa.
AN?LISIS SI-ULT?NEO DE DI;ERENTES .ARIABLES PREDICTORAS=
AN?LISIS -ULTI.ARIANTE.
=esultados clnicos como los que acabamos de referir, ictus o demencia,
normalmente no son debidos a una sla causa. (s decir, en biologa y en la clnica
habitual estamos acostumbrados a ver que diferentes factores causales actan
juntos para producir una consecuencia. Brente al denominado "n)/%% un0"r"nt$
"o bivariante, dado que en realidad se analizan dos variables, la variable predictora y
la variable resultado$, el "n)/%% #u/t0"r"nt$ permite establecer la
responsabilidad que tienen diferentes variables predictoras en el resultado clnico
que nos interesa, ajustando o controlando por la influencia de cada una de ellas.
Como idea m!s general, el concepto de #od$/8"c!n $%t"d2%tc" es el de
un modelo matem!tico que relaciona dos o m!s variables y permite hacer una
descripcin apro)imada de los datos observados. ,os denominados #od$/o%
/n$"/$% son modelos estadsticos aditivos en los que la variable resultado puede
7
'ases de la estadstica
ser e)plicada matem!ticamente "el establecimiento de la causalidad va m!s all! del
simple planteamiento estadstico$ por diferentes variables predictoras, cada una de
las cuales aportar! cierta cantidad de :e)plicacin; a la variable resultado. ,o que
sucede es que aunque una variable resultado pueda presentar una asociacin
estadsticamente significativa con una o varias variables predictoras, la cantidad que
estas variables e)plican de la variable resultado puede ser relativamente modesta.
(sto nos ayuda a comprender el conocido hecho de que la e)istencia de una
asociacin estadstica entre dos o m!s variables no significa que una de ellas quede
e)plicada en su totalidad por la otra u otras variables, en la medida en que gran
parte de la variabilidad de la primera podra justificarse por muchos otros factores
cuyo conocimiento puede no estar a nuestro alcance.
(l planteamiento que debe hacerse en una investigacin clnica y en buena
lgica tambin cuando leemos una artculo que nos la presente, es relacionar un
efecto o resultado "la que hemos denominado variable dependiente o resultado$ con
una intervencin o factor de e)posicin responsable "la que hemos denominado
variable independiente o predictora$. -ero en las dem!s circunstancias, es decir, en
todas las dem!s caractersticas, ambos grupos, el que recibe la intervencin o est!
e)puesto y el que no la recibe o no est! libre de la e)posicin, deben ser iguales. -or
ejemplo, si llevamos a cabo un estudio sobre tratamiento hipotensor para prevenir el
desarrollo de demencia y los sujetos tratados son m!s jvenes o las mujeres est!n
m!s representadas, la menor tasa de dficit cognitivo puede estar en relacin con los
factores referidos m!s que con el efecto del tratamiento. -or ello, la edad y gnero de
ambos grupos, tratados y no tratados, debe ser similar para evitar el efecto
confundente de ambos factores. (n los ensayos clnicos controlados, la primera tabla
que se presenta en los resultados suele mostrar las caractersticas de ambos grupos
de intervencin, el tratado y el no tratado, al inicio del estudio, aclarando que no
e)isten diferencias importantes entre ellos con respecto a los referidos factores
presuntamente confundentes.
-ara enfrentar el problema de las diferencias que puedan presentarse entre los
grupos que se trata de comparar en un estudio se pueden adoptar dos estrategias. -or
una parte, en el dise.o del estudio, se puede %$r r$%trct0o en los criterios de
inclusin de los sujetos "seleccionar slo aquellos con lmites estrictos de edad o
8
'ases de la estadstica
comorbilidades$ o se puede proceder a "("r$"r a los sujetos por las referidas
caractersticas. -or otra parte, en el an!lisis de los resultados podemos :$%tr"t3c"r;
segn variables confundentes "por ejemplo analizar de forma separada el grupo de
jvenes y el de personas mayores$ o podemos utilizar alguna de las tcnicas de
"n)/%% #u/t0"r"nt$% disponibles. ,as tcnicas multivariantes m!s utilizadas
actualmente en la investigacin clnica son las de regresin "lineal, logstica y riesgo
proporcional de Co)$ "(rror* =eference source not found,(rror* =eference source not
found,
F
,
G
,
5
$, cuya pormenorizacin ser! motivo de otro artculo de esta serie.
BIBLIO4RA;A
BIBLIO4RA;A
9
7 .2 Altman +H. -ractical %tatistics for 1edical =esearch. ,ondon*Chapman and 9all, 7447.
I .2 Armitage -, 'erry H. %tatistical 1ethods in 1edical =esearch. F
rd
ed. >)ford*'lacEAell
%cientific -ublications, 744G.
F .2 Carrasco JC, 9ern!n 1A. (stadstica multivariante en las ciencias de la vida. 1adrid*
(ditorial Ciencia F, %.,.744F.
G .2 Abraira %antos ?, -rez de ?argas ,uque A. 1todos 1ultivariantes en 'ioestadstica.
1adrid* (ditorial Centro de (studios =amn Areces, %.A. 744K.
5 .2 Bield A. +iscovering %tatistics using %-%% for 3indoAs. ,ondon* %age -ublications I888.