You are on page 1of 1355

Gua Prctica del

Curso de
Bioestadstica Aplicada
a las Ciencias de la
Salud
D r. Jacobo Daz
Portillo

Gua Prctica del


C urso de Bioestadstica
Aplicada a las C iencias
de la Salud
D r. Jacobo D az Portillo
Coordinador de Formacin Continuada
Hospital Universitario de Ceuta
Direccin Territorial de Ceuta
Hospital Universitario de Ceuta
Urb. Loma Colmenar, s/n
51003 Ceuta

Edita: Instituto Nacional de Gestin Sanitaria


Subdireccin General de Gestin Econmica y Recursos Humanos
Servicio de Recursos Documentales y Apoyo Institucional
Alcal, 56 28014 Madrid
El copyright y otros derechos de propiedad intelectual pertenecen
al Instituto Nacional de Gestin Sanitaria.
Se autoriza la reproduccin total o parcial para uso no comercial,
siempre que se cite explcitamente su procedencia.
Depsito Legal: M-33564-2011
NIPO: 865-11-010-6
Coleccin Editorial de
Publicaciones del INGESA:
1.921

La medicina es una ciencia de probabilidades y el arte de manejar la


incertidumbre...
La estadstica es la ciencia que permite tomar decisiones en
situaciones de incertidumbre.

Bailar JC III. Some uses of statistical thinking. En: Bailar JC III,


Mostoller F, editors. Medical uses of statistics. Boston: N Engl
J Med Books, 1992; p. 25-57.

ndice
Gua Prctica del C urso de Bioestadstica
Aplicada a las C iencias de la Salud

C aptulo 1
Pgina 10
Publicacin Bioestadstica: Introduccin.

Captulo 2
Pgina 72
Publicacin Bioestadstica: Variables y grficos.

Captulo 3
Pgina 161
Publicacin Bioestadstica: Tamao muestral, Error y .

Captulo 4
Pgina 214
Publicacin Bioestadstica: Error y . Evaluacin de pruebas
diagnsticas.

Captulo 5
Pgina 355
Publicacin Bioestadstica: Anlisis bivariante. Test de
contraste de hiptesis. Cualitativa versus cualitativa.

Captulo 6
Pgina 450
Publicacin Bioestadstica: Anlisis bivariante. Test de
contraste de hiptesis. Cualitativa versus cualitativa. Medidas
de asociacin.

Captulo 7
Pgina 640
Publicacin Bioestadstica: Anlisis bivariante. Test de
contraste de hiptesis. Cuantitativa versus cuantitativa.

Captulo 8
Pgina 727
Publicacin Bioestadstica: Anlisis bivariante. Test de
contraste de hiptesis. Cualitativa dicotmica versus
cuantitativa.

Captulo 9
Pgina 874
Publicacin Bioestadstica: Anlisis bivariante. Test de
contraste de hiptesis. Cualitativa policotmica versus
cuantitativa.

Captulo 10
Pgina 992
Publicacin Bioestadstica:
Medidas de concordancia. Variables cualitativas.

Captulo 11
Pgina 1021
Publicacin Bioestadstica: Medidas de concordancia.
Variables cuantitativas.

Captulo 12
Pgina 1158
Publicacin Bioestadstica: Anlisis multivariante.

Captulo 13
Pgina 1337
Publicacin Bioestadstica: Bibliografa.

Es una verdad muy cierta que, cuando no est a nuestro alcance


determinar lo que es verdad, deberemos buscar lo que es ms
probable.
Discurso del Mtodo. Ren Descartes.

N o existe ni el negro ni el blanco, solo existe una completa escala de


grises...
La respuesta est dibujada en el aire...

Si, segn Montaigne, para juzgar cosas grandes y nobles, es necesario


poseer un alma igual de grande y noble(*), para juzgar un artculo
cientfico escrito por un colega es necesario poseer, adems,
conocimientos, experiencia, imparcialidad, confidencialidad, diligencia, una
cierta dosis de pedagoga y otra no menos esencial de compaerismo (**).

(*) Montaigne M. Les essais [libro en internet]. Versin HTML daprs ldition de 1595 [acceso 31 de
octubre de 2008]. Disponible en: http://www.bribes.org/trismegiste/montable.htm
(**) F. Antoja Rib. Revisores. Revista del laboratorio clnico. 2009; 2: 63.

C a pt u l o 1

C aptulo 1
Publicacin Bioestadstica: Introduccin.

D r. Jacobo D az Portillo
Coordinador de Formacin Continuada
Hospital Universitario de Ceuta

p g in a 10

C a pt u l o 1

Bioestadstica aplicada a las Ciencias de la Salud


D efinicin
La Estadstica es la ciencia que se ocupa de los mtodos y procedimientos
para recoger, clasificar, resumir, hallar regularidades y analizar los datos,
siempre y cuando la variabilidad e incertidumbre sea una causa intrnseca
de los mismos; as como de realizar inferencias a partir de ellos, con la
finalidad de ayudar a la toma de decisiones y en su caso formular
predicciones.

p g in a 11

C a pt u l o 1

Bioestadstica aplicada a las Ciencias de la Salud


Estadstica descriptiva
Describe, analiza y representa un grupo de datos utilizando mtodos
numricos y grficos que resumen y presentan la informacin contenida
en ellos.

p g in a 12

C a pt u l o 1

Bioestadstica aplicada a las Ciencias de la Salud


Estadstica inferencial
Apoyndose en el clculo de probabilidades y a partir de datos de una
muestra (procedente de una poblacin), efecta estimaciones, decisiones,
predicciones u otras generalizaciones sobre un conjunto mayor de datos.
Permite generalizar los datos obtenidos a partir de una muestra a la
poblacin de la que proceden. Se basa en la teora de las probabilidades y
trabaja con los datos que le proporciona la estadstica descriptiva.

p g in a 13

C a pt u l o 1

p g in a 14

Bioestadstica aplicada a las Ciencias de la Salud


Estadstica en Medicina
La medicina es una ciencia estadstica, pues siempre se trabaja con la
probabilidad de enfermar y con la oportunidad incierta del diagnstico y del
tratamiento. El mdico debe adecuar el conocimiento cientfico y
tecnolgico a la situacin clnica personal y social del paciente del que se
ocupa en ese momento, ya que no existen enfermedades sino enfermos.
El buen juicio mdico logra un equilibrio entre el riesgo que comporta toda
intervencin diagnstica y/o teraputica y el beneficio esperable de dicha
intervencin
en el paciente concreto, lo que obliga a combinar ciencia y arte, pues no
es fcil trabajar con la incertidumbre, y slo la estadstica nos
proporciona el instrumento adecuado que nos permite convivir con el
azar, y con las limitaciones del conocimiento mdico.

C a pt u l o 1

Hay verdades que por sabidas no se dicen, y por no decirlas se


olvidan...
Hay mentiras (mitos o leyendas) que por decirlas pueden terminar
siendo pseudorealidades o realidades virtuales.

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada.
Hospital Universitario de Ceuta.

p g in a 15

C a pt u l o 1

Mitos y Leyendas en
Bioestadstica
Bobenrieth Astete M.A . Mitos y realidades en torno a la publicacin
cientfica. Med Clin (Barc) 2000; 114: 339-341.
Bobenrieth Astete M.A . Lectura crtica de artculos originales en
Salud. Medicina de Familia (And) 2001; 2: 81-90.
Profesor Bobenrieth Astete M.A.
Profesor de Metodologa de Investigacin y Escritura Cientfica.
Escuela Andaluza de Salud Pblica.

p g in a 16

C a pt u l o 1

Mitos y Realidades en
Bioestadstica
MITO 1: La sonrisa de la esfinge.
Cul es el ser que por la maana anda con cuatro patas, luego por
la tarde con dos, y despus por la noche con tres patas, y que se
vuelve ms dbil cuanto ms patas tiene?
Hay dos hermanas una de las cuales engendra a la otra, y sta a su
vez engendra a la primera Quines son?

p g in a 17

C a pt u l o 1

p g in a 18

Mitos y Realidades en Bioestadstica


REALIDAD 1: Respuesta de Edipo.
Cul es el ser que por la maana anda con cuatro patas, luego por la
tarde con dos, y despus por la noche con tres patas, y que se vuelve ms
dbil cuanto ms patas tiene?
Edipo respondi correctamente y dijo: el HOMBRE, porque la maana, la
tarde y la noche traducen las etapas de la vida. El da o comienzo de la
vida muestra al beb gateando en cuatro pies o patas, la tarde o mitad de
la vida es la adultez del ser humano caminando en dos pies y la noche o
final de la vida muestra al anciano con un bastn o sea en tres pies.
Hay dos hermanas una de las cuales engendra a la otra, y sta a su
vez engendra a la primera Quines son?
Edipo contest: el DA y la NOCHE.
Furiosa, la Esfinge se suicida lanzndose al vaco y Edipo fue
aclamado como
el salvador de Tebas, y como premio, Edipo fue nombrado rey de
Tebas.

C a pt u l o 1

p g in a 19

Mitos y Realidades en Bioestadstica


MITO 1: La sonrisa de la esfinge.
Cmo voy a ser capaz de presentar y defender una comunicacin cientfica
en cualquier foro pblico o mandar a publicar un artculo original a una
revista sanitaria ante tan docto auditorio?
Qu me van a preguntar? Qu me van a decir si no respondo o no lo
hago adecuadamente? Seguro que hago el ridculo
Seguro que me rechazan el artculo original cuando lo mande a publicar a
la revista...
Si lo publican seguro que alguien me lo critica con una carta al director
que se publica en el nmero siguiente, y todo el mundo va a conocer
mis deficiencias
Dr. Jacobo Daz Portillo
Coordinador de Formacin Continuada
Hospital Universitario INGESA de Ceuta

C a pt u l o 1

Realidad 1: Respuesta de
Edipo
FORMACIN CONTINUADA

METODOLOGA DE INVESTIGACIN

BIOESTADSTICA

ESCRITURA CIENTFICA

p g in a 20

C a pt u l o 1

Bioestadstica
La bioestadstica es la punta visible del iceberg de la metodologa
de
investigacin.

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario de Ceuta

p g in a 21

C a pt u l o 1

Mitos y Realidades en Bioestadstica


REALIDAD 1: Muchos investigadores tienen bien definido su estudio y
manejan correctamente las variables (datos), pero no aciertan cuando
escogen las pruebas estadsticas pertinentes, y llegan a la presentacin
oral (comunicacin) o a la redaccin de las revistas cientficas (artculo
original) trabajos que adolecen de una manifiesta mala sincrona entre
los datos obtenidos y su posterior anlisis estadstico.

Antoja Rib F. The innocence of the storks.


Rev Lab Clin 2010; 3 (2): 51.

p g in a 22

C a pt u l o 1

Mitos y Leyendas en Bioestadstica


REALIDAD 1: Los auditores de los congresos sanitarios y los revisores
de las revistas cientficas suelen ser colegas con un alto perfil
profesional, aceptable formacin en Metodologa de Investigacin, pero
quizs sin un alto nivel de conocimientos de anlisis estadstico de
datos.

Antoja Rib F. The innocence of the storks.


Rev Lab Clin 2010; 3 (2): 51.

p g in a 23

C a pt u l o 1

Mitos y Leyendas en Bioestadstica


REALIDAD 1: El Comit Cientfico de los congresos y los editores de las
revistas ante trabajos de difcil evaluacin metodolgica incorporan un
tercer revisor especialista en Bioestadstica que dictamina
definitivamente sobre la idoneidad de las herramientas metodolgicas
empleadas por los autores.

Antoja Rib F. The innocence of the storks.


Rev Lab Clin 2010; 3 (2): 51.

p g in a 24

C a pt u l o 1

Enseanza de la Bioestadstica
Aplicada
MITO 2: Enseanza de la investigacin
clnica.

Antonio Fraguas de Pablo (Forges).


Qu le pasa, Doctor?Eh?. Ediciones Doyma 1988
(Barcelona).

p g in a 25

C a pt u l o 1

p g in a 26

Mitos y Realidades en Bioestadstica


Enseanza autodidacta de la Bioestadstica aplicada
REALIDAD 2: La educacin autodidacta en Bioestadstica es el conjunto
de procesos que realizamos para incorporar nuevos conocimientos
necesarios para cada momento, donde uno mismo selecciona la
informacin que necesita y se evala a s mismo con el mtodo ensayoerror.
La educacin autodidacta es, creo firmemente, el nico tipo de
educacin que existe.
Isaac Asimov.

C a pt u l o 1

p g in a 27

Mitos y Realidades en Bioestadstica


MITO 3: Una publicacin sobre las ventajas de un nuevo tratamiento
con otro vigente que demuestra significacin estadstica (p < 0,05)
posee, en consecuencia, importancia y significacin clnica.

C a pt u l o 1

Mitos y Realidades en Bioestadstica


REALIDAD 3: Mediciones y afirmaciones de probabilidad pueden ser
de gran ayuda en la prctica mdica, pero nunca deben reemplazar
en muchos casos a
- La experiencia.
- La perceptividad.
- El sentido comn.
- Y la intuicin.

Dr. Manuel Bobenrieth Astete


Profesor de Metodologa de Investigacin y Escritura Cientfica
Escuela Andaluza de Salud Pblica.

p g in a 28

C a pt u l o 1

p g in a 29

Mitos y Realidades en las publicaciones cientficas


REALIDAD 3: El valor de p, debe ser valorado con precaucin y teniendo
en cuenta el contexto del estudio, su diseo, las caractersticas de la
muestra o la poblacin analizada, de los potenciales sesgos, etc. Y
NUNCA como una cifra mgica que nos seduzca tanto, que nos invite o
autorice a tomar decisiones o cambiar conductas relacionadas con la
prctica clnica cotidiana.
REALIDAD 3: Antes de tomar decisiones o cambiar conductas clnicas
basadas en un valor de p, se ha de considerar tambin la VALIDEZ
EXTERNA (generalizacin de los resultados obtenidos en ese estudio
respecto de la poblacin inicial y, si esas conclusiones pueden ser
extrapoladas a nuestros pacientes o nuestra realidad laboral (que
pueden ser distinta a la descrita en el estudio publicado y valorado por
nosotros.

C a pt u l o 1

p g in a 30

Realidad 3
...de lo estadsticamente significativo a lo clnicamente
relevante
Hallazgos
estadsticos
1. Reflejan la influencia del azar en
el
resultado
2. Derivan de grupos de individuos
3. Requieren cantidades adecuadas
de datos para ser vlidas
4. Las respuestas estadsticas
son probabilsticas
5. El anlisis estadstico siempre
requiere medicin.

Hallazgos clnicos
1. Reflejan el valor biolgico del
resultado
2. Se practica en individuos
especficos
3. Las decisiones clnicas deben tomarse
a
menudo con datos insuficientes
4. Los tratamientos mdicos
requieren decisiones oportunas
comprometidas
5. La prctica clnica no puede medir
fcilmente cada funcin, cada
sistema, cada signo o sntoma clnico

C a pt u l o 1

Realidad 3
...de lo estadsticamente significativo a lo clnicamente
relevante
Por todo ello, es ms apropiado que hablar de SIGNIFICACIN
ESTADSTICA es ms correcto utilizar el concepto de
RELEVANCIA CLNICA; porque la relevancia clnica de un
fenmeno va ms all de clculos matemticos y depende de
1. La gravedad del problema,
2. La morbilidad y mortalidad generada por el mismo,
3. La magnitud de la diferencia,
4. La vulnerabilidad,
5. Los costes involucrados, etc.

p g in a 31

C a pt u l o 1

p g in a 32

Realidad 3
...de lo estadsticamente significativo a lo clnicamente
relevante
Realidad 3: ...de lo
estadsticamente significativo a lo
clnicamente relevante.

Es clnicamente relevante?

Es estadsticamente significativo? S (xito)

No (fracaso)

S (p < 0,05)

Clnicamente relevante

Clnicamente irrelevante (p < 0,05)

Estadsticamente significativo

Estadsticamente significativo

Error Alfa?
No (p > 0,1)

Clnicamente relevante

Clnicamente irrelevante

Estadsticamente NO
significativo

Estadsticamente NO significativo

Error Beta?

C a pt u l o 1

p g in a 33

Mitos y Realidades en Bioestadstica


REALIDAD 3: Un resultado estadsticamente significativo (p<0,05) sin
relevancia clnica no deja de ser una ANCDOTA; un hallazgo
clnicamente importante sin significacin clnica (p>0,1) no puede ser
asumido como concluyente, ya que no podemos atribuir con seguridad el
hallazgo clnico a la intervencin realizada (no podemos descartar la
influencia del AZAR).

C a pt u l o 1

Mitos y Realidades en Bioestadstica


REALIDAD 3: Una prueba estadstica NO es una prueba de relevancia
cientfica. Bajo ningn concepto la relevancia del dato se encuentra en
la tcnica de anlisis, sino en la repercusin del mismo en el
conocimiento del objeto de estudio. Es perfectamente compatible
encontrar diferencias estadsticamente significativas que no suponen
relevancia clnica, y viceversa.

Guttman . What is not what statistics (1977).

p g in a 34

C a pt u l o 1

Mitos y Realidades en Bioestadstica


MITO 4: La ausencia de evidencia es evidencia de ausencia.
REALIDAD 4: La ausencia de evidencia NO es evidencia de
ausencia.

Altman DG, Bland JM. Absence of evidence is not evidence of absence. BMJ 1995;311:485.

p g in a 35

C a pt u l o 1

Mitos y Realidades en Bioestadstica


MITO 4: La ausencia de significacin estadstica (p > 0,05) implica que
dos tratamientos comparados tienen la misma eficacia y por tanto
pueden prescribirse indistintamente.

Altman DG, Bland JM. Absence of evidence is not evidence of absence. BMJ 1995;311:485.

p g in a 36

C a pt u l o 1

Mitos y Realidades en Bioestadstica


REALIDAD 4: Altman y Bland alertaron sobre un error comn en la
bibliografa biomdica: interpretar un resultado estadsticamente no
significativo, cuando se comparan dos tratamientos, como sinnimo de
su equivalencia teraputica.

Altman DG, Bland JM. Absence of evidence is not evidence of absence. BMJ 1995;311:485.
Argimon JM. La ausencia de significacin estadstica en un ensayo clnico no significa equivalencia
teraputica. Med Clin (Barc) 2002; 118: 701-3.

p g in a 37

C a pt u l o 1

p g in a 38

Mitos y Realidades en Bioestadstica


REALIDAD 4: Un valor de significacin estadstica mayor p > 0,05 se
etiqueta como no significativo. Estos estudios se les denomina negativos,
un trmino que implica errneamente que los tratamientos son iguales,
cuando lo nico que sucede es que no se ha podido demostrar una
diferencia. Ambos conceptos son distintos. Un resultado que no alcance
significacin estadstica quiere decir que (si en realidad no existe esa
diferencia), es probable que la observada en el estudio pueda haberse
producido simplemente por el AZAR (variabilidad aleatoria). No debe
interpretarse como indicativo de que no existe una diferencia en la
realidad, sino tan slo de que no puede descartarse esta posibilidad, en
especial en los estudios que han incluido a pocos sujetos.

C a pt u l o 1

p g in a 39

Mitos y Realidades en Bioestadstica


MITO 5: La estadstica es una religin que conduce a la salvacin a
travs del mgico ritual de la bsqueda de valores significativos de la p
(p<0,05), alcanzando entonces los autores la verdad absoluta y el paraso
prometido de la publicacin del trabajo en una revista de alto ndice de
impacto.

C a pt u l o 1

p g in a 40

Mitos y Realidades en Bioestadstica


REALIDAD 5: En la bibliografa cientfica se est abusando del trmino
significacin estadstica. Numerosos investigadores dan por supuesto
que si en un estudio hallan una probabilidad (p) inferior a 0,05, ello
certifica
la existencia tanto de la validez cientfica de su observacin como de la
relevancia clnica de la misma. Y ello est lejos de ser cierto. Su fe ciega
en el valor de la p contrasta con los detractores de su significado (ateos de
la estadstica).

C a pt u l o 1

Mitos y Realidades en Bioestadstica


REALIDAD 5: La estadstica es una herramienta til para el
diseo y realizacin de estudios sanitarios siempre que sea
utilizada adecuadamente.

Salsburg DS. The religion of statistics as practiced


in medical journals. Am Statistician 1985; 39: 220-223.

p g in a 41

C a pt u l o 1

Mitos y Realidades en Bioestadstica


REALIDAD 5: Los mtodos estadsticos NO son un sustituto del
sentido comn y la objetividad. Nunca deberan estar dirigidos a
impresionar o confundir al lector, sino que deben ser una contribucin
importante a la claridad de los conocimientos cientficos.

Pocock SJ. The role of statistics in medical research. Br J Psychiat 1980; 137: 188-190.

p g in a 42

C a pt u l o 1

Mitos y Realidades en Bioestadstica


REALIDAD 5: Es fundamental hacer buenas preguntas de investigacin,
lo cual nos llevar a trabajos interesantes y respuestas con sentido
comn, no habr necesidad de SALIR DE PESCA para presentar al
editor muchas
p menores de 0.05. Todo, con mesura y utilizado racionalmente, es
bueno, y la estadstica es un instrumento indispensable pero, como todo
en la vida, con SENTIDO COMN (y este sentido estadsticamente
hablando no parece ser a veces muy frecuente).

Dr. Juan M. Garca Torrecillas


Mdico de Especialista en Medicina Familiar y Comunitaria
Experto en Epidemiologa y Nuevas Tecnologas

p g in a 43

C a pt u l o 1

El Borracho
Utiliza la estadstica como un borracho usa una farola, para
aguantarse
en lugar de para iluminarse

Andrew Lang

p g in a 44

C a pt u l o 1

p g in a 45

O bjetivo principal de la estadstica:


Cul es la probabilidad de que la diferencia observada en el
estudio se deba al A Z AR?
- Una p < 0,05 indica que en menos de 5 veces de cada 100 que
repitiramos el mismo estudio, nuestro resultado se debera al
AZAR.
- Cuanto mayor sea la p (p > 0,1) ms fuerte y segura ser la evidencia a
favor de la hiptesis nula (igualdad).
- El valor de la p no es un indicador de fuerza de asociacin, ni tampoco
de su importancia clnica.

C a pt u l o 1

La Llave D orada
La estadstica no es la llave dorada que abre la puerta de la verdad
absoluta e infinita
La verdad absoluta e infinita tiene una sonrisa diablica. Si consigo la llave dorada
podr abrir la puerta , y as podr conocer la verdad absoluta e infinita.

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario de Ceuta

p g in a 46

C a pt u l o 1

Mitos y Realidades en Bioestadstica


MITO 6 (significantitis): Si p es mayor que el 5%, el resultado del
estudio no vale para nada; slo si es menor de 0,05, hemos hecho un
gran descubrimiento.

Chia KS. Significant-itis: an obsession with the P value. Scand J Work Environ Health. 1997; 23:152-4.
Christenson P. To p or not to p. J Child Adolesc Psychiatr Nurs. 1995; 8:42.

p g in a 47

C a pt u l o 1

p g in a 48

Mitos y Realidades en Bioestadstica


REALIDAD 6: Algunos, de forma irnica, a esta postura tan drstica y
que pocas veces est realmente justificada la consideran una autntica
enfermedad llamada significantitis o es como un problema de
conciencia: to p or not to p. Neyman et al. al considerar que haba que
establecer un
lmite claro en el valor p para aplicar los razonamientos anteriores de
forma absoluta. Este valor crtico de p es el famoso 0,05 y marca el
mtico lmite de la significacin estadstica.

Neyman J, Pearson E. On the problem of the most efficient tests of statistical hypothesis. Philosophical trans
of the Royal Society of London (A) 1933;231:289-337.

C a pt u l o 1

p g in a 49

Mitos y Realidades en Bioestadstica


REALIDAD 6: Neyman et al lanzaron este lema exclusivamente
bajo el punto de vista de la toma de decisin ante un problema que
fuera
trascendente y en el que, urgiera tal toma de decisin: rechazar o no la
hiptesis nula con sus consecuencias derivadas. Lo que ocurre es que se
ha universalizado demasiado y se lo ha sacado de su contexto, ya que se
aplica a cualquier inferencia estadstica, aunque el fin de la investigacin
no suponga obligacin alguna de tomar una decisin tan drstica, basada
en la ley del todo o nada.

Neyman J, Pearson E. On the problem of the most efficient tests of statistical hypothesis. Philosophical trans
of the Royal Society of London (A) 1933;231:289-337.

C a pt u l o 1

p g in a 50

Mitos y Realidades en Bioestadstica


MITO 7 (adoradores de la p): La esencia de la estadstica es la bsqueda
de los valores ms bajos de la p, (una p < 0,001 es mejor que una p <
0,01, y sta superior a una p <0,05) ya que cuanto ms pequea sea esta
p mayor intensidad de asociacin y causalidad existir entre las variables
y mayor credibilidad tendrn las conclusiones de mi estudio.

C a pt u l o 1

Mito 7: Adoradores de la p
El cual los tom de las manos, y formlo con buril, e hizo de ello un
becerro de fundicin. Entonces dijeron: Israel, estos son tus dioses,
que te sacaron de la tierra de Egipto

xodo 32, 1-6

p g in a 51

C a pt u l o 1

p g in a 52

Mitos y Realidades en Bioestadstica


REALIDAD 7: La utilidad de la p es una medida de la influencia del AZAR
en la posible asociacin entre las variables analizadas, este azar debe ser
siempre contemplado, evaluado y cuantificado mediante el valor de la p.
La p NO es un indicador de fuerza de la asociacin entre variables, ni
de su importancia. Los valores de la p deben ser considerados solo
como una gua y no como base de conclusiones definitivas e irrevocables.

C a pt u l o 1

Mitos y Realidades en Bioestadstica


MITO 8: Hace poco le en la prensa mdica la siguiente frase: Yo no
creo en la estadstica, (ATEOS de la estadstica) porque est claro que
la
estadstica, como religin que es, es solo una cuestin de fe, que como
tal debe ser respetada (segn dice el artculo 16 de la Constitucin
Espaola sobre la libertad religiosa).

p g in a 53

C a pt u l o 1

Mitos y Realidades en Bioestadstica


REALIDAD 8: La estadstica constituye un instrumento cientfico que
requiere el cumplimiento de NUMEROSAS CONDICIONES para
producir resultados vlidos.
1. Es preciso que los experimentos tengan un diseo muy escrupuloso.
2. Es inexcusable aplicar en cada circunstancia aquellos mtodos que en
ella son idneos y controlar rigurosamente su validez.
3. NUNCA es legtimo deducir que un resultado significativo es
clnicamente
relevante.
4. Una correlacin entre dos variables acabar siendo siempre significativa
(p < 0,05) si la muestra es lo suficientemente grande.
5. Por eso en algunos casos, se dice que: La estadstica es un
instrumento, que si no se usa adecuadamente, puede demostrar
cualquier MENTIRA.

p g in a 54

C a pt u l o 1

Mitos y Realidades en Bioestadstica


REALIDAD 8: Aplicando los mtodos estadsticos de forma abusiva
(como lo haca la Santa Inquisicin), si torturamos suficientemente a
nuestros datos, acabaran por confesarnos lo que nosotros queramos. El
fin nunca justifica los medios.

Ars A. Tmese una antes de acostarse. 1 edicin. Barcelona: Planeta; 1998.

p g in a 55

C a pt u l o 1

La estadstica es un instrumento, que si no se usa adecuadamente,


puede
demostrar cualquier mentira.
En Bioestadstica el fin nunca justifica los medios.

p g in a 56

C a pt u l o 1

p g in a 57

Mitos y Realidades en Bioestadstica


REALIDAD 8: Si los datos de un estudio se analizan con muchos
enfoques distintos y con la suficiente intensidad hasta TORTURARLOS,
acaban dando los resultados que al investigador le hubiese gustado
obtener, aunque tales resultados suelen ser cientficamente NEFASTOS.

Mills JL. Data torturing. N Engl J Med. 1993; 329: 1196-9.

C a pt u l o 1

Mitos y Realidades en
Bioestadstica
MITO 9: La inocencia de las cigeas
Una buena correlacin estadstica (coeficiente de correlacin r
elevado) (p < 0,05) siempre significa que existe una relacin entre las
variables evaluadas y, por tanto, existe una relacin causa - efecto.

p g in a 58

C a pt u l o 1

p g in a 59

C a pt u l o 1

Mitos y Realidades en Bioestadstica


REALIDAD 9:
- Una buena correlacin estadstica (r elevado) (p < 0,05) NO
siempre significa que exista una relacin entres las variables
evaluadas y, por tanto, NO implica una relacin causa-efecto.
- El trabajo estara mal planteado, aunque se hubiera aplicado un
tratamiento estadstico aparentemente correcto.
- Los autores de un estudio deben ser muy cautos en la aplicacin y
posterior interpretacin del anlisis estadstico.

Antoja Rib F. The innocence of the storks. Rev Lab Clin 2010; 3 (2):
51.

p g in a 60

C a pt u l o 1

Estudio
ecolgico
Variable PRED IC TO RA
Factor de exposicin
C IGE AS
(F)

Variable RESULTAD O
Efecto o Enfermedad
(E)N ATALIDAD HUMAN A

Nmero de ejemplares
de cigeas

Tasa de natalidad de
la poblacin humana

p g in a 61

C a pt u l o 1

Enero

Variable cuantitativa continua

Variable RESULTADO-RESPUESTA-posible EFECTO

Tasa de nacimientos en la poblacin humana

Estudio de Bartels
(Alemania)
Mayo

Abril

Junio

Noviembre

Febrero
Marzo

Agosto
Octubre
Julio
Septiembre

Diciembre

Variable PREDICTORA-EXPOSICIN-posible CAUSA

Nmero de ejemplares de cigeas


Variable cuantitativa continua

p g in a 62

C a pt u l o 1

Estudio de Bartels (Alemania)


RESULTADOS: En Alemania, en un mismo ao, descendieron, de forma
significativa, la tasa de nacimientos de la poblacin humana y el nmero
de ejemplares de cigeas. La correlacin entre ambas variables era
alta, lo que demostraba cientficamente su relacin.
CONCLUSIN: La baja natalidad alemana en el ao de estudio se
explica por la disminucin del nmero de cigeas repartidoras de
bebs. La culpa era de las cigeas.

p g in a 63

C a pt u l o 1

C omentario
s
- Es muy saludable encontrar detalles de humor.
- Si leyramos un supuesto artculo cientfico con esa conclusin tan extravagante
pensaramos, sin duda, que se trata de una parodia y como tal la aceptaramos.
-Es fcil entender el error porque sabemos que las cigeas no tienen nada que ver
con la reproduccin humana y, por tanto, se ha buscado errneamente una
relacin entre dos variables sin plausibilidad biolgica.
-El trabajo est mal planteado, y aunque se hubiera aplicado un
tratamiento estadstico aparentemente correcto.
- Una buena correlacin estadstica (r elevado) (p < 0,05) NO siempre significa que
existe una relacin entres las variables evaluadas, y por tanto NO implica una
relacin causa efecto.

p g in a 64

C a pt u l o 1

Reflexione
s
Qu ocurre cuando el estudio se lleva a cabo con variables (datos) menos
conocidos, de poblaciones que nos son menos familiares, obtenidos en
estudios complejos?
Cmo sabemos si el autor sabe certeramente entre qu grupos se puede
establecer relaciones y entre cules no tiene sentido hacerlas?
Esto slo es posible si el investigador conoce muy bien lo que est estudiando y
ha partido de un planteamiento y el diseo del estudio bien estructurado.
Las conclusiones que se obtienen al aplicar las pruebas estadsticas slo
tienen sentido cuando las variables (datos) estn bien definidas y tienen
plausibilidad biolgica.

p g in a 65

C a pt u l o 1

Estos tipos de errores se originan cuando los autores NO tienen


claros algunos conceptos bsicos de METODOLOGA de
INVESTIGACIN pero disponen de programas estadsticos potentes,
en los que slo
se necesita sealar y aceptar con el ratn entre un amplio abanico
de pruebas estadsticas.

p g in a 66

C a pt u l o 1

Parafraseando a Sneca , debemos convenir


que
todo lo honesto es difcil
y la investigacin clnica no es una excepcin.

Sneca LA. De los beneficios. En: Lucio Anneo Sneca: Obras completas. Madrid: Aguilar, 1961.

p g in a 67

C a pt u l o 1

p g in a 68

C urso de Bioestadstica Aplicada


1. Introduccin a la bioestadstica.
2. Estadstica descriptiva. Variables y grficos.
3. Tamao muestral: Error alfa y error beta.
4. Evaluacin de pruebas diagnsticas.
5. Test de contraste de hiptesis: variable cualitativa versus cualitativa.
6. Test de contraste de hiptesis: variable cuantitativa versus
cuantitativa.
7. Test de contraste de hiptesis: variable cuantitativa versus cualitativa.
8. Anlisis estadstico multivariante.
9. Utilidad de la bioestadstica en los resultados y discusin del estudio.

C a pt u l o 1

Salir de nuestra cueva de BENZ, de nuestro nicho


ecolgico
Comunicar nuestra experiencia a los dems
Utilizando la bioestadstica como herramienta de
trabajo.

p g in a 69

C a pt u l o 1

Etapas del proceso de


investigacin

TEORIA
1. Problema
(Preguntas)

18. Conclusin
(Respuestas)

Fase interpretativa
DISCUSIN

17. Alcance
y limitaciones

2. Revisin
bibliogrfica

16. Importancia
Novedad

3. Marco
terico

4. Definicin
Variables

14. ANLISIS

13. Presentacin
de datos
Procesamiento
12. 12.
Procesamiento
de datos
estadstico
de datos

DEDUCCIN

INDUCCIN

15. Validez interna y


externa

Fase emprica
RESULTADOS

Fase conceptual
INTRODUCCIN

6. Seleccin del
diseo

TEMA A INVESTIGAR
Campo de investigacin

7. Identificacin de
la poblacin

11. Recoleccin
de datos

10. Fuentes de
informacin

5. HIPTESIS
OBJETIVOS

8. Determinacin
Casos/muestra

9. Estudio
piloto
HECHOS
DATOS

Fase planificacin
MATERIAL y
MTODOS

p g in a 70

C a pt u l o 1

La bioestadstica y el mtodo epidemiolgico aportan ms ciencia al arte de la


medicina y enfermera y es por ello que la colaboracin conjunta de expertos en
metodologa, bioestadsticos y los clnicos deben trabajar en equipo en
colaboracin para en un esfuerzo conjunto reducir la variabilidad que rodea al
ejercicio de la medicina y enfermera que ser siempre una ciencia de
probabilidades y un arte de manejar la incertidumbre.

Bioestadsticos

Expertos en
metodologa

Personal
sanitario

Pita Fernndez S. Dificultades de los mdicos para la realizacin de estudios clnico-epidemiolgicos.


Congreso Galego de Estadstica e Investigacin de Operacins. Santiago de Compostela, A Corua
(Espaa). 11-13 Novembre-1999.

p g in a 71

C a pt u l o 2

C aptulo 2
Publicacin Bioestadstica: Variables y
grficos.

D r. Jacobo D az Portillo
Coordinador de Formacin Continuada
Hospital Universitario de Ceuta

p g in a 72

C a pt u l o 2

Materiales
Pacientes
1. Criterios de seleccin de la muestra (inclusin y
exclusin).
2. Procedencia.
3. Tcnica de reclutamiento utilizada.
4. Tiempo empleado para reunir a todos los participantes.
5. Principales caractersticas de los pacientes.
- Edad
- Sexo
- Procedencia
- Gravedad
- Aos de evolucin de la enfermedad
- Patologas asociadas...
6. Clculo de tamao muestral.

p g in a 73

C a pt u l o 2

Tipos de
variables
- Variables cualitativas
- Categricas nominales
- Dicotmicas o
Binarias
- Policotmicas
- Categricas ordinales
- Variables
cuantitativas
- Discretas
- Continuas

C ategorizacin

p g in a 74

C a pt u l o 2

Tipos de
variables
- Variables CUALITATIVAS: Representan una cualidad o atributo que clasifica a cada
individuo en una de varias categoras. Pueden ser de dos tipos:
- Dicotmicas o binarias: La situacin ms sencilla es aquella en la que se clasifica
cada
individuo en uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no fumador).
- Policotmicas: Es necesario un mayor nmero de categoras (color de los ojos,
grupo sanguneo, profesin, etctera).
- Variables CUANTITATIVAS: Son aquellas que pueden medirse, cuantificarse o
expresarse numricamente. Pueden ser de dos tipos:
- Continuas: Son aquellas que si admiten tomar cualquier valor dentro de un rango
numrico determinado, con uno o varios decimales (peso, talla, edad).
- Discretas: Son aquellas que NO admiten todos los valores intermedios en un rango.
Suelen tomar solamente valores enteros (nmero de hijos, abortos, partos,
hermanos).

p g in a 75

C a pt u l o 2

p g in a 76

Tipos de variables segn la escala de


medida
Escalas nominales: Variables NOMINALES: sta es una forma de observar o medir en
la que los datos se ajustan por categoras que no mantienen una relacin de orden
entre s.
- Sexo.
- Grupo sanguneo.
- Presencia o ausencia de una enfermedad.
- Presencia o ausencia de un factor de riesgo.
Escalas ordinales: Variables ORDINALES: En las escalas utilizadas para medirlas existe
un cierto orden, grado o jerarqua entre las categoras.
- Grado de disnea.
- Grado de dolor.
- Intensidad del hbito tabquico.
- Tipo de fumador.

C a pt u l o 2

Variables cualitativas categricas


ordinales
- Grado de disnea.
- Grado de dolor.
- Intensidad del hbito
tabquico.
- 1-9 cigarrillos/da.
- 10-20 cigarrillos/da.
- > 20 cigarrillos/da.
- Tipo de fumador.
- Exfumador.
- Fumador pasivo.
- Fumador activo.

p g in a 77

C a pt u l o 2

C ategorizacin de variables
cuantitativas
Variable
Cuantitativa
Triglicridos
continua

Variable
Cuantitativa
Test de APGAR
discreta

Variable
Cualitativa
Hipertriglicridemi
dicotmica

a
N ormotriglicride
mia
C ategorizaci
n

Variable
C ualitativa
Patolgico < 7
ordinal

D udoso = 7
Fisiolgico > 7

C ategorizaci
n

p g in a 78

C a pt u l o 2

Tipos de
variables
Ejemplos
Variables cualitativas
- Categricas
nominales
- Binarias
- Policotmicas
- Ordinales
Variables
cuantitativas
- Discretas
- Continuas

- Sexo
- Credo religioso en
Ceuta
- Hipertensin
- Tipo de fumador
- Colesterolemia
- Nmero de abortos
- Nivel de instruccin
- Edad gestacional
- Frecuencia cardiaca
- Test de apgar

p g in a 79

C a pt u l o 2

Tipos de
variables
Ejemplos
Variables cualitativas
- Categricas
nominales
- Binarias
- Policotmicas
- Ordinales
Variables
cuantitativas
- Discretas
- Continuas

- Antecedentes de IAM
- Grupo sanguneo
- Hipertensin
- Tipo de fumador
- Colesterolemia
- N intentos de dejar
fumar
- Nivel econmico
- Edad
- Peso
- Test de apgar

p g in a 80

C a pt u l o 2

Tipos de
variables
Ejemplos
Variables cualitativas
- Categricas
nominales
- Binarias
- Policotmicas
- Ordinales
Variables
cuantitativas
- Discretas
- Continuas

- Desenlace
- Estado civil
- Inmunizacin toxoplasma
- Intensidad del hbito
tabquico
- LDL colesterol
- Nmero de cigarrillos
- Grado de disnea
- Aos de evolucin
- Hemoglobina
- Nmero de hijos

p g in a 81

C a pt u l o 2

Tipos de
variables
Variable independiente (X)

Variable dependiente (Y)

Controlada por el investigador

Respuesta que no se controla

Informacin disponible

Informacin que se desea conseguir

Variable predictora

Variable desenlace

Variable previa

Variable criterio

Exposicin (F)

Resultado (E)

Posible causa

Posible efecto

Factor

Consecuencia

Regreso

Regresando

p g in a 82

C a pt u l o 2

p g in a 83

Pruebas estadsticas de contraste de


hiptesis ms aplicables a cada situacin
Variable
Independiente
o PREDICTORA

Variable
Dependiente
o RESULTADO

Pruebas de contraste de
hiptesis

Observaciones y/o limitaciones del test

Cualitativa

Cualitativa

Ji cuadrado
Prueba exacta de
Fisher Test de
McNemar
Q de Cochran
REGRESIN LOGSTICA

Cualitativa

Cuantitativa

Cuantitativa

Cualitativa

Cuantitativa

Cuantitativa

t de Student
Anlisis de la
Varianza Test de
Mann-Whitney Test
de Wilcoxon
Test de KruskallWallis Test de
Friedman
Regresin logstica simple
Regresin logstica
multivariante
Regresin lineal
simple Correlacin de
Pearson Correlacin
de Sperman
REGRESIN MLTIPLE

Si el tamao muestral es
grande Si el tamao muestral
es pequeo
Dos grupos de muestras
repetidas o apareadas
Ms de dos grupos de muestras repetidas o
apareadas Varias variables predictoras
cualitativas
Compara medias entre dos grupos independientes
Compara medias entre ms de dos grupos
independientes Dos grupos independientes No
paramtricos
Dos grupos medidas repetidas No paramtrico
Ms de dos grupos No paramtrico, grupos
indendientes Ms de dos grupos No paramtrico
medidas repetidas
Una sola variable predictora cuantitativa
Varias variable predictoras cuantitativa o cualitativas
Paramtrico
Paramtrico
No
paramtrico
Varias
variables
predictoras
cuantitativas

C a pt u l o 2

Fases del anlisis


estadstico
1.- ANLISIS DESCRIPTIVO

2.-ANLISIS BIVARIANTE

3.- ANLISIS MULTIVARIANTE

p g in a 84

C a pt u l o 2

Estadsticos
descriptivos
Medidas de tendencia
central
- Media aritmtica
- Media geomtrica
- Media armnica
- Media ponderada
- Mediana
- Moda
Medidas de forma
- Asimetra
- Curtosis o
apuntamiento

Medidas de dispersin
- Varianza
- Desviacin estndar
- Coeficiente de variacin
- Error estndar de la
media
Medidas de posicin
- Cuantiles
- Percentiles

p g in a 85

C a pt u l o 2

Medidas de tendencia
central
- Media aritmtica
[x]
- Media geomtrica
- Media armnica
- Media ponderada
- Mediana (P50)
- Moda

p g in a 86

C a pt u l o 2

p g in a 87

Media
aritmtica
- Principal medida de tendencia central, pero menos robusta que la media geomtrica
o media armnica.
- Se deja influir mucho por los valores extremos de la distribucin.
- Se suman todos los valores y se divide por el nmero total de individuos.
- Expresin con pocos decimales.

C a pt u l o 2

p g in a 88

Ejemplo: Cul es la nota de un alumno del curso de


metodologa de investigacin que ha obtenido las
siguientes calificaciones?
xi

valor

Peso

valor

Asistencia a clase (X1)

7,5

W1

20%

Tesina (prcticas) (X2)

5,5

W2

20%

Examen inicial (X3)

3/14 (2,1)

W3

10%

Examen final (X4)

11/14 (7,8)

W4

20%

Incremento en sus conocimientos (X4 - X3)

W5

30%

Media ponderada =
6,7

C a pt u l o 2

Mediana
P50
- Medida de tendencia central robusta, de clculo fcil.
- No se deja influir mucho por los valores extremos de la distribucin.
-Coincide con el valor central del conjunto ordenado de observaciones que deja por
debajo y por encima a la mitad de las observaciones realizadas.
- Se debe utilizar siempre en dos casos:
- Bajo tamao muestral (para muestras pequeas) y/o
- Cuando existen observaciones extremas (perifricos)

p g in a 89

C a pt u l o 2

Medidas de
dispersin
- Varianza [s2]

- Desviacin tpica o estndar


[s]

- Coeficiente de variacin
[CV]

- Error estndar de la media


[EE]

p g in a 90

C a pt u l o 2

Cul
de
las
siguientes distribuciones
presenta un mayor valor
de la media?
Cul de las
siguientes distribuciones
presenta una
mayor
dispersin?

Cul de las siguientes


distribuciones presenta
una mayor dispersin?
Cul de las siguientes
distribuciones presenta
un mayor valor de la
media?

p g in a 91

C a pt u l o 2

D esviacin estndar
(s)
-Medida de dispersin que nos suministra mucha informacin sobre la naturaleza de
una variable.
-Cuanto ms separados estn los valores de la media mayor ser su dispersin, y
mayor ser su desviacin estndar.
-Se debe representar como media (desviacin estndar), y NO como media
desviacin estndar.
-Su magnitud SI depende de las unidades de medida de la variable. NO permite la
comparacin directa de la dispersin de varias variables.

p g in a 92

C a pt u l o 2

p g in a 93

C oeficiente de variacin
(C V)
-Medida de dispersin que relaciona que proporcin porcentual de la media representa
la desviacin estndar.
-Representa la desviacin estndar medida en unidades de magnitud relativas a
la media.
- Permite la comparacin directa de la dispersin de varias variables.
- Su magnitud NO depende de las unidades de medida de la variable.

C a pt u l o 2

C ul de las siguientes variables presenta un mayor


grado de
dispersin?
Repetibilidad interdiaria de los procedimientos de anlisis del metabolismo frrico
Componente

Media

Desviacin
estndar

Coeficiente de
variacin (CV %)

Hemoglobina

20

121,70

0,64

0,53

Hierro

20

0,99

0,01

1,20

Ferritina

20

94,50

4,24

4,49

Transferrina

20

3,25

0,094

2,89

soluble de la transferrina 20
2,39
0,13
5,44
CReceptor
ul de
las siguientes variables
presenta
un menor
grado de
dispersin?

p g in a 94

C a pt u l o 2

p g in a 95

Distribucin de los valores de una variable x


medidos en los individuos de una
poblacin
Sigma : desviacin

Desviacin estndar: Mide el grado de


dispersin de todos los individuos que
forman la muestra (s) o la poblacin
().
Media poblacional desconocida de la que
proceden todas las muestras extradas

estndar de los individuos


de la poblacin general

Distribucin de las medias X observadas en las infinitas muestras


de tamao n que pueden obtenerse de una poblacin de media
y de desviacin estndar
DISTRIBUCI
N
DE
LAS
MEDIAS
MUESTRALES

Error Estndar de la Media EEM: Mide el grado de dispersin de las medias de todas las posibles muestras
que pudieran extraerse de la poblacin. Mide el grado de dispersin de las medias muestrales respecto a la
media poblacional (desconocida).

C a pt u l o 2

Medidas de forma
Asimetra (coeficiente de asimetra de

Simtrica (coeficiente de asimetra = 0)


Fisher)
Asimtrica (coeficiente de asimetra 0)

3
i

i1 3
R

Asimetra positiva (coeficiente de asimetra > 0)


Asimetra negativa (coeficiente de asimetra < 0)

Curtosis o apuntamiento (coeficiente curtosis de Fisher)


Mesocrtica ( =
0)
Platicrtica ( < 0)
Leptocrtica ( >
0)

Coeficiente mide el grado de


APLASTAMIENTO de una curva

i1

3 R
4

4
i

p g in a 96

C a pt u l o 2

Medidas de
forma

Asimetra

i 1

R
3

Histograma de frecuencias de una variable cuantitativa


con distribucin simtrica (coeficiente de asimetra =
0)

Distribucin normal

[Asimetra] < 2 EEasimetra

< 2 EE

3
i

p g in a 97

C a pt u l o 2

Medidas de
forma
Asimetra

Histograma de frecuencias de una variable cuantitativa


con distribucin Asimtrica Positiva (coeficiente de asimetra >
0)

p g in a 98

C a pt u l o 2

Histograma de frecuencias de una variable cuantitativa


con distribucin Asimtrica positiva (coeficiente de asimetra > 0)

Moda

Mediana

Media

* Coeficiente de asimetra > 0 (VALOR


POSITIVO)
* La Mediana es un valor ms pequeo que la Media
* La cola de la distribucin se aleja por la derecha

p g in a 99

C a pt u l o 2

Medidas de
forma
Asimetra

Histograma de frecuencias de una variable cuantitativa


con distribucin Asimtrica Negativa (coeficiente de asimetra <
0)

p g in a 100

C a pt u l o 2

Histograma de frecuencias de una variable cuantitativa con


distribucin Asimtrica negativa (coeficiente de asimetra <
0)

Mediana

Moda

Media

* Coeficiente de asimetra < 0 (VALOR


NEGATIVO)
* La Mediana es un valor ms grande que la Media
* La cola de la distribucin se aleja por la izquierda

p g in a 101

C a pt u l o 2

Medidas de forma
Curtosis o apuntamiento
Coeficientes de apuntamiento o curtosis de
Fisher
Leptocrtica ( >
Platicrtica ( <
Mesocrtica ( =
0)
0)
0)

Distribucin normal

[curtosis] < 2 EEcurtois

< 2 EE

p g in a 102

C a pt u l o 2

Segn las medidas de forma C mo puede


clasificarse esta
variable?
Asimetra =
0,01 Curtosis =
0,02
Simtrica ( 0)
Mesocrtica (

0)
Distribuci
n
NORMAL

Coeficientes de asimetra y de apuntamiento o curtosis


en diversos tipos de distribuciones

p g in a 103

C a pt u l o 2

Segn las medidas de forma C mo puede


clasificarse esta
variable?
Asimetra = + 2,98
Curtosis =
+11,53
Asimtrica ( >0)
(+)
Leptocrtica ( >0)
Distribuci
n
ANORMA
L

Coeficientes de asimetra y de apuntamiento o curtosis

en diversos tipos de distribuciones

p g in a 104

C a pt u l o 2

Segn las medidas de forma C mo puede


clasificarse esta
variable?
Asimetra =

-1,59 Curtosis =
Curtosis
+1,97
Asimetra = = -1,59
+1,97

Asimtrica ( <0)
(-)
Leptocrtica (
>0)
Distribuci
n
ANORMA
L

Coeficientes de asimetra y de apuntamiento o curtosis

en diversos tipos de distribuciones

p g in a 105

C a pt u l o 2

Segn las medidas de forma C mo puede


clasificarse esta
variable?Asimetra =
Asimetra

0,04 Curtosis = - = 0,04


Simtrica (
1,37 Curtosis = 0)
Platicrtica
1,37
( <0)

Coeficientes de asimetra y de apuntamiento o curtosis

en diversos tipos de distribuciones

p g in a 106

C a pt u l o 2

Segn las medidas de forma C omo puede


clasificarse esta
variable?

Frecuencia

Asimetra = +
0,135 Curtosis =
+ 0,320
Simtrica ( 0)
Mesocrtica (
Distribuci
0)
n
NORMA
Distribucin
L

Sigue una
Normal?
Peso en adultos (Kg)

Test de Kolmogorov - Smirnov =


0,705

p=
0,702

p g in a 107

C a pt u l o 2

Frecuencia

Segn las medidas de forma C mo puede


clasificarse esta
variable?
Asimetra = +
0,713 Curtosis = +
3,660
Sigue una
Distribucin Normal?

Distribucin
ANORMAL
Asimtrica ( >0)
(+)
Leptocrtica ( >0)

Edad

Test de Kolmogorov - Smirnov =


1,498

p = 0,022

p g in a 108

C a pt u l o 2

Medidas de
posicin:
Cuartiles y
percentiles
6 datos

Mediana
Mediana P
P50
50
6 datos

120
120
110
110
110
95
95
92
92
91
91
90
90
88
88
85
85
76
76
76
73
73
72
72

Cuartil 3 = P75
Cuartil 3 = P75
Cuartil 2 = P50
Cuartil 2 = P50
Cuartil 1 = P25

RIC: Rango intercuartlico

Representacin esquemtica de la Mediana P50


(percentil 50) y de los cuartiles P75 y P25

RIC
RIC

p g in a 109

C a pt u l o 2

Grficos de caja (boxplot)


Bigote superior

=[1,5 * RI ] + P75

80
70

Tercer cuartil

60

P75

Rango intercuartlico (RI)

50

Tercer cuartil Primer cuartil

40
30

Mediana

20
10

Primer cuartil

P50
P25

Consumo de Cigarrillos / da

Bigote inferior

= P25 [1,5 * RI ]

Diagrama de caja (box & whister plot)

p g in a 110

C a pt u l o 2

Grficos de caja (boxplot)


Es legtimo un dato
puntual cuyo valor es
excepcionalmente
grande o pequeo?

220
Bigote superior = 180

Es 220 un valor mal


registrado?
Es el resultado de un
error o accidente en la
experimentacin?

Perifrico o Outlier

P75 = 158
Mediana = 140

RIC = 33

P25 = 125
Bigote inferior
Tensin arterial sistlica (mm Hg)

Diagrama de cajas con un individuo


perifrico
Martnez Gonzlez MA, Jokin de Irala Estvez, Faulin Fajardo FJ. Bioestadstica amigable. Madrid:
Ediciones Daz de Santos; 2001.

p g in a 111

C a pt u l o 2

Tcnicas de deteccin de
O utlier

Variable resultado

outlier?

Variable predictora

p g in a 112

C a pt u l o 2

Tcnicas de deteccin de
O utlier

Variable resultado

C oeficiente de determinacin R 2

Variable predictora

p g in a 113

C a pt u l o 2

Grficos de caja (boxplot)


Sigue el sTfR una Distribucin Normal?
6

Perifrico o Outlier
5

sTfR (mg/L)
Receptor
soluble de la
transferrina en
suero (sTfR)

Tamao muestral N = 121


Distribucin de los valores de sTfR en el grupo de referencia

p g in a 114

C a pt u l o 2

p g in a 115

Grficos de caja (boxplot)

Variable resultado

Mediana
Media

Perifrico o Outlier

Grupos de estudio

C a pt u l o 2

Grficos de
histograma
30

Frecuencia (%)

)
%
(
a
i
c
n
e
u
c
re
F

Asimetra positiva
>0 Mesocrtica
=0

20

Distribuci
n
ANORMA
L

10

Perifricos o Outlier

1,50

2,00 2,25 2,50 2,75 3,00 3,25 3,50 3,75 4,00

4,25 4,50

5,00

5,25
Concentraciones
del Receptor srico de la transferrina (sTfR) (mg/L)
Concentraciones del Receptor srico de la transferrina (sTfR) (mg/L)

Histograma de frecuencias de distribucin del sTfR en una poblacin sana

p g in a 116

C a pt u l o 2

Grficos de
histograma
195
180

Asimetra positiva
>0Mesocrtica
=0

Nmero total de observaciones

165
150
135
120

Distribucin
ANORMAL

105
90
75
60
45
30

Perifricos o
Outlier

15
0

45

55

60

65 70

75

80

85

90

95 100 105 110 115 120

125

130

140

Tensin arterial diastlica (mm Hg)


Histograma de distribucin de la tensin arterial diastlica en el estudio de Venecia N= 1002

p g in a 117

C a pt u l o 2

D istribucin uniforme
discreta
120

Frecuencia

100
80
60
40
20
0
1
2
3
4
5
6

Nmero de caras

p g in a 118

C a pt u l o 2

D istribucin uniforme
discreta
112200
iaia

cc
nn
ee
uu

cc
ee
rr

Frecuencia

1200
110000
1000
8800
800
600
400
6600
200
0

FF

4400

Nmero de
caras

2200

Resultados empricos obtenidos en la realidad


00
despus de lanzar un dado 600 veces
11
22 con ms frecuencia?
Cul es el nmero que sale
33
44

p g in a 119

C a pt u l o 2

D istribucin
normal
200

7 = 3+ 4, 4+ 3, 6+1, 1+ 6, 2+ 5, 5+ 2

180
160

12 = 6 + 6
2=1+1

Frecuencia

140
120
100
80
60
40
20
0

10

11

12

Sumas

Resultados empricos (sumatorio) obtenidos


en la realidad despus de lanzar dos dados 1000
veces

Cul es el nmero que sale con ms


frecuencia?

p g in a 120

C a pt u l o 2

Frecuencia

D istribucin
normal

6
20

10 11 12 13 14 15 16 17 18 19

Sumas

21 22 23 24 25 26 27

28 29

Resultados empricos (sumatorio) obtenidos en la realidad despus de lanzar 5 dados 1000 veces

Cul es el nmero que sale con MENOS


frecuencia?

p g in a 121

C a pt u l o 2

D istribucin
normal
Cambios que se van produciendo en la distribucin de frecuencias
al aumentar el nmero de factores independientes
y las repeticiones de la experiencia

Cambios que se van produciendo en la distribucin de frecuencias al


aumentar el nmero de factores independientes
y las repeticiones de la experiencia

Nmero de factores independientes: Nmero de


dados
Repeticiones de la experiencia: Nmero de tiradas

Martnez Gonzlez MA, Jokin de Irala Estvez, Faulin Fajardo FJ. Bioestadstica amigable. Madrid:
Ediciones Daz de Santos; 2001.

p g in a 122

C a pt u l o 2

La altura de las personas sigue una distribucin


normal?
D e qu depende la altura de una persona?
1. De la altura del padre
2. De la altura de la madre
3. De su nutricin en la infancia y adolescencia
4. De la velocidad de maduracin de su
esqueleto
5. Del aporte que reciba de vitamina D
6. Del aporte de calcio
7. Del ejercicio fsico
8. De sus niveles de hormona del crecimiento
9. Otras variables (algunos de ellas
desconocidas)

Martnez Gonzlez MA, Jokin de Irala Estvez, Faulin Fajardo FJ. Bioestadstica amigable. Madrid:
Ediciones Daz de Santos; 2001.

p g in a 123

C a pt u l o 2

C aractersticas de la distribucin
normal
1.Tener forma de campana.
2. Ser simtrica.
3. Mesocrtica (no excesivamente plana ni muy picuda).
4. Coincidir la media, mediana y moda.
5.Tener aproximadamente el 95% de sus valores dentro del intervalo media
2 desviaciones estndar.

p g in a 124

C a pt u l o 2

D istribucin normal
- El 100% de los valores deben estar por encima y por
debajo de 3 veces la desviacin estndar (s)
(valores entre X 3 s)
- La distribucin debe ser SIMTRICA. La asimetra en
valor absoluto debe ser menor que 2 veces su error
estndar
[Asimetra] < 2 EEasimetra
<2
EE
- La distribucin debe ser MESOCRTICA. La curtois en
valor absoluto debe ser menor que 2 veces su error
estndar [curtois] < 2 EEcurtois < 2 EE

p g in a 125

C a pt u l o 2

Propiedades de la distribucin
normal

f ( x)

1
2 e

2

x
2 2

p g in a 126

C a pt u l o 2

Propiedades de la curva de
Gauss

Media D.E. 68% del rea total


Media 2 D.E. 95% del rea total
Media 3 D.E. 99% del rea
total

p g in a 127

C a pt u l o 2

D istribucin de la t de
Student

Grados de libertad = n - 1

valores " t " : t


)

(x

p g in a 128

C a pt u l o 2

D istribucin de la F de
Snedecor

s12 1
valores " F " : F
2
s22 22

Grados de libertad 1 y 2

1 n1 1 2
n2 1

p g in a 129

C a pt u l o 2

Q u variables biolgicas siguen una distribucin


normal?
En qu circunstancias y en qu poblaciones?
- Colesterol srico poblacin sana
- Consumo de alcohol
- Peso corporal
- Bilirrubina en pacientes cirrticos
- Urea en sangre en poblacin sana
- Urea en sangre en pacientes con insuficiencia
renal
- Troponina I en poblacin sana
- Excrecin urinaria de sodio en orina de 24 horas
Asimtrica > 0 (+)
Leptocrtica > 0
Distribucin ANORMAL
(+)

p g in a 130

C a pt u l o 2

Histograma de la uremia en 504


individuos
Sigue
N ormal?
80 una D istribucin
N = 504
Media
N
= 504(x) = 64,8
Desviacin
(s) = 44,69
Media
(x) = estndar
64,8
Desviacin estndar (s) = 44,69

Frecuencia (%)

60

Criterio de normalidad
X xx
ss << > s
2
22
S (desviacin tpica) < X (media aritmtica) /2 (CV<50%)

40

S (desviacin tpica) > X (media aritmtica)/2 (CV>50%)


44,69 > 64,8/2 (32,4) (CV=69%)

20

0
10
110

30

50

70

90

150

170

Uremia (mg/dl)

190 210

250

Distribucin ANORMAL

p g in a 131

C a pt u l o 2

Histograma de la urea en sangre en 94


pacientes con
insuficiencia renal
Sigue
una distribucin normal?
20

Frecuencia (%)

N = 94
Media (x) = 126
Desviacin estndar (s) = 46,8

xx

ss << > s
2
22
S (desviacin tpica) < X (media aritmtica)/2 (CV<50%)

10

46,8 < 126/2 (63) (CV=37%)

0
20

65
225

105

145

185

Uremia (mg/dl) en 94 pacientes con IR

Distribucin NORMAL

p g in a 132

C a pt u l o 2

Histograma de la urea en sangre en 410


individuos sin
insuficiencia renal
Sigue
una distribucin normal?
140
N = 410
Media (x) = 51
Desviacin estndar (s) = 29,9

Frecuencia absoluta

120
100

xx
ss << >
2
22
X

S (desviacin tpica) > X (media aritmtica)/2 (CV>50%)

80

29,9 > 51/2 (25,5) (CV=59%)

60
40

Distribucin
ANORMAL

20
0
10

45

80

110

145

180

Uremia (mg/dl) en 410 individuos sin IR

p g in a 133

C a pt u l o 2

Medidas de tendencia central


Medidas de dispersin o
variabilidad

Distribuci
n
ANORMA
S (desviacin tpica) < X (media aritmtica)/2 (CV<50%)
L
82.5 < 183.9/2 (91.9) (CV=45%)

Valores entre X 3 s (< 431,4)

40

Frecuencia relativa (%)

Media = 183,9
Desviacin estndar = 82,5
N = 293

30

20

Sigue una Distribucin Normal?


X3s

10
0
20

60

100

140

180 220

260 300

340

380

420

460

Excrecin urinaria de sodio en orina de 24 horas (Na24 h mEq/24)

X
2

> s

p g in a 134

C a pt u l o 2

C ondiciones y pruebas de
normalidad
90

Frecuencia (%)

80
70
60
50
40
30
20

Distribucin ANORMAL

Asimtrica (+) ( > 0)


Leptocrtica (+) ( >
0)
X
2

> s

CV > 50%
Perifricos o
Outlier

10
0

Bilirrubinemia (mg/dl)
Distribucin de frecuencias de los niveles de bilirrubina en pacientes cirrticos.
(Distribucin Anormal con asimetra positiva)

p g in a 135

C a pt u l o 2

C ondiciones y pruebas de
normalidad

Frecuencia

Transformacin logartmica

Logaritmos de las concentraciones de bilirrubina srica


Distribucin de frecuencias de los logaritmos de los
niveles de bilirrubina en pacientes cirrticos.
Con esta transformacin matemtica se corrige la asimetra
positiva anterior

p g in a 136

C a pt u l o 2

Troponina I en poblacin
sana
9 7 .5 % U R L

99% URL

9 7 .5 % U R L

total impreCision (CV%)

FrequenCy oF normal population

99% URL

c T n I g /L
5

0.03
ng/mL

0.06
ng/mL

c T n I g /L

p g in a 137

C a pt u l o 2

La amilasemia sigue una D istribucin


N ormal?

Frecuencia
absoluta

Asimtrica (+) ( > 0)


Leptocrtica (+) ( >
0)
Distribucin ANORMAL
Perifricos o Outlier

Amilasemia
(UI/l)

p g in a 138

p g in a 139

C a pt u l o 2

Estadsticos descriptivos de la
amilasemia
N

Media

Desviacin tpica

Asimetra

Curtosis

EE

549

135,043

Amilasa

90,86

11,359

0,104

170,89

Asimetra

EE

Amilasa

EE
2

11,359

0,104

[Curtosis] > 2 EEcurtois

2 > 2
EE

Curtosis

/ EE
1

109,22

170,89

Distribucin ANORMAL

[Asimetra] > 2 EEasimetra 2 > 2


EE

Distribucin ANORMAL
2

0,208

EE
2

0,208

/ EE
2

821,6

C a pt u l o 2

p g in a 140

Test de
normalidad
- Test de Kolmogoroff-Smirnoff-Lilliefors (test ms potente para muestra > 30 casos).
- Test de Shapiro-Wilk (la prueba ms potente para muestra < 30 casos).
- Test de DAgostino.
- Test de Anderson-Darling.
- Test chi-cuadrado de bondad de ajuste.
- Test de Contraste de asimetra: Sirve para contrastar la hiptesis de que el coeficiente
de
asimetra de Fisher 1 es cero. Propiedad que verifica la distribucin normal (
=
1
0).
- Test de Curtosis: Contraste de apuntamiento, sirve para contrastar la hiptesis de
que
el coeficiente 2 curtosis de Fisher (coeficiente de apuntamiento) es cero. Propiedad
que
verifica
la distribucin normal (2 =
0).
- Test de JarqueBera.

C a pt u l o 2

Test de Kolmogorov-Smirnov
-Es el test de normalidad ms difundido en los programas estadsticos.
-Otorga un MENOR PESO a las observaciones extremas (perifricos o OUTLIER) y por
ello es menos tolerante a las desviaciones que normalmente se producen en estos
tramos distales.
- Cuando se dispone de un nmero suficiente de datos (amplio volumen muestral), los
dems tests de normalidad sern capaces de detectar diferencias pequeas an
cuando estas no sean relevantes para la mayor parte de los objetivos, por eso se
recomienda el test de Kolmogorov-Smirnov (se considera uno de los tests ms
potentes para muestras mayores de 30 casos).
- Se basa en la idea de comparar la funcin de distribucin acumulada de los datos
observados con la de una DISTRIBUCIN NORMAL, midiendo la mxima distancia
entre ambas curvas.
- Como en todos los tests de contraste de hiptesis, la hiptesis nula (Ho ) se
rechazael valor del estadstico calculado supera un cierto valor crtico
cuando
(tabulado) que se
obtiene de una tabla de clculo de probabilidades.
- p > 0,05 se acepta la H o (se cumple la normalidad), se pueden usar test paramtricos.
- p < 0,05 se acepta la H a (no se cumple la normalidad), se deben usar test NO paramtricos.

p g in a 141

C a pt u l o 2

Pregunta de investigacin
Los valores analticos de ambas tcnicas siguen
una
distribucin normal?
Objetivo:
Evaluacin de la amilasa tcnicaAmilasa
1 frente
a la tcnica
Amilasa (srica)
(srica)
2. Tcnica 1
Tcnica 2

Cul es el test estadstico ms


acertado? Test de Kolmogorov-Smirnov

p g in a 142

C a pt u l o 2

Test de KolmogorovSmirnov
Resultados del test
N
Parmetros normales

Diferencias ms extremas

Z de Kolmogorov-Smirnov
Significacin bilateral

Media
Desviacin tpica

Tcnica 1
548
91,03
135,11

Tcnica 2
548
79,29
120,52

Absoluta
Positiva

0,289
0,289

0,301
0,301

Negativa

- 0,280

- 0,299

6,763
0,000

7,034
0,000

Como la significacin p < 0,05 se rechaza la hiptesis nula Ho (normalidad) y se acepta


la
hiptesis
alternativa Ha (no se cumple la normalidad), se deben usar test NO
paramtricos.

p g in a 143

C a pt u l o 2

Test de Jarque-Bera
- El test de Jarque-Bera se realiza para
H0: 1 = 2 = 0, lo que significa simetra y curtsis exactas ( =
contrastar:
0)1: 1 0 o 2 0 lo que significa que existe curtsis ( 0) o
H
asimetra.
- La consecuencia es que si existe asimetra o curtsis falla la
normalidad.
H0: p > 0,05
simetra y curtsis exactas ( =
test
0)1: p < 0,05
curtsis ( 0) o asimetra
test paramtricos
NO
H
paramtricos
- Al contrastarlo conjuntamente (curtsis y asimetra) exige un fallo mayor de alguna
de ellas o de ambas para rechazarse.
n

i1

3
i

i1

R
4

2
2
JB t1 2 t 2 1 2
2
T
6 24

p g in a 144

C a pt u l o 2

Test de JarqueBera
Forma terica de
la normal

Asimetra
Asimetra
negativa:
positiva

casi
mediana mediana
mayor
nula:
la media
que
menor
que la

TEST de normalidad de
JARQUE-BERA

media

Estadstico 2 = 1.54
valor de p = 0.463 (p >
0,05)

Se acepta la H0
H0: = = 0, lo que
significa simetra y
terica de
curtsisForma
exactas.
la
distribucin
DISTRIBUCIN NORMAL

Curtsis negativa:
mas apuntamiento que
la normal

emprica

p g in a 145

C a pt u l o 2

Estadstica
descriptiva
TIPO DE DISTRIBUCIN

SIMTRICA

ASIMTRICA

ndice de tendencia central

Media

Mediana

ndice de dispersin

EEM

Rango intercuartil

Peso de valores extremos


(outlier o perifricos)

Importante

Escaso o nulo

Fiabilidad del estadstico

Mucha

Poca

p g in a 146

C a pt u l o 2

Pruebas paramtricas:
Requisitos
-Las variables cuantitativas tienen que ser continuas.
- Los datos siguen una distribucin normal.
- Los datos numricos se expresan con la media y la desviacin estndar o el EEM
- Homogeneidad de las varianzas muestrales.
- Tamao muestral > 30.
-Presentan un mayor poder de contraste que los tests no paramtricos, y pueden
analizar interacciones entre variables predictoras.
-Cuando se dan las condiciones de aplicacin, las pruebas paramtricas tienen ms
potencia que las no paramtricas, pero, cuando esto no es as, el riesgo alfa puede
ser mayor que el especificado de antemano.

p g in a 147

C a pt u l o 2

Pruebas N O paramtricas:
Requisitos
-Las variables cuantitativas pueden ser ordinales o discretas.
-Los datos siguen una distribucin libre (no necesariamente normal), uno de los
grupos puede tener una distribucin normal mientras que el otro no.
- Los datos numricos se expresan con la mediana y los intervalos intercuartlicos.
- Heterogeneidad de las varianzas muestrales (en uno o ms de un grupo).
- Tamao muestral < 30.
-Presentan un menor poder estadstico que los tests paramtricos.
-Trabajan con la simple ordenacin y recuento (asignando rankings) a los valores de
la variable sin importar el tipo distribucin.

p g in a 148

C a pt u l o 2

Principales pruebas N O
paramtricas
- Chi cuadrado de Pearson.
- Test exacto de Fisher.
- Chi cuadrado de Mc
Nemar.
- Q de Cochran.
- U de Mann Whitney.
- Wilcoxon.
- Kruskall Wallis.
- Friedman.

http://www.slideshare.net/freddygarcia/pruebas-no-parametricas-presentation

p g in a 149

C a pt u l o 2

Pruebas robustas:
C aractersticas
-Otra alternativa a los mtodos paramtricos; la utilizacin de los llamados mtodos
robustos. Estos mtodos son menos potentes que los paramtricos, pero se
muestran superiores a los no paramtricos clsicos.
- La principal de sus ventajas es que no se afectan por la existencia de datos
anmalos.
-Los mtodos robustos pueden ser de utilidad para la realizacin de inferencias sin
tener que depurar los datos extremos.
-Como parmetros de localizacin (posicin central) se recomienda en primer lugar,
el estimador de Huber y, en segundo lugar, la media a-recortada muestral (con a =
0,2).
- Como medida de dispersin se utiliza la desviacin absoluta mediana
estandarizada.
- Mtodos robustos para el contraste de hiptesis con los parmetros antes referidos,
se
pueden construir intervalos de confianza robustos y realizar contrastes de hiptesis.

p g in a 150

C a pt u l o 2

p g in a 151

Mtodos robustos para el clculo de medidas de


posicin:
Medidas robustas de tendencia central
Media -winsorizada muestral
Se sustituye un determinado porcentaje, , (20% Generalmente) de valores extremos a
cada lado de la muestra por el valor ms prximo no sustituido.
Media -recortada muestral
Se eliminan las k observaciones extremas de cada lado en lugar de
winsorizarlas, calculando la media aritmtica de las observaciones restantes.
Mediana muestral
Divide la distribucin en dos partes con el mismo nmero de elementos.
Estimador de Huber
Se encuentra dentro de los denominados M-estimadores, que generalizan al estimador
de mxima verosimilitud con buenas propiedades de robustez y eficiencia. En este caso
se descartan las observaciones que sean mayores (o menores) a una constante.

C a pt u l o 2

Mtodos robustos para el clculo de medidas de


dispersin:
Medidas robustas de dispersin
Desviacin absoluta mediana estandarizada
Es la mediana de las desviaciones absolutas a la mediana.
Cuasi desviacin tpica -winsorizada muestral
En la que se sustituye un determinado porcentaje de valores extremos a cada lado de
la muestra por el valor ms prximo no sustituido.

p g in a 152

C a pt u l o 2

p g in a 153

Pruebas Robustas de contraste de


hiptesis
-Mtodos robustos para el contraste de hiptesis con los parmetros antes referidos, se
pueden construir intervalos de confianza robustos y realizar contrastes de hiptesis.
-El test de Yuen es una alternativa a las pruebas de la t de Student y U de MannWhitney para tamaos muestrales pequeos y distribuciones no normales.
-Para comparar ms de dos medias, cuando no puede utilizarse el ANOVA clsico,
deberamos recurrir a los clsicos no paramtricos de Kruskal-Wallis o, mejor, a
mtodos robustos como la generalizacin robusta del test Welch, que utiliza medias arecortadas muestrales.
-Deberamos recurrir a mtodos no paramtricos (Spearman) o, mejor, a mtodos
robustos como el coeficiente de porcentaje ajustado poblacional y el estimador robusto de
regresin medio biponderado.

http://www.slideshare.net/freddygarcia/pruebas-no-parametricas-presentation

C a pt u l o 2

Seleccin de la
muestra
Poblaci
n

Seleccin
aleatoria

Muestr
a

TCNICAS DE
MUESTREO
Parmetr
o Media
poblacional

ERROR ALEATORIO
Inferencia

Estructura del proceso de la INFERENCIA


ESTADSTICA

Estadstico X
Media
muestral

p g in a 154

C a pt u l o 2

Prueba de
rachas
-Sirve para determinar si una muestra de observaciones es o no aleatoria, es decir, si
las observaciones de una determinada secuencia son independientes entre si.
-En una serie temporal, las observaciones no son aleatorias: lo que ocurre con una
observacin cualquiera depende, de las caractersticas de una observacin
anterior.
-En una muestra aleatoria, lo que ocurre con una observacin cualquiera sea
independiente de las caractersticas de la(s) observacion(es) anterior(es).
-Esta prueba permite determinar si el nmero de rachas (R), observado en una
determinada muestra de tamao n es lo suficientemente grande o lo suficientemente
pequea como para poder rechazar la hiptesis de independencia-aleatoriedad de
las observaciones.

p g in a 155

C a pt u l o 2

Prueba de
rachas
El concepto de RACHA hace referencia a una secuencia de observaciones de
un mismo tipo.
Supongamos que lanzamos una moneda al aire 10 veces seguidas, repitiendo
la experiencia en tres ocasiones
Cmo garantizamos que el resultado obtenido es ALEATORIO?

p g in a 156

C a pt u l o 2

Prueba de rachas
1 EXPERIENCIA: Tenemos 5 RACHAS: CCC, X,CC, XXX,
C

C C
C

C C

2 EXPERIENCIA: Tenemos 2 RACHAS: CCCCC, XXXXX


3 EXPERIENCIA: Tenemos 10 RACHAS: CX, CX, CX, CX, CX

C
C

C C C C
C
C

En cul de las 3 experiencias podemos garantizar que el resultado obtenido


es ALEATORIO?

p g in a 157

C a pt u l o 2

Prueba de
rachas

Prueba de RACHAS

EXP 1

EXP 2

EXP 3

Valor de prueba

Casos < Valor de prueba

Casos Valor de prueba

Casos en total

10

10

10

Nmero total de rachas

10

- 0,211

- 2,348

2,348

Significacin bilateral

0,833

0,019

0,019

Como el nivel de significacin es mayor a 0,05 en la experiencia 1,


podemos
aceptar la hiptesis de independencia (Ho ) y concluir que la secuencia
de
observaciones estudiada es
ALEATORIA.
Como el nivel de significacin es inferior a 0,05 en la experiencia 2 y 3,
podemos rechazar la hiptesis de independencia y concluir que la secuencia
de
observaciones estudiada NO es aleatoria a
(H ).

p g in a 158

C a pt u l o 2

Pregunta de investigacin
Los valores analticos de ambas tcnicas son
aleatorias?
Objetivo:
de la amilasa tcnicaAmilasa
1 frente
a la tcnica 2.
AmilasaEvaluacin
(srica)
(srica)
Tcnica 1

Cul es el test estadstico ms


acertado? Prueba de RACHAS

Tcnica 2

p g in a 159

C a pt u l o 2

Prueba de
rachas
Valor de prueba (mediana)
Casos < Valor de prueba
Casos Valor de prueba
Casos en total
Nmero total de rachas
Z
Significacin bilateral

Tcnica 1

Tcnica 2

70
267
282
549
259
- 1,393
0,164

61
267
281
549
263
- 1,012
0,312

Como el nivel de significacin es mayor a 0,05 en ambas tcnicas,


podemos
aceptar la hiptesis de independencia (Ho ) y concluir que la secuencia
de
observaciones estudiada es
ALEATORIA.

p g in a 160

C a pt u l o 3

C aptulo 3
Publicacin Bioestadstica: Tamao muestral, Error y
.

D r. Jacobo D az Portillo
Coordinador de Formacin Continuada
Hospital Universitario de Ceuta

p g in a 161

C a pt u l o 3

Materiales y mtodos
Estructura
1. Tipo de diseo (estudio).
2. Sujetos incluidos (criterios de seleccin de la muestra).
3. Fuentes de informacin.
4. Descripcin de la intervencin y definicin del punto final de la
investigacin (estudios experimentales).
5. Instrumentos y procedimientos de medida (cuestionarios).
6. Definicin de las variables y covariables incluidas en el estudio (factor
de
estudio y criterio de evaluacin).
7. Limitaciones y consideraciones ticas de la investigacin.
8. Pruebas estadsticas a utilizar (programa estadstico).

p g in a 162

C a pt u l o 3

Materiales
Pacientes
1. Criterios de seleccin de la muestra (inclusin y
exclusin).
2. Procedencia.
3. Tcnica de reclutamiento utilizada.
4. Tiempo empleado para reunir a todos los participantes.
5. Principales caractersticas de los pacientes.
- Edad.
- Sexo.
- Procedencia.
- Gravedad.
- Aos de evolucin de la enfermedad.
- Patologas asociadas...
6. Clculo de tamao muestral.

p g in a 163

C a pt u l o 3

Seleccin de la
muestra
Poblaci
n

Seleccin
aleatoria

Muestr
a

TCNICAS DE
MUESTREO
Parmetr
o Media
poblacional

ERROR ALEATORIO
Inferencia

Estructura del proceso de la INFERENCIA


ESTADSTICA

Estadstico X
Media
muestral

p g in a 164

C a pt u l o 3

INFERENCIA ESTADSTICA: Es el conjunto de procedimientos estadsticos


que permiten pasar de lo particular (la muestra) a lo general (la poblacin).
TCNICAS DE MUESTREO: Es el conjunto de procedimientos que permiten
elegir muestras que sean representativas de la poblacin (de todos los individuos
de la poblacin).
ERROR ALEATORIO: Es el error que se comete al estudiar un problema en base a
una muestra elegida al azar (es siempre un error inevitable). La imposibilidad de
estudiar a todos los individuos de la poblacin obliga al investigador a trabajar con
muestras, lo que supone siempre cometer un error aleatorio.

p g in a 165

C a pt u l o 3

Muestra de la
poblacin
Poblacin diana
Poblacin en estudio
Muestra

p g in a 166

C a pt u l o 3

Proceso de seleccin de individuos para el


estudio

Poblacin diana: Conjunto de individuos al que hace referencia la pregunta principal


del objetivo del estudio. Es la poblacin a la que se deseara generalizar los
resultados obtenidos. Se define principalmente sobre la base de caractersticas
demogrficas y clnicas generales.
Criterios de seleccin

Validez externa

Poblacin de estudio: Es un subconjunto de la poblacin diana definida por


criterios de seleccin establecidos en un protocolo. Esta poblacin presenta
determinadas caractersticas geogrficas y temporales que la hacen accesible al
estudio.
Muestreo
Validez interna
Muestra: Es un conjunto de individuos que pueden ser estudiados en el momento
de
realizar el estudio y que cumplen con los criterios definidos en el protocolo de
estudio.

p g in a 167

C a pt u l o 3

Poblacin diana: Pacientes con HTA esencial del rea sanitaria de


Ceuta.
C riterios de
seleccin

Validez
externa

Poblacin de estudio: Pacientes con HTA esencial leve-moderada de edad


comprendida 40-60 aos del rea sanitaria de Ceuta.

Muestreo
Validez interna
Muestra: Pacientes con HTA esencial leve-moderada de edad comprendida 40-60
aos
registrados en los ficheros del Centro de Salud 1 que incluyen la edad y el sexo.

p g in a 168

C a pt u l o 3

p g in a 169

Poblacin diana: Poblacin peditrica de


Ceuta.
C riterios de
seleccin

Validez
externa?

Poblacin de estudio: Nios que acuden a la consulta de Atencin al nio sano de


Atencin Primaria de edad comprendida 12-14 aos.
Muestre
o

Validez
interna?

Muestra: Nios que acuden al Programa de Atencin al nio sano de los centros de Salud
de Atencin Primaria de edades comprendida entre 12-14 aos que sus madres
demandan la realizacin de una analtica rutinaria completa.

C a pt u l o 3

p g in a 170

Poblacin diana: Poblacin gestante de


Ceuta.
C riterios de
seleccin

Validez
externa

Poblacin de estudio: Mujeres gestantes del rea sanitaria que acuden a la consulta
de Obstetricia del INGESA de Ceuta.

Muestreo
Validez interna
Muestra: Mujeres gestantes del rea sanitaria de Ceuta que acuden a la consulta de
Obstetricia del INGESA embarazo controlado- con cartilla de embarazo completa, que
incluyen las variables predictoras (etnia, nivel cultural, edad, etc) y la variable resultado
(determinacin de anticuerpos frente al virus de la rubeola en el primer trimestre)
incluidas en el estudio.

C a pt u l o 3

p g in a 171

Proceso de seleccin de individuos para el


estudio

Poblacin diana: Poblacin inmigrante de


Ceuta.
C riterios de
seleccin

Validez
externa

Poblacin de estudio: Individuos inmigrantes residentes en el campamento de


Calamocarro de Ceuta atendidos por el personal sanitario.

Muestreo
interna

Validez

Muestra: Individuos inmigrantes residentes en el momento del estudio en el


campamento de Calamocarro de Ceuta, atendidos por el personal sanitario, y en cuya
ficha se haban recogido las variables predictoras (filiacin, pas de origen, edad), as
como el resultado de todas las pruebas complementarias (incluido la Variable resultado:
prueba de la tuberculina) incluidas en el estudio.

C a pt u l o 3

Material
Pacientes
- Criterios de seleccin de la muestra (inclusin y
exclusin).
- Procedencia.
- Tcnica de reclutamiento utilizada.
- Tiempo empleado para reunir a todos los participantes.
- Principales caractersticas de los pacientes.
Edad
.
Sexo.
Procedencia
. Gravedad.
Aos de evolucin de la
enfermedad. Patologas asociadas...
- Clculo de tamao muestral.

p g in a 172

C a pt u l o 3

p g in a 173

Qu error alfa y que error beta estoy dispuesto a asumir?


Cuntos pacientes debo elegir para que mi estudio sea
correcto?

C a pt u l o 3

C oncepto e importancia
error alfa
() y error beta ()

y utilidad prctica del

- Determinacin del tamao muestral


- Estudios para determinar parmetros poblacionales (slo error
alfa) Estimacin de una proporcin
Estimacin de una media
- Estudios para contraste de hiptesis (error alfa y
beta) Comparacin de dos proporciones
Comparacin de dos medias
Correlacin entre dos variables cuantitativas
- Rentabilidad diagnstico de una prueba-test
- Exactitud
Sensibilidad
Especificidad
- Seguridad
Valor predictivo positivo (VPP)
Valor predictivo negativo
(VPN).

p g in a 174

C a pt u l o 3

Riesgos al tomar decisiones


Ejemplo: Se juzga a un individuo por la presunta comisin de un
delito
Los datos pueden refutarla
H0: Hiptesis nula
- Es inocente (no se
encuentran indicios de
culpabilidad)

H1: Hiptesis alternativa


- Es culpable (se
encuentran indicios de
culpabilidad)

Es la hiptesis que se acepta si


las pruebas no indican lo contrario
Rechazarla por error tiene graves
consecuencias (condenar a un
inocente)

No debera ser aceptada sin


una gran evidencia a favor.
Rechazarla por error tiene
consecuencias consideradas
menos graves que la
anterior (liberar a un
delincuente)

p g in a 175

C a pt u l o 3

Tipos de error al tomar una


decisin
Tipos de error al tomar una decisin

Veredicto
Resultado de la prueba
Sentencia del juez

Realidad

Culpable

Inocente

Culpable
Hiptesis
ALTERNATIVA
aceptada
Ha

OK
No error
VP

Error
Muy grave
FP
Encarcela
r a un
inocente

Inocente
Hiptesis NULA
aceptada
Ho

Error
FN
Menos grave: Liberar un
culpable

OK
No error
VN

p g in a 176

C a pt u l o 3

Hiptesis nula (Ho): No existen diferencias significativas en la eficacia clnica de dos


frmacos A y B (A=B)
Hiptesis alternativa (Ha): Existen diferencias en la eficacia clnica de dos frmacos A y
B (A B)
A> B A< B
Tipos de ERROR ALEATORIO en una prueba estadstica de contraste de hiptesis

AB
H
a
A=B
Ho

VP
FN

A B
Ha

FP

A=B
Ho

VN

Error tipo I (alfa): El investigador rechaza la Ho siendo esta verdadera en la poblacin


(el investigador concluye que existe diferencia cuando en realidad no la hay).
Error tipo II (beta): El investigador no rechaza la Ho siendo esta falsa en la poblacin
(el investigador concluye que ha sido incapaz de encontrar una diferencia que existe
en la realidad).

p g in a 177

C a pt u l o 3

Tipos de error al contrastar


hiptesis
H0 Falsa
A B

Realidad
H0 Cierta
A=B

Rechazo H0
Acepto H1 A
B

Correcto
El tratamiento nuevo B tiene
mayor efecto que A y el
experimento lo confirma.

Error de tipo I
El tratamiento nuevo B realmente no es
mejor que el antiguo A pero se decide
errneamente que s.
Probabilidad

VP
FP
No Rechazo H0
Acepto H0
A=B

Error de tipo II
El tratamiento nuevo B
realmente si tiene mayor efecto
que el antiguo A pero no lo
percibimos en nuestro estudio.
Probabilidad
FN

Correcto
El tratamiento nuevo B no tiene mayor
efecto que el antiguo A y as se decide.
VN

p g in a 178

C a pt u l o 3

Tipos de error al contrastar


hiptesis

Rechazo H0
Acepto H1 A
B
Encuentro
pruebas (+)
p < 0,05

Realidad

H0 Falsa
A B
Correcto
Se rechaza la hiptesis nula (H0)
los (se dice que los resultados son
estadsticamente significativos y
equivocamos.
es verdad.

H0 Cierta
A=B
Error de tipo I
Se rechaza la H0 (se dice que
resultados son estadsticamente
significativos) pero nos

VP

FP

Probabilidad

Error

ALFA
No Rechazo H0
Acepto H0
A=B
No encuentro pruebas (-)
p > 0,05

Error de tipo II
Correcto
No se rechaza la hiptesis
No se rechaza la hiptesis nula H0 (el
nula (H0) (se dice que no hay
azar puede explicar las diferencias
diferencias significativas) pero
observadas en los datos), y es
verdad. nos equivocamos. Probabilidad
VN
FN

Error BETA

p g in a 179

C a pt u l o 3

Tipos de error al contrastar


hiptesis
Ha

p g in a 180

Realidad
H0

Ha
Encuentro pruebas (+)
p < 0,05

Acierto
(1- )
POTENCIA
EST

ADSTICA

Error de tipo I

Error ALFA

FP

VP
Error de tipo II
H0
No encuentro pruebas (-)
p > 0,05
FN

Error BETA

Acierto
(1- )
VN

POTENCIA ESTADSTICA: Es la capacidad del estudio para detectar una diferencia si sta existe realmente.

C a pt u l o 3

Tipos de error al contrastar


hiptesis
Ha

Realidad
H0

Ha
Encuentro pruebas (+)
p < 0,05

Acierto
(1- )
POTENCIA
EST

ADSTICA

Error de tipo I

Error ALFA

FP

VP
Error de tipo II
H0
No encuentro pruebas (-)
p > 0,05
FN

Error BETA

Acierto
(1- )
VN

NIVEL DE CONFIANZA (1 - ): Es la probabilidad a priori de que el intervalo de confianza (IC) a calcular


contenga al verdadero valor del parmetro

p g in a 181

C a pt u l o 3

El error tipo I (error


alfa)
- En nuestro estudio se concluye diciendo que hay diferencias
cuando realmente no las hay.
- Se detecta significacin estadstica (p < 0,05) y se rechaza H0 , cuando
realidad
sta es
en
verdadera.
- La probabilidad de cometer este error es lo que mide la
p.
FALSOS POSITIVOS

p g in a 182

C a pt u l o 3

El error tipo II (error


beta)
- Cuando los resultados de nuestro estudio NO son significativos
(p>0,05) se concluye diciendo que no hay diferencias (estudio
negativo) cuando
realmente SI las hay, pero nosotros no hemos sido capaces de
detectarlas
- La probabilidad de tomar esta decisin (y aceptar la H0)
siendo incorrecta se llama error beta.
- En realidad existen diferencias pero el estudio ha sido incapaz
de detectarlas!
- Son los falsos negativos.
FALSOS NEGATIVOS

p g in a 183

C a pt u l o 3

Recomendaciones para disminuir el error alfa ()


tipo I
- Disponer de una teora que gue la investigacin, evitando el salir de
pesca
con el ordenador buscando asociaciones entre variables.
-Disminuir el nmero de test estadsticos llevados a cabo en el estudio.
- Depurar la base de datos para evitar errores de valores extremos que
puedan producir hallazgos significativos.
- Utilizar valores de alfa ms reducidos (0,01 0,001).
-Reproducir el estudio. Si al reproducir el estudio se obtienen resultados
similares, estaremos ms seguros de no estar cometiendo el error de tipo
Pita Fernndez S, Prtega Daz S. Significancia estadstica y relevancia clnica.
I.
Cad Aten Primaria 2001; 8: 191-195.

p g in a 184

C a pt u l o 3

Recomendaciones para disminuir el error beta ()


tipo II
- Incrementar el tamao de la muestra.
- Estimar el poder estadstico del estudio (1 ).
- Incrementar el tamao del efecto a detectar.
- Incrementar el valor de alfa.
- Utilizar test paramtricos (ms potentes) en lugar de test no
paramtricos

Pita Fernndez S, Prtega Daz S. Significancia estadstica y relevancia clnica.


Cad Aten Primaria 2001; 8: 191-195.

p g in a 185

C a pt u l o 3

Importancia del error alfa y error beta


- Determinacin del tamao
muestral
- Estudios para determinar
parmetros poblacionales (slo
error alfa)
- Estimacin de una proporcin.
- Estimacin de una media.
- Estudios para contraste de
hiptesis (error alfa y beta).
- Comparacin de dos
proporciones.
- Comparacin de dos medias.
- Correlacin entre dos
variables cuantitativas.
- Rentabilidad diagnstico de una
prueba-test.
- Sensibilidad.

p g in a 186

C a pt u l o 3

p g in a 187

C lculo del tamao muestral de un


parmetro
1. VARIABILIDAD del parmetro que se desea estimar
- Variables cuantitativas: varianza
- Variables cualitativas: 1-P
1. Variabilidad del parmetro
Cuando esta variabilidad es desconocida
-.Bibliografa
-.Datos propios previos
-.Estudio piloto

2. PRECISIN (i) con la que se desea obtener la estimacin (amplitud deseada del IC).
Se fija i previo al estudio. Cuanto ms precisin ms estrecho ser el IC, y mayor deber
ser el volumen muestral.
2. Precisin

3. NIVEL DE CONFIANZA deseado (generalmente 95%), que corresponde a un valor de


alfa de 0,05. Este valor indica el grado de confianza de que el verdadero valor
poblacional
desconocido del parmetro en estudio se site en el intervalo obtenido.
3. Nivel de confianza 95%

C a pt u l o 3

Frmulas para el clculo del nmero de sujetos necesarios para la realizacin de un estudio
cuyo objetivo es la estimacin de un parmetro
Estimacin de una variable CUALITATIVA (proporcin - prevalencia)

N=

Z2 * P * (1- P)
i2

Estimacin de una variable CUANTITATIVA (MEDIA)

Z2 * s2
N=
i2
N = nmero de sujetos necesarios
Z 2 = Valor del estadstico Z correspondiente al riesgo alfa fijado ( = 0,05)
P = Valor de la proporcin (prevalencia) que se supone que existe en la poblacin
S2 = Varianza de la distribucin de la variable cuantitativa que se supone que existe en la poblacin
i: Precisin con que se desea estimar el parmetro

p g in a 188

C a pt u l o 3

Influencia del valor supuesto de la proporcin (P) o prevalencia (variabilidad del


Parmetro que se desea estimar sobre el nmero de sujetos necesarios N (tamao
muestral mnimo necesario).
INFLUENCIA DE LA PROPORCIN
1. Variabilidad del parmetro

2. Precisin (i = 0,05)

3. Nivel de confianza 95% = 0,05

Prevalencia

Precisin (i = cte)

Tamao muestral (N)

0,10

0,05 (5%)

138

0,20

0,05 (5%)

246

0,30

0,05 (5%)

323

i = Z P (1 P) / N

Todos
con(5%)
un nivel de confianza del 95%
0,40 los clculos han sido realizados
0,05
369
P = valor supuesto de la proporcin que se desea estimar.
i = precisin de la estimacin, que corresponde a la mitad del intervalo de confianza (P i)
0,05
(5%) la estimacin de P con384
N0,50
= nmero de sujetos necesarios para
realizar
la precisin deseada y el 95%
de confianza
Postura de mxima indeterminacin

p g in a 189

C a pt u l o 3

p g in a 190

Influencia de la precisin (i) de la estimacin sobre el nmero de sujetos necesarios


N
(tamao muestral mnimo necesario).

1. Variabilidad del
(P=cte)
2. Precisin (i = 0,05)
INFLUENCIA
DEparmetro
LA PRECISIN

3. Nivel de confianza 95% = 0,05

Prevalencia

Precisin (i = cte)

Tamao muestral

0,40

0,1 (10%)

(N) 92

0,40

0,075 (7,5%

164

0,40

0,050 (5%)

369

0,40

0,025 (2,5%)

1475

0,40

0,01 (1%)

9220

i = Z P (1 P) / N
Todos los clculos han sido realizados con un nivel de confianza del 95% ( = 0,05)
P = valor supuesto de la proporcin que se desea estimar.
i = precisin de la estimacin, que corresponde a la mitad del intervalo de confianza (P i)
N = nmero de sujetos necesarios para realizar la estimacin de P con la precisin deseada y el 95%
de confianza

C a pt u l o 3

Cul es el tamao muestral necesario para conocer la


prevalencia de inmunizacin toxoplsmica en la
ciudad de Ceuta?
Postura de mxima
indeterminacin

Precisin 5%
i = 0,05
Tamao muestral necesario (n) para conocer la prevalencia
de inmunizacin frente a Toxoplasma gondii en la poblacin
de la ciudad de Ceuta

p g in a 191

C a pt u l o 3

Variabilidad
Precisin 5%
i = 0,05

i = 0,05
Precisin 5%

Nivel de confianza
95%
= 0,05

Tamao muestral necesario (n) para conocer la prevalencia


de inmunizacin frente a Toxoplasma gondii en la poblacin
de la ciudad de Ceuta

p g in a 192

C a pt u l o 3

Cul es el tamao muestral necesario para conocer la


prevalencia de rasgo beta-talasmico en la ciudad
de Ceuta?

i = 0,005
Precisin 0,5%

p g in a 193

C a pt u l o 3

Variabilidad
Precisin i = 0,5%

Nivel de confianza
95%
= 0,05

i = 0,005
Precisin 0,5%

p g in a 194

C a pt u l o 3

p g in a 195

Cuntas personas tenemos que estudiar para


conocer la prevalencia de diabetes tipo 2 en el
distrito de salud X de C euta que atiende a una
poblacin
de 15.000
habitantes?
1. Proporcin
esperada: asumamos
que puede ser prxima al 5%
2.

Precisin (i)(d): 3%

3.

Nivel del confianza (seguridad): 95%

n = 203 personas del distrito de salud X


4.

Tamao de la poblacin de origen (poblacin atendida por el distrito de salud X)

n = 200 personas del distrito de salud X


Pita Fernndez S. Determinacin del
tamao muestral. Cad Aten Primaria 1996; 3: 138-144.

C a pt u l o 3

C lculo del tamao muestral para contraste de


hiptesis

1.Magnitud de la diferencia a detectar que tenga inters clnico.


- Comparacin de dos medias.
- Comparacin de dos proporciones: P1 y P2.

2.Aproximacin de los parmetros de la variable que se estudia (bibliografa o


estudios previos).
3.NIVEL DE CONFIANZA deseado o seguridad del estudio (generalmente 95%), que
corresponde a un valor de de 0,05 (riesgo de cometer un error alfa).
4. PODER ESTADSTICO (1- )(riesgo de cometer un error ).
5. Definir si la hiptesis va a ser unilateral o bilateral.
- Bilateral: cualquiera de los dos parmetros a comparar puede ser mayor o
menor
que el otro (no hay direccin) (A B).
- Unilateral: cuando se considera que uno debe ser mayor que el otro
(direccin de
las diferencias) (A < B).

p g in a 196

C a pt u l o 3

Prueba UNILATERAL: Se utiliza cuando se pretende determinar si el frmaco nuevo


B es ms eficaz que el clsico A, es decir, tan slo interesa una de las direcciones de
la comparacin (B > A), interesa demostrar que B sea ms efectivo que A.
DISTRIBUCIN
DISTRIBUCI
N NORMAL
NORMAL
TIPIFICADA
(Z) normal
TIPIFICADA
(Z)
Valores
de la distribucin

Una
Una sola
sola cola
cola

Z 1-

Ho: o
Ha: o >

Z 1- = 0,05

Ho: o

tipificada (Z) correspondientes al


valor=del0,05
5% en las pruebas
estadsticas unilaterales y bilaterales.

B>A

Las pruebas unilaterales especifica


la direccin de la diferencia.
Las pruebas bilaterales NO especifica
la direccin de la diferencia.

Valores de la distribucin normal

Z = 1.645

Ha: o >

H
o: o = (Z) correspondientes al
tipificada
Ha: o

AB

valor del 5% en las pruebas

1.645

Z = - 1.96

Dos colas

B>A

Z 1- /2

Z=

Z = 1.96

estadsticas unilaterales y bilaterales.


Las pruebas unilaterales especifica

Dos colas

de la diferencia. determinar si dos frmacos A y


Prueba BILATERAL: Se utiliza cuandola direccin
se pretende
Las pruebas bilaterales NO especifica
B
la direccin de la diferencia.
Ho: o
difieren en su
efectividad clnica (A B).
Z 1- /2
=
Ha: o

p g in a 197

C a pt u l o 3

Pruebas de contraste
unilateral:
Riesgo en la toma de decisiones
Se utiliza cuando se pretende
determinar si el frmaco
nuevo B es ms eficaz que el
clsico A, es decir, tan solo
interesa una de las direcciones

Ho

Ha

de la comparacin (B > A)

Una sola
cola B >
A
Riesgo alfa
= 0,05

Riesgo beta
error

1 - = Nivel de confianza
Probabilidad de Ho cuando esta es cierta

Z = 1,645

1-

= Potencia estadstica

Probabilidad de Ha cuando esta es cierta

p g in a 198

C a pt u l o 3

Pruebas de contraste
bilateral:
RiesgoSeenutiliza
la toma
de
cuando se pretende determinar si dos frmacos A y B
Se utiliza cuando se pretende determinar si dos frmacos A y B
decisiones
difieren
su
difieren
en
su eficacia
eficacia en
clnica
(A clnica (A B)
B) beta
Riesgo

Dos colas
Dos colas

Riesgo
error

beta
error

B<
BB<<AA
A
/2 = 0,025
/2>= A
0,025
/2 = 0,025
Z = - 1.96
0,025

Riesgo
Riesgo
beta
beta
error
error

B>A

B >B
A

/2 = 0,025
/2 =

0,025
/2 =
Z = 1.96

alfa = 0,05 se distribuye simtricamente a cada lado


Z = - 1.96Riesgo
Z = 1.96
0,025

Z = - 1.96Riesgo alfa = 0,05 se distribuye simtricamente a cada ladoZ0,025


= 1.96

p g in a 199

C a pt u l o 3

p g in a 200

Ejemplo de comparacin de clculo del tamao muestral para


comparacin de dos proporciones a una sola cola
Deseamos evaluar si el nuevo frmaco B es mejor que el tratamiento clsico A para el
alivio del dolor, para lo que diseamos un ensayo clnico. Sabemos por datos previos
(bibliografa) que la eficacia del frmaco A es prxima al 70% y consideramos
clnicamente relevante si el nuevo frmaco B alivia el dolor en un 90%. Nuestro nivel de
riesgo alfa lo fijamos en 0.05 (error =5%) y deseamos un poder estadstico (1- ) de un
80% (error =20%). Cul es el volumen muestral?

B>
A

Una sola cola


Z = 1.645

n = 48 pacientes
En cada grupo (A y B) precisamos 48 pacientes.
Pita Fernndez S. Determinacin del tamao muestral. Cad Aten Primaria 1996; 3: 138-144.

C a pt u l o 3

p g in a 201

Ejemplo de comparacin de clculo del tamao muestral para


comparacin de dos proporciones a dos colas.
Sabemos por datos previos (bibliografa) que la mortalidad del frmaco A es prxima al
31% comparada con el frmaco B que tiene una tasa de mortalidad del 40%. Nuestro
nivel de riesgo alfa lo fijamos en 0.05 (error =5%) y deseamos un poder estadstico (1 ) de un 90% (error =10%). Cul es el volumen muestral?

Dos colas

Z = 1.96

B
A

Necesitamos un total de 1184 pacientes, 592 para cada grupo (A y


B).

C a pt u l o 3

Influencia de la magnitud del efecto a detectar y del poder


estadstico en la determinacin del tamao muestral (n1 y n2).
Comparacin de dos Prevalencias (proporciones) P1 y P2.

Poder estadstico (1
)

100
%
90
%
80
%

P1 =
40%
P
1 = 40%
=
= 20%
2

70
60
%
%
50
%
40
%
30
%

P1 =
=
40%
10%
P
P12 =
= 40%
50%
= 10%
P2 = 50%

20
%
0
10
% 0
%

P1 =
=
P1 = 40% = 15%
40%
15%
P2 =
P2 = 55%
55%

P
2 =
20%
P
= 60%
60%

5
0

10
0

150

200

250

300

Nmero de casos por


grupo

350
500

400

450

p g in a 202

C a pt u l o 3

C lculo del tamao de la muestra por software


(ejemplo)
El clculo resulta an ms fcil, cuando se utiliza un software. Por ejemplo
utilizando el software gratuito PS: Power and Sample Size Program,
tenemos que introducir los valores correspondientes a:
1. Las tasa de mortalidad en los grupos que recibieron el tratamiento A y
B (0.31 y 0.40).
2. El nivel de significacin estadstica (ERROR ALFA del 5%) (p < 0.05) .
3. El poder estadstico del estudio (ERROR BETA del 10%) (0.90)
asumido para obtener el tamao muestral por cada grupo.

p g in a 203

C a pt u l o 3

p g in a 204

C a pt u l o 3

p g in a 205

Ejemplo del clculo del tamao muestral para el clculo del coeficiente de
correlacin entre dos variables cuantitativas
Supongamos que se desea estudiar la asociacin entre la edad y el nivel de colesterol
entre los pacientes de un centro de salud. Se disea un estudio piloto en el que se
determinar mediante una analtica el colesterol en una muestra aleatoria de los
pacientes durante un periodo de tiempo prefijado, de los que tambin se registrar su
edad. Se obtiene un valor del coeficiente de correlacin lineal de Pearson entre la edad y
el colesterol de r=0,3. Aplicando las frmulas, con un NIVEL DE CONFIANZA del 95%
(error =5%) y un PODER ESTADSTICO del 80% (error =20%), se obtiene:
En este caso, se necesitara
incluir a 85 pacientes para
llevar a cabo el estudio.

Si, adems, en este ltimo caso se prev un 20% de posibles prdidas de


informacin durante la ejecucin del estudio, el tamao muestral se recalcula segn
la expresin:
Es decir, se necesitara una
muestra de 107 pacientes para
llevar a cabo la investigacin.
Prtegas Daz S , Pita Fernndez S. Determinacin del tamao muestral para calcular la significacin del
coeficiente de correlacin lineal. Cad Aten Primaria 2001; 9: 209-211.

C a pt u l o 3

Frmulas
para
el
clculo
del
poder
estadstico (1- ) en
funcin del tipo de
diseo del estudio.

Clculo del poder


estadstico de un estudio.
Prtegas Daz S, Pita Fernndez
S.
Unidad de Epidemiologa Clnica
y Bioestadstica. Complexo
Hospitalario-Universitario Juan
Canalejo. La Corua

p g in a 206

C a pt u l o 3

Frmulas para el clculo del poder estadstico (1-) en funcin del tipo
de
diseo del estudio.

Clculo del poder estadstico de un estudio.


Prtegas Daz S, Pita Fernndez S.
Unidad de Epidemiologa Clnica y Bioestadstica. Complexo Hospitalario-Universitario Juan Canalejo.
La Corua

p g in a 207

C a pt u l o 3

n = Tamao muestral. En un estudio de casos y controles, n es el nmero de


casos.
P1 = En un estudio transversal o de cohortes, proporcin de expuestos
que
desarrollan la enfermedad. En un estudio de casos y controles, proporcin de
casos
expuestos
P2 = En un estudio transversal o de cohortes, proporcin de NO expuestos
que
desarrollan la enfermedad. En un estudio de casos y controles, proporcin
de
controles expuestos
d = Valor mnimo de la diferencia a detectar entre dos
medias s2 = Varianza en el grupo control o de referencia
c = Nmero de controles por caso, en estudios caso-control
m = En un estudio de casos y controles, nmero de
controles OR = Valor aproximado del odds ratio a detectar
RR = Valor aproximado del riesgo relativo a detectar
r = Magnitud del coeficiente de correlacin a detectar

p g in a 208

C a pt u l o 3

Valores de los estadsticos Z ms frecuentemente utilizados en el clculo del tamao muestral


considerando el error y
Error

Seguridad (1 - )

Test unilateral
Z 1-

Test bilateral
Z 1- /2

0,05

95%

1,645

1,96

0,01

99%

2,326

2,576

Error

Poder estadstico (1 )

Z 1-

0,10

90%

0,10

1,282

0,20

80%

0,20

0,842

p g in a 209

C a pt u l o 3

Asociacin observada
p < 0,05
Estadsticamente significativa

p > 0,1
Estadsticamente NO significativa

AB

A=B
VP

FP

VN

Verdadera

Verdadera
(no existe asociacin)

Falsa
Utilidad clnica

Error
Sesgo

Sin inters prctico

Error

FN

Falsa
Comparacin
poco sensible

Nmero insuficiente de sujetos

Interpretacin de una asociacin (o diferencia) observada en un estudio

Sesgo

p g in a 210

C a pt u l o 3

Interpretacin de una asociacin (o


diferencia)
observada en un estudio ERRO R ALFA
Expedicin de pesca
La probabilidad de encontrar resultados FALSOS POSITIVOS FP (error alfa )
aumenta notablemente con el nmero de comparaciones injustificadas
realizadas entre las distintas variables durante el anlisis (ir de pesca).
Estudios que sin apoyarse en ninguna hiptesis a PRIORI (estrategia de
anlisis), consideran todas las variables de igual importancia (hiptesis a
POSTERIORI), analizndolas unos contra otras (sin criterio), esperando a ver
que se encuentra

p g in a 211

C a pt u l o 3

D ecisiones que se pueden tomar en un test de


contraste de hiptesis despus de conocer el valor
de significacin estadstica p
p < 0,05 A B
Se rechaza la hiptesis nula
No parece que el azar
pueda explicarlo todo
El EFECTO observado es mayor
que el ERROR
Hay diferencias estadsticamente
significativas
Existen evidencias a favor de la
hiptesis alternativa Ha, y por
tanto rechazamos la hiptesis nula
Ho

p 0,10
A= B
No se puede rechazar la hiptesis nula
No se puede descartar que el azar
lo explique todo
El EFECTO observado es similar que
el ERROR
NO hay diferencias estadsticamente
significativas
NO existen evidencias a favor de
la hiptesis alternativa Ha, y por
tanto aceptamos la hiptesis nula
Ho

Los lmites de 0,05 y 0,1 pueden ser considerados en cierto modo


arbitrarios y aproximados

p g in a 212

C a pt u l o 3

Materiales
Pacientes
1. Criterios de seleccin de la muestra (inclusin y
exclusin).
2. Procedencia.
3. Tcnica de reclutamiento utilizada.
4. Tiempo empleado para reunir a todos los participantes.
5. Principales caractersticas de los pacientes.
- Edad.
- Sexo.
- Procedencia.
- Gravedad.
- Aos de evolucin de la enfermedad.
- Patologas asociadas...
6. Clculo de tamao muestral.

p g in a 213

C a pt u l o 4

C aptulo 4
Publicacin Bioestadstica: Error y .
Evaluacin de pruebas diagnsticas.

D r. Jacobo D az Portillo
Coordinador de Formacin Continuada
Hospital Universitario de Ceuta

p g in a 214

C a pt u l o 4

p g in a 215

Bioestadstica: Error y
Influencia de los errores y en la rentabilidad clnica de
las
pruebas diagnsticas
Evaluacin de las pruebas diagnsticas

C a pt u l o 4

Evaluacin de las pruebas


diagnsticas
- Exactitud (validez, efectividad o
rentabilidad).
- Sensibilidad.
- Especificidad.
- Seguridad: valores predictivos.
- Valor predictivo positivo (VPP).
- Valor predictivo negativo (VPN).
- Razn de verosimilitud.
- Curvas roc.
- Reproductivilidad.
- Invasividad.
- Coste econmico (URV).

p g in a 216

p g in a 217

C a pt u l o 4

Hiptesis nula (Ho): No existen diferencias significativas en la eficacia


clnica
de dos frmacos A y B (A = B)
Hiptesis alternativa (Ha): Existen diferencias en la eficacia clnica de
Realidad
dos frmacos A y B (A B) A>B A<B
Existe
diferencia
(H
a

Se produce un cierto solapamiento en las


distribuciones de probabilidad de la H o y de
la Ha, en este solapamiento siempre
aparece
el
error y asumido, el cual ser mayor o
menor en funcin del resultado o diferencia
observada en nuestro estudio

Resultado
de la prueba
estadstica

p < 0, 05
Acept o la H

No existe
diferencia
(H
o

verdader
a)

verdader
a)

No error
VP (1-)

Error tipo I
FP ( )

p > 0, 05
Acept o la H

Error tipo II No error


FN ()
VN
o

Resultados de una prueba de significacin estadstica


H : hiptesis nula (no hay diferencias significativas)
X:o distribucin de la diferencia cuando H o es cierta
Y: distribucin de la diferencia cuando H a es cierta
R: resultado (diferencia) observado en
nuestro estudio

C a pt u l o 4

Relacin de los riesgos asociados a un test de


hiptesis unilateral (estadstico valor de la
media):
Error tipo I (riesgo ) y tipo II (riesgo )
Muestra:

Riesgo
beta
error

cae en esta lnea:

ReggeR
Regin de
aaceptacin
iinn ddee
H
acep

Regin de rechazo Ha

Riesgo
alfa error
0,05
Significacin
estadstica

de
rechazo
H00chazo
Regin
de re
H0
dReeeaagciepn

daceeiacnneHHpt1acin
H
a

p g in a 218

C a pt u l o 4

Riesgo alfa y riesgo


beta
Se produce un cierto de la
Ho y de la Ha, en este
solapamiento siempre
aparece el error y
asumido, el cual ser
mayor o menor en funcin
del resultado o diferencia
observada en nuestro
estudio

Ho

Ha

Riesgo
alfa error

0,05
Significacin
estadstica

Riesgo
beta
error
Se acepta Ho
Se rechaza Ha

Se acepta Ha
Se rechaza Ho

p g in a 219

C a pt u l o 4

Error alfa versus error


beta:
N o se puede tener todo

ERRO R BETA
FALSOS N EGATIVO S

ERRO R ALFA
FALSOS PO SITIVO S

p g in a 220

C a pt u l o 4

Error alfa versus error beta:


N o se puede tener todo

ERRO R ALFA

ERRO
R BETA
FALSOS
N EGATIVO S

FALSOS PO SITIVO S

p g in a 221

C a pt u l o 4

Error alfa versus error beta:


N o se puede tener todo
Hay que buscar un equilibrio entre los FALSOS POSITIVOS (error ) y los
FALSOS NEGATIVOS (error ).
Ho
Ha

error

10%
Ho

error

20%

error
(0,05)

Ha

erro
r
(0,01)

Para un tamao muestral fijo (N= cte), no se pueden reducir a la vez ambos tipos de
error.
Para reducir , hay que aumentar el tamao muestral N.

p g in a 222

C a pt u l o 4

Tipos de error en las pruebas


diagnsticas
Enfermos
Test de laboratorio

Positivo
(+)
Hiptes
is
alternati
va
Negativo
(-)
Hiptesi
s nula

Realidad
Sanos

VERDADEROS
POSITIVOS
VP
(1- )

FALSO POSITIVO
error
Error Muy grave

FALSO NEGATIVO
error
Error Menos grave

VERDADEROS
NEGATIVOS
VN

p g in a 223

C a pt u l o 4

Tipos de error en las pruebas


diagnsticas
Tipos de error en las pruebas diagnsticas

Test de laboratorio
PSA

Realidad

Enfermos

Sanos

Positivo
(+)

VERDADEROS
POSITIVOS
VP

FALSO POSITIVO
FP

Negativo
(-)

FALSO
NEGATIVO FN

VERDADEROS
NEGATIVOS
VN

p g in a 224

C a pt u l o 4

Tipos de error en las pruebas


diagnsticas
Tipos de error en las pruebas diagnsticas

Resultados de la prueba
diagnstica

Evento o enfermedad estudiada

Enfermos
VERDADEROS
POSITIVOS
VP

Sanos
FALSO
POSITIVO
FP

Total
VP + FP

Negativo
(-)

FALSO
NEGATIVO FN

VERDADEROS
NEGATIVOS
VN

FN + VN

Total

VP + FN

FP + VN

Positivo
(+)

VP
SENSIBILIDAD

VP + FN

Enfermos positivos

SENSIBILIDAD

Total de ENFERMOS

p g in a 225

C a pt u l o 4

La sensibilidad de la prueba
diagnstica
- Es la probabilidad de clasificar correctamente a un individuo enfermo.
- Es la probabilidad de que para un sujeto enfermo se obtenga en la
prueba un resultado positivo.
- Es la capacidad del test para detectar la enfermedad.
-Probabilidad de obtener un resultado positivo cuando el individuo tiene la
enfermedad.
- Mide su capacidad para detectar la enfermedad cuando est presente.
- Su valor depende del error BETA ( ).

p g in a 226

C a pt u l o 4

Tipos de error en las pruebas


diagnsticas
Tipos de error en las pruebas diagnsticas

Resultados de la prueba
diagnstica

Enfermos
VERDADEROS
POSITIVOS
VP

Sanos
FALSO
POSITIVO
FP

Total
VP + FP

Negativo
(-)

FALSO
NEGATIVO FN

VERDADEROS
NEGATIVOS
VN

FN + VN

Total

VP + FN

FP + VN

Positivo
(+)

ESPECIFICIDAD

==

Evento o enfermedad estudiada

VN

Sanos negativos
ESPECIFICIDAD =
Total de SANOS

VN +

FP

p g in a 227

C a pt u l o 4

La especificidad de la prueba
diagnstica
- Es la probabilidad de clasificar correctamente a un individuo sano.
- Es la probabilidad de que para un sujeto sano se obtenga un
resultado negativo.
- Es la capacidad del test para detectar a los sanos.
-Es la probabilidad de obtener un resultado negativo cuando el individuo no
tiene la enfermedad.
- Mide la capacidad para descartar la enfermedad cuando no est
presente.
- Su valor depende del error ALFA ().

p g in a 228

C a pt u l o 4

p g in a 229

Exactitud en las pruebas diagnsticas


- Es la principal cualidad clnica de una prueba diagnstica.
-Es la capacidad de una prueba diagnstica para clasificar correctamente a
los pacientes.
-Es la capacidad de una prueba diagnstica para clasificar correctamente
a los individuos en subgrupos clnicamente relevantes (enfermos y NO
enfermos).
- En su forma ms simple es la capacidad para distinguir entre dos estados
de salud (enfermos y NO enfermos).

EXACTITUD =

VP

VN

VP + FN + FP + VN

C a pt u l o 4

Exactitud en las pruebas


diagnsticas
VP
EXACTITUD =

+
VP +

VN
FN + FP + VN

SEN SIBILID AD

ESPEC IFIC IDAD

ACIERTOS
EXACTITUD =

ACIERTOS + FALLOS

p g in a 230

C a pt u l o 4

Tipos de error en las pruebas


diagnsticas
Tipos de error en las pruebas
diagnsticas

Resultados
de la prueba
diagnstica

Evento o enfermedad estudiada

Enfermos

Sanos

Total

Positivo
(+)

VERDADEROS
POSITIVOS
VP

VP + FP
(total de positivos)

Negativo
(-)

FALSO
NEGATIVO FN

VP + FN

FALSO
POSITIVO
FP

VERDADEROS
NEGATIVOS
VN
FP + VN

Total

FN + VN

VP

VP
VPP =

VPP =

Total de POSITIVOS

VP + FP

p g in a 231

C a pt u l o 4

Valor Predictivo Positivo (VPP) de la prueba


diagnstica
- Es la probabilidad de padecer la enfermedad si se obtiene un
resultado positivo en el test.
- Se puede definir el VPP como la proporcin de resultados vlidos
(VP) entre
todos resultados positivos de la prueba (VP + FP).
- Su valor depende del error ALFA () y de la POTENCIA
ESTADSTICA.
- Su valor depende de la prevalencia (P) de la enfermedad; cuanto menor
sea la prevalencia menor ser el VPP y cuanto mayor sea la prevalencia
mayor ser el VPP.

p g in a 232

p g in a 233

C a pt u l o 4

Tipos de error en las pruebas


diagnsticas
Tipos de error en las pruebas
diagnsticas

Resultados
de la prueba
diagnstica

Evento o enfermedad estudiada

Enfermos

Sanos

Total

Positivo
(+)

VERDADEROS
POSITIVOS
VP

FALSO
POSITIVO
FP

VP + FP
(total de positivos)

Negativo
(-)

FALSO
NEGATIVO FN

VERDADEROS
NEGATIVOS
VN

FN + VN
(total de
negativos)

Total

VP + FN

FP + VN

VN

VN
VPN =

VPN =

Total de NEGATIVOS

VN + FN

C a pt u l o 4

Valor Predictivo N egativo (VPN) de la prueba


diagnstica
- Es la probabilidad de que un sujeto con un resultado negativo en la
prueba est realmente sano.
-El VPN es la proporcin de resultados vlidos (VN) entre todos los
resultados negativos (VN + FN).
- Su valor depende del error BETA ( ).
-Su valor depende de la prevalencia (P) de la enfermedad en estudio
Cuanto menor sea la prevalencia, mayor ser el VPN, y cuanto mayor sea
la prevalencia, menor ser el VPN.

p g in a 234

C a pt u l o 4

Prevalencia de la
enfermedad
Es la frecuencia con la que se presenta una determina enfermedad en
una
poblacin definida en un momento dado.

PREVALENCIA =

VP

FN

VP + FP + FN + VN
ENFERMOS
PREVALENCIA =

ENFERMOS + SANOS

p g in a 235

C a pt u l o 4

Prevalencia de la
enfermedad
VP
PREVALENCIA =

VP +

VALO R
PRED IC TIVO
PO SITIVO
(VPP)

FN

FP + FN + VN

VALO R
PRED IC TIVO
N EGATIVO
(VPN)

Los valores predictivos (VPP y VPN) dependen de la prevalencia de


la enfermedad en estudio.

p g in a 236

C a pt u l o 4

EXACTITUD

SENSIBILIDAD

ESPECIFICIDAD
VALOR PREDICTIVO
POSITIVO (VPP)

VALOR PREDICTIVO
NEGATIVO (VPN)

PREVALENCIA

p g in a 237

C a pt u l o 4

p g in a 238

Relacin entre la prevalencia y el valor predictivo


positivo (VPP)
Prevalencia
de la
enfermedad

Resultado
prueba
diagnstica

Enfermos

Sanos
(No enfermos)

Total

VPP

1%

99

495

594

9404

9406

15%
(99/595)

Total

100

9900

10000

495

475

970

9025

9030

Total

500

9500

10000

5%

SEN SIBILIDAD D IAGN STIC A = 99%

51%
(495/970)

ESPEC IFIC ID AD D IAGN STIC A = 95%

C a pt u l o 4

Relacin entre la prevalencia y el valor


predictivo

Valor predictivo (%)

VALOR PREDICTIVO POSITIVO (VPP)

VALOR PREDICTIVO NEGATIVO (VPN)

Prevalencia de la enfermedad

p g in a 239

C a pt u l o 4

Razn de verosimilitud

SENSIBILIDAD
RV +

1ESPECIFICIDAD

Tasa de VP (%)
RV +

Tasa de FP (%)

p g in a 240

C a pt u l o 4

Cul es la probabilidad de que un paciente que


acude a la consulta tenga un carcinoma de
prstata si el PSA (+) ([PSA]s > 4 ng/ml)?
Variable PRED IC TO RA
PSA (+)

Variable RESULTAD O
C arcinoma de prstata

VALO R PRED IC TIVO PO SITIVO


(VPP)

Es la probabilidad de que un paciente tenga un carcinoma de prstata (CP) una vez que el test (PSA) ha
dado positivo ([PSA] > 4 ng/ml).

p g in a 241

C a pt u l o 4

Cul es la probabilidad de que un paciente que


acude a la consulta N O tenga un carcinoma de
prstata si el PSA (-) ([PSA] < 4 ng/ml)?

VALO R PRED IC TIVO N EGATIVO (VPN)

Es la probabilidad de que un individuo sano NO tenga un carcinoma de prstata (CP) una vez que el test
(PSA) ha dado negativo ([PSA] < 4 ng/ml).

p g in a 242

C a pt u l o 4

p g in a 243

Cul es la probabilidad de que un paciente


diagnosticado de carcinoma de prstata presente
un PSA (+) ([PSA] > 4 ng/ml)?
Variable PRED IC TO RA
C arcinoma de prstata

Variable RESULTAD O
PSA (+) ([PSA] > 4 ng/ml)

SEN SIBILIDAD D IAGN STIC A

Es la probabilidad de que el test (PSA) sea positivo entre los individuos realmente enfermos (carcinoma de
prstata).

C a pt u l o 4

p g in a 244

Cul es la probabilidad de que un paciente sin


carcinoma
de prstata (C P) presente un PSA (-) ([PSA] < 4
ng/ml)?
ESPEC IFIC ID AD D IAGN STIC A

Es la probabilidad de que el test (PSA) sea negativo entre los individuos realmente no enfermos (sin cncer
de prstata).

C a pt u l o 4

p g in a 245

Cul es la probabilidad de que un valor de PSA


patolgico ([PSA] > 4 ng/ml)? sea X veces ms probable
en un paciente con carcinoma de prstata (C P) que en
otro sujeto sin cncer?
RA Z N D E VERO SIMILITUD (RV+)

Es la probabilidad de que un resultado elevado del test (PSA) aparezca en los pacientes con carcinoma de
prstata frente a los individuos realmente no enfermos (sin cncer de prstata).

C a pt u l o 4

Pregunta de investigacin
Qu utilidad clnica tiene el tacto rectal en el
diagnstico del carcinoma de prstata (C P) en una
muestra de pacientes con sospecha de C P que acuden
a una consulta de Urologa?
Objetivo: Evaluacin del tacto rectal en el diagnstico del CP en
una
consulta
de urologa.
Tcnica de
Tcnica
analtica
a
valuar

TAC TO REC TAL

referencia
BIO PSIAdePRO
STTIC A
(patrn
oro)
mediante ecografa
transrectal

Cul es el test estadstico ms


acertado?
Pita Fernndez S, Prtegas Daz S. Pruebas diagnsticas. Cad Aten Primaria 2003; 10: 120-124.

p g in a 246

C a pt u l o 4

Tipos de error en las pruebas


diagnsticas
Tipos de error en las pruebas diagnsticas

TACTO RECTAL

Tcnica de referencia
(BIOPSIA transrectal ecodirigida)

POSITIVA

NEGATIVA

Positivo
(+)

VERDADEROS
POSITIVOS
VP

FALSO POSITIVO
FP

Negativo
(-)

FALSO
NEGATIVO FN

VERDADEROS
NEGATIVOS
VN

p g in a 247

C a pt u l o 4

Tcnica de referencia (BIOPSIA prosttica mediante ecografa transrectal)


TACTO RECTAL

positiva (+)

negativa (-)

Total

Positivo (+)

634

269

903

Negativo (-)

487

1251

1738

Total

1121

1520

2641

VP
SENSIBILIDAD =

SENSIBILIDAD =

VP + FN
634
634 +
487

= 56,5%

p g in a 248

C a pt u l o 4

Tcnica de referencia (BIOPSIA prosttica mediante ecografa transrectal)


TACTO RECTAL

positiva (+)

negativa (-)

Total

Positivo (+)

634

269

903

Negativo (-)

487

1251

1738

Total

1121

1520

2641

VN
ESPECIFICIDAD =

VN + FP
1251

ESPECIFICIDAD =

1251 +
269

= 82,3%

p g in a 249

C a pt u l o 4

Tcnica de referencia (BIOPSIA prosttica mediante ecografa transrectal)


TACTO RECTAL

positiva (+)

negativa (-)

Total

Positivo (+)

634

269

903

Negativo (-)

487

1251

1738

Total

1121

1520

2641

VP + VN
EXACTITUD =

VP + FN + FP +
VN

634 +
EXACTITUD =
1251
634 + 487 + 269 + 1251

= 71,4 %

p g in a 250

C a pt u l o 4

Tcnica de referencia (BIOPSIA prosttica mediante ecografa transrectal)


TACTO RECTAL

positiva (+)

negativa (-)

Total

Positivo (+)

634

269

903

Negativo (-)

487

1251

1738

Total

1121

1520

2641

VPP =

VP
VP + FP

VPP
=

634

= 70,2%

634 + 269

La probabilidad de tener un CP es del 70% cuando el tacto rectal es positivo.

p g in a 251

C a pt u l o 4

Tcnica de referencia (BIOPSIA prosttica mediante ecografa transrectal)


TACTO RECTAL

positiva (+)

negativa (-)

Total

Positivo (+)

634

269

903

Negativo (-)

487

1251

1738

Total

1121

1520

2641

VPN =

VN
VN + FN

VPN =

1251

= 72,0%
1251 + 487

La probabilidad de NO tener un CP es de tan slo el 72% cuando el tacto rectal es negativo.


Como la prueba tiene un VPN bajo, un resultado negativo del tacto rectal slo permite descartar el
diagnstico de CP con una probabilidad del 72%.

p g in a 252

C a pt u l o 4

Tcnica de referencia (BIOPSIA prosttica mediante ecografa transrectal)


TACTO RECTAL

positiva (+)

negativa (-)

Total

Positivo (+)

634

269

903

Negativo (-)

487

1251

1738

Total

1121

1520

2641

PREVALENCIA =

VP + FN
VP + FP + FN + VN
634

PREVALENCIA =

487

634 + 269 + 487 +


1251

= 42,4 %

p g in a 253

C a pt u l o 4

p g in a 254

Tcnica de referencia (BIOPSIA prosttica mediante ecografa transrectal)


TACTO RECTAL

positiva (+)

negativa (-)

Total

Positivo (+)

634

269

903

Negativo (-)

487

1251

1738

Total

1121

1520

2641

RV + =

SENSIBILIDAD
1

ESPECIFICIDAD

RV + =

0,565
1

0,823

= 3,2

Un tacto rectal anormal (+) es 3 veces ms probable en un paciente con CP que en otro sujeto sin cncer.

C a pt u l o 4

Pregunta de investigacin
Qu utilidad clnica tiene la tira reactiva en orina en
el
diagnstico de la infeccin del tracto urinario (ITU)?
Objetivo: Evaluacin de la TIRA REACTIVA en el diagnstico de la
ITU.
Tcnica de
Tcnica analtica a
valuar
referencia
TIRA REAC TIVA
C ULTIVO
(patrn
de oro)
(orina)

(orina)

Cul es el test estadstico ms


acertado?
Latorre C, Noguero M, Mira A. Evaluacin de la tira reactiva para el diagnstico de infeccin urinaria en
nios y adultos. Med Clin (Barc) 2001; 116: 286-289.

p g in a 255

C a pt u l o 4

Tipos de error en las pruebas


diagnsticas
Tipos de error en las pruebas diagnsticas

Test de laboratorio
TIRA REACTIVA
orina

Tcnica de referencia
(CULTIVO)

POSITIVO

NEGATIVO

Positiva
(+)

VERDADEROS
POSITIVOS
VP

FALSO POSITIVO
FP

Negativa
(-)

FALSO
NEGATIVO FN

VERDADEROS
NEGATIVOS
VN

p g in a 256

C a pt u l o 4

INFECCIN DEL TRACTO URINARIO (ITU)


Tira reactiva

SI

NO

Total

Positva (+)

86

433

519

Negativa (-)

20

548

568

Total

106

981

1087

VP
SENSIBILIDAD =

SENSIBILIDAD =

VP + FN
86
86

+ 20

= 81,1%

p g in a 257

C a pt u l o 4

INFECCIN DEL TRACTO URINARIO (ITU)


Tira reactiva

SI

NO

Total

Positva (+)

86

433

519

Negativa (-)

20

548

568

Total

106

981

1087

VN
ESPECIFICIDAD =

VN + FP
548

ESPECIFICIDAD =

548

+ 433

= 55,9%

p g in a 258

C a pt u l o 4

INFECCIN DEL TRACTO URINARIO (ITU)


Tira reactiva

SI

NO

Total

Positva (+)

86

433

519

Negativa (-)

20

548

568

Total

106

981

1087

VP + VN
EXACTITUD =

VP + FN + FP +
VN
86

EXACTITUD =

548

86 + 20 + 433 + 548

= 58,3%

p g in a 259

C a pt u l o 4

INFECCIN DEL TRACTO URINARIO (ITU)


Tira reactiva

SI

NO

Total

Positva (+)

86

433

519

Negativa (-)

20

548

568

Total

106

981

1087

VPP =

VP
VP + FP

VPP
=

86

= 16,6%

86 + 433

La probabilidad de tener una ITU es de tan slo el 17% cuando la tira reactiva es positiva.

p g in a 260

C a pt u l o 4

INFECCIN DEL TRACTO URINARIO (ITU)


Tira reactiva

SI

NO

Total

Positva (+)

86

433

519

Negativa (-)

20

548

568

Total

106

981

1087

VPN =

VN
VN + FN

VPN =

548

= 96,5%
548 + 20

La probabilidad de NO tener una ITU es del 96,5% cuando la tira reactiva es negativa.
Como la prueba tiene un VPN alto, un resultado negativo de la tira urinaria descarta el diagnstico de ITU
con una probabilidad del 96,5%.

p g in a 261

C a pt u l o 4

INFECCIN DEL TRACTO URINARIO (ITU)


Tira reactiva

SI

NO

Total

Positva (+)

86

433

519

Negativa (-)

20

548

568

Total

106

981

1087

PREVALENCIA =

VP + FN
VP + FP + FN + VN
86

PREVALENCIA =

86 +
433

20

+ 20 +
548

= 9,7 %

p g in a 262

C a pt u l o 4

INFECCIN DEL TRACTO URINARIO (ITU)


Tira reactiva

SI

NO

Total

Positva (+)

86

433

519

Negativa (-)

20

548

568

Total

106

981

1087

RV + =

RV + =

SENSIBILIDAD
1

ESPECIFICIDAD

0,811
1

- 0,559

= 1,84

Una tira reactiva anormal (+) es casi 2 veces ms probable en un paciente con ITU que en otro sujeto sin
infeccin.

p g in a 263

C a pt u l o 4

Pregunta de investigacin
Qu utilidad clnica tienen los niveles de ferritina
srica
en el diagnstico de la anemia ferropnica?
Objetivo: Evaluacin de la FERRITINA en el diagnstico de la
anemia
ferropnica.
Tcnica de
Tcnica
analtica a
valuar

FERRITIN A
(srica)

referencia
AN EMIA
(patrn
deFERRO
oro) PN IC A

Cul es el test estadstico ms


acertado?

DL Sackett. Epidemiologa clnica. Buenos Aires, Editorial Mdica Panamericana, 1994.

p g in a 264

C a pt u l o 4

Tipos de error en las pruebas


diagnsticas
Tipos de error en las pruebas diagnsticas

Test de laboratorio
FERRITINA
srica

Realidad

Anemia ferropnica

Sanos

Positivo
(+)
FERRITINA
BAJA

VERDADEROS
POSITIVOS
VP

FALSO POSITIVO
FP

Negativo
(-)
FERRITINA
NORMAL

FALSO
NEGATIVO FN

VERDADEROS
NEGATIVOS
VN

p g in a 265

C a pt u l o 4

ANEMIA FERROPNICA
FERRITINA

SI

NO

Total

BAJA (+)

731

270

1001

NORMAL (-)

78

1500

1578

Total

809

1770

2579

VP
SENSIBILIDAD =

VP +

FN

731
SENSIBILIDAD =

731 +
78

= 90,3%

Si una prueba tiene una sensibilidad alta, un resultado negativo descarta el diagnstico.

p g in a 266

C a pt u l o 4

ANEMIA FERROPNICA
FERRITINA

SI

NO

Total

BAJA (+)

731

270

1001

NORMAL (-)

78

1500

1578

Total

809

1770

2579

VN
ESPECIFICIDAD =

VN + FP
1500

ESPECIFICIDAD =

1500 +
270

= 84,7%

Si una prueba tiene una especificidad alta, un resultado positivo confirma el diagnstico.

p g in a 267

C a pt u l o 4

ANEMIA FERROPNICA
FERRITINA

SI

NO

Total

BAJA (+)

731

270

1001

NORMAL (-)

78

1500

1578

Total

809

1770

2579

VP + VN
EXACTITUD =

EXACTITUD =

VP + FN + FP +
VN
731

+ 78 + 270 + 1500
7311500

= 86,5%

Una exactitud elevada permite distinguir con un mnimo error entre dos estados de salud.

p g in a 268

C a pt u l o 4

ANEMIA FERROPNICA
FERRITINA

SI

NO

Total

BAJA (+)

731

270

1001

NORMAL (-)

78

1500

1578

Total

809

1770

2579

VPP =

VP
VP + FP

VPP
=

731

= 73%
731 +
270

La probabilidad de tener una anemia ferropnica es del 73% cuando la ferritina srica es baja.

p g in a 269

C a pt u l o 4

p g in a 270

ANEMIA FERROPNICA
FERRITINA

SI

NO

Total

BAJA (+)

731

270

1001

NORMAL (-)

78

1500

1578

Total

809

1770

2579

VPN =

VN
VN + FN

VPN =

1500
1500 +
78

= 95,1%

La probabilidad de NO tener una anemia ferropnica es del 95,1% cuando la ferritina srica es normal.
Como la prueba tiene un VPN alto, una ferritina normal descarta el diagnstico de anemia ferropnica con
una probabilidad del 95,1%.

C a pt u l o 4

ANEMIA FERROPNICA
FERRITINA

SI

NO

Total

BAJA (+)

731

270

1001

NORMAL (-)

78

1500

1578

Total

809

1770

2579

PREVALENCIA =

PREVALENCIA =

VP + FN
VP + FP + FN + VN
731 +
78
731 + 270 + 78 + 1500

= 31%

p g in a 271

C a pt u l o 4

p g in a 272

ANEMIA FERROPNICA
FERRITINA

SI

NO

Total

BAJA (+)

731

270

1001

NORMAL (-)

78

1500

1578

Total

809

1770

2579

RV + =

RV + =

SENSIBILIDAD
1

ESPECIFICIDAD

0,903
1

- 0,847

= 5,9

Una ferritina baja es casi 6 veces ms probable en un paciente con anemia ferropnica que en otro sujeto
sin anemia ferropnica.

C a pt u l o 4

Pregunta de investigacin
Qu utilidad clnica tiene el ttulo srico de anticuerpos
antinucleares en el diagnstico de enfermedades
autoinmunes?
Objetivo: Evaluacin del ttulo de ANA en el diagnstico de
diferentes
enfermedades
autoinmunes. Tcnica de
Tcnica analtica
a
valuar

AN A (IFI)

referencia
EN FERMED
AD E
(patrn
de oro)

S
AUTO IN MUN ES

Cul es el test estadstico ms


acertado?

p g in a 273

C a pt u l o 4

Tipos de error en las pruebas


diagnsticas
Tipos de error en las pruebas diagnsticas

Test de laboratorio
ANA
(IFI)

Realidad

Enfermedad autoinmune

Sanos

Positivo
(+)

VERDADEROS
POSITIVOS
VP

FALSO POSITIVO
FP

Negativo
(-)

FALSO
NEGATIVO FN

VERDADEROS
NEGATIVOS
VN

p g in a 274

C a pt u l o 4

Razn de verosimilitud
C ocientes de
probabilidades
SENSIBILIDAD
RV + =

1
ESPECIFICIDAD
RV + =

Tasa de VP (%)
Tasa de FP (%)

p g in a 275

C a pt u l o 4

Grupos de estudio

Razn de verosimilitud (+) (cociente de probabilidades positivo)


Ttulo 1/40

Ttulo 1/80

Ttulo 1/160

Ttulo 1/320

LES (n= 38)

3,1

7,3

18,9

26,1

ESP (n= 37)

3,2

7,1

17,3

25,1

SS (n= 37)

2,7

5,7

14,7

21,3

AR (n= 38)

1,5

2,8

2,7

0,81

RPB (n= 37)

1,2

1,7

1,5

1,2

Sanos (n=120)

1,0

1,0

1,0

1,0

La razn de verosimilitud positivo (RV+) o cociente de probabilidad


(CP) positivo (sensibilidad dividida por el complementario de la
especificidad) es una medida que calcula cunto ms probable es que
un resultado positivo de una prueba (ANA) se presente en un sujeto
enfermo (EAI) frente a uno sano.
La razn de verosimilitud negativo (RV-) o cociente de probabilidad
(CP) negativo (complementario de la sensibilidad dividida por la
especificidad) relaciona la probabilidad de que un resultado negativo de
una prueba se presente en un enfermo frente a un sano.

p g in a 276

C a pt u l o 4

p g in a 277

Razn de verosimilitud
C ocientes de
probabilidades
RV +

Ttulo 1/40
Ttulo 1/80
Ttulo 1/160
Ttulo 1/320

Camps Garca MT, Muoz Rocan N, Calvo de Mora A, De Ramn Garrido E. Los cocientes de probabilidad
como medida de la utilidad de la determinacin de anticuerpos antinucleares por inmunofluorescencia
indirecta en la clnica. Aplicacin de los resultados de la investigacin clnica. Med Clin (Barc) 1999;113: 476.

C a pt u l o 4

Tipos de error en las pruebas


diagnsticas
Tipos de error en las pruebas diagnsticas

Test de laboratorio
FERRITINA
IST

Realidad

Hemocromatosis

Sanos

Positivo
(+)
FERRITINA alta
IST alto

VERDADEROS
POSITIVOS
VP

FALSO POSITIVO
FP

Negativo
(-)
FERRITINA normal
IST normal

FALSO
NEGATIVO FN

VERDADEROS
NEGATIVOS
VN

p g in a 278

C a pt u l o 4

p g in a 279

91,3
Mutacin C282Y

97
96
90

86
IST > 55%

88

90

92

Ferritina > 300 ng/ml varones

94

96

Ferritina > 200 ng/ml mujeres

98
IHH > 1,9

Genotypic/phenotypic correlations in genetic hemochromatosis: evolution of diagnostic criteria.Adams PC,


Chakrabarti S. Gastroenterology. 1998 Feb;114(2):319-23.

C a pt u l o 4

Valoracin conjunta del IST y ferritina en el


screening de la
hemocromatosis

IST (-) y Ferritina (-)

97

94
IST (+) y Ferritina (+)

92

93

94
Sensibilida
d

95
96
valor predictivo

negativo
Holman JR. Hereditary hemochromatosis. J Fam
Pract 1997; 44: 304-308.

97

p g in a 280

C a pt u l o 4

Pruebas diagnsticas en el cncer de


prstata
FAP
PSA
C ociente
PSA libre/ PSA total
Tacto rectal
C itologa aspiracin
Biopsia prosttica
mediante ecografa
transrectal

p g in a 281

C a pt u l o 4

Pruebas diagnsticas:
Mala rentabilidad diagnstica.
Baja sensibilidad y especificidad
(FAP)
Sanos

Enfermos

HPB
Cncer Prstata

FN

error

FP

error

Niveles de FAP

p g in a 282

C a pt u l o 4

Pruebas diagnsticas:
Buena rentabilidad diagnstica.
Equilibrio entre sensibilidad y especificidad
(PSA)
HPB

Cncer Prst

HPB
Cncer Prstata

Niveles de PSA (ng/ml)

error

error
error

p g in a 283

C a pt u l o 4

Pruebas diagnsticas:
Excelente rentabilidad diagnstica.
Mxima sensibilidad y especificidad (C ociente
PSA libre/total)
Sanos

Enfermos

HPB
Cncer Prstata

error

error

Cociente PSAlibre/total

p g in a 284

C a pt u l o 4

Situacin ideal de las pruebas


diagnsticas:

Frecuencia

Mxima sensibilidad y especificidad

HPB
Sanos

Su Negatividad indican
siempre la ausencia de la
enfermedad
Especificidad ~ 100%

Cncer Prstata
Enfermos

Su Positividad indican
siempre la presencia de la
enfermedad
Sensibilidad ~ 100%

p g in a 285

C a pt u l o 4

Situacin real de las pruebas diagnsticas:

Frecuencia

PSA - Buen equilibrio entre sensibilidad y


especificidad

HPB

Sanos

Cncer Prstata
Enfermos

Concentracin PSA (ng/ml)

Sensibilidad ~ 61%
Especificidad ~ 90%

Zona gris / Zona indeterminada

p g in a 286

C a pt u l o 4

Pruebas diagnsticas a evitar:


Fosfatasa cida prosttica
Mal equilibrio entre sensibilidad y
especificidad

Frecuencia

Baja Especificidad

HPB
sanos

Cncer Prstata
enfermos

Concentracin FAP

Sensibilidad ~ 60-70%
Especificidad ~ 40-50%

Zona gris / Zona indeterminada

p g in a 287

C a pt u l o 4

Frecuencia

Eleccin del punto de


corte
Punto de corte ideal

HPB

Cncer Prstata
Enfermos

Sanos

Especificidad = 100%

Su Negatividad indican
siempre la ausencia de la
enfermedad

Xideal

Sensibilidad = 100%

Su Positividad indican
siempre la presencia de la
enfermedad

p g in a 288

C a pt u l o 4

Eleccin del punto de


corte

Frecuencia

Punto de corte real

HPB

Concentracin PSA (ng/ml)

Las
no no
Las pruebas
pruebasdiagnsticas
diagnosticas
tienen
tienen un solo
unpar sensibilidad/
solo
par
especificidad
(S/E),
sino
sensibilidad/especificidad (S/E), sino
muchos,
cada
nivel
de de
muchos, uno
unoporpor
cada
nivel
decisin o punto de corte que
decisin o punto de corte que se
se adopte.

adopte

Cncer Prstata
Enfermos

Sanos

Sensibilidad ~ 61%
Especifcidad ~ 90%

Zona gris
Zona indeterminada

p g in a 289

C a pt u l o 4

Aumento del valor del punto de


corte

Frecuencia

Aumentar la especifcidad

HPB
sanos

enfermos
Cncer Prstata

Concentracin PSA (ng/ml)

Sensibilidad ~ 30%
Especificidad 99%

10

Para cualquier prueba en la que la distribucin de


los resultados de los grupos sano y enfermo se
solapen, existe un equilibrio entre sensibilidad y
especificidad. Ambas varan en direcciones
opuestas:
si
se AUMENTA el punto de corte
disminuye la sensibilidad, y aumenta la especificidad.

p g in a 290

C a pt u l o 4

D isminucin del valor del punto de


corte

Frecuencia

Aumentar la sensibilidad

Cncer Prstata

HPB

enfermos

sanos

1,0 4.0

Sensibilidad 92%
Especificidad ~ 35%

Concentracin PSA (ng/ml)

Para cualquier prueba en la que la distribucin de


los resultados de los grupos sano y enfermo se
solapen, existe un equilibrio entre sensibilidad y
especificidad. Ambas varan en direcciones
opuestas: si se DISMINUYE el punto de corte
aumenta la sensibilidad, y disminuye la
especificidad.

p g in a 291

C a pt u l o 4

PSA: ejemplo de error alfa (FP) y error beta


(FN)

Error
Error
PUNTO DE CORTE = 4 ng/ml
- Buena sensibilidad a la hora de detectar los CP
- Pero existe un nmero elevado de falsos positivos (HBP) > baja especificidad

p g in a 292

C a pt u l o 4

Sensibilidad y especificidad
diagnstica:
Pruebas
en el C ncerS de Prstata
Prueba
E
FAP

56%

94%

PSA

61%

90%

PSA libre/PSA total

69%

95%

Examen rectal

56%

82%

Citologa aspiracin

55%

91%

Patrn de oro
(tcnica de
referencia)
Biopsia de la
prstata mediante
Ecografa
transrectal

p g in a 293

C a pt u l o 4

p g in a 294

C onstruccin de la curva RO C para cada prueba


diagnstica
En el eje Y de coordenadas se sita la sensibilidad o fraccin de verdaderos positivos, calculada en los enfermos
1
SENSIBILIDAD DIAGNSTICA

La curva ROC es un
grfico que muestra todos
los pares posibles
sensibilidad/especificidad
resultantes de la variacin
continua de los puntos de
corte en todo el rango de
resultados observados.
La diagonal muestra por tanto
la peor situacin posible.

0
0

1
ESPECIFICIDAD
(Falsos positivos)

En el eje X se sita la fraccin de FP o 1 - especificidad, definida como 1 E = FP/VN + FP y calculada en


los no enfermos (sanos).

C a pt u l o 4

SENSIBILIDAD DIAGNSTICA

D iagrama de la curva RO C de la prueba


diagnstica A
1
A
Las curvas ROC son los mejores ndices
de la efectividad, rentabilidad o exactitud
diagnstica y proporcionan un criterio
unificador en el proceso de evaluacin de
una prueba, y de comparacin simultnea
de varias pruebas diagnsticas.

0
0

1
ESPECIFICIDAD
(Falsos positivos)

p g in a 295

C a pt u l o 4

SENSIBILIDAD DIAGNSTICA

D iagrama de la curva RO C de la prueba


diagnstica B
1
La diagonal muestra la peor
situacin posible.

El rea bajo la curva ROC es un


ndice de la EXACTITUD o
valor global de la prueba: la
exactitud mxima correspondera a
un valor del rea de 1 y la mnima
de 0.5

0 0

1
ESPECIFICIDAD
(Falsos positivos)

p g in a 296

C a pt u l o 4

D iagrama de la curva RO C del


PSA

Gann PH, Hennekens CH, Stampfer MJ. A prospective evaluation of plasma prostate.specific antigen for
detection of prostatic cancer. JAMA. 1995; 273: 289-294.

p g in a 297

C a pt u l o 4

Med Clin (Barc) 2006;127:416

p g in a 298

C a pt u l o 4

p g in a 299

C a pt u l o 4

p g in a 300

Introduccin (fragmento del


texto)
O bjetivos
El objetivo fundamental de este estudio es valorar la utilidad de la calprotectina fecal
(CPF) para predecir la presencia de una colonoscopia patolgica y, secundariamente,
analizar su uso para discriminar entre diferentes enfermedades orgnicas y
correlacionar sus valores con el grado de actividad clnica, endoscpica e histolgica en
pacientes con enfermedad inflamatoria intestinal (EII).

C a pt u l o 4

Pregunta de investigacin
Qu utilidad clnica tienen los niveles de calprotectina
fecal de
la actividad de la enfermedad inflamatoria intestinal?
Tcnica analtica a
valuar
C alprotectina fecal

Tcnica de
referencia
C olonoscopia:
(patrn
de oro)ndice de

actividad de la enfermedad
inflamatoria intestinal

p g in a 301

C a pt u l o 4

Resultados (fragmento del


texto)
La curva ROC mostr que el valor de CPF de 217 mg/kg fue el mejor punto de corte
para discriminar a los pacientes con enfermedad orgnica en colon. A partir de estos
datos, obtuvimos una sensibilidad de la medida de CPF del 85%, una especificidad del
81%, un valor predictivo positivo del 64% y un valor predictivo negativo del 93%,
respectivamente (p < 0,001).
Valor
Sensibilidad

85%

Especificidad

81%

Valor predictivo positivo

64%

Valor predictivo negativo

93%

p g in a 302

C a pt u l o 4

p g in a 303

D iscusin (fragmento del


texto)
En el presente estudio, la CPF ha mostrado ser una prueba altamente sensible para
detectar a pacientes con CCR y EII utilizando un punto de corte de 217 g/g.
La eleccin de un punto de corte ptimo debera realizarse a partir de un procedimiento
de referencia estndar, lo que en pacientes con dolor abdominal y diarrea implicar un
estudio gastrointestinal completo. De todas formas, siempre es aconsejable utilizar puntos
de corte ms bajos porque lo que debemos pretender con esta prueba es seleccionar a
los pacientes que requieren un estudio endoscpico posterior.

C a pt u l o 4

MITO 1: La sonrisa de la
esfinge
Me parece acertada la eleccin de la curva ROC. Sin embargo
Por qu no has incluido el grfico de la curva?
Cul es el rea de la curva ROC y su IC95%?
En la bibliografa existen datos de curvas ROC que dan datos inferiores de
rentabilidad diagnstica, que no coinciden con lo presentados por Garca Snchez et
al.
Cmo justificas esas diferencias?

p g in a 304

C a pt u l o 4

p g in a 305

D iagrama de la curva RO C de la
calprotectina fecal
S = 85%
S = 70%

E = 65%

E = 85%

Tibblea J et al. Faecal calprotectin and faecal occult blood tests in the diagnosis of colorectal carcinoma and
adenoma. Gut 2001;49:402-408.

C a pt u l o 4

p g in a 306

Interpretacin de Hanley y McN eil del rea bajo la


curva
RO C
- El rea bajo la curva (ABC) ROC es una medida global de la exactitud de una
prueba diagnstica.
- Se define como la probabilidad de clasificar correctamente un par de individuos
sano y enfermo, seleccionados al azar de la poblacin, mediante los resultados
obtenidos al aplicarles la prueba diagnstica.
- Es la probabilidad de que el resultado de la prueba se presente ms elevado en
el paciente enfermo
rea bajo la curva ROC = Probabilidad (X enfermo > X sano)
- En el ejemplo del PSA anterior un rea de 0,83 significa que un individuo seleccionado
al azar del grupo de enfermos tendr el 83% de las veces un valor de PSA
cuantitativamente mayor que el PSA de un individuo elegido al azar del grupo no enfermo
(sanos).
Hanley JA, McNeil BJ. The meaning and use of the area under a Receiver Operating Characteristic (ROC)
Curve. Radiology 1982; 143: 29-36.

C a pt u l o 4

Interpretacin de Swets del rea bajo la curva


RO C

p g in a 307

-El rea bajo la curva ROC es siempre mayor o igual que 0,5. Toma valores
comprendidos entre 0,5, si no existen diferencias en la distribucin de resultados de la
prueba entre
los grupos enfermo y sano, y 1,0, cuando existe separacin perfecta entre las
dos distribuciones.
- Swets interpreta el valor del rea de la siguiente manera:
- Entre 0,5 y 0,7 indican baja exactitud
- Entre 0,7 y 0,9 pueden ser tiles para algunos propsitos
- Valores mayor de 0,9 indica alta exactitud.
-La capacidad de discriminacin de la prueba diagnstica puede evaluarse estimando el
intervalo de confianza del rea de la curva ROC. Si el intervalo no incluye el valor 0,5 la
prueba es capaz de discernir entre enfermos y sanos.
-En el ejemplo del PSA anterior el rea de 0,83 debe ser interpretado que la prueba
puede ser til en algunas situaciones clnicas, pero no es til por ejemplo, para realizar
programas de screening de la poblacin en bsqueda del cncer de prstata en la
poblacin general.
Swets JA. Measuring the accuracy of diagnostic systems. Science 1988; 240: 1.285-1.293.

C a pt u l o 4

C omparacin del rea bajo la


curva:

SENSIBILIDAD DIAGNSTICA

Prueba A versus prueba B


1
A
B

El rea de la curva ROC es la


probabilidad de clasificar correctamente
un par de individuos sano y enfermo,
seleccionados al azar de la poblacin en
estudio, mediante los resultados obtenidos al
aplicarles la prueba diagnstica.

El rea bajo la curva ROC es el mejor indicador de la


capacidad predictiva del la prueba, y permite
la comparacin entre diferentes pruebas diagnsticas.

0
0

1 ESPECIFICIDAD
(Falsos positivos)

p g in a 308

C a pt u l o 4

C omparacin del rea bajo la


curva:

SENSIBILIDAD DIAGNSTICA

Prueba A versus prueba B


A = REA de la curva A

B = REA de la curva B

A
B

Qu prueba diagnstica (A
versus
B) presenta una mayor rentabilidad,
efectividad, exactitud o valor global?
Estadstico Z de Hanley y McNeil (1983)
0
0

1 ESPECIFICIDAD
(fraccin de Falsos
positivos)

p g in a 309

C a pt u l o 4

p g in a 310

C omparacin del rea de las curvas RO C en


muestras
independientes
Z =

( A 1 A 2)
( EEA )2 + (EE
1

)2

A1 = rea bajo la curva ROC de la tcnica


1 A2 = rea bajo la curva ROC de la
tcnica 2
EEA 1 = error estndar del rea bajo la curva ROC de la tcnica
Si
el
estudio
se
realizaestndar
en grupos INDEPENDIENTES,
de reas
1
EE
error
del rea bajo lala comparacin
curva ROC
de lamediante mtodos
A 2 =es
estadsticos
directa. Si se utilizan datos APAREADOS o dependientes es necesario calcular previamente
la correlacin r entre las pruebas coeficiente de correlacin entre ambas tcnicas para muestras
independientes
tcnica 2 vale cero (r = 0).

C a pt u l o 4

C omparacin del rea de las curvas RO C en


muestras
apareadas
Z =

( A 1 A 2)
( EEA )2 + (EE A 2 )2 - 2 r * EEA * EEA
1

A1 = rea bajo la curva ROC de la tcnica


1 A2 = rea bajo la curva ROC de la
tcnica 2
EEA 1 = error estndar del rea bajo la curva ROC de la tcnica
1 EEA 2 = error estndar del rea bajo la curva ROC de la
tcnica 2

p g in a 311

C a pt u l o 4

C omparacin del rea bajo la curva:


prueba A
versus prueba B

SENSIBILIDAD DIAGNSTICA

0,
9
0,
0,
8
7

B
A

0,
6
0,
5
0,
3
0,
0,
4
2
0,
1

Qu prueba diagnstica (A versus B)


presenta una mayor rentabilidad,
efectividad, exactitud o valor global?
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8
0,9 1
1 ESPECIFICIDAD

(fraccin de Falsos
positivos)

Dos curvas ROC (A


y B) con igual rea.
Sin embargo, estas
dos curvas ROC no
son idnticas. La
prueba B es
superior a la
prueba
A en el rango alto
de falsos positivos
(o intervalo de alta
sensibilidad),
mientras que en la
zona baja de falsos
negativos
(intervalo de baja
sensibilidad) la
prueba A es
superior a la B

p g in a 312

C a pt u l o 4

Pregunta de investigacin
Qu utilidad clnica tienen los niveles de urea en
sangre
en el diagnstico de la insuficiencia renal?
Objetivo: Evaluacin de la uremia en el diagnstico de la
insuficiencia
Tcnica analtica a
Tcnica de
renal.
valuar
referencia
Uremia (mg/dl)
Insuficiencia
renal
(patrn
de oro)

Cul es el test estadstico ms


acertado?

p g in a 313

C a pt u l o 4

Tipos de error en las pruebas


diagnsticas
Tipos de error en las pruebas diagnsticas

Enfermedad en estudio
Insuficiencia renal
No enfermos

Valor del punto de corte 90 mg/dl


Test de laboratorio
uremia

Positivo
(+)
Uremia
> 90
mg/dl
Negativo
(-)
Uremia
90
mg/dl

VERDADEROS
POSITIVOS
VP

FALSO POSITIVO
FP

FALSO
NEGATIVO FN

VERDADEROS
NEGATIVOS
VN

p g in a 314

C a pt u l o 4

VN

FP

Individuos SIN
Insuficiencia renal
Uremia mg/dl

300 mg/dl

Pacientes
Insuficiencia renal
FN

VP
Punto de corte
optimo 90 mg/dl

p g in a 315

C a pt u l o 4

Individuos SIN
Insuficiencia renal

Frecuencia

Pacientes con
Insuficiencia renal

50

100

200

150

Uremia mg/dl
Punto de corte optimo 90 mg/dl

250

300 mg/dl

p g in a 316

C a pt u l o 4

1,00

SENSIBILIDAD DIAGNSTICA
(fraccin de verdaderos
positivos)

Curva ROC
de la uremia
0,75

0,50
Las
curvas
ROC
Las curvas
ROC
son ndices
son
la
de landices
exactitudde
diagnostica
y
exactitud
y
proporcionandiagnstica
el mejor criterio
proporcionan
mejorde
unificador en el el
proceso
criterio
en el
evaluacinunificador
de una prueba.
proceso de evaluacin de
una prueba.

0,25

0,00
0,00

0,25

0,50

(fraccin de 0,75
Falsos positivos)
1 ESPECIFICIDAD

1,00

p g in a 317

C a pt u l o 4

Pregunta de investigacin
Qu tcnica analtica presenta una mayor exactitud,
valor global, rentabilidad, o efectividad clnica la urea o
la creatinina srica en el diagnstico de la insuficiencia
renal?
Objetivo: Evaluacin de la urea frente a la creatinina en el diagnstico de
la insuficiencia renal.
Urea (srica)

Cul es el test estadstico ms


acertado? Comparacin del rea bajo la
curva ROC

C reatinina (srica)

p g in a 318

C a pt u l o 4

1,00

Curva ROC
de la creatinemia

SENSIBILIDAD DIAGNSTICA
(fraccin de Verdaderos Positivos)

)
s

0,75

Curva ROC
de la uremia

Ao
Cv
iIt
ST

0,50

Cuanto ms prxima se sita una


curva ROC a la esquina superior
izquierda, ms alta es la exactitud
diagnstica de la prueba.
Si
comparamos en el mismo grfico las
curvas obtenidas con la urea y la
creatinina, sta ltima por estar
situada ms hacia arriba y hacia la
izquierda tendr la mayor exactitud.

0,25

s
0,00

AG

0,00

e
o
r
Id
D

0,25

0,50

(fraccin de Falsos Positivos)


1 ESPECIFICIDAD

0,75
1,00

p g in a 319

C a pt u l o 4

p g in a 320

Pregunta de investigacin
Qu prueba diagnstica (uremia versus creatinemia)
presenta una mayor rentabilidad, exactitud o valor global
en el diagnstico de la insuficiencia renal?
Variables
contrastadas

rea bajo la curva Error estndar del Lmite inferior del


ROC
rea
intervalo de
confianza al 95%

Lmite superior
del intervalo de
confianza al 95%

Uremia

0,930

0,012

0,906

0,955

Creatinemia

0,984

0,005

0,974

0,994

Cul es el test estadstico ms


acertado?

C a pt u l o 4

C omparacin del rea de las curvas RO C en


muestras
dependientes
Z =

( A 1 A 2)
( EEA )2 + (EE A 2 )2 - 2 r * EEA * EEA
1

A1 = rea bajo la curva ROC de la tcnica


1 A2 = rea bajo la curva ROC de la
tcnica 2
EEA 1 = error estndar del rea bajo la curva ROC de la tcnica
1 EEA 2 = error estndar del rea bajo la curva ROC de la
tcnica 2

p g in a 321

C a pt u l o 4

p g in a 322

( A 1 A 2)
Z =

( EEA )2 + (EE
1

A 1 (creatinina) =
0,984
A 2 (urea) = 0,930

)2

2 r * EEA * EEA
1

EEA1 (creatinina) = 0,005.

EEA2 (urea) = 0,012.

Hiptesis nula Ho: A1 A2 = 0 .


Hiptesis alternativa Ha: A1 A2
0.
Resultado: El estadstico para la comparacin de ambas curvas Z de Hanley
y McNeil vale 4,15 que como es mayor que Z95% = 1,96 .
Conclusin: Ambas pruebas tienen un rendimiento significativamente
distinto.

C a pt u l o 4

Pregunta de investigacin
Qu utilidad clnica tienen los niveles de VC M en el
diagnsti- co de la anemia ferropnica?
Objetivo: Evaluacin del VCM en el diagnstico de la anemia ferropnica.
Tcnica analtica a
valuar
VC M
(hemograma)

Cul es el test estadstico ms


acertado?

Tcnica de
referencia
D epsitos
Fe en mdula sea
(patrn
de de
oro)

p g in a 323

C a pt u l o 4

Tipos de error en las pruebas


diagnsticas
Tipos de error en las pruebas diagnsticas

Test de laboratorio
VCM
(hemograma)

p g in a 324

Examen de los depsitos de hierro en mdula sea

Dficit de Fe

Presencia de Fe

Positivo
(+)
VCM
BAJO
(microci
tosis)

VERDADEROS
POSITIVOS
VP

FALSO POSITIVO
FP

Negativo
(-)
VCM
NORMAL

FALSO
NEGATIVO FN

VERDADEROS
NEGATIVOS
VN

C a pt u l o 4

VC M en 100 pacientes con


diagnstico de
anemia ferropnica
Tcnica de referencia: Examen de los
depsitos de hierro en mdula sea

Volumen corpuscular medio (VCM)

Ausencia de Hierro (n= 33)

52, 58, 62, 65, 67, 68, 70, 72, 72, 73, 73, 74,75,
77, 77, 77, 78, 78, 80, 80, 81, 81, 81, 81, 84, 84,
85, 85, 87, 88, 88, 92, 92

Presencia de hierro (n=67)

60, 66, 68, 69, 71, 71, 71, 73, 74, 74, 74, 76,76,
77, 77, 77, 78, 79, 79, 79, 80, 80, 81, 81,82, 82,
82, 83, 83, 83, 83, 83, 83, 83, 83, 84,84, 84, 85,
85, 86, 86, 86, 86, 88, 88, 88, 89,89, 89, 90, 90,
90, 91, 91, 93, 93, 93, 94, 94,94, 94, 96, 97, 98,
100, 103

Beck JR, Shultz EK. The use of relative operating characteristic (ROC) curves in test performance
evaluation. Arch Pathol Lab Med 1986; 110:13-20.

p g in a 325

C a pt u l o 4

110
100
Tcnica analtica a evaluar
90

VCM
(hemograma)

80
70
60

F
N

V
N

F
P

V
P

50

Hierro normal

VCM < 80
Sensibilidad = 55,9%
Especificidad = 71,2%

Hierro BAJO

Examen de los depsitos de hierro en mdula sea


Tcnica de referencia (patrn de oro)

p g in a 326

C a pt u l o 4

110
100
Tcnica analtica a evaluar
90

VCM
(hemograma)

80

F
N

V
N

70
60
50

F
P
Hierro normal

VCM < 65
Sensibilidad = 8,8%
Especificidad = 98,5%

V
P
Hierro BAJO

Examen de los depsitos de hierro en mdula sea


Tcnica de referencia (patrn de oro)

p g in a 327

C a pt u l o 4

110
100
Tcnica analtica a evaluar
90

VCM
(hemograma)

F
N

V
N

F
P

V
P

Hierro normal

Hierro BAJO

80
70
60
50

VCM < 90
Sensibilidad = 94,1%
Especificidad = 25,8%

Examen de los depsitos de hierro en mdula sea


Tcnica de referencia (patrn de oro)

p g in a 328

C a pt u l o 4

SENSIBILIDAD DIAGNSTICA
(fraccin de Verdaderos Positivos)

100

p g in a 329

pruebas
diagnsticas
LaLa
pruebas
diagnosticas
no tienen un
nopar
tienen
un solo par
solo
sensibilidad/especificidad
(S/E),
sino muchos, uno por cada
sensibilidad/especificidad
nivel
de decisin
punto de corte
que
(S/E),
sino omuchos,
uno
se adopte.

VCM < 81

por cada nivel de decisin


o punto de corte que se
adopte.

80

60
Cul ser el par que describa

la exactitud de la prueba?

40
20
0
0
100

20

40

60

80

1 ESPECIFICIDAD
(fraccin de Falsos Positivos)

Punto de corte ideal para el


VCM es de < 81, valor lmite que
permite resumir los resultados de
una escala continua en dos
categoras: positivo y negativo
con una mayor exactitud o
rentabilidad diagnstica.

VCM < 81
Sensibilidad = 61%
Fraccin de FP = 30%
Especificidad = 70%

El clculo del rea bajo la curva es de 0,717 con un EE de 0,05, es decir, el VCM es una prueba diagnstica
de baja rentabilidad, y por tanto no se aconseja, como prueba nica, en el diagnstico de la anemia
ferropnica.

C a pt u l o 4

p g in a 330

C a pt u l o 4

p g in a 331

C a pt u l o 4

p g in a 332

C a pt u l o 4

p g in a 333

C a pt u l o 4

Pregunta de investigacin
Qu tcnica analtica presenta una mayor rentabilidad,
el VC M
o la ferritina en el diagnstico de la anemia ferropnica?
Objetivo: Evaluacin del VCM frente a la ferritina en el diagnstico de
la anemia ferropnica.
VC M
(hemograma)

Cul es el test estadstico ms


acertado? Comparacin del rea bajo la
curva ROC

Ferritina (srica)

p g in a 334

C a pt u l o 4

Punto Corte VCM

Sensibilidad
(%)

Especificidad
(%)

100 especificidad
(%)

65

8,8

98,5

1,5

70

20,6

93,9

6,1

75

38,2

84,8

15,2

80

55,9

71,2

28,8

85

79,4

43,9

56,1

90

94,1

25,8

74,2

92

97,1

19,7

80,3

Construccin de la curva ROC: Es un grfico que muestra todos los pares sensibilidad/especificidad
resultantes de la variacin continua de los puntos de corte en todo el rango de resultados observados.

p g in a 335

C a pt u l o 4

p g in a 336

C omparacin del rea bajo la curva: ferritina srica


versus
100
VC M
Ferritina

SENSIBILIDAD DIAGNSTICA

A
CI
ST

N
A
G
ID
A
D
D
I
L
BI
SI
S
E
N

VCM
Para comparar el VCM con los niveles
sricos de ferritina, se construye para
ella otra curva y se calculara su rea.
Se comparan las reas mediante el
estadstico Z de Hanley y McNeil (1983).
0
0

1 ESPECIFICIDAD
(Falsos positivos)

10
0

Hanley JA, McNeil BJ. A method of comparing the areas under receiver operating characteristic curves
derived from the same cases. Radiology 1983; 148: 839-843.

C a pt u l o 4

C omparacin del rea de las curvas RO C en


muestras
dependientes
Z =

( A 1 A 2)
( EEA )2 + (EE A 2 )2 - 2 r * EEA * EEA
1

A1 = rea bajo la curva ROC de la tcnica


1 A2 = rea bajo la curva ROC de la
tcnica 2
EEA 1 = error estndar del rea bajo la curva ROC de la tcnica
1 EEA 2 = error estndar del rea bajo la curva ROC de la
tcnica
Hanley JA, 2
McNeil BJ. A method of comparing the areas under receiver operating characteristic curves
derived from the same cases. Radiology 1983; 148: 839-843.

r = coeficiente de correlacin entre las reas de ambas tcnicas

p g in a 337

C a pt u l o 4

p g in a 338

( A 1 A 2)
Z =

( EEA )2 + (EE
1

A 1 (creatinina) =
0,984
A 2 (urea) = 0,930

)2

2 r * EEA * EEA
1

EEA1 (creatinina) = 0,005.

EEA2 (urea) = 0,012.

Hiptesis nula Ho: A1 A2 = 0 .


Hiptesis alternativa Ha: A1 A2
0.
Resultado: El estadstico para la comparacin de ambas curvas Z de Hanley
y McNeil vale 4,15 que como es mayor que Z95% = 1,96 .
Conclusin: Ambas pruebas tienen un rendimiento significativamente
distinto.

C a pt u l o 4

C omparacin del rea bajo la curva: ferritina


srica
versus VC M

p g in a 339

C a pt u l o 4

Eleccin del punto de corte:


Criterio basado en el equilibrio de riesgos y beneficios
de
las decisiones mdicas
Es un enfoque prctico que se basa en el cociente entre los costes de un
resultado falso positivo (FP) frente a un falso negativo (FN), en funcin
de la prevalencia (P) de la enfermedad. El valor de corte ptimo se
determina hallando el punto de la curva ROC cuya tangente a la curva
tiene de pendiente el valor de m.

Coste de FP

m = Coste de FN

1-P
P

Zweig MH, Campbell G. Receiver-operating characteristic (ROC) plots: a fundamental evaluation tool in
clinical medicine. Clin Chem 1993; 39: 561-577.
McNeil BJ, Keeler E, Adelstein SJ. Primer on certain elements of medical decision making. N Engl J Med
1975; 293: 211-215.

p g in a 340

C a pt u l o 4

p g in a 341

Eleccin del punto de


corte:
Postulados de1.Galen
y
C riterio de mxima SEN SIBILIDAD D IAGN STIC A
Gambino
Se elige la mayor sensibilidad posible cuando:
1. La enfermedad sea grave y no pueda pasar inadvertida.
2. La enfermedad sea tratable, y
3. Los resultados falsos positivos no supongan un traumatismo
psicolgico o econmico en los individuos examinados.
Podras poner algn ejemplo?

Galen RS, Gambino SR. Beyond normality: The predictive value and efficiency of medical diagnoses. Nueva
York: J Wiley and Sons, lnc., 1975.

C a pt u l o 4

C ribado poblacional de cncer de mama (C aM)


Programa preventivo destinado a la deteccin precoz de CaM mediante la
realizacin de mamografa bilateral con periodicidad bienal en mujeres de
45 a 70 aos. La realizacin del screening permite la deteccin precoz de
CaM en un estadio menos avanzado que el que correspondera a un
diagnstico clnico, lo que supone una considerable mejora en cuanto a la
afectacin, pronstico de la enfermedad y reduccin de aos de vida
perdidos.
Variable
PRED IC TO RA
Mamografa bilateral
Cualitativa
dicotmica

Variable
RESULTAD O
C ncer de mama
Cualitativa
dicotmica

p g in a 342

C a pt u l o 4

p g in a 343

C umple los postulados de Galen y Gambino?


En Espaa se ha descrito que la tasa acumulada de falsos positivos en un
programa de cribado de mama es del 30% tras 10 determinaciones
bianuales (1). De hecho, diversos estudios han demostrado que, por cada
muerte prevenida a travs de un programa de cribado, han aparecido al
menos 200 resultados falsos positivos (2). En respuesta a este hecho, la
OMS ha incidido en nuevos criterios para los programas de cribado,
centrndose en aspectos ticos, en las consecuencias psicolgicas de
resultados falsos positivos y en la necesidad del consentimiento informado
(3).
1. Castells X, Molins E, Macia F. Cumulative false positive recall rate and association with participant
related factors in a population based breast cancer screening programme. J Epidemiol Community Health.
2006;60:316-21.
2. Raffle AE, Alden B, Quinn M, Babb PJ, Brett MT. Outcomes of screening to prevent cancer: analysis
of cumulative incidence of cervical abnormality and modelling of cases and deaths prevented. BMJ.
2003;326:901.
3. Brodersen J, McKenna SP, Doward LC, Thorsen H. Measuring the psychosocial consequences of
screening. Health Qual Life Outcomes. 2007;5:3.

C a pt u l o 4

C ribado poblacional del cncer de pulmn


(C P)
mediante TC
Variable
PRED IC TO RA
Tomografa computarizada (TC )
Cualitativa
dicotmica

Cumple los postulados de Galen y


Gambino?

Variable
RESULTAD O
C ncer de pulmn
Cualitativa
dicotmica

p g in a 344

C a pt u l o 4

p g in a 345

Un estudio publicado por Bach et al (2007) acerca del cribado de cncer de


pulmn sealaba que el uso de la tomografa computarizada (TC) puede
aumentar la tasa de diagnstico y tratamiento de dicho cncer sin reducir el
riesgo de avance de la enfermedad o la mortalidad. Por lo tanto, concluan
la inutilidad del cribado en la prevencin del cncer de pulmn.

Bach PB, Jett JR, Pastorino U, Tockman MS, Swensen SJ, Begg CB. Computed tomography screening and
lung cancer outcgomes. JAMA. 2007;297:953-61.

C a pt u l o 4

C ribado poblacional de cncer de colon


Programa preventivo destinado a la deteccin precoz de
colon
Variable
PRED IC TO RA
D eteccin de SAN GRE O C ULTA
Cualitativa
en heces (guayacol)
dicotmica

Variable
RESULTAD O
C ncer de colon
Cualitativa
dicotmica

Sensibilidad = 40-80%
Especificidad = 90-99%

La sensibilidad de la prueba es tan slo de 5060% cuando se lo utiliza


una vez, pero puede ascender a 90% cuando se la utiliza cada 12 aos
en un perodo de tiempo prolongado (sensibilidad programtica).

p g in a 346

C a pt u l o 4

p g in a 347

C ribado poblacional de cncer de colon


Programa preventivo destinado a la deteccin precoz de
colon
El cncer de colon es el tipo de cncer con mayor posibilidad de deteccin
precoz y que responde mejor al tratamiento en estadios iniciales, por ello se
propone una prueba gentica a la poblacin diana: hombres y mujeres a
partir de los 50 aos..
Variable
PRED IC TO RA
D eteccin de la forma
Cualitativa
metilada del gen Septina 9
dicotmica
(SEPT9).

Variable
RESULTAD O
C ncer de colon
Cualitativa
dicotmica

Sensibilidad = 67%
Especificidad = 88%

C a pt u l o 4

C umple los postulados de Galen y Gambino?


Los resultados FALSOS POSITIVOS causan ansiedad y pueden
conducir a un aumento de pruebas invasivas para determinar si hay
enfermedad
realmente, en este caso una prueba positiva a la deteccin de sangre
oculta en heces ser seguida por una colonoscopia.

p g in a 348

C a pt u l o 4

Falsos positivos versus Falsos


negativos
1.Gravedad o importancia en salud pblica. Si la enfermedad puede ser tratada
y detectada evitando complicaciones posteriores han de utilizarse pruebas con
alta SENSIBILIDAD, es decir con baja tasa de FALSOS NEGATIVOS.
2.Si el coste del proceso asistencial (posibles pruebas invasivas complementarias,
exmenes y cuidados mdicos y de enfermera requeridos ) del enfermo es alto se
deben elegir pruebas con alta ESPECIFICIDAD, para reducir los falsos positivos.
3.Si la enfermedad diagnosticada conlleva consecuencias psicosociales graves, como
la infeccin por VIH, han de minimizarse los falsos positivos, eligiendo pruebas de
alta ESPECIFICIDAD.
4.Baja prevalencia de la enfermedad. En los programas de screening se eligen
pruebas de alta ESPECIFICIDAD, para reducir la tasa de falsos positivos y as
garantizar la eficiencia del programa.

p g in a 349

C a pt u l o 4

p g in a 350

Las carencias metodolgicas en la investigacin evaluativa de pruebas diagnsticas


explican en parte la inadecuacin del uso de pruebas diagnsticas. Por otra parte, no se
ha considerado la potencial iatrogenia atribuible al uso de pruebas diagnsticas, y se
hace necesaria una monitorizacin de los posibles efectos adversos derivados de
cualquier tecnologa diagnstica, as como la informacin detallada a los pacientes de sus
beneficios y riesgos, tanto en el campo del cribado como en el del diagnstico clnico.

C a pt u l o 4

p g in a 351

Eleccin del punto de


corte:
Postulados de2. Galen
y
C riterio de mxima ESPEC IFIC IDAD D IAGN STIC A
Gambino
Se elige la mayor especificidad posible cuando:
1. La enfermedad sea importante pero difcil de curar o incurable, y
2. El hecho de conocer que no se padezca la enfermedad tiene una
importante carga sanitaria y psicolgica.
Podras poner algn ejemplo?

Galen RS, Gambino SR. Beyond normality: The predictive value and efficiency of medical diagnoses. Nueva
York: J Wiley and Sons, lnc., 1975.

C a pt u l o 4

p g in a 352

Eleccin del punto de


corte:
Postulados de 3.Galen
y
C riterio de alto VALO R PRED IC TIVO PO SITIVO
Gambino
Se elige un alto VPP cuando:
El tratamiento de los falsos positivos (FP) pueda tener
consecuencias graves en personas que NO tienen la enfermedad.

VP

VPP

VP + FP

Galen RS, Gambino SR. Beyond normality: The predictive value and efficiency of medical diagnoses. Nueva
York: J Wiley and Sons, lnc., 1975.

C a pt u l o 4

p g in a 353

Eleccin del punto de


corte:
Postulados de 4.Galen
y
C riterio de mxima EX AC TITUD D IAGN STIC A
Gambino
Se desea una elevada exactitud (efectividad, valor global o
rentabilidad diagnstica) cuando:
1. La enfermedad sea importante pero curable, y
2. Tanto los falsos positivos (FP) como los falsos negativos (FN)
supongan un traumatismo y conlleven consecuencias graves.

Galen RS, Gambino SR. Beyond normality: The predictive value and efficiency of medical diagnoses. Nueva
York: J Wiley and Sons, lnc., 1975.

C a pt u l o 4

Ventajas de las curvas RO C en la evaluacin de


pruebas diagnsticas
1. Son una representacin grfica fcilmente comprensible de la capacidad de
discriminacin de la prueba diagnstica en todo el rango de puntos de corte.
2. Son simples, grficas y fciles de interpretar visualmente.
3. No requieren un nivel de decisin particular porque est incluido todo el espectro
de puntos de corte.
4. Son independientes de la prevalencia, ya que ni la sensibilidad ni la especificidad
dependen de ella.
5. Proporcionan una comparacin visual directa entre distintas pruebas en una
escala comn, mientras que otro tipo de grficos, como los diagramas de puntos o
los histogramas de frecuencias requieren diferentes grficos cuando difieren las
escalas.
6. La especificidad y la sensibilidad son fcilmente accesibles en el grfico, en
contraste
con los diagramas de puntos y los histogramas.
Zweig MH, Campbell G. Receiver-Operating Characteristic (ROC) Plots: fundamental evaluation tool
in
clinical medicine. Clin Chem 1993; 39: 561-577.

p g in a 354

C a pt u l o 5

C aptulo 5
Publicacin Bioestadstica: Anlisis
bivariante. Test de contraste de hiptesis.
Cualitativa versus cualitativa.

D r. Jacobo D az Portillo
Coordinador de Formacin Continuada
Hospital Universitario de Ceuta

p g in a 355

C a pt u l o 5

Materiales y mtodos
Estructura
1. Tipo de diseo (estudio)
2. Sujetos incluidos (criterios de seleccin de la muestra)
3. Fuentes de informacin
4. Descripcin de la intervencin y definicin del punto final de la
investigacin (estudios experimentales)
5. Instrumentos y procedimientos de medida (cuestionarios)
6. Definicin de las variables y covariables incluidas en el estudio (factor
de estudio y criterio de evaluacin)
7. Limitaciones y consideraciones ticas de la investigacin
8. Pruebas estadsticas a utilizar (programa estadstico)

p g in a 356

C a pt u l o 5

Fases del anlisis


estadstico
1. ANLISIS DESCRIPTIVO

2. ANLISIS BIVARIANTE

3. ANLISIS MULTIVARIANTE

p g in a 357

C a pt u l o 5

D ecisiones que se pueden tomar en un test de


contraste de hiptesis despus de conocer el valor
de significacin estadstica p
p < 0,05 A B
Se rechaza la hiptesis nula
No parece que el azar
pueda explicarlo todo
El EFECTO observado es mayor
que el ERROR
Hay diferencias estadsticamente
significativas
Existen evidencias a favor de la
hiptesis alternativa Ha, y por
tanto rechazamos la hiptesis nula
Ho

p 0,10
A= B
No se puede rechazar la hiptesis nula
No se puede descartar que el azar
lo explique todo
El EFECTO observado es similar que
el ERROR
NO hay diferencias estadsticamente
significativas
NO existen evidencias a favor de
la hiptesis alternativa Ha, y por
tanto aceptamos la hiptesis nula
Ho

Los lmites de 0,05 y 0,1 pueden ser considerados en cierto modo


arbitrarios y aproximados

p g in a 358

C a pt u l o 5

Anlisis estadstico
Tipos de test analticos estadsticos de contraste de hiptesis
segn el tipo de variables implicadas en el estudio
Variable
dependiente
Variable Continua
resultado
Dicotmica
Variable
Predictor
a
Variable
Independien
te

Dicotmica

Test de 2

t de Student

Continua

Regresin
lo- gstica

Regresin lineal

p g in a 359

C a pt u l o 5

Anlisis
estadstico
ANLISIS ESTADSTICO
Variable
Predictor
a
Variable
Independien
te

Variable resultado
Dicotmica
Continua

Dicotmica

Test de 2

t de Student

Continua

Regresin
lo- gstica

Regresin lineal

Test de 2

p g in a 360

C a pt u l o 5

p g in a 361

Tipos de test analticos estadsticos bivariantes de


contraste
de
hiptesis ms
frecuentes
Variable
Variable RESULTADO o Dependiente (Criterio de evaluacin)
PREDICTORA o
Independiente
(factor de estudio)

Cualitativa
nominal dos
categoras

Cualitativa dos
grupos
independientes

Chi cuadrado
Z comparacin de
proporciones
Test exacto
de Fisher
Test de McNemar

Cualitativa dos
grupos apareados

Cualitativa
nominal
>2
categoras
Chi cuadrado

Cualitativa
ordinal o
Cuantitativa NO
paramtrica
U de Mann-Whitney

Cuantitati
va
paramtric
a
T de Student
(prueba de Welch)

Q de Cochran

Prueba de
los rangos
de Wilcoxon

Prueba de
Kruskal- Wallis
Prueba de
Friedman

T de
Student
para datos
emparejad
os
Anlisis de la Varianza
(ANOVA)
Anlisis de la
Varianza de dos
vas
Regresin lineal
Correlacin de
Pearson

Cualitativa > 2 grupos


independientes
Cualitativa > 2 grupos
apareados

Chi cuadrado

Chi cuadrado

Q de Cochran

Q de Cochran

Cuantitativa

Regresin logstica

Regresin
logstica

Correlacin de
Sperman
Tau de Kendall

C a pt u l o 5

p g in a 362

Pruebas estadsticas de contraste de


hiptesis ms aplicables a cada situacin
Variable
Independiente
o PREDICTORA

Variable
Dependiente
o RESULTADO

Pruebas de contraste de
hiptesis

Observaciones y/o limitaciones del test

Cualitativa

Cualitativa

Ji cuadrado
Prueba exacta de
Fisher Test de
McNemar
Q de Cochran
REGRESIN LOGSTICA

Cualitativa

Cuantitativa

Cuantitativa

Cualitativa

Cuantitativa

Cuantitativa

t de Student
Anlisis de la
Varianza Test de
Mann-Whitney Test
de Wilcoxon
Test de KruskallWallis Test de
Friedman
Regresin logstica simple
Regresin logstica
multivariante
Regresin lineal
simple Correlacin de
Pearson Correlacin
de Sperman
REGRESIN MLTIPLE

Si el tamao muestral es
grande Si el tamao muestral
es pequeo
Dos grupos de muestras
repetidas o apareadas
Ms de dos grupos de muestras repetidas o
apareadas Varias variables predictoras
cualitativas
Compara medias entre dos grupos independientes
Compara medias entre ms de dos grupos
independientes Dos grupos independientes No
paramtricos
Dos grupos medidas repetidas No paramtrico
Ms de dos grupos No paramtrico, medidas
repetidas Ms de dos grupos No paramtrico
medidas repetidas
Una sola variable predictora cuantitativa
Varias variable predictoras cuantitativa o cualitativas
Paramtrico
Paramtrico
No
paramtrico
Varias
variables
predictoras

C a pt u l o 5

D atos categricos:
Cualitativa versus cualitativa.
N ominales

- Test de 2 de Pearson
- Relacin entre dos variables cualitativas nominales o policotmicas
- Comparacin de proporciones
- Correccin de Yates
- Test exacto de Fisher
- Valores esperados menores de 5
- Razn de verosimilitud
- Evaluacin de pruebas diagnsticas
- Test de 2 de McNemar
- Datos apareados o emparejados
- Coeficiente PHI ()
- V de Cramer
- Coeficiente de contingencia
- Coeficiente de incertidumbre
- Tau de Goodman y Kruskal
- Lambda de Goodman y Kruskal (coeficiente de predictibilidad de
Guttman)

p g in a 363

C a pt u l o 5

D atos categricos:
Cualitativa versus cualitativa.
O rdinales
- Test de 2 de tendencia lineal
- Tau-B de Kendall o Stuart
- Tau-C de Kendall
- Coeficiente Gamma de Goodman y
Kruskal
- D de Somers
- Correlacin de Spearman
Estos estadsticos N O se pueden
utilizar cuando alguna de las
variables sea N O MIN AL

p g in a 364

C a pt u l o 5

Test de 2 de
Pearson
Variable RESULTADO
Variable PREDICTORA

(+)

(-)

Total

Si

a+b

No

c+d

Total

a+c

b+d

n ( a d b c )2

(a + b) (c + d) (a + c) (b + d)
Grados de libertad = [ K - 1] [F - 1]

2 =

( fo
fef)o
o

p g in a 365

C a pt u l o 5

Test de 2 de Pearson
Grados de libertad = [K - 1] [F 1]Tabla de valores crticos (tabulados) de
2

Grados de libertad

Tabla 2 x F

Valores crticos con un nivel de


confianza del 95%

3,84

2
3

3
4

5,99
7,81

9,49

11,07

12,59

100

99

124,34

K = n de columnas
F = n de filas

p g in a 366

C a pt u l o 5

Frecuencia relativa esperada

Influencia de los Grados de libertad k en la


distribucin de
probabilidades de 2 de Pearson
Grados
(gl) == (K
Grados de
de libertad
libertad (gl)
(K -- 1)
1) (F
(F 1)
1)

2 de Pearson para gl=1


2 de Pearson para gl=2

2 de Pearson para
gl=3
2 de Pearson para
gl=6

p g in a 367

C a pt u l o 5

Frecuencia relativa esperada

2 =
=

(( ffo
ffe ))2
fo

f o = frecuencia
observada

f e = frecuencia
Error alfa

esperada

Ho

Ha

= 3,84

Pearson tabulado

p g in a 368

C a pt u l o 5

Influencia de los Grados de libertad k en la


distribucin de
probabilidades de 2 de Pearson
Grados de libertad (gl) = (K - 1) (F 1)
gl = 3

gl = 5

K = n de columnas
F = n de filas

gl = 10
Grados de libertad

7,81

2 3 4

6 7

11,07

8 9 10 11 12 13 14 15

p g in a 369

C a pt u l o 5

p g in a 370

Test de 2 de Pearson
C ondiciones necesarias y suficientes de aplicacin
1. Ambas variables deben ser cualitativas en escala NOMINAL.
2. Nmero de sujetos estudiados igual o superior a 40 (n>40)
3. Ninguno de los valores esperados en cada casilla debe ser menor de 5
4. No se debe aplicar cuando la variable dependiente o resultado es
ORDINAL
5. Es un test no dirigido (test de planteamiento bilateral), que nos indica si
existe o no relacin entre dos variables cualitativas pero no en qu
sentido se produce tal, ni cuantifica la intensidad de dicha asociacin.

La prueba permite comprobar si dos variables cualitativas estn o no asociadas. Si al final del
estudio concluimos que las variables no estn relacionadas podremos decir que ambas variables son
independientes, con un determinado nivel de confianza, generalmente del 95%.

C a pt u l o 5

p g in a 371

Pregunta de investigacin
Qu tcnica quirrgica es preferible en pacientes que
deben ser
intervenidos de colecistectoma va laparoscpica?
Variable
PRED IC TO RA
- KTP/532 lser
Cualitativa
- Electrociruga monopolar
dicotmica

Variable
RESULTAD O
esarrollo de complicaciones
CDualitativa
graves postquirrgicas
dicotmica

Cul es el test estadstico ms


adecuado?
Lane GE, Lathrop JC. Comparison of results of KTP/532 laser versus monopolar electrosurgical dissection
in laparoscopic cholecystectomy.
J Laparoendosc Surg 1993; 3: 209-214.

C a pt u l o 5

p g in a 372

Existe diferencia significativa respecto del


porcentaje de complicaciones graves entre ambas
tcnicas
diseccin?
Ho (hiptesisde
nula)
= No hay diferencia entre ambas tcnicas de

diseccin.
Ha (hiptesis alternativa) = S existe diferencia entre ambas tcnicas
de
diseccin.

KTP/532 lser

Electrociruga monopolar

Lane GE, Lathrop JC. Comparison of results of KTP/532 laser versus monopolar electrosurgical dissection
in laparoscopic cholecystectomy.
J Laparoendosc Surg 1993; 3: 209-214.

C a pt u l o 5

Test de 2 de
Pearson
Variable
predictora Tipo de
ciruga
KTP/532 lser
Electrocirug
a monopolar

2Pearson = 9,60

Variable resultado
Complicaciones postquirrgicas graves
SI (+)
NO (-)
Total

16 (8%)

P1

11 (2,6%) P2

p = 0,0019

183

199

411

422

Existe asociacin

p g in a 373

C a pt u l o 5

Si [P1 - P2] es mayor que el producto de 1,96 (Z95% error = 0,05) multiplicado por el error estndar, concluimos que
la diferencia es significativa. Por lo tanto, hemos de calcular el error estndar para luego compararlo con la diferencia

[ P 1 - P2 ]

observada en los grupos en estudio.


[P1 - P2] = [0,080 - 0,026] = 0,054

P= [P1 - P2] / 2 = [0,080 + 0,026] / 2


= 0,053
El error estndar se calcula de la siguiente forma:

Z95% X EE

EE = p (1 p ) ( 1 / n1 + 1 / n2 )

Error estndar (EE) = p (1 p ) ( 1 / n1 + 1 / n2 )

Error estndar (EE) = 0,053 (1-0,053) (1/199+ 1/422)= 0,00035


Error estndar (EE) multiplicado por Z95% = 0,00035 * 1,96 = 0,00069

Z95% = 1,96

Si la diferencia de [P1 - P2] ( 0,054) > EE * Z95% (0,00069) concluimos que existe una diferencia estadsticamente
significativa entre los grupos en estudio (p< 0,05); razn por la cual rechazamos Ho, por ende, aceptamos la Ha.

[ P1 - P 2 ]
[ P1 - P 2 ]

<
>

Z95%
Z95%

Ho (hiptesis nula)

EE

p > 0,1

EE

p < 0,05

Ha (hiptesis alternativa)

p g in a 374

C a pt u l o 5

p g in a 375

Figura 1. Frecuencia de complicaciones graves en 641 pacientes colecistectomizados por va


laparoscpica. Distribucin por tcnicas de diseccin.
p = 0,0019
p = 0,0019

KTP/532 lser

Electrociruga
monopolar

Test de 2 de Pearson
Lane GE, Lathrop JC. Comparison of results of KTP/532 laser versus monopolar electrosurgical dissection
in laparoscopic cholecystectomy. J Laparoendosc Surg 1993; 3: 209-214.

C a pt u l o 5

Test de 2 de
Pearson

Resultados de un estudio
imaginario que estudia la
eficacia de dos
tratamientos A y B en dos
grupos de 30 pacientes
Variable predictora
Tipo de
tratamiento
A

Variable resultado
Porcentaje de respuestas a cada tratamiento

11 (2,6%) P2

2Pearson = 2,5

SI (+)

NO (-)

16 (8%)

p = 0,12

Total

P1 183

199

411

422

No existe asociacin

p g in a 376

C a pt u l o 5

C omparacin de proporciones:
Importancia del intervalo de confianza
Resultados de un estudio imaginario que estudia la eficacia de
dos
tratamientos A y B en dos grupos de 30 pacientes

Diferencia [ P1 - P2 ] = 0,70 - 0,50 = 0,20

IC95% =

0,20 024

A 50%

B 70%

- 4% a20%
+ 44%

p g in a 377

C a pt u l o 5

p g in a 378

Realidad 15: ...de lo


estadsticamente significativo a lo
clnicamente relevante.

Es clnicamente relevante?

Es estadsticamente significativo?

S (xito)

No (fracaso)

S (p < 0,05)

Estadsticamente significativo

Estadsticamente significativo

Clnicamente relevante

Clnicamente irrelevante (p < 0,05)

Estadsticamente NO
significativo

Estadsticamente NO significativo

No (p > 0,1)

Clnicamente irrelevante
Clnicamente
relevante

C a pt u l o 5

Test de 2 de
Pearson

Resultados de un estudio
imaginario que estudia la
eficacia de dos
tratamientos A y B en dos
grupos de 800 pacientes
Variable predictora
Tipo de
tratamiento
A
B

2Pearson = 4,2

Variable resultado
Porcentaje de respuestas a cada tratamiento

SI (+)

NO (-)

Total

480 (60%) P1
520 (65%)
P2

320
280

800
800

p = 0,04

Existe asociacin

p g in a 379

C a pt u l o 5

C omparacin de proporciones:
Importancia del intervalo de confianza
Resultados de un estudio imaginario que estudia la eficacia de
dos
tratamientos A y B en dos grupos de 800 pacientes

Diferencia [ P1 - P2 ] = 0,65 - 0,60 = 0,05

IC95% =
A 60%

0,05 0,047

+ 0,3% a 5%
+ 9,7%

B 65%

p g in a 380

C a pt u l o 5

Realidad 15: ...de lo


estadsticamente significativo a lo
clnicamente relevante.

Es clnicamente relevante?

Es estadsticamente significativo?

S (xito)

S (p < 0,05)

Estadsticamente significativo
Clnicamente relevante

p g in a 381

No (fracaso)
Estadsticamente significativo
Clnicamente irrelevante (p < 0,05)

No (p > 0,1)

Estadsticamente NO
significativo

Estadsticamente NO significativo
Clnicamente irrelevante

Clnicamente
relevante

C a pt u l o 5

p g in a 382

Importancia del intervalo de confianza


Cul de los siguientes tratamientos es
estadsticamente
significativo?
A= B Ha
BH- o
A=0

Diferencia con INTERS


CLNICO
AB BA=
20%

A B

B A=
10%

Ho

Tratamiento

Diferencia
observada

Significacin
estadstica

IC95%

20%

p < 0,05

+10 a
+30%

30%

p < 0,05

+25 a
+35%

10%

p < 0,05

+5 a +15%

10%

NS

-5 a +25%

RC
A
B
C
D
E

-10

-5

0% 5 10 15 20% 25 30

35 40

Resultados hipotticos de un estudio que compara un tratamiento activo frente a un placebo y utiliza como
medidas del efecto la diferencia entre los porcentajes de curacin observados. Se considera que la mnima
diferencia con relevancia clnica es del 20%. RC:EDiferencia con 25%
relevancia clnica.
p < 0,05
+15 a
+35%

C a pt u l o 5

Importancia del intervalo de


confianza
Tratamiento

Diferencia
observada

Significacin
estadstica

IC95%

Interpretacin

20%

p < 0,05

+10 a +30%

No concluyente
Potencialmente
importante
(observado =
relevante)

30%

p < 0,05

+25 a +35%

Importante

10%

p < 0,05

+5 a +15%

No concluyente

10%

NS

-5 a +25%

No concluyente

25%

p < 0,05

+15 a +35%

No concluyente
Potencialmente
importante
(observado >
relevante)

p g in a 383

Resultados hipotticos de un estudio que compara un tratamiento activo frente a un placebo y utiliza como
medidas del efecto la diferencia entre los porcentajes de curacin observados. Se considera que la mnima
diferencia con relevancia clnica es del 20%. RC: Diferencia con relevancia clnica.

C a pt u l o 5

p g in a 384

Pregunta de investigacin
Qu relacin existe entre el grupo cultural/religioso de la
ciudad de C euta y la prevalencia de inmunizacin frente al
virus de la Rubeola en la poblacin gestante?
Variable
PRED IC TO RA
- Cristianas
Cualitativa
- Musulmanas
dicotmica

Variable
RESULTAD O
de la Rubeola
CVirus
ualitativa
dicotmica

Cul es el test estadstico ms


adecuado?
Daz Portillo J, Torres E, Vadillo Andrade J, Laroca C.PREVALENCIA DE ANTICUERPOS FRENTE AL
VIRUS DE LA RUBOLA EN UNA POBLACIN GESTANTE DE CEUTA. Revista de Diagnstico Biolgico
1995, 44: 114-119.

C a pt u l o 5

Test de 2 de
Pearson
Rubeola

Variable
resultado
Inmunizacin
(+)
(-)

2 Pearson

Variable
predictora
Religin
Cristiana

Musulmana

279 (87,2%)

372 (86,1%)

41

60

= 0,18; p=0,668

No existe asociacin

p g in a 385

C a pt u l o 5

p g in a 386

Resumen del procesamiento informtico de los


datos
Clculos del programa estadstico
tabla 2 x 2

Valor

0,183

Grados de
libertad
1

Contraste
bilateral
0,669

2 Pearson

Correccin de Yates

0,102

0,749

Razn de verosimilitud

0,184

Test exacto de Fisher


N Casos vlidos

Contraste
unilateral

0,668
1

0,746

0,376

752

Ho (hiptesis nula) = La inmunizacin frente al virus de la rubeola NO est asociada al grupo cultural de la
gestante.
Ha (hiptesis alternativa) = La inmunizacin frente al virus de la rubeola est asociada al grupo cultural de la
gestante.

C a pt u l o 5

Test de 2 de Pearson (1 grado de


libertad)
2 Pearson calculado = 0,183 <

2 Pearson tabulado

= 3,84

AZAR
2 = 0,183

Ho (hiptesis nula) = La inmunizacin frente


al virus de la rubeola NO est asociada al
grupo cultural de la gestante.
Error alfa

Ho

Ha
AZAR

Pearson tabulado

= 3,84

p g in a 387

C a pt u l o 5

p g in a 388

Pregunta de investigacin
Qu relacin existe entre el hbito tabquico y el cncer de
mama?
Variable
PRED IC TO RA
Hbito tabquico
Cualitativa
dicotmica

Cul es la prueba estadstica ms


adecuada?

Variable
RESULTAD O
ncer de mama
CCualitativa
dicotmica

C a pt u l o 5

Tabla de contingencia cncer de mama


versus tabaquismo
Variable PREDICTORA

Variable
RESULTADO Cncer
deSimama
No

Total

Fumadora

15

20

35

No fumadora

10

40

50

Total

25

60

85

Clculos del
programa
estadstico tabla
2x2

Valor

Grados de libertad Contraste bilateral

2Pearson

5,18

0,023

Correccin de
Yates

4,14

0,042

Razn de
verosimilitud

5,14

Test exacto de
Fisher
N Casos vlidos

0,023
1

85

Contraste
unilateral

0,030

0,021

p g in a 389

C a pt u l o 5

Test de 2 de Pearson (1 grado de


libertad)
2 Pearson calculado = 5,18

>
>

2 Pearson tabulado = 3,84

AZAR

Ha (hiptesis alternativa) = El hbito tabquico


est asociado al cncer de mama en las mujeres de mi
estudio.
2 = 5,18

Ho

Ha
AZAR

Error alfa

= 3,84
Pearson tabulado

p g in a 390

C a pt u l o 5

Pregunta de investigacin
El hbito tabquico de los alumnos del I curso de
metodologa de
investigacin depende del sexo?
Variable
PRED IC TO RA
Sexo de los alumnos
Cualitativa
dicotmica

Cul es la prueba estadstica ms


adecuada?

Variable
RESULTAD O
tabquico
CHbito
ualitativa
dicotmica

p g in a 391

C a pt u l o 5

Test de 2 de
Pearson
Alumnos del curso
Variable PREDICTORA

Variable
RESULTADO
Fumador

No fumador

Total

Masculino

28

33

Femenino

18

10

28

38

61

Total

23

Ho (hiptesis nula) = El hbito tabquico es independiente de sexo del


alumno
del
I curso de Metodologa de
Investigacin.
Ha (hiptesis alternativa) = El hbito tabquico depende del sexo del
alumno
del I curso de Metodologa de
Investigacin.

p g in a 392

C a pt u l o 5

Test de 2 de Pearson (1 grado de


libertad)
2 Pearson calculado = 15,57 >

2 Pearson tabulado

>

= 3,84

AZAR

Ha (hiptesis alternativa) = El hbito tabquico depende del


sexo de alumno del I curso de Metodologa de Investigacin. Es
decir hay diferencias en el hbito tabquico en funcin del sexo.
2 = 15,57

Error alfa
Ho

Ha
AZAR

Pearson tabulado

2
= 3,84

p g in a 393

C a pt u l o 5

p g in a 394

Test de 2 de Pearson
Resumen del procesamiento informtico de los
datos
Clculos del
programa
estadstico

Valor

Grados de liberta d Contraste bilateral Contraste


unilateral

2Pearson (*)

15,57

0,000

Correccin de
Yates

13,54

0,000

Razn de
verosimilitud

16,28

0,000

Test exacto de
1
0,000
0,000
Fisher
(*)
casillas
(0%) tienen
N 0Casos
vlidos
61 una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 10,56
Ha (hiptesis alternativa) = El hbito tabquico depende del sexo de alumno del I curso de Metodologa de
Investigacin. Es decir, hay diferencias en el hbito tabquico en funcin del sexo.

C a pt u l o 5

Pregunta de investigacin
El hbito tabquico es homogneo en los alumnos del II
curso de
metodologa de investigacin en funcin del sexo?
Variable
PRED IC TO RA
Sexo de los alumnos
Cualitativa
dicotmica

Cul es la prueba estadstica ms


adecuada?

Variable
RESULTAD O
tabquico
CHbito
ualitativa
dicotmica

p g in a 395

C a pt u l o 5

Alumnos del curso

Variable RESULTADO

Variable PREDICTORA
(+)
Si
8
No
24
Total
32

(-)
7
4
11

Total
15
28
43

Ho (hiptesis nula) = El hbito tabquico es homogneo en hombres


y mujeres del II curso de Metodologa de Investigacin.
Ha (hiptesis alternativa) = El hbito tabquico NO es homogneo
en hombres y mujeres del II curso de Metodologa de Investigacin.

Test de 2 de
Pearson

p g in a 396

C a pt u l o 5

Test de 2 de Pearson (1 grado de


libertad)
2 Pearson calculado = 5,38

>
>

2Pearson tabulado = 3,84

AZAR

Ha (hiptesis alternativa) = El hbito tabquico NO es homogneo en hombres


y mujeres del II curso de Metodologa de Investigacin. Es decir hay diferencias
en el hbito tabquico en funcin del sexo.

2 = 5,38

Error alfa
Ho

Ha
AZAR

= 3,84
Pearson tabulado

p g in a 397

C a pt u l o 5

p g in a 398

Mito 1: La sonrisa de la
esfinge
Se cumplen todos lo requisitos para el uso del test de 2 Pearson?
He observado que en uno de los casilleros el valor obtenido es inferior a
5 observaciones.
Cmo justificas el empleo del test de 2 Pearson?
La correccin de Yates permite analizar si dos variables dicotmicas estn
asociadas cuando la muestra a estudiar es pequea y no se cumplen las
condiciones necesarias para que la aplicacin del test 2 Pearson sea
adecuada (uno de las casillas es inferior a 5). El test de 2 Pearson exige
que todos los valores esperados de las celdas en una tabla de contingencia
sean mayores de 5.

C a pt u l o 5

Test de 2 de Yates:
C orreccin de continuidad
En la frecuencia esperada en una de las cuatro celdas es menor de 5,
por lo que NO resulta adecuado aplicar el test 2 Pearson , aunque s el
test de Yates. Las variables sexo y tabaquismo son independientes,
porque la probabilidad asociada a los datos del estudio (p = 0,051) es
(error
Por tanto no podemos descartar la hiptesis nula o
inferioralfa).
a 0,05
(H ).
Ho (hiptesis nula) = El hbito tabquico es homogneo en hombres
y
mujeres
del II curso de Metodologa de
Investigacin
Regla de Decisin: Frecuencias esperadas
3

Fisher

Yates
Pearson

p g in a 399

C a pt u l o 5

Resumen del procesamiento informtico de los


datos
Clculos del
programa
estadstico

Valor

Grados de libertad

Contraste bilateral

2Pearson (*)

5,38

0,020

Correccin de
Yates

3,81

0,051

Razn de
verosimilitud

5,21

Test exacto de
Fisher

Contraste unilateral

0,022
1

0,031

0,027

N Casos vlidos
43
(*) 1 casillas (25%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 3,84

Ho (hiptesis nula) = El hbito tabquico NO depende del sexo de alumno del I


curso
de
Metodologa de Investigacin. Es decir NO hay diferencias en el hbito tabquico
en
funcin del sexo.

p g in a 400

C a pt u l o 5

Test exacto de
Fisher
Variable RESULTADO
Variable PREDICTORA

(+)

(-)

Total

Si

a+b

No

c+d

a+c

b+d

Total

(a + b)! * (c + d)! * (a + c)! * (b + c)!


n! * a! * b! * c! * d!

p g in a 401

C a pt u l o 5

Pregunta de investigacin
El hbito tabquico es homogneo en los alumnos del III
curso de
metodologa de investigacin en funcin del sexo?
Variable
PRED IC TO RA
Sexo de los alumnos
Cualitativa
dicotmica

Cul es la prueba estadstica ms


adecuada?

Variable
RESULTAD O
tabquico
CHbito
ualitativa
dicotmica

p g in a 402

C a pt u l o 5

Alumnos del curso


Variable PREDICTORA
Masculino
Femenino
Total

Variable RESULTADO
Fumador
2
8
10

No fumador
5
2
7

Total
7
10
17

Ho (hiptesis nula) = El hbito tabquico es homogneo en hombres


y mujeres del III curso de Metodologa de Investigacin.
Ha (hiptesis alternativa) = El hbito tabquico NO es homogneo
en hombres y mujeres del III curso de Metodologa de Investigacin.

C orreccin de continuidad de Yates


Test de 2 de Pearson

p g in a 403

C a pt u l o 5

Test de 2 de Pearson (1 grado de


libertad)
2 Pearson calculado = 4,49

>
>

2Pearson tabulado = 3,84

AZAR

Ha (hiptesis alternativa) = El hbito tabquico NO es homogneo en


hombres y mujeres del III curso de Metodologa de Investigacin. Es decir
hay diferencias en el hbito tabquico en funcin del sexo.

2 = 4,49

Error alfa
Ho

Ha
AZAR

= 3,84
Pearson tabulado

p g in a 404

C a pt u l o 5

p g in a 405

Mito 1: La sonrisa de la
esfinge
Se cumplen todos lo requisitos para el uso del test de 2 Pearson?
He observado que en varios casilleros el valor es igual o inferior a
5 observaciones.
Cmo justificas el empleo del test de 2 Pearson?
El test exacto de Fisher permite analizar si dos variables dicotmicas estn
asociadas cuando la muestra a estudiar es demasiado pequea y no se
cumplen las condiciones necesarias para que la aplicacin del test 2
Pearson sea adecuada. Estas condiciones exigen que los valores
esperados de las celdas en una tabla de contingencia sean mayores de 5.

C a pt u l o 5

p g in a 406

Test exacto de Fisher


En esta tabla a=2, b=5, c=8 y d=2. La frecuencia esperada en dos de las
cuatro celdas es menor de 5, por lo que NO resulta adecuado aplicar el
test

Pearson, ni la correccin de Yates, aunque s el test exacto de Fisher. Si


las variables sexo y tabaquismo fuesen independientes, la probabilidad
asociada a los datos que han sido observados vendra dada por p = 0,058
(bilateral).
2

Ho (hiptesis nula) = El hbito tabquico es homogneo en hombres


y mujeres del III curso de Metodologa de Investigacin.
Regla de Decisin: Frecuencias esperadas
3

Fisher

Yates

Pearson

C a pt u l o 5

Clculos del
programa
estadstico

Valor

Grados de libertad Contraste bilateral

2Pearson

4,49

0,034

Correccin de
Yates

2,62

0,105

Razn de
verosimilitud

4,65

Test exacto
de Fisher

p g in a 407

Contraste
unilateral

0,031
1

0,058

0,052

N Casos vlidos
17
(*) 3 casillas (75%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 2,88.

En ambos casos la Ho es la misma: la prevalencia de tabaquismo es igual en hombres y mujeres (Ho). En


el contraste unilateral la hiptesis alternativa (Ha) dice de que la prevalencia es mayor en las mujeres que
en los hombres (p=0,052). Cuando el planteamiento se hace con una perspectiva bilateral, la hiptesis
alternativa (Ha) consiste en asumir que existen diferencias en la prevalencia de tabaquismo entre sexos,
pero sin especificar de antemano en qu sentido se producen dichas diferencias, (p=0,058), que tampoco
es significativo. Las dos formas de clculo nunca proporcionan los mismos resultados. El contraste
unilateral (ms exigente) siempre resultar en un valor de p menor al contraste bilateral. En ambos casos, y
a la vista de los resultados del programa estadstico, NO existe evidencia estadstica de asociacin entre el
sexo y el hbito tabquico en los alumnos del curso de metodologa de investigacin de mi estudio.

C a pt u l o 5

Pregunta de investigacin
Qu utilidad clnica tiene la prueba diagnstica X en el
diagnstico
clnico de una determinada enfermedad E?
Objetivo: Evaluacin de la prueba X en el diagnstico de la enfermedad E.
Tcnica analtica a
valuar
PRUEBA X

Cul es el test estadstico ms


acertado?

Tcnica de
referencia
EN FERMEDAD E
(diagnstico
definitivo)

p g in a 408

C a pt u l o 5

Razn de Verosimilitud de
2

- Si la proporcin o frecuencia observada fo es en realidad igual a


proporcin
esperada fe segn la hiptesis nula (Ho ), las 2
la
calculadas
sern iguales y su razn ser igual a
probabilidades
1.
- Cuanto mayor sea la diferencia entre
f y f , mayor
ser la razn
o
e
entre
ambas. La razn de estas 2 probabilidades o verosimilitudes puede
utilizarse
como estadstico para medir el grado de ajuste entre las
frecuencias observadas y las esperadas.
- Esta prueba se calcula de la siguiente
manera:

RV2 = 2 * fo * ln

fe
fo

p g in a 409

C a pt u l o 5

Razn de Verosimilitud de
2
Estudio
Casos - Controles

Diagnstico definitivo

Prueba X

Enfermos

Sanos

Total

Positiva (+)

9 (2,1%)

19 (4,4%)

28 (6,5%)

Negativa (-)

67 (15,7%)

335 (93,5%)

402 (93,5%)

Total

76 (17,7%)

354 (82,3)

430

Ho (hiptesis nula) = Los resultados de la prueba diagnstica X NO


estn
relacionados con el diagnstico
definitivo.
Ha (hiptesis alternativa) = Los resultados de la prueba diagnstica X
estn
relacionados con el diagnstico
definitivo.

p g in a 410

C a pt u l o 5

Razn de Verosimilitud de
2
Clculos del
programa
estadstico

Valor

Grados de libertad

Contraste bilateral

2Pearson

4,309

0,038

Correccin de
Yates

3,311

0,069

Razn de
verosimilitud

3,706

Test exacto de
Fisher
N Casos vlidos

Contraste unilateral

0,054
1

0,067

0,041

430

A pesar de que el test de 2 de Pearson es significativo (p < 0,05) no podemos


rechazar la hiptesis nula ya que la razn de verosimilitud es mayor de 0,05 (diseo
de casos y controles).
Ho (hiptesis nula) = Los resultados de la prueba diagnstica X NO estn relacionados
con
el
diagnstico
definitivo

p g in a 411

C a pt u l o 5

Un equipo de traumatlogos desarrollaron una nueva tcnica


quirrgica para el reemplazo de la cabeza del fmur que suponan
superior a la tcnica tradicional.
Existen diferencias significativa respecto al porcentaje de
complicaciones
postoperatorias inmediatas?
Ho (hiptesis nula) = No hay diferencia entre ambas tcnicas
de
quirrgicas
.
Ha (hiptesis alternativa) = S existe diferencia entre ambas tcnicas
de
quirrgicas
.
Tcnica C LSIC A

Tcnica N UEVA

p g in a 412

C a pt u l o 5

Variable resultado

Variable predictora Tipo de ciruga

Complicaciones
INMEDIATAS

Tcnica CLSICA

Tcnica NUEVA

Dao nervioso

485 (50%)

28 (26,4%)

Hemorragia

285 (29,4%)

16 (15,1%)

Desplazamiento

52 (5,4%)

4 (3,8%)

Ninguna

148 (15,3%)

58 (54,7%)

Total

970

106

Cul es el test estadstico ms


acertado? Test de 2 de Pearson

Pearson
2

= 129,97

p < 0,0001

Existe asociacin

p g in a 413

C a pt u l o 5

2Pearson = 129,97

p < 0,0001

Frecuencia absoluta(%)

Complicaciones
postquirrgicas INMEDIATAS

p g in a 414

C a pt u l o 5

Test de 2 de
Pearson
Grados de libertad = [ K - 1] [F - 1] = (2-1) (4 -1) = 3

2Pearson calculado = 129,97

>

2 = 129,97

2
Pearson tabulado

= 7,81

AZAR

Ho
Ha
7,81
AZAR

Ha (hiptesis alternativa) = La frecuencia de las complicaciones


postquirrgicas inmediatas en la nueva tcnica NO eran iguales que en la
tcnica clsica.

p g in a 415

C a pt u l o 5

p g in a 416

Pregunta de investigacin
Qu relacin existe entre el pas de procedencia y la
prevalencia de infeccin tuberculosa en el colectivo de
inmigrantes del campamento de C alamocarro de C euta?
Variable
PRED IC TO RA
Pases africanos de origen
Cualitativa
policotmica

Variable
RESULTAD O
tuberculosa
CInfeccin
ualitativa
dicotmica

Cul es el test estadstico ms


adecuado?
Fernndez SanFrancisco T, Daz Portillo J, Snchez Romero JM et al. PREVALENCIA DE INFECCIN
TUBERCULOSA EN LA POBLACIN DE INMIGRANTES EN CEUTA. Rev Esp Salud Pblica 2001; 75:
501-558.

C a pt u l o 5

Test de 2 de
Pearson
Pas de procedencia

Prevalencia

Argelia

133

25,6

Camern

128

48,4

Costa de marfil

18

27,8

Gambia

107

11,2

Guinea Bissau

186

26,3

Liberia

105

27,4

Mali

291

32,7

Mauritania

55

24,1

Nigeria

597

29,1

R.D. Congo

146

34,0

R. Guinea

45

65,1

Sierra Leona

177

20,8

= 165; p<0,00001

Pearson

Existe asociacin

p g in a 417

C a pt u l o 5

Pas africano de procedencia del inmigrante

Gambia

11%
20%

Sierra Leona
Mauritania

24%

Argelia

Guinea Bissau

25%
26%

Liberia

27%

Costa de marfil

28%
29%

Nigeria

33%

Mali

34%

R.D. Congo
Camern

48%

R. Guinea

65%

Prevalencia de infeccin tuberculosa


Fernndez SanFrancisco T, Daz Portillo J, Snchez Romero JM et al. PREVALENCIA DE INFECCIN
TUBERCULOSA EN LA POBLACIN DE INMIGRANTES EN CEUTA. Rev Esp Salud Pblica 2001; 75:
501-558.

p g in a 418

C a pt u l o 5

p g in a 419

Pregunta de investigacin
Existen diferencias en la prevalencia de infeccin
tuberculosa en el colectivo de inmigrantes segn la ciudad de
destino (C euta, Barcelo- na, Toledo)?
Variable
PRED IC TO RA
D estino
Cualitativa
- Ceuta
policotmica
- Barcelona
- Toledo

Cul es el test estadstico ms


adecuado?

Variable
RESULTAD O
tuberculosa
CInfeccin
ualitativa
dicotmica

C a pt u l o 5

Test de 2 de
Pearson

Variable
RESULTADO
Prueba de Mantoux
Variable PREDICTORA
(+)
(-)
Ceuta
722 (32,6%)
1501
Barcelona
506 (34%)
983
Toledo
75 (27,7%)
269

Total
2223
1489
344

= 19,29; p = 0,000065

Pearson

Ha: Existen diferencias en la prevalencia de infeccin tuberculosa en el colectivo de inmigrantes segn la


ciudad de destino (Ceuta, Barcelona, Toledo).

p g in a 420

C a pt u l o 5

Fernndez Sanfrancisco MT, Daz Portillo J, Snchez Romero JM, et al. Prevalencia de infeccin
tuberculosa en la poblacin inmigrante de Ceuta. Rev Esp Salud Pblica 2001; 75: 551-558.
Duran E, Cabezos J, Ros M, et al. Tuberculosis en los inmigrantes recin llegados a Barcelona. Med Clin
(Barc) 1996; 106: 525-528.
Alonso Moreno FJ, Garca Bajo MC, Lougedo Caldern MJ, et al. Prevalencia de infeccin tuberculosa en
las personas inmigrantes del rea sur de Toledo. Rev Esp Salud Pblica 2004; 78: 593-600.

p g in a 421

C a pt u l o 5

p g in a 422

Realidad 3
...de lo estadsticamente significativo a lo clnicamente
relevante
Realidad 3: ...de lo
estadsticamente significativo a lo
clnicamente relevante.

Es clnicamente relevante?

Es estadsticamente significativo?

S (xito)

S (p < 0,05)

Clnicamente relevante
Estadsticamente significativo

No (fracaso)
Clnicamente irrelevante (p < 0,05)
Estadsticamente significativo

Error Alfa?
No (p > 0,1)

Clnicamente relevante

Clnicamente irrelevante

Estadsticamente NO
significativo

Estadsticamente NO significativo

Error Beta?

C a pt u l o 5

p g in a 423

Pregunta de investigacin
Qu relacin y qu grado de asociacin existe entre el grupo
cultu- ral/religioso de la ciudad
de Ceuta y la prevalencia
de inmunizacin frente a Toxoplasma goondi en la poblacin
gestante?
Variable
PRED IC TO RA
Grupo cultural:
Cualitativa
- Cristianas
policotmica
- Musulmanas

Variable
RESULTAD O
Toxoplasma goondi
CInfeccin
ualitativa
dicotmica

Cul es el test estadstico ms


adecuado?
Daz Portillo J, Torres E, Vadillo Andrade J. SEROEPIDEMIOLOGA DE LA TOXOPLASMOSIS EN UNA
POBLACIN GESTANTE DE CEUTA. Revista de Diagnstico Biolgico 1998; 47: 106-116.

C a pt u l o 5

Test de 2 de
Pearson

Variable predictora Religin

Variable resultado
Inmunizacin

Cristiana

Musulmana

(+)

112

220

(-)

210

148

Pearson
2

= 43,99; p<0,0000001

Existe asociacin

No cuantifica el grado de intensidad de la


asociacin.

p g in a 424

C a pt u l o 5

Test de McN emar para datos


apareados
(Prueba
de la significacin de los
McNemar
ANTES
XITO (+)
cambios)

DESPUS
FRACASO (-)

XITO (+)

FRACASO (-)

McMemar =

[ ( B C ) 1 ]2

B+C

p g in a 425

C a pt u l o 5

p g in a 426

Existen evidencias de un mejor efecto analgsico en


los dos
frmacos protocolizados para el clico nefrtico?
- Diseo APAREADO
- Un solo grupo de pacientes (n=20) con clico nefrtico recidivante (dos
episodios de clico nefrtico).
- Dos mediciones repetidas (antes y despus).
- Gran potencia estadstica (mnima variabilidad aleatoria).
- Hiptesis nula Ho: la eficacia de ambos analgsicos es la misma
Metamizol
= Ketorolaco
Test de McNemar

C a pt u l o 5

N = 20
pacientes
KETO RO LACO

METAMIZO L

p g in a 427

C a pt u l o 5

Test de McN emar para datos


apareados
McNemar

METAMIZOL

KETOROLACO

XITO = 1

FRACASO = 0

XITO = 1

FRACASO = 0

McMemar =

[ ( B C ) 1 ]2

B+C
(B C)1

Z McNemar =

B+C

p g in a 428

C a pt u l o 5

Test de McN emar para datos


apareados
McNemar

METAMIZOL

KETOROLACO

XITO = 1

FRACASO = 0

XITO = 1

FRACASO = 0

[ ( 9 2 ) 1 ]2

McMemar =
2

9+2

= 3,27 p >
0,05

p g in a 429

C a pt u l o 5

Procesamiento informtico de los


datos
Test de McNemar para datos apareados
Valor
Significacin bilateral (*)
Prueba de McNemar
N casos vlidos

3,27
20

0,065

(*) Utilizada la distribucin


binomial
Hiptesis nula Ho : La eficacia de ambos analgsicos es la misma, es
decir
Metamizol
=
Ketorolaco
Es posible un error ?
Qu ocurre si aumentamos el tamao
muestral?

p g in a 430

C a pt u l o 5

N = 30
pacientes
KETO RO LACO

METAMIZO L

p g in a 431

C a pt u l o 5

Test de McN emar para datos


apareados
McNemar

METAMIZOL

KETOROLACO

XITO = 1

FRACASO = 0

XITO = 1

11

14

FRACASO = 0

[ ( 14 3 ) 1 ]2

McMemar =

14 + 3

= 5,88
p = 0,013

p g in a 432

C a pt u l o 5

Procesamiento informtico de los


datos
Test de McNemar para datos apareados
Valor
Significacin bilateral (*)
Prueba de McNemar
N casos vlidos

5,88
30

0,013

(*) Utilizada la distribucin


binomial
Hiptesis alternativa Ha : La eficacia de ambos analgsicos es NO la
misma,
es
decir Metamizol
Ketorolaco

p g in a 433

C a pt u l o 5

Pregunta de investigacin
Existen evidencias de una mejora en los
conocimientos tericos de Metodologa de
investigacin en los alumnos despus del curso?
Examen de 14 preguntas a los 8 alumnos antes y despus de realizar el
curso Aprobado: [ > 7 respuestas correctas de 14 ] = 1
Suspenso: [ < 8 respuestas correctas de 14 ] = 0
DESPUS del curso
ANTES del curso
APROBADO (> 7)
SUSPENSO (< 8)

APROBADO (> 7)
A
C

SUSPENSO (< 8)
B
D

p g in a 434

C a pt u l o 5

Test de McN emar para datos


apareados
(Prueba
de la significacin de los
McNemar
ANTES del curso
APROBADO (< 7)
cambios)

DESPUS del curso


SUSPENSO (< 8)

APROBADO (< 7)

SUSPENSO (< 8)

McMemar =

[ ( B C ) 1 ]2

B+C
(B C)1

Z McNemar =

B+C

p g in a 435

C a pt u l o 5

Existen evidencias de una mejora en los


conocimientos tericos de metodologa de
investigacin en los alumnos despus del curso?
N del Alumno

Evaluacin ANTES del curso

Evaluacin DESPUS del curso

APROBADO (10)

APROBADO (14)

SUSPENSO (7)

APROBADO (14)

SUSPENSO (7)

APROBADO (14)

SUSPENSO (5)

APROBADO (14)

SUSPENSO (4)

APROBADO (13)

SUSPENSO (3)

APROBADO (13)

SUSPENSO (2)

APROBADO (13)

SUSPENSO (2)

APROBADO (11)

Cul es el test estadstico ms


acertado?

p g in a 436

C a pt u l o 5

Test de McN emar para datos


apareados
(Prueba
de la significacin de los
McNemar
ANTES del curso
APROBADO (< 7)
cambios)

DESPUS del curso


SUSPENSO (< 8)

APROBADO (< 7)

SUSPENSO (< 8)

[ ( 0 7 ) 1 ]2

McMemar =

0+7

= 9,14

p g in a 437

C a pt u l o 5

(B C)1

Z McNemar =

B+C

(0 7)1

Z McNemar =

0+7

= 3,03 >

Z95%

Valor
1,96

0,05

Z98%

2,32

0,02

Z99%

2,56

0,01

Z99,5%

3,29

0,005

Z 99% = 2,56

Conclusin: Como el estadstico Z calculado 3,03 es superior a Z


tabulado para un error alfa de 0,01 (2,56), podemos decir que las dos
variables evaluadas NO son independientes, sino que estn asociadas
(p<0,01), es decir, la accin formadora mejora los conocimientos de los
alumnos.

p g in a 438

C a pt u l o 5

Colesterol total (mg/dl) al nacimiento

110

80

50

20
80

130

180

Colesterol total (mg/dl) durante el segundo ao de vida

230

p g in a 439

p g in a 440

C a pt u l o 5

Colesterol total (mg/dl) al nacimiento

110

8/108 (7,4%)
4/61 Cristianos (6,5%)
4/44 Musulmanes (9,1%)

21/108 (19,4%)
14/61 Cristianos (23,0%)
6/44 Musulmanes (13,6%)

80
P75

50

64/108 (59,5%)
34/61 Cristianos (55,7%)
28/44 Musulmanes (63,6%)

20
80

130

Colesterol total (mg/dl) durante el


segundo ao de vida

14/108 (13,9%)
9/61 Cristianos
(14,7%)
6/44 Musulmanes
(13,6%)
180
75

230

C a pt u l o 5

Test de McN emar para datos


apareados
(Prueba
de la significacin de losSEGUNDO AO DE VIDA
McNemar
NEONATOS
CT > P
CT P
cambios)
75

CT > P

75

75

CT P
75

McMemar =

[ ( B C ) 1 ]2

B+C
(B C)1

Z McNemar =

B+C

p g in a 441

C a pt u l o 5

p g in a 442

Test de McN emar para datos


apareados
(Prueba de la significacin de los
McNemar
SEGUNDO AO DE VIDA
cambios)
NEONATOS
CT > P
CT P
75

CT > P

75

21

14

64

75

CT P
75

Test de McNemar para datos apareados


Valor
Significacin bilateral
Prueba de McNemar
N casos vlidos

1,03
108

0,311

Significacin unilateral
0,155

C a pt u l o 5

Test de McN emar para datos


apareados
(Prueba
de la significacin de losSEGUNDO AO DE VIDA
McNemar
NEONATOS
CT > P
CT P
cambios)
75

CT > P

75

21

14

64

75

CT P
75

[ ( 21 14 ) 1 ]2

McMemar =

= 1,03

21 + 14

Jacobo Daz Portillo .Influencia del grupo tnico en el patrn lipoproteico de una determinada poblacin
peditrica de Ceuta, Tesis doctoral. Facultad de Medicina de la Universidad de Cdiz. 1997

p g in a 443

C a pt u l o 5

(B C)1

Z McNemar =

Z
McNemar

B+C

( 21 14 ) 1

Z95%

Valor
1,96

0,05

Z98%

2,32

0,02

Z99%

2,56

0,01

Z99,5%

3,29

0,005

p g in a 444

= 1,014

21 + 14

Conclusin: Como el estadstico Z calculado 1,014 es INFERIOR a Z


tabulado para un error alfa de 0,05 (1,96), podemos decir que las dos
variables evaluadas son independientes, es decir, NO estn asociadas, y por
tanto no hay cambios importantes en la distribucin del colesterol total al
pasar del nacimiento al segundo ao de vida. Este comportamiento tambin
se repite en los dos grupos culturales (cristianos y musulmanes).

C a pt u l o 5

Existen evidencias de un mejor efecto antitusgeno en los 3 frmacos


ensayados?
TOS

No (0)
Si
(1) RESPUESTA A
TOS

Si
(1)

No (0)

RESPUESTA
B
TOS

Cul es el test estadstico ms


adecuado?

No (0)
Si
(1) RESPUESTA C

p g in a 445

C a pt u l o 5

p g in a 446

Q de C ochran
Para tres o ms muestras dependientes
-La prueba Q de Cochran es una extensin de la prueba de McNemar, que
se utiliza en los modelos experimentales con 3 o ms muestras
dependientes o relacionadas entre s, es decir, esta poblacin sirve como su
propio control, en el que existe un perodo previo y otro ulterior; adems, el
tipo de escala debe ser nominal.
- El valor calculado en la prueba Q de Cochran se distribuye igual que la ji
cuadrada, por lo cual el smbolo utilizado ser Q
X2 .

Donde:
Q = estadstico ji cuadrada de la prueba Q de Cochran.
2
X
K = nmero de tratamientos.
Gn = nmero total de respuestas de cambio de cada tratamiento o columna.
Lc = nmero total de respuestas de cambio por individuo de la muestra o hileras.

C a pt u l o 5

25 pacientes reciben 3 frmacos para mejorar


su tos

p g in a 447

Paciente

Frmaco A Frmaco B

Frmaco C

Paciente

Frmaco A Frmaco B

Frmaco C

15

16

17

18

19

20

21

22

23

10

24

11

25

12

13

14

0 = Mejora la tos
1 = NO mejora la tos

C a pt u l o 5

Frmaco A
Frmaco B
Frmaco C

Media

DE

Mnimo

Mximo

25
25
25

0,60
0,65
0,48

0,500
0,478
0,510

0
0
0

1
1
1

Valores
0
Frmaco A
Frmaco B
Frmaco C

10
8
13

Test estadsticos
1
15
17
12

250

Q de Cochran

2,111

gl

Significacin

0,348

Grados de libertad = [ K - 1] [F - 1]

Hiptesis nula Ho : No hay diferencia entre los 3 frmacos para evitar la


tos.
Hiptesis alternativa Ha : Hay diferencia entre los 3 frmacos para evitar la
tos.
Conclusiones: No hay diferencias estadsticamente significativas entre los 3
frmacos
para evitar la tos en los pacientes.

p g in a 448

C a pt u l o 5

D atos categricos
Cualitativa versus cualitativa O RD IN ALES
- Test de 2 de tendencia lineal
- Tau-B de Kendall o Stuart
- Tau-C de Kendall
- Gamma de Goodman y Kruskal
- D de Somers
- Correlacin de Spearman
Estos estadsticos NO se pueden utilizar cuando alguna de las variables
sea NOMINAL

p g in a 449

C a pt u l o 6

C aptulo 6
Publicacin Bioestadstica: Anlisis
bivariante. Test de contraste de hiptesis.
Cualitativa versus cualitativa.
Medidas de asociacin.

D r. Jacobo D az Portillo
Coordinador de Formacin Continuada
Hospital Universitario de Ceuta

p g in a 450

C a pt u l o 6

D atos categricos:
Cualitativa versus cualitativa.
N ominales

- Test de 2 de Pearson
- Relacin entre dos variables cualitativas nominales o policotmicas
- Comparacin de proporciones
- Correccin de Yates
- Test exacto de Fisher
- Valores esperados menores de 5
- Razn de verosimilitud
- Evaluacin de pruebas diagnsticas
- Test de 2 de McNemar
- Datos apareados o emparejados
- Coeficiente PHI ()
- V de Cramer
- Coeficiente de contingencia
- Coeficiente de incertidumbre
- Tau de Goodman y Kruskal
- Lambda de Goodman y Kruskal (coeficiente de predictibilidad de
Guttman)

p g in a 451

C a pt u l o 6

D atos categricos:
Cualitativa versus cualitativa.
O rdinales
- Test de 2 de tendencia lineal
- Tau-B de Kendall o Stuart
- Tau-C de Kendall
- Coeficiente Gamma de Goodman y
Kruskal
- D de Somers
- Correlacin de Spearman
Estos estadsticos N O se pueden
utilizar cuando alguna de las
variables sea N O MIN AL

p g in a 452

C a pt u l o 6

p g in a 453

Medidas de asociacin
Son indicadores estadsticos que miden la FUERZA o INTENSIDAD
con la que una determinada enfermedad o evento de salud (VARIABLE
RESULTADO) est asociada o relacionada con un determinado factor (que
se presume como su causa, VARIABLE PREDICTORA).
Estadstico

Transversales

Cohortes

Casos-controles

OR (Odds ratio)

Limitaciones

NO

SI

RR (Riesgo Relativo)

NO

SI

NO

Q de Yule

SI

SI

SI

Coeficiente PHI

SI

SI

SI

V de Cramer

SI

SI

SI

Coeficiente de contingencia

SI

SI

SI

Lambda

SI

SI

SI

Tau de Goodman y Kruskal

SI

SI

SI

Coeficiente de incertidumbre

SI

SI

SI

Gamma

SI

SI

SI

D de Somers

SI

SI

SI

Tau-b de Kendall

SI

SI

SI

C a pt u l o 6

Test de 2 de independencia de
Pearson
Test de la Q de Yule
Coeficiente PHI

CONTRASTES A
POSTERIORI

V de Cramer

No es un test de contraste de
hiptesis (no calcula p)
Tablas = 2 x 2
Nominales
Tablas = 2 x 2

Nominales
Tablas > 2 x 2

Coeficiente Lambda

Nominales
Tablas > 2 x 2

Coeficiente de incertidumbre
Coeficiente Tau-b de Kendall

Nominales
Tablas > 2 x 2
Ordinales
Tablas > 2 x 2

Coeficiente Gamma

Ordinales
Tablas > 2 x 2

D de Somers

Ordinales
Tablas > 2 x 2

p g in a 454

C a pt u l o 6

Test de la Q de
Yule

Variable predictora Religin

Variable resultado
Inmunizacin

Cristiana

Musulmana

(+)

(-)

[ (A * D) (B * C) ]

Q =
[ (A * D) + (B * C) ]

p g in a 455

C a pt u l o 6

Test de la Q de
Yule
C oeficiente Gamma
-Q=0
- Interpretacin:
-Q>0

independencia
asociacin positiva
-Q<0
asociacin
negativa
- Intervalo de Q: (-1, +1)
- Informacin:
- Medida de la intensidad de la
asociacin
- Sentido de la misma

p g in a 456

C a pt u l o 6

p g in a 457

C aractersticas de la Q de Yule
- Medida de asociacin.
- Valores mayores de 0 (asociacin positiva).
- Valores menores de 0 (asociacin negativa).
- Valor = 0 o prximos a 0 (es probable que no exista asociacin).
- Vlida para cualquier tipo de Estudios (diseo).
- Alcanza valores extremos (+1, -1) bajo condiciones de asociacin
perfectas.
-Es independiente de los cambios de ESCALA de filas y columnas.
-Si se intercambian entre si las filas o las columnas se mantiene la magnitud
de la INTENSIDAD de la asociacin, slo cambia la direccin de la misma,
es decir el signo de la Q.
- Es ms valida con un test previo de contraste de hiptesis que
indique relacin entre ambas variables.

C a pt u l o 6

Test de la Q de
Yule
C oeficiente Gamma
Rubeola

Religin

Variable resultado
Inmunizacin

Cristiana

Musulmana

(+)

279 (87,2%)

372 (86,1%)

(-)

41

60

[ (279 * 60) (372 * 41) ]

Q =

= 0,047

[ (279 * 60) + (372 * 41) ]

Gamma (Q de Yule)

EEk

p
aprox

0,047

0,113

0,430

0,667

p g in a 458

C a pt u l o 6

Mito 1: La sonrisa de la
esfinge
La Q de Yule es un test que cuantifica la magnitud de la intensidad de la
asociacin entre dos variables cualitativas, pero NO es un test de
contraste de hiptesis, y por tanto, que para usarlo se debe cumplir
previamente la asociacin estadstica entre ambas variables. Se
cumple?
He observado en tus resultados anteriores que el test de contraste de
hiptesis de 2 Pearson tiene un valor de tan slo 0,18, con p = 0,67.
Cmo justificas el empleo de la Q de Yule si NO existe asociacin
estadstica entre ambas variables?

p g in a 459

C a pt u l o 6

Test de la Q de
Yule
Toxoplasma goondi

Religin

Variable resultado
Inmunizacin

Cristiana

Musulmana

(+)

112 (34,8%)

220 (59,8%)

(-)

210

148

Q =

[ (112 * 148) (220 * 210) ]


[ (112 * 148) + (220 * 210) ]

Gamma (Q de Yule)

EEk

p
aprox

- 0,47

0,041

- 6,780

0,000

= 0,47

p g in a 460

C a pt u l o 6

Q = 0,47

Q = 0,70

p g in a 461

Q = 0,72

59,8

Seroprevalencia
(%)

53,6

43,3
34,8

17,3
11,0

Figura .- Evolucin de la seroprevalencia de la toxoplasmosis en gestante de Ceuta (periodos 1994, 2004,


2010) (Q= Q de Yule; gamma; p < 0,001)

C a pt u l o 6

Ejercicio: Q u grado de asociacin existe entre el


infarto
de
miocardio y el sexo
del paciente?
Q de Yule
Acontecimiento de infarto
Sexo

(+)

(-)

Hombre

32

10

Mujer

11

27

Q =

[ (32 * 27) (11 * 10) ]


[ (32 * 27) + (11 * 10) ]

Gamma (Q de Yule)

EEk

= 0,77

p
aprox

0,774

0,102

4,782

0,000

p g in a 462

C a pt u l o 6

Ejercicio: Q u grado de asociacin existe entre el


infarto
de miocardio y el sexo del paciente?
Q de Yule
El valor de 0,77 sugiere un grado de asociacin entre los factores sexo y
acontecimiento del infarto bastante elevado, ya que 0,77 est prximo a
1, y adems indica que dicha asociacin es positiva, es decir los
varones desarrollan con ms frecuencia el infarto que las mujeres.

p g in a 463

C a pt u l o 6

p g in a 464

Pregunta de investigacin
En qu grupo cultural/religioso es mayor la prevalencia de
inmunizacin frente a Toxoplasma goondi en la poblacin gestante de
C euta?
Variable
Variable
Musulmanas
o cristianas?
PRED IC TO RA
Grupo cultural:
Cualitativa
- Cristianas
policotmica
- Musulmanas

RESULTAD O
Toxoplasma goondi
CInfeccin
ualitativa
dicotmica

Cul es el test estadstico ms


adecuado?
Daz Portillo J, Torres E, Vadillo Andrade J. SEROEPIDEMIOLOGA DE LA TOXOPLASMOSIS EN UNA
POBLACIN GESTANTE DE CEUTA. Revista de Diagnstico Biolgico 1998; 47: 106-116.

C a pt u l o 6

Coeficiente PHI ()

Variable predictora

Variable resultado

Positiva (+)

Negativa (-)

Total

Positiva (+)

a+b

Negativa (-)

c+d

Total

a+c

b+d

Coeficiente PHI

(a * d) (b * c)

(a + c) (b + d) (a + b) (c + d)

p g in a 465

C a pt u l o 6

C oeficiente PHI

Coeficiente PHI ()

Variable predictora

Variable resultado

Positiva (+)

Negativa (-)

Total

Positiva (+)

112 (34,8%)

220 (59,8%)

332

Negativa (-)

210

148

358

Total

322

368

690

Coeficiente es un test de contraste de hiptesis

43,99
690

= 0,25

p < 0,01

p g in a 466

C a pt u l o 6

C oeficiente PHI

Coeficiente PHI ()

Variable predictora

Variable resultado

Positiva (+)

Negativa (-)

Total

Positiva (+)

112 (34,8%)

220 (59,8%)

332

Negativa (-)

210

148

358

Total

322

368

690

(112 * 148) (220 * 210)

= - 0,25

(112 + 210) (220 + 148) (112 + 220) (210 + 148)


Ha: La inmunizacin a Toxoplasma se encuentra asociada a la cultura musulmana.

p g in a 467

C a pt u l o 6

p g in a 468

C oeficiente PHI

- Condiciones: Tablas tetracricas (2 x


2).
- =0
- Interpretacin:
- >0
- <0

independencia.
asociacin positiva.
asociacin
negativa.
- Intervalo de : entre -1 y 1.
- Informacin: Es un test de contraste de hiptesis que ofrece una
medida de la intensidad de la asociacin. Cuando se acercan a cero,
indican
independencia o asociacin muy dbil entre las variables. Cuando se
acercan a uno, indican una relacin ms fuerte o intensa entre las variables
asociadas.

C a pt u l o 6

Pregunta de investigacin
El resultado del tratamiento depende del frmaco
empleado?
La condicin de asintomtico se encuentra asociado al
uso de
Variable
Variable
Mosaprida?
PRED IC TO RA
- Metoclopramida (n = 99)
Cualitativa
- Cisaprida (n = 102)
policotmica
- Mosaprida (n = 99)

Cul es el test estadstico ms


adecuado?

RESULTAD O
Asintomtico
C-ualitativa
Sntomas
dicotmica

- Mejora clnica

p g in a 469

C a pt u l o 6

Nominal x Nominales (Tablas > 2 x 2)


V de Cramer
Coeficiente de contingencia
Lambda
Tau de Goodman y Kruskal
Coeficiente de incertidumbre

p g in a 470

C a pt u l o 6

El resultado del tratamiento depende del


frmaco empleado?
Variable RESULTADO Resultado del tratamiento a la semana
Variable PREDICTORA Asintomtico
Tipo de medicamento
Metoclopropamida
24 (8%)
Cisaprida
27 (9%)
Mosaprida
51 (17%)

= 60,12

2 Pearson

p = 0,000

Sintomtico

Mejora

54 (18%)
18 (6%)
27 (9%)

21 (7%)
57 (19%)
21 (7%)

Existe asociacin

Ha: El resultado del tratamiento depende del frmaco empleado


La condicin de asintomtico se encuentra asociado al uso de
Mosaprida?

V de Cramer

p g in a 471

C a pt u l o 6

V de
C ramer

V=
V=

2
2
n (k-1)

V=

n (k- Valor
1) del estadstico

Nominal por nominal

60,12
300 (3 -1)

0,317

Significacin (p)

Coeficiente PHI

0,448

0,000

V de Cramer

0,317

0,000

N de casos vlidos

300 pacientes

Ha: La condicin de asintomtico se encuentra asociado al uso de


Mosaprida.

p g in a 472

C a pt u l o 6

V de
C ramer

p g in a 473

- Definicin: V de Cramer es una manera de calcular la correlacin en los cuadros que


tienen ms de 2x2 filas y columnas. Se utiliza como posterior a la prueba para determinar
la intensidad de la asociacin despus de que el test de chi-cuadrado ha sido
significativa. Chi-cuadrado, dice que existe una relacin significativa entre las variables,
pero no dice nada del grado de significancia ni de su importancia. V de Cramer es un
post-test para dar esta informacin adicional.
- Condiciones: Tablas de ms de 2 x 2. Cuando la tabla es de 2 x 2 (tetracrica), utilice el
coeficiente PHI.
- Interpretacin:
-V =0
independencia.
-V >0
asociacin
-Intervalo de V : entre
positiva.
0 y 1.
-Informacin: Es una medida de la intensidad de la asociacin. Cuando se acercan a
cero, indican independencia o asociacin muy dbil entre las variables. Cuando se
acercan a uno, indican una relacin ms fuerte o intensa entre las variables estudiadas.
Cramer, H. (1999). Mtodos Matemticos de Estadstica, Princeton University Press.

C a pt u l o 6

p g in a 474

Limitaciones del test 2 de Pearson como medida de


asociacin
Una vez que tenemos hallado el valor del 2 podemos preguntarnos si
existe o no asociacin. No se puede emplear el valor de 2 como una
medida de asociacin ya que este aumenta con el tamao muestral. El valor
absoluto de 2 no permite tener una idea clara de la fuerza de la asociacin
ya que sus valores no estn acotados en un intervalo definido.
Un coeficiente que s tiene la propiedad de que sus valores varen dentro de
un intervalo es el COEFICIENTE DE CONTINGENCIA.

Coeficiente de contingencia

El valor de este coeficiente nunca ser inferior a 0 ni superior a 1. El 0


corresponder a ausencia de asociacin, con 2 = 0. No en todos los
casos la dependencia extrema necesariamente debe dar 1, depender del
nmero de categoras k.

C a pt u l o 6

C oeficiente de contingencia (C )
El coeficiente de contingencia se utiliza para saber la asociacin de
variables cualitativas NOMINALES, que tienen dos o ms categoras. Este
coeficiente requiere del clculo previo del estadstico 2 de Pearson.
k-1

Cmx =
Donde:
=
C = coeficiente de
contingencia.
2 = valor de chi-cuadrado de Pearson calculado

+ n

previamente. n = tamao o nmero de la muestra.


C=0
Significa que NO hay asociacin.
C > 0,30
Indica una buena asociacin entre las
Cmx No alcanza el valor
1 aunque las dos variables estn
variables.
relacionadas
totalmente
.

p g in a 475

C a pt u l o 6

C oeficiente de contingencia (C )
El coeficiente de contingencia se utiliza para saber la asociacin de
variables cualitativas NOMINALES, que tienen dos o ms categoras. Este
coeficiente requiere del clculo previo del estadstico 2 de Pearson.

Cajustado =

C=

Cmx =
Cmx =

2 + n
k-1
k

k-1

p g in a 476

C a pt u l o 6

La AD HEREN C IA al curso de bioestadstica


depende del modelo docente utilizado (presencial,
semipresencial o online)?
Cursos semipresenciales

Presencial

O nline (a distancia)

p g in a 477

C a pt u l o 6

Nominal x Nominales (Tablas > 2 x 2)


V de Cramer
Coeficiente de contingencia
Lambda
Tau de Goodman y Kruskal
Coeficiente de incertidumbre

p g in a 478

C a pt u l o 6

Variable predictora TIPO DE CURSO


Variable resultado
Adherencia al curso
Seguimiento
Abandonos
Total

PRESENCIAL

ONLINE

semiPRESENCIAL

190
10 (5%)
200

170
30 (15%)
200

180
20 (10%)
200

= 11,11

p = 0,004

2 Pearson

Existe asociacin

Ha: La adherencia al curso es dependiente del tipo de modalidad de enseanza


empleado.
El modelo PRESENCIAL se encuentra asociado a una mayor adherencia del alumno
al curso?

p g in a 479

C a pt u l o 6

El modelo presencial se encuentra asociado a una


mayor adherencia del alumno al curso?
Variable predictora TIPO DE CURSO
Variable resultado
Adherencia al curso
Seguimiento
Abandonos
Total

PRESENCIAL

ONLINE

semiPRESENCIAL

190
10 (5%)
200

170
30 (15%)
200

180
20 (10%)
200

11,11

C=

2 + n

C=

11,11 + 600 = 0,135

C < 0,30

Ha: La adherencia al curso es mayor en la modalidad


PRESENCIAL.

p g in a 480

C a pt u l o 6

Nominal por nominal

Valor del estadstico

Significacin (p)

Coeficiente de contingencia C

0,135

0,004

V de Cramer

0,136

0,004

N de casos vlidos

k-1
k
Cmx =

600 pacientes

Cmx
=

3-1
3
0,135

C ajustado =

0,816

= 0,816

= 0,165 (16,5%)

Ha: La adherencia al curso es mayor en la modalidad


PRESENCIAL.

p g in a 481

C a pt u l o 6

p g in a 482

Decisin: El coeficiente de contingencia como medida de asociacin para una escala


nominal, es una funcin de 2. La decisin de aceptar o rechazar la hiptesis se
establece mediante el valor de 2 = 11,11 con dos grados de libertad, y se obtiene una
probabilidad en su distribucin de p < 0,05. Entonces se acepta H y se rechaza H ;
adems, el
a
o

coeficiente 0,135 es distinto de 0, aunque muy lejos de su valor mximo (0,816), ya que
slo supone el 16,5% de dicho valor, y tambin est lejos del punto de corte (0,30) por
lo que la asociacin encontrada es dbil.
Grados de libertad = [ K - 1] [F - 1] = [ 3 1] [2 1] = 2

2 = 11,11

Ho

p = 0,004

Ha

AZAR

2
5,99

C a pt u l o 6

Interpretacin del coeficiente de contingencia


La asociacin existente entre la ADHERENCIA al curso del alumno y
el tipo de modalidad docente utilizada es verdadera, en la cual
conforme sea el tipo de modalidad empleada, cambia la frecuencia de
abandonos de manera significativa, siendo mayor el porcentaje de
abandonos en el modelo ONLINE, con un valor de coeficiente de
contingencia de 0,135.
PRESENCIAL

p g in a 483

C a pt u l o 6

Nominal x Nominales (Tablas > 2 x 2)


V de Cramer
Coeficiente de contingencia
Lambda
Tau de Goodman y Kruskal
Coeficiente de incertidumbre

p g in a 484

C a pt u l o 6

p g in a 485

Tau de Goodman y Kruskal


Al igual que el coeficiente de incertidumbre y lambda, el coeficiente Tau (de
Goodman y Kruskal) es una medida de asociacin basada en la reduccin
proporcional del error. Es una medida que expresa el grado de
incertidumbre que conseguimos reducir cuando utilizamos una variable
para efectuar pronsticos sobre otra.
Nominal por nominal

Valor Tau

EE

Significacin

Tipo de modalidad de curso variable resultado

0,009

0,005

0,004

Rendimiento del curso variable resultado

0,019

0,010

0,004

Ha: La adherencia al curso es mayor en la modalidad


PRESENCIAL.

C a pt u l o 6

p g in a 486

C oeficiente de incertidumbre
Al igual que el coeficiente Tau y lambda, el coeficiente de incertidumbre es
una medida de asociacin basada en la reduccin proporcional del error.
Es una medida que expresa el grado de incertidumbre que conseguimos
reducir cuando utilizamos una variable para efectuar pronsticos sobre otra.
Nominal por nominal

Valor

EE

Significacin
aprox

Simtrica
Tipo de modalidad de curso variable
resultado

0,014
0,009

0,008
0,005

1,762
1,762

0,003
0,003

Adhesin al curso variable resultado

0,030

0,017

1,762

0,003

Ha: La adherencia al curso es mayor en la modalidad


PRESENCIAL.

C a pt u l o 6

p g in a 487

El REN D IMIEN TO acadmico (adquisicin de


conocimientos) al curso de bioestadstica depende del
modelo docente utilizado (presencial, semipresencial o
online)?
Cursos semipresenciales

Presencial

O nline (a distancia)

C a pt u l o 6

Nominal x Nominales (Tablas > 2 x 2)


V de Cramer
Coeficiente de contingencia
Lambda
Tau de Goodman y Kruskal
Coeficiente de incertidumbre

p g in a 488

C a pt u l o 6

p g in a 489

El REN D IMIEN TO acadmico (adquisicin de


conocimientos) al curso de bioestadstica depende del
modelo docente utilizado (presencial, semipresencial o
online)?
Variable predictora TIPO DE CURSO
Variable resultado
Evaluacin de los
conocimientos
Aprobados
Suspensos
Total

= 29,68

2 Pearson

ONLINE

SEMIpresencial

PRESENCIAL

Total

15 (37,5%)
25
40

20 (38,4%)
32
52

60 (80%)
15
75

95
72
167

p = 0,0000004

Existe asociacin

Ha: El rendimiento del curso es dependiente del tipo de modalidad de


enseanza
empleado.
El modelo PRESENCIAL se encuentra asociado a un mayor rendimiento del
alumno?

C a pt u l o 6

El modelo PRESEN C IAL se encuentra asociado a un


mayor rendimiento del alumno?
Variable predictora TIPO DE CURSO
Variable resultado
Evaluacin de los
conocimientos
Aprobados
Suspensos
Total

ONLINE

SEMIpresencial

PRESENCIAL

Total

15 (37,5%)
25
40

20 (38,4%)
32
52

60 (80%)
15
75

95
72
167

29,68

C=

2 + n

C =

29,68 +
167

= 0,388
C > 0,30

Ha: El rendimiento del curso es mayor en la modalidad


PRESENCIAL.

p g in a 490

C a pt u l o 6

Nominal por nominal

Valor del estadstico

Significacin (p)

Coeficiente de contingencia C

0,388

0,000

V de Cramer

0,421

0,000

N de casos vlidos

167 alumnos

k-1
Cmx =

Cmx
=

0,388

C ajustado =

0,816

3-1
3

= 0,816

= 0,475 (47,5%)

Ha: El rendimiento del curso es mayor en la modalidad


PRESENCIAL.

p g in a 491

C a pt u l o 6

Decisin: El coeficiente de contingencia como medida de asociacin para una escala


nominal, es una funcin de 2. La decisin de aceptar o rechazar la hiptesis se
establece mediante el valor de 2 = 29,68 con dos grados de libertad, y se obtiene una
probabilidad en su distribucin de p < 0,00001, dado que la zona de rechazo es mayor
que 0,05.
Entonces se acepta Ha y se rechaza Ho; adems, el coeficiente 0,388 es distinto
de 0, aunque no muy lejos de su valor mximo (0,816), ya que supone el 47,5% del
valor mximo.
Grados de libertad = [ K - 1] [F - 1] = [ 3 1] [2 1] = 2

2 = 29,68

p = 0,0000004

Ho
Ha
AZAR

2
5,99

p g in a 492

C a pt u l o 6

Interpretacin del coeficiente de contingencia


La asociacin existente entre el RENDIMIENTO acadmico del
alumno y el tipo de curso realizado es verdadera, aumentando la
frecuencia
de aprobados de manera significativa (p < 0,00001) en el modelo
PRESENCIAL, con un elevado valor de coeficiente de contingencia
de 0,388 (C > 0,30).
PRESENCIAL

p g in a 493

C a pt u l o 6

C oeficiente Lambda
Al igual que el coeficiente de incertidumbre, lambda es una medida que
expresa el grado de incertidumbre que conseguimos reducir cuando
utilizamos una variable para efectuar pronsticos sobre otra. Lambda tiene
tres versiones dos asimtricas (cuando conocemos la variable predictora y
la resultado) y una simtrica cuando no sabemos cual es la variable
predictora y cual es la variable resultado).
Nominal por nominal

Valor

EE

Significacin
aprox

Simtrica
Tipo de modalidad de curso variable
resultado

0,238
0,185

0,077
0,067

2,801
2,527

0,005
0,012

Adhesin al curso variable resultado

0,306

0,111

2.331

0,020

Ha: El rendimiento del curso es dependiente del tipo de modalidad de


enseanza
empleado.

p g in a 494

C a pt u l o 6

p g in a 495

Tau de Goodman y Kruskal


Al igual que el coeficiente de incertidumbre y lambda, el coeficiente Tau (de
Goodman y Kruskal) es una medida de asociacin basada en la reduccin
proporcional del error. Es una medida que expresa el grado de
incertidumbre que conseguimos reducir cuando utilizamos una variable
para efectuar pronsticos sobre otra.
Nominal por nominal

Valor Tau

EE

Significacin

Tipo de modalidad de curso variable resultado

0,103

0,034

0,000

Rendimiento del curso variable resultado

0,178

0,057

0,000

Ha: El rendimiento del curso es dependiente del tipo de modalidad


de
enseanza
empleado.

C a pt u l o 6

p g in a 496

C oeficiente de incertidumbre
Al igual que el coeficiente Tau y lambda, el coeficiente de incertidumbre es
una medida de asociacin basada en la reduccin proporcional del error.
Es una medida que expresa el grado de incertidumbre que conseguimos
reducir cuando utilizamos una variable para efectuar pronsticos sobre otra.
Nominal por nominal

Valor

EE

Significacin
aprox

Simtrica
Tipo de modalidad de curso variable
resultado

0,106
0,087

0,036
0,030

2,958
2,958

0,000
0,000

Adhesin al curso variable resultado

0,136

0,046

2,958

0,000

Ha: El rendimiento del curso es dependiente del tipo de modalidad de


enseanza
empleado.

C a pt u l o 6

Pregunta de investigacin
El resultado del tratamiento depende del frmaco
empleado?
La condicin de asintomtico se encuentra asociado al
uso de
Variable RESULTAD O
Variable
Mosaprida?
PRED IC TO RA
- Metoclopramida (n = 99)
Cualitativa
- Cisaprida (n = 102)
policotmica
- Mosaprida (n = 99)

Cul es el test estadstico ms


adecuado?

C ualitativa
- Asintomtico
policotmica

- Sntomas
- Mejora clnica

p g in a 497

C a pt u l o 6

Nominal x Nominales (Tablas > 2 x 2)


V de Cramer
Coeficiente de contingencia
Lambda
Tau de Goodman y Kruskal
Coeficiente de incertidumbre

p g in a 498

C a pt u l o 6

El resultado del tratamiento depende del frmaco


empleado?
Variable RESULTADO Resultado del tratamiento a la
semana

Tipo de medicamento

Asintomtico

Sintomtico

Mejora

Metoclopropamida
Cisaprida
Mosaprida

24 (8%)
27 (9%)
51 (17%)

54 (18%)
18 (6%)
27 (9%)

21 (7%)
57 (19%)
21 (7%)

= 60,12

2 Pearson

p = 0,000

Existe asociacin

Ha: El resultado del tratamiento depende del frmaco


empleado.
La condicin de asintomtico se encuentra asociada al uso de
Mosaprida?

Coeficiente Lambda

p g in a 499

C a pt u l o 6

C oeficiente Lambda
Al igual que el coeficiente de incertidumbre, lambda es una medida que
expresa el grado de incertidumbre que conseguimos reducir cuando
utilizamos una variable para efectuar pronsticos sobre otra. Lambda tiene
tres versiones dos asimtricas (cuando conocemos la variable predictora y
la resultado) y una simtrica cuando no sabemos cual es la variable
predictora y cual es la variable resultado).
Nominal por nominal

Valor

EE

Significacin
aprox

Simtrica
Tipo de Frmaco variable resultado
Resultado del tratamiento a la semana
variable resultado

0,303
0,303
0,303

0,048
0,052
0,054

5,814
5,108
4,899

Ha: La condicin de asintomtico se encuentra asociada al uso de


Mosaprida.

0,000
0,000
0,000

p g in a 500

C a pt u l o 6

Nominal x Nominales (Tablas > 2 x 2)


V de Cramer
Coeficiente de contingencia
Lambda
Tau de Goodman y Kruskal
Coeficiente de incertidumbre

p g in a 501

C a pt u l o 6

Pregunta de investigacin
El resultado del tratamiento depende del frmaco
empleado?
La condicin de asintomtico se encuentra asociada al
uso de
Variable RESULTAD O
Variable
Mosaprida?
PRED IC TO RA
- Metoclopramida (n = 99)
Cualitativa
- Cisaprida (n = 102)
policotmica
- Mosaprida (n = 99)

Cul es el test estadstico ms


adecuado?

C ualitativa
- Asintomtico
policotmica

- Sntomas
- Mejora clnica

p g in a 502

C a pt u l o 6

El resultado del tratamiento depende del frmaco


empleado?
Variable RESULTADO Resultado del tratamiento a la
semana

Variable PREDICTORA Asintomtico


Tipo de medicamento

Sintomtico

Mejora

Metoclopropamida

24 (8%)

54 (18%)

21 (7%)

Cisaprida
Mosaprida

27 (9%)
51 (17%)

18 (6%)
27 (9%)

57 (19%)
21 (7%)

= 60,12

2 Pearson

p = 0,000

Existe asociacin

Ha: El resultado del tratamiento depende del frmaco


empleado.
La condicin de asintomtico se encuentra asociada al uso de
Mosaprida?

Coeficiente de incertidumbre

p g in a 503

C a pt u l o 6

p g in a 504

C oeficiente de incertidumbre
Al igual que el coeficiente Tau y lambda, el coeficiente de incertidumbre es
una medida de asociacin basada en la reduccin proporcional del error.
Es una medida que expresa el grado de incertidumbre que conseguimos
reducir cuando utilizamos una variable para efectuar pronsticos sobre otra.
Nominal por nominal

Valor

EE

Significacin
aprox

Simtrica
Tipo de Frmaco variable resultado
Resultado del tratamiento a la semana
variable resultado

0,086
0,086
0,086

0,023
0,023
0,023

3,801
3,801
3,801

Ha: La condicin de asintomtico se encuentra asociada al uso de


Mosaprida.

0,000
0,000
0,000

C a pt u l o 6

O dds Ratio
(O R)

p g in a 505

Enfermedad (Variable resultado)

Exposicin (Variable predictora)

Casos

(+)

(-)

A: Personas enfermas que estn


expuestas B: Personas sanas que estn
expuestas
C: Personas enfermas que no
estn expuestas
D: Personas sanas que no estn
expuestas

Controles

Tasa de exposicin
observada en los CASOS

OR =

Tasa de exposicin observada


en los CONTROLES

[A/C]

OR =

[B/D]
[ (A * D) ]

OR =

[ (B * C) ]

C a pt u l o 6

C aractersticas de la O dds Ratio (O R)


-Medida de asociacin.
- Valores mayores de 1 (asociacin positiva) (factor de riesgo).
- Valores menores de 1 (asociacin negativa) (factor de proteccin).
- Valor = 1 (no existe asociacin).
- Estudios casos-controles.
-OR: es la razn entre la probabilidad de que un suceso ocurra y la
probabilidad de que no ocurra.
-OR : cociente entre la tasa de exposicin observada en el grupo de casos
(A/C) y la tasa de exposicin observada en el grupo control (B/D).
- OR: refleja la probabilidad de que los casos (cncer de pulmn) estn
expuestos al factor de estudio (tabaco) comparada con la probabilidad de
que lo estn los controles.

p g in a 506

C a pt u l o 6

Pregunta de investigacin
Qu relacin y qu medida de asociacin existe
entre la cloracin del agua y el cncer de vejiga?
Variable PRED IC TO RA
C UALITATIVA
Cloracin del agua
dicotmica

Cul es el test estadstico ms


adecuado?

Variable RESULTAD O
C UALITATIVA
C ncer de vejiga
dicotmica

p g in a 507

C a pt u l o 6

O dds Ratio
(O R)

p g in a 508

Cncer de vejiga

Exposicin

Casos

Controles

Cloracin (+)

Cloracin (-)

D
Tasa de CLORACIN observada en los
enfermos de CANCER de vejiga (casos)

A: Personas enfermas de cncer de


vejiga expuestas al cloro
B: Personas sanas expuestas al cloro
C: Personas enfermas de cncer de vejiga
no expuestas al cloro
D: Personas sanas no expuestas al cloro

OR =Tasa de CLORACIN observada


en SANOS (controles)

[A/C]

OR =

[B/D]
[ (A * D) ]

OR =

[ (B * C) ]

C a pt u l o 6

Influencia de la metodologa
evaluacin de la exposicin

de la

p g in a 509

C a pt u l o 6

Rodrguez Calabuig D, Igual Adell R, Oltra Alcaraz C, Snchez Snchez P, Bustamante Balen M, Parra
Godoy F y Nagore Enguidanos E. Actividad laboral agrcola y estrongiloidiasis. Estudio caso-control. Rev
Cln Esp 2001; 201:81-84

p g in a 510

C a pt u l o 6

Ejemplo de uso de la O R:
Estudio caso-control
- CASOS: Individuos con Strongiloides stercolaris en las heces ante la
presencia de eosinofilias en el hemograma.
- CONTROLES: Individuos de igual edad y sexo sin eosinofilia ni parsitos
en
heces.

Rodrguez Calabuig D, Igual Adell R, Oltra Alcaraz C, Snchez Snchez P, Bustamante Balen M, Parra
Godoy F y Nagore Enguidanos E. Actividad laboral agrcola y estrongiloidiasis. Estudio caso-control. Rev
Cln Esp 2001; 201:81-84.

p g in a 511

C a pt u l o 6

O dds Ratio (O R)
Ejemplo estudio casocontrol

p g in a 512

C a pt u l o 6

O dds Ratio (O R)
Ejemplo estudio casocontrol

p g in a 513

C a pt u l o 6

p g in a 514

Actividad laboral agrcola y


estrongiloidiasis Estudio caso-control
D iscusin
Un gran nmero de personas trabajaban descalzas en la siembra, cuidando y
recolectando el arroz, con los pies hundidos en el fango durante largos perodos de
tiempo, lo que facilitara la entrada del nematodo. Los resultados obtenidos, especificando
el tipo
de actividad, muestran una asociacin de la estrongiloidiasis con el cultivo de arroz OR
de 2,97 (IC 95%: 1,16-7,71), lo que representa un mayor riesgo de infestacin. En la
limpieza de acequias se obtuvo tambin una tendencia casi significativa OR de 2,39 (IC
95%:
0,85-6,82), en cambio en el cultivo de ctricos y de hortalizas, que habitualmente no se
realizaban descalzos ni en tierras fangosas, no se han encontrado estas diferencias.

Rodrguez Calabuig D, Igual Adell R, Oltra Alcaraz C, Snchez Snchez P, Bustamante Balen M, Parra
Godoy F y Nagore Enguidanos E. Actividad laboral agrcola y estrongiloidiasis. Estudio caso-control. Rev
Cln Esp 2001; 201:81-84.

C a pt u l o 6

Mito 1: La sonrisa de la
esfinge

p g in a 515

En las tablas 1 y 2 presentadas se han incluido slo el valor de la OR y su IC95%, pero


no se ha incluido el valor del estadstico (test de contraste de hiptesis) ni la
significacin estadstica p para cada variable predictora presuntamente significativa.
Cul es el valor de la p?
Por qu dices que la prctica de la limpieza de acequias est relacionada con
la estrongiloidiasis cuando el valor del IC95% de la OR incluye a la unidad?
Cul es el test de contraste de hiptesis que has empleado en cada
asociacin? Test de 2 Pearson
He calculado el valor del estadstico 2 Pearson NO hay la significacin
estadstica.
Ser un error beta ?
Cul es la potencia estadstica del estudio (valor )?

C a pt u l o 6

Q u relacin y qu medida de asociacin existe


entre la
prctica del cultivo de arroz y la estrongiloidiasis?
Test de 2 de Pearson
Variable PREDICTORA
Cultivo de arroz
Si
No
Total

Pearson

= 6,36;

p = 0,012

Variable
RESULTADO
Estrongiloidiasis
Casos

Controles

Total

25 (53%)
22
47

13 (28%)
34
47

38
56
94

OR = 2,97 (1,167,71)
Q de Yule = 0,50

p g in a 516

C a pt u l o 6

Resumen del procesamiento informtico de los


datos
Clculos del programa estadstico tabla
2x2
2Pearson

Valor
6,361

Grados de
libertad
1

Contraste
bilateral
0,012

Correccin de Yates

5,345

0,021

Razn de verosimilitud

6,447

0,011

Test exacto de Fisher

0,020

Contraste
unilateral

0,010

Ho (hiptesis nula) = La prctica del cultivo de arroz NO est asociada a la


N Casos vlidos
94
estrongiloidiasis
en el grupo
estudiado.
Ha (hiptesis alternativa) = La prctica del cultivo de arroz est asociada a
la
estrongiloidiasis en el grupo
estudiado.

p g in a 517

C a pt u l o 6

Test de 2 de Pearson (1 grado de


libertad)
2 Pearson calculado = 6,36

2
> 22Pearson tabulado
P
>
AZAR

= 3,84

Ha (hiptesis alternativa) = Existe relacin entre la


prctica del cultivo de arroz y la estrongiloidiasis.
2 = 6,36

Error alfa
Ha

Ho
AZAR

= 3,84
Pearson tabulado

p g in a 518

C a pt u l o 6

Pregunta de investigacin
Qu relacin y qu medida de asociacin existe
entre la
prctica del cultivo del arroz y la estrongiloidiasis?
Variable PRED IC TO RA
C UALITATIVA
Cultivo de arroz
dicotmica

Variable RESULTAD O
C UALITATIVA
Estrongiloidiasis
dicotmica

OR = 2,97
2Pearson = 6,36;

p = 0,012

IC95% = 1,16
7,71
Q de Yule = 0,50

p g in a 519

C a pt u l o 6

Q u relacin y qu medida de asociacin existe


entre la
prctica de la limpieza de acequias y la
estrongiloidiasis?
Test de 2 de Pearson
Variable
Variable PREDICTORA
Limpieza de acequia
Si
No
Total

2 = 3,40 ;

RESULTADO
Estrongiloidiasis
Casos

Controles

Total

17 (36%)
30
47

9 (19%)
38
47

26
68
94

p = 0,065

No existe asociacin

p g in a 520

C a pt u l o 6

Resumen del procesamiento informtico de los


datos
Clculos del programa estadstico tabla
2x2
2Pearson

Valor
3,403

Grados de
libertad
1

Contraste
bilateral
0,065

Correccin de Yates

2,605

0,107

Razn de verosimilitud

3,445

Test exacto de Fisher

Contraste
unilateral

0,063
1

0,106

Ho (hiptesis nula) = La limpieza de acequias NO est asociada a


N Casos vlidos
94
la
estrongiloidiasis en el grupo
estudiado.
Ha (hiptesis alternativa) = La limpieza de acequias est asociada a
la
estrongiloidiasis en el grupo
estudiado.

0,053

p g in a 521

C a pt u l o 6

Pregunta de investigacin
Qu relacin y qu medida de asociacin existe
entre la
prctica de la limpieza de acequias y la
Variable PRED IC TO RA
Variable RESULTAD O
estrongiloidiasis?
C UALITATIVA
Limpieza de acequias
dicotmica

C UALITATIVA
Estrongiloidiasis
dicotmica

OR = 2,39

= 3,40 ;

p = 0,065

IC95% = 0,85 6,82


Q de Yule = 0,41

p g in a 522

C a pt u l o 6

Test de 2 de Pearson (1 grado de


libertad)
2 Pearson calculado = 3,40

<
<

2Pearson tabulado = 3,84

AZAR

Ho (hiptesis nula) = NO existe relacin entre la prctica


de la limpieza de acequias y la estrongiloidiasis.
2 = 3,40

Grados de libertad = [ K - 1] [F - 1] = (2-1) (2 -1) = 1

Error alfa
Ha

Ho
AZAR

= 3,84
Pearson tabulado

p g in a 523

C a pt u l o 6

Riesgo Relativo
(RR)

p g in a 524

Enfermedad (E)

Exposicin (F)

Casos

Controles

Tabaco (+)

Tabaco (-)

A: Personas enfermas de cncer de


pulmn fumadoras
B: Personas sanas fumadoras
C: Personas enfermas de cncer de
pulmn no fumadores
D: Personas sanas no fumadoras

[ A / (A + B)]

RR =

[ C / (C + D) ]
A<< B

C<< D

A+ B B C+D
D

[ (A * D) ]

RR =
Es la probabilidad de que una enfermedad (E) se desarrolle en el
grupo expuesto (F) en relacin a la del grupo no expuesto.

[ (B * C) ]

C a pt u l o 6

Pregunta de investigacin
Qu relacin y qu medida de asociacin existe
entre la exposicin al humo del tabaco durante la
gestacin y el bajo peso al nacimiento del RN ?
Variable PRED IC TO RA
C UALITATIVA
Exposicin al humo del
dicotmica
tabaco

Variable RESULTAD O
C UALITATIVA
Peso del RN
dicotmica

RR = 2,71 (1,385,34)

Q de Yule = 0,47
2Pearson= 9.03; p =

0.00265
Martn TR, Bracken MB. Association of low birth weight with passive smoke exposure in
pregnancy. Am J. Epidemiol 1986; 124: 633-642.

p g in a 525

p g in a 526

C a pt u l o 6

Riesgo Relativo
(RR)

Enfermedad (E)

Exposicin (F)

Casos

Controles

Tabaco (+)

A (20)

B (833)

Tabaco (-)

C (14)

D (1606)

A: RN de bajo peso de madres expuestas


al tabaco
B: RN normopeso de madres expuestas
al tabaco
C: RN de bajo paso de madres NO
expuestas al tabaco
D: RN normopeso de madres NO
expuestas al tabaco

En la Tabla, exponemos los resultados


de un estudio de seguimiento donde
853 mujeres estuvieron pasivamente
expuestas al humo del tabaco durante
la gestacin y 1620 no lo estuvieron,
y su asociacin con el bajo peso al
nacer.
2 = 9.03; p =
0.00265
95% IC (1.38;5.34)

RR =

Q de Yule = 0,47
Ie
20/853

Io

14/1620

= 2,713

El RR es 2.71, significa que las


expuestas al factor F (exposicin
pasiva al tabaco) tienen 2,71 veces
ms probabilidades de tener nios de
bajo peso que las no expuestas.

Martn TR, Bracken MB. Association of low birth weight with passive smoke exposure in pregnancy. Am J.
Epidemiol 1986; 124: 633-642.

C a pt u l o 6

Pregunta de investigacin
Qu relacin y qu medida de asociacin existe
entre el sedentarismo (factor de riesgo) y el
desenlace (muerte) en pacientes que han sufrido un
IAM?
Variable PRED IC TO RA
Variable RESULTAD O
C UALITATIVA
Ejercicio
dicotmica
moderado/
Sedentarismo

C UALITATIVA
Muerte / Supervivencia
dicotmica

100
pacientes
con IAM

p g in a 527

C a pt u l o 6

p g in a 528

Evolucin de 100 pacientes con IAM a los 5 aos en funcin del ejercicio fsico realizado.
Existe asociacin entre el factor de riesgo (SEDENTARISMO) y el desenlace
(MUERTE)?
Cul es la magnitud de dicha asociacin?

Sedentari
os N = 40

Ejercicio
moderad
o N = 60

Seguimient
o 5 aos
100 pacientes
con IAM

Fallecimientos A = 15
Sobrevivientes B = 25
Fallecimientos C = 10

Seguimient
o 5 aos

Sobrevivientes D = 50

C a pt u l o 6

Evolucin de 100 pacientes


con IAM a los 5 aos en
funcin del ejercicio fsico
Exposicin (F) Variable
predictora

Desenlace (E)
Variable resultado
Muerte

Sobreviviente

Sedentarismo (+)

A = 15

B = 25

Sedentarismo (-)

C = 10

D = 50

100 pacientes con IAM


A: Fallecidos con
sedentarismo B:
Sobrevivientes sedentarios C:
Fallecidos deportistas
D: Sobrevivientes deportistas

Cul es la prueba
estadstica ms
adecuada?

Existe asociacin entre el factor


de riesgo (SEDENTARISMO) y el
desenlace (MUERTE)?

p g in a 529

C a pt u l o 6

Test de 2 de
Pearson
Clculos del
Valor

Grados de libertad

Contraste bilateral

Contraste unilateral

programa
estadstico
2Pearson (*)

5,56

0,018

Correccin de
Yates

4,50

0,034

Razn de
verosimilitud

5,47

Test exacto
de Fisher
N Casos vlidos

0,019
1

0,033

0,017

100

Ha: Existe asociacin entre el factor de riesgo (SEDENTARISMO) y el


desenlace
(MUERTE).

p g in a 530

C a pt u l o 6

p g in a 531

2 = 5,56

Error alfa
Ha

Ho

AZAR

Pearson tabulado

= 3,84

Pearson tabulado = 3,84


earson calculado = 5,56 >
P

Existe asociacin

p < 0,05

C a pt u l o 6

Evolucin de 100 pacientes


con IAM a los 5 aos en
funcin del ejercicio fsico
Exposicin (F) Variable
predictora

p g in a 532

Desenlace (E)
Variable resultado
Muerte

Sobreviviente

Sedentarismo (+)

A = 15

B = 25

Sedentarismo (-)

C = 10

D = 50

100 pacientes con


IAM
A: Fallecidos con
sedentarismo B:
Sobrevivientes sedentarios C:
Fallecidos deportistas
D: Sobrevivientes deportistas

Cul es la intensidad o
magnitud de dicha asociacin?

RR =

[ A / (A + B)]
[ C / (C + D) ]

Es la probabilidad de morir (E) en el grupo de sedentarios (expuestos al factor de riesgo) en relacin con la
probabilidad de muerte en deportistas (grupo no expuesto).

C a pt u l o 6

Tasa de Incidencia de muertes en


sedentarios (en expuestos)

Riesgo Relativo (RR) =

RR =

Tasa de Incidencia de muertes


en deportistas ( NO expuestos )

RR =

[ A / (A + B)]
[ C / (C + D) ]

RR =

[ 15 / (15 + 25)]

Q de Yule = 0,50
2Pearson= 5,56;

Io

= 2,25

[ 10 / (10 + 50) ]

RR = 2,25

p=
0,018

Ie

p g in a 533

C a pt u l o 6

Pregunta de investigacin
Qu relacin y qu medida de asociacin existe
entre el ejercicio fsico moderado (factor de
riesgo) y el desenlace (muerte) en pacientes que
han
sufrido
IAM?
Variable
PREDun
IC TO
RA
Variable RESULTAD O
C UALITATIVA
Ejercicio
dicotmica
moderado/
Sedentarismo

C UALITATIVA
Muerte / Supervivencia
dicotmica

100
pacientes
con IAM

p g in a 534

C a pt u l o 6

Evolucin de 100 pacientes con IAM a los 5 aos en funcin del ejercicio fsico
realizado.
Existe asociacin entre el factor de riesgo (EJERCICIO FSICO) y el
desenlace (MUERTE)? Cul es la magnitud de dicha asociacin?

Ejercicio
moderad
o N = 60

Sedentari
os N = 40

Seguimient
o 5 aos
100 pacientes
con IAM

Fallecimientos C = 10
Sobrevivientes D = 50
Fallecimientos A = 15

Seguimient
o 5 aos

Sobrevivientes B = 25

p g in a 535

C a pt u l o 6

Evolucin de 100 pacientes


con IAM a los 5 aos en
funcin del ejercicio fsico
Exposicin (F) Variable
predictora

p g in a 536

Desenlace (E)
Variable resultado
Muerte

Sobreviviente

Ejercicio fsico (+)

A = 10

B = 50

Ejercicio fsico (-)

C = 15

D = 25

100 pacientes con


IAM
A: Fallecidos con ejercicio fsico
moderado B: Sobrevivientes con ejercicio
fsico moderado
C: Fallecidos sedentarios (NO
deportistas)
D: Sobrevivientes sedentario (NO
deportistas)

RR =

[ A / (A + B)]
[ C / (C + D) ]

Es la probabilidad de morir (E) en el grupo de deportistas (expuestos al factor de riesgo) en relacin con la
probabilidad de muerte en sedentarios -NO deportistas- (grupo no expuesto).

C a pt u l o 6

Tasa de Incidencia de muertes en


deportistas moderados (en expuestos)

Riesgo Relativo (RR) =


Tasa de Incidencia de muertes
en sedentarios ( NO expuestos )

RR =

[ A / (A + B)]
[ C / (C + D) ]

RR =

[ 10 / (10 + 50)]
[ 15 / (15 + 25) ]

RR = 0,44
Q de Yule = - 0,50
=
2 Pearson

5,56;

RR =

p=
0,018

Ie
Io

= 0,44

p g in a 537

C a pt u l o 6

p g in a 538

Evolucin de 100 pacientes operados con una NUEVA tcnica quirrgica frente a
100 pacientes operados con la tcnica CLSICA.

Nueva tcnica
quirrgica Grupo
problema
N= 100
Tcnica
clsica Grupo
Control N =
100

Seguimiento

C omplicaciones A = 15
Sin complicaciones B = 85
C omplicaciones C = 20

Seguimiento

Sin complicaciones D = 80

C a pt u l o 6

Tasa de Incidencia de complicaciones


con la NUEVA tcnica

RR =

Riesgo Relativo (RR) =


Tasa de Incidencia de
complicaciones con la tcnica
CLASICA

RR =

[ A / (A + B)]
[ C / (C + D) ]

RR =

RR =
0,75
RRR = [ 1 RR ] * 100
RRA = [ IN IC ] *
100

[ 15 / (15 + 85)]
[ 20 / (20 + 80) ]

RRR =
25%
RRA =
5%

Ie
Io

= 0,75

p g in a 539

C a pt u l o 6

Evento en estudio
Complicaciones quirrgicas
15%

Frmula
Incidencia de complicaciones
quirrgicas con la NUEVA
tcnica
Incidencia de complicaciones

I N = [ A / (A + B)]

quirrgicas con la tcnica

I C = [ C / (C +

D) ]

20%

CLSICA
RIESGO RELATIVO (RR)

[ A / (A + B)]

0,75

RR =
[ C / (C + D) ]
Reduccin del RIESGO

RRR = [ 1 RR ] * 100

RELATIVO (RRR)
Reduccin ABSOLUTA del
RIESGO (RAR)

Nmero de pacientes que se


necesita operar (NNT)

25%
5%

RAR = [ IN IC ] * 100
NNT = [ 1 / RAR ] * 100

20

p g in a 540

C a pt u l o 6

Escenario clnico: Un da muy ocupado en su centro y usted esta sentado


con la piernas en alto, hojeando un nmero reciente de Mdicos en su
tiempo libre. Se encuentra con un anuncio de PLAVIX que indica que
este medicamento produce una reduccin del riesgo de eventos
cardiovasculares
en un 8% comparado con aspirina. Usted piensa si debera cambiar todos
sus
Eventos resultantes del anlisis del estudio CAPRIE
pacientes a Plavix .
PLAVIX
ASPIRINA
DIFERENCIA
Pacientes

9599

9586

ICTUS
IAM
Otras muertes vasculares
Total de eventos vasculares

4,6%
2,9%
2,4%
9,8%

4,8%
3,5%
2,4%
10,7%

- 0,2%
- 0,6%
0%
- 0,9%

Como se muestra en el cuadro PLAVIX se asoci con una menor


incidencia de eventos resultantes de cualquier clase. La reduccin del
Riesgo Relativo fue de 8,7% con un IC95% = 0,3-16,5% p=0,045. Sin
embargo la reduccin del riesgo absoluto (9,8% contra 10,7%) fue de tan
slo 0,9%.

p g in a 541

C a pt u l o 6

p g in a 542

Aparicin de eventos cardiovasculares despus de un periodo de seguimiento en


pacientes tratados con PLAVIX (grupo problema) frente a los pacientes tratados con
ASPIRINA (grupo control).

Grupo problema
PLAVIX

Grupo control
ASPIRINA

Iplavix = 9,8

Eventos cardiovasculares A

Seguimiento

Sin eventos B

Seguimiento

Eventos cardiovasculares C

Iaspirina = 10,7

Sin eventos D

C a pt u l o 6

Tasa de Incidencia de eventos


cardiovasculares con el PLAVIX

Riesgo Relativo (RR) =


Tasa de Incidencia de eventos
cardiovasculares con ASPIRINA

RR =

IP
IA

9,8
10,7

= 0,916

RRR = [ 1 RR ] * 100

RR =
0,916
RRR =
8,7%

IC95% = 0,3-16,5%

RAR = [ IP IA ] *
100
NNT = [ 1 / RAR ] *
100

IP

RR =

IA

p = 0,045

RAR = 0,9%
NNT = 111
pacientes

p g in a 543

C a pt u l o 6

Evento en estudio
Complicaciones quirrgicas

Frmula
Incidencia de eventos
cardiovasculares con el PLAVIX
Incidencia de eventos
cardiovasculares con la
ASPIRINA
RIESGO RELATIVO (RR)

I Plavix= [ A / (A + B)]
I Aspirina = [ C / (C + D)
RR =

[ A / (A + B)]

9,8%
10,7%

]
0,916

[ C / (C + D) ]
Reduccin del RIESGO
RELATIVO (RRR)
Reduccin ABSOLUTA del
RIESGO (RAR)
Nmero de pacientes que se
necesita operar (NNT)
Aumento del coste mensual del
Plavix respecto a la aspirina

RRR = [ 1 RR ] * 100

8,7%

RAR = [ IN IC ] * 100

0,9%

NNT = [ 1 / RAR ] * 100

111

Ensayo CAPRIE (Lancet)

+ 112 $ (94 )

p g in a 544

C a pt u l o 6

p g in a 545

Resolucin del
escenario
El 8,7% de reduccin del riego que publica el artculo es la Reduccin del Riesgo
Relativo (RRR). La Reduccin Absoluta del Riesgo (RAR) fue un ridculo 0,9%,
con un NNT muy elevado (111), con un amplio IC95% (de 57 a 2500). El resultado
fue
estadsticamente significativo casi marginalmente, p = 0,045, donde el IC95% de la RRR
fue del 0.3% al 16.5%, que ni siquiera apareca en el texto (slo a pie de tabla). Aunque
es estadsticamente significativo, sin embargo la significacin CLNICA es muy
cuestionable. La RRR del 8,7% de Plavix frente a aspirina se dibuja en un grfico con
una rea que es casi igual que la del 25% del RRR de la aspirina frente al placebo,
violando claramente
de la ley de Tufte (factor mentiroso de Tufte = Tamao del efecto mostrado en el
grfico / Tamao del efecto en los datos 1).
La publicacin es un estudio real, el ensayo CAPRIE publicado en Lancet, y sin embargo,
despus de todo usted lgicamente decide, ahorrarles a sus pacientes y a la Seguridad
Social los 112 dlares (94) al mes que cuesta Plavix y seguir tratando a sus pacientes
con aspirina.

C a pt u l o 6

p g in a 546

Objetivo: Evaluar la eficacia de la disminucin de colesterol con simvastatina en la reduccin de la


mortalidad y morbilidad en pacientes con enfermedad coronaria (EC).
Diseo: Ensayo clnico controlado, aleatorizado en dos ramas, a doble ciego con placebo y un seguimiento
medio de 5,4 aos.
mbito: Pacientes procedentes de 95 centros mdicos de Escandinavia.
Sujetos de estudio: 4.444 pacientes de entre 35 y 70 aos, 81% hombres, 51% mayores de 60 aos, con
antecedentes de infarto de miocardio previo a angina de pecho, colesterol srico de 5,5 a 8,8 mmol/l,
concentraciones medias de HDL de 1,18 mmol/l, LDL 4,87 mmol/l, triglicridos 1,50 mmol/l y dieta
hipolipemiante concurrente.
Intervencin: 2.223 sujetos se les administraron 20 mgr de simvastatina y a 2.221 el correspondiente
placebo.
Parmetros principales de eficacia: Mortalidad total, mortalidad de causa coronaria, infarto de
miocardio no
letal probable o definitivo verificado.
Resultados principales: Durante los 5,4 aos en promedio de seguimiento la simvastatina produjo unos
cambios medios de colesterol total, LDL colesterol y HDL colesterol de 25%, -35% y +8%,
respectivamente. 256 (12%) sujetos en el grupo de placebo murieron en comparacin con 182 (8%) en
el grupo de simvastatina. Hubo 189 muertes de origen coronario en el grupo de placebo y 111 en el de
simvastatina y 49 y 46 muertes de origen no cardiovascular en dichos grupos, respectivamente. 622 sujetos
(28%) en el grupo con placebo y 431 (19%) en el de simvastatina tuvieron uno o ms incidentes coronarios
mayores.
Conclusiones: La disminucin de la concentracin de colesterol con simvastatina reduce la mortalidad
total y la incidencia de incidentes cardiovasculares mayores.

Randomised trial of cholesterol lowering in 4444 patients with coronary heart disease: the Scandivarian
Simvastatin Survival Study (4S). Lancet 1994; 334: 1383-1389.

C a pt u l o 6

Grupo problema
SIMVASTATINA
N = 2223

Grupo control
PLACEBO
N = 2221

ISimvastatina = 19%

Seguimiento
medio 5,4
aos
IPlacebo = 28%

Incidentes
coronarios mayores
A = 431
Sin eventos B
Incidentes
coronarios mayores
C = 622
Sin eventos D

Randomised trial of cholesterol lowering in 4444 patients with coronary heart disease: the
Scandivarian Simvastatin Survival Study (4S). Lancet 1994; 334: 1383-1389.

p g in a 547

C a pt u l o 6

Muertes de origen NO

Grupo problema
SIMVASTATINA
N = 2223

cardiovascular 46

ISimvastatina = 8%
Muertes de origen NO

Grupo control
PLACEBO
N = 2221

cardiovascular 49

IPlacebo = 12%

Muertes de origen
cardiovascular A =
111
Sin eventos B
Muertes de origen
cardiovascular C =
189
Sin eventos D

Seguimiento
medio 5,4
aos
Randomised trial of cholesterol lowering in 4444 patients with coronary heart disease: the
Scandivarian Simvastatin Survival Study (4S). Lancet 1994; 334: 1383-1389.

p g in a 548

p g in a 549

C a pt u l o 6

Simvastatina Placebo

RR

RRR

RAR

[ 1 RR ] * 100 IS IP

NNT
[ 1 / RAR ] *
100

Incidencia
en tratados
con
Simvastatina
IS

Incidencia
en tratados
con
placebo
IP

Incidentes
cardiovasculares
mayores

19%

28%

0,68

32%

9%

11

Mortalidad

8%

12%

0,66

33%

4%

25

IS
RR =

IA

Randomised trial of cholesterol lowering in 4444 patients with coronary heart disease: the
Scandivarian Simvastatin Survival Study (4S). Lancet 1994; 334: 1383-1389.

C a pt u l o 6

Grupo problema
WARFARINA
N = 1103

Grupo control
ASPIRINA
N = 1103

Prdidas

IWarfarina = 17,8

Prdidas

IAspirina = 16,0

Recurrencia de
accidentes vasculares
cerebrales de ori- gen
isqumico o muerte
196
Sin eventos
Recurrencia de
accidentes vasculares
cerebrales de ori- gen
isqumico o muerte
176
Sin eventos

Seguimiento 2 aos
Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al. A comparison
of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.

p g in a 550

C a pt u l o 6

p g in a 551

C a pt u l o 6

Riesgo Relativo (RR) =

RR =

17,8
16,0

Tasa de Incidencia de Recurrencia de


accidentes vasculares cerebrales de origen
isqumico o muerte con WARFARINA
Tasa de Incidencia de Recurrencia de
accidentes vasculares cerebrales de
origen isqumico o muerte con ASPIRINA

RR =

= 1,13

RR = 1,13 ;

IC95% = 0,92 -

p = 0,25

1,38

RRR = [ 1 RR ] * 100

RRR = 13%

Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al. A comparison
of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.

IW
IA

p g in a 552

C a pt u l o 6

Grupo problema
WARFARINA
N = 1103

IWarfarina =

Prdidas

2,2

Hemorragia
s Intensas
44

Seguimiento 2 aos
Sin eventos

Grupo control
ASPIRINA
N = 1103

IAspirina = 1,5

Prdidas

Hemorragia
s Intensas
30
Sin eventos

Seguimiento 2 aos
Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al. A comparison
of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.

p g in a 553

C a pt u l o 6

Riesgo Relativo (RR) =

RR =

IP
IA

Tasa de Incidencia de HEMORRAGIAS


intensas con WARFARINA
Tasa de Incidencia de HEMORRAGIAS
intensas con ASPIRINA

RR =

= 1,48

IC95%= 0,932,44

p = 0,10

RRR = [ 1 RR ] * 100

RRR = 48%

RR =
1,48;

Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al. A comparison
of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.

2,2
1,5

p g in a 554

C a pt u l o 6

Incidencia
HEMORRAGIAS
intensas

Warfarina

Aspirina

Incidencia en
tratados con
WARFARINA
IW

Incidencia
en tratados
con
ASPIRINA
IA

2,2

1,5

RR

RRR
IS

RR =

[ 1 RR ]
* 100

RAR
IW I A

IA

1,48

- 48%

0,7

Adems, tal como comentaban los autores en la discusin del artculo, la


warfarina tiene un coste mayor y requiere una monitorizacin ms
estrecha.
Con estos datos, se puede considerar que la warfarina y la
aspirina son alternativas teraputicas razonables para prevenir los
accidentes cerebrovasculares isqumicos recurrentes?
Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al.
A comparison of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.

p g in a 555

C a pt u l o 6

Grupo problema
WARFARINA
N = 1103

Hemorragias
leves 413
IWarfarina = 20,8

Prdidas

Seguimiento 2 aos
Sin eventos

Grupo control
ASPIRINA
N = 1103

IAspirina =

Prdidas

Hemorragias
leves 259

12,9

Sin eventos
Seguimiento 2 aos

Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al. A comparison
of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.

p g in a 556

C a pt u l o 6

Riesgo Relativo (RR) =

RR =

RR =
1,61;

IP
IA

Tasa de Incidencia de HEMORRAGIAS


leves con WARFARINA
Tasa de Incidencia de HEMORRAGIAS
leves con ASPIRINA

RR =

12,
9

= 1,61

IC95%= 1,381,89

RRR = [ 1 RR ] * 100

20,
8

p < 0,001

RRR = 61%

Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al. A comparison
of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.

p g in a 557

C a pt u l o 6

Incidencia
HEMORRAGIAS leves

Warfarina

Aspirina

Incidencia en
tratados con
WARFARINA
IW

Incidencia
en tratados
con
ASPIRINA
IA

20,8

12,9

RR

RRR
IS

RR =

[ 1 RR ]
* 100

RAR
IW I A

IA

1,61

- 61%

7,9

Adems, tal como comentaban los autores en la discusin del artculo, la


warfarina tiene un coste mayor y requiere una monitorizacin ms
estrecha.
Con estos datos, se puede considerar que la warfarina y la
aspirina son alternativas teraputicas razonables para prevenir los
accidentes cerebrovasculares isqumicos recurrentes?
Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al.
A comparison of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.

p g in a 558

C a pt u l o 6

p g in a 559

C a pt u l o 6

p g in a 560

C a pt u l o 6

p g in a 561

C a pt u l o 6

p g in a 562

C a pt u l o 6

p g in a 563

C a pt u l o 6

p g in a 564

C a pt u l o 6

p g in a 565

C a pt u l o 6

p g in a 566

C a pt u l o 6

there were no significant differences between the


warfarin and aspirin groups in the time to the
primary end point (p = 0,25 by two-tailed logrank
test; hazard ratio for warfarin as compared with
aspirin, 1.13; 95 percent confidence interval, 0.92 to
1.38; two-year probability of an event, 17.8
percent
with
warfarin
and
16.0 percent with
aspirin) (Table 2 and Fig. 2)

p g in a 567

C a pt u l o 6

RESULTS

(fragmento del texto)

The rates of major hemorrhage were low, with


no significant diferences between treatment
groups; the annual rates were
2.22 per 100 patient-years for warfarin and
1.49 per 100 patient-years for aspirin (rate
ratio, 1.48; p = 0,10). Patients in
the warfarin group had significantly more minor
hemorrhages than did those in the aspirin
group (Table 3). There was no
significant diference between groups in the
time to the first occurrence of major hemorrhage
or the primary end point (p =
0,16; hazard ratio with warfarin as compared with
aspirin, 1.15; 95 percent confidence interval, 0.95
to 1.39) (Table 2).

p g in a 568

C a pt u l o 6

DISCUSSION

(fragmento del texto)

We
observed
no
significant
diference
between treatment with warfarin and treatment
with aspirin in the prevention of recurrent
ischemic stroke or death or in the occurrence
of serious adverse events in this large cohort
of
patients
with inferred noncardioembolic
ischemic stroke.
Warfarin ofered no additional benefit over
aspirin
in preventing recurrent ischemic
stroke in the population we studied. Patients
with other, established reasons for warfarin use
may take comfort in the evidence of safety
and lack of significant diference overall, as
compared
with
aspirin. However, aspirin,
either alone or in combination with some other
antiplatelet agents, 38 appears to be a well-

p g in a 569

C a pt u l o 6

p g in a 570

Mito 1: La sonrisa de la
esfinge
Por qu concluyes que la ausencia de evidencia es evidencia de
ausencia?
La ausencia de evidencia NO es evidencia de ausencia.
Altman DG, Bland JM. Absence of evidence is not evidence of absence.
BMJ 1995;311:485.
Altman y Bland alertaron sobre un error comn en la bibliografa biomdica:
interpretar un resultado estadsticamente no significativo, cuando se
comparan dos tratamientos, como sinnimo de su equivalencia teraputica.

C a pt u l o 6

Mito 1: La sonrisa de la
esfinge

p g in a 571

En este estudio se comparaba la eficacia de la warfarina y de la aspirina para prevenir las


recurrencias de los accidentes vasculares cerebrales de origen isqumico. Mohr JP, et al
disearon el estudio para poder demostrar una reduccin relativa del riesgo (RRR) del
30% en el grupo tratado con warfarina. Cuando finaliz el perodo de dos aos de
seguimiento, no se observaron diferencias estadsticamente significativas entre los dos
grupos, y los autores llegaron a la conclusin de que la warfarina y la aspirina son
opciones teraputicas razonables en este tipo de situaciones clnicas. Sin embargo, la
warfarina no slo NO consigui reducir el riesgo en un 30%, sino que lo INCREMENT
en un 13%, y el riesgo de HEMORRAGIAS importantes fue SUPERIOR en el grupo de la
WARFARINA (2,22 por 100 pacientes/ao) frente a la ASPIRINA (1,49 por 100
pacientes/ao en el grupo aspirina) pero sin alcanzar significacin. Con estos datos.
Crees que se puede considerar que la warfarina y la aspirina son alternativas
teraputicas razonables para prevenir los accidentes cerebrovasculares isqumicos
recurrentes?
NO.
Adems, tal como comentaban los autores en la discusin del artculo, la warfarina
tiene un coste mayor y requiere una monitorizacin ms estrecha.

C a pt u l o 6

p g in a 572

C a pt u l o 6

El Romiplostim produjo un aumento estadsticamente


significativo del recuento de plaquetas durante el
periodo de estudio, pero no se asoci a una
disminucin del las hemorragias de grado .

p g in a 573

C a pt u l o 6

p g in a 574

C a pt u l o 6

p g in a 575

C a pt u l o 6

p g in a 576

C a pt u l o 6

p g in a 577

Romiplostim. PTI
- Romiplostim. Ensayo pivotal. Fase III vs.
placebo.
- Inclusin: < 30.000 plaquetas/mmc.
- Objetivo principal: > 50.000 plaquetas/mmc.
O bjetivo subrrogado

Efectos
adversos:

Hemorragia Grado 3/4

Romiplostim

Placebo

6 de 84 (7%)

5 de 41 (12%)

n.s.

David J Kuter, James B Bussel. Efficacy of romiplostim in patients with chronic immune thrombocytopenic
purpura: a double-blind randomised controlled trial. Lancet 2008; 371: 395403.

C a pt u l o 6

Romiplostim.
PTI
Hemorragia Grado 3/4

Romiplostim

Placebo

Total

SI

6 (7%)

5 (12%)

11

NO

78

36

114

Total

84

41

125

p g in a 578

El Romiplostim produjo un aumento estadsticamente significativo del


recuento de plaquetas durante el periodo de estudio, pero no se asoci
a una disminucin del las hemorragias de grado .

2Pearson= 0,88;

p=
0,349

David J Kuter, James B Bussel. Efficacy of romiplostim in patients with chronic immune thrombocytopenic
purpura: a double-blind randomised controlled trial. Lancet 2008; 371: 395403.

C a pt u l o 6

O dds Ratio (O R) versus Riesgo Relativo


Enfermedad (E)
(RR)
Exposicin (F)
Tabaco (+)
Tabaco (-)
Total

Cncer de
pncreas
(+)
A (10)
C (10)
20

No enfermos (-) Total


B (9990)
D (19990)
29980

RR =

10000
20000
30000
[ 10 / (10000)]

[ A / (A + B)]
[ C / (C + D) ]

RR =
[ 10 / (20000) ]

[ A/ C ]
OR = 2,001

OR =

[B/D]

[ 10/10 ]
OR =
[ 9990 /19990 ]

RR = 2,000
La OR slo se aproxima al RR cuando el suceso es raro y ocurre en menos del 10% de los sujetos, en
estos casos ambos estimadores son intercambiables.

p g in a 579

C a pt u l o 6

Importancia del intervalo de confianza en el


RR
- Risk Factors for Future C ardiovascular Events:
Lipoprotein(a)
W HS Homocysteine
IL-6
Colesterol total (CT)
Colesterol-LDL (cLDL)
sICAM-1
SAA
Apo B
Cociente CT/cHDL
PCR ultrasensible
PCR + CT/cHDL

1.0

2.0

4.0

6.0

Relative Risk of Future Cardiovascular Events

Ridker PM et al. N Engl J Med 2000;342:836843.

p g in a 580

C a pt u l o 6

D atos categricos:
Cualitativa versus cualitativa.
O rdinales
- Test de 2 de tendencia lineal
- Tau-B de Kendall o Stuart
- Tau-C de Kendall
- Coeficiente Gamma de Goodman y
Kruskal
- D de Somers
- Correlacin de Spearman
Estos estadsticos N O se pueden
utilizar cuando alguna de las
variables sea N O MIN AL

p g in a 581

C a pt u l o 6

Pregunta de investigacin
Existe relacin entre el nivel cultural y el hbito
tabquico?
Variable
PRED IC TO RA
N ivel cultural ordinal
C UALITATIVA

Cul es el test estadstico ms


acertado?

Variable RESULTAD O
C UALITATIVA
Hbito tabquico
dicotmica

p g in a 582

C a pt u l o 6

Existe relacin entre el nivel socioeconmico y


el
hbito tabquico?
ualel nivel de estudios alcanzado frente al hbito tabquico actual
Tabla de contingencia Fumador
que representa
act
ESTUDIOS
<Primarios
Primarios
Secundarios
Universitarios
TOTAL

NO
7
30
20
75
132

SI
13
20
10
25
68

Test de 2 de tendencia
lineal
2 tendencia lineal = 11,56

p=0,001

Total
20
50
30
100
200

Porcentaje
65%
40%
33%
25%
34%

p g in a 583

C a pt u l o 6

Frecuencia de tabaquismo

Grfico que representa el porcentaje de


fumadores segn su nivel de instruccin

2 tendencia lineal = 11,56

p = 0,001

p g in a 584

C a pt u l o 6

Pregunta de investigacin
Existe relacin entre el nivel cultural y la
realizacin de
alguna mamografas de cribado en los 3 ltimos
aos?
Variable
Variable RESULTAD O
PRED IC TO RA
N ivel educativoordinal
C UALITATIVA

Cul es el test estadstico ms


acertado?

C UALITATIVA
Mamografa
dicotmica

p g in a 585

C a pt u l o 6

Existe relacin entre el nivel de


instruccin y la realizacin de
mamografas?
Tabla de contingencia que representa el nivel de estudios alcanzado frente a la realizacin de alguna
de 3cribado
mamografa de cribadoMamografa
en los ltimos
aos.
ESTUDIOS
Sin estudios
Primarios
Secundarios
Universitarios
TOTAL

SI
9
81
23
13
126

NO
233
700
140
41
1114

%
3,7%
10,4%
14,1%
24,1%

Test de 2 de tendencia
lineal
p < 0,00001
2 tendencia lineal = 24,22

OR
1,00
3,00
4,25
8,21

IC 95%
1,48 - 6,06
1,91 9.45
3,30 20,44

p g in a 586

C a pt u l o 6

Frecuencia de participacin en programas de prevencin


Mujeres que se han realizado alguna mamografia en los 3 ltimos
aos

Grfico que representa el porcentaje de


fumadores segn su nivel de instruccin

2 tendencia lineal = 24,22

p < 0,0001

p g in a 587

C a pt u l o 6

p g in a 588

Resultados (fragmento del texto)


El conocimiento que las mujeres tienen de la mamografa como medida
preventiva del cncer de mama se encuentra asociado estadsticamente
a la mayor utilizacin de la misma por parte de stas y se detecta una
clara tendencia creciente en la utilizacin de la mamografa de cribado a
medida que aumenta el nivel educativo de las mujeres de la muestra.

Sim Miana J, Gaztambide Ganuza M, Morote Sanchs M, et al. Utilizacin de la mamografa de cribado
y sus determinantes demogrficos y de riesgo entre mujeres de 25 a 65 aos. Med Clin (Barc) 1997; 108:
767-771.

C a pt u l o 6

p g in a 589

D iscusin (fragmento del texto)


Coincidente con otros datos publicados es la relacin encontrada entre el
nivel educativo y la utilizacin de la mamografa de cribado. Al igual que
ocurre con otras prcticas de carcter preventivo, la mamografa de cribado
es ms utilizada por las mujeres con mayor nivel educativo. No hay que
olvidar que este factor est relacionado con el nivel econmico, variable que
no ha sido recogida en nuestro trabajo y que tambin ha sido asociada a
una mayor utilizacin de la mamografa de cribado.

Sim Miana J, Gaztambide Ganuza M, Morote Sanchs M, et al. Utilizacin de la mamografa de cribado
y sus determinantes demogrficos y de riesgo entre mujeres de 25 a 65 aos. Med Clin (Barc) 1997; 108:
767-771.

C a pt u l o 6

Pregunta de investigacin
Existe relacin entre el sndrome anmico
gestacional y el grupo cultural en C euta?
Existen diferencias en la prevalencia durante los
trimestres
de la gestacin?
Variable
Variable
PRED IC TO RA
- C ristianas
Cualitativa
- Musulmanas
dicotmica

RESULTAD O
Sndrome anmico
Cualitativa
ordinalgestacional
- Primer trimestre
- Segundo trimestre
- Tercer trimestre

Daz Portillo J et al. Prevalencia del sndrome anmico gestacional en Ceuta. Estudio de una poblacin
birracial. Ciencia Ginecolgika 1998, 2 (1): 3-14.

p g in a 590

C a pt u l o 6

Tabla de contingencia que representa la prevalencia de sndrome anmico gestacional en los dos grupos
culturales mayoritarios de Ceuta, y su incidencia en cada trimestre del embarazo.

Trimestre
1 trimestre
2 trimestre
3 trimestre
2 de tendencia lineal

Mamografa de cribado
Cristianas
Musulmanas
5,1%
11,4%
23,9%
27,0%
39,6%
57,4%
34,3
56,7

Significacin (p)

p < 0,001

p < 0,001

Test de 2 de tendencia lineal


Test de 2 de Pearson de indepencia

Test 2
4,75
NS
19,91

p
Total
p = 0,029 7,9%
NS
25,5%
p < 0,0001 49,2%
71,8
p < 0,001

p g in a 591

C a pt u l o 6

Frecuencia de Sndrome anmico


gestacional

Grfico que representa la prevalencia de


sndrome anmico gestacional en los dos
grupos culturales mayoritarios de Ceuta

p g in a 592

C a pt u l o 6

Pregunta de investigacin
La hipertrigliceridemia en sangre de cordn
umbilical
puede ser indicativa de episodios de sufrimiento
fetal?
Variable
Variable
PRED IC TO RA SFA
Test de APGAR

RESULTAD O
Triglicridos (sangre
Hipertrigliceridemi
a de cordn)

p g in a 593

C a pt u l o 6

Test de 2 de tendencia
lineal

Variable
PRED IC TO RA
Cuantitativa discreta

Variable
PRED IC TO RA
C ualitativa
ordinal

C ategorizaci
n

p g in a 594

Variable
Variable
RESULTAD O
RESULTAD O
Cualitativa nominal
C uantitativa
Tabla 4.- Relacinentre la presenciade hipertrigliceridemia neonatal y el indice de apgar al
minuto.
continua
OR
TESTD
Hipertrigliceride
Normotrigliceride
E

mia (n=36)

mia (n=636)

APGAR
Mayor de
7
Iguala 7
Menor de
7

27 (2,1%)

1253 (97,9%)

1,00

4 (11,1%)

81 (88,9%)

2,29

5 (15,6%)

27 (84,4%)

8,57

OR: OddsRatio
Test de ji al cuadrado de tendencia (2) = 20,85 ;
p<0,0001

Daz Portillo J. Influencia del grupo tnico en el patrn lipoproteico de una determinada poblacin
peditrica de Ceuta. Tesis doctoral . Facultad de Medicina. Universidad de Cdiz . Noviembre 1997.

C a pt u l o 6

Resultados
La tabla 4 relaciona la presencia de hipertrigliceridemia neonatal con
el ndice de Apgar al minuto. Se observ una relacin
estadsticamente
significativa con tendencia lineal entre ambas variables categricas,
con una asociacin creciente entre la hipertrigliceridemia y la
disminucin del ndice de Apgar. La probabilidad de detectar
hipertrigliceridemia en
neonatos con ndices de Apgar inferiores a 7 fue ocho veces superior
que
en RN con Apgar fisiolgico.

p g in a 595

C a pt u l o 6

p g in a 596

D iscusin
Nuestros resultados apoyan los obtenidos por Tsang et al. (12) y
Andersen y Friis-Hansen (13), e indican una fuerte asociacin entre los
episodios de sufrimiento fetal y la hipertrigliceridemia neonatal.
Del mismo modo, la frecuencia de hipertrigliceridemia va
aumentando conforme disminuye el ndice de Apgar.
Exposici
n
SFA

D esenlace o
efecto

Hipertrigliceridemia

OR = 7,23 p=0,003
Daz Portillo J. Influencia del grupo tnico en el patrn lipoproteico de una determinada poblacin
peditrica de Ceuta. Tesis doctoral . Facultad de Medicina. Universidad de Cdiz . Noviembre
1997.

C a pt u l o 6

p g in a 597

Pregunta de investigacin
La hipertrigliceridemia en sangre de cordn umbilical
puede ser debida al consumo de tabaco durante la
gestacin?
Variable
PRED IC TO RA

C onsumo de tabaco

Variable
RESULTAD O

Hipertrigliceridemia
Triglicridos (sangre de cordn)

Jacobo Daz Portillo, Mara Jess Snchez Del Pino, Ana Navarro Arvalo. INFLUENCIA DEL
TABAQUISMO EN EL PERFIL LIPOPROTEICO Y GRADO DE PEROXIDACIN LIPDICA EN SANGRE DE
CORDN.
Revista de Diagnstico Biolgico 2000; 49: 23-30.

C a pt u l o 6

Test de 2 de tendencia lineal


C ategorizacin

Variable
RESULTAD O
C uantitativa
Influencia del tabacocontinua
Hipertrigliceridemia

Variable
RESULTAD O
Cualitativa nominal

Normotrigliceridemia
neonatal

OR

neonatal

No fumadoras

1,7%

98,3%

1,00

Fumadoras moderadas

5,3%

94,7%

3,20

Grandes fumadoras

5,4%

94,6%

3,27

2 tendencia lineal = 5,68

p=0,017

Utiliza la estadstica como un borracho usa una farola, para aguantarse


en
lugar de para iluminarse
Andrew Lang

p g in a 598

C a pt u l o 6

p g in a 599

Pregunta de investigacin
Existen diferencias en la prevalencia de infeccin
tuberculosa en el colectivo de inmigrantes residentes en
el campamento de C alamocarro en C euta segn la edad?
Variable PRED IC TO RA
C UALITATIVA
Inmigrantes
policotmica
< 25 aos
25-35 aos
>35

Variable RESULTAD O
C UALITATIVA
Tuberculosis
dicotmica

Cul es el test estadstico ms adecuado?


Fernndez MT, Daz J, Snchez JM, Prez A, Vadillo J. Prevalencia de infeccin tuberculosa en la poblacin
de inmigrantes en Ceuta, Espaa. Rev Esp Salud Pblica 2001; 75: 551-8.

C a pt u l o 6

p g in a 600

Anlisis del texto en el MATERIAL y MTODOS


Empleamos el test de chi2 para comparacin de porcentajes, y la
prueba de la t de Student para variables cuantitativas. La evaluacin de
las tendencias se realiz con la prueba de chi2 de tendencia lineal.
Anlisis del texto en los RESULTADOS
Con independencia del punto de corte seleccionado, se observ mayor
positividad en el sexo masculino que en el femenino, y la positividad
tambin present una ligera tendencia a aumentar con la edad (p =
0,07).
Anlisis del texto en la DISCUSIN
?

Fernndez MT, Daz J, Snchez JM, Prez A, Vadillo J. Prevalencia de infeccin tuberculosa en la poblacin
de inmigrantes en Ceuta, Espaa. Rev Esp Salud Pblica 2001; 75: 551-8.

C a pt u l o 6

Test de 2 de tendencia lineal


C ategorizacin

Grupo etario

Variable
RESULTAD O
C uantitativa
Mantoux (+)
continua

Variable RESULTAD O
Cualitativa nominal
policotmica

Mantoux (-)

Prevalencia

Menos de 25 aos

221

721

942

28,2%

25 - 35 aos

242

482

724

33,5%

> 35 aos

15

38

53

27,8%

2 tendencia lineal = 5,2

p = 0,07

Utiliza la estadstica como un borracho usa una farola, para aguantarse


en
lugar de para iluminarse
Andrew Lang

p g in a 601

C a pt u l o 6

Test de 2 de Pearson de
independencia

Grupo etario

Variable
RESULTAD O
C uantitativa
Mantoux (+)
continua

Variable RESULTAD O
Cualitativa nominal
dicotmica

C ategorizacin
Mantoux (-)

Prevalencia

Menos de 25 aos

221

721

942

28,2%

25 - 35 aos

242

482

777

33,1%

2 = 26,07

p=0,0000003

Utiliza la estadstica como un borracho usa una farola, para aguantarse


en
lugar de para iluminarse
Andrew Lang

p g in a 602

C a pt u l o 6

Pregunta de investigacin
Existen diferencias en la prevalencia de infeccin
tuberculosa en el colectivo de inmigrantes residentes
en Toledo segn la edad?
Variable PRED IC TO RA
C UALITATIVA
Inmigrantes
policotmica
< 20 aos
25-29 aos
30-39 aos

Variable RESULTAD O
C UALITATIVA
Tuberculosis
dicotmica

Cul es el test estadstico ms adecuado?


Alonso Moreno FJ, Garca Bajo MC, Lougedo Caldern MJ, et al. Prevalencia de infeccin tuberculosa en
las personas inmigrantes del rea sur de Toledo. Rev Esp Salud Pblica 2004; 78: 593-600.

p g in a 603

C a pt u l o 6

p g in a 604

Anlisis del texto en el MATERIAL y MTODOS


En el anlisis se emplearon los tests de la 2 de Pearson, para comparacin de
porcentajes, y la t de Student y anlisis de varianza (ANOVA), para comparacin de
medias y varianzas. Se realiz tambin una regresin logstica no condicional por el
mtodo stepwise backward (LR). Las variables independientes incluidas en el modelo
fueron la edad, sexo, peso y origen subsahariano, mientras que la variable dependiente
fue la IDRM positiva.
Anlisis del texto en los RESULTADOS
La prevalencia de infeccin tuberculosa por grupos de edad se muestra en la tabla 2,
en la que puede apreciarse cmo la mayor frecuencia (38,7%) apareci en el grupo de
edad 30-39 aos..
Anlisis del texto en la DISCUSIN
En sta ltima la prevalencia encontrada tanto en el grupo de edad de 20 a 29 aos
(12,1%), como en el de 30 a 39 aos (22,7%), est en ambos casos por debajo de los
resultados de nuestro estudio. Los resultados de nuestro trabajo aportan valores en la
misma lnea que los obtenidos por Durn y colaboradores13 en inmigrantes recin
llegados a Barcelona.
Alonso Moreno FJ, Garca Bajo MC, Lougedo Caldern MJ, et al. Prevalencia de infeccin tuberculosa en
las personas inmigrantes del rea sur de Toledo. Rev Esp Salud Pblica 2004; 78: 593-600.

C a pt u l o 6

Test de 2 de tendencia lineal


C ategorizacin

Variable RESULTAD O
C ualitativa nominal
ordinal

Variable
RESULTAD O
C uantitativa
Prueba de la
continua

Transversal

Casoscontroles

tuberculina

Grupo etario

Mantoux (+)

Mantoux (-)

Prevalencia

OR

Menos de 25 aos
25 - 35 aos
> 35 aos

5
21
36

61
41
57

64
62
93

7,8%
33,9%
38,7%

1,00
6,25
7,71

2 tendencia lineal = 17,4

p = 0,00003

p g in a 605

C a pt u l o 6

Pregunta de investigacin
Qu relacin existe entre la edad y la presencia de
deterioro cognitivo moderado-severo en un grupo de
enfermos mayores ( aos) atendidos en los servicios de
urgencia
Variable del hospital?
Variable
PRED IC TO RA
Grupo etario
Cualitativa
- 60-64
aos
O RD
IN AL
- 65-69 aos
- 70-74 aos
- 75-79 aos
- 80-84 aos
85 aos

RESULTAD O
D eterioro cognitivo
C ualitativa
dicotmica

Cul es el test estadstico ms adecuado?


Laguna P, Moya M, Gazapo R, Salgado R, Calabrese S. Deteccin de deterioro cognitivo en ancianos
atendidos en un servicio de urgencias hospitalario. Rev Cln Esp 1997; 197: 336-340.

p g in a 606

C a pt u l o 6

Test de 2 de tendencia lineal


C ategorizacin

Variable RESULTAD O
C ualitativa nominal
ordinal
Transversal Casos-controles

Variable
RESULTAD O
CDeterioro
uantitativa
cognitivo
continua
Grupo etario

SI

NO

Prevalencia

OR

60 - 64 aos

41

49

16,3%

1,00

65 - 69 aos

14

56

70

20 %

1,28

0,45 - 3,72

70 - 74 aos

19

64

83

22,9%

1,52

0,56 - 4,20

75 - 79 aos

18

51

69

26,1%

1,81

0,66 - 5,09

80 - 84 aos

18

33

51

35,3%

2,80

0,99 - 8,09

85 aos

17

13

30

56,7%

6,70

2,11 22,07

Total

94

258

352

26,7%

2 tendencia lineal = 16,3

p = 0,0005

IC95%

p g in a 607

C a pt u l o 6

p g in a 608

Mito 1: La sonrisa de la esfinge


Por qu estratificas la variable edad en 6 categoras?
Por qu no categorizas la variable edad en slo 3 estratos
ordinales?
Aunque el clculo de la prueba Pearson de tendencia lineal ha
significativa,
el IC95% de los OR de losresultado
distintos grupos de edad incluyen el
2
1
(valor numrico de igualdad), con lo que perdemos informacin...
El test de 2 de tendencia lineal, aunque admite ms de 3 categoras
ordinales
para la variable predictora, no es conveniente estratificar ms all a no
ser que se disponga de un importante volumen muestral, de lo contrario
los IC95% no son significativos.

C a pt u l o 6

Test de 2 de tendencia lineal


C ategorizacin

Variable RESULTAD O
C ualitativa nominal
ordinal
Transversal Casos-controles

Variable
RESULTAD O
CDeterioro
uantitativa
cognitivo
continua
Grupo etario

SI

NO

Prevalencia

OR

IC95%

60 - 69 aos
70 79 aos
80 aos
Total

22
37
35
94

97
115
46
258

119
152
81
352

18,5%
32,2%
43,2%
26,7%

1,00
1,42
3,35

(1,12 1,83)
(2,05 4,96)

El anlisis de tendencias demostr una relacin estadsticamente significativa entre


la edad del anciano y el deterioro cognitivo de grado moderado o severo (p < 0,001).

2 tendencia lineal = 13,9

p = 0,0002

p g in a 609

C a pt u l o 6

Pregunta de investigacin
Existe relacin entre el hbito tabquico y la
presencia del AD N del Papiloma virus (HPV) en
pacientes con lesiones escamosas intraepiteliales del
crvix
Variableuterino?
Variable
PRED IC TO RA
Hbito tabquico
Cualitativa
O (n
RD cigarrillos/da)
IN AL

1. N o fumador (0 )
2. Moderado ( 20)
3. Alto (> 20)

RESULTAD O
AD N del HPV
C ualitativa
Human Papilloma Virus
dicotmica

Cul es el test estadstico ms acertado?


Laguna P, Moya M, Gazapo R, Salgado R, Calabrese S. Deteccin de deterioro cognitivo en ancianos
atendidos en un servicio de urgencias hospitalario. Rev Cln Esp 1997; 197: 336-340.

p g in a 610

C a pt u l o 6

Test de 2 de tendencia
lineal
ADN HPV

TABACO

(+)

(-)

No fumador
Moderado
Alto
TOTAL

5
19
4
28

13
24
1
38

27,8
44,2
80,0

OR

IC 95%

1,00
2,06
10,40
2

0,55 8,62
0,70 550,31
= 4,022

p
0,36
0,06
0,045

tendencia lineal

Tabla de contingencia que representa el hbito tabquico (n de cigarrillos al da) y


la presencia del ADN del papiloma virus (HPV) en pacientes con lesiones
escamosas intraepiteliales del crvix uterino.

p g in a 611

C a pt u l o 6

p g in a 612

Resultados (fragmento del


texto)
No se observaron diferencias significativas entre la edad media y la
edad media de inicio de las relaciones sexuales, y la positividad del
HPV. Por el contrario, la asociacin con el hbito tabquico fue
estadsticamente significativa, observndose una asociacin creciente
ente la deteccin del HPV y el consumo de cigarrillos (tabla).

Torn A, Ordi J, Lluis M, et al. Determinacin del papiloma virus mediante hibridacin in situ. Correlacin
clnicopatolgica y virolgica en pacientes con lesiones escamosas intraepiteliales del crvix uterino. Med
Clin (Barc) 1997; 109: 691-695.

C a pt u l o 6

p g in a 613

D iscusin (fragmento del


texto)
Diversos estudios han destacado el efecto que el consumo de tabaco
puede ejercer en interaccin con el HPV facilitando y cooperando con los
mecanismos oncogenticos. En el presente estudio, el hallazgo de una
asociacin creciente entre la deteccin del HPV y el consumo de
cigarrillos puede relacionarse con el resultado de estudios experimentales
que demuestran que los productos del tabaco causan un defecto
inmunolgico a nivel cervical, disminuyendo la capacidad de presentacin
de antgenos por las clulas de langerhans, fenmeno que finalmente
favorece tanto la infeccin por HPV en el epitelio cervical.

Torn A, Ordi J, Lluis M, et al. Determinacin del papiloma virus mediante hibridacin in situ. Correlacin
clnicopatolgica y virolgica en pacientes con lesiones escamosas intraepiteliales del crvix uterino. Med
Clin (Barc) 1997; 109: 691-695.

C a pt u l o 6

p g in a 614

Mito 1: La sonrisa de la
esfinge
Aunque el clculo de la prueba

de tendencia lineal ha
resultado

significativa
(p= 0,045), sin embargo el IC95%
de los OR de los distintos
grupos de fumadoras (moderadas e intensas) incluyen el 1 (valor numrico
de igualdad), con lo que perdemos informacin, adems se pierde
significacin estadstica (p>0,05)
Pearson

El test de 2 de tendencia lineal, aunque admite 3 o ms categoras


ordinales para la variable predictora, NO es conveniente que los casilleros
contengan valores inferiores a 5, como ocurre en el grupo de las fumadoras
intensas (> 20 cigarrillos/da) .
Sabes lo que ocurre si agrupas las fumadoras moderadas con las intensas
y la enfrentas a las no fumadoras (no fumadoras versus fumadoras)?
OBSERVA LO QUE OCURRE!!!

C a pt u l o 6

Tabla de contingencia que representa la presencia del HPV con el


hbito tabquico.
ADN HPV
TABACO

SI (+)

NO (-)

Total

NO

13

18

SI

23

25

48

TOTAL

28

38

66

Test de 2 de Pearson de
independencia
2 = 2,17

p=0,140

No existe asociacin

p g in a 615

C a pt u l o 6

Mito 1: La sonrisa de la esfinge


Por qu torturas a los datos con test estadsticos NO idneos para que
te digan lo que a ti te interesa?
Sabes lo que te ha ocurrido?
Te ha abrumado el enorme peso de la bibliografa que es muy numerosa
en estudios experimentales y clnicos que relacionan el tabaco, el HPV y
el cncer de crvix, y su interaccin.
Ante tan bajo volumen muestral
No crees que puedes haber cometido un error beta (bajo tamao
muestral)?
Sndrome de la CARGA bibliogrfica

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario INGESA de Ceuta

p g in a 616

C a pt u l o 6

Pregunta de investigacin
Existe asociacin entre el hbito tabquico y la
EPO C?
Variable
PRED IC TO RA
Hbito tabquico
Cualitativa
dicotmica

Cul es el test estadstico ms


acertado?

Variable
RESULTAD O
EPO C
C ualitativa
dicotmica

p g in a 617

C a pt u l o 6

Tabla de contingencia que representa la EPOC frente al hbito


tabquico.
EPOC
TABACO

SI

NO

Total

SI

26 (43%)

34

60

NO

7 (23%)

23

30

TOTAL

33

57

90

Test de 2 de Pearson de
independencia
2 = 3,44

p=0,063

No existe asociacin

p g in a 618

C a pt u l o 6

Pregunta de investigacin
Existe relacin entre la EPO C y el la intensidad del
hbito
tabquico?
Variable
PRED IC TO RA
Hbito tabquico
Cualitativa
ordinal
1.N o fumador
2. Moderado
3. Alto

Cul es el test estadstico ms


acertado?

Variable
RESULTAD O
EPO C
C ualitativa
dicotmica

p g in a 619

C a pt u l o 6

Tabla de contingencia que representa la EPOC frente al hbito


tabquico.
EPOC
TABACO

SI

NO

Total

No fumador

23

30

Moderado

11

19

30

Alto

15

15

30

TOTAL

33

57

90

Test de 2 de Pearson de
independencia
2 = 4,60

p=0,111

No existe asociacin

p g in a 620

C a pt u l o 6

Mito 1: La sonrisa de la
esfinge
Por qu utilizas el test de

Pearson

Se cumplen sus condiciones de


aplicacin?
En el clculo de la prueba Pearson no se tiene en cuenta el orden de
2
y de este modo perdemos
las una valiosa
categoras
informacin..
El test de 2 de tendencia lineal, siempre tiene un grado de libertad, e
incluye
, de modo separa
tienesuenclculo
cuentarespecto
el ordenade
Pearson
una modificacin
la las
expresin de la prueba 2
categoras.

p g in a 621

C a pt u l o 6

Tabla de contingencia que representa la EPOC frente al hbito


tabquico.
EPOC
Caso-control
TABACO
No fumador
Moderado
Alto
TOTAL

SI
7
11
15
33

Test de 2 de tendencia
lineal
2 = 4,54

p = 0,033

NO
23
19
15
57

Total
30
30
30
90

Existe asociacin

OR
1,00
1,90
3,29

p g in a 622

C a pt u l o 6

Pregunta de investigacin
Existe relacin entre la gravedad de la EPO C y la
intensidad
del hbito tabquico?
Variable
PRED IC TO RA
Hbito tabquico
Cualitativa
ordinal
1.N o fumador
2. Moderado
3. Alto

Cul es el test estadstico ms


acertado?

Variable
RESULTAD O
Gravedad EPO
C
Cualitativa
ordinal
1.Leve
2. Moderada
3.Grave

p g in a 623

C a pt u l o 6

Tabla de contingencia que representa la gravedad de la EPOC frente al hbito


tabquico
EPOC
TABACO
Leve
Moderado Grave
Total
No Fumador

20

30

Moderado

10

12

30

Alto consumo

20

30

TOTAL

30

26

34

90

Test de 2 de tendencia
lineal
Coeficiente Gamma

= 0,718

Fuerte asociacin positiva entre ambas variables

Existe asociacin

p g in a 624

C a pt u l o 6

Pregunta de investigacin
Existe asociacin entre el nivel de instruccin
(cultural) y el nivel econmico?
A mayor nivel cultural habr mayor nivel econmico?
Variable
PRED IC TO RA
N ivel instruccin
Cualitativa
ordinal

Cul es el test estadstico ms


acertado?

Variable
RESULTAD O
N ivel econmico
Cualitativa
ordinal

p g in a 625

C a pt u l o 6

Existe asociacin entre el nivel de instruccin y


el nivel econmico?
Tabla de contingencia que representa el nivel de estudios frente al nivel
Nivel econmico
econmico
ESTUDIOS
Alto
Medio
Bajo
TOTAL
Universitarios

19

25

Secundarios

14

22

37

Primarios

36

50

TOTAL

40

63

112

2 Pearson = 30,15

p <0,000001

SI

Existe relacin gradual entre el nivel de instruccin y el nivel


econmico?

Tau-b de Kendall

p g in a 626

C a pt u l o 6

Existe relacin gradual entre el nivel de instruccin y


el nivel econmico?
Ho: A mayor nivel de instruccin no existe mayor nivel
H
econmico.
a: A mayor nivel de instruccin mayor nivel
econmico.

Tau-b de
Kendall

Ordinal por ordinal

Valor del estadstico

Significacin

Tau-b de Kendall

+ 0,448

0,000

Tau-c de Kendall

+ 0,399

0,000

Ha: A mayor nivel de instruccin mayor nivel


econmico.

SI

p g in a 627

C a pt u l o 6

Tau-b de
Kendall

- Condiciones de aplicacin.
- Tablas cuadradas (3 x 3), (4 x 4)

Estadistico
Tipo Variables
- Interpretacin:
- Tau = 0 independencia.
Tau-b de Kendall Ordinal X Ordinal
- Tau >
asociacin positiva.
Tau-c de Kendall
Ordinal X Ordinal
0
asociacin
- Tau de
< Taunegativa.
- Intervalo
: (-1, +1).
0
- Informacin:
- Medida de la intensidad de la asociacin de variables ordinales.
- Sentido de la misma (direccionalidad).

Tipo tabla
K=F
KF

Tau-b de Kendall
- Condiciones de aplicacin: nmero de filas distinto al nmero de columnas (Tablas
NO
cuadradas).

p g in a 628

C a pt u l o 6

Pregunta de investigacin
Existe asociacin entre el nivel de instruccin
(cultural) y el nivel econmico?
A mayor nivel cultural habr mayor nivel econmico?
Variable
PRED IC TO RA
N ivel instruccin
Cualitativa
ordinal

Cul es el test estadstico ms


acertado?

Variable
RESULTAD O
N ivel econmico
Cualitativa
ordinal

p g in a 629

C a pt u l o 6

Existe asociacin entre el nivel de instruccin y


el nivel econmico?
Tabla de contingencia que representa el nivel de estudios frente al nivel
Nivel econmico
econmico
ESTUDIOS
Alto
Medio
Bajo
TOTAL
Universitarios

19

25

Secundarios

14

22

37

Primarios

36

50

TOTAL

40

63

112

2 Pearson = 30,15

p <0,000001

SI

Existe relacin gradual entre el nivel de instruccin y el nivel


econmico?

Coeficiente Gamma

p g in a 630

C a pt u l o 6

Existe relacin gradual entre el nivel de instruccin y


el nivel econmico?
Ho: A mayor nivel de instruccin no existe mayor nivel
H
econmico.
a: A mayor nivel de instruccin mayor nivel
econmico.

C oeficiente Gamma

Ordinal por ordinal

Gamma
N de casos vlidos

Valor de

EE

+ 0,687
112

0,098

Significacin
aprox

5,804

Ha: A mayor nivel de instruccin mayor nivel


econmico.

0,000

SI

p g in a 631

C a pt u l o 6

C oeficiente Gamma

- Test de contraste de hiptesis.


- Test de asociacin para variables
ordinales.
- Interpretacin:
=0
independencia
asociacin
positiva
>0
<0
asociacin
- Intervalo de : (-1,negativa
+1).
- Informacin:
- Medida de la intensidad de la asociacin de variables
ordinales.
- Sentido de la misma (direccionalidad).
A mayor nivel de
instruccin
MENOR nivel
econmico

-1

Variables no
asociadas

A mayor nivel de
instruccin MAYOR
nivel econmico

+1

p g in a 632

C a pt u l o 6

Pregunta de investigacin
Existe asociacin entre el nivel de instruccin
(cultural) y el nivel econmico?
A mayor nivel cultural habr mayor nivel econmico?
Variable
PRED IC TO RA
N ivel instruccin
Cualitativa
ordinal

Cul es el test estadstico ms


acertado?

Variable
RESULTAD O
N ivel econmico
Cualitativa
ordinal

p g in a 633

C a pt u l o 6

Existe asociacin entre el nivel de instruccin y


el nivel econmico?
Tabla de contingencia que representa el nivel de estudios frente al nivel
Nivel econmico
econmico
ESTUDIOS
Alto
Medio
Bajo
TOTAL
Universitarios

19

25

Secundarios

14

22

37

Primarios

36

50

TOTAL

40

63

112

2 Pearson = 30,15

p <0,000001

SI

Ha: El nivel econmico (variable resultado) es dependiente del nivel


de
instruccin
(variable predictora).
Existe relacin gradual entre el nivel de instruccin y el nivel
econmico?

D de Somers

p g in a 634

C a pt u l o 6

Existe relacin gradual entre el nivel de instruccin y


el nivel econmico?
Ho: A mayor nivel de instruccin no existe mayor nivel
H
econmico.
a: A mayor nivel de instruccin mayor nivel
econmico.

D de
Somers

Valor del estadstico D Significacin

Simtrica (no se sabe cual es la resultado) 0,447


Nivel de instruccin resultado (dependiente) 0,484
Nivel econmico resultado (dependiente)
0,415

Ha: A mayor nivel de instruccin mayor nivel


econmico.

0,000
0,000
0,000
SI

p g in a 635

C a pt u l o 6

D de
Somers

- Test de contraste de hiptesis.


- Test de asociacin para variables
ordinales.
- Interpretacin:
D =0
independencia
asociacin
positiva
D >0
D <0
asociacin
- Intervalo de D de Somers:
negativa(-1, +1).
- Informacin:
- Medida de la intensidad de la asociacin de variables
ordinales.
- Sentido de la misma (direccionalidad).
A mayor nivel de
instruccin
MENOR nivel
econmico

-1

Variables no
asociadas

A mayor nivel de
instruccin MAYOR
nivel econmico

+1

p g in a 636

C a pt u l o 6

Pregunta de investigacin
Existe asociacin entre el nivel de instruccin
(cultural) y el nivel econmico?
A mayor nivel cultural habr mayor nivel econmico?
Variable
PRED IC TO RA
N ivel instruccin
Cualitativa
ordinal

RESUMEN

Cul es los tests estadsticos ms


acertados?

Variable
RESULTAD O
N ivel econmico
Cualitativa
ordinal

p g in a 637

C a pt u l o 6

Nivel econmico
ESTUDIOS
Titulado superior
Titulado medio
Secundarios
Primarios
TOTAL

Alto
12
5
0
0
17

Medio
32
21
1
0
54

Bajo
6
136
94
24
260

Muy bajo
0
19
95
29
143

Existe relacin gradual entre el nivel de instruccin y el nivel


econmico?

D de Somers
Tau-b de Kendall

Gamma

Tau-c de Kendall

TOTAL
50
181
190
53
474

p g in a 638

C a pt u l o 6

D de Sommers
(medidas direccionales)
Simtrica (no se sabe cual es
la variable resultado)
Nivel econmico
variable resultado
(dependiente)
Nivel de instruccin
variable resultado
(dependiente)
Ordinal por ordinal

Valor del
estadstic
o
0,557

EED

0,029

16,075

0,000

0,525

0,030

16,075

0,000

0,593

0,030

16,075

0,000

Valor del estadstico

Muy bajo
aprox

EE

Significacin
aprox

Gamma
Tau-b de Kendall
Tau-c de Kendall
N de casos vlidos

0,798
0,558
0,469
474

0,031
0,029
0,029

Ha: A mayor nivel de instruccin mayor nivel


econmico.

16,075
16,075
16,075

0,000
0,000
0,000

p g in a 639

C a pt u l o 7

C aptulo 7
Publicacin Bioestadstica: Anlisis
bivariante. Test de contraste de hiptesis.
Cuantitativa versus cuantitativa.

D r. Jacobo D az Portillo
Coordinador de Formacin Continuada
Hospital Universitario de Ceuta

p g in a 640

C a pt u l o 7

Materiales y mtodos
Estructura
1. Tipo de diseo (estudio).
2. Sujetos incluidos (criterios de seleccin de la muestra)
3. Fuentes de informacin.
4. Descripcin de la intervencin y definicin del punto final de la
investigacin (estudios experimentales).
5. Instrumentos y procedimientos de medida (cuestionarios).
6. Definicin de las variables y covariables incluidas en el estudio (factor
de
estudio y criterio de evaluacin).
7. Limitaciones y consideraciones ticas de la investigacin.
8. Pruebas estadsticas a utilizar (programa estadstico).

p g in a 641

C a pt u l o 7

Fases del anlisis


estadstico
1. ANLISIS DESCRIPTIVO

2. ANLISIS BIVARIANTE

3. ANLISIS MULTIVARIANTE

p g in a 642

C a pt u l o 7

D ecisiones que se pueden tomar en un test de


contraste de hiptesis despus de conocer el valor
de significacin estadstica p
p < 0,05 A B
Se rechaza la hiptesis nula
No parece que el azar
pueda explicarlo todo
El EFECTO observado es mayor
que el ERROR
Hay diferencias estadsticamente
significativas
Existen evidencias a favor de la
hiptesis alternativa Ha, y por
tanto rechazamos la hiptesis nula
Ho

p 0,10
A= B
No se puede rechazar la hiptesis nula
No se puede descartar que el azar
lo explique todo
El EFECTO observado es similar que
el ERROR
NO hay diferencias estadsticamente
significativas
NO existen evidencias a favor de
la hiptesis alternativa Ha, y por
tanto aceptamos la hiptesis nula
Ho

Los lmites de 0,05 y 0,1 pueden ser considerados en cierto modo


arbitrarios y aproximados

p g in a 643

C a pt u l o 7

Anlisis estadstico
Tipos de test analticos estadsticos de contraste de hiptesis
segn el tipo de variables implicadas en el estudio
Variable
dependiente
Variable Continua
resultado
Dicotmica
Variable
Predictor
a
Variable
Independien
te

Dicotmica

Test de 2

t de Student

Continua

Regresin
lo- gstica

Regresin lineal

p g in a 644

C a pt u l o 7

Anlisis
estadstico
ANLISIS ESTADSTICO
Variable
Predictor
a
Variable
Independien
te

Variable resultado
Dicotmica
Continua

Dicotmica

Test de 2

t de Student

Continua

Regresin
lo- gstica

Regresin lineal

REGRESIN LINEAL SIMPLE

p g in a 645

C a pt u l o 7

p g in a 646

Pruebas estadsticas de contraste de


hiptesis ms aplicables a cada situacin
Variable
Independiente
o PREDICTORA

Variable
Dependiente
o RESULTADO

Pruebas de contraste de
hiptesis

Observaciones y/o limitaciones del test

Cualitativa

Cualitativa

Ji cuadrado
Prueba exacta de
Fisher Test de
McNemar
Q de Cochran
REGRESIN LOGSTICA

Cualitativa

Cuantitativa

Cuantitativa

Cualitativa

Cuantitativa

Cuantitativa

t de Student
Anlisis de la
Varianza Test de
Mann-Whitney Test
de Wilcoxon
Test de KruskallWallis Test de
Friedman
Regresin logstica simple
Regresin logstica
multivariante
Regresin lineal
simple Correlacin de
Pearson Correlacin
de Sperman
REGRESIN MLTIPLE

Si el tamao muestral es
grande Si el tamao muestral
es pequeo
Dos grupos de muestras
repetidas o apareadas
Ms de dos grupos de muestras repetidas o
apareadas Varias variables predictoras
cualitativas
Compara medias entre dos grupos independientes
Compara medias entre ms de dos grupos
independientes Dos grupos independientes No
paramtricos
Dos grupos medidas repetidas No paramtrico
Ms de dos grupos No paramtrico, medidas
repetidas Ms de dos grupos No paramtrico
medidas repetidas
Una sola variable predictora cuantitativa
Varias variable predictoras cuantitativa o cualitativas
Paramtrico
Paramtrico
No
paramtrico
Varias
variables
predictoras

C a pt u l o 7

p g in a 647

Tipos de test analticos estadsticos bivariantes de


contraste
de
hiptesis ms
frecuentes
Variable
Variable RESULTADO o Dependiente (Criterio de evaluacin)
PREDICTORA o
Independiente
(factor de estudio)

Cualitativa
nominal dos
categoras

Cualitativa dos
grupos
independientes

Chi cuadrado
Z comparacin de
proporciones
Test exacto
de Fisher
Test de McNemar

Cualitativa dos
grupos apareados

Cualitativa
nominal
>2
categoras
Chi cuadrado

Cualitativa
ordinal o
Cuantitativa NO
paramtrica
U de Mann-Whitney

Cuantitati
va
paramtric
a
T de Student
(prueba de Welch)

Q de Cochran

Prueba de
los rangos
de Wilcoxon

Prueba de
Kruskal- Wallis
Prueba de
Friedman

T de
Student
para datos
emparejad
os
Anlisis de la Varianza
(ANOVA)
Anlisis de la
Varianza de dos
vas
Regresin lineal
Correlacin de
Pearson

Cualitativa > 2 grupos


independientes
Cualitativa > 2 grupos
apareados

Chi cuadrado

Chi cuadrado

Q de Cochran

Q de Cochran

Cuantitativa

Regresin logstica

Regresin
logstica

Correlacin de
Sperman
Tau de Kendall

C a pt u l o 7

Cualitativa versus cuantitativa


Cules son las pruebas estadsticas que tenemos que
emplear?
Variable
PRED IC TO RA
ontinua
C- CUAN
TITATIVA
- D iscreta

Variable
RESULTAD O
C ontinua
C -UAN
TITATIVA
- D iscreta

p g in a 648

C a pt u l o 7

D atos cuantitativos:
Cuantitativa versus cuantitativa
Regresin lineal simple:
-Describe como es la relacin entre la variable predictora (X) y la variable
resultado (Y)
-Busca la lnea que mejor se ajusta a los puntos (x, y), y por tanto busca
la mejor prediccin de Y a partir de X
Correlacin:
- Mide el grado o fuerza de asociacin entre dos variables cuantitativas
(X, Y).

p g in a 649

C a pt u l o 7

D atos cuantitativos:
Cuantitativa versus cuantitativa
Regresin lineal simple.
- Coeficiente de regresin
- Covarianza
Correlacin paramtrica
- Coeficiente de correlacin de Pearson (r)
- Coeficiente de determinacin r2
Correlacin NO paramtrica
- Coeficiente de correlacin de Spearman
()
Concordancia
- Coeficiente de correlacin intraclase

p g in a 650

C a pt u l o 7

D atos cuantitativos:
Cuantitativa versus
cuantitativa
C omparacin de mtodos analticos
Regresin paramtrica
- Regresin lineal simple
- Coeficiente de regresin
- Coeficiente de correlacin
intraclase
Regresiones NO paramtricas
- Regresin de Theil
- Regresin de Passing - Bablok
- Regresin de Bland - Altman
- Regresin de Tholen - Ludbrook

p g in a 651

p g in a 652

C a pt u l o 7

Relacin directa e
inversa
330
33
0
280
28
0
230
23
0
180

100

Incorrelacin
Incorrelacin

90
80

80
60
50
40

60

15 150
0

16 160
0

17 170
0

18 180
0

19 190
0

Para valores de X por encima de la media


tenemos valores de Y por
encima y por debajo en
proporciones similares.
Incorrelacin.

20
0

30

50

20

40

10

30
140
150

Cierta relacin
inversa

70

70

18
130
0
80
13
0
30
80140
140
200

Fuerte
relacin
directa.

160
200

170

180

190

Para los valores de X


mayores que la media le
corresponden valores de Y
mayores tambin. Para los
valores de X menores que la
media le corresponden
valores de Y menores
tambin. Esto se llama
relacin directa.

140
150

160

170

180

190

200

Para los valores de X


mayores que la media le
corresponden valores de Y
menores. Esto es relacin
inversa o decreciente.

C a pt u l o 7

Pregunta de investigacin
Qu relacin existe entre el grado de IRC y el
grado de anemizacin del enfermo?
Variable PRED IC TO RA
(X )
IRC
Cuantitativa
continua

C reatinemi
a

Variable RESULTAD O
(Y)
Anemia
Cuantitativa
continua

Hemoglobinem
ia

p g in a 653

C a pt u l o 7

Variable RESULTADO-RESPUESTA-posible
EFECTO Variable dependiente
Variable cuantitativa continua

Relacin entre variables cuantitativas


continuas
Hemoglobina (g/dl)
11

10

7
2

Creatinina (mg/dl)

Representacin grfica de los niveles de creatinina y hemoglobina en


50 pacientes con fallo renal crnico
Variable PREDICTORA-EXPOSICIN-posible CAUSA
Variable independiente, fija controlada por el
investigador Variable cuantitativa continua

p g in a 654

C a pt u l o 7

Regresin lineal simple. C oeficiente de


regresin
Hemoglobina (g/dl)

Estimaciones de los parmetros y sus


errores estndar para en la relacin de los
niveles de creatinina y hemoglobina en 50
pacientes con fallo renal crnico
Variable

Representacin grfica de los niveles de creatinina y


hemoglobina en 50 pacientes con fallo renal crnico

Coeficiente de regresin 1
Hb (Y) = 12,25 0,5708 *
[C reatinina]

Estimacin Error estndar

Constante 12,25

0,2984

Creatinina - 0,5708

0,05312

E(Y) = 0 + 1 * X

p g in a 655

C a pt u l o 7

Regresin Lineal Simple. C oeficiente de


regresin
El valor de es estadsticamente distinto de cero y por tanto podemos decir que
1

existe
dependencia
lineal entre los niveles de Hb y los de Cr en los pacientes con
IRC?
Z
Z90%

Valor
1,64

90%

Error
10%

Z95%

1,96

95%

5%

Z99%

2,56

99%

1%

Z99,5%

3,29

99,5%

0,5%

1
EE1

Estimaciones de los parmetros y sus


errores estndar para en la relacin de los
niveles de creatinina y hemoglobina en 50
pacientes con fallo renal crnico
Variable
Estimacin Error estndar
Constante 12,25
0,2984
Creatinina - 0,5708
0,05312

0,5708
=

=
0,05312

10,74 > Z95%

Podemos decir con error inferior al 5% que el nivel de Hb est asociado o depende
del
nivel de Cr.

p g in a 656

C a pt u l o 7

C lculo del Intervalo de C onfianza (IC ) del


coeficiente de regresin
Cul es el IC al 95% de confianza para el cambio en el nivel de Hb por unidad
de
aumento en el nivel de Cr en los pacientes con IRC?
Z

Z95%

Valor
1,96

95%

Z99%

2,56

99%

Z99,5%

3,29

99,5%

Z95%

EE1

- 0,5708 (1,96) X 0,05312

= (- 0,67, -0,47)

Podemos decir con error inferior al 5% , es decir con una confianza del 95%, que el
descenso medio del nivel de Hb ser como mnimo 0,47 g/dl y como mximo 0,67 g/dl
por aumento en 1 mg/dl en el nivel de Cr. El hecho de que el IC95% no contenga al
cero esta de acuerdo con el resultado del contraste de hiptesis realizado (p<0,05).

p g in a 657

C a pt u l o 7

C ovarianza de dos variables X


eY
- La covarianza entre dos variables, Sxy, nos indica si la posible relacin
entre dos variables es directa o inversa.
1
Directa: Sxy >0
Inversa: Sxy <0

S xy

(x x)(i y
n i i y)

Incorreladas: Sxy =0
- El signo de la covarianza nos dice si el aspecto de la nube de puntos
es creciente o no, pero no nos dice nada sobre el grado de relacin
entre las variables.

p g in a 658

C a pt u l o 7

Regresin lineal simple:


C ovarianza
Covarianza positiva > 0

Covarianza negativa < 0

sxy

X
i 1

Valores de la COVARIANZA dependiendo de la variacin al unsono de x e y

X Yi
n

100

rxy
90

X
i 1

X Yi

Y n sx s y

80

70

Covarianza nula = 0

60
10

20
50

30

40

El valor de la COVARIANZA es cero cuando no hay variacin al unsono de x e y

rxy s xy
sx s y

p g in a 659

C a pt u l o 7

C ovarianza y coeficiente de correlacin de


Pearson (r)
n

rxy

i 1

X Yi

Y n sx s y

rxy s xy
sx
sy

p g in a 660

C a pt u l o 7

p g in a 661

S xy

r
C oeficiente de correlacin lineal de
Sx y
S
-Pearson
La coeficiente de correlacin lineal de Pearson de dos variables, r, nos indica si los
puntos tienen una tendencia a disponerse alineadamente.
-El coeficiente tiene el mismo signo que la covarianza Sxy por tanto su signo nos informa
del tipo de relacin, directa o inversa.
r es til para determinar si hay relacin lineal entre dos variables, pero no servir para
otro tipo de relaciones (cuadrtica, logartmica, ...)
-El coeficiente de correlacin no se debe extrapolar ms all del rango de valores
observado de las variables en estudio ya que la relacin existente entre X e Y
puede cambiar fuera de dicho rango.
-La correlacin no implica causalidad. La causalidad es un juicio de valor que
requiere
ms informacin que un simple valor cuantitativo de un coeficiente de correlacin
(*).
-No debe utilizarse para comparar dos mtodos que intentan medir el mismo evento
(variable), como por ejemplo dos instrumentos que miden la tensin arterial. El
coeficiente r mide el grado de asociacin entre dos cantidades pero no mira el nivel de
acuerdo
o concordancia. Si los instrumentos de medida miden sistemticamente cantidades
diferentes uno del otro, la correlacin puede ser r 1 y su concordancia ser nula (**).
(*) Pita Fernndez S. Correlacin frente a causalidad JANO 1996; (1174): 59-60.

C a pt u l o 7

p g in a 662

Propiedades de
r

- Es adimensional
- Slo toma valores en [-1,1]
- Las variables son
r=0
- incorreladas
Relacin lineal perfecta entre dos variables
r=+1 o r=-1
- Excluimos los casos de puntos alineados horizontal o verticalmente.
- Cuanto ms cerca est r de +1 o -1 mejor ser el grado de relacin
lineal.
- Siempre que no existan observaciones anmalas.
Relaci
n
inversa
perfect
a

Variables
incorrelad
as

-1

Relacin
directa
casi
perfecta
+1

Horbar JD, Onstad L, Wright E. Predicting mortality risk for infants weighing 501 to 1500 grams at birth: The
National Institutes of Health Neonatal Research Network report. Crit Care Med 1993; 21:1218.

p g in a 663

C a pt u l o 7

Hb (Y) = 12,25 0,5708 * [Creatinina]


12

1 = - 0,5708

Hb (Y) = 12,25 0,5708 * [Creatinina]

1 = - 0,5708

12

Y
10

10

10

10

Nube de puntos con distinta fuerza de asociacin pero con la misma regresin 1

C a pt u l o 7

C oeficiente de correlacin de
Pearson
Y
1 = -= 0,5708
- 0,5708

12

Y
1 = - 0,5708

12

10

10

r =r -=0,72
- 0,98
2
10

r = - 0,72
X

Alta fuerza de asociacin


Alto valor de r

2
10

Menor fuerza de asociacin


Menor valor de r

p g in a 664

C a pt u l o 7

p g in a 665

C oeficiente de correlacin de
Pearson
Y
12

- El valor absoluto de r es una medida de la fuerza de


asociacin entre dos variables cuantitativas
distintas.
r > 0,70: magnitud intensa
0,3 < r < 0,7: magnitud
moderada r < 0,3: magnitud
dbil
-Valores: -1 y 1
- Clculo del tamao muestral
-Mide la asociacin pero NO confundir la asociacin
estadstica con una relacin CAUSA-EFECTO.

10

r = - 0,72
2

10

Valor de r indica FUERZA de


asociacin

C a pt u l o 7

C oeficiente de correlacin de
Pearson

Edad

0p,0=402,048

Indice de Quetelet (IMC)

r =r 0=,1-03,61;36p; =

r=
0,r1=78-;0,1p7=80,04
2

Excrecin de sodio (mEq) en orina de 24 horas

Bajo valor de r

Baja fuerza de
asociacin

p g in a 666

C a pt u l o 7

p g in a 667

Ejemplo del clculo del tamao muestral para el


clculo del
coeficiente de correlacin entre dos variables
cuantitativas
Supongamos que se desea estudiar la asociacin entre la edad y el nivel de colesterol
entre los pacientes de un centro de salud. Se disea un estudio piloto en el que se
determinar mediante una analtica el colesterol en una muestra aleatoria de los
pacientes durante un periodo de tiempo prefijado, de los que tambin se registrar su
edad. Se obtiene un valor del coeficiente de correlacin lineal de Pearson entre la edad y
el colesterol de r=0,3. Aplicando las frmulas, con un NIVEL DE CONFIANZA del 95%
(error =5%) y un PODER ESTADSTICO del 80% (error =20%), se obtiene:
En este caso, se necesitara incluir a 85
pacientes para llevar a cabo el estudio.

Si, adems, en este ltimo caso se prev un 20% de posibles prdidas de


informacin durante la ejecucin del estudio, el tamao muestral se recalcular segn
la expresin:
Es decir, se necesitara una muestra
de 107 pacientes para llevar a cabo la

C a pt u l o 7

Variable RESULTADO-RESPUESTA-posible
EFECTO Variable dependiente
Variable cuantitativa continua

Regresin lineal simple. C oeficiente de


determinacin
Hemoglobina (g/dl)

0 1110

r = - r0,84
2 = 0,71

Y = 12,25 0,5708 * X
7
2

Creatinina (mg/dl)

Representacin grfica de los niveles de creatinina y hemoglobina en


50 pacientes con fallo renal crnico
Variable PREDICTORA-EXPOSICIN-posible CAUSA
Variable independiente, fija controlada por el
investigador Variable cuantitativa continua

p g in a 668

C a pt u l o 7

C oeficiente de
determinacin r2

- Indica el porcentaje de la variabilidad total de la variable dependiente o


resultado
(Y) que puede ser explicada por la variable independiente o predictora (X)

- Se puede afirmar que el 71% de la variabilidad de las Hb (variable resultado)


de los 50 pacientes con IRC puede ser explicada por la distinta Cr de ellos ( r2
= 0,71 ), resta por explicar un 29% que es achacable a otras variables
predictoras distintas de la Cr.

- Valores: -1 y 1

- El coeficiente de correlacin r de Pearson deca que la magnitud de la


asociacin entre la Hb y la Cr es del 84% (r=0,84) de la mxima posible.

p g in a 669

C a pt u l o 7

Tipos de correlaciones: positivas (r


> 0)
330

r=0,1

280
230
180
130
80
30
140
200

150

160

170

180

130
120
110
100
90
80
70
60
50
40
30

140
200

190

100

100

90

90

80

80

70

70

60

60

50

r=0,4

1 = constante (+)
50

150

160

170

180

190

p g in a 670

p g in a 671

C a pt u l o 7

Tipos de correlaciones: negativas (r


< 0)r=-0,5
r=-0,7
80

9
0

70

8
0

60

7
0

50

6
0

30

40

5
0
4
0 140
3 200
0
2
80
0
70

20
10
150

160

170

180

0
140

190

80

r=-0,95

70

1
60
0
50
0

160

170

180

190

200

160

170

180

190

200

r=-0,999

60
50

40

40

30

30

20

20

10

10

0
140

150

150

160

170

180

190

200

0
140

150

1 = constante (-)

C a pt u l o 7

Fenmeno
Tracking
FAC TO RES
AMBIEN TALES
PERFIL
LIPD ICO
N EO N ATO

Estudio de
cohortes de 108
nios

PERFIL LIPD ICO


SEGUN D O A O

FAC TO RES
GEN TICO S
Daz Portillo J. Influencia del grupo tnico en el patrn lipoproteico de una determinada poblacin
peditrica de Ceuta. Tesis doctoral (Noviembre 1997). Facultad de Medicina de la Universidad de Cdiz.

p g in a 672

C a pt u l o 7

Colesterol total (mg/dl) al nacimiento

110

r = 0,23
r2 = 0,05
p < 0,05
80

50

20
80

130

180

Colesterol total (mg/dl) durante el segundo ao de vida

230

p g in a 673

C a pt u l o 7

110

21/108 (19,4%)

Colesterol total (mg/dl) al nacimiento

8/108 (7,4%)
4/61 Cristianos (6,5%)
4/44 Musulmanes (9,1%)

14/61 Cristianos (23,0%)


6/44 Musulmanes (13,6%)

80
P75

50

c
14/108 (13,9%)

64/108 (59,5%)

34/61 Cristianos (55,7%)


28/44 Musulmanes (63,6%)

20

80

9/61 Cristianos (14,7%)


6/44 Musulmanes (13,6%)

130

Colesterol total (mg/dl) durante el


segundo ao de vida

180

P 75

230

p g in a 674

C a pt u l o 7

Test de McN emar para datos


apareados
(Prueba
de la significacin de los
McNemar
NEONATOS
CT > P
cambios)

DESPUS del curso


CT P

75

CT > P

75

75

CT P
75

McMemar =

[ ( B C ) 1 ]2

B+C
(B C)1

Z McNemar =

B+C

p g in a 675

C a pt u l o 7

Test de McN emar para datos


apareados
(Prueba
de la significacin de los
McNemar
NEONATOS
CT > P
cambios)

DESPUS del curso


CT P

75

CT > P

75

21

14

64

75

CT P
75

[ ( 21 14 ) 1 ]2

McMemar =

21 + 14

= 1,03

p g in a 676

C a pt u l o 7

Z
Z95%

Valor
1,96

0,05

Z98%

2,32

0,02

Z99%

2,56

0,01

Z99,5%

3,29

0,005

p g in a 677

(B C)1

Z McNemar =

Z
McNemar

B+C

( 21 14 ) 1

= 1,014

21 + 14

Conclusin: Como el estadstico Z calculado 1,014 es INFERIOR a Z


tabulado para un error alfa de 0,05 (1,96), podemos decir que las dos
variables evaluadas son independientes, es decir NO estn correlacionadas,
y por tanto no hay cambios importantes en la distribucin del colesterol total
al pasar del nacimiento al segundo ao de vida. Este comportamiento
tambin se repite en los dos grupos culturales (cristianos y musulmanes) de
Ceuta.

C a pt u l o 7

110

Colesterol total (mg/dl) al nacimiento

80
P75

50

c
D
20

80

130

Colesterol total (mg/dl) durante el


segundo ao de vida

180

P 75

230

p g in a 678

C a pt u l o 7

r = 0,37
r2 = 0,14
p < 0,01

Apoprotena B (mg/dl) al nacimiento

50

40

30

20

10

30
130

40

50

60

70

80

90

100

110

120

Apoprotena B (mg/dl) durante el segundo ao de vida (12-20 meses)

p g in a 679

C a pt u l o 7

Apoprotena B (mg/dl) al nacimiento

42

34

26

r = 0,29 (IC95%=0,03-0,50)
r2 = 0,08
p < 0,05

18

10
30

70

110

150

Apoprotena B (mg/dl) durante los primeros meses (12-13) del segundo ao de vida

p g in a 680

C a pt u l o 7

47

Apoprotena B (mg/dl) al nacimiento

r = 0,50 (IC95%=0,25-0,68)
39 r2 =

0,25

p < 0,001
31

23

15

40

60
120

80

100

Apoprotena B (mg/dl) durante los 14-20 meses del segundo ao de


vida

p g in a 681

C a pt u l o 7

p g in a 682

Limitaciones del coeficiente de correlacin de


Pearson
120

Protrombina (INR) = 25,1 + (14,4 * [Albmina])

PROTROMBINA
Variable RESULTADORESPUESTA
Variable dependiente
Variable cuantitativa
continua

Representacin grfica de la actividad de protrombina (INR) y la albmina srica en pacientes con hepatocarcinoma.
100
= 14,4 (IC95%: 8,3-20,5)
80

60

40

20

R2 = 0,16
0
1,6

1,8

2,0

2,2

2,4

2,6
3,0

2,8

3,2

3,4

3,6

3,8

4,0

ALBMIN
Variable
PREDICTORA
A
Variable independiente,
fija controlada por el
investigador Variable cuantitativa continua

Slo con la variable predictora incluida en el modelo (ALBMINA srica) slo se puede explicar el 16% de
la variabilidad de la variable resultado (PROTROMBINA), queda por explicar un 84% de la variabilidad que
es achacable a otras variables predictoras distintas no incluidas.

p g in a 683

C a pt u l o 7

Limitaciones del coeficiente de correlacin de


Pearson
El modelo (coeficiente ) indica

Slo con la variable predictora


incluida en el modelo (horas
sentado) slo se puede
explicar el 0,6% de la
variabilidad de la variable
resultado (IMC), queda por
explicar un 99,4% de la
variabilidad que es achacable
a otras variables
predictoras distintas no
incluidas.

IMC = 23,5 + (0,03 * Horas sentada)


IMC (peso [Kg] / Talla 2 [m2])

Variable RESULTADO-RESPUESTA-posible
EFECTO Variable dependiente
Variable cuantitativa continua

26,0

que por cada 10 horas que


pasa sentada una mujer a la
semana aumenta su peso en
unos 800 gr.

R2 = 0,006

25,5

25,0

24,5

24,0
23,5
23,0
0

10

20

30

40

50

60

70

80

Horas sentado / semana (tiempo libre)

Relacin entre el ndice de masa corporal (IMC) y las horas de estar sentado
a la semana en el tiempo libre.

Muestra representativa (n=7.926) mujeres de la Unin Europea


Variable PREDICTORA-EXPOSICIN-posible CAUSA
Variable independiente, fija controlada por el
investigador Variable cuantitativa continua

p g in a 684

C a pt u l o 7

Limitaciones del coeficiente de correlacin de


Pearson
100

34

30

Indice de masa Corporal (IMC)

Glucemia (mg/dl)

90

1 = 0

32

1 = 0

80

70

60

28
26
24
22
20

10

20

30

40

50

10

20

30

40
50

60

70

80

Edad

Edad

Dos nubes de puntos con la misma pendiente 1 de valor cero que muestran dos situaciones muy diferentes.
A la izquierda ausencia de relacin. A la derecha relacin NO lineal.

NO se puede emplear el coeficiente de correlacin de Pearson

C a pt u l o 7

Limitaciones del coeficiente de correlacin de


Pearson
Relacin
hiperblica

Relacin
cuadrtica

y=a+b

1
X

y = a + b x2

NO se puede emplear el coeficiente de correlacin de Pearson


Podemos encontrar cualquier tipo de funcin matemtica con claro apartamiento de
la linealidad.

p g in a 685

C a pt u l o 7

p g in a 686

O tros coeficientes de correlacin


-Cuando las variables en vez de ser numricas son ordinales, es
posible preguntarse sobre si hay algn tipo de correlacin entre ellas?
- Disponemos para estos casos de tres test estadsticos:
- (ro) de Spearman
- (tau) de Kendall
- Coeficiente de asociacin ordinal de Goodman-Kruscall (coefiente
gamma)
-Son estadsticos anlogos al coeficiente de correlacin lineal de Pearson r,
que aparecen en estudios donde las variables cuantitativas no son
continuas y/o no siguen una distribucin normal.
-El coeficiente de correlacin de Spearman es recomendable utilizarlo
cuando los datos presentan valores externos ya que dichos valores
afectan mucho el coeficiente de correlacin de Pearson, o ante
distribuciones NO normales.
rs
1

2
i1 di

n n2

C a pt u l o 7

C oeficientes de
correlacin
-PEARSON
Ambas variables deben seguir
la distribucin NORMAL
-Slo detecta asociaciones
lineales
-Las observaciones han de ser
independientes

SPEARMAN
- No requiere supuestos
previos de normalidad
- Detecta asociaciones
distintas de la lineal
-Es un mtodo no paramtrico
pero permite la construccin
de intervalos de confianza
-Estima el grado de asociacin
de cualquier tipo con
independencia de la funcin
matemtica que relaciona
ambas variables

p g in a 687

C a pt u l o 7

Pregunta de investigacin
Existe relacin entre la edad del paciente y la
duracin
de
PREDen
IC TO
RAI?
Variable RESULTAD O
laVariable
estancia
UC
1 C UAN TITATIVA
Edad
continua
- Aos

Cul es el test estadstico ms


acertado?

C UAN TITATIVA
Estancia
discreta
- D as

p g in a 688

C a pt u l o 7

p g in a 689

C a pt u l o 7

80
Das de estancia en
UCI

Lnea continua ajuste mediante estimador


robusto de regresin medio ponderado
Lnea de trazos discontinuos: ajuste
mediante mnimos
cuadrad
os

60

40

20

0
20

30

40

50

Edad del
paciente

60

70

80

p g in a 690

C a pt u l o 7

Resultados
C oeficiente de correlacin de
Spearman
Variable
N
Correlacin (r)
Edad del paciente versus Estancia en UCI

Tau-b de
Kendall
Variable
Edad del paciente versus Estancia en UCI

22

0,614 (**)

0,002

Correlacin (r)

Significacin

22

0,470 (**)

0,003

** La correlacin es significativa al nivel 0,01


(bilateral).
p < 0,01

Significacin

Rechazamos la hiptesis nula

p g in a 691

C a pt u l o 7

Pregunta de investigacin
Existe relacin entre la intensidad del estudio y el
rendimiento
acadmico en el examen del curso de Bioestadstica?
Variable PRED IC TO RA
1 Cuantitativa
Horas de estudio
continua

Cul es el test estadstico ms


acertado?

Variable
RESULTAD O
Rendimiento acadmico
Cuantitativa
discreta

p g in a 692

p g in a 693

C a pt u l o 7

Pregunta de investigacin: Existe relacin entre la


intensidad del estudio y el rendimiento acadmico en el
examen del curso de Bioestadstica?
N
respuestas
correctas
(Y)

16

17

18

21

21

29

20

15

10

100

22

20

r = 0.976
0.001

Nmero de respuestas
correctas

N del
Horas
Alumno de
estudio
(X )

15

10

0
10
30
50
70

p<

C a pt u l o 7

Resultados
C oeficiente de correlacin de
Spearman
Variable
Horas de estudio versus Respuestas correctas

Tau-b de
Variable
Kendall
Horas de estudio versus Respuestas correctas

Correlacin (r)

Significacin

10

0,976 (**)

0,000

Correlacin (r)

Significacin

10

0,911 (**)

0,000

** La correlacin es significativa al nivel 0,01


(bilateral).
p < 0,01

Rechazamos la hiptesis nula

p g in a 694

C a pt u l o 7

p g in a 695

Mito 1: La sonrisa de la esfinge


He observado que el individuo n 20 se aparta bastante de la tendencia
del grupo. De hecho si se eliminara se podra considerar una supuesta
relacin lineal.
Ests seguro que ese dato n 10 es correcto?Est bien tomado? Cmo
ests seguro de que ese individuo ha estudiado 100 horas? Qu medidas
has tomado para considerar la credibilidad de la variable predictora (horas
de estudio)?
No podra considerarse a ese individuo n 10 como un perifrico
o OUTLIER?

C a pt u l o 7

Pregunta de investigacin
Existe relacin entre el coeficiente intelectual de los
alumnos y el
rendimiento acadmico en el examen del curso de
Bioestadstica?
Variable PRED IC TO RA
2 Cuantitativa discreta
C oeficiente intelectual

Cul es el test estadstico ms


acertado?

Variable
RESULTAD O
Rendimiento acadmico
Cuantitativa
discreta

p g in a 696

C a pt u l o 7

Pregunta de investigacin: Existe relacin entre el


coeficiente intelectual del alumno y el rendimiento
acadmico en el examen del curso de Bioestadstica?
N
respuestas
correctas
(Y)

r = 0.811
20

Nmero de respuestas
correctas

N del
Horas
Alumno de
estudio
(X )
1

104

125

16

115

18

100

100

140

21

112

130

20

125

15

100

10

122

22

110

15

10

120
130
140

p< 0.01

p g in a 697

C a pt u l o 7

Resultados
C oeficiente de correlacin de
Spearman
Variable

Correlacin (r)

Significacin

Coeficiente intelectual versus respuestas correctas

10

0,811 (**)

0,004

Correlacin (r)

Significacin

10

0,705 (**)

0,005

Tau-b de
Variable
Kendall
Coeficiente intelectual versus respuestas correctas

** La correlacin es significativa al nivel 0,01


(bilateral).
p < 0,01

Rechazamos la hiptesis nula

p g in a 698

C a pt u l o 7

Pregunta de investigacin
Existe relacin entre las horas de asistencia a clase y el
rendimiento acadmico en el examen del curso de
Bioestadstica?
Variable PRED IC TO RA
3 Cuantitativa
Horas de asistencia a clases
continua

Cul es el test estadstico ms


acertado?

Variable
RESULTAD O
Rendimiento acadmico
Cuantitativa
discreta

p g in a 699

p g in a 700

C a pt u l o 7

Pregunta de investigacin: Existe relacin entre las


horas de asistencia a clase y el rendimiento acadmico
en el examen del curso de Bioestadstica?
N
respuestas
correctas
(Y)

23

92

16

78

18

15

20

100

21

35

95

20

75

15

10

100

22

r=
0.985

20

Nmero de respuestas
correctas

N del
Horas
Alumno de
estudio
(X )

Cul es el test estadstico ms


acertado?

p<
0.01

15

10

0
25

50
75

Horas de asistencia a
clase

100

C a pt u l o 7

Resultados
C oeficiente de correlacin de
Spearman
Variable
Asistencia a clase versus respuestas correctas

Tau-b de
Variable
Kendall
Asistencia a clase versus respuestas correctas

Correlacin (r)

Significacin

10

0,985 (**)

0,000

Correlacin (r)

Significacin

10

0,944 (**)

0,000

** La correlacin es significativa al nivel 0,01


(bilateral).
p < 0,01

Rechazamos la hiptesis nula

p g in a 701

C a pt u l o 7

Resumen de los resultados de correlacin


bivariante
Variables predictoras

Rho Spearman

Significacin

Tau de Kendall

Significacin

Horas de estudio

0,976

0,000

0,911

0,000

Coeficiente intelectual

0,811

0,004

0,705

0,005

Asistencia a clase

0,985

0,000

0,944

0,000

Variable resultado: Rendimiento acadmico (nmero de respuestas correctas)

Existe relacin entre las distintas variables


predictoras?
COLINEALIDAD?

p g in a 702

C a pt u l o 7

Pregunta de investigacin
Existe relacin entre las horas dedicadas al estudio
por el alumno y el coeficiente intelectual de los
alumnos del curso de Bioestadstica?
Variable PRED IC TO RA
1 Cuantitativa
Horas de estudio
continua

Cul es el test estadstico ms


acertado?

Variable PRED IC TO RA
2 Cuantitativa discreta
C oeficiente intelectual

p g in a 703

C a pt u l o 7

Resultados
C oeficiente de correlacin de
Spearman
Variable
Horas de estudio versus coeficiente intelectual

Correlacin (r)

Significacin

10

0,787 (**)

0,007

Correlacin (r)

Significacin

10

0,614 (*)

0,015

** La correlacin es significativa al nivel 0,01


(bilateral).

Tau-b
de Kendall
Variable
Horas de estudio versus coeficiente intelectual

* La correlacin es significativa al nivel 0,05


(bilateral).
p < 0,05

Rechazamos la hiptesis nula

p g in a 704

C a pt u l o 7

Pregunta de investigacin
Existe relacin entre las horas de estudio del
alumno y las
horas de asistencia a clase del curso de
Bioestadstica?
Variable PRED IC TO RA
1 Cuantitativa
Horas de estudio
continua

Cul es el test estadstico ms


acertado?

Variable PRED IC TO RA
3 Cuantitativa
Horas de asistencia a clases
continua

p g in a 705

C a pt u l o 7

Resultados
C oeficiente de correlacin de
Spearman
Variable
Horas de estudio versus asistencia a clase

Correlacin (r)

Significacin

10

0,954 (**)

0,000

Correlacin (r)

Significacin

10

0,854 (**)

0,001

** La correlacin es significativa al nivel 0,01


(bilateral).

Tau-b
de Kendall
Variable
Horas de estudio versus asistencia a clase

** La correlacin es significativa al nivel 0,01


(bilateral).
p < 0,05

Rechazamos la hiptesis nula

p g in a 706

C a pt u l o 7

Pregunta de investigacin
Existe relacin entre el coeficiente intelectual del
alumno y
las horas de asistencia a clase del curso de
Bioestadstica?
Variable PRED IC TO RA
2 Cuantitativa discreta
C oeficiente intelectual

Cul es el test estadstico ms


acertado?

Variable PRED IC TO RA
3 Cuantitativa
Horas de asistencia a clases
continua

p g in a 707

C a pt u l o 7

Resultados
C oeficiente de correlacin de
Spearman
Variable
Coeficiente intelectual versus asistencia a clase

Correlacin (r)

Significacin

10

0,869 (**)

0,001

Correlacin (r)

Significacin

10

0,782 (**)

0,002

** La correlacin es significativa al nivel 0,01


(bilateral).

Tau-b
de Kendall
Variable
Coeficiente intelectual versus asistencia a clase

** La correlacin es significativa al nivel 0,01


(bilateral).
p < 0,05

Rechazamos la hiptesis nula

p g in a 708

C a pt u l o 7

Variable PRED IC TO RA
1 C uantitativa
Horas
de estudio

Variable PRED IC TO RA
C uantitati
2
va C oeficiente

Variable
RESULTAD O
C uantitativa
Rendimient

intelectual

o
acadmico

Variable PRED IC TO RA
3 C uantitativa
Horas de
asistencia a
clases

p g in a 709

C a pt u l o 7

p g in a 710

C a pt u l o 7

Qu relacin existe entre el consumo de cigarrillos


y los
niveles de cadmio en sangre?
Cuantitativa
C onsumo de
discreta

cigarrillos N mero
de cigarrillos
consumidos por da

Cul es el test estadstico ms


acertado?

Cuantitativa
C admio en sangre
continua
N iveles sricos de
cadmio (g/L)

p g in a 711

C a pt u l o 7

r = 0,532 p =
0,001

p g in a 712

C a pt u l o 7

Med Clin (Barc)


2006;127:41-6

p g in a 713

C a pt u l o 7

p g in a 714

C a pt u l o 7

Pregunta de investigacin
Qu relacin y que grado de asociacin existe entre
el ndice de actividad clnica de las enfermedades
inflamatorias intestinales (EII) y los niveles de
calprotectina fecal?
Variable
PRED IC TO RA
C alprotectina fecal
Cuantitativa
continua

Variable
RESULTAD O
ndice de actividad de la
Cuantitativa
enfermedad inflamatoria
discreta

intestinal (Harvey- Bradshaw


modificado para colitis ulcerosa
y enfermedad de C rohn)

p g in a 715

C a pt u l o 7

ndice de HarveyBradshaw

Qu tipo de variable es el ndice de HarveyBradshaw?

p g in a 716

C a pt u l o 7

20

Coeficiente de correlacin
Rho de Spearman
ndice de Harvey- Bradshaw

ndice de actividad
clnica

15

r=
0,719

10

0
0
1.000 2.000
3.000 4.000 5.000 6.000
7.000 8000

p<
0,01

p g in a 717

C a pt u l o 7

Anlisis estadstico (fragmento del


texto)
El anlisis de los datos se llev a cabo mediante el programa estadstico SPSS 11.0. El
valor de la CPF se presenta como media y con un intervalo de confianza (IC) del 95%.
Se utiliz el test de Kruskal-Wallis para evaluar las diferencias entre los valores de CPF
entre los diferentes grupos y el coeficiente de Spearman para valorar la correlacin
entre este marcador y el ndice de actividad de la enfermedad en el grupo de pacientes
con enfermedad inflamatoria intestinal (EII).

p g in a 718

C a pt u l o 7

p g in a 719

Resultados (fragmento del


texto)
En la figura 2 se muestra la correlacin positiva entre la concentracin de la CPF
y el ndice de actividad de la enfermedad en pacientes con enfermedades
inflamatoria
intestinales (EII) (enfermedad de Crohn (EC) y colitis ulcerosa (CU)) (r = 0,719, p <
0,01).

D iscusin (fragmento del texto)


El presente trabajo muestra que la concentracin de CPF est significativamente
elevada en pacientes con procesos orgnicos en colon, fundamentalmente en el cncer
colorrectal y enfermedad inflamatoria intestinal (EII). Adems, los valores ms altos se
alcanzan
en pacientes con EII, y sus valores se correlacionan con el grado de actividad de la
enfermedad.

C a pt u l o 7

p g in a 720

Pregunta de investigacin
Qu relacin y qu grado de asociacin existe entre el
nivel de conocimientos mdicos actualizados sobre el
mejor trata- miento posible y el tiempo transcurridos
desde la graduacin?
Variable
PRED IC TO RA
Aos desde la graduacin
Cuantitativa
continua

Variable
RESULTAD O
C onocimientos actualizados
Cuantitativa
sobre el mejor tratamiento posible
discreta
(medidos segn escala de MBE)

C a pt u l o 7

Conocimientos actualizados sobre


el mejor tratamiento posible
(niveles de evidencia)

Coeficiente de correlacin Rho de Spearman


r=p
0,54
<
0,001

. ..
.. .. ....
.... ....
...

...
....
....

Una Pendiente
Resbaladiza
Aos desde la graduacin

...
..

p g in a 721

C a pt u l o 7

Estudios
ecolgicos

EE.UU
Ferroviarios

Seven
Countries
Study
FINLANDIA

HOLANDA
Zutphen

ITALIA
Crevalcore
GRECIA
Montegiorgio
Creta
Roma
Corfu

YUGOSLAVIA
Belgrado
Dalmacia
Eslavonia
Velika Krsna
Zrenjanin

JAPON
Tanushimaru
Ushibuka

p g in a 722

C a pt u l o 7

Estudio
ecolgico
Variable PRED IC TO RA
Factor de exposicin
Grasas saturadas
(F)

Variable RESULTAD O
Efecto o Enfermedad
(E)C ardiopata coronaria

cidos grasos
saturados de la dieta (%
de aporte calrico)

Tasas de mortalidad
por cardiopata
coronaria

Cul es el test estadstico ms


acertado?

p g in a 723

C a pt u l o 7

Fallecimiento por cardiopata coronaria (%)

Estudio
ecolgico

Coeficiente de correlacin r de Spearman


4

3
2

MC
DB

V
0

Z
K

N
W
r=
0,84

5
10
15
20
25
cidos grasos saturados en la dieta (% de aporte calrico)

Tasa de mortalidad por cardiopata coronaria en funcin del contenido en cidos grasos saturados de la
dieta (% del aporte calrico). Ambas variables estn significativamente correlacionadas segn un amplio
estudio (Seven Countries Study) llevado a cabo en diferentes grupos de poblacin. B = Belgrado, C=
Crevalcore, D= Dalmacia, E = este de Finlandia, G = Corf, K = Creta, N = Zutphen, M = Montegiorgio, S
= Eslavonia, T = Tanushimaru, U = empleados de ferrocarriles de EEUU, V = Velika Krsna, W = oeste
de
Finlandia, Z = Zrenjarin.

p g in a 724

C a pt u l o 7

Estudio
ecolgico
Variable PRED IC TO RA
Factor de exposicin
Grasas saturadas
(F)

Variable RESULTAD O
Efecto o Enfermedad
(E)C olesterolemia

cidos grasos
saturados de la dieta (%
de aporte calrico)

Tasas de colesterol
en sangre (mg/dl)

Cul es el test estadstico ms


acertado?

p g in a 725

C a pt u l o 7

Estudio
ecolgico

Coeficiente de correlacin r de Spearman

280

260

Colesterolemia (mg/dl)

p g in a 726

240
220

200
180

160

B
K Z
S
MC
D

U N
r=
0,89

140

10

15

20

25

cidos grasos saturados en la dieta (% de aporte calrico)


Valores de colesterol en sangre en relacin con el contenido en cidos grasos saturados de la dieta (% del
aporte calrico). Ambas variables estn significativamente correlacionadas segn un amplio estudio
(Seven Countries Study) llevado a cabo en diferentes grupos de poblacin. B = Belgrado, C= Crevalcore,
D= Dalmacia, E = este de Finlandia, G = Corf, K = Creta, N = Zutphen, M = Montegiorgio, S = Eslavonia,
T = Tanushimaru, U = empleados de ferrocarriles de EEUU, V = Velika Krsna, W = oeste de Finlandia, Z =
Zrenjarin.

C a pt u l o 8

C aptulo 8
Publicacin Bioestadstica: Anlisis
bivariante. Test de contraste de hiptesis.
Cualitativa dicotmica versus cuantitativa.

D r. Jacobo D az Portillo
Coordinador de Formacin Continuada
Hospital Universitario de Ceuta

p g in a 727

C a pt u l o 8

Materiales y mtodos
Estructura
1. Tipo de diseo (estudio).
2. Sujetos incluidos (criterios de seleccin de la muestra)
3. Fuentes de informacin.
4. Descripcin de la intervencin y definicin del punto final de la
investigacin (estudios experimentales).
5. Instrumentos y procedimientos de medida (cuestionarios).
6. Definicin de las variables y covariables incluidas en el estudio (factor
de
estudio y criterio de evaluacin).
7. Limitaciones y consideraciones ticas de la investigacin.
8. Pruebas estadsticas a utilizar (programa estadstico).

p g in a 728

C a pt u l o 8

Fases del anlisis


estadstico
1. ANLISIS DESCRIPTIVO

2. ANLISIS BIVARIANTE

3. ANLISIS MULTIVARIANTE

p g in a 729

C a pt u l o 8

D ecisiones que se pueden tomar en un test de


contraste de hiptesis despus de conocer el valor
de significacin estadstica p
p < 0,05 A B
Se rechaza la hiptesis nula
No parece que el azar
pueda explicarlo todo
El EFECTO observado es mayor
que el ERROR
Hay diferencias estadsticamente
significativas
Existen evidencias a favor de la
hiptesis alternativa Ha, y por
tanto rechazamos la hiptesis nula
Ho

p 0,10
A= B
No se puede rechazar la hiptesis nula
No se puede descartar que el azar
lo explique todo
El EFECTO observado es similar que
el ERROR
NO hay diferencias estadsticamente
significativas
NO existen evidencias a favor de
la hiptesis alternativa Ha, y por
tanto aceptamos la hiptesis nula
Ho

Los lmites de 0,05 y 0,1 pueden ser considerados en cierto modo


arbitrarios y aproximados

p g in a 730

C a pt u l o 8

Anlisis estadstico
Tipos de test analticos estadsticos de contraste de hiptesis
segn el tipo de variables implicadas en el estudio
Variable
dependiente
Variable Continua
resultado
Dicotmica
Variable
Predictor
a
Variable
Independien
te

Dicotmica

Test de 2

t de Student

Continua

Regresin
lo- gstica

Regresin lineal

p g in a 731

C a pt u l o 8

Anlisis
estadstico
ANLISIS ESTADSTICO
Variable
Predictor
a
Variable
Independien
te

Variable resultado
Dicotmica
Continua

Dicotmica

Test de 2

t de Student

Continua

Regresin
lo- gstica

Regresin lineal

t de Student

p g in a 732

C a pt u l o 8

p g in a 733

Pruebas estadsticas de contraste de


hiptesis ms aplicables a cada situacin
Variable
Independiente
o PREDICTORA

Variable
Dependiente
o RESULTADO

Pruebas de contraste de
hiptesis

Observaciones y/o limitaciones del test

Cualitativa

Cualitativa

Ji cuadrado
Prueba exacta de
Fisher Test de
McNemar
Q de Cochran
REGRESIN LOGSTICA

Cualitativa

Cuantitativa

Cuantitativa

Cualitativa

Cuantitativa

Cuantitativa

t de Student
Anlisis de la
Varianza Test de
Mann-Whitney Test
de Wilcoxon
Test de KruskallWallis Test de
Friedman
Regresin logstica simple
Regresin logstica
multivariante
Regresin lineal
simple Correlacin de
Pearson Correlacin
de Sperman
REGRESIN MLTIPLE

Si el tamao muestral es
grande Si el tamao muestral
es pequeo
Dos grupos de muestras
repetidas o apareadas
Ms de dos grupos de muestras repetidas o
apareadas Varias variables predictoras
cualitativas
Compara medias entre dos grupos independientes
Compara medias entre ms de dos grupos
independientes Dos grupos independientes No
paramtricos
Dos grupos medidas repetidas No paramtrico
Ms de dos grupos No paramtrico, medidas
repetidas Ms de dos grupos No paramtrico
medidas repetidas
Una sola variable predictora cuantitativa
Varias variable predictoras cuantitativa o cualitativas
Paramtrico
Paramtrico
No
paramtrico
Varias
variables
predictoras

C a pt u l o 8

p g in a 734

Tipos de test analticos estadsticos bivariantes de


contraste
de
hiptesis ms
frecuentes
Variable
Variable RESULTADO o Dependiente (Criterio de evaluacin)
PREDICTORA o
Independiente
(factor de estudio)

Cualitativa
nominal dos
categoras

Cualitativa dos
grupos
independientes

Chi cuadrado
Z comparacin de
proporciones
Test exacto
de Fisher
Test de McNemar

Cualitativa dos
grupos apareados

Cualitativa
nominal
>2
categoras
Chi cuadrado

Cualitativa
ordinal o
Cuantitativa NO
paramtrica
U de Mann-Whitney

Cuantitati
va
paramtric
a
T de Student
(prueba de Welch)

Q de Cochran

Prueba de
los rangos
de Wilcoxon

Prueba de
Kruskal- Wallis
Prueba de
Friedman

T de
Student
para datos
emparejado
s
Anlisis de la Varianza
(ANOVA)
Anlisis de la
Varianza de dos
vas
Regresin lineal
Correlacin de
Pearson

Cualitativa > 2 grupos


independientes
Cualitativa > 2 grupos
apareados

Chi cuadrado

Chi cuadrado

Q de Cochran

Q de Cochran

Cuantitativa

Regresin logstica

Regresin logstica Correlacin de


Sperman
Tau de Kendall

C a pt u l o 8

Cualitativa versus cuantitativa


Cules son las pruebas estadsticas que tenemos que
emplear?
Variable PRED IC TO RA
C UALITATIVA
dicotmica

Variable
RESULTAD O
C UAN TITATIVA

p g in a 735

C a pt u l o 8

C ualitativa dicotmica versus


cuantitativa
2 GRUPO S

Independient
es
Aparejad
os

PARAMTRIC O
S

NO
PARAMTRIC O S

T de Student para
mues- tras
independientes

U de Mann-W hitney

T de Student para
mues- tras apareadas

W ilcoxon

Variable predictora Cualitativa versus variable resultado


Cuantitativa.

p g in a 736

C a pt u l o 8

p g in a 737

Test de la T de Student para dos muestras


independientes
C ondiciones de aplicacin (1)
- n1 y n2 >= 30
- Normalidad (Requisitos necesarios)
- Comprobar que el mximo y el mnimo quedan dentro del intervalo
definido por 3 DE por encima y por debajo de la media (media 3 DE)
- Que la asimetra (en valor absoluto) sea menor que dos veces el error
estndar [asimetra] < 2 EE de asimetra
- Que la curtois (en valor absoluto) sea menor que 2 veces su EE [Curtois]
<
2 EE de curtois
Test de KolmogorovSmirnov Test de ShapiroWilks

C a pt u l o 8

Test de la T de Student para dos muestras


independientes
C ondiciones de aplicacin (2)
Homogeneidad de varianzas
(homoscedasticidad)
- Prueba F de Snedecor
- Test de Barttlet
Levene

F=

Ho: Las varianzas de ambos grupos son


iguales
Ha: Existen diferencias entre las varianzas
Fcalculada < Ftabulada
Fcalculada > Ftabulada
Ho)
nula)

Varianza
mayor
Varianza
menor
Test T de
Student
Test de
Welch

p>0,05 (aceptamos la
p<0,05 (rechazamos la hiptesis

p g in a 738

C a pt u l o 8

Pregunta de investigacin
El peso al nacer de los varones difiere del peso al
nacer de
las mujeres?
Variable PRED IC TO RA
C UALITATIVA
Sexo
dicotmica

Cul es la prueba estadstica ms


adecuada?

Variable RESULTAD O
C UAN TITATIVA
Peso (Kg)
continua

p g in a 739

C a pt u l o 8

Test de la T de Student:
Muestras independientes
Hiptesis nula Ho: El peso al nacer de los varones NO difiere del peso al
nacer de las mujeres
Hiptesis alternativa Ha: El peso al nacer de los varones difiere del peso
Peso al nacer del RN
al
Varones
Mujeres
nacer de las mujeres
Media
Desviacin estndar (S)
n

3380,3
417,3
833

3246,8
388,0
789

X1 X2

t calculada =

(n 1) S12 + (m 1) S2 2
(n + m 2)

n
m

tcalculada= 6,666

p g in a 740

C a pt u l o 8

Test de la T de Student para muestras


independientes
Grados dePeso
libertad
(g.l) = n + m - 2Varonesgl = 883Mujeres
+ 789 - 2 = 1620
del RN
n

883

789

Media

3380,34

3246,79

Desviacin estndar

417,28

388,0

EEM

14,46

13,81

t calculada

6,666

Grados de libertad

1620

Significacin (bilateral)

0,000

t calculada= 6,666 > t tabulado = 1,96;

p < 0,001

Ha: El peso al nacer de los varones difiere del peso al nacer de las mujeres

p g in a 741

C a pt u l o 8

D istribucin de la t de
Student
Grados de libertad
1

=n-

valores " t " : t ( x


s
)

n
1

p g in a 742

C a pt u l o 8

D istribucin de la t de Student (gl 30)


El test de la T de Student para muestras de ms de 30 individuos
presenta
una distribucin muy similar a la distribucin normal tipificada Z.
El test de la T de Student es una prueba BILATERAL, y por tanto NO
especifica la direccin de la diferencia ( A B).
Nivel de significacin
estadstica = 0,05

t calculada = 6,666

Z 1- /2

Z 1- /2

- 1,96

1,96

t tabulado = 1,96 para los grados de libertad de la muestra (1620)

p g in a 743

C a pt u l o 8

Interpretacin del valor de la t de Student


(t=6,666)
-La diferencia observada (t calculada= 6,666) es muy grande en relacin a la
variabilidad aleatoria esperada (t tabulada) , y por tanto existen diferencias
significativas (p<0,001)
-El efecto observado (diferencia entre el peso de los dos sexos) es
muy superior a la variabilidad biolgica esperada.
-El efecto observado (diferencia entre el peso de los dos sexos)
es importante, es decir mucho mayor de lo esperado por el azar.
- El valor de la t tabulada para un error alfa del 5% es muy inferior al
encontrado
t tabulado < t calculada

- El valor de la p (p < 0,001) indica que existe una probabilidad


muy baja
(<0,1%) de observar al menos estas diferencias en los pesos por efecto
del AZAR y no porque los varones tengan distinto peso que las mujeres.

p g in a 744

C a pt u l o 8

Pregunta de investigacin
Tiene influencia el tipo de dieta (pescado/huevos)
seguida
en el peso del individuo?
Variable PRED IC TO RA
C UALITATIVA
Tipo de dieta
dicotmica

Variable RESULTAD O
C UAN TITATIVA
Peso (Kg)
continua

p g in a 745

C a pt u l o 8

p g in a 746

Test de la T de
Student:
Muestras
Hiptesis nula Ho
independientes
Hiptesis
alternativa

(ambas dietas tienen igual efecto)


(las dietas tienen distinto
efecto)

H1
Cualitativa discreta y dicotmica: TIPO DE DIETA (pescado o huevos)
Variable
Variable
RESULTADO
PREDICTORA
Cuantitativa continua: Kg adelgazados durante los 3 meses que dur la
dieta
Variable
Personas que siguen la
Variacin en el peso (kg)
PRED IC TO RA
dieta P a base de
Cualitativa discreta y
pescado n=19
dicotmica:
Personas que siguen la
Variacin en el peso (kg)
TIPO D E D IETA
dieta H a base de huevo
n=10
3 meses
Martnez Gonzlez MA, Jokin de Irala Estvez, Faulin Fajardo FJ. Bioestadstica amigable. Madrid:
Ediciones Daz de Santos; 2001.

C a pt u l o 8

Personas que siguen la dieta


P a base de pescado n=19

Personas que siguen la dieta


H a base de huevo n=10

ID

DIETA

REDUCCION
REDUCCION PESO
PESO(Kg)
(Kg)

ID

DIETA

REDUCCION PESO
(Kg)

PESCADO
PESCADO

19

20

HUEVOS

23

21

HUEVOS

23

22

HUEVOS

PESCADO
PESCADO

28

PESCADO
PESCADO

17

23

HUEVOS

14

PESCADO
PESCADO

15

24

HUEVOS

22

PESCADO
PESCADO

16

25

HUEVOS

20

26

HUEVOS

27

HUEVOS

12

PESCADO
PESCADO

21

PESCADO
PESCADO

27

28

HUEVOS

18

PESCADO
PESCADO

18

29

HUEVOS

33

PESCADO
PESCADO

15

30

HUEVOS

10

PESCADO
PESCADO

10

11

PESCADO
PESCADO

10

12

PESCADO
PESCADO

13

PESCADO
PESCADO

12

14

PESCADO
PESCADO

13

15

PESCADO
PESCADO

19

16

PESCADO
PESCADO

17

PESCADO
PESCADO

29

18

PESCADO
PESCADO

35

19

PESCADO
PESCADO

38

Media

18,579

Desviacin estndar

9,26

Varianza

85,8

Variable
RESULTADO
Cuantitativa continua

19

Media

17,545

Desviacin estndar

8,43

Varianza

71,1

Variable
RESULTADO
Cuantitativa continua

X1 X2

t calculada =

t calculada = 0,3

(n 1) S12 + (m 1) S2 2
(n + m 2)

t calculada= 0,3 < t tabulado

1
n

1
m

p = 0,76

p g in a 747

C a pt u l o 8

Test de la T de Student:
Muestras independientes
Test de la t de
Student
t

calculada < t

calculada > t

tabulada p >

tabulada p <

0,05

0,05

Hiptesis nula H 0

Hiptesis alternativa H a

Las medias de la reduccin


del peso en los dos grupos
comparados es independiente de
la intervencin diettica

Las medias de la reduccin


del peso en los dos grupos
comparados son diferentes
entre s, es decir NO pueden
considerarse iguales

t calculada = 0,3 < t tabulado

p = 0,76

Tienen el mismo efecto las dietas ensayadas para reducir el peso


corporal? S

p g in a 748

C a pt u l o 8

p g in a 749

Interpretacin del valor de la t de Student


(t=0,30)
-La diferencia observada (t calculada= 0,3) es pequea en relacin a la
variabilidad aleatoria esperada (t tabulada) , y por tanto no existen
diferencias significativas (p>0,05)
-El efecto observado (diferencia entre las dos dietas) es slo del 30% de
la variabilidad biolgica esperada.
- El efecto observado (diferencia entra las dos dietas) es insignificante, es
decir mucho menor de lo esperado por el azar.
- El valor de la t tabulada para un error alfa del 5% es superior al encontrado
t tabulado > t calculada

- El valor de la p (p = 0,76) indica que existe una probabilidad muy alta


(76%)
de observar al menos estas diferencias en la reduccin del peso si la
muestra procediese de una poblacin donde las dos dietas tienen el mismo
efecto (las diferencias observadas son producidas por el AZAR y no porque
las dietas tengan distinto efecto).

C a pt u l o 8

p g in a 750

Test de la T de Student para dos muestras


independientes
C ondiciones de aplicacin (1)
- n1 y n2 >= 30
- Normalidad (Requisitos necesarios)
- Comprobar que el mximo y el mnimo quedan dentro del intervalo
definido por 3 DE por encima y por debajo de la media (media 3 DE)
- Que la asimetra (en valor absoluto) sea menor que dos veces el error
estndar [asimetra] < 2 EE de asimetra
- Que la curtois (en valor absoluto) sea menor que 2 veces su EE [Curtois]
<
2 EE de curtois
Test de KolmogorovSmirnov Test de ShapiroWilks

C a pt u l o 8

Test de la T de Student para dos muestras


independientes
C ondiciones de aplicacin (2)
Homogeneidad de varianzas
(homoscedasticidad)
- Prueba F de Snedecor
- Test de Barttlet
Levene

F=

Ho: Las varianzas de ambos grupos son


iguales
Ha: Existen diferencias entre las varianzas
Fcalculada < Ftabulada
Fcalculada > Ftabulada
Ho)
nula)

Varianza
mayor
Varianza
menor
Test T de
Student
Test de
Welch

p>0,05 (aceptamos la
p<0,05 (rechazamos la hiptesis

p g in a 751

C a pt u l o 8

p g in a 752

Mito 1: La sonrisa de la esfinge


La t de Student es un test paramtrico, es decir para usarlo se debe
cumplir la normalidad de la variable cuantitativa. Se cumple?Como lo
has comprobado?
He observado que en los dos grupos de estudio comparados slo tienen
19 y
11 sujetos respectivamente. Ante tan bajo volumen muestral (n < 30),
Cmo justificas esa supuesta normalidad?Que test has empleado para
comprobar esa normalidad de la reduccin del peso? Ests seguro que se
cumplen los criterios para poder usar la t de Student ? Se cumplen todos
los requisitos para su utilizacin?

C a pt u l o 8

p g in a 753

Realidad 1: Respuesta de
Edipo

Reduccin del peso

Reduccin del peso

Tipo de dieta

Test de Kolmogorov-Smirnov
Estadstico
g.l

Significacin

Pescado
Huevos

0,166
0,168

0,178
0,200

Tipo de dieta

Test de Shapiro-Wilk
Estadstico
g.l

Significacin

Pescado
Huevos

0,956
0,950

0,493
0,615

H : p > 0,05 test paramtricos


o

19
11

19
11

H : p < 0,05 test NO paramtricos


a

Los test de normalidad ensayados dan un valor de p NO significativo (p >0,05) en


ambos grupos (tipos de dieta). Por tanto no hay evidencias suficientes para rechazar la
hiptesis nula de normalidad de la variable reduccin del peso en ambas muestras.

C a pt u l o 8

p g in a 754

C a pt u l o 8

p g in a 755

C a pt u l o 8

+
IC95%

+
IC95%

Media Kg pescado
Media Kg
huevos
- IC95%
- IC95%

p g in a 756

C a pt u l o 8

Pregunta de investigacin
Existen diferencias en los valores del VC M en sangre
en funcin de los depsitos de hierro normales o
ferropnicos en mdula sea?
Variable PRED IC TO RA
C UALITATIVA
D epsitos de Fe en mdula sea
dicotmica
N ormal =1
D ficit = 0

Cul es el test estadstico ms


acertado?

Variable RESULTAD O
C UAN TITATIVA
VC M
continua
(hemograma)

p g in a 757

C a pt u l o 8

p g in a 758

C a pt u l o 8

p g in a 759

C a pt u l o 8

Test de la T de Student para muestras


independientes
Grados de libertad (g.l) = n + m 2VCM
Medula normal

gl = 67 + 33 - 2 = 98
Dficit de hierro

67

33

Media

83,56

76,89

Desviacin estndar

8,588

9,323

EEM
t

1,049

1,623
3,560

calculada

Grados de libertad
Significacin (bilateral)

98
0,001

t calculada = 3,560 > t tabulado = 1,96;


p <
0,001
Ha: El VCM es depende de los depsitos medulares de
hierro.

p g in a 760

C a pt u l o 8

Pregunta de investigacin
Existen diferencias en los valores de la ferritina en
sangre en funcin de los depsitos de hierro normales
o ferropnicos en mdula sea?
Variable PRED IC TO RA
C UALITATIVA
D epsitos de Fe en mdula sea
dicotmica
N ormal =1
D ficit = 0

Cul es el test estadstico ms


acertado?

Variable RESULTAD O
C UAN TITATIVA
FERRITIN A srica
continua

p g in a 761

C a pt u l o 8

p g in a 762

C a pt u l o 8

Test de W elch para desigualdad de


varianzas
FERRITINA srica

Mdula normal

Dficit de hierro

67

33

Media

21,76

12,61

Desviacin estndar

9,165

5,528

EEM
T

1,120

0,962
6,201

calculada

Grados de libertad
Significacin (bilateral)

93,876
0,000

t calculada = 3,560 > t tabulado = 1,96;


p <
0,001
Ha: El ferritina srica depende de los depsitos medulares de
hierro.

p g in a 763

C a pt u l o 8

p g in a 764

Pregunta de investigacin
Qu relacin existe entre el grupo cultural/religioso y los
niveles
de anticuerpos frente al virus de la Rubeola en la poblacin
gestante
Variable
Variable
inmunizada
de
Ceuta
en
el
ao
1994? O
PRED IC TO RA
RESULTAD
C ristianas
Cualitativa
inmunizadas
dicotmica
Musulmanas
inmunizadas

Cul es el test estadstico ms


adecuado?

Virus de la Rubeola
Cuantitativa
continua

C a pt u l o 8

p g in a 765

Test de t de Student para muestras


independientes
P < 0,001

Figura 1.- Ttulos de anticuerpos frente al virus de la Rubeola en gestantes inmunizadas de Ceuta en 1994.
Distribucin por grupos culturales.

C a pt u l o 8

p g in a 766

Pregunta de investigacin
Qu relacin existe entre el grupo cultural/religioso y los
niveles
de anticuerpos frente al virus de la Rubeola en la poblacin
gestante
Variable
Variable
inmunizada
de
Ceuta
en
el
ao
2010? O
PRED IC TO RA
RESULTAD
C ristianas
Cualitativa
inmunizadas
dicotmica
Musulmanas
inmunizadas

Cul es el test estadstico ms


adecuado?

Virus de la Rubeola
Cuantitativa
continua

C a pt u l o 8

Test de la T de Student para muestras


independientes
Grados de libertad (g.l) = n + m 2

gl = 234 + 487 - 2 =
719

IgG-anti-RUBEOLA

Cristianas

Musulmanas

234

487

Media

133,20

94,90

Desviacin estndar

197,26

100,69

EEM

12,89

4,56

t calculada
Grados de libertad
Significacin (bilateral)

3,452
719
0,001

t calculada = 3,452 > tabulado = 1,96;


p <
t
0,001
Ha: Los niveles de IgG anti-Rubeola depende del grupo cultural, siendo distintos
en
cristianas
y
musulmanas.

p g in a 767

C a pt u l o 8

Test de t de Student
independientes
(varianzas desiguales)

p g in a 768

para muestras
p = 0,006

Ttulos de anticuerpos IgG antiRUBEOLA (UI/ml)

133,2

94,9

Figura 2.- Ttulos de anticuerpos frente al virus de la Rubeola en gestantes inmunizadas de Ceuta en 2010.
Distribucin por grupos culturales.

C a pt u l o 8

Mito 1: La sonrisa de la
esfinge
Para poder usar la t de Student para muestras independientes es
necesario, entre otras condiciones, la homogeneidad de las
varianzas (homocedasticidad) de la variable cuantitativa.
La variable cuantitativa niveles de anticuerpos IgG antiRUBEOLA (UI/ml) en la poblacin gestante inmunizada de Ceuta
cumple la homocedasticidad?
Que test has empleado para comprobar que se cumple la
homogeneidad de las varianzas?

p g in a 769

C a pt u l o 8

Test de Levene para


homocedasticidad
Test de Levene para la igualdad de varianzas

IgG-anti-RUBEOLA

14,498

Significacin

0,000

Ho: Las varianzas de ambos grupos son


H
iguales.
a: Existen diferencias entre las
varianzas.
F
calculada
tabulada

Test de
Welch

>F

p < 0,05 (rechazamos la hiptesis


nula)

p g in a 770

C a pt u l o 8

Test de W elch para desigualdad de


varianzas

IgG-anti-RUBEOLA

Cristianas

Musulmanas

234

487

Media

133,20

94,90

Desviacin estndar

197,26

100,69

EEM

12,89

4,56

T calculada

2,800

Grados de libertad

292,8

Significacin (bilateral)

0,005

tcalculada = 2,800 > ttabulado =


p < 0,01
1,96;
Ha: Los niveles de IgG anti-Rubeola depende del grupo cultural, siendo distintos
en
cristianas y
musulmanas.

p g in a 771

C a pt u l o 8

p g in a 772

Pregunta de investigacin
Qu relacin existe entre el grupo cultural/religioso y los
niveles de anticuerpos frente a Toxoplasma en la poblacin
gestante inmunizada de Ceuta en el ao 1994?
Variable
PRED IC TO RA
C ristianas
Cualitativa
inmunizadas
dicotmica
Musulmanas
inmunizadas

Cul es el test estadstico ms


adecuado?

Variable
RESULTAD O
Virus de la Rubeola
Cuantitativa
continua

C a pt u l o 8

Test de t de Student
independientes

p > 0,1
32,8

Ttulos de IgG anti-toxoplasma


(UI/ml)

35,5

para muestras

Figura 1.- Ttulos de anticuerpos frente a Toxoplasma en gestantes inmunizadas de Ceuta en 1994.
Distribucin por grupos culturales.

p g in a 773

C a pt u l o 8

p g in a 774

Pregunta de investigacin
Qu relacin existe entre el grupo cultural/religioso y los
niveles de anticuerpos frente a Toxoplasma en la poblacin
gestante inmunizada de Ceuta en el ao 2010?
Variable
PRED IC TO RA
C ristianas
Cualitativa
inmunizadas
dicotmica
Musulmanas
inmunizadas

Cul es el test estadstico ms


adecuado?

Variable
RESULTAD O
Toxoplasma
Cuantitativa
continua

C a pt u l o 8

Test de t de Student
independientes

para muestras
78,6

67,9

p > 0,1

Figura 2.- Ttulos de anticuerpos frente a Toxoplasma en gestantes inmunizadas de Ceuta en 2010.
Distribucin por grupos culturales.

p g in a 775

C a pt u l o 8

Mito 1: La sonrisa de la
esfinge
La t de Student para muestras independientes es un test paramtrico, es
decir para usarlo se debe cumplir la normalidad de la variable
cuantitativa.
La variable cuantitativa niveles de anticuerpos (UI/ml) en la
poblacin gestante inmunizada de Ceuta sigue una distribucin
normal?
No encuentro datos estadsticos de dispersin (desviacin tpica)
Cmo justificas esa supuesta normalidad? Qu test has empleado
para
comprobar que se cumple la normalidad (campana de Gauss)?

p g in a 776

C a pt u l o 8

Test de normalidad

Test de Kolmogorov-Smirnov

Ao 2010

Media

DE

Estadstico Z

Significacin

Niveles de anticuerpos IgG


anti-RUBEOLA

721

107,3

140,6

6,870

0,000

Test de normalidad
Ao 2010
Tipo de cultura
Niveles de
Cristianas
anticuerpos
IgG antiRUBEOLA
Musulmanas

Test de Kolmogorov-Smirnov
N
Media DE
234
133,2
197,3

Estadstico Z
4,211

Significacin
0,000

487

4,723

0,000

H : p > 0,05 test paramtricos


o

94,9

100,7

H : p < 0,05 test NO paramtricos


a

Los test de normalidad ensayados dan un valor de p significativo (p <0,05) en ambos


grupos culturales. Por tanto hay evidencias suficientes para rechazar la hiptesis nula
de normalidad de la variable reduccin del peso en ambas muestras. NO PODEMOS
USAR TEST PARAMTRICOS.

p g in a 777

C a pt u l o 8

Test de normalidad

Test de Kolmogorov-Smirnov

Ao 2010

Media

DE

Estadstico Z

Significacin

Niveles de anticuerpos IgG


anti-RUBEOLA

297

77,5

133,6

5,321

0,000

Test de normalidad
Ao 2010
Tipo de cultura
Niveles de
Cristianas
anticuerpos
IgG antiRUBEOLA
Musulmanas

Test de Kolmogorov-Smirnov
N
Media DE
32
67,9
58,6

Estadstico Z
1,260

Significacin
0,084

265

5,110

0,000

H : p > 0,05 test paramtricos


o

78,62

139,9

H : p < 0,05 test NO paramtricos


a

Los test de normalidad ensayados dan un valor de p significativo (p <0,05) en ambos


grupos culturales. Por tanto hay evidencias suficientes para rechazar la hiptesis nula
de normalidad de la variable reduccin del peso en ambas muestras. NO PODEMOS
USAR TEST PARAMTRICOS.

p g in a 778

C a pt u l o 8

C ualitativa dicotmica versus


cuantitativa
2 GRUPO S

Independient
es
Aparejad
os

PARAMTRIC O
S

NO
PARAMTRIC O S

T de Student para
mues- tras
independientes

U de Mann-W hitney

T de Student para
mues- tras apareadas

W ilcoxon

Variable predictora Cualitativa versus variable resultado


Cuantitativa.

p g in a 779

C a pt u l o 8

p g in a 780

Pregunta de investigacin
Existen diferencias de la tensin arterial sistlica (TAS) de
los 20 alumnos del curso de Metodologa de investigacin
en funcin del sexo?
Variable
PRED IC TO RA
Sexo
Cualitativa
dicotmica

Cul es el test estadstico ms


adecuado?

Variable
RESULTAD O
TAS
Cuantitativa

C a pt u l o 8

Test de la U de MannW hitney

Condiciones de aplicacin:
-Si alguna de las dos muestras contiene menos de 30 observaciones y No se puede
asumir la normalidad.
- Variable medida en escala ORDINAL.
-Si la muestra es de muy pequeo tamao (<10 observaciones en alguno de los dos
grupos).
Inconvenientes:
-Se pierde potencia para detectar diferencias significativas (para una comparacin
que resulte significativa con 95 individuos en la t de Student, se necesitaran 100
individuos para que la misma comparacin resulte significativa con el test de MannWhitney).
- No permite construir intervalos de confianza.

p g in a 781

C a pt u l o 8

Alumnos
1
2
3
4
5
6
7
8
9
10
10

TAS
Alumnos
110
120
100
115
110
100
120
125
125
125
Total

Rango 1
(R1)
9,5
16
5
13,5
9,5
5
16
18,5
18,5
20

Orden

Alumnas

7
15
4
13
8
5
16
18
19
20

1
2
3
4
5
6
7
8
9
10
10

TAS
Alumnas
90
95
110
110
120
115
110
100
95
100

Hiptesis nula Ho : La TAS es igual en alumnos y en


alumnas.
Hiptesis alternativa Ha : La TAS es diferente en alumnos y en
alumnas.

Rango 2
(R2)
1
2,5
9,5
9,5
16
13,5
9,5
5
2,5
9,5
78,5

Orden
1
2
9
10
17
14
11
6
3
12

p g in a 782

C a pt u l o 8

U de MannW hitney

rea de
rechazo

Ha

Area de NO
rechazo

Hiptesis nula

rea de
rechazo

Ha

Los valores de estadstico U y W calculados por el test se comparan con los tabulados para un contraste
bilateral con un error alfa 0,05.

p g in a 783

C a pt u l o 8

U de MannW hitney
TAS

SEXO

Mean Rank

Sum of Ranks

Alumna
Alumno
Total

10
10
20

7,85
13,15

78,50
131,50

Test estadsticos

TAS

Mann-Whitney U

23,50

Wilcoxon W

78,50

Zu

- 2,030

Significacin a dos colas

0,041

Significacin exacta a una cola

0,043

Sum of ranks
Mean rank
Zu

U-R

El ranking promedio de la TAS en mujeres es 7,85 y en los hombres 13,15, es decir


existen
diferencias entre alumnos y alumnas, y por tanto como p < 0,05 se rechaza la o
H.
Conclusin: La TAS es diferente en alumnos y en alumnas, siendo mayor en
varones.

p g in a 784

C a pt u l o 8

p g in a 785

Ejemplo para muestras


pequeas
-Un profesor de bioestadstica utiliza dos tipos de modelos de cursos para
ensear la misma materia a un grupo de 10 alumnos mdicos con un nivel
previo similar de conocimientos en bioestadstica. El experimentador quiere
demostrar que el procedimiento clsico de asistencia a clase
(PRESENCIAL) es ms efectivo que el curso online (a DISTANCIA) que le
propone la direccin que presupone que es ms eficiente; para ello, mide el
nivel de conocimientos adquiridos por los alumnos en bioestadstica en
ambos modelos de curso mediante el mismo examen de conocimientos
realizado al final de cada tipo de curso.
-El plan experimental preliminar consiste en elegir al azar tanto una
muestra total de 10 mdicos, 5 para cada mtodo.

C a pt u l o 8

Planteamiento de la
hiptesis
- Hiptesis nula (Ho ). Las diferencias observadas entre las calificaciones
del
examen de conocimientos mediante los dos tipos de cursos se deben al
azar.
- Hiptesis alternativa (Ha ). Las calificaciones del examen de
conocimientos,
segn el mtodo de enseanza PRESENCIAL son ms altas y diferentes
que
las observadas en el mtodo A DISTANCIA.
Cul es la prueba estadstica ms
adecuada?

p g in a 786

C a pt u l o 8

Tipo de Curso

Calificaciones de los alumnos

N del alumno

A DISTANCIA

80

85

25

70

90

Tipo de Curso

Calificaciones de los alumnos

N del alumno

10

PRESENCIAL

95

100

93

110

45

- Nivel de significacin: Para todo valor de probabilidad igual o menor que p = 0,05,
se
acepta Ha y se rechaza Ho.
- Zona de rechazo: Para todo valor de probabilidad mayor que 0,05, se acepta Ho y
se
rechaza Ha.
- Dos cursos diferentes aplicados en dos grupos de alumnos
mdicos.

p g in a 787

C a pt u l o 8

Test de la U de Mann-W hitney


(paso 1)

- Aplicacin de la prueba estadstica.


De acuerdo con los pasos, las observaciones se deben ordenar en rangos
del menor al mayor.
- Rangos de lectura de la tabla anterior.

Tipo de Curso

Calificaciones de los alumnos

R (S)

A distancia Grupo 1

80 (4)

85 (5)

25 (1)

70 (3)

90 (6)

19

Presencial Grupo 2

95 (8)

100 (9)

93 (7)

110 (10)

45 (2)

36

p g in a 788

C a pt u l o 8

Test de la U de Mann-W hitney


(paso 2)
Calculamos las U de Mann-Whitney (U1 y U2 ) con las siguientes
frmulas:

p g in a 789

C a pt u l o 8

Test de la U de Mann-W hitney


(paso 2)
Calculamos las U de Mann-Whitney (U1 y
U)

p g in a 790

C a pt u l o 8

Test de la U de Mann-W hitney


(paso 3)
-De los dos valores de U calculados (U y U ), se elige el valor ms pequeo (U
1
2
2

= 4) y se comparan con los valores tabulados crticos de la U Mann-Whitney


-En caso de que el valor de U calculado no se localice en las tablas
correspondientes, se obtendr de la frmula siguiente;
- En esta frmula, U corresponde al valor ms alto (U1 = 21) . El resultado
U
= [ n * n ] - U
U
= [ 5 * 5 ] 21 = 4
en
ambos
calculadocasos es
1 el mismo
2
calculado
(4).

p g in a 791

C a pt u l o 8

Tamao
muestral

Ucalculado =

p = 0,048

p g in a 792

C a pt u l o 8

D ecisi
n
A la probabilidad del valor U de Mann-Whitney, calculado anteriormente calculado),
(U
corresponde a un valor de la p de 0,048, el cual es ms pequeo que el nivel
de
significancia (0,05); por lo tanto, se acepta Ha y se rechaza o
H.

p g in a 793

C a pt u l o 8

Interpretaci
n
Entre las calificaciones del examen de conocimientos adquiridos mediante las
dos modalidades del curso de enseanza de la bioestadstica, existe una
diferencia significativa con un nivel de probabilidad de error alfa menor del 5%
(p<0,05); es decir, aun cuando las muestras de ambos grupos son pequeas, las
calificaciones ms altas mediante el curso clsico PRESENCIAL sealan ms
efectividad, con la probabilidad de equivocarse de 0,048 para aceptarlo por la
influencia del AZAR (4,8%).

p g in a 794

C a pt u l o 8

p g in a 795

Ejemplo aplicable cuando la muestra es mayor de 25 y


donde ny n pueden ser iguales o de un tamao
diferente:
1

El Profesor del curso de Bioestadstica aplicada para mdicos, entusiasmado


por las observaciones y conclusiones preliminares, decide repetir el
experimento
aumentando el tamao muestral en ambos grupos. Disea un nuevo estudio con
10 alumnos mdicos que realizan el curso con el mtodo a DISTANCIA y 25
mdicos mediante el procedimiento clsico PRESENCIAL. Los nuevos datos del
estudio se muestran en la tabla siguiente.

p g in a 796

C a pt u l o 8

Planteamiento de la
hiptesis
- Hiptesis nula (Ho ). Las posibles diferencias entre las calificaciones dadas
por
los alumnos en ambos tipos de cursos se deben al
azar.
- Hiptesis alternativa (Ha ). Las calificaciones de los alumnos inscritos en el
curso
realizado por el mtodo clsico PRESENCIAL, propuesto por el
experimentador,
son diferentes y con valores ms altos.
- Nivel de significacin: Para todo valor de probabilidad igual o menor que
0,05,
se acepta H y se rechaza H .
a
o
- Zona de rechazo: Para todo valor de probabilidad mayor que 0,05, se acepta
H
y se rechaza Ha.

p g in a 797

C a pt u l o 8

Poblacin de alumnos mdicos a los cuales se les


aplic dos tipos de cursos (mtodo presencial,
mtodo a distancia)
PRESENCI
PRESENCI
AL

Notas
Notas

55

70

90

110

45

60

60

Curso PRESENCIAL N=25


8

10

11

12

13

14

15

16
16

17
17

18

19

20
20

21
21

22
22

23
23

24
24

25

75

80

95

100

110

95

60

70

80
80

40
40

65

50

75
75

90
90

90
90

100
100

80
80

100
100

Curso a DISTANCIA (online) N=10


DISTANCIA N=10

10

Notas

60

80

25

30

40

60

90

100

60

55

Cul es la prueba estadstica ms


adecuada?

C a pt u l o 8

Test de la U de Mann-W hitney


(paso 1)
-Aplicacin de la prueba estadstica. Primero ordenamos los rangos de todas las
observaciones.
- Direccin de las ligas o empates y el tamao de estas.

p g in a 798

C a pt u l o 8

p g in a 799

C a pt u l o 8

Test de la U de Mann-W hitney


(paso 2)
Calculamos las U de Mann-Whitney (U1 y
U)

p g in a 800

C a pt u l o 8

Test de la U de Mann-W hitney


(paso 3)
Teniendo en cuenta los pasos del test, hay que saber que cuando el
tamao muestral total es mayor de 25 (como ocurre en este caso), el
estadstico del test de Mann-Whitney se distribuye normalmente, por tanto
se calcula el estadstico Z, que se compara con el tabulado para conocer la
probabilidad (p). Esto se calcula como sigue:

_
Z= U
U -- U
U

Z=

p g in a 801

C a pt u l o 8

Test de la U de Mann-W hitney


(paso 3a)
Donde:
Z = valor estadstico de la curva
normal.
U = cualquier valor de U calculado (ya sea U1 o
). valor promedio de U.
U=
U = desviacin estndar de U.
Calculamos el valor promedio de
U:

_
U=

n1 * n2

_
U=

10 * 25
2

= 125

p g in a 802

C a pt u l o 8

Test de la U de Mann-W hitney (paso


3b)
- La desviacin estndar de U (U ) se determina de la forma
siguiente:
- Donde:
U
estndar de U.
n1 y=ndesviacin
2= tamao de la muestra de los grupos 1 y
2. = tamao total de la muestra (la suma de n1 y
N
n2).
Li = sumatoria de las ligas o empates.
El clculo de Li se realiza de la siguiente
manera:
Li =
=

p g in a 803

C a pt u l o 8

Z = U- U

U=

Li =

U =

n1 * n2
2

p g in a 804

C a pt u l o 8

Test de la U de Mann-W hitney


(paso 3c)
- Una vez obtenida la sumatoria de Li, se determinar la desviacin estndar de
U
(U ) mediante la expresin siguiente:

U =

UU =

U = 27,24

p g in a 805

C a pt u l o 8

Test de la U de Mann-W hitney (paso


3d)
- Una vez calculados todos los parmetros necesarios, se obtiene el valor
Z
conforme la frmula anterior:

Z = U- U

Z=
Z

Z=

178 - 125

= 1,95
=

27,24
72

- 125

27,24

U = cualquier valor de U calculado (ya sea U1 o


U ).

= - 1,95

p g in a 806

C a pt u l o 8

Test de la U de Mann-W hitney


(paso 4)
- Para obtener la probabilidad (valor de la p) del valor Zcalculado de 1.95 (1,9
+
0,05),
se debe consultar la tabla de tamao de la muestra en funcin de los
valores d y buscar la hilera 1.9, en cuya columna correspondiente al error alfa
de 0,05 se localiza el nmero 0,9788, cuyo complementario (1 - 0,9744 =
0,0256) corresponde a la probabilidad del valor de U con respecto al promedio
(p = 0,0256). Esto quiere decir que es menor que el nivel de significancia
(p<0,05).

p g in a 807

C a pt u l o 8

p = [ 1 - 0,9744 ] = 0,0256

p g in a 808

C a pt u l o 8

D ecisi
n
A la cifra de Z de 1,95 le corresponde una probabilidad menor que 0,05 (p =
0,0256), por lo cual se acepta Ha y se rechaza Ho (tabla de probabilidades
asociadas en valores extremos como los de 2 en la distribucin normal).

p g in a 809

C a pt u l o 8

p g in a 810

Interpretaci
n
El experimentador (profesor de bioestadstica de los cursos), al aumentar el
tamao
muestral en ambos grupos (n1 =10, y n2 =25, N=35), CONFIRMA la
investigacin
preliminar con una muestra pequea (n1 =5, y n2 =5, N=10), con lo cual da
a
entender que los resultados (calificaciones de los alumnos) logrados con el mtodo
PRESENCIAL son diferentes de los obtenidos con el mtodo de enseanza A
DISTANCIA; adems, este ltimo revela calificaciones ms bajas y permitira
concluir que es menos efectivo que el otro.

C a pt u l o 8

p g in a 811

Pregunta de investigacin
Qu relacin existe entre el grupo cultural/religioso y los
niveles
de anticuerpos frente al virus de la Rubeola en la poblacin
gestante
Variable
Variable
inmunizada
de
Ceuta
en
el
ao
2010? O
PRED IC TO RA
RESULTAD
C ristianas
Cualitativa
inmunizadas
dicotmica
Musulmanas
inmunizadas

Cul es el test estadstico ms


adecuado?

Virus de la Rubeola
Cuantitativa
continua

C a pt u l o 8

Anti-IgGRUBEOLA

SEXO

Mean Rank

Sum of Ranks

Cristianas
Musulmanas
Total

234
487
721

392,46
345,88

91836,0
168445,0

Test estadsticos

IgG-Rubeola

Mann-Whitney U

49573,00

Wilcoxon W

168401,0

Zu

- 2,828

Significacin a dos colas (bilateral)

0,005

Significacin exacta a una cola

0,043

Sum of ranks
Mean rank
Zu

U-R

El ranking promedio de los niveles de Anti-IgG-RUBEOLA en gestantes inmunizadas


cristianas superior al de las musulmanas, es decir existen diferencias significativas
entre
ambos grupos culturales, y por tanto como p < 0,05 se rechaza la o
H.
Conclusin: El grado de inmunizacin frente a la rubeola es diferente en cristianas
y musulmanas, siendo mayor en las primeras.

p g in a 812

C a pt u l o 8

p g in a 813

Pregunta de investigacin
Qu relacin existe entre el grupo cultural/religioso y los
niveles de anticuerpos frente a Toxoplasma en la poblacin
gestante inmunizada de Ceuta en el ao 2010?
Variable
PRED IC TO RA
C ristianas
Cualitativa
inmunizadas
dicotmica
Musulmanas
inmunizadas

Cul es el test estadstico ms


adecuado?

Variable
RESULTAD O
Toxoplasma
Cuantitativa
continua

C a pt u l o 8

Test de normalidad

Test de Kolmogorov-Smirnov

Ao 2010

Media

DE

Estadstico Z

Significacin

Niveles de anticuerpos IgG


anti-toxoplasma

297

77,5

133,6

5,321

0,000

Test de normalidad
Ao 2010
Tipo de cultura
Niveles de
Cristianas
anticuerpos
IgG antitoxoplasma
Musulmanas

Test de Kolmogorov-Smirnov
N
Media DE
32
67,9
58,6

Estadstico Z
1,260

Significacin
0,084

265

5,110

0,000

78,62

139,9

Ho: p > 0,05 test


Ha: p < 0,05 test NO
paramtricos
paramtricos
Los test de normalidad ensayados dan un valor de p significativo (p <0,05) en ambos
grupos culturales. Por tanto hay evidencias suficientes para rechazar la hiptesis nula
de normalidad de la variable reduccin del peso en ambas muestras. NO PODEMOS
USAR TEST PARAMTRICOS.

p g in a 814

C a pt u l o 8

Anti-IgGtoxoplasma

SEXO

Mean Rank

Sum of Ranks

Cristianas
Musulmanas
Total

32
265
297

162,11
147,42

5187,50
39065,50

Test estadsticos

IgG-toxoplasma

Mann-Whitney U

3820,50

Wilcoxon W

39065,50

Zu

- 0,914

Significacin a dos colas (bilateral)

0,361

Sum of ranks
Mean rank
Zu

U-R

El ranking promedio de los niveles de Anti-IgG-toxoplasma en gestantes inmunizadas


cristianas similar al de las musulmanas, es decir NO existen diferencias significativas
entre ambos grupos culturales, y por tanto como p > 0,05 se acepta la Ho (igualdad).
Conclusin: El grado de inmunizacin (nivel de anticuerpos especficos) frente a
Toxoplasma es igual cristianas y musulmanas.

p g in a 815

C a pt u l o 8

C ualitativa dicotmica versus


cuantitativa
2 GRUPO S

Independient
es
Aparejad
os

PARAMTRIC O
S

NO
PARAMTRIC O S

T de Student para
mues- tras
independientes

U de Mann-W hitney

T de Student para
datos apareados

W ilcoxon

Variable predictora Cualitativa versus variable resultado


Cuantitativa.

p g in a 816

C a pt u l o 8

Variables cuantitativas:
C omparacin de la media entre dos
grupos
Muestras relacionadas
Muestras independientes
Tipos de
Peso
Tipos
de dieta
dieta
Peso (Kg)
(Kg)
Pescado
23
Pescado
23
Pescado
19
Pescado
19
Pescado
28
28
Pescado
23
Pescado
Pescado
Pescado
Pescado
Pescado
Pescado
Pescado
.
Pescado

5
23
17
5
14
17
13
14
13

.
Huevos
Huevos
Huevos
Huevos
Huevos
Huevos
Huevos
Huevos
Huevos
Huevos
Huevos
Huevos
Huevos
Huevos
Huevos
Huevos
.
Huevos

21
21
22
22
26
26
25
25
2
2
28

Peso
Peso final
final (Kg)
(Kg)
Peso inicial
inicial Peso
23
21
23
21
19
22
19
22
28
26
26
28
23
25
25
23
5
2
2
5
17
28
28
17
14
17
17
14
13
4
4
..
13
..

DIF
DIF
-- 22
+3
+3
-2
-2
+2
+2
-3
3
+- 11
++11
3
+- 93
-9

17
28
4
17
12
4
12

Se compara cada individuo consigo mismo antes y despus de un tratamiento con


una determinada dieta.

p g in a 817

C a pt u l o 8

p g in a 818

Test de la t de Student para datos apareados


(muestras relacionadas)
Caractersticas del test:
-Se realizan mediciones repetidas en un mismo individuo.
- Se aplican dos frmacos consecutivos a un mismo paciente.
- Se desea evaluar el cambio de una variable cuantitativa tras aplicar un
tratamiento (cambio entre antes y despus).
- Calcular una nueva variable que es la diferencia entre los valores antes
y despus de cada individuo.
- Cuando el tamao muestral es inferior al 30, se debe probar si la nueva
variable sigue una distribucin normal.
-En las muestras relacionadas la variabilidad ALEATORIA es menor que
en las muestras independientes.

C a pt u l o 8

Test de la t de Student para muestras relacionadas


Pregunta de investigacin: Existen variacin del peso de la madre antes
y despus del embarazo?
Hiptesis nula Ho X antes = X despus ( DIF = POST FREC = 0)
Hiptesis alternativa Ha X antes X despus ( DIF = POST FREC 0)

d - O
t calculada =

S2

Variables
Estadsticos

Peso antes del


embarazo

Peso despus del


parto

Diferencia de peso

Media

54,26

55,64

1,38

Desviacin estndar (S)

6,653

7,624

4,096

1626

1626

1626

p g in a 819

C a pt u l o 8

Variables

Media

Error estndar de
la media (EEM)

1626

Desviacin
estndar
(s)
6,653

Peso ANTES
embarazo
Peso DESPUS
del parto

54,26
55,64

1626

7,624

0,189

0,165

Variable

Correlacin (r)

Significacin

Peso ANTES embarazo versus Peso


DESPUS del parto

1626

0,844

0,000

Variables

Diferencias relacionadas Intervalo de


confianza de la
diferencia
Media s
EEM
Inferior Superior

Peso despus del 1,378


parto peso antes
del embarazo

4,096

0,102

t calculada= 13,56 > t tabulado = 1,96;


tcalculada > ttabulada

1,178

t calculada

gl

13,562

1625 0,000

1,577

p < 0,001

p < 0,05 (rechazamos la hiptesis nula)

Ha: Existe variacin en el peso de las madres antes y despus de un


embarazo.

Significacin
bilateral

p g in a 820

C a pt u l o 8

D istribucin de la t de Student (gl 30)


El test de la T de Student para muestras de ms de 30 individuos
presenta
una distribucin muy similar a la distribucin normal tipificada Z.
El test de la T de Student es una prueba BILATERAL, y por tanto NO
especifica la direccin de la diferencia ( A B).
Nivel de significacin
estadstica = 0,05

t calculada = 6,666

Z 1- /2

Z 1- /2

- 1,96

1,96

t tabulado = 1,96 para los grados de libertad de la muestra (1620)

p g in a 821

C a pt u l o 8

Test de la t de Student para datos apareados


(muestras relacionadas)
Ejemplo
Estudio sobre la forma fsica de un grupo de 30 individuos antes y
despus de un programa de entrenamiento deportivo (PED).
Pregunta de investigacin:
Ha mejorado la forma fsica del grupo durante las sesiones del PED?
Reduce el PED la frecuencia cardiaca media?
Variable
PRED IC TO RA
PED
Cualitativa
dicotmica

Variable
RESULTAD O
Frecuencia C ardaca Media
Cuantitativa

p g in a 822

C a pt u l o 8

Objetivo: Conocer si el entrenamiento deportivo (PED) mejora la forma


fsica de un grupo de individuos.
Material: Grupo de 30 individuos antes y despus de un programa
de entrenamiento deportivo (PED)
Mtodo: Se evala la frecuencia cardiaca antes (FRECPRE) y despus
del PED (FRECPOST).
Se define una nueva variable DIF = FRECPRE FRECPOST.
Hiptesis nula Ho X antes = X despus
( DIF = FRECPRE FRECPOST =
Hiptesis alternativa H1 X antes X despus
(DIF = FRECPRE FRECPOST 0)

p g in a 823

C a pt u l o 8

Resultado
s
Variables

Media

FRECPRE
FRECPOST

79,53
70,40

30
30

Desviacin
estndar
(s)
19,15
12,95

Error estndar de
la media (EEM)
3,50
2,36

Variables

Correlacin (r)

Significacin

FRECPRE versus FRECPOST

30

0,828

0,000

Variables

FRECPRE FRECPOST

Diferencias
relacionadas
Media

9,13

11,12 2,031

t calculada < t tabulada


t calculada > t tabulada

EEM

Intervalo de
confianza de la
diferencia
Inferior Superior
4,98

t calculada

gl

Significacin
bilateral

4,49

29

0,000

13,29

p>0,05 (aceptamos la
Ho)
p<0,05 (rechazamos la hiptesis
nula)

p g in a 824

C a pt u l o 8

Test de la t de Student para datos apareados


(muestras relacionadas)
Ejemplo - C onclusiones
1. Puede concluirse que ha existido un descenso significativo
(p<0,001) de la frecuencia cardiaca despus del PED. Existen
evidencias, con una confianza del 95%, para afirmar que el PED se ha
acompaado de un descenso de la frecuencia cardaca .
2. El descenso medio estimado fue de 9 latidos por minuto despus
del PED.

p g in a 825

C a pt u l o 8

Mito 1: La sonrisa de la esfinge


La t de Student de datos apareados es un test paramtrico, es decir
para usarlo se debe cumplir la normalidad de la variable cuantitativa.
Se cumple? La nueva variable DIF = FRECPRE FRECPOST sigue
una distribucin normal?
He observado en tus resultados de DIF un valor de la desviacin tpica
(11,1) muy superior a la media (9,1),
Cmo justificas esa supuesta normalidad? Qu test has empleado para
comprobar esa supuesta normalidad?
La frecuencia cardiaca es una variable cuantitativa DISCRETA.
Por qu empleas un test paramtrico para este tipo de variables?No
sera ms adecuado utilizar el test de WILCOXON?

p g in a 826

C a pt u l o 8

Objetivo: Comprobar si la reduccin ponderal conseguida tras


intervencin diettica en los pacientes con obesidad mrbida disminuye
los factores de riesgo cardiovascular.
Prueba de la t de Student para datos
apareados Prueba de Shapiro-Wilk (test de
IMC > 40
normalidad)
Peso (Kg)
IMC (Kg/m2)
Cintura (cm)
Cadera (cm)
Indice C/c

Inicio

Final

IC (95%)

149,1 (22)
49,2 (7,7)
144,4 (17,3)
143,3 (17,5)
1,01 (0,12)

115 (18)
38,8 (5)
119,6 (12,1)
127,7 (14,6)
0,94 (0,08)

< 0,001
< 0,001
< 0,001
0,02
0,02

26,9-39,8
7,8-13,2
18,4-36,5
9,1-24,1
0,017-0,16

Los valores se expresan como media (desviacin estndar); p nivel de significacin; IC intervalo de
confianza; IMC: ndice de masa corporal; C/c cintura-cadera.

p g in a 827

C a pt u l o 8

Objetivo: Comprobar si la reduccin ponderal conseguida tras


intervencin diettica en los pacientes con obesidad mrbida disminuye
los factores de riesgo cardiovascular.
Prueba de la t de Student para datos
apareados IMC > 40

Peso (Kg)
IMC (Kg/m2)
Cintura (cm)
Cadera (cm)
ndice C/c

Inicio

Final

IC (95%)

126 (19)
48,7 (5,8)
129,8 (17,7)
142,5 (15,6)
0,92 (0,11)

107 (18)
42,5 (6,2)
118,7 (15,4)
132,8 (13)
0,89 (0,09)

< 0,001
< 0,001
< 0,001
0,003
0,04

13,5-20,3
4,5-7,5
9,1-21,6
3,6-15,9
0,017-0,16

Los valores se expresan como media (desviacin estndar); p nivel de significacin; IC intervalo de
confianza; IMC: ndice de masa corporal; C/c cintura-cadera

p g in a 828

C a pt u l o 8

La reduccin ponderal se acompa de una mejora del perfil lipdico


(triglicridos, cHDL y apoprotena B100 principalmente en los
varones.
Varones
Inicio
Final
p
IC (95%)
Colesterol total (mg/dl) 192 (49,7)

179,7 (34,5)

0,16

-5,1 a 29,6

Triglicridos (mg/dl)

162,4 (73,6)

107,7 (33,7)

0,001

25,4 - 90,0

cLDL (mg/dl)

124,1 (38,5)

115 (30,4)

0,12

-12,9 a 5,7

cHDL (mg/dl)

35,4 (86,3)

43,5 (8,5)

< 0,001

5,7 12,6

cVLDL (mg/dl)

32,5 (14,7)

21,9 (6,8)

0,002

4,8 18,5

Apo B100 (mg/dl)

122,1 (31,3)

100,7 (19,6)

0,01

6,5 40,5

Apo A1 (mg/dl)

117,8 (13,2)

126 (18,8)

0,24

- 17,5 a 4,9

Los valores se expresan como media (desviacin estndar); p nivel de significacin; IC intervalo de
confianza;

p g in a 829

C a pt u l o 8

La reduccin ponderal se acompa de una mejora del perfil lipdico


(triglicridos, cHDL y apoprotena B100 principalmente en los
varones.
Mujeres
Inicio
Final
p
IC (95%)
Colesterol total (mg/dl) 189 (29,2)

183,6 (32)

0,32

-5,7 a 16,5

Triglicridos (mg/dl)
cLDL (mg/dl)
cHDL (mg/dl)
cVLDL (mg/dl)
Apo B100 (mg/dl)

137 (60,8)
117,8 (13,2)
41,9 (15,6)
32,3 (15,9)
110 (30,6)

109,5 (43,7)
115,6 (26,4)
45,6 (13.1)
22 (8,4)
106,1 (20,6)

0,22
0,07
0,03
0,2
0,7

-5,8 a 23,5
-0,8 a 18,5
0,4 6,6
-1,1 a 4,8
-11,4 a 15,9

Apo A1 (mg/dl)

124,1 (23,2)

129 (21,4)

0,052

-0,07 a 19,4

Los valores se expresan como media (desviacin estndar); p nivel de significacin; IC intervalo de
confianza;

p g in a 830

C a pt u l o 8

p g in a 831

D iscusin - C onclusiones
- Los varones presentaron una mayor reduccin ponderal que las mujeres.
- Con la intervencin diettica empleada conseguimos una mejora en el
perfil
aterognico, principalmente en los triglicridos, VLDL y HDL.
-Los varones presentaron una mejora ms importante que las mujeres en el
perfil lipdico.
-La reduccin ponderal ha conseguido una reduccin de algunos de los
factores de riesgo cardiovascular (FRCV) analizados.
-El sexo masculino presenta una mejor respuesta global con reduccin de
los FRCV y mejora de la distribucin grasa.

C a pt u l o 8

Mito 1: La sonrisa de la
esfinge
La t de Student de datos apareados es un test paramtrico, es decir
para usarlo se debe cumplir la normalidad de las variables cuantitativas.
Se cumple en todas las variables? Las nuevas variables DIF =
FRECPRE
FRECPOST siguen una distribucin normal? Cmo justificas esa
supuesta
normalidad?Que test has empleado?
He observado que en tus resultados NO aparece las nuevas variables DIF
ni su desviacin tpica.
Porqu no se ha incluido en los resultados?

p g in a 832

C a pt u l o 8

Cualitativa versus
cuantitativa
PARAMTRIC O
S

Independient
es
Aparejad
os

NO
PARAMTRIC O S

T de Student para
mues- tras
independientes

U de Mann-W hitney

T de Student para
mues- tras apareadas

W ilcoxon

Variable predictora Cualitativa versus variable resultado


Cuantitativa.

p g in a 833

C a pt u l o 8

Test de
W ilcoxon
Prueba NO PARAMTRICA o de libre distribucin
- No se basa en la media, desviacin estndar, etc.
Condiciones de aplicacin:
- Diseo emparejado o de medidas repetidas
- Datos a comparar
son ORDINALES o
Cuantitativos con
BAJO tamao
muestral (n < 30) y
NO siguen una
distribucin
NORMAL

p g in a 834

C a pt u l o 8

p g in a 835

Ejemplo (muestras relacionadas)


Test de W ilcoxon para datos apareados
Estudio sobre la mejora clnica del dolor en pacientes con artrosis tratados
con un infiltracin de corticoides.
Pregunta de investigacin:
Ha mejorado el grado de bienestar de los pacientes con artrosis tras el
tratamiento con infiltraciones?
Existen evidencias de una mejora en el nivel de dolor en los pacientes
con
artrosis despus del tratamiento con infiltraciones intrarticulares?
N ivel de dolor
ANTES del
tratamiento

Infiltraci
n

N ivel de dolor
D ESPUS del
tratamiento

C a pt u l o 8

Objetivo: Conocer si la infiltracin con corticoides mejora el bienestar


clnico
de en un grupo de los pacientes con artrosis de rodilla...
Material: Grupo de pacientes con artrosis de rodilla del Hospital
X seleccionados para el ensayo.
Mtodo: Se evala el nivel de dolor en los pacientes mediante un test
estandarizado antes (NDA) y despus del tratamiento infiltrativo (NDD).
Se define una nueva variable DIF = NDA NDD.
Hiptesis nula
( DIF = NDA NDD =
X antes = X despus
Ho
0)
Ho (hiptesis nula) = La infiltracin con corticoides NO mejora el
bienestar
clnico de los pacientes con artrosis de rodilla.
Hiptesis alternativa
X antes X despus (DIF = NDA NDD
0)
H1
Ha (hiptesis alternativa) = La infiltracin con corticoides SI mejora
el
bienestar clnico de los pacientes con artrosis de rodilla.

p g in a 836

C a pt u l o 8

Test de 2 de tendencia lineal


Ejercicio: Realizamos un estudio hipottico de cohortes recogiendo datos
sobre la actividad deportiva que practicaban en su juventud 10 pareja de
gemelos de Ceuta, donde despus de un seguimiento de 20 aos, uno de
los gemelos ha muerto y el otro sobrevive.
Variable
predictora:
Actividad deportiva
Variable cuantitativa
ordinal S= sedentarios
O= deporte
ocasional R= deporte
regular
C = deporte
competitivo E = deporte
de elite

Variable
resultado:
Pareja

Gemelo vivo

Gemelo muerto

10

p g in a 837

C a pt u l o 8

Test de W ilcoxon para datos apareados


Ejercicio: Realizamos un estudio hipottico de cohortes recogiendo datos
sobre la actividad deportiva que practicaban en su juventud 10 pareja de
gemelos de Ceuta, donde despus de un seguimiento de 20 aos, uno de
los gemelos ha muerto y el otro sobrevive.
Variable
predictora:
Actividad deportiva
Variable cuantitativa
ordinal 0 = sedentarios
1= deporte espordico
2= deporte regular
3= deporte
competitivo 4=
deporte de lite

Variable
resultado:
Pareja

Gemelo vivo

Gemelo muerto

10

p g in a 838

C a pt u l o 8

Prueba de los rangos con signo de


W ILCO X O N
Estadstico
de contraste
para
datos
apareadosDESENLACE - TIPO DE DEPORTE
Z

- 1,897

Significacin asintomtica (bilateral)

0,058

Prueba de los signos para datos


Estadstico de contraste
DESENLACE - TIPO DE DEPORTE
apareados
Significacin asintomtica (bilateral)

0,180

p g in a 839

C a pt u l o 8

El test de Wilcoxon es una prueba BILATERAL, y por tanto NO especifica


la direccin de la diferencia ( A B).

Nivel de significacin
estadstica ( =
0,05)

Z calculado= - 1,89

Ho
Z 1- /2

Z 1- /2

Ha

Ha

- 1,96
Z calculado= - 1,89

1,96
<

Z tabulado = 1,96

p g in a 840

C a pt u l o 8

p g in a 841

Ho = La prctica deportiva en la juventud NO reduce la mortalidad


Ha = La prctica deportiva en la juventud REDUCE la mortalidad

n(n

1)
n(n 1)(2n
4
1)
24

~N
(0,1)

n(n
1) 4
3
g
ti
n(n 1)(2n

2t
1) 24
W

~N
(0,1)

i1

1. Calculo del estadstico z: Zcalculado= -1,89


2. Comparacin del Z calculado con el Ztabulado de las tablas de la normal. Z calculado = -1,89 < Ztabulado = -1,96 para
p < 0,05 a dos colas. La significacin estadstica p = 0,058
3.No se dispone de evidencias para rechazar la Ho de igualdad de medias entre el gemelo que sobrevivi y
el que muri. La probabilidad de hallar unas diferencias al menos como las encontradas es de slo el 5,8%.
Las diferencias encontradas pueden ser debidas al AZAR.
4.No se puede rechazar Ho, ya que el valor de p es superior a 0,05. Estos datos NO proporcionan
evidencias que indiquen que la prctica deportiva era superior en los gemelos supervivientes respecto a
sus hermanos gemelos fallecidos. El estudio NO apoya que el deporte en la juventud reduzca la mortalidad
en el futuro.
5. ERROR de DISEO: falta de potencia estadstica por su escaso tamao muestral. ERROR BETA.

C a pt u l o 8

Desenlace (E) Variable resultado


Exposicin (F) Variable predictora

Muerte

Sobreviviente

Sedentarismo (+)

Sedentarismo (-)

A: Fallecidos con
sedentarismo B:
Sobrevivientes sedentarios
C: Fallecidos deportistas
D : Sobrevivientes
deportistas

RR =

[ A / (A + B)]
[ C / (C + D) ]

Es la probabilidad de morir (E) en el grupo de sedentarios (expuestos al


factor de riesgo) en relacin con la probabilidad de muerte en deportistas
(grupo no expuesto).

p g in a 842

C a pt u l o 8

RR = 1.41 IC95%=1.23-1.61 de los sedentarios frente a los para los


ocasionalmente
activos
RR = 1.52 IC95%=1.06-2.17 de los sedentarios frente a los entrenados
EXPUESTOS al
factor de riesgo
(sedentarismo)

NO expuestos
al factor de
riesgo
(sedentarismo)

Prdidas
de
seguimient
Seguimiento o
20
aos

Fallecimientos
RIESGO

RELATIVO
Prdidas de

Sobrevivientes
Fallecimientos
Sobrevivientes

seguimient
o
Kumala et al. Relationship of leisure-time physical activity and mortality: the Finnish twin cohort. JAMA
1998; 11; 279: 440-4.

p g in a 843

C a pt u l o 8

Desenlace (E) Variable resultado


Exposicin (F) Variable predictora

Muerte

Sobreviviente

Deporte (+)

Deporte (-)

A: Fallecidos con
sedentarismo B:
Sobrevivientes sedentarios
C: Fallecidos deportistas
D : Sobrevivientes
deportistas

RR =

[ A / (A + B)]
[ C / (C + D) ]

Es la probabilidad de morir (E) en el grupo de deportistas (expuestos al


factor de proteccin) en relacin con la probabilidad de muerte en
sedentarios (grupo no expuestos).

p g in a 844

C a pt u l o 8

RR = 0.71 IC95%=0.62-0.81 para los ocasionalmente


activos
RR = 0.66 IC95%=0.46-0.94 para los entrenados

EXPUESTOS al
factor de riesgo
(sedentarismo)

NO expuestos
al factor de
riesgo
(sedentarismo)

Prdidas
de
seguimient
Seguimiento
o
20
aos

Fallecimientos
RIESGO

RELATIVO
Prdidas de

Sobrevivientes
Fallecimientos
Sobrevivientes

seguimient
o
Kumala et al. Relationship of leisure-time physical activity and mortality: the Finnish twin cohort. JAMA
1998; 11; 279: 440-4.

p g in a 845

C a pt u l o 8

- Diseo: estudio de COHORTES


- 7925 varones gemelos
- 7977 mujeres gemelas
- Resultados:
- RR = 0,71: Se encontr una reduccin del 29% en la mortalidad para los
ocasionalmente activos comparados con los sedentarios.
- RR = 0,66: Se encontr una reduccin del 34% en la mortalidad para los
entrenados comparados con los sedentarios.
RRR
RR ]] * 100
RRR =
= [[ 11 RR

RRR1 = 29%
RRR2 =
34%
- Conclusiones: Este estudio es importante porque deja claro que la mejor
superviviencia de los ms activos NO se debe a una predisposicin gentica
(controlada por el emparejamiento entre gemelos), sino al efecto real del ejercicio fsico
sobre la superviviencia.

Kumala et al. Relationship of leisure-time physical activity and mortality: the Finnish twin cohort. JAMA
1998; 11; 279: 440-4.

p g in a 846

C a pt u l o 8

Ejemplo (muestras relacionadas)


Estudio sobre los conocimientos adquiridos en Metodologa de
Investigacin en Ciencias de la Salud (MICS) en los alumnos del curso de
Sevilla.
Pregunta de investigacin:
Han mejorado los conocimientos adquiridos en Metodologa de
Investigacin en los alumnos del curso de Sevilla?
Aumenta el curso el nivel de conocimientos sobre la materia impartida?
Existen evidencias de una mejora en los conocimientos tericos
de Metodologa de investigacin en los alumnos despus del curso?
C onocimientos de
MIC S previos al curso

Curso

C onocimientos de
MIC S despus del
curso

p g in a 847

C a pt u l o 8

Objetivo: Conocer si el curso de Metodologa de Investigacin (CMI) realizado en


Sevilla mejora los conocimientos sobre dicha materia en un grupo de alumnos
(licenciados en Ciencias de la Salud).
Material: Grupo de 8 individuos FEA y residentes del Hospital Universitario de Valme
(Sevilla ) antes y despus de realizar el curso de Metodologa de Investigacin en
Ciencias de la Salud (CMICS)
Mtodo: Se evala los conocimientos mediante un test (examen) antes (RCAC) y
despus
del CMICS (RCDC). Se define una nueva variable DIF = RCDC RCAC.

Hiptesis nula
Ho

X antes = X despus

(DIF = RCDC RCAC =


0)

Ho (hiptesis nula) = La accin formativa (CMICS) no mejora los conocimientos


sobre
metodologa
de investigacin en los
alumnos.

Hiptesis alternativa
H1

X antes X despus

(DIF = RCDC RCAC


0)

Ha (hiptesis alternativa) = La accin formativa (CMICS) mejora los conocimientos


sobre
metodologa
de investigacin en los
alumnos.

p g in a 848

C a pt u l o 8

p g in a 849

Existen evidencias de una mejora en los


conocimientos tericos de metodologa de
investigacin en los alumnos despus del curso?
N del
Alumno

N respuestas
correctas ANTES del
curso (RCAC)

N respuestas correctas
Diferencia de respuestas
DESPUS del curso (RCDC) acertadas DESPUS ANTES
(RCDC- RCAC)

10

14

14

14

14

13

13

10

13

11

11

Cul es el test estadstico ms


acertado?

C a pt u l o 8

Prueba de los rangos con signo de


W ILCO X O N
Estadstico
de contraste
para
datos
apareadosDESENLACE - TIPO DE DEPORTE
Z

-2,536

Significacin asintomtica (bilateral)

0,011

Prueba de los signos para datos


Estadstico de contraste
DESENLACE - TIPO DE DEPORTE
apareados
Significacin asintomtica (bilateral)

0,008

p g in a 850

C a pt u l o 8

RESULTADOS: Se realiz la comparacin del Zcalculado con el Ztabulado de


las tablas de la normal mediante el programa estadstico SPSS. El valor
del estadstico Zcalculado = 2,536 fue superior al Ztabulado = 1,96 para p < 0,05
a
dos colas (test de contraste bilateral). La significacin estadstica
encontrada fue de p = 0,011. Estos datos permiten rechazar Ho, ya que el
valor de p es inferior a 0,05.
CONCLUSIONES: Puede concluirse que ha existido un aumento
significativo (p<0,05) del nmero de respuestas acertadas despus del
curso. Existen evidencias, con una confianza del 95% (error alfa del 5%),
para afirmar que
la accin formativa ha producido una mejora en los conocimientos. Por
tanto, estos datos proporcionan evidencias que indican una mejora
objetiva y significativa en los conocimientos terico-prcticos de
Metodologa de investigacin en los alumnos despus del curso (hiptesis
alternativa).

p g in a 851

C a pt u l o 8

MUESTRAS
APAREADAS

INDEPENDIENTES
n1 y n2 30
30

n 30

n1 o n2
Test de normalidad

Test de levene
Homogeneidad
de las
varianzas

Test de la t de
Student para
muestras
independientes

SI

n 30

Test de normalidad
NO
SI

Heterogeneidad
de las
varianzas

Test de Welch

Test de la
U de
MannWhitney

Test de la t de
Student para
datos
apareados

NO

Test de
Wilcoxon

p g in a 852

C a pt u l o 8

Pregunta de investigacin
Qu relacin existe entre los niveles de colesterolLD L en
sangre y la probabilidad de padecer un IAM?
Variable PRED IC TO RA
C UAN TITATIVA
N iveles colesterol-LD L
continua

Cul es el test estadstico ms


acertado?

Variable RESULTAD O
C UALITATIVA
IAM
dicotmica

p g in a 853

C a pt u l o 8

Pregunta de investigacin
Qu relacin existe entre los niveles de
alcoholemia y la probabilidad de tener un
accidente de trfico?
Variable PRED IC TO RA
C UAN TITATIVA
N iveles de Alcoholemia
continua

Cul es el test estadstico ms


acertado?

Variable RESULTAD O
C UALITATIVA
Accidente de trfico
dicotmica

p g in a 854

C a pt u l o 8

Pregunta de investigacin
Qu relacin existe entre la ingesta crnica de
alcohol y la probabilidad de desarrollar cncer de
esfago?
Variable PRED IC TO RA
C UAN TITATIVA
Ingesta crnica de alcohol
continua

Cul es el test estadstico ms


acertado?

Variable RESULTAD O
C UALITATIVA
C ncer de esfago
dicotmica

p g in a 855

C a pt u l o 8

Pregunta de investigacin
Qu relacin existe entre la edad
gestacional y la
probabilidad de muerte del recin nacido?
Variable PRED IC TO RA
C UAN TITATIVA
Edad gestacional
continua

Cul es el test estadstico ms


acertado?

Variable RESULTAD O
C UALITATIVA
Muerte del RN
dicotmica

p g in a 856

C a pt u l o 8

D epsitos de Fe en mdula sea

Predice
Produce

VC M (hemograma)

Produc
e

Ferritina (srica)

Predic
e

p g in a 857

C a pt u l o 8

Pregunta de investigacin
Qu relacin existe entre el VC M del hemograma y
la probabilidad de tener dficit de los depsitos de
hierro en mdula sea?
Variable PRED IC TO RA
C UAN TITATIVA
VC M
continua
(hemograma)

Cul es el test estadstico ms


acertado?

Variable RESULTAD O
C UALITATIVA
D epsitos de Fe en mdula sea
dicotmica

p g in a 858

C a pt u l o 8

Pregunta de investigacin
Qu relacin existe entre los niveles de ferritina
srica y la probabilidad de tener dficit de los
depsitos de hierro en mdula sea?
Variable PRED IC TO RA
C UAN TITATIVA
Ferritina (srica)
continua

Cul es el test estadstico ms


acertado?

Variable RESULTAD O
C UALITATIVA
D epsitos de Fe en mdula sea
dicotmica

p g in a 859

C a pt u l o 8

Anlisis estadstico
Tipos de test analticos estadsticos de contraste de hiptesis
segn el tipo de variables implicadas en el estudio
Variable
dependiente
Dicotmica
Variable
Predictor
a
Variable
Independien
te

VariableContinua
resultado

Dicotmica

Test de 2

t de Student

Continua

Regresin
logstica
simple

Regresin lineal

p g in a 860

C a pt u l o 8

Anlisis
estadstico
ANLISIS ESTADSTICO
Variable
Predictor
a
Variable
Independien
te

Variable resultado
Dicotmica
Continua

Dicotmica

Test de 2

t de Student

Continua

Regresin
logstica

Regresin lineal

REGRESIN LOGSTICA SIMPLE

p g in a 861

C a pt u l o 8

Anlisis de Regresin Logstica


Simple
- Variable RESULTADO: Dicotmica
- Variable PREDICTORA:
- Cuantitativa
- Categrica
Variables PREDICTORAS

Variable RESULTADO

Alcoholemia

Accidente de trfico

Ingesta de alcohol

Cncer de esfago

Colesterolemia

IAM

Edad gestacional

Muerte del RN

p g in a 862

C a pt u l o 8

Pregunta de investigacin
Qu relacin existe entre los niveles de colesterolLD L en
sangre y la probabilidad de padecer un IAM?
Variable PRED IC TO RA
C UAN TITATIVA
N iveles colesterol-LD L
continua

Cul es el test estadstico ms


acertado?

Variable RESULTAD O
C UALITATIVA
IAM
dicotmica

p g in a 863

C a pt u l o 8

Modelo de Anlisis de Regresin Logstica


Simple
e 1X1

P=

1+

log

P
1-P

= 0 + 1 X 1

1X1

Y=1

Modelo de regresin
logstica simple

Probabilidad de
enfermedad
coronaria

Modelo de probabilidad
lineal simple
Y=0
Factor de riesgo: cLDL

X1

p g in a 864

C a pt u l o 8

Anlisis de regresin logstica


simple

p g in a 865

C a pt u l o 8

Pregunta de investigacin
Qu relacin existe entre la edad gestacional y la
probabili- dad de muerte del recin nacido?
Estudio caso-control realizado por Brand et al con 410 RN de
edad gestacional entre 24-29 semanas.
Variable PRED IC TO RA
C UAN TITATIVA
Edad gestacional
continua

Anlisis de Regresin Logstica


Simple

Variable RESULTAD O
C UALITATIVA
Probabilidad de morir
dicotmica

p g in a 866

p g in a 867

C a pt u l o 8

Anlisis de regresin logstica simple


Qu relacin existe entre la edad gestacional y la probabilidad de
muerte del recin nacido?
Variable
PREDICTORA Edad
gestacional
Variable RESULTADO
Riesgo de muerte del
RN

Edad gestacional
Semanas

24

25

26

27

28

29

Total

Vivo

16

38

49

45

30

181

Muerto

26

56

69

50

21

229

Estimaciones de los parmetros del modelo logstico


propuesto para los datos anteriores
Variable

Estimacin

Error estndar

Constante

18,36

2,375

Edad
gestacional

- 0,6819

0,08908

P = probabilidad que muera un RN

C a pt u l o 8

p g in a 868

Regresin logstica. C oeficiente de regresin


logstica 1
Existe relacin entre la probabilidad de muerte neonatal (Variable Resultado) y la
Z
Valor (Variable
Predictora) en losEstimaciones
de los
parmetros del modelo logstico
edad
gestacional
RN de 24-29
semanas?
Z95%

1,96

95%

propuesto para los datos anteriores

Z99%

2,56

99%

Variable

Z99,5%

3,29

99,5%

estndar Constante

EE1

Error
18,36

2,375

Coeficiente de regresin
logstica estandarizado

Estimacin

Edad
gestacional

- 0,6819

0,08908

0,6819
=

=
0,08908

7,65

> Z95%

Podemos decir con error inferior al 5% que existe asociacin entre la mortalidad de los
RN prematuros y su edad gestacional en el rango estudiado.

C a pt u l o 8

Anlisis de regresin logstica


simple
Estimaciones de los parmetros del modelo
logstico propuesto para los datos anteriores
Variable

Estimacin

Error estndar

Constante

18,36

2,375

Edad
gestacional

- 0,6819

0,08908

1/OR = 1,98
Un RN presenta casi 2 veces ms riesgo de
morir que otro RN con una semana ms

20

OR = 0,506

1 = - 0,6819

Es el riesgo de morir de un RN respecto


a otro que tiene una semana menos

Logit

10

- 10

24

25

26

27

28

29

Cul es el riesgo de morir de un RN


con 25 semanas en relacin a otro de 29
semanas?

Edad gestacional (semanas)

Representacin grfica de los logits en las diferentes


edades gestacionales estudiadas

OR = e1 (X1-X2)
OR = e -0,6819 (25-29) = 15,30

p g in a 869

C a pt u l o 8

Pregunta de investigacin
Qu relacin existe entre el VC M del hemograma y
la probabilidad de tener dficit de los depsitos de
hierro en mdula sea?
Variable PRED IC TO RA
C UAN TITATIVA
VC M
continua
(hemograma)

Cul es el test estadstico ms


acertado?

Variable RESULTAD O
C UALITATIVA
D epsitos de Fe en mdula sea
dicotmica

p g in a 870

C a pt u l o 8

Anlisis de Regresin Logstica Simple


Qu relacin existe entre el VC M y los
depsitos de hierro en mdula sea?
Variable PRED IC TO RA

Variable RESULTAD O

VC M

D epsitos de Fe medular

Estimaciones de los parmetros del modelo


logstico propuesto para los datos anteriores
Variable
Estimacin
Error estndar
Constante
- 6,1112
VCM

0,08485

0,02689

log

P
P
1 -

- 6,1112

0,08485

VCM

P = probabilidad de que existan depsitos de


hierro medular

p g in a 871

C a pt u l o 8

p g in a 872

Anlisis de Regresin Logstica Simple


Qu relacin existe entre la Ferritina srica y los
depsitos
de hierro medular?
Variable PRED IC TO RA

Variable RESULTAD O

Ferritina srica

D epsitos de Fe medular

Estimaciones de los parmetros del modelo


logstico propuesto para los datos anteriores
Variable
Estimacin
Error estndar
Constante
- 2,1290
FERRITINA

0,1713

0,04085

log

P
1 -

- 2,1290

FERRITINA

0,1713

P = probabilidad de que existan depsitos de


hierro medular

C a pt u l o 8

p g in a 873

Tipos de test analticos estadsticos bivariantes de


contraste
Variable
o Dependiente (Criterio de evaluacin)
de
hiptesisVariable
msRESULTADO
frecuentes
PREDICTORA o
Independiente
(factor de estudio)

Cualitativa
nominal dos
categoras

Cualitativa
dos grupos
independient
es

Chi cuadrado
Z comparacin de
proporciones
Test exacto de
Fisher
Test de McNemar

Cualitativa
dos grupos
apareados

Cualitativa > 2
grupos
independientes
Cualitativa > 2
grupos
apareados
Cuantitativa

Cualitativa
nominal > 2
categoras
Chi cuadrado

Cualitativa
ordinal o
Cuantitativa NO
paramtrica
U de Mann-Whitney

Cuantitati
va
paramtric
a
T de Student
(prueba de Welch)

Q de Cochran

Prueba de los
rangos de
Wilcoxon

Chi cuadrado

Chi cuadrado

Prueba de
Kruskal- Wallis

T de
Student
para datos
emparejado
s
Anlisis de la Varianza
(ANOVA)

Q de Cochran

Q de Cochran

Prueba de Friedman

Regresin logstica
simple

Regresin
logsti- ca
multivariante

Correlacin de
Sperman
Tau de Kendall

Anlisis de la
Varianza de dos
vas
Regresin lineal
Correlacin de
Pearson

C a pt u l o 9

C aptulo 9
Publicacin Bioestadstica: Anlisis
bivariante. Test de contraste de hiptesis.
Cualitativa policotmica versus cuantitativa.

D r. Jacobo D az Portillo
Coordinador de Formacin Continuada
Hospital Universitario de Ceuta

p g in a 874

C a pt u l o 9

Materiales y mtodos
Estructura
1. Tipo de diseo (estudio).
2. Sujetos incluidos (criterios de seleccin de la muestra)
3. Fuentes de informacin.
4. Descripcin de la intervencin y definicin del punto final de la
investigacin (estudios experimentales).
5. Instrumentos y procedimientos de medida (cuestionarios).
6. Definicin de las variables y covariables incluidas en el estudio (factor
de
estudio y criterio de evaluacin).
7. Limitaciones y consideraciones ticas de la investigacin.
8. Pruebas estadsticas a utilizar (programa estadstico).

p g in a 875

C a pt u l o 9

Fases del anlisis


estadstico
1. ANLISIS DESCRIPTIVO

2. ANLISIS BIVARIANTE

3. ANLISIS MULTIVARIANTE

p g in a 876

C a pt u l o 9

p g in a 877

Pruebas estadsticas de contraste de


hiptesis ms aplicables a cada situacin
Variable
Independiente
o PREDICTORA

Variable
Dependiente
o RESULTADO

Pruebas de contraste de
hiptesis

Observaciones y/o limitaciones del test

Cualitativa

Cualitativa

Ji cuadrado
Prueba exacta de
Fisher Test de
McNemar
Q de Cochran
REGRESIN LOGSTICA

Cualitativa

Cuantitativa

Cuantitativa

Cualitativa

Cuantitativa

Cuantitativa

t de Student
Anlisis de la
Varianza Test de
Mann-Whitney Test
de Wilcoxon
Test de KruskallWallis Test de
Friedman
Regresin logstica simple
Regresin logstica
multivariante
Regresin lineal
simple Correlacin de
Pearson Correlacin
de Sperman
REGRESIN MLTIPLE

Si el tamao muestral es
grande Si el tamao muestral
es pequeo
Dos grupos de muestras
repetidas o apareadas
Ms de dos grupos de muestras repetidas o
apareadas Varias variables predictoras
cualitativas
Compara medias entre dos grupos independientes
Compara medias entre ms de dos grupos
independientes Dos grupos independientes No
paramtricos
Dos grupos medidas repetidas No paramtrico
Ms de dos grupos No paramtrico, medidas
repetidas Ms de dos grupos No paramtrico
medidas repetidas
Una sola variable predictora cuantitativa
Varias variable predictoras cuantitativa o cualitativas
Paramtrico
Paramtrico
No
paramtrico
Varias
variables
predictoras

C a pt u l o 9

p g in a 878

Tipos de test analticos estadsticos bivariantes de


contraste
de
hiptesis ms
frecuentes
Variable
Variable RESULTADO o Dependiente (Criterio de evaluacin)
PREDICTORA o
Independiente
(factor de estudio)

Cualitativa
nominal dos
categoras

Cualitativa dos
grupos
independientes

Chi cuadrado
Z comparacin de
proporciones
Test exacto
de Fisher
Test de McNemar

Cualitativa dos
grupos apareados

Cualitativa
nominal
>2
categoras
Chi cuadrado

Cualitativa
ordinal o
Cuantitativa NO
paramtrica
U de Mann-Whitney

Cuantitati
va
paramtric
a
T de Student
(prueba de Welch)

Q de Cochran

Prueba de
los rangos
de Wilcoxon

Prueba de
Kruskal- Wallis
Prueba de
Friedman

T de
Student
para datos
emparejado
s
Anlisis de la Varianza
(ANOVA)
Anlisis de la
Varianza de dos
vas
Regresin lineal
Correlacin de
Pearson

Cualitativa > 2 grupos


independientes
Cualitativa > 2 grupos
apareados

Chi cuadrado

Chi cuadrado

Q de Cochran

Q de Cochran

Cuantitativa

Regresin logstica

Regresin logstica Correlacin de


Sperman
Tau de Kendall

C a pt u l o 9

Cualitativa versus cuantitativa


Cules son las pruebas estadsticas que tenemos que
emplear?
Variable PRED IC TO RA
C UALITATIVA
dicotmica

Variable
RESULTAD O
C UAN TITATIVA

p g in a 879

C a pt u l o 9

C ualitativa policotmica versus


cuantitativa
2 GRUPO S

Independient
es
Aparejad
os

PARAMTRIC O
S

NO
PARAMTRIC O S

AN O VA para
muestras
independientes

Kruskal-W allis

Anlisis
de
la
Varianza
para
muestras
dependientes
o
apareadas

Friedman

Variable predictora Cualitativa versus variable resultado


Cuantitativa.

p g in a 880

C a pt u l o 9

Anlisis de la varianza para un factor (AN O VA):


C ondiciones de aplicacin
-Tipos de variables.
- Variable resultado: Cuantitativa numrica.
- Variable predictora: Cualitativa policotmicas.
- Normalidad: Variable resultado siga una distribucin normal o de gauss.
-Homogeneidad de las varianzas (homocedasticidad): Las varianzas de
cada grupo deben ser iguales.
- Prueba F de Snedecor.
- Test de Barttlet.
- Test de Levene.

p g in a 881

C a pt u l o 9

Homogeneidad de varianzas
(homocedasticidad)
- Prueba F de
Snedecor
- Test de Barttlet
- Test de Levene

F=

Varianza
mayor
Varianza
menor

Ho: Las varianzas de ambos grupos son


ANOV
iguales
A
Ha: Existen diferencias entre las
KRUSKALvarianzas
WALLIS
Fcalculada < Ftabulada
p>0,05 (aceptamos la o
H)
Fcalculada > Ftabulada
p<0,05 (rechazamos la hiptesis
nula)

p g in a 882

C a pt u l o 9

HIPERLIPID EMIA
ED AD
SEX O
N IVEL C ULTURAL
TABAQ UISMO
O BESID AD IMC
D IABETES

Excrecin urinaria
de sodio en 24 horas

p g in a 883

C a pt u l o 9

Test de la t de Student
Anlisis de la varianza para un factor
Variables PRED IC TO RAS
RESULTAD O

Variable

Sigue una Distribucin


Normal?
Distribucin ANORMAL

p g in a 884

C a pt u l o 9

Pregunta de investigacin
Tienen la misma eficacia las dietas ensayadas para
reducir
el nivel de colesterol-LD L?
Variable PRED IC TO RA
C UALITATIVA
Tipos de dieta
policotmica
- D ieta control
- D ieta moderada
- D ieta estricta

Cul es la prueba estadstica ms


adecuada?

Variable RESULTAD O
C UAN TITATIVA
LD L- colesterol
continua

p g in a 885

C a pt u l o 9

Grupo Control (n=10)

Dieta moderada (n=10)

Dieta estricta (n=10)

+ 13

+ 10

12

+2

15

10

21

-8

20

-10

+5

15

-18

-16

+8

-10

+2

16

-20

-2

-15

Media = + 2,5

Media = - 10,1

Media = - 13,7

p g in a 886

C a pt u l o 9

Anlisis de la varianza para un


factor
Hiptesis nula: 1

2 = 3 =

= n

Hiptesis alternativa: al menos una de las medias x es distinta

EFECTO debido a la dieta


Dispersin debida al AZAR (error)

F =

Varianza entre grupos (EFECTO)

Varianza residual (ERROR)

Varianza entre grupos (EFECTO)


Varianza residual (ERROR)

723,6
=
35,7

= 20,2

p g in a 887

C a pt u l o 9

p g in a 888

Varianza entre grupos (EFECTO)

15

F =

35,7

= 20,2

Varianza residual (ERROR)

10
5

Cambio de el LDL (mg/dl)

0
-5
- 10
-15
- 20
- 25

Control

Moderada

Estricta

Cambio en los niveles de colesterol-LDL (mg/dl) a los 6 meses de


tratamiento de intervencin diettica en 3 grupos de voluntarios
asignados a diferentes dietas

Tienen la misma eficacia las dietas ensayadas para


reducir
el nivel de colesterol-LD L?
723,6

Cul es la intervencin diettica que ms reduce los niveles de colesterolLDL?

Cambio de el LDL (mg/dl)


+10

- 10

- 20

Cambio en los niveles de colesterol-LDL (mg/dl) a los 6 meses de


tratamiento de intervencin diettica en 3 grupos de voluntarios
asignados a diferentes dietas
C a pt u l o 9

Control
Moderada
Estricta
p g in a 889

C a pt u l o 9

Anlisis de la varianza para un


factor
Peso del RN

gl

Inter-grupos
Intra-grupos

Suma de
cuadrados
1447,2
965,5

Total

2412,7

29

2
27

Media
cuadrtica
723,6
35,7

Significacin

20,235

0,000

F
= 20,235 > F
= 3,23;
p <
0,001
calculada
tabulado
Hiptesis
alternativa Ha : El
reduccin del LDL difiere segn el tipo de
dieta.
Cul es la intervencin diettica que ms reduce los niveles de
colesterol- LDL?

p g in a 890

C a pt u l o 9

D istribucin de la F de
Snedecor

s12 1
valores " F " : F 2 2 2
s2 2

Grados de libertad 1 y 2

1 n 1 1
n 1

El ANOVA para un factor


2 para poblaciones con alto
tamao muestral presenta una distribucin de la F de
Snedecor.

p g in a 891

C a pt u l o 9

D istribucin de la F de
Snedecor

Ho

F calculada = 20,2
F

calculada >
tabulada

Ha
p < 0,05

F tabulado = 3,23 para los grados de libertad de la muestra

p g in a 892

C a pt u l o 9

Anlisis de la varianza para un factor


Anlisis de la Varianza para un
factor
t

calculada < t
tabulada p >

Varianza entre grupos (EFECTO)

F =318,6

0,05

Hiptesis nula H 0
El cambio en el nivel de cLDL es
independiente de la intervencin
diettica

Varianza residual (ERROR)

=
=
5,2
61,0

calculada > t
tabulada p <
0,05

Hiptesis alternativa H a
Las medias del cLDL de los
distintos grupos son diferentes
entre s, es decir NO pueden
considerarse iguales

Tienen la misma eficacia las dietas ensayadas para reducir el nivel de colesterolLDL?
NO
Cul es la intervencin diettica que ms reduce los niveles de colesterol-LDL?
?

p g in a 893

C a pt u l o 9

p g in a 894

CONTRASTES A POSTERIORI

C ul es la intervencin diettica que ms reduce los


niveles
de colesterol-LD L?
Procedimiento de SCHEFFE

Procedimiento de BONFERRONI

Se comparan los
grupos de 2 en 2
Se comparan los
grupos de 2 en 2
Se comparan los
grupos de 2 en 2
Se comparan los
grupos de 2 en 2
Se comparan los
grupos de 2 en 2
Se obtienen
intervalos de medias

Mtodo de DUNNET

C a pt u l o 9

C ontrastes a posteriori en
SPSS

p g in a 895

C a pt u l o 9

Pruebas Post
Hoc
Hiptesis nula Ho : La dieta ESTRICTA reduce el LDL de forma similar
al
resto de las dietas
comparadas.
Hiptesis alternativa Ha : La dieta ESTRICTA reduce el LDL de
forma
significativa con respecto al resto de las
dietas comparadas.
DIETAS
Control

Moderada

Control

Moderada

Estricta

Ho =

Ho =

Ha

Ha
Ho =
Ha

Estricta

p g in a 896

C a pt u l o 9

Procedimiento de
Bonferroni
Dieta (I)

Dieta (J)

Control
Moderada
Estricta

Error estndar

Significacin

Moderada
Estricta

Diferencias de
medias (I J)
12,60
16,20

2,674
2,674

0,000
0,000

Control
Estricta
Control
Moderada

- 12,60
3,60
- 16,20
- 3,60

2,674
2,674
2,674
2,674

0,000
0,568
0,000
0,568

Hiptesis nula H o: La dieta ESTRICTA reduce el LDL de forma similar al resto de las dietas comparadas.

p g in a 897

C a pt u l o 9

Procedimiento de
Scheffe
Dieta (I)

Dieta (J)

Control
Moderada
Estricta

Error estndar

Significacin

Moderada
Estricta

Diferencias de
medias (I J)
12,60
16,20

2,674
2,674

0,000
0,000

Control
Estricta
Control
Moderada

- 12,60
3,60
- 16,20
- 3,60

2,674
2,674
2,674
2,674

0,000
0,416
0,000
0,416

Hiptesis nula H o: La dieta ESTRICTA reduce el LDL de forma similar al resto de las dietas comparadas.

p g in a 898

C a pt u l o 9

Procedimiento de HSD de
Tukey
Dieta (I)

Dieta (J)

Control
Moderada
Estricta

Error estndar

Significacin

Moderada
Estricta

Diferencias de
medias (I J)
12,60
16,20

2,674
2,674

0,000
0,000

Control
Estricta
Control
Moderada

- 12,60
3,60
- 16,20
- 3,60

2,674
2,674
2,674
2,674

0,000
0,383
0,000
0,383

Hiptesis nula H o: La dieta ESTRICTA reduce el LDL de forma similar al resto de las dietas comparadas.

p g in a 899

C a pt u l o 9

Procedimiento de
Gabriel
Dieta (I)

Dieta (J)

Control
Moderada
Estricta

Error estndar

Significacin

Moderada
Estricta

Diferencias de
medias (I J)
12,60
16,20

2,674
2,674

0,000
0,000

Control
Estricta
Control
Moderada

- 12,60
3,60
- 16,20
- 3,60

2,674
2,674
2,674
2,674

0,000
0,459
0,000
0,459

Hiptesis nula H o: La dieta ESTRICTA reduce el LDL de forma similar al resto de las dietas comparadas.

p g in a 900

C a pt u l o 9

Procedimiento de
Sidak
Dieta (I)

Dieta (J)

Control
Moderada
Estricta

Error estndar

Significacin

Moderada
Estricta

Diferencias de
medias (I J)
12,60
16,20

2,674
2,674

0,000
0,000

Control
Estricta
Control
Moderada

- 12,60
3,60
- 16,20
- 3,60

2,674
2,674
2,674
2,674

0,000
0,467
0,000
0,467

Hiptesis nula H o: La dieta ESTRICTA reduce el LDL de forma similar al resto de las dietas comparadas.

p g in a 901

C a pt u l o 9

Procedimiento de la t de Dunnett
(bilateral)
Dieta (I)

Dieta (J)

Diferencias de
medias (I J)

Error estndar

Significacin

Control

Estricta

16,20

2,674

0,000

Moderada

Estricta

3,60

2,674

0,315

La prueba de Dunnett trata como un grupo como control y lo compara


con todos los dems grupos.

Hiptesis nula H o: La dieta ESTRICTA reduce el LDL de forma similar al resto de las dietas comparadas.

p g in a 902

C a pt u l o 9

Mtodo de
Duncan
Tipo de dieta
Test de Duncan

DIETA
Estricta

N
10

Subconjunto para alfa


= 0,05
1
2
-13,700

Moderada

10

-10,100

Control

10

Significacin
Comparacin de la dieta estricta
con la moderada (p > 0,1).

2,500
0,189

1,000

Comparacin de la dieta control con las


dems (1- p = 1,000; p = 0,000).

Hiptesis nula H o: La dieta CONTROL reduce el LDL de forma similar al resto de las dietas comparadas.
No existe diferencia entre la moderada y la estricta).

p g in a 903

C a pt u l o 9

Mito 1: La sonrisa de la
esfinge
ANOVA es un test paramtrico, es decir para usarlo se debe cumplir
la normalidad de la variable cuantitativa. Se cumple?
He observado que en los tres grupos de estudio slo tienen 10 sujetos.
Ante tan bajo volumen muestral
Cmo justificas esa supuesta normalidad?
Qu test has empleado para comprobar esa normalidad de la reduccin
del LDL?
Ests seguro que se cumplen los criterios para poder usar ANOVA?

p g in a 904

C a pt u l o 9

Realidad 1: Respuesta de
Edipo
Estadsticos descriptivos del LDL en cada dieta
Tipo de dieta Media
DE
Mediana 1
Reduccin del Control
LDL
Moderada
Estricta

2,500
-10,100
- 13,700

6,53
5,19
6,12

2,000
-8,500
-15,000

0,127
- 0,880
1,172

EE1

EE2

0,687
0,687
0,687

-0,732
-0,307
1,909

1,334
1,334
1,334

D istribucin normal

[Asimetria] < 2 EEasimetra


[Curtosis] < 2 EEcurtois

< 2 EE

< 2 EE

p g in a 905

C a pt u l o 9

p g in a 906

Realidad 1: Respuesta de
Edipo
Test de Kolmogorov-Smirnov

Reduccin del LDL

Tipo de dieta
Control
Moderada
Estricta

Ho: p > 0,05 NORMALIDAD


Ha: p < 0,05
ANORMALIDAD

Estadstico Z
0,488
0,657
0,582

g.l
10
10
10

Significacin
0,971
0,782
0,887

Test
paramtricos
Test NO
paramtricos

Los test de normalidad ensayados dan un valor de p NO significativo (p > 0,05) en los 3 grupos (tipos de
dieta). Por tanto no hay evidencias suficientes para rechazar la hiptesis nula de normalidad de la variable
reduccin del peso en ambas muestras: podemos usar test PARAMTRICOS.

C a pt u l o 9

p g in a 907

Test AN O VA:
O bservaciones
-Los resultados del contraste estadstico F en la prueba ANOVA son
sustancialmente vlidos aunque los datos no sean normales, en ese sentido se dice
que es una tcnica ROBUSTA frente a desviaciones de la normalidad.
-El efecto de desigualdad de las varianzas en los grupos sobre el contraste F y
los contrastes de medias dependen de que el nmero de observaciones en
cada grupo sea igual o muy distinto. Si todos los grupos tienen el mismo
nmero de observaciones, el contraste F es igualmente exacto aunque las
varianzas sean distintas. Es decir, podemos despreocuparnos de las varianzas
a efectos de contrastes de medias, siempre que haya aproximadamente el
mismo nmero de
observaciones por grupo, en caso contrario, diferencias entre las varianzas
pueden ser graves.

C a pt u l o 9

Pregunta de investigacin
El peso al nacer de los RN difiere segn la
localidad
de origen?
Variable PRED IC TO RA
C UALITATIVA
Ciudad de origen
policotmica
1.C euta
2. Algeciras
3. Tarifa
4. La Lnea

Cul es la prueba estadstica ms


adecuada?

Variable RESULTAD O
C UAN TITATIVA
Peso del RN
continua

p g in a 908

C a pt u l o 9

p g in a 909

Anlisis de la varianza para un


factor
Hiptesis nula Ho: El peso al nacer de los RN NO difiere segn la localidad
de
origen.
Hiptesis alternativa Ha: El peso al nacer de los RN difiere segn la localidad
de
origen.
Estadsticos
Peso al nacer del RN
Localidad de origen

Ceuta

Algeciras

Tarifa

La Lnea

Media

3366,2

3217,2

3188,4

3169,0

Desviacin estndar (S)

393,0

444,1

471,5

361,4

1146

214

80

186

Varianza entre grupos (EFECTO)

F=

Varianza residual (ERROR)

= 21,3

C a pt u l o 9

D istribucin de la F de
Snedecor

Ho

F calculada = 21,3

Ha

F tabulado = 3,23 para los grados de libertad de la muestra

p g in a 910

C a pt u l o 9

Anlisis de la varianza para un


factor
Peso del RN

gl

Media cuadrtica

Significacin

Inter-grupos
Intra-grupos

Suma de
cuadrados
10290751
260596358

3
1622

3430250,3
160663,599

21,351

0,000

Total

270887109

1625

p <
0,001
Hiptesis alternativa Ha: El peso al nacer de los RN difiere segn la
localidad
de origen.
F calculada= 21,3 > F tabulado = 3,23;

Cul es la ciudad donde los nios nacen con mayor peso?

p g in a 911

C a pt u l o 9

Pregunta de investigacin
Cul es la ciudad donde los nios nacen con mayor
peso?
Variable PRED IC TO RA
C UALITATIVA
Ciudad de origen
policotmica
1.C euta
2. Algeciras
3. Tarifa
4. La Lnea

Cul es la prueba estadstica ms


adecuada?

Variable RESULTAD O
C UAN TITATIVA
Peso del RN
continua

p g in a 912

C a pt u l o 9

CONTRASTES A POSTERIORI

Pruebas Post Hoc


paramtrico
Procedimiento de SCHEFFE

Procedimiento de BONFERRONI

Se comparan los
grupos de 2 en 2
Se comparan los
grupos de 2 en 2
Se comparan los
grupos de 2 en 2
Se comparan los
grupos de 2 en 2
Se comparan los
grupos de 2 en 2
Se obtienen
intervalos de medias

Mtodo de DUNNET

Mtodo de TUKEY

p g in a 913

C a pt u l o 9

Pruebas Post Hoc


Hiptesis nula Ho: Los RN que nacen en Ceuta tiene un peso medio
similar al resto de los RN de las otras ciudades.
Hiptesis alternativa Ha: Los RN que nacen en Ceuta tiene mayor
peso medio que el resto de las ciudades.
Ciudades
Ceuta

Algeciras

Tarifa

Ceuta

Algeciras

Tarifa

La Lnea

Ho =

Ho =

Ho =

Ha

Ha

Ha

Ho =

Ho =

Ha

Ha
Ho =
Ha

La Lnea

p g in a 914

C a pt u l o 9

p g in a 915

Procedimiento de
Scheffe
Ciudad (I)

Ciudad (J)

Ceuta

Algeciras

Tarifa
La Lnea

Error estndar

Significacin

Algeciras
Tarifa

Diferencias de
medias (I J)
148.92
177,79

29,85
46,35

0,000
0,002

La Lnea

197,13

31,69

0,000

Ceuta
Tarifa

- 148,92
28,87

29,85
52,53

0,000
0,960

Algeciras
La Lnea
La lnea

- 28,87
48,21
19,34

52,53
40,18
53,59

0,960
0,696
0,988

Ceuta
Ceuta

- 177,79
- 197,13
- 48,21
- 19,92

46,35
31,69
40,18
53,59

0,002
0,000
0,696
0,988

Tarifa

Hiptesis alternativa Ha: Los RN que nacen en Ceuta tiene mayor peso medio que el resto de las ciudades.

C a pt u l o 9

p g in a 916

Procedimiento de
Bonferroni
Ciudad (I)

Ciudad (J)

Ceuta

Algeciras

Tarifa
La Lnea

Error estndar

Significacin

Algeciras
Tarifa

Diferencias de
medias (I J)
148.92
177,79

29,85
46,35

0,000
0,001

La Lnea

197,13

31,69

0,000

Ceuta
Tarifa

- 148,92
28,87

29,85
52,53

0,000
1,000

Algeciras
La Lnea
La lnea

- 28,87
48,21
19,34

52,53
40,18
53,59

1,000
1,000

Ceuta
Ceuta

- 177,79
- 197,13
- 48,21
- 19,92

46,35
31,69
40,18
53,59

0,001
0,000
1,000
1,000

Tarifa

Hiptesis alternativa Ha: Los RN que nacen en Ceuta tiene mayor peso medio que el resto de las ciudades.

C a pt u l o 9

p g in a 917

Procedimiento de
Duncan
Procedencia
Test de Duncan

Subconjunto para alfa


= 0,05
Ciudad

La Lnea

186

3169,03

Tarifa

80

3188,38

Algeciras

214

Ceuta

114
6

3217,2
4
3366,16

0,960

0,298

1,000

Significacin

Comparacin de las 3 ciudades


(p > 0,1).

2 (Ceuta)

Comparacin de Ceuta con las dems


ciudades (1- p = 1,000; p = 0,000).

Hiptesis alternativa Ha: Los RN que nacen en Ceuta tiene mayor peso medio que el resto de las ciudades.

C a pt u l o 9

C ualitativa policotmica versus


cuantitativa
2 GRUPO S

Independient
es
Aparejad
os

PARAMTRIC O
S

NO
PARAMTRIC O S

AN O VA para
muestras
independientes

Kruskal-W allis

Anlisis
de
la
Varianza
para
muestras
dependientes
o
apareadas

Friedman

Variable predictora Cualitativa versus variable resultado


Cuantitativa.

p g in a 918

C a pt u l o 9

La prueba de Kruskal-W allis (comparar ms de dos


grupos)
-Para la comparacin de una misma variable cuantitativa en ms de tres grupos.
Es la prueba NO paramtrica ms potente para comparar >2 variables
continuas independientes. Es el similar al test de ANOVA para un factor.
-La prueba de Kruskal-Wallis, es una alternativa a la prueba F del ANOVA
(anlisis de varianza) para diseos de clasificacin simple donde NO se cumple
la normalidad de la variable cuantitativa.
-En este caso se comparan varios grupos de la variable predictora (cualitativa
POLICOTMICA) pero usando la MEDIANA de cada uno de ellos, en lugar de
las medias, donde, n es el total de datos.
2

k
12
Ri
H
3(n

n(n 1) i 1 ni 1)

Ho: La mediana de las k poblaciones consideradas son iguales y


Ha: Al menos una de las poblaciones tiene mediana distinta a las otras

p g in a 919

C a pt u l o 9

Pregunta de investigacin
Tienen la misma eficacia las dietas ensayadas en
grupos de
5 individuos para reducir el nivel de colesterol-LD L?
Variable PRED IC TO RA
C UALITATIVA
Tipos de dieta
policotmica
- D ieta control
- D ieta moderada
- D ieta estricta

Cul es la prueba estadstica ms


adecuada?

Variable RESULTAD O
C UAN TITATIVA
LD L- colesterol
continua

p g in a 920

C a pt u l o 9

Tienen la misma eficacia las dietas ensayadas para


reducir
el nivel de colesterol-LD L?
Variaciones en los niveles de colesterol-LDL (mg/dl) a los 6 meses de
seguimiento en 3 grupos de voluntarios asignados a diferentes medidas
de intervencin diettica.
Grupo Control
+ 13
+ 10
+2
-2
-8

Dieta moderada
-4
-8
-9
- 10
- 20

Dieta estricta
0
- 12
- 15
- 21

N=5
Media = + 3

N=5
Media = - 10,2
N = 14
Media total = - 6

N=4
Media = - 12

p g in a 921

C a pt u l o 9

Resultados: Prueba de KruskalW allis


Rangos

Cambio del LDLc

Tipo de DIETAS

Rango promedio

CONTROL

12,30

MODERADA

6,70

ESTRICTA

5,00

Total

15

Estadstico de contraste
N

15

Chi-cuadrado
gl

(K 1)

Significacin

7,308
2
0,026

p g in a 922

C a pt u l o 9

Test de Kruskal-W allis


Test de KruskalW allis
t

calculada < t

X2 H = 7,3 p = 0,026

calculada > t

tabulada p >

tabulada p <

0,05

0,05

Hiptesis nula H 0

Hiptesis alternativa H a

El cambio en el nivel de cLDL es


independiente de la intervencin
diettica

Las medias del cLDL de los


distintos grupos son diferentes
entre s, es decir NO pueden
considerarse iguales

Tienen la misma eficacia las dietas ensayadas para reducir el nivel de colesterolLDL?
NO
Cul es la intervencin diettica que ms reduce los niveles de colesterol-LDL?
?

p g in a 923

Cambio de el LDL (mg/dl)

+3

+10

- 10,2

0
-12

- 10

- 20

Control
Moderada
Estricta
Cambio en los niveles de colesterol-LDL (mg/dl) a los 6 meses de
tratamiento de intervencin diettica en 3 grupos de 5 voluntarios
asignados a diferentes dietas
C a pt u l o 9
p g in a 924

C a pt u l o 9

CONTRASTES A POSTERIORI

Pruebas Post Hoc no


paramtricas
Procedimiento de BONFERRONI

Procedimiento de IDK

Mtodo de HOLM

Mtodo de HOLLAND-COPENHAVER

p g in a 925

C a pt u l o 9

Med Clin (Barc)


2006;127:41-6

p g in a 926

C a pt u l o 9

p g in a 927

C a pt u l o 9

Pregunta de investigacin
Qu relacin existe entre los niveles de
calprotectina fecal
y las diferentes enfermedades orgnicas intestinales?
Variable PRED IC TO RA
C UALITATIVA
C ontroles
policotmica

- Plipos
- C ncer colorrectal
- Enfermedad inflamatoria
intestinal

Variable RESULTAD O
C UAN TITATIVA
C alprotectina fecal
continua

p g in a 928

C a pt u l o 9

4.000
3.600

Calprotectina fecal (g/g)

3.200
2.800
2.400

2.000
1.600
1.200
800

400
21
7

Normal

Cncer

Enfermedad

colorrectal

inflamatoria

Polipos

Diagnstico endoscpico

Cul es la prueba estadstica ms


adecuada?

intestinal

p g in a 929

C a pt u l o 9

Qu relacin existe entre los niveles de


calprotectina fecal
y las diferentes
enfermedades
orgnicas
intestinales?
Concentraciones
de calprotectina fecal
(g/g)
Grupos

Media

DE

Controles

117

113,7

113,1

Plipos

28

158,3

155,8

Cncer colorrectal

20

726,6

533,2

Enfermedad inflamatoria intestinal

25

2171,1

2133,6

Test de KRUSK AL-W ALLIS

p < 0,001

p g in a 930

C a pt u l o 9

Anlisis estadstico (fragmento del


texto)
El anlisis de los datos se llev a cabo mediante el programa estadstico SPSS 11.0. El
valor de la CPF se presenta como media y con un intervalo de confianza (IC) del 95%.
Se utiliz el test de Kruskal-Wallis para evaluar las diferencias entre los valores de CPF
entre los diferentes grupos y el coeficiente de Spearman para valorar la correlacin
entre este marcador y el ndice de actividad de la enfermedad en el grupo de pacientes
con enfermedad inflamatoria intestinal (EII).

p g in a 931

C a pt u l o 9

p g in a 932

Resultados (fragmento del


texto)

En la figura 1 se muestra los valores de CPF en los diferentes grupos de pacientes.


Se encontr un incremento del valor medio (DE) en pacientes con enfermedad
inflamatoria intestinal (EII) EII (2.171 [2.134] mg/kg) y CCR (727 [533] mg/kg) con
diferencias
estadsticamente significativas con respecto al grupo 1 (114 [113] g/g, p < 0,001).

D iscusin (fragmento del texto)


El presente trabajo muestra que la concentracin de CPF est significativamente
elevada en pacientes con procesos orgnicos en colon, fundamentalmente en el cncer
colorrectal y enfermedad inflamatoria intestinal (EII). Adems, los valores ms altos se
alcanzan
en pacientes con EII, y sus valores se correlacionan con el grado de actividad de la
enfermedad.

C a pt u l o 9

Mito 1: La sonrisa de la
esfinge
Me parece acertada la eleccin del test de KRUSKAL-WALLIS
como contraste de hiptesis, sin embargo
Qu test has empleado para comprobar esa supuesta anormalidad de
la calprotectina fecal?
Si la calprotectina no sigue la distribucin normal
Por qu utilizas la media y la desviacin estndar como
estadsticos descriptivos?

p g in a 933

C a pt u l o 9

p g in a 934

Mito 1: La sonrisa de la
esfinge
El test de KRUSKAL-WALLIS muestra un nivel crtico que es menor de 0,05,
y slo podemos rechazar la hiptesis de igualdad de promedios,
concluyendo que los grupos comparados (control, plipos, cncer colorrectal
y enfermedad inflamatoria intestinaI), difieren en los niveles de calprotectina
fecal. Sin embargo el test no te permite decir que en la enfermedad
inflamatoria intestinal los valores son mayores.
Por qu dices que los valores ms altos se alcanzan en pacientes
con enfermedad inflamatoria intestinal, cuando eso no te lo permite el
test estadstico empleado?

C a pt u l o 9

p g in a 935

Mito 1: La sonrisa de la
esfinge
Aunque existen procedimientos POCT HOC para efectuar comparaciones
mltiples tras obtener un estadstico H significativo, para analizar con SPSS
que grupo tiene un mayor valor de CPF puedes utilizar la U de MannWhitney para dos muestras independientes, pero acompaada de la
correccin de Bonferroni para controlar la probabilidad de cometer un error
alfa.
Puesto que con 4 grupos de la variable predictora; control (CT), polipos
(PL), cncer colorrectal (CCR) y enfermedad inflamatoria intestinal (EII),
necesitas hacer 6 comparaciones 2 a 2 (CT-PL, CT-CCR, CT-EII, PL-CCR,
PL-EII, CCR-EII), la aplicacin de la correccin de Bonferroni te llevar a
basar vuestras decisiones en un nivel de significacin de 0,05/6 = 0,0083.
Es decir, consideraremos que dos grupos comparados difieren
significativamente cuando el nivel crtico obtenido (p) sea inferior a 0,0083.

C a pt u l o 9

Test de KruskalW allis


VENTAJAS

INCONVENIENTES

Permite datos ordinales y cuantitativos


discretos

Menor potencia estadstica

No es necesaria la normalidad (test no


paramtrico)

Menor sensibilidad para detectar


diferencias entre grupos

El tamao muestral puede ser pequeo

No permite construir intervalos de


confianza

p g in a 936

C a pt u l o 9

Prueba de la
Mediana
-Su objetivo es comparar las medianas de dos muestras y determinar si
pertenecen a la misma poblacin o no.
-Se calcula la mediana de todos los datos conjuntamente. Despus, se divide
cada muestra en dos subgrupos: uno para aquellos datos que se siten por
encima de la mediana y otro para los que se siten por debajo.
-La prueba de chi-cuadrado determinar si las frecuencias observadas en cada
grupo difieren de las esperadas con respecto a una distribucin de frecuencias
que combine ambas muestras.
-Esta prueba est especialmente indicada cuando los datos sean extremos o
estn sesgados.

p g in a 937

C a pt u l o 9

Pregunta de investigacin
Tienen la misma eficacia las dietas ensayadas para
reducir
el nivel de colesterol-LD L?
Variable PRED IC TO RA
C UALITATIVA
Tipos de dieta
policotmica
- D ieta control
- D ieta moderada
- D ieta estricta

Cul es la prueba estadstica ms


adecuada?

Variable RESULTAD O
C UAN TITATIVA
LD L- colesterol
continua

p g in a 938

C a pt u l o 9

Grupo Control (n=10)

Dieta moderada (n=10)

Dieta estricta (n=10)

+ 13

+ 10

12

+2

15

10

21

-8

20

-10

+5

15

-18

-16

+8

-10

+2

16

-20

-2

-15

Media = + 2,5

Media = - 10,1

Media = - 13,7

p g in a 939

C a pt u l o 9

Prueba de la
Mediana
> Mediana
Mediana

Control

Tipo de dietas
Moderada

Estricta

9
1

4
6

1
9

Hay 3 casillas con frecuencia esperada menor de 5.


La frecuencia de casilla esperada mnima es de 4,7

Estadstico de contraste

LDL

30

Mediana

- 8,000

Chi-cuadrado

13,125

gl

(K 1)

Significacin

0,001

p g in a 940

C a pt u l o 9

Test de JonckheereTerpstra
-Cuando no se cumplen las condiciones para el ANOVA, hay tres tests
disponibles: H de Kruskal-Wallis, mediana y Jonckheere-Terpstra.
-El test H de Kruskal-Wallis, una extensin del test U de Mann-Whitney es
el anlogo no-paramtrico del ANOVA.
-El test de la mediana, que es una prueba ms general pero no tan potente,
detecta diferencias en la situacin y forma de las distribuciones. Ambas
pruebas asumen que no hay un ordenamiento a priori de las k poblaciones de
las que se han extrado las muestras.
-Cuando hay una ordenacin natural a priori (ascendente o descendente) de
las k poblaciones, es preferible usar el test de Jonckheere-Terpstra.

p g in a 941

C a pt u l o 9

74 pacientes ingresados en una UC I y queremos


comparar las estancias generadas en dicha unidad
entre tres grupos de pa- cientes clasificados en funcin
de la edad (jvenes, maduros y ancianos)
Variable PRED IC TO RA
1 C UALITATIVA
Grupos etarios
ordinal
- Jvenes
- Maduros
- Ancianos

Cul es el test estadstico ms


acertado?

Variable
RESULTAD O
Estancia
C UAN
TITATIVA
- D as

p g in a 942

C a pt u l o 9

Estadsticos
descriptivos
Variable resultado

ESTANCIA

Media

DE

EEM

Mediana

Variable predictora
Grupos etarios

JVENES

28

5,18

11,17

2,11

2,00

MADUROS

23

9,22

15,29

3,19

3,00

ANCIANOS

23

21,51

21,52

4,49

3,00

Variable resultado

ESTANCIA

EE1

EE1

Variable predictora
Grupos etarios

JVENES

28

3,944

0,441

16,048

0,858

MADUROS

23

2,760

0,481

8,430

0,935

ANCIANOS

23

2,290

0,481

5,682

0,935

Distribucin normal

p g in a 943

1 < 2 EE 1 2 < 2 EE 2

La variable resultado ESTANCIA, como casi todas las que se refieren al tiempo, es una variable conocida
por su distribucin alejada de lo normal. Si el tamao de los grupos que se estudian es pequeo menor
de 30, no sera adecuada la utilizacin de mtodos paramtricos (ANOVA) y deberamos recurrir a los
clsicos no paramtricos (KRUSKAL-WALLIS).

C a pt u l o 9

Medi
a
Media
Median
a

Median
a

p g in a 944

C a pt u l o 9

p g in a 945

Test de
normalidad
Variable resultado
ESTANCIA
Variable predictora
Grupos etarios

Test de Kolmogorov-Smirnov
N
Estadstico Z Significacin
Jvenes
Maduros
Ancianos
Total

28
23
23
74

2,301
1,668
1,236
2,829

0,000
0,008
0,097
0,000

Ho: p > 0,05 NORMALIDAD Test


paramtricos
Ha: p < 0,05 Test NO
paramtricos
El test de normalidad ensayado da un valor de p significativo (p < 0,05). Por tanto hay evidencias suficientes
para rechazar la hiptesis nula de normalidad de la variable ESTANCIA en UCI en los grupos. No se puede
asumir la normalidad.

C a pt u l o 9

Prueba de la homogeneidad de las


varianzas
Test de Variable
Levene
resultado ESTANCIA en UCI (das)
Estadstico de Levene

gl1

gl2

Significacin

3,707

71

0,022

El test de Levene (1960) se usa para contrastar si los 3 grupos comparados tienen la misma varianza, es
decir, la homogeneidad de varianzas. Para poder utilizar el anlisis de la varianza es necesario que las
varianzas son iguales para todos los grupos. De ah la importancia de verificar con el test de Levene esa
hiptesis.

Ho: Las varianzas de ambos grupos son


iguales
H
a: Existen diferencias entre las
varianzas
p > 0,05 (aceptamos la o
H <) 0,05 (rechazamos la hiptesis
p
nula)

ANOVA
KRUSKALWALLIS
ANOVA
KRUSKALWALLIS

p g in a 946

C a pt u l o 9

Reflexiones: existen varios incumplimientos


para el
AN O VA
1. Ausencia de normalidad.
2. Ausencia de homocedasticidad: el test de Levene para valorar la
homogeneidad de las variancias muestra que existen diferencias entre ellas (p
= 0,027).
3. Y existencia de valores anmalos (outliers) que impiden la utilizacin de
mtodos paramtricos (ANOVA clsico).
Tenemos que recurrir a los clsicos no paramtricos de Kruskal-Wallis o, mejor, a
mtodos robustos como la generalizacin robusta del test Welch, que utiliza
medias -recortadas muestrales y es capaz de detectar diferencias significativas
entre los grupos.

p g in a 947

C a pt u l o 9

Resultados: Prueba H de KruskalW allis


Clculo de Rangos
GRUPO ETARIO

Rango promedio

JVENES

28

31,00

MADUROS

23

38,37

ANCIANOS

23

44,54

Total

74

Estadstico de contraste
Chi-cuadrado
gl

(K 1)

Significacin

ESTANCIA
5,234
2
0,073

Hiptesis nula Ho : La estancia en UCI de los pacientes estudiados NO difiere segn


el
grupo
etario.

p g in a 948

C a pt u l o 9

Test de Jonckheere-Terpstra
(J-T)
Estadstico de contraste

ESTANCIA

Nmero de niveles

74

Estadstico de J-T observado

1136,500

Media del estadstico J-T

908,500

Desviacin tpica del estadstico J-T

99,118

Estadstico de J-T tipificado

2,305

Significacin (bilateral)

0,021

Hiptesis alternativa Ha : La estancia en UCI de los pacientes estudiados difiere segn


el
grupo
etario.

p g in a 949

C a pt u l o 9

C ualitativa policotmica versus


cuantitativa
2 GRUPO S

Independient
es
Aparejad
os

PARAMTRIC O
S

NO
PARAMTRIC O S

Anlisis de la
Varianza para
muestras independientes

Kruskal-W allis

AN O VA
para medidas repetidas

Friedman

Variable predictora Cualitativa versus variable resultado


Cuantitativa.

p g in a 950

C a pt u l o 9

Anlisis de la Varianza (AN O VA) para


muestras dependientes o apareadas
(medidas repetidas)
- Anlisis de la variancia (ANOVA) se utiliza para la obtencin del coeficiente de
correlacin intraclase (CCI).
-En los estudios que evalan la concordancia, cada sujeto es examinado por
ms de un observador, siendo adecuado realizar un anlisis de la variancia
(ANOVA) para medidas repetidas (generalizacin de la prueba de la t de
Student para datos apareados).
-Este tipo de diseo permite aislar la variabilidad entre pacientes y
concentrarnos en la variabilidad debida al factor de inters; en el anlisis de
la variancia simple, la variabilidad entre pacientes est incluida en la
variabilidad residual.

p g in a 951

C a pt u l o 9

p g in a 952

Experimento diseado para estudiar el efecto del paso del tiempo sobre la calidad del recuerdo y realizacin
prctica de estudios con aplicacin de la estadstica de los 30 alumnos que han realizado el curso de
BIOESTADSTICA APLICADA A LAS CIENCIAS DE LA SALUD. Se evala el grado de conocimientos con
el mismo examen de 20 preguntas tipo test en 4 momentos diferentes; inmediatamente despus de finalizar
el curso, al ao, a los 2 aos, y a los 3 aos del curso. Se valora el nmero de respuestas correctas.
TIEMPO

Media

DE

EE1

EE1

INICIO

30

15,53

2,776

0,014

0,427

- 0,946

0,833

PRIMER AO

30

12,00

2,626

- 0,159

0,427

- 0,515

0,833

SEGUNDO AO

30

9,37

2,282

0,334

0,427

0,412

0,833

TERCER AO

30

8,03

2,539

0,366

0,427

- 0,647

0,833

TIEMPO

Test de Kolmogorov-Smirnov
N

Estadstico Z

Significacin

INICIO

30

0,618

0,839

PRIMER AO

30

0,548

0,925

SEGUNDO AO

30

0,679

0,746

TERCER AO

30

0,648

0,795

C a pt u l o 9

C omparacin de > de 2 grupos


apareados
Test de Kolmogorov-Smirnov
p > 0,05; Normalidad

Prueba de la esfericidad de Mauchly


p > 0,05
ESFERICIDAD
Contrastes UNIVARIADOS

p < 0,05

p < 0,05
NO ESFERICIDAD
Contrastes MULTIVARIADOS

p < 0,05

POST HOC: Procedimiento de BONFERRONI: Comparacin por pares

p g in a 953

C a pt u l o 9

p g in a 954

Prueba de la homogeneidad de las


varianzas
Prueba
de la esfericidad
dedeMauchly
Efecto intra-sujetos
Prueba de esfericidad
Mauchly
TIEMPO

W de Mauchly

Chi cuadrado

g.l

Significacin

0,803

6,096

0,297

Para el ANOVA de medidas repetidas es conveniente suponer que las varianzas de las diferencias entre
cada dos niveles del factor TIEMPO son iguales. Con los 4 niveles, tenemos 6 pares de combinaciones
dos a dos entre niveles; inicio-1ao, inicio-2ao, inicio-3 ao, 1ao-2ao, 1 ao-3ao, 2ao3ao. Calculando las diferencias entre las puntuaciones de esos 6 pares, tendremos 6 nuevas variables.
Este supuesto equivale a afirmar que la matriz de varianzas-covarianzas es circular o esfrico. Para el
procedimiento de medidas repetidas esto se realiza con la prueba de esfericidad de MAUCHLY. Puesto que
la significacin estadstica asociada al estadstico W de Mauchly es de 0,297, (mayor de 0,05), NO podemos
rechazar la hiptesis nula de esfericidad. La matriz de las varianzas-covarianzas es ESFRICA.

C a pt u l o 9

p g in a 955

Prueba de la esfericidad de
Mauchly
Efecto intra-sujetos
Epsilon
TIEMPO

Greenhous e-Geisser

Hunh-Feldt

Lmite-interior

0,865

0,958

0,333

Cuando el estadstico W de Mauchly nos lleve al rechazo de la esfericidad (NO ESFERICIDAD), podemos
basar nuestra decisin en los estadsticos F MULTIVARIADOS que no les afecta la falta de esfericidad, o
bien podemos utilizar el estadstico F UNIVARIADO aplicando el ndice corrector EPSILON.
El ndice corrector EPSILON expresa el grado en que la matriz de varianzas-covarianzas se aleja de la
esfericidad. En condiciones de esfericidad perfecta, psilon vale 1. En este caso psilon es alto porque hay
ESFERICIDAD.
Existen 3 estimaciones del ndice psilon, Greenhous e-Geisser es la ms conservadora. El lmite inferior
expresa el valor que adoptara psilon en caso de incumplimiento extremo de la esfericidad. El valor
de EPSILON se utiliza para corregir el valor del F UNIVARIADO. En este caso NO es necesario utilizar
EPSILON porque se cumple la ESFERICIDAD (p > 0,05).

C a pt u l o 9

TIEMPO

Contrastes MULTIVARIADOS
Valor

GI de la hiptesis

GI del error Significacin

Traza de Pillai

0,902

83,25

27

0,000

Lambda de Wilks

0,098

83,25

27

0,000

Traza de Hotelling

9,250

83,25

27

0,000

Raz mayor de Roy

9,250

83,25

27

0,000

La tabla contiene 4 estadsticos multivariados: Traza de Pillai, Lambda de Wilks, Traza de Hotelling, Raz
mayor de Roy. Se interpretan de la misma forma que todos los estadsticos ya estudiados; puesto que la
significacin de cada uno de ellos (p < 0,001) es menor que 0,05, podemos rechazar la hiptesis nula
de igualdad de las medias y concluir que la calidad del recuerdo de los conocimientos de bioestadstica
adquiridos no es la misma en los 4 momentos temporales definidos en el factor tiempo.

Ha: La calidad del recuerdo de los conocimientos de bioestadstica NO es la misma


en 4 momentos
los
considerados.

p g in a 956

C a pt u l o 9

TIEMPO

p g in a 957

Contrastes UNIVARIADOS: Prueba de efectos INTRA-SUJETOS


Suma de cuadrados gl
tipo III

Media cuadrtica

Significacin

Esfericidad asumida

984,067

328,022

103,236

0,000

Greenhouse-Geisser

984,067

2,596

379,006

103,236

0,000

Huynh-Feldt

984,067

2,874

342,361

103,236

0,000

Lmite-inferior

984,067

1,000

984,067

103,236

0,000

Si de cumple la ESFERICIDAD (homogeneidad de las varianzas) es preferible utilizar la aproximacin


UNIVARIADA (esfericidad asumida), ya que en condiciones de esfericidad, el estadstico UNIVARIADO F
(F= 103,236) es ms potente que los estadsticos MULTIVARIADOS de la tabla anterior (F= 83,246), sobre
todo con muestras pequeas, aunque, si ambos estadsticos conducen a la misma conclusin es irrelevante
utilizar uno u otro.
Observando los resultados de esta tabla vemos que las cuatro versiones del estadstico F UNIVARIADO (la
no corregida y las 3 corregidas con el valor de EPSLION) conducen a la misma conclusin, que coincide
con la ya alcanzada en la tabla de contrastes MULTIVARIADOS, por tanto, de nuevo rechazamos la Ho
(igualdad de medias) y aceptamos la Ha.
Ha: la calidad del recuerdo de los conocimientos NO es la misma en los 4 momentos considerados.

C a pt u l o 9

TIEMPO

MEDIAS MARGINALES ESTIMADAS


Media

Error tpico

Lmite inferior del IC95% Lmite inferior del IC95%

INICIO

15,553

0,507

14,494

16,570

1 ao

12,000

0,479

11,019

12,981

2 ao

9,367

0,417

8,515

10,219

3 ao

8,033

0,464

7,085

8,981

Se observa en la tabla que la media de los conocimientos adquiridos en el curso van disminuyendo
paulatinamente con el paso del TIEMPO.

Esta disminucin es estadsticamente significativa en cada uno de


los
estratos temporales?

p g in a 958

C a pt u l o 9

Medidas marginales estimadas

Grfico de perfil representando el efecto del


factor
tiempo
Se observa en el grfico que los conocimientos
16
14

adquiridos en el curso van disminuyendo


paulativamentre con el paso del TIEMPO en
todos los intervalos ensayados (p< 0,05)

12

10

8
Inicio
1 ao
2 ao
3 ao

TIEMPO

p g in a 959

C a pt u l o 9

TIEMPO

p g in a 960

Pruebas de CONTRASTES INTRA-SUJETOS


Suma de cuadrados gl
tipo III

Media cuadrtica

Significacin

LINEAL

947,527

947,527

206,956

0,000

CUADRTICO

36,300

36,300

13,815

0,001

CBICO

0,240

0,240

0,103

0,750

La tabla ofrece contrastes polinmicos, de tipo ortogonal, mostrando tantos contrastes como niveles tiene el
factor tiempo menos uno, como el factor tiempo tiene 4 niveles, aparecen 3 contrastes (lineal, cuadrtico y
cbico).
Si miramos la significacin (p) asociados a cada estadstico F podemos rechazar las hiptesis nulas
referidas a los componentes lineal y cuadrtico, pero no la referida al componente cbico. Podemos
concluir que las medias de los conocimientos adquiridos en el curso en cada momento temporal se ajustan
significativamente tanto a una lnea recta (componente lineal) como a una curva (componente cuadrtico).
Pero como existe ms de un componente significativo se elige el de mayor orden (modelo lineal) (mayor
valor de F, y mejor significacin). El grafico del perfil siguiente nos ayuda a comprender con ms claridad lo
que est ocurriendo.

C a pt u l o 9

Pruebas Post Hoc Anova


apareado
TIEMPOS
INICIO

1 AO

2 AO

INICIO

1 AO

2 AO

3 AO

Ho =

Ho =

Ho =

Ha

Ha

Ha

Ho =

Ho =

Ha

Ha
Ho =
Ha

3 AO

p g in a 961

C a pt u l o 9

Procedimiento de Bonferroni: C omparacin por


pares
Tiempo (I)

Tiempo (J)

Inicio

1 ao

2 ao
3 ao

Error estndar

Significacin

1 ao
2 ao

Diferencias de
medias (I J)
3,533
6,167

0,417
0,407

0,000
0,000

3 ao

7,500

0,544

0,000

Inicio
2 ao

- 3,533
2,633

0,417
0,405

0,000
0,000

1
3 ao
3 ao

- 2,633
3,967
1,333

0,405
0,531
0,440

0,000
0,031

Inicio
Inicio
1 ao
2 ao

- 6,167
- 7,500
- 3,9967
- 1,333

0,401
0,544
0,531
0,440

0,000
0,000
0,000
0,031

p g in a 962

C a pt u l o 9

Relacin entre las glucemias medias, la


hemoglobina glicosilada y el riesgo de
aparicin de complicaciones de la diabetes
GLUCEMIAS MEDIAS

HbA1c (%)

RIESGO DE COMPLICACIONES

60
90

4
5

RIESGO BAJO

120
150

6
7

180
210

8
9

240
270

10
11

300
330

12
13

360

14

RIESGO MODERADO (control aceptable hasta 7,5%)

RIESGO AUMENTADO
RIESGO ALTO

RIESGO CRTICO

MAL CONTROL
METABLICO
(> 9,5%)

p g in a 963

C a pt u l o 9

Objetivo: Conocer si el curso de educacin diabetolgica mejora el


metablico de un grupo de pacientes diabticos mal controlados (HbA
control
1c >
8,0).
Material: Grupo de 30 individuos antes y despus de un programa
de educacin para el control diabtico (ECD).
Mtodo: Se evala la hemoglobina glicosilada antes (HbA1c PRE) y
del
ECD (HbA1c
despus
POST).
Se define una nueva variable HbA DIF = HbA PRE HbA
POST.
1c

Hiptesis 1c
nula Ho X antes = X despus
( DIF = HbA1c
1cPRE HbA1cPOST = 0)
Hiptesis alternativa H1 X antes X despus
(DIF = HbA1cPRE HbA1cPOST 0)

p g in a 964

C a pt u l o 9

El curso de educacin diabetolgica (EC D ) mejora el


con- trol diabtico de un grupo de pacientes mal
controlados (HbA > 8,0)?
1c

Diabetes = Educacin
1c

HbA
D ESPUS
1c

Cul es la prueba estadstica ms


adecuada?

p g in a 965

C a pt u l o 9

Resultados 1
objetivo
HbA1c

Media

DE

EE1

EE2

INICIAL (PRE)

30

10,150

1,77

0,745

0,427

- 0,516

0,833

PRIMER AO (POST)

30

7,130

0,932

1,408

0,427

2,619

0,833

HbA1c

p g in a 966

Test de Kolmogorov-Smirnov
N

INICIAL (PRE) 30

Estadstico Z

Significacin

0,827

0,501

Experimento
diseado
PRIMER AO
30 con dos objetivos:
1,034
0,235
1.Se evala el control metablico con los niveles de HbA1c antes y despus (al ao) de la imparticin de un
curso intensivo de educacin diabetolgica a un grupo de 30 pacientes mal controlados (HbA1c > 8) para
comprobar si el curso ha sido til en la mejora del control glucmico a CORTO plazo.
2.Estudiar el efecto del paso del tiempo (LARGO plazo) sobre el control metablico tras la realizacin de un
curso de educacin diabetolgica en un grupo de 30 pacientes con diabetes mal controlada (HbA1c > 8),
realizando controles sucesivamente cada ao (2, 3 y 4 ao). Se quiere valorar si es necesario un nuevo
curso y con que frecuencia debera realizarse.

C a pt u l o 9

Resultados 1
objetivo
Variables

Media

Error estndar de
la media (EEM)

30

Desviacin
estndar
(s)
1,772

HbA PRE

10,150
7,130

30

0,932

0,170

Correlacin (r)
0,772

Significacin
0,000

0,323

1c

HbA POST
1c

Variable
HbA PRE versus HbA POST
1c

Variables

HbA PRE

N
30

1c

Diferencias relacionadas Intervalo de


t calculada
confianza de la
diferencia
Media
s
EEM
Inferior Superior 13,692
3,020
1,208 0,2206 2,569
3,471

gl

29 0,000

1c

HbA POST
1c

t calculada < t tabulada


t calculada > t tabulada

Significacin
bilateral

p>0,05 (aceptamos la
Ho)
p<0,05 (rechazamos la hiptesis
nula)

p g in a 967

C a pt u l o 9

Resultados 2
objetivo
HbA1c

Media

DE

EE1

EE2

PRIMER AO

30

7,130

0,932

1,408

0,427

2,619

0,833

SEGUNDO AO

30

7,207

0,835

1,110

0,427

1,805

0,833

TERCER AO

30

7,707

0,712

1,056

0,427

0,998

0,833

CUARTO AO

30

9,050

0,910

0,652

0,427

- 0,084

0,833

HbA1c

Test de Kolmogorov-Smirnov
N

Estadstico Z

Significacin

PRIMER AO

30

1,034

0,235

SEGUNDO AO

30

0,901

0,392

TERCER AO

30

0,990

0,281

CUARTO AO

30

0,737

0,649

p g in a 968

2. Estudiar el efecto del paso del tiempo (LARGO plazo) sobre el control metablico tras la realizacin de
un curso de educacin diabetolgica en un grupo de 30 pacientes con diabetes mal controlada (HbA1c > 8),
realizando controles sucesivamente cada ao (2, 3 y 4 ao). Se quiera valorar si es necesario un nuevo
curso y con que frecuencia debera realizarse.

C a pt u l o 9

Prueba de la homogeneidad de las


varianzas
Prueba
de la esfericidad
dedeMauchly
Efecto intra-sujetos
Prueba de esfericidad
Mauchly
HbA1c

W de Mauchly

Chi cuadrado

g.l

Significacin

0,368

27,717

0,000

Para el ANOVA de medidas repetidas es conveniente que las varianzas de las diferencias entre cada
dos niveles del factor TIEMPO son iguales. Con los 4 niveles, tenemos 6 pares de combinaciones dos a
dos entre niveles; 1ao-2ao, 1 ao-3ao, 1ao-4ao, 2ao-3ao, 2ao-4ao, 3ao- 4ao.
Calculando las diferencias entre las puntuaciones de esos 6 pares, tendremos 6 nuevas variables. Este
supuesto equivale a afirmar que la matriz de varianzas es circular o esfrico. Para el procedimiento de
medidas repetidas esto se realiza con la prueba de esfericidad de MAUCHLY. Puesto que la significacin
estadstica asociada al estadstico W de Mauchly es p < 0,001, (MENOR de 0,05), podemos rechazar la
hiptesis nula de esfericidad.
NO HAY ESFERICIDAD.

p g in a 969

C a pt u l o 9

p g in a 970

Prueba de la esfericidad de
Mauchly
Efecto intra-sujetos
Epsilon
TIEMPO

Greenhous e-Geisser

Hunh-Feldt

Lmite-interior

0,654

0,701

0,333

Cuando el estadstico W de Mauchly nos lleve al rechazo de la esfericidad (NO ESFERICIDAD), podemos
basar nuestra decisin en los estadsticos F MULTIVARIADOS que no les afecta la falta de esfericidad, o
bien podemos utilizar el estadstico F UNIVARIADO corregido aplicando el ndice corrector EPSILON.
El ndice corrector EPSILON expresa el grado en que la matriz de varianzas-covarianzas se aleja de la
esfericidad. En condiciones de esfericidad perfecta, psilon vale 1. Cuanto menor es psilon menor es la
esfericidad.
Existen 3 estimaciones del ndice psilon, Greenhous e-Geisser es la ms conservadora. El lmite inferior
expresa el valor que adoptara psilon en caso de incumplimiento extremo de la esfericidad. El valor de
EPSILON se utiliza para corregir el valor del F UNIVARIADO cuando no se cumple la esfericidad.

C a pt u l o 9

TIEMPO

p g in a 971

Contrastes UNIVARIADOS: Prueba de efectos INTRA-SUJETOS


Suma de cuadrados gl
tipo III

Media cuadrtica

Significacin

Esfericidad asumida

71,079

23,693

238,282

0,000

Greenhouse-Geisser

71,079

1,961

36,238

238,282

0,000

Huynh-Feldt

71,079

2,102

33,810

238,282

0,000

Lmite-inferior

71,079

1,000

71,079

238,282

0,000

Si se cumple la ESFERICIDAD es preferible utilizar la aproximacin UNIVARIADA (versin esfericidad


asumida), pues en condiciones de esfericidad el estadstico F UNIVARIADO es ms potente que los
estadsticos MULTIVARIADOS, sobre todo con muestras pequeas.
Si NO se cumple la ESFERICIDAD es preferible utilizar los estadsticos F MULTIVARIADOS (como en este
caso).

C a pt u l o 9

C omparacin de > de 2 grupos


apareados
Test de Kolmogorov-Smirnov
p > 0,05; Normalidad

Prueba de la esfericidad de Mauchly


p > 0,05
ESFERICIDAD
Contrastes UNIVARIADOS

p < 0,05

p < 0,05
NO ESFERICIDAD
Contrastes MULTIVARIADOS

p < 0,05

POST HOC: Procedimiento de BONFERRONI: Comparacin por pares

p g in a 972

C a pt u l o 9

TIEMPO

p g in a 973

Contrastes MULTIVARIADOS
Valor

GI de la hiptesis

GI del error Significacin

Traza de Pillai

0,931

120,741

27

0,000

Lambda de Wilks

0,069

120,741

27

0,000

Traza de Hotelling

13,416

120,741

27

0,000

Raz mayor de Roy

13,416

120,741

27

0,000

La tabla contiene 4 estadsticos multivariados: Traza de Pillai, Lambda de Wilks, Traza de Hotelling, Raz
mayor de Roy. Se interpretan de la misma forma que todos los estadsticos ya estudiados; puesto que la
significacin de cada uno de ellos (p = 0,000) es menor que 0,05, podemos rechazar la hiptesis nula de
igualdad de las medias y concluir que el control metablico debido a la educacin del diabtico por el curso
no es el mismo en los 4 momentos temporales definidos en el factor tiempo.

Ha: el control metablico debido a la educacin del diabtico por el


curso
no
es la misma en los 4 momentos temporales definidos en el
factor
tiempo.

C a pt u l o 9

TIEMPO

MEDIAS MARGINALES ESTIMADAS


Media

Error tpico

Lmite inferior del IC95% Lmite inferior del IC95%

1 ao

7,130

0,170

6,782

7,478

2 ao

7,207

0,152

6,895

7,518

3 ao

7,707

0,130

7,441

7,973

4 ao

9,050

0,166

8,710

9,390

Se observa en la tabla que la media de la hemoglobina glicosilada va aumentando paulatinamente con el


paso del TIEMPO.

Este aumento es estadsticamente significativo en cada uno de


los
estratos?

p g in a 974

C a pt u l o 9

Grfico de perfil representando el efecto del


factor
Se observa en el grfico que la HbA1c
9,5
tiempo
va aumentando con el paso del TIEMPO,
Medidas marginales estimadas

9,0

siendo este aumento significativo (p < 0,05) al


pasar del 2 ao al 3 ao, y del 3 al 4 ao.

8,5

8,0

7,5

7,0
1 ao

2 ao

TIEMPO

Qu test has utilizado para llegar a esa


conclusin?

3 ao

4 ao

p g in a 975

C a pt u l o 9

Procedimiento de Bonferroni: C omparacin por


pares
Tiempo (I)

Tiempo (J)

1 ao

2 ao

3 ao
4 ao

Error estndar

Significacin

2 ao
3 ao

Diferencias de
medias (I J)
- 0,077
0,577

0,041
0,070

0,425
0,000

4 ao

- 1,920

0,098

0,000

1 ao
3 ao

0,077
- 0,500

0,041
0,068

0,425
0,000

2
4 ao
4 ao

-0,500
1,843
- 1,343

0,068
0,104
0,090

0,000
0,000

1 ao
1 ao
2 ao
3 ao

0,577
1,920
1,843
1,343

0,070
0,098
0,104
0,090

0,000
0,000
0,000
0,000

p g in a 976

C a pt u l o 9

C ualitativa policotmica versus


cuantitativa
2 GRUPO S

Independient
es
Aparejad
os

PARAMTRIC O
S

NO
PARAMTRIC O S

Anlisis de la
Varianza para
muestras independientes

Kruskal-W allis

Anlisis
de
la
Varianza
para
muestras
dependientes
o
apareadas

Friedman

Variable predictora Cualitativa versus variable resultado


Cuantitativa.

p g in a 977

C a pt u l o 9

p g in a 978

Existen diferencias en el tiempo de reaccin frente


a los 3
frmacos ensayados?
A

RESPUESTA
ATiempo

A
RESPUESTA
BTiempo

Cul es el test estadstico ms


adecuado?

B
RESPUESTA
CTiempo C

C a pt u l o 9

p g in a 979

Test de Friedman
- Es la versin NO PARAMTRICA del ANOVA para muestras apareadas.
- Utiliza la modificacin estadstica de Iman & Davenport (1980) que lo hace
menos conservador.
-El valor de z de cada hiptesis se puede utilizar para calcular la
probabilidad de error (valor p) mediante la distribucin normal.
- Se cumplen las condiciones impuestas por el test ANOVA?
SI: Utilizar ANOVA
NO: Utilizar el test de FRIEDMAN

C a pt u l o 9

Se ha medido el tiempo de la reaccin farmacolgica de 10 pacientes a


3 medicamentos diferentes.
Paciente

Frmaco A

Frmaco B

Frmaco C

10

10

15

10

15

20

11

15

12

12

10

12

15

10

15

14

12

18

10

14

17

12

10

10

14

16

Ho: No existen diferencias entre los tiempos de reaccin frente a los 3 frmacos.
Ha: Existen diferencias entre los tiempos de reaccin frente a los 3 frmacos.

p g in a 980

C a pt u l o 9

Test de
Friedman

Estadstica descriptiva

Tratamiento

Mean

Standars Desviation

Minimum

Maximum

Frmaco A

10

10,40

2,458

7,00

15,00

Frmaco B

10

12,30

2,162

9,00

15,00

Frmaco C

10

14,40

3,565

8,00

20,00

Ranks

Friedman test Statistics

Tratamiento

Promedio de rangos

Frmaco A

1,35

Chi cuadrado

Frmaco B

2,00

gl

Frmaco C

2,65

Significacin

10
(K 1)

9,135
2
0,010

Ha: Existen diferencias entre los tiempos de reaccin frente a los 3


frmacos.

p g in a 981

C a pt u l o 9

C oeficiente de concordancia W de Kendall


-Mide le grado de concordancia entre un grupo de elementos y un grupo
de caractersticas.
- Si la concordancia es mxima W=1, si la concordancia es mnima
W=0.

W=

S
1/12 K2 (N3 N) K Li

Donde:
w = coeficiente de concordancia de Kendall.
S = suma de los cuadrados de las diferencias observadas con respecto a un promedio.
N = Tamao de la muestra en funcin del nmero de tripletes, tetrapletes, quintupletes, etc.
K = nmero de variables incluidas.
Li = sumatoria de las ligas o empates entre los rangos.

p g in a 982

C a pt u l o 9

C oeficiente de concordancia W de Kendall


- El coeficiente W de Kendall y el estadstico 2 de Friedman
son aplicables al mismo tipo de situaciones.
- La hiptesis nula de que los tratamientos aplicados son iguales en
su efectividad es exactamente lo mismo que mantener la hiptesis
nula de ausencia de concordancia en los resultados de los
tratamientos ensayados.

p g in a 983

C a pt u l o 9

Existen diferencias en la medida de la frecuencia


cardaca en los tres mdicos evaluados?
Mdico JEFE
SERVIC IOA

Mdico
RESID ENTE
B

MED IDA A
10
PAC IENTES

FC A
MED ID A B
FC B

Mdico
AD JUNTO
C

Cul es el test estadstico ms


adecuado?

MED IDA C
FC C

p g in a 984

C a pt u l o 9

p g in a 985

Comparacin de las mediciones consecutivas de la FRECUENCIA CARDACA en


pulsaciones por minuto (ppm) en 10 pacientes realizada por tres mdicos diferentes: un
mdico A, jefe del servicio, un mdico B en periodo de formacin, y un mdico C
adjunto del mismo departamento.
Pacientes

Mdico JEFE
SERVICIO (A)

Medico
RESIDENTE (B)

Mdico ADJUNTO (C)

75

80

74

74

84

72

76

81

75

79

83

80

82

92

84

83

88

82

85

90

84

87

92

86

87

92

88

10

88

93

88

Media

81,6

87,5

81,3

DE

5,3

5,04

5,85

C a pt u l o 9

Test de
Friedman

Estadsticos descriptivos

Mdico

Media

Desviacin estndar

Mnimo

Mximo

JEFE A

10

81,6

5,23

74

88

RESIDENTE B

10

87,5

5,04

80

93

ADJUNTO C

10

81,3

5,85

72

88

Rangos

Estadstico de contraste prueba de Friedman

Promedio de rangos

10

JEFE A

1,35

Chi cuadrado

RESIDENTE B

2,00

gl

ADJUNTO C

2,65

Significacin

(K 1)

15,846
2
0,000

Ha: Existen diferencias entre la medida de la frecuencia cardiaca en los tres


mdicos.

p g in a 986

C a pt u l o 9

C oeficiente de concordancia W de
Kendall
Rangos

Estadstico de contraste prueba de Kendall

Promedio de rangos

10

JEFE A

1,35

W de Kendall (*)

0,792

RESIDENTE B

2,00

Chi cuadrado

15,846

ADJUNTO C

2,65

gl

(K 1)

Significacin

2
0,000

(*) Coeficiente de concordancia de Kendall

Ha: Existen diferencias entre la medida de la frecuencia cardiaca en los tres


mdicos.

p g in a 987

C a pt u l o 9

Experimento diseado para estudiar el efecto del paso del tiempo sobre la calidad del
recuerdo y realizacin prctica de estudios con aplicacin de la estadstica de los 10
alumnos que han realizado el curso de BIOESTADSTICA APLICADA A LAS
CIENCIAS DE LA SALUD. Se evala el grado de conocimientos con el mismo examen
de 20 preguntas tipo test en 4 momentos diferentes; inmediatamente despus de
finalizar el curso, al ao, a los 2 aos, y a los 3 aos del curso.

La calidad y cantidad del recuerdo de los conocimientos sobre


bioestadstica es la misma en los 4 momentos considerados?

p g in a 988

C a pt u l o 9

Respuestas acertadas en funcin del tiempo transcurrido desde la realizacin del curso
Alumnos

Tiempo 0

1 ao

2 ao

3 ao

16

12

12

10

12

10

10

15

13

11

18

12

12

12

13

13

10

18

16

10

13

15

20

11

10

14

12

11

Cul es el test estadstico ms


adecuado?

p g in a 989

C a pt u l o 9

Test de
Friedman

Estadsticos descriptivos

Tiempo

Media

Desviacin estndar

Mnimo

Mximo

INICIO

10

15,30

2,710

12

20

1 AO

10

11,10

2,514

16

2 AO

10

9,20

1,932

12

3 AO

10

9,90

2,183

13

Rangos

Estadstico de contraste prueba de Friedman

Rango promedio

10

INICIO

3,95

Chi cuadrado

1 AO

2,50

gl

2 AO

1,70

Significacin

3 AO

1,85

(K 1)

20,868
3
0,000

Ha: la calidad del recuerdo de los conocimientos no es la misma en los 4


momentos
considerados.

p g in a 990

C a pt u l o 9

C oeficiente de concordancia W de
Kendall
Rangos

Estadstico de contraste prueba de Kendall

Rango promedio

10

INICIO

3,95

W de Kendall (*)

0,698

1 AO

2,50

Chi cuadrado

20,868

2 AO

1,70

gl

3 AO

1,85

Significacin

(K 1)

3
0,000

(*) Coeficiente de concordancia de Kendall

Ha: La calidad del recuerdo de los conocimientos no es la misma en los 4


momentos
considerados

p g in a 991

C a pt u l o 10

C aptulo 10
Publicacin Bioestadstica: Medidas de concordancia.
Variables cualitativas.

D r. Jacobo D az Portillo
Coordinador de Formacin Continuada
Hospital Universitario de Ceuta

p g in a 992

C a pt u l o 10

Medidas de concordancia
- Fiabilidad de los procedimientos de medida empleados.
- Fleis: ni el ms elegante de los diseos seria capaz de paliar el
dao
causado por un sistema de medida poco fiable.
- Error de medida: Variabilidad entre observadores.
- Estudios de fiabilidad.
- Sesgo entre observadores.
- Concordancia entre observadores.
- Indicadores del grado de variabilidad.
- Coeficiente de correlacin intraclase (variables cuantitativas).
- ndice de Kappa (variables cualitativas tipo categricos).

p g in a 993

C a pt u l o 10

Valoracin de la fiabilidad externa de las publicaciones de dos


revistas cientficas durante el ltimo quinquenio.
En 5 (4 de JAMA y uno de MC) de los 12 artculos se han llevado a
cabo tratamientos estadsticos no idneos para medir la
concordancia, mediante las siguientes pruebas de contraste de
hiptesis:
- Comparacin de medias con la t de Student
- Test exacto de Fisher,
- Test de chi-cuadrado 2
- Anlisis de la varianza (ANOVA)
- Test de Wilcoxon
- Coeficiente de Spearman

Med Clin (Barc) 2003; 121 (20): 793-8

p g in a 994

C a pt u l o 10

Anlisis de concordancia: Variables


C ualitativas
- ndice kappa de Cohen (2 observadores)
- ndice kappa de Fleiss (> 2 observadores)
- ndice kappa ponderado
- Prueba de homogeneidad de kappas

p g in a 995

C a pt u l o 10

ndice kappa de C ohen (medida


dicotmica)
OBSERVADOR A
( 1 medicin)

OBSERVADOR B
( 2 medicin)

TOTAL

Anormal (+)

Normal (-)

Anormal (+)

a+b

Normal (-)

c+d

Total

a+c

b+d

Statistical methods for rates and proportions. Joseph L. Fleis. Ed.John Wiley New York 1981.

p g in a 996

C a pt u l o 10

Dos radilogos del programa de tuberculosis se les remiten radiografas de trax de


170 sujetos que estn controlados en una unidad de neumologa, y que se quiere
estimar
el grado de concordancia entre ellos. Los radilogos A y B tienen que clasificar cada
radiografa en una de dos categoras:
(+) positiva (sospechosa de lesin tuberculosa).
(-) negativa (no sospechosa de lesin tuberculosa).
RADILOGO A

RADILOGO B

Anormal (+)
Normal (-)
Total

Anormal (+)
58
12
70

k = 0,415

IC95% = 0,2862 0,5430

TOTAL
Normal (-)
39
61
100

97
73
170

p g in a 997

C a pt u l o 10

p g in a 998

C ul es el grado de concordancia
encontrado?
Medida de acuerdo

Valor de Kappa

EEk

Significacin

Kappa de Cohen

+ 0,415

0,0655

5,688

0,000

N de casos vlidos

200

Junto al ndice kappa aparece su error estndar EEk y el valor del


estadstico Z.
Puesto que el valor de p es muy pequeo (<0,001) podemos rechazar
la hiptesis nula y concluir que existe un ACUERDO significativamente
ms alto que el esperado por el azar.
Cmo se clasifica el grado de concordancia encontrado?

p g in a 999

C a pt u l o 10

ndice kappa de
C ohen

k = 0 cuando la concordancia observada po es la que se esperada a causa del azar e


p
k > 0 cuando la concordancia observada po es mayor de la esperada slo por el azar
p

Valoracin del ndice Kappa


Valor de k

Fuerza de concordancia

< 0,20

Pobre

0,21 0,40

Dbil

0,41 0,60

Moderada

0,61 0,80

Buena

0,81 1,00

Muy buena

Con los datos de la tabla se obtiene aplicando esta frmula un valor de k = 0,415 (IC95%:
0,2862 0,5430), que segn la clasificacin anterior calificaramos como una
MODERADA concordancia.

C a pt u l o 10

Pregunta de investigacin
Tienen los dos radilogos de mi servicio el
mismo
criterio-juicio clnico para informar
las 2
Radilogo
radiografas?
Radilogo 1
Anormal
Dudosa
Anormal
Dudosa
Normal

18
1
2

4
10
4

Normal
3
5
53

Se enfrenta ambos radilogos a la tarea de categorizar una misma


muestra
de 100 radiografas mediante la escala: anormal, dudosa, normal.
Cul es el test estadstico ms acertado?
Lpez de Ullibarri Galparsoro I, Pita Fernndez S. Medidas de concordancia: el ndice Kappa. Cad Aten
Primaria 1999; 6: 169-171.

p g in a 1000

C a pt u l o 10

ndice kappa de
Fleiss
Medida de acuerdo

Valor de Kappa

EEk

Significacin
aprox

Kappa de Fleiss

+ 0,660

N de casos vlidos

100

C oeficiente
Gamma
Gamma

EEk

0,044

8,944

0,000

p
aprox

0,899
N de casos vlidos

0,044
100

8,744

Cmo se clasifica el grado de concordancia


encontrado?

0,000

p g in a 1001

p g in a 1002

C a pt u l o 10

ndice kappa de
Fleiss

k = 0 cuando la concordancia observada po es la que se esperada a causa del azar e


p
k > 0 cuando la concordancia observada po es mayor de la esperada slo por el azar
p

Valoracin del ndice Kappa


Valor de k

Fuerza de concordancia

< 0,20

Pobre

0,21 0,40

Dbil

0,41 0,60

Moderada

0,61 0,80

Buena

0,81 1,00

Muy buena

Con los datos de la tabla se obtiene aplicando esta frmula un valor de k = 0,660
(IC95%: 0,527-0,793), que segn la clasificacin anterior calificaramos como una
buena concordancia.

C a pt u l o 10

Pregunta de investigacin
Tienen los dos psiquiatras de mi servicio el mismo
criterio- juicio clnico al diagnosticar una muestra de
200 pacientes?
Psiquiatra 2

Psiquiatra 1
Fbica
Histrica
Obsesiva
Depresiva

Fbica
20
7
1
2

Cul es el test estadstico ms


acertado?

Histrica
8
36
8
6

Obsesiva
6
14
43
4

Depresiva
1
4
7
33

p g in a 1003

C a pt u l o 10

Medida de acuerdo

Valor de Kappa

EEk

p g in a 1004

Significacin
aprox

Kappa de Fleiss

+ 0,538

N de casos vlidos

200

0,046

12,921

0,000

Junto al ndice kappa aparece su valor estandarizado (T


aproximada), resultado similar al resultante de dividir el valor de
kappa por su error estndar (EEk) (11,69).
Puesto que el valor de p es muy pequeo (<0,001) podemos rechazar
la hiptesis nula y concluir que existe un ACUERDO significativamente
ms alto que el esperado por el azar.
Cmo se clasifica el grado de concordancia encontrado?

p g in a 1005

C a pt u l o 10

ndice kappa de
Fleiss

k = 0 cuando la concordancia observada po es la que se esperada a causa del azar e


p
k > 0 cuando la concordancia observada po es mayor de la esperada slo por el azar
p

Valoracin del ndice Kappa


Valor de k

Fuerza de concordancia

< 0,20

Pobre

0,21 0,40

Dbil

0,41 0,60

Moderada

0,61 0,80

Buena

0,81 1,00

Muy buena

Con los datos de la tabla se obtiene aplicando esta frmula un valor de k = 0,538,
que
segn la clasificacin anterior calificaramos como una MODERADA concordancia.

C a pt u l o 10

Pregunta de investigacin
Podemos sustituir el diabur-test por el clinitest para la
medida de la glucosuria?

Clinitest

D iabur-test 5000

Cul es el test estadstico ms


acertado?

Banauch D, Koller PU, Bablok W. Evaluation of Diabur-Test 5000: a cooperative study carried out at 12
diabetes centers. Diabetes Care 1983; 6(3): 213-18.

p g in a 1006

C a pt u l o 10

p g in a 1007

Pregunta de investigacin
Se desea estimar la concordancia entre dos pruebas
diagnsticas de diabetes, el D iabur-Test5000 y el C linitest
en 1677 muestras de orina. C alcula el valor de kappa sin
ponderar y ponderado por pesos cuadrticos.
Diabur-test 5000
++

Clinitest
Negativo

Negativo
452

Trazas
5

Trazas

133

270

28

+
++

36
5

107
53

5
76

2
2

2
4

12

28

81

35

11

44

251

+++
++++
ndice
kappa
Ponderado

+++

++++

C a pt u l o 10

p g in a 1008

Kappa ponderado. Si las categoras de clasificacin son ms de dos y estn definidas


en una escala ordinal, como por ejemplo sano, posiblemente enfermo y
claramente
enfermo. A la hora de valorar el grado de discrepancia entre dos observadores, no es
lo mismo que uno clasifique a un sujeto como posiblemente enfermo y el otro lo
declare sano a que uno lo clasifique como sano y el otro como claramente
enfermo. La distancia entre ambas discrepancias no es la misma.
Cuando ciertos tipos de desacuerdo son ms acusados que otros, al investigador le
puede interesar tenerlo en cuenta en la construccin del ndice kappa. Para ello, se
PONDERA las diferentes discrepancias, usando una matriz de pesos que pueden variar
segn el criterio del investigador en funcin de lo que est analizando, aunque siempre
cumpliendo ciertas restricciones:
1. La matriz debe ser simtrica;
2. La diagonal de acuerdos se le asigna el mximo peso, que es 1 y el resto de pesos
deben ser inferiores, aunque siempre positivos o iguales a cero.

C a pt u l o 10

Medida de acuerdo

Valor de Kappa

EEk

Significacin

Kappa NO ponderado

+ 0,6706

0,013

57,098

0,0000

N de casos vlidos

1677

IC95%: 0,6450 0,6961

Medida de acuerdo

Valor

Acuerdo observado

+ 0,7376

Acuerdo esperado

+ 0,2035

Medida de acuerdo

Valor de Kappa

EEk

Significacin

Kappa ponderado

+ 0,9491

0,0033

38,982

0,0000

N de casos vlidos

1677

IC95%: 0,9427 0,9555

Medida de acuerdo

Valor

Acuerdo observado

+ 0,9856

Acuerdo esperado

+ 0,7165

p g in a 1009

C a pt u l o 10

Variabilidad en datos
clnicos
Grado de acuerdo
Variables
interobservador
(CCI / Kappa)

Acuerdo preadiestramiento

Valor

Acuerdo postadiestramiento

+ 0,9856

(CCI / Kappa)

+ 0,7165

+ 0,7165

Afectacin simtrica

0.14

0.79

Clase funcional

-0.08

0.65

Numero criterios diagnsticos

0.02

0.93

Sexo

Anticuerpos antinucleares

0.62

0.84

Valor mximo VSG

0.70

0.99

A. Gmez de la Cmara et al. Med Clin (Barc) 1997; 108:377-381

p g in a 1010

C a pt u l o 10

Limitaciones del estadstico


Kappa
-El valor de kappa se ve afectado por la prevalencia del rasgo estudiado. Por tanto,
es necesario ser cuidadoso a la hora de generalizar los resultados de comparacin
de
observadores en situaciones con prevalencias diferentes; esto quiere decir que
kappa es
un estadstico descriptivo til, pero es inadecuado con fines de prediccin o
inferencia.
-Kappa es dependiente del nmero de categoras. Cuantas ms categoras se estn
considerando, ms difcil ser clasificar correctamente los sujetos de observacin, lo
que implica valores de kappa ms bajos. Por tanto, debe tenerse en cuenta el nmero
de categoras a la hora de interpretar kappa.
- Para datos ordinales derivados de categorizar variables continuas, kappa depende
fuertemente las definiciones arbitrarias que se hacen de las categoras.

p g in a 1011

C a pt u l o 10

Se desea evaluar los conocimientos prcticos adquiridos por los residentes de


microbiologa a su paso por el departamento de micobacterias. Para ello se mide
la concordancia con el Especialista adjunto mediante la evaluacin conjunta de
un determinado nmero de tinciones de Ziehl Neelsen. Se desea estimar el
grado de concordancia de cada residente con el adjunto, y si el grado de
adiestramiento ha sido el mismo en los 4 residentes que han rotado por el
departamento.
RESID ENTE

Cul es el test estadstico ms


acertado?

AD JUNTO

p g in a 1012

C a pt u l o 10

Prueba de homogeneidad de las


kappas
Hiptesis nula: k1

k2 = k3 =

= kn

Hiptesis alternativa: al menos una de las kappas kx es distinta

Comparacin de kappas: Distribucin de 2 de Pearson


Hiptesis nula Ho: Igualdad de las kappas comparadas. El grado de
aprendizaje no varia entre los distintos residentes.
Hiptesis alternativa Ha: Desigualdad de las kappas comparadas. El grado de
aprendizaje varia entre los distintos residentes. Existe al menos una kappa
diferente al resto.

p g in a 1013

C a pt u l o 10

RESIDENTE R1

ADJUNTO
Anormal (+)
320
120
440

Anormal (+)
Dudosa (-)
Total

TOTAL

Anormal (-)
30
29
59

350
149
499

P = 72,7%

Kappa

EEk

IC95%

p
aprox

0,132

Gamma (Q de Yule)

0,043

0,048 0,215

EEk

3.448

0,001

aprox

0,441

0,113

3,027

0,002

p g in a 1014

C a pt u l o 10

RESIDENTE R2

ADJUNTO
Anormal (+)
890
290
1180

Anormal (+)
Dudosa (-)
Total

TOTAL

Anormal (-)
210
700
59

1100
990
2090

P = 75,4%

Kappa

EEk

IC95%

p
aprox

0,518

Gamma (Q de Yule)

0,019

0,481 0,555

EEk

23,764

0,000

aprox

0,822

0,017

27,549

0,000

p g in a 1015

C a pt u l o 10

RESIDENTE R3

ADJUNTO
Anormal (+)
350
70
420

Anormal (+)
Dudosa (-)
Total

TOTAL

Anormal (-)
120
550
670

470
620
1090

P = 83,3%

Kappa

EEk

IC95%

p
aprox

0,640

Gamma (Q de Yule)

0,024

0,593 0,686

EEk

21,226

0,000

aprox

0,916

0,013

25,914

0,000

p g in a 1016

C a pt u l o 10

RESIDENTE R4

ADJUNTO
Anormal (+)
280
60
340

Anormal (+)
Dudosa (-)
Total

TOTAL

Anormal (-)
80
550
630

360
610
970

P = 82,3%

Kappa

EEk

IC95%

p
aprox

0,687

Gamma (Q de Yule)

0,024

0,639 0,735

EEk

21,425

0,000

aprox

0,940

0,011

24,63

0,000

p g in a 1017

C a pt u l o 10

C omparacin de
kappas
Nmero de Kappas a comparar

Nivel de confianza

95%

Kappa global

IC95%

0,687

0,5379 0,5855

Prueba de la homogeneidad de kappas


Chi cuadrado

gl

Valor p

143,0515

0,0000

Hiptesis alternativa H a: Desigualdad de las kappas comparadas. El grado de aprendizaje varia entre los
distintos residentes. Existe al menos una
kappa diferente al resto.

p g in a 1018

C a pt u l o 10

C omparacin de kappas: D istribucin de 2 de


Pearson
Grados de libertad = [ K - 1] [F - 1] = (2-1) (4 -1) = 3

2Pearson calculado = 143,05

2
> Pearson tabulado = 7,81

2 = 143,05

AZAR

Ho
Ha
7,8
1
AZAR

Hiptesis alternativa H a: Desigualdad de las kappas comparadas. El grado de aprendizaje varia entre los
distintos residentes. Existe al menos una
kappa diferente al resto.

p g in a 1019

C a pt u l o 10

p g in a 1020

Mito 1: La sonrisa de la
esfinge
El valor de kappa se ve afectado por la prevalencia del rasgo estudiado. Por tanto, es
necesario ser cuidadoso a la hora de generalizar los resultados de comparacin de
observadores en situaciones con prevalencias diferentes; esto quiere decir que kappa
es un estadstico descriptivo til, pero es inadecuado con fines de prediccin o
inferencia.
La prevalencia (porcentaje de tinciones positivas valoradas) es la misma en la
evaluacin de los 4 residentes comparados?
Si no son iguales NO podemos comparar los ndices kappa.

Gardner PL. Measuring attitudes to science: Unidimensionality and internal consistency revisited. Research
in Science Education 1995; 25: 283-9.

C a pt u l o 11

C aptulo 11
Publicacin Bioestadstica: Medidas de concordancia.
Variables cuantitativas.

D r. Jacobo D az Portillo
Coordinador de Formacin Continuada
Hospital Universitario de Ceuta

p g in a 1021

C a pt u l o 11

Medidas de concordancia
- Fiabilidad de los procedimientos de medida empleados.
- Fleis: ni el ms elegante de los diseos seria capaz de paliar el
dao
causado por un sistema de medida poco fiable.
- Error de medida: Variabilidad entre observadores.
- Estudios de fiabilidad.
- Sesgo entre observadores.
- Concordancia entre observadores.
- Indicadores del grado de variabilidad.
- Coeficiente de correlacin intraclase (variables cuantitativas).
- ndice de Kappa (variables cualitativas tipo categricos).

p g in a 1022

C a pt u l o 11

Valoracin de la fiabilidad externa de las publicaciones de dos


revistas cientficas durante el ltimo quinquenio.
En 5 (4 de JAMA y uno de MC) de los 12 artculos se han llevado a
cabo tratamientos estadsticos no idneos para medir la
concordancia, mediante las siguientes pruebas de contraste de
hiptesis:
- Comparacin de medias con la t de Student
- Test exacto de Fisher,
- Test de chi-cuadrado 2
- Anlisis de la varianza (ANOVA)
- Test de Wilcoxon
- Coeficiente de Spearman

Med Clin (Barc) 2003; 121 (20): 793-8.

p g in a 1023

C a pt u l o 11

Evaluacin de mtodos diagnsticos


cuantitativos
- Variacin metrolgica.
Errores aleatorios.
Errores
sistemticos.
- Comparacin de mtodos.

p g in a 1024

C a pt u l o 11

Evaluacin metrolgica
La evaluacin metrolgica de una prueba diagnstica
CUANTITATIVA persigue detectar los errores aleatorios y
sistemticos que origina, para cuantificarlos mediante clculos
estadsticos y determinar si son inferiores a los lmites permisibles
que no comprometen a la utilizacin clnica de los resultados.
Esta evaluacin nos permite conocer el error que cometemos en
nuestras condiciones de trabajo, y si el la prueba es adecuada
para nuestros fines o es necesario cambiarlo por otros mtodos.

p g in a 1025

C a pt u l o 11

INTRASERIAL

ERRO RES
ALEATO RIO S

EXPERIMENTOS DE
REPLICACIN
INTERSERIAL

EVALUAC I
N METRO L GIC A
CONSTANTES

EXPERIMENTOS DE
REPLICACIN

ERRO RES SISTEMTICO S


PROPORCIONALES

EXPERIMENTOS DE
REPLICACIN

p g in a 1026

C a pt u l o 11

Variacin
metrolgic
a

SD
CVa =

* 100

X
Error aleatorio

Error
sistemtico

Inexactitud y imprecisin

Exactitud y

Inexactitud y precisin

iimmprecisin
Exactitud y precisin

p g in a 1027

C a pt u l o 11

Especificaciones de la calidad para la imprecisin


analtica
Prestacin ptima

CVa < CVBw

Prestacin deseable

CVa < CVBw

Prestacin mnima

CVa < CVBw

p g in a 1028

C a pt u l o 11

Fuentes de variacin
biolgica
- Variacin biolgica NO aleatoria
- A lo largo de la vida
- Ritmo biolgico diario
- Ciclos mensuales
- Ritmos estacionales
- Variacin biolgica aleatoria
- Variacin biolgica intra) inter-individual
- individual
Variacin (CV
biolgica
(CV )

Bw
Bb

p g in a 1029

C a pt u l o 11

Fuentes de variacin
biolgica

Concentracin relativa

Colesterol

Urea

Fsforo

20

30

40

50
60

Edad en aos

70

p g in a 1030

C a pt u l o 11

Variacin de los niveles de C olesterol


total
D istribucin por grupos socioculturales
Colesterol total (mg/dl)
185
175
165
155
145
135
125

CRISTIANOS
1

1,5

MUSULMANES
7

EDAD (aos)

10

11

12

13

p g in a 1031

C a pt u l o 11

Ritmo biolgico
circadiano
Cortisol nmol/L

GH

600

mU/L

GH

300

9:00 horas

Cortisol

24:00

Tiempo

9:00

p g in a 1032

C a pt u l o 11

C lculo de la variacin total


(C V )

Cuando se obtiene una sola muestra y esta es analizada una sola


vez....

CVt

CVCV
CV

CV
a

Bw

p
Variacin
preanaltica

Variacin
analtica

Variacin
biolgica
intraindividual

p g in a 1033

C a pt u l o 11

p g in a 1034

Si minimizamos la variabilidad preanaltica mediante protocolizacin, entrenamiento,


buenas prcticas de laboratorio y seguimiento de los procedimientos operativos descritos
y estandarizados....

CVt

CVa 2

Variacin
analtica

CVBw2

Variacin
biolgica
intraindividual

C a pt u l o 11

Variabilidad biolgica
aleatoria
Lmite de referencia superior

Lmite de referencia superior

CVBw = 4,3

Mediana
Punto de ajuste
homeosttico

Lmite de referencia inferior

Creatinemia (mg/dl)

Creatinemia (mg/dl)

CVBb = 18,3

Lmite de referencia inferior

p g in a 1035

C a pt u l o 11

ndice de individualidad (II)

CVBw
CVBb

II > 0,6

II < 0,6

CVBw > CVBb

CVBw < CVBb

Escasa
individualidad
Diagnstico

Fuerte individualidad

Intervalos de referencia poblacionales

Seguimiento
Diferencia crtica

p g in a 1036

C a pt u l o 11

DC = 2 * Z [CVBw 2+ CVa ]2
Cambio significativo con probabilidad del 95% (Z=1.96)

DC95 = 2,77 [CVB 2 + CV 2]


w
a

Cambio significativo con probabilidad del 99% (Z=2.58)

DC99 = 3,65 [CVBw 2+ CVa ]2

p g in a 1037

C a pt u l o 11

Varn de 63 aos con hipertensin y una concentracin de colesterol total de 254


mg/dl,
la cual tras modificar sus hbitos de vida (tratamiento diettico) cambi a 224 mg/dl.
Cunto ha cambiado la colesterolemia?

Variacin
porcentual

CT final

- CT inicial

=
CT inicial

Ha cambiado significativamente la
colesterolemia?

- 11,8%

p g in a 1038

C a pt u l o 11

Interpretacin del cambio aplicando criterios


basados en la variabilidad biolgica
Variacin biolgica: de la teora a la prctica
Callum G. Fraser

Ninewells Hospital and medical School. Dundee. Scotland. 2001.

p g in a 1039

C a pt u l o 11

Ha cambiado significativamente la
colesterolemia?

Cambio significativo con probabilidad del 95% (Z=1.96)(p<0,05)

DC95 = 2,77 [CVBw 2+ CVa ]2

DC = 19%

Cambio significativo con probabilidad del 99% (Z=2.58)(p<0,01)

DC99 = 3,65 [CVBw 2+ CVa ]2

DC = 24,5%

p g in a 1040

Probabilidad estadstica de cambio P(%) Z

C a pt u l o 11

99% (p<0,01)
95% (p<0,05)
90% (p<0,1)
82%

11,8%

15,6%

19%

24,5%

Dc Cambio en la colesterolemia (%)

p g in a 1041

C a pt u l o 11

C omparacin de
mtodos
D iagnsticos cuantitativos
1. Mtodos analticos
2. Mtodos de regresin
3. Mtodos grficos

p g in a 1042

C a pt u l o 11

p g in a 1043

C omparacin de mtodos
D iagnsticos cuantitativos
- Se utiliza para demostrar que el nuevo mtodo (Y) presenta una buena
concordancia con el mtodo clsico de referencia (X).
- Demostrar que una misma medida tiene equivalencia con diferentes
equipos.
- Detectar la presencia de SESGOS (errores sistemticos):
- Error (sesgo) constante.
- Error (sesgo) proporcional.

C a pt u l o 11

Error (sesgo)
constante

Mtodo
Y

La diferencia
entre ambos
mtodos se
mantiene
constante a lo
largo del rango
de medidas

Mtodo
X

p g in a 1044

C a pt u l o 11

Error (sesgo)
proporcional

Mtodo
Y

La diferencia
entre ambos
mtodos se lineal
a lo largo de todo
el largo del rango
de medicin.

Mtodo
X

p g in a 1045

C a pt u l o 11

C omparacin de mtodos diagnsticos


cuantitativos
-Si los errores sistemticos detectados y medidos estn en un lmite aceptable,
la evaluacin se debe completar con un experimento de comparacin de
mtodos frente a los resultados obtenidos con un mtodo de referencia.
-La utilizacin de la estadstica en los experimentos de comparacin de mtodos
es la parte ms difcil del anlisis estadstico en los estudios de evaluacin de
mtodos.
-Qu mtodo estadstico es el que comete menos error para calcular el
error que comete un mtodo analtico?

p g in a 1046

C a pt u l o 11

Anlisis de concordancia: variables


cuantitativas
Mtodos diagnsticos

- Coeficiente de correlacin intraclase


(ANOVA).
- Modelo de efectos ALEATORIOS.
- Modelo de efectos FIJOS.
- Coeficiente de correlacin-concordancia de
Lin.

- Concordancia de Krippendorff.

p g in a 1047

C a pt u l o 11

Anlisis de concordancia: variables


cuantitativas
Mtodos de regresin

- Mtodo de regresin lineal por mnimos


cuadrados.
- Mtodo de regresin ortogonal de Deming.
- Modelo de Passing-Bablock.
- Mtodo de mnimos cuadrados ponderado.
- Mtodo de regresin de Bland y Altman.
- ANOVA de medidas repetidas.
- Modelos de ecuaciones estructurales.

p g in a 1048

C a pt u l o 11

Anlisis de concordancia: variables


cuantitativas
Mtodos grficos

- Anlisis de las diferencias individuales mtodo de Bland y Altman (que


calcula un intervalo de concordancia),
- Grfico de distribucin acumulativa emprica grfico montaa (mountain
plot)
- Grfico de la concordancia- supervivencia (survival-agreement plot).

p g in a 1049

C a pt u l o 11

C ul es el mtodo estadstico ms adecuado para


calcular
el error que comete un mtodo diagnstico
La utilizacin de la estadstica en los experimentos de comparacin de
cuantitativo?
mtodos cuantitativos es la parte ms difcil del anlisis estadstico en los
estudios de evaluacin de mtodos diagnsticos.

p g in a 1050

C a pt u l o 11

Pregunta de investigacin
Podemos sustituir en instrumento clsico analgico
por el nuevo sistema digital para la medida de la
tensin arterial?
Sistema analgico

Sistema digital

Cul es el test estadstico ms


acertado?

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.

p g in a 1051

C a pt u l o 11

p g in a 1052

Regresin lineal por mnimos cuadrados:


C ondiciones de aplicacin(*)
1. Linealidad de datos.
2. Pequeos errores aleatorios.
3. Intervalo de valores normales suficientemente amplio de concentraciones.
4. Ausencia de valores aberrantes (outliers).
5. Que la variable PREDICTORA X no tenga error, es decir que el mtodo de
referencia utilizado sea exacto, pero en la mayora de ocasiones no es posible, por
lo que los resultados del mtodo de comparacin (X) tambin presenta errores.

(*) Westgard JO, Hunt MR. Use and interpretation of common statistical test in method-comparison studies.
Clin Chem 1973; 19: 44-57.

C a pt u l o 11

Mtodo digital

Medidas de tensin arterial sistlica en


un grupo de 30 pacientes mediante dos
mtodos de medicin (tradicional y
automatizado)

Error sistemtico
proporcional
Mtodo analgico

p g in a 1053

C a pt u l o 11

Se representan los datos de un estudio en el que se tom la tensin arterial sistlica


en 30 pacientes utilizando dos mtodos diferentes. Se representan grficamente
estos datos, indicando el coeficiente de correlacin lineal de Pearson r=0,997
(p<0,0001) una asociacin prcticamente lineal.
Para variables cuantitativas, es frecuente que el anlisis de la concordancia entre
dos medidas de la misma variable se realice ERRNEAMENTE mediante el clculo
del coeficiente de correlacin de lineal (r) de Pearson como ndice de concordancia.

Bland JM, Altman DG. Statistical methods for assesing agreement between two methods of clinical
measurement. Lancet 1986; 1: 307-310.

p g in a 1054

C a pt u l o 11

Regresin lineal por mnimos


cuadrados:
Variable Y

DIGITAL

Variable X

ANALGICO

Tamao de muestra

30

Coeficiente de determinacin R

Ecuacin de regresin

0,9940
Y = 5,8672 + 0,9351 X

Parmetro Coeficiente Error estndar IC95%

5,8672
1,9830
1,8053-9,9291

t
2,9588

p
0,0062

66,295

< 0,0001

0,9351

0,01369

0,9071-0,9632

p g in a 1055

C a pt u l o 11

p g in a 1056

C oeficiente de correlacin de Pearson


- Mide la fuerza de asociacin entre ambas variables (X-Y), es decir
la intensidad de la relacin lineal entre los dos mtodos
diagnsticos cuantitativos.
- No ofrece informacin sobre el grado de CONCORDANCIA, por tanto no
puede detectar sesgo constante o proporcional.
- Es posible encontrar un alto coeficiente de correlacin con una baja
intensidad de concordancia entre mtodos.
CORRELACIN CONCORDANCIA

C a pt u l o 11

Mito 1: La sonrisa de la
esfinge
Por qu has elegido el coeficiente de correlacin de Pearson? Se cumplen
todos los requisitos para poder utilizarlo? Te permite ese test decir que los
resultados son intercambiables entre ambos instrumentos de medida?
El coeficiente de correlacin de lineal (r) de Pearson NO resulta una medida adecuada
del grado de acuerdo o concordancia entre dos mediciones de un mismo parmetro
(presin arterial), ya que si dos instrumentos miden sistemticamente cantidades
diferentes uno del otro, la correlacin puede ser perfecta (r 1), a pesar de que la
concordancia sea nula.
El coeficiente de correlacin r de Pearson deca que la magnitud de la asociacin de
la medida de la presin arterial entre el mtodo manual A y el mtodo digital B es del
99,7 (r=0,997) de la mxima posible.

p g in a 1057

C a pt u l o 11

C oeficiente de correlacin intraclase


- Los valores del CCI pueden oscilar entre 0 y 1, de modo que la mxima
concordancia posible corresponde a un valor de CCI=1.
- Cuando el valor CCI=0 se obtiene cuando la concordancia observada es
igual a la que se esperara que ocurriera slo por AZAR. En este caso la
variabilidad observada se explicara por las discrepancias entre los
mtodos de medicin o de los diferentes criterios utilizados por los
observadores en el experimento.
CORRELACIN CONCORDANCIA

Bland JM, Altman DG. Statistical methods for assessing agreement between two methods of clinical
measurement. Lancet 1986;8:307-10.
Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de
concordancia
para variables numricas. Cad Aten Primaria 2004.

p g in a 1058

C a pt u l o 11

C oeficiente de correlacin
intraclase

p g in a 1059

-La obtencin del CCI que permite evaluar la concordancia general entre dos o ms
mtodos u observaciones diferentes se basa en un modelo de anlisis de la variancia
(ANOVA) con medidas repetidas, pero su obtencin directa no es posible con los
paquetes estadsticos habituales.
- La variabilidad total observada en el CCI puede dividirse en tres componentes:
- La variabilidad debida a las diferencias entre los pacientes (2P);
- La variabilidad debida a las diferencias entre los observadores (mdicos A y B)
(2O), y
- La variabilidad (residual), inexplicable (aleatoria), asociada al error inherente a
toda
medicin (2R).
- El CCI se define como la proporcin de variabilidad total debida a la variabilidad de los
pacientes:
CCI =

2P

2P + 2O +
2R

C a pt u l o 11

C oeficiente de correlacin
intraclase

- Los valores del CCI pueden oscilar entre 0 y 1: donde el 0 indica ausencia de
concordancia y el 1, la concordancia o fiabilidad absoluta de los resultados obtenidos.
- Si bien el valor del CCI que define una fiabilidad satisfactoria es arbitrario (criterios de
Fleiss):
- CCI < 0,4 representan BAJA fiabilidad.
- CCI entre 0,4 - 0,75 representan una fiabilidad entre REGULAR y BUENA.
- CCI > 0,75 representan una fiabilidad EXCELENTE.
Fleiss JL. The design and analysis of clinical experiments. Nueva York: John
Wiley
& Sons, Inc., 1986.
- Los resultados ofrecidos por la r de Pearson para estos propsitos pueden
resultar equvocos.
- Se recomienda el uso del CCI para cuantificar la fiabilidad de las mediciones
clnicas.

p g in a 1060

C a pt u l o 11

Pregunta de investigacin
Podemos sustituir en instrumento clsico analgico
por el nuevo sistema digital para la medida de la
tensin arterial?
Sistema analgico

Sistema digital

Cul es el test estadstico ms


acertado?

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.

p g in a 1061

C a pt u l o 11

C oeficiente de correlacin intraclase


Ejemplo
-En este caso CCI=0.991, casi toda la variabilidad observada no
depende de las diferencias en los mtodos de medicin empleados o los
diferentes observadores (tan slo el 0,9%).
-Es decir, slo el 0,9% de la variabilidad observada es debida a las
discrepancias o diferencias entre los mtodos de medicin o por el
diferente criterios utilizados por los observadores.
Sistema analgico

Sistema digital

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.

p g in a 1062

C a pt u l o 11

C oeficiente de correlacin intraclase


C lculo del CC I mediante programas
estadsticos
Parmetro

Correlacin intraclase

IC95%

Medidas individuales

0,9911

0,9398 a 0,9971

Medidas promedio

0,9955

0,9690 a 0,9986

p g in a 1063

C a pt u l o 11

Valoracin del C oeficiente de correlacin


intraclase
Valoracin de la concordancia segn los valores de
C oeficiente de C orrelacin Intraclase (CC I)
CCI

Fuerza de la concordancia

> 0,90

Muy buena

0,71 - 0,90

Buena

0,51 - 0,70

Moderada

0,31 - 0,50

Mediocre

< 0,30

Mala o nula

p g in a 1064

C a pt u l o 11

p g in a 1065

Modelo de efectos
aleatorios
Este modelo aleatorio es apropiado cuando los observadores implicados en la medicin,
las enfermeras A y B en el ejemplo, representan una muestra aleatoria de la
poblacin de posibles observadores (p. ej, otras enfermeras del hospital) que en el
futuro harn uso del instrumento evaluado (el esfigmomanmetro).

Luis Prieto, Rosa Lamarca, Alfonso Casado. La evaluacin de la fiabilidad en las observaciones clnicas: el
coeficiente de correlacin intraclase. Med Clin (Barc). 1998;110:142-5.

C a pt u l o 11

Se desea evaluar la concordancia entre las medidas de tensin arterial entre dos
enfermeras A y B mediante la comparacin de los resultados de dos mediciones
consecutivas de la presin arterial sistlica en 10 pacientes, realizadas en el
mismo esfingomanmetro por dos enfermeras.

EN FERMERA A

Cul es el test estadstico ms


acertado?

EN FERMERA B

p g in a 1066

C a pt u l o 11

Comparacin de dos mediciones consecutivas de la presin arterial


sistlica en 10 pacientes, realizadas en el mismo esfingomanmetro por
dos enfermeros diferentes.
Paciente

Enfermera A

Enfermera B

Diferencia (B-A)

135

140

140

145

130

135

145

150

140

145

150

160

10

140

145

135

140

140

145

10

135

145

10

Media

139

145

DE

5,68

6,67

2,11

p g in a 1067

C a pt u l o 11

150

Pearson
r = 0,954
ENFERMERA A

145

r = 0,910
2

Rho Spearman
r = 0,929
p < 0,01

p < 0,01
140

135

130
130

135

140
145

ENFERMERA B

150

160

p g in a 1068

C a pt u l o 11

160

ENFERMERA A

Pearson
r = 0,954
150

r2 = 0,910
p < 0,01

ENFERMERA B

145

140

Rho Spearman
r = 0,929
p < 0,01

135

130

ENFERMERA A
130

135

140
145

150

p g in a 1069

C a pt u l o 11

160

150

Pearson
Pearson

Error
sistemtico
constante

r = 0,954
r = 0,954
r22 = 0,910
r = 0,910
p < 0,01
p < 0,01

ENFERMERA B

145

140

Rho
Rho Spearman
Spearman
r = 0,929
r = 0,929
p < 0,01
p < 0,01

135

130

ENFERMERA
A
ENFERMERA
A
130

135

140
145

150

160

p g in a 1070

C a pt u l o 11

p g in a 1071

T de Student para datos


apareados:
1.Mide la diferencia entre las medias de las mediciones realizadas por los dos
mtodos comparados.
2. Slo puede detectar el sesgo o error sistemtico constante.
3. No puede detectar el error sistemtico PROPORCIONAL.

Gardner PL. Measuring attitudes to science: Unidimensionality and internal consistency revisited. Research
in Science Education 1995; 25: 283-9.

C a pt u l o 11

Resultado
s
Variables

Media

ENFERMERA A
ENFERMERA B

139,0
145,0

10
10

Desviacin
estndar
(s)
5,678
6,667

Error estndar de
la media (EEM)
1,795
2,108

Variable

Correlacin (r)

Significacin

ENFERMERA A versus ENFERMERA B

10

0,954

0,000

Variables

Enfermera B Enfermera A

Diferencias relacionadas Intervalo de


t calculada
confianza de la
diferencia
Media
s
EEM
Inferior Superior 9,000
6,00
2,108 0,667
4,492
7,508

t calculada > t tabulada

gl

Significacin
bilateral

0,000

p<0,05 (rechazamos la hiptesis nula)

La t de Student para datos apareados permite detectar el sesgo o error sistemtico


CONSTANTE.

p g in a 1072

C a pt u l o 11

CCI =
o

+ 2O +

Frmula simplificada del coeficiente de correlacin intraclase (CCI)


para un MODELO de EFECTOS ALEATORIOS

CCI =

( DEA )2 + ( DEB )2 - ( DEB-A )2


( DEA )2 + ( DEB )2 + ( XB-A )2 - ( DEB-A )2/ n
Clculo del CCI del ejemplo anterior:
( 5,68 )2 + ( 6,67 )2 - ( 2,11 )2

CCI =

( 5,68 )2 + ( 6,67 )2 +

( 6 )2 - ( 2,11 )2 / 10

= 0,64

p g in a 1073

C a pt u l o 11

C oeficiente de correlacin intraclase


C lculo del CC I mediante programas
estadsticos
Parmetro

Correlacin intraclase

IC95%

Medidas individuales

0,6436

- 0,0488 a 0,9240

Medidas promedio

0,7831

- 0,1027 a 0,9695

p g in a 1074

C a pt u l o 11

Valoracin del C oeficiente de correlacin


intraclase
Valoracin de la concordancia segn los valores de
C oeficiente de C orrelacin Intraclase (CC I)
CCI

Fuerza de la concordancia

> 0,90

Muy buena

0,71 - 0,90

Buena

0,51 - 0,70

Moderada

0,31 - 0,50

Mediocre

< 0,30

Mala o nula

p g in a 1075

C a pt u l o 11

C onclusiones
- El valor del CCI obtenido es claramente inferior al valor 0,954 obtenido
con la r de Pearson, demostrando que la existencia de una alta
asociacin entre dos variables no es necesariamente signo de una alta
concordancia.
- Aplicando la frmula a los datos anteriores, se obtiene un CCI igual
a 0,64, lo que indica una concordancia moderada entre los
resultados obtenidos por las enfermeras A y B.
CORRELACIN CONCORDANCIA

p g in a 1076

C a pt u l o 11

p g in a 1077

Modelo de efectos fijos


-Este modelo es apropiado cuando los observadores que intervienen en el
estudio son los nicos que participarn en el mismo.
-Se utiliza cuando el objetivo es conocer la magnitud de las discrepancias
entre dos mdicos y determinar si el mdico A puede ser sustituido por el
mdico B en esa tarea.
-Slo estamos interesados en la comparacin de los resultados obtenidos
por estos 2 mdicos y no desearemos generalizar los resultados al conjunto
de mdicos que miden la frecuencia cardaca en el hospital.

C a pt u l o 11

Se desea valorar la concordancia de las mediciones de la FRECUENCIA


CARDACA obtenidas en 10 pacientes por 2 mdicos diferentes: un mdico A,
jefe del servicio, y un mdico B, en perodo de formacin. El objetivo es conocer
la magnitud de las discrepancias entre ambos y determinar si el mdico A puede
ser sustituido por el mdico B en esa tarea.

El pulso radial se siente mejor en la


mueca, debajo del pulgar.

JEFE D E SERVIC IO

Cul es el test estadstico ms


acertado?

MD ICO RESID ENTE

p g in a 1078

C a pt u l o 11

Comparacin de dos mediciones consecutivas de la FRECUENCIA


CARDACA en pulsaciones por minuto (ppm) en 10 pacientes realizada
por dos mdicos diferentes: un mdico A, jefe del servicio, y un mdico B
en periodo de formacin (modelo de EFECTOS FIJOS).
Paciente

Mdico A

Medico B

Diferencia (B-A)

75

80

74

84

10

76

81

79

83

82

92

10

83

88

85

90

87

92

87

92

10

88

93

Media

81,6

87,5

5,9

DE

5,3

5,04

2,18

p g in a 1079

MEDICO RESIDENTE

C a pt u l o 11

95

Pearson

90

r = 0,912
r2 = 0,832
p < 0,01

Pearson
r = 0,912
Rho
r2 = 0,832
Spearman

85

pr =< 0,855
0,01
= 0,002
Rho pSpearman

80

r = 0,855
p = 0,002

75
75

80

RESIDENTE = 16,7 + 0,868 * JEFE

85

90

95

JEFE DE SERVICIO

p g in a 1080

C a pt u l o 11

95

MEDICO RESIDENTE

Error sistemtico
constante
90

85

80

75
75

80

RESIDENTE = 16,7 + 0,868 * JEFE

85

90

95

JEFE DE SERVICIO

p g in a 1081

C a pt u l o 11

2P

CCI =

2P + 2O +
2Rde correlacin intraclase (CCI)
Frmula simplificada del coeficiente
para un MODELO de EFECTOS FIJOS

CCI =

( DEA )2 + ( DEB )2 - ( DEB-A )2


( DEA )2 + ( DEB )2 + ( XB-A )2 / 2 - ( DEB-A )2 / 2n
Clculo del CCI del ejemplo anterior:
( 5,3 )2

+ ( 5,04 )2 - ( 2,18 )2

CCI =

= 0,69
( 5,3 ) + ( 5,04 ) + ( 5,9 ) / 2 - ( 2,18 ) / 2 x 10
2

p g in a 1082

C a pt u l o 11

Valoracin del C oeficiente de correlacin


intraclase
Valoracin de la concordancia segn los valores de
C oeficiente de C orrelacin Intraclase (CC I)
CCI

Fuerza de la concordancia

> 0,90

Muy buena

0,71 - 0,90

Buena

0,51 - 0,70

Moderada

0,31 - 0,50

Mediocre

< 0,30

Mala o nula

p g in a 1083

C a pt u l o 11

C onclusiones
A pesar de que la r de Pearson indica una alta asociacin (r = 0,912),
aplicando la frmula a los datos anteriores, se obtiene un CCI igual a
0,69, lo que indica una concordancia moderada entre los resultados
obtenidos por los mdicos A y B.

CORRELACIN CONCORDANCIA

p g in a 1084

C a pt u l o 11

p g in a 1085

Limitaciones del coeficiente de correlacin


intraclase
A pesar de ser la medida de concordancia ms adecuada para el caso de
variables NUMRICAS, el CCI presenta ciertas limitaciones:
1. A la hora de interpretar los valores del CCI, la clasificacin de la tabla 5 es
subjetiva.
2. Dificultad inherente a su clculo.
3.Se trata de una prueba PARAMTRICA, por lo que limita su uso a:
- variables distribuidas segn una normal.
- igualdad de varianzas.
- independencia entre los errores de cada observador.
4.El CCI depende en gran medida de la variabilidad de los valores observados:
cuanto ms homognea sea la muestra estudiada, ms bajo tender a ser el valor del
CCI.
5.Lo que ms ha limitado la difusin del uso del CCI en la literatura mdica es la
carencia de interpretacin clnica completamente objetiva.
Prieto L, Lamarca R, Casado A. La evaluacin de la fiabilidad en las observaciones clnicas: el coeficiente
de correlacin intraclase. Med Clin (Barc) 1998;110:142-5.

C a pt u l o 11

Pregunta de investigacin
Podemos sustituir en instrumento clsico analgico
por el nuevo sistema digital para la medida de la
tensin arterial?
Sistema analgico

Sistema digital

Cul es el test estadstico ms


acertado?

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.

p g in a 1086

C a pt u l o 11

Medidas de tensin arterial sistlica en un


grupo de 30 pacientes mediante dos mtodos
de medicin (tradicional y automatizado)

Mtodo digital

Error sistemtico
proporcional

Mtodo analgico

p g in a 1087

C a pt u l o 11

p g in a 1088

C oeficiente de concordancia de Lin


- El coeficiente de correlacin de las medidas de concordancia de LIN mide
el
grado de acuerdo entre dos variables cuantitativas continuas.
- Es til para evaluar la reproducibilidad o fiabilidad entre dos observadores o
evaluadores.
Escala de McBrige para el coeficiente de
concordancia de Lin
Valor de la c

Fuerza de acuerdo

< 0,90

Pobre

0,90 0,95

Moderada

0,95 0,99

Sustanciales

> 0,99

Casi perfecto

C a pt u l o 11

C oeficiente de concordancia de
Lin
Variable Y
Variable X
Tamao de muestra
Coeficiente de CONCORDANCIA de Lin
Intervalo de confianza al 95%
Pearson (precisin)
Factor de correccin del sesgo C (exactitud)
b

DIGITAL
ANALGICO
30
0,9908
0,9832 a 0,9949
0,9970
0,9937

p g in a 1089

C a pt u l o 11

Se desea evaluar la concordancia entre las medidas de tensin arterial entre dos
enfermeras A y B mediante la comparacin de los resultados de dos mediciones
consecutivas de la presin arterial sistlica en 10 pacientes, realizadas en el
mismo esfingomanmetro por dos enfermeras.

EN FERMERA A

Cul es el test estadstico ms


acertado?

EN FERMERA B

p g in a 1090

C a pt u l o 11

C oeficiente de concordancia de
Lin
Variable Y

Enfermera A

Variable X

Enfermera B

Tamao de muestra

10

Coeficiente de CONCORDANCIA de Lin

0,6190

Intervalo de confianza al 95%

0,3074 a 0,8107

Pearson (precisin)

0,9542

Factor de correccin del sesgo C b (exactitud)

0,6487

p g in a 1091

C a pt u l o 11

Pregunta de investigacin
Podemos sustituir en instrumento clsico analgico
por el nuevo sistema digital para la medida de la
tensin arterial?
Sistema analgico

Sistema digital

Cul es el test estadstico ms


acertado?

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.

p g in a 1092

C a pt u l o 11

Mtodo de regresin ortogonal de


D eming
1.En el caso de que presenten errores aleatorios en el mtodo de referencia (X) ha sido
propuesto como ms aceptable el mtodo de regresin ortogonal establecido por
Deming en 1943 (*).
2. Es adecuado incluso si existen valores aberrantes (**).
3.Si el error que presenta esta variable es proporcional, cuando la varianza de los
resultados aumenta con la concentracin, ha sido considerado adecuado el clculo de
la correlacin lineal mediante el clculo de mnimos cuadrados ponderado.
4.Mientras que consideran mejor el mtodo de Deming si los errores en x son
significativos frente al intervalo ensayado, cuando el intervalo de concentraciones
es estrecho (v.g. en Potasio) (***).
(*) Wakkers PJM, Hallendoorn HBA, Op de Weegh GJ, Heerspink W. Applications of statistics in clinical
chemistry. A critical evaluation of regression lines. Clin Chim Acta 1975; 64: 173-84.
(**) Cornbleet PJ, Gochman N. Incorrect least-squares regression coefficients in method-comparison
analysis. Clin Chem 1979; 25: 432-38.
(***) Zaydman L, Lasky FD, Van Nostrand C, Doptis PD. Recommended linear regressin models for
comparison of method in clinical Chemistry. Clin Chem 1991, 37: 960.

p g in a 1093

C a pt u l o 11

Representacin grfica de
D eming

Error sistemtico
proporcional

p g in a 1094

C a pt u l o 11

Mtodo de regresin ortogonal de


D eming
Variable Y

DIGITAL

Variable X

ANALGICO

Tamao de muestra

30

Ecuacin de regresin

Y = 5,4741 + 0,9379 X

Mtodo

Media

Coeficiente de variacin (CV%)

140,23

26,24

137,00

25,19

Parmetro

Coeficiente
5,4741

Error estndar
1,7780

IC95%
1,8377-9,1106

0,9379

0,01275

0,9124-0.9634

p g in a 1095

C a pt u l o 11

Representacin grfica de los residuales de


D eming

p g in a 1096

C a pt u l o 11

Modelos de regresin de PassingBablock


-En los aos 80-90, para evitar los inconvenientes del mtodo simple de
mnimos cuadrados, Passing y Bablok desarrollan el clculo del mtodo de
regresin no paramtrica.
-Fue defendido como mtodo de eleccin debido a su robustez y a permitir
obtener una estimacin no sesgada de la recta de regresin.

Frey E, Fuentes-Arderiu X, Queralt JM. Comparacin estadstica de mtodos analticos. Educacin


continuada Qumica Clnica. 1988; 1:
69-79.

p g in a 1097

C a pt u l o 11

Modelos de regresin de PassingBablock


C ondiciones y limitaciones de aplicacin

1.La razn de varianzas en Y y X iguale el cuadrado de la pendiente.


2. Ausencia de error en la variable PREDICTORA (independiente) X.
3.Que el error en la variable RESULTADO Y debe ser homogneo en todo el
intervalo de concentraciones.

Zaydman L, Lasky FD, Van Nostrand C, Doptis PD. Recommended


linear regressin models for comparison of method in clinical Chemistry. Clin Chem 1991, 37: 960.

p g in a 1098

C a pt u l o 11

Modelos de regresin de PassingBablock


Variable Y

DIGITAL

Variable X

ANALGICO

Tamao de muestra

30

Ecuacin de regresin

Y = 5,9375 + 0,9375 X

Parmetro

Coeficiente
5,9375

IC95%
1,4912-9,5455

0,9375

0,9091-0,9649

Test de linealidad de
suma acumulada

p < 0,10

No existe desviacin significativa de la linealidad

p g in a 1099

C a pt u l o 11

p g in a 1100

C a pt u l o 11

Se puede utilizar el mtodo de PassingBablock?


2
S
Syy
2

1190,
69

Sx 2
= 0,8796
2
=
1353,
56

S.

= [ 1 ]
2
=
2 [ 1 ]

[ 0,9375 =
]2
0,8789

p g in a 1101

C a pt u l o 11

Pregunta de investigacin
El objetivo de este estudio ha sido analizar la
concordan- cia entre dos mtodos enzimticos de
determinacin de la AMILASA srica perteneciente a
una misma casa comercial y
basados en el mismo
principio
fsico-qumico.
Amilasa antigua
Amilasa nueva

Cul es el test estadstico ms


acertado?

p g in a 1102

C a pt u l o 11

Modelos de regresin de PassingBablock


Variable Y

AMILASA NUEVA

Variable X

AMILASA CLSICA

Tamao de muestra

548

Ecuacin de regresin

Y = 4,6190 + 0,8095 X

Parmetro

Coeficiente
4,6190

IC95%
4,000-5,200

0,8095

0,8000-0,8182

Test de linealidad de
suma acumulada

p < 0,01

Desviacin significativa de la linealidad

p g in a 1103

C a pt u l o 11

Error sistemtico
proporcional

p g in a 1104

C a pt u l o 11

CVa (nueva) =
152%

SD
CVa =

* 100

CVa (clsica) =
148%

NO SE PUEDE UTILIZAR el mtodo de Regresin ortogonal de


Deming
porque los CV > 100%.

p g in a 1105

C a pt u l o 11

Se puede utilizar el mtodo de PassingBablock?


Sy

= [ 1 ]

1450
=
8
No.

1869
5

0,7060

Sx
2

[ 0,8095 =
]2
0,6553

p g in a 1106

C a pt u l o 11

Pregunta de investigacin
Podemos sustituir en instrumento clsico analgico
por el nuevo sistema digital para la medida de la
tensin arterial?
Sistema analgico

Sistema digital

Cul es el test estadstico ms


acertado?

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.

p g in a 1107

C a pt u l o 11

Mtodo de mnimos cuadrados


ponderado
- En 1991 Zaydman et al., en su estudio sobre modelos de regresin lineal para
comparacin de mtodos, rechazan el mtodo de Passing-Bablok porque no cumple
las condiciones anteriores.
- Obtienen los mejores resultados con el mtodo de mnimos cuadrados ponderado
cuando los errores en la variable PREDICTORA X son pequeos frente al intervalo
de concentraciones como el medido (v.g. en Glucosa).

p g in a 1108

C a pt u l o 11

Mtodo de mnimos cuadrados


ponderado

EE

0,935
0,014 = 66,76 >> Z95% (1,96)
Z99,5% (3,29)

p < 0,05
p < 0,005

p g in a 1109

C a pt u l o 11

Pregunta de investigacin
El objetivo de este estudio ha sido analizar la
concordan- cia entre dos mtodos enzimticos de
determinacin de la AMILASA srica perteneciente a
una misma casa comercial y
basados en el mismo
principio
fsico-qumico.
Amilasa antigua
Amilasa nueva

Cul es el test estadstico ms


acertado?

p g in a 1110

C a pt u l o 11

Mtodo de mnimos cuadrados


ponderado

p g in a 1111

C a pt u l o 11

p g in a 1112

Mtodo grfico de Bland y


Altman
- Bland y Altman proponen su mtodo de evaluacin de las diferencias, con el atractivo de
su sencillez de clculo y su utilizacin frente al uso de los mtodos de regresin
anteriores.
- Representan grficamente la diferencia entre los dos mtodos (D = Y X) frente a la
media de la suma de los dos resultados (A = X + Y / 2).

Altman DG, Bland JM. Measurement in medicine: the analysis of method comparison studies. The
Statistician 1983; 32, 307-317.
Lpez, F. Utilizacin adecuada de las pruebas estadsticas en los estudios de comparacin de
procedimientos. Quim Clin 2000; 19: 237.

C a pt u l o 11

Pregunta de investigacin
Podemos sustituir en instrumento clsico de gran
tamao por el sistema mini porttil para la medida
del flujo respira- torio mximo (FEM)?
Clsico grande

Mini porttil

Cul es el test estadstico ms


acertado?

Altman DG, Bland JM. Measurement in medicine: the analysis of method comparison studies. The
Statistician 1983; 32, 307-317.

p g in a 1113

C a pt u l o 11

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

GRANDE 1 Medida

GRANDE 2 medida

MINI 1 medida

MINI 2 medida

494
395
516
434
476
557
413
442
650
433
417
656
267
478
178
423
427

490
397
512
401
470
611
415
431
638
429
420
633
275
492
165
372
421

512
430
520
428
500
600
364
380
658
445
432
626
260
477
259
350
451

525
415
508
444
500
625
460
390
642
432
420
605
227
467
268
370
443

p g in a 1114

Se midi el flujo respiratorio mximo (FEM) en una muestra de 17 individuos con un amplia gama de FEM. Se
realizaron 2 mediciones en cada instrumento (grande clsico y Mini portatil). Slo la 1 medida de cada aparato
se utiliz para la comparacin de los mtodos, la 2 medicin se utiliz en el estudio de la repetibilidad.

C a pt u l o 11

r = 0,9433; p <0,0001

Sistema portatil Mini


(l/min)

80
0

Generalmente los puntos de datos se agrupan cerca


de la lnea y es difcil evaluar las diferencias entre
los mtodos comparados

60
0
40
0

20
0
0
0
800

200

400

600

Sistema clsico grande Flujo


respiratorio (l/min)

p g in a 1115

C a pt u l o 11

p g in a 1116

C a pt u l o 11

p g in a 1117

Mtodo grfico de Bland y Altman:


Interpretacin
-En el caso de que no haya error sistemtico los puntos se distribuirn de forma
aleatoria a uno y otro lado de la recta correspondiente a la diferencia 0 entre medidas
(lnea horizontal naranja).
-La lnea azul representa la media de las diferencias, que en nuestro ejemplo
corresponde a 2,1 (error sistemtico del segundo mtodo respecto al primero).
- Las lneas marrones representan los lmites de confianza definidos mediante 2 DE de
la media de la diferencia, y se denominan lmites de concordancia

Altman DG, Bland JM. Measurement in medicine: the analysis of method comparison studies. The
Statistician 1983; 32, 307-317.
Bland JM, Altman DG . Statistical methods for assessing agreement between two methods of
clinical
measurement. Lancet 1986: 307310.

C a pt u l o 11

p g in a 1118

Reflexiones del
grfico
-Se observa una considerable falta de concordancia entre los medidores grandes y mini,
con discrepancias de hasta 80 l/min.
-Siempre que las diferencias d 2s no sean clnicamente importantes podamos
asumir que los mtodos de medicin son intercambiables. Estas d 2s son los lmites
de acuerdo.
- Para los datos de FEM se tiene:
d - 2s = -2,1 - (2 * 38,8) = - 78,1 l /
min d + 2s = -2,1 + (2 * 38,8) = - 73,9
l / min
-El medidor Mini ofrece datos de hasta 80 l / min por debajo o de 76 l / min por encima
del medidor grande, lo que es inaceptable para los propsitos clnicos.
- Esta falta de concordancia NO es evidente en la figura de correlacin lineal de FEM.

C a pt u l o 11

Ensayo de
repetibilidad
-La repetibilidad es relevante para el estudio de comparacin de mtodos porque
la repetibilidad de los mtodos de medida limita el grado de concordancia.
-Si un mtodo presenta una repetibilidad pobre - es decir, existe una considerable
variacin en las mediciones repetidas en la misma muestra - el grado de
concordancia entre ambos mtodos es pobre tambin.
-La mejor manera de examinar la repetibilidad de un instrumento es tomar
medidas repetidas en una serie de muestras.
-Se calcula la media y la desviacin estndar de la diferencias medidas. La diferencia
media debe ser cero, ya que se trata del mismo mtodo. Si la diferencia de medias
es significativamente diferente de cero, no podemos utilizar los datos para evaluar la
repetibilidad, ya sea porque el conocimiento de la 1 medida est afectando a la 2 o el
de la medida es modificar la cantidad).

p g in a 1119

C a pt u l o 11

Ensayo de repetibilidad en el
Mini

p g in a 1120

C a pt u l o 11

Pregunta de investigacin
Podemos sustituir en instrumento clsico analgico
por el nuevo sistema digital para la medida de la
tensin arterial?
Sistema analgico

Sistema digital

Cul es el test estadstico ms


acertado?

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.

p g in a 1121

C a pt u l o 11

Mtodo grfico de Bland y


Altman

La diferencia
entre ambos
mtodos es
LINEAL a lo
largo del rango
de medicin
Error sistemtico
proporcional

p g in a 1122

C a pt u l o 11

p g in a 1123

Mtodo grfico de Bland y Altman:


Interpretacin
-Existe un importante error sistemtico porque los puntos se distribuyen
preferentemente por encima de la recta correspondiente a la diferencia 0 entre medidas
(lnea horizontal naranja).
-El error sistemtico es proporcional porque la diferencia entre ambos mtodos es LINEAL
(lnea rosa) a lo largo del rango de medicin.
-La lnea azul representa la media de las diferencias, que en nuestro ejemplo
corresponde a 3,2 (error sistemtico del segundo mtodo digital- respecto al primero
analgico-).
- Las lneas marrones representan los lmites de confianza definidos mediante 2 DE de
la media de la diferencia (de -3,8 a +10,2 ), y se denominan lmites de concordancia.

C a pt u l o 11

Pregunta de investigacin
El objetivo de este estudio ha sido analizar la
concordan- cia entre dos mtodos enzimticos de
determinacin de la AMILASA srica perteneciente a
una misma casa comercial y
basados en el mismo
principio
fsico-qumico.
Amilasa antigua
Amilasa nueva

Cul es el test estadstico ms


acertado?

p g in a 1124

C a pt u l o 11

Mtodo grfico de Bland y


Altman
La diferencia entre
ambos mtodos es
LINEAL a lo largo del
rango de medicin

Error sistemtico
proporcional

p g in a 1125

C a pt u l o 11

p g in a 1126

Mtodo grfico de Bland y Altman:


Interpretacin
-Existe un error sistemtico porque casi todos los puntos se distribuyen
preferentemente por encima de la recta correspondiente a la diferencia 0 entre medidas
(lnea horizontal naranja).
-El error sistemtico es proporcional porque la diferencia entre ambos mtodos es LINEAL
(lnea rosa) a lo largo del rango de medicin.
-La lnea azul representa la media de las diferencias, que en nuestro ejemplo
corresponde a 11,8 (y nos mide el error sistemtico del segundo mtodo amilasa nuevarespecto al primero clsica-).
- Las lneas marrones representan los lmites de confianza definidos mediante 2 DE de
la media de la diferencia (de -21,2 a +44,8 ), y se denominan lmites de concordancia.

C a pt u l o 11

Evaluacin de mtodos diagnsticos


cuantitativos
Recomendaciones de Z aydman

Zaydman L, Lasky FD, Van Nostrand C, Doptis PD. Recommended


linear regressin models for comparison of method in clinical Chemistry. Clin Chem 1991, 37: 960.

p g in a 1127

C a pt u l o 11

Recomendaciones de Z aydman
Modelos de regresin de Passing-Bablock
No debe utilizarse porque NO cumple la condicin:
1. La razn de varianzas en Y y X iguale el cuadrado de la
pendiente.

Sy
2

= [ 1 ]
2

Sx
2
Zaydman L, Lasky FD, Van Nostrand C, Doptis PD. Recommended
linear regressin models for comparison of method in clinical Chemistry. Clin Chem 1991, 37: 960.

p g in a 1128

C a pt u l o 11

Recomendaciones de Z aydman
Mtodo de mnimos cuadrados (mtodo regresin lineal
simple)
No debe utilizarse porque NO cumple los siguientes requisitos:
1.Ausencia de error en la variable PREDICTORA (independiente) X.
2.Que el error en la variable RESULTADO Y debe ser homogneo en todo el
intervalo de concentraciones.

Zaydman L, Lasky FD, Van Nostrand C, Doptis PD. Recommended


linear regressin models for comparison of method in clinical Chemistry. Clin Chem 1991, 37: 960.

p g in a 1129

C a pt u l o 11

Recomendaciones de Z aydman
Mtodo de mnimos cuadrados ponderado
Debe utilizarse cuando:
Los errores en la variable predictora (independiente) x son pequeos frente al
intervalo de concentraciones medido (glucemia).

Mtodo de regresin ortogonal de D eming


Debe utilizarse cuando:
Cuando los errores en la variable predictora x son significativos frente al intervalo
ensayado, cuando el intervalo de concentraciones es estrecho (kaliemia).

Zaydman L, Lasky FD, Van Nostrand C, Doptis PD. Recommended


linear regressin models for comparison of method in clinical Chemistry. Clin Chem 1991, 37: 960.

p g in a 1130

C a pt u l o 11

p g in a 1131

C a pt u l o 11

p g in a 1132

Pregunta de investigacin
El objetivo de este estudio ha sido analizar la
concordancia entre dos dispositivos de medida del
oxido ntrico (N O ) ex- halado, un Analizador de
quimioluminiscencia estacionario (N IO X Aerocrine)
analizador ideal, y un analizador porttil (N IO X MIN
O ), basado en anlisis electroqumico.
Equipo
Equipo porttil
estacionario N 6008 SIR

N IO X -MIN O

Cul es el test estadstico ms


acertado?

Fortuna AM, Feixas T, Casan P. Determinacin de xido ntrico en aire espirado (FENO) mediante un equipo
porttil (NIOX-MINO Aerocrine) en poblacin sana. Arch Bronconeumol. 2007;43:176-9.

C a pt u l o 11

p g in a 1133

Anlisis
estadstico
Para la descripcin de los valores de FENO se facilitan valores medios desviacin
estndar. La comparacin entre valores medios se llev a cabo mediante un test de
Mann- Whitney. La comparacin de los resultados individuales se analiz mediante la
correlacin de Pearson. En todos los casos la aproximacin ha sido bilateral y el nivel de
significacin el habitual del 5% ( = 0,05). El programa informtico empleado en el
anlisis fue el paquete estadstico SPSS versin 11.

Fortuna AM, Feixas T, Casan P. Determinacin de xido ntrico en aire espirado (FENO) mediante un equipo
porttil (NIOX-MINO Aerocrine) en poblacin sana. Arch Bronconeumol. 2007;43:176-9.

C a pt u l o 11

FENO (ppb) con el equipo NIOX-MINO

50

p g in a 1134

[NIOX-MINO] = 10 + 1,5 [N-6000 SIR]


[NIOX-MINO] = 10 + 1,5 [N-6000 SIR]

40

30

20

10

r = 0,855; p =0,001
r = 0,855; p =0,001

0
0

10

20

FENO (ppb) con el equipo N-6000


SIR

Fig. 3. Correlacin de xido ntrico en aire espirado (FENO) entre la determinacin con los equipos
N-6008 SIR (sensor de quimioluminiscencia) y NIOX-MINO (mtodo de electroqumica) en voluntarios
sanos. La correlacin de Pearson muestra la curva de regresin lineal entre ambos equipos (y = FENO
[ppb] con equipo NIOX-MINO; x = FENO [ppb] con el equipo N-6008 SIR).

C a pt u l o 11

p g in a 1135

Resultado
s
El valor medio ( desviacin estndar) de FENO con el equipo NIOX-MINO fue de 20
7 ppb (rango: 8-41ppb), y con el sensor N-6008, de 7 5 ppb (rango: 1-19 ppb).
Se observ una correlacin directa y estadsticamente significativa de la determinacin
de FENO entre ambos equipos (r = 0,92; p = 0,001). Los valores de FENO con el equipo
NIOX-MINO siempre fueron superiores a los obtenidos con el equipo N-6008.
Adems, la curva de regresin lineal demostr un factor de correccin de: FENO (NIOXMINO) = 10 + 1,5 FENO (N-6008) (fig. 3).

Fortuna AM, Feixas T, Casan P. Determinacin de xido ntrico en aire espirado (FENO) mediante un equipo
porttil (NIOX-MINO Aerocrine) en poblacin sana. Arch Bronconeumol. 2007;43:176-9.

C a pt u l o 11

p g in a 1136

D iscusi
n
Al comparar los 2 equipos y mtodos se constata que existe una muy buena correlacin
de cada determinacin de FENO para ambos equipos, con un factor de correccin entre
los valores de los 2 equipos de 1,5 + 10 para cada valor de FENO obtenido con el
equipo N-6008 (figs. 2 y 3), lo que coincide con los valores obtenidos por otros autores.

Fortuna AM, Feixas T, Casan P. Determinacin de xido ntrico en aire espirado (FENO) mediante un equipo
porttil (NIOX-MINO Aerocrine) en poblacin sana. Arch Bronconeumol. 2007;43:176-9.

C a pt u l o 11

p g in a 1137

C a pt u l o 11

p g in a 1138

Mito 1: La sonrisa de la
esfinge
Por qu das un valor de corte, como valor de referencia, a partir de la media ms
2 desviaciones estndar?
El clculo de valores de referencia basado en la media 2 desviaciones estndar
slo puede aplicarse si las variables siguen distribuciones normales.
Se cumplen la normalidad de la variable cuantitativa (medida del NO en el aire
exhalado) en los dos instrumentos comparados?
No aportas ningn test estadstico (analtico o grfico) que demuestre que dicha variable
sigue la distribucin normal. En la tabla I aparecen otros trabajos (5 y 10) se han tenido
que realizar transformaciones logartmicas para normalizar la variable.
Seguro que sigue una distribucin normal?

C a pt u l o 11

p g in a 1139

Mito 1: La sonrisa de la
esfinge
Por qu has elegido el coeficiente de correlacin de Pearson? Se cumplen
todos los requisitos para poder utilizarlo? Te permite ese test decir que los
resultados son intercambiables entre ambos instrumentos de medida?
El coeficiente de correlacin de lineal (r) de Pearson NO resulta una medida
adecuada
del grado de acuerdo o concordancia entre dos mediciones de un mismo parmetro
(NO), ya que si dos instrumentos miden sistemticamente cantidades diferentes uno del
otro, la correlacin puede ser perfecta (r 1), a pesar de que la concordancia sea nula.
El coeficiente de correlacin r de Pearson deca que la magnitud de la asociacin de la
medida del NO entre el equipo NIOX-MINO y el equipo N-6008 es del 92% (r=0,92)
de la mxima posible.

C a pt u l o 11

Mito 1: La sonrisa de la
esfinge
Por qu has elegido el coeficiente de correlacin de Pearson? Se cumplen
todos los requisitos para poder utilizarlo? Te permite ese test decir que los
resultados son intercambiables entre ambos instrumentos de medida?
Se ha demostrado que el coeficiente de correlacin de Pearson para evaluar la
concordancia entre medidas cuantitativas es insuficiente-inadecuado y que la
interpretacin de dicho coeficiente como una medida de concordancia es errnea. La
igualdad de medias tan slo garantiza que los 2 mtodos se centran en el mismo
valor, pero en ningn caso que todos sus valores sean iguales.

p g in a 1140

C a pt u l o 11

p g in a
1141

Mito 1: La sonrisa de la
esfinge
Por qu utilizas el test de Mann-Whitney?
Los autores utilizan para la comparacin de medias el test de Mann-Whitney, que es
una prueba no paramtrica de comparacin de medias para grupos independientes;
sin
embargo, al tratarse de medidas apareadas, deberan haber utilizado el test no
paramtrico para la comparacin de medias de medidas apareadas, que es la prueba de
Wilcoxon.

C a pt u l o 11

Mito 1: La sonrisa de la
esfinge
Afortunadamente, un buen estudio con un anlisis deficiente siempre se puede
volver a analizar. Hay paquetes estadsticos (MedCalc) que incorporan
directamente un
procedimiento de comparacin de mtodos que incluyen el clculo de test que
determinan la concordancia entre medidas cuantitativas:
a) mtodos analticos, a travs del clculo de diferentes coeficientes que evalan
la concordancia, como el coeficiente de correlacin intraclase o el coeficiente de
correlacin-concordancia de Lin, modelos de regresin (modelos de regresin
de
Deming y de Passing-Bablock), ANOVA de medidas repetidas y modelos de
ecuaciones estructurales, y
b) mtodos grficos como el mtodo de Bland y Altman (que calcula un intervalo de
concordancia), el grfico de distribucin acumulativa emprica grfico montaa
(mountain plot) o el grfico de la concordancia- supervivencia (survival-agreement
plot).

p g in a 1142

C a pt u l o 11

p g in a 1143

Mito 1: La sonrisa de la
esfinge
Como puedes observar en la tabla I he realizado una revisin bibliogrfica ms
exhaustiva
que la tuya en la literatura mdica.
He encontrado en la pgina web http://www.nioxmino.com/references.html) muestra
diversos estudios que s utilizan algunos de estos mtodos (tabla I). Si hubieras usado
los
grficos
Bland yentre
Altman
puede que
hubierasdeencontrado
(como
los estudios
6y7
la tabla)
unade
relacin
los valores
apareados
FENO con los
2 equipos
de
de tipo heterocedstica, es decir, a mayores valores de FENO , mayores son las
medida
diferencias
entre las
medidas.

C a pt u l o 11

p g in a 1144

C a pt u l o 11

Mito 1: La sonrisa de la
esfinge
Por qu no indicas el intervalo de confianza del coeficiente de correlacin de
Pearson?
Los autores no aportan un intervalo de confianza para dicho coeficiente. Calculado
por m, dicho intervalo del 95% es de 0,83 a 0,96, lo que implica que valores
posibles de dicho coeficiente podran ser inferiores a 0,90, los cuales
empricamente se han clasificado como correlacin slo buena.

p g in a 1145

C a pt u l o 11

Mito 1: La sonrisa de la
esfinge
Eres el nico autor que ha investigado la correlacin entre dichos instrumentos?
Por qu no comparas tus resultados con los publicados en la bibliografa?
Otros trabajos, encontrados en mi revisin bibliogrfica, ninguno de los cuales han
sido mencionados por los autores, ofrecen coeficientes de correlacin de Pearson
mejores que el tuyo (0,92) y mucho ms cercanos a 1, como se indica en la tabla I.

p g in a 1146

C a pt u l o 11

p g in a 1147

C a pt u l o 11

Mito 1: La sonrisa de la
esfinge
Como has podido ver en la tabla I, aunque otros autores tambin han utilizado slo el
coeficiente de correlacin de Pearson (trabajos 2, 8 y 11), este valor nicamente indica
la fuerza de asociacin entre 2 variables (la proximidad de los puntos de los 2 mtodos
de medida a la recta de regresin) y que dicha relacin es lineal, pero no
necesariamente que dicha recta sea la bisectriz; ni siquiera una correlacin perfecta es
sinnimo de concordancia perfecta.

p g in a 1148

C a pt u l o 11

Mito 1: La sonrisa de la
esfinge
Aunque te puedo creer cuando describes las bondades de la medida de FENO con
el
nuevo equipo porttil (sencillez, rapidez, manejabilidad, coste, etc.) y su utilidad en el
diagnstico y seguimiento del paciente asmtico, lo que en ningn caso, te puedo
admitir del anlisis estadsticos de tus datos es que dicho equipo sea concordante
(fiable) con
el usado como referencia, ni que los valores de referencia propuestos sean vlidos
sin aportar informacin acerca de la forma de la distribucin de la variable.

p g in a 1149

C a pt u l o 11

2007; 67(6): 572-7


2007; 67(6):
572-7

p g in a 1150

C a pt u l o 11

Anlisis
estadstico
En el anlisis estadstico se ha estudiado la regresin de las medias de FENO
obtenidas con ambos dispositivos de medida respecto a la diferencia de las mismas,
mediante
el mtodo Bland-Altman, tanto en valores absolutos como relativos. Asimismo, se ha
analizado el grado de acuerdo entre los dos dispositivos de medida, en relacin con
los valores de normalidad para ambos, mediante el estadstico kappa de Cohen.

p g in a
1151

C a pt u l o 11

40

30

DIFERENCIA

+ 2 DE
20

Media

10

0
- 2 DE
-10

50

100

150

200

Media FENO
Figura 2: Anlisis estadstico (Bland-Altman). Media FE NO: media de la fraccin exhalada de xido ntrico;
DIF: diferencia de las medias de FE NO obtenidas con NIOX y con NIOX-MINO, en valores absolutos.

p g in a 1152

C a pt u l o 11

p g in a 1153

Mito 1: La sonrisa de la
esfinge
-Existe un error sistemtico porque casi todos los puntos se distribuyen
preferentemente por encima de la recta correspondiente a la diferencia 0 entre medidas
(lnea horizontal naranja).
-El error sistemtico es PROPORCIONAL porque la diferencia entre ambos mtodos es
LINEAL (lnea rosa) a lo largo del rango de medicin.
-La lnea azul representa la media de las diferencias, que en nuestro ejemplo
corresponde a 11 (y nos mide el error sistemtico del segundo mtodo porttilrespecto al primero).
- Las lneas marrones representan los lmites de confianza definidos mediante 2 DE
de
la media de la diferencia (de -3 a +25), y se denominan lmites de concordancia.

C a pt u l o 11

Anlisis estadstico mediante el ndice kappa de


C ohen
NIOX-MINO

NIOX

TOTAL

Anormal (+)
Normal (-)
Anormal (+)
9
1
Normal (-)
2
18
Total
11
19
Punto de corte de FE NO: media de la fraccin exhalada de xido ntrico.

Medida de acuerdo
Kappa de Cohen
N de casos vlidos

Valor de Kappa
+ 0,780
20

EEk
0,120

Z
4,286

Significacin
0,000

10
20
30

p g in a 1154

C a pt u l o 11

Resultados (fragmento del


texto)
La regresin de las medias obtenidas por ambos dispositivos de medida de FENO
respecto a la diferencia de las mismas fue significativa, tanto en valores absolutos
como relativos (p < 0,005) (fig. 2). Asimismo, hubo acuerdo entre los valores obtenidos
con ambos dispositivos de medida, kappa de Cohen 0,78 (fig. 3).

p g in a 1155

C a pt u l o 11

p g in a 1156

D iscusin (fragmento del


texto)
El objetivo de nuestro estudio ha sido analizar la concordancia entre dos dispositivos de
medida para NO exhalado, sistema NIOX y sistema porttil NIOX-MINO. Segn los datos
obtenidos en nuestra muestra, observamos que existen diferencias significativas (p <
0,005) en la regresin de las medias obtenidas por ambos dispositivos de medida
respecto a la diferencia de las mismas. Por tanto, los dos sistemas estudiados no son
equivalentes, por lo que no son sustituibles. De acuerdo con otros investigadores, los
valores obtenidos con el sistema NIOX-MINO han sido significativamente superiores a los
obtenidos con el sistema NIOX, tanto ms cuanto mayor ha sido el valor de FE obtenido
(fig. 2).
NO

C a pt u l o 11

D iscusin
(conclusiones)

p g in a 1157

En conclusin, la FENO , determinada mediante tcnica electroqumica con


sistemas
porttiles, es vlida en nios mayores de 5 aos y ofrece la posibilidad de cuantificar de
forma simple y no invasiva la inflamacin eosinoflica de la va area, que resulta de gran
utilidad como complemento a la funcin pulmonar en el diagnstico de asma y en el
control del tratamiento en nios.

Introduccin (fragmento del texto:


objetivos)

El objetivo de este estudio ha sido analizar la concordancia entre dos dispositivos


de medida de NO exhalado, un analizador de quimioluminiscencia estacionario
(NIOX, Aerocrine, Suecia), considerado como analizador.

C a pt u l o 12

C aptulo 12
Publicacin Bioestadstica: Anlisis multivariante.

D r. Jacobo D az Portillo
Coordinador de Formacin Continuada
Hospital Universitario de Ceuta

p g in a 1158

C a pt u l o 12

Fases del anlisis


estadstico
1. ANLISIS DESCRIPTIVO

2. ANLISIS BIVARIANTE

3. ANLISIS MULTIVARIANTE

p g in a 1159

C a pt u l o 12

Anova de 2
factores
Variable
C ausa o Factor 1: Cualitativa
Predictora
1

Interacci
n
Variable
Predictora
2 C ausa o Factor 2: Cualitativa

Variable
RESULTAD
D esenlaceOo
efecto:
Cuantitativa

p g in a 1160

C a pt u l o 12

Anova de 2
factores

Factor 1:
Variable predictora
1 Grupo cultural

F= 7,49 p<0,01

F= 1,09 p<0,01

Interacci
n

Variable
RESULTAD O
D esenlace o
C uantitativa

efecto: Peso del


RN

Factor 2:
Variable predictora
2 Tabaquismo materno
F= 0,59 N.S

p g in a
1161

C a pt u l o 12

p g in a 1162

Anlisis de la varianza (AN O VA) de dos


factores
Variable dependiente cuantitativa: Peso del
RN Factor 1 cualitativa: Grupo cultural
Factor 2 cualitativa: Tabaquismo materno

Estudio de la variable resultado peso del RN. Efecto de las variables predictoras grupo cultural y hbito de
tabaquismo en las madres.
Factor

Varianza

Significacin

Grupo cultural

3,2631

7,49

p < 0,01

Tabaquismo

2,5776

0,59

N.S

Interaccin (*)

4,7592

1,09

p < 0,01

(*) Test ANOVA de dos factores

Las diferencias en el peso de los RN se mantuvieron slo dependientes del grupo


cultural o de la interaccin de ambos factores, pero no del hbito de fumar. A ello pudo
contribuir el bajo nmero de madres musulmanas fumadoras.

C a pt u l o 12

Anova de 2
factores

Factor 1:
Variable predictora
1 Grupo cultural

F= 3,67 p<0,01

F= 0,34 N.S

Variable
RESULTAD O
D esenlace o
C uantitativa

efecto: VC M

Factor 2:
Variable predictora
2 Tipo de lactancia
F= 1,03

p<0,01

p g in a 1163

C a pt u l o 12

Anlisis de la varianza (AN O VA) de dos


factores

p g in a 1164

Variable dependiente o resultado cuantitativa: VCM


Factor 1 cualitativa (variable predictora principal): Grupo cultural
Factor 2 cualitativa (variable predictora secundaria): Tipo de
lactancia
Estudio de la variable resultado VCM en lactantes. Efecto de las variables predictoras grupo cultural y tipo
de lactancia.
Factor

Varianza

Significacin

Grupo cultural

6,0017

3,673

p < 0,01

Lactancia

1,6904

1,034

p < 0,01

Interaccin (*)

0,5579

0,341

N.S

(*) Test ANOVA de dos factores

Las diferencias en el VCM (microcitosis) se mantuvieron dependientes tanto del


grupo cultural como del tipo de lactancia, pero no de la interaccin de ambas
variables.

Daz Portillo J. Influencia del grupo tnico en el patrn lipoproteico de una determinada poblacin
peditrica de Ceuta. Tesis doctoral . Facultad de Medicina. Universidad de Cdiz . Noviembre 1997.

C a pt u l o 12

Anlisis multivariante
Anlisis multivariante para la deteccin de potenciales
factores de confusin
Variable Predictora 1
Variable Predictora 2
Variable Predictora 3
Variable Predictora 4
Variable Predictora 5
Variable Predictora n

Variable Resultado

p g in a 1165

C a pt u l o 12

p g in a 1166

Pruebas estadsticas de contraste de


hiptesis ms aplicables a cada situacin
Variable
Independiente
o PREDICTORA

Variable
Dependiente
o RESULTADO

Pruebas de contraste de
hiptesis

Observaciones y/o limitaciones del test

Cualitativa

Cualitativa

Ji cuadrado
Prueba exacta de
Fisher Test de
McNemar
Q de Cochran
REGRESIN LOGSTICA

Cualitativa

Cuantitativa

Cuantitativa

Cualitativa

Cuantitativa

Cuantitativa

t de Student
Anlisis de la
Varianza Test de
Mann-Whitney Test
de Wilcoxon
Test de KruskallWallis Test de
Friedman
Regresin logstica simple
Regresin logstica
multivariante
Regresin lineal
simple Correlacin de
Pearson Correlacin
de Sperman
REGRESIN MLTIPLE

Si el tamao muestral es
grande Si el tamao muestral
es pequeo
Dos grupos de muestras
repetidas o apareadas
Ms de dos grupos de muestras repetidas o
apareadas Varias variables predictoras
cualitativas
Compara medias entre dos grupos independientes
Compara medias entre ms de dos grupos
independientes Dos grupos independientes No
paramtricos
Dos grupos medidas repetidas No paramtrico
Ms de dos grupos No paramtrico, medidas
repetidas Ms de dos grupos No paramtrico
medidas repetidas
Una sola variable predictora cuantitativa
Varias variable predictoras cuantitativa o cualitativas
Paramtrico
Paramtrico
No
paramtrico
Varias
variables
predictoras

C a pt u l o 12

REGRESIN LINEAL
MLTIPLE

REGRESIN LOGSTICA
MULTIVARIANTE

Variable
RESULTADO

Cuantitativa

Cualitativa
(dicotmica)

Variables
PREDICTORAS

Cualitativa
Cuantitativa

Cualitativa
Cuantitativa

ECUACIN

p g in a
1167

C a pt u l o 12

Regresin logstica
multivariante
Es un modelo de regresin que permite estudiar si una variable resultado
de tipo cualitativa nominal depende, o no, de otras variables predictoras.
La naturaleza de las variable predictoras puede ser:
-Categrica DICOTMICA, es decir, slo puede admitir dos
posibles resultados.
- CUANTITATIVA (discreta o continua).

p g in a 1168

C a pt u l o 12

Regresin logstica
multivariante

Variable Predictora 1
Variable Predictora 2
Variable Predictora 3

Variable Resultado

Variable Predictora 4
Variable Predictora 5
Variable Predictora n

C ualitativa
dicotmica

p g in a 1169

C a pt u l o 12

Ejemplos de posibles modelos de regresin


logstica
Variable RESULTADO

Variables PREDICTORAS

Curacin (si/no)

tratamiento aplicado
grado de cumplimiento
gnero
comorbilidad

HTA (si/no)

ingesta de sal
antecedentes familiares
edad

Morir por cncer de mama

grado del tumor


edad
tipo histolgico
receptores hormonales

RN de bajo peso

HTA, edad, tabaquismo, peso materno,


raza, complicaciones obsttricas

p g in a
1170

C a pt u l o 12

p g in a
1171

Aplicacin de los modelos de regresin


logstica
-En ENSAYOS CLNICOS en los que se evala un evento o resultado
en relacin a uno o ms factores etiolgicos, predictores o asociados
(RR).
-En estudios de COHORTES en los que se evala un evento o resultado en
relacin a uno o ms factores de riesgo (etiolgicos, predictores o
asociados) (RR).
-En estudios de CASOS Y CONTROLES en los que se evalan
diferentes factores en cada grupo, para encontrar asociaciones entre
ellos y la enfermedad o caso (OR).
-En estudios TRANSVERSALES en los que se evalan diferentes
variables predictoras (factores de riesgo), para encontrar asociaciones
entre ellas y la enfermedad en estudio (variable resultado).

C a pt u l o 12

p g in a 1172

O bjetivos de los modelos de regresin


logstica
1. ESTIMAR la relacin entre una o ms variables predictoras con la
variable resultado.
- Estudios etiolgicos.
- Confusin e interaccin.
2. PREDECIR lo mejor posible la variable RESULTADO o respuesta,
usando la combinacin ms eficiente de las variables PREDICTORAS
incluidas en el estudio.

C a pt u l o 12

C aractersticas de los modelos de regresin


logstica
multivariante
-

La variable RESULTADO es siempre cualitativa


discreta Si = 1
No = 0
Las variables PREDICTORAS del modelo
puede ser Continuas
Discretas
-La ecuacin inicial del modelo NO es una funcin lineal, sino
cuyas
pendientessison
losuna
distintos
coeficientes
de regresin
i (LOGIT) la
EXPONENCIAL,
bien
sencilla
transformacin
logartmica
.convierte finalmente en una funcin lineal, que sigue la ecuacin de la
recta

p g in a 1173

C a pt u l o 12

Anlisis de regresin logstica


mltiple

p g in a
1174

C a pt u l o 12

Ventajas de los modelos de regresin logstica


multivariante (1)
1. Es un modelo til en muchas circunstancias de investigacin en
medicina...
- En las que se quiere analizar o predecir una respuesta dicotmica de
la variable resultado
Enfermo / sano
Vive / muere
Presente /
ausente Positivo /
negativo
- En funcin de su
perfil de variables
predictoras o factores
de riesgo, que
pueden ser
cualitativas: gnero, sexo, grupo cultural, estado civil, nivel de

p g in a 1175

C a pt u l o 12

Ventajas de los modelos de regresin logstica


multivariante (2)
2. Es la mejor aproximacin a la realidad biolgica, ya que la
influencia de una variable predictora o factor de riesgo sobre la
probabilidad de que aparezca una enfermedad (variable resultado)
suele asemejarse ms a una curva sigmoidea (funcin exponencial)
que a una recta.
La curva sigmoidal es la representacin habitual de una respuesta
a diferentes dosis de un estmulo.
Probabilidad de
enfermedad
coronaria

X
1

Factor de riesgo: cLDL

p g in a
1176

p g in a 1177

C a pt u l o 12

Ventajas de los modelos de regresin logstica


multivariante (3)
3. El modelo matemtico del modelo permite obtener directamente la
ODDS RATIO (OR) o el RIESGO RELATIVO (RR) para cada factor de
variable
riesgo o PREDICTORA incluida en el modelo. El coeficiente i de
cada
variable predictora obtenido por regresin logstica es el
logaritmo neperiano
de la OR o del RR del factor de riesgo.

OR

OR1 = e

RR

RR1 = e

C a pt u l o 12

p g in a 1178

Funciones de los modelos de regresin


logstica
multivariante
1.CUANTIFICAR la relacin existente entre las distintas variables predictoras incluidas
en el modelo y la variable resultado (respuesta).
2.CONTROLAR Y AJUSTAR aquellas variables predictoras que actan como potenciales
FACTORES MODIFICADORES de EFECTO, especialmente los FACTORES de
CONFUSIN.
3.PREDECIR LA RESPUESTA de la variable resultado en funcin de las variables
predictoras o factores de riesgo, clasificando a los individuos en una de las dos
posibles respuestas en funcin de la probabilidad que arroje su perfil de variables
predictoras incluidas en el modelo de regresin logstica multivariante.

C a pt u l o 12

Variables explicativas o predictoras en el


modelo de
regresin logstica
Variables CUALITATIVAS

Variables CUANTITATIVAS

El modelo asume estimaciones basadas en variables continuas

La OR y el RR son medidas que cuantifican el cambio en el riesgo cuando se


pasa de un valor del factor a otro

Las variables cualitativas deben ser


modeladas en 2 categoras (0,1) o
transformadas en tantas variables
dicotmicas como categoras (variables DUMMY)

Este aumento o disminucin del riesgo es


lineal y proporcional al cambio

p g in a 1179

C a pt u l o 12

p g in a 1180

Regresin logstica:
Estimacin de coeficientes

0, 1, 2,.., n son los coeficientes de regresin logstica del


- 0 es el trmino independiente (o constant en SPSS)
modelo
- El resto de las i son los coeficientes de regresin logstica para
las
diferentes variables predictoras incluidas en le modelo
- La evidencia de relacin entre una variable predictora y la variable
significativamente
diferente
cero
i
resultado es la existencia
deaun
coeficiente
de regresin logstica
0
- El signo de i tiene un significado importante
- Si es positivo (i > 0) significa que esa variable predictora AUMENTA
porque
la
PROBABILIDAD del suceso (variable resultado o respuesta) que
estamos
-analizando.
Si es negativo (i < 0) su clculo se lleva a cabo mediante la
FUNCIN
DE
MXIMA
VEROSIMILITUD.

C a pt u l o 12

Regresin logstica:
D efinicin de las hiptesis nula H o y
alternativa
Ha
- La hiptesis conceptual
es que una o varias variables predictoras

influyen significativamente en la probabilidad del suceso en estudio (que la


variable predictora tome un valor u otro)
- Las hiptesis operativas se reducen al contraste de los diferentes
coeficientes i obtenidos en el anlisis de los datos como estimadores de
las
variables predictoras de inters
As, cuando slo hay una variable predictora
H
1 = 0
X10
Ha
1 0
- Hay varios procedimientos para llevar a cabo este
contraste.

p g in a 1181

C a pt u l o 12

p g in a 1182

Regresin logstica:
Procedimientos para evaluar el contraste de hiptesis
1. Evaluacin estadstica del coeficiente i
2. Evaluacin estadstica de WALD
- El estadstico de WALD es el resultado de dividir el cuadrado del
coeficiente de regresin logstica i por el cuadrado de su error estndar
EEi
razn
de verosimilitud
3. Evaluacin
estadstica de la razn de verosimilitud (L0)
5.
Evaluacin
del estadstico Z2, (Goodness of
(L
)
4. 0Evaluacin
estadstica del cambio del estadstico -2LL0
Fit)
- Este estadstico resulta ser menor de dos veces el logaritmo neperiano de
la

C a pt u l o 12

p g in a 1183

1. Evaluacin estadstica del


coeficiente i
- El coeficiente de regresin logstica i de la variable predictora i debe
ser estadsticamente distinto de cero i 0 para que esta tenga
influencia significativa sobre la variable resultado.
- La hiptesis H0 ser que... i =
0
- La hiptesis Ha ser que... i
0
- Para tener en cuenta el error aleatorio (EEi) con que el coeficiente
i (obtenido en la regresin logstica) estima al coeficiente de
regresin poblacional n se lleva a cabo un contraste a travs del
estadstico t
de Student con un nmero de grados de libertad igual al nmero de
individuos de la muestra (N) menos el nmero de variables predictoras
(n) introducidas en el modelo.

C a pt u l o 12

p g in a 1184

Interpretacin del coeficiente de regresin


logstica i
-Si su signo es positivo (i > 0), la probabilidad de que se d o aparezca la
caracterstica de la variable predictora aumentar segn aumente el valor
de xn (la variable resultado a quien afecta).
-Si i 0 es significativamente distinta de cero (test de contraste de hiptesis
p < 0,05), la variable predictora i influye significativamente en la probabilidad
de que se d o aparezca la caracterstica de la variable resultado, y el
modelo logstico tiene sentido.

C a pt u l o 12

2. Evaluacin estadstica de
W ald
El estadstico de Wald (W) es tambin muy utilizado para evaluar la
significacin estadstica del modelo de regresin logstica multivariante.
El estadstico W se obtiene dividiendo el cuadrado de i por el cuadrado
del
error estndar de i
El estadstico de Wald se distribuye segn una CHI
CUADRADO.
La hiptesis a contrastar son las mismas que en el caso
anterior La hiptesis H0 ser que... W = 0
La hiptesis Ha ser que... W 0

p g in a 1185

C a pt u l o 12

Evaluacin del modelo de Regresin logstica multivariante mediante el programa


estadstico
SPSS
ESTADSTICO
HIPTESIS NULA
CONTRASTE
SIGNIFICACIN

i
Wald
(i)2 / (EEi)2
- 2 Log
Likelihood (-2LL)

i = 0
i = 0

L=1

(-2LL) = 0
ajuste perfecto
Improvement
o cambio en la razn
de verosimilitud en
cada paso
Z2

t de Student

p < 0,05

CHI CUADRADO

p < 0,05

CHI CUADRADO
con n-k-1 grados
de libertad

Si rechaza la hiptesis
nula
(p < 0,05) significa que
el modelo de regresin
no es significativo
p < 0,05

(-2LLK-1) - (-2LLK )

CHI CUADRADO
con k grados de
libertad

Z2 0

CHI CUADRADO

Si se rechaza la
hiptesis nula
(p < 0,05) significa que
el modelo de regresin
no es significativo

(-2LL0) - (-2LLK )

CHI CUADRADO
con k grados de
libertad

p < 0,05

(Goodness of Fit)

Model Chi- Square

p g in a 1186

C a pt u l o 12

Evaluacin del modelo de Regresin logstica


multivariante
mediante el programa estadstico SPSS
ESTADSTICO

HIPTESIS NULA

CONSTANTE

SIGNIFICACIN

=0

t de Student

p < 0,05

CHI CUADRADO

p < 0,05

Wald

W=0
[ ]2
i

[EE ]2
i

Si se rechaza la hiptesis nula (Ho) (p< 0,05) significa que el modelo de regresin
es significativo.

p g in a 1187

C a pt u l o 12

Es posible predecir el estado de los depsitos


medulares de hierro conociendo los niveles sricos
de ferritina y el VC M del hemograma?
Variable predictora 1
VC M

Variable resultado
cualitativa
D epsitos de hierro
en Mdula sea

Variable predictora
2 FERRITIN A
(srica)

1 = Depsitos de hierro normales


0 = Dficit de hierro medular

p g in a 1188

C a pt u l o 12

Anlisis de regresin lineal


mltiple

Posible variables predictoras asociadas a los depsitos de hierro en mdula sea


Variables predictoras
Constante

Estimacin
- 0,6799

Error estndar EE

VCM

- 0,02223

0,03835

FERRITINA SRICA

0,1919

0,05525

Para que una variables PREDICTORAS est relacionada estadsticamente con


la variable resultado (depsitos de hierro en mdula sea) debe cumplirse
siempre la condicin de que

Ferritina

0,1919
=

EE Ferritina
VCM
EE VCM

0,05525 = 3,47 > Z95% (1,96)

p < 0,05

-0,02223
0,03835

= 0,06 << Z95% (1,96)

p > 0,05

p g in a 1189

C a pt u l o 12

Mtodo de introduccin de las


variables

REGRESIN LINEAL
MLTIPLE

REGRESIN LOGSTICA
MULTIVARIANTE

Forward (hacia adelante)

Introducir progresivamente en el modelo las variables


predictoras estadsticamente significativas, comenzando por
la que tenga mayor significacin

Backward (hacia atrs)

Comienza por estimar un modelo que contiene todas las


variables predictoras para ir eliminando posteriormente
una a una, de forma sucesiva, aquellas que no sean
significativas

Stepwise

Es una combinacin de los anteriores

p g in a 1190

C a pt u l o 12

Anlisis de Regresin Logstica mltiple


Qu relacin existe entre las variables predictoras
VC M y Ferritina srica y los depsitos de hierro
medular?
VC M y Ferritina srica

Variables PRED IC TO RAS

log

P
1-P

log

P
1-P

D epsitos de Fe medular

Variable RESULTAD O

= 0 + X 1 + 2X 2

= -2,1290 + 0,1713
FERRITINA

P = probabilidad de que existan depsitos de hierro medular

p g in a
1191

C a pt u l o 12

Anlisis de Regresin Logstica mltiple


Qu relacin existe entre las variables predictoras
VC M y Ferritina srica y los depsitos de hierro
medular?
VC M y Ferritina srica

Variables PRED IC TO RAS

OR =

OR =

i (X)

0,1713 (Xa

XX
) Niveles de ferritina srica del paciente A
a b=
Xb = Niveles de ferritina srica del paciente B

D epsitos de Fe medular

Variable RESULTAD O

p g in a 1192

C a pt u l o 12

Qu diferencia promedio de probabilidades de tener


depsitos medulares normales existe entre un paciente
A con 24 ng/ml de ferritina y otro B con 3 ng/ml?
Variables predictoras

Paciente A

PACIENTE B

Ferrritina srica (ng/ml)

0,1713

24 ng/ml

3 ng/ml

OR =

OR =

i (X a X b)

0,1713 (24 - 3)

= 36,6

El paciente A tiene una probabilidad de 37 veces de tener depsitos medulares


de hierro normal frente al paciente B.

p g in a 1193

C a pt u l o 12

p g in a 1194

Pregunta de
investigacin

-Qu relacin existe entre diversas posibles variables predictoras y la probabilidad


de muerte del recin nacido de bajo peso?
-Estudio de COHORTES realizado por Horbar et al (1993) con 3603 RN de peso
entre 501-1500 g (2 aos de seguimiento).
Variable Predictora 1
Variable Predictora 2
Variable Predictora 3

Anlisis
Multivariante
Variable Resultado

Variable Predictora 4
Variable Predictora 5
Variable Predictora n

Probabilidad de
morir

Horbar JD, Onstad L, Wright E. Predicting mortality risk for infants weighing 501 to 1500 grams at birth: The
National Institutes of Health Neonatal Research Network report. Crit Care Med 1993; 21:1218.

C a pt u l o 12

p g in a 1195

Estudio de cohortes prospectivo de Recin


N acidos
Factores de Riesgo
Variables
predictoras
Muertos por otras
causas

Variable RESULTADORESPUESTA-posible EFECTO


Variable dependiente
Variable cualitativa dicotmica

Fallecimientos

3603 RN de peso
comprendido
entre 501 y 1500
g
Prdidas de
seguimiento
S
e
g
u
i
Horbar JD, Onstad L, Wright E. Predicting mortality risk for infants weighing
501 to 1500 grams at birth: The
m Med 1993; 21:1218.
National Institutes of Health Neonatal Research Network report. Crit Care
i
e
n

C a pt u l o 12

Estudio de cohortes prospectivo de Recin


N acidos

Objetivo: Evaluar el riesgo de muerte en RN de bajo peso (entre 501 1500 g)


Variable resultado: Fallecimiento del RN
(dicotmica) Variable predictora [1]: peso en
gramos del RN
Variable predictora [2]: Tamao segn edad
gestacional Variable predictora [3]: Raza
Variable predictora [4]: Sexo
Variable predictora [5]: tipo de parto
(vaginal/cesrea) Variable predictora [6]:
presentacin del parto Variable predictora [7]: ndice
del Apgar al minuto
Variable predictora [8]: Presencia o no de complicaciones maternas (diabetes
melitus, eclampsia, hipertensin o hemorragia) antes del parto

p g in a 1196

C a pt u l o 12

1. Peso del RN
2. Tamao segn edad gestacional
(BPSEG)
3. Raza
4. Sexo
5. APGAR al 1 minuto
6. Presentacin del parto
7. Tipo de parto
8. C omplicaciones maternas de parto

Riesgo de muerte

p g in a 1197

C a pt u l o 12

Variables predictoras significativas en la regresin


logstica
multivariante
1. Peso del RN
2. Tamao segn edad gestacional
(BPSEG)
3. Raza
4. Sexo
5. APGAR al 1 minuto

Riesgo de muerte

p g in a 1198

C a pt u l o 12

Anlisis de regresin logstica


mltiple

Estimacin del modelo para predecir la mortalidad en recin nacidos con


pesos entre 501 y 1500 gramos

Variables predictoras

2,606

Constante

t de Student

0,029

Peso (en gr/100)

- 0,422

0,157

BPSEG

- 0,491

0,145

Raza

- 0,450

p < 0,05

Sexo

0,656

0,131

Apgar

0,971

0,131

p g in a 1199

C a pt u l o 12

p g in a 1200

Tipos de variables del estudio Horbar et al.


Variable resultado (cualitativa dicotmica):
- Muerte = 1
- Sobrevivi = 0
1. Variable predictora 1: Peso del RN (gramos/100)
2. Variable predictora 2: Bajo peso segn la edad gestacional (BPSEG).
- Peso inferior al P10 para su edad gestacional = 1
- Peso igual o superior al P10 para su edad gestacional = 0
3. Variable predictora 3: RAZA
- Raza negra = 1
- Raza blanca = 0
4. Variable predictora 4: SEXO
- Hombre = 1
- Mujer = 0
5. Variable predictora 5: Indice de APGAR
- Apgar =< 3 = 1
- Apgar > 3 = 0
Horbar JD, Onstad L, Wright E. Predicting mortality risk for infants weighing 501 to 1500 grams at birth: The
National Institutes of Health Neonatal Research Network report. Crit Care Med 1993; 21:1218.

C a pt u l o 12

Q u diferencia promedio de riesgo de morir existe


entre un
RN A con 850 gramos y otro B con 1250
gramos iguales para el resto de las variables
predictoras ensayadas?
Variables
predictoras

RN A

RN B

Peso en
gramos/10
0

- 0,422

850 g [8,5]

1250 G
[12,5]

RR
RR
RR =

i (X a X b)
(850/100 1250/100)

RR =

-0,422

= 5.4

Un RN A de 850 g de peso al nacer


presenta 5.4 veces ms riesgo de
morir que otro RN B de 1250 g a
igualdad del resto de las variables
predictoras (Xi) incluidas en el
modelo.

p g in a 1201

C a pt u l o 12

Q u diferencia promedio de riesgo de morir existe


entre un RN A con SFA (Apgar < 3) con respecto a
otro RN B sin SFA (Apgar > 3) con igualdad para el
resto de las variables predictoras?
Variables
predictoras

RN A SFA
(+)

RN B SFA
(-)

APGAR
(>3/<=3)
[1/0]

0,97
1

APGAR < 3
[1]

APGAR > 3 [0]

RR
RR
RR =

i (X a X b)
(1 0)

RR =

0,971

= 2,62

Los RN con SFA presenta 2,62


veces ms riesgo de morir que los
RN sin SFA a igualdad del resto
de las variables predictoras (Xi)
incluidas en el modelo.

p g in a 1202

C a pt u l o 12

Q u diferencia promedio de riesgo de morir existe


entre un RN A nio con respecto a otro RN B nia
con igualdad para el resto de las variables
predictoras incluidas en el modelo?
Variables
predictoras

RN A nio

RN B nia

SEXO (hombre/
mujer) [1/0]

0,656

hombre [1]

mujer [0]

RR
RR

e
0,656 (1 0)
RRRRe
= 1,93
RR =

==

i (X a X b)

Los RN varones presentan 1,93


veces ms riesgo de morir (un
93%) que los RN mujeres a
igualdad del resto de las variables
predictoras (Xi) incluidas en el
modelo.

p g in a 1203

C a pt u l o 12

p g in a 1204

Q u diferencia promedio de riesgo de morir existe


entre un RN N de raza negra con respecto a otro
RN B de raza
blanca con igualdad para el resto de las variables
predictoras?
Variables
predictoras

RN N

RN B

Raza
(>1/<=1)
[1/0]

- 0,450

Negra
[1]

Blanco [0]

RR
RR
RR =

RR =

e
e

i (X n X b)
-0,450 (1 0)

= 0.64

Los RN de raza blanca estn a


1/0.64 = 1.56 veces (un 56%) ms
riesgo de morir que los RN de raza
negra a igualdad del resto de las
variables predictoras.

Los RN de raza negra presenta 0.64


veces ms riesgo de morir que los
RN de raza blanca a igualdad del
resto de las variables predictoras
incluidas en el modelo.

C a pt u l o 12

Q u diferencia promedio de riesgo de morir existe


entre dos RN A y B con las siguientes
caractersticas?
Variables predictoras

RN A

RN B

Peso en gramos/100

- 0,422

1150 g [11,5]

1400 g [14,0]

Bajo peso para su edad


gestacional BPSEG [1/
0]
Raza (>1/<=1) [1/0]

- 0,491

BPPSEG [1]

[0]

- 0,450

Negra [1]

Blanco [0]

Sexo (mujer/hombre) [1/ 0]

0,650

Nia [0]

Nio [1]

Apgar (<=3/ >3) [1/ 0]

0,971

Apgar <=3 [1]

Apgar >3 [0]

RR
RR

El RN A (nia negra) presenta un


54% de riesgo de morir que el RN B
(nio blanco) segn el valor de las
variables predictoras incluidas en el
modelo.

p g in a 1205

C a pt u l o 12

C lculo de la probabilidad (P) de muerte


individual
Variables predictoras

RN A

RN C

Peso en gramos/100

1150 g [11,5]

750 g [7,5]

Bajo peso para su edad


gestacional BPSEG [1/
0]
Raza (>1/<=1) [1/0]

BPPSEG [1]

[0]

Negra [1]

Blanco [0]

Sexo (mujer/hombre) [1/ 0]

Nia [0]

Nio [1]

Apgar (<=3/ >3) [1/ 0]

Apgar <=3 [1]

Apgar >4 [1]

RN A

RN C

p g in a 1206

C a pt u l o 12

p g in a 1207

Estudio de Marshall et al. (N EO CO SUR)


- Objetivo: Desarrollar una ecuacin que permita predecir el riesgo de
mortalidad neonatal en RN de muy bajo peso de nacimiento basado en
variables predictoras conocidas en el momento del nacimiento, antes
del ingreso a la unidad de cuidado intensivo neonatal.
- Mtodos: Fueron incluidos en este estudio 1801 RN con peso al
nacimiento de 500 a 1500 gramos.
- Variables Predictoras: edad materna, peso de nacimiento, edad
gestacional, Apgar al 1 minuto, malformaciones congnitas mayores,
sexo, gestacin mltiple, uso de esteroides prenatales y peso pequeo
para su edad gestacional (BPSEG) (definida como ms bajo que Percentil
10 de peso para edad gestacional).
Marshall G, Tapia JL, DApremont I, Grandi C. Un nuevo score para predecir el riesgo de mortalidad
neonatal del muy bajo peso de nacimiento en la red sudamericana NEOCOSUR. Journal of Perinatology
2005; 25:577582.

C a pt u l o 12

Estudio de Marshall et al (N EO CO SUR)


Objetivo: Predecir el riesgo de mortalidad neonatal en RN de muy bajo peso de
nacimiento (entre 500 1500 g)
Variable resultado: Fallecimiento del RN
(dicotmica) Variable predictora [1]: Edad materna
Variable predictora [2]: Peso de nacimiento
Variable predictora [3]: Edad gestacional
Variable predictora [4]: ndice del Apgar al
minuto
Variable predictora [5]: Malformaciones congnitas
mayores Variable predictora [6]: Sexo
Variable predictora [7]: Gestacin mltiple
Variable predictora [8]: Uso de esteroides prenatales
Variable predictora [9]: Peso pequeo para su edad
gestacional (definida como ms bajo
que Percentil 10 de peso para edad gestacional) (BPSEG)

p g in a 1208

C a pt u l o 12

5.
Malformaciones
congnitas

1. Edad de la madre

2. Peso

Riesgo de
muerte

6. Sexo
7. Gestacin

3. Edad gestacional

8. Uso de
esteroides
prenatales

4. APGAR al 1 minuto
9. BPSEG

p g in a 1209

C a pt u l o 12

Variables predictoras significativas en la regresin


logstica
multivariante
Malformacion
es congnitas

Peso del RN

Edad gestacional

APGAR al 1 minuto

Riesgo de
muerte

Sexo

Uso de
esteroides
prenatales

p g in a 1210

C a pt u l o 12

Estudio de Marshalll et al
(N EO CO SUR)
APGAR
al 1 minuto

p g in a 1211

Malformacion
es congnitas

Fallecimientos
1801 RN de peso
comprendido
entre 500 y 1500
g

Variable
RESULTADO

Sobrevivientes
Peso
del
RN

Edad
Sexo
gestacional

Esteroide
s
prenatal
es

Marshall G, Tapia JL, DApremont I, Grandi C. Un nuevo score para predecir el riesgo de mortalidad
neonatal del muy bajo peso de nacimiento en la red sudamericana NEOCOSUR. Journal of Perinatology
2005; 25:577582.

C a pt u l o 12

p g in a 1212

Anlisis de Regresin Logstica Mltiple: Estimacin del modelo para predecir la mortalidad en recin
nacidos con pesos entre 500 y 1500 gramos
Variables predictoras

Estimacin
Coeficiente

Error estndar
EE

Cociente
/ EE

OR

IC95%

Constante

8,378

0,99

Peso del RN

- 0,331

0,04

8,27

0,72

0,64 0,79

Edad gestacional

- 0,132

0,04

3,3

0,88

0,80 0,95

Apgar al minuto

0,265

0,03

8,83

0,77

0,71 0,82

Malformaciones
congnitas
(Si =1; No = 0)

3,419

0,64

5,32

30,55

8,74 106,77

Uso de esteroides
prenatales
(Si =1; No = 0)

- 0,302

0,08

3,77

0,74

0,58 0,89

Sexo (mujer =1;


hombre = 0)

- 0,474

0,16

2,96

0,62

0,30 0,93

Se ha utilizado el modelo de regresin logstica mltiple con un procedimiento paso a paso, descartndose
3 variables e incluyendo 6 variables predictoras que fueron estadsticamente significativos.

C a pt u l o 12

p g in a 1213

Interpretacin del modelo del estudio N EO CO SUR


La Tabla muestra los coeficientes del modelo de regresin logstica mltiple , el error
estndar EE y los odds ratios (OR) asociados. Estos coeficientes para las 6
variables predictoras seleccionadas en el modelo logstico permite evaluar el score
NEOCOSUR y puede ser usado para calcular el riesgo de mortalidad del RN con muy
bajo peso al nacimiento.
-Un aumento de 100 g en el peso de nacimiento redujo el riesgo de mortalidad
intrahospitalaria en 28% (OR = 0,72).
-La adicin de 1 punto en el score de Apgar al 1-minuto redujo el riesgo en 23% (OR
= 0,77).
- Una semana adicional de edad de gestacin redujo el riesgo en 12% (OR= 0,88).
-La presencia de malformacin congnita tuvo el mayor efecto de entre todas las
variables predictoras (factores de riesgo)(OR=30,55) aumentando notablemente el riesgo
de mortalidad neonatal.

RRR = [ 1 RR ] * 100

C a pt u l o 12

p g in a 1214

Variables D UMMY (indicadoras)


Para la introduccin de variables policotmicas en el anlisis multivariante es
necesario crear las llamadas variables dummy. Siempre se elegir una categora de
referencia con la que se compararan el resto de las categoras. Si la variable tiene k
categoras, se proponen k - 1 variables dummy al modelo multivariante.
Hosmer and Lemeshow del Baystate Medical Center realizaron un estudio para conocer
los principales factores de riesgo asociados con el bajo peso del RN (definido como peso
< 2500 g) en un grupo de 189 mujeres. Una de las 11 variables predictoras evaluadas fue
la RAZA, la cual tena 3 categoras (negra, blanca e hispana).
Para la variable RAZA se tienen que proponer dos variables dummy.
Cmo se formularon esas dos nuevas variables?

C a pt u l o 12

Anlisis bivariante
previo
Relacin entre la variable predictora RAZA y la prevalencia del bajo peso al
nacer.
Bajo peso del RN
RAZA
Blanca
Hispana

SI
23
25

NO
73
42

Total
96
67

(%)
24%
37%

Negra

11

15

26

42%

TOTAL

59

130

189

Test de 2
Pearson
= 5,005

p = 0,082

NO existe asociacin

p g in a 1215

C a pt u l o 12

Anlisis bivariante
previo
Relacin entre la variable predictora RAZA y la prevalencia del bajo peso al
nacer.
Bajo peso del RN
RAZA
Blanca
Otras razas

SI
23
36

NO
73
57

Total
96
93

TOTAL

59

130

189

Test de 2
Pearson
= 4,787

p = 0,029

Existe asociacin

(%)
24%
39%

p g in a 1216

C a pt u l o 12

Anlisis bivariante
previo
Relacin entre la variable predictora RAZA y la prevalencia del bajo peso al
nacer.
Bajo peso del RN
RAZA
Blanca
Hispana
Negra
TOTAL

SI
23
25
11
59

Test de 2 de tendencia
lineal
= 4,68
p=
2 0,030

NO
73
42
15
130

Caso-control
Total
96
67
26
189

(%)
24%
37%
42%

Existe asociacin

OR
1,00
1,89
2,33
TOTAL

p g in a 1217

C a pt u l o 12

Edad de la madre

HTA durante el embarazo

Raza materna

Peso de la madre

Bajo peso
del RN

p g in a 1218

Hbito tabquico
materno durante el
embarazo
Trabajo prematuro de
parto
N de visitas al gineclogo
durante el primer trimestre
Irritabilidad uterina

C a pt u l o 12

Variables predictoras significativas en el


anlisis
Hbito tabquico
multivariante
materno durante el
embarazo

Bajo peso
del RN

Raza materna

Peso de la madre
Log

P
1-P

= 0

+ 1X 1 + 2X 2 + 3X3

Hosmer and Lemeshow (2000) Applied Logistic Regression: Second Edition. Baystate Medical Center,
Springfield, Massachusetts .

p g in a 1219

C a pt u l o 12

p g in a 1220

Modelo de regresin logstico para el BAJO PESO AL NACER


Variables predictoras

Estimacin

Error estndar EE

/EE

Constante

-0,109

0,882

0,123

0,901

Tabaquismo

1,060

0,378

2,804

0,005

Peso de la madre

-0,027

0,013

2,077

0,036

Raza
negra
(1
dummy)
(NEGRA=1,
blanca =0, hispana=0)

1,290

0,511

2,525

0,012

Raza hispana (2 dummy)


(HISPANA=1, blanca =0,
negra=0)

0,970

0,412

2,354

0,019

Para la variable RAZA se tienen que proponer dos variables dummy (k-1). La categora de referencia es la
que no tiene variable dummy propia, en esta caso la raza blanca.

C a pt u l o 12

REGRESIN LINEAL
MLTIPLE

REGRESIN LOGSTICA
MULTIVARIANTE

Variable
RESULTADO

Cuantitativa

Cualitativa
(dicotmica)

Variables
PREDICTORAS

Cualitativa
Cuantitativa

Cualitativa
Cuantitativa

ECUACIN

Y = + X + ... + X
0

p g in a 1221

C a pt u l o 12

Regresin lineal mltiple


Se utiliza la regresin lineal mltiple cuando estudiamos la posible
entre
varias variables predictoras Xi (independientes o explicativas) y
relacin
una
variable resultado (respuesta, dependiente, explicada ) que es
siempre de tipo
numrico (cuantitativa).

Y = + X + ... + X
0

1
n
n

p g in a 1222

C a pt u l o 12

Regresin lineal
mltiple
Y = + X + ... + X
Variable Predictora 1

Variable Predictora 2
Variable Predictora 3

Variable Predictora n

Variable Resultado

Variable Predictora 4
Variable Predictora 5

1
n
n

C uantitati
va

p g in a 1223

C a pt u l o 12

Utilidades de la regresin lineal


mltiple
- Prediccin de respuestas (variable resultado) a partir de un conjunto
de variables explicativas (predictoras).
- Identificacin de variables predictoras y construccin del modelo de
regresin lineal mltiple.
- Deteccin de interacciones entre las distintas variables predictoras
que afectan a la variable resultado.
- Identificacin (y ajuste) de variables predictoras que actan como
FACTORES de CONFUSIN.

p g in a 1224

C a pt u l o 12

Requisitos para el uso de la regresin lineal


mltiple
1. Linealidad.
La variable RESULTADO depende linealmente de las
variables PREDICTORAS.
Si encontramos respuestas no-lineales, esas variables predictoras se
pueden transformar en lineales.
2. Normalidad de las variables cuantitativas.

p g in a 1225

C a pt u l o 12

Modelo de la regresin lineal


mltiple
Y = + X + ... + X
0

-Y es la variable resultado o dependiente (debe ser siempre numrica).


-Los trminos Xi son las variables predictoras o independientes o
explicativas, las cuales pueden ser
- Cuantitativas (discretas o continuas).
- Cualitativas dicotmicas; en este caso deben transformarse en
cuantitativas ( 0,1 ).
- Cualitativas policotmicas; en este caso deben transformarse en
cuantitativas ( 0,1 ), son las variables dummy.
- Los trminos i son los coeficientes de regresin del modelo y los calcula
el programa estadstico.

p g in a 1226

C a pt u l o 12

Pregunta de investigacin
Existe relacin entre la intensidad del estudio y el
rendimiento
acadmico en el examen del curso de Bioestadstica?
Variable PRED IC TO RA
1 Cuantitativa
Horas de estudio
continua

Cul es el test estadstico ms


acertado?

Variable
RESULTAD O
Rendimiento acadmico
Cuantitativa
discreta

p g in a 1227

C a pt u l o 12

Modelo de regresin lineal simple para la variable resultado nmero de RESPUESTAS


correctas del examen ajustado por la variable predictora nmero de horas de
ESTUDIO
Resumen del modelo
Modelo
R

R2

Regresin

0,629

0,396

ANOVA
Modelo
Regresin
Residual

Suma de cuadrados g.l


222,234
1
338,666
8

Total

560,900

R2 corregido

Error estndar de la estimacin

0,321

6,506

Media Cuadrtica
222.234
42,333

F
5,250

p
0,051

Coeficientes
Variables

Coeficiente

Constante

9,662

2,496

3,871

0,005

Horas de estudio

0,167

0,073

2,291

0,051

p g in a 1228

C a pt u l o 12

Anlisis multivariante
Variable predictora 1:
Horas de estudio
C uantitativa

Interacci
n
Variable predictora 2:
C uantitativa
C oeficiente intelectual

Variable
resultado:
C uantitativa
Rendimiento acadmico

p g in a 1229

C a pt u l o 12

Pregunta de investigacin
Existe relacin entre el nmero de horas de estudio, el
coefi- ciente intelectual del alumno y el rendimiento
acadmico en el examen del curso de Bioestadstica?
N del Alumno

Horas de estudio (X ) CI del alumno estudio (X )


1

N respuestas correctas (Y)

104

125

16

17

115

18

100

100

21

140

21

112

29

130

20

125

15

10

100

122

22

Cul es el test estadstico ms


acertado?

p g in a 1230

C a pt u l o 12

p g in a 1231

Modelo de regresin lineal MLTIPLE para la variable resultado nmero de


RESPUESTAS correctas del examen ajustado por las variables predictoras nmero de
horas de ESTUDIO y coeficiente intelectual CI
Resumen del modelo
Modelo
R

R2

Regresin

0,948

0,899

ANOVA
Modelo
Regresin
Residual

Suma de cuadrados g.l


504,363
2
56,537
7

Total

560,900

R2 corregido

Error estndar de la estimacin

0,870

2,842

Media Cuadrtica
252,182
8,077

F
31,224

Coeficientes
Variables

Coeficiente

Constante

- 41,153

8,667

- 4,748

0,002

Horas de estudio

0,096

0,034

2,836

0,001

p
0,000

C a pt u l o 12

Mito 1: La sonrisa de la
esfinge
Para la realizacin del modelo de la regresin lineal mltiple es necesario que
las variables incluidas cumplan la normalidad.
Qu test de normalidad has utilizado?
Con independencia de la normalidad, los test paramtricos NO se recomiendan
cuando el
tamao muestras es pequeo (n 10),y/o cuando la variables cuantitativa es
discreta.
Ests seguro que se cumplen estas condiciones?

p g in a 1232

C a pt u l o 12

Realidad 1: Respuesta de
Edipo
Test de Kolmogorov-Smirnov
Variables

Estadstico

Significacin

Horas de estudio

0,881

10

0,420

Coeficiente intelectual

0,648

10

0,795

Rendimiento acadmico

0,439

10

0,991

H : p > 0,05 test paramtricos


o

H : p < 0,05 test NO paramtricos


a

El test de normalidad ensayado da un valor de p NO significativo (p >0,05) en las 3


variables evaluadas. Por tanto no hay evidencias suficientes para rechazar la hiptesis
nula de normalidad. Podemos utilizar test paramtricos.

p g in a 1233

C a pt u l o 12

Realidad 1: Respuesta de
Edipo

Distribucin paramtrica del coeficiente intelectual en la poblacin

p g in a 1234

C a pt u l o 12

Realidad 1: Respuesta de
Edipo

CI Score Distribucin

Porcentaje
de poblacin

CI Score Distribucin

Distribucin paramtrica del coeficiente intelectual en la poblacin

p g in a 1235

C a pt u l o 12

Distribucin paramtrica del coeficiente intelectual en la poblacin

p g in a 1236

C a pt u l o 12

Mito 1: La sonrisa de la esfinge


Para la aplicacin del modelo de la regresin lineal
mltiple es necesario que N O exista CO LIN EALID AD
entre las variables predictoras.
Variable PRED IC TO RA
1 Cuantitativa
Horas de estudio
continua

Existe
COLINEALIDAD?

Variable PRED IC TO RA
2 Cuantitativa discreta
C oeficiente intelectual

p g in a 1237

C a pt u l o 12

p g in a 1238

C olinealidad en la regresin lineal


mltiple
- Es uno de los problemas ms importantes que se puede encontrar en un anlisis
de regresin. Si en un modelo de Regresin Lineal Mltiple alguna variable
predictora es combinacin lineal de otras variables predictoras, el modelo es
irresoluble.
- La colinealidad aparece cuando alguna variable predictora es casi combinacin lineal
de otra u otras variables predictoras, es decir sus coeficientes de correlacin simple o
mltiple entre las variables predictoras son cercanos a 1, aunque no llegan a dicho valor.
- Como medida de la misma hay varios estadsticos propuestos, los ms sencillos son los
coeficientes de determinacin (r2) de cada variable predictoras con todas las dems.

C a pt u l o 12

D iagnstico de colinealidad
(1):
- FACTOR DE INFLACIN DE LA VARIANZA
(FIV)
FIV > 10: Colinealidad (*)
1
FIV =
1 - R2j

- TOLERANCIA (T)
T < 0,1: Colinealidad (*)
1
T=

= 1 - R2j
FIV

(*) Regla emprica de Kleinbaum

p g in a 1239

C a pt u l o 12

D iagnstico de colinealidad
(1):
Modelo

Regresin

0,948

R2

0,899

R2 corregido

Error estndar de la estimacin

0,870

2,842

Variable resultado: Nmero de respuestas


correctas
FIV =
1

T=

FIV (estudio-CI) = 9,90

1 - R2j

= 1 - R2j

FIV

NO hay colinealidad

T (estudio-CI) =
0,101

p g in a 1240

C a pt u l o 12

D iagnstico de colinealidad (2) SPSP


Ruta con SPSS: O pcin: Anlisis, Regresin lineal,
Estadsticos

p g in a 1241

C a pt u l o 12

D iagnstico de
colinealidad (2)
NDICE DE CONDICIN: Regla emprica (Belsley):
- ndices de condicin < 5 : NO existe colinealidad.
- ndices de condicin entre 5 y 10: colinealidad dbil.
- ndices de condicin entre 10 y 30: colinealidad
moderada.
- ndices de condicin > 30 colinealidad fuerte (grave).
Modelo

Dimensin

Autovalor

ndice de
condicin

1
2

2,456
0,536

1,000
2,136

Proporciones de la varianza
Constante
Horas de CI
Estudio
0,00
0,06
0,00
0,00
0,84
0,00

0,005

21,608

1,00

Variable resultado: Nmero de respuestas


correctas

0,10

1,00

p g in a 1242

C a pt u l o 12

D iagnstico de
colinealidad (2)
-Hay un ndice de condicin alto (21,6) y asociado con el mismo est el trmino
constante y el coeficiente intelectual (CI) con proporcin de varianza alta.
-Nos indica, por tanto, que el CI slo es colineal con la constante, pero no con las
horas de estudio.
Modelo

Dimensin

Autovalor

ndice de
condicin

1
2

2,456
0,536

1,000
2,136

Proporciones de la varianza
Constante
Horas de CI
Estudio
0,00
0,06
0,00
0,00
0,84
0,00

0,005

21,608

1,00

Variable resultado: Nmero de respuestas


correctas

0,10

1,00

NO hay colinealidad

p g in a 1243

C a pt u l o 12

Pregunta de investigacin
Existe relacin entre el nmero de horas de estudio, el
coefi- ciente intelectual del alumno, asistencia a clases
(horas) y el ren- dimiento acadmico en el examen del
curso de Bioestadstica?
N del Alumno

Horas de estudio (X ) CI del alumno Horas de Asistencia


1
(X )
a clase (X )

1
2

5
9

104
125

23
92

6
16

17

115

78

18

100

15

100

20

21

140

100

21

112

35

29

130

95

20

125

75

15

10

100

122

100

22

N respuestas
correctas (Y)

p g in a 1244

C a pt u l o 12

Variable predictora 1:
C uantitativa
Horas de estudio

Variable predictora 2:
C uantitativa
C oeficiente intelectual

Variable predictora 3:
C uantitativa
Horas de asistencia a clases

Variable
resultado:
C uantitativa
Rendimiento acadmico

p g in a 1245

C a pt u l o 12

Modelo de regresin lineal MLTIPLE para la variable resultado nmero de


RESPUESTAS correctas del examen ajustado por las variables predictoras nmero de
horas de ESTUDIO, coeficiente intelectual CI y asistencia a clase
Resumen del modelo
Modelo
R

R2

Regresin

0,984

0,969

ANOVA
Modelo
Regresin
Residual

Suma de cuadrados g.l


543,632
3
17,268
6

Total

560,900

R2 corregido

Error estndar de la estimacin

0,954

1,696

Media Cuadrtica
181,211
8,077

F
62,963

p
0,000

Coeficientes
Variables

Coeficiente

Constante

- 2,593

11,651

0.0223

0,831

Horas de estudio

0,028

0,104

1,007

0,353

Coeficiente intelectual

0,022

0,123

0,177

0,865

Asistencia a clase (horas)

0,196

0,053

3,694

0,010

p g in a 1246

C a pt u l o 12

Variables

Estadsticos de colinealidad

Horas de estudio
Coeficiente intelectual
Asistencia a clase (horas)

Tolerancia (T)
0,477
0,117
0,89

FIV
2,098
8,552
11,241

Obsrvese que los mayores valores de la tolerancia (T) y del factor de


inflacin
corresponden a la variable predictora ASISTENCIA a clase.
- FACTOR DE INFLACIN DE LA VARIANZA (FIV)
FIV > 10: Colinealidad (*)
- TOLERANCIA (T)
T < 0,1: Colinealidad (*)

p g in a 1247

C a pt u l o 12

Autovalor

ndice de condicin
Constante

3.366
0,538
0,095
0,001

1,000
2,501
5.957
64,725

0,00
0,00
0,00
0,99

Proporciones de la varianza
Horas de
Coeficiente
ESTUDIO
intelectual
0,02
0,00
0,45
0,00
0,24
0,00
0,29
1,00

ASISTENCIA
a clases
0,00
0,00
0,14
0,85

Variable resultado: Rendimiento acadmico (respuestas acertadas)

Hay un ndice de condicin alto (64,72) y asociado con el mismo hay dos variables
(el trmino constante, coeficiente intelectual, y ASISTENCIA a clase) con proporcin
de varianza alta. Nos indica, por tanto, que la asistencia a clase es COLINEAL con
el coeficiente intelectual y con la constante.

p g in a 1248

C a pt u l o 12

Grasas
TO TALES
C olesterol diettico
cidos grasos saturados
cidos grasos insaturados

ED AD
EJERC IC IO FSICO

C olesterol-LD L

p g in a 1249

C a pt u l o 12

Realizando los anlisis de regresin de cada una de las variables


predictoras del modelo con todas las dems, se obtienen los siguientes
coeficientes de determinacin, tolerancia y factores de inflacin de la
varianza que indican graves problema de COLINEALIDAD.

Modelo
Constante
Grasa TOTAL

Coeficientes no
estandarizados

EE
258,484
130,837
- 5,714

Colesterol dieta
0,067
Edad
0,443
Ejercicio
- 3,115
cidos grasos
0,0722
0,966 saturados
cidos grasos
- 0,0746
0,065 Insaturados
Variable resultado colesterol-LDL

Significacin

Estadsticos de
colinealidad
Tolerancia
FIV

1,976

0,70

4,776

-1,196

0,253

0,036
2,867
45,953
0,075

1,851 0,087
0,155 0,879
- 0,068 0,947
0,351

0,038
0,098
0,143
0,066

26,530
10,225
7,005
15,242

1,150

0,130

7,683

0,949

0,20

49,978

p g in a 1250

C a pt u l o 12

Obsrvese que el factor de inflacin mayor corresponde a la variable


grasas TOTAL, resultado esperable debido a que se han creado tres
variables ms (colesterol diettico, cidos grasos saturados y cidos
grasos insaturados) a partir de ella.
Autovalor ndice de
condicin

Proporciones de la varianza
Constante

Edad

Grasas
totales

Ejercicio Colesterol cidos


diettico
grasos
insaturados

cidos
grasos
saturados

5,276

1,000

0,00

0,00

0,00

0,00

0,00

0,00

0,00

1,055

2,236

0,00

0,00

0,00

0,03

0,00

0,03

0,00

0,519

3,190

0,00

0,01

0,00

0,02

0,02

0,00

0,00

0,100

7,250

0,03

0,01

0,00

0,06

0,01

0,20

0,04

0,0354

12,200

0,06

0,00

0,00

0,78

0,03

0,64

0,04

0,01207

20,908

0,02

0,41

0,05

0,02

0,31

0,05

0,23

0,00205

50,781

0,89

0,58

0,95

0,09

0,64

0,07

0,69

Variable resultado: Colesterol-LDL

p g in a 1251

C a pt u l o 12

Autovalor ndice de
condicin

Proporciones de la varianza
Constante

Edad

Grasas
totales

Ejercicio Colesterol cidos


diettico
grasos
insaturados

cidos
grasos
saturados

5,276

1,000

0,00

0,00

0,00

0,00

0,00

0,00

0,00

1,055

2,236

0,00

0,00

0,00

0,03

0,00

0,03

0,00

0,519

3,190

0,00

0,01

0,00

0,02

0,02

0,00

0,00

0,100

7,250

0,03

0,01

0,00

0,06

0,01

0,20

0,04

0,0354

12,200

0,06

0,00

0,00

0,78

0,03

0,64

0,04

0,01207

20,908

0,02

0,41

0,05

0,02

0,31

0,05

0,23

0,00205

50,781

0,89

0,58

0,95

0,09

0,64

0,07

0,69

p g in a 1252

Variable resultado: Colesterol-LDL

Hay un ndice de condicin alto (50,781) y asociado con el mismo hay cinco
variables (el trmino constante, EDAD, GRASAS TOTALES, COLESTEROL
diettico, y cidos
grasos SATURADOS) con proporcin de varianza alta. Nos indica, por tanto, que Grasas
TOTALES es COLINEAL con el COLESTEROL diettico, cidos grasos SATURADOS,
EDAD y con la constante. Al existir esta ltima colinealidad, el centrado de variables
podra mejorar el problema, se podra tambin renunciar a estudiar los trminos no
lineales COLESTEROL diettico y cidos grasos SATURADOS.

C a pt u l o 12

Edad de la madre

HTA durante el embarazo

Raza materna

Peso de la madre

Peso
del RN

p g in a 1253

Hbito tabquico
materno durante el
embarazo
Trabajo prematuro de
parto
N de visitas al gineclogo
durante el embarazo
ITU durante la gestacin

C a pt u l o 12

Interpretacin prctica de los resultados de la


regresin lineal
mltiple
Coefficientsa
Mode l

(Constant)
Edad de la madre

Unstandardized
Coefficients
B
Std. Error
2975,284
315,998
-1,919
9,544

Hbito tabquico materno

-338,413

106,977

Hipertensin durante el
embarazo

-573,555

Infeccion urinaria en la
gestacin
Raza materna (blanca vs
otras)

Standardized
Coefficients
Beta
-,014

Sig.

95% Confidence Interval for B

9,416
-,201

,000
,841

Lower Bound
2351,748
-20,752

Upper Bound
3598,820
16,914

-,227

-3,163

,002

-549,503

-127,322

200,591

-,192

-2,859

,005

-969,369

-177,742

-488,353

136,959

-,239

-3,566

,000

-758,604

-218,102

-380,931

104,245

-,262

-3,654

,000

-586,630

-175,232

8,055

3,570

,155

2,256

,025

1,010

15,100

-11,248

99,741

-,008

-,113

,910

-208,059

185,563

-203,230

136,333

-,102

-1,491

,138

-472,247

65,787

a. Dependent Variable: Peso del RN

Peso de la madre en Kg

N de visitas en el
embarazo categorizada
Trabajo prematuro de
parto

p g in a 1254

C a pt u l o 12

Modelo de regresin logstico para el BAJO PESO AL NACER


Variables predictoras
Estimacin Error
/EE
estndar EE t

Constante

2975,28

315,998

9,416

0,000

Edad de la madre

-1,919

9,544

-0,201

0,841

Hbito tabquico materno

-338,413

106,977

-3,163

0,002

Hipertensin durante el embarazo

-573,555

200,591

-2,859

0,005

Infeccin urinaria durante el embarazo

488,353

136,959

-3,566

0,000

Raza materna (blanca versus otras)

-380,931

104,245

-3,654

0,000

Peso de la madre en Kg

8,055

3,570

2,256

0,025

N visitas al gineclogo categorizada

-11,248

99,741

-0,113

0,910

Trabajo prematuro de parto

-203,230

136,333

-1,491

0,138

p g in a 1255

C a pt u l o 12

t = - 3,163
p = 0,002

t = - 2,859
p = 0,005

HTA durante el embarazo

Peso
del RN

Hbito tabquico
materno durante el
embarazo

t = - 3,654
p = 0,000

Raza materna
t = 2,256
p = 0,025

Peso de la madre

t = - 3,566
p = 0,000

ITU durante la gestacin

p g in a 1256

C a pt u l o 12

Interpretacin prctica de los resultados de la


regresin
lineal mltiple
- La aceptacin de la Ho (p > 0,05) implica que la variable resultado Y no est
influenciada
por las variables predictoras Xi incluidas en el
modelo.
- La aceptacin de la Ha (p < 0,05) supone que hay algn tipo de influencia de algunas
de
las variables predictoras Xi sobre la variable resultado.
- La significacin estadstica se realiza mediante el test de contraste de hiptesis
del
anlisis de la varianza (ANOVA).
ANOVAb

Mod l
e
1

Regression
Residual

Sum of
Squares
24747080
75169973

df
8
180

Mean Square

3093384,997
417610,959

7,407

Sig.
,000a

Total (Constant),
99917053
188 de parto, Hipertensin durante el
a. Predictors:
Trabajo prematuro
embarazo, Raza materna (blanca vs otras), N de visitas en el embarazo
categorizada, Infeccion urinaria en la gestacin, Peso de la madre en Kg, Edad
de la madre, Hbito tabquico materno
b. Dependent Variable: Peso del RN

Significacin
estadstica del
modelo de regresin

p g in a 1257

C a pt u l o 12

Interpretacin prctica de los resultados de la


regresin
lineal mltiple
- Los programas estadsticos como el SPSS ofrecen una estimacin de los distintos
coeficientes de regresin i , junto al:
- Error estndar de los coeficientes de regresin EEi.
- Significacin estadstica (valor de p) de i cada variable predictora.
- Un intervalo de confianza (IC95%) de los coeficientes de regresin i.
-Las variables predictoras con significacin estadstica (p < 0,05) deben quedar en el
modelo multivariante y en la ecuacin que predice a la variable resultado.
-Las variables predictoras sin significacin estadstica (p > 0,1) deben ser excluidas
del modelo final.

p g in a 1258

C a pt u l o 12

EEi

i
Model
1

(Constant)
Edad de la madre
Hbito tabquico
materno Hipertensin
durante el embarazo
Infeccion urinaria en
la gestacin
Raza materna (blanca
vs otras)
Peso de la madre en
Kg N de visitas en el
embarazo categorizada
Trabajo prematuro
de parto

a. Dependent Variable: Peso del

RN

IC95%i

Coefficients
a

Unstandardize
d Coefficients
B
Std. Error
2975,284
315,998
-1,919
9,544
-338,413
106,977

Standardize
d
Coefficients
Beta

p g in a 1259

-,014
-,227

t
9,416
-,201
-3,163

Sig.
,000
,841
,002

95% Confidence Interval for


B Lower Bound
Upper
2351,748
3598,820
Bound
-20,752
16,914
-549,503
-127,322

-573,555

200,591

-,192

-2,859

,005

-969,369

-177,742

-488,353

136,959

-,239

-3,566

,000

-758,604

-218,102

-380,931

104,245

-,262

-3,654

,000

-586,630

-175,232

8,055

3,570

,155

2,256

,025

1,010

15,100

-11,248

99,741

-,008

-,113

,910

-208,059

185,563

-203,230

136,333

-,102

-1,491

,138

-472,247

65,787

C a pt u l o 12

Interpretacin prctica de los resultados de la


regresin
lineal mltiple
- El trmino estadstico R cuadrado (R2) es el porcentaje de reduccin de la
incertidumbre sobre la variabilidad de la variable RESULTADO (respuesta) cuando son
conocidas las variables PREDICTORAS. Cuanto ms se acerque a 1 ms poder
explicativo tiene el modelo.
- La R cuadrado corregida es un resultado ajustado, que penaliza la introduccin de
variables innecesarias en el modelo, es decir, disminuye su valor cuando se
introducen variables que no actan sobre la variable resultado.
R2 corregida (ajustada)
R2 (R Square o bondad del ajuste) Model Summary
Model
1

R
,498a

R Square
,248

Adjusted
R Square
,214

Std. Error of
the Estimate
646,228

a. Predictors: (Constant), Trabajo prematuro de parto,

Hipertensin durante el embarazo, Raza materna


(blanca vs otras), N de visitas en el embarazo
categorizada, Infeccion urinaria en la gestacin,
Peso de la madre en Kg, Edad de la madre, Hbito
tabquico materno

p g in a 1260

C a pt u l o 12

p g in a 1261

Interpretacin prctica de los resultados de la


regresin
lineal mltiple
- La tabla o matriz de correlaciones es de gran inters para identificar correlaciones
lineales entre parejas de variables cuantitativas.
- Interesante si ocurre entre la variable resultado y alguna de las variables predictoras.
- Problemtico si ocurre entre dos variables predictoras porque indica COLINEALIDAD.
- La matriz est formada por todos los coeficientes de correlacin lineal de Pearson (r)
para
cada par de variables cuantitativas del estudio.
Model

Trabajo
prematuro
de parto

Correlations

Trabajo prematuro de
parto

Hipertensin
durante el
embarazo

Raza materna
(blanca vs
otras)

N de visitas
en el
embarazo
categorizada

Infeccion
urinaria en la
gestacin

Peso de la
madre en Kg

Edad de
la madre

Hbito
tabquico
materno

1,000

-,050

-,126

,074

-,174

,113

-,150

-,218

Hipertensin durante el embarazo


Raza materna (blanca vs otras)

-,050

1,000

-,053

-,065

,092

-,240

,043

-,025

N de visitas en el embarazo
categorizada
Infeccion uri naria en la gestacin
Peso de la madre en Kg Edad de la madre
Hbito tabquico materno

-,126

-,164

-,014

,045

,192

,370

,028

,165

-,199

,061

-,020

Covariances

Trabajo prematuro de
parto
Hipertensin durante el embarazo
Raza materna (blanca vs otras)
N de visitas en el embarazo
categorizada
Infeccion uri naria en la gestacin
Peso de la madre en Kg Edad de la madre
Hbito tabquico materno

a. Dependent Variable: Peso del RN

,074

Coefficient Correlationsa
-,053
1,000
-,065

-,164

1,000

-,042

-,174

,092

-,014

-,042

1,000

,091

,113

-,240

,045

,028

,091

1,000

-,170

,023

-,150
-,218

,043
-,025

,192
,370

,165
-,199

,061
-,020

-,170
,023

1,000
,094

,094
1,000

18586,737

-1365,589

-1791,262

1009,836

-3254,760

55,082

-195,718

-3181,035

-1365,589

40236,901

-1118,575

-1306,095

2519,927

-171,932

81,982

-525,956

-1791,262

-1118,575

10866,947

-1707,605

-200,116

16,866

190,755

4124,674

1009,836

-1306,095

-1707,605

9948,197

-574,052

9,929

156,628

-2124,941

-3254,760

2519,927

-200,116

-574,052

18757,679

44,682

80,006

-292,270

55,082

-171,932

-195,718
-3181,035

81,982
-525,956

16,866
190,755
4124,674

9,929
156,628
-2124,941

44,682
80,006
-292,270

12,745
-5,795
8,723

-5,795
91,092
95,883

8,723
95,883
11444,113

C a pt u l o 12

Mito 1: La sonrisa de la
esfinge
En la regresin lineal mltiple realizado se han incluido inicialmente 8
posibles variables predictoras de la variable resultado (peso del RN). De
ellas slo 5 han quedado en el modelo final.
Ests seguro que se ha realizado una completa y actualizada revisin
bibliogrfica?
Por qu no se ha tenido en cuenta en el modelo de regresin la variable
DIABETES GESTACIONAL que es ampliamente conocido que aumenta
el peso del RN causando macrosomas?

p g in a 1262

C a pt u l o 12

Estudio transversal en pacientes con diabetes


mellitus

Objetivo: Evaluar la influencia de determinadas variables en el control metablico


de
la diabetes mellitus tipo 2.
Variable resultado: Niveles de hemoglobina
glicosilada Variable predictora [1]: Tipo de tratamiento
Variable predictora [2]: Sexo del paciente
Variable predictora [3]: Aos desde el diagnstico de
la enfermedad
Variable predictora [4]: Nmero de enfermedades relacionadas con la
diabetes Variable predictora [5]: Acceso al dietista
Variable predictora [6]: Mdico interesado por la diabetes (actitud y
conocimiento) Variable predictora [7]: Nivel socioeconmico
Variable predictora [8]: Estilos de vida (tabaco,
alcohol) Variable predictora [9]: Edad del mdico
Variable predictora [10]: Sexo del mdico

Y = + X + ... + X
0

p g in a 1263

C a pt u l o 12

Anlisis bivariante:
Existe relacin entre el tipo de tratamiento y los
niveles de
hemoglobina glicosilada?
Variable PRED IC TO RA
1
Tipo de tratamiento
Cualitativa
- D ieta
policotmica
- Insulina
- AD O

Variable
RESULTAD O
%HbA1c
Cuantitativa
continua

Cul es el test estadstico ms acertado?


Anlisis de la Varianza para un factor (ANOVA) p <
0,05

p g in a 1264

C a pt u l o 12

Anlisis bivariante:
Existe relacin entre el sexo del paciente y los
niveles de
hemoglobina glicosilada?
Variable PRED IC TO RA
2
Sexo del paciente
Cualitativa
dicotmica

Cul es el test estadstico ms


acertado?
T de Student para muestras
independientes

Variable
RESULTAD O
%HbA1c
Cuantitativa
continua

p < 0,05

p g in a 1265

C a pt u l o 12

Anlisis bivariante:
Existe relacin entre los aos desde el diagnstico de la
enfermedad
y los niveles de HbA1c?
Variable PRED IC TO RA
3 C uantitativa
Aos desde el diagnstico
continua
de la enfermedad

Variable
RESULTAD O
%HbA1c
Cuantitativa
continua

Cul es el test estadstico ms acertado?


Coeficiente de correlacin de Pearson p <
0,05

p g in a 1266

C a pt u l o 12

Anlisis bivariante:
Existe relacin entre los aos desde el diagnstico de la
enfermedad
y los niveles de HbA1c?
Variable PRED IC TO RA
3
Aos desdedicotmica
el diagnstico
Cualitativa
de la enfermedad
> 7 aos
< 7 aos

Cul es el test estadstico ms


acertado?
T de Student para muestras
independientes

Variable
RESULTAD O
%HbA1c
Cuantitativa
continua

p < 0,05

p g in a 1267

C a pt u l o 12

Anlisis bivariante:
Existe relacin entre el nmero de enfermedades
relacionadas con
la diabetes y los niveles de HbA1c?
Variable PRED IC TO RA
4 C uantitativa discreta
N mero de
enfermedades
relacionadas con la D M

Variable
RESULTAD O
%HbA1c
Cuantitativa
continua

Cul es el test estadstico ms acertado?


Coeficiente de correlacin de Spearman p <
0,05

p g in a 1268

C a pt u l o 12

Anlisis bivariante:
Existe relacin entre el nmero de enfermedades
relacionadas con
la diabetes y los niveles de HbA1c?
Variable PRED IC TO RA
4
N mero dedicotmica
Cualitativa
enfermedades
relacionadas con la D M
- Ms de una
- Una o menos de una

Cul es el test estadstico ms


acertado?
T de Student para muestras
independientes

Variable
RESULTAD O
%HbA1c
Cuantitativa
continua

p < 0,05

p g in a 1269

C a pt u l o 12

Anlisis bivariante:
Existe relacin entre el acceso al dietista y los
niveles de
hemoglobina glicosilada?
Variable PRED IC TO RA
5
Acceso al Ddicotmica
IETISTA
Cualitativa

Variable
RESULTAD O
%HbA1c
Cuantitativa
continua

Cul es el test estadstico ms acertado?


T de Student para muestras independientes p <
0,05

p g in a 1270

C a pt u l o 12

p g in a 1271

Anlisis bivariante:
Existe relacin entre la actitud y conocimiento del mdico
por la
D M y los niveles de HbA1c?
Variable PRED IC TO RA
6
Mdico
Cualitativa
dicotmica
interesado por
la D M
- Si
- No

Cul es el test estadstico ms


acertado?
T de Student para muestras
independientes

Variable
RESULTAD O
%HbA1c
Cuantitativa
continua

p < 0,05

C a pt u l o 12

Anlisis bivariante:
Existe relacin entre el nivel socioeconmico del
paciente y
los niveles de HbA1c?
Variable PRED IC TO RA
7
N ivel socioeconmico
Cualitativa
policotmica

Variable
RESULTAD O
%HbA1c
Cuantitativa
continua

Cul es el test estadstico ms acertado?


Anlisis de la Varianza para un factor (ANOVA) p >
0,1

p g in a 1272

C a pt u l o 12

Anlisis bivariante:
Existe relacin entre el estilo del vida del paciente y los
niveles de
hemoglobina glicosilada?
Variable PRED IC TO RA
8
Estilos de vida
Cualitativa
dicotmica
- Adecuados
- Inadecuados
(tabaco, alcohol, etc)

Cul es el test estadstico ms


acertado?
T de Student para muestras
independientes

Variable
RESULTAD O
%HbA1c
Cuantitativa
continua

p>
0,1

p g in a 1273

C a pt u l o 12

Anlisis bivariante:
Existe relacin entre el sexo del mdico y los
niveles de
hemoglobina glicosilada?
Variable PRED IC TO RA
9
Sexo del Mdico
Cualitativa
dicotmica

Variable
RESULTAD O
%HbA1c
Cuantitativa
continua

Cul es el test estadstico ms acertado?


T de Student para muestras independientes p >
0,1

p g in a 1274

C a pt u l o 12

Anlisis bivariante:
Existe relacin entre el tipo de tratamiento y los
niveles de
hemoglobina glicosilada?
Variable PRED IC TO RA
10 Cuantitativa
Edad del Mdico
continua

Variable
RESULTAD O
%HbA1c
Cuantitativa
continua

Cul es el test estadstico ms acertado?


Coeficiente de correlacin de Pearson p >
0,1

p g in a 1275

C a pt u l o 12

Acceso al
D ietista hospitalario

Tipo de tratamiento

Sexo del paciente


Aos desde el diagnstico
de la enfermedad
N de enfermedades
relacionad
as con la
DM
N ivel socioeconmico

%HbA1c

Actitud y conocimiento
de la D M por parte del
mdico
Sexo
del mdico
Edad del mdico

Estilos de vida

p g in a 1276

C a pt u l o 12

p g in a 1277

Anlisis de regresin lineal


mltiple
1. D ummy
Tipo de tratamiento
2. D ummy
Tipo de tratamiento

6. Acceso al
D ietista
hospitalario

%HbA1c

3. Sexo del paciente


4. Aos desde el diagnstico
de la enfermedad
5. N de enfermedades
relacionad
as con la
DM

Y = 0 + 1X 1 + 2 X2 + 3 X3 + 4 X4 + 5 X5 + 6
6
X

7. Actitud y conocimiento
de la D M por parte del
mdico

C a pt u l o 12

Anlisis de regresin lineal


mltiple
1.- Tipo de
tratamiento
Insulina
Antidiabticos orales (ADO) Dieta
2.- Sexo del paciente (mujer [1];
hombre [0])
3.- Aos desde el diagnstico de
la enfermedad
> 7 aos: [1]
< 7 aos: [0]
4.- Nmero de enfermedades
relacionadas con la diabetes
-Ms de una: [1]
Y -=Una
o+menos
X +de...una:
+ [0]X
0
1
n n
5.- Acceso al dietista (si [1];1 no
[0])
Y = interesado
+X +
6- Mdico
porXla+ X + X + X + X
0
1
2 2
3 3
4 4
5 5
diabetes (si [1]; no [0])6 61

Variables predictoras
(X )
Variable resultado
(Y): HbA1c(%)

p g in a 1278

C a pt u l o 12

p g in a 1279

Anlisis de regresin lineal


mltiple
Y = 0 + 1X1 + ... +
Variable resultado
(Y): HbA1c(%)

Variables
PRED IC TO RAS que
estaban relacionadas
estadsticamente con
la variable resultado
HbA1c en el anlisis
univariante
Coeficiente de regresin
estandarizado
(t calculada)

sexo
EE sexo

0,72
0,28

Variables predictoras
(X )
nXn asociadas al nivel de hemoglobina glicosilada
Variables
Variables predictoras

Estimacin

Error estndar
EE

Constante

10,51

0,59

1 dummy Antidiabticos orales /


insulina

0,29

0,37

2 dummy Dieta / insulina

-0,97

0,46

N enfermedades relacionadas con la


diabetes (> 1 / 1)

0,20

0,08

Sexo (mujer/hombre)

0,72

0,28

Aos desde el diagnstico (> 7 / 7)

0,04

0,02

Acceso al dietista hospitalario (si/no)

-1,06

0,43

Mdico interesado en la diabetes (si/no)

- 0,86

0,38

= 2,57

> Z95% (1,96)

p < 0,05

C a pt u l o 12

Mito 1: La sonrisa de la
esfinge
En la tabla de la regresin lineal mltiple presentada se han incluido slo el valor de
y su error estndar EE, pero no se ha incluido el IC95% de ni la significacin
estadstica p de cada variable predictora. Tampoco veo la tabla donde se indica el
R 2 (R Square o bondad del ajuste del modelo multivariante).
Ests seguro que las 6 variables predictoras incluidas en el modelo multivariante
presentan significacin estadstica (p<0,05)?
La variable 1 dummy ADO/insulina presenta un valor de (0,29) inferior a su error
estndar EE, (0,37) por lo que su cociente vale 0,78, cifra muy inferior al 1,96 (Z
95% )
Por qu has incluido en el modelo de regresin la variable
ADO/insulina?

p g in a 1280

C a pt u l o 12

p g in a 1281

Anlisis de regresin lineal


mltiple
Variable resultado
(Y): HbA1c(%)

Variables predictoras
Y = 0 + 1X1 + ... +
(X )
nXn asociadas al nivel de hemoglobina glicosilada
Variables

Cul de las distintas


va- riables predictoras
inclui- das en el
modelo parece afectar
ms a la variable
resultado (HbA1c)?

Variables predictoras

Estimacin

Error estndar
EE

Constante

10,51

0,59

1 dummy Antidiabticos orales /


insulina

0,29

0,37

2 dummy Dieta / insulina

-0,97

0,46

N enfermedades relacionadas con la


diabetes (> 1 / 1)

0,20

0,08

Sexo (mujer/hombre)

0,72

0,28

Aos desde el diagnstico (> 7 / 7)

0,04

0,02

Acceso al dietista hospitalario (si/no)

-1,06

0,43

Mdico interesado en la diabetes (si/no)

- 0,86

0,38

p g in a 1282

C a pt u l o 12

Anlisis de regresin lineal


mltiple
Variable resultado
Y = 0 + 1X1 + ... +
(Y): HbA1c(%)

Variables predictoras
(X )

nXn

Variables asociadas al nivel de hemoglobina glicosilada


Variables predictoras

Estimacin

Error estndar
EE

Cociente /
EE

Significacin
p

Constante

10,51

0,59

1 dummy Antidiabticos orales / insulina

0,29

0,37

0,78

p > 0,1

2 dummy Dieta / insulina

-0,97

0,46

2,11

p < 0,05

N enfermedades relacionadas con la


diabetes (> 1 / 1)

0,20

0,08

2,5

p < 0,05

Sexo (mujer/hombre)

0,72

0,28

2,57

p < 0,01

Aos desde el diagnstico (> 7 / 7)

0,04

0,02

2,00

p < 0,05

Acceso al dietista hospitalario (si/no)

-1,06

0,43

2,47

p < 0,02

Mdico interesado en la diabetes (si/no)

- 0,86

0,38

2,26

p < 0,05

C a pt u l o 12

p g in a 1283

Q u diferencia promedio de HBA1c existe entre un


paciente A mujer (sexo=1) y un paciente B hombre
(sexo=0) y a igualdad del resto de las variables
predictoras incluidas en el modelo?
Variables
predictoras
Sexo
(mujer=1,
hombre =0)

Paciente A

Paciente B

+0,72

mujer [1]

hombre [0]

Y= +X
+ ...
0

HbA1c (A)= 10,51 + 0,72 (1) = 11,23


HbA1c (B) = 10,51 + 0,72 (0) = 10,51

+X
n

Las mujeres presentan 0,72


unidades ms de HbA1c que los
hombres a igualdad del resto de las
variables predictoras incluidas en el
modelo.

C a pt u l o 12

Q u diferencia promedio de HBA1c existe


entre un paciente A con acceso al dietista
hospitalario (1) de un paciente B sin acceso (0) y
a igualdad del resto de las variables predictoras
incluidas
en el modelo?
Variables predictoras
Paciente A
Paciente B
i

Acceso al dietista
hospitalario
(si =1, no =0)

-1,06

SI [1]

NO [0]

Y = + X + ... + X
0

HbA1c (A)= 10,51 1,06 (1) = 9,45


HbA1c (B) = 10,51 1,06 (0) = 10,51

Los pacientes CON acceso al


dietista por termino medio presentan
1,06 unidades menos de HbA1c
que los pacientes SIN dietista
hospitalario a igualdad del resto de
las variables predictoras incluidas
en el modelo.

p g in a 1284

C a pt u l o 12

p g in a 1285

Q u diferencia promedio de HBA1c existe entre un


paciente A tratado con AD O (1) de un paciente N
tratado con insulina (0) a igualdad del resto de las
variables predictoras incluidas en el modelo?
Variables predictoras

Paciente A

Paciente N

ADO/insulina
(ADO=1,
insulina=0)

+ 0,29

ADO [1]

insulina [0]

Y = + X + ... + X
0

HbA1c (A)= 10,51 + 0,29 (1) = 10,8


HbA1c (N) = 10,51 + 0,29 (0) = 10,51

Los pacientes en tratamiento con


ADO por termino medio presentan
0,29 unidades ms de HbA1c que
los pacientes tratados con insulina a
igualdad del resto de las variables
predictoras incluidas en el modelo.

C a pt u l o 12

p g in a 1286

Q u diferencia promedio de HBA1c existe entre un


paciente A tratado slo con D IETA (1) de un
paciente B tratado con insulina (0) a igualdad del
resto de las variables predictoras incluidas en el
modelo?
Variables predictoras
Paciente A
Paciente N
i

Dieta/insulina
(dieta=1,
insulina=0)

- 0,97

dieta [1]

insulina [0]

Y = + X + ... + X
0

HbA1c (D)= 10,51 - 0,97 (1) = 9,54


HbA1c (N) = 10,51 - 0,97 (0) = 10,51

Los pacientes en tratamiento


slo con dieta por termino medio
presentan 0,97 unidades menos de
HbA1c que los pacientes tratados
con insulina a igualdad del resto de
las variables predictoras incluidas
en el modelo.

C a pt u l o 12

Q u diferencia promedio de HbA1c existe


entre dos pacientes A y B con las siguientes
caractersticas?
Variables predictoras
Paciente A
Paciente B
Antidiabticos orales/insulina [1/ 0]

ADO [1]

Insulina [0]

Dieta/insulina [1/ 0]

Dieta [1]

Insulina [0]

N enfermedades relacionadas con la diabetes


(>1/<=1) [1/ 0]

3 [1]

1 [0]

Sexo (mujer/hombre)

Hombre [0]

Mujer [1]

Aos desde el diagnstico (> 7 / 7)

8 aos [1]

3 aos [0]

Acceso al dietista hospitalario (si/no) [1/ 0]

Si [1]

No [0]

Mdico interesado en la diabetes (si/no)

Si [1]

Si [1]

HbA1c A = 10,51 + 0,29 (1) 0,97 (0) + 0,20 (1) + 0,72 (0) + 0,04 (1) 1,06 (1) 0,86 (1) =
9.12%
HbA1c B = 10,51 + 0,29 (0) 0,97 (1) + 0,20 (0) + 0,72 (1) + 0,04 (0) 1,06 (0) 0,86 (1) =
9,40%
Diferencia HbA1c (A-B) = - 0,28%

p g in a 1287

C a pt u l o 12

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario INGESA de Ceuta

p g in a 1288

C a pt u l o 12

PC basal
PC post

Grupo Cultural

Lp(a)

Tabaco

C olesterol total

HTA

C olesterol-LD L

C ardiopata isqumica

Apoprotena B

Arteriopata perifrica

Ure
a
Retinopat
a
Proteinuria

Accidente
isqumico cerebral
Microalbuminuria

p g in a 1289

C a pt u l o 12

Anlisis de regresin lineal


mltiple
1.- Grupo cultural
Cristianos: [1]
Musulmanes: [0]
2.- Tabaco (si [1]; no [0])
3.- Hipertensin arterial
si: [1]
no: [0]
4.- Cardiopata isqumica
si: [1]
no: [0]
5.- Arteriopata perifrica (si [1]; no [0])
6- Accidente isqumico cerebral (si [1]; no [0])
8.- Microalbuminuria (si [1]; no
7.[0])Retinopata (si [1]; no [0])
9.- Proteinuria (si [1]; no [0])

Variables predictoras
(X )
C UALITATIVAS
Variable resultado
(Y):
Lipoprotena a
314 pacientes
con
D M tipo 2

Y = 0 + 1X 1 + ... + n
X

Amor Garca, Jacobo Daz, Lus Escobar, Manuel Aguilar, Alipio Mangas.
LIPOPROTENA (a) Y DIABETES MELLITUS TIPO 2: FACTORES QUE INFLUYEN EN LAS
CONCENTRACIONES PLASMTICAS Y UTILIDAD COMO MARCADOR DE COMPLICACIONES
TARDAS (Premio AEBM). Revista: Revista de Diagnstico Biolgico 2000; 49: 125-137.

p g in a 1290

C a pt u l o 12

Anlisis de regresin lineal


mltiple
1.- Edad
2.- Peso
3.- IMC
4.- ICC
5.- Tensin arterial sistlica (TAS)
6- Tensin arterial diastlica
(TAD) 7.- Glucemia
10.-Pptido
IPC C basal
IPC(PCB)
= PCP - PCB
8.11.-Pptido
HbA1c C postprandrial (PCP)
9.12.- Colesterol total
13.- Triglicridos
14.- Colesterol-HDL
15.- Colesterol-LDL
16.- Apoprotena A1
17.- Apoprotena B
18.- Urea
19.- Creatinina

Variables predictoras
(X )
C UALITATIVAS
Variable resultado
(Y):
Lipoprotena a
314 pacientes
con
D M tipo 2

Y = 0 + 1X 1 + ... + n
X

Amor Garca, Jacobo Daz, Lus Escobar, Manuel Aguilar, Alipio Mangas.
LIPOPROTENA (a) Y DIABETES MELLITUS TIPO 2: FACTORES QUE INFLUYEN EN LAS
CONCENTRACIONES PLASMTICAS Y UTILIDAD COMO MARCADOR DE COMPLICACIONES
TARDAS (Premio AEBM). Revista: Revista de Diagnstico Biolgico 2000; 49: 125-137.

p g in a 1291

C a pt u l o 12

Anlisis de regresin lineal


mltiple
Variables asociadas al nivel de lipoprotena (a)
Variables predictoras
CUALITATIVAS

Estimacin

Error estndar EE

/EE

Test F

Grupo cultural

- 5,1428

2,7270

1,88

3,5564

p > 0,1

Tabaco

0,1952

3,1477

0,062

0,0038

NS

HTA

2,4388

2,5480

0,960

0,9161

NS

Cardiopata isqumica

8,4219

2,8256

2,98

8,9028

p < 0,01

Arteriopata perifrica

3,1005

3,375

0,919

0,8440

NS

AIC

2,041

3,114

0,656

0,4298

NS

Retinopata

- 0,8838

2,6850

0,329

0,1084

NS

Microalbuminuria

0,4571

2,6964

0,169

0,0287

NS

Proteinuria

12,905

4,1180

3,13

9,821

p < 0,005

/ EE: Coeficiente de regresin estandarizado

p g in a 1292

C a pt u l o 12

Anlisis de regresin lineal


mltiple
Variables asociadas al nivel de lipoprotena (a)
Pptido C basal

- 1,863

0,9581

1,94

3,7807

0,051

Pptido C post

- 0,027

0,5067

0,053

0,0029

NS

Colesterol total

0,0638

0,0573

1,113

1,2420

NS

Colesterol-LDL

- 0,0518

0,0628

0,825

0,679

NS

Apoprotena B

0,0242

0,0747

0,324

0,1052

NS

Urea

0,1340

0,0704

1,90

3,6205

p > 0,1

AIC

2,041

3,114

0,656

0,4298

NS

/ EE: Coeficiente de regresin estandarizado

p g in a 1293

C a pt u l o 12

Lp(a)
C ardiopata isqumica

Proteinuria

p g in a 1294

C a pt u l o 12

D iscusin (parte
final)
Por lo tanto, la determinacin de Lp(a) presenta utilidad como marcador de las
complicaciones tardas de la DM tipo 2, y sus concentraciones plasmticas estn
influenciadas de forma directa e independiente por la cardiopata isqumica y la
nefropata. Cabe destacar que a pesar de que el diseo del estudio es transversal y
no permite inferir una relacin causal, si tenemos en cuenta el condicionamiento
gentico de la Lp(a), los resultados sugieren que la elevacin de los niveles
plasmticos de Lp(a) predisponen al enfermo diabtico a la aparicin de
complicaciones vasculares,
principalmente la cardiopata isqumica y la nefropata diabtica. A pesar de tratarse
de un estudio con elevado nmero de pacientes, dada la gran variabilidad
interindividual de las concentraciones de Lp(a), estas asociaciones deberan
confirmarse en estudios longitudinales ms amplios y ms a largo plazo que los
publicados en la actualidad.
Amor Garca, Jacobo Daz, Lus Escobar, Manuel Aguilar, Alipio Mangas.
LIPOPROTENA (a) Y DIABETES MELLITUS TIPO 2: FACTORES QUE INFLUYEN EN LAS
CONCENTRACIONES PLASMTICAS Y UTILIDAD COMO MARCADOR DE COMPLICACIONES
TARDAS (Premio Nacional AEBM). Revista: Revista de Diagnstico Biolgico 2000; 49: 125-137.

p g in a 1295

C a pt u l o 12

Mito 1: La sonrisa de la
esfinge
Segn se desprende en el final de la discusin del estudio, se sugiere que la Lp(a), por
su condicionamiento gentico, podra actuar como variable predictora principal de la
aparicin de algunas complicaciones vasculares como la cardiopata isqumica y la
nefropata diabtica en los pacientes con diabetes tipo 2. Sin embargo en el anlisis
multivariante la has considerado con variable resultado.
Ests seguro que la lipoprotena a es realmente la variable resultado?
No crees que la Lp(a) podra ser la variable predictora principal y la aparicin de
algn tipo complicaciones vasculares la variable resultado?

p g in a 1296

C a pt u l o 12

Variable
PRED IC TO RA
Lp(a)
Cuantitativa
continua

Variable RESULTAD O
C ualitativa dicotmica (s o
no)C omplicaciones vasculares
- C ardiopata isqumica
- Proteinuria

p g in a 1297

C a pt u l o 12

PC basal

Lp(a)

PC post
C olesterol total
C olesterol-LD L
Apoprotena B
Urea
Grupo Cultural
Tabaco
HTA

C omplicacion
es vasculares

p g in a 1298

C a pt u l o 12

Problema clnico: En Atencin Primaria la eficiencia de la determinacin de la


excrecin urinaria de albmina en orina de 24 horas (EUA) para el diagnostico de la
nefropata diabtica es baja.
Objetivo del estudio: Introducir el cociente albmina/creatinina en una muestra de
orina matinal (CAC) como alternativa a la EUA.
Pregunta de investigacin: Podemos sustituir el cociente albmina/creatinina en
orina matinal (CAC) por la excrecin urinaria de albmina (EUA) en orina de 24 horas
en pacientes con sospecha de nefropata diabtica? Qu relacin existe entre el
CAC y la EUA en orina de 24 horas en dichos pacientes?.
Cul es el test estadstico ms acertado?

p g in a 1299

C a pt u l o 12

Pregunta de investigacin
Qu relacin existe entre el cociente
albmina/creatinina en orina matinal (C AC ) y la
excrecin urinaria de albmina (EUA) en orina de 24
horas?
Variable
PRED IC TO RA
C AC
Cuantitativa
continua

REGRESIN LINEAL
SIMPLE
Coeficiente de
correlacin

Variable
RESULTAD O
EUA
Cuantitativa
continua

Y = 0 + 1 * X
r = 0,893
(89,3%)

p g in a 1300

C a pt u l o 12

p g in a 1301

C oeficiente de correlacin de
Pearson

Correlacin global EUA versus CAC r = 0,893; R2 = 0,806; p < 0,01


COEFICIENTE DE PEARSON: La magnitud de la asociacin entre la EUA y la CAC es
del 89,3% de la posible.
COEFICIENTE DE DETERMINACIN: El 80,6% de la variabilidad de la EUA puede
ser explicada por la distinta CAC, resta por explicar un 19,4% que es achacable a
otras variables PREDICTORAS distintas de la CAC.
Cules son esas variables predictoras?
Influencia del SEXO
EUA versus CAC

Correlacin de Pearson r

Sexo masculino

0,753

Sexo femenino

0,979

Las diferencias entre los coeficientes de correlacin para cada sexo (masculino
versus
femenino) se pueden analizar por el mtodo de OLKIN.

C a pt u l o 12

p g in a 1302

El test de Kaiser-Meyer-Olkin (KMO), que mide la idoneidad de los datos para realizar un
anlisis factorial comparando los valores de los coeficientes de correlacin observados
con los coeficientes de correlacin parcial (grupos comparados). Si la suma de los
cuadrados de los coeficientes de correlacin parcial entre todos los pares de variables es
pequea
en comparacin con la suma de los coeficientes de correlacin al cuadrado, esta medida
tiende a uno. Para Kaiser los resultados del modelo factorial sern excelentes si el ndice
KMO est comprendido entre 0,9 y 1; buenos, si est comprendido entre 0,8 y 0,9;
aceptables, si se encuentra entre 0,7 y 0,8; mediocres o regulares, cuando resulte entre
0,6 y 0,7; malos, si est entre 0,5 y 0,6; e inaceptables o muy malos cuando sea menor
que 0,5.

KMO =

( r global)2
( r global)2 + ( r hombres)2

C a pt u l o 12

El coeficiente de correlacin parcial es un indicador de la fuerza de las relaciones


entre dos variables eliminando la influencia del resto. Si las variables comparten
factores comunes, el coeficiente de correlacin parcial entre pares de variables
deber ser bajo, puesto que se eliminan los efectos lineales de las otras variables.
Una forma de evaluar este hecho es mediante la Medida de Adecuacin de la Muestra
KMO propuesta por Kaiser, Meyer y Olkin. Dicha medida viene dada por la ecuacin
KMO donde rij(p) es el coeficiente de correlacin parcial entre las variables Xi y Xj
eliminando la influencia del resto de las variables.

p g in a 1303

C a pt u l o 12

KMO =

( r global)2
( r global

)2

+ ( r hombres)2

KMO hombres = 0,584

KMO =

( r global)
( r global)

p g in a 1304

+ ( r mujeres) 2

KMO mujeres = 0,457

KMO es un ndice que toma valores entre 0 y 1 y que se utiliza para comparar las
magnitudes de los coeficientes de correlacin observados con las magnitudes de los
coeficientes de correlacin parcial de forma que, cuanto ms pequeo sea su valor,
mayor es el valor de los coeficientes de correlacin parciales rij(p) y, por lo tanto, menos
deseable es realizar un Anlisis Factorial. Kaise, Meyer y Olkin aconsejan que si KMO
0,75 la idea de realizar un anlisis factorial es buena, si 0,75 > KMO 0,5 la idea es
aceptable y si KMO < 0,5 es inaceptable.

C a pt u l o 12

p g in a 1305

Se observa que el valor del KMO = 0.584 para hombres est en el lmite de los valores
recomendados por Kaiser, Meyer y Olkin poniendo de manifiesto que, en este caso
muy probablemente, el proceso de reduccin de datos no sea muy espectacular.
Se observa que el valor del KMO = 0.457 para mujeres es inferior al lmite de los
valores recomendados por Kaiser, Meyer y Olkin (0,5) poniendo de manifiesto que, en
este caso con toda seguridad, el proceso de reduccin de datos no es importante.

C a pt u l o 12

Regresin lineal
mltiple

Factor 1:
Variable predictora
1 C AC

p g in a 1306

R2 = 0,806
(80,6%)

1 = 7.65 p=0,001

Factor 3:
Variable predictora
3 Edad
3= -0.54 p=0,42

Factor 2:
Variable predictora
2 Sexo
2 = -30.26 p=0,01

Variable
RESULTAD O
Cuantitativa
EUA
continua
Aplicacin del modelo de regresin mltiple
a los datos de un estudio que usa como
variables predictoras el cociente albmina/
creatinina en orina matinal (CAC), sexo y
edad del individuo frente a la excrecin
urinaria de albmina en orina 24 horas EUA
(variable resultado).

p g in a 1307

C a pt u l o 12

Anlisis de regresin lineal


mltiple
EUA: Excrecin urinaria de
albmina en orina de 24 horas
CAC: Cociente
albmina/creatinina en una
muestra de orina matinal EUA:
Variable dependiente o resultado
CAC: Variable Predictora 1
SEXO: Variable Predictora
2 EDAD: Variable
Predictora 3

Modelo de Regresin Lineal Mltiple


Coeficiente IC95% de

Constante

110,85

13,88 a 187,84 0,02

CAC

7,65

7,13 a 8,16

0,001

Edad

- 0,54

- 1,86 a 0,78

0,42

Sexo

- 30,26

- 53,93 a 6,58 0,01

eu a (y ) = 110,85 + 7,65 C aC - 0,54 eD a D 30,26


seX o
eu a (y ) = 110,85 + 7,65 C aC 30,26 seX o

C a pt u l o 12

Fases del anlisis


estadstico
1. ANLISIS DESCRIPTIVO

Qu Variables PREDICTORAS
se deben incluir en el Anlisis
de Regresin Lineal Mltiple?

2. ANLISIS BIVARIANTE

3. ANLISIS MULTIVARIANTE

Variable Predictora 1
Variable Predictora 2
Variable Predictora 3
Variable Predictora 4
Variable Predictora 5
Variable Predictora n

Variable Resultado

p g in a 1308

C a pt u l o 12

Mtodo de introduccin de las


variables

REGRESIN LINEAL
MLTIPLE

REGRESIN LOGSTICA
MULTIVARIANTE

Forward (hacia adelante)

Introducir progresivamente en el modelo las variables


predictoras estadsticamente significativas, comenzando por
la que tenga mayor significacin

Backward (hacia atrs)

Comienza por estimar un modelo que contiene todas las


variables predictoras para ir eliminando posteriormente
una a una, de forma sucesiva, aquellas que no sean
significativas

Stepwise

Es una combinacin de los anteriores

p g in a 1309

C a pt u l o 12

HIPERLIPID EMIA
EDAD
SEX O
N IVEL C ULTURAL
TABAQ UISMO
O BESIDAD IMC
D IABETES

Excrecin urinaria
de sodio en 24 horas

p g in a 1310

C a pt u l o 12

Q u variables predictoras se deben incluir en el


anlisis de
regresin lineal mltiple?
Con significacin estadstica
(p<0,05)
Edad
Sexo
Nivel cultural
Tabaquismo

Prxima a la significacin
estadstica (0,05 < p <
0,1)
- IMC
- Hiperlipidemia

p g in a 1311

p g in a 1312

C a pt u l o 12

Anlisis de regresin lineal


Cul
de las distintas variables
mltiple
Resultados del anlisis de Regresin Lineal Mltiple
predictoras con significacin
estadstica (p<0,05) del
anlisis univariante NO
aparecen en el modelo
multivariante?
Nivel cultural
Cul de las distintas
variables predictoras prximas
a la significacin estadstica
(0,05
<p<0,1) del anlisis
univariante SI aparecen en el
modelo multivariante?
Obesidad (IMC)

Coeficiente IC95% de

Constante

96,67

19,2 a 174,15

0,015

Edad

- 1,17

- 1,89 a 0,44 0,002

Sexo

28,71

4,65 a 52,78

0,020

Tabaquismo

29,22

3,83 a 54,6

0,024

IMC
4,15
2,00 a 6,29
0,000
La codificacin de las variables dicotmicas se
realiz sexo: mujer = 0, hombre = 1, tabaquismo: no
fumador 0, fumador 1). IMC = peso / (talla)2

En el anlisis de regresin lineal MLTIPLE se incluyeron las variables predictoras con


Significacin estadstica en el anlisis de regresin lineal SIMPLE (edad, sexo, nivel cultural,
tabaquismo; p<0,05) y aquellas prximas a la significacin (IMC y hiperlipidemia; p=0,1),
identificndose como verdaderas variables predictoras o independientes slo la edad, sexo,

C a pt u l o 12

Pregunta de investigacin
Qu relacin existe entre los niveles de colesterol en
sangre y la tensin arterial?
Variable
PRED IC TO RA
C olesterol
Cuantitativa
continua

REGRESIN LINEAL
SIMPLE
Coeficiente de
correlacin

Variable
RESULTAD O
Tensin arterial
Cuantitativa
continua

Y = 0 + 1 * X
R2 = 0,691
(69,1%)

p g in a 1313

C a pt u l o 12

p g in a 1314

Modelo de regresin lineal simple para la variable resultado


tensin arterial diastlica ajustado por la variable
predictora
colesterol
Variable
Coeficiente
EE
IC95%
t
p
Constante
Colesterol

26,91
0,23
Suma de
cuadrados

7,15
0,03
g.l

12,63 41,19
0,17 0,29
Media
Cuadrtica

3,76
7,70
F

< 0,001
< 0,001
p

Regresin
Residual

4067,11
4459,01

1
65

4067,11
68,60

59,29

< 0,001

Total

8526,12

66

29,22

Y = 0 + 1 * X
TAD = 26.91 + 0.23 * Colesterol
Es el modelo de regresin simple que resulta de tomar como nica variable predictora el colesterol de un
individuo. El valor del coeficiente de determinacin R2 es 0.691 (69.1%).
Se puede mejorar el R2 incluyendo otra variable predictora?.
R2 puede ser mejorado a 0.722 (72.2%) aplicando un modelo multivariante en el que se introduce el ndice
de masa corporal (IMC) como nueva variable predictora.

C a pt u l o 12

p g in a 1315

C orrelacin lineal de las variables predictoras edad, colesterol


e ndice de masa corporal con la variable resultado tensin
arterial diastlica
NSNS
TAD

TA
D
NS
N
NS
S
NS

N
S

N NS
EDAD
EDA
NS NS
NS
S
D
Coleste
N
NS
rol
S
Colesterol
N
S

NS

N NS
S

IM
C

Prtegas Daz S, Pita Fernndez S. Tcnicas de regresin: Regresin lineal mltiple. Cad Aten Primaria
2000; 7: 173-176.

C a pt u l o 12

Regresin lineal
mltiple
Variable
C ausa o Factor 1: C uantitativa
Predictora
1

Interacci
n

Variable
RESULTAD
D esenlaceOo
efecto:
Cuantitativa

Variable
Predictora
2 C ausa o Factor 2: C uantitativa
Y = 0 + 1 * X1 + 2 *
X2

p g in a 1316

C a pt u l o 12

Regresin lineal mltiple


R2 = 0,722 (72,2%)
Factor 1:
Variable predictora 1
C olesterol

t= 5.26 p<0,001

D esenlace o
efecto
Tensin arterial

Factor 2:
Variable predictora
2 IMC
t= 2.45 p=0,017

Aplicacin del modelo de regresin


mltiple a los datos de un estudio que usa
como variables predictoras de la tensin
diastlica (variable resultado) el colesterol
y el ndice de masa corporal de un
individuo.

p g in a 1317

C a pt u l o 12

p g in a 1318

Modelo de regresin lineal simple para la variable resultado


tensin arterial diastlica ajustado por las variables
predictoras
ndice
de masa
colesterol e
R2 = 0,722
(72,2%)
corporal
Variable
Coeficiente
EE
IC95%
t
p
Constante
Colesterol
IMC

19,42
0,18
0,73
Suma de
cuadrados

7,54
0,03
0,30
g.l

4,37 34,48
0,11 0,25
0,14 1,33
Media
Cuadrtica

2,58
5,26
2,45
F

0,012
< 0,001
0,017
p

Regresin
Residual

4449,72
4076,40

2
64

2224,86
63,69

34,93

< 0,001

Total

8526,12

TAD = 19,42 + 0.18 * Colesterol + 0,73 IMC


Los coeficientes de regresin para ambas variables predictoras fueron 0.18 (= 0.03) y 0.73 (=0.30)
respectivamente, siendo ambos significativamente distintos de cero. Esto indica que por trmino medio la
tensin arterial diastlica de un paciente se incrementa en 1.8 y 7.3 respectivamente por cada 10 unidades
a mayores en su colesterol o ndice de masa corporal. El valor del coeficiente de determinacin R2 =0.72
(72%) y la significacin del contraste F global de la regresin (p<0.001) sugieren que gran parte de la
variabilidad de la respuesta (TAD) viene explicada por el modelo ajustado.

C a pt u l o 12

Regresin lineal
mltiple

Factor 1:
Variable predictora
1 C olesterol

p g in a 1319

R2 = 0,52
(52%)
t= 4.84 p<0,001

Factor 3:
Variable predictora
3 Edad

D esenlace o
efecto
t= 1.67 p=0.10

Factor 2:
Variable predictora
2 IMC
t= 2.31 p=0,024

Tensin
arterial

Aplicacin del modelo de regresin mltiple


a los datos de un estudio que usa como
variables predictoras de la tensin diastlica
(variable resultado) el colesterol, ndice de
masa corporal y edad de un individuo.

C a pt u l o 12

p g in a 1320

Modelo de regresin lineal simple para la variable resultado


tensin arterial diastlica (TAD ) ajustado por las variables
predictoras
terol,
ndicecolesde masa corporal y
R2 = 0,52
(52%)
edad
Variable
Coeficiente
EE
IC95%
t
p
Constante
Colesterol
IMC
Edad

10,55
0,17
0,68
0,24
Suma de
cuadrados

9,13
0,03
0,30
0,14
g.l

-7,70 a 28,81
0,1 0,24
0,09 1,28
- 0,05 a 0,53
Media
Cuadrtica

1,15
4,84
2,31
1,67
F

0,252
< 0,001
0,024
0,100
p

Regresin
Residual

4622,52
3903,60

3
63

1540,84
61,96

24,87

< 0,001

Total

8526,12

66

Los coeficientes de regresin para el colesterol fue 0.17 (= 0.03) y de 0.68 (=0.30) para el IMC
continuarn siendo distintos de cero (p<0.05). La introduccin de la nueva variable predictora EDAD en el
modelo, proporciona un cambio en el coeficiente de determinacin R2 de tan slo 0.028 que NO mejora de
forma significativa (p=0.059). La entrada de la variable edad NO produce una mejora del ajuste del modelo.
El coeficiente de regresin de la EDAD (0.24) no es significativo (p=0.100).

C a pt u l o 12

p g in a 1321

Modelo de regresin lineal simple para la variable resultado


tensin arterial diastlica (TAD ) ajustado por las variables
predictoras coles- terol, ndice de masa corporal y edad
Variable
Constante
Colesterol
IMC
Edad

Coeficiente
10,55
0,17
0,68
0,24
Suma de
cuadrados

EE
9,13
0,03
0,30
0,14
g.l

IC95%
-7,70 a 28,81
0,1 0,24
0,09 1,28
- 0,05 a 0,53
Media
Cuadrtica

t
1,15
4,84
2,31
1,67
F

p
0,252
< 0,001
0,024
0,100
p

Regresin
Residual

4622,52
3903,60

3
63

1540,84
61,96

24,87

< 0,001

Total

8526,12

66

edad

EE
edad

0,24
0,14

= 1,71

< Z95% (1,96)

p = 0,100

Prtegas Daz S, Pita Fernndez S. Tcnicas de regresin: Regresin lineal mltiple. Cad Aten Primaria
2000; 7: 173-176.

C a pt u l o 12

Mtodo de introduccin de las


variables

REGRESIN LINEAL
MLTIPLE

REGRESIN LOGSTICA
MULTIVARIANTE

Forward (hacia adelante)

Introducir progresivamente en el modelo las variables


predictoras estadsticamente significativas, comenzando por
la que tenga mayor significacin

Backward (hacia atrs)

Comienza por estimar un modelo que contiene todas las


variables predictoras para ir eliminando posteriormente
una a una, de forma sucesiva, aquellas que no sean
significativas

Stepwise

Es una combinacin de los anteriores

p g in a 1322

C a pt u l o 12

Anlisis multivariante
Anlisis multivariante para la deteccin de potenciales
factores de confusin
Variable Predictora 1
Variable Predictora 2
Variable Predictora 3
Variable Predictora 4
Variable Predictora 5
Variable Predictora n

Variable Resultado

p g in a 1323

C a pt u l o 12

Sesgo de
confusin
Variable predictora Exposicin F
o factor de riesgo

Variable resultado
Enfermedad o efecto E

Variable
confundent
e

Es el nico sesgo que se puede controlar (evitar) en la fase de anlisis y no slo en la fase de diseo.
Distorsin en las conclusiones del estudio, producida por la distribucin desigual, en los grupos de
comparacin, de una tercera variable (confundente C).

p g in a 1324

C a pt u l o 12

Portadores del Alelo


4
- Elevada prevalencia de enfermedad
coronaria
- Mayor extensin de la arteriosclerosis
- Mayor tasa de IAM
- Mayor mortalidad de causa coronaria
Alelo 4

Enfermedad coronaria

- ANLISIS UNIVARIANTE:
El 15,7% de los portadores del alelo 4 presentaban CI frente al 6,9% en
NO
4 (p<0,01)
ORc = 2,49 IC95%: 1,19-5,22

p g in a 1325

C a pt u l o 12

Modelo de regresin
logstica
Exposici
n Alelo 4

Potenciales FACTORES DE
CONFUSIN
- Edad
- Sexo
- HTA
- Tabaquismo
- Obesidad (IMC)
- Lpidos y lipoprotenas

Enfermedad coronaria

p g in a 1326

C a pt u l o 12

p g in a 1327

Regresin logstica multivariante para la


deteccin de potenciales factores de confusin
Alelo 4

Enfermedad coronaria

No corregido
Corregido para la edad y el sexo

2,49 (1,19 - 5,22)

Corregido para la edad, el sexo y otros


factores de riesgo cardiovascular (FRCV)

2,59 (1,15 - 5,83)

Corregido para la edad, el sexo, otros


factores de FRCV y perfil lipdico

0,75

OR (IC95%)

2,83 (1,18 - 6,81)


2,56 (1,03 - 6,39)

Asociacin entre la prevalencia de enfermedad coronaria y el tipo de apo E (4 frente a no 4) expresada


como OR e IC95% en una poblacin de 386 pacientes con hipercolesterolemia. Se presenta la asociacin
simple (anlisis univariante) (OR no corregido) y despus de corregir, de forma escalonada, para distintas
variables predictoras potencialmente confundentes como la edad y el sexo, para estas variables ms la
presencia de hipertensin arterial, tabaquismo e IMC y, por ltimo, todos los anteriores ms el perfil lipdico
colesterol total, cHDL y triglicridos mediante anlisis multivariante.

C a pt u l o 12

Reflexiones
finales
Los distintos tipo de sesgos, la influencia del azar y la presencia de
variables predictoras de CONFUSIN deben finalmente siempre, tenerse
en cuenta, en todos los estudios como explicacin posible de cualquier
asociacin estadstica ya sea esta positiva, negativa o no existente.
Y como sealaba M. Susser en sus reflexiones sobre causalidad
Cuando hay minas por todas partes uno no debe aventurarse sin un
detector
de minas (ANLISIS MULTIVARIANTE).

Susser M. Conceptos y estrategias en epidemiologa. El pensamiento causal en ciencias de la salud.


Mxico: Biblioteca de la Salud; 1991.

p g in a 1328

C a pt u l o 12

REGRESIN LINEAL
MLTIPLE

REGRESIN LOGSTICA
MULTIVARIANTE

Variable
RESULTADO

Cuantitativa

Cualitativa
(dicotmica)

Variables
PREDICTORAS

Cualitativa
Cuantitativa

Cualitativa
Cuantitativa

ECUACIN

Y = + X + ... + X
0

p g in a 1329

C a pt u l o 12

Modelo de regresin mltiple de


C ox
REGRESIN
MLTIPLE de COX
Variable
RESULTADO

Cuantitativa
Desenlace: supervivencia a tiempo t

Variables
PREDICTORAS

Cualitativa
Cuantitativa
(factores pronstico)

ECUACIN

p g in a 1330

C a pt u l o 12

Anlisis
multivariante
Edad
Estado civil
Tiempo de alcoholismo
Bilirrubina
Presencia de ascitis
Albmina

Probabilidad de muerte

p g in a 1331

C a pt u l o 12

Estudio de cohortes prospectivo de pacientes


alcohlicos
Variables predictoras

Anlisis Univariante (p)

Edad

p < 0,05

Estado civil

p < 0,05

Tiempo de alcoholismo

p < 0,05

Bilirrubina srica

p < 0,05

Presencia de ascitis

p < 0,05

Albmina srica

p < 0,05

p g in a 1332

C a pt u l o 12

Estudio de cohortes prospectivo de pacientes


alcohlicos
Factores de Riesgo

Muertos por otras


causas

162
pacientes
alcohlicos
hospitalizad
os

Fallecimientos 56

Sobrevivientes 59
Prdidas de
seguimiento
Seguimiento mediana 8,7 aos

p g in a 1333

C a pt u l o 12

Estudio de cohortes prospectivo de pacientes


alcohlicos
Edad

Ascitis

Pacientes
alcohlico
s

Muert
e
Bilirrubina

Estado civil

p g in a 1334

C a pt u l o 12

Estudio de cohortes prospectivo de pacientes


alcohlicos
Variables predictoras con significado pronstico en pacientes alcohlicos
Modelo de Regresin de Cox (mtodo paso a paso)
Variable

RR

IC95% del RR

Significacin

Edad

1,0763

1,0334-1,1209

0,0004

Ascitis

2,0940

1,0553-4,1551

0,0345

Bilirrubina

1,4220

1,2058-1,6769

0,0000

Estado civil

2,3922

1,1796-4,8515

0,0156

p g in a 1335

C a pt u l o 12

p g in a 1336

Pruebas estadsticas de contraste de


hiptesis ms aplicables a cada situacin
Variable
Independiente
o PREDICTORA

Variable
Dependiente
o RESULTADO

Pruebas de contraste de
hiptesis

Observaciones y/o limitaciones del test

Cualitativa

Cualitativa

Ji cuadrado
Prueba exacta de
Fisher Test de
McNemar
Q de Cochran
REGRESIN LOGSTICA

Cualitativa

Cuantitativa

Cuantitativa

Cualitativa

Cuantitativa

Cuantitativa

t de Student
Anlisis de la
Varianza Test de
Mann-Whitney Test
de Wilcoxon
Test de KruskallWallis Test de
Friedman
Regresin logstica simple
Regresin logstica
multivariante
Regresin lineal
simple Correlacin de
Pearson Correlacin
de Sperman
REGRESIN MLTIPLE

Si el tamao muestral es
grande Si el tamao muestral
es pequeo
Dos grupos de muestras
repetidas o apareadas
Ms de dos grupos de muestras repetidas o
apareadas Varias variables predictoras
cualitativas
Compara medias entre dos grupos independientes
Compara medias entre ms de dos grupos
independientes Dos grupos independientes No
paramtricos
Dos grupos medidas repetidas No paramtrico
Ms de dos grupos No paramtrico, medidas
repetidas Ms de dos grupos No paramtrico
medidas repetidas
Una sola variable predictora cuantitativa
Varias variable predictoras cuantitativa o cualitativas
Paramtrico
Paramtrico
No
paramtrico
Varias
variables
predictoras

C a pt u l o 13

C aptulo 13
Publicacin Bioestadstica: Bibliografa.

D r. Jacobo D az Portillo
Coordinador de Formacin Continuada
Hospital Universitario de Ceuta

p g in a 1337

C a pt u l o 13

Bibliografa utilizada en el
curso (1)

-Alvarez Cceres R. Estadstica aplicada a las ciencias de la salud. Madrid. Daz


de Santos 2007.
-Martnez-Gonzlez MA, editor. Bioestadstica amigable. 2 ed. Madrid : Daz
de Santos, 2006.
-Martn Andrs A, Luna del Castillo JD. Bioestadstica para las ciencias de la salud.
4 ed. Madrid: NORMA; 1993.
-Milton JS, Tsokos JO. Estadstica para biologa y ciencias de la salud.
Madrid: Interamericana McGraw Hill; 2001.
-Dawson-Saunders B, Trapp RG. Bioestadstica Mdica. 2 ed. Mxico: Editorial
el Manual Moderno;1996.
-Pita Fernndez, S. Uso de la estadstica y la epidemiologa en atencin primaria.
En: Gil VF, Merino J, Orozco D, Quirce F. Manual de metodologa de trabajo en
atencin primaria. Universidad de Alicante. Madrid, Jarpyo Editores, S.A. 1997; 115161.

p g in a 1338

C a pt u l o 13

Bibliografa utilizada en el
curso (2)

p g in a 1339

-Castillo Ron E. Introduccin a la estadstica aplicada. Santander: Ed. autor; 1993.


- Cobo E, Muoz P, Gonzlez JA. Bioestadstica para no estadsticos: bases para
interpretar artculos cientficos. msterdam : Elsevier Masson, 2007.
- Morell Ocaa M, Redondo Bautista M. Metodologa cientfica en ciencias de la salud.
Grupo editorial 33 (Mlaga); 2002.
-Argimn Palls JM, Jimnez Villa J. Mtodos de investigacin aplicados a la atencin
primaria de salud. 2 ed. Barcelona: Mosby-Doyma; 1994.
-Sackett DL, Richarson WS, Rosenberg W, Hynes RB. Evidence-based medicine:
how to practice and teach EBM. 2nd ed. London: Churchill-livingstone; 2000.
- Silva Ayaguer LC. Cultura estadstica e investigacin cientfica en el campo de la
salud: una mirada crtica. Madrid: Ediciones Daz de Santos; 1997.

C a pt u l o 13

Bibliografa utilizada en el
curso (3)

-Bailar JC III. Some uses of statistical thinking. En: Bailar JC III, Mostoller F,
editors. Medical uses of statistics. Boston: N Engl J Med Books, 1992; p. 25-57
-Bobenrieth Astete M.A . Mitos y realidades en torno a la publicacin cientfica.
Med Clin (Barc) 2000; 114: 339-341.
-Bobenrieth Astete M.A . Lectura crtica de artculos originales en Salud. Medicina
de Familia (And) 2001; 2: 81-90.
- Antoja Rib F. The innocence of the storks. Rev Lab Clin 2010; 3 (2): 51.
-Altman DG, Bland JM. Absence of evidence is not evidence of absence. BMJ
1995;311:485.
- Argimon JM. La ausencia de significacin estadstica en un ensayoclnico
no significa
equivalencia teraputica. Med Clin (Barc) 2002; 118: 701-3
-Mora I, Ripoll R. Cmo mejorar la calidad estadstica de los artculos presentados
a revistas biomdicas: lista de comprobacin para los autores. Med Clin (Barc).
1999;113:138-49.

p g in a 1340

C a pt u l o 13

Bibliografa utilizada en el
curso (4)

p g in a 1341

-Salsburg DS. The religion of statistics as practiced in medical journals. Am Statistician


1985; 39: 220-223.
- Pocock SJ. The role of statistics in medical research. Br J Psychiat 1980; 137: 188190.
- Chia KS. Significant-itis: an obsession with the P value. Scand J Work Environ
Health.
1997; 23:152-4.
- Christenson P. To p or not to p. J Child Adolesc Psychiatr Nurs. 1995; 8:42.
- Neyman J, Pearson E. On the problem of the most efficient tests of statistical
hypothesis. Philosophical trans of the Royal Society of London (A) 1933;231:289-337.
- Ars A. Tmese una antes de acostarse. 1 edicin. Barcelona: Planeta; 1998.

C a pt u l o 13

Bibliografa utilizada en el
curso (5)

-Martn Andrs A. Bioestadstica para ciencias de la salud. 1 ed. Madrid :


Ediciones Norma-Capitel, 2004.
- Prez Lpez C. Mtodos estadsticos avanzados con SPSS. Thomson, 2005.
- Garca A. Mtodos avanzados de estadstica aplicada. Madrid: UNED, 2001.
-Juez Martel P, Diez Vegas FJ. Probabilidad y Estadstica en Medicina. Madrid: Daz
de Santos, 1997.
-Alvarez Cceres R. Estadstica multivariante y no paramtrica con SPSS. Madrid:
Daz de Santos, 1994.
-Armitage P, Berry G. Estadstica para la Investigacin Biomdica. Doyma,
Barcelona, 1992.
-DL Sackett. Epidemiologa clnica. Buenos Aires, Editorial Mdica
Panamericana, 1994.

p g in a 1342

C a pt u l o 13

Bibliografa utilizada en el
curso (6)

p g in a 1343

-Pita Fernndez S, Prtega Daz S. Significancia estadstica y relevancia clnica.


Cad Aten Primaria 2001; 8: 191-195.
- Escrig Sos J et al. Intervalos de confianza: por qu usarlos. Cir Esp.
2007;81(3):121-5.
-Camps Garca MT, Muoz Rocan N, Calvo de Mora A, De Ramn Garrido E. Los
cocientes de probabilidad como medida de la utilidad de la determinacin de
anticuerpos antinucleares por inmunofluorescencia indirecta en la clnica. Aplicacin de
los resultados de la investigacin clnica. Med Clin (Barc) 1999;113: 476.
-Tibblea J et al. Faecal calprotectin and faecal occult blood tests in the diagnosis of
colorectal carcinoma and adenoma. Gut 2001;49:402-408.

C a pt u l o 13

Bibliografa utilizada en el
curso (7)

-Seoanea T et al. Estadstica: Estadstica Descriptiva y Estadstica Inferencial.


SEMERGEN. 2007;33(9):466-71.
-Iraurgi I. Significancia estadstica y relevancia clnica. Norte de Salud Mental
2009; 94 - 108.
- Rubio C. Diseo estadstico de ensayos clnicos. Med Clin (Barc) 1996; 107: 303309.
- Plasencia A, Porta Serra M. La calidad de la informacin clnica (II): significacin
estadstica. Med Clin (Barc) 1988; 90: 122-126.
-Carlos Manterola D, Viviana Pineda N. El valor de p y la significacin estadstica.
Aspectos generales y su valor en la prctica clnica. Interpretation of medical
statistics. Rev. Chilena de Ciruga 2008; 60: 86-89.

p g in a 1344

C a pt u l o 13

Bibliografa utilizada en el
curso (8)

-Lpez de Ullibarri Galparsoro I, Pita Fernndez S. Medidas de concordancia: el


ndice Kappa. Cad Aten Primaria 1999; 6: 169-171.
-Pita Fernndez S, Prtegas Daz S. Relacin entre variables cuantitativas. Cad
Aten Primaria 1997; 4: 141-144.
-Pita Fernndez S, Prtegas Daz S. Pruebas diagnsticas. Cad Aten Primaria
2003; 10: 120-124.
- Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el
anlisis
de concordancia para variables numricas. Cad Aten Primaria 2004.
- Prtegas Daz S, Pita Fernndez S. Tcnicas de regresin: Regresin lineal
mltiple.
Cad Aten Primaria 2000; 7: 173-176.

p g in a 1345

C a pt u l o 13

Bibliografa utilizada en el
curso (9)

p g in a 1346

-Pita Fernndez S, Prtegas Daz S. Tcnicas de regresin: regresin lineal mltiple.


Cad Aten Primaria 2000; 7: 91-94.
- Pita Fernndez S. Correlacin frente a causalidad JANO 1996; (1174): 59-60.
-Pita Fernndez S. Determinacin del tamao muestral. Cad Aten Primaria 1996;
3: 138-144.
-Prtegas Daz S , Pita Fernndez S. La distribucin normal. Cad Aten Primaria 2001;
8: 268-274.
-Prtegas Daz S , Pita Fernndez S. Mtodos paramtricos para la comparacin de
dos medias. t de Student. Cad Aten Primaria 2001; 8: 37-41.
-Passing H, Bablok W. A new biometrical procedure for testing the equality of
measurements from two different analytical methods. J Clin Chem Biochem 1983;
21: 709-20.

C a pt u l o 13

Bibliografa utilizada en el curso


(10)

-Burgueo MJ, Garca-Bastos JL y Gonzlez-Buitrago JM. Las curvas ROC en la


evaluacin de las pruebas diagnsticas. Med Clin (Barc) 1995: 104: 661-670.
-Hanley JA, McNeil BJ. The meaning and use of the area under aReceiver Operating
Characteristic (ROC) Curve. Radiology 1982; 143: 29-36.
-Lpez de Ullibarri Galparsoro I, Pita Fernndez S. Curvas ROC. Cad Aten Primaria
1998; 5: 229-235.
-McNeil BJ, Keeler E, Adelstein SJ. Primer on certain elements of medical decision
making. N Engl J Med 1975; 293: 211-215.
- Galen RS, Gambino SR. Beyond normality: The predictive value and efficiency of
medical diagnoses. Nueva York: J Wiley and Sons, lnc., 1975.

p g in a 1347

C a pt u l o 13

Bibliografa utilizada en el
curso (11)

p g in a 1348

-Beck JR, Shultz EK. The use of relative operating characteristic (ROC) curves in test
performance evaluation. Arch Pathol Lab Med 1986; 110:13-20.
-Swets JA. Measuring the accuracy of diagnostic systems. Science 1988; 240:
1.285- 1.293.
- Zweig MH, Campbell G. Receiver-operating characteristic (ROC) plots: a
fundamental evaluation tool in clinical medicine. Clin Chem 1993; 39: 561-577.
-Yupanqui Pacheco RM: Introduccin a la estadstica bayesiana. UNMSM. Facultad
de Ciencias Matemticas. EAP de Estadstica, Lima, 2005 (disponible en: http://sisbi
b. unmsm.edu.pe/ bibvirtualdata/Tesis/Basic/yupanqui_pr/yupanqui_pr.pdf).
- Altman DG, Moher D. Elaboracin de directrices para la publicacin de
investigacin
biomdica: proceso y fundamento cientfico. Med Clin (Barc). 2005;125(Supl 1):8-13.

C a pt u l o 13

Bibliografa utilizada en el
curso (12)

-Lpez, F. Utilizacin adecuada de las pruebas estadsticas en los estudios


de comparacin de procedimientos. Quim Clin 2000; 19: 237.
- Fleiss JL. The design and analysis of clinical experiments. Nueva York:
John Wiley &
Sons, Inc., 1986.
-Luis Prieto, Rosa Lamarca, Alfonso Casado. La evaluacin de la fiabilidad en
las observaciones clnicas: el coeficiente de correlacin intraclase. Med Clin
(Barc).
1998;110:142-5.
-(*) Wakkers PJM, Hallendoorn HBA, Op de Weegh GJ, Heerspink W. Applications
of statistics in clinical chemistry. A critical evaluation of regression lines. Clin Chim
Acta 1975; 64: 173-84.
- Cornbleet PJ, Gochman N. Incorrect least-squares regression coefficients in
methodcomparison analysis. Clin Chem 1979; 25: 432-38.
- Zaydman L, Lasky FD, Van Nostrand C, Doptis PD. Recommended linear
regressin models for comparison of method in clinical Chemistry. Clin Chem 1991,
37: 960.

p g in a 1349

C a pt u l o 13

Bibliografa utilizada en el
curso (13)

-Frey E, Fuentes-Arderiu X, Queralt JM. Comparacin estadstica de mtodos


analticos. Educacin continuada Qumica Clnica. 1988; 1: 69-79.
-Lpez, F. Utilizacin adecuada de las pruebas estadsticas en los estudios
de comparacin de procedimientos. Quim Clin 2000; 19: 237.
-Westgard JO, Hunt MR. Use and interpretation of common statistical test in
method- comparison studies. Clin Chem 1973; 19: 44-57.
-Bland JM, Altman DG. Statistical methods for assesing agreement between two
methods of clinical measurement. Lancet 1986; 1: 307-310.
- Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el
anlisis
de concordancia para variables numricas. Cad Aten Primaria 2004.

p g in a 1350

C a pt u l o 13

Bibliografa utilizada en el
curso (14)

p g in a 1351

-Altman DG, Bland JM. Statistical methods for assessing agreement between two
methods of clinical measurement. The lancet 1986; 307-10.
-Altman DG, Bland JM. Measurement in medicine: the analysis of method comparison
studies. The Statistician 1983; 32, 307-317.
-Lpez, F. Utilizacin adecuada de las pruebas estadsticas en los estudios
de comparacin de procedimientos. Quim Clin 2000; 19: 237.
- Prtegas Daz S , Pita Fernndez S. Determinacin del tamao muestral
para calcular
la significacin del coeficiente de correlacin lineal. Cad Aten Primaria 2001;
9: 209-211.
-Jacobo Daz Portillo .Influencia del grupo tnico en el patrn lipoproteico de una
determinada poblacin peditrica de Ceuta, Tesis doctoral (1997). Facultad de
Medicina de la Universidad de Cdiz.

C a pt u l o 13

Bibliografa utilizada en el curso


(15)

p g in a 1352

-Albert A, Harris EK. Multivariate interpretation of clinical laboratory data. New


York: Marcel Dekker; 1987.
- Saez M. El problema de las medidas repetidas. Anlisis longitudinal en
epidemiologa.
Gac Sanit 2001;15(4):347-352.
-F. Lpez Azorn. La necesidad de mejores evaluaciones metodolgicas y nuestra
exigencia ante los criterios de aceptabilidad de los resultados. Qumica Clnica 2003;
22 (6) 431-432.
- Snchez-Cantalejo Ramrez E. Regresin logstica en salud pblica. EASP 2000.
- Silva Ayaguer LC. Excursin a la regresin logstica en ciencias de la salud.
Madrid: Daz de Santos, 1995.
- Hernndez Aguado I, Porta Serra M, Miralles M, Garca Benavides F, Bolmar F. La
cuantificacin de la variabilidad en las observaciones clnicas. Med Clin (Barc) 1990;
95: 424- 429.

C a pt u l o 13

Bibliografa utilizada en el
curso (16)

p g in a 1353

-Prtegas Daz S, Pita Fernndez S. Representacin grfica en el anlisis de datos.


Cad Aten Primaria 2001; 8: 112-117.
-Lpez de Ullibarri Galparsoro I, Pita Fernndez S. Medidas de concordancia: el
ndice Kappa. Cad Aten Primaria 1999; 6: 169-171.
-Prieto L, Lamarca R, Casado A. La evaluacin de la fiabilidad en las
observaciones clnicas: el coeficiente de correlacin intraclase. Med Clin 1998:
110(4): 142-145.
- Argimon JM. El intervalo de confianza: algo ms que un valor de significacin
estadstica. Med Clin (Barc) 2002;118(10):382-4.
- Argimon JM. La ausencia de significacin estadstica en un ensayo clnico no
significa
equivalencia teraputica. Med Clin (Barc) 2002;118(18):701-3.
-Ramalle-Gmara E, Andrs de Llano JM. Utilizacin de mtodos robustos en la
estadstica inferencial. Aten Primaria 2003;32(3):177-82.
-Cobo E. Anlisis multivariante en investigacin biomdica: criterios para la inclusin de
variables. Med Clin (Barc) 2002;119(6):230-237.

Gua Prctica del


Curso de Bioestadstica
Aplicada
a las C iencias de la
Salud
D r. Jacobo D az Portillo

Coordinador de Formacin Continuada


Hospital Universitario de Ceuta

Edita: Instituto Nacional de Gestin Sanitaria


Subdireccin General de Gestin Econmica y Recursos Humanos
Servicio de Recursos Documentales y Apoyo Institucional
Alcal, 56 28014 Madrid
El copyright y otros derechos de propiedad intelectual pertenecen
al Instituto Nacional de Gestin Sanitaria.
Se autoriza la reproduccin total o parcial para uso no comercial,
siempre que se cite explcitamente su procedencia.
Depsito Legal: M-33564-2011
NIPO: 865-11-010-6
Coleccin Editorial de
Publicaciones del INGESA:
1.921

Gua Prctica del


Curso de
Bioestadstica Aplicada
a las Ciencias de la
Salud
D r. Jacobo Daz
Portillo

You might also like