You are on page 1of 31

:aptulo 2)

en compa:3 000 pancipal fue nfarto del

3
Resumen y presentacin de datos en cuadros y figuras

a relacin hormonal coronaria tudio fueginalmen000 mucon edad rciona inoria famitura, peso, ial posme.ocardio o altas conTuimienos. para exaignos fsi-igidez de al de 297 se realiz raron con

CONCEPTOS CLAVE

le

Todas las observaciones de sujetos en un estudio se evalan en una escala de mediciones que determina cmo deben resumirse, analizarse y presentarse las observaciones.

Los histogramas, los grficos de caja, y los polgonos de frecuencia muestran distribuciones de observaciones numricas. Las proporciones y porcentajes se usan para resumir los datos nominales y ordinales. Las frecuencias describen el nmero de eventos que ocurren en un periodo determinado.

11Qr 2 Las escalas nominales se usan para categorizar las ca, ractersticas aisladas.

del incres frecuenm los paco nacioDrmacin tes y morrelacion tras com-

s Las escalas ordinales categorizan caractersticas que tie19 nen un orden inherente.
Las escalas numricas miden la cantidad de algo. 11 La media mide la mitad de la distribucin de una caracterstica numrica. La mediana mide la mitad de la distribucin de una caracterstica ordinal o una caracterstica numrica que estn sesgadas.

15 La prevalencia y la incidencia son dos mediciones importantes ,. /Q '. de morbilidad. Las frecuencias deben ajustarse cuando las poblaciones que son comparadas difieren en un factor de confusin importante. La relacin entre dos caractersticas numricas se describe por la correlacin. La relacin entre dos caractersticas nominales se describe por la proporcin de riesgo, razn de momios y tasa de eventos. El nmero necesario para tratar es una indicacin til de la eficacia de una terapia determinada o procedimiento. } Las grficas de dispersin ilustran la relacin entre dos careery 2(j \ teristicas numricas.

acia de la nizaje en Pulmonar. tempralmon ar y

c 7 . La desviacin estndar es una medida de la extensin de \ ,, las observaciones mostradas alrededor de la media y se
usa en muchos procedimientos estadsticos. !coeficiente de variacin es una medida de extensin g El relativa que permite la comparacin de observaciones Q medidas en diferentes escalas.

igredienicir dao alicilatos r. Cmo de estos ates cau-

. un tema ridos en inen cuicidir cul ar la Ares invest; estaban s en este a el disea misma

9 .1(Q

g . Los percentiles son tiles para comparar una observacin ii !., El e . diseo deficiente de g ticos y tablas proporcionan informaindividual con una norma. cin errnea. Los programas de cmputo son esenciales en la investigacin hoy en da, y la destreza para utilizarlos e interpretarlos puede ser muy til.

10 ` Los grficos tronco y hoja son una combinacin de tablas de frecuencia e histogramas que son tiles explorando la s distribucin de un conjunto de observaciones. Las tablas de frecuencia muestran el nmero de observaciones que tienen una caracterstica especfica.

21

22 Bioestadis "ca mdica

(Captulo 3)

0 1

PLANTEAMIENTO DE. PRO

de un ao. Los resultados se incluyen en la seccin Exposicin de datos numricos en cuadros y grficos.

La fetal

Planteamiento de problema 3 Planteamiento de problema 1


La embolia pulmonar (EP) es una causa importante de morbilidad y mortalidad. Las manifestaciones clnicas son inespecf ices y un diagnstico certero a menudo es difcil de realizar. Se han realizado esfuerzos por simplificar y mejorar el proceso diagnstico evaluando a los pacientes con posible EP mediante dos componentes: la determinacin de probabilidad por preprueba y la prueba del dmero D. La probabilidad por preprueba se determina con el desarrollo de criterios explcitos para determinar la probabilidad clnica de EP. La prueba del dmero D mide la formacin de dmero D cuando las redes de fibrina en el trombo son destruidas por medio de la plasmina. Puede usarse un elevado nivel de dmero D para descubrir trombosis venosa profunda (TVP) y EP. Algunas pruebas de dmero D son muy sensibles para TVP, y puede usarse un resultado normal para descartar el tromboembolismo venoso. Kline et al. (2002) decidieron desarrollar un conjunto de criterios clnicos que definira un subgrupo de pacientes con una probabilidad por preprueba de EP mayor a 40% (grupo de alto riesgo). Estos pacientes tendran un riesgo tan elevado de experimentar EP como para excluir el diagnstico con base en la comprobacin del dmero D. Sin embargo, pacientes con una probabilidad por preprueba ms baja (grupo de bajo riesgo), en quienes un resultado normal podra ayudar a excluir el diagnstico de EP, podran ser los candidatos ideales para la comprobacin con el dmero D. Los datos se obtuvieron de 934 pacientes con sospecha de EP en siete servicios de urgencias urbanos en EUA. Los investigadores midieron varios factores de riesgo potenciales para EP, y se observaron algunos atributos bsicos de las observaciones en este captulo. En la seccin Clculo de las medidas de tendencia central se presenta una muestra aleatoria de observaciones sobre el ndice de choque en 18 pacientes. Un estudio extenso en una clnica de atencin primaria encontr que 1 de cada 20 mujeres haba experimentado violencia domstica en el ao anterior, y 1 de 4 la haba experimentado alguna vez durante su vida adulta. Los nios de hogares violentos a menudo sufren problemas conductuales, emocionales y de salud fsica, ya sea porque fueron vctimas de abuso o porque presenciaron el abuso de su madre. Los pediatras tienen una oportunidad nica de descubrir a estas madres porque las mujeres golpeadas o vctimas de violencia domstica suelen requerir ms cuidados mdicos para sus nios que para ellas mismas. Lapidus et al. (2002) en el Connecticut Children S Medical Center dirigieron un estudio para evaluar la educacin e instruccin sobre violencia domstica y la deteccin de sta entre una muestra ampliamente representativa de pediatras y mdicos familiares. Ellos enviaron por correo las encuestas que se administraron a 903 mdicos identificados como miembros activos de la American Academy of Pediatrics y la American Academy of Family Physicians. La encuesta solicit informacin sobre la comunidad demogrfica del mdico y problemas relacionados con violencia domstica. sta se defini como "el dao pasado o actual fsico, sexual, emocional o verbal a una mujer causado por su esposo, pareja o algn miembro de la familia. En total, 49% de los mdicos respondieron el estudio despus de tres envos. Los autores observaron la distribucin de las respuestas y calcularon algunas mediciones de factores predictivos. Este estudio se volver a analizar en el captulo sobre investigacin con encuestas. En este captulo se ilustran las tablas de frecuencias y razn de momios calculadas por estos investigadores.

centra dios ti Ye ba rerele

Planteamiento de problema 4
El factor VIII es uno de los procoagulantes de la va intrnseca de la coagulacin. La hemofilia A, enfermedad que afecta a 1 de cada 10 000 varones, es un trastorno hemorrgico hereditario caracterizado por la presencia de un factor VIII deficiente o defectuoso. La hemofilia adquirida es un trastorno hemorrgico ms raro, el cual afecta a una persona por cada milln cada ao y se caracteriza por el desarrollo espontneo de autoanticuerpos dirigidos contra el factor VIII. Es comn que los pacientes presenten equimosis, hematomas, hematuria o neuropata por compresin. Las complicaciones hemorrgicas son letales en 14 a 22% de los enfermos. Con frecuencia se acompaa de otras enfermedades como padecimientos autoinmunitarios y neoplasias. No se ha establecido el tratamiento ptimo, y en vista de que la enfermedad es poco frecuente, no se han efectuado ensayos controlados aleatorios. Se realiz un estudio retrospectivo en 34 pacientes con hemofilia adquirida ocasionada por inhibidores del factor VIII, junto con una extensa revisin de la bibliografa para aclarar las caractersticas clnicas del padecimiento y planear un estudio prospectivo para obtener el tratamiento ptimo (Bossi et al., 1998). La informacin del estudio se presenta en la seccin cuadros y grficas para datos nominales y ordinales. Los investigadores desean resumir los datos de algunos de los factores de riesgo para varones y mujeres por separado.

con

Planteamiento de problema 2
El envejecimiento de la generacin baby-boomers est provocando importantes cambios demogrficos en la poblacin, con grandes implicaciones para los planificadores de los cuidados de la salud. En EUA se espera en los prximos 30 aos un gran aumento de la proporcin de personas mayores de 75 aos. Con el envejecimiento de la poblacin, la declinacin funcional en consecuencia por la discapacidad y morbilidad es un gran reto para los sistemas de salud. Beben et al. (1997) disearon un estudio para medir la discapacidad y los cambios funcionales en una poblacin mayor de 75 aos de edad de una comunidad en un periodo de dos aos. La poblacin de estudio fue de 655 residentes de una comunidad en Quebec, Canad. Cada persona fue entrevistada en su hogar por una enfermera. Se aplic el Functional Autonomy Measurement System (SMAF), que es una escala de calificacin de 29 reactivos que mide la discapacidad funcional en cinco reas junto con un cuestionario para medir salud, funcin cognitiva y depresin. A cada sujeto se le repiti la entrevista 1 y 2 aos despus por la misma enfermera. La escala SMAF califica cada reactivo con una escala de 4 puntos, en la cual O es independiente y 3 es dependiente. La declinacin funcional se defini por el incremento de 5 puntos o ms en el cuestionario, la mejora como la disminucin de 5 puntos o ms y la estabilidad como todo cambio entre 4. (El anlisis final incluy a 572 sujetos, 504 de ellos completaron ambas entrevistas y 68 murieron durante el estudio.) Los autores quisieron resumir los datos y calcular la declinacin en estado funcional. Tambin quisieron explorar la relacin entre los cambios en las calificaciones en los dos periodos

rept* en

Sin ad por en to

estn 1 e evel

Planteamiento de problema 5
El parto prematuro, sobre todo si es antes de la semana 32 de gestacin, se acompaa de una elevada incidencia de sndrome de insuficiencia respiratoria del recin nacido y una forma de enfermedad pulmonar crnica conocida como displasia broncopulmonar. Dicha enfermedad pulmonar es la principal causa de morbilidad y mortalidad en recin nacidos.

tipos mejc usa para il

ca

a< Como

a may

aptulo 3)

Resumen y presentacin de datos en cuadros y figuras 23

Exposi-

encontiolencia sentado tres vioiocionaabuso o tras tieres pormstica pe para

Medical n e ins1sta eniatras y ziuestas ) miemcs y la solicit o y prodefini ll o ver] miemndieron ,aron la tediciomalizar iste canomios

rnseca teta a 1 heredificiente irrgico n cada leo de n que ituria o 'gicas -ida se tientos

Las hormonas tiroideas estimulan el desarrollo pulmonar fetal en animales. Una reducida cantidad de estas hormonas pasan de la madre al feto, pero cuando se administra hormona liberadora de tirotropina (TRH) a la madre, se aumenta la concentracin srica de hormona tiroidea en el feto. Varios estudios han demostrado que la administracin prenatal de TRH reduce la incidencia y gravedad del sndrome de insuficiencia respiratoria, de enfermedad pulmonar crnica y de muerte en estos productos de alto riesgo. Otros dos estudios no mostraron que la TRH produjera algn beneficio. Ballard et al. (1998) quisieron revalorar la eficacia y la seguridad de la administracin prenatal de TRH para mejorar el desenlace pulmonar en lactantes prematuros. Casi todos los estudios anteriores incluan pocos pacientes y eran abiertos. Tambin, los cambios en la atencin prenatal que aparecieron en decenios pasados, en particular el uso del factor surfactante, mejoraron la posibilidad de supervivencia de los prematuros. El estudio reclut 996 mujeres con embarazo de al menos 24 semanas, pero de menos de 30 semanas en trabajo de parto activo para un estudio al azar, doble ciego, de TRH prenatal controlado con placebo. A las mujeres que se les dio el tratamiento activo se les administraron cuatro dosis de 400 pg de TRH por va IV en intervalos de 8 h; el placebo consisti en Solucin salina normal. En ambos grupos se les di glucocorlicoides; a los recin nacidos se les administr surfactante cuando hubo indicacin clnica. Hubo 1 134 nacidos vivos (844 productos nicos y 290 productos mltiples) y 11 mortinatos. Los recin nacidos de 32 semanas de gestacin o menos fueron considerados como el grupo de riesgo para la enfermedad pulmonar; los nacidos despus de la semana 33 de gestacin no estuvieron en tal riesgo. El desenlace incluy la muerte del producto el da 28 de nacimiento, antes de este da o despus del parto; la enfermedad pulmonar crnica definida como la necesidad de oxgeno durante 21 de los primeros 28 das de vida, y el desarrollo del sndrome de insuficiencia respiratoria, definido como la necesidad de oxgeno ventilacin asistida o hallazgos radiolgicos. Los autores quisieron investigar el riesgo de desarrollar estos resultados en el grupo de TRH comparado con el grupo de placebo. Los resultados seleccionados en el estudio se presentan en la seccin Nmero necesario para tratar.

lizar datos. De hecho, este captulo y lo siguientes contienen numerosas ilustraciones de algunos programas estadsticos de computadoras usados comnmente; incluyendo el NCSS.

ESCALAS DE MEDICIN
La escala para medir una caracterstica tiene implicaciones en la forma de presentar y resumir la informacin. Como se ver en los captulos siguientes, la escala de medicin precisin con la que se mide una caracterstica tambin determina el mtodo estadstico escogido para analizar los datos. Las tres escalas de medicin ms usadas en la medicina son: nominal, ordinal y numrica.

Escalas nominales
Las escalas nominales se usan para el nivel ms simple de medicin, cuando los valores de los datos caen en categoras. Por ejemplo, en el Planteamiento del problema 5, Ballard et al. (1998) emplean la siguiente caracterstica nominal para describir el resultado de los neonatos tratados con TRH prenatal: desarrollo de sndrome de insuficiencia respiratoria. En este ejemplo, las observaciones son dicotmicas o binarias porque el resultado se basa slo en uno de dos valores: s o no. Aunque se habla de un dato nominal como perteneciente a una escala de medicin, de hecho no se miden datos nominales, en su lugar se cuenta el nmero de observaciones con o sin el atributo de inters. Muchas clasificaciones de la investigacin mdica se evalan en escala nominal. Por lo general, el resultado de un tratamiento mdico o un procedimiento quirrgico, as como la presencia de factores de riesgo o exposicin posibles, se describen como ocurrentes o no ocurrentes. Los resultados tambin pueden describirse con ms de dos categoras, como en la clasificacin de las anemias en microctica (incluida la ferropnica), macroctica o megaloblstica (incluida la que produce la deficiencia de vitamina By) y normoctica (a menudo relacionada con enfermedades crnicas). Los datos evaluados en escala nominal en ocasiones suelen llamarse observaciones cualitativas porque describen una calidad de la persona o cosa estudiada, u observaciones categricas, si los valores caen en categoras. En general, los datos nominales o cualitativos se describen en trminos de porcentajes o proporciones. Por ejemplo, en el estudio de pacientes con hemofilia adquirida (Bossi et al. 1998), 38% de los pacientes tuvo hematuria. A menudo se utilizan las tablas de contingencia y las grficas de barras para mostrar este tipo de informacin, la cual se presenta en cuadros y grficas para datos nominales y ordinales.

PROPSITO DEL CAPTULO


Este captulo presenta los diferentes tipos de datos obtenidos en la investigacin mdica y muestra la forma tanto de organizarlos como de presentarlos en forma de resumen. Sin importar el tipo de investigacin realizada, los investigadores obtienen las observaciones y, en general, optan por transformarlas en cuadros o grficas, o en forma de nmeros resumidos como porcentajes o medias. Desde un punto de vista estadstico, no importa si las observaciones estn hechas en humanos, animales, objetos inanimados o eventos, lo que importa es el tipo de observacin realizada y la escala con la que se mida. Estas caractersticas determinan el mtodo estadstico a emplear para resumir los datos, llamados mtodos estadsticos descriptivos, y los tipos de cuadros o grficas que muestren y comuniquen mejor las observaciones. Se usarn los datos de los planteamientos de problemas para ilustrar los pasos implicados en los clculos y las estadsticas porque se cree que el hecho de ver esos pasos ayudar a entender los procedimientos. Como se enfatiza en este libro, sin embargo, se espera que la mayora de la gente use una computadora para ana-

de que nsayos tivo en )jdores ografa ) y plaptimo a en la linales. de los

32 de tandroforma iplasia incipal

Escalas ordinales
Cuando ocurre un orden inherente dentro de las categoras, se dice que las observaciones se miden en una escala ordinal. Las observaciones tambin se clasifican, como en

24 Bioestadistica mdica

(Captulo 3)

las escalas nominales, pero algunas observaciones son ms o mayores que otras. A menudo, los mdicos emplean escalas ordinales para determinar la cantidad de riesgo de un paciente o el tipo apropiado de tratamiento, por ejemplo, los tumores se clasifican segn su grado de desarrollo. La clasificacin internacional del carcinoma del crvix es una escala ordinal de 0 a 4, en la cual la etapa O representa carcinoma in situ y la etapa 4 seala carcinoma que se extiende ms all de la pelvis o afecta a las mucosas de vejiga y recto. Resulta obvio que el orden inherente a esta escala ordinal ser que el pronstico para la etapa 4 es peor que para la etapa 0. A veces las clasificaciones basadas en la extensin de la enfermedad se apoyan en el grado de actividad del paciente; por ejemplo, la artritis reumatoide se clasifica se' gn la gravedad de la enfermedad en cuatro clases, que van desde la actividad normal (clase 1] a ser dependiente de silla de ruedas (clase 4). Usando el Functional Autonomy Measurement desarrollado por la Organizacin Mundial de la Salud (OMS), Hbert et al. (1997) estudiaron la actividad funcional de ancianos que vivan en la comunidad. Aunque existe cierto orden entre las categoras en las escalas ordinales, la diferencia entre dos categoras adyacentes no es la misma en toda la escala. Como ejemplo, considrese la escala de Apgar, el cual califica la madurez de los recin nacidos en puntos de O a 10, en ella la calificacin ms baja indica depresin del funcionamiento cardiorrespiratorio y neurolgico, mientras que la ms alta representa una buena funcin cardiorrespiratoria y neurolgica. Es probable que la diferencia entre las calificaciones 8 y 9 no sea de la misma magnitud que la diferencia entre O y 1. Algunas escalas consisten en calificaciones de mltiples factores que luego se aaden para lograr un ndice total. Un ndice utilizado con frecuencia para calcular el riesgo cardiaco en procedimientos quirrgicos no cardiacos fue creado por Goldman eral. (1977, 1995). Este ndice asigna una puntuacin a una serie de factores como mayores de 70 aos de edad, antecedente de infarto del miocardio en los ltimos seis meses, alteraciones especficas en el electrocardiograma y estado fsico general.. Los puntos se suman para obtener una calificacin total en el ndice de Goldman, el cual va de O a 53, y se usa para indicar el riesgo de complicaciones o muerte segn las distintas calificaciones. Un tipo especial de escala ordenada es la escala de orden por rango, en ella las observaciones se clasifican por rango, desde el ms alto al ms bajo (o viceversa). Por ejemplo, los mdicos pueden encaminar sus programas educativos a las pacientes obsttricas segn el rango de las causas de peso bajo al nacer, por ejemplo, desnutricin, abuso de drogas y atencin prenatal inadecuada. La duracin de los procedimientos quirrgicos puede convertirse a una escala de rangos para obtener una medida de la dificultad del procedimiento. Al igual que con las escalas nominales, es comn el uso de porcentajes y proporciones en las escalas ordinales. A veces, el grupo de datos medidos en una escala ordinal se resume en un valor medio, y se comentar la forma de sacar medias, adems de lo que significan. Las escalas ordinales con un gran nmero de valores algunas veces se

tratan como si stos fueran numricos (vase la siguiente seccin). Los mismos tipos de cuadros y grficas empleados para mostrar los datos nominales tambin pueden usarse para los ordinales.

dio poi datos p

Med i c

Escalas numricas
A las observaciones por las cuales las diferencias entre nmeros tienen significado en una escala numrica se les denomina observaciones cuantitativas, porque miden la cantidad de algo. Existen dos tipos de escalas numricas: de intervalo* o continuas, y discretas. Una escala continua tiene valores en una fase continua (p. ej., edad), una escala discreta tiene valores iguales en los nmeros enteros (p. ej., nmero de fracturas). Si no es necesario que los datos sean tan precisos, los datos continuos pueden redondearse hasta el nmero entero ms cercano, sin embargo, en teora es posible hacer mediciones ms precisas. La edad es una medida continua y, por lo general, basta aproximar la edad hasta el ao ms cercano en estudios de adultos, pero en nios pequeos se prefiere aproximar la edad al mes ms cercano. Otros ejemplos de datos continuos son peso, talla, tiempo de supervivencia, grado de movilidad articular, as como muchos datos de laboratorio. Cuando una observacin numrica se hace slo en valores enteros, la escala de medicin es discreta. Por ejemplo, los conteos de eventos nmero de embarazos, cirugas previas, factores de riesgo son medidas discretas. En el estudio de Kline et al. (2002) se evaluaron varias caractersticas de los pacientes, incluyendo ndice de choque y EP. La primera caracterstica se mide en una escala numrica continua debido a que puede tomar un solo valor individual dentro del lmite posible de valores. La presencia de EP tiene una escala nominal con slo dos valores: presencia o ausencia. En el estudio de Ballard et al. (1998), el nmero de recin nacidos que present sndrome de insuficiencia respiratoria es un ejemplo de una escala numrica discreta. Con frecuencia, las caractersticas medidas en una escala numrica se muestran en una variedad de cuadros grficas. Por lo general, se usan medias y desviaciones estndar para resumir los valores de las mediciones numricas. A continuacin se explican las formas de resumir y presentar los datos numricos para despus regresar al tema de datos ordinales y nominales.

Uno de del cen valor n central media, emplea bin se

Clcu

Media

Aunqu

Se le st sigue: a luego c La (letra g individ El presin tientes (Kline torias e pacieni

RESUMEN DE DATOS NUMRICOS CON NMEROS


Cuando un investigador obtiene muchas observaciones, como el ndice de choque o la presin arterial en el estaAlgunos especialistas en estadstica diferencian las escalas de intervalo (con un punto cero arbitrario] de las escalas de propon cin (con un punto absoluto], por ejemplo, la temperatura en escala Celsius (intervalo) y la temperatura en una escala Kelvin (proporcin). Sin embargo, hay poca diferencia en la forma del trato estadstico que se da a estas escalas, por tanto, slo las llamamos numricas.

aptu/o 3)

Resumen y presentacin de datos en cuadros y figuras 25

sigui ente empleaden usar-

dio por Kline et al. (2002), los nmeros que resumen los datos pueden proporcionar mucha informacin.

Medicin de la media
Uno de los nmeros resumidos ms tiles es un indicador del centro de una distribucin de datos, el cual habla del valor medio o promedio. Las tres medidas de tendencia central ms utilizadas en medicina y epidemiologa son la media, la mediana y en menor grado, la moda. Las tres se emplean para datos numricos, pero las dos ltimas tambin se pueden utilizar en datos ordinales.

ias entre :ica se les miden la imricas: continua una escalteros (p.

Clculo de las medidas de tendencia central


Media

cisos, los mero enale hacer continua ao ms [ueos se ros ejemle supermuchos

slo en 'or ejemr,os, ciru,cretas. aron vandice de en una omar un valores. slo dos , allard et mur) sna de una

Aunque es posible calcular varias medias con mtodos matemticos, la media aritmtica es la ms usada en estadstica, se le conoce como "media". La media es el promedio aritmtico de las observaciones. Se le simboliza con X (llamada X barra) y se calcula como sigue: agregar las observaciones para obtener la suma y luego dividir la suma entre el nmero de observaciones. La frmula de la media se escribe E X/n, donde (letra griega sigma) significa sumar, X representa los datos individuales y n es el nmero total de datos. El cuadro 3-1 muestra el valor del ndice de choque, presin arterial sistlica, y frecuencia cardiaca de 18 pacientes seleccionados al azar en el estudio del dmero D (Kline et al., 2002). (Usted conocer sobre pruebas aleatorias en el captulo 4.) El ndice de choque para estos 18 pacientes es:
X EX _ 0.61 +0.56+...+0.44 18 n . 12.41 = 0.689 18

La media se usa cuando se pueden sumar los nmeros (es decir, cuando se miden las caractersticas en una escala numrica), no debe emplearse con datos ordinales debido a la naturaleza arbitraria de la escala ordinal. La media es sensible a valores extremos en un grupo de datos, sobre todo cuando el tamao de la muestra es pequeo. Por ejemplo, el valor 1 .30 para los sujetos 15, es relativamente grande comparado con los valores de los otros sujetos de este grupo. Si no estuvieran estos valores, la media sera 0.612 en vez de 0.689. Si no estuvieran disponibles los datos originales, la media puede calcularse a partir de una tabla de frecuencia. El promedio cargado se obtiene multiplicando el valor de cada dato por el nmero de observaciones que tiene ese valor, se aaden los productos y se divide la suma entre el nmero total de datos. En el cuadro 3-2 se presenta una muestra tabla de frecuencia de las observaciones del ndice de choque que se puede usar para calcular el ndice de choque medio de la frecuencia cardiaca para todos los sujetos del estudio en quienes se haya registrado la medicin. El clculo del promedio cargado de la media usando el nmero de personas y de los puntos medios de cada intervalo es:
10.35
x

38) + (0.45 x 104) + 931 = 642.75 0 691 931

+ (1.25 x 19)

El valor de la media calculado a partir de una tabla de frecuencia no siempre es la misma que el obtenido con los nmeros reales. En este ejemplo, la media del ndice de choque calculada de los nmeros reales y la tabla de frecuencias son muy semejantes. Los investigadores que calculan la media para presentar un trabajo o dar una conferencia deben tener las observaciones originales y emplear la frmula exacta. Es til usar la frmula con una tabla de frecuencias cuando, como lectores de un artculo,

i una esaadros y iaciones mes noresumir gresar al 1

Cuadro 3-1. ndice de choque para una muestra aleatoria de 18 pacientes


Nm. de pacientes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 ndice de choque 0.61 0.56 0.52 0.33 0.45 0.74 0.73 0.92 0.42 0.63 0.55 0.50 0.75 0.82 1.30 1.29 0.85 0.44 Presin arterial sistlica 139 151 201 170 123 121 119 100 164 161 164 138 118 130 109 92 126 139 Frecuertia cardiaca 85 84 104 56 55 90 87 92 69 102 69 89 106 142 119 107 61

z
C) (,)

1 <C 22i 17t h= -1;7 52 C2[ bias >

aciones, el estu-

scalas de proporperatura tna escaicia en la or tanto,

Fuente: Datos usados con autorizacin de los autores y editores, Kline JA, Nelson RD, Jackson RE, Cour ney DM; Criteria for the safe use of D-dimer testing in emergency department patients with suspected pulmonary embolism: A multicenter US study. Ann Emergency Med 2002;39:144-152. Cuadro producido con el NCSS; usado con autorizacin. The American College of Emergency Physicians.

26 Bioestadstwa mdica
indice de choque en intervalos de 10 puntos

(Captulo 3)

ndice de choque

Cuenta

4.08 38 0.40 = o menos 11.16 104 0.40 hasta 0 50 21.24 198 0.50 hasta 0.60 21.35 199 0.60 hasta 0 70 16.63 155 0.70 hasta 0 80 10.94 102 0.80 hasta 0 90 6.44 60 0.90 hasta 1.00 3.97 37 1.00 hasta 1.10 2.04 19 1.10 hasta 1.20 2.15 19 1.20 = o ms Fuente: datos utilizados con autorizacin de los auto es y el editor, Kline JA, Nelson __ , Jackson Ann Emergency Med
emergency department patients with suspected pulmonary embolism: A multicenter US study. NCSS; usado con autorizacin. The American College of Emergency Physicians.

Cuenta acumulada 38 142 340 539 694 796 856 893 912 932

Porcentaje

Porcentaje acumulado 4.08 1524 36.48 57.83 74.46 85.41 91.85 95.82 97.85 100.00

Grfica nt dee porceaj / //// //////// //////// ////// //// // / / /

dos d distri 1 ' form 1.

2.

3.

2002;39:144-152. Cuadro producido con el

no se tiene acceso a los datos reales, pero se quieren calcular a partir de la media. Mediana La mediana es la observacin media, es decir, el punto a partir del cual la mitad de los datos son menores y la otra mitad mayores. Su smbolo es M o Md, aunque no es un smbolo convencional. El procedimiento para calcular la mediana es el siguiente: 1. Disponer los datos desde el menor hasta el mayor (o viceversa) 2. Contar hasta encontrar el valor medio. La mediana es el valor medio para un nmero impar de observaciones; se define como la media de los dos valores medios para un nmero impar de observaciones. Por ejemplo, en orden (del menor al mayor), los valores en el ndice de choque en el cuadro 3-1 son los siguientes: 0.33, 0.42, 0.44, 0.45, 0.50, 0.52, 0.52, 0.55, 0.53, 0.61, 0.63, 0.73, 0.74, 0.75, 0.82, 0.85, 0.92, 1.29, 1.30 Para 18 observaciones, la mediana es la media entre el noveno y el dcimo valor (0.61 y 0.63) o 0.62. La mediana dice que la mitad de los valores de la variacin en la frecuencia cardiaca de este grupo de personas es inferior a 0.62, y la otra mitad es superior a ese valor. Ms adelante, en este captulo; se explicar cmo la media es una medida fcil de determinar a partir de un grfico de tronco y hojas de los datos. La mediana es menos sensible a valores extremos que la media, por ejemplo, si la observacin mayor 1.30 se eliminara de la muestra, la mediana sera el valor medio, 0.61. La mediana tambin se usa con observaciones ordinales. Moda La moda es el valor que se presenta con mayor frecuencia. Se usa, por lo general, con grandes cantidades de datos cuando el investigador desea designar el valor que ms se repite. Ninguno de los resultados se presenta con mucha frecuencia en los datos de la frecuencia cardiaca del cuadro 3-1. Cuando un grupo de datos tiene dos modas, se llama bimodal. Para tablas de frecuencia o pequeas can-

tidades, la moda se calcula a partir de la clase modal, que es el intervalo entre el nmero mayor de los resultados. En el caso de los datos del ndice de choque del cuadro 3-2, la clase modal es 0.60 a 0.69 con 199 pacientes.

En u: ciom et al. da d. bleci< slo I

ts te

maci qu 1 Media geomtrica Otra medida de tendencia central que no se usa con la misma frecuencia como la media aritmtica o la mediana 1. es la media geomtrica, simbolizada como MG o G. Esta I se define como la raz n del producto de n observaciones. 2. En forma simblica, para n observaciones X1, X2, X3,..., 3. Xn, la media geomtrica es
17/(X1) (X2 ) ( X3 ) - ( XJ MG =,

4.

La media geomtrica generalmente se usa con datos medidos en una escala logartmica, como la dilucin de la vacuna de la varicela estudiada por Frey et al. (2002), un planteamiento de problema del captulo 5. Tomando el logaritmo de ambos lados de la ecuacin precedente, se observa que el logaritmo de la media geomtrica es igual a la media de los logaritmos de las observaciones.
log MG =
-

Med

log X

Supc elegi la mi prop bre 1 sona de lc

Uso de las medidas de tendencia central Cul es la mejor medida de tendencia central para un grupo particular de datos? Deben tomarse en cuenta dos factores importantes: la escala de la medicin (ordinal o numrica) y la forma de distribucin de los resultados. Aunque las distribuciones se comentan con mayor detalle en el captulo 4, puede considerarse en este captulo la nocin de si la distribucin es simtrica respecto a la media o si se carga a la izquierda o a la derecha de la meda. Si los resultados extremos se inclinan en una sola direccin -ya sea algunos valores menores o mayores- se dice que la distribucin es de tipo distribucin cargada. Si los valores extrnsecos son menores, la distribucin se cargar a la izquierda, en forma negativa, si stos son mayores, la distribucin se cargar a la derecha, en forma positiva. La distribucin simtrica es igual en ambos la-

Figur A) ca

Ttulo 3)

Resumen y presentacin de datos en cuadros y figuras 27

:a de ataje

dos de la media. En la figura 3-1 se presentan ejemplos de distribuciones de carga negativa, positiva y simtricas. Los siguientes puntos ayudarn al lector a conocer la ' forma de distribuir los datos sin tener que verla. 1.Si la media y la mediana son iguales, la distribucin de los resultados es simtrica, generalmente como en las figuras 3-1 C y 3ID. 2. Si la media es mayor que la mediana, la distribucin se carga a la derecha (figura 3-1 B) . 3. Si la media es menor que la mediana, la distribucin se carga a la izquierda (figura 3-1A). En un estudio acerca del incremento de la deuda educacional entre estudiantes de medicina canadienses, Kwong eta?. (2002) reportaron acerca del valor medio de la deuda de los estudiantes graduados. Los investigadores establecieron que usaban mejor la mediana en lugar de la media slo porque un nmero relativamente pequeo de estudiants tena deudas muy elevadas, esto caus una sobreestimacin de la media. Las siguientes guas ayudarn a decidir qu medida de tendencia central es la mejor. 1.La media se usa para datos numricos y distribuciones simtricas (no cargadas). 2. La mediana se utiliza para datos ordinales o para datos numricos si la distribucin est cargada. 3. La moda se utiliza principalmente para distribuciones bimodales. 4. La media geomtrica se usa generalmente para observaciones medidas en escala logartmica.

describir la dispersin de los datos variacin, desviacin estndar, coeficiente de variacin, percentiles e intercuartiles.

Clculo de las medidas de dispersin


Variacin

ar tesling in icido con el

La variacin es la diferencia entre el resultado mayor y menor. Es fcil de determinar cuando los datos se han dispuesto en orden, por ejemplo, el ndice de choque menor entre los 18 sujetos es 0.33 y el mayor es 1.30; por tanto, la variacin es 1.30 menos 0.33 o 0.97. Muchos autores dan los valores mnimo y mximo en lugar de la variacin, de alguna forma estos valores son ms tiles.
Desviacin estndar

dal, que ultados. Ldro 3-2,

a con la mediana G. sta aciones.

2, X3,,

'tos me5n de la )02), un 'ando el Lente, se es igual

Medidas de dispersin
Suponga que todo lo que se sabe acerca de los 18 sujetos elegidos al azar del Planteamiento de problema 1 es que la media del ndice de choque es 0.69. Aunque la media proporciona informacin til, se tiene una mejor idea so) bre la distribucin de los ndices de choque en estas personas, si se sabe algo acerca de la dispersin o variacin g de los resultados. Se han utilizado varias estadsticas para

para un !nta dos rdinal o ultados. detalle tulo la 1 la memedia sola di:es se argada. tcin se ;on maE forma ibos la-

Es la medida de dispersin ms utilizada en los daos mdicos y de salud. Aunque su significado y clculo son algo complejos, es muy importante porque se usa para describir la forma en que los resultado se agrupan alrededor de la media y en muchas pruebas estadsticas. Sin duda, el lector emplear una computadora para determinar esta medida, pero se presentan los pasos necesarios para calcularla manualmente, ya que permite entender mejor el significado de esta prueba estadstica. La desviacin estndar es una medida de la dispersin de los datos sobre su media. Mirando brevemente la lgica que subyace a esta estadstica, es necesario medir la dispersin "promedio" de las observaciones de la media. Por qu no encontrar la desviacin de cada observacin de la media, sumar estas desviaciones, y dividir la suma entre n para formar una analoga para la propia media? El problema es que la suma de las desviaciones sobre la media siempre es cero (vase Ejercicio 1) Por qu no usar los valores absolutos de las desviaciones? El valor absoluto de un nmero ignora el signo del nmero y se indica por las barras verticales a cada lado del nmero. Por ejemplo, el valor absoluto de 5, 151, es 5, y el valor absoluto de -5, 1- 51, tambin es 5. Si bien este mtodo evita el problema del cero en la suma, le faltan algunas propiedades estadsticas importantes, y por eso no es til. Por lo que entonces, las desviaciones se elevan al cuadrado antes de agregarlos, y se encuentra despus la raz cuadrada para expresar la desviacin estndar en la escala original de medida. La desviacin estndar se simboliza como DE, de, o simplemente e (en este texto se usa DE), y su frmula es
DE =

1
A

i(X - )02
n- 1

D Figura 3-1. Formas ms comunes de la distribucin de resultados. A) carga negativa. B) carga positiva. C y D) simtricas.

El nombre del mtodo estadstico antes de la raz cuadrada es varianza, pero la desviacin estndar es el mtodo de inters primario. Usar n 1 en vez de n en el denominador produce un clculo ms exacto de la desviacin estndar de la poblacin verdadera, y tiene propiedades matemticas deseables para hacer inferencias estadsticas.

28 Bioestadstica mdica

(Captulo 3)

La frmula anterior de la desviacin estndar, llamada frmula definitoria, no suele presentarse en los textos introductorios como la mejor para calcular el valor. En su lugar se emplea otra, la frmula computacional. Debido a que generalmente se usa la computadora para calcular la desviacin estndar, los ejemplos del libro usarn la frmula ms significativa para realizar los clculos, quiz sea la menos eficiente, desde el punto de vista computacional; la frmula computacional se muestra en el ejercicio 5. A continuacin se intentar hacer un clculo. Los resultados del ndice de choque de los 18 sujetos se repiten en el cuadro 3-3, en donde tambin se mencionan las necesidades computacionales. Ahora se dan los siguientes pasos: 1. Considerar X como el ndice de choque para cada persona encontrar la media: la media es 0.69 como ya se calcul. 2. Restar la media de cada observacin para formar las desviaciones X - media. 3. Elevar al cuadrado cada desviacin para formar (X media)2. 4. Sumar las desviaciones al cuadrado. 5. Dividir el resultado del paso 4 entre n- 1, se obtiene 0.071. Este valor es la varianza. 6. Tomar la raz cuadrada del valor en el paso 5 para encontrar la desviacin estndar; se tiene 0.267 o 0.27. (El valor real es 0.275 o 0.28; el resultado se debe al redondeo-sin error.)

Pero ntese las grandes desviaciones al cuadrado de 0.38 para los sujetos 15 del cuadro 3-3. Esto contribuye de manera sustancial a la variacin en los datos. La desviacin estndar de los restantes 17 individuos (despus de eliminar a los sujetos 15) es menor, 0.235, lo que demuestra el efecto que los resultados extremos pueden tener sobre el valor de la desviacin estndar.. La desviacin estndar, al igual que la media, requiere datos numricos, tambin es un dato estadstico muy importante. Primero, es parte esencial de muchas pruebas estadsticas, como se explicar en captulos posteriores. Segundo, la desviacin estndar es muy til para describir la dispersin de los resultados alrededor del valor medio. Las dos reglas siguientes son importantes cuando se usa la desviacin estndar:

cin 100' relat cien:

1. Sin importar cmo se distribuyan los datos, al menos 75% de los valores siempre quedan entre estos dos nmeros: la media menos 2 desviaciones estndar y la media ms 2 desviaciones estndar. En el ejemplo del ndice de choque la media es de 0.69 y la desviacin estndar de 0.28, por lo que al menos 75% qued , entre 0.69 2(0.28), o entre 0.13 y 1.25. En este ejemplo, 16 de 18 observaciones, u 89%, caen dentro de estos lmites. 2. Si la distribucin de los datos tiene forma de campana, con mayor razn se puede decir acerca del porcentaje de resultados que quedan entre la media y 2 desviaciones estndar. Para una distribucin en forma de campana, aproximadamente: 67% de las observaciones quedan entre la media 1 desviacin estndar 95% de los resultados quedan entre la media 2 desviaciones estndar 99.7% de las observaciones quedan entre la media _ 3 desviacioi les estndar La desviacin estndar junto con la media, pueden ayudar a determinar el sesgo cuando slo se dan resmenes estadsticos: si la media menos 2 DE contiene O (es decir, la media es menor que 2 DE), los datos probablemente sern sesgados.

De e 0.691 presi tantc choq presi' cient' de lal Perc

Cuadro 3-3. Clculo de la desviacin estndar del ndice de choque en una muestra aleatoria de 18 sujetos
Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Suma Media H X 0.61 0.56 0.52 0.33 0.45 0.74 0.73 0.92 0.42 0.63 0.55 0.50 0.75 0.82 1.30 1.29 0.85 0.44 12.41 0.69 , X -X -0.08 -0.13 -0.17 -0.36 -0.24 0.05 0.04 0.23 -0.27 -0.06 -0.14 -0.19 0.06 0.13 0.61 0.60 0.16 -0.25 (X - X)2 0.01 0.02 0.03 0.13 0.06 0.00 0.00 0.05 0.07 0.00 0.02 0.04 0.00 0.02 0.38 0.36 0.03 0.06 1.28

to fsi 36 m mese: en el de 21 ms valor del pa L valor e inte nes 1 variac deten los lim

cuand cin c

Fuente: datos usados con autorizacin de los autores y el editor, Kline JA, Nelson RD, Jackson RE, Courtney DM; Criteria for the safe use of o-dimer testing in emergency department patients with suspected pulmonary embolisma A multicenter lis study. Ann Emergency Med 2002;39:144-152. Cuadro producido con Microsoft Excel. The American College of Emergency Physicians.

Coeficiente de variacin Es una medida til de la dispersin relativa de los datos y ..,9 8 se emplea con frecuencia en ciencias biolgicas. Por 1 1 . ejemplo, supngase que Kline et al. (2002) quisieron comparar la variabilidad en el ndice de choque con la variabilidad en la presin arterial sistlica en las personas de su estudio. La media y la desviacin estndar del ndice de choque en la muestra total son 0.69 y 0.20; respectivamente; para la presin sistlica, 138 y 0.26, respectivamente. No tiene sentido comparar las desviaciones estndar debido a que el ndice de choque y la presin arterial se miden con escalas diferentes. El coeficiente de variacin ajusta las escalas de manera que pueda hacerse una comparacin sensible.

Variad Una rr es la v entre ] tercer( tiene E cin ir (figura 6.5 kg tare 6.5

Uso d decas Las sig minar ' a pan

L. La c deci

2aptulo 3)

Resumen y presentacin de datos en cuadros y figuras 29

lo de 0.38 tribuye de La desvialespus de e demuesden tener

El coeficiente de variacin se define como la desviacin estndar dividida entre la media y multiplicada por 100%. Produce una medida de variacin relativa que es relativa al tamao de la media. La frmula para el coeficiente de variacin es:
CV =D 7 (E(100%)

requiere ) muy iras pruebas anteriores. 1 describir or medio. o se usa la

De esta frmula, el CV para el ndice de choque es (0.20/ 0.69) (100%) = 29.0% y el coeficiente de variacin para la presin arterial sistlica es (26/138) (100%) = 18.8%. Por tanto, se concluye que la variacin relativa del ndice de choque es considerablemente mayor que la variacin en la presin arterial sistlica. Una aplicacin frecuente del coeficiente de variacin en el campo de la salud es en las pruebas de laboratorio y en los procedimientos de control de calidad.
Percentiles

2. Los percentiles y la variacin intercuartilar se utilizan en dos situaciones: a. Cuando se usa la media (p. ej., con datos ordinales o numricos cargados). b. Cuando se utiliza la media pero el objetivo es comparar las observaciones individuales con un grupo de valores normales. 3. La variacin intercuartilar se usa para describir 50% central de una distribucin, sin importar su forma. 4. La variacin se utiliza con datos numricos cuando el objetivo es destacar los valores extremos. 5. El coeficiente de variacin se utiliza cuando el objetivo es comparar distribuciones numricas medidas en escalas diferentes.
EXPOSICIN DE DATOS NUMRICOS EN CUADROS Y GRFICAS

al menos estos dos stndar y 1 ejemplo la desvia5% qued 1 tste ejemlentro de e campadel pormedia y ucin en edia 1 2 des-

Media 3

n ayudar les estadecir, la ente se-

El percentil es el porcentaje de una distribucin que es igual o menor a un nmero en particular; por ejemplo, considerar el diagrama del crecimiento fisico estndar para nias desde el nacimiento hasta los 36 meses de edad en la figura 3-2. Para las nias de 21 meses, percentil 95 de peso es de 12 kg, como se observa en el diagrama. Este percentil indica que 95% de las nias de 21 meses de edad pesan 12 kg o menos, y slo 5% pesa ms de 12 kg. El percentil 50 es, desde luego, el mismo valor que la mediana, para nias de 21 meses, la mediana del peso o percentil 50 es de unos 10.6 kg. Los percentiles a menudo se usan para comparar el valor de un individuo con el normal. Se utilizan para crear e interpretar diagramas de crecimiento fisico y mediciones de capacidad e inteligencia. Tambin determinan las variaciones normales de las cifras de laboratorio, stas se determinan en los percentiles 2.5 y 97.5, de tal modo que los lmites normales contienen 95% central de la distribucin. Esta tcnica fue empleada por Gelber et al. (1997) cuando desarrollaron los valores normales para la variacin cardiaca media a respiracin y el rango de Valsalva.
Variacin intercuartilar

Es conocido el refrn "ms vale una imagen que mil palabras", tambin es cierto que los investigadores del campo de la salud usan grficas y exposiciones ilustradas de los datos. Los datos numricos pueden presentarse de varias maneras, se utilizan los datos del estudio de Hbert et al. (1997) sobre la disminucin funcional de ancianos (Planteamiento de problema 2), para ilustrar algunos de los mtodos ms comunes. Los pacientes de este estudio tenan 75 aos de edad o ms. Se utiliza un subgrupo de los datos, 72 sujetos de 85 aos o ms que completaron el SMAF. En el cuadro 3-4 se presenta la calificacin total en el SMAF de estos sujetos en el ao 1 y 3, as como las diferencias en las calificaciones entre los aos 3 y 1.
Grfico de tronco y hojas

datos y icas. Por I quisiede choMica en stndar y 0.20; y 0.26, sviaciopresin I ente de hacerse

Una medida de variacin que permite el uso de percentiles 1 es la variacin intercuartilar, definida como la diferencia entre los percentiles 25 y 75, tambin llamadas primero y tercero cuartiles, respectivamente. La variacin intercuartilar tiene 50% central de los resultados. Por ejemplo, la variacin intercuartilar del peso de nias de 9 meses de edad (figura 3-2) es la diferencia entre 7.5 kg (percentil 75) y 6.5 kg (percentil 25), es decir, 50% de las nias pesan entre 6.5 y 7.5 kg a los nueve meses de edad.
Uso de las diferentes medidas de dispersin

Las siguientes guas ayudarn a los investigadores a determinar cul de las medidas de dispersin es la ms apropiada para un grupo determinado de datos. 1. La desviacin estndar se usa al emplear la media (es decir, con datos numricos simtricos).

Este grfico fue ideado en 1977 por Tukey, un estadstico interesado en formas significativas para comunicar imgenes. Es un medio conveniente de mostrar las observaciones, y puede usarse como una imagen directa de los datos o como un paso preliminar para construir una tabla de frecuencias. Los resultados del cuadro 3-4 muestran que muchas de las diferencias de las calificaciones totales son pequeas, pero tambin que algunas personas tienen varias calificaciones positivas que indican una disminucin grave de la funcin. Sin embargo, no es fcil entender los datos slo con mirar la lista de nmeros reales. El primer paso para organizar los datos en un grfico de tronco y hojas es decidir el nmero de subdivisiones, llamadas clases o intervalos (en general, deben ser entre 6 y 14; en la siguiente seccin se proporcionan ms detalles sobre esta decisin). Primero, se clasifican las observaciones de 5 en 5, de 9 a 5, 4 a 0, 1 a 5, 6 a 10, 11 a 15, 16 a 20, etc. Para formar un grfico de tronco y hojas, trazar una linea vertical y colocar los primeros cinco dgitos de cada clase llamados el tronco del lado izquierdo de la lnea, como se observa en el cuadro 3-5. Los nmeros del lado derecho de la lnea vertical representan el segundo dgito de cada resultado, son las hojas. Los pasos para construir un grfico de tronco y hojas son los siguientes:

30 Bioestadstica mdica

(Captulo 3)

---,_ 11111111112111111111111111111111EZZERIE 30 111112. 36 54 EMEIZEIZEI Edad (meses) 1:111111115511111115 21 - 54 --11111 : 5115 53 NEMIZIWITA:5112111111112111115 r 21 --e onannennonnonsons -53- c s wann 52 noniananannannunna in -527
bird= 51-1 nglo -2 njillrimnelitillrAa 90 i 20 --r ra WW. Ma ...~~-1.....~~ 75 50-r EIM 50 _ \. 50 49 Igragailialliara:02::00":11:51
ll._ eralla li M t i nani iang l Millninnni.Preril

8ninnallWk-sillaflla~.-aalIN .....r .2a00111%, 1 11,0 .~~111~10%.11111120211~01 arallMom...J.7015%. 47 lia ffi nal l INEMIIIWIrna -- 47-r46... ralligieralinPraltaggrarla EIZEIgrolitra" i cm pulg gn MEI M n lir i a rin n r an a r n g u t lin o na o e sa an -a n n r n 445 L a n n aa i nu wegzreareaamninaalnnre m na nnraAggi iaM _, 44 L n gan or omnia 46 onn n arn eapann a 17 -es-43 E 44 lWiralgEM llaillgelliri i a ill ll rArilealling grA 11ttd -- 42 .4111111ME 42 . RE RE MI II a 41
9 ---1 - 48

s-19

16 -40

36 71011511111111111111111111MEr .11110M111112r11 W2115 2 n 34 5 38 'rata' MI r. maanilltrairaffir IMMO= 32 imgarargorps'inalowin ag r 37 irl .si 111111M U EU .. ' 30 u irtgrg,...ugunomousilasaisr. 36 lalaralln .4i1101MManallifigtarallein nem 14 --- U Walw=ilan 28 -8 35 Pra 1 1 12111. mIrallitan'tig0111.911WArariale: 26 34 lia mmun Malltrarel"'" 24 fhil:11191112Prammall 13 33 111 22 MIZEM117411111MUCISPOIRTMEME 32 r atummannwararamartmumn 20 or an -31
2 ildinglingallarliggilill nglarifirg tr.41Ealinggi Mi al g~ 16 .~1:::MTOIPOI~O~ EEEEE niMIZZOI r s 4 111101111991.11" : 111191 I EA:10 ORIIIIIII mummuummomann giumagaronslagunnom MI EEEEE 11: 12

39

15127,121011111111=MIUMLIEr

1r ffneddrr5511111111111:1111111 ardra11111211111111111star

40

38

41111111111111111MINIK 1111

Pu i g cm
2

iiiiiiii1591112155:iiiiiiiiiiiIII~1111111:11111 8 1:11:11:1111111nrgilligneffallinglinglalgallall: 8 6 6 111:11:1111111:1111111:111111111:1111111:111111111:11:11111:111111 4 ::::::::::11111111:111.91111:1:1:11:1111111111111:111111:1 4 lb

M lb s EIMMIZIERMINIMMEMEIMUMMIIIIIIIIIIM 00 s'95 90 85 80 1 cm 50 5 , J 60 65 7075 , . s S


Puig 20 21 22 23 24 25 26 27 28 29 30 3 33 34 35 36 37 38 39 40 41 42

Figura 3-2.

Diagrama del crecimiento fsico estndar. (Reproducido con autorizacin de Laboratorios Ross.)

1.Tomar el resultado de la primera persona (-8) y escribir el segundo dgito (8) u hoja en el lado derecho, opuesto al primer dgito o tronco, correspondiente a 9 a 5. Para la segunda persona, escribir el 3 (hoja) en el lado 2. derecho de la lnea vertical opuesta al de 1 a 5 (tronco). 3. Para la tercera persona, escribir el 3 (hoja) opuesto de 1 a 5 (tronco) de la calificacin previa de 3. Para la cuarta persona, escribir el 4 (hoja) opuesto a 4. 4 a O (tronco), y as sucesivamente.

5. Cuando el resultado sea de un solo dgito, como en los sujetos 1 a 7 del cuadro 3-4, ese dgito es la hoja. No obstante, cuando la observacin sea de dos dgito; 6. como en la calificacin 28 del sujeto 8, slo se escribe el segundo dgito, 8 en este caso. Las hojas de las primeras 10 personas se muestran en el cuadro 3-5. El grfico de tronco y hojas completo para los cambios de calificaciones de todos los pacientes se pre.

Resumen y presentacin de datos en cuadros y figuras 31

Cuadro 3-4. Diferencias en la calificacin total del SMAF para pacientes de 85 aos o ms. Las diferencias positivas indican declinacin
Edad 90 88 88 90 88 86 86 85 88 86 95 88 87 86 86 93 87 94 86 85 87 89 87 87 85 85 88 88 86 88 86 85 85 88 85 89 87 88 87 94 86 85 85 85 85 87 85 85 85 90 86 88 85 87 86 85 86 88 85 86 Sexo F F F F M F M F F F F F F M F F F F M F F F F F M F M F F M M F F F F M F M F M F F F F M M M F M F M M F 30 13 47 1 3 4 12 1 13 1 35 22 1 2 3 21 2 7 SMAF en tiempo 1 28 8 6 22 6 9 23 12 9 5 20 3 22 20 SMAF en tiempo 3 20 11 9 18 7 9 15 40 30 15 16 26 24 20 1 34 23 52 20 50 57 14 4 16 1 30 19 1 17 3 39 2 8 10 5 20 19 56 16 26 21 2 5 34 34 22 4 27 27 13 29 26 47 46 23 57 19 22 6 Diferencias (tiempo 3 tiempo 1) 8 3 3 4 1

o -8
28 21 10 4 23 2 1 4 10 5 19 47 53 2 3 3 5 3 15 18 1 2 2 9 1 7 37 5 9 6 2 4 27

8
7 11 1 12 19 21 17 27 4 9 7 38 13 4 17 23 12 30 27 26 44 21 17 10 15 4

-4
9 10 4 1 1 1 21 2 2 40 9 7 2

nio en los hoja. as dgitos, se escribe

tran en el

Lo para los es se pre-

32 Bioestadstica mdica

(Captulo 3)

Cuadro 3-4. Diferencias en la calificacin total del SMAF para pacientes de 85 aos o ms. Las diferencias positivas indican declinacin (continuacin)
Edad
88 88 87 85 85 89 85 87 86 90 85 88

Sexo
F M M M

SMAF en tiempo 1
10 18 12 37 17 14 11 4 16 5 48 9

SMAF en tiempo 3
12 22 20 47 14 19 14 6 26 6 51 17

Diferencias (tiemp 3 tiempo


2 4 8 10 3 5 3 2 10 1 3 8

F F

Fuente: datos usados con autorizacin de los autores y de Oxford University Press, de Hbert R, Brayne C, Spiegelhalter D: Incidente of functional decline and
improvement in a community-dwelling very elderly population. Am J Epidemion 997145:935-944.

Para algu primero mero. La la amplit a. Los Hl ben como 50"o qu b. Cuan ser ig senta cuan' c. Siemi tas e cin, de la

senta en el cuadro 3-6. Ambos grficos proporcionan un recuento de los resultados y muestran la forma en que se distribuyen los cambios de las calificaciones. Es razonable escoger una variacin de 5 puntos; por lo general, se prefiere evitar muchas de las clases vacas en el extremo superior de la escala. Tambin se prefiere tener amplitud de clases iguales y evitar los intervalos muy abiertos, como de 30 o ms, aunque algunos deciden elegir la combinacin de las clases superiores del grfico final. Las hojas se reordenan de la ms baja a la ms alta de cada clase. Despus de este reordenamiento, es fcil localizar la mediana de la distribucin, slo contando desde cualquier extremo.

cia. La escala de las observaciones debe dividirse en clases, como se hace con el grfico de tronco y hojas, luego se cuentan los datos de cada clase. Los pasos para construir una tabla de frecuencias son los siguientes:

: n t r e sam es ie i ne d.s S

1. Identificar los resultados mayor y menor.


2. Restar el resultado menor del mayor para obtener la) variacin de los datos. 3. Determinar el nmero de clases. Por lo general, el sentido comn es adecuado para tomar esta decisin pero puede utilizarse las siguientes guas: a. Es suficiente entre 6 y 14 clases para proporcionar informacin adecuada sin caer en el exceso de de. talles. b. Debe haber suficientes clases para demostrar la for. ma de la distribucin, pero no tantas que distorsionen las fluctuaciones menores. 4. Un enfoque es dividir la variacin de los datos entre el nmero de clases para obtener la amplitud de stas.
Cuadro 3-6. Grfica de tronco y hojas de los cambios en la calificacin total de la funcin con categoras de cinco puntos
Tronco
9 a 5 4a O +1 a +5 +6 a +10 +11 a +15 +16 a +20 +21 a +25 +26 a +30 +31 a +35 +36 a +40 +41 a +45 +46 a +50 +51 a +55 +56 a +60 8855 4040 3312 0097 5 98 131 87 70 7 3

de tien' real tir c Me( 5. Hacer si se es notar yendo de obs

Tablas de frecuencia
A menudo, las revistas cientficas presentan informacin de las distribuciones de la frecuencia o tablas de frecuenCuadro 3-5. Construccin de una grfica de tronco y hojas del cambio de la calificacin total de la funcin con categoras de 5 puntos: observaciones de los primeros 10 pacientes
Tronco Hojas

quencia.1 ,Issnites d. valores e codificar Algu ente


se

ros prog lista de t(

Hojas
6 03000212440113 1452 331241222245 32 13 990978080

def

9 a 5
4a 0 +1a +5 +6 a +10 +11 a +15 +16 a +20 +21 a +25 +26 a +30 +31 a +35 +36 a +40 +41 a +45 +46 a +50 +51 a +55 +56 a +60

88 40 3 3 1 O

n, yl

clase c

3-2,

1 8

Fuente: datos usados con autorizacin de los autores y de Oxford University


Press, de Hbert R, Brayne C, Spiegelhalter D. Incidente of functional decline and improvement in a community-dwelling, very elderly population. Am J Epidemia' 1 997;145:935-944.

Fuente: datos usados con autorizacin de los autores y de Oxford University


Press, de Hbert R, Brayne C, Spiegelhalter Incidente of functional decline and improvement in a community-dwelling, very elderly population. Am Epidemia! 1997;145:935-944.

(Captulo 3)

Resumen y presentacin de datos en cuadros y figuras 33

3 tiempo

aal decline and

e en clases, is, luego se a construir

obtener la

ral, el senisin pero

porcionar so de de-

Para algunas aplicaciones, tiene mayor sentido decidir primero la amplitud de la clase para determinar su nmero. Las siguientes son algunas guas para determinar la amplitud de las clases: a. Los lmites de clase (nmero inicial y final) no deben sobreponerse. Por ejemplo, debe especificarse como "40 a 49" o "40 hasta antes de 50", y no "40 a 50" o "50 a 60". Por otra parte, no es posible decir a qu observacin pertenece 50. b. Cuando sea posible, la amplitud de las clases debe ser igual. Con amplitudes de clase desiguales se presentan problemas para hacer grficas y deben usarse cuando haya grandes brechas en los datos. c.Siempre que se pueda, deben evitarse las clases abiertas en los extremos superior e inferior de la variacin, ya que no comunican con precisin la variacin de las observaciones. El cuadro 3-2 se usaron las clases abiertas cuando se tenian las categoras de 0.40 o menos y 1.20 o mayores. d. Siempre que sea posible, escoger los lmites de clase de tal modo que la mayor parte de los datos en la clase queden lo ms cerca posible al punto medio de sta y no cerca del extremo de la misma. Se obtiene un mejor estimado de la media de los datos reales cuando la media cargada se calcula a partir de una tabla de frecuencias (vase la seccin Media). 5. Hacer un recuento del nmero de datos de cada clase; si se est construyendo un grfico de tronco y hojas se notar el valor real de los mismos. Si se est construyendo una tabla de frecuencias, bastar usar el nmero de observaciones que caigan dentro de la clase. Los programas de computadora por lo general dan una lista de todos los valores que aparezcan, junto con su frecuencia. Quiens usen estos programas deben designar los lmites de clase si desean formar tablas de frecuencia para valores en intervalos especficos, como en el cuadro 3-2, codificando las observaciones originales. Algunas tablas slo presentan frecuencias (nmero de pacientes o personas), otras slo porcentajes. Los porcentajes se obtienen dividiendo el nmero de datos en una clase definida n, entre el total del nmero de observaciones, n, y luego multiplicndolo por 100. Por ejemplo, para la clase de ndice de choque de 0.40 hasta 0.50 en el cuadro 3-2, el porcentaje es:

Histogramas, grficos de caja y polgonos de frecuencia


Las grficas se utilizan mucho en medicina en revistas de este campo, diapositivas para presentaciones en conferencias profesionales y en la literatura publicitaria dirigida al personal de salud. Los grficos ms tiles en medicina son los histogramas, grficos de caja, de error, de distribucin y grficas lineales.
Histogramas

rar la fortorsionen

s entre el de stas.

En la figura 3-3 se muestra el histograma de los cambios en las calificaciones de los ancianos del estudio de Hbert et al. (1997), acerca de la estabilidad funcional. Los histogramas presentan la medicin de inters en el eje X y el nmero o porcentaje de observaciones en el eje Y, aunque algunos programas de computadora hacen lo contrario. El uso de nmeros o porcentajes depende del propsito del histograma; por ejemplo, se recurrir a los porcentajes cuando se comparen dos histogramas basados en diferentes nmeros de sujetos. Puede notarse que los nmeros de los pacientes de cada clase son diferentes de los que se encuentran cuando se crean grficos de tronco y hojas. Esta incongruencia sucede porque la mayor parte de los programas estadsticos de las computadoras determina en forma automtica los limites de las clases. Como en las tablas de frecuencia, es posible registrar los nmeros con una nueva medida si se quiere especificar los lmites de la clase. Ntese que el rea de cada barra es proporcional al porcentaje de resultados en ese intervalo; por ejemplo, los nueve datos en el intervalo 5 (valores entre 7.5 y 2.5) constituyen 9/72, o 12.5%, del rea cubierta por el histograma; por tanto, un histograma brinda informacin acerca del rea. El concepto de rea es uno de los motivos por el cual la amplitud de las clases debe ser igual, de otro modo la altura de las columnas en el histograma debe modificarse
30

ambios

1
3

e E 10

n
E

x 100 = 14 x 100 = 0.112 x 100, o 11.2% 931

o
-10 -5 0 5 10 15 20 25 30 35 40 45 50 55 Cambios en calificacin del SMAF (tiempo 3 menos tiempo 1)

Thiversity al decline )n. Am J

Para algunas aplicaciones es deseable obtener las frecuencias acumuladas, o porcentajes. La frecuencia acumulada es el porcentaje de observaciones para un valor determinado ms el de todos los dems valores inferiores. El valor acumulado en la ltima columna del cuadro 3-2, por ejemplo, muestra que casi 75% de los pacientes tuvo un ndice de choque menor que 0.80.

Figura 3-3. Histograma del cambio en las calificaciones de la funcin total con categoras de 5 puntos. (Datos utilizados con autorizacin de Oxford University Press, de Hbert R, Brayne C, Spiegelhalter Incidence of lunctional decline and improvement in a communitydwelling, very elderly population. Am J Epidemio/1997;145:935-944. Grfica producida con el SPSS, una marca registrada de SPSS, Ine.; usado con autorizacin.

Ir

34 Bioestadstica mdica

(Captulo 3.)

para mantener el rea correcta. Por ejemplo, en la figura 3-3, si la clase inferior fue de una amplitud de 10 puntos (de 12.5 a 2.5) y las dems clases fueran de 5 habra 11 resultados en el intervalo. Sin embargo, la altura de la columna para ese intervalo ser de slo 5.5 U (en vez de 11), para compensar el doble de su amplitud. Grficos de caja El grfico de caja, a veces llamado grfico de caja y barbas por Tukey (1977), es otra manera de mostrar la informacin cuando el objetivo es ilustrar ciertos puntos en la distribucin. Se construye con la informacin de un grfico de tronco y hojas o una tabla de frecuencia. En el cuadro 3-7 se presenta un grfico de tronco y hojas de los pacientes de 85 aos de edad y ms. Para construir el grfico de caja se usa la medianas, as como el primero y tercero cuartiles de la distribucin. No es comn que los programas para computadora muestren la mediana y los cuartiles 75 y 25 con los grficos de tronco y hojas, pero es fcil solicitar esta informacin, como se ilustra en el cuadro 3-7. El cambio mediano en la calificacin SMAF es 2.5, el percentil 75 es 9 y el percentil 25 es O. Ntese que los valores para el tronco son diferentes a los que de los que se usan debido a que la mayor parte de los programas de computadoras determinan los valores del tronco. En el cuadro 3-7 existe un valor del tronco por cada dos valores del cambio de las calificaciones SMAF. Aunque no es muy evidente, los valores del tronco representan los tamaos de clase 2 y se interpretan como sigue:

para los nmeros que terminan en O y 1; T representa los nmeros con terminacin en 2 y 3; F representa los mi. meros terminados en 4 y 5; S representa los nmeros que terminan en 6 y 7; y * representa los nmeros terminados en 8 y 9. Un grfico de caja de los cambios en las calificaciones SMAF para pacientes de 85 aos o ms, se representa en la figura 3-4? Se dibuja una caja con la parte alta en el tercer cuartil y la baja en la primera, a veces se dice que los cuartiler son las bisagras de los grficos de caja. La longitud de es una representacin visual de la variacin intercuartilar, representacin de 50% medio de los datos. No importa 1 amplitud de la caja. La localizacin del punto medio a mediana de la distribucin se indica con una lnea horizon tal en la caja. Por ltimo, las lneas verticales, o barbas, se extienden 1.5 veces ms de la variacin intercuartilar pos arriba y debajo de los percentiles 75 y 25. A todo valor que quede arriba o debajo de las barbas se le llama extremo. Los grficos de caja ofrecen gran cantidad de infor. macin, por ejemplo, en la figura 3-4 se observan los cam. bios en las calificaciones que varan en aproximadamente 10 a cerca de 55 (de hecho, de 8). La mitad de los can bios de las calificaciones estuvieron entre O y 8, la media. na fue un poco mayor de 0. Existen siete valores extremo cuatro pacientes tuvieron cambios de calificacin may res de 35 puntos.
* Para este anlisis se escogieron los siguientes pacientes aos, calificacin SMAF total de 3 1.

ro

3-4

pacier de Oxf

ng, Pro

grafi<

para o primer

Cuadro 3-7. Informacin descriptiva y grfica de tronco y hojas de los cambios en la calificacin total de la SMAF para sujetos de 85 aos o mayores
Cuartiles de los cambios de calificacin de SMAF Parmetro Valor 95% LCL 95% UCL Percentil 10 -4 -6 -2 Percentil 25 O -3 1 Percentil 50 2.5 1 4 Percentil 75 9 5 18 Percentil 90 22.4 10 40

Seccin de tronco y hoja de los cambios de calificaciones del SMAF Profundidad 2 3 9 13 19 28 (14) 30 25 23 17 12 12 11 11 9 Alto Total = 1 S F Tronco 88 6 554444 3322 111000 00001111 22222222333333 44455 77 889999 00000 Hojas

T
-o' 0'

mena hasta hasta hasta hasta hasta hasta hasta hasta o may

T R
S 1*

5 S 89 2' 11 23, 27, 28, 37, 40, 47, 53 Ejemplo: 1 12 Representantes 12

T F

Men hasta hasta hasta hasta hasta hasta hasta hasta o may
O

Fuente: datos utilizados con autorizacin de los autores y de Oxford University Press, de Hbert R, Brayne C, Spiegelhalter D: Incidente of functional decline
improvement in a community-dwelling very elderly population. Am J Epidemiol 1997;145:935-944. Grfica producida por el NCSS; usado con autorizacin.

datc

usad

(Captulo 3)

Resumen y presentacin de datos en cuadros y figuras 35

presenta los enta los niaCimeros que terminados

60 0 50.0 40.0 30.0 20.0 -

dificaciones esenta en la en el tercer los cuartfles itud de sta tercuartilar, importa la :o medio e ea horizonbarbas, se zartilar por o valor que xtremo. 1 de inforIn los camtadamente Le los cam, la mediaextremos, in mayo85

10_0 o -10.0 -20.0 Tiempo 3 - tiempo 1 Variables

es generar un grfico de tronco y hojas o una tabla de frecuencias. El cuadro 3-8 presenta las frecuencias del ndice de choque para pacientes con y sin EP. La figura 3-5 es un histograma basado en las frecuencias de varones con un polgono de frecuencia superpuesto en l. Esto demuestra que los polgonos de frecuencia se construyen a partir de la conexin de los puntos medios de las columnas de un histograma. Por tanto, las mismas guas que se dieron para construir las tablas de frecuencia y los histogramas se aplican para construir los polgonos de frecuencia. Ntese que la lnea se extiende desde el punto medio de la primera y ltima columnas hasta el eje X para cerrar ambos extremos de la distribucin e indicar una frecuencia cero de cualquiera de los valores que salgan de los extremos. En vista de que un polgono de frecuencia se basa en un histograma, los polgonos de frecuencia tambin muestran reas.
Grficos que comparan dos o ms grupos

Figura 3-4. Grfica de caja de los cambios en la calificacin del SMAF para pacientes de 85 aos o mayores. (Datos utilizados con autorizacin de Oxford University Press, de Hbert R, Brayne C, Spiegelhalter D: incidence of functional decline and improvement in a communitydwelling, very elderly population. Am J Epidemiol 1997;145:935-944. Grfica producida con el NCSS, usada con autorizacin.)

Mates:

Polgonos de frecuencia

Son grficas lineales similares a los histogramas, muy tiles para comparar dos distribuciones en la misma grfica. El primer paso para construir un polgono de frecuencias

Observar slo los nmeros en el cuadro 3-8 es insuficiente para decidir si la distribucin del ndice de choque es similar para los pacientes con y sin EP. Varios mtodos son tiles para comparar las distribuciones. Los grficos de caja son muy eficaces cuando hay ms de un grupo, y aqu se muestran para el ndice de choque entre los pacientes con y sin EP en la figura 3-6. Las distribuciones del ndice de choque son similares, aunque existe ms variabilidad en los pacientes sin EP, y el ndice de la mediana es ligeramente ms alto en aquellos que tenan EP. Existe una diferencia entre los dos grupos; en el captulo 6 se da la respuesta.

al
Categora

Cuadro 3-8. Tablas de frecuencias para ndice de choque


A. ndice de choque en pacientes que no tienen EP Cuenta Cuenta acumulada Porcentaje Porcentaje acumulado Grfica de porcentaje //// /////// /////// ///// ///

lil 90 0.40 menos 0.40 hasta 0.49 0.50 hasta 0.59 0.60 hasta 0.69 0.70 hasta 0.79 0.80 hasta 0.89 0.90 hasta 0.99 1.00 hasta 1.09 1.10 hasta 1.19 1.20 o mayor 33 94 160 161 120 89 39 28 15 12

33 127 287 448 568 657 696 724 739 751

4.39 12.52 21.30 21.44 15.98 11.85 5.19 3.73 2.00 1.60

4.39 16.91 38.22 59.65 75.63 87.48 92.68 96.40 98.40 100.00

B. ndice de choque en pacientes que tienen EP


Categora Cuenta Cuenta acumulada Porcentaje Porcentaje acumulado Grfica de porcentaje

0.40 o menos 0.40 hasta 0.49 0.50 hasta 0.59 0.60 hasta 0.69 0.70 hasta 0.79 0.80 hasta 0.89 0.90 hasta 0.99 1.00 hasta 1.09 1.10 hasta 1.19 1.20 o mayor
o

5 10 38 38 35 13 21 9 4

5 15 53 91 126 139 160 169 173 181

2.76 5.52 20.99 20.99 19.34 7.18 11.60 4.97 2.21 4.42

2.76 8.29 29.28 50.28 69.61 76.80 88.40 93.37 95.58 100.00

/// //////// ////1111 /11/1/1 /fi ////

tcline and in.

Fuente: datos utilizados con autorizacin de los auto es y el editor, Mine JA, Nelson RD, Jackson RE, Cou tney DM; Criteria for the sa e use of e-dimer testing in emergency department patients with suspected pulmonary embolism: A multicenter US study. Ann Emergency Med 2002;39:144-152. Cuadro producido con el NCSS; usado con autorizacin. The American College of Emergency Physicians.

36 B oestadstica mdica

(Captulo 3)

El crcu Histograma de ndice de choque: pacientes con EP 50

o e o_ -2 25 o E

o 2 o-

viacin error est el cual desviar cacione militud v los poli

porcion

z
0 1 1 1 1 1 1 1 o 00 o o o , ?, o .0 o S' 0 O 0 0, 0 0 '0 co o 1 0 10 1 0 0 0 12" T C9 '5 1 .8 0 .`9 0 .0 9 O ndice de choque en categorias Figura 3-7. Polgono de frecuencias del ndice de choque para pacientes con y sin embolia pulmonar. (Datos utilizados con autorizacin de Kline JA, Nelson RD, Jackson RE, Courtney DM: Criteria for the safe use of D-dimer testing in emergency department patients with suspected pulmonary embolism: A multicenter US study. Ann Emergency Med 2002;39:144-152. Grfica producida con SPSS, marca registrada del SPSS, Inc.; usada con autorizacin.The American College of Emergency Physicians.)

RESU1 Y ORE

I ndice de hoque

Figura 3-5. Polgono de frecuencia del indice de choque para pacientes con embolia pulmonar. Kline JA, Nelson RD, Jackson RE, Courtney DM: Criteria for the sale use of D-dimer testing in emergency department patients with suspected pulmonary embolism: A multicenter US study. Ann Emergency Med 2002;39:144-152. Grfica producida con el NCSS; usada con autorizacin. The American College of Emergency Physicians.)

Los polgonos de porcentaje tambin son tiles para comparar dos distribuciones de frecuencias. En la figura 3-7 se presentan los polgonos de porcentaje de la variacin de la frecuencia cardiaca en varones y mujeres. Las frecuencias deben convertirse a porcentajes cuando los grupos a comparar tienen un nmero desigual de observaciones (figura 3-7). Al parecer, la distribucin del ndice de cho-

que no es muy diferente para los dos grupos de pacientes, la mayor parte del rea de un polgono se sobrepone en el rea de la otra. Por tanto, el mensaje visual de los grficos de caja y de los polgonos de frecuencia es consistente. Otro tipo de grfica que se utiliza con frecuencia en la literatura mdica es el diagrama de error en barras; la figura 3-8 muestra barras de error para pacientes con y sin EP.

Al med mtodc punto r terstic numri cin. El caracte miento explica] et al., 2 das, est seccin tipo de

Forma

Los dat dos: prc estas m ron pac

miento
Grfica de error en barras Grfica de caja 2.0

P'

oo
<U
1

01.0 O

Locanz, Urba Subu Rura

0.5

Tipo de Priva Otra

Ensee 00 Presente Ausente Embolia pulmonar Figura 3-6. Grfica de caja del indice de choque para pacientes con y sin embolia pulmonar. (Datos usados con autorizacin de Kline JA, Nelson RD, Jackson RE, Courtney DM: Criteria for the safe use of Ddimer testing in emergency department patients with suspected pulmonary embolism: A multicenter US study. Ann Emergency Med 2002;39:144-152. Grfica producida con el NCSS; usada con autorizacin. The American College of Emergency Physicians.)

Embolia pulmonar Figura 3-8. Diagrama de error en barras del ndice de choque para pacientes con y sin embolia pulmonar. (Datos utilizados con autorizacin de Kline JA, Nelson RD, Jackson RE, Courtney DM: Criteria for the safe use of D-dimer testing in emergency department patients with suspected pulmonary embolism: A multicenter US study. Ann Emergency Med 2002;391 44-152. Grfica producida con SPSS, marca registrada de SPSS, Inc.; usada con autorizacin.The American College of Emergency Physicians.)

em Entri viole S No

Fuente: Cooke se ics oy ill p dh

con Mi

2aptulo 3)

Resumen y presentacin de datos en cuadros y figuras 37

-de

te

El crculo designa la media y las barras representan la desviacin estndar, aunque algunos autores usan la media y el error estndar (un valor menor que el de la desviacin estndar, el cual se explica en capitulo 4). Se recomienda usar las desviaciones estndar y referirse al captulo 4 para explicaciones ms detalladas. Las barras de error indican la similitud de las distribuciones, de igual manera que lo hacen los polgonos de porcentajes y los grficos de caja. Vanse las figuras 3-6, 3-7 y 3-7 y decide cul proporciona la informacin ms til.

Pro orciones y porcentajes

Una proporcin es el nmero, a, de observaciones con una caracterstica determinada (quienes fueron detectados para violencia domstica) dividida entre el nmero total de observaciones, a + b, en un grupo dado (como aquellos que tuvieron entrenamiento previo). Es decir,
Proporcin = a a+ b

RESUMEN DE DATOS NOMINALES Y ORDINALES CON NMEROS

te para pain autorizaGritera for patients study. Ann pon SPSS, e American

, acientes,

one en el s grficos stente. -ida en la s; la figuy sin EP.

Al medir los datos en una escala nominal o categrica, los mtodos mencionados no son adecuados para describir el punto medio y la dispersin de una distribucin. Las caractersticas medidas en una escala nominal no tienen valores numricos, pero son conteos de frecuencias de presentacin. El estudio sobre violencia domstica examin diversas caractersticas sobre los mdicos, incluyendo su entrenamiento previo ante la violencia domstica, lo que ayuda a explicar las diferencias en su conducta de escrutinio (Lapidus et al., 2002). Ambas caractersticas son dicotmicas o binadas, esto indica que slo son posibles dos categoras. En esta seccin se revisarn las medidas que pueden usarse con este tipo de observaciones.

La proporcin siempre se define como una parte dividida entre el total, y es til para los datos ordinales y numricos, sobre todo si las observaciones se colocaron en una tabla de frecuencias. En el estudio sobre violencia domstica, la proporcin de mdicos capacitados en violencia domstica obtuvo una deteccin en los pacientes de 175/ 202 = 0.866, y la proporcin sin entrenar que subsecuentemente detect pacientes fue de 155/266 = 0.583. El porcentaje es la proporcin multiplicada por 100%.
Relaciones y tasas
14 Una relacin es el nmero de observaciones en un isQf grupo determinado con una caracterstica dividido

entre el nmero de observaciones sin esa caracterstica:


Relacin = a

Formas para describir datos nominales


Los datos nominales pueden cuantificarse con varios mtodos: proporciones, porcentajes, relaciones y tasas. Para ilustrar estas medidas se usarn los nmeros de mdicos que detectaron pacientes para violencia domstica con base en adiestramiento previo; los datos se presentan en el cuadro 3-9.
Cuadro 3-9. Prevalencia de deteccin mdica por datos demogrficos, prctica y educacin de violencia domstica en 438 encuestados
S Localizacin de la prctica Urbana Suburbana Rural Tipo de prctica Privada Otra Enseanza de residentes Si No Entrenamiento previo de violencia domstica S No 97 199 34 261 40 154 175 Deteccin No 28 99 11 110 12 62 76 Total 125 298 45 371 52 216 251

La relacin siempre se define como una parte dividida entre otra parte. Por ejemplo, en el caso de los mdicos entrenados, la relacin de quienes detectaron pacientes con aquellos que no lo hicieron fue 175/27 = 6.481. Otras relaciones familiares en medicina incluyen relaciones de los tres componentes del colesterol (HDL, LDL, triglicridos), asi como la relacin LDL/HDL. Las tasas son similares a las proporciones, excepto en que se usa un multiplicador (p. ej., 1 000, 10 000 o 100 000), y se calculan para un periodo especfico. Al multiplicador se le llama base, la frmula es:
Tasa =

a+ b

x base

Por ejemplo, si un estudio dur exactamente un ao y la proporcin de pacientes con una condicin dada fue de 0.002, la tasa por 10 000 pacientes sera (0.002) x (10 000), 0 20 por 10 000 pacientes por ao.

Tasas de estadsticas vitales


Las tasas son muy importantes en epidemiologa y en la medicina basada en evidencias, son la base para calcular las estadsticas vitales, las cuales describen el estado de salud de las poblaciones; en las siguientes secciones se definen de manera breve algunas de las tasas ms usadas.
Tasas de mortalidad

que para autorizariteria for patients udy. Ann n SPSS, kmerican

175 155

27 111

202 266

Fuente: datos usados con autorizacin de los autores y el editor, Lapidus G, Cooke MB, Gelven E, Sherman K, Duncan M, Bancol L: A statewide survey of domestic violente screening behaviors among pediatricians and family physicians. Arch Pediatr Adolesc Med 2002156:332-336. Cuadro producido con Microsoft Excel.

Son una manera estndar para comparar los nmeros de muertes que ocurren en diferentes poblaciones, ya sea por diferentes enfermedades en la misma poblacin o en dife-

38 Bioestadstica mdica

(Captulo 3)

rentes periodos. El numerador en una tasa de mortalidad es el nmero de personas que falleci en un periodo determinado en tanto que el denominador ser el nmero de personas que estuvieron en riesgo de expirar durante el mismo periodo. En vista de que el denominador por lo general es difcil de obtener, con frecuencia se usa el nmero de personas vivas de la poblacin a la mitad de ese periodo como una aproximacin. En el cuadro 3-10 se ofrecen los datos de mortalidad de las Vital Statistics of the United States. Una tasa real es la tasa calculada para todos los individuos de una poblacin determinada, por ejemplo, la tasa de mortalidad anual real de toda la poblacin del cuadro 3-10 fue de 872.5 por 100 000 en 1996. La tasa de mortalidad especfica por sexo fue 896.4 para varones y 849.7

para mujeres por 100 000. Al comparar las tasas de mo r talidad especficas por sexo a travs de los aos que se, proporcionan en el cuadro 3-10, la tasa de mortalidad; parece haber aumentado para las mujeres. Tiene sentidel o hay otra explicacin? Considrese que un gran nmero de mujeres mayores pudo haber vivido hasta 1996 en aosl previos. Esta hiptesis puede examinarse al ajustar las ta. sas de mortalidad por edad de las personas en riesgo. Cuan. do se observan las tasas ajustadas por edad del cuadro 3-10, se observa que las tasas han declinado, como era de espe., rarse; se ampla esta informacin en el tema Tasas ajustadas, Las tasas de mortalidad especficas por causa miden los descesos en una poblacin ya sea por enfermedad o ' evento adverso especficos. Comparar las tasas de mortali. dad especficas por causa en un periodo ayuda a los epide.

milogos pres a; te rn sobre ot


en la

dad mor l e de mortal m cador del poblacir fallecen p caso es el fica que entre el n ficada du,

Tasas de

Son par::
Cuadro 3-10. Nmero de muertes, tasas de mortalidad y tasas de mortalidad ajustadas por edad, raza y sexo: EUA de 1987 a 19961
Nmero de muertes en EUA de 1987 a 1996 Todas las razas Ao 1996 1995 1994 1993 1992 1991 1990 1989 1988 1987 Ambos sexos 2 314 690 2 312 132 2 278 994 2 268 553 2 175 613 2 169 518 2 148 463 2 150 466 2 167 999 2 123 323 Masculino 1 163 569 1 172 959 1 162 747 1 161 797 1 122 336 1 121 665 1 113 417 1 114 190 1 125 540 1 107 958 Femenino 1 1 1 1 1 1 1 1 1 1 151 121 139 173 116 247 106 756 053 277 047 853 035 046 036 276 042 459 015 365 Ambos sexos 1 992 966 1 987 437 1 959 875 1 951 437 1 873 781 1 868 904 1 853 254 1 853 841 1 876 906 1 843 067 Blanca Masculino Femenino 991 984 997 277 988 823 988 329 956 957 956 497 950 812 950 852 965 419 953 382 1 000 982 990 160 971 052 963 108 916 824 912 407 902 442 902 989 911 487 889 685 Negra Ambos sexos Masculino Femenino 282 089 286 401 282 379 282 151 269 219 269 525 265 498 267 642 264 019 254 814 149 472 154 175 153 019 153 502 146 630 147 331 145 359 146 393 144 228 139 551 132 617 132 226 129 360 128 649 122 589 122 194 120 139 121 249 119 791 115 263

Tasas de mortalidad en EUA por 100 000, de 1987 a 1996 1996 1995 1994 1993 1992 1991 1990 1989 1988 1987 872.5 880.0 875.4 880.0 852.9 860.3 863.8 871.3 886.7 876.4 896.4 914.1 915.0 923.5 901.6 912.1 918.4 926.3 945.1 939.3 849.7 847.3 837.6 838.6 806.5 811.0 812.0 818.9 831.2 816.7 906.9 911.3 905.4 908.5 880.0 886.2 888.0 893.2 910.5 900.1 918.1 932.1 931.6 938.8 917.2 926.2 930.9 936.5 957.9 952.7 896.2 891.3 880.1 879.4 844.3 847.7 846.9 851.8 865.3 849.8 842.0 864.2 864.3 876.8 850.5 864.9 871.0 887.9 888.3 868.9 939.9 980.7 987.8 1 006.3 977.5 998.7 1 008.0 1 026.7 1 026.1 1 006.2 753.5 759.0 752.9 760.1 736.2 744.5 747.9 763.2 764.6 745.7

lr z logos P bi du determino pr poblacin efn La ,cantes usa Oda se ,enfermed poblacin mento. La nuevos qi entre (En vista en la actu forma inc se usa a VE de una "pi tninos es ees d un soas d ey s re ap lo tt ex Puede

La prevale

s; der ioe testu nqui Eran estiu

Tasas de mortalidad ajustadas por edad en EUA por 100 000, de 1987 a 1996 1996 1995 1994 1993 1992 1991 1990 1989 1988 1987 491.6 503.9 507_4 513.3 504.5 513.7 520. 2 528.0 539.9 539.2 623.7 646.3 654.6 664.9 656.0 669.9 680.2 689.3 706.1 706.8 381.0 385.2 385.2 388.3 380.3 386.5 390.6 397.3 406.1 404.6 466.8 476.9 479.8 485.1 477.5 486.8 492.8 499.6 512.8 513.7 591.4 610.5 617.9 627.5 620.9 634.4 644.3 652.2 671.3 674.2 361.9 364.9 364.9 367.7 359.9 366.3 369.9 376.0 385.3 384.8 738.3 765.7 772.1 785.2 767.5 780.7 789.2 805.9 809.7 796.4 967.0 1 016.7 1 029.9 1 052.2 1 026.9 1 048.9 1 061.3 1 082.8 1 083.0 1 063.6 561.0 571.0 572.0 578.8 568.4 575.1 581.6 594.3 601.0 592.4

' Tasas reales por ao, por 100 000 habitantes en grupos especficos; tasas de edad ajustadas por edad por 100000, poblacin estndar por milln en EUA. Las tasas se basan en poblaciones numeradas al 1 de abril para los aos de los censos, y se calculan al 1 de julio para los dems aos. Se excluyen las muertes de los no residentes en EUA. Fuente: adaptado con autorizacin de Peters KD, Kochanek KD, Murphy SL: Deaths: Final data for 1996. National Vital Statistics Report; Vol 47, no. 9, p. 16. Nation Center for Health Statistics, 1998.

dios de col empiezan examinar Los ej incidencia ones fut prevalenci mente 23( te estable es que al p teniendo c en los cuic do de id, de corta coa d - coz (p. 'mayor que

)aptulo 3)

Resumen y presentacin de datos en cuadros y figuras 39

as de moros que se tortalidad le sentido n nmero /6 en aos ;tar las talo. Cuan[dro 3-10, a de espeajustadas. Isa miden rmedad o e mortalilos epide-

milogos a determinar los posibles factores predisponentes en la presentacin de enfermedades y hacer proyecciones sobre tendencias futuras. Otras tasas de mortalidad usadas con frecuencia son la de mortalidad infantil y la de letalidad por caso. La tasa de mortalidad infantil, que en ocasiones se usa como indicador del grado de atencin de la salud general de una poblacin, es el nmero de nios menores de un ao que fallecen por 1 000 nacidos vivos. La tasa de letalidad por caso es el nmero de muertes por una enfermedad especfica que se presenta en un periodo determinado dividido entre el nmero de individuos con la enfermedad especificada durante ese periodo.
Tasas de morbilidad

Tasas ajustadas

emenino

132 617 132 226 129 360 128 649 122 589 122 194 120 139 121 249 119 791 115 263

753.5 759.0 752.9 760.1 736.2 744.5 747.9 763.2 764.6 745.7

561.0 571.0 572.0 578.8 568.4 575.1 581.6 594.3 601.0 592.4 Las tasas de los no 6. National

Son parecidas a las de mortalidad, pero muchos epidemilogos opinan que las tasas de morbilidad proporcionan una medida ms directa del estado de salud de una poblacin La tasa de morbilidad es el nmero de individuos que presentan un padecimiento en un periodo determinado dividido entre el nmero de personas de una poblacin en riesgo. La prevalencia y la incidencia son dos medidas importantes usadas con frecuencia en epidemiologa. La prevalencia se define como el nmero de individuos con una enfermedad determinada, en cierto punto dividido entre la Poblacin en riesgo de tener esa enfermedad en ese momento. La incidencia se define como el nmero de casos nuevos que se presentan en un intervalo determinado dividido entre la poblacin en riesgo al inicio de ese intervalo. (En vista de que la prevalencia no comprende un periodo, en la actualidad es una proporcin, pero se le considera en forma incorrecta como una tasa.) El trmino "incidencia" se usa a veces de forma errnea cuando en realidad se trata de una "prevalencia". Una manera de distinguir ambos trminos es fijarse en las unidades: la incidencia siempre se expresa en trminos de unidad de tiempo. Puede dibujarse una analoga entre prevalencia e incidenda y dos de los diseos de estudio explicados en el captulo 2. La prevalencia es como una instantnea en el tiempo, como lo es un estudio de corte transversal. De hecho, a muchos estudios de corte transversal, los epidemilogos los llaman estudios de prevalencia. Por otra parte, la incidencia requiere que transcurra cierto periodo, similar al de los estudios de cohorte. Debe recordarse que estos ltimos estudios empiezan en un momento determinado y continan para examinar desenlaces en un tiempo especfico del estudio. Los epidemilogos emplean las tasas de prevalencia e incidencia para evaluar patrones de enfermedad y proyecciones futuras. Por ejemplo, la diabetes mellitus tiene una prevalencia creciente aunque su tasa anual de aproximadamente 230 casos por 100 000 se ha mantenido relativamente estable en los ltimos aos. La razn de esta diferencia es que al presentarse la enfermedad, un paciente contina teniendo diabetes por el resto de su vida, pero los avances en los cuidados de los diabticos han aumentado el periodo de vida de stos. Por el contrario, para enfermedades de corta duracin (p. ej., influenza) o con una mortalidad precoz (p. ej., cncer de pncreas), la tasa de incidencia es mayor que la de prevalencia.

Pueden usarse tasas reales para realizar comparaciones entre dos poblaciones diferentes slo si stas son similares en todas las caractersticas que puedan afectar la tasa, por ejemplo, si las poblaciones son diferentes o se ven confundidas por factores como edad, gnero o raza, deben usarse tasas especficas por edad, gnero o raza, o ajustar las tasas reales, de otro modo no sern vlidas las comparaciones. Es comn que en medicina se ajusten las tasas por edad. Por lo general, dos poblaciones de inters tienen diferentes distribuciones por edad, tambin muchas de las caractersticas que se estudian en medicina estn afectadas por la edad, lo que hace que sean ms o menos frecuentes segn envejecen los individuos. Si se compararn dos poblaciones, las tasas deben ajustarse para reflejar lo que seran en caso de que las distribuciones por edad fuesen similares.
Mtodo directo para ajustar tasas

Como ejemplo, supngase que un investigador compara las tasas de mortalidad infantil de un pas desarrollado con las de otro en vas de desarrollo y concluye que la tasa de mortalidad del ltimo es casi el doble que la tasa del primero. Esta conclusin es errnea?, hay posibles factores de confusin que afecten la mortalidad infantil de tal modo que se distribuya de manera diferente en ambos pases? Existe una relacin entre el peso al nacer y la mortalidad, y en este ejemplo, una comparacin vlida de las tasas de mortalidad requiere que la distribucin de los pesos al nacer sea similar en los dos pases. En el cuadro 3-1 I se presentan datos hipotticos. La tasa real de mortalidad infantil para el pas desarrollado es 12.0 por 1 000 nios, para el pas en vas de desarrollo es de 23.9 por 1 000. Las tasas especficas para el segundo pas son mayores para todas las categoras de peso al nacer. Sin embargo, ambas distribuciones de peso al nacer no son las mismas: el porcentaje de nios de bajo peso al nacer (< 2 500 g) es ms de dos veces el porcentaje mayor en los pases en vas de desarrollo. En vista de que el peso al nacer y la mortalidad infantil se relacionan, no es posible determinar qu porcentaje de diferencia en las tasas reales de mortalidad entre ambos se debe a las diferencias en la mortalidad especfica por peso y qu cantidad se debe a la mayor proporcin de recin nacidos de bajo peso al nacer en el pas en vas de desarrollo. En este caso, las tasas de mortalidad deben estandarizarse o ajustarse para que sean independientes de la distribucin del peso al nacer.* La determinacin de la tasa ajustada es un proceso simple, siempre y cuando se disponga de informacin como la del cuadro 3-11. Para cada poblacin se deben conocer las tasas especficas. Ntese que la tasa real de cada pas es, de hecho, un promedio cargado de las tasas especficas, en las que el nmero de neonatos nacidos en cada categora de peso al nacer se usan como las cargas. Por ejemplo, la * Desde luego que otros factores distintos del peso al nacer pueden afectar la mortalidad, y es importante recordar que la correccin de un factor no corrige otros.

40 Bioestadstica mdica

(Captulo 3)

Cuadro 3-1 1.Tasa ajustada de mortalidad infantil; mtodo directo


Pas desarrollado Nacimientos Peso al nacer < 1 500 g 1 500 a 2 499 g 2 500 g Total N (por 1 000) 20 30 150 200 10 15 75 Nm. 870 480 1 050 2 400 Muertes Tasa 43.5 16.0 7.0 12.0 Pas en vas de desarrollo Nacimientos -r N (por 1 000) 30 45 65 140 21 32 47 Nm. 1 860 900 585 3 345 Muertes Tasa 62.0 20.0 9.0 23.9

directa. inters, darizada

CUADF DATOS

tasa real de mortalidad en el pas desarrollado es 2 400/ 200 000 = 0.012, o 12 por 1 000, y es igual a
E (Tasa x N) N total (43.5 x 20) + (16.0 x 30) + (LO x 150) 20 + 30 + 150 = 2 400 , o 12 por 1 000 200

En virtud de que el objetivo de ajustar las tasas es hacer que reflejen distribuciones similares, se utilizan los nmeros de cada categora de una poblacin, llamada poblacin de referencia, como las cargas para formar los promedios cargados para ambas poblaciones. No importa la poblacin que se elija como referencia, de hecho, puede usarse un grupo de frecuencias que corresponda a una poblacin de referencia totalmente distinta. El punto es aplicar el mismo grupo de nmeros a las dos poblaciones. Por ejemplo, si se usan los nmeros de neonatos en cada categora de peso al nacer en el pas desarrollado como la referencia y se aplican a las tasas especficas del pas en vas de desarrollo, se tendr
N estndar) Tasa ajustada = E (Tasa x N total estndar = (62.0 x 20) + (20.0 x 30) + (9.0 x 150) 20 + 30 +150 =3 _ 190 o 15.95 por 1 000 200

po de tasas especficas (ya sea de una de las poblaciones que se va a comparar o de cualquier otra), puede usarse un mtodo indirecto para ajustar las tasas. El mtodo indirecto da lugar a una relacin de mortalidad estandarizada que se define como el nmero de muertes observadas dividido entre el nmero de muertes esperadas. Como ejemplo, supngase que se dispone de la distribucin de pesos al nacer tanto de los pases desarrollados como en vas de desarrollo, pero slo se tienen las tasas de mortalidad especficas de otra poblacin, nombrada pp. Nacin estndar en el cuadro 3-12. El nmero esperado de muertes se calcula en cada poblacin mediante las tasas especficas de la poblacin estndar. Para el pas desa. rrollado, el nmero esperado de muertes es
(50.0 x 20) + (20.0 x 30) + (10.0 x 150) = 3100

En esta comune: ilustrar 1 tme 34 pacie Plantean presenta dos punt una o porcen dro 3-14 para el ni mome Cual

la de va CM ente

En el pas en vas de desarrollo, el nmero esperado de muertes es


(50.0 x 30) + (20.0 x 45) + (10.0 x 65) = 3050

Por tanto, la tasa real de mortalidad en el pas en vas de desarrollo ser de 15.95 por 1 000 (en vez de 23.9 por 1 000) si fueron distribuidas las proporciones de los pesos al nacer de los neonatos de igual forma a como se hizo en el pas desarrollado. Para emplear este mtodo de ajuste de tasas deben conocerse las tasas especficas de cada categora de las poblaciones que se vayan a ajustar y las frecuencias en la poblacin de referencia para el factor que se quiera ajustar. A este mtodo se le denomina mtodo directo para estandarizacin de tasas. Mtodo indirecto para ajuste de tasas A veces no se dispone de tasas especificas de una o de las dos poblaciones que se van a comparar. Si se conocen las frecuencias del factor de ajuste, como la edad o el peso al nacer para cada poblacin y se cuenta con cualquier gru-

La relacin de mortalidad estndar (nmero real de muertes dividido entre el nmero esperado) para el pas desarrollado es 2 400/3 100 = 0.77. Para el pas en vas de desarrollo, esta misma relacin es 3 345/3 050 = 1:1. Si la relacin de mortalidad estndar es mayor de 1, como en el pas en vas de desarrollo, la poblacin de inters tiene una tasa de mortalidad mayor que la de la poblacin estndar. Si la tasa de mortalidad estndar es menor de I, como sucede en el pas desarrollado, su tasa de mortalidad es menor que la de la poblacin estndar. Por tanto, el mtodo Oilrecto permite hacer una comparacin relativa. Por el con. trario, el mtodo directo permite hacer una comparacin Cuadro 3-12.Tasa ajustada de mortalidad infantil: mtodo indirecto
Nmero de nacimientos (por 100) Peso al nacer Pas desarrollado < 1 500 1 500 a 2 499 g 2 500 g Nmero de muertes 20 30 150 2 400 Pas en vas de desarrollo 30 45 65 3 345 Tasa de mortalidad especfica por 100 en poblacin estndar 50.0 20.0 10.0

11 11

14
1 1

l'ap In 3)

Resumen y presentacin de datos en cuadros y figuras 41

directa. Si se conocen las tasas de una de las poblaciones de inters, pueden usarse stas, en ese caso la relacin estandarizada de mortalidad para esa poblacin ser de 1.0. Tasa 62.0 20.0 9.0 23.9

CUADROS Y GRFICAS PARA DATOS NOMINALES Y ORDINALES


En esta seccin se describen algunos de los mtodos ms comunes para resumir datos nominales y ordinales. Para ilustrar la forma de construir cuadros para datos nominales, tmense como base los datos del cuadro 3-13 para los 34 pacientes con hemofilia adquirida (Bossi, 1998) del Planteamiento de problema 4. La manera ms sencilla de presentar datos nominales (u ordinal es si no hay demasiados puntos en la escala) es hacer una lista de las categoras en una de las columnas del cuadro y la frecuencia (tonteo) o porcentaje de las observaciones en otra columna. El cuadro 3-14 muestra una manera sencilla de presentar datos para el nmero de pacientes que tuvieron o no hematuria al momento del diagnstico de hemofilia. Cuando se exploran dos caractersticas en una escala nominal, una forma comn de mostrar los datos es en una tabla de contingencia, en la cual los datos se clasifican segn varios factores. Supngase que se desea conocer el nmero de varones y mujeres que tuvieron hematuria al momento del diagnstico, el primer paso es hacer una lista

ablaciones usarse un lo indirecndarizada rvadas di-

e la distriarrollados is tasas de brada po. esperado nte las tapas desa-

de las categoras que aparecern en la tabla: varones con y sin hematuria, as como mujeres con y sin hematuria (cuadro 3-15). Despus se colocan los conteos de cada paciente que tenga los criterios. El paciente 1 cae en la casilla "Varones con hematuria", el paciente 2 cae en la casilla "Mujeres con hematuria" y as hasta el final. En el cuadro 3-15 se muestran los conteos de los primeros siete pacientes. La suma de los conteos de cada casilla se usa despus para construir una tabla de contingencia como la del cuadro 3-16, la cual contiene cuentas de casillas de los 34 sujetos del estudio. A menudo se dan los porcentajes junto con los conteos de las casillas. Para la imagen grfica de datos nominales u ordinales se usan los diagramas de barras. En un diagrama de barras, las cuentas o porcentajes de las caractersticas de categoras diferentes se muestran en forma de barras. Los investigadores de este ejemplo pudieron haber empleado un diagrama de barras para presentar el nmero de pacientes con y sin hematuria (figura 3-9). Las categoras de hematuria (s o no) se colocan en el eje horizontal, o X, y el nmero de pacientes en el eje vertical tienen Y. Los diagramas de barras tambin, o las categoras en el eje vertical y los nmeros en el horizontal. Es comn el uso de otros tipos de grficas, como la circulares y las pictografas, principalmente en diarios, revistas populares y folletos publicitarios. Se emplean en el

)erado de
Nm.

Cuadro 3-13. Datos de 34 pacientes con hemofilia adquirida debida a factor VIII
Edad Sexo Equimosis Hematoma Hematuria Factor VIII < 5 unidades eritrocitarias

e muertes ;arrollado esarrollo, nacin de , 4 pas en la tasa de dar. Si la Lo sucede es menor odo indim el conparacin

1 2 3 4 5 6 7

8 9 lo
11

fantil:
sa de

ecfica 100 en Sacien :andar

50.0 20.0 10.0 y

12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

70 70 75 93 69 85 80 26 33 81 42 74 55 86 71 89 81 82 82 71 32 30 29 78 58 26 51 69 67 44 59 59 40 22

Varn Mujer Mujer Mujer Varn Varn Mujer Mujer Mujer Varn Mujer Varn Varn Mujer Varn Varn Mujer Mujer Mujer Mujer Mujer Mujer Mujer Varn Varn Mujer Varn Varn Varn Varn Mujer Mujer Varn Mujer

S S S S No S No S S Si S S S S Si S S S S S S S S S Si S Si Si S S S S S S

No S S S No Si No S S S S Si S S S S S S S S S S S S S S S S S Si S Si S S

Si S No No S No No S S No No S S S No No No S No S S No No No S No No No No No No No S No

5.0 0.0 1.0 5.0 5.0 6.0 1.0 2.5 3.5 1.3 30.0 0.0 3.0 3.0 6.0 5.0 0.0 1.0 3.0 1.0 2.0 2.0 0.0 13.0 1.0 0.0 3.0 0.0 1.0 3.0 3.0 6.0 3.0 1.0

S No S No No S No No S No No S S No No S S No No S S S No No No Si No S No No S No S No

Fuente: datos usados con autorizacin de Excerpta Medica Inc, de Sossi P, Cabane J, Wat J, Dhote R, Hansl T, Chosidow O, et al.: Acquired hemophilla due to
factor VIII intsbifors in 34 patients. Am J Med 19981 05:400-408.

44 B oestadstica mdica

(Captulo 3)

El coeficiente de correlacin siempre vara de 1 a +1, en el que 1 describe una relacin lineal negativa perfecta (lnea recta) y +1 implica una relacin lineal positiva perfecta. La correlacin 0 significa que no hay relacin lineal entre ambas variables. A veces, la correlacin se eleva al cuadrado (id) para formar una funcin estadstica til llamada coeficiente de determinacin o 12 esta prctica es recomendable. Para los datos del funcionamiento mental, el coeficiente de determinacin es (0.58)2 , o 0.34. Esto quiere decir que 34% de la variabilidad de una de las medidas, como sera el funcionamiento mental a los dos aos, puede ser la causa (o predecir) a partir del conocimiento del valor de la otra medida, el funcionamiento mental basal. Es decir, si se conoce el valor de la calificacin de una mujer anciana en la parte del funcionamiento mental del SMAF y se considera la calificacin dos aos despus, la varianza (desviacin estndar al cuadrado) de la calificacin despus de dos aos se ver reducida en 34%, o alrededor de un tercio. Otras caractersticas del coeficiente de correlacin ameritan ser mencionadas. El valor del coeficiente de correlacin es independiente de las unidades particulares que se emplean para medir las variables, por ejemplo, dos estudiantes de medicina miden la talla y el peso de un grupo de preescolares para determinar la correlacin entre talla y peso. Miden la talla en centmetros y el peso en kilogramos, calculan un coeficiente de correlacin igual a 0.70. Cul sera la correlacin si hubieran usado pulgadas y libras? Desde luego que seguira siendo 0.70 debido a que el denominador de la frmula para el coeficiente de correlacin se ajusta para la escala de las unidades. El valor del coeficiente de correlacin est muy influenciado por los valores extremos, idntico a la desviacin estndar. Por tanto, la correlacin no describe bien la relacin entre dos variables cuando la distribucin de cada una se carga o contiene valores extremos. En esta situacin, debe hacerse una transformacin de datos que modifique la escala de medicin y modere el efecto de los extremos (vase captulo 5) o puede usarse la correlacin de Spearman. Las personas que estn aprendiendo el coeficiente de correlacin suelen preguntar: "qu tan grande debe ser la correlacin?". La respuesta depender de la aplicacin, por ejemplo, cuando se miden las caractersticas fsicas y se dispone de buenos instrumentos de medicin, como sucede en muchas de las ciencias fsicas, es posible hacer correlaciones muy precisas. Sin embargo, en las ciencias biolgicas a menudo participan caractersticas menos definidas y los instrumentos de medicin son imprecisos, en estos casos ocurrirn correlaciones inferiores. Colton (1974) comenta la siguiente regla real para interpretar el tamao de las correlaciones:
Correlaciones de O a 0.25 (o 0.25) indican muy poca o ninguna relacin; las que van de 0.25 a 0.50 (o de 0.25 a 0.50) sealan un grado mnimo de relacin; las que son de 0.50 a 0.75 (o 0.50 a 0.75) implican una relacin de moderada a buena; y las mayores de 0.75 (o de 0.75) sealan una relacin de buena a excelente.

debido a la variabilidad inherente en la mayor parte de las caractersticas biolgicas. Cuando se encuentra una correlacin alta, se debe preguntar si es un error, un artefacto o el resultado de combinar dos poblaciones (ilustrado en el captulo 8). Un ejemplo de un artefacto es cuando el nmero de kilogramos que los pacientes pierden en la primera semana de un programa de dieta se pone en correlacin con el nmero de kilogramos que ellos pierden durante el programa entero del segundo mes. El coeficiente de correlacin mide slo una relacin en lnea recta, de hecho, dos caractersticas pueden tener una fuerte relacin curvilnea, aunque la correlacin sea muy pequea. Por consiguiente, cuando se analizan las relaciones entre dos caractersticas, los datos siempre deben graficarse como se muestra en la seccin Grficas para dos caractersticas. Una grfica ayudar a detectar errores y sesgos en las distribuciones. Finalmente, "correlacin no es igual a causa". El juicio de que una caracterstica causa otra, debe justificarse con base en las observaciones experimentales o argumentos lgicos, no slo en el coeficiente de correlacin.

Ta

Lo rie cul un es net de fac me

Rie El r sim pea la ir pue

Relacin entre dos caractersticas ordinales


La correlacin de rangos de Spearman, a veces llamada rho de Spearman (en honor de su creador) se emplea con frecuencia para describir la relacin entre dos caractersticas ordinales (o una ordinal y otra numrica). Tambin es el mtodo estadstico apropiado para usarse con variables numricas cuyas distribuciones estn cargadas y tengan observaciones extremas. Al calcular la correlacin de rangos de Spearman, simbolizada como rs, participa el ordenamiento por rangos de los valores de cada una de las caractersticas, desde la ms baja hasta la ms alta, despus se tratan los rangos como si fueran valores reales. Aunque la frmula es simple, cuando no hay ajustes en los valores, el clculo es muy tedioso. Como el clculo se encuentra en muchos programas de computadora, se pospone su ejemplificacin hasta el captulo 8, donde se explica con mayo- detalle.

mm 198 cid da) vasc 22 foro' luan dato cid( segu yaq cada dio, 1 riesg mdi

Relacin entre dos caractersticas nominales


En estudios en los que participan dos caractersticas, el inters principal puede ser si stos se encuentran significativamente relacionados (comentado en el captulo 6) o la magnitud de dicha relacin, como la relacin entre un factor de riesgo y la ocurrencia de un resultado determinado. Se usan dos relaciones para estimar esto: la relacin del riesgo relativo y la razn de momios, ambas a menudo referidas como relaciones de riesgo. Por ejemplo, en el planteamiento del problema 3, los investigadores quisieron conocer si la educacin sobre violencia domstica reduce el "riesgo" de que los mdicos no detecten esta condicin. En el contexto de esta explicacin, se presentan algunos conceptos y trminos importantes que se emplean cada vez ms en la literatura mdica y de la salud, incluyendo el nmero de pacientes que necesitan tratarse para observar un resultado positivo.

Facto Fado

Tasa (

Tasa c

Reduc

Nmer

Reduc

Rasgo
Razn

Colton tambin enfatiza el cuidado que se debe tener con correlaciones de 0.95 o mayores en las ciencias biolgicas,

Resumen y presentacin de datos en cuadros y figuras 45

iarte de las una correartefacto o :rado en el o el mmela primera melad& durante el

a relacin den tener [acin sea alizan las mpre deligas para ar errores

Tasas de eventos experimental y control Los conceptos importantes en el cmputo de medidas de riesgo se conocen como tasa de eventos. Con los datos del cuadro 3-18, se tiene inters en el hecho de que ocurra una enfermedad. La tasa de eventos experimentales (TEE) es el nmero de personas que con un factor de riesgo tienen o van a presentar una enfermedad, Al (A + BY La tasa de eventos control (TEC) es el nmero de personas sin el factor de riesgo quienes tienen o van a presentar la enfermedad, C/(C + I). Riesgo relativo El riesgo relativo, o relacin de riesgo, de una enfermedad, simbolizado como RR, es la relacin de la incidencia en personas con el factor de riesgo (personas expuestas) con la incidencia en personas sin este factor (personas no expuestas). Se obtiene al dividir la TEE entre la TEC. The Physicians Health Study (conducido por el Committee of the Physicians Health Study Research Group, 1989) es un estudio clsico emprendido para conocer si el cido acetilsaliclico en dosis bajas (325 mg cada tercer da) reduce la mortalidad en las enfermedades cardiovasculares. Los participantes en este ensayo clnico fueron 22 071 mdicos sanos del sexo masculino asignados en forma aleatoria para recibir el frmaco o placebo y se evaluaron a lo largo de 60 meses. En el cuadro 3-19 estn los datos de infarto del miocardio en mdicos que tomaban cido acetilsaliclico y en los que tomaban placebo. Se di seguimiento a los mdicos que tomaron el medicamento y a quienes tomaron placebo para conocer el nmero de cada grupo que tuvo infarto del miocardio. En este estudio, la ingestin del frmaco asume el papel de factor de riesgo. La TEE es la incidencia de infarto del miocardio en mdicos que tomaron cido acetilsaliclico, 139/11 037 =

0.0126. La TEC es la incidencia de infarto del miocardio en los que tomaron placebo, 239/11 034 = 0.0217. El riesgo relativo de infarto del miocardio con el primero, comparado con el de infarto con placebo es, por tanto:
RR TEE = 111(A + B) _ 139/11037 239/11034 TEC C/(C+ D) = 0.0126 = 0.581 0.0217

. El juicio
umentos

mrse con

mies

llamada plea con icterstinbin es variables tengan t de ranel ordea de las La, des; reales. istes en Indo se se pose se ex-

En vista de que se presentaron menos infartos en el grupo que tom cido acetilsaliclico que en quienes tomaron placebo, el riesgo relativo es menor de 1. Si se toma el nmero recproco y se ve el riesgo relativo de tener un infarto en los mdicos del grupo placebo, el riesgo relativo es 1/0.58 = 1.72. En ese sentido, los mdicos del grupo placebo tuvieron 1.7 ms posibilidades de tener un infarto del miocardio que los mdicos del grupo de cido acetilsaliclico. El riesgo relativo se calcula slo en un estudio de cohorte o en un ensayo clnico en el cual se identifica primero un grupo de personas con el factor de riesgo, y un segundo grupo sin dicho factor, despus se les da seguimiento para determinar las personas que presenten el resultado de inters. En esta situacin, el investigador determina el nmero de sujetos de cada grupo. Reduccin de riesgo absoluto La reduccin del riesgo absoluto (RRA) es una manera de estimar la reduccin del riesgo comparado con el riesgo basal. En los pacientes que en el estudio tomaron cido acetilsaliclico (cuadro 3-19), la TEE para un infarto del miocardio por cualquier causa fue de 0.0126, en el grupo del cido acetilsaliclico y la TEV fue 0.0217 en el gru-

Cuadro 3-18. Disposicin de la tabla y las frmulas de varias medidas importantes de riesgo
Enfermedad Factor de riesgo presente Factor de riesgo ausente A+C Tasa de evento experimentales (TEE) = A (A + B) A No enfermedad A+B

D
B+ D

C+D

5, el insignifilo 6) o rtre un tenni]acin en tido en el squitstica n esta resenue se la satra-

Tasa de eventos control (TEC) =

(C+ D)

Reduccin del riesgo absoluto (RRA) = TEE TEC

Nmero necesario para tratar (NNT) =

1 RRA

=TECI RRA/TEC Reduccin del riesgo relativo (RRR) = ITEE TEC Riesgo relativo (RR) _ TEE _ A/ (A+ 8) TEC C/ (C+ D) Razn de momios (RM) = [A / (A + C)11 [C / (A + C)] = A / C _ AD BC [B / (8 + D)l / [D / (B + D)] B / D

46 Bioestadsica mdica

(Captulo 3)

Cuadro 3-19. Puntos finales cardiovasculares confirmados en el componente del cido acetilsaliclico del Physicians' Health Study, de acuerdo con el grupo de tratamiento
Grupo de cido Grupo placebo acetilsaliclico Nmero de pacientes Punto final Infarto del miocardio Mortal No mortal Total Personas-ao de observacin Evento vascular cerebral Mortal No mortal Total Personas-ao de observacin 11 037 11 034

10 129 139 54 560.0 9 110 119 54 650.3

26 213 239 54 355.7 6 92 98 54 635.8

Fuente: adaptado y reproducido con autorizacin de Steering Committee of the


Physicians' Health Study Research Group: Final report on the aspirin component of the ongoing Physicians. Health Study. N Engl J Med 1989;321:129-135.

mayor que el del estudio de este frmaco en mdicos. Tambin vieron el resultado del evento vascular cerebral e informaron de una RRA en la apopleja isqumica de 39 en 10 000. Con base en sus resultados, el NNT para prevenir un infarto del miocardio fue de 1/0.0137, es decir 72.99 (alrededor de 73 pacientes), y el NNT para prevenir una enfermedad cerebral isqumica fue de 1/0.0039, o 256.41 (casi 257). Al mismo tiempo, el tratamiento con cido acetilsaliclico dio como resultado un incremento en el riesgo de enfermedad cerebral hemorrgica de 12 por cada 10 000 personas. El nmero recproco del ARA, 1/ARA, se llama nmero necesario para daar (NND). Con base en el estudio de He et al. para la enfermedad cerebral hemorrgica, el NND fue de 1/0.0012, o 833. Con estos datos, los autores concluyeron que los beneficios totales del tratamiento con cido acetilsaliclico sobrepasan el riesgo de la enfermedad cerebral hemorrgica.
Reduccin del riesgo relativo

rorr <8( Snd2 respir Muerte

Enferme

:n c rni teo hr Fu

Concepto relacionado, la reduccin del riesgo relativo po placebo. La RRA es el valor absoluto de la diferencia entre ambos grupos:
RRA = ITEE - TECI = 10.0126 - 0.02171 = 1-0.00911 = 0.0091

(RRR), aparece con frecuencia en la literatura mdica. Esta

medida da la cantidad de reduccin del riesgo respecto al riesgo basal, es decir, la TEE menos la TEC dividida entre la TEC (basal). La RRR en el estudio de cido acetilsaliclico en mdicos es
RR =

sibilida' estado momio : de 2x: at no dr neo sinn toa y a la TR

ITEE -TECI
TEC

Una buena manera de interpretar estos nmeros es pensarlos en trminos de eventos por 10 000 personas. Por tanto, el riesgo de infarto del miocardio es de 126 en un grupo que toma cido acetilsaliclico y de 21 7 en el que toma placebo, la RRA es de 91 por 10 000 personas.
Nmero necesario para tratar

= 0.0091 = 0.4194
0.0217

Otra ventaja de interpretar los datos de riesgo en trminos de RRA es que el nmero reciproco, 1/RRA es el nmero necesario para tratar (NNT), es decir, para prevenir un evento. En ese sentido, el nmero de personas que es necesario tratar para evitar un infarto del miocardio es 1/0.0091, es decir, 109.9 (aproximadamente 110 personas). Este tipo de informacin ayuda a los mdicos a evaluar los riesgos y los beneficios relativos de un tratamiento en particular. Con base en los riesgos de tomar el frmaco, piensa que es buena idea prescribirla a 110 personas para prevenir que una de ellas tenga infarto del miocardio? Los artculos de Glasziou et al. (1998) y de S ackett et al. (2000) contienen excelentes comentarios al respecto. Nuovo et al. (2002) discuten la necesidad de incluir el conteo necesario a tratar en los reportes de ensayos clnicos.
Aumento del riesgo absoluto y nmero necesario para daar

o cerca de 42%. La RRR dice que respecto al riesgo basal de 217 infartos del miocardio en 10 000 personas, si reciben cido acetilsaliclico se reduce el riesgo en 42%. Muchos mdicos opinan que la RRA es un ndice ms valioso que la RRR, ya que su nmero recproco es el nmero necesario para tratar. Si un artculo de alguna revista tiene slo RRR, puede (con facilidad) convertirse en RRA mediante la multiplicacin de la TEC, valor que casi siempre se da en el artculo: por ejemplo, 0.4194 x 0.0217 es 0.0091, que es el mismo valor de la RRA que se dio al principio de esta seccin.
Razn de momios

y las po piraton

Al jura se tiene

rm po ua U grn

Es una manera de ver el riesgo en los estudios de casoscontrol. Para comentar sobre la razn de momios, hay que recordar el estudio de Ballard et al. (1998)*, en el cual se estudi el uso prenatal de hormona liberadora de tirotropina (cuadro 3-20). La razn de momios (RM) es la posibilidad de que un paciente con un resultado adverso haya estado expuesto o en riesgo dividido entre la po* Los autores pudieron haber presentado el RR debido a que el estudio fue un ensayo clnico pero decidieron dar la razn de momios. Alguna vez, el uso de la razn de momios se reserv para los estudios de casos y controles. Uno de los mtodos estadsticos empleados cada vez ms en medicina, la regresin logstica, puede presentarse en trminos de la razn de momios. Se explicar este ltimo mtodo con mayor detalle en el captulo 10. En el captulo 8 se explica el aspecto de la significancia estadstica y de las razones de riesgo.

preseni neonat

no tuvo

produc can de

Cuadre Gru AHpo T

Algunos tratamientos o procedimientos aumentan el riesgo de algn efecto o resultado indeseable. En este caso, la diferencia (valor absoluto) entre la TEE y la TEC se denomina aumento del riesgo absoluto (ARA). He et (1998), en su metaanlisis de ensayos al azar sobre el uso del cido acetilsaliclico, descubrieron una RRA de infarto del miocardio en 137 por 10 000 personas, resultado todava

Placebo Total

n3 9at8e; a:1 c l e 9nn Fu

releasii

aptuk 3)

Resumen y presentacin de datos en cuadros y figuras 47

.cos. Tambral e nade 39 en [ prevenir cir 72.99 venir una o 256.41 on cido ato en el por cada , 1/ARA, in base en ilemorr-

Cuadro 3-20. Desenlace de neonatos en los grupos con hormona liberadora de tirotropina y placebo
Neonatos en riesgo Desenlace TRH (N = 392) 260 43 175 Placebo (N = 377) 244 42 157 Razn de momios (IC 95%) 1.1 (0.8 a 1.5) 1.0 (0.6 a 1.6) 1.1 (0.8 a 1 .3) 3 TRH (N = 171) 5 Neonatos sin riesgo Placebo (N = 194) 13 1 2 Razn de momios (IC 95%) 0.4 (0.1 a 1.3) 2.3 (0.1 a 135) 1.7 (02 a 20.7)

Sndrome de insuficiencia respiratoria Muerte S 28 das despus del parto

Enfermedad

pulmonar crnica S 28 das despus del parto

Fuente: datos usados con autorizacin del cuadro 2 en Ballard RA, Ballard PL, Cnaan A, Pinto-Martin J Davis, DJ, Padbury JF, et al.:Antenatal thyrotropin-releasing
hormone to preven lung disease in prete m infants. N Engl J Med 1998:338:493-498.

datos, los iel trata-

:sgo de la

relativo lica. Esta ipecto al da entre cetilsali-

sibilidad de que una persona sin el evento adverso no haya estado expuesta ni en riesgo. Es fcil calcular la razn de momios cuando los resultados se presentan en una tabla de 2 x 2. En el cuadro 3-20 se presentan los nmeros de neonatos que tuvieron sndrome de insuficiencia respiratoria y el reacomodo de los mismos en el cuadro 3-21. En este estudio, la posibilidad de que un neonato con sndrome de insuficiencia respiratoria haya estado expuesto a la TRH es de:
(260/504) = 260 = 1 0656 (244/504) 244

(260) (133) (244) (132)

1.0737

y las posibilidades de que un neonato sin insuficiencia respiratoria haya estado expuesto a la TRH es de
(132/265) = 132 = 0 9025 (133/265) 133

En los estudios de casos-control, el investigador decide la cantidad de personas a estudiar con y sin enfermedad. Esto es contrario a lo que sucede en los estudios de cohorte y en ensayos clnicos, en los cuales el investigador decide el nmero de sujetos con y sin el factor de riesgo, por tanto, la razn de momios debe usarse en los estudios de casoscontrol. Si est interesado en mayores detalles, se recomienda el texto de Epidemiologa elemental, de fcil lectura, de Fletcher et al. (1996). La informacin sobre otras mediciones del riesgo usadas en epidemiologa pueden consultarse en Greenberg (2000).
GRFICAS PARA DOS CARACTERSTICAS

go basal si recil%. ]ice ms es el na revista en RRA tsi siem0217 es e dio al

Al juntar esta posibilidad para obtener la razn de momios se tiene


1.0656 = 1.0737, o = 1:1 0.9925

Una razn de momios de 1:1 significa que un neonato del grupo de TRH tiene 1:1 veces ms de posibilidades de Presentar sndrome de insuficiencia respiratoria que un neonato del grupo placebo. Este riesgo no parece mayor; e casosBallard et al. (1998) reportaron que la razn de momios aay que no tuvo significancia estadstica. cual se 113 A la razn de momios tambin se le llama razn del ora de producto cruzado, ya que puede definirse como la relaAM) es cin del producto de las diagonales en una tabla de 2 x 2: ) advere la poCuadro 3-21. Datos para razn de momios de neonatos de 32 semanas de gestacin o antes
Grupo TRH Placebo Total Con insuficiencia respiratoria 260 244 504 Sin insuficiencia respiratoria 132 133 265 Total 392 377 1

a que el azn de reserv ntodos gresin nomios. el capficancia

Fuente: datos usados con autorizacin del cuadro 2 en Ballard RA, Ballard PL, Cnaan A, Pinto-Martin J, Davis, DJ, Padbury JF, et al.: Antenatal thyrotropinreleasing hormone to preven( lung disease in preterm infants. N Engl J Med 1998;338:493-498.

La mayor parte de los estudios de medicina estudian ms de una caracterstica, y las grficas que muestran la relacin entre dos caractersticas son frecuentes en los textos mdicos. No hay una grfica para mostrar la relacin entre dos caractersticas cuando ambas se miden en escala nominal; los nmeros se presentan en tablas de contingencia. Cuando una de las caractersticas es nominal y la otra numrica, los datos pueden mostrarse en grficas de caja como la de la figura 3-6, o como grficas de error, como en la figura 3-8. En medicina tambin son frecuentes las grficas bivariadas (conocidas como grficas de dispersin o diagramas de dispersin) para ilustrar la relacin entre las dos caractersticas cuando ambas se miden en escala numrica. En el estudio de Hbert et al. (1997), se obtuvo informacin sobre el funcionamiento mental de cada paciente en tres momentos, con un ao de diferencia. El recuadro 3-1 contiene datos de dispersin de las calificaciones del funcionamiento mental en los tiempos 1 y 3 en mujeres de 85 aos y mayores. Una grfica de dispersin se construye dibujando ejes X y Y; la caracterstica, se supone, que explica o predice, o la que ocurre primero (a veces llamada factor de riesgo), se coloca en el eje X. La caracterstica que se explicar o predecir, o la que ocurre en segundo lugar, se coloca en el eje de las Y. En aplicaciones en las cuales la hiptesis es una

48 Bioestadstica mdica

(Captulo 3)

in
Estudios de correlacin de Pearson

Dispersin de calificaciones de funcionamiento mental 12.0 CO o E 10.0 e

ao
E o

6.0 4.0

recta. Con una correlacin de 0.58, es de esperarse una forma oval del grfico de dispersin de los datos, como en el recuadro 3-1. Generalmente, el uso de tablas o grficas se basa en el propsito de la presentacin de los datos. Las tablas contienen muchos detalles y pueden desplegar informacin sobre varias caractersticas, pero stas requieren una lectura y sntesis que puede llevar mucho ms tiempo. Las grficas se presentan como un cuadro de fcil interpretacin de los datos y son las ms apropiadas cuando la meta es ilustrar la distribucin o las frecuencias sin detalles especficos.

o u u_

2.0

EJEMPLOS DE DIAGRAMAS Y GRFICAS ENGAOSAS


00 2.0 4M 6.0 8.0 10.0

0. 0

Funcionamiento mental en tiempo 1

Estudio de correlaciones de Pearson


Tiempo 1 Tiempo 1 Tiempo 3 1.000000 0.582715 Tiempo 3 0.582715 1.000000

Fuente: datos usados con autorizacin de Oxford University Press, de Hbert R, Brayne C, Spiegelhalter D: Incidence of functional decline
and improvement in e community-dwelling very elderly population. Am J Epidemiol 1997;145: 935-944. Grfica producida por el NCSS; usada con autorizacin.

causal, no importa el eje elegido. Cada observacin se representa con un punto pequeo; por ejemplo, el crculo del extremo inferior derecho del recuadro 3-1 representa al sujeto 237, el cual tuvo una calificacin basal de 7 y otra de 1, dos aos despus. En el captulo 8 se ampla la informacin para interpretar los grficos de dispersin, por tanto, aqu se ver que los datos del recuadro 3-1 sugieren la posibilidad de una relacin positiva entre ambas calificaciones. En este punto no puede decirse si la relacin es significativa o slo indica azar, este tema se explicar en el captulo 8. Se puede observar que pocos datos indican lo que ocurre en el recuadro 3-1 que en el cuadro 3-17. Esto resulta cuando varios datos tienen el mismo valor. Tanto los NCSS y los SPSS tienen una opcin para el uso de "girasoles" en los cuales cada ptalo de girasol permace para una observacin Como nota final, hay correspondencia entre el tamao del coeficiente de correlacin y una grfica de dispersin de las observaciones. Tambin se incluyen en el recuadro 3-1 los datos del programa NCSS para obtener el coeficiente de correlacin. Recurdese que una correlacin de 0.58 indica una relacin de moderada a buena entre estas dos calificaciones de la funcin mental. Cuando la correlacin es cercana a O, la forma del patrn de los resultados es ms o menos circular. Al acercarse el valor de la correlacin a +1 o I, la forma se vuelve ms elptica, hasta que en +1 y 1 los resultados forman una lnea

relacin no

La calidad de los diagramas y las grficas publicadas en la literatura mdica es superior al de los esquemas impresos en la prensa popular. El problema ms importante de las grficas (as como de las tablas y los cuadros) en las revistas mdicas es su complejidad. Muchos autores intentan presentar demasiada informacin en una sola grfica, de manera que al lector le toma ms tiempo entenderla. El propsito de los cuadros y grficas es presentar informacin (por lo general basada en gran cantidad de observaciones) de manera concisa para que el lector pueda comprenderla y recordarla con mayor facilidad. Los diagramas, cuadros y grficas deben ser sencillos, as como de fcil comprensin para el lector, y deben complementarse con leyendas y seales completas. Conocer los errores comunes ayuda a interpretar de manera correcta la informacin de los artculos y las presentaciones. Se ejemplifican cuatro errores que se han visto con la suficiente frecuencia como para ameritar su explicacin. Se emplean ejemplos hipotticos para ilustrar estos errores, lo que no implica necesariamente que hayan ocurrido en la presentacin de los problemas utilizados en este texto. Si se est interesado en aprender ms sobre las tablas y la construccin de grficas, el trabajo de Wainer (1992) hace las recomendaciones para el diseo de tablas para datos. Spirer et al. (1998) proporcionan una explicacin sobre grficas; por su parte. Briscoe (1996) hace sugerencias para mejorar todos los tipos de presentaciones y carteles, as como publicaciones. Un investigador puede lograr un cambio ms o menos importante a partir de la seleccin del punto de inicio de una grfica, ya sea antes o despus de que inicie el cambio. La figura 3-10A muestra la disminucin en la mortalidad anual de una enfermedad empezando en 1960 y continuando con la mortalidad proyectadas hasta al 2010. La mayor reduccin en la mortalidad por este padecimiento ocurri en el decenio de 1970. Aunque no es incorrecta, la grfica que inicia en 1980 (figura 3-10B) subestima la disminucin e implica que el cambio ha sido mnimo. Si los valores en el eje Y son mayores, no podr dibujarse toda la escala. Por ejemplo, un investigador quiere ilustrar el nmero de muertes por cncer iniciando en 1960 (cuando hubo 200 000 fallecimientos) hasta el ao 2010 (cuando se espera que haya 600 000). Aunque la escala

Figura mentos mortalic

vertica

interrt incom mayor


Sin

La figi del ce: ao, la error c porqu( terstic res usa. alguno tambii dejarse La o dism vertica edades La figu las eda morir magna ores y I El vantes, estn ir los pac interesa suele s( del con centaj e seguro, nera qu Los por

(Captulo 3)

Resumen y presentacin de datos en cuadros y figuras 49

perarse una os, como en

12 10 o o 8 g

600 500 400 300 200 960 1970 1980 1990 Ao 2000 2010

ie basa en el tablas connformacin en una lec-iem po. Las interpretaido la meta detalles es-

-2

o
A

Muertes (en miles)

o o o
A 6 o 4

o
1960 1970 1980 Ao 1990 2000 2010

2 0 B

2 0 21980 1990 Ao 2000 2010 Muertes (en miles)

600 500 400

%idas en la esquemas la ms imablas y los dad. Mumacin en ns tiemrficas es gran canme el lecfacilidad. cilios, as ien com-

Figura 3-10. Ilustracin del efecto de mostrar un cambio en dos momentos diferentes. A: mortalidad de una enfermedad desde 1960. B: mortalidad de una enfermedad desde 1980.

300 200

fletar de / las prehan visto explicarar estos yan ocu,ados en :obre las Wainer e tablas explicase y

menos lidia de :ambio. talidad conti110. La mento acta, la la dis-

dibuamere 1960 2010 escala

vertical sea en miles, debe variar de 200 a 600. Si no se interrumpe el eje Y, el mensaje implcito es impreciso, la incomprensin de la escala hace que el cambio se vea mayor de lo que es en realidad. Este error, llamado supresin del cero, es comn en histogramas y grficas lineales. La figura 3-11A ilustra el efecto que tiene la supresin del cero sobre el nmero de muertes por cncer y por ao, la figura 3-11B ilustra la construccin correcta. El error de la supresin del cero es ms grave en Y que X, Porque la escala de Y representa la magnitud de la caracterstica de inters. En la actualidad, muchos investigadores usan programas de computadora para hacer sus grficas; algunos dificultan o imposibilitan controlar la escala Y (y tambin X). Como lectores, es necesario estar atento y no dejarse confundir involuntariamente por esta prctica. La magnitud del cambio tambin puede incrementarse o disminuirse a partir de la seleccin de la escala en el eje vertical. Por ejemplo, un investigador desea comparar las edades al morir en un grupo de varones y otro de mujeres. La figura 3-12A, al suprimir la escala, muestra que todas las edades tanto de los varones como de las mujeres al morir son similares; la figura 3-1213, al reducir la escala, fi magnifica las diferencias de la edad al morir entre hombres y mujeres. El ejemplo final es un cuadro que da porcentajes irrele1 vantes, un error comn. Supngase que los investigadores estn interesados en la relacin entre el grado de apego de los pacientes y el tipo de cobertura de su seguro. Cuando interesan dos o ms mediciones, el propsito del estudio suele ser determinar cul de las dos medidas est dentro del contexto de la otra. El cuadro 3-22A muestra el porcentaje de pacientes con diferentes tipos de cobertura de seguro, con tres niveles de apego de los pacientes, de mao o nera que el total de porcentajes de cada columna es 100%. Los porcentajes del cuadro 3-22A tienen sentido si el in-

o
B 1960 1970 1980 1990 Ao 2000 2010

Figura 3-11. Ilustracin del efecto de suprimir el cero en Y para grficas que muestran fallecimiento por cncer. A: sin interrupcin de la lnea en Y. B: interrupcin de la lnea bien hecha en Y.

vestigador desea comparar el tipo de cobertura del seguro de los pacientes con grados especficos de apego, es posible concluir, por ejemplo, que 35% de los pacientes con grado bajo de apego no tiene seguro.

100 90 o 80

Edad al morir (aos)

tu

SI 70

E E 60 Te 50 40 O

A Varones Mujeres

Varones Mujeres

Figura 3-12. Ilustracin del efecto de suprimir o estirar la escala en grficas que muestran la edad al fallecer. A: supresin de la escala. B: estiramiento de la escala.

50 Bioestadstica mdica

(Captulo 3)

Se compara esta interpretacin con la obtenida si los porcentajes se calculan con el estado del seguro, como en el cuadro 3-22B, en l los porcentajes de cada fila suman un total de 100%. Del cuadro 3-22B puede concluirse que 55% de los pacientes sin cobertura de seguro tienen un grado bajo de apego. En otras palabras, el formato del cuadro debe reflejar los objetivos buscados en el estudio. Si se examina una medida para ver si explica otra, como el estado del seguro explica el apego, los investigadores deben presentar los porcentajes dentro de la medicin explicatoria. PROGRAMAS DE COMPUTADORA

RESUMEN El captulo presenta dos importantes conceptos bioestadsticos: las diferentes escalas de medicin usadas en medicina y los mtodos apropiados tanto para resumir como para mostrar la informacin, segn la escala empleada. Algunas de las medidas resumidas en este captulo son la base de las pruebas estadsticas que se presentan en los siguientes captulos. El nivel ms simple de medicin es la escala nominal, tambin llamada categorial o cualitativa. Las escalas nominales miden las caractersticas que pueden clasificarse en categoras; se cuenta el nmero de resultados de cada; categora. Con frecuencia se usan proporciones, relaciones y porcentajes para resumir los datos de las categoras. Las caractersticas nominales se muestran en tablas de contingencia y en grficas de barras. Las escalas ordinales se usan para caractersticas que tienen un orden subyacente. Las diferencias entre los valores en la escala no son iguales a lo largo de la misma. Como ejemplo se tienen varias enfermedades que se organizan en diversos esquemas con 4 o 5 categoras que se agrupan de acuerdo con la severidad del padecimiento. La mediana, los percentiles y la variacin son medidas resumidas de eleccin, ya que son las menos afectadas con las mediciones extremas. Las caractersticas ordinales, al igual que las nominales, se muestran en tablas de contingencia y grficas de barras. Las escalas numricas son el nivel ms elevado de medicin, tambin se les llama escalas de intervalo o cuantitativas. Las caractersticas medidas en una escala numrica pueden ser continuas (toman cualquier valor en la lnea de los nmeros) o discretas (toman slo valores enteros). Se recomienda usar la media con los resultados que tengan distribucin simtrica. La mediana, una medida tambin de la mitad, se emplea con observaciones ordinales o numricas que tengan distribucin cargada. Cuando sea apropiado utilizar la media para describir la mitad, es apropiado utilizar la desviacin estndar con el fin de describir la dispersin o variacin de los resultados. El valor de la desviacin estndar se ve afectado por valores extremos o cargados, que deban usarse los percentiles o variaciones intercuartilares con las observaciones para las que es apropiada la media. La variacin proporciona informacin sobre valores extremos, pero no brinda ningn dato sobre la manera en que se distribuyen los resultados. Una manera fcil de determinar si la distribucin de datos es simtrica o est cargada, es crear un histograma o una grfica de caja. Otros mtodos grficos son el polgono de frecuencias, las grficas lineales y las grficas de error. Aunque cada mtodo proporciona informacin acerca de la distribucin de las observaciones, las grficas de caja son muy tiles para mostrarlas en forma concisa, ya que dan una idea con una sola mirada a dicha distribucin. Los grficos de tronco y hojas combinan caractersticas de las tablas de frecuencias y de los histogramas, muestran las frecuencias y la forma de la distribucin. Las tablas de frecuencias resumen las observaciones numricas, la escala se divide en clases y se cuentan los nmeros de datos de cada clase Tanto las frecuencias como los porcentajes se usan a menudo en las tablas de frecuencia.

"cr

Como ya se mencion, se han dado ejemplos de progra2 mas de computadora diseados especialmente para k analizar los datos estadsticos. En la medida de lo ' posible, se reproduce la forma real obtenida al analizar las observaciones de los planteamientos de problemas, aun cuando por lo general las formas tienen procedimientos estadsticos que todava no se comentan. Se discuten aspectos importantes de las formas, mientras tanto, se debe ignorar la informacin desconocida; en captulos siguientes se explicarn muchos mtodos estadsticos. Los programas estadsticos de computadora estn diseados para satisfacer las necesidades de los investigadores de diversos campos; por tanto, algunas de las impresiones de las estadsticas rara vez se usan en estudios mdicos, de aqu que no se incluyan en este libro. En este libro se usan ejemplos de varios programas estadsticos, como NCSS, SPS S, y JMP; los ms usados son los dos primeros. En los captulos siguientes tambin se usan programas especializados para calcular el tamao de la muestra necesaria para un estudio.
Cuadro 3-22. Efecto de calcular los porcentajes en columnas contra porcentajes en filas para estudiar el apego a los frmacos contra cobertura de seguro
A. Porcentajes basados en grado de apego (% de columnas) Grado de apego con frmacos Cobertura de seguro Medicaid Medicare Medicaid y Medicare Otros seguros Sin seguro Baja 30 20 5 10 35 Media 20 25 5 30 20 Alta 15 30 5 40 10

Cui minal y grficas cin de caracter El c cin que po de ir se utiliz Cuando calculan el riesgo ambas o Se t orao el como el desviaci, formas realizad( tales urb de 934 1 imagen dio de o perfusor EP. El ch nando e jetivas, 5 estudian dividual: ron usar (captuli de choq men de a moptisis yeron un para defi de proba Hb ma 2, se cionales de los su las grfic al. repor dicaron significar ligacin:

s a l o l ei es d htio uln d p Pe

B. Porcentajes basados en cobertura de seguro

(% de filas)

Grado de apego a los frmacos Cobertura de seguro Medicaid Medicare Medicaid y Medicare Otros seguros Sin seguro Baja. Media 45 25 33 15 55 30 35 33 35 30 Alta 25 40 33 50 15

todas y una seg clinacin sexo. Es i cin furn declinaci diaria) er res propi efecto de dia ter discapaci

!Captulo 3)

Resumen y presentacin de datos en cuadros y figuras 51

s bioestadsa medicina y ro para mos.gunas de las de las pruees captulos. la nominal, escalas noclasificarse los de cada Les, relaciocategoras. )las de con-

rsticas que ntre los vala misma. que se mujas que se miento. La didas resudas con las les, al igual ntingencia

ido de meo cuantitanumrica la lnea de teros). Izados que la medida s ordinales :uando sea d, es aproe describir Talor de la xtremos o ariaciones le es aprolacin so:o sobre la

Ducin de :ograma o el polgos de error. acerca de e caja son L que dan Los grfilas tablas frecuenecuencias se divide ada clase. can a me-

Cuando las mediciones son de una caracterstica nominal y otra numrica, los polgonos de frecuencia, las grficas de caja y las grficas de error ilustran la distribucin de las observaciones numricas de cada valor de la caracterstica nominal. El coeficiente de correlacin indica el grado de relacin que hay entre dos caractersticas sobre el mismo grupo de individuos. La correlacin del rango de Spearman se utiliza para dos observaciones, cargadas u ordinales. Cuando se miden las caractersticas en escala nominal y se calculan las proporciones para describirlas, puede usarse el riesgo relativo o la razn de momios para medirla entre ambas caractersticas. Se utilizaron datos del estudio de Kline et al. (2002) Para ilustrar el clculo de pruebas estadsticas comunes, como el resumen de datos del tipo de la media, mediana y desviacin estndar, as como para proporcionar algunas formas tiles para mostrar los datos en grficas. El estudio, realizado en los departamentos de urgencias de siete hospitales urbanos, implic la obtencin prospectiva de los datos de 934 pacientes a los que se haba realizado estudios de imagen de la vasculatura pulmonar (TC del trax con medio de contraste o gammagrama pulmonar ventilatorio y perfusorio [gammagrama V/Q] por la sospecha clnica de EP. El diagnstico definitivo de EP se estableci combinando estudios de imagen vasculares y otras pruebas objetivas, y el seguimiento telefnico por seis meses. Dos estudiantes de medicina entrevistaron a cada paciente individualmente para obtener datos clnicos que se analizaron usando pruebas de regresin logstica multivariada (captulo 10) para seleccionar seis variables (edad, ndice de choque, hipoxemia inexplicable, aumento de volumen de miembro plvico unilateral, ciruga reciente y hemoptisis) asociadas significativamente con EP. Construyeron una "regla de decisin" utilizando estas seis variables para definir un grupo de alto riesgo de pacientes con 40% de probabilidad ms alto para presentar EP. Hbert et al. (1997), en el Planteamiento de problema 2, se centraron en la discapacidad y los cambios funcionales en ancianos. En este captulo se usaron los datos de los sujetos de 85 aos de edad y mayores para ilustrar las grficas de tronco y hojas y la grfica de caja. Hbert et al. reportaron que las calificaciones basales del SMAF indicaron que las mujeres tuvieron una discapacidad ms significativa que los varones para las actividades de movilizacin y formacin mental, las mujeres fueron ms independientes en actividades tiles de la vida diaria (labores del hogar, compras, uso de frmacos, manejo del presupuesto). En general, los sujetos mostraron declinacin en todas las reas de funcionamiento entre la entrevista banal y una segunda entrevista realizada un ao despus. La declinacin funcional se relacion con la edad, mas no con el sexo. Es interesante notar que la declinacin de la calificacin funcional no fue significativa (salvo por una ligera declinacin en las actividades instrumentales de la vida diaria) entre la segunda y la tercera entrevistas. Los autores propusieron tres explicaciones para este fenmeno: efecto de piso, efecto de supervivencia y regresin a la media temas que se explican en captulos siguientes. La discapacidad es una de las medidas importantes de trmi-

no en los estudios en poblaciones de ancianos. Tambin se revis la relacin entre las calificaciones del SMAF basales y dos aos despus en este estudio, encontrndose una relacin de moderada a buena entre las mediciones. Los resultados del estudio realizado por Lapidus et al. (2002) para detectar la violencia domstica (Planteamiento de problema 3) se utilizaron para ilustrar que las proporciones y los porcentajes pueden usarse intercambiablemente para describir la relacin de una parte con el todo; las tasas relacionan a estos dos elementos. Al calcular una proporcin en un periodo, su resultado se denomina tasa. Se definieron e ilustraron algunas de las tasas ms usadas en medicina. Para comparar las tasas entre dos poblaciones diferentes, stas deben ser similares respecto a las caractersticas que pudieran afectar a dicha tasa, se necesitan las tasas ajustadas cuando estas caractersticas difieren entre las poblaciones. Con frecuencia, en medicina se ajustan las tasas a las disparidades de la edad. Las tablas de contingencia muestran dos caractersticas nominales medidas en el mismo grupo de sujetos. Los diagramas de crculo y barras son formas comunes para ilustrar los datos nominales. La hemofilia adquirida es una enfermedad rara que pone en peligro la vida, y es causada por autoanticuerpos dirigidos contra el factor VIII. A menudo se acompaa de otros padecimientos. En el Planteamiento de problema 4, Bossi et al. (1998) estudiaron las caractersticas y resultados de 34 pacientes con la enfermedad. Los resultados del estudio ayudan a los mdicos a entender la presentacin y la evolucin clnica de la hemofilia adquirida. Los tratamientos incluyeron la administracin de factor VIII porcino, frmacos inmunosupresores e inmunoglobulina por va intravenosa. Los investigadores sealan adems, la necesidad de efectuar estudios al azar y controlados para valorar los distintos tratamientos. El estudio de Ballard et al. (1998) encontr que la administracin prenatal de hormona liberadora de tirotropina no tuvo efecto en el desenlace a nivel pulmonar de los prematuros. No hubo diferencias significativas entre los grupos de tratamiento y de placebo en la incidencia de sndrome de insuficiencia respiratoria, muerte y enfermedad pulmonar crnica. Se utilizaron los datos para mostrar la razn de momios para insuficiencia respiratoria y los resultados aqu obtenidos (no significativos) fueron acordes con los resultados obtenidos por los autores. Los investigadores concluyeron que el tratamiento con hormona liberadora de tirotropina no est indicado para mujeres en riesgo de tener productos prematuros.

1. Demostrar que la suma de las desviaciones de la media es igual a O a partir de los datos de la suma de las desviaciones para la variacin de la frecuencia cardiaca del cuadro 3-3. 2. Cul es la forma ms factible de distribucin de los resultados de los siguientes estudios?

52 Bioestadstica mdica

(Captulo 3)

de rodilla. Un bajo aumento de volumen se relaci on con una estancia prolongada en el hospital. Q u mtodo grfico es mejor para demostrar la relaci n entre el aumento de volumen y la frecuencia de complicaciones?. 6. Qu medidas de tendencia central y de dispersin son las ms apropiadas de usar con los siguientes grupos de datos? a. Salarios de 125 mdicos en una clnica. b. Calificaciones de todos los estudiantes de medicina que tomaron la Fase I del USLME del Examen d el Consejo Nacional en un determinado ao. Fuente: da c. Concentraciones sricas de sodio de individuo of norma sanos. d. Nmero de articulaciones dolorosas en 30 articula 11)e - 11 ciones evaluadas en exploraciones estndar para ac DE= ; b. Lo tividad de enfermedad en sujetos con artriti n aje reumatoide. rer e. Presencia de diarrea en un grupo de nios. Ilustrar cmo el valor de la desviacin estndar calcuc. C Etapas de la enfermedad en un grupo de paciente lado por esta frmula es equivalente al encontrado rice con sndrome de Reye (seis etapas, que van desd e con la frmula definitoria usando los datos del ndice lids O = despierto y alerta, hasta 5 = no despierto, par de choque en el cuadro 3-3. De la seccin tiulada pos lisis flcida, arreflexia, pupilas sin respuesta). Desviacin estndar, el valor de la desviacin estndar 12. De su g. Edad al inicio del cncer de mama en mujeres. del ndice de choque usando la frmula definitoria es y Lens h. Nmero de pastillas dejadas en los envases de me 0.27. (Utilizar las sumas del cuadro 3-3 para hacer cerebx dicamento de los pacientes cuando los investigado algunos clculos.) en jv res de un estudio las contaron para evaluar la cons5. Las siguientes preguntas dan descripciones breves de ron a tancia para ingerir los medicamentos. algunos estudios, quiz se desee consultar los artcuadmiti 7. Examinar el patrn de distribucin de la variacin melos referidos para tener ms informacin. reados dia de la frecuencia cardiaca para los diferentes grua. Khalakdina et al. (2003) reclutaron a pacientes con al misn pos de edad del cuadro 3-23 (Gelbert et al. 1997). criptosporidiosis y controles pareados por edad. Los cos agt Qu se ve?, cmo podra saber si la giba es correcta sujetos en ambos grupos fueron entrevistados va drogas o no? telefnica para obtener informacin sobre exposien el a 8. La correlacin entre edad y variacin de la frecuencia ciones anteriores. Qu estadstica es mejor para re13. Ejercicii cardiaca es -0.45 (Gelbert et al. 1997). Cmo intersumir los hallazgos? Moore preta este valor?, cules son las implicaciones de los b. Brown et al. (2003) estudiaron un grupo de 68 adulsiguient valores normales para la variacin de la frecuencia tos alrgicos a las picaduras de hormiga; cada sujeto a. Cul cardiaca? fue asignado al azar para recibir inmunoterapia con b. Cul 9. Refirase a la figura 3-2 para responder a las siguienveneno o un placebo. Despus de una picadura, se c. Por cr tes preguntas: registraron todas las reacciones, qu estadstica es d. Exam: a. Cul es el peso medio de las nias de 24 meses de mejor para resumir los resultados? les son edad? c. Se cuestiono a estudiantes de medicina para evaluar e. Examia b. Cul es el percentil 90 de la circunferencia de la su competencia para realizar exmenes para detecmuesti cabeza para las nias de 12 meses de edad? cin en diversos tipos de cncer en un estudio por rones r c. Cul es el percentil 5 del peso para las nias de 12 Lee et al. (2002). Qu estadstica sera mejor para meses de edad? resumir el promedio de las opiniones de los estu- 10. E ncontrar el coeficiente de variacin del cambio mediantes en cada competencia? io en las unidades de eritrocitos en varones y mujed. Grodstein et al. (2000) examinaron los datos de es con los datos de Bossi et al. (1998). En alguno de Nurses' Health Study para estudiar la relacin entre 1os sexos se ve una mayor variacin relativa en la ca la duracin de terapia hormonal posmenopusica y idad de eritrocitos? el riesgo de enfermedad coronaria cardiaca en las 11. Refirase al Physicians' Health Study (Steering Committee mujeres. Qu estadsticas son mejores para descrif the Physicians' Health Study Research Group, 1989) en birla distribucin de la duracin del tratamiento en el cuadro 3-19 para responder a las siguientes preguntas: quienes desarrollaron y las que no experimentaron a. Los autores emplearon personas-ao de observa enfermedad coronaria cardiaca en consecuencia? clon para calcular la razn de momios. Calcular la s Qu mtodos grficos son los apropiados? razn de momios a partir de los datos de personas. e. Kreder et al. (2003) estudiaron el efecto del increao y comparar el valor con el obtenido. Expresar mento del volumen en la frecuencia de complicaalgunas razones acerca de la similitud en la magni. ciones en los pacientes despus de artroplastia total tud. En qu circunstancias podran diferir?

a. Edad de los pacientes en un estudio de pacientes con enfermedad de Crohn. b. Nmero de recin nacidos trados al mundo por todos los obstetras de una gran ciudad el ao 2000. c. Nmero de pacientes trasladados a un hospital de tercer nivel procedentes de otros hospitales de la regin. 3. Dibujar los polgonos de frecuencia para comparar las calificaciones SMAF de varones y mujeres sobre la funcin mental en el momento 1 en el estudio de Hbert et al. (1997); repetir para el tiempo 2. Cul es su conclusin? 4. La frmula computacional para la desviacin estndar es:

'9'

?aptulo 3)

Resumen y presentacin de datos en cuadros y figuras 53

se relacio>ital. Qu la relacin uencia de

Cuadro 3-23.Tabla de frecuencias que muestra la VAR dividida en grupos de edad de 10 aos
Variacin de frecuencia cardiaca Edad 11 a 20 21 a 30 31 a 40 41 a 50 51 a 60 61 a 70 = 70 Total

Cuenta
52 162 144 78 20 23 11 490

Media 63.0 57.6 51.1 39.6 34.0 29.1 16.8

Mediana 57.6 56.1 48.3 37.6 32.3 23.5 17.3

Mnima 24.0 13.3 14.0 9.4 7.2 3.3 2.1

Mxima 150.9 124.4 128.9 105.5 85.7 70.9 28.3

dispersin entes gru-

. medicina camen del o. ndividuos

Fuente: datos utilizados con autorizacin del autor y editor de Gelber DA, Pfeffer M, Dawson B Shumer M: Cardiovascular autonomic nervous system tests. Determination of normative values and effect of confounding variables. J Auton Nerv Syst 1997;62:40-44, Cuadro elaborado con el NCSS; utilizado con autorizacin.

3 articulaar para acn artritis

pacientes van desde ?rto, parsta). ti eres. es de mezestigadoir la cons-

acin meentes grua". 1997). s correcta

secuencia pm internes de los s siguienmeses de

secuencia

ncia de la 1? as de 12

b. Los autores tambin calcularon la razn de momios ajustada para edad y uso de R carotenos. Qu quieren decir con este enunciado? c. Cmo podra contribuir el efecto de los voluntarios sanos, al hallazgo de no diferencias en la mortalidad total por causas cardiovasculares entre los grupos de cido acetilsaliclico y placebo? 12.De su experiencia en un hospital pblico urbano, Kaku y Lowenstein (1990) notaron que el evento vascular cerebral se relacionaba con el uso frecuente de drogas en jvenes. Para investigar el problema, se identificaron a todos los pacientes entre 15 y 44 aos de edad admitidos en el hospital y se eligieron controles pareados por sexo y edad de los pacientes que ingresaron al mismo hospital con problemas mdicos o quirrgicos agudos, en los cuales no se demostr abuso de drogas como factor de riesgo. Los datos se presentan en el cuadro 3-24. Cul es la razn de momios? 13. Ejercicio en grupo. Obtener una copia del estudio de Moore et al. (1991) en la biblioteca y contestar las siguientes preguntas: a. Cul fue el propsito del estudio? b. Cul fue el diseo del estudio? c. Por qu hubo dos grupos de pacientes en el estudio? d. Examinar la grfica de la figura 1 del artculo. Cules son las conclusiones posibles obtenidas? e. Examinar las grficas de la figura 2 del artculo. Qu muestra esta grfica acerca del grado de pH en varones normales sanos?

14. Ejercicio en grupo. Es importante que las escalas recomendadas para que los mdicos evalen el riesgo de tomar decisiones sean confiables y vlidas. Elegir un rea de inters y consultar algunos artculos de revistas que describan escalas o reglas de decisin. Evaluar si los autores presentaron evidencia adecuada para reproducir y validar esas escalas. Qu tipo de reproduccin se estableci?, qu tipo de validez?, son suficientes para garantizar el uso de la escala? (p. ej., si se est interesado en evaluar el riesgo quirrgico en ciruga no cardiaca, pueden consultarse los artculos acerca del ndice del riesgo cardiaco hechos por Goldman [1995] y Goldman et al. [1977], as como el informe de seguimiento del ndice creado por Detsky y colaboradores [1986] .)
Cuadro 3-24. Datos de razn de momios para evento vascular cerebral con antecedentes de abuso de drogas
Evento vascular cerebral Abuso de drogas Sin abuso de drogas Total 73 141 214 Control

18 196 214

Fuente: reproducido con autorizacin de Kaku DA, Lowenstein DH: Emergency of recreational drug abuse as a major risk factor for stroke in young adults. Ann Intern Med 1990;113:821-827_

-rabio me- u s y mujealguno de a en la can-

_Toinmittee 1989) en 1 preguntas: observa'alcular la 1 personasExpresar la magni- o ir?

You might also like