You are on page 1of 5

www.medigraphic.org.

mx

Investigacin
Vol. 80, Nm. 1 Enero-Febrero 2013
pp 30-34

Cmo seleccionar una prueba estadstica


(Primera de dos partes)
(Choosing a statistical test. First of two parts)

Manuel Gmez-Gmez,* Cecilia Danglot-Banck,* Leopoldo Vega-Franco**

RESUMEN

La eleccin de una prueba en estadstica depende: 1) Del tipo de diseo que se us en la investigacin. 2) De la pregunta o pre-
guntas que se hizo el autor. 3) Del inters particular de los autores. 4) De la distribucin de los datos obtenidos en uno, dos o ms
grupos. 5) De la manera como se recopilaron los datos. 6) Del potencial de sesgo y confusin de los datos obtenidos.
En esta contribucin se examina cmo definir los tipos de datos, la comprobacin de las hiptesis planteadas y cmo elegir la
prueba estadstica ms adecuada para plantear una conclusin.

Palabras clave: Estadstica paramtrica, estadstica no paramtrica, variables, pruebas de hiptesis, pruebas estadsticas.

SUMMARY

The choice of a test in statistics depends on: 1) The type of research design. 2) Which is the question of research. 3) The outcome of
interest. 4) Data distribution in one, two o more groups. 5) In the manner of collection of data. 6) The potential of bias and confusion.
This article examines the types of data, hypothesis testing and how to choose the most appropriate statistical test.

Key words: Parametric statistics, non-parametric statistics, variables, hypothesis testing, statistical tests.

Los principales diseos en la investigacin mdica se Al revisar el diseo de un estudio planeado de


pueden dividir en dos grupos: los estudios de interven- manera apropiada para responder a las preguntas
cin con pruebas clnicas o experimentales y los estu- planteadas por el investigador, se debe analizar, en
dios observacionales; los que pueden ser descriptivos, primer lugar, si los objetivos del estudio se definieron
como en este caso o serie de casos o una encuesta, un de manera correcta y si las hiptesis se formularon
estudio transversal o uno de prevalencia. Los de tipo de manera clara; 3 luego, el investigador debe con-
analtico son estudios transversales; unos con relacin siderar si el tamao de la muestra en el estudio es
a casos clnicos o bajo control teraputico y eventual- suficiente para responder a la pregunta o preguntas
mente estudios de cohorte.1 planteadas 4 y si el diseo ha sido el apropiado para
La presentacin de un caso clnico o de una serie de casos responder a las preguntas hechas por l; teniendo
son a diseos ms dbiles, basados en la descripcin y ob- siempre en cuenta las ventajas y desventajas de cada
servaciones, en casos particulares; sin embargo, stos pue- tipo de estudio.3
den ser la evidencia de una asociacin particular que puede En ocasiones, cuando se hace una investigacin, el in-
www.medigraphic.org.mx
generar una hiptesis clnica, teraputica o etiolgica.2 vestigador puede optar por formar dos grupos: uno de
estudio y otro de controles; siempre que sean similares
en cuanto a las caractersticas particulares y con excep-
* Pediatra-Neonatlogo, Maestra en Ciencias con nfasis en Epide- cin de la o las variables en estudio.
miologa, UNAM. Otras veces, los investigadores siguen un diseo de
** Pediatra-Gastroenterlogo, Editor de la Revista Mexicana de Pe- casos y controles, o bien optan por un estudio de co-
diatra.
horte, pero tal caso debe evitar sesgos de seleccin de
Este artculo puede ser consultado en versin completa en casos; lo que acontece cuando los grupos seleccionados
http://www.medigraphic.com/rmp son escogidos de tal manera que puedan influir en los
Gmez-Gmez M y cols. Cmo seleccionar una prueba estadstica

resultados de la investigacin por ser distintos ambos manera que las medidas son expresadas como medidas
grupos.5 de resumen, para sintetizar los datos cualitativos en tr-
Por otra parte, los autores se deben preguntar: Cul minos de razones, proporciones y tasas.
es el significado de sus resultados?, de tal manera que si la En lo que atae a los datos cuantitativos, las medi-
magnitud de las diferencias o de la fuerza de asociacin en das de resumen se sintetizan segn que la distribucin
el estudio son significativas, podrn saber si stas sern ti- de los datos sea normal expresndolos en trminos de
les y trascendentes; sobre todo si los autores han cumpli- promedio y desviacin estndar; en cambio, cuando la
do con los criterios ligados a una relacin de causa-efecto.6 distribucin de los datos no es normal, la informacin
numrica se expresa en trminos de la moda y la ampli-
SELECCIN DE UNA PRUEBA ESTADSTICA tud, la mediana y los percentiles. Finalmente, al anlisis
de las frmulas estadsticas y el uso de tablas que facili-
La estadstica, como parte de las matemticas emplea- tan la comparacin de las medidas de resumen mediante
das, es la secuencia de razonamientos para estudiar las pruebas estadsticas apropiadas, permiten saber a los
los fenmenos de la naturaleza, y considera que la in- investigadores si las variables, motivo de estudio, tienen
ferencia estadstica es la que permite obtener conclu- diferencias significativas.
siones en funcin de los resultados obtenidos en una Cada prueba de anlisis se emplea en funcin del
muestra en estudio representativa; sin embargo, cabe diseo de investigacin, que se halla seleccionado para
sealar que hay dos tipos de inferencias: la que se co- comprobar si la consecuencia es verificable a partir de la
noce como prueba de hiptesis y la que concierne a la hiptesis general de investigacin.9
estimacin de intervalos.7 Es conveniente mencionar que se definen como va-
Y en cuanto a las hiptesis en las pruebas estadsti- riables: las cualidades, rasgos, atributos, caractersticas o
cas, la hiptesis de nulidad (Ho) plantea la ausencia de propiedades de diferentes valores, magnitudes o intensi-
diferencias significativas, en tanto que la hiptesis al- dades valoradas en un grupo de elementos.
terna (Hi) afirma que hay diferencias en las variables de En cuanto al manejo estadstico de los datos numri-
estudio. Es as como las pruebas de significancia esta- cos, es importante conocer el grado de precisin con el
dstica conducen a conocer la magnitud de las diferen- que se obtuvieron las variables, ya que dependiendo de
cias y la significancia de los resultados, considerando un stas se presenta la informacin en cuadros o grficas.
nivel significativo cuando la p < 0.05, que se interpreta Cabe reiterar que las variables pueden ser de carc-
como rechazo de la hiptesis de nulidad y aceptacin ter cualitativas y cuantitativas, de tal manera que cuando
de la hiptesis alterna8 y de no existir diferencias esta- los datos se pueden observar, pero no son medidos, se
dsticas, la p 0.05. trata de una variable cualitativa o categrica, por ejem-
Es as como el mtodo estadstico consiste en una plo, los colores, texturas, olores, sabores, apariencia,
secuencia de procedimientos relacionados con el ma- etc., y se clasifican en subgrupos en trminos de:
nejo de los datos que proporciona una investigacin y
comprende la siguiente secuencia: a) Dicotmicas o binarias, cuando hay slo dos catego-
ras posibles: S y No; por ejemplo: paciente con
1) Recoleccin de datos (medicin). enfermedad y paciente sin enfermedad.
2) Recuento (cmputo). b) Nominal o variables de atributo o categricas. La
3) Presentacin. observacin individual de una variable nominal suele
4) Descripcin. ser considerada una palabra no un nmero y sigue un
5) Anlisis. orden, por ejemplo: el gnero (los valores posibles
son masculino o femenino), el grupo sanguneo (los
En la fase inicial de la investigacin se recoge informa- valores son A, B, AB y 0).
www.medigraphic.org.mx
cin cualitativa y cuantitativa (variables), lo que se seala
desde el diseo del estudio. La segunda etapa concierne
c) Ordinal, cuando es posible determinar un orden,
como la clase social (alta, media o baja), el orden de
a la revisin, clasificacin y cmputo numrico de la in- nacimiento (primero, segundo, tercero, etc.), el gra-
formacin recogida. En la siguiente fase (presentacin) do escolar (de uno a sexto grado), etctera.
se elaboran los cuadros y figuras para someter los datos
numricos a un anlisis estadstico. Cuando se puede cuantificar una variable en enteros,
En la descripcin, la informacin es resumida en me- como es el nmero de hijos, el nmero de empleados
didas que permiten expresar de manera sinttica las de una fbrica, etc., se le denomina variable cuantitativa
propiedades numricas de los datos obtenidos; de tal discreta (discontinua o de intervalo); y cuando se expre-

31 Rev Mex Pediatr 2013; 80(1); 30-34


Gmez-Gmez M y cols. Cmo seleccionar una prueba estadstica

sa en fracciones, por ejemplo: la estatura, el peso, etc., Las pruebas de significancia estadstica son mtodos
se les llama variables cuantitativas continuas (de cociente estadsticos que permiten contrastar las hiptesis para
o de razn). Tambin puede ser que los datos tengan valorar los efectos del azar, de acuerdo con los resulta-
una distribucin estadstica normal como los valores de dos de una investigacin.13
sesgo de - 0.5 a + 0.5 y curtosis de 2 a 4.10 En los ensayos clnicos y el estudio de cohorte, el
En cuanto a la clasificacin de las variables estadsticas riesgo relativo es la medida bsica de la fuerza de una
se dividen en: variables independientes (como sinnimos asociacin, como cuando se mide la magnitud de la aso-
de antecedente, causa, origen, razn) y en variables depen- ciacin al contrastar la incidencia de una enfermedad
dientes, como consecuente, efecto, resultado o producto. entre personas expuestas a un factor de riesgo, respec-
Es conveniente mencionar que las variables independientes to a las personas no expuestas a ste. La frmula para
son el antecedente de la variable dependiente o efecto. saberlo es (a/a + b)/(c/c + d).
Cuando hay una asociacin entre dos variables y sta En el estudio de casos y controles se emplea la ra-
es real, corresponde a colocar en la celda a de la tabla zn de momios o razn de productos cruzados (Odds
de contingencia de 2 x 2, si no hay asociacin entre las Ratio de la literatura sajona) cuya frmula es ad/bc, y
variables, esto corresponde a la realidad y se coloca en en el estudio transversal la razn de momios de pre-
la celda d. En ambos casos no se ha cometido error. Si valencia informa de la fuerza de la asociacin, y am-
se dice que hay una asociacin entre dos variables y no bas razones tienen una interpretacin similar al riesgo
es real se coloca en la celda b, entonces se comete el relativo.14
error de tipo I, que se representa con el valor = 0.05, El valor de p (probabilidad asociada con la hiptesis
y es conocido como el valor crtico de p. En cambio, nula de la prueba) es la probabilidad de que un resul-
cuando se dice que la asociacin entre las variables es tado sea debido al azar; entre menor sea la diferencia
estadsticamente significativa, que hay menos del 5% de encontrada entre dos o ms grupos hay una mayor signi-
posibilidades de error tipo I, lo que en general tiene que ficancia estadstica (y se considera significativa p < 0.05
ver con el tamao de la muestra. De no haber una aso- en adelante); el valor de p tiene distinto significado de
ciacin y sta en realidad existe, corresponde a la celda acuerdo con la prueba de que se trata, por ejemplo: la t
c y se comete un error tipo II, representado con un de Student y la prueba Z ponen a prueba la hiptesis de
valor = 0.20. Su contraparte (1-) es el poder de la que la diferencia entre dos promedios se debe al azar;
muestra, que constituye la sensibilidad mnima requerida la p de una correlacin indica la probabilidad de que la
para probar alguna diferencia (Cuadro 1).11 pendiente de esa recta sea igual a la pendiente de una
El procedimiento estadstico aplicable al problema de la recta igual a 0, y no indica qu tan importante es esa
significancia estadstica de una prueba, va a depender de: correlacin, mientras que la p de la prueba exacta de
Fisher indica cul es la probabilidad de que la distribu-
1. El diseo estadstico seleccionado para la investigacin. cin observada se deba al azar.15
2. La distribucin de casos en uno, dos o ms grupos. El intervalo de confianza de 95% indica la impreci-
3. El tipo de medida o variable a analizar. sin de las estimaciones puntuales; esto es si se tom
4. La manera en que se distribuyan las variables, la ho- un nmero infinito de muestras del mismo tamao que
mogeneidad de las varianzas en los grupos, el impac- la que se estudi, entre cul de estos valores (alto y
to de los residuos y el tamao de la muestra. bajo) se encontrara el 95% de las mediciones de esta
5. El poder de la prueba, es decir, la capacidad para diferencia o correlacin? Si la magnitud de los valores de
aceptar o rechazar la hiptesis nula.12 los dos extremos son menores a la unidad, se considera
un efecto protector; y si la magnitud de estos valores de
los dos extremos son mayores a la unidad, el resultado
Cuadro 1. La realidad y sus posibles apreciaciones. es significativo. Si la magnitud de los valores de uno de
S www.medigraphic.org.mx
No los extremos es menor a la unidad y el otro es mayor a
la unidad, el resultado es no significativo.16
Realidad Error tipo I Los intervalos de confianza y las pruebas de hiptesis
Poder = 0.05 llevan a las mismas conclusiones.
a b Es importante mencionar que el primer paso a seguir
es hacer un anlisis exploratorio de los datos numricos
c d
para conocer el grado de exactitud, y al mismo tiempo
Error tipo II Confianza
= 0.20 Realidad saber si no hay error en la recoleccin y registro de los
datos recabados.17

Rev Mex Pediatr 2013; 80(1); 30-34 32


Gmez-Gmez M y cols. Cmo seleccionar una prueba estadstica

Por otra parte, el anlisis exploratorio de los datos promedio vale 0.5 y el rea a la derecha vale 0.5); sin
numricos corresponde a la estadstica descriptiva, embargo, el rea que se encuentra sobre el segmento
la que incluye el clculo de las medidas de tendencia de la abscisa, que va desde el promedio hasta el valor z
central: media y mediana, las medidas de dispersin: la de +1
Este vale 0.3413;
documento por simetra,
es elaborado porelMedigraphic
rea que se encuen-
desviacin estndar y los rangos intercuartiles, segn la tra sobre el segmento que va desde el promedio hasta el
naturaleza de los datos. valor z de -1 de la abscisa tambin vale 0.3413.
La generalidad de las pruebas estadsticas parten de la En cuanto al rea que se encuentra sobre el segmen-
suposicin de que los datos de una muestra tienen una to de la abscisa, que va ms all del valor z de +1 vale
distribucin normal. Estas pruebas son conocidas como 0.1587; por simetra, el rea que se encuentra sobre el
pruebas paramtricas como la t de Student y el anlisis segmento que va ms all (-) del valor z de -1 de la
de varianza (ANOVA). abscisa, tambin vale 0.1587.
La llamada curva normal en estadstica es un polgono Para cualquier segmento de la abscisa, y aun para
de frecuencias en forma de campana, para el cual se han fracciones del segmento, se encuentran calculadas las
calculado las reas de la curva en funcin de los valores reas correspondiente en las tablas de valores z.
obtenidos del eje horizontal (abscisa). Es en la abscisa As, en el intervalo de una desviacin estndar [ -
donde se encuentran los valores que corresponden a los , + ] se comprende, aproximadamente el 68.26%
cuantitativo continuos, genricamente denominados va- de la distribucin, y en el intervalo de dos desviaciones
lores z, cuyas magnitudes en teora, van de izquierda a estndar [ 2, + 2] se encuentra el 95.44% del
derecha, de menos infinito (-) hasta ms infinito (+). rea de la curva. Por otra parte, en el intervalo de tres
El promedio de todos los valores zeta de la abscisa equi- desviaciones estndar [ 3, + 3] est comprendi-
vale a 0, ya que la mitad son positivos y la otra mitad son da 99.74% de la distribucin.
negativos, y corresponde a la parte ms alta de la curva, la Estas propiedades son de gran utilidad para estable-
que es simtrica alrededor del promedio, es decir, hay una cer los intervalos de confianza. El hecho de que prcti-
mitad izquierda que es reflejo de la mitad derecha. camente la totalidad de la distribucin est a tres des-
En la abscisa hay segmentos unitarios de igual longi- viaciones estndar de la media, significa los lmites de las
tud y de magnitud 1, de tal manera que los segmentos a tablas de la curva normal estndar (Figura 1).18
la izquierda del promedio tienen un signo negativo y los Es pertinente mencionar que en la valoracin de las
segmentos de la derecha tienen un signo positivo. En ta- caractersticas de los datos se debe seguir la siguiente
les segmentos, la desviacin estndar puede dividirse en secuencia:
fracciones infinitamente pequeas y continuas; la curva
es asinttica, es decir, que los extremos en teora nunca 1) Conocer el nivel de medida de la variable de inters.
tocan a la abscisa. 2) Saber la distribucin de las variables.
Por costumbre se grafica la distancia de tres segmen- a) Las medidas de tendencia central para cada variable.
tos a la izquierda y a la derecha del promedio, y toda b) El sesgo y curtosis para cada variable.
el rea bajo la curva vale 1 (el rea a la izquierda del c) La apreciacin visual de la distribucin de los datos.

0.4

0.3

0.2 www.medigraphic.org.mx
34,1% 34,1%

0.1 Figura 1.

2,1% 2,1% Principales propiedades de la dis-


0,1% 13,6% 13,6% 0,1% tribucin normal (Campana de
0.0 Gauss). = promedio; = des-
-3 -2 -1 l 1 2 3 z viacin estndar.

33 Rev Mex Pediatr 2013; 80(1); 30-34


Gmez-Gmez M y cols. Cmo seleccionar una prueba estadstica

d) Examinar los diagramas y las posibilidades de dis- ejemplo, una prueba paramtrica como la t de Student de
tribucin de los datos. dos muestras es una prueba estadstica correcta. Si la va-
e) Si se considera necesario, transformar las variables. riable independiente categrica tiene ms de dos valores
f) Ver los resultados de la transformacin. de contraste se debe aplicar la ANOVA unidireccional.21
3) Ver la homogeneidad de las varianzas.
4) Ver el tamao de la muestra total y de los subgrupos. Referencias
5) Decidir qu prueba estadstica paramtrica o no pa-
ramtrica es la ms adecuada. 1. Gmez GM, Danglot BC, Velsquez JL. Bases para la revisin
crtica de artculos mdicos. Rev Mex Pediatr 2001; 68:152-159.
2. Reynaga OJ. Estadstica bsica en ciencias de la salud. Mxico:
Si el procedimiento estadstico no precisa plantear Distribuidora y Editora Mexicana; 1999; 37-52.
inferencias de los parmetros de la poblacin (media y 3. Daniel WW. Bioestadstica. Bases para el anlisis de las ciencias de
dispersin) se le conoce como no paramtrica o de dis- la salud. Mxico: Editorial Limusa Wiley; 2002.
tribucin libre, ya que no se hacen suposiciones acerca 4. Meja AJM, Fajardo GA, Gmez DA, Cuevas UML, Hernndez
HDM, Garduo EJ et al. El tamao de muestra: un enfoque prc-
de la distribucin de la poblacin de donde procede la tico en la investigacin clnica peditrica. Bol Med Hosp Infant
muestra, debido a que en stas se puede trabajar con Mex 1995; 52: 381-91.
muestras pequeas de datos categricos u ordinales, in- 5. Sackett DL. Bias in analytic research. J Chron Dis 1979; 32: 51-63.
dependientemente de la distribucin de muestras con 6. Alvarez MH, Prez CE. Causalidad en medicina. Gac Med Mex
2004; 140: 467-472.
las que se desea contrastar.19 7. Armitage P, Berry G. Estadstica para la investigacin biomdica. 3
Las principales ventajas de las pruebas no param- ed. Madrid: Harcourt Brace; 1997. p. 145-164.
tricas son: 8. Dawson SB, Trapp RG. Bioestadstica mdica. El Manual Moderno
2002; 3: 335-352.
9. Reynaga OJ. Anlisis estadstico en ciencias de la salud. Mxico:
1) Sencillas, mediante frmulas simples. Distribuidora y Editora Mexicana; 2001.
2) Fciles de aplicar, con operaciones de jerarquizacin, 10. Stevens SS. On the theory of scales of measurement. Science
conteo, suma y resta. 1946; 103: 677-680.
3) Pequeas, son fciles de usar. 11. Hernndez AM, Garrido LF, Lpez MS. Diseo de estudios epi-
demiolgicos. Salud Pblica Mx 2000; 42: 144-154.
4) Se aplican a los grupos mayores de poblaciones. 12. Velsquez JL, Gmez GM. Valoracin de un artculo biomdico.
5) Son menos susceptibles a la contravencin de los su- En: Martnez y Martnez R, editor. Cmo escribir un texto en cien-
puestos, ya que son escasos y sencillos. cias de la salud. Anatoma de un libro. 2 ed. Mxico: El Manual
6) Se pueden usar con datos ordinales o nominales. Moderno; 2002: 93-104.
13. Soyemi K. Choosing the right statistical test. Pediatr Rev 2012;
7) Cuando la muestra es menor de 10 son sencillas, r- 33(5): 38-44.
pidas y slo poco menos eficaces; conforme aumenta 14. Connor KA. Quantifying associations: understanding Relative
el tamao de la muestra se hacen laboriosas, tardadas Risks and Odds Ratios. Pediatric Rev 2012; 33: 473-474.
y menos efectivas. 15. Wacher RN. Utilidad del valor de p y del intervalo de confianza.
Rev Med IMSS (Mxico) 1993; 31: 143-144.
8) Cuando se cumplen los supuestos de una prueba no 16. Granhill FA, Bowden DC. Linear segment confidence bands for
paramtrica son igual de efectivas. sample linear models. J Am Stat Assoc 1967; 62: 403-408.
17. Windish DM, Diener WM. A clinician-educators roadmap to
Si se satisfacen los supuestos de una prueba paramtri- choosing and interpreting statistical test. J Gen Intern Med 2006;
21(6): 656-660.
ca con una muestra pequea, es slo poco menos efectiva 18. Galton F. Co-relations and their measurement, chiefly from
y son menos sensibles a medida que aumenta el tamao anthropometric data. Proc Roy Soc 1888; 45: 135-145.
de la muestra. Si se puede usar una prueba paramtrica 19. Gmez GM, Danglot BC, Vega FL. Sinopsis de pruebas estadsticas
y se emplea una no paramtrica, hay una prdida de in- no paramtricas. Cundo usarlas. Rev Mex Pediatr 2003; 70: 91-99.
20. Bailar JC, Mosteller F. La informacin estadstica que deben pro-
formacin. Vale la pena hacer nfasis en que en muestras porcionar los artculos publicados en revistas mdicas. Bol Of
grandes las pruebas no paramtricas son muy laboriosas.20 Sanit Panam 1990; 108: 317-332.

www.medigraphic.org.mx
Puede el nmero de niveles de una variable categ-
rica influir sobre el estadstico de prueba que se puede
21. Gmez GM, Danglot BC, Huerta ASG, Garca de la TG. El estu-
dio de casos y controles: su diseo, anlisis e interpretacin en
investigacin clnica. Rev Mex Pediatr 2003; 70: 257-263.
usar, por ejemplo: si se quiere comparar si el gnero
afecta la duracin del tiempo de accin de un medica- Correspondencia:
mento. El sexo es una variable cualitativa que tiene dos Dr. Manuel Gmez Gmez
posibles valores: mujer y hombre. Parque Zoquiapan 25,
Col. Lomas del Parque,
La frecuencia de administracin de un medicamento 53398, Naucalpan, Estado de Mxico.
es una variable dependiente continua y el investigador Tel: 55 76 56 06
encuentra que tiene una distribucin normal; en este E-mail: mangomez@prodigy.net.mx

Rev Mex Pediatr 2013; 80(1); 30-34 34

You might also like