You are on page 1of 13

Pruebas de comparacin mltiple

Prueba de Scheff

DISEO EXPERIMENTAL
December 1, 2014
Diana Carolina Bonilla Fonseca. 20121010052
Mirfarleinis Ziomara Corredor Snchez.20122010003
Mary Alejandra Hortua Muoz. 20122010251
Viviana Lozano Chaparro. 20121010053
David Luis Fernando Puentes. 20121010046

CONTENIDO

INTRODUCCIN ............................................................................................................ 2
DESCRIPCIN: PRUEBAS DE COMPARACIN MLTIPLE .................................. 3
Asumiendo varianzas homogneas ............................................................................... 3
Metodo de la mnima diferencia significativa .............................................. 3
Mtodo de Bonferroni (Fisher) ..................................................................... 3
Mtodo de Sidak ............................................................................................ 3
Mtodo R-E-G-W F ....................................................................................... 3
Mtodo de Student-Neuwman-Keuls ............................................................. 4
Mtodo de Scheff ......................................................................................... 4
Mtodo de Duncan ........................................................................................ 4
Asumiendo varianzas diferentes ................................................................................... 4
Mtodo de Games-Howell ............................................................................. 4
Mtodo C de Dunnett .................................................................................... 4
PRUEBA DE SCHEFF .................................................................................................. 5
EJEMPLO......................................................................................................................... 7
CONCLUSIONES .......................................................................................................... 10
RECOMENDACIONES ................................................................................................ 11
BIBLIOGRAFA ............................................................................................................ 12

INTRODUCCIN
El inters en el problema de las comparaciones mltiples se inici en la dcada de 1950
con la obra de Tukey y Scheff. El inters aument por cerca de dos dcadas y luego
vino un declive. Algunos hasta pensaban que el campo estaba muerto. Sin embargo, el
campo estaba vivo y cada vez ms las ideas se presenta como la respuesta a las
necesidades de las estadsticas mdicas. Los nuevos mtodos y procedimientos salieron:
procedimiento de prueba cerrada, mtodo de Holm-Bonferroni. Ms tarde, en la dcada
de 1980, la cuestin de comparaciones mltiples regres. Los libros fueron publicados
Hochberg y Tamhane, Westfall and Young, y Hsu. En 1995, el trabajo sobre la tasa de
descubrimiento falso y otras nuevas ideas haba comenzado. En 1996 tuvo lugar la
primera conferencia sobre comparaciones mltiples en Israel. Esta reunin de
investigadores le siguieron las conferencias en todo el mundo: Berln, Bethesda,
Shanghai, Viena y Tokio. Todos estos reflejan una aceleracin del aumento de inters
en mltiples comparaciones.
En las estadsticas, las comparaciones mltiples, mltiples o mltiples ensayos
problema se produce cuando se tiene en cuenta un conjunto de inferencias estadsticas
simultneamente o infiere un subconjunto de los parmetros seleccionados en base a los
valores observados. Los errores en la inferencia, incluyendo intervalos de confianza que
no incluyan sus correspondientes parmetros de la poblacin o de las pruebas de
hiptesis que errneamente rechazar la hiptesis nula es ms probable que ocurra
cuando se tiene en cuenta el conjunto como un todo. Varias tcnicas estadsticas se han
desarrollado para evitar que esto suceda, lo que permite niveles de significacin para las
comparaciones individuales y mltiples para ser comparados directamente. Estas
tcnicas generalmente requieren un nivel ms fuerte de las pruebas que se observ con
el fin de una comparacin individual para ser considerado "significativo", a fin de
compensar el nmero de inferencias que se estn realizando.
Las principales tcnicas que se emplean dependen directamente de la homogeneidad de
las varianzas en donde si estas son homogneas se utiliza: mtodo de la mnima
diferencia significativa, mtodo de Bonferroni (Fisher), mtodo de Sidak, mtodo R-EG-W F, mtodo de Student-Neuwman-Keuls, mtodo de Scheff y mtodo de Duncan;
mientras que si se trabajan con varianzas heterogneas o diferentes se utiliza: mtodo de
Games-Howell, mtodo C de Dunnett.
Para efectos del trabajo propuesto se realiz un anlisis exhaustivo sobre la prueba de
Scheff, realizando una explicacin acerca de las bases sobre las que la misma trabaja,
as como el procedimiento que se lleva a cabo para realizar esta prueba, por ltimo se
ejemplifica la prueba para tener una amplia visin acerca de su funcionamiento,
mostrando algunos de los resultados que es posible encontrar cuando se aplica esta
prueba en diferentes situaciones acadmicas.

DESCRIPCIN: PRUEBAS DE COMPARACIN MLTIPLE


Cuando los resultados de anlisis de varianza conduzcan a rechazar la hiptesis nula de
no ser diferentes las medias poblacionales, surge la pregunta sobre que tratamiento es
mejor, ya que con frecuencia se desea saber que tratamientos pueden ser iguales por
medio de la realizacin de pruebas de comparaciones de cada uno de los tratamientos.
El experimentador debe tener la precaucin al pretender encontrar diferencias
significativas entre las medias individuales, siempre asegurarse que su procedimiento de
comparacin sea vlido.
Algunas de las pruebas de comparaciones mltiples son sensibles al valor de la
varianza dependiendo de que sean iguales o no, por lo cual los mtodos se dividen en
mtodos asumiendo varianzas homogneas y mtodos asumiendo varianzas diferentes
(Meulemn y Heiser, 2004; SPSS, 2005).
Asumiendo varianzas homogneas
Metodo de la mnima diferencia significativa
Se basa en la distribucin t de Student. Fue propuesto por Fisher en 1935. No ejerce
ningn control sobre la tasa de error, es decir, cada comparacin se lleva a cabo
utilizando el nivel de significacin establecido.
Esta prueba puede dar resultados falsamente significativos si el experimentador se
dedica a hacer comparaciones entre tratamientos de resultados extremos (Dean yVoss,
1999; Atil y Unver, 2001)
Mtodo de Bonferroni (Fisher)
Se basa en la distribucin t de Student y en la desigualdad de Bonferroni, intenta
resolver el problema que tiene la aplicacin de numerosas pruebas de Student
reduciendo la probabilidad de cometer un error de tipo I en cada comparacin. Controla
la tasa de error dividiendo el nivel de significacin entre el nmero de comparaciones
realizadas.
Mtodo de Sidak
Se basa en la distribucin t de Student, pero controla la tasa de error evaluando cada
comparacin con un nivel de significacin
, esta rechaza la
hiptesis fundamental en ms ocasiones que en el mtodo de Bonferroni.
Mtodo R-E-G-W F: mtodo de Ryan (1960), Einot-Gabriel (1975) y Welsch
(1977)
Se basa en la distribucin F es un mtodo por pasos, comienza ordenando de forma
ascendente los P grupos por el tamao de sus medias, se efectan todas las
comparaciones posibles entre pares de medias teniendo en cuenta el nmero de
escalones (r) que las separa.

El nmero de escalones existente entre las medias comparadas condiciona el nivel de


significacin de cada comparacin, siendo ste mayor cuanto ms alejadas se
encuentran las medias ordenadas.
Mtodo de Student-Neuwman-Keuls: (Newman, 1939; Keuls, 1952)
Se basa en la distribucin del rango estudentizado. Al igual que el mtodos R-E-G-W,
parte de ordenar las medias por su tamao. Pero a diferencia de l, aqu el nivel de
significacin para cada conjunto de medias separadas (r) pasos es siempre , cuantos
ms pasos existen entre dos medias, mayor es la diferencia mnima necesaria para
considerar que esas medias difieren significativamente (Atil y Uver, 2001).
Mtodo de Scheff
Se basa en la distribucin F de Fisher. Permite controlar la tasa de error para el conjunto
total de comparaciones que es posible disear con P medias, utilizado para efectuar slo
comparaciones por pares, es un procedimiento conservador ya que tiende a considerar
significativas menos diferencias de las que debera. Para ser consecuente con este
problema, Scheff recomienda utilizar
(Scheff, 1959). Esta es una de las
pruebas ms recomendadas debido a la alta precisin en las diferencias que detecta.
Mtodo de Duncan
Es conocido como la prueba de los rangos mltiples, es un mtodo de comparacin por
pasos. Controla la tasa de error utilizando, para el conjunto de medias separadas r pasos,
un nivel de significacin
, mientras ms pasos existan entre dos
medias, mayor es la diferencia mnima con la que se va a considerar que esas medias
difieren significativamente, sin embargo cuando el numero de replicas no es igual en
los tratamientos que se comparan resulta poco confiable su aplicacin.
Asumiendo varianzas diferentes
Mtodo de Games-Howell
Es un mtodo muy similar al de Tukey, se basa en la distribucin del rango
estudentizado y en un estadstico t en el que, tras estimar las varianzas poblacionales
suponiendo que son distintas, se corrigen los grados de libertad mediante la ecuacin de
Welch.
Mtodo C de Dunnett
Mtodo idntico al de Games-Howell excepto en la forma de corregir los grados de
libertad de la distribucin del rango estudentizado, esta solucin es ms conservadora
que la de Games-Howell.

PRUEBA DE SCHEFF
Las pruebas de comparaciones mltiples, son utilizadas cuando se quiere comparar
todas las parejas de las t medias de los tratamientos. Es decir, que se desea probar que
Ho: i=i, para toda ii, dentro de los mtodos posibles para satisfacer estas
condiciones encontramos la prueba de SCHEFF. En 1953, Scheff, propuso un
mtodo para realizar cualquier contraste entre medias de tratamientos, esta prueba tiene
en cuenta el nmero de comparaciones que son posibles realizar, es aplicable tanto si el
nmero de elementos por tratamiento es igual o diferente, es decir no requiere que el
modelo sea equilibrado. Es acertada, tanto si no se cumple la normalidad de la variable
en todos los tratamientos, como para casos en que no se cumple la homogeneidad entre
varianzas (Garca 1998).
Se recomienda, la prueba de Tukey cuando se tienen varianzas homogneas, la variable
dependiente se distribuye normalmente en todos los grupos y el nmero de casos es
igual en todos los grupos o tratamientos (Porras-2000).
Supongamos que se tiene una familia de contrastes de la siguiente manera:

Se tiene como objetivo, comprobar qu hiptesis es la correcta para cada uno de los
contrastes:
Ho: C=0

Hi: C0

Segn (Alvarez-2007) El mtodo de Scheff, est basado en la construccin de


intervalos de confianza para todos los posibles casos de hiptesis. Los niveles de
confianza se encuentran en rango de 1-.Donde la diferencia media significativa entre
dos medias se calcula, mediante la siguiente frmula:

Donde K=es el nmero de grupos, N=el nmero total de casos, F=valor de la F de


Snedecor para K y N-K grados de libertad y un nivel de significancia .Adems,
MSD=es el cuadrado medio dentro de grupos, ni y nj, son el nmero de elementos de
los dos grupos implicados en la colaboracin (lvarez-2007).
Por otra parte, los intervalos de confianza 1- , para una diferencia de media se calcula,
a partir de la siguiente expresin:
i- j; [( i- j)-DMSs; ( i- j)+DMSs]
Esta prueba no es recomendable para la comparacin de medias, pero puede usarse en
contrastes ms amplios, es decir con ms de dos medias. Es mucho ms eficaz que la
prueba de Bonferroni, si el nmero de comparaciones es relativamente mucho ms
grande que el nmero de media (Garca 1998).

Para ilustrar el procedimiento, supngase que los contrastes de inters son:


C2=1+3-4-5
C3=4-5
Y las estimaciones numricas de estos contrastes son:
C =y

y -y -y5=50+48-47-45=6
C =y -y5=47-45=2

Sus errores tpicos determinados, usando la ecuacin:


S{C2} =

S{C3} =

) =1,912
(

) =1,394

Los intervalos de confianza respectivamente, son:

(6-19, 2

I2= (C2- S{C2}


{ }

I3= (C3- S{C3}


+S{C3}
(2-1,394

C3

=
(-2, 69; 6, 69)

Como los intervalos I2 y I3, contienen al 0, se concluye que tanto C2=1+3-4-5,


como C3=4-5, no son distintos de 0. Por lo tanto, se concluye que la media de los
tratamientos uno y tres, tomadas como grupo, no difieren significativamente de las
medias de los tratamientos cuatro y cinco, tomadas como grupo y por otra parte
tampoco existe diferencia significativa entre los tratamientos cuatro y cinco (Porras2000)

EJEMPLO
Se tienen los datos acerca de la contaminacin de mercurio en 5 ciudades de los cuales
se obtuvieron los siguientes datos:

7
8
9
8
10

N=42
Consultando las tablas de F de Snedecor:
La diferencia mnima significativa entre las medias es:

La diferencia mnima significativa entre las ciudades A y B es:

La diferencia mnima significativa entre las ciudades A y C es:

La diferencia mnima significativa entre las ciudades A y D es:

La diferencia mnima significativa entre las ciudades A y E es:

La diferencia mnima significativa entre las ciudades B y C es:

La diferencia mnima significativa entre las ciudades B y D es:

La diferencia mnima significativa entre las ciudades B y E es:

La diferencia mnima significativa entre las ciudades C y D es:

La diferencia mnima significativa entre las ciudades C y E es:

La diferencia mnima significativa entre las ciudades D y E es:

Si la diferencia entre las medias correspondientes las ciudades A y B es mayor a y que


0,59 se considera prueba suficiente para considerar que entre estas dos medias hay
diferencias estadsticamente significativas.

2,76- 2,27=0,49. Como la


diferencia es menor que la
, no hay diferencias estadsticamente significativas
con 0,05.A continuacin se exponen las diferencias entre las medias, la MSD
correspondiente a cada comparacin, la significacin estadstica o NS, en caso de que
las diferencias no sean estadsticamente significativas, y los intervalos de confianza del
95%.
Se obtiene la siguiente tabla resumen:
Diferencia de
DMS
Significancia
Intervalos de
medias
confianza 95%
NS
(-0,10: 1,08)

NS
(-0,37: 0,77)

< 0,05
(0,19: 1,37)

<
0,05
(0,22: 1,34)

NS
(-0,83: 0,26)

NS
(-0,26: 0,86)

NS
(-0,24: 0,83)

< 0,05
(0,03: 1,13)

< 0,05
(0.06: 1.09)

NS
(-0,53; 0,53)

Se observa que la contaminacin por mercurio en los habitantes de la ciudad A es


significativamente mayor, desde el punto de vista estadstico, que en los de las ciudades
D y E, no hay diferencias con los habitantes de las ciudades B y C, los habitantes de la
ciudad B no tienen diferencias significativas con los de las dems ciudades; los
habitantes de la ciudad C tienen un nivel de contaminacin mayor que los de las
ciudades D y E, los habitantes de las ciudades D y E tienen una contaminacin
significativamente menor que los de las ciudades A y C observe que la diferencia
estadsticamente significativa; el nivel de mercurio de los habitantes de las ciudades A y
C es significativamente mayor que los habitantes de las ciudades D y E, sin embargo los
habitantes de la ciudad B tienen diferencias significativas con los de ninguna de las no
otras ciudades. Esto poniendo las medias poblacionales segn el orden de se expresa
magnitud de sus medias muestrales unen mediante una lnea las medias entre las y se
que no hay diferencias estadsticamente significativas:

CONCLUSIONES

Teniendo en cuenta que las pruebas de comparacin mltiple son empeladas


cuando, las medias de un anlisis estadstico difieren, debido al aumento de
pares de comparacin y el nivel de significancia, se emplean diversos mtodos
que permiten comparar los valores de la media manejando siempre un nivel de
significancia de 0.05.

En las pruebas de rangos mltiples, se observa que los mtodos empleados


empelan un gran margen de confiabilidad, ya que la probabilidad de rechazar la
hiptesis nula, cuando esta es cierta, tiende a ser menor que el nivel de
significancia.

Para determinar qu tipo de prueba a emplear se debe tener en cuenta el nmero


de contrastes, el nmero de nivel de factor y el tipo de error a controlar.

La prueba de Scheffer a diferencia de otros mtodos de comparacin, permite


comparar dos medias, construyendo intervalos de confianza simultnea, para
todas las diferencias de medias, manejando solo comparaciones por pares de
muestras, donde los contrastes tienden a ser ms complicados que las diferencias
de medias, presenta un lmite de confianza ms estrecho.

En el momento de decidir el mtodo empleado tiende a confundirse el mtodo


de Turkey con el de Scheffer, pero se debe emplear el primero cuando se desea
tener lmites de confianza pequeos, con mayores diferencias significativas.

Por su parte el mtodo de Bonferronier tiende a emplearse cuando el nmero de


contraste es igual o menor que los niveles de factores.

Las pruebas Tukey, Newman-Keuls y Duncan, son las adecuadas para emplear
cuando el nmero de comparaciones por parejas tiende a ser muy grande ya que
producen intervalos de confianza ms estrechos.

Los mtodos de Duncan y Tukey son aquellos que presentan ms diferencias


significativas y su eleccin del mtodo depende de que tanto se desee aceptar
diferencias que no lo sean o solo trabajar con las que si sean verdaderas. Sus
diferencias se basan fundamentalmente en que el mtodo de Tukey presenta un
error tipo por lo tanto su precisin no es tan alta; mientras la prueba de Duncan
brinda diferencias significativas con mayor facilidad.

Por su parte, la prueba t de student es la que menor confiabilidad presenta,


seguido de la prueba de Sidak que controla el error pero puede rechazar la
hiptesis fundamental.

Cuando las varianza son diferentes se debe emplear los mtodos de Mtodo de
Games-Howell o Mtodo C de Dunnett.

10

RECOMENDACIONES

Esta prueba es recomendada emplearla cuando la comparacin no es planeada.


Se debe tener cuidado con el manejo de la prueba de Duncan, debido a su baja
rigurosidad.
Se recomienda el empleo del mtodo de Turkey, ya que efecta un control sobre
el error global
Se debe hacer una valoracin general de las condiciones de los datos
experimentales a analizar, bien sea con la determinacin de la varianza.
Considerar que para un numero grande de nivel de significancia establecido,
puede provocar

11

BIBLIOGRAFA

Meulman J, Heiser WJ (2004) Manual de SPSS


Siegel, s (1987) Diseo experimental no paramtrico. Edicin Revolucionaria
p.335. La Habana
Montgomery, D C (2004) Diseo y anlisis de experimentos. Tercera edicin.
Editorial Flix Varela.
Atil H, Unver Y (2001) Multiple Comparisons. OnLine Journalof Biological
Sciences 1(8): 723-727
Comparaciones
mltiples.
URL:
http://www.ugr.es/~bioestad/guiaspss/practica7/ArchivosAdjuntos/Comparacion
esMultiples.pdf.Consulta [ 29 de Noviembre].
LVAREZ,R.Estadstica aplicada a las ciencias de la salud.2007
GarcaLeal&LaraPorras ( 998). DiseoEstadsticoExperimentos.Anlisis de la
Varianza.
Lara Porras, A.M. ( 000). Diseo Estadstico de Experimentos, Anlisis de la
Vari-anza y Temas Relacionados: Tratamiento Informtico mediante
SPSSProyecto Sure Ediciones.( 000)

12

You might also like