Professional Documents
Culture Documents
0
:
i i
H
0
:
i i
H
:
a i i
H
:
a i i
H
> :
a i i
H
<
Para i i ,
, 1, 2, , i i t K
Nivel de significacin
Estadstica de prueba
( )
~ /
i i
i i
c GLE
Y Y
Y Y
t t
S
0
H
es verdadera
donde :
GLE = Grados de libertad del error
1 1
i i
Y Y
i i
S CME
n n
1
+
1
]
Criterio de decisin
Decisin Caso Bilateral Unilateral a la
derecha
Unilateral a la
izquierda
Se acepta
0
H
, 1 ,
2 2
c
GLE GLE
t t t
_ _
, ,
( ) 1 , c GLE
t t
( ) , c GLE
t t
Se rechaza
0
H
, 1 ,
2 2
c c
GLE GLE
t t o t t
_ _
, ,
< >
( ) 1 , c GLE
t t
>
( ) , c GLE
t t
<
Diferencia mnima o lmite de significacin (DMS o DLS)
0
:
i i
H
:
a i i
H
Para i i ,
, 1, 2, , i i t K
Nivel de significacin
En la prueba de t se acepta
0
H
si
, 1 ,
2 2
c
GLE GLE
t t t
_ _
, ,
, 1 ,
2 2
i i
i i
GLE GLE
Y Y
Y Y
t t
S
_ _
, ,
1 , 1 ,
2 2
i i i i
i i Y Y Y Y
GLE GLE
t S Y Y t S
_ _
, ,
1 ,
2
i i
i i Y Y
GLE
Y Y t S
,
Y se rechaza
0
H
si
1 ,
2
i i
i i Y Y
GLE
Y Y t S
,
>
Entonces si definimos
( )
1 ,
2
,
i i
Y Y
GLE
DMS i i t S
,
o
( )
1 ,
2
,
i i
Y Y
GLE
DLS i i t S
,
Luego, un criterio para examinar si existe diferencia significativa entre medias de
tratamiento se puede usar este criterio de la diferencia mnima o lmite significante
( ) ( ) ( )
, , DMS i i o DLS i i
. Esto es, se rechaza
0
H
si
( ) ,
i i
Y Y DMS i i
>
o ( ) ,
i i
Y Y DLS i i
>
Para i i ,
, 1, 2, , i i t K
Ejemplo: Para el ejemplo de tiempo de coagulacin, suponga se ha planeado comparar
los verdaderos tiempo promedio de coagulacin que se obtiene con la dieta A y la dieta
C, use la prueba de t para realizar esta comparacin a un nivel de significacin
0.05 .
0
:
C A
H
:
a C A
H
0.05
( )
1 1 1 1
5.6 1.5275
6 4
C A
Y Y
C A
S CME
n n
1
1
+ +
1
1
]
]
68 61
4.5826
1.5275
C A
C A
c
Y Y
Y Y
t
S
( ) 0.025,20
2.086 t
y
( ) 0.975,20
2.086 t
, como
( ) 0.975,20 c
t t >
, se rechaza
0
H
Ejemplo Si se planeo realizar todas las comparaciones en el ejemplo de coagulacin a
un nivel de significacin 0.05 , use la prueba de DMS. Luego, se tiene:
0
:
i i
H
:
a i i
H
Para i i ,
, , , , i i A B C D
i
A D B C
. i
Y
61 61 66 68
i
n 4 8 6 6
Comparaciones
i i
Y Y
i i
Y Y
S
( )
( ) 0.975,20
,
i i
Y Y
DMS i i t S
C-A 7 1.5275 3.1864 *
C-D 7 1.2780 2.6659 *
C-B 2 1.3663 2.8501 ns
B-A 5 1.5275 3.1864 *
B-D 5 1.2780 2.6659 *
D-A 0 1.4491 3.0228 ns
*=significativo , ns= no significativo
Prueba de t con R
> coag<-read.table("c:/victor/datos/coag.txt",header=TRUE)
> tiempo<-coag[,1]
> dieta<-coag[,2]
> pairwise.t.test(tiempo,dieta,p.adjust.method="none")
Pairwise comparisons using t tests with pooled SD
data: tiempo and dieta
a b c
b 0.00380 - -
c 0.00018 0.15878 -
d 1.00000 0.00086 2.3e-05
P value adjustment method: none
Las comparaciones mltiples afectan las tasas de error
Para probar la hiptesis
0
:
i j
H
1
:
i j
H
para
i j
,
, 1, 2, , i j t K
se utiliza la estadstica
0
2
1 1
i j
i j
y y
t
s
r r
1
+
1
1
]
(1)
Siendo
2
s CME , el nivel de significacin o probabilidad de error tipo I para una sola
prueba es una tasa de error con respecto a la comparacin ,
C
. Es el riesgo de
cometer al menos un error tipo I en la familia de comparaciones en el experimento.
Para una familia de pruebas independientes, se puede evaluar la tasa de error tipo I con
respecto al experimento. Sin embargo, no todas las pruebas son independientes con la
ecuacin dado en (1), ya que
2
s CME en el denominador es la misma, y en el
numerador de cada prueba contiene la misma media que en algunos otros estadsticos
0
t
.
Aunque las pruebas en la familia descrita no son independientes, se puede evaluar el
lmite superior para el valor del error tipo I con respecto al experimento, si se suponen
pruebas independientes. Suponiendo que las hiptesis nulas son ciertas para cada una de
las
( ) 1
2
t t
n
pruebas, la probabilidad de un error tipo I para cualquier prueba sola es
C
:
a i i
H
Para i i ,
, 1, 2, , i i t K
Nivel de significacin
donde:
( ) , q t GLE
1
+
1
]
Se rechaza
0
H
a un nivel de significacin
, si
i i
Y Y w
>
Ejemplo Use la prueba de Tukey para realizar todas comparaciones en el ejemplo de
coagulacin a un nivel de significacin 0.05 .
i
A D B C
. i
Y
61 61 66 68
i
n 4 8 6 6
( )
0.05
4, 20 3.96 q
0
:
i i
H
:
a i i
H
Para i i ,
, , , , i i A B C D
Comparaciones
i i
Y Y
i i
Y Y
S
( )
0.05
1
4, 20
2
i i
Y Y
w q S
Valor Crtico:
( )
1
, ,
i
Dunnet Y Y
d t t GLE S
, para
2, , i t K
donde :
( ) , ,
Dunnet
t t GLE
= t de Dunnett con un nivel de significacin
.
t
= nmero de tratamiento a comparar
GLE = Grados de libertad del error
1 1
i i
Y Y
i i
S CME
n n
1
+
1
]
Se rechaza
0
H
aun nivel de significacin
, si
1 i
Y Y d >
, para
2, , i t K
Ejemplo: Suponga que el tratamiento A es el testigo. Use la prueba de Dunnett para
realizar la comparacin entre media de tratamiento testigo con el resto a un nivel de
significacin 0.05 .
0
:
i A
H
:
a i A
H
, para
, , i B C D
0.05
( ) 0.05, 3, 20 2.54
Dunnett
t
Comparaciones
i i
Y Y
i i
Y Y
S
( ) 0.05, 4, 20
i A
Dunnett Y Y
d t S
D-A 0 1.4491 3.6807 ns
C-A 7 1.5275 3.8799 *
B-A 5 1.5275 3.8799 *
*=significativo , ns= no significativo
Usando el paquete R
> library(multcomp)
> coag<-read.table("d:/data2/coag.txt",header=T)
> mod<-aov(Tiempo~dieta,data=coag)
> cdu <- glht(mod, linfct = mcp(dieta = "Dunnett"))
> summary(cdu)
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: Dunnett Contrasts
Fit: aov(formula = Tiempo ~ dieta, data = coag)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
B - A == 0 5.000e+00 1.528e+00 3.273 0.00955 **
C - A == 0 7.000e+00 1.528e+00 4.583 < 0.001 ***
D - A == 0 -1.071e-14 1.449e+00 -7.39e-15 1.00000
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
(Adjusted p values reported -- single-step method)
Prueba de t y F con Contraste
Contraste: Son subconjunto de funciones lineales de totales o media de tratamientos
estimados. De esta manera si se tiene t tratamiento, de modo que el tratamiento i est
repetido
i
n
veces en el experimento, entonces un contraste se define:
. .
1 1
t t
i i i i i
i i
Q CY n CY
, con
1
0
t
i i
i
n C
En el caso que
1 2 t
n n n n L
, entonces
. . .
1 1 1
t t t
i i i i i i
i i i
Q CY nCY n CY
, con
1 1
0
t t
i i
i i
nC n C
,
1
0
t
i
i
C
Contrastes Ortogonales:
Dos contrastes:
1 1 .
1
t
i i
i
Q C Y
y
2 2 .
1
t
i i
i
Q C Y
son ortogonales si
1
1
0
t
i i
i
n C
,
2
1
0
t
i i
i
n C
y
1 2
1
0
t
i i i
i
n C C
y
2 2 .
1
t
i i
i
Q C Y
son ortogonales si
1
1
0
t
i
i
C
,
2
1
0
t
i
i
C
y
1 2
1
0
t
i i
i
C C
1
1
1 ]
]
[ ]
2 2
1
t
i i
i
Var Q n C
y
( )
2
GLE CME
Luego
( )
.
1 1
2 2
.
1 1 1
2
2
1
t t
i i i i i i
i i
t t t
i i i i i i i i
i i i
t
i i
i
n CY n C
n C n CY n C
t
GLE CME
CME n C
GLE
( )
.
1 1
2
1
~
t t
i i i i i i
i i
GLE
t
i i
i
n CY n C
t t
CME n C
1
: 0
t
a i i i
i
H n C
a un nivel de significacin
Estadstica de Prueba
( )
0
2
1
~ /
GLE
t
i i
i
Q
t t H
CME n C
es verdadera, siendo
. .
1 1
t t
i i i i i
i i
Q CY n CY
Luego se acepta
0
H
si
, 1 ,
2 2
c
GLE GLE
t t t
_ _
, ,
, caso contrario se rechaza.
Prueba de F con contraste:
Suponga que se desea probar la Hiptesis
0
1
: 0
t
i i i
i
H n C
1
: 0
t
a i i i
i
H n C
a un nivel de significacin
Estadstica de Prueba
Se sabe que
( ) ( )
2
1, GLE GLE
t F
, entonces la prueba de t dada anteriormente es equivalente a
usar la siguiente estadstica
( ) ( )
2
2
2
2
2 1
1,
2
2
1
1
~
t
i i
i
GLE GLE t
t
i i
i i
i
i
Q
n C
Q Q
t F
CME
CME nC
CME n C
1
1
1
1
1
1
]
Si se hace
2
2
1
t
i i
i
Q
SCQ
n C
, si
( ) 1 ,1, c GLE
F F
>
Prueba de F con contrastes ortogonales
Si se planeado comparar t-1 funciones de medias de tratamientos resultante de t-1
contrastes ortogonales :
1 2 1
, , ,
t
Q Q Q
K
, se puede demostrar que
1 2 1 t
SCTrat SCQ SCQ SCQ
+ + + K
Luego se puede tener el siguiente cuadro de ANVA
Fuente de
Variacin
SC GL CM F
c
Entre Tratamiento SCTrat GLTrat CMTrat / CMTrat CME
1
Q
1
SCQ 1
1
SCQ
1
/ SCQ CME
2
Q
2
SCQ 1
2
SCQ
2
/ SCQ CME
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1 t
Q
1 t
SCQ
1
1 t
SCQ
1
/
t
SCQ CME
Dentro de
Tratamiento
SCE GLE CME
Total SCTotal
.
1 n
Este cuadro de ANVA permite probar las siguientes pruebas de hiptesis:
0
1
: 0
t
i li i
i
H n C
versus
1
: 0
t
a i li i
i
H n C
, para
1, 2, , 1 l t K
donde :
1
0
t
i li
i
n C
y
1
0
t
i li l i
i
n C C
, para l l y
, 1, 2, , 1 l l t K
Nota: Para el caso de experimentos no balanceados (con tratamientos desigualmente
repetidos), sucede en muchos casos que los contrastes ortogonales que se construyen no
tienen sentidos, por esta razn lo ms comn es construir contrastes ortogonales para el
caso balanceado (con tratamientos igualmente repetido). En caso,
1 2 t
n n n n L
entonces se tiene
0
1
: 0
t
i i i
i
H n C
es equivalente a
0
1
: 0
t
i i
i
H nC
, luego
0
1
: 0
t
i i
i
H n C
versus
1
: 0
t
a i i
i
H C
_
,
Ejemplo : Suponga que se tiene cuatro fertilizantes que se desea comparar, con tal
motivo se realiz un experimento bajo un DCA con cinco repeticiones por tratamiento,
obtenindose los siguientes resultados:
Fertilizante
T
1
T
2
T
3
T
4
. i
Y
73.8 74.2 69.0 71.8
10.4 SCE
Adems, los fertilizantes 3 y 4 poseen un componente K que no poseen los fertilizantes
1 y 2. Se ha planeado antes de realizar el experimento comparar (
1
T
y
2
T
) versus (
3
T
y
4
T
). Obtenga todos los contrastes ortogonales. Realice las pruebas de hiptesis
correspondientes a un nivel de significacin 0.05
Matriz de contraste
Fertilizante
Coeficientes T
1
T
2
T
3
T
4
1i
C -1 -1 1 1
2i
C -1 1 0 0
3i
C 0 0 -1 1
Contrastes ortogonales
1 1. 2. 3. 4.
Q Y Y Y Y + +
2 1. 2.
Q Y Y +
3 3. 4.
Q Y Y +
Hiptesis:
(
1
T
y
2
T
) versus (
3
T
y
4
T
)
0 3 4 1 2
: 0 H +
contra
3 4 1 2
: 0
a
H +
1
T
versus
2
T
0 2 1
: 0 H
contra
2 1
: 0
a
H
3
T
versus
4
T
0 4 3
: 0 H
contra
4 3
: 0
a
H
( ) ( )
( ) ( ) ( ) ( )
2
2
1 .
1
1 2 2 2 2
2
1
1
5 73.8 74.2 69.0 71.8
64.8
1 1 1 1
t
i i
i
t
i
i
n C Y
SCQ
C
_
+ +
,
+ + +
( ) ( )
( ) ( )
2
2
2 .
1
2 2 2
2
2
1
5 73.8 74.2
0.4
1 1
t
i i
i
t
i
i
n C Y
SCQ
C
_
+
,
+
( ) ( )
( ) ( )
2
2
3 .
1
3 2 2
2
3
1
5 69.0 71.8
19.6
1 1
t
i i
i
t
i
i
n C Y
SCQ
C
_
+
,
+
Contraste SC GL CM F
c
(
1
T
y
2
T
) versus (
3
T
y
4
T
)
64.80 1 64.80 99.69*
1
T
versus
2
T 0.4 1 0.4 0.62 ns
3
T
versus
4
T 19.6 1 19.6 30.15*
Residual 10.4 16 0.65
*=Significativo ns = no significativo
( ) 0.95,1,16
4.49 F
> vp<-c(73.8,74.2,69,71.8)
> sce<-10.4
> r=5
> ct<-c(-1,-1,1,1)
> scc1<-r*((t(ct)%*%vp)^2)/(sum(ct^2))
> scc1
[,1]
[1,] 64.8
> ct2<-c(-1,1,0,0)
> scc2<-r*((t(ct2)%*%vp)^2)/(sum(ct2^2))
> scc2
[,1]
[1,] 0.4
> ct3<-c(0,0,-1,1)
> scc3<-r*((t(ct3)%*%vp)^2)/(sum(ct3^2))
> scc3
[,1]
[1,] 19.6
> tr<-4
> gle<-r*tr-tr
> gle
[1] 16
> cme<-sce/gle
> fuente<-c("Q1","Q2","Q3","Residuals")
> gl<-c(1,1,1,gle)
> SC<-c(scc1,scc2,scc3,sce)
> CM<-SC/gl
> Fc<-c(round(CM[1:3]/CM[4],4),"")
> Fc1<-as.numeric(Fc[1:3])
> pvalue1<-round(1-pf(Fc1,1,gle),4)
> pvalue<-c(pvalue1,"")
> data.frame(fuente,gl,SC,CM,Fc,pvalue)
fuente gl SC CM Fc pvalue
1 Q1 1 64.8 64.80 99.6923 0
2 Q2 1 0.4 0.40 0.6154 0.4442
3 Q3 1 19.6 19.60 30.1538 0
4 Residuals 16 10.4 0.65
>
Prueba de Scheffe
Es una prueba que permite realizar pruebas sobre cualquier funcin estimable de
medias de tratamientos (o de funciones lineales de medias de tratamientos). Esto quiere
decir que se puede realizar infinitas pruebas simultneas aunque en la prctica se
realice un nmero finito de pruebas simultneas. Inclusive esta prueba vlida para
comparaciones sugeridas por los datos. Luego, esta prueba de hiptesis sobre las
siguientes funciones lineales de parmetros:
1
t
i i
i
L C
donde
1
0
t
i
i
C
contra
1
: 0
t
a i i
i
H C
Nivel de significacin
donde:
.
1
t
i i
i
L CY
1
t
i
L
i
i
C
S CME
n
Se acepta
0
H
, si
L VCS
Se rechaza
0
H
, si
L VCS >
Ejemplo: Con los datos de tiempo de coagulacin, pruebe:
0
: 0
A B C D
H +
contra la alternativa
: 0
a A B C D
H +
0.05
A B C D
. i
Y
61 66 68 61
i
n 4 6 6 8
i
C 1 1 -1 -1
5.6 CME ,
( ) 0.95,3,20
3.098391 F
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
.
1
1 61 1 66 1 68 1 61 2
t
i i
i
L CY
+ + +
( )
( ) ( ) ( ) ( )
2 2 2 2
2
1
1 1 1 1
5.6 1.991649
4 6 6 8
t
i
L
i
i
C
S CME
n
1
+ + + 1
1
]
( )
( )
( ) ( ) ( )
1 , ,
1.991649 4 1 3.098391 6.0721382
GLTrat GLE L
VCS S GLTrat F
Como
,
de
tratamientos se puede seguir el siguiente procedimiento:
1) Plantear las hiptesis:
0
:
i i
H
:
a i i
H
, para i i , y
, 1, 2, . i i t K
2) Fijar el nivel de significacin de comparacin simultnea
, para i i , y
, 1, 2, . i i t K
4) Encontrar el valor Crtico de Bonferroni
( )
. .
1 ,
2
,
i i
Y Y
GLE
nc
VCB i i t S
,
donde:
. .
1 1
i i
Y Y
i i
S CME
n n
1
+
1
]
Se rechaza
0
H
para i i , y
, 1, 2, . i i t K
, si
( )
. .
,
i i
Y Y VCB i i
>
Para aplicar esta prueba se requiere que
ij
:
a i i
H
Para i i ,
, , , , i i A B C D
i
A D B C
. i
Y
61 61 66 68
i
n 4 8 6 6
( ) 0.05 0.9958333,20
1 ,20
12
2.927116 t t
_
,
, esto se obtuvo usando R:
> qt(0.9958333,20)
[1] 2.927116
Comparaciones
i i
Y Y
i i
Y Y
S
( )
( )
0.9995833,20
,
i i
Y Y
VCB i i t S
)
C-A 7 1.5275 4.471243* 4.471243
C-D 7 1.2780 3.74091* 3.740910
C-B 2 1.3663 3.999201ns 3.999201
B-A 5 1.5275 4.471243* 4.471243
B-D 5 1.2780 3.74091* 3.740910
D-A 0 1.4491 4.241793ns 4.241793
*=significativo , ns= no significativo
> pairwise.t.test(tiempo,dieta,p.adjust.method="bonferroni")
Pairwise comparisons using t tests with pooled SD
data: tiempo and dieta
a b c
b 0.02282 - -
c 0.00108 0.95266 -
d 1.00000 0.00518 0.00014
P value adjustment method: bonferroni
Nota el R da los pvalue ajustado de manera que se pueda tomar decisiones con la tasa
de error del experimento.
Prueba de Comparaciones Mltiple con el Mejor
El objetivo de esta prueba es seleccionar el conjunto de tratamientos o un slo
tratamiento (si es posible) que proporcione el resultado ms deseable. El procedimiento
de comparaciones mltiple con el mejor (CMM) permite al investigador clasificar los
tratamientos de manera que la mejor poblacin est incluida en subconjunto con un
nivel de confianza dado. Existen dos casos:
a) Eleccin de subconjunto con la media ms grande
b) Eleccin de subconjunto con la media ms pequea
a) Eleccin de subconjunto con la media ms grande
En este caso los parmetros de inters son:
. , para 1, 2, ,
i j
j i
mx i t
K
donde: j
j i
mx
. Si
. 0
i j
j i
mx
>
, entonces el
tratamiento i es el mejor. Por otro lado, si
. 0
i j
j i
mx
<
, entonces el tratamiento i
no es el mejor.
Los intervalos de confianza simultneos (ICS) de las CMM para
.
i j
j i
mx
tiene la
restriccin de incluir el cero con la perspectiva de que a la larga dos tratamientos nunca
tienen promedio idnticos. El intervalo de confianza CMM restringido establece que el
tratamiento i es uno de los mejores si el intervalo para
.
i j
j i
mx
incluye el cero o el
cero es su lmite inferior. Por el contrario, si el lmite superior del intervalo para
.
i j
j i
mx
K
. Esto es entre cada
media de tratamiento,
i
y
, y la mayor media de tratamiento de los restantes,
( )
j
j i
mx y
2.- La cantidad
, 1,
2
t gle
CME
M d
r
, donde
, 1, t gle
d
es el estadstico tabulado para las
comparaciones de un lado en la Tabla IV del apndice del texto Diseos de
Experimentos de Robert Kuehl para una tasa experimental de
, 1 t comparaciones y
gle
grados de libertad del error experimental.
3.- Encontrar los intervalos de confianza restringidos. El lmite inferior del intervalo de
confianza restringido para
.
i j
j i
mx
es:
, Si 0
0 de otra manera
i i
D M D M
L
<
'
es:
, Si 0
0 de otra manera
i i
D M D M
U
+ + >
'
4.- Para obtener el mejor tratamiento o el conjunto de los mejores de tratamientos con
una tasa de error experimental de
K
donde:
min
j
j i
. Si
. min 0
i j
j i
<
, entonces el
tratamiento i es el mejor. Por otro lado, si
. min 0
i j
j i
>
, entonces el tratamiento i
no es el mejor.
El procedimiento para construir los intervalos de confianza simultneos se da a
continuacin:
1.- Se calcula la diferencia,
( )
min , para 1, 2, ,
i i j
j i
D y y i t
K
. Esto es entre cada
media de tratamiento,
i
y
, y la menor media de tratamiento de los restantes,
( )
min
j
j i
y
2.- La cantidad
, 1,
2
t gle
CME
M d
r
, donde
, 1, t gle
d
es el estadstico tabulado para las
comparaciones de un lado en la Tabla IV del apndice del texto Diseos de
Experimentos de Robert Kuehl para una tasa experimental de
, 1 t comparaciones y
gle
grados de libertad del error experimental.
3.- Encontrar los intervalos de confianza restringidos. El lmite inferior del intervalo de
confianza restringido para
. min
i j
j i
es:
, Si 0
0 de otra manera
i i
D M D M
L
<
'
es:
, Si 0
0 de otra manera
i i
D M D M
U
+ + >
'
4.- Para obtener el mejor tratamiento o el conjunto de los mejores de tratamientos con
una tasa de error experimental de
1
(1)
Asignar el rango 1 al ms pequeo de la totalidad de N observaciones, rango 2 al
segundo ms pequeo, y as sucesivamente hasta el ms grande de todas las
observaciones, al cual se le asigna rango N. Sea R(X
ij
) que representa el rango asignado
a X
ij
. Sea
i
R
la suma de rango asignado a la i-sima muestra
( )
R R X
i ij
j
n
i
1
i=1, 2, ..., k (2)
Calcule R
i
para cada muestra.
En caso que existan empates, asignar el promedio de los rangos a cada una de las
observaciones empatadas.
Asunciones :
1.- Todas las muestras son muestras aleatorias de sus respectivas poblaciones
2.- Las muestras son mutuamente independientes.
3.- La escala de medida es al menos ordinal.
4.- Las k poblaciones tienen funciones de distribucin idnticas, o algunas de las
poblaciones tiende a producir valores ms grandes que otras poblaciones.
Hiptesis :
H
0
: Las k poblaciones tienen funciones de distribucin idnticas.
H
1
: Al menos una de las k poblaciones tiende a producir observaciones ms grandes
que las restantes.
Nota : La prueba de Kruskal - Wallis est diseado para ser ms sensitivo contra la
diferencia entre medias en k poblaciones, por esta razn, algunas veces la hiptesis
alternativa se expresa como sigue :
H
1
: Las k poblaciones no tiene medias idnticas.
Estadstico de Prueba : Se usa el siguiente estadstico
( )
T
S
R
n
N N
i
i i
k
+
1
]
1
1 1
4
2
2
1
2
(3)
donde
( )
( )
S
N
R X
N N
ij
i j
2
2
2
1
1
1
4
1
]
1
,
(4)
si no hay empates S
2
se simplifica a
( ) N N +1
4
2
y el estadstico de prueba se reduce a
( )
( ) T
N N
R
n
N
i
i i
k
+
+
12
1
3 1
2
1
(5)
Si hay pocos empates (nmero de empates moderado) de manera que los valores
obtenidos con la ecuacin (3) y (5) son muy prximos, entonces se prefiere usar
ecuacin (5).
Regla de decisin :
Si k=3, todos los tamaos de muestras son 5 o menos y no hay empates, el cuantil
exacto puede ser obtenido de la tabla A8. Tabla ms completa pueden ser obtenidos de
Iman Quade y Alexander (1975). Cuando hay empates o cuando tablas exactas no son
disponibles, entonces se puede usar la aproximacin
( )
T H es cierta
k
1
2
0
|
Comparaciones Mltiples :
Si y solamente si la hiptesis nula es rechazada, se puede usar el siguiente
procedimiento para determinar cuales de los pares de poblaciones tiende a ser
diferentes. As, para ver si existe diferencia entre las poblaciones i y j a un nivel de
significacin se compara:
R
n
R
n
i
i
j
j
con
( )
( )
t
S N T
N k n n
N k
i j
1
2
1 2
2
1 1 1
_
,
1
]
1
1
,
/
As si
( )
( ) R
n
R
n
t
S N T
N k n n
i
i
j
j
N k
i j
>
_
,
1
]
1
1
1
2
1 2
2
1 1 1
,
/
Existe diferencia entre las funciones de distribucin de las poblaciones i y j a un nivel
de significacin .
Ejemplo No 1 : Para comparar tres mtodos de enseanza de programacin en cierto
lenguaje en computadora, en donde:
El mtodo A: instruccin directa con la computadora
El mtodo B: instruccin de teora y prctica en computadora
El mtodo C: instruccin solo de clase tericas
Se extraen de grandes grupos de alumnos instruidas por uno de los mtodos en forma
aleatoria: 4 alumnos del mtodo A, 6 del mtodo B y 5 del mtodo C. Luego se les tom
una prueba. Los puntajes obtenidos se dan a continuacin:
Mtodos
A B C
73 91 72
77 90 76
67 81 79
71 83 77
84 78
83
H
0
: Los tres mtodos son equivalentes.
H
1
: Algunos mtodos de enseanza tiene puntajes ms altos que otros.
Mtodos
A B C 4
Observ. Rango Observ. Rango Observ. Rango
73 4 91 15 72 3
77 6.5 90 14 76 5
67 1 81 10 79 9
71 2 83 11.5 77 6.5
84 13 78 8
83 11.5
R
i
13.5 75 31.5
n
i
4 6 5
N=15
( )
( ) ( )
2 2
2
2
,
1 15 15 1
1 1
1239 19.92857
1 4 15 1 4
ij
i j
N N
S R X
N
1 1
+ +
_
1 1
,
1 1
] ]
( ) ( )
2 2
2
2
1
1 15 15 1
1 1
1181.513 11.11535
4 19.92857 4
k
i
i
i
N N R
T
S n
1 1
+ +
1 1
1 1
] ]
( )
2
0.95,2
5.991
, se rechaza H
0
.
Como se rechaz H
0
en la prueba anterior, entonces se prosigue con las comparaciones
mltiples para determinar entre que mtodos existe diferencias en los rendimientos:
( ) 0.975,11
2.201 t
Comparaciones
R
n
R
n
i
i
j
j
( )
( )
2
1/ 2
2
1 ,
1
1 1
N k
i j
S N T
t
N k n n
1
_
+ 1
1
, ]
A y B 9.125 3.078296*
A y C 2.925 3.199059ns
B y C 6.2 2.887698*
> metodos<-read.table("d:/datos/metodos.txt",header=T)
> puntaje<-metodos[,1]
> metodo<-metodos[,2]
> kruskal.test(puntaje,metodo)
Kruskal-Wallis rank sum test
data: puntaje and metodo
Kruskal-Wallis chi-squared = 11.1153, df = 2, p-value = 0.003858
> rank(puntaje)
[1] 4.0 6.5 1.0 2.0 15.0 14.0 10.0 11.5 13.0 11.5 3.0 5.0 9.0 6.5 8.0
> rango<-rank(puntaje)
> pr<-tapply(rango,metodo,mean)
> pr
a b c
3.375 12.500 6.300
> library(mvtnorm)
> library(multcomp)
> re<-tapply(rango,metodo,length)
> re
a b c
4 6 5
> mc<-as.matrix(contrMat(re,type="Tukey"))
> mc
a b c
b-a -1 1 0
c-a -1 0 1
c-b 0 -1 1
> difrp<-abs(mc%*%pr)
> difrp
[,1]
b-a 9.125
c-a 2.925
c-b 6.200
> sumrangoq<-sum(rango^2)
> sumrangoq
[1] 1239
> N<-length(rango)
> s2<-(sumrangoq-N*(N+1)^2/4)/(N-1)
> s2
[1] 19.92857
> kt<-kruskal.test(puntaje,metodo)
> T<-kt$statistic
> a<-mc[,1]
> b<-mc[,2]
> c<-mc[,3]
> mc1<-data.frame(a,b,c)
> mc1
a b c
1 -1 1 0
2 -1 0 1
3 0 -1 1
> mc1$a[mc1$a==-1]<-1
> mc1$b[mc1$b==-1]<-1
> mc1$c[mc1$c==-1]<-1
> mc1
a b c
1 1 1 0
2 1 0 1
3 0 1 1
> vdifre<-as.matrix(mc1)%*%rei
> vdifre
[,1]
1 0.4166667
2 0.4500000
3 0.3666667
> k<-length(re)
> vcc<-qt(0.975,N-k)*sqrt((s2*(N-1-T)/(N-k))*vdifre)
> vcc
[,1]
1 3.078296
2 3.199059
3 2.887698
> data.frame(difrp,vcc)
difrp vcc
b-a 9.125 3.078296
c-a 2.925 3.199059
c-b 6.200 2.887698