Professional Documents
Culture Documents
Introduccin
En las situaciones que hemos estudiado en el Captulo 1 hemos supuesto que existe
bastante homogneidad entre las unidades experimentales, as, por ejemplo, en el caso de la
industria algodonera, hemos supuesto que las parcelas de terreno son de la misma calidad
e igual supercie. Pero, puede suceder que dichas parcelas sean distintas y contribuyan a
la variablidad observada en el rendimiento de la semilla de algodn. Si en esta situacin
se utiliza un diseo completamente aleatorizado, las diferencias entre los rendimientos de
dos unidades experimentales sometidas a distintos tratamientos no sabremos si se deben
a una diferencia real entre los efectos de los tratamientos o a la heterogeneidad de dichas
unidades. Como resultado el error experimental reejar esta variabilidad entre las parcelas
de terreno.
En todo diseo de experimento se desea que el error experimental sea lo ms pequeo
posible. Por lo tanto, en la situacin descrita se debe sustraer del error experimental la
variabilidad producida por las parcelas de terreno. Para ello, el experimentador puede:
Considerar parcelas de terreno muy homogneas.
O bien, formar bloques de terreno de manera que el terreno de cada bloque sea lo
ms homogneo posible y los bloques entre s sean heterogneos.
En esta ltima situacin, cada bloque se divide en I parcelas de terreno, tantas como
tratamientos y cada tratamiento se prueba en cada uno de los bloques. Los I tratamientos,
en este caso las I variedades del fertilizante, se asignan al azar a cada una de las I parcelas
del bloque; esto se hace con asignacin aleatoria independientemente en cada bloque. Este
1
5.2.
El trmino bloques aleatorios procede de la experimentacin agrcola, en la que pueden usarse parcelas
de terreno como unidades experimentales. Un bloque consiste en varias parcelas adyacentes, y se supone
que las parcelas adyacentes son ms semejantes que las alejadas entre s.
2
El terreno, en cada bloque, debe ser lo ms homogneo posible.
de cada bloque cada una de las parcelas con un fertilizante. Al recoger la cosecha se mide
el rendimiento de la semilla, obtenindose las siguientes observaciones.
Tabla 4-1. Rendimiento de la
semilla de algodn
Fertilizantes
1
2
3
4
5
A
87
85
90
89
99
Bloques
B C
86 88
87 95
92 95
97 98
96 91
D
83
85
90
88
90
5.2.1.
Bloque j
y1j
.
yi1
.
yI1
Bloque J
y1J
.
yij
yiJ
.
yIj
.
yIJ
Supondremos que se realiza una observacin por tratamiento en cada bloque, por
tanto, hay un total de N = IJ observaciones y que la asignacin de los tratamientos a las
unidades experimentales en cada bloque se determina aleatoriamente. Tambin se supone
que tanto los tratamientos como los bloques son factores de efectos jos y que no hay
interaccin entre ellos. Se dice que no hay interaccin entre dos factores cuando el efecto
de un factor no depende del nivel del otro factor; en este caso se dice que los efectos de
los factores son aditivos.
Las observaciones se pueden disponer en forma de tabla de doble entrada como la
siguiente
Tabla 4-2. Diseo en bloques aleatorizado
Tratamientos
1
2
..
1
y11
y21
..
2
y12
y22
..
Bloques
j
y1j
y2j
..
..
i
..
yi1
..
yi2
..
..
yI1
yI2
yij
..
yIj
..
J
y1J
y2J
..
..
yiJ
..
yIJ
yi. =
yij
i = 1, 2, , I
(5.1)
j=1
y.j =
yij
i=1
j = 1, 2, , J
(5.2)
y.. =
I
.
yij =
J
.
yi. =
i=1 j=1
i=1
y.j
(5.3)
j=1
I
J
.
1 .
yij ,
N
i=1 j=1
que tambin se puede expresar como media de las medias parciales, es decir
I
-1 .
y.. =
i=1
1.J
yi. =
y.j .
j=1
i = 1, 2, , I ; j = 1, 2, , J ,
(5.4)
donde
yij es la variable aleatoria que representa la observacin (i)-sima del bloque (j)simo.
es un efecto constante que mide el nivel promedio de respuesta para todas las
unidades, denominado media global.
i es el efecto producido por el nivel i-simo del factor principal. Se supone que
.
i i = 0.
j es el efecto producido por el nivel j-simo del factor secundario o factor de bloque.
.
Se supone que j j = 0.
uij son variables aleatorias independientes con distribucin N (0, ), que engloban el
efecto de todas las restantes fuentes de variabilidad; al igual que en el modelo completamente aleatorizado, reciben el nombre de perturbaciones o error experimental.
En este modelo intervienen dos factores, el factor tratamiento y el factor bloque. Al
primero es usual llamarlo factor principal mientras que al segundo factor secundario,
puesto que nuestro inters fundamentalmente est centrado en el primero y el factor bloque
se introduce en el modelo para eliminar su inuencia en la variable respuesta.
Nuestro objetivo es estimar los efectos de los tratamientos y de los bloques y contrastar
la hiptesis de que todos los niveles del factor principal producen el mismo efecto, frente
a la alternativa de que al menos dos dieren signicativamente. Tambin es de inters
contrastar la igualdad de los efectos de los bloques.
La expresin y condiciones de este modelo se resumen en:
1o )
yij = + i + j + uij
2o )
uij ~ N (0, )
3o )
4o )
I
.
i = 0 ,
i=1
i, j
J
.
(5.5)
j = 0 .
j=1
Las hiptesis establecidas para la variable de perturbacin pueden ser formuladas tambin en trminos de la variable respuesta. Es decir, las observaciones yij son variables
aleatorias independientes con distribucin normal, con media
E[yij ] = + i + j ,
(5.6)
y varianza constante
2 [yij ] = 2
i, j .
(5.7)
(5.8)
5.2.2.
,
(5.9)
N
ln(2)
1
ln( 2 )
...
.2
, (5.10)
yij i j
2
i=1 j=1
y se hallan las primeras derivadas parciales respecto de los parmetros del modelo
I
ln L
=
1 ...
yij i j
2
ln L
=
i
1 ..
ij i j
y
2 j=1
ln L
=
j
I .
.
.
1
yij i j
2 i=1
ln L
2
i=1 j=1
J
I .
J
1 ..
y
= 2+
2
2( 2 )2 i=1 j=1
i = 1,
,I
(5.11)
j = 1, , J
ij
..
=
= y.. ,
(5.12)
i =
1.
(5.13)
1 I
. yij
= y.j y.. .
=I i=1
(5.14)
j=1
Por tanto, la media general se estima utilizando el promedio de todas las observaciones
y cualquiera de los efectos de los factores se estiman usando la diferencia entre el promedio
correspondiente al nivel del factor y el promedio total.
Se puede comprobar fcilmente que
.
i = 0
j = 0
siendo, por tanto, I 1 y J 1 los grados de libertad asociados a los tratamientos y a los
bloques, respectivamente.
j en la ltima ecuacin de (5.11) igualada a cero,
Finalmente, sustituyendo i y
obtenemos el estimador de mxima verosimilitud para la varianza
..
2 = 1 I J .yij
j .2 .
(5.15)
i
N
i=1 j=1
Residuos
Los residuos se denen como las diferencias entre los valores observados yij y los
valores estimados por el modelo yij y los denotamos por eij ,
yij
ij
2
Por lo tanto, el estimador mximo-verosimil,
, se puede escribir como
I
. .e
2
ij
i=1 j=1
(5.16)
Se verica que la suma de los residuos por las y por columnas es cero, en efecto
.
.
.
j ) = J y Jy J
eij =
(yij
j =
i
i.
..
i
j
.
eij =
i
J.
yi. Jy.. J(yi. y.. ) = 0
i = 1,.
,I
j =
j ) = Iy Iy
(yij
I
i
.j
..
i
i
j = 1, , J
]
=
E[]
E[y
..
N
N
i=1 j=1
i=1 j=1
I
.
1
N
N + J
i + I
i=1
J
.
j=1
1
=
N =
] = Var . . yij
Var[
i=1 j=1 N
. 2
i,j
N2
1
=
N2
I
J
.
.
i=1 j=1
N =
2
N
Var
. yij .
N
. Var [yij ]
i,j
N2
10
E[yi. ] = E
j=1
. J.
1
yij
+ i + j + uij
.
=
j=1
J
.
J
1
J
J + J i +
b) La varianza de i es (I 1)
j +
j=1
.
J
E[uij ]
= + i
j=1
, puesto que
N
1.
1 .
yij
yij
i,j
J
1 .
J2
Var(y ) +
ij
1 .
N2
i,j
Var(y )
ij
2 Cov
NJ
1 .
2
2
.
2+ 1
2
J2 j
N 2 i,j N J J =
1 2 1 2
2q2
q2 q2
q2
+
J
N
=
= (I 1)
N
J
N
N
.
y ,
ij
j
=
ij
i,j
(5.17)
c) i se distribuye segn una Normal, puesto que dicho estimador est expresado
como funcin lineal de variables aleatorias con distribucin Normal.
j
3) Propiedades de
11
E 1 . yij = E
I
I
i
..
.
.
.
+ i + j + uij =
.
.
.
.
1 I +
i + I j +
[u
]
E ij = + j
I
i
i
2
b) La varianza de j es (J 1)
N
j se distribuye segn una Normal.
c)
2
4) Propiedades de
2
2
no es un estimador insesgado de puesto que se verica
2
N
1 ..
2
(eij ) ~ 2(I1)(J 1) ,
= 2
i=1 j=1
N
2
.
(I 1)(J 1)
12
.
I .
J
(eij )2 ~ 2
(I1)(J 1)
i=1 j=1
Para ello, denamos los siguientes vectores, formado cada uno de ellos por N componentes:
Y=
=
=
=
U =
(5.19)
(5.20)
1
dividiendo (5.21) por y llamando Z = U, se tiene la siguiente descomposicin
( ) +
( ) +
1
e
( ) +
(5.22)
..
eij = 0
i
(5.23)
( ) e =
..
( )e = .(
i
i
)
) e =
(
13
ij
e =0
ij
..
.
.
j j )eij =
j j )
(
(
eij = 0
i
(5.24)
(5.25)
De forma similar se comprueba que los restantes productos escalares son nulos. Por
lo tanto, los vectores en que se descompone Z son ortogonales y se verican las
condiciones del teorema de Cochran cuyo enunciado presentamos en el Captulo 1.
Por consiguiente, los cuadrados de los mdulos de los vectores de la descomposicin
(5.22) seguirn distribuciones 2 independientes cuyos grados de libertad sern la
dimensin del subespacio al que pertenezca cada vector. De esta forma,
a) Como ( ) pertenece a un subespacio de dimensin 1, al tener todas sus
coordenadas iguales:
N (y.. )2
~ 1
2
b) Como ( ) pertenece a un subespacio de dimensin I 1, al tener I coordenadas distintas y una ecuacin de restriccin:
.
1
1
( i i )2
( ) ( ) = J
~ 2I1
.
eij = 0 ;
eij = 0
i
es decir, la suma de los residuos por las y por columnas es cero, lo que implica
I + J 1 ecuaciones de restriccin e IJ (I + J 1) = (I 1)(J 1) residuos
independientes. Por lo tanto,
14
..e
i
2
ij
2
~ (I1)(J 1) .
En resumen,
~ N (, 2 /N )
.
.
i ~ N i , (I 1) 2 /N
.
.
j ~ N j , (J 1) 2 /N
2
2
2 (I1)(J
N
/ ~
1)
5.2.3.
Descomposicin de la variabilidad
(5.26)
que expresa cada variable yij observada como la suma de cuatro trminos:
- La media total y.. , es decir el estimador de
- El efecto producido por el tratamiento i-simo, (desviacin de la media del i-simo
nivel del factor principal respecto de la media total), yi. y.. , es decir el estimador
de i
- El efecto producido por el bloque j-simo, (desviacin de la media del j-simo nivel
del factor bloque respecto de la media total), y.j y.. , es decir el estimador de j
- La diferencia entre los valores observados yij y los valores previstos por el modelo
yij, es decir el estimador de uij .
15
(5.27)
de: Contiene
libertad, Iyavalores
que distintos
= 0. yi. y.. , cada uno repetido J veces. Tiene I 1 grados
i i
: Contiene J valores
j
e: Contiene los N residuos estimados, que deben sumar cero por las y por columnas.
Tiene, por tanto, N (I + J 1) grados de libertad.
Por lo que, la ecuacin (5.26) aplicada a los N datos tomar la siguiente forma (mostrada anteriormente):
+e
Y = + +
(5.28)
Esta descomposicin est formada por componentes ortogonales dos a dos siendo los
grados de libetad de Y la suma de los grados de libertad de los componentes. En efecto,
se comprueba directamente que
= y..
I .
J
.
i = 0
i=1 j=1
= y..
I
J
.
.
j = 0
i=1 j=1
e = y..
I .
J
.
eij = 0
i=1 j=1
I
J
.
.
j =
=
i
i=1
j=1
16
e =
e =
I
.
i
J
.
i
eij =
1
j=1
J
.
j=1
I
.
eij = 0
i=1
y
N = 1 + (I 1) + (J 1) + (I 1)(J 1)
La ecuacin (5.26) tambin se puede expresar
yij y.. = (yi. y..) + (y.j y.. ) + (yij yi. y.j + y.. ) ,
(5.29)
elevando los dos miembros al cuadrado y sumando para todas las observaciones tenemos
I .
J
.
i=1 j=1
(yij y.. )2 =
I .
J
.
i=1 j=1
I
.
(yi. y.. )2 + I
i=1
J
.
(y.j y.. )2 +
j=1
I .
J
.
(yij yi. y.j + y.. )2 +
i=1 j=1
(5.30)
I .
J
.
2
i=1 j=1
I .
J
.
2
(y.j y.. )(yij yi. y.j + y.. )+
i=1 j=1
I .
J
.
2
(yi. y.. )(yij yi. y.j + y.. )
i=1 j=1
donde los dobles productos se anulan (ya que los trminos son ortogonales, como acabamos
de comprobar), por lo que dicha ecuacin queda en la forma
I .
J
.
(yij y..
)2
I
.
= J
i=1 j=1
(yi. y..
)2
J
.
+I
i=1
(y.j y..
17
)2
I .
J
.
j=1
i=1 j=1
(5.31)
que representa la ecuacin bsica del anlisis de la varianza, que simblicamente podemos
escribir
SCT = SCT r + SCBl + SCR ,
donde hemos desglosado la variabilidad total de los datos
SCT =
I .
J
.
(yij y.. )2 ,
i=1 j=1
i=1
j=1
de los bloques y la media general, que expresa la variabilidad explicada por los
bloques, denominada suma de cuadrados entre bloques.
.
3) SCR = Ii=1 .Jj=1 (yij yi. y.j + y.. )2 , la suma de cuadrados de los residuos, que
expresa la variabilidad no explicada por el modelo, denominada suma de cuadrados
del error.
A partir de la ecuacin bsica del ANOVA se pueden construir los cuadrados medios
denidos como:
Cuadrado medio total
I .
J
.
(yij y.. )2
2
ST =
i=1 j=1
N 1
(5.32)
18
I
.
J
(yi. y.. )2
i=1
ST r =
(5.33)
I 1
J
.
I
2
SBl =
(y.j y.. )2
j=1
(5.34)
J 1
I .
J
.
2
SR =
i=1 j=1
(I 1)(J 1)
(5.35)
J
.
yi. = J + J i +
19
yi. = + i + ui.
j + ui. ;
j=1
I
.
y.j = I +
y.j = + j + u.j
i + I j + u.j ;
(5.36)
i=1
I
.
y.. = N + J
i + I
J
.
i=1
j=1
I
.
(yi. y.. )2
i=1
ST r =
I 1
I
.
J
i=1
i2
I 1
J
+
i=1
J
.
I
.
(ui. u.. )2
i=1
I 1
I 1
2J
i (ui. u.. )
j=1
I 1
.
.
= E
2
E S
Tr
.
I
.
I
i2
i=1
I 1
J
+E
.
I
(ui. u.. )2
i=1
I 1
2J
+E
i (ui. u.. )
i=1
I 1
(5.37)
Ahora bien, puesto que:
a) El modelo es de efectos jos E[ i ] = i , entonces
20
.
I
i2
i=1
I 1
J . . 2.
J . 2
i
E i =
=I 1
I 1 i
i
(5.38)
.
(ui. u.. )2
I
.
J
=
i=1
I 1
I 1
E [ui. u.. ]2 =
i=1
I
J .
E [(yi. y.. ) i ]2 =
I 1 i=1
I 1
E [ i E [ ]] =
i=1
I
.
Var ( ) =
I 1
i=1
.
I
2
2
(I 1) = J (I 1)I = 2
N
I 1
N
I 1 i=1
J
(5.39)
2J
E
i (ui. u.. )
i=1
I 1
.
2
i E [ui. u.. ] = 0 .
= I 1J
i=1
(5.40)
Por lo tanto, sustituyendo las expresiones (5.38), (5.39) y (5.40) en (5.37) tenemos
que el valor esperado del cuadrado medio entre grupos es:
T2r ) =
E (S
21
J . 2
+ 2
I 1 i=1 i
(5.41)
J
I . 2
+ 2
J 1 j=1 j
(5.42)
3o ) Ya hemos visto en la subseccin 5.2.2 que la varianza residual es un estimador insesgado de la varianza poblacional, es decir
2
2
E (S
R ) =
4o ) Por ltimo, calculemos el valor esperado del cuadrado medio total. Para ello nos
basaremos en la ecuacin bsica del ANOVA que podemos poner en funcin de los
cuadrados medios de la siguiente forma:
2
S2
S2
S2
.
. .
.
2
de donde, sustituyendo los valores obtenidos anteriormente para E ST2r , E SBl
y
. .
2 , obtenemos
E SR
I
.
J
2
E(ST ) =
i=1
J
.
i2
N 1
I
+
j2
j=1
N 1
(5.43)
Observacin 5.1
Hemos visto que al aplicar el mtodo de mnimos cuadrados al modelo completamente
aleatorizado, se obtiene el sistema de ecuaciones normales (??). En el caso del modelo en
bloques completos aleatorizados, las ecuaciones normales para tratamientos no contienen
22
informacin con respecto a los efectos de bloques, y recprocamente, las ecuaciones normales para bloques no contienen informacin alguna sobre los efectos de los tratamientos,
(la informacin con respecto a los tratamientos no se encuentra mezclada con aquella
debida a los efectos de los bloques). Y as, un contraste entre efectos de tratamientos se
realiza comparando las medias de tratamientos e idnticamente, un contraste entre efectos
de bloques se realiza comparando las medias de los bloques. Cuando esto ocurre, se dice
que los efectos de bloques y tratamientos son ortogonales.
5.2.4.
Anlisis estadstico
El contraste estadstico de ms inters en este modelo, como mencionamos anteriormente, es el que tiene como hiptesis nula la igualdad de medias de los tratamientos:
H0 1 = 2 = = I = 0
(5.44)
(5.45)
a) SR = SCR/(I 1)(J I) es un estimador insesgado de la varianza , independientemente de que se veriquen las hiptesis nulas.
b) Si no hay diferencia entre las medias de los I tratamientos;
es decir, si es cierta la
2
2
hiptesis de que todo i = 0, el primer sumando de E(ST r ) es nulo, y entonces ST r
es un estimador insesgado de 2 .
c) Si no hay diferencia entre las medias de los J bloques;
es decir, si es cierta la hiptesis
2
2
23
yij
e
=
+ + +
.
i
j
ij
(5.46)
Considerando esta descomposicin para totas las observaciones y expresndola en forma vectorial, tenemos
Z = Z1 + Z2 + Z3 + Z4
(5.47)
siendo
1
Z=
Z1 =
Z2 =
1
Z3 =
Z4 =
1
1 , . . . . .,
J ,
1 , . . . . .,
J , . . . . .,
1 , . . . . .,
J )
(
(e11 , . . . , e1J , e21 , . . . , e2J , . . . ., eI1 , . . . , eIJ )
donde
Z: Contiene N trminos independientes
libertad.
(y
ij
1
Z1: Contiene N coordenadas iguales a (y.. ). Tiene, por tanto, un grado de
libertad.
24
1
Z2: Contiene I valores distintos i , cada uno repetido J veces y sujetos a una
.
ecuacin de restriccin,
i = 0. Tiene, por tanto, I 1 grados de libertad.
i
1
Z3: Contiene J valores .
distintos j , cada uno repetido I veces y sujetos a una
ecuacin de restriccin,
j = 0. Tiene, por tanto, J 1 grados de libertad.
j
1
Z4: Contiene N coordenadas eij , sujetas a I + J 1 ecuaciones de restriccin,
.
.
j eij = 0 para i = 1, . . . , I. y
i eij = 0 para j = 1, . . . , J. Tiene, por tanto,
(I 1)(J 1) grados de libertad.
Bajo las hiptesis nulas hemos realizado una descomposicin del vector Z, de variables
N (0, 1) independientes, en componentes ortogonales. Dicha descomposicin cumple las
condiciones del Teorema de Cochran, vericndose que:
i)
J
SCTr
.
(y i. y.. )2
i
ii)
.
I
SCBl
2
iii)
.
SCR
i,j
~ I1
(y .j y.. )2
~ J 1
~ (I1)(J 1)
=
2
2
y adems estas tres distribuciones son independientes entre s.
Hay que notar que:
Por una parte, se tiene que SCR/ 2 se distribuye como una 2 con (I 1)(J 1)
grados de libertad, se verique o no la hiptesis nula, como ya vimos en la subseccin
5.2.2
Por otra parte, bajo las hiptesis (5.44) y (5.45), se tiene que SCT r/ 2 y SCBl/ 2
se distribuyen como una 2 con I 1 y J 1 grados de libertad, respectivamente.
25
Por consiguiente, bajo las hiptesis de igualdad de efectos de los tratamientos y los
bloques, se verica
SCT r/ 2
2
S
1
T
F =
= 2r
SCR/ 2
SR
(I 1)(J 1)
(5.48)
y
SCBl/ 2
S2
J 1
F =
~ F(J 1),(I 1)(J 1) .
(5.49)
= Bl
2
SCR/ 2
SR
(I 1)(J 1)
Estos son los estadsticos de contraste para probar dichas hiptesis nulas. Por lo tanto:
Si la hiptesis de igualdad de efectos de los tratamientos es cierta, tanto el numerador
como el denominador del estadstico de contraste (5.48) son estimadores insesgados
de 2, mientras que si dicha hiptesis no es cierta, la esperanza del numerador del
estadstico de contraste (5.48) es mayor que la esperanza del denominador, por lo
que rechazaremos H0 cuando el valor experimental de dicho estadstico sea mayor
que el valor terico, F(I1),(I1)(J 1); .
Siguiendo el mismo razonamiento anterior, se rechazar la hiptesis nula de igualdad
de efectos de los bloques cuando el valor del estadistico de contraste (5.49) sea mayor
que el valor terico, F(J 1),(I1)(J 1); .
Aunque hemos dicho que el contraste principal es el de la igualdad de medias de los
tratamientos, tambin es interesante la comparacin entre las medias de los bloques, ya
que la ecacia de este diseo depende de los efectos de los bloques. Un valor grande
del cociente (5.49), implica que el factor bloque tiene un efecto grande, es decir que los
bloques realmente inuyen mucho. En este caso, este diseo es ms ecaz que el diseo
2
completamente aleatorizado ya que si el cuadrado medio entre bloques,SBl , es grande, el
trmino residual ser mucho menor y el contraste principal (5.44) ser ms sensible a las
diferencias entre tratamientos.
Si los efectos de los bloques son muy pequeos, el anlisis por bloques quiz no sea
necesario y en caso extremo, cuando el cociente (5.49) es prximo a 1, puede llegar a
ser perjudicial, ya que el nmero de grados de libertad, (I 1)(J 1), del denominador
en la comparacin de tratamientos (5.48) es menor que el nmero de grados de libertad
correspondiente, IJ I = I(J 1), en el diseo completamente aleatorizado.
Para una mayor sencillez en el clculo se utilizan las expresiones abreviadas de SCT ,
SCT r, SCBl y SCR, dadas a continuacin
26
I .
J
.
SCT =
i=1 j=1
yij2
y..2
IJ
y2
.
SCT r = 1
yi.2 ..
J
IJ
(5.50)
i=1
J
.
y2
SCBl = 1
y.j2 .. ,
I
IJ
j=1
(5.51)
Suma de
cuadrados
I
.
Grados de
libertad
Cuadrados
medios
Fexp
I 1
S T2 r
2
S T2 r/S R
J 1
2
SBl
2 2
SBl
/S R
(I 1)(J 1)
S2
R
IJ 1
ST2
i=1
J
.
Entre bloques
I
j=1
Residual
TOTAL
27
Suma de
cuadrados
I
.
Grados de
libertad
Cuadrados
medios
Fexp
Entre tratam.
1
J
y2..
= SCT r
IJ
I 1
ST2 r
2
ST2 r /SR
Entre bloques
J
1.
y2..
2
y
.j
I
IJ = SCBl
J1
2
SBl
2 2
SBl
/S R
(I 1)(J 1)
S2
R
IJ 1
ST
yi.2
i=1
j=1
Residual
TOTAL
..
yij2
i=1 j=1
y2
..
IJ
Una de las ventajas del diseo en bloques aleatorizados es que se puede transformar
en un diseo unifactorial, simplemente suprimiendo el estudio por bloques y uniendo su
variabilidad a la residual.
Coecientes de determinacin
Al igual que en el modelo completamente aleatorizado, una medida apropiada
para comprobar la adecuacin del modelo a los datos es el coeciente de determinacin,
denotado por R2 y denido como el cociente entre la suma de las variabilidades explicadas
por los tratamientos y los bloques, y la variabilidad total
R2 =
SCTr +SCBl
.
SCT
Llamando
R2 al cociente entre la variabilidad explicada por los tratamientos y la total, es decir
SCTr
R2 = SCT ,
28
Fertilizantes
1
2
3
4
5
y.j
y 2.j
. ij
y2
bloques
yi.
A
B
C
D
87
86
88
83
344
85
87
95
85
352
90
92
95
90
367
89
97
98
88
372
99
96
91
90
376
450
458
467
436
1811
202500 209764 218089 190096 820449
40616 42054 43679 38058 164407
yi.2
118336
123904
134689
138384
141376
656689
29
siguiente forma:
5 .
4
.
SCT =
2
yij
i=1 j=1
y..2
(1811)2
IJ = 164407
= 420,95
20
5
656689 (1811)2
y2
.
1
SCT r =
= 186,20
yi.2 .. =
J
IJ
20
4
i=1
SCBl =
1.
4
j=1
y2
.j
2
y..2 = 820449 (1811)
= 103,75
5
20
IJ
Suma de
cuadrados
186.20
103.75
131.00
420.95
Grados de
libertad
4
3
12
19
Cuadrados
medios
46.5500
34.5833
10.9166
Fexp
4.264
3.168
30
SCTr
R2 =
SCTBl
SCT
SCT
186,2
420,95
= 0,4423
103,75
420,95
= 0,2464 ,
que:
a) El factor tipo de fertilizante explica el 44.23 % de la variabilidad en el rendimiento
de la semilla de algodn.
b) El factor tipo de terreno explica el 24.64 % de la variabilidad en el rendimiento
de la semilla de algodn.
Es interesante ver los resultados que se hubiesen obtenido de no haberse realizado un
diseo en bloques aleatorizados. Para ello, supongamos que prescindimos del factor tipo
de terreno y realizamos un anlisis de la varianza de un factor, obtenindose la tabla
ANOVA siguiente
Tabla 4-7. Anlisis de la varianza para los datos del Ejemplo 4-1
Fuentes de
variacin
Entre tratamientos
Residual
TOTAL
Suma de
cuadrados
186.20
234.75
420.95
Grados de
libertad
4
15
19
Cuadrados
medios
46.55
15.65
Fexp
2.974
5.3.
31
Comparaciones mltiples
32
Figura 4-2
Tambin se puede comprobar qu bloques son signicativamente distintos
mediante
.
2 /I, que en
un procedimiento grco como el anterior, pero con un factor de escala
SR
,
nuestro ejemplo tiene el valor 10,9166/5 = 1,47761. Dicho procedimiento se muestra en
la Figura 4-3, donde comprobamos que se conrma el resultado del contraste F del anlisis
de la varianza, es decir, no hay diferencias signicativas entre los bloques.
Figura 4-3
5.4.
33
5.4.1.
i = 1, 2, , I
j = 1, 2, , J ,
(5.52)
34
yij = + i + j + i j + uij
i = 1, 2, , I ; j = 1, 2, , J ,
(5.53)
i =
j =
i j =
i j = 0 .
En primer lugar abordaremos la estimacin de los parmetros del modelo. Para ello,
se construye la funcin de verosimilitud asociada a la muestra y =(y11 , , y1J , ,
yI1 , , yIJ ):
L(, i , j , , 2) = (2 2 ) 2 exp
1 .
I .
J .
.2
y
ij
i
i j
j
2 2
,
i=1 j=1
(5.54)
se determina el logaritmo de dicha funcin
N
ln(L(, i , 2)) =
N
ln(2)
1
ln( 2 )
...
.2
yij i j i j
,
2
i=1 j=1
(5.55)
y se hallan las primeras derivadas parciales respecto de los parmetros del modelo, obtenindose las mismas expresiones que en (5.12)-(5.14) para los estimadores de los parmetros
, i y j .
El estimador mximo verosimil de se obtiene realizando la correspondiente derivada
parcial, es decir
I
J
.
ln L
1 ...
= 0
=
yij i j i j i j
(5.56)
i=1 j=1
de donde
.
I .
J
i=1 j=1
yij i j
.
I
i=1
.
J
j=1
.
I
.
J
i
i=1
j=1
i=1
i=1
. 2 . i . 2 . 2 = 0 .
j
j=1
j=1
Por lo tanto
35
. . j yij
i=1 j=1 i
I
.
i=1
i2
(5.57)
.
j
j=1
i=1 j=1
(5.58)
I
J
.
.
2
(yi. y.. )
(y.j y.. )2
i=1
j=1
Como hemos supuesto la existencia de interaccin entre los factores, hay que introducir
en este modelo una suma de cuadrados que represente dicha interaccin, esta suma de
cuadrados se denota por SCIT y viene dada por la expresin
..
2
SCIT =
2 2
(5.59)
i j ,
i
..
IJ
(yi. y.. )(y.j y.. )yij
..
SCIT =
i=1 j=1
i=1 j=1
I
.
i=1
(yi. y.. )2
J
.
. (5.60)
(y.j y.. )2
j=1
Por lo tanto, la ecuacin bsica del anlisis de la varianza para el modelo con interaccin (5.53) debe tener un trmino ms que la citada ecuacin del modelo en bloques
aleatorizados. Dicha ecuacin se expresa simblicamente en la forma
SCT = SCT r + SCBl + SCIT + SCR ,
donde
(5.61)
36
(5.63)
puesto que, F se distribuye como una F1,IJIJ cuando H0 es cierta y puesto que los
valores grandes de Fexp conducen a la conclusin H1, la decisin apropiada para controlar
un riesgo de error de Tipo I igual a , es:
Si Fexp F,1,IJ IJ , se acepta H0
(5.64)
Si Fexp > F,1,IJ IJ , se rechaza H0 ,
donde F,1,IJ IJ es el punto crtico superior de la distribucin F con 1 y IJ I J
grados de libertad.
A n de ilustrar este procedimiento utilicemos el Ejemplo 4-1. Para ello, construimos
la Tabla 4-8, organizando los datos de la siguiente manera:
37
1
2
3
4
5
y.j
j
87
85
90
89
99
90
0,55
86
87
92
97
96
91,6
1,05
88
95
95
98
91
93,4
2,85
83
85
90
88
90
87,2
3,35
86,00
88,00
91,75
93,00
94,00
90,55 = y..
2i
y
i j ij
4,55 20,702 j=1 69,16
6,502
2,55
78,03
1,20 1,440
19,62
2,45 6,002
91,63
3,45 11,902
14,49
46,55
21,45
(46,55)(20,75)
. 2 . 2
j
i
. i. j 2
SCIT =
2 2 = ( 0,022)2 (46,55)(20,75) = 0,4760 .
i j
38
Bibliografa utilizada
Garca Leal, J. & Lara Porras, A.M. (1998). Diseo Estadstico de Experimentos.
Anlisis de la Varianza. Grupo Editorial Universitario.
Lara Porras, A.M. (2000). Diseo Estadstico de Experimentos, Anlisis de la Varianza y Temas Relacionados: Tratamiento Informtico mediante SPSS Proyecto Sur
de Ediciones.