Bloques Completos

Captulo 5
Diseos en bloques aleatorizados

5.1.
Introduccin
En las situaciones que hemos estudiado en el Captulo 1 hemos supuesto que existe
bastante homogneidad entre las unidades experimentales, as, por ejemplo, en el caso de la
industria algodonera, hemos supuesto que las parcelas de terreno son de la misma calidad
e igual supercie. Pero, puede suceder que dichas parcelas sean distintas y contribuyan a
la variablidad observada en el rendimiento de la semilla de algodn. Si en esta situacin
se utiliza un diseo completamente aleatorizado, las diferencias entre los rendimientos de
dos unidades experimentales sometidas a distintos tratamientos no sabremos si se deben
a una diferencia real entre los efectos de los tratamientos o a la heterogeneidad de dichas
unidades. Como resultado el error experimental reejar esta variabilidad entre las parcelas
de terreno.
En todo diseo de experimento se desea que el error experimental sea lo ms pequeo
posible. Por lo tanto, en la situacin descrita se debe sustraer del error experimental la
variabilidad producida por las parcelas de terreno. Para ello, el experimentador puede:
Considerar parcelas de terreno muy homogneas.
O bien, formar bloques de terreno de manera que el terreno de cada bloque sea lo
ms homogneo posible y los bloques entre s sean heterogneos.
En esta ltima situacin, cada bloque se divide en I parcelas de terreno, tantas como
tratamientos y cada tratamiento se prueba en cada uno de los bloques. Los I tratamientos,
en este caso las I variedades del fertilizante, se asignan al azar a cada una de las I parcelas
del bloque; esto se hace con asignacin aleatoria independientemente en cada bloque. Este
1
diseo se conoce como diseo en bloques 1 completos aleatorizados. La palabra completo

indica que todos los tratamientos se prueban en cada bloque.
Puede suceder, cuando se realizan diseos en bloques aleatorizados, que no puedan
realizarse los ensayos de todos los tratamientos dentro de cada bloque, debido, por ejemplo,
a la escasez de recursos del experimento o al tamao fsico de los bloques. Es decir, no
se puede aplicar cada fertilizante en cada bloque. En estos casos, es posible usar diseos
aleatorizados por bloques en los que no todos los tratamientos se encuentran representados
en cada bloque, y aquellos que s estn representados en uno en particular se ensayan en
l una sola vez. Estos diseos se conocen como diseos por bloques incompletos.
Recordemos que en el diseo completamente aleatorizado asignbamos los tratamientos al azar a las parcelas sin restriccin alguna, mientras que en el diseo en bloques
aleatorizados primero agrupamos las parcelas en bloques y a continuacin asignamos los
tratamientos a las parcelas en cada bloque. Podemos decir, por tanto, que un diseo en
bloque aleatorizados es un diseo con aleatorizacin restringida en el cual las unidades
experimentales son primero clasicadas en grupos homogneos, llamados bloques, y los
tratamientos son entonces asignados aleatoriamente dentro de los bloques.
Esta estrategia de diseo mejora efectivamente la precisin en las comparaciones al
reducir la variabilidad residual. Dicho diseo es quizs el diseo experimental ms ampliamente utilizado. En la prctica, las situaciones en las que este diseo se aplica son muy
numerosas y pueden identicarse fcilmente.
Estudiaremos en primer lugar el diseo en bloques completos aleatorizados, y en la
seccin ?? el diseo en bloques incompletos.
5.2.
Diseo en bloques completos aleatorizados
Para desarrollar esta seccin consideramos el siguiente ejemplo al que seguiremos

haciendo referencia en las sucesivas secciones.
Ejemplo 5.1
Una industria algodonera, interesada en maximizar el rendimiento de la semilla de algodn, quiere comprobar si dicho rendimiento depende del tipo de fertilizante utilizado para
tratar la planta. A su disposicin tiene 5 tipos de fertilizantes. Como puede haber diferencia
entre las parcelas, el experimentador decide efectuar un diseo en bloques aleatorizados.
Para ello, divide el terreno en 4 bloques2 y cada bloque en 5 parcelas, fumigando dentro
1
El trmino bloques aleatorios procede de la experimentacin agrcola, en la que pueden usarse parcelas
de terreno como unidades experimentales. Un bloque consiste en varias parcelas adyacentes, y se supone
que las parcelas adyacentes son ms semejantes que las alejadas entre s.
2
El terreno, en cada bloque, debe ser lo ms homogneo posible.
5.2 Diseo en bloques completos aleatorizados
de cada bloque cada una de las parcelas con un fertilizante. Al recoger la cosecha se mide
el rendimiento de la semilla, obtenindose las siguientes observaciones.
Tabla 4-1. Rendimiento de la
semilla de algodn
Fertilizantes
1
2
3
4
5
A
87
85
90
89
99
Bloques
B C
86 88
87 95
92 95
97 98
96 91
D
83
85
90
88
90
Especicamente, en este experimento, se han considerado 5 tipos de fertilizantes que

se han aplicado aleatoriamente a las parcelas dentro de cada bloque. La variable de inters
o variable respuesta es el rendimiento de la semilla en peso por unidad de supercie. En
este ejemplo hemos supuesto que el tipo de terreno inuye en el rendimiento de la semilla
de algodn y decidimos controlar estadsticamente sus efectos, mediante la formacin de
bloques. Es decir, nuestro propsito es eliminar en el estudio de los efectos del fertilizante la
variabilidad debida al terreno e intentar que de esta forma sean ms patentes las diferencias
entre los fertilizantes, si las hay.
5.2.1.
Planteamiento del modelo
Todo el planteamiento anterior se puede formalizar de manera general. Supongamos

I tratamientos, (I fertilizantes), y supongamos tambin que hay otra variable que pueda
inuir en la variable respuesta, (por ejemplo el tipo de terreno) y cuyos efectos deseamos
controlar estadsticamente. Para ello, seleccionamos J niveles de esta variable, J bloques,
y aplicamos cada uno de los I niveles del tratamiento en cada bloque. La gura 4-1 muestra
este tipo de diseo.
Bloque 1
y11
Bloque j
y1j
.
yi1
.
yI1
Bloque J
y1J
.
yij
yiJ
.
yIj
.
yIJ
Figura 4-1. Diseo en bloques completos aleatorizados.
Supondremos que se realiza una observacin por tratamiento en cada bloque, por
tanto, hay un total de N = IJ observaciones y que la asignacin de los tratamientos a las
unidades experimentales en cada bloque se determina aleatoriamente. Tambin se supone
que tanto los tratamientos como los bloques son factores de efectos jos y que no hay
interaccin entre ellos. Se dice que no hay interaccin entre dos factores cuando el efecto
de un factor no depende del nivel del otro factor; en este caso se dice que los efectos de
los factores son aditivos.
Las observaciones se pueden disponer en forma de tabla de doble entrada como la
siguiente
Tabla 4-2. Diseo en bloques aleatorizado
Tratamientos
1
2
..
1
y11
y21
..
2
y12
y22
..
Bloques
j
y1j
y2j
..
..
i
..
yi1
..
yi2
..
..
yI1
yI2
yij
..
yIj
..
J
y1J
y2J
..
..
yiJ
..
yIJ
Generalmente no vamos a utilizar el trmino completo cuando en el contexto est claro

que todos los tratamientos estn incluidos en cada bloque.
Utilizamos la siguiente notacin:
N = IJ es el nmero total de observaciones.
yi. es el total de las observaciones bajo el i-simo tratamiento, es decir
J
.
yi. =
yij
i = 1, 2, , I
(5.1)
j=1
y.j es el total de las observaciones bajo el j-simo bloque, es decir

I
.
y.j =
yij
i=1
j = 1, 2, , J
(5.2)
y.. es la suma de todas las observaciones, denominado el total general, es decir

I .
J
.
y.. =
I
.
yij =
J
.
yi. =
i=1 j=1
i=1
y.j
(5.3)
j=1
yi. es la media de las observaciones del tratamiento i-simo, es decir

yi.
yi. =
y.j es la media de las observaciones del bloque j-simo, es decir

y.j
y.j =
y.. es la media general de las observaciones, es decir

y..
y.. =
I
J
.
1 .
yij ,
N
i=1 j=1
que tambin se puede expresar como media de las medias parciales, es decir
I
-1 .
y.. =
i=1
1.J
yi. =
y.j .
j=1
El modelo estadstico para este diseo es:

yij = + i + j + uij
i = 1, 2, , I ; j = 1, 2, , J ,
(5.4)
donde
yij es la variable aleatoria que representa la observacin (i)-sima del bloque (j)simo.
es un efecto constante que mide el nivel promedio de respuesta para todas las
unidades, denominado media global.
i es el efecto producido por el nivel i-simo del factor principal. Se supone que
.
i i = 0.
j es el efecto producido por el nivel j-simo del factor secundario o factor de bloque.
.
Se supone que j j = 0.
uij son variables aleatorias independientes con distribucin N (0, ), que engloban el
efecto de todas las restantes fuentes de variabilidad; al igual que en el modelo completamente aleatorizado, reciben el nombre de perturbaciones o error experimental.
En este modelo intervienen dos factores, el factor tratamiento y el factor bloque. Al
primero es usual llamarlo factor principal mientras que al segundo factor secundario,
puesto que nuestro inters fundamentalmente est centrado en el primero y el factor bloque
se introduce en el modelo para eliminar su inuencia en la variable respuesta.
Nuestro objetivo es estimar los efectos de los tratamientos y de los bloques y contrastar
la hiptesis de que todos los niveles del factor principal producen el mismo efecto, frente
a la alternativa de que al menos dos dieren signicativamente. Tambin es de inters
contrastar la igualdad de los efectos de los bloques.
La expresin y condiciones de este modelo se resumen en:
1o )
yij = + i + j + uij
2o )
uij ~ N (0, )
3o )
uij son independientes entre s
4o )
I
.
i = 0 ,
i=1
i, j
J
.
(5.5)
j = 0 .
j=1
Las hiptesis establecidas para la variable de perturbacin pueden ser formuladas tambin en trminos de la variable respuesta. Es decir, las observaciones yij son variables
aleatorias independientes con distribucin normal, con media
E[yij ] = + i + j ,
(5.6)
y varianza constante
2 [yij ] = 2
i, j .
(5.7)
En este planteamiento, el contraste de hiptesis ms importante es

H0 : i = 0
i
H1 : i = 0 por lo menos para algn i .
(5.8)
A continuacin, vamos a estudiar la estimacin de los parmetros del modelo , i , j

y 2 .
5.2.2.
Estimacin de los parmetros del modelo
Estimacin por mxima verosimilitud

Al igual que en modelo completamente aleatorizado se construye la funcin de
verosimilitud asociada a la muestra y = (y11, , y1J , , yI1 , , yIJ ):
N
.
.2
1 .
I .
J
L(, i , j , 2 ) = (2 2 ) 2 exp 2
yij i j
2
i=1 j=1
,
(5.9)
se determina el logaritmo de dicha funcin

N
ln(L(, i , j , 2 )) =
N
ln(2)
1
ln( 2 )
...
.2
, (5.10)
yij i j
2
i=1 j=1
y se hallan las primeras derivadas parciales respecto de los parmetros del modelo
I
ln L
=
1 ...

yij i j
2
ln L
=
i
1 ..
ij i j
y
2 j=1
ln L
=
j
I .
.
.
1
yij i j
2 i=1
ln L
2
i=1 j=1
J
I .
J
1 ..
y
= 2+
2
2( 2 )2 i=1 j=1
i = 1,
,I
(5.11)
j = 1, , J
ij
Igualando a cero estas derivadas parciales, se obtiene un sistema de ecuaciones que

proporciona los estimadores mximo verosmiles. Dichos estimadores vienen dados por las
expresiones
I
..
=
i=1 j=1 yij
= y.. ,
(5.12)
i =
1.
yij = yi. y.. ,
(5.13)
1 I
. yij
= y.j y.. .
=I i=1
(5.14)
j=1
Por tanto, la media general se estima utilizando el promedio de todas las observaciones
y cualquiera de los efectos de los factores se estiman usando la diferencia entre el promedio
correspondiente al nivel del factor y el promedio total.
Se puede comprobar fcilmente que
.
i = 0
j = 0
siendo, por tanto, I 1 y J 1 los grados de libertad asociados a los tratamientos y a los
bloques, respectivamente.
j en la ltima ecuacin de (5.11) igualada a cero,
Finalmente, sustituyendo i y
obtenemos el estimador de mxima verosimilitud para la varianza
..
2 = 1 I J .yij
j .2 .
(5.15)
i
N
i=1 j=1
Residuos
Los residuos se denen como las diferencias entre los valores observados yij y los
valores estimados por el modelo yij y los denotamos por eij ,
yij
ij
j = yij yi. y.j + y.. .

i
2
Por lo tanto, el estimador mximo-verosimil,
, se puede escribir como
I
. .e
2
ij
i=1 j=1
(5.16)
Se verica que la suma de los residuos por las y por columnas es cero, en efecto
.
.
.
j ) = J y Jy J
eij =
(yij
j =
i
i.
..
i
j
.
eij =
i
J.
yi. Jy.. J(yi. y.. ) = 0
i = 1,.
,I
j =
j ) = Iy Iy
(yij
I
i
.j
..
i
i
Iy.j Iy.. I(y.j y.. ) = 0
j = 1, , J
por lo tanto hay (I 1)(J 1) residuos independientes, ya que

IJ (I + J 1) = (I 1)(J 1) .
Propiedades de los estimadores mximo verosmiles
A continuacin vamos a ver algunas propiedades que verican los estimadores del
modelo. Concretamente, vamos a determinar su esperanza, su varianza y su distribucin
en el muestreo.
1) Propiedades de
a) es un estimador centrado de , puesto que
I
J
I
J
1 ..
1 ..
]
=
( + i + j ) =
E[y
ij
=
]
=
E[]
E[y
..
N
N
i=1 j=1
i=1 j=1
I
.
1
N
N + J
i + I
i=1
J
.
j=1
1
=
N =
b) La varianza de es 2 /N , puesto que al ser independientes las observaciones

se verica:
IJ
] = Var . . yij
Var[
i=1 j=1 N
. 2
i,j
N2
1
=
N2
I
J
.
.
i=1 j=1
N =
2
N
Var
. yij .
N
. Var [yij ]
i,j
N2
10
c) se distribuye segn una Normal, puesto que dicho estimador es combinacin

lineal de variables aleatorias independientes con distribucin Normal.
2) Propiedades de i
a) i es un estimador centrado de i , puesto que
E[i ] = E[yi. ] E[y.. ] = + i = i .
En efecto
J
1.
E[yi. ] = E
j=1
. J.
1
yij
+ i + j + uij
.
=
j=1
J
.
J
1
J
J + J i +
b) La varianza de i es (I 1)
j +
j=1
.
J
E[uij ]
= + i
j=1
, puesto que
N
1.
Var[i ] = Var [yi. y.. ] = Var
1 .
yij
yij
i,j
J
1 .
J2
Var(y ) +
ij
1 .
N2
i,j
Var(y )
ij
2 Cov
NJ
1 .
2
2
.
2+ 1
2
J2 j
N 2 i,j N J J =
1 2 1 2
2q2
q2 q2
q2
+
J
N
=
= (I 1)
N
J
N
N
.
y ,
ij
j
=
ij
i,j
(5.17)
c) i se distribuye segn una Normal, puesto que dicho estimador est expresado
como funcin lineal de variables aleatorias con distribucin Normal.
j
3) Propiedades de
11
j es un estimador centrado de j , puesto que

a)
j ] = E[y.j ] E[y.. ] = + j = j .
E[
En efecto
E[y.j ] =
E 1 . yij = E
I
I
i
..
.
.
.
+ i + j + uij =
.
.
.
.
1 I +
i + I j +
[u
]
E ij = + j
I
i
i
2
b) La varianza de j es (J 1)
N
j se distribuye segn una Normal.
c)
2
4) Propiedades de
2
2
no es un estimador insesgado de puesto que se verica
2
N
1 ..
2
(eij ) ~ 2(I1)(J 1) ,
= 2
i=1 j=1
donde los grados de libertad de la distribucin 2 corresponden al nmero de residuos

independientes, por tanto
2.
.
(I 1)(J 1) 2
2
N
,
E 2 = (I 1)(J 1) E[ ] =
N
2 no es un estimador insesgado de 2. Ahora bien, a partir de este resultado
luego
se construye fcilmente un estimador centrado simplemente considerando
2
N
2
.
(I 1)(J 1)
Dicho estimador recibe el nombre de varianza residual, se denota por S2 y se expresa,

R
por tanto, de la siguiente forma
..
I
J [yij ]
I .
J
.
eij2
yij 2
i=1 j=1
i=1 j=1
2 2
.
(5.18)
=
= SR = (I 1)(J
1)
(I 1)(J 1)
12
Vamos a demostrar que efectivamente

1
2
.
I .
J
(eij )2 ~ 2
(I1)(J 1)
i=1 j=1
Para ello, denamos los siguientes vectores, formado cada uno de ellos por N componentes:
Y=
=
=
=
U =
(y11, , y1J , y21 , , y2J , , yI1 , , yIJ )

(, . ., , , . ., , . ., , . ., )
( 1 , . ., 1 , 2 , . ., 2 , . ., I , . ., I )
( 1 , . ., J , 1 , . ., J , . ., 1 , . ., J )
(u11, , u1J , u21 , , u2J , , uI1 , , uIJ ) .
De esta forma, el modelo en bloques aleatorizados se puede expresar como:

Y = + ++U
(5.19)
y e , los vectores obtenidos al sustituir los parmetros por

Denotemos por ,
sus estimadores y las perturbaciones uij por los residuos eij , respectivamente. Vericndose, por tanto, la siguiente identidad
+e
Y = + +

(5.20)
De (5.19) y (5.20) se obtiene

) + e
U = ( ) + ( ) + (
(5.21)
1
dividiendo (5.21) por y llamando Z = U, se tiene la siguiente descomposicin
del vector Z, de variables normales (0, 1), en componentes ortogonales.

1
Z=
( ) +
( ) +
1
e
( ) +
(5.22)
En efecto, los siguientes productos escalares son nulos

)
( ) e = (y.. )
..
eij = 0
i
(5.23)
( ) e =
..
( )e = .(
i
i
)
) e =
(
13
ij
e =0
ij
..
.
.
j j )eij =
j j )
(
(
eij = 0
i
(5.24)
(5.25)
De forma similar se comprueba que los restantes productos escalares son nulos. Por
lo tanto, los vectores en que se descompone Z son ortogonales y se verican las
condiciones del teorema de Cochran cuyo enunciado presentamos en el Captulo 1.
Por consiguiente, los cuadrados de los mdulos de los vectores de la descomposicin
(5.22) seguirn distribuciones 2 independientes cuyos grados de libertad sern la
dimensin del subespacio al que pertenezca cada vector. De esta forma,
a) Como ( ) pertenece a un subespacio de dimensin 1, al tener todas sus
coordenadas iguales:
N (y.. )2
~ 1
2
b) Como ( ) pertenece a un subespacio de dimensin I 1, al tener I coordenadas distintas y una ecuacin de restriccin:
.
1
1
( i i )2
( ) ( ) = J
~ 2I1
) pertenece a un subespacio de dimensin J 1, al tener J coorc) Como (

denadas distintas y una ecuacin de restriccin:
I .
( j j )2 ~ 2J 1
) (
) = 2
(
d) El vector e tiene IJ coordenadas, en principio distintas, pero sujetas, como

hemos visto, a las ecuaciones de restriccin
.
.
eij = 0 ;
eij = 0
i
es decir, la suma de los residuos por las y por columnas es cero, lo que implica
I + J 1 ecuaciones de restriccin e IJ (I + J 1) = (I 1)(J 1) residuos
independientes. Por lo tanto,
14
..e
i
2
ij
2
~ (I1)(J 1) .
En resumen,
~ N (, 2 /N )
.
.
i ~ N i , (I 1) 2 /N
.
.
j ~ N j , (J 1) 2 /N
2
2
2 (I1)(J
N
/ ~
1)
5.2.3.
Descomposicin de la variabilidad
Como dijimos en el Captulo 1, para comparar globalmente los efectos de los

distintos niveles de un factor se emplea la tcnica estadstica denominada anlisis de
la varianza, que est basada en la descomposicin de la variabilidad total de los datos
en distintas componentes. En los diseos en bloques aleatorizados tambin se emplea esta
tcnica y para ello consideramos la siguiente identidad:
yij = y.. + (yi. y.. ) + (y.j y.. ) + (yij yi. y.j + y.. ) ,
(5.26)
que expresa cada variable yij observada como la suma de cuatro trminos:
- La media total y.. , es decir el estimador de
- El efecto producido por el tratamiento i-simo, (desviacin de la media del i-simo
nivel del factor principal respecto de la media total), yi. y.. , es decir el estimador
de i
- El efecto producido por el bloque j-simo, (desviacin de la media del j-simo nivel
del factor bloque respecto de la media total), y.j y.. , es decir el estimador de j
- La diferencia entre los valores observados yij y los valores previstos por el modelo
yij, es decir el estimador de uij .
15
Por tanto, la expresin (5.26) tambin se puede poner en la forma

j + eij
+
i +
(5.27)
Considerando esta expresin para todas las observaciones y expresndola en forma

vectorial resultan los siguientes vectores, todos ellos de dimensin N :
Y: Contiene los N trminos independientes yij . Tiene, por tanto, N grados de libertad.
:
Contiene N coordenadas iguales a y.. . Tiene, por tanto, un grado de libertad.
.
de: Contiene
libertad, Iyavalores
que distintos
= 0. yi. y.. , cada uno repetido J veces. Tiene I 1 grados
i i
: Contiene J valores
.distintos y.j y.. , cada uno repetido I veces. Tiene J 1 grados

de libertad, ya que
j = 0.
j
e: Contiene los N residuos estimados, que deben sumar cero por las y por columnas.
Tiene, por tanto, N (I + J 1) grados de libertad.
Por lo que, la ecuacin (5.26) aplicada a los N datos tomar la siguiente forma (mostrada anteriormente):
+e
Y = + +
(5.28)

Esta descomposicin est formada por componentes ortogonales dos a dos siendo los
grados de libetad de Y la suma de los grados de libertad de los componentes. En efecto,
se comprueba directamente que

= y..
I .
J
.
i = 0
i=1 j=1
= y..

I
J
.
.
j = 0
i=1 j=1
e = y..
I .
J
.
eij = 0
i=1 j=1
I
J
.
.
j =
=
i
i=1
j=1
16
e =
e =
I
.
i
J
.
i
eij =
1
j=1
J
.
j=1
I
.
eij = 0
i=1
y
N = 1 + (I 1) + (J 1) + (I 1)(J 1)
La ecuacin (5.26) tambin se puede expresar
yij y.. = (yi. y..) + (y.j y.. ) + (yij yi. y.j + y.. ) ,
(5.29)
elevando los dos miembros al cuadrado y sumando para todas las observaciones tenemos
I .
J
.
i=1 j=1
(yij y.. )2 =
I .
J
.
[(yi. y.. ) + (y.j y.. ) + (yij yi. y.j + y.. )]2 =
i=1 j=1
I
.
(yi. y.. )2 + I
i=1
J
.
(y.j y.. )2 +
j=1
I .
J
.
(yij yi. y.j + y.. )2 +
i=1 j=1
(5.30)
I .
J
.
(yi. y.. )(y.j y.. )+
2
i=1 j=1
I .
J
.
2
(y.j y.. )(yij yi. y.j + y.. )+
i=1 j=1
I .
J
.
2
(yi. y.. )(yij yi. y.j + y.. )
i=1 j=1
donde los dobles productos se anulan (ya que los trminos son ortogonales, como acabamos
de comprobar), por lo que dicha ecuacin queda en la forma
I .
J
.
(yij y..
)2
I
.
= J
i=1 j=1
(yi. y..
)2
J
.
+I
i=1
(y.j y..
17
)2
I .
J
.
j=1
(yij yi. y.j + y.. )2
i=1 j=1
(5.31)
que representa la ecuacin bsica del anlisis de la varianza, que simblicamente podemos
escribir
SCT = SCT r + SCBl + SCR ,
donde hemos desglosado la variabilidad total de los datos
SCT =
I .
J
.
(yij y.. )2 ,
i=1 j=1
denominada suma total de cuadrados, en tres componentes:

.I
(yi. y.. )2 , la suma de cuadrados de las diferencias entre las medias

de los tratamientos y la media general, que expresa la variabilidad explicada por los
tratamientos, denominada suma de cuadrados entre tratamientos.
.J
2) SCBl = I
(y.j y.. )2 , la suma de cuadrados de las diferencias entre las medias
1) SCT r = J
i=1
j=1
de los bloques y la media general, que expresa la variabilidad explicada por los
bloques, denominada suma de cuadrados entre bloques.
.
3) SCR = Ii=1 .Jj=1 (yij yi. y.j + y.. )2 , la suma de cuadrados de los residuos, que
expresa la variabilidad no explicada por el modelo, denominada suma de cuadrados
del error.
A partir de la ecuacin bsica del ANOVA se pueden construir los cuadrados medios
denidos como:
Cuadrado medio total
I .
J
.
(yij y.. )2
2
ST =
i=1 j=1
N 1
(5.32)
18
Cuadrado medio entre tratamientos
I
.
J
(yi. y.. )2
i=1
ST r =
(5.33)
I 1
Cuadrado medio entre bloques
J
.
I
2
SBl =
(y.j y.. )2
j=1
(5.34)
J 1
Cuadrado medio residual
I .
J
.
2
SR =
(yij yi. y.j + y.. )2
i=1 j=1
(I 1)(J 1)
(5.35)
donde los denominadores, corresponden a los grados de libertad de la distribucin en el

muestreo de los correspondientes numeradores.
Una notacin muy utilizada tambin en la prctica para los cuadrados medios anteriores es, respectivamente, CM T , CM T r, CM Bl y CM R o CM E.
A continuacin vamos a calcular las esperanzas matemticas de estos cuadrados medios.
En primer lugar, recordemos la expresin del modelo (5.4)
yij = + i + j + uij .
Consideremos las expresiones de yi. , yi. , y.j , y.j , y.. e y.. , en funcin de los parmetros
del modelo, con objeto de.
poder hallar las esperanzas de las varianzas muestrales. Tambin
.
tengamos en cuenta que i i = 0 y j j = 0 . As tenemos:
J
.
yi. = J + J i +
19
yi. = + i + ui.
j + ui. ;
j=1
I
.
y.j = I +
y.j = + j + u.j
i + I j + u.j ;
(5.36)
i=1
I
.
y.. = N + J
i + I
J
.
i=1
j + u.. ; y.. = + u..
j=1
1o ) El cuadrado medio entre grupos se puede expresar

I
.
I
.
(yi. y.. )2
i=1
ST r =
I 1
I
.
J
i=1
i2
I 1
J
+
[ i + (ui. u.. )]2
i=1
J
.
I
.
(ui. u.. )2
i=1
I 1
I 1
2J
i (ui. u.. )
j=1
I 1
y su esperanza matemtica ser la suma de las esperanzas matemticas de cada

sumando; es decir,
.
.
= E
2
E S
Tr
.
I
.
I
i2
i=1
I 1
J
+E
.
I
(ui. u.. )2
i=1
I 1
2J
+E
i (ui. u.. )
i=1
I 1
(5.37)
Ahora bien, puesto que:
a) El modelo es de efectos jos E[ i ] = i , entonces
20
.
I
i2
i=1
I 1
J . . 2.
J . 2
i
E i =
=I 1
I 1 i
i
(5.38)
b) Como E [ i E [ ]]2 es la Var ( ), cuya expresin, determinada en la subsec

i
i
cin 5.2.2, es (I 1) 2 /N , luego
.
(ui. u.. )2
I
.
J
=
i=1
I 1
I 1
E [ui. u.. ]2 =
i=1
I
J .
E [(yi. y.. ) i ]2 =
I 1 i=1
I 1
E [ i E [ ]] =
i=1
I
.
Var ( ) =
I 1
i=1
.
I
2
2
(I 1) = J (I 1)I = 2
N
I 1
N
I 1 i=1
J
(5.39)
c) Como E (ui. u.. ) = 0, entonces

I
2J
E
i (ui. u.. )
i=1
I 1
.
2
i E [ui. u.. ] = 0 .
= I 1J
i=1
(5.40)
Por lo tanto, sustituyendo las expresiones (5.38), (5.39) y (5.40) en (5.37) tenemos
que el valor esperado del cuadrado medio entre grupos es:
T2r ) =
E (S
21
J . 2
+ 2
I 1 i=1 i
(5.41)
J
I . 2
+ 2
J 1 j=1 j
(5.42)
2o ) De la misma forma se comprueba que

2
Bl
E (S
)=
3o ) Ya hemos visto en la subseccin 5.2.2 que la varianza residual es un estimador insesgado de la varianza poblacional, es decir
2
2
E (S
R ) =
4o ) Por ltimo, calculemos el valor esperado del cuadrado medio total. Para ello nos
basaremos en la ecuacin bsica del ANOVA que podemos poner en funcin de los
cuadrados medios de la siguiente forma:
2
(N 1)ST = (I 1)ST r + (J 1)SBl + (I 1)(J 1)SR ,

tomando esperanzas matemticas en ambos miembros y aplicando la linealidad del
valor esperado, tenemos
. .
.
.
. .
. .
(N 1)E T = (I 1)E T r + (J 1)E Bl + (I 1)(J 1)E R ,
S2
S2
S2
S2
.
. .
.
2
de donde, sustituyendo los valores obtenidos anteriormente para E ST2r , E SBl
y
. .
2 , obtenemos
E SR
I
.
J
2
E(ST ) =
i=1
J
.
i2
N 1
I
+
j2
j=1
N 1
(5.43)
Observacin 5.1
Hemos visto que al aplicar el mtodo de mnimos cuadrados al modelo completamente
aleatorizado, se obtiene el sistema de ecuaciones normales (??). En el caso del modelo en
bloques completos aleatorizados, las ecuaciones normales para tratamientos no contienen
22
informacin con respecto a los efectos de bloques, y recprocamente, las ecuaciones normales para bloques no contienen informacin alguna sobre los efectos de los tratamientos,
(la informacin con respecto a los tratamientos no se encuentra mezclada con aquella
debida a los efectos de los bloques). Y as, un contraste entre efectos de tratamientos se
realiza comparando las medias de tratamientos e idnticamente, un contraste entre efectos
de bloques se realiza comparando las medias de los bloques. Cuando esto ocurre, se dice
que los efectos de bloques y tratamientos son ortogonales.
5.2.4.
Anlisis estadstico
El contraste estadstico de ms inters en este modelo, como mencionamos anteriormente, es el que tiene como hiptesis nula la igualdad de medias de los tratamientos:
H0 1 = 2 = = I = 0
(5.44)
Tambin es interesante contrastar la igualdad de medias de los bloques:

H0 1 = 2 = = J = 0
(5.45)
Como hemos comprobado anteriormente se verica que:

2
a) SR = SCR/(I 1)(J I) es un estimador insesgado de la varianza , independientemente de que se veriquen las hiptesis nulas.
b) Si no hay diferencia entre las medias de los I tratamientos;
es decir, si es cierta la
2
2
hiptesis de que todo i = 0, el primer sumando de E(ST r ) es nulo, y entonces ST r
es un estimador insesgado de 2 .
c) Si no hay diferencia entre las medias de los J bloques;
es decir, si es cierta la hiptesis
2
2
de que todo j = 0, el primer sumando de E(SBl ) es nulo, y entonces SBl es un

estimador insesgado de 2 .
Sin embargo, hay que notar que:
Si existe diferencia en las medias de los tratamientos, el valor esperado de ST2r es
mayor que 2.
2
Si existe diferencia en las medias de los bloques, el valor esperado de SBl
es mayor
que 2 .
23
De todo sto podemos deducir que:

1o ) Un contraste para vericar la hiptesis
nula
de igualdad de medias de los tratamien2
2
tos puede efectuarse comparando ST r y SR .

2o ) Un contraste para vericar la hiptesis
nula de igualdad de medias de los bloques
2
2
puede efectuarse comparando SBl y SR .

Para ello, vamos a estudiar la distribucin de SCT , SCT r, SCBl y SCR en las hiptesis de que ni los tratamientos ni los bloques inuyen, es decir si las hiptesis (5.44) y (5.45)
son ciertas o equivalentemente, si las N observaciones provienen de la misma poblacin.
Tipicando las variables aleatorias yij en la descomposicin (5.27) , se tiene
yij

e
=
+ + +
.
i
j
ij
(5.46)
Considerando esta descomposicin para totas las observaciones y expresndola en forma vectorial, tenemos
Z = Z1 + Z2 + Z3 + Z4
(5.47)
siendo
1
Z=
Z1 =
Z2 =
1
Z3 =
Z4 =
(y11 , . . . , y1J , y21 , . . . , y2J , . . . , yI1 , . . . , yIJ )

(y.. , . . . . ., y.. , y.. , . . . . ., y.. , . . . . ., y.. , . . . . ., y.. )
( 1 , . . . . ., ,
2, . . . . ., 2 , . . . . ., I , . . . . ., I )
1
1 , . . . . .,
J ,
1 , . . . . .,
J , . . . . .,
1 , . . . . .,
J )
(
(e11 , . . . , e1J , e21 , . . . , e2J , . . . ., eI1 , . . . , eIJ )
donde
Z: Contiene N trminos independientes
libertad.
(y
ij
). Tiene, por tanto, N grados de
1
Z1: Contiene N coordenadas iguales a (y.. ). Tiene, por tanto, un grado de
libertad.
24
1
Z2: Contiene I valores distintos i , cada uno repetido J veces y sujetos a una
.
ecuacin de restriccin,
i = 0. Tiene, por tanto, I 1 grados de libertad.
i
1
Z3: Contiene J valores .
distintos j , cada uno repetido I veces y sujetos a una
ecuacin de restriccin,
j = 0. Tiene, por tanto, J 1 grados de libertad.
j
1
Z4: Contiene N coordenadas eij , sujetas a I + J 1 ecuaciones de restriccin,
.
.
j eij = 0 para i = 1, . . . , I. y
i eij = 0 para j = 1, . . . , J. Tiene, por tanto,
(I 1)(J 1) grados de libertad.
Bajo las hiptesis nulas hemos realizado una descomposicin del vector Z, de variables
N (0, 1) independientes, en componentes ortogonales. Dicha descomposicin cumple las
condiciones del Teorema de Cochran, vericndose que:
i)
J
SCTr
.
(y i. y.. )2
i
ii)
.
I
SCBl
2
iii)
.
SCR
i,j
~ I1
(y .j y.. )2
~ J 1
(yij yi. y.j + y.. )2

2
~ (I1)(J 1)
=
2
2
y adems estas tres distribuciones son independientes entre s.
Hay que notar que:
Por una parte, se tiene que SCR/ 2 se distribuye como una 2 con (I 1)(J 1)
grados de libertad, se verique o no la hiptesis nula, como ya vimos en la subseccin
5.2.2
Por otra parte, bajo las hiptesis (5.44) y (5.45), se tiene que SCT r/ 2 y SCBl/ 2
se distribuyen como una 2 con I 1 y J 1 grados de libertad, respectivamente.
25
Por consiguiente, bajo las hiptesis de igualdad de efectos de los tratamientos y los
bloques, se verica
SCT r/ 2
2
S
1
T
F =
= 2r
SCR/ 2
SR
(I 1)(J 1)
~ F(I 1),(I 1)(J 1)
(5.48)
y
SCBl/ 2
S2
J 1
F =
~ F(J 1),(I 1)(J 1) .
(5.49)
= Bl
2
SCR/ 2
SR
(I 1)(J 1)
Estos son los estadsticos de contraste para probar dichas hiptesis nulas. Por lo tanto:
Si la hiptesis de igualdad de efectos de los tratamientos es cierta, tanto el numerador
como el denominador del estadstico de contraste (5.48) son estimadores insesgados
de 2, mientras que si dicha hiptesis no es cierta, la esperanza del numerador del
estadstico de contraste (5.48) es mayor que la esperanza del denominador, por lo
que rechazaremos H0 cuando el valor experimental de dicho estadstico sea mayor
que el valor terico, F(I1),(I1)(J 1); .
Siguiendo el mismo razonamiento anterior, se rechazar la hiptesis nula de igualdad
de efectos de los bloques cuando el valor del estadistico de contraste (5.49) sea mayor
que el valor terico, F(J 1),(I1)(J 1); .
Aunque hemos dicho que el contraste principal es el de la igualdad de medias de los
tratamientos, tambin es interesante la comparacin entre las medias de los bloques, ya
que la ecacia de este diseo depende de los efectos de los bloques. Un valor grande
del cociente (5.49), implica que el factor bloque tiene un efecto grande, es decir que los
bloques realmente inuyen mucho. En este caso, este diseo es ms ecaz que el diseo
2
completamente aleatorizado ya que si el cuadrado medio entre bloques,SBl , es grande, el
trmino residual ser mucho menor y el contraste principal (5.44) ser ms sensible a las
diferencias entre tratamientos.
Si los efectos de los bloques son muy pequeos, el anlisis por bloques quiz no sea
necesario y en caso extremo, cuando el cociente (5.49) es prximo a 1, puede llegar a
ser perjudicial, ya que el nmero de grados de libertad, (I 1)(J 1), del denominador
en la comparacin de tratamientos (5.48) es menor que el nmero de grados de libertad
correspondiente, IJ I = I(J 1), en el diseo completamente aleatorizado.
Para una mayor sencillez en el clculo se utilizan las expresiones abreviadas de SCT ,
SCT r, SCBl y SCR, dadas a continuacin
26
I .
J
.
SCT =
i=1 j=1
yij2
y..2
IJ
y2
.
SCT r = 1
yi.2 ..
J
IJ
(5.50)
i=1
J
.
y2
SCBl = 1
y.j2 .. ,
I
IJ
j=1
y la suma de cuadrados del error se obtiene por diferencia

SCR = SCT SCT r SCBl .
(5.51)
El anlisis de la varianza utiliza la descomposicin (5.31), ecuacin bsica del anlisis

de la varianza, cuyos trminos se pueden disponer de la siguiente manera,
Tabla 4-3. Tabla ANOVA para el modelo de bloques aleatorizados
Fuentes de
variacin
Entre tratam.
Suma de
cuadrados
I
.
Grados de
libertad
Cuadrados
medios
Fexp
(yi. y.. )2 = SCT r
I 1
S T2 r
2
S T2 r/S R
(y.j y.. )2 = SCBl
J 1
2
SBl
2 2
SBl
/S R
(I 1)(J 1)
S2
R
IJ 1
ST2
i=1
J
.
Entre bloques
I
j=1
Residual
TOTAL
SCT SCT r SCBl =

SCR
I
J
..
(yij y.. )2 = SCT
i=1 j=1
Alternativamente, utilizando las expresiones abreviadas de SCT , SCT r, SCBl y SCR,

dadas en (5.50), se construye la siguiente Tabla ANOVA.
27
Tabla 4-4. Forma prctica de la tabla ANOVA para

el modelo de bloques aleatorizados
Fuentes de
variacin
Suma de
cuadrados
I
.
Grados de
libertad
Cuadrados
medios
Fexp
Entre tratam.
1
J
y2..
= SCT r
IJ
I 1
ST2 r
2
ST2 r /SR
Entre bloques
J
1.
y2..
2
y
.j
I
IJ = SCBl
J1
2
SBl
2 2
SBl
/S R
(I 1)(J 1)
S2
R
IJ 1
ST
yi.2
i=1
j=1
Residual
SCT SCT r SCBl =

SCR
I
TOTAL
..
yij2
i=1 j=1
y2
..
IJ
Una de las ventajas del diseo en bloques aleatorizados es que se puede transformar
en un diseo unifactorial, simplemente suprimiendo el estudio por bloques y uniendo su
variabilidad a la residual.
Coecientes de determinacin
Al igual que en el modelo completamente aleatorizado, una medida apropiada
para comprobar la adecuacin del modelo a los datos es el coeciente de determinacin,
denotado por R2 y denido como el cociente entre la suma de las variabilidades explicadas
por los tratamientos y los bloques, y la variabilidad total
R2 =
SCTr +SCBl
.
SCT
Llamando
R2 al cociente entre la variabilidad explicada por los tratamientos y la total, es decir
SCTr
R2 = SCT ,
28
R2 al cociente entre la variabilidad explicada por los bloques y la total, es decir

SCBl
R2 = SCT ,
el coeciente de determinacin tambin lo podemos expresar como
R2 = R2 + R2 ,
donde R2 y R2 reciben el nombre de coecientes de determinacin parciales asociados a los
tratamientos y a los bloques. Estas cantidades son adimensionales y se interpretan como

la proporcin de la variabilidad que es explicada por los tratamientos y por los bloques,
respectivamente.
A n de ilustrar el anlisis de la varianza de bloques aleatorizados vamos a considerar
el Ejemplo 4-1, en el que se desea comprobar si se aprecian diferencias signicativas, en
primer lugar, entre los fertilizantes y en segundo lugar, entre los bloques de terreno.
Para ello, construimos la Tabla 4-5, organizando los datos de la siguiente manera
Tabla 4-5. Datos del Ejemplo 4-1
Fertilizantes
1
2
3
4
5
y.j
y 2.j
. ij
y2
bloques
yi.
A
B
C
D
87
86
88
83
344
85
87
95
85
352
90
92
95
90
367
89
97
98
88
372
99
96
91
90
376
450
458
467
436
1811
202500 209764 218089 190096 820449
40616 42054 43679 38058 164407
yi.2
118336
123904
134689
138384
141376
656689
Las sumas de cuadrados necesarias para el anlisis de la varianza se calculan de la
29
siguiente forma:
5 .
4
.
SCT =
2
yij
i=1 j=1
y..2
(1811)2
IJ = 164407
= 420,95
20
5
656689 (1811)2
y2
.
1
SCT r =
= 186,20
yi.2 .. =
J
IJ
20
4
i=1
SCBl =
1.
4
j=1
y2
.j
2
y..2 = 820449 (1811)
= 103,75
5
20
IJ
SCR = SCT SCT r SCBl = 131 .
El anlisis de la varianza resultante se presenta en la siguiente tabla.

Tabla 4-6. Anlisis de la varianza para los datos del Ejemplo 4-1
Fuentes de
variacin
Entre tratamientos
Entre bloques
Residual
TOTAL
Suma de
cuadrados
186.20
103.75
131.00
420.95
Grados de
libertad
4
3
12
19
Cuadrados
medios
46.5500
34.5833
10.9166
Fexp
4.264
3.168
Realizando los contrastes al nivel de signicacin del 5 %, se tiene:

1o ) Si comparamos el cociente F (exp) = 46,55/10,9166 = 4,264, con el valor de la F
terica (F0,05,4,12 = 3,26), se concluye que se rechaza H0 (igualdad de medias de
tratamientos); en otras palabras, concluimos que, a un nivel de signicacin del 5
%, el rendimiento de la semilla de algodn diere signicativamente dependiendo del
tipo de fertilizante utilizado.
2o ) Si comparamos el cociente F(exp) = 34,5833/10,9166 = 3,168, con el valor de la F
terica (F0,05,3,12 = 3,49), se concluye que no hay suciente evidencia para rechazar
H0 (igualdad de medias de bloques); en otras palabras, concluimos que, a un nivel
de signicacin del 5 %, los bloques de terreno no son signicativamente distintos.
30
Comprobamos, mediante los coecientes de determinacin parciales, cuyos valores son

R2 =
SCTr
R2 =
SCTBl
SCT
SCT
186,2
420,95
= 0,4423
103,75
420,95
= 0,2464 ,
que:
a) El factor tipo de fertilizante explica el 44.23 % de la variabilidad en el rendimiento
de la semilla de algodn.
b) El factor tipo de terreno explica el 24.64 % de la variabilidad en el rendimiento
de la semilla de algodn.
Es interesante ver los resultados que se hubiesen obtenido de no haberse realizado un
diseo en bloques aleatorizados. Para ello, supongamos que prescindimos del factor tipo
de terreno y realizamos un anlisis de la varianza de un factor, obtenindose la tabla
ANOVA siguiente
Tabla 4-7. Anlisis de la varianza para los datos del Ejemplo 4-1
Fuentes de
variacin
Entre tratamientos
Residual
TOTAL
Suma de
cuadrados
186.20
234.75
420.95
Grados de
libertad
4
15
19
Cuadrados
medios
46.55
15.65
Fexp
2.974
Si efectuamos el contraste al 5 % y comparamos el valor de la Fexp = 2,974, con el

valor de la F terica (F0,05;4,15 = 3,05), se concluye que no se puede rechazar H0 (igualdad
de medias de tratamientos); es decir, no hemos podido encontrar diferencias signicativas
entre los distintos tipos de fertilizantes aunque si se detectaron dichas diferencias al aplicar
el modelo en bloques aleatorizados.
Con este ejemplo se ilustra el hecho de que aunque los bloques no resulten signicativamente diferentes, en algunas situaciones no es conveniente prescindir de ellos. Pero cmo
saber cuando se puede prescindir de los bloques? La respuesta la tenemos en el valor de
la F(exp), experimentalmente se ha comprobado que si dicho valor es mayor que 3, no
conviene prescindir de los bloques para efectuar los contrastes.
5.3 Comparaciones mltiples
5.3.
31
Comparaciones mltiples
Si el anlisis de la varianza conrma la existencia de diferencias signicativas entre

los tratamientos o entre los bloques, es conveniente investigar qu medias son distintas
realizando las comparaciones mltiples correspondientes a los tratamientos o a los bloques
o a ambos. Para ello se realizarn cualesquiera de los procedimientos de comparaciones
mltiples estudiados en el Captulo 2. Simplemente hay que recordar que, en el diseo
en bloques aleatorizados los grados de libertad del error son ((I 1)(J 1)) en lugar de
(N I ) del diseo completamente aleatorizado y en el caso de comparaciones de medias
relativas a los tratamientos hay que reemplazar en las frmulas correspondientes el nmero
de repeticiones (n) del diseo completamente aleatorizado, por el nmero de bloques (J ).
Como ilustracin vamos a realizar comparaciones entre las medias de los tratamientos
utilizando la prueba de rangos mltiples de Tukey con los datos del ejemplo de referencia.
En este ejemplo, los valores de los cinco promedios de los tratamientos son:
y1. = 86 ; y2. = 88 ; y3. = 91,75 ; y4. = 93 ; y5. = 94 .
As, por ejemplo, si realizamos la comparacin entre los tratamientos 1 y 2, el valor

crtico HSD correspondiente a un nivel de signicacin del 5 % se calcula como
.
.
2
10,9166
SR
= q0,05,5,12
= (4,51)(1,65) = 7,4415 .
HSD = q,I,(I1)(J1)
4
J
Puesto que se verica:
| y1. y2. |= 2 < HSD ,
se concluye que las medias 1 y 2 no dieren signicativamente.
Adems de los procedimientos analticos de comparaciones mltiples tambin se puede
adaptar el mtodo grco visto en la subseccin ?? del Captulo 2 que nos muestra que
medias son signicativamente diferentes. Este procedimiento consiste en utilizar
. como
distribucin de referencia una distribucin t ajustada por el factor de escala
SR2 /J,
para la comparacin de las medias de los tratamientos, donde es el nmero de grados de
libertad de la varianza residual.
En la Figura 4-2 se representan las 5 medias de los fertilizantes del Ejemplo 4-1 en
relacin,con la distribucin de referencia t con 12 grados de libertad y con un factor de
escala 10,9166/4 = 1,65. Esta gura muestra que los procedimientos grcos a veces
no son sucientemente claros. Sin embargo, en dicha gura puede observarse que hay una
32
gran diferencia entre los tratamientos 1 y 5, como se comprobar posteriormente en la

subseccin ?? mediante el procedimiento de Tukey realizado con Swowseoem+rs.
Figura 4-2
Tambin se puede comprobar qu bloques son signicativamente distintos
mediante
.
2 /I, que en
un procedimiento grco como el anterior, pero con un factor de escala
SR
,
nuestro ejemplo tiene el valor 10,9166/5 = 1,47761. Dicho procedimiento se muestra en
la Figura 4-3, donde comprobamos que se conrma el resultado del contraste F del anlisis
de la varianza, es decir, no hay diferencias signicativas entre los bloques.
Figura 4-3
5.4.
Comprobacin de la idoneidad del modelo
La comprobacin de la idoneidad del modelo requiere contrastar las hiptesis dadas

en (5.5). Los contrastes de normalidad, homocedasticidad e independencia son anlogos a
los realizados en el modelo completamente aleatorizado, por lo que remitimos al lector al
Captulo 3, con la diferencia de que en el modelo en bloques aleatorizados tambin hay
5.4 Comprobacin de la idoneidad del modelo
33
que estudiar la variabilidad del error por bloques.

En este modelo hemos supuesto otra hiptesis adicional, la aditividad de los efectos de
tratamiento y bloque, es decir, hemos supuesto un modelo en el que el efecto de un factor
no depende del nivel del otro factor. A pesar de que este modelo aditivo es a menudo til,
existen situaciones en las que resulta inadecuado, por ejemplo, las diferencias entre dos
fertilizantes pueden ser mayores cuando se aplican en el bloque 1 que cuando se aplican en
el bloque 3. Cuando esto ocurre se dice que existe interaccin entre los tratamientos y los
bloques, y entonces el modelo de ecuacin (5.4) no es adecuado. Por lo tanto, la hiptesis
de aditividad tambin debe ser contrastada.
5.4.1.
Test de Interaccin de Tukey
Cuando existe interaccin entre tratamiento y bloque, el modelo tendr en general

la siguiente ecuacin
yij = + i + j + ( )ij + uij
i = 1, 2, , I
j = 1, 2, , J ,
(5.52)
donde el trmino ( )ij representa la interaccin. Se suponen las siguientes restricciones

para los parmetros
.
.
.
.
i =
j =
( )ij =
( )ij = 0 ,
i
por lo tanto el nmero de parmetros independientes de este modelo sera

1 + (I 1) + (J 1) + (I 1)(J 1) = IJ ,
que, puesto que hay una sola observacin por celdilla, coincide con el nmero de observaciones, no habiendo sucientes grados de libertad para estimar la varianza residual. Un
procedimiento para solventar este problema consiste en tomar ms de una observacin por
celdilla.
Tukey (1949) desarroll un mtodo para determinar si existe interaccin entre tratamientos y bloques, cuando slo hay una observacin por celdilla, conocido como el test de interaccin de un grado de libertad de Tukey. Este procedimiento supone que la forma de la
interaccin es particularmente simple, es decir
( )ij = i j ,
en donde es una constante desconocida. De esta forma las interacciones aaden nicamente un parmetro, y el modelo resultante es:
34
yij = + i + j + i j + uij
i = 1, 2, , I ; j = 1, 2, , J ,
(5.53)
siendo las restricciones para este modelo

.
i =
j =
i j =
i j = 0 .
En primer lugar abordaremos la estimacin de los parmetros del modelo. Para ello,
se construye la funcin de verosimilitud asociada a la muestra y =(y11 , , y1J , ,
yI1 , , yIJ ):
L(, i , j , , 2) = (2 2 ) 2 exp
1 .
I .
J .
.2
y
ij
i
i j
j
2 2
,
i=1 j=1
(5.54)
se determina el logaritmo de dicha funcin
N
ln(L(, i , 2)) =
N
ln(2)
1
ln( 2 )
...
.2
yij i j i j
,
2
i=1 j=1
(5.55)
y se hallan las primeras derivadas parciales respecto de los parmetros del modelo, obtenindose las mismas expresiones que en (5.12)-(5.14) para los estimadores de los parmetros
, i y j .
El estimador mximo verosimil de se obtiene realizando la correspondiente derivada
parcial, es decir
I
J
.
ln L
1 ...
= 0

=
yij i j i j i j
(5.56)
i=1 j=1
de donde
.
I .
J
i=1 j=1
yij i j
.
I
i=1
.
J
j=1
.
I
.
J
i
i=1
j=1
i=1
i=1
. 2 . i . 2 . 2 = 0 .
j
j=1
j=1
Por lo tanto
35
. . j yij
i=1 j=1 i
I
.
i=1
i2
(5.57)
.
j
j=1
j por sus respectivos estimadores muestrales, tenemos

y reemplazando i y
I .
J
.
(yi. y.. )(y.j y.. )yij
i=1 j=1
(5.58)
I
J
.
.
2
(yi. y.. )
(y.j y.. )2
i=1
j=1
Como hemos supuesto la existencia de interaccin entre los factores, hay que introducir
en este modelo una suma de cuadrados que represente dicha interaccin, esta suma de
cuadrados se denota por SCIT y viene dada por la expresin
..
2
SCIT =
2 2
(5.59)
i j ,
i
que recibe el nombre de suma de cuadrados debida a la interaccin o no-aditividad del

modelo, que tambin se puede expresar, sustituyendo los correspondientes estimadores
muestrales, de la siguiente forma
..
IJ
(yi. y.. )(y.j y.. )yij
..
SCIT =
i=1 j=1
i=1 j=1
(yi. y.. )2 (y.j y.. )2 =
I
.
i=1
(yi. y.. )2
J
.
. (5.60)
(y.j y.. )2
j=1
Por lo tanto, la ecuacin bsica del anlisis de la varianza para el modelo con interaccin (5.53) debe tener un trmino ms que la citada ecuacin del modelo en bloques
aleatorizados. Dicha ecuacin se expresa simblicamente en la forma
SCT = SCT r + SCBl + SCIT + SCR ,
donde
(5.61)
36
SCT r es la suma de cuadrados entre tratamientos

SCBl es la suma de cuadrados entre bloques
SCIT es la suma de cuadrados debida a la interaccin por Tukey
SCR es la suma de cuadrados residual que se obtiene como
SCR = SCT SCT r SCBl SCIT .

Se demuestra que si = 0, esto es, si no hay interaccin del tipo i j , entonces
SCIT / 2 y SCR/ 2 son variables aleatorias independientes distribuidas segn una 2
con 1 y IJ I J grados de libertad, respectivamente. Por tanto, si = 0, el estadstico
de contraste
SCIT /1
F =
,
(5.62)
SCR/(IJ I J )
se distribuye segn una F de Snedecor con 1, IJ I J grados de libertad. As, para
contrastar
H0 : = 0 (no hay interaccin)
H1 : = 0 ( hay interaccin del tipo i j )
,
(5.63)
puesto que, F se distribuye como una F1,IJIJ cuando H0 es cierta y puesto que los
valores grandes de Fexp conducen a la conclusin H1, la decisin apropiada para controlar
un riesgo de error de Tipo I igual a , es:
Si Fexp F,1,IJ IJ , se acepta H0
(5.64)
Si Fexp > F,1,IJ IJ , se rechaza H0 ,
donde F,1,IJ IJ es el punto crtico superior de la distribucin F con 1 y IJ I J
grados de libertad.
A n de ilustrar este procedimiento utilicemos el Ejemplo 4-1. Para ello, construimos
la Tabla 4-8, organizando los datos de la siguiente manera:
37
Tabla 4-8. Datos del Ejemplo 4-1

Bloques
i
1
2
3
4
5
y.j
j
87
85
90
89
99
90
0,55
0,302 1,102 8,122 11,222 20,75
86
87
92
97
96
91,6
1,05
88
95
95
98
91
93,4
2,85
83
85
90
88
90
87,2
3,35
86,00
88,00
91,75
93,00
94,00
90,55 = y..
2i
y

i j ij
4,55 20,702 j=1 69,16
6,502
2,55
78,03
1,20 1,440
19,62
2,45 6,002
91,63
3,45 11,902
14,49
46,55
21,45
En primer lugar calculamos el estimador de y la suma de cuadrados de la interaccin

SCIT
. . j yij

21,45
= 0,0222 ,
= i j i
=
(46,55)(20,75)
. 2 . 2
j
i
. i. j 2
SCIT =
2 2 = ( 0,022)2 (46,55)(20,75) = 0,4760 .
i j
Continuamos con la suma de cuadrados debida al error SCR

SCR = SCT SCT r SCBl SCIT = 420,95 186,20 103,75 0,4760 = 130,524 .
Por lo tanto el valor del estadstico de contraste es

SCIT /1
0,4760
Fexp =
=
= 0,04011 .
SCR /(IJ I J)
130,524/11
Si realizamos el contraste al nivel de signicacin del 5 %, como el valor de la F terica
es F0,05,1,11 = 4,84 y puesto que Fexp = 0,04011 < 4,84 se concluye que no hay interaccin
entre los fertilizantes y los bloques de terreno.
38
Bibliografa utilizada
Garca Leal, J. & Lara Porras, A.M. (1998). Diseo Estadstico de Experimentos.
Anlisis de la Varianza. Grupo Editorial Universitario.
Lara Porras, A.M. (2000). Diseo Estadstico de Experimentos, Anlisis de la Varianza y Temas Relacionados: Tratamiento Informtico mediante SPSS Proyecto Sur
de Ediciones.

Bloques Completos

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Bloques Completos

Uploaded by

Copyright:

Available Formats

Captulo 5

Diseos en bloques aleatorizados

Diseos en bloques aleatorizados

diseo se conoce como diseo en bloques 1 completos aleatorizados. La palabra completo

Diseo en bloques completos aleatorizados

Para desarrollar esta seccin consideramos el siguiente ejemplo al que seguiremos

5.2 Diseo en bloques completos aleatorizados

Especicamente, en este experimento, se han considerado 5 tipos de fertilizantes que

Planteamiento del modelo

Todo el planteamiento anterior se puede formalizar de manera general. Supongamos

Figura 4-1. Diseo en bloques completos aleatorizados.

Diseos en bloques aleatorizados

Generalmente no vamos a utilizar el trmino completo cuando en el contexto est claro

y.j es el total de las observaciones bajo el j-simo bloque, es decir

5.2 Diseo en bloques completos aleatorizados

y.. es la suma de todas las observaciones, denominado el total general, es decir

yi. es la media de las observaciones del tratamiento i-simo, es decir

y.j es la media de las observaciones del bloque j-simo, es decir

y.. es la media general de las observaciones, es decir

El modelo estadstico para este diseo es:

Diseos en bloques aleatorizados

uij son independientes entre s

En este planteamiento, el contraste de hiptesis ms importante es

A continuacin, vamos a estudiar la estimacin de los parmetros del modelo , i , j

5.2 Diseo en bloques completos aleatorizados

Estimacin de los parmetros del modelo

Estimacin por mxima verosimilitud

se determina el logaritmo de dicha funcin

Igualando a cero estas derivadas parciales, se obtiene un sistema de ecuaciones que

i=1 j=1 yij

Diseos en bloques aleatorizados

yij = yi. y.. ,

j = yij yi. y.j + y.. .

5.2 Diseo en bloques completos aleatorizados

Iy.j Iy.. I(y.j y.. ) = 0

por lo tanto hay (I 1)(J 1) residuos independientes, ya que

b) La varianza de es 2 /N , puesto que al ser independientes las observaciones

Diseos en bloques aleatorizados

c) se distribuye segn una Normal, puesto que dicho estimador es combinacin

Var[i ] = Var [yi. y.. ] = Var

5.2 Diseo en bloques completos aleatorizados

j es un estimador centrado de j , puesto que

donde los grados de libertad de la distribucin 2 corresponden al nmero de residuos

Dicho estimador recibe el nombre de varianza residual, se denota por S2 y se expresa,

Diseos en bloques aleatorizados

Vamos a demostrar que efectivamente

(y11, , y1J , y21 , , y2J , , yI1 , , yIJ )

De esta forma, el modelo en bloques aleatorizados se puede expresar como:

y e , los vectores obtenidos al sustituir los parmetros por

De (5.19) y (5.20) se obtiene

del vector Z, de variables normales (0, 1), en componentes ortogonales.

En efecto, los siguientes productos escalares son nulos

5.2 Diseo en bloques completos aleatorizados

) pertenece a un subespacio de dimensin J 1, al tener J coorc) Como (

d) El vector e tiene IJ coordenadas, en principio distintas, pero sujetas, como

Diseos en bloques aleatorizados

Como dijimos en el Captulo 1, para comparar globalmente los efectos de los

5.2 Diseo en bloques completos aleatorizados

Por tanto, la expresin (5.26) tambin se puede poner en la forma

Considerando esta expresin para todas las observaciones y expresndola en forma

.distintos y.j y.. , cada uno repetido I veces. Tiene J 1 grados

Diseos en bloques aleatorizados

[(yi. y.. ) + (y.j y.. ) + (yij yi. y.j + y.. )]2 =