You are on page 1of 112

Diseo completamente al azar

Diseo de experimentos p. 1/112

Ejemplo

Suponga que tenemos 4 dietas diferentes que queremos


comparar. Las dietas estn etiquetadas A,B,C y D.
Estamos interesados en estudiar si las dietas afectan la tasa
de coagulacin en conejos. La tasa de coagulacin es el
tiempo en segundos que tarda una cortada en dejar de
sangrar.
Tenemos 16 conejos para el experimento, por lo que usaremos
4 en cada dieta.
Los conejos estn en una jaula grande hasta que se inicie el
experimento, momento en que se transferirn a otras jaulas.
Cmo asignamos los conejos a los cuatro grupos
tratamiento?

Diseo de experimentos p. 2/112

Mtodo 1

Supongamos que los conejos se atrapan "al azar". Atrapamos


cuatro conejos y los asignamos a la dieta A. Atrapamos otros
cuatro y los asignamos a la dieta B y as sucesivamente.
Dado que los conejos fueron "atrapados al azar", esto
producir un diseo completamente al azar.

Diseo de experimentos p. 3/112

Mtodo 1

No es necesariamente cierto.
Los primeros cuatro conejos atrapados pueden ser los ms
lentos y dbiles, aquellos menos capaces de escapar. Esto
puede sesgar los resultados.
Si los resultados del experimento dan desventaja a la dieta A,
no habr forma de determinar si los resultados son a
consecuencia de la dieta A o del hecho de haber asignado los
conejos ms dbiles a esa dieta por nuestro "proceso de
aleatorizacin".

Diseo de experimentos p. 4/112

Mtodo 2

Atrape a todos los conejos y etiqutelos del 1 al 16.


Seleccione cuatro nmeros aleatorios (sin reemplazo) del 1 al
16 y ponga los conejos con esa etiqueta en una jaula que
recibir la dieta A.
Entonces, seleccione otros cuatro nmeros aleatorios y ponga
los conejos correspondientes en otra jaula que recibir la dieta
B.
As sucesivamente hasta tener cuatro jaulas con cuatro
conejos en cada una.

Diseo de experimentos p. 5/112

Mtodo 2

No hay repeticiones.
El diseo es un diseo completamente al azar pero no tiene
repeticiones.
Hay 16 conejos, pero los conejos en cada jaula no son
independientes. Si un conejo come mucho, los otros en la
jaula tienen menos para comer.
La unidad experimental es la menor unidad de material
experimental a la cual se le aplica un tratamiento en forma
independiente. En este caso, las jaulas son las unidades
experimentales. Para un diseo completamente al azar con
repeticiones, cada conejo debe estar en su propia jaula.

Diseo de experimentos p. 6/112

Mtodo 3

En una urna ponga las letras A,B,C y D en pedazos de papel


separados.
Atrape un conejo, saque un pedazo de papel al azar de la urna
y asigne el conejo a la dieta que indique el papel. No
reemplace el papel. Atrape el segundo conejo y seleccione al
azar otro pedazo de papel de la urna de los tres que quedan.
Asigne el conejo a la dieta correspondiente.
Continue hasta que los primeros cuatro conejos sean
asignados a una de las cuatro dietas. De esta manera, todos
los conejos lentos tienen diferentes dietas.
Coloque otra vez los cuatro pedazos de papel en la urna y
repita el procedimiento hasta que los 16 conejos estn
asignados a una dieta.

Diseo de experimentos p. 7/112

Mtodo 3

Este no es un diseo completamente al azar.


Ya que se seleccionaron los conejos en bloques de 4, y cada
uno asignado a una de las dietas, el diseo es el bloques al
azar.
El tratamiento es Dieta pero se ha bloqueado a travs del
grado de "atrapabilidad".

Diseo de experimentos p. 8/112

Mtodo 4

Atrape a todos los conejos y mrquelos del 1 al 16. Ponga 16


piezas de papel en una urna, con las letras A, B, C y D
repetidas cuatro veces cada una.
Ponga otros 16 pedazos de papel numerados del 1 al 16 en
otra urna. Tome un pedazo de papel de cada urna. El conejo
con el nmero seleccionado es asignado a la dieta
seleccionada.
Para hacer ms fcil de recordar cul conejo tiene cul dieta,
las jaulas se acomodan como se muestra abajo:
A
B
C
D

A
B
C
D

A
B
C
D

A
B
C
D

Diseo de experimentos p. 9/112

Mtodo 4

El mtodo 4 tiene algunas deficiencias. La asignacin de los


conejos a los tratamientos es un diseo completamente al
azar. Sin embargo, el arreglo de las jaulas crea un sesgo en
los resultados.
Puede haber cambios climticos y de luz que afecten de forma
diferencial a los tratamientos, de tal manera que, cualquier
diferencia observada no puede ser atribuida a la dieta, sino
que podra ser resultado de la posicin de la jaula.
La posicin de la jaula no es parte del tratamiento, pero debe
ser considerada. En un diseo completamente al azar, todos
los conejos tienen la misma probabilidad de recibir cualquier
dieta y en cualquier posicin de la jaula.

Diseo de experimentos p. 10/112

Mtodo 5

Marque las jaulas del 1 al 16.


1
2
3
4

5
6
7
8

9
10
11
12

13
14
15
16

Ponga 16 pedazos de papel en una urna, numerados del 1 al


16. En otra urna ponga 16 pedazos de papel, marcados con
las letras A, B C y D.
Atrape un conejo. Seleccione un nmero y una letra de cada
urna. Ponga el conejo en la jaula indicada por el nmero
escogido y asgnelo a la dieta indicada por la letra.
Repita sin reemplazo hasta que todos los conejos hayan sido
asignados a una dieta y una jaula.

Diseo de experimentos p. 11/112

Mtodo 5

Si, por ejemplo, el primer nmero seleccionado fu 7 y la


primera letra B, entonces el primer conejo se pone en la jaula
7 y se alimenta con la dieta B.
1
2
3
4

5
6
7B
8

9
10
11
12

13
14
15
16

Diseo de experimentos p. 12/112

Mtodo 5

Un ejemplo de asignacin completa es el siguiente:


1C
2D
3C
4A

5A
6B
7B
8A

9B
10 D
11 A
12 C

13 D
14 C
15 D
16 B

Note que el diseo completamente al azar no toma en cuenta


las diferencias en la altura de las jaulas. Es solamente una
asignacin completamente al azar.
En este ejemplo vemos que la mayora de los conejos con la
dieta A estn en jaulas de la parte de abajo y los de la dieta D
estn en la parte superior. Un diseo completamente al azar
supone que estas posiciones no producen una diferencia
sistemtica en la respuesta (tiempo de coagulacin).
Si creemos que la posicin afecta la respuesta, deberamos
usar un diseo de bloques al azar.
Diseo de experimentos p. 13/112

Diseo completamente al azar, un factor

Ejemplo: Disminucin del crecimiento de bacterias en carne


almacenada.
La vida en estante de carne almacenada es el tiempo en que
el corte empacado se mantiene bien, nutritivo y vendible.
El empaque estndar con aire del medio ambiente tiene una
vida de 48 horas. Despus se deteriora por contaminacin
bacterial, degradacin del color y encogimiento.
El empaque al vaco detiene el crecimiento bacterial, sin
embargo, se pierde calidad.
Estudios recientes sugieren que al controlar ciertos gases de
la atmsfera se alarga la vida en estante.

Diseo de experimentos p. 14/112

Diseo completamente al azar, un factor

Hiptesis de investigacin: Algunas formas de gases


controlados pueden mejorar la efectividad del
empacamiento para carne.
Diseo de tratamientos: Un factor con 4 niveles:
1. Aire ambiental con envoltura plstica
2. Empacado al vaco
3. Mezcla de gases:
1% CO (monxido de carbono)
40% O2 (oxgeno)
59% N (nitrgeno)
4. 100% CO2 (bixido de carbono)
Diseo experimental: Completamente al azar.

Diseo de experimentos p. 15/112

Diseo completamente al azar, un factor

Tres bisteces de res, aproximadamente del mismo tamao (75


grs.) se asignaron aleatoriamente a cada tratamiento. Cada
bistec se empaca separadamente con su condicin asignada.
Variable de respuesta: Se mide el nmero de
bacterias psichnotropicas en la carne despus de 9
das de almacenamiento a 4 C.
Estas bacterias se encuentran en la superficie de la
carne y aparecen cuando la carne se ech a perder.
La medicin fu el logaritmo del nmero de
bacterias por cm2 .

Diseo de experimentos p. 16/112

Diseo completamente al azar, un factor

Cmo aleatorizar?
Se obtiene una permutacin aleatoria de los nmeros 1 a 12. Para esto se
toma una secuencia de nmeros de 2 dgitos de una tabla de nmeros
aleatorios y se les asigna el rango que les corresponda.
Por ejemplo:
# aleatorio
rango
trat
u.e.
trat

52
6
1
1
1

56
7
1
2
3

20
1
1
3
2

99
12
2
4
4

44
5
2
5
2

34
3
2
6
1

62
10
3
7
1

60
9
3
8
4

31
2
3
9
3

57
8
4
10
3

40
4
4
11
4

78
11
4
12
2

Diseo de experimentos p. 17/112

Diseo completamente al azar, un factor

Modelo estadstico para el experimento


El modelo estadstico para estudios comparativos supone que
hay una poblacin de referencia de u.e. En muchos casos la
poblacin es conceptual. En el ejemplo, es posible imaginar
una poblacin de carne empacada.
Cada unidad de la poblacin tiene un valor de la variable de
respuesta, y, la cual tiene media y varianza 2 .
Se supone una poblacin de referencia para cada tratamiento
considerado en el estudio, y las variables en el experimento se
suponen seleccionadas aleatoriamente de dicha poblacin de
referencia, como resultado de la aleatorizacin.
Nota. Para estudios observacionales, suponemos que las
unidades observadas se seleccionaron aleatoriamente de
cada una de las poblaciones.
Diseo de experimentos p. 18/112

Diseo completamente al azar, un factor

Diseo de experimentos p. 19/112

Diseo completamente al azar, un factor

Modelo estadstico lineal para un diseo completamente al


azar.
Modelo de medias:
yij = i + ij i = 1, 2, . . . , t j = 1, 2, . . . , r
donde
yij es la observacin de la j-sima u.e. del i-simo tratamiento,
i es la media del i-simo tratamiento,
ij es el error experimental de la unidad ij.
Suponemos que hay t tratamientos y r repeticiones en cada
uno.
En el ejemplo de la carne empacada, tenemos:

Diseo de experimentos p. 20/112

Diseo completamente al azar, un factor

bistec
6
7
1
12
5
3
10
9
2
8
4
11

trata
miento
1
1
1
2
2
2
3
3
3
4
4
4

obser
vacin
1
2
3
1
2
3
1
2
3
1
2
3

log
(conteo/cm2 )
7.66
6.98
7.80
5.26
5.44
5.80
7.41
7.33
7.04
3.51
2.91
3.66

yij

Modelo

y11
y12
y13
y21
y22
y23
y31
y32
y33
y41
y42
y43

1 + 11
1 + 12
1 + 13
2 + 21
2 + 22
2 + 23
3 + 31
3 + 32
3 + 33
4 + 41
4 + 42
4 + 43

Diseo de experimentos p. 21/112

Diseo completamente al azar, un factor

El modelo:
yij = i + ij
lo llamaremos modelo completo ya que incluye una media
separada para cada una de las poblaciones definidas por los
tratamientos.
Si no hay diferencia entre las medias de las poblaciones, es
decir,
1 = 2 = 3 = 4 =
se genera el modelo reducido
yij = + ij
que establece que las observaciones provienen de la misma
poblacin con media .

Diseo de experimentos p. 22/112

Diseo completamente al azar, un factor

El modelo reducido representa la hiptesis de no diferencia


entre las medias
H0 : 1 = 2 = 3 = 4 =
El modelo completo representa la hiptesis alternativa:
Ha : i 6= k i 6= k
El investigador debe determinar cul de los dos modelos
describe mejor a los datos en el experimento.

Diseo de experimentos p. 23/112

Diseo completamente al azar, un factor

yij = + ij

yij = i + ij

Diseo de experimentos p. 24/112

Diseo completamente al azar, un factor

Pregunta de investigacin: Hay ms crecimiento bacterial


con algunos mtodos de empacado que con otros?
Pregunta estadstica: Cul modelo describe mejor los
resultados del experimento?

Se requiere un mtodo para estimar los parmetros de los dos


modelos y con base en algun criterio objetivo determinar cul
modelo o hiptesis estadstica se ajusta mejor a los datos del
experimento.

Diseo de experimentos p. 25/112

Diseo completamente el azar, un factor

Los estimadores de mnimos cuadrados son aquellos que


resultan de minimizar la suma de cuadrados de los errores
experimentales.
Si los errores experimentales son independientes con media
cero y varianzas homogneas, los estimadores de mnimos
cuadrados son insesgados y tienen varianza mnima.
Nota. El muestreo aleatorio en los estudios observacionales y
la aleatorizacin en los experimentales aseguran la suposicin
de independencia.

Diseo de experimentos p. 26/112

Estimadores para el modelo completo

yij
ij
SSEc

= i + ij i = 1, . . . , t j = 1, . . . , r
= yij i
=

r
t X
X
i=1 j=1

2ij =

r
t X
X
i=1 j=1

(yij i )

La SSEc es una medida de qu tan bien se ajusta el modelo a


los datos.
Queremos determinar los estimadores
i tales que se
minimice esta SSEc .
Vamos a tener t ecuaciones normales, una para cada
tratamiento, encontradas a partir de derivar la SSEc con
respecto a cada i e igualarlas a cero.

Diseo de experimentos p. 27/112

Estimadores para el modelo completo

Para una i:
r
X
2
(yij i )
i j=1

= 2

igualando a cero
r
X
2
(yij
i ) = 0

r
X
j=1

(yij i )

j=1

r
X
j=1

yij ri

= 0

Pr

j=1

yij

= yi.

Diseo de experimentos p. 28/112

Estimadores para el modelo completo

Por lo tanto,

i = yi

i = 1, . . . , t

Entonces,
SSEc

t X
r
X
i=1 j=1

t X
r
X
i=1 j=1

(yij
i )

(yij yi. )

t
r
X
X
2

=
(yij yi. )
i=1

j=1

Diseo de experimentos p. 29/112

Estimadores para el modelo completo

La varianza muestral del i-simo tratamiento es:


Pr
2
(y

)
ij
i.
j=1
Si2 =
r1

es una estimador de 2 de los datos del i-simo grupo.


i
Pt hPr
2
i. )
i=1
j=1 (yij y
SSEc
2
S =
=
t(r 1)
t(r 1)

es un estimador combinado (pooled) de 2 de todos los


datos del experimento.
Es un buen estimador si podemos hacer la suposicin de que
2 es homognea en todos los grupos.

Diseo de experimentos p. 30/112

Estimadores para el modelo completo

Para los datos del ejemplo:


tratamiento

i = yi.
Pr
2

)
(y
ij
i.
j=1

comercial
7.66
6.98
7.80
7.48
0.3848

vaco
5.26
5.44
5.80
5.50
0.1512

mezcla
7.41
7.33
7.04
7.26
0.0758

CO2
3.51
2.91
3.66
3.36
0.3150

SSEc = 0.3848 + 0.1512 + 0.0758 + 0.3150 = 0.9268


S2 =

SSEc
0.9268
=
= 0.11585
t(r 1)
4(2)

Diseo de experimentos p. 31/112

Estimadores para el modelo reducido

yij
ij

= + ij
= yij

SSEr

t X
r
X

2ij =

i=1 j=1

i=1 j=1

t X
r
X

XX
2
(yij )
i=1 j=1

= 2

igualando a cero
t X
r
X
i=1 j=1

(yij )

t X
r
X
i=1 j=1

t X
r
X

(yij )

yij

i=1 j=1

rt = y..
y..

=
= y..
rt
Diseo de experimentos p. 32/112

Estimadores para el modelo reducido

Entonces,
SSEr =

t X
r
X
i=1 j=1

(yij
) =

t X
r
X
i=1 j=1

(yij y.. )

Para el ejemplo,
70.80
= 5.90

= y.. =
12

Diseo de experimentos p. 33/112

Tratamiento
Comercial

Vaco

Mezcla

CO2

Observado
y
7.66
6.98
7.80
5.26
5.44
5.80
7.41
7.33
7.04
3.51
2.91
3.66

Modelo reducido
yij = + ij
Estimado Diferencia

(yij
)
5.90
1.76
5.90
1.08
5.90
1.90
5.90
-0.64
5.90
-0.46
5.90
-0.10
5.90
1.51
5.90
1.43
5.90
1.14
5.90
-2.39
5.90
-2.99
5.90
-2.24
SSEr = 33.7996

Modelo completo
yij = i + ij
Estimado Diferencia

i
(yij
i )
7.48
0.18
7.48
-0.50
7.48
0.32
5.50
-0.24
5.50
-0.06
5.50
0.30
7.26
0.15
7.26
0.07
7.26
-0.22
3.36
0.15
3.36
-0.45
3.36
0.30
SSEc = 0.9268
Diseo de experimentos p. 34/112

Diseo completamente al azar, un factor

Siguiendo con el ejemplo:


Modelo completo
Modelo reducido

yij = i + ij
yij = + ij

Diferencia:
SSEr SSEc

XX
i

haciendo lgebra
=

XX
i

P P
SSEc = i j (yij yi. )2 = 0.9268
P P
SSEr = i j (yij y.. )2 = 33.7996
2

(yij y.. )
2

XX

(
yi. y.. ) = r

(yij yi. )2

(
yi. y.. )2

En el ejemplo: SSEr SSEc = 32.8728

Diseo de experimentos p. 35/112

Diseo completamente al azar, un factor

SSEr SSEc = SSt suma de cuadrados de tratamientos.


Representa la reduccin en SSE al haber incluido
tratamientos en el modelo, tambin se le conoce como
reduccin en suma de cuadrados debida a tratamientos.
Llamaremos SStotal = SSEr ya que es la suma de cuadrados
de las diferencias de cada observacin y la media general y..
Entonces, tenemos la particin:
SStotal
XX
i

(yij y.. )2

desviacin de la
observacin ij
con respecto a
la media general

= SSt + SSEc
XX
XX
2
=
(
yi. y.. ) +
(yij yi. )2
i

desviacin de la
media del grupo
con respecto a
la media general

desviacin de la
observacin ij
con respecto a
la media de su grupo
Diseo de experimentos p. 36/112

Diseo completamente al azar, un factor

XX
i

(yij y.. )

XX
i

2
XX
i

XX
i

[(yij yi. ) + (
yi. y.. )]

(yij yi. ) +

XX
i

(yij yi. )(
yi. y.. ) =
=

XX
i

(
yi. y.. )2

(yij yi. )(
yi. y.. )

X
i

X
i

(
yi. y.. )

X
j

(yij yi. )

(
yi. y.. )(yi. r
yi. ) = 0

Diseo de experimentos p. 37/112

Diseo completamente al azar, un factor

Grados de libertad. Representan el nmero de piezas de


informacin independientes en las sumas de cuadrados.
En general, es el nmero de observaciones menos el nmero
de parmetros estimados de los datos.
Sea n = rt, el tamao de muestra total.
Pt Pr
As, SStotal = i j (yij y.. )2 donde y.. es el estimador de
, tiene n 1 g.l.
Pt Pr
SSE = i j (yij yi. )2 se estimaron t parmetros
(1 , 2 , . . . , t ) por lo tanto tiene n t g.l.
SSt = SStotal SSE = (n 1) (n t) = t 1 g.l.

Diseo de experimentos p. 38/112

Tabla de Anlisis de Varianza

ANOVA
F.V.
Tratamientos
Error
Total

g.l.
t1
nt
n1

SS
SSt
SSE
SStotal

CM
CMt = SSt /t 1
CM E = SSE/n t =
2

Se puede demostrar que:


E (CM E)

= 2
t

E (CMt )

1 X
2
= +
r(i
)2 ;
t 1 i=1

i /t

Diseo de experimentos p. 39/112

Tabla de Anlisis de Varianza

Si suponemos ij N ID(0, 2 ) i = 1, . . . , t
en el modelo completo yij = i + ij

j = 1, . . . , r

Entonces, yij N ID(i , 2 ).


Se puede demostrar que:
P P
.. )2
SStotal
i
j (yij y
2
=

n1
2
2
P P
2
(y

)
SSE
ij
i.
i
j
2
=

nt
2
2
Cuando
SSt
2

H0 : 1 = 2 = . . . = t es cierta
P
2
r(
y

)
i.
..
2
i
=

t1
2

Diseo de experimentos p. 40/112

Tabla de Anlisis de Varianza

Por el Teorema de Cochran (Montgomery, 2001, pg. 69), SSt


y SSE son independientes, por lo tanto cuando H0 es cierta,
SSt / 2 (t 1)
CMt
F0 =
=
Ft1,nt
2
SSE/ (n t)
CM E
Adems, E (CMt ) = 2 + t2 = 2 cuando t2 = 0 que es
cuando H0 es cierta. Es decir,
E (CMt )
E (CMt )

= E (CM E) cuando H0 es cierta


> E (CM E) cuando H0 no es cierta

Entonces, si CMt > CM E, o sea, valores grandes de F0


llevan a rechazar la hiptesis nula H0 : 1 = 2 = . . . = t .
Por lo tanto, la regin de rechazo es:

F0 > Ft1,nt
Diseo de experimentos p. 41/112

Tabla de Anlisis de Varianza

ANOVA
F.V.
Tratamientos

g.l.
t1

SS
SSt

CM
CMt =

Error

nt

SSE

CM E =

Total

n1

SStotal

SSt

t
X
i=1

SSE

SSt
t1

CMt
CM E

SSE
nt

E(CM )
2 + t2
2

r (
yi. y.. )

r
t X
X
i=1 j=1

SStotal

t X
r
X
i=1 j=1

(yij yi. )

(yij y.. )

Diseo de experimentos p. 42/112

Tabla de Anlisis de Varianza

En el ejemplo de empacado de carne:


F.V.
trat
error
total

g.l.
3
8
11

SS
32.8728
0.9268
33.7996

CM
10.958
0.1159

F
94.55

Pr > F
0.000

Por lo tanto, se rechaza la hiptesis H0 : 1 = 2 = . . . = 4 ,


es decir, hay algn mtodo de empaque que tiene diferente
comportamiento en promedio.

Diseo de experimentos p. 43/112

Diseo completamente al azar, un factor

Se quieren comparar t niveles de un factor, lo que implica t


tratamientos y se dispone de ni u.e. para el tratamiento i,
i = 1, . . . , t. Hay dos situaciones:
1. Los t tratamientos son escogidos especficamente por el
investigador. En esta situacin deseamos probar hiptesis
acerca de las medias de los tratamientos y nuestras
conclusiones se aplicarn solamente a los niveles del
factor considerados en el anlisis. Las conclusiones no se
pueden extender a tratamientos similares que no fueron
explcitamente considerados. Este es el modelo de
efectos fijos.
2. Los t tratamientos son una muestra aleatoria de una
poblacin de tratamientos. En esta situacin nos gustara
poder extender las conclusiones (las cuales estn basadas
en la muestra de tratamientos considerada) a todos los
tratamientos de la poblacin. Este es el modelo de
efectos aleatorios.
Diseo de experimentos p. 44/112

Diseo completamente al azar, un factor

A las cantidades n1 , n2 , . . . , nt se les llama repeticiones de


cada tratamiento.
Si ni = r i se dice que el diseo es balanceado.
yij es la respuesta de la u.e. j del tratamiento i,
i = 1, . . . , t j = 1, . . . , ni .

Diseo de experimentos p. 45/112

Diseo completamente al azar

Estructura de los datos.


1
y11
y12
y13
.
.
.
y1n1
y1.
y1.

2
y21
y22
y23
.
.
.
y2n2
y2.
y2.

tratamientos
3
... t
y31
... yt1
y32
... yt2
y33
... yt3
.
... .
.
... .
.
... .
y3n3 ... ytnt
y3.
... yt.
y3.
... yt.

totales
medias

Diseo de experimentos p. 46/112

Diseo completamente al azar

n
yi.
yi.
y..

=
=

=
=

t
X

i=1
ni
X

ni
yij i = 1, . . . , t total tratamiento i

j=1
Pni
j=1

yij

ni
ni
t X
X
i=1 j=1

y..

i = 1, . . . , t media tratamiento i

yij =

t
X

yi. total de las observaciones

i=1

y..
media general
n

Diseo de experimentos p. 47/112

Diseo completamente al azar

Se tienen t muestras aleatorias independientes de tamaos


n1 , n2 , . . . , nt respectivamente.
y11 , y12 , . . . , y1n1 es una muestra aleatoria de N (1 , 2 )
y21 , y22 , . . . , y2n2 es una muestra aleatoria de N (2 , 2 )
yt1 , yt2 , . . . , ytnt es una muestra aleatoria de N (t , 2 )

Diseo de experimentos p. 48/112

Diseo completamente al azar

Las observaciones en cada una de estas muestras se pueden


representar por el modelo lineal simple
yij = i + ij i = 1, . . . , t j = 1, . . . , ni
con ij error experimental en la observacin j-sima del
tratamiento i-simo.
Estamos suponiendo independencia entre y dentro de las
muestras, es decir, ij son independientes y ij N (0, 2 ).

Diseo de experimentos p. 49/112

Diseo completamente al azar

Otra forma de verlo


Como suponemos que las u.e. son homogneas, es decir, el
promedio de respuesta de todas las u.e. es el mismo () antes
de aplicar los tratamientos, y si se observan en condiciones
similares, las respuestas las podemos modelar como
yij = + ij

Diseo de experimentos p. 50/112

Modelo de efectos

Entonces al aplicar el tratamiento i-simo a un grupo (de


tamao ni ) de u.e. se introduce un efecto (i ) de ese
tratamiento en las variables por observar.
El modelo se puede escribir como:
Modelo de efectos
yij = + i + ij i = 1, . . . , t j = 1, . . . , ni
donde
es la media general, comn a todas las u.e.
i es el efecto del tratamiento i-simo

Diseo de experimentos p. 51/112

Modelo de efectos

Diseo de experimentos p. 52/112

Modelo de efectos

El modelo de efectos implica que se empieza el experimento


con u.e. con la misma capacidad de respuesta () y con la
misma varianza ( 2 ).
La aplicacin de los tratamientos tiene el efecto de alterar las
medias, que ahora son i = + i , pero supone que no se
modifican las varianzas.
En este caso, la hiptesis a probar es:
H0 : 1 = 2 = . . . = t = 0
Ha : i 6= 0 para al menos una i

Diseo de experimentos p. 53/112

Modelo de efectos

Estimadores de mnimos cuadrados:


yij = + i + ij i = 1, . . . , t j = 1, . . . , ni
SSE =

ni
t X
X

2ij

i=1 j=1

i
XX
(yij i )2
i=1 j=1

ni
t
XX
(yij i )2
i i=1 j=1

ni
t X
X
i=1 j=1

= 2
= 2

(yij i )2

ni
t X
X
i=1 j=1

ni
X
j=1

(yij i )

(yij i )

i = 1, . . . , t

Diseo de experimentos p. 54/112

Modelo de efectos

Igualando a cero:
ni
t X
X

yij

= n
+

i=1 j=1
n1
X

t
X

ni i

i=1

y1j

= n1
+ n1 1

n2
X

y2j

= n2
+ n2 2

nt
X

ytj

j=1

j=1

...

...
= nt
+ nt t

j=1

Las ecuaciones normales no son linealmente independientes,


por lo tanto no hay una solucin nica. Esto ocurre porque el
modelo de efectos est sobreparametrizado.
Diseo de experimentos p. 55/112

Modelo de efectos

Se aade una ecuacin linealmente independiente:


Pt
a)
i = 0
i=1

= y..
i = yi. y.. i = 1, . . . , t

b)

=0

= 0
i = yi. i = 1, . . . , t

c)

1 = 0

= y1.
i = yi. y1. i = 2, . . . , t
Diseo de experimentos p. 56/112

Modelo de efectos

Hay un nmero infinito de posibles restricciones que se


pueden usar para resolver las ecuaciones normales. Entonces
Cul usar?
No importa ya que en cualquier caso
\
+ i = yi.
Aunque no podemos obtener estimadores nicos de los
parmetros del modelo de efectos, podemos obtener
estimadores nicos de funciones de estos parmetros.
A estas funciones se les llama funciones lineales
linealmente estimables.

Diseo de experimentos p. 57/112

Diseo completamente al azar, Tabla de ANOVA

F.V.

g.l.

SS

CM

t1

SSt

CMt =

Error

nt

SSE

CM E =

Total

n1

SStotal

SSt =

i=1

SSE =

ni (
yi. y.. )

ni
t X
X
i=1 j=1

SStotal =

ni
t X
X
i=1 j=1

(yij yi. )

(yij y.. )

CMt
CM E

SSt
t1

Tratamientos

t
X

E(CM )

SSE
nt

ni (i
)2
t1

y..2

ni
n
i.

ni
t X
X

ni
t X
X
i=1 j=1

i=1 j=1

t
X
y2
i=1

t
X
i=1

2
yij

2
yij

t
X
y2

i.

i=1

ni

y..2

ni
Diseo de experimentos p. 58/112

Intervalos de confianza

i = yi.

Sy2i.

S
=
ni

con S = CM E =

Syi. =

CM E
ni

Como suponemos que

yij N i ,
entonces

yi. N i , /ni

como estimamos la varianza:

yi. i
tnt
Syi.
Por lo tanto, un intervalo del (1 )100% de confianza para i
es
1/2
yi. tnt (Syi. )
Diseo de experimentos p. 59/112

Contrastes

En el ejemplo del empacado de carne tenamos:

i = yi.

Comercial
7.48

Al vaco
5.50

CO,O2,N
7.26

CO2
3.36

S 2 = CM E = 0.116 con 8 g.l.


Una vez que rechazamos la hiptesis H0 : 1 = 2 = 3 = 4
Qu sigue?

Diseo de experimentos p. 60/112

Contrastes

Se podran contestar preguntas como:

Es ms efectiva la creacin de una atmsfera artificial que el


aire ambiente con plstico para reducir el crecimiento de
bacterias?
Son ms efectivos los gases que el vaco?
Es ms efectivo el tratamiento de CO2 puro que la mezcla
CO,O2 y N?

Un contraste es una funcin lineal de los parmetros i


definido como
C=

t
X

ki i = k1 1 + k2 2 + . . . + kt t

i=1

donde

Pt

i=1

ki = 0.

Diseo de experimentos p. 61/112

Contrastes

Los contrastes para las preguntas anteriores son:

comercial vs. atmsfera artificial


1
C1 = 1 (2 + 3 + 4 )
3

vaco vs. gases


C2 = 2

1
(3 + 4 )
2

mezcla de gases vs. CO2 puro


C3 = 3 4

Diseo de experimentos p. 62/112

Contrastes

El estimador del contraste


C=

t
X

ki i

es

C =

t
X

Si suponemos que

yij N i ,

yi. N i , /ni

Por lo tanto,
C =

t
X
i=1

ki yi. N

t
X
i=1

ki yi.

i=1

i=1

i=1

entonces

ki
i =

t
X

ki i ,

t
X
i=1

ki
ni

Diseo de experimentos p. 63/112

Contrastes

Ya que:
E

t
X

ki yi.

i=1

t
X
i=1

ki yi.

t
X

ki E (
yi. ) =

t
X

ki i

i=1

i=1

t
2
2
X
k

i
2
2
2
=

=
k
k
V
(
y
)
=
i.
i
i
|{z}
ni
n
i=1 i
i=1
i=1

m.indep

t
X

t
X

t
t

2
2
X
X
k
k
i
i
2
= CM E
V C =

n
n
i=1 i
i=1 i

Diseo de experimentos p. 64/112

Contrastes

Entonces,
Pt
Pt
i. i=1 ki i
i=1 ki y
q
tg.l.error
Pt
CM E i=1 ki2 /ni
De aqu un intervalo del 100(1 )% de confianza para el
contraste C es:
v
u
t
X
u
1/2
ki2 /ni
C tg.l.error tCM E
i=1

Diseo de experimentos p. 65/112

Contrastes

Adems,

Si H0 :

Pt

i=1

C C
q P
N (0, 1)
t
2 i=1 ki2 /ni

ki i = 0, es decir, H0 : C = 0 es cierta, entonces,


C 2

Sea

Pt
2

2 /n
k
i
i
i=1

SSc = Pt

21

C 2

2 /n
k
i
i=1 i

entonces

Pt
2

C / i=1 ki2 /ni


SSc /
=
F1,nt
2
SSE/ (n t)
CM E
2

Por lo tanto, para probar H0 : C = 0 se rechaza si Fc > F1,nt


Diseo de experimentos p. 66/112

Contrastes

El nmero de contrastes que se pueden hacer es muy grande,


sin embargo, esta tcnica tiene su mayor utilidad cuando se
aplica a comparaciones planeadas antes de realizar el
experimento.
Una clase de contrastes, conocida como Contrastes
ortogonales (como son los del ejemplo anterior) tienen
propiedades especiales con respecto a la particin de sumas
de cuadrados y grados de libertad y con respecto a su relacin
entre ellos. La ortogonalidad implica que un contraste no
aporta informacin acerca de otro.
Dos contrastes, con coeficientes {ki }, {li } son ortogonales si
t
X
ki li
i=1

ni

=0

Diseo de experimentos p. 67/112

Contrastes

Para t tratamientos existe un conjunto de t 1 contrastes


ortogonales, los cuales hacen una particin de la suma de
cuadrados de tratamientos en t 1 componentes
independientes, cada uno con 1 g.l. Por lo tanto las pruebas
realizadas con contrastes ortogonales son independientes.
En el ejemplo anterior, los contrastes son ortogonales.

C1
C2
C3

k1
1
0
0

k2
-1/3
1
0

k3
-1/3
-1/2
1

k4
-1/3
-1/2
-1

Diseo de experimentos p. 68/112

ANOVA

La tabla de ANOVA incorporando las pruebas de hiptesis de


los 3 contrastes es:
F.V.
trat
C1
C2
C3
error
total

g.l.
3
1
1
1
8
11

SS
32.8728
10.01
0.07
22.82
0.9268
33.7996

CM
10.958
10.01
0.07
22.82
0.1159

F
94.55
86.29
0.62
196.94

Pr > F
0.000
0.000
0.453
0.000

Se rechaza H0 : 1 = 2 = 3 = 4
Se rechaza H01 : 1 = 31 (2 + 3 + 4 )
No se rechaza H02 : 2 = 21 (3 + 4 )
Se rechaza H03 : 3 = 4
SSC1 =

1
r

2
C1
P4

i=1

ki2

(2.11)2
12 +3(1/3)2
3

4.4521
= 10.01
0.4444
Diseo de experimentos p. 69/112

Otro ejemplo

En un experimento se van a comparar los % de carbohidratos


en cuatro marcas de pan, para lo cual se van a hacer 18
determinaciones: 5 en la marca A, 3 en la B, 4 en la C y 6 en
la D.
En este caso, cada marca de pan es un tratamiento (t = 4) y
se tienen n1 = 5, n2 = 3, n3 = 4, n4 = 6. Para obtener las
respuestas se tomarn muestras aleatorias de los tamaos ni
especificados de cada marca y se harn determinaciones de
los porcentajes mediante un procedimiento (hasta donde sea
posible) idntico en las 18 u.e.
Note que en este ejemplo no estamos en libertad de asignar
las u.e. a los tratamientos, ya que las poblaciones (las 4
marcas) existen independientemente de la accin del
experimentador. No obstante lo anterior, basta que las
muestras aleatorias de las 4 poblaciones sean independientes
para que el anlisis bajo el modelo que se propone sea vlido.
Este es un estudio observacional, no experimental.
Diseo de experimentos p. 70/112

Otro ejemplo

Tratamiento (marca)
A
B
C
63
60
59
68
65
66
71
61
58
70
59
69
ni
yi.
yi.

5
341
68.2

3
186
62.0

4
242
60.5

D
70
69
62
71
70
66
6
408
68.0

Diseo de experimentos p. 71/112

Otro ejemplo

Pruebe la hiptesis de igualdad de medias


H0 : 1 = 2 = 3 = 4 .
Conteste las siguientes preguntas:

Son diferentes en promedio los porcentajes de


carbohidratos en las marcas B y C?
Es diferente el porcentaje de carbohidratos de la marca A al
promedio de las marcas C y D?
Suponga que las marcas A y B estn hechas con harina
integral y las marcas C y D con harina blanca. El promedio
del porcentaje de carbohidratos de las marcas A y B es igual
al promedio de C y D?

Hacerlo con SPSS, JMP, STATA

Diseo de experimentos p. 72/112

Comparaciones mltiples

En muchas situaciones prcticas, se desea comparar pares de


medias. Podemos determinar cules medias difieren probando
las diferencias entre todos los pares de medias de
tratamientos.
Es decir, estamos interesados en contrastes de la forma
= i j i 6= j
Lo primero que se nos viene a la mente es hacer una prueba t
para cada par de medias, es decir, probar
H0 : i
Ha : i

= j
6= j i 6= j

Diseo de experimentos p. 73/112

Comparaciones mltiples

Si suponemos varianzas iguales, se tiene la estadstica de


prueba
yi. yj.
tc = q
sp n1i + n1j

y se rechaza H0 al nivel de significancia si


/2

tc tni +nj 2

1/2

tc tni +nj 2

Esto es equivalente a decir que se rechaza H0 si


|tc | =
o equivalente a

|
y yj. |
1/2
qi.
> tni +nj 2
sp n1i + n1j

|
yi. yj. | >

1/2
tni +nj 2

sp

1
1
+
ni
nj
Diseo de experimentos p. 74/112

Comparaciones mltiples

Esta prueba conocida como Diferencia Mnima Significativa


(DMS LSD) en el contexto de ANOVA, lo que hace es
comparar el valor absoluto de la diferencia de cada par de
medias con DMS:
Si
s

1
1
1/2
+
|
yi. yj. | > DM S = tglerror CM E
ni
nj
se rechaza H0 : i = j .
CM E es el cuadrado medio del error que es una estimacin
ponderada de la varianza basada en t estimaciones de la
varianza.
El utilizar este procedimiento no es conveniente por que el
nivel de significancia global, es decir, para el conjunto de todas
las pruebas, resulta muy superior al nivel de significancia ()
planeado.
Diseo de experimentos p. 75/112

Comparaciones mltiples

Por ejemplo, si se tienen 4 medias de tratamientos, entonces


se tienen

4
4!
=6
=
2!2!
2
pares a comparar, es decir, 6 pruebas de hiptesis a realizar,
con lo que se pueden cometer 0, 1, 2, 3, 4, 5, 6 errores Tipo I,
si todas las medias son iguales.
Se define otra forma de error tipo I basado en los riesgos
acumulados asociados a la familia de pruebas bajo
consideracin.
Este es el error tipo I del experimento E que es el riesgo de
cometer el error tipo I al menos una vez.
La probabilidad de error tipo I del experimento puede
evaluarse para una familia de pruebas independientes.

Diseo de experimentos p. 76/112

Comparaciones mltiples

Sin embargo, todas las pruebas a pares usando la DM S no


son independientes, puesto que el CM E es el mismo en cada
una de las estadsticas de prueba y el numerador contiene las
mismas medias en varias de las estadsticas de prueba.
An as, se puede evaluar el lmite superior de la probabilidad
de error tipo I del experimento, suponiendo n pruebas
independientes.
t
Suponga que la H0 es cierta para cada una de las n = 2
pruebas y que son independientes.
Sea c = P (error tipo I) en una sola prueba (comparacin)
con (1 c ) = P (decisin correcta).

Diseo de experimentos p. 77/112

Comparaciones mltiples

La probabilidad de cometer x errores tipo I est dada por la


distribucin binomial como:

n x
P (X = x) =
c (1 c )nx
x
n!
cx (1 c )nx x = 0, 1, 2, . . . , n
P (X = x) =
(n x)!x!
La probabilidad de no cometer ningn error tipo I es
P (X = 0) = (1 c )n

Diseo de experimentos p. 78/112

Comparaciones mltiples

La probabilidad de cometer al menos 1 error tipo I es


P (X 1) = 1 P (X = 0) = 1 (1 c )n
es decir, la mxima probabilidad de cometer al menos un error
tipo I entre las n comparaciones es:
E

1 (1 c )n

de aqu

1 (1 E )1/n

Diseo de experimentos p. 79/112

Comparaciones mltiples

# de pruebas
indep. n
1
2
3
4
5
10

E cuando
c = 0.05
0.05
0.098
0.143
0.185
0.226
0.401

c cuando
E = 0.05
0.05
0.025
0.017
0.013
0.010
0.005

Por el razonamiento anterior es que han surgido una serie de


pruebas de diferentes autores para hacer comparaciones
mltiples tratando de mantener la
P (error tipo I del experimento) =

Diseo de experimentos p. 80/112

Bonferroni

E nc

n comparaciones, la igualdad se d cuando las pruebas son


independientes.
Entonces,
c = E /n
Si queremos E = 0.05 entonces, c = 0.05/n y se hacen las
pruebas t para los pares de medias con un nivel de
significancia c en cada una de ellas.

Diseo de experimentos p. 81/112

Tukey

Conocida como la prueba de la Diferencia Mnima Significativa


Honesta (DMSH)
r
CM E

DM SH = qt,glerror
si ni = r i
r
s

1
CM E 1

+
DM SH = qt,glerror
2
ni
nj
Si |
yi. yj. | > DM SH se rechaza H0 : i = j .
q1 ,2 se obtiene de las "tablas de rangos estudentizados".

Diseo de experimentos p. 82/112

Tukey

Para el ejemplo del empaque de carne:


yi.

Comercial
7.48

Al vaco
5.50

CO,O2,N
7.26

CO2
3.36

S 2 = CM E = 0.116 con 8g.l. t = 4, r = 3


0.05
DM SH = q4,8

0.116
= (4.53)(0.197) = 0.891
3

|
y1. y2. |
|
y1. y3. |
|
y1. y4. |
|
y2. y3. |
|
y2. y4. |
|
y3. y4. |

=
=
=
=
=
=

1.98
0.22
4.12
1.76
2.14
3.90
Diseo de experimentos p. 83/112

Student-Newman-Keuls (SNK)

Se calcula un conjunto de valores crticos

kp = qp,f
Syi. p = 2, 3, . . . , t

donde qp,f
es el percentil 1 de la distribucin del rango
estudentizado para el nmero p de medias
q involucradas en la

comparacin y f g.l. del error, y Syi. =

CM E
r

Para el ejemplo de la carne empacada:


p
2
3
4
.05
qp,8
3.26
4.04
4.53
kp
0.642 0.796 0.892

Diseo de experimentos p. 84/112

Student-Newman-Keuls (SNK)

yi.

Comercial
7.48

Al vaco
5.50

CO,O2,N
7.26

CO2
3.36

Medias ordenadas:
y4. = 3.36 y2. = 5.50 y3. = 7.26 y1. = 7.48
|
y4. y1. |
|
y4. y3. |
|
y4. y2. |
|
y2. y1. |
|
y2. y3. |
|
y3. y1. |

=
=
=
=
=
=

4.12 > k4
3.90 > k3
2.14 > k2
1.98 > k3
1.76 > k2
0.22 < K2 (N.S.)

Diseo de experimentos p. 85/112

Duncan

Es similar a la de SNK. Los promedios de los t tratamientos se


ordenan en forma ascendente y el error estndar de cada
promedio se determina con
r
CM E
si ni = r i
Syi. =
r
Para muestras de diferente tamao, se reemplaza la r por la
media armnica (nh ) de los {ni }
nh = P
t

i=1

1
ni

Diseo de experimentos p. 86/112

Duncan

De las tablas de Duncan de rangos significativos se obtienen

los valores de rp,f


para p = 2, 3, . . . , t.
p es el nmero de medias involucradas en la comparacin,
es el nivel de significancia y f los grados de libertad del error.
Se calculan

Rp = rp,f
Syi. p = 2, 3, . . . , t

Para el ejemplo de la carne empacada:


p
2
3
4
.05
3.26
3.39
3.47
rp,8
Rp
0.642 0.668 0.684

Diseo de experimentos p. 87/112

Duncan

yi.

Comercial
7.48

Al vaco
5.50

CO,O2,N
7.26

CO2
3.36

Medias ordenadas:
y4. = 3.36 y2. = 5.50 y3. = 7.26 y1. = 7.48
|
y4. y1. |
|
y4. y3. |
|
y4. y2. |
|
y2. y1. |
|
y2. y3. |
|
y3. y1. |

=
=
=
=
=
=

4.12 > R4
3.90 > R3
2.14 > R2
1.98 > R3
1.76 > R2
0.22 < R2 (N.S.)

Diseo de experimentos p. 88/112

Dunnett

Para comparar las medias de los tratamientos con la media del


tratamiento control.
Suponga que el tratamiento t es el control, queremos probar
las hiptesis
H0 : i
Ha : i

= t
6
=
t i = 1, 2, . . . , t 1

r
H0 : i = t se rechaza si
CM E
|
yi. yt. | > D = d (t 1, glerror)
r
con d (k, ) es el percentil 1 de las tablas de Dunnett.
Para el ejemplo de la carne empacada, el tratamiento 1 es el
control.
Comercial Al vaco CO,O2,N CO2
yi. 7.48
5.50
7.26
3.36
Diseo de experimentos p. 89/112

Dunnett

d0.05,3,8 = 2.42
!
r
CM E
= 0.477
D = 2.42
r
|
y2. y1. | = 1.98 > D
|
y3. y1. | = 0.22 < D(N.S.)
|
y4. y1. | = 4.12 > D

Diseo de experimentos p. 90/112

Scheff

Scheff (1953) propuso un mtodo para probar todos los


posibles contrastes.
Considere cualquier contraste
C=

t
X

ki i estimado con C =

t
X

ki yi.

i=1

i=1

con error estndar


v
#
" t
u
X k2
u
i
t
SC = CM E
n
i=1 i

La hiptesis nula pra el contraste H0 : C = 0 se rechaza si


|C| > S(E )
donde
S(E ) = SC

E
(t 1)Ft1,g.l.error
Diseo de experimentos p. 91/112

Anlisis de residuales

Tenemos el modelo
yij = i + ij

Suposiciones:

yij = + i + ij

2
ij N ID 0,

errores normales
independientes
varianza constante

La prueba F del anlisis de varianza es robusta a falta de


normalidad.

Diseo de experimentos p. 92/112

Anlisis de residuales

Si los errores experimentales estn correlacionados, el error


estndar estar mal estimado. La independencia se justifica
aleatorizando las u.e. a los tratamientos en experimentos y
seleccionando muestras aleatorias en estudios
observacionales.
Si no hay homogeneidad de varianzas el estimador de 2 es
malo, aunque se ha visto en estudios que si el diseo es
balanceado no efecta mucho. Tambin si los tamaos de
muestra mayores corresponden a las poblaciones con mayor
varianza.

Diseo de experimentos p. 93/112

Anlisis de residuales, Normalidad

Residuales
eij
yij
eij

= yij yij

= \
+ i =
i = yi.
= yij yi.

Prueba no parmetrica ( Kolmogorov-Smirnov )


Histograma (muestras grandes)
grfica en papel normal
anlisis de residuales estandarizados para detectar outliers.
0
Si ij N (0, 2 ) entonces ij N (0, 1). Sean
eij
dij = CM
, esperamos que:
E
68% de los residuales estandarizados estn entre -1 y 1
95 % estn entre -2 y 2
Virtualmente todos estn entre -3 y 3.

Diseo de experimentos p. 94/112

Anlisis de residuales, Homogeneidad de varianzas

Prueba de Bartlett
H0 :
Ha :

12 = 22 = . . . = t2
no H0

Estadstica de Prueba:
"
#
X
1
2
(n t)ln(
)
(ni 1)ln(
i2 )
U=
C
i
X (ni 1)
2

X (yij yi. )2
donde
=
=
n

t
ni 1
i
j

!
X
1
1
1

C =1+
3(t 1)
ni 1 n t
i
2

i2

H0 se rechaza si U > 2,t1 (prueba sensible a falta de


normalidad)

Diseo de experimentos p. 95/112

Anlisis de residuales, Homogeneidad de varianzas

Prueba de Levene
Se calcula
dij = |yij yi. |

i = 1, . . . , t j = 1, . . . , ni

donde yi. es la mediana de las observaciones en el


tratamiento i.
Se evala si el promedio de estas observaciones dij es igual
para todos los tratamientos, es decir, se hace un ANOVA para
probar igualdad de medias de dij .

Diseo de experimentos p. 96/112

Prueba de Welch

La prueba F usual es robusta ante heteroscedasticidad


(varianzas diferentes) si los tamaos de muestra son muy
parecidos o, si los tamaos de muestra ms grandes
corresponden a las poblaciones con varianzas ms grandes.
Sin embargo, se han construdo algunas procedimientos de
prueba de igualdad de medias (H0 : 1 = 2 = . . . = t ) como
por ejemplo el desarrollado por Welch, conocido como la
prueba de Welch.
P
P

2
Sean Wi = ni /
i y = i Wi yi. / i Wi y
=

X (1 Wi /W. )2
i

donde W. =

ni 1

Wi .

Diseo de experimentos p. 97/112

Prueba de Welch

Entonces
Fc =

1+

(
yi.
y )2
i Wi
t1
2(t 2)/(t2

1)

tiene aproximadamente una distribucin F con


1 = t 1 y 2 = (t2 1)/3 grados de libertad.
H0 : 1 = 2 = . . . = t se rechaza al nivel de significancia si
Fc > F1 ,2 .

Diseo de experimentos p. 98/112

Transformaciones

Se utilizan las transformaciones para cambiar la escala de las


observaciones para que se cumplan las suposiciones del
modelo lineal y dar inferencias vlidas del anlisis de varianza.
Cuando las transformaciones son necesarias, se hace el
anlisis y se hacen las inferencias en la escala transformada
pero se presentan tablas de medias en la escala de medicin
original.
1. Distribucin Poisson. Mediciones que son conteos
(nmero de plantas en cierta rea, insectos en plantas,
accidentes por unidad de tiempo) tienen distribucin Poisson.

La transformacin x = y + a, a es la adecuada.

Diseo de experimentos p. 99/112

Transformaciones

2. Distribucin binomial. Observaciones del nmero de


xitos en n ensayos independientes tiene distribucin binomial
(proporcin de semillas germinadas, proporcin de plantas
con flores en un transecto).
= y/n

es la adecuada.
La transformacin x = sin
Las transformaciones del tipo potencia alteran la simetra o
asimetra de las distribuciones de las observaciones.
Si suponemos que la desviacin estndar de y es proporcional
a alguna potencia de la media, es decir,
y
Una transformacin de las observaciones, del estilo:
x = yp

Diseo de experimentos p. 100/112

Transformaciones

Da una relacin
x p+1

Si p = 1 entonces la desviacin estndar de la variable


transformada x ser constante, ya que p + 1 = 0 y x 0 .
La transformacin de Box-Cox
x = (y p 1)/p p 6= 1
x = loge y p = 1
El estimador de p se encuentra maximizando
1
L(p) = loge [CM E(p)]
2
donde CM E(p) es el cuadrado medio del error del anlisis de
varianza usando la transformacin x = (y p 1)/p para el valor
dado p.
Diseo de experimentos p. 101/112

Transformaciones

Se determina CM E(p) para un conjunto de valores de p, se


grafica CM E(p) vs. p y se toma el valor de p que corresponde
al valor mnimo de CM E(p).
JMP calcula la transformacin de Box-Cox, da una grfica de p
vs. CM E y da la opcin de guardar los datos transformados
en el archivo.
La dificultad de utilizar esta transformacin es la interpretacin.

Diseo de experimentos p. 102/112

Ejemplo

Los siguientes datos son el nmero de errores en un examen


de sujetos bajo la influencia de dos drogas. El grupo 1 es un
grupo control (sin droga), a los sujetos del grupo 2 se les di la
droga 1, a los del grupo 3 la droga 2 y a los del grupo 4 las dos
drogas.
Grupo 1

Grupo 2

Grupo 3

Grupo 4

(sin droga)

(droga 1)

(droga 2)

(dos drogas)

1
8
9
9
4
1
1

12
10
13
13
12
10

12
4
11
7
8
10
12
5

13
14
14
17
11
14
13
14

Diseo de experimentos p. 103/112

Ejemplo

Correr el ejemplo con SPSS y JMP.


1. Probar homogeneidad de varianzas. (Bartlett y Levene)
2. Hacer prueba de Welch
3. Probar con algunas transformaciones, checando
normalidad y homogeneidad de varianzas

ej2_1_messy.sav
ej2_1_messy.jmp
ej2_1_messy.txt

Diseo de experimentos p. 104/112

Relacin entre Regresin y ANOVA

Cualquier modelo de ANOVA se puede escribir como un


modelo de regresin lineal.
Suponga el ejemplo de la carne empacada
tratamiento

comercial
7.66
6.98
7.80

vaco
5.26
5.44
5.80

mezcla
7.41
7.33
7.04

CO2
3.51
2.91
3.66

Un diseo completamente al azar con un solo factor (mtodo


de empacado) con 4 niveles (4 tratamientos) y 3 repeticiones
en cada tratamiento (diseo balanceado).

Diseo de experimentos p. 105/112

Relacin entre Regresin y ANOVA

Modelo ANOVA completamente al azar un solo factor


balanceado:
(
i = 1, 2, 3, 4
yij = i + ij = + i + ij
j = 1, 2, 3
El modelo de regresin equivalente es:

yij = 0 + 1 x1j + 2 x2j + 3 x3j + ij

i = 1, 2, 3, 4
j = 1, 2, 3

Diseo de experimentos p. 106/112

Relacin entre Regresin y ANOVA

Donde las variables x1j , x2j , x3j estn definidas como:

x1j =

1
0

si la observacin j es del tratamiento 1


en otro caso

x2j =

1
0

si la observacin j es del tratamiento 2


en otro caso

x3j =

1
0

si la observacin j es del tratamiento 3


en otro caso

Diseo de experimentos p. 107/112

Relacin entre Regresin y ANOVA

La relacin entre los parmetros del modelo ANOVA y el


modelo de regresin es:
Si la observacin viene del tratamiento 1, entonces
x1j = 1, x2j = 0, x3j = 0 y el modelo de regresin es
y1j

= 0 + 1 (1) + 2 (0) + 3 (0) + 1j


= 0 + 1 + 1j

y el modelo ANOVA es:


y1j = 1 + 1j = + 1 + 1j
Por lo tanto:
0 + 1 = 1 = + 1

Diseo de experimentos p. 108/112

Relacin entre Regresin y ANOVA

Similarmente, para las observaciones del tratamiento 2


y2j

= 0 + 1 (0) + 2 (1) + 3 (0) + 2j


= 0 + 2 + 2j

y la relacin entre los parmetros es:


o + 2 = 2 = + 2
Lo mismo para las observaciones del tratamiento 3
y3j

= 0 + 1 (0) + 2 (0) + 3 (1) + 3j


= 0 + 3 + 3j

y la relacin entre los parmetros es:


o + 3 = 3 = + 3
Diseo de experimentos p. 109/112

Relacin entre Regresin y ANOVA

Finalmente, considere las observaciones del tratamiento 4,


para las cuales el modelo de regresin es:
y4j

= 0 + 1 (0) + 2 (0) + 3 (0) + 4j


= 0 + 4j

entonces 0 = 4 = + 4
Por lo tanto,
0
1
2
3

=
=
=
=

4
1 4
2 4
3 4

Diseo de experimentos p. 110/112

Relacin entre Regresin y ANOVA

Entonces, para probar la hiptesis H0 : 1 = 2 = 3 = 4


tendramos que probar H0 : 1 = 2 = 3 = 0, lo cual se puede
hacer con cualquier paquete de cmputo estadstico.
Para el ejemplo de la carne empacada:
tratamiento

x1

x2

x3

7.66

6.98

7.80

5.26

5.44

5.80

7.41

7.33

7.04

3.51

2.91

3.66

0
Diseo de experimentos p. 111/112

Relacin entre Regresin y ANOVA

Si pedimos una regresin y = 0 + 1 x1 + 2 x2 + 3 x3 + y


pedimos una tabla de anlisis de varianza del modelo
yij = + i + ij las dos tablas ANOVA son idnticas.

Diseo de experimentos p. 112/112

You might also like