Professional Documents
Culture Documents
5 Semestre
Asignatura:
Estadstica Inferencial II
Profesor:
Unidad 5
Alumna:
Suponga que tiene inters en un solo factor que tiene a niveles, y que el
experimento se efecta en b bloques. Las observaciones pueden presentarse con
el modelo estadstico lineal
Modelo Estadstico
Valor esperado
Causa de Grados de Suma de Cuadrado de
variacin libertad cuadrados medio cuadrados
medios
Tratamient
os
Bloques
Error
Total
Stefansky (1972) describe un mtodo general para calcular valores crticos del
MRN y provee tablas para el caso de dos vas de clasificacin con una
observacin por celda. Para algunos valores de solamente acotados para
valores crticos pueden ser obtenidos. Esas tablas son reproducidas en Martin
Tablas C- 6a y C- 6b. Las clasificaciones filas y columnas son intercambiables.
Las pruebas analticas para igualdad de varianza dadas por el DCA no son
aplicables a bloques ya que no se tienen estimadores independientes de las
varianzas de los tratamientos. Existen algunos procedimientos, pero quiz el ms
simple es el desarrollado por Han ( . Esta prueba es especialmente para un
DBC y asume:
Los errores son igualmente correlacionados dentro de los bloques, pero son
independientes entre bloques.
Ejemplo
variedades
Loc. 1 2 3 4
1 43.60 24.05 19.47 19.41
2 40.40 21.76 16.61 23.84
3 18.08 14.19 16.69 16.08
4 19.57 18.61 17.78 18.29
5 45.20 29.33 20.19 30.08
6 25.87 25.60 23.31 27.04
7 55.20 38.77 21.15 39.95
8 55.32 34.19 18.56 25.12
9 19.79 21.65 23.31 22.45
10 46.24 31.52 22.48 29.28
11 14.88 15.68 19.79 22.56
12 7.52 4.69 20.53 22.08
13 41.17 32.59 29.25 43.95
33.29 24.05 20.70 26.16
Tratamientos t-1 SC
Bloques b-1 SC
Residual (t-1)(b-1)
Error (t-1)(b-1)-1 SC
No aditividad 1 SC
TOTAL N-1
Acombe (1961) propuso una prueba general que puede ser usada para cualquier
modelo lineal, incluyendo modelos de regresin
Data TRIGO;
Cards;
PROC GLM;
DATA NUEVO;
SET VALIDA;
Y2= PRE*PRE;
Z= RES*Y2;
VAR Z;
PROC ANOVA;
RUN;
Error* 35
No aditividad 1 SC
TOTAL 51 6251.6
Donde
La hiptesis a probar es
Tratamientos
Bloques A B C
1 4 7 4
2 4 4 4
3 2 5 2
Los valores de los residuos del diseo aleatorizado por bloques completos se
obtienen, como es usual, por la diferencia entre los valores observados y los
estimados
El anlisis de varianza del modelo supone que las observaciones estn
distribuidas de manera normal e independiente, con la misma varianza para cada
tratamiento o nivel del factor. Estas suposiciones deben verificarse mediante el
anlisis de los residuos.
La suposicin de normalidad puede verificarse mediante la construccin de una
grfica de probabilidad normal de los residuos. Para esto, los residuos se agrupan
en una tabla de distribucin de frecuencias, se calcula la frecuencia relativa
acumulada para cada valor y se grafican en una hoja de papel de probabilidad
normal. Si la suposicin es vlida los puntos tendern a agruparse sobre una lnea
recta que pasa por el punto medio.
yij = + i + j + ij
i = kl = k + l + kl
Tratamiento = factor A + factor B + interaccin AB
i k l
1 11
2 12
3 13
.. .. ..
t K L
Suponga un diseo con dos factores: A con a niveles y B con b niveles, en diseo
completamente al azar. (Factorial a b completo, balanceado, efectos jos)
yijk = + i + j + ij + ijk
i = 1,. . ., a j = 1, . . ., b k = 1, . . ., n
H01 :ij = 0 i, j
H02 :i + i. = 0 i
H03 : j + .j = 0 j
Material 15 70 125
1 130 155 34 40 20 70
74 180 80 75 82 58
Suponga un experimento con dos factores A con a niveles y B con b niveles y una
sola repeticin en cada celda (tratamiento).
A a1 2 + b2
B b1 2 + a2b
AB (a 1)(b 1) 2 + 2ab
Error 0 2
Total ab 1
2 no se puede estimar, por lo tanto no hay prueba para los efectos principales a
menos que no haya interaccin, y entonces el modelo es
yij = + i + j + ij
A con a niveles
B con b niveles
..............
Tres factores
i = 1,. . ., a; j = 1, . . ., b; k = 1, . . ., c; l = 1, . . ., n
Ejemplo:
En otras palabras, cada tratamiento no ocurre en cada bloque. Existen dos formas
generales de resolver el problema de los valores faltantes. La primera es un
anlisis aproximado en el que se estima la observacin faltante. A continuacin se
efecta el anlisis de varianza usual como si la observacin estimada fuera un
dato real, disminuyendo los grados de libertad del error en uno. La segunda es un
anlisis exacto usando la prueba de significancia de regresin general.
40 52 20 30
A 21
2 2
Factor B
B1 B2
A1 20 40
Factor A
A2 50 12
A = 50 - 20 = 30
A = 12 - 40 = 28
Puede observarse que existe una interaccin entre los factores A y B porque el
efecto de A depende del nivel elegido de B.
Estas ideas pueden ilustrarse grficamente. En la Fig. 1 se muestra una grfica de
la respuesta de los datos de la Tabla 1 contra los niveles del factor A para ambos
niveles del factor B. Se observa que las rectas B1 y B2 son, aproximadamente,
paralelas. Esto indica que no hay interaccin entre los factores. De manera similar,
en la Fig. 2 se presenta una grfica de la respuesta de los datos de la Tabla 2.
60
B2
50
B1
Respuesta
40
30 B2
20
B1
10
A1 A2
Factor A
En este caso se ve que las rectas B1 y B2 no son paralelas. Esto muestra que
existe una interaccin entre A y B. Sin embargo, no debe ser la nica tcnica para
analizar los datos, porque su interpretacin es subjetiva y su apariencia, a
menudo, es engaosa.
60 B1
50
B2
Respuesta
40
30
20
B1
10 B2
A1 A2
Factor A
Hay que notar que cuando una interaccin es grande los correspondientes efectos
principales tienen poco significado prctico. Una estimacin del efecto principal de
A de los datos de la Tabla 2 es:
50 12 20 40
A 1
2 2
El cual resulta ser muy pequeo corrindose el riesgo de concluir que no existe un
efecto debido a A. Sin embargo, cuando se examin el efecto de A en niveles
diferentes de B se concluy que ste no era el caso. El factor A tiene un efecto,
pero depende del nivel del factor B. En otras palabras, es ms til conocer la
interaccin AB que el efecto principal. Una interaccin significativa oculta a
menudo el significado de los efectos principales.
A1 A1B1 A1B2
Factor A
A2 A2B1 12
Combinacin de Replica
A baja, B baja 28 25 27 80
A alta, B alta 31 30 29 90
As
Cantidad de catalizador B
Alto (2 sacos) +
bajo (1 saco) -
(1) = 80(28+25+27) a = 100(36+32+32)
- +
bajo (15%) alto (20%)
Concentracion de reactivo A
ab a b (1) ab b - a (1)
1 1
B
2n 2n
Por otro lado se puede definir AB como la diferencia promedio entre el efecto de B
en el nivel superior de A y el efecto de B en el nivel inferior de A.
Las formulas para los efectos de A, B y AB pueden deducirse por otro mtodo. El
efecto de A puede hallarse como la diferencia en la respuesta promedio de las dos
combinaciones de tratamiento en la mitad derecha (que llamaremos Y A+, puesto
que es la respuesta promedio para las combinaciones de tratamientos a las que A
que se encuentra en el nivel alto) y las dos combinaciones de tratamientos en la
mitad izquierda (o Y A). Esto es,
A YA YA
ab a b (1)
2n 2n
1
ab a b (1)
2n
B YB YB
ab b a (1)
2n 2n
1
ab b a (1)
2n
ab (1) a b
AB
2n 2n
1
ab (1) a b
2n
Con los datos que aparecen en la figura 1, las estimaciones de los efectos
promedio son:
90 100 60 80 8.33
1
A
2(3)
90 60 100 80
1
B 5.00
2(3)
90 80 100 60 1.67
1
AB
2(3)
ContrasteA ab a b (1)
SSc 1
aci yi .2 na
a ci
2
.
SSB
ab b a (1)2
n * 4
SSAB
ab (1) a b 2
n * 4
Con los datos de la figura 1, las sumas de cuadrados se pueden calcular aplicando
las ecuaciones anteriores, obtenindose:
2
50
SSA 208.33
4(3)
2
30
SSB 75.00
4(3)
2
10
SSAB 8.33
4(3)
2
2 Y ...
SST i2 2 n
1 j1 k 1 Y ijk
4n
2
2 2 3 2 Y
SS E Yi jk 9398.00 9075.00 323.00
i 1j 1k 1 4(3)
SS E SS T SS A SS B SS AB
Efectos (1) a b Ab
A: -1 +1 -1 +1
B: -1 -1 +1 +1
AB: +1 -1 -1 +1
Fuente de
variacin SS G.L. MS Fo
Total 323.00 11
a
significativo al 1%
Signos algebraicos para calcular los efectos en un diseo 22
Combinacin
Efecto Factorial
De
Tratamientos I A B AB
(1) + - - +
a + + - -
b + - + -
ab + + + +
Observe que los coeficientes de los contrastes usados para estimar la interaccin
son iguales al producto de los coeficientes correspondientes a los dos efectos
principales. Los coeficientes de los contrastes siempre son +1 o 1 y se puede
usar una tabla de signos positivos y negativos como la mostrada en la de signos
algebraicos para determinar el signo apropiado de cada combinacin de
tratamientos. En el encabezado de las columnas de tabla y se encuentran los
efectos principales (A y B), la interaccin AB, e I, que representa el total el total o
el promedio de todo el experimento. Se observa que la columna encabezada por I
se compone de solo de signos positivos. Los renglones corresponden a las
combinaciones de tratamientos.
ab b a ab a
1 1
A (1) b (1)
2n 2n
Los tipos ms sencillos de diseos factoriales implican slo dos factores o
conjuntos de tratamientos. Haya a niveles del factor A y b niveles del factor
B,dispuestos en un diseo factorial; esto es, cada A repeticin o rplica del
experimento contiene todas las combinaciones de tratamiento ab. En general, hay
nrepeticiones.
= la media general
Si consideramos una tabla de doble entrada donde las las y las columnas
representan cada uno de los dos factores de bloque y las celdillas los niveles del
factor principal o tratamientos, el requerimiento anterior supone que cada
tratamiento debe aparecer una vez y slo una en cada la y en cada columna.
Se parte de una primera Fila con las letras latinas ordenadas alfabticamente
Fila 1 A B C K
ABCD
BADC
CDAB
DCBA
BADC
CDAB
ABCD
DCBA
CDBA
BACD
DCAB
ABDC
Por ltimo, se asignan al azar las las, las columnas y las letras latinas a los tres
factores. Por ejemplo, supongamos que las las, las columnas y las letras se
asignan, respectivamente, a los tipos de insecticidas, semillas y abonos, de tal
forma que el diseo resultante es
Table 5-1.
Semillas
Insecticidess1 s2 s3 s4
i1 a3 a4 a2 a1
i2 a2 a1 a3 a4
i3 a4 a3 a1 a2
i4 a1 a2 a4 a3
Por convenio, se suele situar el factor principal, en este caso el tipo de semilla, en
las
Tabla 5-2.
Abonos
Insecticidas a1 a2 a3 a4
i1 s4 s3 s1 s2
i2 s2 s1 s3 s4
i3 s3 s4 s2 s1
i4 s1 s2 s4 s3
En resumen, podemos decir que un diseo en cuadrado latino tiene las siguientes
caractersticas:
En donde:
= La media general
l= Es el efecto de la columna l
Slo dos de los cuatro subndices son necesarios para identificar completamente
cualquier observacin.
En el Apndice C se muestra una tabla de cuadrados latinos que dan lugar, por
superposicin de dos de ellos, a cuadrados greco-latinos. Notamos que no es
posible formar cuadrados greco-latinos de orden 6. La Tabla 5-8 ilustra un
cuadrado greco-latino para K = 4
Tabla 5-8.
Cuadrado greco-latino
ABCD
DCBA
BADC
CDAB
yij(hp) = + i + j + h + p + ij(hp)
i = 1, 2 . . . , K
j = 1, 2 . . . , K
h = 1, 2 . . . , K
p = 1, 2 . . . , K , (8.1)
Donde
es un efecto constante, comn a todas las unidades. i es el efecto producido
por el i-simo nivel del factor la. Dichos efectos estn sujetos a la restriccin
ii = 0.
j es el efecto producido por el j-simo nivel del factor columna. Dichos efectos
estn sujetos a la restriccin
jj = 0.
h es el efecto producido por el h-simo nivel del factor letra latina. Dichos efectos
estn sujetos a la restriccin
hh = 0.
p es el efecto producido por el p-simo nivel del factor letra griega. Dichos
efectos estn sujetos a la restriccin
p p = 0.
La notacin yij(hp) indica que los niveles i y j determinan los niveles h y p para un
cuadrado greco-latino especicado. Es decir, los subndices h y p toman valores
que dependen de la celdilla (i, j).