Professional Documents
Culture Documents
=
=
|
|
.
|
\
|
=
k
k
2
1 i
2
i
2
1 i
i i
C
c n
y c
SC la cual tiene 1 grado de libertad
Diseo Experimental
Prof.: Mara Rosa Chillemi
44
En los diseos 2
k
, los y
i
son los trminos de la notacin de Yates. En 2
2
los y
i
son:
ab y b y a y ) 1 ( y
4 3 2 1
= = = =
Los c
i
representan los niveles de los factores: (+1) (-1)
En el 2
2
: Contraste A = | | ) 1 )( 1 ( b ) 1 ( ab . 1 a . 1 + + + c
1
=1; c
2
=1; c
3
=-1; c
4
=-1
Contraste B = | | ) 1 )( 1 ( a ) 1 ( ab . 1 b . 1 + + +
Contraste AB =| | b ) 1 ( a ) 1 ( ) 1 .( 1 ab . 1 + + +
Una forma prctica de calcular contrastes es mediante el auxilio de tabla de signos. Esta se
construye a partir de la matriz diseo:
-
+
-
+
-
-
+
+
A B AB
+
-
-
+
(1)
a
b
ab
Combinacin (Yates)
Esta columna se obtiene multiplicando las columnas A x B
Contraste A: columna A x columna Yates
Contraste B: columna B x columna Yates
Contraste AB: columna AB x columna Yates
Los efectos se calculan dividiendo los contrastes en la mitad de las observaciones:
1 k
k
2 n
2
2 n
= .
Para un 2
2
efecto=contraste/2n
Se prueban las siguientes hiptesis, para modelos de efectos fijos:
Ho: Efecto A= 0 H1: Efecto A=0
Ho: Efecto B= 0 H1: Efecto B=0
Ho: Efecto AB= 0 H1: Efecto AB=0
Para realizar El anlisis de varianza Es necesario calcular las sumas de cuadrados que corresponden
a los efectos A, B, y AB. Aplicando las frmulas de las sumas de cuadrados:
SC
A
=
| |
2
2
2 n
b ) 1 ( ab a +
SC
B
=
| |
2
2
2 n
a ) 1 ( ab b +
SC
AB
=
| |
2
2
2 n
b a ) 1 ( ab +
Cada una con 1 grado de libertad ya que cada factor tiene 2 niveles. La suma de cuadrados totales
es:
= = =
- - -
=
n
1 k
2
1 j
2
1 i
2
2
2
ijk
2 n
y
y SCT con (n2
2
-1) grados de libertad.
La suma de cuadrados del error:
SCerror=SCT-SCA-SCB-SCAB con n2
2
-1-3=4(n-1) grados de libertad.
La Tabla ANOVA es:
Diseo Experimental
Prof.: Mara Rosa Chillemi
45
ANOVA
Fuente Suma de
cuadrados
Grados de libertad Cuadrado medio Fo p-value
Efecto A SCA 1 CMA CMA/CME P(F>FoA)
Efecto B SCB 1 CMB CMB/CME P(F>FoB)
Efecto AB SCAB 1 CMAB CMAB/CME P(F>FoAB)
Error SCE 4(n-1) CME
Total SCT 4n-1
Con el anlisis de varianza se sabe cual efecto es significativo sobre la variable respuesta. Se
aconseja graficar los efectos activos e interpretar y convertir esta interpretacin en conocimiento
sobre el proceso. Para determinar las mejores condiciones de operacin, utilizar slo los efectos
activos segn el ANOVA. El mejor nivel de operacin de los factores que resultan no significativos
se determina con base en el criterio de economa y/o productividad; otro criterio puede ser su
posible impacto en la variabilidad de la respuesta, y en ese caso se elige el nivel donde la
variabilidad es menor.
En un 80 % o ms de los experimentos se obtiene alguna mejora en el proceso, y es posible que
con lo aprendido en un primer estudio, ms nuevos experimentos que se planteen en el futuro, se
logre llevar el proceso a condiciones de operacin ptimas. En el ejemplo, el ANOVA resultante
fue:
ANOVA
Fuente Suma de Cuadrados Gl Cuadrado Medio Razn-F Valor-P
EFECTOS PRINCIPALES
A 208,333 1 208,333 53,19 0,0001
B 75,0 1 75,0 19,15 0,0024
INTERACCIONES
AB 8,33333 1 8,33333 2,13 0,1828
RESIDUOS 31,3333 8 3,91667
TOTAL (CORREGIDO) 323,0 11
El tratamiento ganador luego de realizar las pruebas de rangos mltiples y con ayuda de los
grficos correspondientes es:
Factor A: nivel alto ( 25%) Factor B: nivel bajo( 1 saco)
ANLISIS DE REGRESIN
Es fcil calcular los residuos de un diseo 2
k
por medio de un modelo de regresin. Para el
proceso del ejemplo el modelo es:
ij j i ij
y c + | + t + =
Tambin puede escribirse como: c + | + | + | =
2 2 1 1 0
X X y donde X
1
es la variable codificada que
representa al factor A, , X
2
al factor B y
j
| los coeficientes de regresin.
=
bajo nivel el en est factor el i s 1
alto nivel el en est factor el si 1
X
i
La relacin entre variables naturales y las codificadas est dada por:
X =
Variable original - valor medio
1
2
Rango
Valor Medio =
Valor Mayor + Valor Menor
2
Rango =
Valor Mayor - Valor Menor
2
1
2
As para el factor A y el B del ejemplo:
Diseo Experimental
Prof.: Mara Rosa Chillemi
46
( )
( )
( )
( ) 2 / 1 2
2 / 2 1 original . v
X
2 / 15 25
2 / 25 15 original . v
X
B A
+
=
+
=
Los estimadores de los coeficientes son:
- - -
= = | Y
0
2
EfB
2
EfA
2 1
= | = |
Entonces el modelo de regresin ajustado es:
2 1
X
2
) 5 (
X
2
33 , 8
5 , 27 y
+ + =
Se divide en 2 los efectos porque el coeficiente de regresin mide el efecto de un cambio unitario
en X sobre la media de y, en cambio la estimacin del efecto se basa en un cambio de dos
unidades (de -1 a 1).
Este modelo puede utilizarse para generar los valores predichos de y en los cuatro puntos del
diseo.
El grado de credibilidad en la prediccin obtenida, depende de la calidad del modelo ajustado. Para
medir la calidad del ajuste se utiliza el coeficiente de determinacin R
2
.
Coeficiente de determinacin R
2
y
R
2
ajustado
Estos coeficientes se utilizan para medir la calidad global del modelo de regresin mltiple,
definidos como:
100 x
CMTotal
CMError CMTotal
R
100 x
SCTotal
SCModelo
100 x
SCTotal
SCError SCTotal
R
2
ajustado
2
=
=
=
Estos coeficientes comparan la variabilidad explicada por el modelo contra la variacin total. Se
cumple que 100 R R 0
2 2
ajustado
s s s y cuantifican el porcentaje de variabilidad presente en los datos
que es explicada por el modelo( es deseable que sea prximo al 100%)
Se recomienda en general un coeficiente de determinacin ajustados R
2
aj
de al menos 70%.
Cuando hay muchos factores se recomienda usar R
2
aj
en lugar de R
2
, ya que este ltimo es
engaoso al incrementarse de manera artificial con cada trmino que se agrega al modelo, aunque
sea un trmino que no contribuya en nada a la explicacin de la respuesta. En cambio R
2
aj
incluso
baja cuando el trmino que se agrega no aporta nada. En caso en que R
2
aj
R
2
sean pequeos, esto
indicara que el efecto o variabilidad atribuible a los factores estudiados es pequeo comparado
con el resto de la variacin observada en el experimento y esto puede deberse a:
- Los factores estudiados por s solos no tienen lo suficiente influencia para explicar las
variaciones observadas en la variable respuesta.
- Los niveles de los factores estudiados son muy estrechos, por lo que el efecto sobre la
variable respuesta al cambiar de un nivel a otro es demasiado pequeo.
- Otros factores no estudiados en el experimento no se mantuvieron suficientemente fijos,
por lo que al tener variaciones durante el experimento causaron mucha variacin
experimental.
Diseo Experimental
Prof.: Mara Rosa Chillemi
47
- Los errores experimentales y errores de medicin fueron altos.
Al analizarlas razones que influyeron en los valores bajos de R
2
aj
R
2
no debe desecharse el
experimento y creer que no sirvi. Este servir para plantear nuevas conjeturas y nuevos
estudios experimentales.
En el ejemplo, R
2
aj
=89,4% lo que indica que el modelo completo es un buen ajuste.
Predicciones sobre el mejor tratamiento:
Es til predecir al valor esperado de la caracterstica de inters sobre el mejor tratamiento. Con
esta informacin se puede convencer a la gerencia sobre la conveniencia de realizar los cambios
que se recomiendan a partir del estudio realizado. Tambin se puede obtener un rango o intervalo
de confianza dentro del cual se espera caigan las mediciones individuales futuras de la respuesta
sobre el tratamiento ganador.
La respuesta predicha y en un punto dado es un estimador de la respuesta promedio en dicho
punto y es una variable aleatoria, por lo tanto puede construirse su intervalo de confianza.
Los intervalos de confianza son:
1- Para la respuesta promedio sobre un punto X
1
o
= (1, x
0
,, x
0k
)
( ) ( )
0
1
' '
0
2
p N ,
2
0
X X X X t y
o
o
Donde:
p: nmero de trminos en el modelo ajustado contando tambin el trmino
independiente
0
| .
N: total de datos experimentales
X: Matriz diseo de los coeficientes incluidos en el diseo( cada efecto y las interacciones)
aumentada con una columna (la 1
ra
) de 1.
(Para un 2
2
)
2
o = CME
2- Para mediciones individuales futuras sobre el mejor tratamiento:
( ) ( )
0
1
' '
0
2
p N ,
2
0
X X X X 1 t y
o
+ o
El intervalo en el caso 1 se llama intervalo de confianza para la respuesta promedio y el del
caso 2 se denomina intervalo de prediccin para una repuesta individual.
En el ejemplo, suponiendo que tiene sentido el modelo encontrado:
y = 27,5 + 4,16667*X
1
- 2,5*X
2
+ 0,833333X
1
X
2
Los intervalos, estos son:
Diseo Experimental
Prof.: Mara Rosa Chillemi
48
Observados Ajustados Inferior 95,0% Superior 95,0% Inferior 95,0% Superior 95,0%
Fila Valores Valores para Pronstico para Pronstico para Media para Media
1 28,0 27,4167 21,3198 33,5135 23,8966 30,9367
2 36,0 34,0833 27,9865 40,1802 30,5633 37,6034
3 18,0 20,75 14,6531 26,8469 17,23 24,27
4 31,0 30,75 24,6531 36,8469 27,23 34,27
5 25,0 25,6667 19,5698 31,7635 22,1466 29,1867
6 32,0 32,3333 26,2365 38,4302 28,8133 35,8534
7 19,0 19,0 12,9031 25,0969 15,48 22,52
8 30,0 29,0 22,9031 35,0969 25,48 32,52
9 27,0 26,9167 20,8198 33,0135 23,3966 30,4367
10 32,0 33,5833 27,4865 39,6802 30,0633 37,1034
11 23,0 20,25 14,1531 26,3469 16,73 23,77
12 29,0 30,25 24,1531 36,3469 26,73 33,77
Anlisis de Residuos:
El residuo es: e
ijk
= y
observado
y
predicho
=
ijk ijk
y y
El anlisis residual se debe realizar para analizar si se cumplen los supuestos de: normalidad,
varianza constante y de independencia.
Grfico de Probabilidad Normal para Residuos
-2,8 -1,8 -0,8 0,2 1,2 2,2 3,2
residuos
0,1
1
5
20
50
80
95
99
99,9
p
o
r
c
e
n
t
a
j
e
Grfica de Residuos para Col_4
18 21 24 27 30 33 36
predichos
-2,8
-1,8
-0,8
0,2
1,2
2,2
3,2
r
e
s
i
d
u
o
Grfica de Residuos para Col_4
0 2 4 6 8 10 12
nmero de corrida
-2,8
-1,8
-0,8
0,2
1,2
2,2
3,2
r
e
s
i
d
u
o
Diseo 2
3
Este diseo tiene 3 factores a 2 niveles cada uno y se puede representar las ocho combinaciones
mediante un cubo.
Matriz Diseo:
Con este diseo se pueden estudiar 2
3
-1= 7 efectos, tres efectos principales: A, B. C, tres
interacciones dobles: AB, AC, BC y una interaccin triple: ABC.
En general las interacciones de mayor orden(de 3 o ms) generalmente no influyen de manera
significativa y cuando esto ocurre son difciles de reproducir en la prctica.
Las columnas de los efectos de interaccin se calculan multiplicando las columnas
correspondientes.
Atencin: No confundir los trminos, por ejemplo: a; efecto A y factor A
a: total o suma de mediciones y hechas en el tratamiento donde A est presente con nivel alto t B
y C con nivel bajo, es decir: (1, -1, -1)
Efecto A: diferencia entre la respuesta media de y en el nivel alto de A con la media de y en el
nivel bajo de A.
Diseo Experimental
Prof.: Mara Rosa Chillemi
49
Factor A: uno de los factores que se estudia en el experimento.
Multiplicando las columnas de signos de la tabla de la matriz diseo por la columna de totales
representados por la notacin de Yates, se obtienen los contrastes:
( )
( )
( )
( )
( )
( )
( ) ab a b ) 1 ( c ac bc abc ABC
a ac ab ) 1 ( abc c b bc BC
b ab bc ) 1 ( abc a c ac AC
c ac bc ) 1 ( abc a b ab AB
ab b a ) 1 ( abc bc ac c C
ac c a ) 1 ( abc bc ab b B
bc c b ) 1 ( abc ac ab a A
+ + + =
+ + + =
+ + + =
+ + + =
+ + + =
+ + + =
+ + + =
Si se hacen n rplicas de cada tratamiento, los efectos de un diseo 2
3
se estiman dividiendo los
contrastes por n 2
1 k
, o sea:
( )
k
2
k
k
2 n
contraste
SC
: decir es , n 2 en dividido contraste del cuadrado el es cuadrados de suma La
1 2 n
contraste
Efecto
=
=
La suma de cuadrados del error se obtiene por sustraccin entre la suma de cuadrados total y la
suma de cuadrados de los efectos activos. La tabla ANOVA resultante tiene la forma:
Fuente SC gl CM F Hiptesis
A SCA 1 CMA CMA/CME Ho: efecto A=0
B SCB 1 CMB CMB/CME Ho: efecto B=0
AB SCAB 1 CMAB CMAB/CME Ho: efecto AB=0
C SCC 1 CMC CMC/CME Ho: efecto C=0
AC SCAC 1 CMAC CMAC/CME Ho: efectoAC=0
BC SCBC 1 CMBC CMBC/CME Ho: efecto BC=0
ABC SCABC 1 CMABC CMABC/CME Ho: efecto ABC=0
Error SCE 2
3
(n-1) CME
Total SCT n2
3
-1
Si se incluyen el total de efectos ser necesario realizar cuando menos dos rplicas del
experimento para poder estimar la suma de cuadrados del error. Se recomienda al menos dos
replicas para que hayan suficientes grados de libertad para el error (al menos 8 grados).
En la mayora de los casos es til estudiar los efectos principales y las intersecciones dobles.
Cuando k>4 no es estrictamente necesario realizar rplicas porque se puede construir la suma de
cuadrados del error en forma aproximada, utilizando las sumas de cuadrados de las interacciones
triples o de mayor orden.
Cuando se emplea un diseo 2
k
, se supone que la respuesta es aproximadamente lineal en el rango
de variacin de cada uno de los factores estudiados.
Dado que cada factor se prueba a 2 niveles, no e posible estudiar efecto de curvatura (efectos
tipo A
2
, B
2
,). Se pueden agregar repeticiones en el centro(al menos 3) y con ella detectar la
presencia se curvatura. Si esto sucede, se deber aumentar el diseo.
Diseo Factorial General 2
K
:
Al aumentar el nmero de factores en el diseo 2
K
crece el nmero de tratamientos y el nmero
de corridas experimentales. Una sola replica del factorial 2
K
es una estrategia adecuada cuando se
Diseo Experimental
Prof.: Mara Rosa Chillemi
50
tienen 4 o ms factores. Las interacciones de alto orden (> 2) pueden utilizarse para estimar el
error que permita construir un ANOVA aproximado. Antes de ello, conviene ayudarse de los
grficos para decidir que interaccin no es significativa y enviarla al error.
Se consideran k factores con 2 niveles cada uno. Hay 2
k
tratamientos o puntos en el diseo. Las k
columnas y 2
k
renglones que componen la matriz para este diseo, considerando una rplica, se
pueden construir de la siguiente forma. En la primer columna correspondiente al factor A se
alternan signos - ; + hasta llegar a los 2
k
renglones (comenzando con -). En la segunda columna se
alternan dos signos con dos signos+; en la tercer cuatro y cuatro +; en la k-sima columna 2
k-1
signos y 2
k-1
signos +.
Familia de Diseos Factoriales 2
K
(k 5)
Con el diseo 2
k
completo se pueden estudiar: k
1
k
=
|
|
.
|
\
|
efectos principales;
2
) 1 k ( k
2
k
=
|
|
.
|
\
|
interacciones dobles;
)! 3 k ( ! 3
! k
3
k
=
|
|
.
|
\
|
interacciones triples;, 1
k
k
=
|
|
.
|
\
|
interacciones de los k
factores.
Los efectos se calculan a partir de los contrastes que a su vez se obtienen construyendo la tabla de
signos del diseo. Las columnas de las interacciones se calculan multiplicando las columnas que
corresponden a los efectos. Por ejemplo para calcular AB se multiplican las columnas AxB
Diseo Experimental
Prof.: Mara Rosa Chillemi
51
Anlisis del experimento
El diagrama de Pareto sin estandarizar representa una forma prctica de ver cules efectos son los
ms grandes en cuanto a su magnitud. El diagrama no presupone distribucin alguna.
Una vez calculados los efectos, estos pueden graficarse en un diagrama de Pareto para as
visualizar cules efectos tienen mayor impacto sobre la variable respuesta. El diagrama de Pareto
estandarizado representa lo efectos divididos en su error estndar.
2 k
efecto
2
2 n
CME
= o
Esto se deduce de:
CME Adems
2 n 2 n
2
2 n 2 n
) y ( ) y ( ) efecto (
y y Efecto
2
2 k
2
1 k
2
1 k
2
1 k
2
2 2 2
= o
o
=
o
=
o
+
o
=
o + o = o
=
- - +
- - +
En el diagrama de Pareto se grafican los efectos estimados estandarizados:
2 k
2 n
CME
Efecto
Estos efectos estandarizados se usan para probar las hiptesis:
Ho: Efecto=0 vs. H1: Efecto =0
El estadstico de prueba es
2 k
2 n
CME
0 efecto
t