You are on page 1of 30

Captulo 5

Diseo de bloques
3.1. Diseos en bloques completos al azar. 3.2. Diseo en cuadrado latino. 3.3. Diseo en cuadrado grecolatino. 3.4. Uso de un software estadstico.

Competencias a desarrollar
Identificar las caractersticas generales y los usos que se le dan a los diseos en bloques. Explicar la definicin del diseo en bloques completos al azar, as como su hiptesis, modelo estadstico y anlisis de varianza. Describir la seleccin y la aleatorizacin del diseo en cuadro latino y su diferencia con el diseo en cuadro grecolatino

3. 1. Diseos en bloques completos al azar.


Cuando se quieren comparar ciertos tratamientos o estudiar el efecto de un factor, es deseable que las posibles diferencias se deban principalmente al factor de inters y no a otros factores que no se consideran en el estudio. Cuando esto no ocurre y existen otros factores que no se controlan o nulifican para hacer la comparacin, las conclusiones podran ser afectadas sensiblemente. Por ejemplo, supongamos que se quieren comparar varias mquinas, si cada mquina es manejada por un operador diferente y se sabe que ste tiene una influencia en el resultado, entonces es claro que el factor operador debe tomarse en cuenta si se quiere comparar a las mquinas de manera justa. Un operador ms hbil puede hacer ver a su mquina (aunque sta sea la peor) como la que tiene el mejor desempeo, lo cual impide hacer una comparacin adecuada de los equipos. Para evitar este sesgo hay dos maneras de anular el posible efecto del factor operador: la manera lgica es utilizar el mismo operador en las cuatro maquinas; sin embargo, tal estrategia no siempre es aconsejable, ya que utilizar el mismo sujeto elimina el efecto del factor operador pero restringe la validez de la comparacin con dicho operador, y es posible que el resultado no se mantenga al utilizar a otros operadores. La otra forma de anular el efecto operador en la comparacin consiste en que cada operador trabaje durante el experimento con cada una de las mquinas. Esta estrategia es la ms recomendable, ya que utilizar a todos los operadores con todas las mquinas permite tener resultados de la comparacin que son vlidos para todos los operadores. Esta forma de nulificar el efecto de operadores, recibe el nombre de bloqueo.

Factores de bloque A los factores adicionales al factor de inters que se incorporan de manera explcita en un experimento comparativo se les llama factores de bloque. stos tienen la particularidad de que no se incluyen en el experimento porque interese analizar su efecto, sino como un medio para estudiar de manera adecuada y eficaz al factor de inters.

Los factores de bloque entran al estudio en un nivel de importancia secundaria con respecto al factor de inters y, en este sentido, se puede afirmar que se estudia un solo factor, porque es uno el factor de inters. En un diseo en bloques completos al azar (DBCA) se consideran tres fuentes de variabilidad: El factor de tratamientos El factor de bloque El error aleatorio es decir, se tienen tres posibles culpables de la variabilidad presente en los datos. La palabra completo en el nombre del diseo se debe a que en cada bloque se prueban todos los tratamientos, o sea, los bloques estn completos. La aleatorizacin se hace dentro de cada bloque; por lo tanto, no se realiza de manera total como en el diseo completamente al azar. Los factores de bloqueo que aparecen en la prctica son: Turno, lote, da, tipo de material, lnea de produccin, operador, maquina, mtodo, etc. Supongamos una situacin experimental con k tratamientos y b bloques. El aspecto de los datos para este caso se muestra en la tabla 3.1. Considerando una repeticin en cada combinacin de tratamiento y bloque.
Tabla 3.1 Arreglo de los datos en un diseo en bloques completos al azar

Tratamiento 1 2 3 . k

Bloque . . . .

Modelo estadstico Cuando se decide utilizar un DBCA, el experimentador piensa que cada medicin ser el resultado del efecto del tratamiento donde se encuentre, del efecto del lo que al que pertenece y de cierto error que se espera sea aleatorio. El modelo estadstico para este diseo est dado por: { donde
3

Es la medicin que corresponde al tratamiento y al bloque Es la media global poblacional Es el efecto debido al tratamiento Es el efecto debido al bloque Es el error aleatorio atribuible a la medicin

Hiptesis a probar La hiptesis de inters es la misma para todos los diseos comparativos, y est pada por:

que tambin se puede expresar como

En cualquiera de estas hiptesis la afirmacin a probar es que la respuesta media poblacional lograda con cada tratamiento es la misma para los tratamientos y que, por lo tanto, cada respuesta media es igual a la media global poblacional . De manera alternativa, es posible afirmar que todos los efectos de tratamiento sobre la variable de respuesta son nulos, porque cuando el efecto , entonces necesariamente la respuesta media del tratamiento es igual a la media global ( ).

Anlisis de varianza La hiptesis dada se prueba con un anlisis de varianza con dos criterios de clasificacin, porque se controlan dos fuentes de variacin: el factor de tratamientos y el factor de bloque. En la tabla 3.2 se muestra el aspecto del ANOVA para diseo DBCA.

Tabla 3.2 ANOVA para un diseo en bloques completos al azar


Fuentes de variabilidad Tratamientos Suma de cuadrados SCTRAT SCB Grado de libertad K1 b1 Cuadrado medio CMTRAT CMB Valor-p

Bloques

Error

SCE SCT

(k 1)(b 1)

CME

Total

N-1

Los clculos necesarios pueden ser manuales, pero siempre es ms prctico hacerlos con un software estadstico, porque adems proporciona muchas otras opciones grficas y tabulares tiles (no slo el ANOVA). Utilizando la notacin de puntos, las frmulas ms prcticas para calcular las sumas de cuadrados son:

y la del error se obtiene por sustraccin como:

Ejemplo En el ejemplo donde se planteo la comparacin de los cuatro mtodos de ensamble, ahora se va a controlar activamente en el experimento a los operadores que realizaran el ensamble, lo que da lugar al siguiente diseo en bloques completamente al azar. Mtodo A B C D 1 6 7 10 10 Operador 2 3 9 7 10 11 16 11 13 11

4 8 8 14 9

Recordemos que la variable de respuesta son los minutos en que se realiza el ensamble. Para comparar los cuatro mtodos se plantea la hiptesis: =

la cual se prueba mediante el anlisis de varianza dado en la siguiente tabla( Excel y Minitab)

Nota: para capturar la tabla en Excel se sombrea totalmente, tal y como est indicada la tabla anterior, en la herramienta de Anlisis de varianza de dos factores con una sola muestra por grupo)
Anlisis de varianza de dos factores con una sola muestra por grupo RESUMEN A B C D Operador Cuenta 4 4 4 4 4 4 4 4 Suma 30 36 51 43 33 48 40 39 Promedio 7,5 9 12,75 10,75 8,25 12 10 9,75 Varianza 1,66666667 3,33333333 7,58333333 2,91666667 4,25 10 4 8,25

ANLISIS DE VARIANZA Origen de las variaciones Filas Columnas Error Total

Suma de cuadrados 61,5 28,5 18 108

Grados de libertad 3 3 9 15

Promedio de los cuadrados 20,5 9,5 2

F 10,25 4,75

Probabilidad 0,002919257 0,029845948

Valor crtico para F 3,862548358 3,862548358

De esta tabla se observa que para los mtodos se obtuvo un valor-p = 0.003 , por lo que se rechaza la de que el tiempo medio poblacional de los mtodos de ensamble son iguales, y se acepta que al menos dos de los mtodos son diferentes en cuanto al tiempo medio que se requiere. De la misma manera para operadores, como su valor-p = 0.030 , el factor de bloque (operadores) tambin afecta, es decir, existen diferencias entre los operadores en cuanto al tiempo promedio.

Resultados arrojados en Minitab 15


ANOVA de dos factores: Dato vs. Mtodo; Operador

Fuente Mtodo Operador Error Total

GL 3 3 9 15

SC 61,5 28,5 18,0 108,0

MC 20,5 9,5 2,0

F 10,25 4,75

P 0,003 0,030

S = 1,414 R-cuad. = 83,33% R-cuad.(ajustado) = 72,22%


6

Calculo manual para Diseo de bloque ANOVA para el diseo bloque


Fuente de variaciones Tratamientos Bloque Error Total

SC

GL

CM

Valor crtico para F

1.- Suma de cuadrados de tratamientos o variabilidad debida a la diferencia entre las marcas de llantas, bloque 1 y bloque 2
) )

2.- Suma total de cuadrados o variabilidad total de los datos )

3.- Suma de cuadrados del error o variabilidad dentro de mtodos de ensamble )


7

4.- Cuadrados medios de tratamientos, del bloque, y del error

5- Estadstico de prueba

Concentrado en tabla ANOVA Suma de Grados de cuadrados libertad 61,5 3 28,5 3 18 9 108 15 Promedio de los cuadrados 20,5 9,5 2 Valor crtico para F 3,8625483 3,8625486

F 10,25 4,75

Comparacin de parejas de medias de tratamiento en el DBCA.


Cuando se rechaza la hiptesis de igualdad de los cuatro tratamientos, es natural preguntarse cules de ellos son diferentes entre s. Para averiguarlo se utiliza alguna de las pruebas que se estudiaron en la seccin Comparaciones o pruebas de rangos mltiples del captulo anterior. Por ejemplo, recordemos que la Diferencia mnima significativa (LSD) para dos tratamientos, en un DCA est dada por

Entonces, en bloque esta expresin se transforma en


8

donde b es el nmero de bloques, que hace las veces de nmero de rplicas, y (k-1)(b-1) son los grados de libertad del De aqu que en el ejemplo de los cuatro mtodos de ensamble tenemos que 2.26 (valor buscado en tablas de T de ) ) = ) ) = estudent) )

Al comparar esta diferencia mnima significativa con los datos se obtiene la siguiente tabla: Diferencia poblacional Diferencia muestral -1.5 2.26 -5.25 2.26 -3.25 2.26 -3.75 2.26 -1.75 2.26 2.00 2.26 Decisin No significativo Significativo Significativo Significativo No significativo No significativo

Ejercicios 1.- En qu situaciones se aplica un diseo en bloques completos al azar? En qu diferentes los factores de tratamiento y de bloque? 2.- Se hace un estudio sobre la efectividad de tres marcas de atomizador para matar moscas. Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el nmero de moscas muertas expresando en porcentajes. Se hicieron seis replicas, pero en das diferentes; por ello, se sospecha que puede haber algn efecto importante debido a esta fuente de variacin. Los datos obtenidos se muestran a continuacin. Marca del atomizador A B C Nmero de replicas (da) 72 65 67 75 62 73 55 59 68 70 53 50 64 74 61 58 51 69

a) b) c) d)

Suponiendo un DBCA, formule las hiptesis adecuadas y el modelo estadstico. Existe diferencia entre la efectividad promedio de los atomizadores? Hay algn atomizador mejor? Argumente su respuesta Hay diferencias significativas en los resultados de diferentes das en que se realiz el experimento? Argumente su respuesta

ANLISIS DE VARIANZA Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crtico para F Filas 296,3333333 2 148,1666667 2,88075178 0,102804418 4,102821015 Columnas 281,3333333 5 56,26666667 1,09397278 0,420717751 3,325834529 Error 514,3333333 10 51,43333333 Total 1092 17

ANOVA de dos factores: datos vs. Spray, replicas Minitab Fuente Spray replicas Error Total a) = a) No existe diferencias entre la efectividad de los spray b) No existe evidencia estadsticas para suponer lo que existe algn spray mejor que el otro c) = En el ANOVA para los diferentes das de los spray se acepta la hiptesis nula de que no importa el da, es decir son iguales 3.- A continuacin se muestran los datos para un diseo en bloque al azar Tratamiento A B C 1 3 7 4
10

GL 2 5 10 17

SC MC 296.33 148.167 281.33 56.267 514.33 51.433 1092.00

F 2.88 1.09

P 0.103 0.421

Bloque 2 3 4 4 2 6 9 3 10 6 3 7

a) Obtenga la tabla de anlisis de varianza y anote los principales conclusiones b) Obtenga la diferencia mnima significativa (LSD) para comparar tratamientos en este diseo en bloque.
Anlisis de varianza de dos factores con una sola muestra por grupo RESUMEN A B C Tratamiento Cuenta 4 4 4 3 3 3 3 Suma 15 29 20 14 19 8 23 Promedio 3,75 7,25 5 4,666666667 6,333333333 2,666666667 7,666666667 Varianza 2,916666667 9,583333333 3,333333333 4,333333333 6,333333333 0,333333333 4,333333333

ANLISIS DE VARIANZA Origen de las variaciones Filas Columnas Error Total Suma de cuadrados 25,16666667 42 5,5 72,66666667 Grados de libertad 2 3 6 11 Promedio de los cuadrados 12,58333333 14 0,916666667 F 13,72727273 15,27272727 Probabilidad 0,005768838 0,003244859 Valor crtico para F 5,14325285 4,757062664

a) valor-p = 0.0057 entre los tratamientos

, por lo que se rechaza la

, es decir existe diferencia

valor-p = 0.0032 , el factor de bloque (tratamientos) tambin afecta, es decir, existen diferencias entre el bloque, por lo que se rechaza la b)
) )= ) ) ) )=

Diferencia poblacional Diferencia muestral -3.5 1.65 -1.25 1.65 2.25 1.65

Decisin Significativo No Significativo Significativo

4.- A continuacin se muestran los datos para un diseo en bloques al azar. Bloque 2 3 4 4 2 6 9 3 10 6 3 7
11

1 A 3 B 7 C 4

a) Obtenga la tabla de anlisis de varianza y anote las principales conclusiones. b) Obtenga la diferencia mnima significativa (LSD) para comparar tratamientos en este diseo en bloques. 5.- En una empresa lechera se tienen varios silos para almacenar leche (cisternas de 60 000 L). Un aspecto crtico para que se conserve la leche es la temperatura de almacenamiento. Se sospecha que en algunos silos hay problemas, por ello, durante cinco das se decide registrar la temperatura a cierta hora crtica. Obviamente la temperatura de un da a otro es una fuente de variabilidad que podra impactar la variabilidad total. Da Silo Lunes Martes Mircoles Jueves Viernes A 4,0 4,0 5,0 0,5 3,0 B 5,0 6,0 2,0 4,0 4,0 C 4,5 4,0 3,5 2,0 3,0 D 2,5 4,0 6,5 4,5 4,0 E 4,0 4,0 3,5 2,0 4,0 a) b) c) d) e) En este problema, cul es el factor de tratamiento u cul el factor de bloque? Suponga un DBCA, formule las hiptesis adecuadas y el modelo estadstico. Hay diferencia entre los silos? La temperatura de un da a otro es diferente? Revise residuos, hay algn problema evidente?

6.- Se diseo un experimento para estudiar el rendimiento de cuatro detergentes. Las siguientes lecturas de blancura se obtuvieron con un equipo especial diseado para 12 cargas de lavado, distribuidas en tres modelos de lavadoras: Detergente Lavadora 1 Lavadora 2 Lavadora 3 A 45 43 51 B 47 44 52 C 50 49 57 D 42 37 49

a) Seale el nombre del diseo experimental utilizado b) Formule la hiptesis que se quiere probar en este problema c) Realice el anlisis estadstico ms apropiado para estos datos y obtenga conclusiones. 7.- Se realizo un experimento para determinar el efecto de cuatro sustancias qumicas diferentes sobre la resistencia de una tela. Estas sustancias qumicas se usan como parte del proceso de acabado del planchado permanente. Se seleccionaron cinco muestras de tela, y se corri un diseo de bloques completos aleatorizados para probar cada tipo de sustancia
12

qumica sobre cada muestra de tela en orden aleatorio. Se probarn las diferencias de las medias utilizadas en el anlisis de varianza con Muestra de tela 1 2 3 4 5 1,3 2,2 1,8 3,9 1,6 2,4 1,7 4,4 0,5 0,4 0,6 2,0 1,2 2,0 1,5 4,1 1,1 1,8 1,3 3,4

Sustancia Qumica 1 2 3 4

a) Seale el nombre del diseo experimental utilizado b) Formule la hiptesis que se quiere probar en este problema c) Realice el anlisis estadstico ms apropiado para estos datos y obtenga conclusiones.

3.2. Diseo en cuadrado latino


En el diseo en cuadro latino (DCL) se controlan dos factores de bloque y se estudia un factor de tratamientos, por lo que se tienen cuatro fuentes de variabilidad que pueden afectar la respuesta observada, stas son: Los tratamientos El factor de bloque I (renglones) El factor de bloque II (columnas) El error aleatorio

Se llama cuadro latino por dos razones: es un cuadro debido a que tiene la restriccin adicional de que los tres factores involucrados se prueban en la misma cantidad de niveles, y es latino porque se utilizan letras latinas para denotar a los tratamientos o niveles del factor de inters. Sean A, B, C, , K, los k tratamientos a comparar, por lo tanto ambos factores de bloques tienen tambin k niveles cada uno. El aspecto de los datos se muestran en la siguiente tabla. Bloque II (columnas) 2 3 B = Y212 C = Y322 D = Y432 . . A = Y1k2
13

1 1 2 Bloque I 3 (renglones) . . k A = Y111 B = Y221 C = Y331 . . K = Ykk1

C = Y313 D = Y423 E = Y533 . . B = Y2k3

K = YK1K A = Y12K B = Y23K . . J = YJkK

Ahora se necesitan al menos tres subndices, por ejemplo, la respuesta Y313 se gener en el tratamiento tres (C), en el primer nivel del factor rengln y en el tercer nivel del factor columna. El modelo estadstico para describir el comportamiento de las observaciones est dado por

donde es la observacin del tratamiento , en el nivel , del factor rengln y en el nivel del factor columna; es el error atribuible a dicha observacin. De acuerdo con este modelo, la variabilidad total presente en los datos se puede descomponer como

y los grados de libertad correspondientes son ) ) ) ) )

El ANOVA para el diseo en cuadro latino se muestra en la tabla 3.4. En l se prueba la hiptesis sobre los efectos de tratamiento del factor rengln y del factor columna. Otra vez, la hiptesis fundamental es la de los tratamientos; las otras dos proporcionan un adicional al objetivo inicial y permiten comprobar la relevancia de controlar los factores de bloque. Tabla 3.4 ANOVA para el cuadro latino Fuentes de variabilidad Tratamientos Suma de Grado de cuadrados libertad SCTRAT SCB1 k1 k1 Cuadrado medio CMTRAT CMB1 Valor-p

Renglones

Columnas Error Total

SCB2 SCE SCT

k1 (k 2)(k 1) k2 - 1

CMB2 CME

14

Seleccin y aleatorizacin de un cuadro latino. No cualquier arreglo de letras latinas en forma de cuadro es cuadro latino, la regla fundamental es que cada letra debe aparecer slo una vez en cada rengln y en cada columna. Un cuadro latino estndar es aquel en el que en la primera columna y en el primer rengln aparecen las letras en orden alfabtico. Por ejemplo, un cuadro latino estndar de tamao cuatro est dado por: ABCD BCDA CDAB DABC
Existen adems los siguientes tres cuadros latinos de dimensin cuatro:

ABCD BADC CDBA DCAB

ABCD By DAC CADB DCBA

ABCD BADC CDAB DCBA

Para cuatro tratamientos se pueden construir un total de 576 cuadros latinos de los cuales cuatro son estndar. La seleccin del diseo debera ser elegir uno al azar de los 576 posibles; no obstante, es prcticamente imposible construirlos a todos para seleccionar uno al azar. Sin embargo, ocurre que dado un cuadro latino, cualquier intercambio de columnas o de renglones es tambin cuadro latino, por eso la estrategia de seleccin y aleatorizacin recomendada en la prctica es la siguiente: Se construye el cuadro latino estndar ms sencillo. Se aleatoriza el orden de los renglones (o columnas) y posteriormente se aleatoriza el orden de las columnas (o renglones). Por ltimo, los tratamientos a comparar se asignan en forma aleatoria a las letras latinas.

El cuadro latino tiene dos restricciones a la aleatorizacin debido a los dos factores de bloque, lo que implica que a la hora de correr el experimento no hay ningn margen de aleatorizacin. Es decir, se puede correr por columna o por rengln segn convenga. Lo que no es correcto es hacer todas las pruebas de un tratamiento, y luego todas las de otro, y as sucesivamente, puesto que se puede introducir ruido adicional debido a factores no controlables que cambian con el tiempo.

Ejemplo. Comparacin de cuatro marcas de llantas. Una compaa de mensajera est interesada en determinar cul marca de llantas tiene mayor duracin en trminos del desgaste. Para ello se planea un experimento en cuadro latino, en el que se comparan las cuatro marcas de llantas sometindolas a una prueba de 32 000 kilmetros de recorrido, utilizando cuatro diferentes tipos de auto y las cuatro posiciones posibles de las llantas en el auto. As, el
15

factor de inters es el tipo de llantas o marca, y se controlan dos factores de bloque: el tipo de carro y la posicin de la llanta en el auto. Estos factores de bloque se controlan ya que, por experiencia, se sabe que el tipo de carro y la posicin de la llanta tiene efecto en el desgaste de la misma. La eleccin del cuadro latino a utilizar se hace antes de obtener los datos. Para ello, a partir de un cuadro latino inicial se aleatorizan las columnas y los renglones; despus, las diferentes marcas de llantas se asignan de manera aleatoria a las letras latinas que denotan los niveles del factor de inters

Posicin 1 2 3 4 1 C = 12 B = 14 A = 17 D = 13

Carro 2 3 D = 11 A = 13 C = 12 D = 11 B = 14 C = 10 A = 14 B = 13

4 B=8 A=3 D=9 C=9

Las pruebas se hacen al mismo tiempo con choferes, a quienes se les instruye para que manejen de manera similar sobre el mismo terreno para los cuatro automviles. Al hacer las pruebas de los cuatro autos al mismo tiempo se evita el efecto del ambiente en el desgaste; asimismo, el conductor y el tipo de terreno podran influir, pero se considera suficiente mantenerlos lo ms homogneo posible durante el experimento. El diseo y los datos observados se muestran en la tabla anterior. Se mide la diferencia mxima entre el grosor de la llanta nueva y el grosor de la llanta despus de recorrido los 32 000 kilmetros. Obviamente, a mayor diferencia en grosor mayor desgaste. Las unidades de medicin son milsimas de pulgada ANOVA resultante Fuente de variabilidad Marca Posicin Carro Error Total Suma de Grados de Promedio de cuadrados libertad los cuadrados 5.6875 3 10 16.1875 3 2.0625 103.6875 3 12.8958 30.375 6 0.895833 155.9375 15 Valor crtico para F 4.76 4.76 4.76

F 0.37 1.07 6.83

Valor-p 0,775 0,431 0.023

Se observa que nuestro punto critico tanto para la posicin, el tipo de carro y las marcas es de 4,76. Concluimos que en las marcas y posicin no existe evidencia de que esta influya por lo que se acepta la hiptesis nula de que son iguales a un nivel de significancia de = 0.05. En cuanto al tipo de carro observamos que este si influye en el desgaste de las llantas por lo que rechazamos la hiptesis nula

16

Resultado arrojado en minitab Modelo lineal general: Desgaste vs. posicin, Carro, Marcas Factor posicin Carro Marcas Fuente posicin Carro Marcas Error Total Tipo fijo fijo fijo Niveles Valores 4 1, 2, 3, 4 4 1, 2, 3, 4 4 A, B, C, D SC ajust. MC ajust. 16.187 5.396 103.688 34.563 5.687 1.896 30.375 5.062 F 1.07 6.83 0.37 P 0.431 0.023 0.775

GL SC sec. 3 16.188 3 103.688 3 5.687 6 30.375 15 155.938

Calculo manual para ANOVA de cuadro latino

Fuente de variaciones
Tratamientos

SC

GL

CM

Valor crtico para F

Bloque 1 (filas) Bloque 2 (columnas) Error Total

) )

17

Sumas bsicas para el clculo manual Posicin, carro y marca Operaciones bsicas C = 12 B = 14 A = 17 D = 13 D = 11 C = 12 B = 14 A = 14 A = 13 D = 11 C = 10 B = 13 B=8 A=3 D=9 C=9 ( )
Suma de los cuadrados de los tratamientos

Suma total por Tratamiento

Sumatoria de las letras A,B,C y D Suma de los cuadrados de filas (bloque 1) correspondientes 47 49 43 44
Suma total por fila Bloque 1

( )

44 40

50

49

Suma de los cuadrados de las columnas (bloque 2) los datos suma de total de medicin media global

Suma total por columna Bloque II

56

51

47

( ) 29

1.- Suma de cuadrados de tratamientos o variabilidad debida a la diferencia entre las marcas de llantas, bloque 1 y bloque 2
) )

) )

) )

2.- Suma total de cuadrados o variabilidad total de los datos )

3.- Suma de cuadrados del error o variabilidad dentro de mtodos de ensamble ) 4.- Cuadrados medios de tratamientos, del bloque 1, del bloque 2 y del error

18

5- Estadstico de prueba

ANOVA para el diseo del cuadro latino Fuente de SC GL CM F Valor crtico variaciones para F Tratamientos 5.68 3 1.89 0.37 4.76 Renglones (Bloque 1) Columnas (Bloque2) Error 16.19 103.69 30.37 3 3 6 5.39 1.06 4.76 4.76

34.56 6.83 5.06

Comprobacin de supuestos. Como se coment antes, la validez del anlisis de varianza recae en tres supuestos que siempre deben verificarse:
Normalidad Varianza constante Independencia de los residuos

Adems de la ausencia de observaciones atpicas o aberrantes. Como se observa en la figura 3.6, el supuesto de normalidad se cumple al caer los residuos o puntos ms o menos en lnea recta (Grafica de probabilidad normal). Tambin se cumple el supuesto de
19

varianza constante de acuerdo a la grafica de residuos vs valor ajustado, y en la grafica de residuos vs orden de observacin, en la que los residuos se ubican aleatoriamente dentro de una banda horizontal; su dispersin vertical es la misma a lo largo de los grficos. No se comprob el supuesto de independencia porque no se conoce el orden en que se realizaron las mediciones del desgaste. Figura 3.6 Grficas de residuos para la verificacin de supuestos
Grficas de residuos para Desgaste
Grfica de probabilidad normal
99 90 50 10 1 -4 -2 0 Residuo 2 4 1

vs. ajust es

Porcentaje

Residuo

0 -1 -2 -3 5,0 7,5 10,0 12,5 Valor ajustado 15,0

Hist ograma
4 1

vs. orden

Frecuencia

2 1 0 -3 -2 -1 Residuo 0 1

Residuo

0 -1 -2 -3
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Orden de observacin

Ejercicios 1.- Las letras A,B,C y D representan cuatro variedades de trigo; los renglones representan cuatro diferentes fertilizantes; y las columnas 4 anos diferentes. Los datos de la siguiente tabla son los rendimientos para las cuatro variedades de trigo, medidas en kilogramos por parcela. Se supone que las diversas fuentes de variacin no interactan. Utilice un nivel de significancia de 0.05 para probar la ; no hay diferencia en los rendimientos promedio de las cuatro variedades de trigo Rendimiento del trigo (kg por parcela) Fertilizantes 1981 Fertilizante 1 A 70 Fertilizante 2 D 66 Fertilizante 3 C 59 Fertilizante 4 B 41 1982 B 75 A 59 D 66 C 57 1983 1984 C D 68 81 B C 55 63 A B 39 42 D A 39 55

20

Modelo lineal general: Rendimiento vs. Fertilizante, Ano, Trigo Factor Tipo Fertilizante fijo Ano fijo Trigo fijo Fuente Fertilizante Ano Trigo Error Total Niveles 4 4 4 Valores 1, 2, 3, 4 1, 2, 3, 4 A, B, C, D SC ajust. 1557.19 417.69 263.69 261.37 MC ajust. F P 519.06 11.92 0.006 139.23 3.20 0.105 87.90 2.02 0.213 43.56

GL SC sec. 3 1557.19 3 417.69 3 263.69 6 261.37 15 2499.94

La variabilidad debida al fertilizante, aos y tipos de tratamiento. La = 2.02 es sobre 3 y 6 grados de libertad El valor p de aproximadamente 0.2 es en realidad demasiado grande para concluir que las variedades de trigo afectan de manera significativa el rendimiento. 2.- El departamento de matemticas de una universidad desea evaluar las capacidades de enseanza de cuatro profesores. A fin de eliminar cualquier efecto debido a los diferentes cursos de matemticas y los diferentes horarios, se decide realizar un experimento con el uso de un diseo de cuadros latinos en que las letras A, B, C y D representan a los cuatro diferentes profesores. Cada profesor ensena una seccin de cada de cuatro diferentes cursos programados en cada uno de los cuatro diferentes horarios durante el da. Los datos muestran las calificaciones asignadas por estos profesores a 16 estudiantes de aproximadamente igual capacidad. Utilice un nivel de significancia de 0,05 para probar la hiptesis de que los diferentes profesores no tienen efecto en las calificaciones.

Horario 1 2 3 4

Curso lgebra Geometra Estadstica Clculo A 84 B 79 C 63 D 97 B 91 C 82 D 80 A 93 C 59 D 70 A 77 B 80 D 75 A 91 B 75 C 68

3.- Una empresa fabricante quiere investigar los efectos de cinco aditivos de color en el tiempo de fraguado de una mezcla de concreto nueva. Las variaciones en el tiempo de fraguado se pueden esperar de los cambios diarios en la temperatura y humedad y tambin de los diferentes trabajadores que preparan los moldes de prueba. Para eliminar estas fuentes externas de variacin se utiliza un diseo de cuadro latino de 5 x 5 en el que las letras A, B, C, D y E representan los cinco aditivos. Los tiempos de fraguado, en horas,
21

para los 25 moldes. El nivel de significancia de 0,05, Podemos decir que los aditivos de color tienen algn efecto en el tiempo de fraguado de la mezcla de concreto? Da Trabajador 1 2 3 4 5 1 D E A B C 10,7 11,3 11,8 14,1 14,5 2 E C B A D 10,3 10,5 10,9 11,6 11,5 3 B D C E A 11,2 12,0 10,5 11.0 11,5 4 A B D C E 10,9 11,5 11,3 11,7 12,7 5 C 10,5 A 10,3 E 7,5 D 11,5 B 10,9

4.- Se quiere estudiar el efecto de cinco diferentes catalizadores (A, B, C, D y E) sobre el tiempo de reaccin de un proceso qumico. Cada lote de material slo permite cinco corridas y cada corrida requiere aproximadamente 1,5 horas por lo que slo se pueden realizar cinco corridas diarias. El experimentador decide correr los experimentos con un diseo en cuadro latino para controlar activamente a los lotes y das. Los datos obtenidos son: Da 3 D 1 A 7 C 10 E 6 B 3

Lote 1 1 A 8 2 C 11 3 B 4 4 D 6 5 E 4

2 B E A C D 7 2 9 8 2

4 C D E B A

5 7 E 3 3 B 8 1 D 5 6 A 10 8 C 8

a) Cmo se aleatoriz el experimento? b) Anote la ecuacin del modelo y las hiptesis estadsticas correspondientes c) Existen diferencias entre los tratamientos? Cules tratamientos son diferentes entre si? d) Verifique los supuestos del modelo, considerando que los datos se obtuvieron columna por columna, da a da 5.- Se comprueba el peso en gramos de un material de tres proveedores: A, B y C, por tres diferentes inspectores: I, II y III, utilizando tres diferentes escalas: 1,2 y 3. El experimento se lleva a cabo como el siguiente cuadro latino: Escala Inspector 1 2 3 I A 16 B 10 C 11 II B 15 C 9 A 14 III C 13 A 11 B 13 a) Hay diferencias entre los proveedores?
22

b) Hay diferencias entre los inspectores y entre las escalas? c) Si el peso debe ser 15 g, cul proveedor es mejor? d) Si algn factor de bloque es no significativo, elimnelo y haga el anlisis adecuado 6.- Cuando se comparan varios fertilizantes o diferentes variedades de cierto cultivo, es tpico que se deba considerar el gradiente de fertilidad del suelo (factor columna) o los efectos residuales de cultivos previos (factor rengln). Considerando estos factores de bloque, Gmez y Gmez (1984) plantean un experimento en cuadro latino para comparar, en cuanto a rendimiento en toneladas por hectrea, tres variedades de maz hibrido (A, B, C) y una variedad control (D). Para ello, se utiliza un campo agrcola cuadrado de 16 hectreas, dividido en parcelas de una hectrea. Los datos de rendimiento obtenidos en cada parcela se muestran a continuacin: Ren Col 1 2 3 4 1 1,640 1,475 1,670 1,565 2 1,210 1,185 0,710 1,290 3 1,425 1,400 1,665 1,655 4 1,345 1,290 1,180 0,660

B C A D

D A C B

C D B A

A B D C

a) Existen diferencias en los rendimientos de las diferentes variedades de maz? b) Cul de los factores de bloque tuvo efectos? c) Se habran detectado las mismas diferencias en los tratamientos con un diseo completamente al azar? d) Y con un diseo en bloques completos al azar?

3.3. Diseo en cuadrado grecolatino


Con el diseo en cuadro grecolatino (DCGL) se controlan tres factores de bloque, adems del factor de tratamiento. Se llama cuadro grecolatino porque los cuatro factores involucrados se prueban en la misma cantidad de niveles, de aqu que se pueda escribir como un cuadro (ver tabla 3.5); adems, se utilizan letras latinas para denotar a los tratamientos y letras griegas para nombrar a los niveles del tercer factor de bloque.

Tabla 3.5 Diseo en cuadro grecolatino

Renglones

1 2 3 4

1 A B C D

Columnas 2 3 B C A D D A C B

4 D C B A

23

Al igual que en el cuadro latino, cada letra (latinas y griegas) debe aparecer slo una vez en cada rengln y en cada columna. Adems, cada par de letras debe aparecer slo una vez en todo el arreglo. El modelo estadstico que describe a las mediciones en un cuadro grecolatino est dado por

donde es la observacin o respuesta que se encuentra en el tratamiento ( -sima letra latina), en el rengln , en la columna y en la -sima letra griega; es el efecto del tratamiento , es el efecto del rengln , representa el efecto de la columna y representa el efecto de la -sima letra griega, que son los niveles del tercer factor de bloque; el trmino representa el error aleatorio atribuible a la medicin . Es importante no confundir las letras griegas del modelo que representan efectos, con las letras griegas en el diseo que simbolizan a los niveles del tercer factor de bloque. La variabilidad total presente en los datos se puede partir de la manera usual como

donde las sumas , miden la variabilidad debida a los factores de bloque rengln, columna y de letras griegas, respectivamente. Para tratamientos, los grados de libertad correspondientes a cada suma son ) ) ) ) )

Un bosquejo del anlisis de varianza se muestra en la tabla 3.6, en la cual se prueban las hiptesis de igualdad de letras latinas (tratamientos), de renglones, de columnas y de letras griegas Tabla 3.6 ANOVA para el diseo en cuadro grecolatino
Fuente de variabilidad Tratamientos (letras latinas) Factor de bloque I (renglones) Suma de cuadrados Grados de libertad

k-1

k-1

Factor de bloque II (columnas) Factor d bloque III (letras griegas) Error

k-1 k-1 (k-3)(k-1)

Total

24

Ejemplo En el caso del ejemplo donde se comparan los cuatro mtodos de ensamble y se tiene el factor de bloque operador, se podran tener dos factores de bloque adicionales: Orden en el que se hace el ensamble Lugar donde se hace

De acuerdo con esto, el diseo en cuadro grecolatino se observa en la siguiente tabla.

Tabla 3.7 Diseo en cuadro grecolatino para mtodos de ensamble Operador 1 2 3 4 1 C = 10 B D A 2 B C A D 3 A D B C 4 D A C B Orden del ensamble

Tabla 3,8 ANOVA para el diseo en cuadro grecolatino Fuente Suma de Gl Cuadrado Razn F Valor-p F critica cuadrados medio Mtodo 83,5 3 27,8333 23,86 0,0135 9,28 Operador 18,5 3 6,16667 5,29 0,1024 Orden 9,5 3 3,16667 2,71 0,2170 Lugar 2,0 3 0,666667 0,57 0,6714 Residual 3,5 3 1,16667 Total 117,0 15

Resultado arrojado en Minitab


Modelo lineal general: promedio vs. Mtodo; operador; orden; lugar
Factor Mtodo operador orden lugar Tipo fijo fijo fijo fijo Niveles 4 4 4 4 Valores 1; 2; 3; 1; 2; 3; 1; 2; 3; 1; 2; 3; 4 4 4 4

25

Fuente Mtodo operador orden lugar Error Total

GL 3 3 3 3 3 15

SC sec. 9,500 18,500 83,500 2,000 3,500 117,000

SC ajust. 9,500 18,500 83,500 2,000 3,500

MC ajust. F 3,167 2,71 6,167 5,29 27,833 23,86 0,667 0,57 1,167

P 0,217 0,102 0,014 0,671

S = 1,08012

R-cuad. = 97,01%

R-cuad.(ajustado) = 85,04%

El anlisis de varianza para el ejemplo se aprecia que el nico efecto significativo son los tratamientos (mtodos), y ninguno de los factores de bloque tiene un efecto significativo sobre el tiempo de ensamble. El factor operador tiene un valor-p bajo, lo cual indica que podra tener un efecto significativo; sin embargo, en este experimento fue imposible detectarlo. Si contrastamos con respecto a F critica para los cuatro casos Fen tablas es F = 9.28, por lo cual se rechaza la hiptesis nula para mtodo, en cuanto para operador, orden y lugar se acepta.

Ejercicios. 1.- Una compaa distribuidora ubicada en los suburbios est interesada en estudiar la diferencia en costos (tiempo y gasolina) entre las cuatro rutas (A, B, C, D) que llegan a la zona comercial, ms importante para ellos, en el otro extremo de la ciudad. Deciden correr un experimento en cuadro grecolatino controlando los factores de bloque chofer, marca de vehculo ( ) y da de la semana. El experimento se repite en dos semanas diferentes, en las cuales no hay das festivos ni quincenas. Los costos observados en pesos se muestran en la siguiente tabla: Chofer/da Carlos Enrique Genaro Luis Lunes 825, 750 650, 725 700, 675 475, 480 Martes 585, 610 540, 560 650, 740 560, 615 Mircoles 550, 580 580, 635 635, 540 650, 725 Jueves 580, 650 850, 770 450, 550 670, 730

a) Haga el anlisis de varianza de este experimento b) Realice las pruebas de comparaciones mltiples para los factores significativos c) Represente los tratamientos y factores de bloque usando grficas de medias y diagrama de dispersin. d) Cul es la mejor ruta? Cul es la peor? e) Hay diferencias significativas entre los choferes? Y entre el tipo o marca de unidad?

26

2.- El rendimiento de un proceso qumico se midi utilizando cinco lotes de materia prima, cinco concentraciones del cido, cinco tiempos de procesamiento (A, B, C, D y E) y cinco concentraciones del catalizador ( , ). Se us el cuadrado grecolatino siguiente. Analizar los datos de este experimento (utilizar = 0,05) y sacar conclusiones.

Lote 1 2 3 4 5

1 A B C, D E, 26 B, 18 C 20 D, 15 E 10 A,

Concentracin de cido 2 3 4 5 16 C, 19 D 16 E, 13 21 D, 18 E, 11 A, 21 12 E 16 A, 25 B 13 15 A 22 B 14 C 17 24 B, 17 C, 17 D, 14

3.4. Uso de un software estadstico


Para capturar los datos en minitab para el diseo de bloques se sigue la siguiente secuencia: Primeramente en la hoja de clculo de minitab, se capturan los datos en las columnas uno dos y tres de la siguiente manera: a) En la columna uno se captura el mtodo u tratamiento indicando de que mtodo se trata y cuantas repeticiones hay del mismo, repitiendo el mismo nmero 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4 b) En la segunda columna se anota el operador, en la posicin que le corresponde. 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4 c) En la tercera columna se anota el dato numrico de la tabla de datos, es decir el tiempo promedio para este caso. 6, 9, 7, 8, 7, 10, 11, 8, 10, 16, 11, 14, 10, 13, 11, 9 d) En el cuadro de captura ser en ANOVA de dos factores, en la ventana de captura se anotara en Respuestas el nombre de la tercer columna, en este caso dato, en el cuadro del factor fila se anota el nombre de la primera columna que corresponde al mtodo o tratamiento, en el factor columna se anota el nombre del factor bloque que en este caso es operador Nota, recordar que esto se hace en el cuadro principal de la izquierda dando dos clics con el ratn. e) Indicar aceptar y obtendremos el resultado.

27

Para capturar los datos en minitab para el sigue la siguiente secuencia:

cuadro latino (ANOVA de dos factores) se

Primeramente en la hoja de clculo de minitab, se capturan los datos en las columnas uno dos tres y cuatro de la siguiente manera: f) En la columna uno, se captura la posicin (para el problema de comparacin de llantas) indicando cuantas repeticiones hay de ese nmero repitiendo el mismo nmero 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4 g) En la segunda columna se anota el carro, tal y como se indica en el diseo del cuadro. 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4 h) En la tercera columna se anota la letra que corresponde a la marca de las llantas en la secuencia que le corresponda segn los nmeros de la columna anterior, C, D, A, B, B, C, D, A, A, B, C, D, D, A, B, C i) En la cuarta columna se anota los valores correspondientes a la respuesta, es decir, el desgaste. 12, 11, 13, 8, 14, 12, 11, 3, 17, 14, 10, 9, 13, 14, 13, 9 j) Ahora en Estadsticas de minitab, seleccionar ANOVA, luego Modelo linear general. k) En respuesta seleccionar la columna cuatro (desgaste) dando dos clic con el ratn, luego en Modelo, indicar con dos clic del ratn, carro, marca y desgaste (recordar que esto se hace en el cuadro principal de la izquierda quedando de manera continua sin comas, pero con su espacio de separacin) l) En factores aleatorios se deja en blanco, y se indica aceptar, y obtendremos el resultado
28

Para capturar los datos en minitab para el cuadro grecolatino (ANOVA de tres factores de bloque) se sigue la siguiente secuencia: Primeramente en la hoja de clculo de minitab, se capturan los datos en las columnas uno dos tres, cuatro y cinco de la siguiente manera: a) En la columna uno se captura la tratamiento o mtodo, indicando con un nmero cuantas repeticiones hay de ese tratamiento, repitiendo el mismo nmero 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4 b) En la segunda columna se anota el operador (para el ejemplo de referencia), es decir si es repeticin 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4 c) En la tercera columna se anota el nmero que representa a la letra latina como se colocaron el diseo del cuadro (para este caso el orden de las cuatro letras inciales fue C, B, D, y A (C = 1, B = 2, D = 3 y A = 4)). Anotando el nmero que represente a cada letra indicada en el cuadro. 1, 2, 3 ,4, 2, 1, 4, 3, 4, 3, 2, 1, 3, 4, 1, 2 d) En la cuarta columna se anota el nmero que representa a la letra griega como se colocaron el diseo del cuadro (para este caso el orden de las cuatro letras inciales fue , , , y ( = 1, = 2, , = 3 y = 4)). Anotando el nmero que represente a cada letra indicada en el cuadro.
29

1, 2, 3, 4, 4, 3, 2, 1, 3, 4, 1, 2, 2, 1, 4, 3 e) En la quinta columna se anota los valores correspondientes a la respuesta, es decir, el tiempo o promedio (para este ejemplo), siendo: 10, 10, 12, 7, 8, 15, 7, 14, 6, 14, 11, 13, 11, 8, 10, 8 f) Ahora en Estadsticas de minitab, seleccionar ANOVA, luego Modelo linear general. g) En respuesta seleccionar la columna quinta (tiempo o promedio) dando dos clic con el ratn, luego en Modelo, indicar con dos clic del ratn, mtodo, operador, orden y lugar (recordar que esto se hace en el cuadro principal de la izquierda) h) En factores aleatorios se deja en blanco, y se indica aceptar, y obtendremos el resultado

30

You might also like