You are on page 1of 9

Alumno: Miguel Angel Torres Rodríguez

3.1 Familia de diseños para comparar


tratamientos.
Los diseños experimentales más utilizados para comparar tratamientos son:
1. Diseño completamente al azar (DCA)
2. Diseño en bloque completamente al azar (DBCA)
3. Diseño en cuadro latino (DCL)
4. Diseño en cuadro grecolatino (DCGL)

La diferencia fundamental entre estos diseños es el número de factores de bloque que


incorporan o controlan de forma explícita durante el experimento. La comparación de
los tratamientos en cuanto a la respuesta media que logran, en cualquiera de estos
diseños, se hace mediante la hipótesis que se prueba con la técnica estadística
llamada Análisis de Varianza (ANOVA) con uno, dos, tres o cuatro criterios de
clasificación, dependiendo del número de factores de bloques incorporados al
diseño.

Diseñ Factores ANOVA con Modelo estadístico


o de
DCA bloqueo
0 Un criterio
DBCA 1 Dos criterios
DCL 2 Tres criterios
DCGL 3 Cuatro criterios

El modelo estadístico que describe el comportamiento de la variable observada Y en


cada diseño, incorpora un término adicional por cada factor de bloqueo
controlado.
De acuerdo con los modelos dados en la tabla, para cada diseño comparativo
se tienen al menos dos fuentes de variabilidad: los tratamientos o niveles del factor de
interés y el error aleatorio. Se agrega una nueva fuente de variabilidad por cada factor
de bloque que se controla directamente. Se observa que los diseños suponen que no
hay efectos de interacción entre los factores, lo cual sería lo deseable que
ocurra; de no ocurrir así, tal efecto se recarga al error y el problema de comparación
no se resuelve con éxito.

Un efecto de interacción entre dos factores hace referencia a que el efecto de


cada factor depende del nivel en que se encuentra el otro.

3.2 El modelo de efectos fijos


El modelo de efectos fijos (es cuando se estudian todos los posibles tratamientos) de
análisis de la varianza se aplica a situaciones en las que el experimentador ha sometido

Alumno: Miguel Angel Torres Rodríguez


al grupo o material analizado a varios factores, cada uno de los cuales le afecta sólo a
la media, permaneciendo la "variable respuesta" con una distribución normal.

Este modelo se supone cuando el investigador se interesa únicamente por los niveles
del factor presentes en el experimento, por lo que cualquier variación observada en las
puntuaciones se deberá al error experimental.

Donde es el parámetro de escala común a todos los tratamientos, llamado media


global, ; es un parámetro que mide el efecto del tratamiento y es el error atribuible
a la medición . Este modelo implica que en el diseño completamente al azar actuarían
a lo más dos fuentes de variabilidad: Los tratamientos y el error aleatorio. La media
global de la variable de respuesta no se considera una fuente de variabilidad por ser
una constante común a todos los tratamientos, que hace las veces de punto de
referencia con respecto al cual se comparan las respuestas medias de los tratamientos.

 Si la respuesta media de un tratamiento particular es ¨muy diferente¨ de la


respuesta media global, es un síntoma de que existe un efecto de dicho
tratamiento, ya que como se verá más adelante. La diferencia que debe tener las
medias entre sí para concluir que hay un efecto (que los tratamientos son
diferentes), nos lo dice el análisis de varianza (ANOVA).

 En la práctica puede suceder que los tratamientos que se desea comparar sean
demasiados como para experimentar con todos. Cuando esto sucede es
conveniente comparar sólo una muestra de la población de tratamientos, de
modo que pasa a ser
 una variable aleatoria con su propia varianza que deberá estimarse a partir de los
 datos. En este capítulo sólo se presenta el caso en que todos los tratamientos
que se tienen se prueban, es decir, se supone una población pequeña de
tratamientos, lo cual hace posible compararlos a todos. En este caso, el modelo
dado por la ecuación (2.2) se llama modelo de efectos fijos.

3.3 Diseño completamente al azar y ANOVA


Muchas comparaciones, como las antes mencionadas, se hacen con base en el diseño
completamente al azar (DCA), que es el más simple de todos los diseños que se
utilizan para comparar dos o más tratamientos, dado que sólo consideran dos
fuentes de variabilidad: los tratamientos y el error aleatorio. En la siguiente unidad
veremos diseños que consideran la influencia de otras fuentes de variabilidad
(bloques).

Este diseño se llama completamente al azar porque todas las corridas


experimentales se realizan en orden aleatorio completo. De esta manera, si durante el
estudio se hacen en total N pruebas, éstas se corren al azar, de manera que los

Alumno: Miguel Angel Torres Rodríguez


posibles efectos ambientales y temporales se vayan repartiendo equitativamente entre
los tratamientos.

Ejemplo 1
Comparación de cuatro métodos de ensamble. Un equipo de mejora investiga el
efecto de cuatro métodos de ensamble A, B, C y D, sobre el tiempo de ensamble en
minutos con un nivel de significancia de 0.05. En primera instancia, la estrategia
experimental es aplicar cuatro veces los cuatro métodos de ensamble en orden
completamente aleatorio (las 16 pruebas en orden aleatorio). Los tiempos de ensamble
obtenidos se muestran en la tabla 2.1. Si se usa el diseño completamente al azar
(DCA), se supone que, además del método de ensamble, no existe ningún otro factor
que influya de manera significativa sobre la variable de respuesta (tiempo de
ensamble)

Tabla 2,1 Diseño completamente al azar para


el ejemplo 1
Método de ensamble
A B C D
6 7 11 10
8 9 16 12
7 10 11 11
8 8 13 9

Ejemplo 2
Comparación de cuatro tipos de cuero. Un fabricante de calzado desea mejorar la
calidad de las suelas, las cuales se pueden hacer con uno de los cuatro tipos de cuero
A, B, C y D disponibles en el mercado. Para ello, prueba los cueros con una máquina
que hace pasar los zapatos por una superficie abrasiva; la suela de éstos se desgasta
al pasarla por dicha superficie. Como criterio de desgaste se usa la pérdida de peso
después de un número fijo de ciclos. Se prueban en orden aleatorio 24 zapatos, seis
de cada tipo de cuero. Al hacer las pruebas en orden completamente al azar se evitan
sesgos y las mediciones en un tipo de cuero resultan independientes de las demás.
Los datos (en miligramos) sobre el desgaste de cada tipo de cuero se muestran en la
tabla 2.2

Tabla 2,2 Comparación de cuatro tipos de cuero (cuatro tratamientos)


Tipo de cuero Observaciones Promedio
A 264 260 258 241 262 255 256,7
B 208 220 216 200 213 206 209,8
C 220 263 219 225 230 228 230,8
D 217 226 215 227 220 222 220,7

El análisis de la varianza de un criterio (ANOVA de un criterio) es una metodología

Alumno: Miguel Angel Torres Rodríguez


para analizar la variación entre muestras y la variación al interior de las mismas con
varianzas, en lugar de rangos. Como tal, es un método estadístico útil para comparar
dos o más medias poblacionales.

El objetivo del análisis de varianza en el DCA es probar las hipótesis de igualdad de


los tratamientos con respecto a la media de la correspondiente variable de respuesta:
Nota: Primeramente explicare el cálculo manual tradicional para ANOVA,
posteriormente el simplificado y más práctico, así como su solución utilizando un
paquete computacional.
El método de ANOVA con un criterio requiere del cálculo de dos estimaciones
independientes para , la varianza poblacional común. Estas dos estimaciones
sedenotan por y .
 . Se denomina estimación de la varianza entre muestras (Método entre)
 Se denomina estimación de la varianza al interior de las muestras

Tabla ANOVA
Los resultados del análisis de varianza se presentan en una tabla ANOVA que
resume los valores importantes de la prueba. Esta tabla tiene un formato estándar
que usan los libros y los problemas de computadora que ejecutan ANOVA. La
siguiente tabla muestra la forma general de la tabla ANOVA.
En dicha tabla se resumen los cálculos necesarios para la prueba de igualdad de las
medias poblacionales usando análisis de varianza. Primero se usa el método dentro
para estimar 2. Cada valor de los datos se compara con su propia media, y la suma
de las diferencias al cuadrado se divide entre los grados de libertad c(n-1).

Fuente de SC GL Estimación de Coeficiente F


variación
2 
2

Grupos Entre c-1 / glb /


2
Grupos Dentro c(n-1) / glb

  ( xij – x )
2
Total

Donde:
 = Número de la columna
 i = Número de la fila
 c = Número de columnas (grupos)
 n = Número de elementos en cada grupo (tamaño de la muestra)

La tabla ANOVA contiene columnas con las fuentes de variación, las sumas de
cuadrados, los grados de libertad, las estimaciones de la varianza y el valor F para
el procedimiento de análisis de varianza.

Alumno: Miguel Angel Torres Rodríguez


3.4 Comparaciones o Prueba de rangos múltiples
La prueba de rango múltiple Duncan es una comparación de las medias de tratamientos
todos contra todos de manera que cualquier diferencia existente entre cualesquier
tratamiento contra otro se verá reflejado en este análisis. Utiliza un nivel de significancia
variable que depende del número de medias que entran en cada etapa de comparación.
La idea es que a medida que el número de medias aumenta, la probabilidad de que se
asemejen disminuye. Para obtener los comparadores Duncan, se toman de la tabla de
Duncan los valores de acuerdo al número de tratamientos y con los grados de libertad
del error. Cada uno de estos valores será multiplicado por el error estándar de la media
y éstos serán los comparadores para determinar cuáles diferencias son significativas

Alumno: Miguel Angel Torres Rodríguez


3.5 Verificación de los supuestos del modelo
La evaluación de los supuestos de un modelo se basa en la verificación de las
propiedades empíricas que se derivan de ellos. Si se cumple la monotonía podremos
encontrar estas características en los datos: a) todos los pares de ítems tendrán
correlaciones no-negativas para todos los subgrupos de sujetos que difieren en el mismo
rasgo (Mokken, 1971); b) todo par de ítems tendrá una asociación condicional (CA) en
cualquier grupo de personas con una particular puntuación empírica (X+) (Rosenbaum,
1984); c) para cualquier ítem i la proporción de personas que lo respondan correctamente
será no-decreciente sobre los grupos de puntuación creciente (X+), donde X+ se estima
sobre el resto de n-1 ítems; finalmente d) la puntuación total (X+) tendrá una regresión
monótona no-decreciente sobre la habilidad (Lord y Novick, 1968), lo que implica una
correlación positiva entre ambos. La doble monotonía por su parte implicaría que el orden
de las dificultades de los pasos entre ítems es independiente de la distribución de
habilidad; esta propiedad aseguraría el ordenamiento invariante de las funciones de
respuesta entre pasos. Este ordenamiento entre pasos sólo podría generalizarse al
ordenamiento entre ítems si se cumple la doble monotonía fuerte. Coeficiente de
escalabilidad. La evaluación empírica de M puede llevarse a cabo a través de una
adaptación del coeficiente de escalabilidad de Loevinger (1947, 1948) que Mokken
(1971) utilizó para las escalas dicotómicas. Este coeficiente se define en términos de
errores de una escala Guttman que compara un patrón de respuesta observado con el
patrón teórico que debiera seguir una escala acumulada. Para dos ítems i y k (i < k) se
operacionaliza del siguiente modo: Hik=1-(eik/eik(0)) donde eik y eik(0) son las
probabilidades de errores observados y esperados bajo el modelo de independencia
marginal, en cuyo caso Hik sería 0. En la hipotética situación en que los patrones teóricos
y observados coincidieran el coeficiente de escalabilidad sería 1. El coeficiente de
escalabilidad para un ítem (i) podría obtenerse con respecto al resto de n-1 ítems como
una combinación lineal del total de H obtenidos. 15 La adaptación de este coeficiente a
una escala politómica fue propuesta por Molenaar (1991, 1997; Sijtsma y Molenaar,
2002). El nuevo coeficiente pondera los errores en los patrones de respuesta observados
respecto a los patrones teóricos. La ponderación sobre un par de ítems se lleva a cabo
teniendo en cuenta el número de pasos entre opciones involucrados en la resolución de

Alumno: Miguel Angel Torres Rodríguez


esos ítems. El valor de H ponderado iguala la razón entre la correlación observada entre
dos ítems y la correlación máxima obtenida a partir de sus frecuencias marginales- Para
la evaluación de su significatividad Molenaar y Sijstma (2000) utilizan un test estadístico
contra la hipótesis nula de H=0. Sin embargo, dado que en condiciones empíricas este
test siempre resulta significativo, es habitual valorar la escalabilidad de un ítem respecto
al punto de corte de 0,30 (Mokken, 1971). Evaluación de la homogeneidad monótona:
Puesto que la proporción de personas que superan una opción de respuesta de un ítem
es no-decreciente sobre los grupos de puntuación creciente (X+) para comprobar esta
propiedad bastaría con formar grupos de sujetos por niveles de puntuación manifiesta
(X+), y comprobar que el porcentaje de personas que superan una opción se incrementa
a medida que se incrementa ésta. Evaluación de la doble monotonía: La evaluación de
la doble monotonía se lleva a cabo definiendo proporciones univariadas ( ) y bivariadas
( ) de respuestas entre categorías. Con la información obtenida se forman matrices
empíricas (P(++)) de orden n(m-1)xn(m-1) con elementos . Las filas y las columnas se
ordenan crecientemente en función de los marginales de las proporciones. Dado este
ordenamiento, las celdas tanto de las filas como de las columnas deben ser
monótonamente nodecrecientes si las ISRF son invariantemente ordenadas en theta.
Evaluación de la doble monotonía fuerte: Los análisis llevados a cabo para estudiar la
condición de doble monotonía fuerte son similares a los llevados a cabo en la evaluación
de la doble monotonía pero en lugar de comparar las proporciones de respuestas
referidas a los pasos entre ítems las comparaciones se llevan a cabo sobre las medias
aritméticas obtenidas en los ítems.

Alumno: Miguel Angel Torres Rodríguez


Referencias Bibliográficas

 Salazar Alejandro (2010).Diseño de experimento de un factor. Disponible en:


http://cursos.aiu.edu/estadistica%20superior/pdf/tema%202.pdf

 Soberano Alejandro (2012).Estadístico Inferencial. Disponible en:


https://es.scribd.com/doc/313075106/Familia-de-disenos-para-comparar-
tratamientos-docx

Alumno: Miguel Angel Torres Rodríguez

You might also like