You are on page 1of 10

Diseño de experimentos

Consiste en planear y realizar un conjunto de pruebas con el objetivo de generar


datos que, al ser analizados estadísticamente, proporcionen evidencias objetivas
que permitan responder las interrogantes planteadas por el experimentador sobre
determinada situación.

El diseño de experimentos es la aplicación del método científico para generar


conocimiento acerca de un sistema o proceso, por medio de pruebas planeadas
adecuadamente. Esta metodología se ha ido consolidando como un conjunto de
técnicas estadísticas y de ingeniería, que permiten entender mejor situaciones
complejas de relación causa-efecto.

Un experimento es un cambio en las condiciones de operación de un sistema o


proceso, que se hace con el objetivo de medir el efecto del cambio sobre una o
varias propiedades del producto o resultado. Asimismo, el experimento permite
aumentar el conocimiento acerca del sistema. Por ejemplo, en un proceso químico
se pueden probar diferentes temperaturas y presiones, y medir el cambio
observado en el rendimiento (yield, ppm, defectivo) del proceso. Al analizar los
efectos (datos) se obtiene conocimiento acerca del proceso químico, lo cual
permite mejorar su desempeño.

La unidad experimental es la pieza(s) o muestra(s) que se utiliza para generar un


valor que sea representativo del resultado del experimento o prueba. En cada
estudio experimental es importante definirla de manera cuidadosa, ya que la
unidad experimental puede ser una pieza o muestra de una sustancia o un
conjunto de piezas producidas, dependiendo del proceso que se estudia. Por
ejemplo, si se quiere investigar alternativas para reducir el porcentaje de piezas
defectuosas, en un proceso que produce muchas piezas en un lapso corto de
tiempo, es claro que no sería muy confiable que la unidad experimental fuera una
sola pieza, en la cual se vea si en una condición experimental estaba defectuosa o
no. Aquí, la unidad experimental será cierta cantidad de piezas que se producen
en las mismas condiciones experimentales, y el valor se obtiene al analizar
cuántas de ellas están defectuosas y cuántas no.

Variable(s) de respuesta

A través de esta(s) variable(s) se conoce el efecto o los resultados de cada prueba


experimental por lo que pueden ser características de la calidad de un producto
y/o variables que miden el desempeño de un proceso. El objetivo de muchos
estudios experimentales es encontrar la forma de mejorar la(s) variable(s) de
respuesta. Por lo general, estas variables se denotan con la letra y
Factores controlables

Son variables de proceso o características de los materiales experimentales que


se pueden fijar en un nivel dado. Algunos de éstos son los que usualmente se
controlan durante la operación normal del proceso, y se distinguen porque, para
cada uno de ellos, existe la manera o el mecanismo para cambiar o manipular su
nivel de operación. Esto último es lo que hace posible que se pueda experimentar
con ellos. Por ejemplo, si en el proceso se usa agua a 60°C entonces debe existir
un mecanismo que permita fijar la temperatura del agua dentro de un rango de
operación. Algunos factores o características que generalmente se controlan son:
temperatura, tiempo de residencia, cantidad de cierto reactivo, tipo de reactivo,
método de operación, velocidad, presión, etc. A los factores controlables también
se les llama variables de entrada, condiciones de proceso, variables de diseño,
parámetros del proceso, las x de un proceso o simplemente factores.

Factores no controlables o de ruido

Son variables o características de materiales y métodos que no se pueden


controlar durante el experimento o la operación normal del proceso. Por ejemplo,
algunos factores que suelen ser no controlables son las variables ambientales (luz,
humedad, temperatura, partículas, ruido, etc.), el ánimo de los operadores, la
calidad del material que se recibe del proveedor (interno o externo). Un factor que
ahora es no controlable puede convertirse en controlable cuando se cuenta con el
mecanismo o la tecnología para ello.

Factores estudiados

Son las variables que se investigan en el experimento, respecto de cómo influyen


o afectan a la(s) variable(s) de respuesta. Los factores estudiados pueden ser
controlables o no controlables, a estos últimos quizá fue posible y de interés
controlarlos durante el experimento. Para que un factor pueda ser estudiado es
necesario que durante el experimento se haya probado en, al menos, dos niveles
o condiciones.

En principio, cualquier factor, sea controlable o no, puede tener alguna influencia
en la variable de respuesta. Para fines de un diseño de experimentos deben
seleccionarse los factores que se considera, por conocimiento del objeto de
estudio, que pueden tener efecto sobre la respuesta de interés.

Obviamente, si se decide o interesa estudiar un mayor efecto de un factor no


controlable, parte de la problemática a superar durante el diseño es ver la manera
en la que tal factor se controlará durante el experimento.
Niveles y tratamientos

Los diferentes valores que se asignan a cada factor estudiado en un diseño


experimental se llaman niveles. Una combinación de niveles de todos los factores
estudiados se llama tratamiento o punto de diseño.

Por ejemplo, si en un experimento se estudia la influencia de la velocidad y la


temperatura, y se decide probar cada una en dos niveles, entonces cada
combinación de niveles (velocidad, temperatura) es un tratamiento. En este caso
habría cuatro tratamientos. Es necesario probar cada tratamiento y obtener el
correspondiente valor de y.

Error aleatorio

Es la variabilidad observada que no se puede explicar por los factores estudiados;


resulta del pequeño efecto de los factores no estudiados y del error experimental.

Error experimental

Componente del error aleatorio que refleja los errores del experimentador en la
Planeación y ejecución del experimento.
Aleatorización

Consiste en hacer corridas experimentales en orden aleatorio (al azar); este


principio aumenta la posibilidad de que el supuesto de independencia de los
errores se cumpla.

Repetición
Es correr más de una vez un tratamiento o combinación de factores.

Réplica
Es cada corrida de todos los tratamientos del arreglo factorial

Diseño completamente al azar (DCA), que es el más simple de todos los diseños
que se utilizan para comparar dos o más tratamientos, dado que sólo consideran
dos fuentes de variabilidad: los tratamientos y el error aleatorio. Este diseño se
llama completamente al azar porque todas las corridas experimentales se realizan
en orden aleatorio completo. De esta manera, si durante el estudio se hacen en
total N pruebas, éstas se corren al azar, de manera que los posibles efectos
ambientales y temporales se vayan repartiendo equitativamente entre los
tratamientos.

Diseño balanceado

Es cuando se utiliza el mismo número de repeticiones en cada tratamiento.

Modelo de efectos fijos

Es cuando se estudian todos los posibles tratamientos.

Modelo de efectos aleatorios:

Se toman al azar algunos eventos.

Modelo de factores:

Son aquellos que involucran variables cualitativas en el experimento.

Modelos de regresión:

Involucra solo variables cuantitativas en su diseño

Análisis de varianza

El análisis de varianza (ANOVA) es la técnica central en el análisis de datos


experimentales. La idea general de esta técnica es separar la variación total en las
partes con las que contribuye cada fuente de variación en el experimento. En el
caso del DCA, se separan la variabilidad debida a los tratamientos y la debida al
error. Cuando la primera predomina “claramente” sobre la segunda, es cuando se
concluye que los tratamientos tienen efecto (figura 3.1b), o dicho de otra manera,
las medias son diferentes. Cuando los tratamientos no dominan (contribuyen igual
o menos que el error), se concluye que las medias son iguales (figura 3.1a)

El objetivo del análisis de varianza en el DCA es probar la hipótesis de igualdad de


los tratamientos con respecto a la media de la correspondiente variable de
respuesta:

H0 : m1 = m2 = … = mk = m

HA : mi ≠ mj para algún i ≠ j

la cual se puede escribir en forma equivalente como:

H0 : t1 = t2 = … = tk = 0

HA : ti ≠ 0 para algún i

Donde ti es el efecto del tratamiento i sobre la variable de respuesta. Si se acepta


H0, se confirma que los efectos sobre la respuesta de los k tratamientos son
estadísticamente nulos (iguales a cero), y en caso de rechazar se estaría
concluyendo que al menos un efecto es diferente de cero.

Gráficos de medias

Cuando se rechaza H0 mediante el ANOVA, y se concluye que no hay igualdad


entre las medias poblacionales de los tratamientos, el gráfico de medias (means
plot) permite hacer una comparación visual y estadística de las medias de los
tratamientos (métodos de ensamble) para así saber cuáles tratamientos son
diferentes entre sí. En la fi gura 3.4 se presenta el gráfico de medias con intervalos
de confianza de acuerdo con la prueba LSD, la cual se estudiará más adelante.

Como se explicó en el capítulo anterior, si dos intervalos de confianza se


traslapan, los tratamientos correspondientes son estadísticamente iguales en
cuanto a sus medias; pero si no se traslapan, entonces son diferentes. Así,
podemos ver que el método LSD detecta, con una confianza de 95%, que A ≠ C, A
≠ D y B = C. De esta forma, la conclusión práctica del experimento es que el mejor
método de ensamble parece ser el A, ya que estadísticamente sus tiempos son
menores que los de los métodos C y D. Le sigue el método B, ya que éste es
mejor que el C. Pero no es posible concluir que el método A sea mejor que el
método B, ya que sus intervalos se traslapan. Si se quisiera decidir en forma
estadística sobre la diferencia entre los métodos A y B, una forma de hacerlo es
tomar más datos para incrementar la potencia de la prueba, o bien, recurrir a otros
criterios para tomar la decisión.

Diagramas de caja

Gráficos basados en los cuartiles de un conjunto de datos


Verificación de los supuestos del modelo

La validez de los resultados obtenidos en cualquier análisis de varianza queda


supeditada a que los supuestos del modelo se cumplan. Estos supuestos son:
normalidad, varianza constante (igual varianza de los tratamientos) e
independencia. Esto es, la respuesta (Y) en cada tratamiento se debe distribuir de
manera normal, con la misma varianza en cada tratamiento, y las mediciones
deben ser independientes.

Estos supuestos sobre Y se traducen en supuestos sobre el término error (e) en el


modelo .Es una práctica común utilizar la muestra de residuos para comprobar los
supuestos del modelo, ya que si los supuestos se cumplen, los residuos o
residuales se pueden ver como una muestra aleatoria de una distribución normal
con media cero y varianza constante.

Residuos

Son generados por la diferencia entre la respuesta observada y la respuesta


predicha por el modelo en cada prueba experimenta.

Varianza constante
Supuesto del ANOVA que se cumple cuando los tratamientos tienen la misma
varianza.

Ejemplo donde no se cumple con el supuesto de Independencia.

De esta manera, si al graficar en el eje horizontal el tiempo (orden de corrida) y en


el eje vertical los residuos, se detecta una tendencia o patrón no aleatorio
claramente definido, esto es evidencia de que existe una correlación entre los
errores y, por lo tanto, el supuesto de independencia no se cumple.
Bloqueo

Es nulificar o tomar en cuenta en forma adecuada todos los factores que pueden
afectar la respuesta observada.

Factores de bloque. Éstos tienen la particularidad de que se incluyen en el


experimento no porque interese analizar su efecto, sino como un medio para
estudiar de manera adecuada y eficaz el factor de interés. Los factores de bloque
entran al estudio en un nivel de importancia secundaria con respecto al factor de
interés y, en este sentido, se puede afirmar que se estudia un solo factor, porque
es uno el factor de interés. Los factores de bloqueo ayudan a disminuir el error
aleatorio, no son el objeto de estudio pero controlan el error.

En un diseño en bloques completos al azar (DBCA) se consideran tres fuentes de


variabilidad: el factor de tratamientos, el factor de bloque y el error aleatorio, es
decir, se tienen tres posibles “culpables” de la variabilidad presente en los datos

Cuadro latino (bloque de cuadro latino)

Diseño en el que se controlan dos factores de bloque y uno de tratamientos; los


tres factores tienen la misma cantidad de niveles. Los tratamientos se representan
por letras latinas y se distribuyen en forma adecuada en un cuadro.

Efecto de interacción
Es cuando dos factores interactúan, es decir, cuando el efecto de uno depende del
nivel del otro.

Diseño factorial

Diseño experimental que sirve para estudiar el efecto individual y de interacción de


varios factores sobre una o varias respuestas.
Factor cualitativo

Sus niveles toman valores discretos o de tipo nominal. Ejemplos: máquinas, lotes,
marcas, etcétera.

Factor cuantitativo

Sus niveles de prueba pueden tomar cualquier valor dentro de cierto intervalo. La
escala es continua, como por ejemplo: temperatura, velocidad, presión, etcétera.

Efecto de un factor Efecto principal Efecto de interacción


Es el cambio observado Es igual a la respuesta Dos factores interactúan
en la variable de promedio observada en el de manera signifi cativa
respuesta debido a un nivel alto de un factor, sobre la variable de
cambio de nivel en menos la respuesta respuesta cuando el
el factor promedio en el nivel bajo efecto de uno depende
del nivel en que está el
otro.

1. Mediana. Valor que deja a la mitad de los casos por encima y a la otra mitad por debajo.
2. Primer Cuartil (Q1). El 25% de los casos se encuentran por debajo de este valor.
3. Tercer Cuartil (Q3). El 75% de los casos se encuentran por encima de este valor.
4. Rango Intercuartílico (RIC). Es la diferencia entre el tercer y el primer cuartil.
5. Límites Superior o Inferior (Ls o Li). Ls contiene los casos por encima de Q3 más 1,5
veces el rango intercuartílico o Li por debajo de Q1 – 1,5xRIC (Estilo de Tukey). Cuando
los valores no son posibles en lugar de emplear la aproximación anterior se escogen los
valores máximo o mínimo de la muestra (Estilo de Spears).
6. Los valores atípicos son aquellos que están más a allá de los límites inferior y superior.
Cuando los valores atípicos están más allá de 3 veces el RIC en lugar del 1.5 son
denominados valores extremos.

You might also like