You are on page 1of 37

Análisis de varianza de un Factor

Marcelo Rodríguez G.
Ingeniero Estadístico - Magister en Estadística

Universidad Católica del Maule


Facultad de Ciencias Básicas
Ingeniería en Agronomía
Diseño Experimental
21 de marzo de 2011

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 1 / 37


Introducción

Denición (ANOVA de un Factor)


El método de ANOVA de un Factor, es un método de comparación de
medias que consiste en la comparación de varios grupos (tratamientos) de
una variable cuantitativa (variable dependiente).

(La hipótesis de investigación)


Existe un efecto atribuible a los tratamientos. Estadísticamente sería,

H1 : µi 6= µj .

(La hipótesis nula)


El efecto de los tratamientos es el mismo. Estadísticamente sería,

H 0 : µ 1 = µ 2 = . . . µt .

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 2 / 37


Modelo Estadístico

(Modelo completo de medias)


El modelo está dado por

yij = µ + τj + εij ,

i = 1, · · · , r j = 1, · · · , t
donde:

r es el número de replicas y t el número de tratamientos.


yij : i -ésima observación del j -ésimo tratamiento,
µj : media del j -ésimo tratamiento,
τj = µj − µ : Efecto sobre la respuesta del j -ésimo tratamiento,
εij : i -ésimo error experimental del j -ésimo tratamiento.

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 3 / 37


Modelo Estadístico

(Arreglo común de los datos)


Tratamientos

1 2 ··· t

y11 y12 ··· y1t


y21 y22 ··· y2t
. . . .
. . . .
. . . .

yr 1 yr 2 ··· yrt

r t X
r
1 1
yj yij n =r ·t y yij
X X
Considere: = =
r i =1
n j =1 i =1

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 4 / 37


Ejemplo: Nociones del análisis de varianza

Recuerde el problema de crecimiento bacterial. A cada conjunto de


condiciones de empaque, se le asignaron, al azar, 5 cortes de carne. Se
asume que los cortes forman un grupo homogéneo. Se mide el número de
bacterias por centímetro cuadrado.

Condiciones de empaque
Al vacio (T1 ) Mezcla de gases (T2 ) 100% CO2 (T3 )
620 730 550
640 720 500
680 690 440
630 680 510
670 670 550

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 5 / 37


Ejemplo: Nociones del análisis de varianza
y
Bacterias ( ij ) Empaques y yj (yij − y )2 (y j − y )2 (yj − y j )2
620 Al vacío (1) 618,67 648 1,78 860,44 784,00
640 Al vacío (1) 618,67 648 455,11 860,44 64,00
680 Al vacío (1) 618,67 648 3761,78 860,44 1024,00
630 Al vacío (1) 618,67 648 128,44 860,44 324,00
670 Al vacío (1) 618,67 648 2635,11 860,44 484,00
730 Mezcla de gases (2) 618,67 698 12395,11 6293,78 1024,00
720 Mezcla de gases (2) 618,67 698 10268,44 6293,78 484,00
690 Mezcla de gases (2) 618,67 698 5088,44 6293,78 64,00
680 Mezcla de gases (2) 618,67 698 3761,78 6293,78 324,00
670 Mezcla de gases (2) 618,67 698 2635,11 6293,78 784,00
550 100% CO2 (3) 618,67 510 4715,11 11808,44 1600,00
500 100% CO2 (3) 618,67 510 14081,78 11808,44 100,00
440 100% CO2 (3) 618,67 510 31921,78 11808,44 4900,00
510 100% CO2 (3) 618,67 510 11808,44 11808,44 0,00
550 100% CO2 (3) 618,67 510 4715,11 11808,44 1600,00
Suma 108373,333 94813,333 13560,000

El modelo completo es yij = µj + εij donde i = 1, 2, 3, 4, 5 y j = 1, 2, 3.


La variación total sería 108373,333, este valor será llamado SCT. El
objetivo es descomponer esta variación total es dos variaciones, una
atribuible a los tratamientos y otra al error.
La variación atribuible a los tratamientos (entre grupos) sería
94813,333, este valor será llamado SCTR. Si los y j , son muy similares
al y , entonces SCTR sería un valor pequeño, lo cual indicaría que no
hay diferencias entre los tratamientos.
mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 6 / 37
Ejemplo: Nociones del análisis de varianza
La variación atribuible al error (dentro del grupo) sería 13560,000,
este valor será llamado SCE. Esta es la variación que existe entre cada
dato y el promedio del tratamiento que fue aplicado (εij = yij − µj ).
Note que se obtiene la siguiente descomposición de la varianza

108373, 333 = 94813, 333 + 13560, 000 .


| {z } | {z } | {z }
SCT SCTR SCE

Para que exista un efecto atribuible a los tratamientos (promedio por


tratamiento diferentes), la SCTR debería ser un valor grande en
comparación a SCT (la SCE debería ser pequeña). El porcentaje que
SCTR
representa la SCTR de la SCT es ∗ 100% = 87, 5%.
SCT
Como la SCTR representa el 87,5% de la variación total (la SCE
representa sólo el 12,5% de la variación total), entonces, al parecer,
los promedios de los tratamientos son diferentes (efecto atribuible a
los tratamientos).

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 7 / 37


Descomposición de la suma de cuadrados

(Suma de cuadrados total)


t X
r
(yij − y )2
X
SCT =
j =1 i =1

(Suma de cuadrados de los tratamientos)


t X
r
(y j − y )2
X
SCTR =
j =1 i =1

(Suma de cuadrados de los errores)


t X
r
(yij − y j )2
X
SCE =
j =1 i =1

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 8 / 37


Grados de libertad

(Relación de la suma de cuadrados)


Las sumas de cuadrados se pueden descomponer mediante

SCT = SCTR + SCE

Ejemplo (Grados de libertad para las sumas de cuadrados)


Los grados de libertad para la SCE serían n−t
Los grados de libertad para la SCT serían n − 1

Los grados de libertad para la SCTR serían t − 1

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 9 / 37


Media cuadrática
Denición (Media de cuadrática)
Se dene como la suma de cuadrados promedio, con respecto al n
o de

grados de libertad.

(Media cuadrática de los tratamientos)


Es la variación entre (inter-grupos) cada tratamiento.

SCTR
MCTR =
t −1
(Media de cuadrática del error)
Es la variación dentro (intra-grupos) de cada tratamiento. También
llamada estimación de la varianza del error experimental.

SCE
MCE =
n−t
mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 10 / 37
Prueba de hipótesis

(Tabla de ANOVA)
Modelo Suma de Grados de Media Fc
cuadrados libertad cuadrática
Tratamiento (Inter-grupos) SCTR t −1 MCTR
MCTR
Error (Intra-grupos) SCE n−t MCE
MCE
Total SCT n−1

(Hipótesis)
H0 : µ1 = µ2 = · · · = µ t v/s H1 : µi 6= µj , para algún i, j

(Reglas para el rechazo de H0 )


Fijar α y Rechace H0 si Fc > F1−α (t − 1, n − t )
Rechace H0 si valor-p < 0, 05, donde valor-p= P (F > Fc ).

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 11 / 37


Sumas de cuadrado, para diseños no balanceados

En los diseños no balanceados cada tratamiento puede tener un n


o

r
diferente de UE's asignadas ( j ). Tanto la prueba de hipótesis como la
tabla ANOVA se mantiene, considerando los siguientes cambios:

(Sumas de cuadrado, para diseños no balanceados)


r
t X j

(y j − y )2
X
SCTR =
j =1 i =1

r
t X j

(yij − y )2
X
SCT =
j =1 i =1

rj t r
t X j
1 1
yj yij n= rj y yij
X X X
donde; = =
rj i =1 j =1
n j =1 i =1

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 12 / 37


Ejemplo de una ANOVA de un Factor en SPSS
Con α = 0, 05, pruebe la hipótesis de que existe efecto atribuible a las
condiciones de empaque. Las hipótesis serían
H0 : µ1 = µ2 = µ3 = µ4 v/s H1 : µi 6= µj , para algún i, j

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 13 / 37


Ejemplo de una ANOVA de un Factor en SPSS
Puede descargar los datos desde http://bit.ly/carne_anova_1factor

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 14 / 37


Ejemplo de una ANOVA de un Factor en SPSS

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 15 / 37


Ejemplo de una ANOVA de un Factor en SPSS

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 16 / 37


Peso <ninguno>

Ejemplo de una ANOVA de un Factor en SPSS


Segmentar archivo <ninguno>
Núm. de filas del archivo 15
de trabajo
Tratamiento de los valores Definición de los valores Los valores perdidos definidos por el
perdidos perdidos usuario serán tratados como
perdidos.
Casos utilizados Los estadísticos de cada análisis se
basan en los casos sin datos
Con α = 0, 05, pruebe la hipótesis
perdidos para cualquier variablede
el análisis.
en que existe efecto atribuible a las
Sintaxis ONEWAY bacterias BY empaques
condiciones de empaque. LasDESCRIPTIVES
/STATISTICS hipótesis serían
/MISSING ANALYSIS.

H0 : µ1 = µ2 = µ3 = µ4
Recursos Tiempo de procesador
Tiempo transcurrido
00:00:00,000
v/s00:00:00,008 H1 : µi 6= µj , para algún i, j
[Conjunto_de_datos1] C:\Users\13865271\Desktop\carne.sav

Descriptivos
750
Número de bacterias
Intervalo de confianza para la
media al 95% 700

Desviación Límite

95% IC Número de bacterias


N Media típica Límite inferior superior
650
Al vacio 5 648,00 25,884 615,86 680,14
Mezcla de gases 5 698,00 25,884 665,86 730,14
100% CO2 5 510,00 45,277 453,78 566,22 600

Total 15 618,67 87,983 569,94 667,39

550
ANOVA
Número de bacterias
500
Suma de Media
cuadrados gl cuadrática F Sig.
Inter-grupos 94813,333 2 47406,667 41,953 ,000
450
Intra-grupos 13560,000 12 1130,000
Total 108373,333 14 Al vacio Mezcla de gases 100% CO2
Condiciones de empaques

Como Fc = 41, 953 > F0,95 (2, 12) = 3, 89 (o equivalentemente el


p = 0, 000 < 0, 05) entonces, rechace H0 , en favor de H1 .
Página 13

valor−
Conclusión: Existe un efecto atribuible a las condiciones de empaque.

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 17 / 37


Vericación de Supuestos
Normalidad

Denición (Kolmogorov-Smirnov)
Pruebas de signicación permiten contrastar la hipótesis de que las
muestras obtenidas proceden de poblaciones normales (simétricas conforma
de campana). Se debe vericar que para cada tratamiento, los datos
provienen de una población con distribución normal.

(Regla)
Se rechaza la hipótesis de normalidad si el valor p (sig.) es menor que 0,05.

En SPSS: Analizar -> Estadísticos Descriptivos -> Explorar -> Grácos ->
Grácos con prueba de normalidad.

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 18 / 37


Ejemplo de vericación de normalidad en SPSS
Verique si los datos de la supresión del crecimiento bacterial en carnes
almacenadas, provienen de una distribución normal (en cada condición).

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 19 / 37


Ejemplo de vericación de normalidad en SPSS

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 20 / 37


Ejemplo de vericación de normalidad en SPSS

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 21 / 37


Ejemplo de vericación de normalidad en SPSS

Pruebas de normalidad
a
Condiciones de Kolmogorov-Smirnov Shapiro-Wilk
empaques
Estadístico gl Sig. Estadístico gl Sig.
*
Número de bacterias Al vacio ,221 5 ,200 ,915 5 ,501
*
Mezcla de gases ,221 5 ,200 ,915 5 ,501
*
100% CO2 ,213 5 ,200 ,885 5 ,332
a. Corrección de la significación de Lilliefors
*. Este es un límite inferior de la significación verdadera.

Número de bacterias
SPSS también entrega la prueba de Shapiro-Wilk, la cual se utiliza
Gráficos Q-Q normales
cuando n
≤ 50, en caso contrario se utiliza la prueba de
Kolmogorov-Smirnov. Ambos métodos son para vericar el supuesto
de normalidad.

Utilizando la prueba de Kolmogorov-Smirnov, como en cada condición


de empaque el valor− p (sig.) es 0,20 > 0,05. Entonces, no se puede
rechazar la hipótesis de normalidad.

Si utilizamos la prueba de Shapiro-Wilk, la conclusión sería la misma,


con la única diferencia de que los valores− p no son los mismos.
mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 22 / 37
Vericación de Supuestos
Homogeneidad de varianzas

Denición (Prueba de Levene)


La prueba de Levene (1960) contrasta la hipótesis de que los grupos
denidos por la variable factor proceden de poblaciones con la misma
varianza (supuesto de homogeneidad de varianzas). Consiste en llevar a
cabo una ANOVA de un factor utilizando como variable dependiente la
diferencia en valor absoluto entre cada puntuación individual y la media (o
la mediana, o la media recortada) de su grupo.

(Regla)
Se Rechaza la hipótesis de homogeneidad, si el valor p (Sig.) es menor que
0, 05.

En SPSS: Analizar -> Estadísticos Descriptivos -> Explorar -> Grácos ->
Dispersión por nivel con prueba de Levene -> No transformados.

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 23 / 37


Ejemplo de vericación de homogeneidad en SPSS
Verique si los datos de la supresión del crecimiento bacterial en carnes
almacenadas, tiene varianzas iguales (entre cada condición de empaque).

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 24 / 37


Ejemplo de vericación de homogeneidad en SPSS

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 25 / 37


Ejemplo de vericación de homogeneidad en SPSS

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 26 / 37


Ejemplo de vericación de homogeneidad en SPSS

800

Prueba de homogeneidad de la varianza


700
Estadístico de

Número de bacterias
Levene gl1 gl2 Sig.
Número de bacterias Basándose en la media ,573 2 12 ,578
600
Basándose en la ,567 2 12 ,582
mediana.
Basándose en la mediana ,567 2 8,987 ,586
500
y con gl corregido
Basándose en la media ,628 2 12 ,550
recortada
400

Al vacio Mezcla de gases 100% CO2


Condiciones de empaques

Considere las hipótesis H0 : σ12 = σ22 = σ32 . (varianzas iguales para las
distintas condiciones de empaque)

Si consideramos la prueba de homogeneidad basado en la media, no


podríamos rechazar H0 , pues el valor− p = 0, 578 > 0, 05. Página 1

En el diagrama de caja, se nota esta armación, por lo menos en el


empaque al vacío y mezcla de gases.

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 27 / 37


Comparaciones Múltiples post hoc

Denición (Comparaciones Múltiples)


Método que permite comparar si existen diferencias signicativas entre un
par me tratamientos

Si se asume que cada tratamiento proviene de una distribución con la


misma varianza, comúnmente se utiliza el

método de Tukey (todas las comparaciones son referidas a la misma


diferencia mínima) o el
método de Dunnett (sirve para comparar todos los grupos con el
testigo.

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 28 / 37


Método de Tukey
Tukey (1949a) desarrolló un procedimiento, para las comparaciones en
pares de todas la medias de tratamiento, que se usa para obtener intervalos
de conanza simultáneos de 100(1 − α)%. La prueba se conoce también
como diferencia honestamente signicativa. Todas las comparaciones son
referidas a una misma diferencia mínima.

(Método de Tukey para todas las comparaciones por pares)


Para un grupo de t medias de tratamiento, se calcula la diferencia
honestamente signicativa como:

MCE
r
DHS (t , α) = q (α, t , n − t )
r
Las estimaciones de los intervalos simultáneos de dos lados para el valor
absoluto de todas las diferencias por pares, µi − µj . para toda i <j son:

y i − y j ± DHS (t , α).
mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 29 / 37
Método de Tukey

(Método de Tukey, para un número diferente de replicas)


Para un grupo de t medias de tratamiento, se calcula la diferencia
honestamente signicativa como:

MCE
s  
1 1
DHS (t , α) = q (α, t , n − t ) +
2 ri rj
Las estimaciones de los intervalos simultáneos de dos lados para el valor
absoluto de todas las diferencias por pares, µi − µj . para toda i <j son:

y i − y j ± DHS (t , α).

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 30 / 37


Método de Dunnett

(Método de Dunnett para comparar todos los tratamientos con un


control)
Para un grupo de t medias de tratamiento con un testigo (control), se
tiene:

· MCE
r
2
D (t − 1, α) = d (α, t − 1, n − t )
r
Las estimaciones de los intervalos de conanza simultáneos bilaterales (dos
colas) para las diferencias entre las medias de los tratamientos individuales
y la media del tratamiento testigo µi − µc , son:

y i − y c ± D (t − 1, α).

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 31 / 37


Método de Dunnett

(Método de Dunnett, para un número diferente de replicas)


Para un grupo de t medias de tratamiento con un control, se tiene:

s  
1 1
D (t − 1, α) = d (α, t − 1, n − t ) MCE +
ri rc
Las estimaciones de los intervalos de conanza simultáneos bilaterales (dos
colas) para las diferencias entre las medias de los tratamientos individuales
y la media del control µi − µ c , son:

y i − y c ± D (t − 1, α).

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 32 / 37


Ejemplo de la prueba comparaciones múltiples en SPSS

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 33 / 37


Ejemplo de la prueba comparaciones múltiples en SPSS

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 34 / 37


Ejemplo de la prueba comparaciones múltiples en SPSS

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 35 / 37


Ejemplo de la prueba comparaciones múltiples en SPSS
Comparaciones múltiples
Variable dependiente:Número de bacterias
(I) Condiciones de (J) Condiciones de Intervalo de confianza al 95%
empaques empaques
Diferencia de Límite
medias (I-J) Error típico Sig. Límite inferior superior
HSD de Tukey Al vacio Mezcla de gases -50,000 21,260 ,086 -106,72 6,72
*
100% CO2 138,000 21,260 ,000 81,28 194,72
Mezcla de gases Al vacio 50,000 21,260 ,086 -6,72 106,72
*
100% CO2 188,000 21,260 ,000 131,28 244,72
*
100% CO2 Al vacio -138,000 21,260 ,000 -194,72 -81,28
*
Mezcla de gases -188,000 21,260 ,000 -244,72 -131,28
a
t de Dunnett (bilateral) Mezcla de gases Al vacio 50,000 21,260 ,065 -3,20 103,20
*
100% CO2 Al vacio -138,000 21,260 ,000 -191,20 -84,80
*. La diferencia de medias es significativa al nivel 0.05.
a. Las pruebas t de Dunnett tratan un grupo como control y lo comparan con todos los demás grupos.

Subconjuntos homogéneos
SPSS entrega los intervalos de conanza y valores−
Número de bacterias
p. Cuando los
signos de los intervalos son
Condiciones de
empaques diferentes, no se podría armar que existen
Subconjunto para alfa = 0.05
N 1 2
a
diferencias
HSD de Tukey
signicativas
100% CO2 5
entre
510,00
esos tratamientos.
Al vacio 5 648,00

Por ejemplo, si consideramos


Mezcla de gases 5
el método
698,00
de Tukey y queremos
Sig. 1,000 ,086

comparar el empaque al vacío con el de mezcla de gases,


Se muestran las medias para los grupos en los subconjuntos homogéneos.

IC0,95 (µ1 − µ2 ) = (−106, 72; 6, 72). Lo que indicaría que no existen


a. Usa el tamaño muestral de la media armónica = 5,000.

diferencias en la cantidad de bacterias, entre estos dos empaques.

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 36 / 37


*
Mezcla de gases -188,000 21,260 ,000 -244,72 -131,28
a

Ejemplo de la prueba comparaciones múltiples en SPSS


t de Dunnett (bilateral) Mezcla de gases Al vacio 50,000 21,260 ,065 -3,20 103,20
*
100% CO2 Al vacio -138,000 21,260 ,000 -191,20 -84,80
*. La diferencia de medias es significativa al nivel 0.05.
a. Las pruebas t de Dunnett tratan un grupo como control y lo comparan con todos los demás grupos.

Subconjuntos homogéneos
Número de bacterias
Condiciones de Subconjunto para alfa = 0.05
empaques
N 1 2
a
HSD de Tukey 100% CO2 5 510,00
Al vacio 5 648,00
Mezcla de gases 5 698,00
Sig. 1,000 ,086
Se muestran las medias para los grupos en los subconjuntos homogéneos.
a. Usa el tamaño muestral de la media armónica = 5,000.

La misma conclusión se obtiene si consideramos el criterio del


p
valor− . Por ejemplo, si planteamos los hipótesis H0 : µ1 = µ2 v/s
H1 : µ1 6= µ2 . No podríamos rechazar la hipótesis nula (H0 ), pues el
valor−p = 0, 068 > 0, 05.
Por otro lado, IC0,95 (µ1 − µ3 ) = (81, 28; 194, 72), indicaría que existen
diferencias signicativas entre el empaque al vacío y de 100% de CO2 .
(µ1 > µ3 , pues el signo del intervalo es positivo). Equivalentemente,
Deberíamos rechazar la hipótesis nula (H0 : µ1 = µ3 ), pues el
valor−p = 0, 000 < 0, 05.
También se presenta una tabla resumen, de sub-grupos homogéneos
(estadísticamente iguales).

mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 37 / 37

You might also like