Professional Documents
Culture Documents
ANOVA
DE 1 Y
2
FACTO
RES
PROF.:
Angel garcia
AUTOR:
Yoger Mendez exp:2009100220
INTRODUCCION
En estadstica, el anlisis de la varianza (ANOVA, Analysis Of Variance,
segn terminologa inglesa) es una coleccin de modelos estadsticos y sus
procedimientos asociados, en el cual la varianza est particionada en ciertos
componentes debidos a diferentes variables explicativas.
Las tcnicas iniciales del anlisis de varianza fueron desarrolladas por
el estadstico y genetista R. A. Fisher en los aos 1920 y 1930 y es algunas
veces conocido como "Anova de Fisher" o "anlisis de varianza de Fisher",
debido al uso de la distribucin F de Fisher como parte del contraste de
hiptesis.
El anlisis de la varianza parte de los conceptos de regresin lineal. Un
anlisis de la varianza permite determinar si diferentes tratamientos muestran
diferencias significativas o por el contrario puede suponerse que sus medias
poblacionales no difieren. El anlisis de la varianza permite superar las
limitaciones de hacer contrastes bilaterales por parejas (que son un mal
mtodo para determinar si un conjunto de variables con n > 2 difieren entre s.
MediaGlobal:
Variacin Total:
Variacin Intra-grupos:
Variacin Inter-grupos:
Siendo xij el i-simo valor de la muestra j-sima; nj el tamao de dicha
muestra y su media.
Cuando la hiptesis nula es cierta SCE/K-1 y SCD/n-K son dos
estimadores insesgados de la varianza poblacional y el cociente entre ambos
se distribuye segn una F de Snedecor con K-1 grados de libertad en el
numerador y N-K grados de libertad en el denominador. Por lo tanto, si H0 es
cierta es de esperar que el cociente entre ambas estimaciones ser
aproximadamente igual a 1, de forma que se rechazar H0 si dicho cociente
difiere significativamente de 1.
La secuencia para realizar un ANOVA es:
Analizar
Comparar medias
ANOVA de un factor
Se abre el siguiente cuadro de dilogo:
SS
MS
SSA
SSA/(a - 1)
SSB
SSB/(b - 1)
SSAB SSAB/[(a - 1)(b - 1)]
SSE
SSE/[ab(n - 1)]
SST
Valor esperado
MSA
MSB
MSAB
MSE
Por lo tanto, los estadsticos MSAB/MSE, MSA/MSE y MSB/MSE se
distribuyen como una F con los grados de libertad correspondientes y
permiten contrastar, respectivamente, las hiptesis:
ii) no existe efecto del primer factor, es decir, diferencias entre niveles del
primer factor (MSA/MSE)
Valor esperado
donde
son, respectivamente las componentes aadidas por el
primer factor, por el segundo y por la interaccin, que tienen la misma forma
quelos del modelo I, sin ms que cambiari y j por Ai y Bj,
respectivamente.
La interaccin se contrasta, como en el modelo I, con MSAB/MSE, si se
rechaza la hiptesis nula se contrastaran cada uno de los factores
con MSA/MSAB yMSB/MSAB.
En un modelo II, como no se est interesado en estimar los efectos de
los factores sino slo la existencia de la componente aadida, s tiene sentido
G.L.
SS
MS
1 factor
315,8
78,95
2 factor
823,5
274,5
12
328,9
27,41
Error
100
2308,0
23,08
Total
119
3776,2
Interaccin
Valor esperado
MSA
MSB
MSAB
MSE
Se contrastan la interaccin y el factor aleatorio con el trmino de error,
si la interaccin fuera significativa no tiene sentido contrastar el efecto fijo y
si no lo fuera, el efecto fijo se contrasta con el trmino de interaccin o con el
promedio de interaccin y error.
Ejemplo
Se quiere probar la eficacia de un somnfero estudiando posibles
diferencias de la misma por el sexo de los sujetos. Se eligen al azar dos grupos
de insomnes varones y otros dos de mujeres y tanto para los hombres como
para las mujeres se suministra a un grupo el somnfero y a otro un placebo y se
mide, en minutos, el tiempo que tardan en dormirse.
Somnfero
35
32
30
25
30
42
30
15
18
23
Hombre
Mujer
y la tabla de medias
Por tanto la estimacin del efecto del somnifero es 39,8 - 28,0=11,8 min
Tamaos muestrales desiguales en un anova de dos factores
Aunque los paquetes estadsticos suelen hacer el anova de dos factores,
tanto en el caso de tamaos muestrales iguales como desiguales, conviene
resaltar que el anlisis es bastante ms complicado en el caso de tamaos
desiguales. La complicacin se debe a que con tamaos desiguales hay que
ponderar las sumas de cuadrados de los factores con los tamaos muestrales y
no resultan ortogonales (su suma no es la suma de cuadrados total) lo que
complica no slo los clculos sino tambin los contrastes de hiptesis.
Por esto, cuando se disea un anlisis factorial de la varianza se
recomienda disearlo con tamaos iguales. Hay ocasiones en que, sin
embargo, por la dificultad de obtener los datos o por prdida de alguno de
ellos es inevitable recurrir al anlisis con tamaos desiguales. Algunos autores
recomiendan, incluso, renunciar a alguno de los datos para conseguir que
todas las muestras tengan el mismo tamao. Evidentemente esta solucin es
delicada pues podra afectar a la aleatoriedad de las muestras.
Casos particulares: Anova de dos factores sin repeticin
En ciertos estudios en que los datos son difciles de obtener o presentan
muy poca variabilidad dentro de cada subgrupo es posible plantearse un anova
sin repeticin, es decir, en el que en cada muestra slo hay una observacin
(n=1). Hay que tener en cuenta que, como era de esperar con este diseo, no se
puede calcular SSE. El trmino de interaccin recibe el nombre de residuo y
Analgsico A <Analgsico
B
20
22
35
42
50
30
40
35
30
22
SS
748,8
767,6
409,2
1925,6
MS
374,4
191,9
51,15
y el resultado
Los tres primeros subndices para los factores y el cuarto para las repeticiones,
ntese que aparecen trminos de interaccin de segundo y tercer orden, en
general en un modelo de k factores aparecen trminos de interaccin de orden
2, 3,... hasta k y el nmero de trminos de interaccin de orden n ser el