You are on page 1of 165

Diseos con ms de dos grupos independientes

Anlisis de varianza con dos factores


completamente aleatorizados

Tema 7

Diseos de un factor
intra-sujetos
Los diseos vistos en los temas
anteriores (1 solo factor inter o intrasujeto), aunque tienen una utilidad
muy amplia, no permiten abordar
cuestiones complejas como son las
posibles interacciones que se
pueden dar cuando se manipulan
varios factores a la vez.

Supongamos que un departamento


policial de una gran ciudad est
interesado en mejorar la actitud de los
nuevos oficiales hacia las minoras
radicadas en la ciudad. Los responsables
piensan que la mejora depender de la
duracin del curso que se les imparte
sobre relaciones humanas, pero no
descartan que tambin sea importante el
lugar, en el sentido de zona de la ciudad
donde se va a desarrollar posteriormente
su labor policial.

Para dar respuesta a esta pregunta,


contactan con un consultor
estadstico para que les disee la
experiencia de modo que puedan
posteriormente tomar decisiones a
partir de los resultados.

Al ser dos los factores o variables


independientes (duracin del curso
y zona de la ciudad) que hay que
considerar, el consultor elabora un
diseo en el que por un lado juega
con la zona de la ciudad donde se va
a impartir y por el otro con la
duracin.

En cada uno de los factores establece


tres niveles:
en el Factor A (zona) el curso se
imparte o en un barrio de clase alta, o de
clase media, o en un barrio
econmicamente deprimido, asociado a
la clase con ms nmero de grupos
minoritarios;
En el factor B (duracin del curso)
establecen tres niveles: de 5, de 10 o de
15 horas.

Una vez elaborado el diseo, realiza


una seleccin al azar de 45 policas
que van a participar en los cursos y
asigna 5 a cada combinacin de
zona y duracin.
Como variable dependiente se toma la
puntuacin alcanzada en un test,
previamente validado
(psicometra), sobre actitudes haca
grupos minoritarios.

Con un diseo factorial de este tipo no slo se


pueden alcanzar conclusiones sobre la
incidencia que tenga
a) la duracin del curso o
b) la ubicacin de la oficina policial donde
se imparte,
(que en trminos de los diseos
experimentales se conoce como efectos
principales del factor), sino que, adems,
c) se pueden llegar a conclusiones sobre si la
duracin y la zona estn relacionados de
algn modo (efectos de interaccin) entre
los factores.

En general, un diseo factorial es


ms eficiente que varios diseos
simples.
Es ms econmico, en el sentido de
que proporcionan ms informacin,
con menor nmero de sujetos
esfuerzos y tiempo.

Qu informacin proporciona un
diseo factorial?

Los responsables de la formacin de


los oficiales de polica pueden
contrastar, de manera
independiente, el efecto que tiene la
zona donde se imparte el curso, al
margen del tiempo.

Para ello slo se tendran en cuenta


los datos de los 15 oficiales
asignados a cada de las zonas (cinco
por cada uno de los tres grupos de
tiempo).

Tambin podran evaluar el efecto que


tiene la duracin del curso, al
margen de la zona, para lo cual slo se
tendran en cuenta los datos de los 15
oficiales asignados a cada tiempo de
duracin de curso, con independencia
de la zona en que se imparten.

Con esto, estaramos contrastando


los denominados efectos
principales, que sern tantos como
factores hay implicados en el diseo.

Adems de estos efectos principales,


hay un conjunto de contrastes ms
focalizados de cada factor con cada
nivel del otro factor, que representan
los llamados efectos simples, en el
sentido de que se contrastan los
tratamientos de un factor en cada
nivel del otro factor.

Aplicado al ejemplo de la
introduccin, un efecto simple es el
de la zona en que se imparte el curso
cuando est slo dura 5 horas.

Otro efecto simple es el del tiempo


de duracin del curso cuando ste se
imparte en una zona de clase media.

En total, hay tantos efectos simples


como la suma de los niveles de cada
factor.

Un tercer y ltimo efecto es el que se


produce por los cruces de los
tratamientos (o niveles) de cada uno
de los factores, que est relacionado
con los denominados efectos simples
y que se conoce como efecto de
interaccin.

Imaginemos, en el ejemplo de las


actitudes ante las minoras por parte
de los oficiales policiales, que para el
caso de la zona alta, la actitud de los
oficiales sube conforme aumenta la
duracin del curso, y lo mismo
sucede para las otras zonas.

Si este fuera el caso, el


comportamiento de la variable
dependiente estara relacionado slo
por la duracin y sera independiente
de la zona. En este caso, las lneas
del grfico de medias de la VD
respecto de la duracin, para cada
una de las zonas, seran ms o
menos paralelas.

Por el contrario, si se observaran


comportamientos diferentes de la VD
respecto de la duracin en funcin de la
zona, las lneas del grfico de medias
tenderan a cruzarse, o se cruzaran de
hecho, en algn lugar del plano.
En este ltimo caso, diramos que se ha
producido una interaccin (que habra
que confirmar analticamente como
veremos ms adelante).

Patrones usuales en la
interaccin

Interaccin
What type of body do women like? American
women generally prefer men of average build,
but bigger above the waist than below. The
studies tell us they prefer V's to pears.
However, taste varies depending on the class
of the woman judging the male anatomy.
Women on the lower end of the socioeconomic
totem pole prefer muscle men. Conversely,
highly paid professional women find hefty
beefcake downright distasteful. They go for the
dark, slim, and sensitive body types.

Interaccin
Los factores que estn
manipulando en este
estudio son:
A)Clase social de la mujer
B)Fsico masculino
La variable dependiente es
el juicio que emiten estas
mujeres sobre el fsico.

Interaccin
Eso es una interaccin: no
podemos decir, sin ms,
que a las mujeres les
gustan los hombres
musculosos (o con forma
de V) sino que su
preferencia depende de
la clase social a la que
pertenece.

Interaccin
Como regla general,
podemos decir que si las
lneas que conectan las
medias de los niveles de
los factores no son
paralelas (en trminos
estadsticos) entonces
tenemos una interaccin.

Esto no es una interaccin

Slo parece haber efecto


del tipo de fsico (factor
principal)

Slo parece haber efecto


de la clase social

Hay efecto, tanto de la clase


social como del fsico pero no de
la interaccin

Esto tampoco es una


interaccin

Interaccin

Interaccin y efectos
principales

La presencia de interaccin de un
diseo factorial obliga a ir ms all
de las conclusiones que se sacan a
partir de los efectos principales, pues
stos, para cada factor, deben ser
interpretados teniendo en
cuenta los niveles del otro
factor.

1 definicin
Una interaccin est presente
cuando los efectos de una variable
independiente sobre la conducta
objeto de estudio cambia en los
diferentes niveles de la otra variable
independiente (este cambio, no
significa que una variable
independiente influya sobre la otra;
de hecho, las variables
independientes son, valga la

2 definicin
Una interaccin est presente
cuando los patrones de
diferencias asociados con una
variable independiente cambia con
los diferentes niveles de la otra
variable independiente.

3 definicin
Una interaccin est presente
cuando los efectos simples de una
variable independiente no son los
mismos en todos los niveles de la
otra variable independiente.

4 definicin
Una interaccin est presente
cuando los efectos principales de una
variable independiente no son
representativos de los efectos
simples de esa misma variable.

5 definicin
Una interaccin est presente
cuando las diferencias entre las
medias de las celdas que
representan el efecto de un factor en
algn nivel del otro factor no son
iguales a las correspondientes
diferencias en otro nivel de este
factor.

6 definicin
Una interaccin est presente
cuando los efectos de una de las
variables independientes estn
condicionalmente relacionados a los
niveles de la otra variable
independiente (Cohen, 1983).

7 definicin
Una interaccin est presente
cuando una variable independiente
no tiene un efecto constante en
todos los niveles de la otra variable
independiente (Pedhazur, 1982).

Algunos ejemplos de datos de


diseos factoriales 3x3 (esta es la
forma de representar simblicamente
un diseo de dos factores, ya que
solo hay dos dgitos, y cada uno de
ellos compuesto de tres niveles),
donde se muestran grficos de
medias de tratamientos, dos de ellos
con interaccin y uno sin interaccin.

En los diseos factoriales de 2 factores (que


denotaremos genricamente como los factores
A y B) se sigue un patrn de anlisis similar,
pero en esta ocasin la suma de cuadrados
entre-grupos se divide a su vez en tres
componentes que reflejan: (1) la suma de
cuadrados entre tratamientos del factor A
(SCA), que refleja los efectos principales del
factor A; (2) la suma de cuadrados entre
tratamientos del factor B (SCB), que refleja los
efectos principales del factor B; y (3) la suma
de cuadrados que representa la interaccin
entre A y B (SCAxB).

Los datos en un diseo factorial de


dos factores se pueden representar
en una tabla de doble entrada

Tambin se pueden representar en


forma de columnas con las dos
primeras filas representando los
diferentes combinaciones de los
niveles de los factores.

Para un diseo como el planteado en


la introduccin, con 2 factores (3
niveles por factor y 5 sujeto en cada
cruce de tratamiento) diramos que
tenemos un diseo factorial 3x3.
Al tener 3 niveles cada factor, el
nmero de tratamientos es 9, es
decir, el producto de los niveles de
los factores 3 x 3 = 9.

Una observacin genrica se


representa como

Yijk

siendo i el nivel genrico del factor A,


j el nivel genrico del factor B, y k la
observacin genrica dentro del
tratamiento ABij.

A partir de esta matriz de datos se


obtienen las sumas de los
tratamientos de cada factor (que en
la figura se designan como sumas
marginales -Ai para el factor A y Bj
para el factor B-) y la suma total de
todas las observaciones
representada por T.

A partir de los sumatorios, tambin


se pueden obtener las medias
generales para cada factor, para el
total del sistema y para la
interaccin mediante las frmulas:

Variabilidad del sistema


Previamente hemos visto que la
suma de cuadrados total (SCT) es
igual a la suma de cuadrados entregrupos (o tratamientos) y la suma de
cuadrados intra-grupo:

Esta igualdad se mantiene en un diseo


factorial aunque con algunas
consideraciones sobre en qu
componentes est basada ahora la suma
de cuadrados entre-grupos (SCE).
En un diseo de un factor, SC E est
basada en las desviaciones de las medias
de cada tratamiento respecto la media
total, es decir, siendo A el factor, y
prescindiendo de los sumatorios propios
en el clculo de las sumas de cuadrados,
est basada en las desviaciones

Sin embargo, en un diseo factorial


de dos factores, SCE (entre grupos)
est basada en las desviaciones de
las medias de cada tratamiento
conjunto AB, respecto de la media
total:

Si pensamos en un grupo de sujetos


que reciben una combinacin de
tratamientos A y B, la desviacin
respecto de la media total del
sistema puede estar influida por tres
componentes: el Factor A, el Factor
B, y la interaccin entre A y B, y cada
una de estas influencias puede ser
expresada de la siguiente forma

De ello se concluye que la desviacin


de cualquier puntuacin individual
respecto de la media total del
conjunto de datos del diseo se
puede dividir en cuatro componentes
de desviacin:

El primer componente es el relacionado


con los efectos del tratamiento A i
El segundo es el relacionado con los
efectos del tratamiento Bj
El tercero es el efecto de la interaccin
entre ambos factores
El cuarto es la desviacin de la puntuacin
del sujeto respecto del tratamiento que le
ha sido asignado aleatoriamente.

A partir de aqu, solo quedara


realizar los sumatorios y elevar al
cuadrado para obtener las
correspondientes sumas de
cuadrados para el anlisis de
varianza.

Las fuentes de variabilidad de cada


observacin son tres de ellas relacionadas
con los tratamientos (que expresaran,
adems del error experimental, las
posibles diferencias que pudieran darse
entre tratamientos), y una relacionada con
su propio grupo (que sera la expresin del
error experimental, nicamente), fuentes
que denominaremos,
A, B, AB y S/AB,

Ahora debemos de determinar los


grados de libertad para cada una de
estas fuentes. Para los efectos
principales se sigue la misma regla
del nmero de tratamientos menos
1.

Los grados de libertad de la


interaccin es el resultado del
producto de los grados de libertad
asociados con los factores A y B.

(3 x 3) = 9 puntuaciones iguales Abij


Menos 3 medias del factor A
Menos 3 medias del factor B
Ms una Media total

933+1=
(3-1)(3-1)=

Los grados de libertad debidos al


error experimental, es decir, a las
diferencias individuales dentro de
cada tratamiento, y habida cuenta
de que en cualquier de ellos los
grados de libertad son n-1, los
asociados al error son

n a b a b (a b)(n 1)

Proceso de clculo del ANOVA de dos


factores

Ejemplo

A partir de estos valores se calculan


las SC (o SS):

Se comprueba que

Grados de libertad
g .l. A a 1 3 1 2

Grados de libertad
g .l. A a 1 3 1 2
g .l.B b 1 3 1 2

Grados de libertad
g .l. A a 1 3 1 2
g .l.B b 1 3 1 2
g .l. AxB a b a b 1 3 3 3 3 1 9 6 1 4

Grados de libertad
g .l. A a 1 3 1 2
g .l.B b 1 3 1 2
g .l. AxB a b a b 1 3 3 3 3 1 9 6 1 4

g.l.B a b s a b a b ( s 1) 3 3 (5 1) 34

Grados de libertad
g .l. A a 1 3 1 2
g .l.B b 1 3 1 2
g .l. AxB a b a b 1 3 3 3 3 1 9 6 1 4

g.l.S / AB a b s a b a b ( s 1) 3 3 (5 1) 36

g .l.T a b s 1 3 3 5 1 44

Tabla del anova

Los resultados ponen de manifiesto que


los efectos principales del factor B
(duracin del curso) y de la
interaccin son significativos. Conviene,
no obstante, representar grficamente
las medias de los tratamientos cada uno
de los factores, para ver los efectos
principales, y tambin las medias de los
tratamientos para ver el sentido de la
interaccin a travs de la representacin
de los efectos simples.

165
33
5
175
35
5
190
38
5

150
30
5
150
30
5
185
37
5

100
20
5
200
40
5
260
52
5

A partir de los grficos es posible


anticipar por qu la interaccin
resulta significativa. Observe el
estudiante los grficos que
representan los efectos principales
del factor Zona, y el segundo, los
efectos simples del factor Zona en
funcin de los tres niveles del factor
Duracin

Como demuestra la tabla del ANOVA,


los tratamientos del factor Zona no
resultan ser estadsticamente
diferentes, y esto es lo que debera
suceder en cada uno de los tres
efectos simples si no existiera la
interaccin.
Sin embargo, el segundo grfico
muestra que esta falta de diferencias
no parece darse en todas los niveles
del otro factor.

Quizs no haya diferencias entre


zonas en los niveles de 5 y 10 horas,
pero s se observan diferencias en el
nivel de 15 horas, entre, por un lado,
las zonas alta y media (con una
puntuacin media de 38 y 37,
respectivamente), y por otro la zona
deprimida (con una puntuacin
media de 52).

El modelo estadstico
El modelo estadstico que subyace en
un diseo factorial de 2 factores
completamente aleatorizados es un
modelo lineal en el cual se
especifican los componentes que
contribuyen a explicar cualquier
puntuacin Yijk

T es la media total de la poblacin


i es el promedio del efecto del
tratamiento en el nivel ai (i = i - T)
j es el promedio del efecto del
tratamiento en el nivel bj (j = j - T)
()ij es el efecto de la interaccin en la
celda aibj (()ij =ij -i -j +T)
ijk es el error experimental asociado con
cada puntuacin (ijk = Yijk - ij)

Las hiptesis estadsticas con este


modelo se pueden expresar de la
siguiente forma:

Los valores esperados (E) de las


medias cuadrticas calculados en el
ANOVA, E(MC), se refieren a los
factores que contribuyen al valor
promedio de cada media cuadrtica
obtenida mediante sucesivos
muestreos aleatorios de una
poblacin dada.

Modelo de efectos fijos

El valor esperado del error

Como en el diseo de un factor, la


lgica del anlisis es la formacin de
las razones

Bajo la hiptesis nula, el componente de la


varianza que refleja el efecto ser cero y por
tanto

Luego el cociente

ser igual a la unidad excepto variaciones


debidas al azar.

Si la hiptesis nula es falsa, el valor


de MCefecto ser significativamente
superior a MCerror y, por consiguiente,
la razn entre ambas medias
cuadrticas ser superior a la unidad
(tanto ms cuanto mayor sea la
varianza aportada por el efecto y
ms pequea sea MCerror).

Esta razn se distribuye segn la


distribucin de probabilidad F con los
grados de libertad de las MC del
numerador y del denominador

bajo los supuestos de normalidad,


homocedasticidad e independencia.

Anlisis de la interaccin
La prueba anterior en donde se evalu la
significatividad de los efectos principales
y la interaccin entre factores se conoce
como prueba mnibus (global) debido a
que no diferencia entre niveles, esto es, el
efecto de un factor principal con tres
niveles puede ser significativo segn el
test anterior pero ste no nos indicar si
las tres comparaciones posibles entre
niveles son todas ellas significativas o solo
lo son un subconjunto de las mismas.

El que el efecto de interaccin sea


significativo, no supone que no
prestemos atencin a los efectos
principales, slo que su
interpretacin, caso de resultar
significativos, debe hacerse teniendo
en cuenta los resultados obtenidos
en el anlisis de los efectos simples,
y sobre todo el marco terico en el
que se desarrollan las hiptesis de

Contrate de los efectos


simples
Seguiremos la lgica de razones
bsicas que hemos utilizado en el
ANOVA. Para este anlisis partimos
de la matriz AB, que contiene las
sumas de las puntuaciones de los
tratamientos.

La manera de enfocar este anlisis


es convertir cada columna o fila de
la matriz AB en un diseo de un solo
factor y luego obtener las sumas de
cuadrados entre grupos del mismo
modo que ha hecho con las sumas
de cuadrados de los efectos
principales.

En el caso de los
efectos principales
del factor A, las dos
razones bsicas para
el clculo de la SCA,
son:

Siguiendo esta
lgica, la suma de
cuadrados del factor
A en el nivel b1 del
factor B es:

Gl = a-1

Las medias cuadrticas para los


efectos simples se obtienen de la
misma manera que en el anlisis
general, dividiendo la suma de
cuadrados por los grados de libertad.
El denominador de la F es la media
cuadrtica intra-grupos del anlisis
general, es decir

Del mismo modo se calcularan los


efectos simples para el factor B en
relacin a los niveles del factor A.

Al haber tres niveles por factor, los


grados de libertad sern 2 (a 1 y b
1) para ambas sumas de cuadrados
y las medias cuadrticas sern el
resultado del cociente entre las SC y
sus grados de libertad.

Los efectos principales de un


factor son independientes del efecto
de interaccin (es decir, son
ortogonales), pero los efectos
simples del factor A no son
independientes ni de los efectos
principales del Factor A ni de su
interaccin con el factor B, de hecho
su suma es igual a la suma de los
efectos principales y la interaccin
(lo mismo sucede con los efectos
simples del factor B):

SC

B en ai

SC B SC AB

El efecto principal del Factor A no es


significativo, pero los grficos
sealaban que esa falta de efecto no
se produca en alguno de los niveles
del factor B. De hecho, hay dos
efectos simples del factor A
significativos (concretamente, en los
niveles b1 y b3).

Tambin hay una diferencia entre los


efectos principales del factor B y sus
efectos simples. Los efectos
principales son ampliamente
significativos, y de hecho el test de
comparaciones mltiples refleja
diferencias significativas entres los
tres niveles del factor,

Sin embargo, en los efectos simples,


slo en el nivel a3 se producen
diferencias significativas, lo que
implica que ese nivel capitaliza todas
las diferencias reflejadas en el efecto
principal.

El valor terico de referencia (la F


crtica) para las comparaciones
simples

Comparaciones por pares dentro


de los efectos simples
Desarrollaremos el anlisis solo para
aquellos efectos simples que han
resultado significativos, el factor A en
los niveles b1 y b3 y el factor B en el
nivel a3.

Factor A: medias para los niveles


significativos y los coeficientes para
los contrastes que habra que realizar
para las comparaciones que nos
resultan interesantes tericamente.

Factor B: medias para los niveles


significativos y los coeficientes para
los contrastes que habra que realizar
para las comparaciones que nos
resultan interesantes tericamente.

Comparaciones por pares dentro


de los efectos simples
En el efecto simple del factor A slo se
realiza un contraste entre la media mayor,
52, en el nivel a3, y la segunda mayor, 38,
en el nivel a1 en b3. La razn de hacer un
solo contraste en este caso es que entre
las medias de los niveles a 1 y a2 hay una
diferencia de un punto (de 37 a 38) y
claramente no resultar significativa dicha
diferencia de modo que solo se realizan
para las dos medias mencionadas.

La frmula para la comparacin

Y aplicada a un efecto simple:

Donde
se refiere a las diferencias entre las
dos medias especificadas en cada
contraste, cuya expresin es

Aplicado al contraste del factor A, se


tiene:

Luego las sumas de cuadrados


correspondientes sern:

El nmero de grados de libertad para


la comparacin es 1, pues se estn
comparando solo dos niveles, y para
el clculo de la razn F el divisor es
la media cuadrtica error de la
prueba mnibus. Por lo tanto su valor
es:

Y al ser la F crtica con 1 y


36 grados de libertad
igual a 4,11

valor inferior al obtenido,


la comparacin resulta
significativa
En consecuencia tambin
lo ser con la media del
nivel a2.

Para el segundo contraste del factor


A

Para el tercer contraste del factor A

Para el primer contraste del factor B

Quedan dos contrastes ms, pero


son idnticos a lo visto hasta el
momento.

Y las SC son:

Las MC = SC en este caso ya que gl = 1

Al ser el valor terico de F el mismo


que calculamos previamente

los cinco contrastes resultan


significativos.

Cmo se acta cuando no es


significativo el efecto de interaccin?
Cuando se analiza un diseo
factorial, se hace la prueba mnibus
para los efectos principales y el
efecto de interaccin. Si sta ltima
no es significativa, es preciso
rehacer el anlisis focalizndolo slo
sobre los efectos principales.

Cmo se acta cuando no es


significativo el efecto de interaccin?
Esto tiene consecuencias en la tabla
del ANOVA, en el sentido de que
aumenta la suma de cuadrados del
error en la misma cuanta que la
suma de cuadrados de la interaccin,
y tambin los grados de libertad en
la misma cuanta que los grados de
libertad del efecto de interaccin.

Cmo se acta cuando no es


significativo el efecto de interaccin?
La consecuencia es que el valor de la
F del contraste se reduce, por el
aumento que se da en el valor de la
media cuadrtica del error.

Cuando el efecto de interaccin no


forma parte del modelo, el valor de
la suma de cuadrados de error es
igual a la suma de cuadrados error
cuando entra la interaccin y la
suma de cuadrados de la interaccin.

3336.67 = 1226.67 + 2110

Y los grados de libertad


40 = 36 + 4.
Los valores de F para los efectos
principales son inferiores, por el
aumento de la media cuadrtica del
error que pasa de 58,611 a 83,417.

Los valores de F para los efectos


principales son inferiores, por el
aumento de la media cuadrtica del
error que pasa de 58,611 a 83,417.

9.670 < 13.763


1.139 < 1.621

Porqu los fsicos cunticos nunca


hacen el amor?
Porque si encuentran la posicin no
encuentran el momento y si
encuentran el momento no dan con
la posicin.

Cmo interpretar un
experimento?
Un bioestadstico
decide llevar a cabo un experimento
completo sobre los efectos del alcohol sobre la
conducta humana.
Para ello, el primer da ingiere diez cubalibres y se
emborracha.
Una semana despus, se bebe una decena de
combinados de ron con Coca-Cola y vuelve a
experimentar los mismos efectos perniciosos.
En sucesivas semanas, repite el ensayo mezclando el
mismo refresco con vodka, brandy, whisky y otras
bebidas de alta graduacin. Finalmente publica un
artculo en el que afirma que lo que embriaga es la
Coca-Cola ya que es el nico producto que haba en
comn con los diferentes combinados.

Sobre la interpretacin de las


estadsticas
En Nueva York, un hombre es
atropellado cada 10 minutos.
El pobre tiene que estar hecho polvo.

Los cientficos son personales


normales. Y si no, qu me dicen de la
forma en que se descubrieron las
huellas fsiles de Laetoli, hechas por
unos homnidos hace 3.7 millones de
aos se descubrieron una tarde de
1976 mientras un grupo de
paleontlogos se diverta tirndose
boigas de elefante adems,
tenan que se hombres.

Cuando a Thomas Bouch (18221880) se le pregunt la razn del


particular trazado del puente Tay que
se desplom en 1879 y del cual l
haba sido el diseador, respondi lo
siguiente: porque facilitaba los
clculos.

You might also like