You are on page 1of 34

1

2011

UNED


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS
[TEMA 7]
Diseos con ms de dos grupos independientes. Anlisis de varianza con dos factores completamente
aleatorizados


2




ndice
7.1 Introduccin ............................................................................................................................................. 3
7.2 Objetivos del tema ................................................................................................................................... 3
7.3 Qu informacin proporciona un diseo factorial? ............................................................................... 4
7.4 Reglas para el clculo de los efectos principales y del efecto de interaccin .......................................... 7
7.4.1 Diseo y notacin .............................................................................................................................. 8
7.4.2 Variabilidad del sistema .................................................................................................................... 9
7.4.3 Proceso de clculo del ANOVA de dos factores .............................................................................. 11
7.4.4 Desarrollo del ANOVA de 2 factores con un ejemplo ..................................................................... 12
7.5 El modelo estadstico ............................................................................................................................. 18
7.6 Anlisis de la interaccin ........................................................................................................................ 20
7.6.1 Comparaciones por pares dentro de los efectos simples ............................................................... 24
7.6.2 Cmo se acta cuando no es significativo el efecto de interaccin? ............................................ 28
7.7 Resumen ................................................................................................................................................. 29
7.8 Ejercicios de autoevaluacin .................................................................................................................. 29
7.8.1 Preguntas ......................................................................................................................................... 30
7.8.2 Soluciones ejercicios de autoevaluacin ......................................................................................... 31
7.8.3 Respuestas ....................................................................................................................................... 33




3

7.1 Introduccin
En los dos captulos precedentes, se han estudiado dos diseos de ms de dos grupos, uno con grupos
completamente aleatorizados (cap. 5) y otro con grupos de medidas repetidas (cap. 6). En los primeros, los
sujetos, definidos stos en sentido amplio, se asignan aleatoriamente a cada uno de los niveles del factor, de
modo que cada sujeto slo recibe uno de los posibles tratamientos establecidos en el diseo. En los
segundos, cada sujeto pasan por todos los tratamientos del diseo. El primer tipo de diseo se conoce como
un diseo completamente aleatorizado, y el segundo de medidas repetidas. No obstante, este tipo de
diseos de un solo factor an teniendo una utilidad muy amplia, no permite abordar cuestiones complejas
que se dan muy a menudo en el mundo real, como son las posibles interacciones que se pueden dar
cuando se manipulan varios factores a la vez y su incidencia sobre la variable objeto de estudio.
Para comprender lo anterior, supongamos que un departamento policial de una gran ciudad est
interesado en mejorar la actitud de los nuevos oficiales hacia las minoras radicadas en la ciudad. Los
responsables piensan que la mejora depender de la duracin del curso que se les imparte sobre relaciones
humanas, pero no descartan que tambin sea importante el lugar, en el sentido de zona de la ciudad donde
se va a desarrollar posteriormente su labor policial. Para dar respuesta a esta inquietud, contactan con un
consultor estadstico para que les disee la experiencia de modo que puedan posteriormente tomar
decisiones a partir de los resultados. Al ser dos los factores o variables independientes (duracin del curso y
zona de la ciudad) que hay que considerar, el consultor elabora un diseo en el que por un lado juega con la
zona de la ciudad donde se va a impartir y por el otro con la duracin. En cada uno de los factores establece
tres niveles: en el Factor A (zona) el curso se imparte o en un barrio de clase alta, o de clase media, o en un
barrio econmicamente deprimido, asociado a la clase con ms nmero de grupos minoritarios; respecto de
la duracin del curso establecen tres niveles: de 5, de 10 o de 15 horas. Una vez elaborado el diseo, realiza
una seleccin al azar de 45 policas que van a participar en los cursos y asigna 5 a cada combinacin de zona
y duracin. Como variable dependiente se toma la puntuacin alcanzada en un test, previamente validado,
sobre actitudes haca grupos minoritarios.
Con un diseo factorial de este tipo no slo se pueden alcanzar conclusiones sobre la incidencia que
tenga la duracin del curso o la ubicacin de la oficina policial donde se imparte, que en trminos de los
diseos experimentales se conoce como efectos principales del factor, sino que, adems, se pueden llegar a
conclusiones sobre si la duracin y la zona estn relacionados de algn modo, lo cual se conoce como efectos
de interaccin entre los factores. En general, un diseo factorial es ms eficiente que varios diseos simples.
Es ms econmico, en el sentido de que proporcionan ms informacin, con menor nmero de sujetos
esfuerzos y tiempo. En este captulo vamos a estudiar la tcnica de anlisis de diseos de dos factores
completamente aleatorizados y presentando las posibilidades de contrastes que estos diseos permiten.

7.2 Objetivos del tema
En este tema vamos a aprender los siguientes aspectos de un diseo factorial de 2 factores
completamente aleatorizados:
La disposicin de los datos y la notacin
Identificar los diversos efectos que estn presenten en el diseo (principales, de
interaccin y simples)
Mtodo de clculo para el contraste de la significacin estadstica de estos efectos


4

Mtodos para el clculo de los efectos simples presentes en el diseo
Mtodos de clculo para las comparaciones por pares de los efectos simples
significativos
7.3 Qu informacin proporciona un diseo factorial?
Pensemos en el diseo expuesto en la introduccin. Tal como est planteado, los responsables de la
formacin de los oficiales de polica pueden contrastar, de manera independiente, el efecto que tiene la
zona donde se imparte el curso, al margen del tiempo. Para ello slo se tendran en cuenta los datos de los
15 oficiales asignados a cada de las zonas (cinco por cada uno de los tres grupos de tiempo) ver Figura 7.1-.
Tambin podran evaluar el efecto que tiene la duracin del curso, al margen de la zona, para lo cual slo se
tendran en cuenta los datos de los 15 oficiales asignados a cada tiempo de duracin de curso, con
independencia de la zona en que se imparten. Con esto, estaramos contrastando los denominados efectos
principales, que sern tantos como factores hay implicados en el diseo.



Figura 7.1 Posibles contrastes en un diseo factorial de dos factores
Adems de estos efectos principales (tantos como factores hay), cuyos contrastes no difieren del ya
estudiado en el captulo 5, hay un conjunto de contrastes ms focalizados de cada factor con cada nivel del


5

otro factor, que representan los llamados efectos simples, en el sentido de que se contrastan los
tratamientos de un factor en cada nivel del otro factor. Aplicado al ejemplo de la introduccin, un efecto
simple es el de la zona en que se imparte el curso cuando est slo dura 5 horas. Otro efecto simple es el del
tiempo de duracin del curso cuando ste se imparte en una zona de clase media. En total, hay tantos
efectos simples como la suma de los niveles de cada factor. En cada uno de estos contrastes slo entran en
juego los sujetos asignados aleatoriamente a cada una de los tres niveles de un factor condicionado a un
nivel del otro factor. Para el caso del ejemplo de la introduccin, cada nivel estara compuesto por 5
oficiales.
Un tercer y ltimo efecto es el que se produce por los cruces de los tratamientos (o niveles) de cada uno
de los factores, que est relacionado con los denominados efectos simples y que se conoce como efecto de
interaccin. Aunque luego lo veremos con datos, imaginemos, en el ejemplo de las actitudes ante las
minoras por parte de los oficiales policiales, que para el caso de la zona alta, la actitud de los oficiales sube
conforme aumenta la duracin del curso, y lo mismo sucede para las otras zonas. Si este fuera el caso, el
comportamiento de la variable dependiente estara relacionado slo por la duracin y sera independiente
de la zona. En este caso, las lneas del grfico de medias de la VD respecto de la duracin, para cada una de
las zonas, seran ms o menos paralelas. Por el contrario, si se observaran comportamientos diferentes de la
VD respecto de la duracin en funcin de la zona, las lneas del grfico de medias tenderan a cruzarse, o se
cruzaran de hecho, en algn lugar del plano, tal como de hecho sucede con los datos del ejemplo que
veremos en el prximo epgrafe. En este ltimo caso, diramos que se ha producido una interaccin (que
habra que confirmar analticamente como veremos ms adelante).
La presencia de interaccin de un diseo factorial obliga a ir ms all de las conclusiones que se sacan a
partir de los efectos principales, pues stos, para cada factor, deben ser interpretados teniendo en cuenta
los niveles del otro factor. Hay muchas definiciones de interaccin, todas ellas equivalentes pero con nfasis
en distintos aspectos de la misma. En el Cuadro 7.1 hacemos una relacin de stas para hacerse una idea de
la importancia que se le concede a este concepto (interaccin entre factores).
Cuadro 7.1 Definiciones sobre el concepto de interaccin en un diseo factorial

Una interaccin est presente cuando los efectos de una variable independiente sobre la conducta
objeto de estudio cambia en los diferentes niveles de la otra variable independiente (este cambio, no
significa que una variable independiente influya sobre la otra; de hecho, las variables independientes
son, valga la redundancia, independientes entre s).
Una interaccin est presente cuando los patrones de diferencias asociados con una variable
independiente cambia con los diferentes niveles de la otra variable independiente. Para entender
esto, supongamos que en un diseo experimental tenemos que uno de los factores est compuesto
por tres niveles, un grupo control y dos tratamientos experimentales. Es posible que consideremos
realizar comparaciones entre los dos tratamientos experimentales y entre el control y cada uno de
los tratamientos, o entre el control y una combinacin de los tratamientos. Si est presente una
interaccin, el patrn de estas diferencias no ser el mismo en cada nivel del otro factor.
Una interaccin est presente cuando los efectos simples de una variable independiente no son los
mismos en todos los niveles de la otra variable independiente.
Una interaccin est presente cuando los efectos principales de una variable independiente no son
representativos de los efectos simples de esa misma variable.
Una interaccin est presente cuando las diferencias entre las medias de las celdas que representan
el efecto de un factor en algn nivel del otro factor no son iguales a las correspondientes diferencias
en otro nivel de este factor
Una interaccin est presente cuando los efectos de una de las variables independientes estn
condicionalmente relacionados a los niveles de la otra variable independiente (Cohen, 1983).


6

Una interaccin est presente cuando una variable independiente no tiene un efecto constante en
todos los niveles de la otra variable independiente (Pedhazur, 1982).
El estudiante puede observar que hay diferencias ms semnticas que conceptuales o estadsticas en
estas definiciones, y una vez estudiado en profundidad el captulo le invitamos a dar su propia definicin de
este efecto. En la diversos grficos de la Figura 7.2 se proponen algunos ejemplos de datos de diseos
factoriales 3x3 (esta es la forma de representar simblicamente un diseo de dos factores, ya que solo hay
dos dgitos, y cada uno de ellos compuesto de tres niveles), donde se muestran grficos de medias de
tratamientos, dos de ellos con interaccin y uno sin interaccin. Las medias de los tratamientos estn
representadas encima de cada grfica.
A modo de resumen y antes de empezar con el ejemplo numrico, la notacin y la exposicin del modelo
estadstico, veremos algunas cuestiones bsicas en un diseo factorial.
Un diseo factorial consiste en un conjunto de diseos simples de un factor en el cual la misma
variable independiente es manipulada en combinacin con una segunda variable independiente.
Los efectos simples de una variable independiente se refieren a las diferencias entre las medias
para cada uno de los componentes del experimento. Si tenemos una factor A, las diferencias
observadas en el nivel b
1
, del factor B, se denominan como efectos simples del factor A en el
nivel b
1
.
Las interacciones se definen en trminos de las comparaciones entre un conjunto de efectos
simples. Estn presentes cuando se encuentra que los efectos simples asociados con una variable
independiente no son los mismos en todos los niveles de la otra variable independiente.
Los efectos principales de una variable independiente o factor se refieren a los efectos promedio
totales de una variable y se obtiene combinando el conjunto completo de componentes
experimentales presentes en ese factor.



7


Figura 7.2 Grficos con interaccin y sin interaccin entre factores

7.4 Reglas para el clculo de los efectos principales y del efecto de
interaccin
En el captulo 5 se ha explicado el procedimiento de clculo para los efectos de los tratamientos de un
factor a partir de las llamadas razones bsicas, y a partir de stas, las sumas de cuadrados (SC), las medias
cuadrticas (MC), y el valor del estadstico F. Tambin se explic cmo la variabilidad total del sistema (la
suma de cuadrados total) se puede partir en dos sumas de cuadrados independientes; por una parte las que
reflejan la variabilidad entre los tratamientos (suma de cuadrados entre-grupos) y por otra la que refleja la
variabilidad dentro de los tratamientos (suma de cuadrados intra-grupos). En los diseos factoriales de 2
factores (que denotaremos genricamente como los factores A y B) se sigue un patrn de anlisis similar,
pero en esta ocasin la suma de cuadrados entre-grupos se divide a su vez en tres componentes que
reflejan: (1) la suma de cuadrados entre tratamientos del factor A (SC
A
), que refleja los efectos principales
del factor A; (2) la suma de cuadrados entre tratamientos del factor B (SC
B
), que refleja los efectos
principales del factor B; y (3) la suma de cuadrados que representa la interaccin entre A y B (SC
AxB
). En este
captulo slo consideraremos los diseos equilibrados, es decir aquellos que tienen el mismo nmero de
casos o sujetos por cada tratamiento (en este caso sera mejor decir cruce por tratamientos).


8

7.4.1 Diseo y notacin
Los datos en un diseo factorial de dos factores se pueden representar en una tabla de doble entrada
(como la representada en la Figura 7.1) o en forma de columnas con las dos primeras filas representando los
diferentes combinaciones de los niveles de los factores. En las diferentes tablas representadas en la Figura
7.3 se pueden ver estas dos configuraciones en que pueden presentarse los datos de un diseo de 2
factores. Para un diseo como el planteado en la introduccin, con 2 factores (3 niveles por factor y 5 sujeto
en cada cruce de tratamiento) diramos que tenemos un diseo factorial 3x3 (al tener 3 niveles cada factor,
el nmero de tratamientos es 9, es decir, el producto de los niveles de los factores 3 x 3 = 9).
Una observacin genrica se representa como Y
ijk
, siendo i el nivel genrico del factor A, j el nivel
genrico del factor B, y k la observacin genrica dentro del tratamiento AB
ij
. A partir de esta matriz de
datos, donde se representan los valores de la variable dependiente dentro de cada tratamiento (AB
i,j
), se
obtienen las sumas de los tratamientos de cada factor (que en la figura se designan como sumas marginales
-A
i
para el factor A, y B
j
para el factor B-) y la suma total de todas las observaciones representada por T. En la
secuencia de tablas de la Figura 7.3 se reflejan las sumas bsicas que hay que realizar, a partir de las cuales
se obtienen las denominadas razones bsicas y posteriormente las sumas de cuadrados.





9


Figura 7.3 Disposicin de los datos en un diseo factorial para su ulterior anlisis
A partir de los sumatorios, tambin se pueden obtener las medias generales para cada factor, para el
total del sistema y para la interaccin, mediante un sencillo juego de frmulas:


7.4.2 Variabilidad del sistema
En el captulo 5 ya hemos tenido ocasin de comprobar que la suma de cuadrados total es igual a la suma
de cuadrados entre-grupos (o tratamientos) y la suma de cuadrados intra-grupo:

Ecuacin 7.1
siendo SC
T
la Suma de Cuadrados Total, SC
E
la Suma de Cuadrados entre-grupos y SCI la Suma de Cuadrados
intra-grupos. Esta igualdad se mantiene en un diseo factorial aunque con algunas consideraciones sobre en
qu componentes est basada ahora la suma de cuadrados entre-grupos (SC
E
).
En un diseo de un factor, SC
E
est basada en las desviaciones de las medias de cada tratamiento
respecto la media total, es decir, siendo A el factor, y prescindiendo de los sumatorios propios en el clculo
de las sumas de cuadrados,

est basada en las desviaciones

. Sin embargo, en un diseo




10

factorial de dos factores, SC
E
est basada en las desviaciones de las medias de cada tratamiento conjunto
AB, respecto de la media total, es decir,

.
Si pensamos en un grupo de sujetos que reciben una combinacin de tratamientos A y B, la desviacin
respecto de la media total del sistema puede estar influida por tres componentes: el Factor A, el Factor B, y
la interaccin entre A y B, y cada una de estas influencias puede ser expresada de la siguiente forma (vase
Ecuacin 7.2):


Ecuacin 7.2
A partir de aqu, y con leves transformaciones algebraicas, se concluye que la desviacin de cualquier
puntuacin individual respecto de la media total del conjunto de datos del diseo se puede dividir en cuatro
componentes de desviacin (ver Ecuacin 7.3):


Ecuacin 7.3
El primer componente es el relacionado con los efectos del tratamiento A
i
, el segundo es el relacionado
con los efectos del tratamiento B
j
, el tercero es el efecto de la interaccin entre ambos factores, y el cuarto
es la desviacin de la puntuacin del sujeto respecto del tratamiento que le ha sido asignado
aleatoriamente. A partir de aqu, solo quedara realizar los sumatorios y elevar al cuadrado para obtener las
correspondientes sumas de cuadrados para el anlisis de varianza
Una vez detectadas las fuentes de variabilidad de cada observacin, tres de ellas relacionadas con los
tratamientos (que expresaran, adems del error experimental, las posibles diferencias que pudieran darse
entre tratamientos), y una relacionada con su propio grupo (que sera la expresin del error experimental,
nicamente), fuentes que denominaremos, siguiendo el esquema de captulos anteriores, A, B, AB y S/AB,
tenemos que determinar los grados de libertad para cada una de estas fuentes. Para los efectos principales
se sigue la misma regla del nmero de tratamientos menos 1. Por tanto (vase la Ecuacin 7.4),

1 Ecuacin 7.4
Los grados de libertad de la interaccin es el resultado del producto de los grados de libertad asociados
con los factores A y B.

1 1 Ecuacin 7.5
Los grados de libertad debidos al error experimental, es decir, a las diferencias individuales dentro de
cada tratamiento, y habida de que en cualquier de ellos los grados de libertad son n-1, los asociados al error
son (vase Ecuacin 7.6):

/
1 Ecuacin 7.6


11

7.4.3 Proceso de clculo del ANOVA de dos factores
Comenzaremos con la tabla donde se resumen (Tabla 7.1) las razones bsicas para realizar el clculo
posterior de las sumas de cuadrados, basadas en los sumatorios reflejadas en la tabla de la matriz AB en la
Figura 7.3
Tabla 7.1. Clculo de las razones bsicas
Cantidad Bsica
Sumas y cuadrados
implicados
Razn bsica
Cdigo para
representar
esta razn
A

[A]
B

[B]
AB

[AB]
Y

[Y]
T

[T]

A partir de estas razones, obtener las sumas de cuadrados es sencillo. En la Tabla 7.2, se puede ver la
tabla resumen del ANOVA con las frmulas de cmputo a partir de las razones bsicas. Para ayudar al
estudiante, la frmula de cmputo completa se presenta slo una vez, que posteriormente es designada
nicamente por el cdigo de la letra entre corchetes referido en la ltima columna de la Tabla 7.1. Los
totales para SC
A
son las sumas marginales del factor A, los totales para SC
B
son las sumas marginales del
factor B, ambos representados en la matriz AB de la figura 7.3, y las sumas para la razn [AB] se obtienen
directamente de los totales de la matriz de datos de la misma figura.







12

Tabla 7.2 Frmulas de clculo y tabla del ANOVA de dos factores
Fuente de
Variacin
Frmula clculo Sumas de Cuadrados
grados de
libertad
Medias Cuadrticas F
A

a - 1

b 1


A x B

(a 1)(b 1)


Intra
(S/AB)

(a)(b)(n-1)
/


/

/

Total

(a)(b)(n)-1

7.4.4 Desarrollo del ANOVA de 2 factores con un ejemplo
Vamos ahora a desarrollar la tcnica con los datos del ejemplo referido en la introduccin sobre mejora
de las actitudes hacia las minoras por parte de jvenes oficiales de polica. En total hay 45 observaciones
repartidas entre los 9 tratamientos, que son los que se producen por el cruce de los 3 tratamientos de cada
factor. Llamaremos factor A a las zonas donde se realiza el curso, con tres niveles, alta, media y deprimida
(a=3) y factor B a la duracin del curso, tambin con tres niveles, 5, 10 y 15 horas (b=3). Las puntuaciones de
los sujetos participantes en la experiencia se muestran en la Tabla 7.3, con las sumas totales de las
puntuaciones de cada tratamiento en la fila inferior de la tabla, bajo la denominacin Matriz de Datos, y en
la tabla que llamamos Matriz AB se presentan los resultados de los sumas para cada tratamiento, los
marginales y la suma total.












13

Tabla 7.3 Datos del ejemplo numrico

Matriz de Datos
a
1
a
1
a
1
a
2
a
2
a
2
a
3
a
3
a
3

b
1
b
2
b
3
b
1
b
2
b
3
b
1
b
2
b
3


24 44 38 30 35 26 21 41 42
33 36 29 21 35 32 18 39 52

37 25 28 39 27 36 10 50 53
29 27 47 26 31 46 31 36 49

42 43 48 34 22 45 20 34 64
Suma 165 175 190 150 150 185 100 200 260
Media 33 35 38 30 30 37 20 40 52
Desv.Tpic 6.229 7.874 8.509 6.229 4.980 7.642 6.723 5.550 7.127


Matriz AB
Factor A
Factor B
a
1
(zona alta)
a
2
(zona media)
a
3
(zona deprimida)
Suma
b
1
(5 h.) 165 150 100 415
b
2
(10 h.) 175 150 200 525
b
3
(15 h.) 190 185 260 635
Suma 530 485 560 1575

Los resultados de las razones bsicas a partir de estos datos son:

1575

335

24

33

37

53

49

64



530

485

560

35


415

525

635

35
,


14


165

150

185

260

5

A partir de estos valores se calculan las sumas de cuadrados

55315 55125

56738,333 55125 ,

58155 55315 56738,333 55125 ,

/
60265 58155

60265 55125
Se comprueba que


/
.
2110 667 . 1226 333 . 1613 190 5140 + + + =
Como los clculos de los grados de libertad y las medias cuadrticas son sencillos, y adems ya se han
visto en el captulo 5, escribimos en la Tabla 7.4, el resumen del ANOVA con todos los resultados; los
asteriscos a derecha del valor del estadstico F indican que la fuente de variabilidad es significativa (para ese
factor o interaccin, se rechaza la hiptesis nula).
Tabla 7.4. Resumen del Anlisis de Varianza
Fuente de
Variacin
Sumas de Cuadrados
grados de
libertad
Medias Cuadrticas F
A 190 2 95 1,621
B 1613,333 2 806,667 13,763
*
A x B 1226,667 2x2= 4 306,667 5,232
*


15

Intra
(S/AB)
2110 3x3x(5-1) =36 58,611
1

Total 5140

Los resultados ponen de manifiesto que los efectos principales del factor B (duracin del curso) y de la
interaccin son significativos. Conviene, no obstante, representar grficamente las medias de los
tratamientos cada uno de los factores, para ver los efectos principales, y tambin las medias de los
tratamientos para ver el sentido de la interaccin a travs de la representacin de los efectos simples. En las
grficas de las Figuras 7.4 (a) (b) (c) y (d), se representan estos valores mediante diagramas de lneas.


Figura 7.4 (a) Medias efectos principales factor Zona

1
Al mismo resultado se llega sumando las varianzas de todos los tratamientos y dividiendo el resultado por el de tratamientos.
Para los datos del ejemplo
/

,

58,611


16


Figura 7.4 (b) Medias efectos principales factor Duracin del curso

Figura 7.4 (c) Medias de los efectos simples del factor Zona respecto de los niveles del factor Duracin del curso


17


Figura 7.4 (c) Medias de los efectos simples del factor duracin del curso respecto de los niveles del factor Zona
A partir de los grficos es posible anticipar, antes de proceder al anlisis de lascomparaciones, por qu la
interaccin resulta significativa. En todos los grficos se ha puesto la misma escala de valores en el eje de
ordenadas (de 0 a 60) para facilitar la comparacin entre ellos. Observe el estudiante los grficos 7.3 (a) y 7.3
(d), que representan, el primero, los efectos principales del factor Zona, y el segundo, los efectos simples del
factor Zona en funcin de los tres niveles del factor Duracin. Como demuestra la tabla del ANOVA, los
tratamientos del factor Zona no resulta ser estadsticamente diferentes, y esto es lo que debera suceder en
cada uno de los tres efectos simples. Sin embargo, el grfico (d) muestra que esta no diferencia no parece
darse en todas los niveles del otro factor. Quizs no haya diferencias entre zonas en los niveles de 5 y 10
horas, pero s se observan diferencias en el nivel de 15 horas, entre, por un lado, las zonas alta y media (con
una puntuacin media de 38 y 37, respectivamente), y por otro la zona deprimida (con una puntuacin
media de 52).
En el caso del factor Duracin es posible que haya tambin un efecto de interaccin, pero justo en
sentido contrario al del factor Zona. En este caso, la prueba F resulta significativa, y las comparaciones
mltiples sealan que hay diferencias entre los tres niveles de duracin (sugerimos al estudiante que lo
compruebe con la prueba de Scheff, explicada en el captulo 5). Si observamos el grfico 7.3 (c), se ve
claramente que estas diferencias no se manifiestan en todos los niveles del factor Zona. En el nivel zona alta,
las puntuaciones medias son muy similares, y en el nivel zona media, las puntuaciones de 5 y 10 horas son
idnticas, siendo algo mayor la puntuacin media para 15 horas, diferencia que s puede resultar
significativa. Por ltimo, en el nivel zona deprimida es posible que s se registren diferencias entre las
puntuaciones promedio para las tres zonas. Posteriormente veremos si estas conjeturas que hemos
realizado sobre las grficas tienen respaldo estadstico al realizar los contrastes sobre los efectos simples.


18

7.5 El modelo estadstico
El modelo estadstico que subyace en un diseo factorial de 2 factores completamente aleatorizados es
un modelo lineal en el cual se especifica los componentes que contribuyen a explicar cualquier puntuacin
Y
ijk
. Este modelo se puede expresar del siguiente modo:

Ecuacin 7.7
Donde:

T
es la media total de la poblacin

i
es el promedio del efecto del tratamiento en el nivel a
i
(
i
=
i
-
T
)

j
es el promedio del efecto del tratamiento en el nivel b
j
(
j
=
j
-
T
)
()
ij
es el efecto de la interaccin en la celda a
i
b
j
(()
ij
=
ij
-
i
-
j
+
T
)

ijk
es el error experimental asociado con cada puntuacin (
ijk
= Y
ijk
-
ij
)
Las hiptesis estadsticas con este modelo se pueden expresar de la siguiente forma:
Efectos Principales Factor A H
0
: Todos los
i
= 0
H
1
: No todos los
i
= 0
Efectos Principales Factor B H
0
: Todos los
j
= 0
H
1
: No todos los
j
= 0
Interaccin A x B H
0
: Todos los
ij
= 0
H
1
: No todos los
ij
= 0
Los valores esperados de las medias cuadrticas calculados en el ANOVA, E(MC), se refieren a los factores
que contribuyen al valor promedio de cada media cuadrtica obtenida mediante sucesivos muestreos
aleatorios de una poblacin dada. En este diseo los valores son

Ecuacin 7.8

Ecuacin 7.9

Ecuacin 7.10
En el modelo de efectos fijos, que es el modelo ms utilizado en el mbito de las ciencias sociales, los tres
valores de

se definen de la siguiente forma:




19

1

Ecuacin 7.11

1

Ecuacin 7.12

1 1

Ecuacin 7.13
Siendo el valor esperado del error

Ecuacin 7.14
Como en el diseo de un factor, la lgica del anlisis es la formacin de las razones


Ecuacin 7.15
en donde


Bajo la hiptesis nula, el componente de la varianza que refleja el efecto ser cero y por tanto


Y la razn



ser igual a la unidad excepto variaciones debidas al azar. Si la hiptesis nula es falsa, el valor de MC
efecto
ser
significativamente superior a MC
error
y, por consiguiente, la razn entre ambas medias cuadrticas ser
superior a la unidad (tanto ms cuanto mayor sea la varianza aportada por el efecto y ms pequea sea
MC
error
).
Esta razn se distribuye segn la distribucin de probabilidad F con los grados de libertad de las MC del


20

numerador y del denominador [

bajo los supuestos de normalidad, homocedasticidad e


independencia.
Para cualquiera de los efectos (principales y de interaccin)

, dado que cuando la H


0

es cierta tanto las medias cuadrticas del efecto como la del error son estimaciones independientes del error
experimental. Por consiguiente, cada efecto principal y de interaccin utiliza su propia MC pero la MC
error
de
la Ecuacin 7.15 es idntica para todos.
7.6 Anlisis de la interaccin
La prueba anterior en donde se evalu la significatividad de los efectos principales y la interaccin entre
factores se conoce como prueba mnibus (global) debido a que no diferencia entre niveles, esto es, el efecto
de un factor principal con tres niveles puede ser significativo segn el test anterior pero ste no nos indicar
si las tres comparaciones posibles entre niveles son todas ellas significativas o solo lo son un subconjunto de
las mismas.
Una vez realizada la prueba mnibus, el siguiente paso es comprobar si el efecto de interaccin resulta
significativo. La secuencia lgica de anlisis sera la que se muestra en el diagrama de flujo de la Figura 7.5

Figura 7.5 Secuencia de anlisis en un diseo factorial
El que el efecto de interaccin sea significativo, no supone que no prestemos atencin a los efectos
principales, slo que su interpretacin, caso de resultar significativos, debe hacerse, como seala el


21

diagrama, teniendo en cuenta los resultados obtenidos en el anlisis de los efectos simples, y sobre todo el
marco terico en el que se desarrollan las hiptesis de investigacin. No obstante, como ya hemos
mencionado, en este captulo slo nos interesaremos por el anlisis de la interaccin.
Retomando nuestro ejemplo, comenzaremos por el contraste de los efectos simples, y para ello
seguiremos la lgica de razones bsicas que hemos utilizado en el ANOVA. Para este anlisis partimos de la
matriz AB, que contiene las sumas de las puntuaciones de los tratamientos. En la Tabla 7.5 reflejamos esta
matriz para los datos que nos sirven de ejemplo. La manera de enfocar este anlisis es convertir cada
columna o fila de la matriz AB en un diseo de un solo factor y luego obtener las sumas de cuadrados entre
grupos del mismo modo que ha hecho con las sumas de cuadrados de los efectos principales.
Tabla 7.5 Matriz AB datos del ejemplo
Matriz AB
Factor A
Factor B
a
1
(zona alta)
a
2
(zona media)
a
3
(zona deprimida)
Suma
b
1
(5 h.) 165 150 100 415
b
2
(10 h.) 175 150 200 525
b
3
(15 h.) 190 185 260 635
Suma 530 485 560 1575

En el caso de los efectos principales del factor A, las dos razones bsicas para el clculo de la SC
A
, son:



Y el resultado era SC
A
= [A]-[T]. Siguiendo esta lgica, la suma de cuadrados del factor A en el nivel b
1
del
factor B es:



Siendo entonces

, y sus grados de libertad son a-1. Las medias cuadrticas


para los efectos simples se obtienen de la misma manera que en el anlisis general, dividiendo la suma de


22

cuadrados por los grados de libertad. El denominador de la F es la media cuadrtica intra-grupos del anlisis
general, es decir


/


Del mismo modo se calcularan los efectos simples para el factor B en relacin a los niveles del factor A,
siempre que se cumpla el supuesto de homocedasticidad. Si no se cumple el supuesto de homocedasticidad,
una solucin es realizar tantos anlisis como efectos simples hay, tomando como media cuadrtica error slo
la de las observaciones implicadas en cada uno de los anlisis.
Veamos, en primer lugar cmo se realizan los clculos para obtener las sumas de cuadrados de los
efectos simples del factor A en el nivel b
1
del factor B, y del Factor B en el nivel a
2
del factor A.


165

150

100

5

415

35
463,33


150

150

185

5

485

35
163,33

Al haber tres niveles por factor, los grados de libertad sern 2 (a 1 y b 1) para ambas sumas de
cuadrados y las medias cuadrticas sern el resultado del cociente entre las SC y sus grados de libertad. En la
Tabla 7.6 se refleja el resultado del contraste para todos los efectos simples, con su significacin estadstica
sealada con un asterisco en la columna de la derecha (es decir, en vez de poner el valor concreto de p, si
este valor para la F correspondiente es menor o igual al nivel de significacin, se seala mediante un
asterisco y en caso contrario se deja sin poner nada).
Tabla 7.5 Tabla resumen ANOVA con los resultados de los efectos principales y los efectos simples
FV SC gl MC F Sig.
SC
A

190 2 95 1,621

SC
B

1613,33 2 806,667 13,763 **
SC
AB

1226,67 4 306,667 5,232 **
SC
AB1

463,33 2 231,667 3,953 **
SC
AB2

250 2 125 2,133

SC
AB3

703,33 2 351,667 6 **
SC
BA1

63,33 2 31,667 0,540

SC
BA2

163,33 2 81,667 1,393

SC
BA3

2613,33 2 1306,667 22,294 **
SC
S/AB

2110 36 58,611





23

SC
T

5140 44


Los efectos principales de un factor son independientes del efecto de interaccin (es decir, son
ortogonales), pero los efectos simples del factor A no son independientes ni de los efectos principales del
Factor A ni de su interaccin con el factor B, de hecho su suma es igual a la suma de los efectos principales y
la interaccin (lo mismo sucede con los efectos simples del factor B):


Ecuacin 7.15
Con los datos de la Tabla 7.5 se comprueba esa dependencia (hay una desigualdad de una centsima por
efecto del redondeo):
463,33 + 250 + 703,33 = 190 + 1226,67 = 1416,67
Los resultados de la Tabla 7.5 estn en sintona con lo sealado ms arriba acerca de lo que permitan
intuir los grficos de medias. El efecto principal del Factor A no es significativo, pero los grficos sealaban
que esa falta de efecto no se produca en alguno de los niveles del factor B. De hecho, hay dos efectos
simples del factor A significativos (concretamente, en los niveles b
1
y b
3
). Tambin hay una diferencia entre
los efectos principales del factor B y sus efectos simples. Los efectos principales son ampliamente
significativos, y de hecho (como sealamos anteriormente) el test de comparaciones mltiples (no realizado,
pero sugerido para que el estudiante lo desarrolle) refleja diferencias significativas entres los tres niveles del
factor, y sin embargo, en los efectos simples, slo en el nivel a
3
se producen diferencias significativas, lo que
implica que ese nivel capitaliza todas las diferencias reflejadas en el efecto principal. El valor terico de
referencia (la F crtica) para las comparaciones
2
simples es
,;;
3,259 (vanse la Figura 7.6a y b).

Figura 7.6a: valor crtico de la F con 2 y 36 grados de libertad ( 05 . 0 = ). Este valor ha sido calculado con un
software cientfico.

2
Aunque muchos metodlogos han introducido tcnicas para el control de la tasa de error, la prctica actual de la investigacin
en psicologa se decanta por el anlisis sin la correccin para esta tasa, por lo que el valor de en estos contrastes es de 0,05, que es
el que utilizan la mayor parte del software de anlisis estadstico


24


Figura 7.6b: bsqueda en las tablas del valor crtico de F para 2 y 36 grados de libertad. Como no tenemos la
fila de n
2
= 36, elegimos el valor ms cercano (n
2
= 30).

Siguiendo la secuencia del diagrama de la figura 7.4, pasaramos a efectuar las comparaciones por pares
dentro de los niveles donde se han detectado diferencias significativas. Por su complejidad, en este libro no
abordaremos los contrastes de la interaccin.
7.6.1 Comparaciones por pares dentro de los efectos simples
El procedimiento es el mismo al ya visto en el captulo 5, y los desarrollaremos con los datos del ejemplo,
slo para aquellos efectos simples que han resultado significativos, el factor A en los niveles b
1
y b
3
y el
factor B en el nivel a
3
. En la Tabla 7.6 hemos reflejado las medias para los niveles significativos y los
coeficientes para los contrastes que habra que realizar para las comparaciones que nos resultan
interesantes tericamente. Para el factor A hemos comparado los niveles a
1
vs. a
3
y a
2
vs. a
3
en b
1
por un
lado y a
2
vs. a
3
en b
3
por el otro. En el factor B hemos realizado las tres comparaciones binarias posibles, es
decir, b
1
vs. b
2
, b
1
vs. b
3
y b
2
vs. b
3
en a
3
.









25

Tabla 7.6 Medias de las celdas a comparar y coeficientes de los contrastes

a
1
(zona alta)
a
2
(zona media)
a
3
(zona deprimida)

33 30 20



38 37 52

0

1 0 -1

0
0 1 -1

0

1 0 -1


b
1
5 h.
b
2
10 h.
b
3
15 h.



20 40 52

0

1 -1 0

0

1 0 -1

0

0 1 -1

En el efecto simple del factor A slo se realiza un contraste entre la media mayor, 52, en el nivel a
3
, y la
segunda mayor, 38, en el nivel a
1
en b
3
. La razn de hacer un solo contraste en este caso es que entre las
medias de los niveles a
1
y a
2
hay una diferencia de un punto (de 37 a 38) y claramente no resultar
significativa dicha diferencia de modo que solo se realizan para las dos medias mencionadas. Adems, en el
caso de ser significativa la diferencia tambin lo ser la que hay entre a
3
y a
2
, dado que la media en este nivel
en un punto inferior a la de a
1
.
La frmula para la comparacin ya la conocemos del captulo 5, y es



Y aplicada para un efecto simple es


26



Donde


se refiere a las diferencias entre las dos medias especificadas en cada contraste, cuya
expresin es:



Aplicado al contraste del factor A, se tiene:


133 030 120 13
Luego las sumas de cuadrados correspondientes sern:




513

422,5

El nmero de grados de libertad para la comparacin es 1, pues se estn comparando solo dos niveles, y
la para el clculo de la razn F el divisor es la media cuadrtica error de la prueba mnibus
/
. Por lo
tanto su valor es:



422,5
58,611
7,208

Y al ser la F crtica con 1 y 36 grados de libertad igual a 4,11 [
,;;
4,11] inferior al obtenido, la
comparacin resulta significativa, y, por consiguiente, tambin lo ser con la media del nivel a
2
. Para el otro
contraste del factor A, y los tres contrastes del factor B, las diferencias entre medias para cada contraste
son:


033 130 120 10


138 037 152 14


120 140 052 20


120 040 152 32


27


020 140 152 12
Y las sumas de cuadrados

.


510

250

.


514

490

.


520

1000

.


532

2560

.


512

360

Y, por ltimo, las razones F son
3
:



250
58,611
4,265



490
58,611
8,360



1000
58,611
17,062



2560
58,611
43,678



360
58,611
6,142


3
El paso intermedio, calcular las medias cuadrticas, no es necesario pues es el mismo valor que las sumas de cuadrados, dado
que al ser la comparacin entre dos grupos los grados de libertad son siempre igual a 1


28

Al ser el valor terico de F el mismo que calculamos previamente [
,;;
4,11], los cinco
contrastes resultan significativos (aunque el de los tratamientos a
2
y a
3
, dentro del nivel b
1
, est muy
prximo al valor terico, razn por la cual habra que considerar este resultado con cautela).
7.6.2 Cmo se acta cuando no es significativo el efecto de interaccin?
Cuando se analiza un diseo factorial, se hace la prueba mnibus para los efectos principales y el efecto
de interaccin. Si sta ltima no es significativa, es preciso rehacer el anlisis focalizndolo slo sobre los
efectos principales. Esto tiene consecuencias en la tabla del ANOVA, en el sentido de que aumenta la suma
de cuadrados del error en la misma cuanta que la suma de cuadrados de la interaccin, y tambin los grados
de libertad en la misma cuanta que los grados de libertad del efecto de interaccin. La consecuencia es que
el valor de la F del contraste se reduce, por el aumento que se da en el valor de la media cuadrtica del
error. En la tabla 7.6 se puede ver la tabla resumen del ANOVA con el efecto de interaccin incluido y la
misma sin el efecto de interaccin.
Tabla 7.6 (a) Tabla resumen ANOVA con efecto de interaccin
FV SC gl MC F Sig.
SC
A
190 2 95 1,621

SC
B
1613,33 2 806,667 13,763 **
SC
AB
1226,67 4 306,667 5,232 **
SC
S/AB
2110 36 58,611
SC
T
5140 44

Tabla 7.6 (a) Tabla resumen ANOVA sin efecto de interaccin
FV SC gl MC F Sig.
SC
A

190,000 2 95,000 1,139
SC
B

1613,333 2 806,667 9,670 **
SC
S/AB

3336,67 40 83,417

SC
T

5140,000 45



Cuando el efecto de interaccin no forma parte del modelo, el valor de la suma de cuadrados de error es
igual a la suma de cuadrados error cuando entra la interaccin y la suma de cuadrados de la interaccin.
Observe que 3336,67 = 2110 + 1226,67 y los grados de libertad 40 = 36 + 4. Los valores de F para los efectos
principales son inferiores, por el aumento de la media cuadrtica del error que pasa de 58,611 a 83,417.


29

7.7 Resumen
En este captulo hemos visto el procedimiento de anlisis de los diseos factoriales de 2 factores
completamente aleatorizados, que son tiles por la economa de sujetos que supone y el nmero de
contrastes que se pueden realizar con un conjunto no muy grande de datos.
Todos los diseos factoriales se pueden descomponer en un conjunto de efectos mutuamente
independientes: los denominados efectos principales de cada factor y los efectos de interaccin entre los
factores. Los dos primeros son los efectos de los tratamientos de cada factor con independencia del otro
factor, mientras los segundos son los efectos que se producen por el cruce de los factores
En el proceso de anlisis, la prueba mnibus informa de la significacin estadstica tanto de los efectos
principales como de los de la interaccin. Si los primeros son significativos, se procede a las comparaciones
mltiples entre los tratamientos. Si son los segundos significativos, es preciso analizar cules de los
diferentes efectos simples que explican este efecto.
En el procedimiento de anlisis de los efectos simples es muy similar al seguido para un diseo de un solo
factor completamente aleatorizado. El total de efectos simples no son independientes de los efectos
principales ni de los efectos de interaccin, ms bien estos dos efectos estn contenidos en el conjunto de
efectos simples.
Por ltimo, una vez determinados qu efectos simples son los que resultan significativos, hemos realizado
las comparaciones mltiples en ellos para determinar entre qu tratamientos se producen las diferencias
que explican la significacin estadstica del efecto simple.

7.8 Ejercicios de autoevaluacin

Supongamos el nivel de aspiracin como variable dependiente en un experimento, en el que la
tarea experimental consiste en un juego aparentemente difcil que implica ciertas habilidades
motoras y en el que se da una puntuacin segn la ejecucin del sujeto. No obstante, es todo
apariencia y en realidad el sujeto desconoce que el juego est bajo control del experimentador, de
tal modo que a cada sujeto se le otorga siempre la misma puntuacin. Despus de un nmero de
ensayos determinado, durante el cual el sujeto recibe la puntuacin pre-asignada, se le pide al sujeto
que prediga la puntuacin para el prximo grupo de ensayos. No obstante, antes de efectuar la
prediccin, se informa al sujeto sobre la puntuacin obtenida comparndola con un grupo de
referencia ficticio. En una condicin experimental (Factor B), al sujeto se le dice que su puntuacin
est por encima del promedio (b1) del grupo de referencia; en la segunda se le dice que est en el
promedio (b2), y en la tercera que est por debajo del promedio (b3). Adems, hay dos grupos de
referencia con los que comparar a los sujetos (Factor A): el primer grupo de es varones universitarios
(a1) y el segundo es de atletas profesionales (a2).
La variable dependiente que se registr es la puntuacin que el sujeto predice que va a obtener
en el siguiente conjunto de ensayos, y es esta puntuacin la que se toma como una cuantificacin de
su nivel de aspiracin. Cada sujeto fue entrevistado por separado y no se permita la comunicacin
con los otros sujetos hasta que no acab el experimento. Se asign 10 sujetos a cada grupo de forma
aleatoria, y las puntuaciones predichas por ellos fueron las siguientes:




30

a
1
a
2

b
1
b
2
b
3
b
1
b
2
b
3

52 28 15 38 43 23
48 35 14 42 34 25
43 34 23 42 33 18
50 32 21 35 42 26
43 34 14 33 41 18
44 27 20 38 37 26
46 31 21 39 37 20
46 27 16 34 40 19
43 29 20 33 36 22
49 25 14 34 35 17

7.8.1 Preguntas
1. En el diseo planteado slo una de las siguientes tres afirmaciones es cierta:
a. Los dos efectos principales son significativos
b. Slo el efecto principal del Factor B es significativo
c. Son significativos el efecto principal del factor B y el efecto de interaccin (*)
2. El resultado de la razn bsica [AB] para el clculo de las sumas de cuadrados es.
a. 66228,8 (*)
b. 54789,5
c. 45791,9
3. El valor de la razn F para contrastar el efecto principal del factor A es:
a. 34,007
b. 0,358 (*)
c. 4,574
4. El valor de La Media Cuadrtica Error
/
es:
a. 11,911 (*)
b. 25,346
c. 4,225
5. Cuntos efectos simples hay en este diseo?
a. 6
b. 5 (*)
c. 4


31

6. Cul es el valor de la F terica con el que comparar el valor razn F obtenida en el contraste de
la interaccin?
a. 3,168 (*)
b. 4,019
c. 5,346
7. Cul es el valor de la F observada para el contraste de la interaccin?
a. 34,007 (*)
b. 2,356
c. 8,254
8. De todos los efectos simples posibles, cuntos de ellos resultan ser estadsticamente
significativos?
a. Dos
b. Tres
c. Todos (*)
9. De las tres afirmaciones siguientes, slo una es cierta en diseo factorial completamente
aleatorizado
a. Los efectos simples son independientes de los efectos de interaccin
b. Las sumas de cuadrados de todos los efectos simples es igual a la variabilidad total del
sistema (es decir, a la suma de cuadrados total)
c. Los efectos principales de cada factor y los efectos de interaccin son ortogonales, en el
sentido de que aportan informacin independiente. (*)
10. La suma de las sumas de cuadrados de todos los efectos simples del Factor A, vale en total
a. 814,4 (*)
b. 5804,27
c. 810,13
7.8.2 Soluciones ejercicios de autoevaluacin
Comencemos con algunas tablas intermedias, tanto de los datos como de las matrices AB, una con los
sumatorios y otra con las medias (resaltado en negrilla ests las diferentes respuestas con resultados
numricos)










32


Varones Universitarios Atletas profesionales
a
1
a
2

Encima del
promedio
En el promedio
Debajo del
promedio
Encima del
promedio
En el promedio
Debajo del
promedio
b
1
b
2
b
3
b
1
b
2
b
3

52 28 15 38 43 23
48 35 14 42 34 25

43 34 23 42 33 18
50 32 21 35 42 26
43 34 14 33 41 18
44 27 20 38 37 26

46 31 21 39 37 20
46 27 16 34 40 19
43 29 20 33 36 22
49 25 14 34 35 17
Media 46,4 30,2 17,8 36,8 37,8 21,4
Suma 464 302 178 368 378 214




Matriz AB de sumas
a1 a2 Suma
b1 464 368 832
b2 302 378 680
b3 178 214 392
Suma 944 960 1904

Matriz AB de Medias
a1 a2 Medias
b1 46,400 36,800 41,600
b2 30,200 37,800 34,000
b3 17,800 21,400 19,600
Medias 31,467 32,000 31,733
Razones Bsicas

11904

2310
,
52

48

22

17




33


944

960

310
,

832

680

392

210
,

464

368

178

214

10
,
A partir de estas razones se construye la siguiente tabla resumen de ANOVA, en donde ya hemos
incorporado los efectos simples.

FV SC gl MC F F
ter
Sig.
SC
A
4,267 1 4,267 0,358 4,020
SC
B
4994,133 2 2497,067 209,642 3,168 ***
SC
AB
810,133 2 405,067 34,007 3,168 ***
SC
AB1
460,800 1 460,800 38,687 4,020 ***
SC
AB2
288,800 1 288,800 24,246 4,020 ***
SC
AB3
64,800 1 64,800 5,440 4,020 ***
SC
BA1
4113,867 2 2056,933 172,690 3,168 ***
SC
BA2
1690,400 2 845,200 70,959 3,168 ***
SC
S/AB
643,200 54 11,911

SCT 6451,733 59
*** Estadsticamente significativos con probabilidad p < 0,05
El clculo para, por ejemplo, la suma de cuadrados de uno de los efectos principales sera:


464

368

10

832

210
,
7.8.3 Respuestas
1. C
2. A
3. B
4. A


34

5. B (desde SC
AB1
a SC
BA2
)
6. C
7. A
8. C
9. C (Slo los efectos principales y la interaccin son independientes)
10. A (460,800 + 288,800 + 64,800 = 814,400)

You might also like