You are on page 1of 720

A rthur A ron

Elaine N . A ron

ESTADISTICA
PARA PSICOLOGA

arson
Educacin

Argentina * Botiva * Brasil * Colombia * Costa Rica * Chite *


Ecuador * El Salvador Espaa * Guatemala * Honduras * Mxico
Nicaragua * Panam * Paraguay * Per Puerto Rico *
Repblica Dominicana * Uruguay Venezuela
A m sterdam * Harlow Londres * Menio Prk * Munich * Nueva Deihi *
Nueva je rs e y 1 Nueva York * O ntario * Pars * Sidney * Singapur
Tokio *Toronto * Zurch

519.5.
ARO .

:Aron, Arthur. ' .


Estadstica pats psicologa/Arthur Aron y: Elaine

.Aron, - P ed. - Buenos Aires: Pcrsoh Educacin, 2001.


736p.; 19,5x25,5.cm. '
. A '
Traduccin de: Kaxtua Abraham .

ISBN: 987-9460-66-9
: I. Aron, Elaine II. Ttulo - 1. Estadsticas '

Editor: Daro Rubinstein


Gerente de Divisin: Esteban Lo Prest
Armado de Tapae Interior: Carlos Prez Vilamil / Mara Rosa Ruggiero
Traduccin: Karina Abraham
Correccin: Viccoria Aljanad
Produccin: Laura G. Lago
Traducido de: Statistics for Psychology, Second Edition by Arthur Aron and Elaine N. Aron, Copyright 1999- Todos
los Derechos Reservados, Publicado con el acuerdo del editor original, PRENTICE HALL, INC., Editorial de Peatson
Education Company.
ISBN; 0-13-914078-6

Edicin en Espaol publicada por:


Copyright 2 0 0 1 PEARSON EDUCATION S.A.
Av. Regimiento de Patricios .1959 (C1266AAF), Buenos Ares, Rep. Argentina
PRENTICE HALL Y PEARSON EDUCACION s o n m a rc a s d e p r o p ie d a d d e PEARSON EDUCATION S.A.

ISBN: 987-9460-66-9
Primera Edicin: Diciembre 2001
Queda hecho el depsito que dispone la ley 11.723

Este libro no puede ser reproducido total ni parcialmente en ninguna forma, ni por ningn medio o procedimiento, sea reprogrfico, fotocopia, microfilmacin, mimeogrko o cualquier orco sistema mecnico, {bioqumico, electrnico, informtico,
magntico, electroptico, etctera. Cualquier reproduccin sin el permiso previo por escrito de la editorial viola derechos reser
vados, es ilegal y constituye un delito.

Impreso en Brasil por RR Donnelley, en el mes de diciembre de 2001.


Ra Epiacaba 90 -Vila Arapu04257.170 So Paulo SP

Prefacio para ei profesor...................................................


xvii
Reconocimientos..................................................................................................................
xxiv
Introduccin para e alumno .................................................................................................
xxv

1 E xp osicin del orden de un grupo de n m eros

Las dos ramas de la metodologa estadstica ...................... ................................ ,..........


Tablas de frecuencias......................................... :.............................. ..............................,.
Cuadro 1-1; Trivialidades importantes para estudiantes de
estadstica con espritu potico................................................................................
Cmo crear una tabla de frecuencias?.................................................. .................
Tabla de frecuencias agrupadas ..................................... .................................. !........ ........
Hisfogramas ..................................................... ...............'................................................ 12

2
2
3

6
.8

Cuadro 1-2: La angustia matemtica, la angustia estadstica y el alumno,


Un mensaje para aquellos que estn realmente preocupados
por este curso.................

13

Polgonos de frecuencias .., ......................... .......................................... ............................


Formas de las distribuciones de frecuencias........... ...........................................;..............
Controversias y limitaciones................................................................................................

17
-20
24

Cuadro 1-3: Sexo, etnia y desempeo m atem tico......................................................

26

Tablas de frecuencias, histogramas y polgonos de frecuencias segn


se describen en publicaciones cientficas........................................... ;......................
Resumen..............................
Trminos clav e......................................................................:................................... .........
Ejercicios ...........................

28
31
32
32

M ediay varian za, d esvo estn d ar y pu n tu acion es Z

34

M e d ia ........ *..................................................... .................................................................


Medidas alternativas de la tendencia central.......................................................................
Varianza y desvo estndar.................................................................................................
Puntuaciones Z ........ ,.................................-.......................................................................

35
40
43
51

Cuadro 2-1: La verdadera alegra (s, alegra)


que provoca el anlisis estadstico.........................................................................

52

Controversias y limitaciones: la tirana de la media............ .............................................


Media y desvo estndar segn se describen en publicaciones cientficas........................
Resumen..............................................................................................................................
Trminos clav e............ ............'........................................................................... .........
Ejercicios .................................................................................................................................
Apndice del captulo: frmulas de clculo optativas
de la varianza y el desvo estndar.............................................................................

C orrelacin

58
61
63
63
63
65

68

Variables independientes o predictoras y variables dependientes.............. .......................


Cmo graficar correlaciones: diagrama de dispersin ......................................................
Patrones de correlacin............................................................................................................
Clculo de un ndice del grado de correlacin lineal:
coeficiente de correlacin de Pearson......................................................................................

70
71

Cuadro 3-2; Galton, un caballero g en ia l.......................................................

82

Integracin de los distintos pasos. Otros ejemplos.................................................................


Prueba de la significacin estadstica del coeficiente de correlacin................................ '

91

Cuadro 3-2; Correlacin ilusoria: cuando estamos completamente seguros


de que si es grande, es gordo... y estamos completamente equivocados....... ......

91

73
79

85

Cuestiones relacionadas con la interpretacin del coeficiente de correlacin ..................


93
Controversias y desarrollos recientes: qu es una gran correlacin?..............................
96
Coeficientes de correlacin segn se describen en publicaciones cientficas .................
98
Resumen..............................................................................................................................
100
Trminos clav e........................................................................................................................
101
Ejercicios .................................................................................................................... *......
101
Apndice I del captulo: frmula de clculo
optativa del coeficiente de correlacin...........................................................................
105
Apndice II del captulo: pruebas de hiptesis y
potencia del coeficiente de correlacin ..................... ............,................................ .
105

P rediccin

108

Terminologa relacionada con la prediccin bivariada......................................................


Modelo de prediccin bivariada con puntuaciones Z ........ ...............................................
Prediccin bivariada con puntuaciones originales............................................................
Lnea de regresin......................... *.................................. .................................................
Error y reduccin proporcional de error........ ,...................................................................
Otro ejemplo de prediccin bivariada.................................................................................
Extensin a regresin y correlacin m ltiples..................................................................

109
110
112
114
117
122
126

Cuadro 4-1: Prediccin clnica versus prediccin estadstica.....................................

132

Controversias y limitaciones.......................................... ....................................................


Los modelos de prediccin segn se describen en publicaciones cientficas...................
Resumen..............................................................................................................................
Trminos clav e....................................................................................................................
Ejercicios ....................................................................

135
136
138
139
139

A lgunos com ponentes clave de la estadstica inductiva:


curva n orm al, prob ab ilid ad y pob lacin versus m uestra

146

Distribucin norm al...........................................................................................................

147

Cuadro 5-1: DeMoivre, el excntrico desconocido


que invent la curva normal.....................................................................................

149

Probabilidad........................................................................................................................

156

Cuadro 5-2: Pascal comienza a desarrollar la teora de la probabilidad


en las mesas de juego y ms tarde aprende.a apostar a D ios...............................

159

Muestra y poblacin...........................................................................................................

160

Cuadro 5-3: Sondeos, encuestas y la costosa muestra gratis de 1948 .....................

164

Relacin entre curva normal, probabilidad y muestra versus poblacin..........................


Controversias y limitaciones......................................... .....................................................
Curvas normales, probabilidades, muestras y poblaciones
segn se describen en las publicaciones cientficas..................................................
Resumen ...................................................................................................i............-.........
Trminos clav e....................................................................................................................
Ejercicios ....................................................................................................................
Apndice del captulo: reglas de la probabilidad y probabilidades condicionales .........

In trod uccin a la p rueba de h ip tesis

165

166
170
170
171
172
173

176

Un ejemplo de prueba de hiptesis.....................................................................................


Lgica central de la prueba de hiptesis........................... ..............................*..................

178
179

El proceso de la prueba de hiptesis...................................................................................

y j^

Cuadro 6-1; Ser o no ser pero> es posible no ser?


Cundo y por qu aceptar la hiptesis n u la ........... ...................................................
Pruebas de hiptesis de una y dos colas............................................................................
Controversias y limitaciones.........................................................................................._
La prueba de hiptesis segn se describe en las publicaciones cientficas........................
Resumen..............................................................................................................................
Trminos clav e....................................................................................................................
Ejercicios .....................................................................

P ruebas de h ip tesis con m ed ias m u strales

jgg

394
195
196
198
198

202

La distribucin de medias...................................................................................................
Creacin de una distribucin de m edias.............................................................................
Caractersticas de una distribucin de medias ..................................................................
Prueba de hiptesis con una distribucin de medias..........................................................

203
204
206
212

Cuadro 7-1: Algo ms sobre las encuestas: errores de maestreo


y errores al analizar las muestras................................................... ........................

213

Estimacin e intervalos de confianza..............


Controversias y limitaciones:
intervalos de confianza o pruebas de significacin? ................ ;............................
Desvo estndar de la distribucin de medias mustrales,
pruebas de hiptesis sobre medias mustrales e intervalos de
confianza segn se describen en publicaciones cientficas ......................................
Resumen..............................................................................................................................
Trminos clave........................................
Ejercicios ............................................................................................................................

P oten cia esta d stica y tam a o de efecto

219
. 224

225
228
229
229

232

Qu es la potencia estadstica?................................................................
Alfa, beta y potencia ..........................................................................................................
Clculo de la potencia estadstica............................................................
Tablas de potencia ..............................................................................................................
Qu factores determinan la potencia de un estudio?.........................................................
Tamao de efecto ......................................................................................................... -......
Tamao de la m uestra.............................................................................*...................... .

234
236
239
242
243
244
252

Cuadro 8-1: La potencia de experimentos psicolgicos tpicos

..............................

254

Otros factores que influyen en la potencia........................................................................


Papel que desempea la potencia al disear un experimento............................................

256
256

La importancia de la potencia en la evaluacin de los resultados de un estudio.............


Potencia, tamao de efecto e intervalos de confianza.........................................................
Meta-anlisis........................................................................................................................

261
263
263

Cuadro 8-2: Tamaos de efecto de la relajacin


y la meditacin: un meta-anlisis sosegado............................................... ...........

264

Controversias y limitaciones: continuacin de


la controversia acerca de la significacin estadstica
Tamao de efecto versus significacin estadstica....................................................
Potencia y tamao de efecto segn se describen en publicaciones cientficas..................
Resumen........... ......................................
Trminos clave....................................................................................................................
Ejercicios .......................

266
268
270
271
271

P rueba

t para m ed ias d ep en d ien tes

274

Cuadro 9-1: William S. Gosset, alias Student:


no era un matemtico sino un hombre prctico................................................

276

Introduccin a la prueba f: prueba t para una sola muestra ..............................................


La prueba t para medias dependientes -...............................................................................
Presunciones de la prueba t,.,............ ..................................................................... ............
Tamao de efecto y potencia de la prueba t para medias dependientes............................

277
287
296
298

Cuadro 9-2: La potencia en estudios en los que se utilizan registros diferenciales:


cmo el experimento de Lanarkshire acerca del consumo de leche
podra haber sido mejor aprovechado.....................................................

302

Controversias y limitaciones................................................................................................
La prueba t segn se describe en publicaciones cientficas ..............................................
Resumen.......... :...................................................................................................................
Trminos clave.............................................................................................
Ejercicios ............................................
Apndice del captulo: frmulas de clculo optativas
para la prueba t para medias dependientes.................................................................

10

P ru eb a

t para m ed ias in d ep en d ien tes

303
303
306
306
306
310

312

Estrategia bsica de la prueba t para medias independientes:


la distribucin de diferencias entre medias ...............................................................
Pasos de la prueba de hiptesis, con una prueba t para medias independientes...............
Supuestos de la prueba t para1medias independientes ......................................................
Tamao de efecto y potencia de la prueba t para medias independientes..........................

313
319
326
328

Cuadro 20-1: Mtodos de Montecarlo>o bien, cuando la matemtica se convierte


slo en un experimento y la estadstica depende de un juego de azar .............
Controversias y limitaciones...............................................................................................
La prueba t para medias independientes segn
se describe en las publicaciones cientficas..........................
Resumen.............................................................................................................................
Trminos clave...................................................................................................................
Ejercicios ...........................................................................................................................
Apndice del captulo; frmulas de clculo optativas de
la prueba t para medias independientes'....................................................................

XI Introduccin al anlisis de varian za

330
333
334
337
338
338
341

344

Lgica bsica del anlisis de varianza...................................................................... *.......

346

Cuadro 11-1: Sir Ronald Fisher, genio mordaz de la estadstica...............................

352

Realizacin de un anlisis de varianza........................................................ ......................


Prueba de hiptesis con anlisis de varianza....................................................................
Supuestos del anlisis de varianza.....................................................................................
Tamao de efecto y potencia del anlisis de varianza ......................................................
Controversias y limitaciones: asignacin aleatoria
versus seleccin sistemtica.............................................
El anlisis de varianza segn se describe en las publicaciones cientficas........................
Resumen.............................................................................................................................
Trminos clave...........................
Ejercicios ........................................................................

354
361
363
364

12

El m odelo estructural en el anlisis de varian za

368
369
370
371
371

376

Principios del modelo estructural.......................................................................................

378

Cuadro 12-1: El anlisis de varianza como forma


de pensar acerca del m undo.............................................. -.................. .................
Utilizacin del modelo estructural para realizar un anlisis de varianza..........................
Tablas del anlisis de varianza.............................................................. ...................*........
Anlisis de varianza con grupos de tamaos desiguales....................................................
Resumen de los procedimientos de clculo del anlisis de varianza
utilizando el modelo estructural.................................................................................
Comparaciones mltiples.........................................:....................................... .................
Supuestos del anlisis de varianza con muestras de tamaos desiguales............... ..........
Tamao de efecto y potencia...............................................................................................
Controversias, limitaciones y desarrollos recientes...........................................................

383
384
385
391
391
395
395
397

El anlisis de varaoza con modelo estructural y las comparaciones mltiples


segn se describen en las publicaciones cientficas..................................................
Resumen.............................................................. ........................................ ......................
Trminos clav e....................................................................................................................
Ejercicios ............................................................................................................................
Apndice I del captulo: frmulas de clculo optativas para la suma
de los cuadrados en un anlisis de varianza de un criterio........................................

13 A n lisis factorial de varian za

398
400
401
401
405

406

Lgica bsica de los diseos factoriales y de los efectos interactivos..............................


Lgica bsica del anlisis de varianza de dos criterios....... -.............................................

407
420

Cuadro 13-1: Influencia de la personalidad y las circunstancias


en el comportamiento. Un efecto interactivo.................

422

Potencia y tamao de efecto del anlisis factorial de varianza.............. ...........................


Extensiones y casos especiales del anlisis factorial de varianza......................................
Controversias, limitaciones y desarrollos recientes..........................................................
Los resultados del anlisis factorial de varianza segn
se describen en las publicaciones cientficas............................................................
Resumen...................................................................................
Trminos clave...................................................................................................................
Ejercicios ....................................................................................................................
Apndice del captulo: frmulas de clculo optativas para
el anlisis de varianza de dos criterios.......................................................................
Apndice II del captulo: anlisis de varianza de
un criterio con medidas repetidas.............................

14 P ru eb as ch i-cu ad rad o

436
442
444
447
448
449
449
455
457

460

El dato estadstico chi-cuadrado y la prueba chi-cuadrado de bondad de ajuste.............

462

Cuadro 14-1: Karl Pearson, inventor del chi-cuadrado


y centro de controversias ................ ................... ...................................................

463

Prueba chi-cuadrado de independencia..................................................................,............


Supuestos de las pruebas chi-cuadrado...............................................................................
Tamao de efecto y potencia en las pruebas chi-cuadrado de independencia.................
Controversias y limitaciones...............................................................................................
Pruebas chi-cuadrado segn se describen en las publicaciones cientficas ................. .
Resumen.........................................................
Trminos clav e....................................................................................................................
Ejercicios ......

472
482
482
486
487
488
489
489

E strategias a aplicar cuando las d istribucion es


poblacionales no son norm ales:
transform acin de datos, pruebas de rango y orden
y m todos in tensivos por com p utad ora

494

Supuestos de los procedimientos estndar de prueba de hiptesis............. .


Transformaciones de datos...........................................................................
Pruebas de rango y orden.............. ..............................................................
Mtodos intensivos por computadora...........................................................
Comparacin de mtodos................................................. ............................

495
497
505
510
516

Cuadro 15-1: De dnde provienen los nmeros aleatorios ? ................

518

Controversias ...................................................... ,...................:....................


Procedimientos que se utilizan cuando las poblaciones parecen anormales
segn se describen en las publicaciones cientficas............................
Resumen.......................................................................................................
Trminos clave..............................................................................................
Ejercicios ......................................................................................................

519

16 Integracin d e contenidos: el m odelo lin eal gen eral

519
521
522
522

526

Relacin entre los principales mtodos estadsticos..........................................................


Revisin de los principios de la regresin y la correlacin mltiples................................
Introduccin al modelo lineal general ...............................'...............................................
El modelo lineal general y la regresin / correlacin mltiples........................................
Regresin y correlacin bivariadas como casos especiales
de regresin / correlacin mltiples ............................................. ,.............,..............
La prueba t como caso especial de anlisis de varianza....................................................
Cuadro 16-1: La poca dorada de la estadstica:
cuatro muchachos en Londres .................. ................................ .................. .......
La prueba t como caso especial de la prueba
de significacin del coeficiente de correlacin ........................................................
El anlisis de varianza como caso especial de
la prueba de significacin del coeficiente de correlacin m ltiple.......... ...............
Eleccin de pruebas estadsticas.........................................................................................

527
528
530
531
531
531
533
536
541
547

Cuadro 16-2: Dos mujeres establecen una posicin


con respecto al sexo y la estadstica ................. .............. .......................................

548

Los supuestos y el modelo lineal general...........................................................................


Controversias y limitaciones...............................................................................................

550
551

Resumen............................................................................. .................................................
Trminos clave....................................................................................................................
Ejercicios ............................................................:........................................................... .

552
554
554

17 C om prensin de los p roced im ien tos estad sticos avanzados


que aparecen en p u b licacion es cientficas
558
Breve descripcin de la correlacin y regresin mltiples................................................
Regresin mltiple jerrquica y gradual.............................................................................
Correlacin parcial.................................. ...........................................................................
Confiabilidad.................................................................................
Anlisis factorial..................................................................................................................
Modelo causal.......................... ...........................................................................................
a n c o v a (Anlisis de covarianza) .......................................................................................
MANOVA (Anlisis de varianza multivariado)
m a n c o v a (Anlisis de covarianza multivariado) .......................................................
Repaso general de tcnicas estadsticas.............................................................................
Controversia: debera ser controvertida la estadstica?....................................................

560
561
564
566
568
570
575

Cuadro 17-1; El matrimonio forzado de F iskery Neyman-Pearson...........................

580

Cmo leer resultados en publicaciones cientficas


que incluyen tcnicas estadsticas que no nos son familiares ..................................
Resumen.................................................................................
Trminos clave....................................................................................................................
Ejercicios ............................................................................................................................

582
583
584
584

Apndice A: Repaso de la lgica y de la terminologa


relacionadas con la investigacin psicolgica.......................................................

595

El mtodo de investigacin tradicionalmente ideal ...........................................................


Equivalencia de participantes en los grupos de control y experimental............................
Equivalencia de circunstancias en los grupos de control y experimental..........................
Representatividad de la muestra........................
Medicin........................................................................................................................ ......
Trminos clave....................................................................................................................

576
578
579

596

597
601
603
604
607

Apndice B: ta b la s............................................................................................................

09

Tabla B-l
reas de la curva normal: porcentaje de la curva normal entre la media
y las puntuaciones Z indicadas .................................................................................
Tabla B-2; puntos de corte para la distribucin t .............................................................
Tabla B-3: puntos de corte para la distribucin F .............................................................
Tabla B-4: puntos de corte para la distribucin chi-cuadrados.........................................

609
612
613
615

Tabla B-5: ndice de las tablas de potencia y de las tablas


con la cantidad de participantes necesarios para obtener una potencia del 80% .....

615

Respuestas a los ejercicios de la serie I ........................................ *................*..............

617

Glosario.................... *......................... ................................................... *................ -.......

667

Glosario de smbolos ....................................... .......................... ....................................

679

Referencias bibliogrficas.............................................................................................

681

ndice analtico

691

........................................................... ..............................................

Prefacio para el profesor

l corazn de la primera edicin de este libro fue escrito, durante un verano, en un pe


queo departamento de Pars cerca de Place Saint Ferdinand, y diseado en los cafs
de la zona y durante las caminatas por el Bois de Boulogne. Treinta aos de experien
cia en la enseanza, la investigacin y la redaccin avalan esta obra. Creemos que el
libro que logramos es tan diferente de los libros convencionales de estadstica como
Pars lo es de Calcuta; es ms, incluso consideramos que resultar prctico y estimulante para la
sufrida comunidad de profesores de estadstica.
El mtodo que da forma al texto se ha ido desarrollando durante tres dcadas de enseanza
exitosa, no slo porque los alumnos continuamente calificaban al curso como uno de los temas
ms importantes e interesantes de la especializacin (y estamos hablando de un curso de estads
tica), sino tambin en el sentido de que nos encontramos aos despus con alumnos que nos di
cen: Yo estaba a aos luz de los otros graduados gracias a su libro o aun cuando en la
actualidad no realizo investigaciones, su curso realmente me ha ayudado en la lectura de las pu
blicaciones cientficas relacionadas con mi especialidad.
El reconocimiento a la primera edicin ha sido sobrecogedor. Hemos recibido un gran nme
ro de e-mails y cartas de profesores (e incluso de alumnos!) agradecindonos desde todo el mun
do de habla inglesa. Por supuesto, nos emocion tambin la crtica entusiasta del Contemporary
Psychology* (Bourgeois 1997).
En la segunda edicin hemos intentado mantener los aspectos del libro que fueron especial
mente reconocidos, a la ve2 que trabajamos sobre el mismo para incluir aquellos otros aspectos
surgidos de la respuesta de la gente, de nuestras propias experiencias, y de los avances y cambios en
la materia. Sin embargo, antes de comenzar con la segunda edicin quisiramos reiterar algunos

N. de laTrad.: Psicologa Contempornea.

xv

comentarios realizados en la primera sobre la historia de ios textos de esta especialidad y sobre
aquellas cosas que hemos cambiado.

BREVE HISTORIA DE LOS TEXTOS DE ESTADSTICA COMO GNERO


En las dcadas de 1950 y 1960, los textos sobre estadstica eran libros aburridos, intiirdatorios y
basados esencialmente en la matemtica, los cuales rezagaban rpidamente a la mayora de los
alumnos. En la dcada de 1970, se produjo una revolucin; surgi el mtodo intuitivo, con mucho
menos nfasis en derivaciones, pruebas y fundamentos matemticos, El nuevo mtodo funcion.
Los alumnos comenzaron a perder el'temor a los cursos de estadstica y a considerarlos ms acce
sibles e, incluso, bastante claros.
La tendencia intuitiva continu en la dcada de 1980, y en la de 1990 se agregaron algunos tra
bajos realmente claros. En la actualidad, algunos textos adems han comenzado a incentivar a los
alumnos a utilizar las computadoras para realizar anlisis estadsticos. Sin embargo, las exposicio
nes de interpretaciones intuitivas son cada vez ms breves. Lo comn es encontrar una especie de
minimalismo en l que se hace una revisin superficial de la idea principal, y algunas veces se in
cluye la frmula de definicin de cada tcnica. Despus se detallan los procedimientos y ejem
plos para la realizacin efectiva del clculo, utilizando ofia frmula denominada de clculo.
Aun con toda esta modernizacin, o tal vez a causa de ella, al finalizar el curso, la mayora de
los alumnos no estn en condiciones de explicar claramente la lgica implcita en las tcnicas que
han aprendido. Al transcurrir unos meses, difcilmente puedan realizar siquiera los procedimien
tos. Y lo que es ms importante, no se cumplen los fies objetivos principales de los cursos de in
troduccin a la estadstica: a los alumnos les resulta imposible comprender el sentido de los
resultados en las publicaciones de investigacin psicolgica, estn mal preparados para futuros
cursos de estadstica (en los que los profesores deben, inevitablemente, dedicar la mitad del se
mestre para volver a ensear el curso de introduccin) y no se ha producido el contacto con el
pensamiento profundo que, en teora, justifica el cumplimiento del curso con las exigencias de la
educacin en general en el rea cuantitativa.

QU COSAS HEMOS REALIZADO DE MANERA DIFERENTE?____________


Continuamos haciendo lo que los mejores libros modernos ya estn realizando: poner el acento
en el aspecto intuitivo y quitrselo al aspecto matemtico y, adems, explicar cada tema en un len
guaje claro y simple. Pero nuestra obra se diferencia de esos otros libros en 11 puntos clave.
1.
Las frmulas de definicin retoman el centro de la escena, ya que las mismas brindan
un resumen simblico conciso de la lgica de cada procedimiento en particular. Todas nuestras
explicaciones, ejemplos, ejercicios e tems de los paquetes de pruebas se .basan en las menciona
das frmulas de definicin, (Hemos reducido adecuadamente las cifras utilizadas en los ejercicios
y en los tems de las pruebas para que los clculos sean manejables).
Por qu utilizamos este mtodo? Hasta el momento, los libros de estadstica no han logrado
amoldarse a la realidad tecnolgica. Lo importante no es que los alumnos aprendan a calcular una
prueba t con gran cantidad de nmeros- ya que las computadoras pueden realizar ese trabajo. Lo
importante es que los alumnos tengan siempre en mente la lgica implcita del procedimiento.
Por ejemplo, analicemos la varianza poblacional, el promedio de los desvos cuadrticos de la
media. El concepto se presenta claramente a travs de la frmula de definicin (una vez que el
alumno se familiariza con los smbolos): varianza = {X - M)2/N. Al resolver una y otra vez los

ejercicios utilizando esta frmula, el significado de la misma se fija en la mente del alumno. Por
el contrario, la versin de clculo habitual de la mencionada frmula slo oscurece el significado:
varianza - [ZX2- (ZX)2/N\/N. Lo nico que se logra al resolver ejercicios utilizando esta segun
da frmula es ensear al alumno la diferencia entre ZA2 y (Z/ 0 2!
Ensear frmulas de clculo en la actualidad es un anacronismo. Hoy en da, los investigado
res realizan sus estadsticas con computadoras. Al mismo tiempo, el empleo de software estadsti
co hace que la comprensin de los principios bsicos, tal como se expresan simblicamente en las
frmulas de definicin, sean ms importantes que nunca.
El motivo por el cual los libros de estadstica no han modificado sus mtodos, con el adveni
miento del software estadstico, es un misterio para nosotros, pero estamos convencidos de que el
cambio ya debera haberse realizado. Por supuesto, dado que las frmulas de clculo son intere
santes desde el punto de vista histrico y, ocasionalmente necesarias, y porque adems algunos
profesores pueden sentirse desprotegidos sin ellas, aun as las proporcionamos (con un ejemplo
resuelto) en un breve apndice de cada captulo en el que normalmente se presentara una frmu
la de clculo.
2. Cada procedimiento es explicado tanto numrica como verbamente y, en general,
tambin en forma visual, describiendo los mismos ejemplos en cada una de las formas men
cionadas. Los ejercicios prcticos y los tems de los paquetes de pruebas requieren, a su vez, que
los alumnos calculen resultados, creen grficos o ilustraciones, y redacten, adems, una breve ex
plicacin del significado de las estadsticas en lenguaje lego. El material de cada captulo, que in
cluye al menos dos ejemplos resueltos de las diversas formas mencionadas, prepara a los alumnos
para los ejercicios y las preguntas de las pruebas.
La experiencia nos demuestra que las diferentes formas mencionadas para expresar una idea
son de suma importancia para establecer un concepto de modo inalterable en la mente del alum
no. Muchos estudiantes de psicologa tienen mayor facilidad para manejarse con las palabras que
con los nmeros. En realidad, algunos tienen miedo de todo lo relacionado con la matemtica. Ai
redactar las explicaciones en lenguaje lego tienen la oportunidad de hacer lo que mejor hacen y, si
tienen dificultades, se ven forzados a enfrentarlas y a plantear los procedimientos en la forma ver
bal que mejor manejan.
3. Hacemos hincapi en el hecho de que la estadstica es un campo de investigacin vivo
y en crecimiento. Dedicamos el tiempo necesario para describir las controversias y los desarro
llos recientes en trminos sencillos. El objetivo es que los alumnos tomen conciencia de que los
mtodos estadsticos son esfuerzos humanos destinados a dar sentido a grandes cantidades de da
tos; que las estadsticas no surgen por naturaleza, no son infalibles, ni son una descripcin per
fecta de los hechos que intentan describir, sino que constituyen un lenguaje en constante
perfeccionamiento a travs del pensamiento esmerado de aquellos que lo utilizan. Esperamos que
esta orientacin ayude al alumno a mantener una actitud inquisitiva y alerta como tai, como tam
bin a estar a la altura de los nuevos desarrollos estadsticos como profesional.
4. El objetivo principal de todo curso introductorio de estadstica aplicada a la psicologa es
p reparar a los alumnos para la lectura de publicaciones cientficas. En realidad, el modo en
que una publicacin cientfica describe un procedimiento como la prueba t o el anlisis de varian
za con frecuencia es muy diferente de lo que el alumno espera encontrar, teniendo en cuenta las
exposiciones que normalmente aparecen en los textos. Es por eso que este libro, a la vez que ense
a un mtodo estadstico, brinda ejemplos sobre el modo en que dicho mtodo es presentado en
las revistas cientficas (extractos de publicaciones de actualidad). Los ejercicios prcticos y los
tems de los paquetes de pruebas tambin incluyen extractos de publicaciones para que los alum
nos expliquen.

5. El libro est extraordinariamente actualizado. Por alguna razn, en la mayora de los tex
tos de introduccin a la estadstica que hemos visto, parecera que los autores estuvieran escri
biendo en la dcada de 1950. Los principios bsicos siguen siendo tos mismos, pero las sutilezas
con las que los estadsticos e investigadores analizan esos principios bsicos han cambiado radi
calmente, En la actualidad, los principios bsicos estn apuntalados por una apreciacin diferen
te de temas, tales como la magnitud de efecto, la potencia y la acumulacin de resultados por
meta-anlisis; la incin primordial que desempean los diversos diseos; la coherencia implci
ta en las estadsticas por diferencia y por asociacin, y la creciente prominencia de la regresin y
los mtodos relacionados con ella, al igual que un sinnmero de nuevas orientaciones que surgen
del papel preponderante de la computadora en el anlisis. Estamos profundamente comprometidos
con los ltimos desarrollos con respecto a la teora y aplicacin de la estadstica, y confiamos en
que e libro refleja dicho compromiso. Por ejemplo, dedicamos todo un captulo al tamao de efec
to y la potencia y, al discutir el manejo de situaciones en las que los supuestos no se cumplen, cu
brimos el tema de las transformaciones de datos (se traa de un mtodo ampliamente utilizado y de
fcil comprensin para alumnos de nivel introductorio, pero que, sin embargo, la mayora de los
textos actuales de introduccin a la materia rara vez menciona). Por supuesto, las secciones que
tratan sobre controversias y desarrollos recientes son fundamentales para hacer de este libro un
texto actualizado con respecto a la utilizacin efectiva de la estadstica en la investigacin actual.
6. El captulo 16 es nico en cuanto integra las tcnicas ms importantes que han sido en
seadas, explicando que la prueba t es un caso especial del anlisis de varianza y que tanto la
prueba t como el anlisis de varianza son casos especiales de correlacin y regresin. (Resumien
do, presentamos el modelo lineal general). En el pasado, s este tema se trataba siquiera, slo ocu
rra en textos avanzados. Sin embargo, muchos alumnos lo consideran valioso para asimilar y
retener lo que han aprendido, as como tambin para sentir que han profundizado en los funda
mentos de los mtodos estadsticos.
7. El ltimo captulo analiza los procedimientos avanzados sin tratarlos en detalle. Expli
ca en trminos simples cmo interpretar esas estadsticas cuando aparecen en publicaciones cien
tficas. La mayora de las publicaciones cientficas de psicologa utilizan mtodos tales como el
anlisis de covarianza, el anlisis de covarianza multivariado, ia regresin jerrquica mltiple, l
anlisis factorial y ei modelo de ecuacin estructural Los alumnos que terminan un curso estn
dar de introduccin a la estadstica no cuentan con los elementos necesarios para comprender la
mayora de las publicaciones que deben leer para preparar sus trabajos o estudiar para determina
do curso. El captulo mencionado utiliza los principios bsicos que ios alumnos acaban de apren
der (adems de extractos extensivos de publicaciones cientficas actuales) para lograr una
interpretacin rudimentaria de los procedimientos avanzados. A la vez, el captulo sirve como
gua que los alumnos pueden guardar y utilizar en el futuro al leer el tipo de publicaciones men
cionadas.
8. El libro ha sido escrito con ia intencin de apelar a las motivaciones que llevan a un
alumno a especializarse en psicologa. Adems de intentar representar la diversidad de la psico
loga, nuestros ejemplos destacan aquellos temas y poblaciones de mayor inters para los alum
nos. El primer ejemplo fue extrado de un estudio real en el que 151 alumnos evalan el nivel de
estrs que sienten durante la primera semana de clases de un curso de introduccin a la estadsti
ca. Otros ejemplos hacen hincapi en la psicologa clnica, empresarial y educativa, y a la vez se
incluyen suficientes e interesantes ejemplos de las reas experimentales, sociales, de desarrollo y
otras, que estimulan a los alumnos con el valor de dichas reas. Adems, en nuestros ejemplos
destacamos continuamente la utilidad de los mtodos estadsticos como herramientas para el pro
ceso de investigacin, evitando siempre que ios alumnos sientan que lo que estn aprendiendo es
teora por la teora misma. El apndice A brinda una visin general de mtodos de investigacin,

mostrando el contexto en el cual funciona la estadstica, Y a medida que se ensea cada tcnica se
ilustra y recalca su funcin dentro del proceso de investigacin.
9. La Gua de estudio y libro de tareas de computacin para el alumno, que acompaa esta
obra, se concentra en el dominio de los conceptos, e incluye tambin instrucciones y ejemplos pa
ra resolver los ejercicios utilizando una computadora. La mayora de las guas de estudio se con
centran en la ubicacin de nmeros dentro de las frmulas y en la memorizacin de reglas
(coherentemente con el estilo de los textos que acompaan). Nuestra Gua de estudio y libro de
tareas de computacin establece, para cada captulo, objetivos de aprendizaje, un resumen deta
llado del captulo, las frmulas tratadas en el captulo correspondiente (con la definicin de cada
smbolo) y resmenes de los pasos a seguir para la realizacin de cada proceso tratado en el cap
tulo, ms una serie de exmenes para amo-calificarse que incluyen ejercicios de multple-choice,
ejercicios para completar y preguntas para contestar en forma de ejercicio o de ensayo. Adems,
para cada procedimiento tratado en el captulo, la gua de estudio brinda pautas completas para la
redaccin de un ensayo, explicando el procedimiento a una persona que nunca ha asistido a un
curso sobre estadstica. Como una ayuda extra para el estudio, incluye tarjetas recortables de con
sulta rpida con todos los trminos clave.
Es especialmente importante el hecho de que nuestra Gua de estudio y libro de tareas de
computacin brinda la ayuda necesaria para ensear a los alumnos a realizar anlisis estadsticos
en una computadora. En primer lugar, hay un apndice especial que presenta ia terminologa y los
procedimientos del spss para Windows. Luego, en concordancia con los captulos del libro, existe
una seccin que explica en forma detallada cmo realizar con una computadora los procesos tra
tados en cada captulo. (Esta seccin incluye instrucciones paso a paso, ejemplos e ilustraciones
que muestran cmo se ve en la pantalla de la computadora cada ingreso y devolucin de informa
cin). La gua cuenta tambin con actividades especiales para utilizar la computadora, con el fin
de profundizar la comprensin de los temas. Hasta donde nuestro conocimiento nos ha permitido
investigar, no existe otro paquete de textos sobre estadstica que brinde tal flexibilidad o profundi
dad en el tratamiento de los diversos temas.
10. Hemos escrito tambin un Manual para el Instructor que realmente ayuda a dictar el
curso. El manual comienza con un captulo que resunte lo que hemos percibido por nuestra pro
pia experiencia en la enseanza y el material producido por la investigacin acerca de la efectivi
dad en la enseanza universitaria. El siguiente captulo trata sobre organizaciones alternativas
para el curso, que incluye posibles monogramas y un programa a modo de ejemplo. Luego, cada
captulo, en concordancia con los captulos del libro, brinda un resumen completo de la clase y
ejemplos resueltos que no se encuentran en ei libro (en un formato adecuado para realizar
transparencias o para distribuir a los alumnos). Este material es particularmente til, ya que crear
ejemplos resueltos es una de las mayores dificultades al preparar clases sobre estadstica.
11. Nuestro Banco de pruebas y Respuestas a los ejercicios de la serie 0 facilita la
preparacin de buenos exmenes. Para cada captulo proporcionamos aproximadamente 40
ejercicios de multple-choice, 25 ejercicios para completar y 10 12 preguntas para contestar en
forma de ejercicio o de ensayo. Teniendo en cuenta que el nfasis del curso est puesto en lo
conceptual, los ejercicios de mltiple-choice sern particularmente tiles para aquellos que no
estn preparados para calificar ensayos. Este suplemento tambin incluye las respuestas a la se
rie II de ejercicios de cada captulo del libro, las cuales no aparecen en el mismo, (El libro inclu
ye las respuestas a todos los ejercicios de la serie I y, ai menos, un ensayo a modo de ejemplo,
por cada captulo).

La revisin para la segunda edicin la realizamos en Manhattan. Esperamos que este hecho no ha
ya provocado la prdida de cualquier encanto que pudiera haber ganado la primera edicin por
haber sido realizada en Pars. Por otro lado, la presente edicin est impregnada por el espritu del
teatro y del ballet.
Ms an, la presente revisin est enriquecida por la experiencia obtenida ai ensear con la
anterior, y por la experiencia y aliento recibidos de infinidad de profesores que nos han escrito so
bre sus propias experiencias al utilizar el libro.
La revisin tambin ha sido moldeada por nuestra propia aplicacin de mtodos estadsticos:
los ltimos cinco aos han sido un perodo muy productivo para nosotros en nuestros propios pro
gramas de investigacin, en el campo de la psicologa social y de la personalidad. (Para tener una
visin general de nuestros propios programas de investigacin, remitirse a A. Aron & E. Aron,
1997; E. Aron & A. Aron, 1997). Tal vez haya sido especialmente til que, durante los ltimos
tres aos, uno de nosotros (AA) se haya desempeado como editor asociado del jpsp (Journal o f
Personality and Social Psychology, Revista Cientfica de Psicologa Social y de la Personalidad),
hecho que nos permite estar en contacto con el modo en que los mejores investigadores utilizan
las estadsticas (como tambin con la forma en que los crticos califican el uso que sus colegas ha
cen de las mismas).
La revisin ha sido afectada tambin, y en gran medida, por los desarrollos ocurridos durante
estos ltimos cinco aos en el campo de la estadstica y en su aplicacin a la psicologa. Lo ms
importante en este sentido ha sido la controversia sobre el valor de las pruebas de significacin y
las correspondientes propuestas de reemplazarlas por las estimaciones puntuales del tamao de
efecto y los intervalos de confianza. Los temas que estn surgiendo determinarn, sin duda, el
modo en que los psiclogos utilicen la estadstica en las prximas dcadas. En el corto plazo, a
influencia ha sido sorprendentemente escasa. Durante estos tres aos como editor del psp, AA ha
manejado aproximadamente 150 manuscritos y, sin embargo, slo uno ha mostrado evidencia de
la controversia actual. Editores de otras revistas cientficas nos informan que sus experiencias son
similares. Por lo tanto, consideramos que en el futuro cercano los alumnos continuarn necesitan
do estar bien familiarizados con la prueba de significacin tradicional para estar en condiciones
de leer publicaciones tanto nuevas como antiguas.
De todos modos, en esta revisin hemos intentado tener en cuenta los aparentes vientos.de
cambio. En especial, hemos mejorado nuestro tratamiento de los intervalos de confianza, as co
mo tambin hemos cubierto ms extensamente los temas involucrados en el debate actual sobre
prueba de hiptesis (vanse las secciones de controversia de los captulos 5,7 y 8). Tal vez lo ms
importante sean los cambios sutiles de terminologa en todo el texto, sobre la base de nuestros co
nocimientos de las cuestiones actuales. Nuestro objetivo es preparar alumnos para quienes este li
bro resulte til ante cualquier cambio que se avecine, pero, al mismo tiempo, aseguramos de que
conocen los principios bsicos tal como existen en la actualidad. Por eso, mientras todos estn de
acuerdo con que las pruebas de significacin han sido mal utilizadas con demasiada frecuencia,nosotros recalcamos precisamente aquellos aspectos que permiten aseguramos de que los alum
nos no repetirn los errores ms comunes.

Las revisiones que hemos realizado se pueden dividir en cuatro clases principales:
L Redaccin: hemos revisado cuidadosamente cada oracin, simplificando las construccio
nes y la terminologa siempre que fuera posible. Ya es bastante difcil aprender estadstica como
para tener que lidiar, adems, con oraciones complicadas.
2. Actualizacin de ejemplos: hemos reemplazado ms de 100 ejemplos de la primera edi
cin con otros nuevos publicados durante los ltimos dos aos. Esta revisin es particularmente
importante en las secciones acerca de cmo interpretar y evaluar las publicaciones cientficas.
La nica finalidad de esas secciones es que los alumnos observen cmo se presentan las estads
ticas cuando se informan en investigaciones de actualidad. Al revisar los viejos ejemplos y en
contrar otros nuevos, nos sorprendi la existencia de no pocos cambios sutiles en el modo en que
se informan los resultados estadsticos. Por ejemplo, hace cinco aos, los efectos interactivos en
el anlisis de varanza se informaban, por lo general, con grficos de lneas. En la actualidad,
generalmente se utilizan grficos de barras (vase el captulo 13).
3. Actualizacin del contenido y las controversias: hemos actualizado el contenido tenien
do en cuenta nuevos desarrollos en el campo relevantes para el curso de estadstica bsica. Inclu
ye el material mencionado anteriormente sobre la controversia en cuanto a la prueba de hiptesis,
al igual que varios otros cambios, tales como la influencia del escrito de DeCarlo de 1997 sobre
curtos is o el de Frick de 1995 sobre prueba de la hiptesis nula. Las revisiones de contenido tam
bin tuvieron en cuenta cambios de terminologa bsicos, como puede ser a utilizacin del trmi
no participantes en lugar de sujetos, conforme al estilo actual de la Asociacin Americana de
Psicologa.
4. Correcciones p a ra m ejorar la pedagoga y cum plir en m ejor medida con las nece
sidades de los profesores que utilizan el libro: hemos agregado nuevas secciones sobre pro
babilidad y anlisis de varianza de medidas repetidas (vanse apndices de los captulo 5 y
13), una seccin en el captulo 1 sobre niveles de medicin y una seccin substancial sobre in
tervalos de confianza. Hemos escrito, letra por letra, la mayora de los subndices, e incluso
nos hemos esforzado an ms que en la primera edicin para utilizar ejemplos multiculturales
siempre que fuera posible.
Algunos aspectos que no hemos cambiado. Los once puntos mencionados anteriormente en
esta misma introduccin continan siendo las caractersticas centrales y distintivas del libro.
Siempre que pudimos, evitamos tambin cambiar los ejemplos que incluan grandes tablas de cl
culos para minimizar las posibilidades de error.

MANTENGMONOS EN CONTACTO
Es nuestro objetivo colaborar en todo lo que sea posible para que tenga xito con su curso.
Si usted tuviera alguna duda o sugerencia, por favor escrbanos o envenos un e-mail
(aron@psychl.psy.sunysb.edu es la direccin de ambos). Si, Dios no lo permita, usted encon
trara un error en algn lugar del libro, prometemos que a) lo corregiremos en la siguiente edicin,
b) enviaremos los detalles a todos aquellos en la red y c) incluiremos su nombre en nuestros agra
decimientos en el prefacio de la prxima edicin.

AGRADECIMIENTOS
Ante todo, queremos agradecer a nuestros alumnos de todos estos aos por haber dado forma a
nuestro mtodo de enseanza, premindonos con su valoracin por las cosas que hemos hecho
bien al igual que con sus diversas formas de anular lo que no hemos hecho tan bien.
Por habernos impulsado a iniciar este proyecto, queremos agradecer a nuestro amigo Bryan
Strong, quien en primer lugar nos alent para que lo emprendiramos, y a Brete Harrison, quien
gui el proyecto durante su desarrollo inicial. Agradecemos tambin la colaboracin y apoyo de
nuestro amigo John Touhey, quien ley varios de los primeros borradores de captulos. Los revi
sores del libro en diversas etapas han sido sumamente tiles identificando falencias en la lgica y
la pedagoga, y sus elogios generosos nos dieron mpetu cuando, ocasionalmente, nos sentamos
perdidos en la inmensidad del proyecto. Queremos agradecer a Paul C. Amrbein, Universidad de
Nueva Mxico; James V. Couch, Universidad James Madison; Livia M. DAndrea, Universidad
de Nevada, Reno; Susan E, Dutch, Universidad Estatal de Westfield; Peter C. HUI, Universidad de
Grove City; J. Robert Newman, Universidad del Estado de California, Long Beach; Michael L.
Frank, Universidad Estatal de. Stockton; Martin A. Johnson, Universidad del Estado Occidental
de Missouri; Carel Pandey, Universidad L. A. Pierce; Roger Bakeman, Universidad del Estado de
Georgia; Jeffrey S. Berman, Universidad del Estado de Memphis; y Michael J. Scozzaro, Univer
sidad suny en Buffalo.

RECONOCIMIENTOS
CO-1, PhotoDisc, Inc.; CO-2, David Young-Wolff/PhotoEdit; C-3, Leonard Lee Ru, IH/Photo
Researchers; CO-4, Secretara de Turismo de Nueva Mxico; CO-5, H., Fouque/Photo Resear
chers, Inc.; CO-6, Leu Rue, Jr./Photo Researchers; CO-7, Grant Heilman Photography; CO-8,
PhotoDisc, Inc.; CO-9, U.S. Secretara de Agricultura; CO-10, Chip Henderson Photography;
CO-11, Tom Hollyman/Photo Researchers, Inc.; CO-12, Bill Bachman/Photo Researchers, Inc.;
CO-13, Okoniewski/The Image Works; CO-14, Barry L. Runk/Grant Heilman Photography;
CO-15, Michael Newman/PhotoEdit; CO-16, Matura/Gamma-Liaison, Inc.; CO-17, Simon
Fraser/Science Photo Library.
Los datos de las pginas 99,278,279,308,309,340,341,410,449,450 y 496 se basan en las ta
blas de Cohen, J. (1988), Anlisis del poder estadstico para las ciencias del comportamiento
[Statistical Power Analysis fo r the Behavioral Sciences] (2a Ed,). Copyright 1988 por Law
rence Erlbaum Associates, Inc. Reimpreso con autorizacin.

Introduccin para el alumno

El objetivo del libro es ayudar a comprender la estadstica concentrndose en los significados y


conceptos, no slo en los smbolos y nmeros.
Esto juega a favor del alumno. La mayora de aquellos que se especializan en psicologa no
aman los clculos, pero s se sienten sumamente cmodos con las ideas; por lo tanto, queremos
subrayar lo siguiente segn nuestra experiencia de 30 aos de enseanza: nunca hemos tenido
un alumno que, siendo capaz de tener un buen desempeo en otras materias universitarias,
no lo haya logrado en esta materia. (No obstante, debemos admitir que tener xito en esta mate
ria puede requerir ms esfuerzo que tenerlo en las otras).
En esta introduccin trataremos los motivos por los que se estudia la materia y cmo aprove
charla al mximo.

POR QU APRENDER ESTADSTICA?


(ADEMS DE CUMPLIR CON UN REQUISITO)________
1. Entender la estadstica es crucial para poder leer publicaciones cientficas de psicologa.
Casi todos los cursos que el alumno tome como especialista en psicologa harn hincapi en los
resultados de estudios cientficos, y estos usualmente se expresan a travs de las estadsticas. Si el
alumno no comprende la lgica bsica de las estadsticas, si no puede comprender la jerga, las ta
blas y los grficos que constituyen el centro de cualquier informe cientfico, la lectura de los re
sultados de investigaciones cientficas ser muy superficial.
2.
Comprender la estadstica es crucial para poder realizar investigaciones cientfi
cas. Con el tiempo, muchos especialistas en psicologa deciden realizar estudios de posgrado.
Los estudios de posgrado en psicologa, incluso en psicologa clnica o de asesoramento y otras
reas aplicadas, casi siempre incluyen la realizacin de investigaciones cientficas. Con frecuen
cia, aprender a realizar investigaciones es el punto central de los estudios de posgrado, y realizar
investigaciones cientficas casi siempre incluye el empleo de estadsticas. Este curso proporciona

al alumno una base slida de los conocimientos estadsticos necesarios para realizar investigacio
nes. Ms an, dominando la lgica bsica y el razonamiento estadstico, el alumno estar extraor
dinariamente bien preparado para cursos avanzados que se concentran en la parte ms concreta
del anlisis de investigaciones cientficas.
Muchos programas de psicologa ofrecen tambin oportunidades de realizar investi
gaciones cientficas a alumnos no graduados. La idea principal de este libro es que el alumno
comprenda la estadstica, no que la utilce. Aun as, el alumno aprender lo necesario para
realizar los anlisis ms bsicos de informacin utilizados en el tipo de investigaciones que
probablemente realice.
3.
Comprender la estadstica desarrolla el pensamiento analtico y crtico dei alum
no, Los especialistas en psicologa con frecuencia estn interesados principalmente en las perso
nas y en mejorar el mundo real. Lo dicho anteriormente no significa que los especialistas en
psicologa eviten las ideas abstractas, de hecho, a los alumnos que conocemos los estimulan los
niveles de abstraccin prcticamente filosficos en los que muchas veces parecen esconderse los
secretos de las experiencias humanas. Sin embargo, incluso este tipo de ideas abstractas, por lo
general, al principio slo se captan superficialmente como frases hechas en lugar de conocimien
tos tiles. De todas las materias que el alumno posiblemente estudie en la carrera de psicologa, es
probable que sta sea la que ms lo ayude a aprender a pensar en forma precisa, a evaluar infor
macin y a aplicar el anlisis lgico a alto nivel.

CMO APROVECHAR EL CURSO AL MXIMO


Al respecto, podemos ofrecer cinco consejos:
1. Concntrese en los conceptos. Considere este curso no tanto como un curso de matemti
ca sino como uno de lgica. Cuando lea una seccin de un captulo, concentre su atencin en cap
tar los principios, Al realizar los ejercicios piense en las razones por las que realiza cada paso; si
intenta simplemente memorizar cmo obtener los nmeros correctos, habr aprendido muy poco
que le pueda ser til en sus estudios futuros, y tampoco tendr muy buenos resultados en los ex
menes de este curso.
2. Asegrese de comprender cada concepto antes de pasar al siguiente. La estadstica es
acumulativa. Cada nuevo concepto se construye sobre el anterior. Incluso dentro de un mismo ca
ptulo, si ha ledo una seccin y no la comprende, detngase, vuelva a leerla, a razonarla y pida
ayuda. Es preciso que realice todo lo necesario para captar el significado. (Si considera que ha
comprendido una seccin, pero no est totalmente seguro, intente realizar un ejercicio pertinente
de los que aparecen al final del captulo).
Tener que leer el material del libro una y otra vez no significa que uno carezca de capaci
dad. La mayora de los alumnos necesitan leer cada captulo varias veces, y cada lectura es mucho
ms lenta que en el caso de un texto comn. La lectura de textos de estadstica debe realizarse de
tenidamente, con calma y concentracin, para que vaya surgiendo el significado. Es importante
dedicar mucho tiempo a este tipo de lectura, as como tambin a su relectura.
3. No se retrase. Debido a que la estadstica es acumulativa, si se retrasa en la lectura o pier
de clases, las clases a las que luego asista resultarn prcticamente incomprensibles. Y cada vez
ser ms difcil ponerse al da.
4. Estudie con especial intensidad durante la prim era mitad dei curso. Es particularmen
te importante dominar completamente los temas tratados al comienzo del curso, ya que todo lo
dems en estadstica se construye sobre los primeros conceptos aprendidos, Sin embargo, comn
mente el comienzo del semestre es la poca en que los alumnos estudian menos seriamente,

Si ha logrado dominar la primera mitad del curso- no slo aprender la idea general sino cono
cerla realmente-, la segunda mitad resultar ms sencilla. Si no ha logrado dominar la primera
parte, la segunda resultar casi imposible.
5.
Aydense entre ustedes. No existe mejor forma de afianzar y profundizar los conocimien
tos de estadstica que intentar explicarlos a alguien a quien le resulta ms complicado aprender
los. (Por supuesto, esto debe hacerse con paciencia y respeto). Para aquellos a los que la materia
les resulta ms difcil, no existe mejor forma de resolver las dificultades que aprender de otro
alumno que acaba de comprender a fondo esos temas.
Por eso, recomendamos firmemente que se formen grupos de estudio de dos a cuatro
alumnos. Lo ideal sera que los grupos incluyan alumnos que esperan entender e! material fcil
mente y otros que no. Aquellos que comprendan la estadstica con facilidad se beneficiarn ayu
dando a otros a los que les cueste ms; stos ltimos pondrn a prueba enormemente los
supuestos conocimientos de los primeros. Aquellos que crean que tendrn inconvenientes, necesi
tan trabajar con los que no los tienen; que un ciego gue a otro ciego no es una buena forma de
aprender. Tambin es conveniente escoger compaeros de estudio que vivan cerca para que sea
fcil reunirse, y tambin hacerlo frecuentemente, si es posible una vez entre clase y clase.

COMENTARIO FINAL
Aunque cueste creerlo, nos encanta ensear estadstica. Una y otra vez hemos vivido la mara
villosa experiencia de que se nos acerquen alumnos rebosantes de alegra a decimos: Profe
sor Aron, saqu un 90 en este examen, no lo puedo creer! Yo, un 90 en un examen de
estadstica! O el alumno que nos confiesa: Realmente es entretenido. No se lo diga a nadie,
pero en verdad me divierte la estadstica, nada menos! Esperamos que a usted le ocurra algo
parecido en este curso.
Arthur Aron
Eiaine N. Aron

Las dos ramas de la metodologa


estadstica.
>'. tablas de frecuencias.
! Cmo crear tina tabla de
frecuencias?
Tabla de frecuencias agrupadas.
Histogramas,
Polgonos de frecuencias.

>.

Formas de las distr1 -----J~


frecuencias.
Controversias y limitaciones.
Tablas de frecuencias, histogramas y
polgonos de frecuencias segn se
describen en publicaciones cientficas.
Resumen.
Trminos clave.
Ejercicios,

ueremos darle al lector la bienvenida a nuestro libro de estadstica. Imaginamos que


se asemeja a otros estudiantes de psicologa que hemos conocido: eligi cursar esta
materia porque le fascinan las personas, sus comportamientos visibles, y tal vez
tambin su vida interior e incluso la propia. Algunos lectores son altamente cientfieos; otros ms intuitivos. A algunos les gusta la matemtica, a otros no tanto; y al
gunos hasta le temen. Cualquiera sea la categora en la que se encuentre el lector, es
bienvenido y puede estar seguro de que si le presta especial atencin a nuestro libro (tal vez un
poco ms que a la mayora de los libros de texto), realmente aprender estadstica. El mtodo uti
lizado en este libro result de gran utilidad en la enseanza de la materia a todo tipo de alumnos,
incluso a aquellos que previamente haban cursado estadstica con resultados insatisfactorios. Es
tamos seguros de que con nuestro libro y la ayuda de un profesor aprender bien la estadstica.
Lo ms importante es que el lector sepa que no importa por qu razn estudia psicologa. Este
curso no pretende ser una prdida de tiempo. La utilidad de esta materia radica en la necesidad de
comprender la estadstica para leerlos trabajos realizados por otros psiclogos; tambin para reali
zar sus propias investigaciones y para pulir tanto su capacidad de razonamiento como su intuicin,
Qu es realmente la estadstica? Es una herramienta que ha evolucionado a partir de un proceso
bsico de pensamiento que todo psiclogo, todo ser humano, emplea: observamos algo; nos pre
guntamos cul es su significado o cul es su causa; aplicamos nuestra capacidad de discernimiento
o nuestra intuicin; volvemos a observar, pero ahora en detalle, o bien intentamos realizar algunos
pequeos cambios en el proceso para probar nuestra intuicin. Entonces nos enfrentamos al eterno
problema: Se confirm o no nuestro presentimiento? Cules son las posibilidades de que lo que
hemos observado en esta segunda oportunidad suceda una y otra vez, de tal forma que podamos
anunciar el resultado de nuestro razonamiento al mundo como algo probablemente cierto?
En otras palabras, ia estadstica es un mtodo de bsqueda de la verdad. O al menos puede in
dicamos las probabilidades de que nuestro presentimiento sea verdadero en este momento y en
este lugar, con este tipo de personas. Esa bsqueda de la verdad, o al menos de la probabilidad fu
tura, es la esencia de la psicologa, de la ciencia y de la evolucin humana. Pensemos en las pri

meras hiptesis: Qu harn los mamuts la prxima primavera?; qu suceder si como esta raz?
Es fcil ver cmo han sobrevivido aquellos que han acertado, y el propio lector es uno de ellos. La
estadstica es una forma de bsqueda de precisin y verdad.
Los psiclogos utilizan mtodos estadsticos para dar sentido a los nmeros que renen al in
vestigar. El problema de cmo disear una investigacin adecuada es todo un tema en s mismo,
el cual resumiremos en el apndice A. No obstante, en este libro nos limitamos a tratar los mto
dos estadsticos que dan sentido a los datos recolectados durante una investigacin.

LAS DOS RAMAS PE LA ESTADSTICA_________________


Existen dos ramas principales de la estadstica:
1, Estadstica descriptiva: los psiclogos la utilizan para resumir y hacer comprensibles los
datos recolectados en el transcurso de una investigacin.
2. Estadstica inferencial: los psiclogos la utilizan para sacar conclusiones que, basadas en los
datos recolectados durante la investigacin, tienen una significancia que va ms all de los mismos.
En este captulo y en los prximos tres, nos concentraremos en la estadstica descriptiva. E
tema es importante en s mismo y, adems, prepara al alumno para comprender la estadstica infe
rencial, que constituye el tema central del resto del libro.
En este captulo veremos cmo utilizar tablas y grficos para describir grupos de datos. El
propsito de la estadstica descriptiva es facilitar la comprensin de esos datos, siendo las tablas y
los grficos muy tiles en ese aspecto.

TABLAS DE FRECUENCIAS
Comencemos con un ejemplo. Durante la primera semana del curso, Aron, Pars y Aron (1995),
como parte de un estudio ms amplio, repartieron un cuestionario a 151 alumnos en una clase de
introduccin a la estadstica. Una de las preguntas era la siguiente: Qu grado de estrs has ex---------------------------------- perimentado en las ltimas dos semanas y media, en una escala del
Tabla. 1-1,
_
Oal 10, enlaqueO indicaparanadaestresadof y lO tanestresado
eii* *cada valo^defa escala corao es posible? Las puntuaciones dadas por 151 estudiantes
de medicin de estrs.
fueron las siguientes.
P u n t u a c i n

F r e c u e n c ia

10
9
8
7

5
4
3
2
I
0

14
15
26
31
13
18
16
12
3
1
2

Fuente: Aron, Paris & Aron

(1995).

4 . 7 . 7 . 7 , 8, 8, 7 , 8, 9 , 4, 7, 3, , 9, 10, 5, 7, 1 0 , 6, 8 , 7 , 8 , 7 , 8 , 7 , 4 , 5,
1 0 , 1 0 , 0 , 9, 8, 3, 7 , 9 , 7 , 9 , 5 , 8 , 5 , 0 , 4 , , 6, 7 , 5 , 3 , 2 , 8, 5 , 1 0 , 9 , 1 0 ,
6 , 4 , 8 , 8 , 8 , 4 , 8 , 7 , 3 , 8 , 8 , 8 , 8 , 7 , 9 , 7 , 5 , 6 , 3 , 4 , 8 , 7 , 5 , 7 , 3 , 3 , 6 , 5,
7 . 5 . 7 . 8 . 8 . 7 , 10, 5 , 4 , 3 , 7 , 6 , 3 , 9 , 7 , 8 , 5 , 7 , 9 , 9 , 3 , 1 , 8 , 6 , 6 , 4 , 8 , 5 ,
10, 4, 8, 1 0 , 5 , 5 , 4 , 9 , 4 , 7 , 7 , 7 , 6, , 4 , 4 , 4 , 9 , 7 , 1 0 , 4 , 7 , 5, 10, 7, 9,
2.7,
5,9,10, 3 , 7 , 2 , 5 , 9 , 8 , 1 0 , 1 0 , 6 , 8 , 3

El slo hecho de leer todas estas clasificaciones llevara un tiempo


considerable. Al examinar rpidamente los datos obtenemos una
idea de la tendencia general, pero difcilmente sea un mtodo pre
ciso. Una solucin es confeccionar una tabla que muestre cuntos
alumnos eligieron cda uno de los once valores de estas puntua
ciones (0,1, 2 y siguientes, hasta 10). Es precisamente lo que he
mos hecho en la tabla 1-1. Este tipo de tabla se denomina tabla de
frecuencia, porque muestra con qu frecuencia (cuntas veces)

ocurre cada puntuacin. Una tabla de frecuencias hace que el patrn numrico se comprenda
claramente y a simple vista. En este ejemplo, podemos ver que la mayora de los alumnos se atri
buyeron un nivel de estrs en alrededor de 7 u 8 puntos, y que muy pocos lo hicieron por debajo
de esos valores.
V C u a e tr d -i^ l.

;.

*.

Trivialidades im portantes par estu d ian tes d e estadstica


\\
J r con espritu p o tic o .
terminar no slo la fabricacin de una deli- : ;
La palabra estadstica deriva de la palabra
ciosa cerveza sino tambin la supervivencia
. italiana ptatista, persona que trata asuntos
de miles de granjeros. Las teoras de a me
de Estado (de Stato, Estado). Original
dicin y el anlisis factorial (captulo 17) tiemente s la llam aritmtica de Estado e
involucraba representar con tablas la infor ; . nen su origen en la . psicologa !de la
personalidad, pampo en el que por primera \ ;
macin relativa a las naciones, especialmnte aqullos datos relacionados con los . vez se exploraron las profundidades del ca
rcter humano mediante la utilizacin de n- :
impuestos y la planificacin de la viabili
: meros. Y el chi cuadrado, (captulo 14) lleg
dad de las guerras. .
. a nosotros desde la sociologa, que con fre
La estadstica deriva de una amplia
cuencia trata con clases sociales.
variedad de fuentes. La idea de recolectar
En ios comienzos del desarrollo de la .
estadsticas deriv de requerimientos guber
estadstica, en los siglos xvn y xvai, era
namentales, pero tambin de la necesidad,
usual que se utilizaran los nuevos mtodos;
en tiempos antiguos, de calcular la posibili
' para, probar la existencia: d e : Dios. Por. ,..
dad de naufragios y piratera con el propsi
ejemplo, John Arbuthnot descubri que en :
to de administrar los seguros.martimos para
fomentar viajes comerciales y de explora .. Londres, entre los aos 1629 y 1970, nacie-. . ,
cin a sitios lejanos. l estudio moderno de . ron ms. bebs de sexo masculino que fe-\
menino. Mediante lo que se considera el
los ndices de mortalidad y seguros de vida
primer cas de utilizacin de una prueba
se origin en las fosas donde se depositaban
estadstica, prob que el ndice de natalidad
, los cadveres de las.vctimas de la plaga del
masculino era mayor de lo que la razn:por .
siglo xvn; all se contaban los cuerpos de
azar hubiera indicado (asumiendo' en s t e \
personas muertas en el esplendor de su ju
un porcentaje del 50% para cada sexo), lie-:
ventud. La teora de errores (tratada en. el cagando a la conclusin de que se estaba v
ptulo 4 de este libro) se origin con la
astronoma, en la observacin de las estrecumpliendo, un plan determinado, para con- :
trarrestar el hecho de que los hombres en
: lias; la teora de la correlacin (captulo 3),
frentaban mayores peligros para obtener el
. con la biologa, a partir de la observacin de
sustento para sus familias, y que dicha pla
padres e hijos. La teora de la probabilidad
nificacin, segn l, slo poda haber sido.,
(captulo 5) lleg a nosotros desde los tensos
realizada por Dios.

ambientes de las. mesas de juego. La teora


En el ao 1767, John Michell tambin
del anlisis d experimentos (captulos 9' a
utiliz la teora de la probabilidad para de
. 13) comenz a desarrollarse en las destile
mostrar la existencia de Dios, cuando argu
ras y en los ondulantes campos de trigo,
ment que las posibilidades de que seis
donde las' predicciones correctas podan de

estrellas se ubicaran tan cerca como lo.estaban las de la constelacin de Plyades


eran de 500.000 a 1, y que por ende $u ubi
cacin tena que haber sido un acto delibe
rado del Creador.
. La estadstica ayud a ganar las guerras
independentistas de lo que luego:seran los
Estados Unidos de Norteamrica. John dams:
obtuvo ayuda vital de Holanda despus de
tomar en cuenta ciertas estadsticas de su
ma importancia, cuidadosamente recolecta
das por los clrigos en las parroquias locales.
Las estadsticas demostraban que las colo
nias haban duplicado su poblacin cada 18 .
aos, agregando 20.000 hombres por ao
para la lucha. Es ste el caso de nuestro ,
enemigo, Gran Bretaa?, escribi Adams..
Entonces quin podr mantener la guerra
por ms tiempo? En el ao 1786, el presidente de los Esta
dos Unidos, Thomas Jefferson, tuvo en cuen-

ta estadsticas similares. Escribi que su


pueblo se intranquilizaba cuando haba
ms de diez habitantes por milla cuadrada
y que, debido al crecimiento d la pobla
cin del nuevo pas, en cuarenta aos stas.- .
: almas; inquietas llenaran- todo.l territorio .;,
disponible. Unos diecisiete aos despus,
' Jefferson duplic l tamao de ese territo rio disponible a travs de la adquisicin de
Louisiana.
;. A . '
En la actualidad, la estadstica,, en el .
sentido de aritmtica de Estado, es res-,
paldada jurdicamente por la mayora d '
. los gobiernos. Por ejemplo, el primer a r - :
tculo de la constitucin de los Estados
Unidos exige la realizacin de mi censo.
Quin dijo que la estadstica carece d; ;
alma o sentido humno?

Variables, valores y observaciones.


Antes de continuar con nuestra exposicin sobre tablas de frecuencias, es necesario presentar
cierta terminologa que se aplica a esas tablas y prcticamente a todos los temas tratados en este
libro. En primer lugar, explicaremos el significado de variables, valores y observaciones. Lue
go, consideraremos brevemente otro tema relacionado con diferentes tipos de variables; los nive
les de medicin,
Una manera de describir la funcin de una tabla de frecuencias es diciendo que muestra la
frecuencia de cada uno de los valores de una determinada variable. Un valor es simplemente un
nmero, como por ejemplo 4, -81 367,12. Un valor tambin puede ser una categora, como por
ejemplo, masculino o femenino o la religin de una persona.
Una variable es una caracterstica que puede tener diferentes valores. Er otras palabras, pue
de variar. En el ejemplo que ofrecimos anteriormente, la variable es el nivel de estrs, con valo
res que van desde el 0 al 10. La estatura es una variable; la clase social es una variable; el
resultado obtenido en una prueba de creatividad es una variable; el tipo de psicoterapia recibida
por los pacientes es una variable; la velocidad en una prueba de tiempo de reaccin es una varia
ble; la cantidad de personas ausentes en el trabajo es una variable, y as sucesivamente.
En toda variable, cada persona analizada presenta un nmero o valor observado (observa
cin) particular, que constituye el valor de esa persona con respecto a la variable. Por ejemplo, el
valor observado de Chris en la variable de estrs podra haber sido un valor de 6 ; Pat podra tener
un valor observado de 8. Con frecuencia utilizamos las palabras valor observado u observacin
para referimos al valor particular de una persona en una variable, ya que la mayora de las investi
gaciones psicolgicas incluyen observaciones registradas en algn tipo de prueba.

Las investigaciones psicolgicas no se tratan de otra cosa ms que de variables, valores


y observaciones. Utilizaremos estos trminos a lo largo de todo el libro. Aunque las defini
ciones formales son un poco abstractas, en la prctica el significado de estos trminos es ge
neralmente obvio.
Niveles de medicin: variables numricas y nominales
La mayora de las variables utilizadas por psiclogos son semejantes a las que aparecen en el
ejemplo de las puntuaciones de estrs. Las observaciones son nmeros que indican el grado o la
cantidad de lo que se est midiendo. En el ejemplo del estrs, cunto mayor era el nmero, mayor
era el estrs. Nosotros nos referimos a este tipo de variables como variables numricas. Las va
riables numricas tambin se denominan variables cuantitativas.
En realidad, existen distintos tipos de variables numricas. En las investigaciones psicol
gicas, la distincin ms importante debe hacerse entre (a) variables en las que los nmeros re
presentan cantidades prcticamente iguales de aquello que se est midiendo y (b) variables en
las que los nmeros slo representan posiciones relativas. Por ejemplo, el gpa (Grade Pont
Average, promedio de calificaciones) es, en lneas generales, una variable intervalar, ya que
la diferencia entre una calificacin promedio de 2,5 y otra de 2,8 significa prcticamente lo
mismo que la diferencia entre calificaciones de 3,0 y 3,3 (en ambos casos existe una diferencia
de 0,3 puntos entre las calificaciones promedio).
Un ejemplo de variable sera la jerarqua en una clase determinada. La diferencia entre el se
gundo y el tercero de la clase, en cuanto al gpa, puede implicar una diferencia distinta de la que
existe entre el octavo y el noveno. De alguna manera, se brinda menos informacin con una varia
ble ordinal; sta es menos precisa.
Otro tipo importante de variable en la investigacin psicolgica esia variable nominal (tam
bin llamada variable categrica). Las variables nominales son variables tales como el sexo o el
diagnstico psiquitrico, es decir, aquellas en las que los valores son nombres o categoras (el tr
mino nominal proviene de la idea de que sus valores son nombres). Por ejemplo, los valores co
rrespondientes al sexo son femenino y masculino. La observacin de cada persona en la
variable sexo ser uno de estos dos valores. Del mismo modo, el diagnstico tiene valores tales
como trastorno de estrs postraumtico, esquizofrenia y trastorno de obsesin compulsiva.
Las distintas clases de variables mencionadas reflejan diferentes niveles de medicin. Su
pongamos que un investigador est analizando los efectos de un tipo particular de lesin cerebral
que incide en la capacidad de reconocimiento de objetos. Uno de los enfoques que podra aplicar
el investigador sera medir la cantidad de objetos diferentes que una persona que padece una le
sin puede observar al mismo tiempo. En ese caso estaramos frente a un ejemplo de nivel de me
dicin intervalar. Otra alternativa sera que el investigador calificara a las personas del siguiente
modo: incapaces de observar objeto alguno (0); capaces de observar slo un objeto a la vez ( 1);
capaces de observar un objeto, con una vaga sensacin de la existencia de otros objetos (2), o vi
sin normal (3). En este caso, estaramos frente a una medicin ordinal. Finalmente, el investiga
dor podra dividir a las personas entre aquellas que son completamente ciegas (B), aquellas que
pueden identificar la ubicacin de un objeto pero no pueden definir qu es ese objeto (L), aquellas
que pueden identificar qu es el objeto pero no pueden localizarlo en el espacio (I), aquellos que
pueden localizar e identificar un objeto pero sufren otras anormalidades en cuanto a la percepcin
de objetos (O), y aquellos con percepcin visual normal (N). En este caso estaramos frente a un
nivel de medicin nominal.

A lo largo de todo el libro, y como sucede en la gran mayora de las situaciones reales
de investigacin psicolgica, trabajamos con variables numricas. Asimismo, trabajare
mos principalmente con variables intervalares (o variables que se consideran bastante
aproximadas a las mencionadas). En el captulo 14, veremos mtodos estadsticos que in
cluyen variables nominales, y en el captulo 15, mtodos relacionados con variables ordi
nales. No obstante, cabe destacar en este punte, que a menudo so hacen tablas de
frecuencias con variables nominales. En ese caso, la tabla muestra la frecuencia de cada
uno de los valores de la variable nominal. Por ejemplo, un psiclogo especializado en de
sarrollo, que analiza los estilos de disciplina utilizados por padres solteros, podra confec
cionar una tabla de frecuencias indicando la cantidad de padres que utilizan cada uno de
los siete estilos diferentes de disciplina. Sin embargo, en lneas generales, este libro se
concentra principalmente en tablas de frecuencias y en otros procedimientos con variables
numricas intervalares.

CMO CONFECCIONAR UNA TABLA DE FRECUENCIAS?_______________ _


Ahora podemos dedicarnos a los procedimientos concretos para la creacin de una tabla
de frecuencias.
Los pasos a seguir son tres:
1. Preparar una lista con cada valor posible, comenzando con el mayor y finalizando con
el menor. En los resultados de la medicin de estrs la lista va desde el 10, la mayor puntua
cin posible, hasta el 0, la menor puntuacin posible.1.(Aun cuando alguna de las puntua
ciones entre 10 y 0 no se utilice, ese valor de la variable de estrs deber ser incluido en la
lista, mostrando que presenta una frecuencia 0. Por ejemplo, si nadie hubiera seleccionado
un valor 2 de estrs, de todos modos debera incluirse el 2 como uno de los valores de la ta
bla de frecuencias).
2. Controlar una por una todas las observaciones, realizando una marca en cada una de ellas
al lado del valor correspondiente. La figura 1-1 ilustra este procedimiento. Es recomendable ir ta
chando cada registro a medida que se incluya la marca correspondiente junto a la lista de valores.
3. Preparar una tabla prolija que muestre cuntas veces ha sido elegido cada valor de la lista.
Para ello se debe sumar la cantidad de marcas realizadas junto a cada valor. Es conveniente con
trolar la precisin dei trabajo realizado sumando esos totales, de modo de asegurarse de que coin
cidan con la cantidad total de observaciones. (Vase figura 1- 1).
Ejemplo de la confeccin de una tabla de frecuencias
Como parte de un estudio ms amplio sobre el comportamiento social de alumnos universitarios,
Tracy McLaughn-Volpe y sus colegas (1998) hicieron que 94 estudiantes del ciclo de Introduc
cin a la Psicologa llevaran un diario de sus interacciones sociales durante una semana del se
mestre. Cada vez que los participantes tuvieran una interaccin social de 10 minutos o ms,
deberan llenar una tarjeta. La tarjeta inclua preguntas tales como quines eran las otras personas
con las que interactuaban, cmo se sinti el alumno durante la interaccin y varios aspectos rela
l,La mayora de. los expertos en estadstica siguen el procedimiento aqu recomendado, ordenando los valores desde el
mayor, en l parte superior, hasta el menor, en la parte inferior. Sin embargo, en las publicaciones cientficas es ms
probable que las rabias de frecuencias contengan el nmero menor en la parte superior y el mayor en la parte inferior.

PUNTUACIONES

10
9

-'
,

6
75:7

4
3

FRECUENCIA

7,8,9, 4, 7, 3, 6, 9, TO', 5,
7, 10, 6, 8, 78, 7, 8, 7, 4, 5, ' 10,10.0,9,,

F igura 1-1. Construccin de


una tabla de frecuencias, uti
lizando los datos de; Aron,
Pars, & Aron (1995).

' 8,3,7,9,7,9,5,8,5,0,4,6, 6,7,5,3,2,


8,5/10,9,10,6,4,8,8,8,4,8,7,3,8,8,
M ,.7; 9,7,5,0,3, 4, 8, 7, 3, 7, 3, 3, 6,
5, 7, 5, 7, 8, 8, 7, 10, 5, 4, 3, 7, 6, 3, 9, 7,
8,5,7,9.9,3,1,8,6,6,4,-8,5,10,4,8,
10,'5,5,4,9,4,7,7, 7, 6, 6, 4, 4, 4, 9, 7,

' 2

1
0

10, 4,7,5,10,7,9,2,7,5,9,10,3,7,2,

5,9,8,10,10,6,8,3,

cionados con la naturaleza de la conversacin mantenida. Excluyendo las situaciones familiares y


laborales, la cantidad de interacciones sociales (de 10 minutos o ms de duracin) ocurridas du
rante una semana en el caso de cada uno de los 94 alumnos, fue la siguiente:
31- .
48-/
' 15-/
.'4 7 -//
3 0 -//-:
1 4 -/// .
46- ,
, 2 9 -////
1 3 -//
'45-' - - ' 2 8 - /.' /.
.1 2 -/
'44 7 : , - 27 - /
M i-////
26 7 / 7 r - . : . i o ' . m i l
4 2 - . 2 5 - // /' ' L 9 - / .
41-/
\ ',24,-7/
;8r-W 2/
4 0 :/',
.
1 -//; ;
1 ..2 2 7 /7
39--,
;
M ' ; - / / 7 ' 5-->)/
3 8 -/-"
'2 0 - , - . ' ,: 4 - //7/
.3736 r 9 - / / / / - .% 'y tfU .
'35,-7/
' 1 8 - M ' 7 ;- - / M M
34- 1 7 -////' '-Y '- - 7
3 3-/
J - / : ; 7 7 '. . 7 7 . '7 '

3^ - z i .

; v(: l :

;:r;;4-;

48,15, 33, 3, 21, 19, 17,16,44,25, 30,3, 5,9, 35,32,26,


1 3 ,1 4 ,1 4 ,47,47,29, 18,1 1 ,5 ,1 9 ,2 4 ,1 7 ,6 ,2 5 , 8,18,29,
1, 18, 22, 3 ,2 2 ,2 9 ,2 , 6,10, 29, 10, 21, 38, 41,16,17, 8,
40, 8, 10, 18, 7, 4, 4, 8, 11, 3, 23, 10, 19, 21, 13, 12, 10,
4,17, 11,21, 9 , 8,7 , 5 ,3 ,2 2 ,1 4 ,2 5 , 4,11, 10,18, 1,28,
2 7 ,1 9 ,2 4 ,3 5 ,9 ,3 0 ,8 ,2 6

F igura 1-2, Construccin de una tabla


de frecuencias del nmero de interac
ciones sociales mantenidas por estu
diantes durante una semana.

(Fuente: McLaughlin-Vlpe et al. 1998).

Sigamos ahora los tres pasos indicados para la creacin de una tabla de frecuencias.
1. Preparar una lista de cada valor posible a lo largo del margen izquierdo de la pgina,, co
menzando con el mayor y finalizando con el menor. En este estudio en particular, la mayor canti
dad de interacciones podra ser cualquier numero. Sin embargo, el mayor nmero obtenido en ei
grupo analizado es 48, por lo tanto, podemos utilizarlo como el mayor valor posible. Y la menor
cantidad posible de interacciones es 0. Teniendo en cuenta lo anterior, el primer paso a seguir es
hacer una lista de esos valores. (Sera buena idea utilizar varias columnas para poder incluir todos
los registros en una sola pgina).
2. Revisar los registros uno por uno, haciendo una marca por cada uno junto al valor corres
pondiente en la lista. La figura 1-2 muestra el resultado de este paso.
3. Preparar una tabla prolija que indique cuntas veces ocurre cada uno de los valores de la
lista. La tabla 1-2 es la tabla de frecuencias definitiva.

T a b la d e fr e c u e n c i a s d e i n m e r o d e in t e r a c c io n e s s o c ia l e s m a n t e n id a s p o r 9 4 e s t u d ia n t e s u n iv e r s it a r io s
d u ra n te u n a se m a n a .
O b s e r v a c io n e s F r e c u e n c ia s

O b s e r v a c io n e s

F r e c u e n c ia s

O b s e r v a c io n e s

31
30
29
28
27
26
25
24
23
22
21

0
2
4
1
1
2
3
2
1
3
4

15
14
13
12
11
10
9
8
7

19
18
17

4
5
4

1
2
0
0
1
0
0
1

0
1
0
0
2

1
1

48
47
46
45
44
43
42
41
40
39
38
37
36
35
34
33
32'

20

6
5
4
3
2
1
0

F recue
1
3
2
1
4
6
3
6
2
2
3
4
5
1
." 2
0

Fuente: McLaughlin-Volpe et al.

Tabia de frecuencias agrupadas


A veces existen tantos valores posibles que es difcil reflejarlos en una tabla de frecuencias; en el
ltimo ejemplo suceda algo as. La solucin a este problema consiste en formar grupos de valo
res que incluyan todos aquellos valores que se encuentran comprendidos dentro de un determina
do intervalo. Analicemos el ejemplo de medicin del estrs. En lugar de presentar una frecuencia
para los alumnos que atribuyeron a su estrs 8 puntos y otra para los que lo hicieron con un 9, po
dramos presentar una categora combinada de 8 y 9. La categora combinada es un intervalo que
incluye los dos valores, la cual tendra una frecuencia de 41 (26 casos con 8 puntos, ms 15 casos
con 9 puntos).
Una tabla que asocia frecuencias a intervalos es una tabla de frecuencias agrupadas. La ta
bla 1-3 es la tabla de frecuencias agrupadas correspondiente al ejemplo de medicin del estrs.
(Sin embargo, en este caso, la tabla de
frecuencias completa tena slo 11 valo
T a b la 1 -3 .
res diferentes y, por ende, no era real
T a b la d e f r e c u e n c i a s a g r u p a d a s c o r r e s p o n d i e n t e a la s
mente necesario realizar una tabla de
p u n tu a c io n e s d e e str s .
frecuencias agrupadas). La tabla 1-4 es la
tabla de frecuencias agrupadas corres
F recuenda
I n te r v a lo s d e d a s e :
pondiente al caso de la cantidad de inte
14
1 0 - 1 1 ,9
racciones sociales mantenidas por 94
8 - 9 ,9
41
estudiantes durante una semana.
6 - 7 ,.9
44
4 - 5 ,9
2 - 3 ,9
0 -1 ,9
F u en te : A ron, Pars & A ron (1 9 9 5 ).

34
15
3

T a b la d e f r e c u e n c i a s a g r u p a d a s d e l n m e r o d e i n t e r a c c i o n e s s o c i a l e s m a n t e n i d a s p o r 9 4 e s t u d i a n t e s
u n iv e r s ita r io s d u r a n te u n a s e m a n a .

In terv a lo s d e d a s e

F r e c u e n c ia

4 5 -4 9 ,9
4 0 -4 4 ,9
3 5 -3 9 ,9
3 0 -3 4 ,9
2 5 -2 9 ,9
2 0 -2 4 ,9
1 5 -1 9 ,9
1 0 -1 4 ,9
5 - 9,9
0 - 4,9

3
3
3
4
11
10
16
16
16
12

F u en te : M cL augh lin-V olpe et at, (1 9 9 8 ).

A travs de una tabla de frecuencias agrupadas se puede, brindar informacin de forma an ms


directa que mediante una tabla de frecuencias comn. Cabe destacar, sin embargo, que la facili
dad de comprensin que brinda una tabla de frecuencias agrupadas se logra a costa de perder cier
ta informacin, como por ejemplo, el detalle de las frecuencias dentro de cada intervalo.
Cmo confeccionar una tabia de frecuencias agrupadas?
El punto clave al construir una tabla de frecuencias agrupadas es definir de qu modo se agrupa
rn los valores individuales, es decir, la serie de valores a incluir en cada intervalo. No deben exis
tir brechas entre los intervalos, porque lo que nos interesa es incluir todos los valores de la tabla
de frecuencias; tampoco deben superponerse unos valores con otros, porque no sabramos en qu
Intervalo incluir algunas observaciones. Asimismo, es muy importante que todos los intervalos
tengan la misma longitud (es decir, que incluyan igual cantidad de valores). De ese modo, cuando
se compare la cantidad de observaciones de dos intervalos diferentes, se estarn comparando dos
elementos de igual tamao.
Al decidir la formacin de los intervalos se deben considerar tres principios fundamentales.
Primero, es deseable tener entre 5 y 15 intervalos. (No debe haber demasiados intervalos yaque el
objetivo de la tabla de frecuencias agrupadas es simplificar la informacin y transmitirla a prime
ra vista. Por otro lado, si los intervalos son muy pocos, la tabla dejara de ser til en cuanto a la
descripcin del patrn que forman las observaciones. En general, se ha observado que la cantidad
adecuada sera entre 5 y 15 intervalos).
El segundo principio es que el tamao del intervalo (la cantidad de valores que incluye) de
be ser un nmero con el que resulte fcil trabajar. Se considera que 2 ,3 ,5 ,1 0 , mltiplos de 5
de 10, son tamaos adecuados de intervalo. Tambin es til que los lmites del intervalo (los n
meros con los que los intervalos comienzan y terminan) se establezcan de forma tal que el lmite
inferior de cada intervalo sea mltiplo exacto del tamao del intervalo. Por ejemplo, supongamos
que estamos utilizando un intervalo de tamao 2 , con informacin cuyo valor menor posible sea
cercano al 0. Los lmites de intervalo apropiados seran de 0 a 2, de 2 a 4, de 4 a 6, y as sucesiva
mente. O bien, supongamos que estamos utilizando tamaos de intervalo de 5, con informacin
cuyo valor menor posible sea 32. En este caso, usaramos intervalos de 30 hasta casi 35, de 35
hasta casi 40, y as sucesivamente.

Con respecto al lmite superior de los intervalos, generalmente utilizamos el valor real ms
alto que pueda tener la variable, y que sea inmediatamente inferior al comienzo del siguiente in
tervalo. En otros casos, los investigadores pueden colocar como lmite superior de sus intervalos
un nmero decimal apenas menor al lmite inferior del siguiente intervalo. Es decir, si los nicos
valores posibles fueran nmeros enteros, los intervalos serian de 30 a 34,35 a 39, y as sucesiva
mente; aunque tambin podramos utilizar intervalos de 30 a 34,9; 35 a 39,9, y as sucesivamente.
(Si los nmeros a incluir fueran de dos decimales, deberamos utilizar intervalos de 30 a 34,99; 35
a 39,99, y as sucesivamente).
Al determinar los intervalos se debe tener en cuenta tanto la cantidad de intervalos (el princi
pio fundamental mencionado en primer lugar) como el tamao de los mismos (el segundo princi
pio fundamental). A veces es difcil cumplir con ambos principios, y entonces se deben hacer
concesiones. A menudo existe ms de un modo de preparar una tabla de frecuencias agrupadas
que cumpla con las reglas que mencionamos anteriormente (y algunas veces no es posible reali
zar una tabla de frecuencias agrupadas sin ajustar levemente alguna de dichas reglas.) En esos ca
sos, tendremos la oportunidad de utilizar la creatividad, recordando siempre que el objetivo es
realizar una tabla de frecuencias agrupadas que presente las observaciones de forma simple y di
recta.
A continuacin, describimos cuatro pasos a seguir para construir una tabla de frecuencias
agrupadas que cumpla con los principios que hemos estudiado:
1. Restar el valor menor al mayor para obtener la amplitud de la serie de valores. En la medi
cin de estrs, la amplitud es 10 valores (10 - 0 = 10). En el ejemplo sobre la cantidad de interac
ciones, la amplitud es 48 (48 - 0 = 48).
2. Dividir la amplitud por un tamao de intervalo razonable. (Siempre que sea posible, es
conveniente utilizar los tamaos 2,3 , 5,10, un mltiplo de 10). Probar distintos tamaos de in
tervalo hasta lograr, despus de redondear, una cantidad razonable de intervalos (en general, entre
5 y 15). En el ejemplo de medicin de estrs, al dividir la amplitud 10 por un tamao de intervalo
de 2, el resultado es 5, que es la menor cantidad aceptable de agrupaciones. En el ejemplo de la
cantidad de interacciones sociales, al dividir la amplitud de 48 por un tamao de intervalo de 5 y
luego redondear, el resultado es 10, que es una cantidad de intervalos adecuada.
3. Realizar una lista de los intervalos de mayor a menor, controlando que el lmite inferior de
cada intervalo sea mltiplo exacto del tamao del intervalo. En el caso de la medicin de estrs, el
primer intervalo es 10-11,9, el siguiente es 8-9,9, y as sucesivamente. Los lmites inferiores de
stos intervalos, 10 y 8, son mltiplos de 2 , es decir, el tamao de intervalo. (Si se utilizaran, por
ejemplo, intervalos de 9-10,9 y 7-8,9, los intervalos respetaran el tamao de 2 valores, pero los l
mites inferiores 9 y 7 no seran mltiplos de 2). En el caso de las interacciones sociales, cada in
tervalo comienza con un mltiplo de 5.
4. Proceder de igual modo que en el caso de una tabla de frecuencias no agrupadas comn: le
yendo una por una las observaciones, realizando una marca al iado de cada intervalo y as sucesi
vamente, para realizar luego una tabla prolija. (Si ya se ha realizado una tabla de frecuencias
comn con las observaciones, este paso resultar mucho ms simple: slo es necesario sumar las
frecuencias de los valores que forman cada intervalo).
Otro ejemplo de construccin de una tabla de frecuencias agrupadas
Las tablas de frecuencias agrupadas son especialmente tiles cuando los valores incluyen decima
les ya que, por lo general, cuando se trabaja con decimales, cada individuo presenta una observa
cin diferente. Analicemos el siguiente ejemplo ficticio, basado vagamente en el trabajo de Inhoff,

Lima y Carroll (1984). El objetivo de los estudios realizados consista en observar el efecto del
contexto en la velocidad de lectura de oraciones ambiguas. Las oraciones eran ambiguas, por lo
cual podan ser tomadas literal o metafricamente, como por ejemplo, las carteleras son verrugas
en el paisaje. En un captulo posterior analizaremos este estudio ms profundamente, pero por
ahora nos concentraremos en la parte de la investigacin que slo pretenda determinar el tiempo
de lectura de oraciones bsicas ambiguas (metafricas) dentro de un contexto no metafrico. El
tiempo de lectura se mide mediante un dispositivo electrnico que, a la vez que presenta el mate-:
nal de lectura, determina si los ojos se estn moviendo o estn fijos. A los efectos del ejemplo, su
pondremos que los participantes en la investigacin eran 100 alumnos secundarios y que cad uno
deba leer varias oraciones ambiguas. Ms abajo se detalla la lista (de observaciones ficticias) cn
el nmero promedio de segundos que demor cada participante en leer las oraciones ambiguas.
2 ,7 2 ; 2 ,8 4 ; 2 ,6 3 ; 2 ,5 1 ; 2 ,5 4 ; 2 ,9 8 ; 2 ,6 1 ; 2 ,9 3 ; 2 ,8 7 ; 2 ,7 6 ; 2 ,5 8 ; 2 ,6 6 ; 2 ,8 6 ; 2 ,8 6 ; 2 ,5 8 ; 2 ,6 0 ; 2 ,6 3 ; 2 ,6 2 ;
2 ,7 3 ; 2 ,8 0 ; 2 ,7 9 ; 2 ,9 6 ; 2 ,5 8 ; 2 ,5 0 ; 2 ,8 2 ; 2 ,8 3 ; 2 ,9 0 ; 2 ,9 1 ; 2 ,8 7 ; 2 ,8 7 ; 2 ,7 4 ; 2 ,7 0 ; 2 ,5 2 ; 2 ,7 5 ; 2 ,9 9 ; 2 ,6 6 ;
2 ,5 8 ; 2 ,7 1 ; 2 ,5 1 ; 2 ,8 7 ; 2 ,8 7 ; 2 ,7 5 ; 2 ,8 5 ; 2 ,6 1 ; 2 ,5 4 ; 2 ,7 3 ; 2 ,9 6 ; 2 ,9 0 ; 2 ,7 5 ; 2 ,7 6 ; 2 ,9 3 ; 2 ,6 4 ; 2 ,8 5 ; 2 ,7 0 ;
2 ,5 6 ; 2 ,5 1 ; 2 ,8 3 ; 2 ,7 9 ; 2 ,7 6 ; 2 ,7 5 ; 2 ,8 6 ; 2 ,5 8 ; 2 ,8 7 ; 2 ,8 9 ; 2 ,8 9 ; 2 ,5 2 ; 2 ,5 9 ; 2 ,5 4 ; 2 ,5 4 ; 2 ,8 5 ; 2 ,8 3 ; 2 ,9 6 ;
2 ,9 3 ; 2 ,8 9 ; 2 ,9 2 ; 2 ,9 8 ; 2 ,5 9 ; 2 ,8 1 ; 2 ,7 8 ; 2 ,9 5 ; 2 ,9 6 ; 2 ,9 5 ; 2 ,5 6 ; 2 ,5 9 ; 2 ,8 7 ; 2 ,8 4 ; 2 ,8 4 ; 2 ,8 0 ; 2 ,6 5 ; 2 ,7 0 ;
2 ,6 1 ; 2 ,8 9 ; 2 ,8 3 ; 2 ,8 5 ; 2 ,5 2 ; 2 ,6 6 ; 2 ,7 4 ; 2 ,7 3 ; 2 ,8 8 ; 2 ,8 5

A continuacin, se describen los pasos que se deben seguir para construir una tabla de fre
cuencias agrupadas utilizando los datos contenidos en la lista.
1. Restar el valor menor al mayor para saber cul es la amplitud de la serie de valores. El va
lor mayor (2,99) menos el menor (2,50) da 0,49.
2. Dividir la amplitud por varios tamaos de intervalo posibles hasta encontrar, despus de re
dondear, una cantidad razonable de intervalos. Cuando la amplitud es pequea, es necesario tener
en cuenta tamaos de intervalo representados por decimales. Sin embargo, aun utilizando deci
males, es conveniente utilizar slo tamaos de intervalos que sean nmeros comunes y regulares.
As, en este ejemplo, podramos tomar un tamao de intervalo de 0,1, lo cual dara como resulta
do 5 intervalos, pero sera an ms adecuado utilizar el tamao 0,05, para obtener 10 intervalos.
3. Realizar una lista de los intervalos ordenndolos de mayor a menor. En este caso, los inter
valos deberan comenzar con 2,95-2,99 y continuar hasta 2,50-2,54.
4. Proceder del mismo modo que con una tabla de frecuencias comn. La tabla 1-5 muestra el
resultado.

T a b la 1 -5 .
T a b la d e f r e c u e n c i a s a g r u p a d a s c o r r e s p o n d i e n t e a u n e s t u d i o r e a l i z a d o a 1 0 0 a l u m n o s s e c u n d a r i o s ,
p a r a m e d i r e i t i e m p o p r o m e d i o d e le c tu r a d e o r a c i o n e s a m b i g u a s ( e n s e g u n d o s ) .

T ie m p o d e le c tu r a
2 ,9 5 - 2 ,9 9
2 ,9 0 - 2 ,9 4
2 ,8 5 - 2 ,8 9
2 ,8 0 - 2 ,8 4
2 ,7 5 - 2 ,7 9
2 , 7 0 - 2 ,7 4
2 , 6 5 - 2 ,6 9
2 ,6 0 - 2 ,6 4
2 , 5 5 - 2 ,5 9
2 , 5 0 - 2 ,5 4

F r e c u e n c ia
9
7
20
n
10
0
4
8
10
11

HISTOGRAMAS
Los grficos constituyen otro medio adecuado para facilitar la comprensin de una cantidad im
portante de registros. Una imagen vale ms que mil palabras, y a veces ms que mil nmeros.
Una manera de graficar la informacin de una tabla de frecuencias es con un grfico de barras es
pecial denominado histograma. En un histograma, la altura de cada barra representa la frecuen
cia que le corresponde al intervalo de acuerdo con la tabla de frecuencias. Adems, las barras
estn ubicadas una al lado de la otra, sin espacios entre ellas. Los histogramas se parecen al con
torno de una ciudad en el horizonte. La figura 1-3 muestra dos histogramas basados en el ejemplo
de medicin del estrs (uno representa la tabla de frecuencias clsica y el otro la tabla de frecuen
cias agrupadas).
Figura 1-3. Histograma basado en (a)
tabla de frecuencias y (b) tabla de fre
cuencias agrupadas segn informa
cin de Aron, Paris, & Aron (995).

Afrontmoslo: muchos alumnos le temen


a este curso, incluso hasta el punto de con
vertirse en un caso de angustia estadstica.
(Zedner, 1991) Por lo tanto, si hay quienes
se pondrn tensos a medida que comiencen a
aparecer los nmeros, ser mejor tratar el te
ma ahora mismo.
En primer lugar, este curso es una opor
tunidad para comenzar de cero con los d
gitos. El desempeo anterior (o la ausencia
de desempeo) en geometra, trigonometra,
clculo u horrores semejantes no debe i n - .'.
fluir de ningn modo en la forma de encrar
la estadstica. Es una materia muy distinta
de las otras.
En segundo lugar, si la preocupacin
persiste, es necesario descubrir cul es su
origen. La angustia matemtica o estadsti
ca, la angustia provocada por ios exme
nes, la angustia en general y el baj nivel /
de confianza en uno mismo son elementos';
que aparentemente influyen en el nivel de .
dificultad que enfrentan los alumnos en los
cursos de matemtica. (Cooper & Robnson, 1989; Swinell & Higbee, 199.1)
Angustia matemtica: si el problema
es la angustia matemtica, recomendamos
averiguar si el centro de asesoramient; 'de.'
la facultad cuenta con algn programa d
ayuda para aquellos que tienen esta dificul- y
tad (como por ejemplo, los programas estu
diados por Schneider & Nevid, 1993; Vanee
& Watson, 1994). De lo contrario, existe n
buen libro sobre el tema: Cmo tener xito
con las matemticas?: gua para que cada
alumno pueda superar la angustia mate
mtica [Succeed With Math: Every Student's Guide to Conquering MathAnxiety].
(I9B7)

Tobas, una alumaa que sola evitar la


matemtica, sugiere que el objetivo debe ser
la salud mental matemtica, la que ella
misma define como la Voluntad d pren? .
der las matemticas que necesitas,:'eand
las necesitas, (p, 12) (Tal vz este curso de:: ,
estadstica pueda ser una de esas opdrhrni-:-;
ddes).
' - ;:/v Tobas explica que la salud mental ma- , '
temtica se pierde generalmente en la pri- .
maria. Cuando el alumno pasa al frente' su
mente se bloquea y e resulta iniposible enconfiar l respuesta correcta a un problema
aritmtico. S igo de esa experiencia el
ahiinn conserva alguna cnfianz, probablemente.la pierd durante los exmenes,
cronometrados, los cuales- aunquero re --::
Slte evidente, sn difciles para todos, ex-:.
cepto para unos pocos expertos.'
Tobas sostiene que. los alumnos' hbb
les para las matemticas no son necesria-:
mente ms inteligentes que el resto, sino
que realmente conocen cules son sus for
talezas y sus debilidades, sus estilos de pen- , .
samientos y sentimientos con respect, a un
problema; No se juzgan severamente por.
sus errore: Particularmente,.no espran cm-.
prender las cosas en forma- instantnea. '
Permitirse tener; un aprendizaje lento- no '
significa ser menos intehgnte, 'implca qe -.:la propia salud mental matemtica est ere-. .
cendo. ; . '
T ; ,, 'y 'y;\ f %- yy- y
Uno d los trucos de.Tobas es dividir a: :
pgina en dos y trabajar-con los; problemas :
de estadstica en la mitad derecha. Cuando,
la angustia estadstica bloquea su: trabajo,
utiliza la mitad izquierda para anotar sus.
pensamientos. En general, se-trata de pen
samientos negativos, comopor ejemplo nun-

ne que el problema es provocado por la an


:ca voy a aprender esto. Luego, Tobas reem
plaza esos pensamientos por otros ms ra- . siedad fsica y por un estado emocional ge
neral de angusti. Cualquier tipo de angustia
zonabes y positivos, tales como slo es
. cuestin de tiempo, y si me trabo durante
"produce nsiedd,. y: tina, de las; relaciones .:.
ms comprobadas en psicologa es la que ..
. demasiado tiempo siempre habr , alguien
que rae ayude o mira todo lo qu ya he :' existe entre la ansiedad y el ' desempeo :..
aprendido sobre estadstica. De ese modo,
(vase figura 3-6). Mientras qpl ansiedad '
mderada s pbsitiya para el desempeo, de-
nunca deja de trabajar (ya sea en el proble
; masida (o, muy poca) ansiedad lo reduce,
ma o en los obstculos psicolgicos que le
drsticamente.
impiden resolverlo).
. Cuando la raz, del .problema, es ,a an
Angustia por los exmenes: si el pro
siedad, es til-para el alumno saber que. no
blema es la angustia causada por ios ex
'. existe nada malo en el hardware, nada :
menes, tambin ,podemos brindar nuestra
malo ocurre con su cerebro, su inteligencia: - ^
ayuda. Es posible que en el centro.de ase o su forma de estudiar el material. El aium-
soramiento dicten algn curso sobr el te
ma o exista algn libro al. respect. Sin ; no debe confiaren que realmente conoce e l .
embargo, creemos que resultara til para : tema. Mueiler, Elser y Roack (1993) lo
el alumno saber que existen tres modos de .demostraron probando, directa indirecta-..
reducir la angustia causada por los. exme- : mente ; en qu medida era adecuado e l.., *
aprendizaje de una lista de palabras, descu- .
nes, de tal forma que pueda elegir la com
binacin de los. tres que ms se adece a ,... briendo que al ser probados en forma direc-,
ta, los sujetos que estaban angustiados . .;
cada uno.
mostraban, un desempeo inferior al de :i
El primer mtodo parte del supuesto de
que dominar un tema cualquiera pesa ms aquellos que no lo.estaban.. Sin embargo, al T
que la angustia; que.pueda sentirse; incluso, V ser probados indirectamente, el nivel de deexisten investigaciones qu. as lo sugieren : sempeo de unos y otros era prcticamente'
(Klejin, vanderPloeg. & Tppman, 1994). - ^ Al misino. /
' i
. Cmo se puede reducir la angustia y :
i Adems, elhechode estar ben prepala ansiedad? Una vez ms, el centro de ase- ; !
rado tiene qu reducir la angusti.. El rijejor .
momento para comenzar a aplicar esta tc v soramiento debera estar capacitado, para
tica es.el primer, examen del purso: rio0ha ri. brindarayudaenla resoluein deeste prT; :
blema, o bien, aconsejar'l lectura d libros
br material antiguo para repasar, e | xito
no depender de haber comprendido .tenias v: . tiles al respectp. Existen muchas cnics,
tales como' aprender respirar de forma i
previos y ser til para un mejor desempe
adecuada y tomar un breve descanso para '
o a lo larg de todo el curso. (Hasta se po
. relajarse profundamente. Despus de aprn-;
dra .conquistar la simpata del: profesor o.
der el mtodo de relajacin se puede in-,
ayudante de ctedra presentndole una lista
tentar la desensibilizacin sistemticaV, .
Se los temas estudiados, explicndole por
qu se est siendo tan exigente y aven- . travs de la cual el alumno se imagina a s
mismo en itacihs.de.examen cada vez. : i
guando $i falta estudiar algn tema). La
preparacin, para el examen debe ser absur
ms complejas nenras pennanece: fisi-. '
damente completa, pero slo para unos po . carpente relajado. Loimportante esguarse ;
por lo que resulte ms adecuado para c- .
cos exmenes. Despus de tener xito n
' : ' da uno.
^

'.
..
ellos, la angustia debera disminuir.
;VJn (ruc muy til para reducir la ansie-..
El segundo mtodo para disminuir la
angustia provocada por los exmenes supo- ; dad. es crear, una. prctica' de xmen, tan ;

parecida a una prueba real como sea posi


pando, nuevamente sugerimos que es mo~
ble, de tal manera de familiarizarse con la ment de intentar obtener ayuda del cordial ,
centro de asesoramiento universitario.
mayor cantidad de aspectos de un examen
Un ltimo comentario sobre la an
(de modo que causen menos ansiedad). Es
gustia y la ansiedad: es probable que el
importante que el alumno se .'esfuerce por .
lector se encuentre dentro del 15 20% ;d e v
reproducir los aspectos que ms lo inqueseres humanos (y animales superiores) que
. ten. Si el problema es la falta de tiempo,
nacen con una cualidad que los.hace ms
una vez que se considere bien preparado
propensos a percibir las estimulaciones su- 7\
debe establecer un lmite de tiempo para
tiles, lo cualcn frecuencia los: hace sumaesolvr algunos de los ejercicios que tenga
mont intuitivos; : incluso' dotados, .o :"
como tarea. :Las respuestas deben ser com
pletas y legibles, ya que estos dos requisi v obstante, estos seres tambin resultan fcil- '
mente excitables por niveles de estimulatos pueden ser ios que lo hagan sentir lento
durante un examen. Si lo que al alumno le . clon que no perturban otros. (Eysenck,. ;
1981; Kagan, 1994). Nuestra propia invesmolesta es la presencia de otras personas o
el sonido de los lpices avanzando rpida ; tigacin (E. Aron, 1996; E. Aron & A. Aron,
1997) sobre individuos con estas cualidades
mente mientras el suyo se encuentra sus
pendido en el aire, entonces debe realizar la
especiales, a quienes llamamos Ps (perso-,
prctica de examen con otros alumnos de
as altamente sensibles), indica que las
mismas no son ni particularmente neurti
su curso. Incluso es recomendable propo
ner explcitamente una competencia para
cas ni excesivamente emocionales. En vercomprobar quin termina primero., :
. dad, poseen, muchas cualidades positivas:
Finalmente, si el profesor puede reali- . . en comparacin con otros, muestran mayo- .
res niveles de equidad, una mayor aprecia
; zar los arreglos necesarios, probablemente
el desempeo del alumno mejore s realiza
cin del .arte y lamsica- y qnayidf interior
exmenes no cronometrados. En este tipo
rica y compleja. Se trata de up conjunto: si
de exmenes^ los himnos que sufren an
una persona posee mayor sensibilidad* tam- .
gustia obtienen ios mismos resultados que
bin es ms fcilmente excitable.
los dems; imentr que en exmenes cro
Si el lector considera que es una Ps:,
nometrados, otehe peores resultados que . tal yz ayud a disminuir su ansiedad el
el resto (Onwuegbuzie, 1994).
hecho de comprender por (qu; es ms
El tercer mtodo para enfrentar la an ' excitable qq 10^
mismas sigustia producida por los exmenes es cog tuaciones. Almenos n es necesario preocu- ,
noscitivo. ste parte: del supuesto de que
pgrse .por estar preocupado ! Muchas p a s
se ;necesita reemplazar cualquier petisa- . no tienen problemas con los exmenes,
mientp negativo irracional, que surja al es
pro sualraerite existe, algn aspecto de
tudiar o dar un examen, por pensamientos
su. vida en el que la ansiedad, les. cause
positivos y ' racionales. Una vez ms, l
vprobiemas (deportes, baljlagr .en pblico,
centro de asesoramiehto debera estar; c a -.. ' etc.);puede ser que en l cas de lector el
pacitdo para ayudar al respecto. Si no es
aspecto, conflictivo: sean los exmenes. 7
as, el mtodo de Tobas tambin es' ade
Cabe recordar qu lo importante es lo que
cuado en este cas/
uno realmente Sabe, que probablemente
Poca confianza en uno mismo: si el
sea bastante.
alumno sospecha que su problema es una
As que buena suerte a todos. Les de-
falta general de confianza, o si existe algu
seamos lo mejor durante este curso y en to- .
na otra cosa en su vida que lo est preocu
dos los aspectos de sus vidas.. . ..

Cmo confeccionar un hisograma?


A continuacin presentamos los cuatro pasos para la construccin de un histograma;
1. Construir una tabla de frecuencias (o una tabla de frecuencias agrupadas).
2. Ubicar la escala de intervalos al pie de la pgina. Los nmeros deben ir de izquierda a dere
cha y de menor a mayor. En el caso de una tabla de frecuencias agrupadas, el histograma ser de
intervalos. Comnmente, en un histograma basado en una tabla de frecuencias agrupadas, slo se
marca el punto medio de cada intervalo en el centro de la base de cada barra. El punto medio es el
centro del intervalo, a mitad del camino entre el comienzo de un intervalo y el siguiente. (Para ob
tener el punto medio se debe restar el lmite inferior del intervalo en cuestin al lmite inferior del
intervalo siguiente; dividir el resultado por 2 y sumarlo al lmite inferior del intervalo, cuyo punto
medio estamos determinando).
3. Desplegar una escala de frecuencias a lo largo del margen izquierdo de la pgina. La esca
la debe partir de 0, en la parte inferior, hasta la mayor de todas las frecuencias de los intervalos.
4. Dibujar una barra para cada intervalo. La altura de cada barra es la frecuencia del intervalo
sobre la cual se ubica esa barra.
Resulta ms fcil construir un histograma utilizando papel para grficos.
Otros ejemplos de histogramas
La figura 1-4 muestra un histograma construido a partir de la tabla de frecuencias agrupadas co
rrespondiente al ejemplo de la cantidad de interacciones sociales vividas por estudiantes universi
tarios durante una semana. La figura 1-5 muestra el histograma basado en la tabla de frecuencias
agrupadas correspondiente al ejemplo referido al tiempo de lectura de una oracin ambigua.

Intecvalo
45 -49,9
.40-44,9
35-39,9'::

30 - 34,9'
'.2 5 -2 9 ,9 .
" 20 -2 4 ,9
' '..li-.19,9 :
1 0 a 4 ,9

. 5-9,9 '
0 - 4 ,9 .

Figura 1-4. Histograma que representa el nmero de interacciones sociales vividas durante una semana por 94 estu
diantes universitarios, basado en frecuencias agrupadas. (Fuente: McLaughlin- Volpe et al., 1998).

Figura 1-5. Histograma que representa


el tiempo promedio de lectura de ora
ciones ambiguas por parte de 100 alum
nos secundarios, basados en frecuencias
agrupadas {datos ficticios),

Tiempo
de'lectura Frecuencia
2,95-2,99
9
2,90 - 2,94
. 7

2,8S~2,89
20 '
2,80 ~2,84
ii
2,75-2,79
10
2,70 -2,74 ,
: : 10

2,65 - 2 , 6 9
2,60 - 2 ,6 4
2 .5 5 - 2 ,5 9

2;50'-2;54,

.'

4
8
10

/'7l
^
'

-"Vi

POLIGONOS DE FRECUENCIAS
Existe otro mtodo utilizado comunmente para mostrar grficamente la informacin contenida
en una tabla de frecuencias. Este tipo de grfico, denominado polgono de frecuencias, es bsi
camente la versin del histograma representado con un grfico de Eneas. En lugar de barras, la
frecuencia de cada intervalo se indica a travs de la altura de una lnea que se desliza por la pgi
na, creando una especie de contorno de montaas. La figura 1-6 muestra los polgonos de fre
cuencias creados a partir de las tablas de frecuencias comunes y agrupadas correspondientes al
ejemplo de medicin del estrs.
Cmo confeccionar un polgono de frecuencias?
A continuacin describimos los cinco pasos que se deben seguir para la creacin de un polgono
de frecuencias:
1. Realizar una tabla de frecuencias (o una tabla de frecuencias agrupadas).
2. Ubicar la escala de intervalos al pie de la pgina. Incluir un intervalo extra al principio y
otro al final de a serie de intervalos que tienen observaciones realmente obtenidas. Los interva
los adicionales son necesarios para asegurar que la lnea comience y termine en la base del grfi
co, es decir, en la frecuencia cero, AI incluir los intervalos adicionales se crea una figura cerrada
o polgono. Ai igual que con los histogramas, la escala se construye marcando slo el punto
medio de cada intervalo.

3. Realizar una escala de frecuencias a lo largo del margen izquierdo de la pgina. La escala
debe partir de 0, en la parte inferior, hasta la mayor de las frecuencias de todos ios intervalos.
4. Marcar un punto sobre el centro de cada intervalo, a la altura correspondiente a la frecuen
cia de ese intervalo.
5. Unix los puntos por medio de lneas.

F igura 1-6. Polgonos de frecuencias basados en (a) una tabla de frecuencias y (b) una tabla de frecuencias agrupadas,
construidas con los datos de Aron, Pars & Aron (1995).

Otro ejemplo de polgonos de frecuencias


La figura 1-7 muestra los cinco pasos necesarios para construir un polgono de frecuencias, utili
zando la tabla de frecuencias agrupadas correspondiente al ejemplo sobre interacciones sociales
de varios alumnos.

\ Pas :L'- : : Tabide frecuencias agrupadas


intervalo : Frecuencia
45 -49,9
'.'3': V'.
40 - 44,9 ' :V-v.:.v3-;' ;
35 - 39;9 : y :y y >3Y'y ,
30-34,9.' '
.25 - 29,9 .
:20-24,9 : \
10
15-19,9
16
10-14,9'=
'5 - 9,9
.16
0 - '4,9
12 .

'i A -:' i;A

.v.;:;V
S-:;=/:-;g

.'-'.'-'A

-A :, A

A' ,

Paso 2
A

.
A

A .

-2,5 .2,5 7,5 12,5;'17,5 22,5 27,5 32,5 37,5 42,5 47,5 52,5.
Cantidad de interacciones sociales

A'

A -'-'-.A

. _ " a ...; ; A; . A - ,.. .:'r : A ; ' ' : 'A

' . ;

'A V ;

A '; '

l?,5 v n ,5 422,5;.27>5::32^:;37;5,.42,5;4 Z 5 .; 5 Z 5 Y ; /^ ,S .;; 2 ; S J ^ { 2 , 5 7 j 5 ^

- i V;:f'.!Cantj*d* interacciones sociales

' V. ;- Cantidad de riteracciones sociales'

F igura 1-7. Cinco pasos para la construc


cin de un polgono de frecuencias uti
lizando la tabla de frecuencias agrupadas
correspondiente a la cantidad de interac
ciones sociales de 94 estudiantes univer
sitarios durante una semana (Fuente:
McLaughlin-VopeetaL, 1998). Paso 1: rea
lizar una tabla de frecuencias. Paso 2: ubi
car la escala de intervalos al pie de la
pgina. Paso 3: a lo largo del margen iz
quierdo de la pgina, realizar una escala de
frecuencias que parta de 0, en la parte infe
rior, hasta la mayor de las frecuencias de
los intervalos. Paso 4: marcar un punto so
bre e l centro de cada intervalo, a la altura de
la frecuencia de ese intervalo. Paso 5: unir
los puntos por medio de lneas.

F igura 1-8. Creacin de un pol


gono de frecuencias a partir de un
histograma, utilizando el bistograma correspondiente al tiempo pro
medio de lectura de oraciones am
biguas pof parte de 100 alumnos
secundados (datos ficticios).

:2,475 2,525 2,575 2,625 2,675 2.725 2,775 2.825 2,p?5 2,925 2,975 3,025' Tiem po de lectura <$eg.)

Creacin de un polgono de frecuencias a partir de un histograma


Si ya se ha hecho un histograma, todo lo que hace falta para convertirlo en un polgono de fre
cuencias es colocar un punto en el centro de la parte superior de cada barra y luego unirlos entre
s. La nica complicacin es agregar los puntos medios de cada intervalo vaco al principio y al fi
nal de la serie de intervalos, de modo que el polgono comience y termine en 0. La figura 1-8 ilus
tra este procedimiento utilizando el ejemplo basado en el estudio del tiempo de lectura de
oraciones ambiguas.

FORMAS DE LAS DISTRIBUCIONES DE FRECUENCIAS


Una tabla de frecuencias, un histograma o un polgono de frecuencias describen una distribucin
de frecuencias. Es decir, muestran el patrn conforme al cual las frecuencias se dispersan o dis
tribuyen.
A los psiclogos tambin les resulta til describir con palabras el patrn de distribucin de las
frecuencias. En general, las descripciones se refieren a aspectos de la forma del histograma o del
polgono de frecuencias. En esta seccin analizamos estos aspectos y su terminologa especfica.
Distribuciones de frecuencias unimodales y bimodales
Un aspecto importante relacionado con la forma de una distribucin de frecuencias es el hecho de
que la figura presente un solo punto mximo principal (una torre alta en el histograma o un pi
co alto principal en el polgono de frecuencias). En el ejemplo de las clasificaciones de estrs, el
registro ms frecuente es el 7, lo que da como resultado un grfico con slo un rea muy elevada.
Este tipo de distribucin se denomina unimodal. Una distribucin con dos puntos elevados prc
ticamente iguales es una distribucin bimodal. Cualquier distribucin con dos o ms punios eleva
dos se denomina multimodal,2 Finalmente, una distribucin en la que todos los valores presentan
prcticamente la misma frecuencia se denomina rectangular. La figura 1-9 muestra las distintas
distribuciones de frecuencias.
En general, la informacin que recolectamos en investigaciones psicolgicas es prcticamen
te unimodal. Las distribuciones bimodales y multimodales se dan slo ocasionalmente.
2 Estrictamente hablando, una distribucin es braodal o multimodal slo si los picos son exactamente iguales, Pero es
comtn en la prctica utilizar estos trminos ms informalmente para describir la forma general.

F igura 1-9. Ejemplos de polgonos de frecuencias (a) unimodai,


(b) prcticamente bimodal y (c) prcticamente rectangular.

Un ejemplo bimoda! sera la distribucin de la cantidad de empleados en cuyos gerentes de nivel


superior se han fijado en ellos por algn motivo. Si construyramos una distribucin de frecuen
cias con respecto a ia calidad del trabajo de dichos empleados, los puntos altos en un grfico de
este tipo coincidiran con los valores que indican una calidad de trabajo muy pobre o muy buena.
Un ejemplo de distribucin rectangular sera la cantidad de nios en cada grado de la escuela pri
maria. En este caso, habra prcticamente la misma cantidad en primer grado que en segundo, y
as sucesivamente. La figura 1-10 ilustra estos ejemplos.

Figura 1-10. Ejemplos ficticios de distribuciones que no son unimodaies. (a) Distribucin bimodal que indicajas posibles frecuencias en diferentes niveles de calidad del trabajo realizado por empleados que llama
ron la atencin de gerentes de mayor nivel, (b) Distribucin rectangular que muestra las posibles
frecuencias de la cantidad de alumnos en los diferentes grados de la escuela primaria.

Figura 1-11. E jem p lo s d e p o lg o n o s d e frecu en cias de d istrib u cion es (a) prcticam ente sim trica s, (b ) a si
m tricas h a cia la derecha (p o sitiv a m en te asim tricas) y (c ) asim tricas hacia la izquierda (n egativam en te
asim tricas).

Distribuciones simtricas y asimtricas


Otro aspecto para observar en el ejemplo de puntuaciones de estrs es que la distribucin era la
deada, con mayor cantidad de casos cerca del extremo correspondiente al valor ms alto. Esto es
algo poco frecuente; la mayora de los fenmenos que medimos en psicologa tienden a presentar
prcticamente la misma cantidad de casos a ambos lados del centro. Es decir, la mayora de las
distribuciones son prcticamente simtricas (si las doblramos por la mitad, las dos mitades se
ran iguales).
Las distribuciones que claramente no son simtricas se denominan asimtricas. La distribu
cin de las puntuaciones de estrs es un ejemplo de distribucin asimtrica, es decir, presenta un
lado largo y estirado, como una especie de cola. El lado con menor cantidad de casos (el lado
que parece una cola) es el lado al que nos referimos para nombrar la direccin de la asimetra.
na distribucin como la del ejemplo de medicin del estrs, que presenta muy pocos casos en el
extremo correspondiente a los valores bajos, es una distribucin asimtrica hacia la izquierda. El
ejemplo relacionado con el tiempo de lectura tambin es asimtrico hacia la izquierda. Por otro
lado, el ejemplo relacionado con las interacciones sociales es asimtrico hacia la derecha. La fi
gura 1-11 ilustra casos de distribuciones simtricas y asimtricas.
Una distribucin asimtrica hacia la derecha se denomina tambin positivamente asim
trica. Una distribucin asimtrica hacia la izquierda se denomina tambin negativamente
asimtrica.
En la prctica, las distribuciones muy asimtricas aparecen en las investigaciones psicol
gicas, principalmente cuando lo que se est midiendo presenta un lmite superior o inferior. Por
ejemplo, en los Estados Unidos, la distribucin de la cantidad de hijos por familia es asimtrica

Figura 1-12. D is tr ib u c i n a s im tr ic a h a c ia ia d e r e c h a ; c a n tid a d d e h ij o s


e n lo s
e e .u u

e e .u u

. p o r c a d a fa m ilia , e n 1 9 8 8 . ( F u e n t e : O f ic in a d e C e n s o s d e

. [U .S . B u r e a n o f th e C e n s u s ] , 1 9 9 0 ).

hacia la derecha (vase figura 1-12), porque no es posible tener menos de cero hijos. El efecto
piso es la acumulacin de observaciones en el extremo izquierdo del grfico, debido a que es
imposible que exista un registro menor. El ejemplo referido a la cantidad de interacciones so
ciales tambin presenta un efecto piso, porque nadie puede tener menos de 0 interacciones.
La figura 1-13 ilustra un caso de distribucin asimtrica causada por la existencia de un lmi
te superior. La distribucin, referida al resultado logrado por adultos en una prueba sobre las ta
blas de multiplicar, es drsticamente asimtrica hacia la izquierda. La mayora de los resultados
se acumularon a la derecha, en el extremo con los valores ms altos (resultado perfecto.) E ejem
plo descripto presenta un efecto techo. El ejemplo de medicin del estrs tambin presenta un le
ve efecto techo. Esto se debe a que muchos alumnos sufran de un alto nivel de estrs -la
puntuacin mxima era 10- pero, por lo general, a las personas no les gusta utilizar las mximas.
F ig u r a 1 -1 3 . D istrib u cin asim trica
h acia la izquierda: distribu cin ficticia
d e lo s resu ltad os o b ten id os por adultos
en un a prueba sobre la s tablas d e m u l
tiplicar.

Distribuciones normales y crticas


Finalmente, una distribucin puede describirse segn lo espeso o pesado de sus colas (cun
altas son las colas, cuntos casos estn incluidos en ellas). El patrn de comparacin es una cur
va con forma de campana, a la que se aproximan la mayora de las distribuciones de frecuencias
provenientes de investigaciones psicolgicas y de la naturaleza en general, que se denomina
curva normal, y a la que dedicaremos considerable atencin en captulos posteriores. Sin em
bargo, por ahora es suficiente destacar que la curva normal es unimodal y simtrica, lo cual tiene
el tipo de forma de campana que presenta a figura l-14a. Los tres ejemplos principales de este
captulo se aproximan a una curva normal en un sentido muy general, aunque, como hemos vis
to, todos ellos son algo asimtricos. Segn nuestra experiencia, la mayora de las distribuciones
que resultan de las investigaciones psicolgicas realmente se aproximan ms a la curva normal
que estos tres ejemplos.

F igura 1-1 4 . E je m p lo s d e distrib u cion es (a) norm al, (b ) de c o la s esp esa s y (c ) d e c o la s d elgad as. (A d ap ta
c i n , D e C a r lo 19 9 7 ).

El trmino curtosis se refiere al grado en el que la forma de una distribucin difiere de la curva nor
mal, principalmente con respecto ai hecho de que las colas sean ms espesas o delgadas que las de
la curva normal (DeCarlo, 1997). El trmino curtosis proviene de la palabra griega kyrtos, que sig
nifica curva. La lnea oscura de la figura l-14b indica una distribucin crtica con colas ms es
pesas que las de la curva normal. La figura l-14c presenta un ejemplo extremo de distribucin
curtica, una distribucin sin colas. (Una distribucin rectangular sera un caso an ms extremo).
Adems de la diferencia en el espesor de las colas con respecto a la curva normal, las distri
buciones con colas espesas por lo general son ms empinadas que la curva normal (vase figura
l-14b), y aqullas con colas ms delgadas o sin colas, por lo general son ms chatas que la-curva
normal (vase figura 3-14c).
Las distribuciones con colas espesas se ven como si a la curva normal se la pellizcara en la
mitad, y parte de ella se elevara formando un pico agudo y el resto se extendiera para formar espe
sas colas. Las distribuciones con colas delgadas (o sin colas), se ven como si se tirara hacia fuera
el centro de la distribucin y se absorbieran las colas y el pico. De todos modos, aun cuando
usualmente la elevacin o chatura de una distribucin est relacionada con a curtosis, lo ms im
portante es el espesor de las colas.

CONTROVERSIAS Y LIMITACIONES______________________
La controversia ms importante con respecto a ia utilizacin de tablas de frecuencias, histograma$ y polgonos de frecuencias no se genera entre los psiclogos, sino entre el pblico en general.
La utilizacin y el uso incorrecto de estos procedimientos descriptivos por parte de los medios pa
rece haber creado escepticismo con respecto a la confiabilidad de la estadstica en general y de las
tablas y cuadros estadsticos en particular Quin no ha escuchado decir que la estadstica mien
te ! En realidad, las personas pueden mentir a travs de la estadstica, y as lo hacen. Es tan senci
llo como mentir con palabras, pero las mentiras dichas con nmeros son seguramente ms
difciles de reconocer. En esta seccin destacamos dos maneras a travs de las cuales las tablas de
frecuencias y los grficos equivalentes pueden ser usados en forma errnea, y mostramos cmo
reconocer esos usos incorrectos. (Gran parte del material est basado en la excelente y entreteni
da exposicin de estos temas). (Tufte, 1983)

Figura 1-15. R ep resen tacin e n g a o sa d e una distri


b u cin d e frecu en cias a causa d e lo s d istin to s tam a
os de intervalos, (F u e n te : N e w Y o r k T im e s, 8 de
agosto, 1978, p. D - l . 1978 por la N e w Y o rk T im e s
C o m p a n y . R eim p reso con autorizacin).

No utilizar intervalos de) mismo tamao


Como ya observamos, un requisito indispensable de las tablas de frecuencias es que los tamaos
de los intervalos sean iguales. Si los intervalos no son iguales, la tabla o grfico resultante puede
ser muy engaosa. Tufte (1983) nos da un ejemplo, ilustrado en la figura 1-15, tomado del respe
table (y usualmente preciso) New York Times. Aparentemente, este grfico seala que las comisio
nes pagadas a agentes de viaje cayeron drsticamente en el ao 1978. Sin embargo, una lectura
ms detallada revea que la tercera barra de cada caso representa slo el primer semestre del ao
1978. Por lo tanto, se est comparando slo la mitad de un ao con cada uno de los aos anterio
res completos. Presumiendo que el segundo semestre del ao 1978 haya sido igual al primero, la
informacin en este grfico sugiere en realidad que en el ao 1978 se produjo un aumento y no
una disminucin. (Por ejemplo, las cifras estimadas por Delta Airlines para todo el ao 1978 se
rian de $72 millones, cifra mucho mayor a los $57 millones de 1977).

Exageracin de las proporciones


Comnmente, la altura de un histograma o de un polgono de frecuencias debera comenzar en 0,
como menor valor de la escala, y continuar hasta su valor mayor. Al mismo tiempo, el grfico de
bera tener un ancho igual a 1,5 veces su altura. El ejemplo sobre puntuaciones de estrs ilustra
este principio. Sin embargo, observemos qu sucede si hacemos el grfico mucho ms alto o cor
to (como lo ilustra la figura 1-16): la impresin lograda puede ser una mayor o menor diferencia
entre los intervalos. El efecto es semejante al de los espejos de los parques de diversiones, pues la
verdadera imagen est distorsionada.

Por supuesto que cualquier forma particular es precisa en algn sentido. Pero se ha adoptado
la escala 1,5:1 para brindar un patrn de comparacin. Cambiar esta proporcin sera engaoso
para la vista.

; ' )

0.5-

-2J

; : Estris

8,5 10,5

(c) '

0.5 . 2,5 ' '4 J ,''

6^ . 8 J l O J . -

'

Esifa

Figura M 6 . H istogram as q u e distorsionan la s c la sific a c io n e s d e estrs d e lo s alum nos al n o cum p lir c o n la


norm a d e u so qu e esta b le ce un a n ch o ig u a l a 1,5 v e c e s la altura. (F u e n te : A ron, Pars & A ron).

Sexo, etnia y desiMripeo matemtico.


susancialmente, y an ms en aquellos lu
De tanto en tanto, alguien intenta argumen
gares en los que se han mejorado la actitud
tar que al ser los hombres blancos quienes i
y las oportunidades. Esta sugiere que..las /
tienden u lograrlos mayores xitos en ma
diferencias no eran genticas sino que.esta- .
temtica, las ^mujeres y las;personas de co
lor son inherentemente menos .capaces n . ban determinadas culturahnente. (Baker &
ese campo (y en la estadstica). Planteamos Jones, 1993; Hyde, 199.3) En una revisin
este tema porque seguramente. el alumno , de las. investigaciones realizadas sobre el y
ha odo hablar de tales actitudes y no que " tema, Hyde (1993) descubri que en la seremos que eHaainfluyan sutilmente en n in -;
cundaria los vaiories aun ,se. desempean
mejor que las mujeres en la solucin de
gunp .de/ellosy. especialmente en los que n o ..
problemas complejos y en el at (Scholas- i
son hombres biarics.
i... Con respecto a los sexos, exista cierta ,. tic Amplitude Test, Examen de aptitud escobrecha entre ellos que sugera .que las mu- -i lar) por diversas razones (es como el hecho '
jeres eran menos capaces paira matemti- de qu los varones continen tomando cur- i
sos de matemtica). Sin embargo, stas di- i
ca, pero la ' rhism se h a ! estrechado

lerendas no se encontraban en oros indi


e n la m a te r ia y m e n o s r e c u r s o s p a r a la e n - d
cadores de capacidad matemtica. Algunos
s e a n z a d e la m a te m tic a y la c ie n c ia . L a
han descubierto que los varones tienen me
fa lt a d e e s t u d ia n te s d o c to r a d o s d e n tro d e
jor razonamiento espacial, pero este aspec
e s t a s c o m u n id a d e s p r o b a b le m e n te p e r p e
to an:no ha sido comprendido o medido
t e la d e s v e n ta ja . T o d o d e m u e s tr a q u e e l
adecuadamente, y es probable que no se
p r o b le m a r e a l n o s o n lo s g e n e s s in o la s a c deba a una diferencia gentica.
titu d e s q u e h a n fo m e n ta d o la s d e s ig u a ld a
Es verdad qu, en general, los que mejor
d e s e n la e d u c a c i n .
se han desempeado en el campo de la mate
Qu se .puede hacer al respecto? Un
mtica han sido hombres. Pero aun as, las
camin es combatir de la mejor manera po
diferencias, son leves, y las mujeres no son
sible la idea de que la matemtica es natulas ms propensas a tener los peores desem
ramente ms .complicada para uno que ;;
peos, como ocurrira si existieran diferen ; para otro.. Si lo es, probablemente sqdeba a .
cias genticas. Ms que nunca, las mujeres
q u e l a l u m n o h a t e n i d o . m e n o s c o n t a c t o '.
estn obteniendo doctorados en matemtica, ] c o n e l l a y c o n l s n m e r o s e n g e n e r a l , a l
aunque tambin es el campo con el mayor
.' h a b e r s i d o d e s a l e n t a d o a a s is t ir ; a c u r s o s . ;.
ndice de desercin femenina. Tai vez una de
avanzados de matemtica o debido a que '
las razones sea que, si bien las mujeres no
V n Ha recibido una buena enseanza en la
consideran la matemtica un campo para
m a te r ia . P o n e r s e a l d a p u e d e s e r . d if c il,
hombres, lqs hombres definitivamente s lo
p e r o e l h e c h o d te n e r , q u q e s f o r z a r s e m s
consideran de ese modo, (Hyde et al., 1990)
n o s ig n ific a n a d a c o n r e s p e c to a la p o te n -,
Coa esa actitud, es posible que los hombres
d a lid a d p ara, a p r e n d e r e s ta d s tic a .
dedpadps.a la matemtica no incentiven a
P a r a c a m b i a r l a s i d e a s . e q u i v o c a d s q u e ,-y
sus alumnas o colegas femeninas. No obs
p u d i r a m o s t e p e r s o b r e n u e s t r a s > p r o p i a s .
tante, cambiar ese tipo de actitud slo s
c a p a c i d a d e s ,, p u e d e s e r t i l r e c o n o c e r q u e cuestin de tiempo..
.
e x i s t e p n a c r e e n q i a e n r n e a y s i n v a lo r , a m V En lo que respecta al desempeo feme
. p li a n iie n t e d i f u n d i d a , . q u e'; s 0 s .ti r e ...q u e . l a
nino en estadstica, chequeamos las calific a p a c i d a d 'm a t e m t i c a e s in n a t a ,, a l g o q u e
: caciones en nuestras. propias clases de
s e t i e n e o n o ( p o r l o t a n t o , l a c o n c l u s i n ...
introduccin y realmente ro encontramos
ms f r e c u e n t e e q u e n o t i e n e s e n t i d o e s t u
ninguna diferencia confiable relacionada
diar una m a t e r i a s i n o e x i s t e l a m e n o r espV
con el sexo. Tampoco Buck (1985) encon
. r a n z a de l l e g a r .d o r n in a r la ) . N o existe d
tr dicha diferencia en un anlisis de trece ^ prueba alguna dla existencia d e Upa c a p a - d
semestres d cursos de estadstica para,
cidad innata y, sin e m b a r g o ^ s existe g r a n . .
alumnos universitarios no graduados, prin
cantidad de e v i d e n c i a :que indica que los : :
cipiantes y avanzados.
distintos rendimientos se deben al esfuerzo ;' ;
En cuanto a los grupos tnicos, s exis
realizado. ; :
ten. diferencias de desempeo, pero ningu
Tobas (1987). cita un estudio comparana que no pueda ser explicada a travs de
tivo entre estudiantes asiticos y nortame-
las diferentes' oportunidades de cada gru
ricanos en un examen internacional e
po, En1particular, la gente de color no es
matemtica. Los estudiantes nrteamericalentada con frecuencia a estudiar mate , nos fueron ' superados / por; completo, pero:
mtica de alto nivel. Y lo que es peor, las
an ms importante fue el motivo de ese re
escuelas a las que asisten por lo general
sultado: las entrevistas revelaron que los '
cuentan con menos cursos avanzados' de
estudiantes asiticos consideraban que la
matemtica, menos profesores calificados
capacidad matemtica estaba distribuida en

forma bastante pareja entre las personas, y


pensaban que las diferencias de desempeo
eran el resultado del mayor esfuerzo. Los.
alumnos norteamericanos insistan con que
la capacidad para la matemtica es un ta
lento raro e innato.
La matemtica casi nunca resulta fcil
para nadie. Y casi toda persona puede prender incluso el ms complejo de los concep
tos matemticos, si es perseverante y si;los
conceptos le son bien enseados. Si para al
gunas personas la matemtica es ms sen
cilla que. para ,otros; slo se debe a. que al
gunos tienen mayor prctica y experiencia
con los nmeros. Pensar que uno ha naci
do con menor capacidad para aprender mate
mtica y estadstica crea una preocupacin
adicional que es necesario descartar ahora
mismo. Como mencionamos antes, sencilla
mente no existe prueba alguna que indique
diferencias inherentes, y las diferencias de :
: desempeo que en efecto existen no necesa- :
riamente predicen algo acerca de uno. Cada
uno es un individuo, con su propia capaci
dad y determinacin. Si un alumno necesita
trabajar con ms esfuerzo para aprobar esta
materia, seguramente- se sentir ms satisfe-:
cho cuando1lo logre. Y vale la peh;recordar;
que uno no lo est haciendo slo por uno

mismo, sino que cada mujer y cada persona


de color que curse estdstica, o cualquier.:
otro curso de matemtica a escala universitana, es en realidad n modelo para aquells
que vendrn despus.
v
' Consideremos, las pal ^bras. pronuncia- .
das por .el .ex presidente de la Asociacin '
Americana de Matemtica: ..
L a p a r a d o j a d e u e s t r o s t ie m p o s es=
q u e' a l v e z q u e l a m a t e m t ic a es- c a
d a v e z m s p o d e r o s a , s o l* s p o d e r r o s o s p a r e c e n b e n e fic ia r s e ^ c o n ' l l .

. L a c a p a c id a d d e p e n s a r , m a t e m t ic a -

.j m e n te ^ e n u n s e n t id o a m p li ,:- es' a b s - :
lu t a m e n t e c r u c i a l p a r a el- 4esarroi.ro!'

. : /'.

. e n p r c t ic a m e n t e t o d a s l a s c a r r e r a s .i

'

L a c o n f ia n z a h e l r n a h e j o .d e n f o r -

'f ; ; .

m a c i n , e l e s c e p t i c i s m ; h e ; n a lisis:-

: d e a rg u m e n to s-, la p e r s e y r a h c i a : :
p e n etra r.' p r o b le m a s :-c o m p le j o s
.- cajjacidatd-.de; M m n f c a ^ n v s o b w ' ; ^ ^ .
;,
.

m a s t c n ic o s e n fo f m r jfo ^

':

s o n la s a r te s f a c u lt a t iv a s q u e . o f r e c e ii.

la s nuevas d e n < ^ m t i M ^ f ( S i i y

. 1987,;pfxviii>v :

CC;' d :' Y.'vf-

N o d e b e m o s d e ja r d a p r e n d e r e s t a s ; a r te s
fa c u lta tiv a s s lo p o r q u e a lg u ie n - o s h iz o

c r e e r q e n o p o d r a m s o o q u m a f n s . .' ^
a p r e n d e r l a s . f

f.f.;

TABLAS DE FRECUENCIAS, HISTOGRAMASY POLIGONOS DE FRECUENCIAS


SEGN SE DESCRIBEN EN PUBLICACIONES CIENTFICAS
Los psicolgicos investigadores utilizan las tablas de frecuencias., histograrns y polgonos de fre
cuencias principalmente como pasos previos para anlisis estadsticos ms elaborados. El estudio
realizado por Sanbonmatsu, Posavac y Stasney (1997) aporta un ejemplo de una tabla de frecuen
cias publicada en un artculo de investigacin cientfica. La investigacin analizaba la tendencia
de las personas a sobrestimar la probabilidad de que un hecho posible suceda cuando su atencin
est puesta en ese hecho. Se inform a los participantes que se estaban examinando cuatro candi
datos para un puesto dentro del cuerpo docente de la Universidad de Indiana. Su tarea era estimar
la probabilidad de que un candidato en particular fuera contratado. En primer lugar, los partici
pantes hicieron girar una flecha en una ruleta para seleccionar al candidato que evaluaran. Luego
se les entreg informacin sobre el desempeo de los cuatro candidatos. La informacin que se
brind sobre los candidatos era positiva y, sobre todo, se la prepar procurando que fuer pareja
para los cuatro candidatos. Por lo tanto, ninguno de ellos debera haber sido calificado con mayo
res probabilidades de obtener el empleo con respecto a los otros. Sin embargo, cualquiera fuera el

candidato evaluado, los participantes mostraron una frme tendencia a calificar a su propio candi
dato con mayores probabilidades que los dems. Una de las formas empleadas por Sanbonmatsu
(et al., 1997) para mostrar los resultados, consiste en indicar la cantidad de participantes que se
leccionaron cada uno, de ios nueve enunciados que se Ies propusieron relativos a la probabilidad
de que los candidatos fueran contratados. La tabla 1-6 reproduce la tabla de frecuencias de los
participantes. Como puede observarse, muchos ms participantes calificaron como mejor que
casuar' la probabilidad de que los candidatos que ellos mismos haban evaluado fueran contrata
dos (mayor que 5 en la serie de enunciados).
De todos modos, por lo general, cuando se publican tablas de frecuencias en los artculos, los
valores de la variable son categoras y no nmeros. Adems, es muy comn que en las tablas se
utilicen porcentajes de casos ms que de cantidades. Por ejemplo, Norcross, Hanych y Terranova
(1996) analizaron el Postgrado de Psicologa ( a p a -American Psychologycal Association, Aso
ciacin Americana de Psicologa-, 1994) e identificaron los cursos exigidos para ser aceptado en
la escuela para graduados. La tabla 1-7 fue extrada de esa publicacin. La tabla muestra el por
centaje de programas para graduados, la cual exige o prefiere que los aspirantes hayan tomado
distintos cursos de psicologa. A propsito, podemos observar que un mayor porcentaje (85,25)
exige o prefiere que los aspirantes hayan cursado estadstica!
En las publicaciones cientficas casi nunca se publican histogramas o polgonos de frecuen
cias (excepto en artculos sobre estadstica). En las raras ocasiones en que aparecen, por lo gene
ral se presentan en formatos bastante poco comunes. Por ejemplo, Wechsler y sus colegas (1994)
realizaron un estudio entre 17.592 estudiantes de 140 facultades de Estados Unidos con respecto
a hbitos en la bebida. Una de las preguntas ms importantes se refera al porcentaje de estudian
tes de las distintas facultades considerados bebedores por diversin. Los investigadores definan

Tabla 1-6.
F r e c u e n c ia s c o n q u e s e c o n fir m a r o n lo s e n u n c ia d o s s o b r e la p r o b a b ilid a d d e q u e e i c a n d id a to
a s ig n a d o fu e r a c o n tr a ta d o : e x p e r im e n to 1.

F r e c u e n c ia
(n = 31)
1. Es a b so lu ta m en te seg u ro que (el objetivo) n o sea contratado
0
2. Las probabilidades de (el objetivo) ser seleccion ad o para el puesto en e cuerpo docente
d e la universidad eran m u ch o m en o res que las de cualquiera de lo s otros tres candidatos
1 1
3 . Las probabilidades de (el objetivo) ser seleccion ad o para el puesto en el cuerpo docente
de la universidad eran m en o res que las de cualquiera de ios otros tres candidatos
3
4. Las probabilidades de (el objetivo) ser seleccio n a d o para el puesto en el cuerpo docente
de la universidad eran a p en a s m e n o r e s que las de cualquiera de los otros tres candidatos
, 3
5. Las probabilidades de (el objetivo) ser seleccion ad o para el puesto en el cuerpo docente de la
universidad eran a p r o x im a d a m e n te las m ism a s que las de cualquiera de lo s otros tres candidatos
6
6. Las probabilidades de (el objetivo) ser seleccion ad o para el puesto en el cuerpo docente
de la universidad eran a p en a s m e jo r e s que las de cualquiera de los otros tres candidatos
8
7. Las probabilidades de (el objetivo) ser seleccion ad o para el puesto en el cuerpo docente
de la universidad eran m e jo res que las de cualquiera de los otros tres candidatos
6
8. Las probabilidades de (el objetivo) ser seleccion ad o para el puesto en el cuerpo docente
de la universidad eran m u ch o m ejo res que las de cualquiera de lo s otros tres candidatos
2
9. Es a b so lu ta m e n te seg u ro que (ei objetivo) ser contratado
2
Fuente: Sanbonmatsu, D. M., Posavac, S.S., & Stasney, R. (1997), tab. 2. "Opiniones subjetivas implcitas en la sobrestimacin de probabilidades. R e v is ta C ientfica le P s ic o lo g a S o c ia l E x p erim en ta l [J o u rn a l q f E x p erim en ta l S o cia l
P s y c k o b g y ] 3 3 ,2 7 6 -2 9 6 . Copyright, 1997, por Academic Press, Reimpreso con autorizacin.

como bebedores por diversin a aqullos que informaban haber bebido al menos una vez durante
las dos semanas previas a la encuesta (cuatro copas de bebida alcohlica seguidas en el caso de las
mujeres y cinco en el caso de los hombres). La figura 1-17 reproduce la tabla que elaboraron. ni
camente una facultad present slo un 1-5% de bebedores por diversin. Sin embargo, bastantes
facultades presentaron un 30-50% de estos bebedores. Seis facultades presentaron un 66 -70% de
alumnos considerados bebedores por diversin!

Tabla 1-7.
C u r so s r e q u e r id o s c o m o c o n d ic i n p r e v ia p o r p r o g r a m a s p a r a g r a d u a d o s q u e e x ig e n c u r s o s
e s p e c fic o s d e p s ic o lo g a (n = 1 .5 5 4 ).

C u rso

E xig id o

A norm al / psicopatologia
N i ez / desarrollo
C ognoscitivo
H istoria y sistem as
Cursos de laboratorio
A prendizaje
F isio l g ic o / biop sico lo g a
Personalidad
M todos de investigacin i diseo experim ental
Sensacin y percepcin
Estadstica
Prueba / m edicin
Social

15,6%
11,2%
3,6%
4,9%
7,8%
8,7%
5,5%
12,0%
40,0%
3,1%
56,5%
9,5%
4,7%

P referid o
16,9%
24,2%
9,0%
12,3%
3,8%
19,6%
18,9%
15,7%
26,0%
7,8%
28,7%
8,0%
18,7%

E x ig id o o p r e fe rid o
32,5%
35,9%
12,6%
17,2%
11,6%
28,3%
24,4%
27,7%
66,0%
10,9%
85,2%
17,5%
23,4%

Fuente: Norcross, J. C., Hanych, J. M & Terranova, R. D. (1996), tab. 4 , Postgrado de Psicologa, 1992-1993. A m e ri
c a n P sy ch o lo g ist, 5 1, 631-643, Copyright, 1996, por la Asociacin Americana de Psicologa [American Psychological
Association]. Reimpreso con autorizacin.

Figura 1-17. D istrib u cin d e facu ltad es seg n porcen taje d e b eb ed ores por d iversin . (F u e n te : W ech sler,
H ., D avenport, A ., D o w d a ll, G ., M o ey k en s, B ., & C a stillo, S . (7 d e d iciem b re d e 1 9 9 4 ), tab. 1. C o n se
c u e n c ia s para la sa lu d y e l co m p o rta m ien to p rovocad as por e l h b ito d e beber p or d iversin durante la p o
c a universitaria: un e stu d io n a cio n a l d e alu m n o s d e 140 cam p u s u n iversitarios , J A M A , 2 7 2 ,1 6 7 4 ) .

Los histogramas y los polgonos de frecuencias slo en raras ocasiones se publican en artcu
los de investigacin. Es ms probable que se vean breves comentarios sobre la forma de la distri
bucin de los registros recolectados durante el estudio, especialmente si la distribucin se desva
de lo normal Speed y Gangestad (1997) aportan una tpica descripcin, como la mencionada en
sus comentarios, sobre un grupo de variables que analizaron; Estas variables no estaban distri
buidas en forma normal (eran positivamente asimtricas), (p. 930)

Resumen
Los psiclogos utilizan procedimientos de estadstica descriptiva para describir, es decir, pa
ra resumir y hacer fcilmente comprensibles un grupo de nmeros obtenidos a partir de una
investigacin.
Un valor es un nmero o categora; una variable es una caracterstica que puede tener diferen
tes valores; una observacin es el valor particular correspondiente a una persona en una variable.
Con una variable numrica, los valores nos transmiten el grado o cantidad de lo que se mide. Hay
dos clases principales de variables numricas: en el caso de las variables intervalares, los valores
representan cantidades iguales de lo que se mide; en el caso de las variables ordinales, los valores
slo representan posiciones relativas. En el caso de las variables nominales, los valores son cate
goras o nombres.
Una tabla de frecuencias organiza los nmeros en una tabla en la que cada uno de los valores
posibles aparecen en una lista a lo largo del margen izquierdo, ordenado de mayor a menor, junto
con la cantidad de observaciones que corresponden a cada valor.
Cuando hay una gran cantidad de valores diferentes es ms til construir una tabla de fre
cuencias agrupadas, que es igual a una tabla de frecuencias comn, slo que las frecuencias se
atribuyen a intervalos que incluyen una serie de valores. El tamao de los intervalos debe elegirse
de tal modo que (a) la cantidad total de intervalos sea de entre 5 y 15; (b) sea un nmero comn,
simple, y (c) el lmite inferior de cada intervalo sea mltiplo del tamao del intervalo.
El patrn de las frecuencias puede representarse con un histograma, es decir, una especie de
grfico en el que la altura de cada barra es la frecuencia para un valor o intervalo determinado, y
en el que no existen espacios entre las barras. Los polgonos de frecuencias son otra alternativa de
los histogramas; en ellos, una lnea conecta puntos, es decir, la altura de cada uno de los cuales re
presenta la frecuencia de un valor o intervalo determinado.
La forma general del histograma o polgono de frecuencias puede ser unimodal (con un solo
pico), bimodal, multimodal (que incluye al bimodal), o rectangular (sin picos); puede ser sim
trica o asimtrica (con una larga cola) hacia la derecha o hacia la izquierda; y con respecto a la
curva normal con forma de campana, puede presentar curtosis (con colas que son muy anchas o
muy angostas).
A veces se puede distorsionar la representacin grfica de informacin para el pblico en ge
neral, de tal manera que a simple vista resulte engaosa, como por ejemplo, utilizando intervalos
que no son iguales o exagerando las proporciones.
Las tablas de frecuencias, los histogramas y los polgonos de frecuencias rara vez aparecen
en publicaciones cientficas. Cuando aparecen, por lo general lo hacen en formatos no tradiciona
les o presentando frecuencias (o porcentajes) para varias categoras, ms que para los diferentes
valores numricos de una variable.

Trminos clave
- Bimoda.
- Efecto techo.
- Estadstica descriptiva.
- ntervalar.
- Efecto piso.
- Distribucin de frecuencias.
- Polgono de frecuencias.
- Tabla de frecuencias.
- Tabla de frecuencias agrupadas.

Histogramas.
Estadstica inferencial.
intervalo.
Curtosis.
Niveles de medicin.
Multimodal.
Variable nominal.
Curva normal.
Variable numrica.

- Variable ordinal.
- Rectangular.
- Valor observado
u observacin.
- Asimtrico.
- Simtrico.
- Unimodal.
- Valor.
-Variable.

Ejercicios
Los ejercicios implican la realizacin de clculos o tabulaciones. La mayora de los problemas
estadsticos reales se resuelven por computadora, pero aun as, es conveniente realizar estos ejer
cicios manualmente para incorporar el mtodo de trabajo.
Para adquirir prctica en la utilizacin de una computadora, para resolver problemas estads
ticos, se puede utilizar la seccin de computacin de cada captulo, publicada en la Gua de estu
dio y libro de tareas de computacin para el alumno / Students Study Guide and Computer
WorkbookJ que acompaa este libro.
Todos los datos de esta seccin son ficticios (a menos que se especifique lo contrario). Las
respuestas a los ejercicios de la serie I se encuentran al final del libro.

SERIE I
1. Indique el nivel de medicin de cada
una de las siguientes variables: a) grupo tnico
al que pertenece una persona, b) cantidad de
veces que un animal equivoca el camino en un
laberinto y c) posicin en la que uno finaliza
una carrera.
2. A continuacin, aparecen las observa
ciones de una medicin de sensibilidad olfati
va realizada a un grupo de chefs asistentes a un
congreso nacional:
96, 83, 59, 64, 73, 74, 80, 68, 87, 67, 64,
92, 76, 71, 68, 50, 85, 75, 81,70, 76, 91,
69,83,75
Confeccione a) una tabla de frecuencias,
b) una tabla de frecuencias agrupadas y c) u
histograma de las frecuencias agrupadas; y d)
describa la forma general de la distribucin.
3. Las observaciones que aparecen a conti
nuacin representan la cantidad de minutos

que tard cada uno de los integrantes de un


grupo de nios de 10 aos de edad en comple
tar una serie de rompecabezas abstractos:
24, 83, 36, 22, 81, 39, 60, 62, 38, 66, 38,
36, 45, 20, 20, 67, 41, 87, 41, 82, 35, 82,
28,80,80,68,40,27,43,80,31,89,83,24
Confeccione a) una tabla de frecuencias
agrupadas y b) un histograma que represente la
tabla.
4.
Supongamos que se consult a 50 alum
nos acerca de la cantidad de horas que estudia
ron durante este fin de semana, y que los
mismos dieron las siguientes respuestas:
1 1 ,2 ,0 ,1 3 ,5 ,7 ,1 ,8 ,1 2 ,1 1 ,7 ,8 ,9 ,1 0 ,7 ,
4 , 6 ,1 0 ,4 ,7 , 8, 6,7 ,1 0 ,7 , 3 ,1 1 ,1 8 ,2 ,9 ,
7 ,3 ,8 ,7 ,3 ,1 3 ,9 ,8 ,7 ,7 ,1 0 ,4 ,1 5 ,3 ,5 ,6 ,
9 ,7 ,1 0 ,6
Confeccione a) una tabla de frecuencias,
b) una tabla de frecuencias agrupadas y c) un
polgono de frecuencias que represente la tabla

Confeccione a) una tabla de frecuencias,


de frecuencias agrupadas, y d) describa la for
b) una tabla de frecuencias agrupadas, c) un
ma general de la distribucin.
histograma de las frecuencias agrupadas y d)
5.
Describa las formas de las tres distribu
un polgono de frecuencias de las frecuencias
ciones ilustradas.
agrupadas, y e) describa ia forma general de la
distribucin.
3. Las siguientes son las cantidades de re
galos adquiridos por 25 familias entrevistadas
al azar en un centro de compras local a fines de
la temporada de vacaciones:
22, 18, 22, 26, 19, 14, 23, 27, 2, 18, 28, 28,
11,16,34,28,13,21,32,17,6,29,23,22,19
(<o

6 . Dibuje un ejemplo de cada una de las si


guientes distribuciones: a) simtrica, b) rectan
gular y c) asimtrica hacia la derecha.
7. Explique a alguien que nunca ha asisti
do a un curso sobre estadstica el significado
de los siguientes trminos: a) distribucin si
mtrica, unimodal y b) distribucin unimoda!
negativamente asimtrica. (Asegrese de ex
plicar tambin en su primera respuesta el signi
ficado de distribucin).
SERIE ti

1. Explique y ejemplifique cada uno de los


siguientes tipos de variable: a) intervalar, b) or
dinal y c) nominal.
2. A continuacin, aparecen las velocida
des de automviles cronometrados por radar
durante una tarde en una ruta de una zona con
lmite de velocidad de 35 millas por hora:
30, 36, 42, 36, 30, 52, 36, 34, 36, 33, 30,
32, 35, 32, 37, 34, 36, 31, 35, 20, 24, 46,
23, 31, 32, 45, 34, 37, 28, 40, 34, 38, 40,
52,31,33,15,27,36,40

Confeccione a) una tabla de frecuencias


agrupadas y b) un polgono de frecuencias con
las frecuencias agrupadas, y c) describa la for
ma general de la distribucin.
4. Elija un libro y una pgina del mismo
(escoja una pgina con al menos 30 renglones).
Confeccione una lista de la cantidad de pala
bras en cada rengln; luego utilice esa lista co
mo informacin. Confeccione a) una tabla de
frecuencias, b) una tabla de frecuencias agru
padas, c) un histograma de las frecuencias
agrupadas y d) un polgono de frecuencias con
las frecuencias agrupadas, y e) describa la for
ma general de la distribucin.
5. Explique a una persona que nunca ha
asistido a un curso sobre estadstica el signifi
cado de a) tabla de frecuencias agrupadas y b)
histograma.
6. Cree un ejemplo que presente las si
guientes formas de distribucin: a) bimodal, b)
prcticamente rectangular y c) positivamente
asimtrica. No utilice ejemplos dados en este
libro o en clase.
7. Busque en peridicos o revistas un gr
fico cuyo aspecto resulte engaoso a causa de
la utilizacin de intervalos desiguales o de la
exageracin de las proporciones.

Media, varianza;
desvo estndar

D escrip cin del cap tu lo

_ v

Meda.
Medidas alternativas de la tendencia.
central.
Varianza y desvo estndar.
Puntuaciones Z. _
Controversias y limitaciones: la tirana
de la media.:V .V>
)VV(
la media y el desvo estndar segn se
describen en publicaciones cientficas.

Resumen,
Trminos clave.
^ Ejercicios.
Apndice del captulo: frmulas
optativas para el clculo de la
varianza y el desvo estndar.
V\ V.
.
V: -.:j. V:

omo sealamos en el captulo 1, el propsito de la estadstica descriptiva es hacer f


cilmente comprensibles un grupo de observaciones. Hemos visto algunas formas de
lograr esa comprensin a travs de tablas y grficos. Es este captulo, considerare
mos las principales tcnicas estadsticas para describir un grupo de observaciones
utilizando ciertos nmeros. Estos nmeros son: la media, la varianza, el desvo es
tndar y las puntuaciones Z. La media es el promedio. La varianza y el desvo estndar describen
el grado de variacin de las observaciones. Una puntuacin Z describe la desviacin de una ob
servacin en particular respecto del promedio.

C
MEDIA

Comnmente, el mejor nmero para describir un grupo de observaciones es el promedio normal,


es decir, la suma de todas las observaciones dividida por la cantidad de observaciones. En estads
tica, ese promedio se denomina media. A veces se dice que el promedio o media de un grupo de
registros muestra la tendencia central o el valor tpico o representativo de un grupo de observa
ciones. Ms adelante Veremos que existen otras formas, adems de la media, para describir la ten
dencia central de un grupo de observaciones.
Supongamos que una psicoterapeuta observ cuntas sesiones haban tardado sus ltimos 10
pacientes en completar una terapia breve. Las cantidades de sesiones eran las siguientes:
7,8,8,7,

3,1,6,9,3,8

La media de las 10 observaciones anteriores es 6 (la suma de 60 sesiones dividida por 10 pa


cientes), Es decir, en promedio, los ltimos 10 pacientes de la terapeuta haban asistido a 6 sesio
nes. As, la informacin referida a los 10 pacientes se resume slo en este nmero.
A muchos estudiantes les resulta til visualizar la media como una especie de punto de equilibrio de la
distribucin de observaciones. Intentemos visualizar una tabla en equilibrio sobre un tronco, como un

Figura 2-1. Media de ia distribucin de cantidad de se


siones de terapia realizadas segn un ejemplo ficticio,
ilustrada a travs de una analoga con cubos apoyados
encima de una tabla en equilibrio sobre un tronco.

sube y baja rudimentario. Imaginemos pilas de cubos distribuidos a lo largo de la tabla segn los valo
res que representan, es decir, un cubo para cada observacin de la distribucin. (La figura resultante es
similar a un histograma construido con cubos). La meda sera el punto de la tabla donde el peso de los
cubos se equilibra perfectamente. La figura 2-1 representa lo antedicho utilizando e! ejemplo de la
cantidad de sesiones a las que asistieron los 10 pacientes de nuestra terapeuta imaginaria.
La figura 2-2 muestra algunos otros ejemplos. Cabe destacar, que ni siquiera es necesario que
haya un cubo exactamente en el punto de equilibrio. Es decir, la media no necesariamente debe
corresponder a una observacin real en la distribucin. La media es simplemente el promedio de
las observaciones, el punto de equilibrio. La media incluso podra ser un nmero cuya aparicin
en la distribucin fuera imposible, como en el caso de una media representada por un nmero de
cimal cuando todos los nmeros en la distribucin deben ser nmeros enteros (2,3 nios, por
ejemplo), Otra caracterstica es que los cubos pueden estar muy separados o muy juntos y que no
necesiten estar distribuidos en forma pareja. En cualquiera de esos casos, aun es posible encontrar
un punto de equilibrio. (Cabe mencionar que esta analoga, que utiliza cubos en equilibrio encima
de una tabla apoyada sobre un tronco, funcionara en la realidad slo si la tabla no tuviera peso).
Frmula para o b te n c i n

de

la media y smbolos estadsticos

La regla para el clculo de la media consiste en sumar todas las observaciones y dividirlas por la
cantidad de las mismas. Se expresa a travs de la siguiente frmula:
M=

JX

(2- 1)

Figura 2-2. Medias de varias distribuciones ficticias ilustradas utilizando la analoga de los cubos apoyados
encima de una tabla en equilibrio sobre un tronco.

M es un smbolo que representa la media. (Ms adelante aprenderemos otro smbolo para repre
sentar la media, la letra griega i, mu, que se utiliza en circunstancias particulares. Tambin es
bastante utilizado un tercer smbolo, X, a veces denominado X-raya).
X, la letra griega mayscula sigma, es el smbolo que representa la suma de; significa
suma de todas las cantidades siguientes. Es el smbolo aritmtico especial ms comnmente
utilizado en estadstica.
La X se refiere a las observaciones en la distribucin de la variable X. Podramos haber elegi
do cualquier otra letra. Sin embargo, cuando existe slo una distribucin, generalmente se la de
nomina X. En captulos posteriores veremos situaciones en las que se analizan dos distribuciones
al mismo tiempo. En ese caso, se utiliza una segunda letra, generalmente la Y. Otra alternativa es
utilizar subndices, como por ejemplo X l y X2. En el caso de un tratamiento matemtico ms for
mal de la estadstica, ios smbolos utilizados en varias frmulas son an ms complejos. Es preci
samente esa complejidad la que permite que las frmulas representen casos complicados sin
confusin. Sin embargo, los libros de estadstica para psiclogos, aun los textos ms avanzados,
utilizan smbolos simples. La forma ms simple rara vez crea ambigedad en las frmulas esta
dsticas que utilizan los psiclogos.
XX significa la suma de X. ndica que se deben sumar todos los valores observados de la dis
tribucin de la variable X. Supongamos que X se refiere a la cantidad de sesiones de terapia en la dis
tribucin de nuestro ejemplo. XX sera igual a 60, la suma de 7 + 8 + 8 + 7 + 3 4 -1 + 0 + 9 + 3 + 8.
N es un nmero. Se utiliza en estadstica para indicar la cantidad de observaciones de una dis
tribucin. En nuestro ejemplo existen 10 observaciones, por lo tanto, N es igual a 10.
Resumiendo, la frmula indica dividir la suma de todas las observaciones de la distribucin
de la variable X por la cantidad total de observaciones M En nuestro ejemplo, significa que debe
mos dividir 60 por 10. La frmula sera la siguiente;
M=

XX
N

60

10

=6

Otro ejemplo de clculo de ia media


Analicemos los ejemplos del captulo 1. Las puntuaciones de estrs (Aron et al., 1995) fueron las
siguientes:

4 ,7 ,7 ,7 , 8, 8,7 , 8,9 ,4 ,7 ,3 , 6,9,10,5,7,10, 6, 8,7 , 8,7 , 8,7,4,5,10,10,0,9, 8,3 ,7 ,9 ,7 ,9 ,5 , 8^5,


0 ,4 , 6, 6,7 ,5 ,3 , 2, 8,5,10,9,10, 6,4 , 8, 8, 8,4 , 8,7 ,3 , 8, 8, 8, 8,7 ,9 ,7 ,5 , 6,3 ,4 , 8,7 ,5 ,7 ,3 ,3 , 6,5,
7 .5 .7 . 8. 8.7 .1 0 .5 .4 .3 .7 . 6.3 .9 .7 . 8.5 .7 .9 .9 .3 .1 . 8. 6. 6.4 . 8.5 .1 0 .4 . 8.10.5.5.4.9.4.7.7.7,
6. 6.4.4.4.9.7.10.4.7,
5,10,7,9,2,7,
Calculando la media se puede resumir toda esta informacin en un slo nmero. La media
se calcula sumando todas las puntuaciones de estrs y dividiendo el resultado por la cantidad de
puntuaciones de estrs. Es decir, se suman las puntuaciones de estrs, 4 + 7 + 7 + 7 + 8 + 8,y a s
sucesivamente, obteniendo un total de 975. Luego se divide el total por 151, es decir, la canti
dad de observaciones.
M=

XX
M

975
= 6,46
151

La frmula nos indica que la puntuacin promedio de estrs en la escala de 10 puntos fue de 6,46
(redondeando). Esta cifra se encuentra claramente por encima del punto medio de la escala. El

ejemplo tambin puede representarse grficamente. Consideremos otra vez el histograma como
una pila de cubos encima de una tabla, y la media 6,46 como el punto en el que la tabla se equili
bra sobre el fulcro que tiene debajo, (vase figura 2-3). Este nico nmero simplifica enorme
mente la informacin dlas 151 puntuaciones de estrs.
De modo similar, analicemos el ejemplo de las interacciones sociales de los alumnos
(McLaughlin-Volpe et al., 1998). Las cantidades de interacciones de ios 94 alumnos durante una
semana fueron las siguientes:
48,15,33,3,21,19,17,16,44,25,30,3, 5,9,35,32,26,13,14,14,47,47,29,18,11, 5,19,24,17,
6,25,8,18,29,1,18,22,3,22,29,2,6,10,29,10,21,38, 41,16,17, 8,40,8,10,18, 7,4,4, 8, 11,
3,23,10,19,21,13,12,10,4,17,11,21, 9 , 8,7, 5, 3,22, 14,25,4,11,10, 18,1, 28,27, 19, 24, 35,
9,30,8,26
La tabla de frecuencias, la tabla de frecuencias agrupadas, el histograma y el polgono de frecuen
cias que construimos en el captulo 1 simplificaron considerablemente la visualizacin de los da
tos. Pero incluso, despus de todo ese proceso tambin sera til obtener un resumen de un slo
nmero. Por lo tanto, podemos calcular la media en la forma usual. En este caso:
1.635
= 17,40
94
Es decir, si sumamos las cantidades de interacciones de los 94 alumnos, la suma de X ' da 1.635.
Al dividir este nmero por la cantidad de observaciones, obtenemos una media de interacciones
de 17,40. La figura 2-4 grfica este caso.

Figura 2-3, Analoga de cubos apoya


dos encima de una tabla en equilibrio
sobre un punto de apoyo (utilizando
un histograma) que representa la me
dia de las puntuaciones del nivel de
estrs dadas por 151 estudiantes de
estadstica. (Fuente: Aron, Pars, &
Aron, 1995).

.Nivel e Estrs

;/

5,40 \

Otro de los principales ejemplos analizados en el captulo 1 se refera al tiempo utilizado para leer
oraciones ambiguas. La media se calcula en la forma usual:
M =
N
100

755

La figura 2-5 representa este caso grficamente.

Figura 2-4. Analoga de cubos apoya


dos encima de una tabla en equilibrio
sobre un punto de apoyo (utilizando un
histograma) que representa la media
de la cantidad de interacciones socia
les vividas por 94 alumnos universi
tarios durante una semana (Fuente:
McLaughlin-Volpe et al., 1998).

Figura 2-5. Analoga de cubos apo


yados encima de una tabla en equi
librio sobre un punto de apoyo
(utilizando un histograma) que re
presenta la media de una distribu
cin ficticia del tiempo utilizado
por 100 sujetos para leer oraciones
ambiguas (en segundos).

MEDIDAS ALTERNATIVAS DE TEN DENCIA CENTRAL


La media es slo uno de ios varios medios descriptivos de la tendencia central, el valor tpico o re
presentativo. Otra alternativa es la moda. La moda es el valor observado ms comn en una dis
tribucin. En nuestro ejemplo sobre las sesiones de terapia, la moda es 8, porque existen tres
pacientes que asistieron a 8 sesiones y no existe ninguna otra cantidad de sesiones que haya sido
completada por igual o mayor cantidad de pacientes. La moda tambin puede considerarse el va
lor con mayor frecuencia en una tabla de frecuencias, o bien el punto alto o pico de la distribucin
en un polgono de frecuencias o en un histograma (tal como lo ilustra la figura 2-6).
En una distribucin perfectamente simtrica y unimodal, la moda coincide con la media,
Qu ocurre cuando la media y la moda no coinciden? En ese caso, la moda coincide en menor
grado que la media, por lo cual, en lneas generales, consideraramos un valor bien representativo
de la distribucin, Adems, es posible cambiar algunas de las observaciones de una distribucin
(vase la figura 2-7) sin afectar la moda, mientras que prcticamente cualquier cambio que se rea
lice afecta la media. Por lo tanto, la media es ms representativa de todas las observaciones de una
distribucin. Por estas y otras razones, los psiclogos rara vez utilizan la moda.
Otra alternativa de la media es la mediana. Si ordenamos todas las observaciones de menor a
mayor, el valor del medio es la mediana. La figura 2-8 muestra los registros correspondientes a la
cantidad de sesiones de terapia, ordenados de menor a mayor. En este ejemplo, el quinto y sexto
caso (los dos del medio) son iguales a 7. Es decir, en cualquiera de los dos casos, la mediana es 7.
Uno de los errores ms comunes que cometen los estudiantes de estadstica al calcular ia mediana
es no ordenar primero las observaciones de menor a mayor.
Cuando existe una cantidad par de casos, la mediana puede estar entre dos nmeros diferen
tes. En el ejemplo anterior, tenamos una cantidad par de registros, pero los dos casos del medio
presentaban el mismo nmero; por lo tanto, no surga ningn inconveniente. Cuando los dos ca
sos medios son diferentes, se utiliza el promedio de los dos. En el ejemplo del tiempo requerido
para leer oraciones ambiguas hay exactamente 100 casos. El caso 50 (de menor a mayor) es de
2,76, y el 51 de 2,78. La mediana es, por lo tanto, 2,77; el promedio de 2,7y 2,78.
En ciertos casos, la mediana indica con ms precisin que la media la tendencia central de un
grupo de observaciones. Esto sucede cuando existen unas pocas observaciones extremas que
afectaran notoriamente ia media pero no influiran en la mediana. Por ejemplo, supongamos que
de 100 familias que trabajan en una plantacin de bananas en Amrica Central, 99 obtienen un in
greso anual de $100 y 1 (la familia del propietario) obtiene un ingreso anual de $90.100. La me
dia del ingreso familiar en esta plantacin sera de $1000 (99 x 100 = 9.900; 9.900 + 90.100 =
100.000; 100.000/100 = 1.000). Sin embargo, ninguna de las familias obtiene un ingreso siquiera
cercano a los $1.000, por lo que esta cantidad resulta ser completamente engaosa. En este caso,
la mediana del ingreso por familia sera de $ 100, una cifra mucho ms representativa de cualquier
persona a la que uno pudiera acercarse por azar en la plantacin.
Los resultados del tiempo de reaccin son otro ejemplo de los casos en los que podra ser pre
ferible la mediana. Supongamos que los tiempos en cinco pruebas fueron (en segundos) 0,74,
0,86, 2,32, 0,79 y 0,81. La marca de 2,32 segundos puede haber ocurrido porque la persona se
distrajo momentneamente. Por lo tanto, podra ser mejor utilizar la mediana para describir la
tendencia central, ya que esto le quitara influencia a la nica observacin extrema, y probable
mente sea lo correcto.
La importancia del indicador de tendencia central utilizado se refleja en una reciente contro
versia entre psiclogos que estudian la base evolutiva de la eleccin de la pareja humana. Una se
rie de tericos (p. ej., Buss & Schmitt, 1993) sostienen que a lo largo de sus vidas los hombres
preferiran tener muchas ms parejas que las mujeres. Segn esta visin, la evolucin sera la cau-

Figura 2-6. R ep resen ta ci n

Moda=8

g rfica d e la m o d a c o
m o pu nto m s a lto e n e l h istogram a d e una distri
bu cin , u tiliza n d o el e je m p lo fic tic io d e la cantidad
d e s e s io n e s d e terapia tom adas p o r 10 p a cien tes.

F ig u ra 2 -7 , R epresentacin grfica d e l efecto


causado e n la m ed ia y en la m od a por e l cam
bio d e algunos valores, utilizando e l ejem plo
ficticio de la cantidad d e sesio n es de terapia
tom adas por 10 pacientes.

/ * Media 7 .
5

F ig u r a 2 -8 . R ep resen ta ci n g rfica d e ia m ed ian a c o


m o e l valor d el m e d io al ordenar lo s registros d e m enor
a m ayor, u tiliza n d o e l eje m p lo fic tic io d e la cantidad
de s e s io n e s d e terapia tom adas por 1 0 pacientes.

6 7. ; 8

3 ' 3 .

v.

10 -

,v

Mediana'

:
.

sa de que las mujeres prefieran tener slo una pareja estable, debido a que una mujer slo puede
tener una pequea cantidad de hijos durante su vida, y es ms probable que los genes de la mujer
sobrevivan si esos pocos hijos son bien cuidados. Los hombres, sin embargo, pueden tener una
gran cantidad de hijos durante su vida; por eso, segn la misma teora, para ellos lo mejor es una
postura semejante al disparo de escopeta. Si tienen muchas parejas es ms probable que sus genes
sobrevivan. Coherentemente con esta presuncin, los psiclogos evolucionistas descubrieron que
los hombres expresaban necesitar muchas ms parejas que las mujeres.

Otros tericos (p.ej., Milier & Fishkin, 1998), sin embargo, han cuestionado esta visin. Sos
tienen que hombres y mujeres preferiran aproximadamente la misma cantidad de parejas debido
a que los individuos que tienen una predisposicin bsica a buscar un lazo ntimo fuerte son los
que tienen las mayores probabilidades de sobrevivir a la niez, y que este deseo de lazos fuertes
perdura (y tiene otros beneficios) en la etapa adulta. Los mismos investigadores tambin pregun
taron a mujeres y hombres cuntas parejas necesitaban, y ios resultados mostraron la misma dife
rencia en cuanto a las medias; los hombres necesitaban un promedio de 64,32 y las mujeres un
promedio de 2,79. Sin embargo, la escena cambia drsticamente si observamos la mediana o la
moda (vase tabla 2-1). La figura 2-9, tomada directamente de la publicacin preparada por los
investigadores, nos explica la situacin. La mayora de las mujeres y los hombres desean slo una
pareja; unos pocos desean ms de una, y sganos desean muchas ms. La gran diferencia reside
en que hay muchos ms hombres dentro del pequeo grupo que desea muchas ms parejas. (Los
valores observados ms extremos estaban tan alejados -los hombres que deseaban ms de 100 pa
rejas-, que ios investigadores ni siquiera los incluyeron al calcular las medias).
Por lo tanto, cul de las dos teoras es la correcta? Tal vez uno podra sostener cualquiera de
las dos formas para analizar esta informacin. La verdad es que concentrarse slo en la media, en
este caso, desfigura drsticamente la realidad de la distribucin.

r; \;:vpar(tidd te jareja; deseadas: para, iosprxirios 30 artos f: V

-r-h

F ig u r a 2 -9 . D istrib u cion es d e la cantidad id ea l d e parejas desead as para un perod o d e 3 0 aos p or h o m


bres y mujeres.
Nota: C on e l fin d e incluir tod os lo s datos, ju n tam os las categoras que s e encontraban m s alejadas a lo
largo de la c o la d e esta s distribu ciones. S i c a d a categora representara s lo un n m ero, sera m s e v id e n te
qu e la co la e s m uy chata y qu e las d istrib u cio n es so n an m s asim tricas d e lo q u e aq u parece. [F u e n te :
M ilier, L. C ., & F ishk in, S. A . (1 9 9 7 ), fig . 8 -1 . S ob re la din m ica d el e n la c e h u m ano y e i x ito reproducti
vo: buscando ventanas en la interfase am b ien tal adaptada a hu m an os . En: J. A. Simpson &D,T. Kendrick
(Eds.), Psicologa Social Evolutiva {Evolutionary Social Psychology]. M ah w ah , NJ: L a w re n c e E rlbaum
A ssociates, Inc., E ditores.]

De un modo ms general, la mediana (y a veces la moda) se utiliza ocasionalmente en psico


loga como estadstica descriptiva. Como hemos visto, es ms probable que se utilice en situacio
nes en las que existen algunos registros extremos que haran que la media no represente el cuerpo
principal de casos. Tambin existen circunstancias en las que los psiclogos utilizan la mediana
como parte de tcnicas estadsticas ms complejas.
Tabla 2-1.

Respuestas de 106 hombres y 160 mujeres a la pregunta: Cuntas parejas deseara tener en los
prximos 30 aos?

M ujeres
Hom bres

M ed ia

M ed ia n a

M od a

2,8
64,3

1
1

1
1

Fuente: M iller & Fishkin, 1997.

Sin embargo, a menos que existan valores extremos, los psiclogos casi siempre utilizan la media
como medida de la tendencia central. En realidad, la media cumple la funcin de piedra angular
para la mayora de las otras tcnicas estadsticas.

VARIANZA Y DESVO ESTNDAR*1


Adems de la tendencia central, los investigadores necesitan conocer la dispersin de una distri
bucin, Por ejemplo, supongamos que alguien preguntara: Cuntos aos tienen los alumnos de
determinada clase de estadstica? En una universidad ubicada en una ciudad con muchos estu
diantes que retoman los estudios o estudian por horas, la edad media podra llegar a ser 38. rio
podra decir a quien le preguntara: La edad promedio es 38. Pero esto no reflejara toda la situa
cin. Sera posible, por ejemplo, tener una media de 38 porque cada estudiante en la clase tiene
exactamente 38 aos de edad. O podramos tener una media de 38 porque la mitad de la clase tie
ne 18 aos y la otra mitad 58. Seran dos situaciones muy distintas.
La figura 2-10 representa tres distribuciones de frecuencias diferentes, con la misma media
pero con diferentes grados de dispersin de las observaciones alrededor de la media; y otras tres
con diferentes medias pero con el mismo grado de dispersin.1

Varianza
La varianza de un grupo de observaciones indica la dispersin de esos valores alrededor de la
meda. Para ser ms precisos, la varianza es el promedio de los cuadrados de la diferencia entre
cada observacin y la media. A continuacin, detallamos los pasos para calcular la varianza;

1 Esta seccin est dedicada a la varianza y al desvo estndar com o indicadores de dispersin. Existe otra forma de des
cribir la dispersin de un grupo de observaciones, la am plitud, e l registro mayor menos el registro menor. Supongamos
que en una clase en particular el registro ms alto en un examen parcial es 98 y el menor es 60; la amplitud es 38 (es de
cir 98 - 6 0 = 38). La amplitud rara vez es utilizada por investigadores psicolgicos ya que se trata de un medio muy bur
do de describir la dispersin. Es burdo debido a que no tiene en cuenta la distancia entre las observaciones dentro de la
distribucin.

Figura 2 -1 0 .

E jem p lo s d e d istrib u cio n es c o n (a) la m ism a m ed ia con d iferen tes grados d e d isp e r si n y (b)
diferentes m ed ias co n e l m ism o grado d e d ispersin .

1. Restar la media a cada observacin para obtener el desvo de cada una de ellos. El desvo
indica la distancia entre la observacin en cuestin y la media.
2. Elevar cada uno de los desvos al cuadrado (multiplicar cada uno de ellos por s mismo). Se
obtiene as el desvo cuadrtico de cada registro.
3. Sumar los desvos cuadrticos. El total logrado con este clculo se denomina suma de los
cuadrados.
4. Dividir la suma de los cuadrados por la cantidad de desvos cuadrticos (es decir, por la
cantidad de observaciones), Se obtiene as el promedio o media de desvos cuadrticos, es decir,
la varianza.
Aunque este procedimiento pueda parecer un poco extrao o difcil de recordar al principio,
en verdad funciona muy bien. Supongamos que una distribucin es ms dispersa que otra. La dis
tribucin con mayor dispersin presenta una varianza mayor porque la misma dispersin hace
que los desvos sean mayores. Si los desvos son mayores, los desvos cuadrticos tambin lo son
y, por lo tanto, tambin la varianza.
En el ejemplo de la clase en la que todos tenan 38 aos de edad, la varianza sera exactamen
te 0. Es decir, no habra varianza. (En trminos numricos, el desvo de cada persona sera
38 *- 38 - 0; 0 al cuadrado es 0. El promedio de 0 es 0). Por el contrario, la clase con la mitad de

los alumnos de 18 aos de edad y la otra mitad de 58 aos de edad tendra una varianza bastante
alta, es decir, 400. (Los alumnos de 18 aos de edad tendran cada uno un desvo de 18 - 38 =-20,
Los alumnos de 58 aos de edad tendran desvos de 58 - 38 = 20. En ambos casos, los desvos
cuadrticos, tanto -20 al cuadrado como 20 al cuadrado, daran como resultado 400. Y, cuando to
dos ios nmeros son 400, el promedio es 400).
La varianza es importante en muchos otros procedimientos estadsticos (incluso en la mayora de
los temas tratados en la segunda mitad de este libro). Sin embargo, la varianza se utiliza slo ocasio
nalmente como estadstica descriptiva, debido a que est basada en desvos cuadrticos, y los desvos
cuadrticos no transmiten claramente la dispersin de las observaciones. Son verdaderos
desvos o son no cuadrticos. Por ejemplo, queda claro que una clase con una varianza de 400 pre
senta una distribucin mucho ms dispersa que otra cuya varianza es 200. Sin embargo, el nmero
400 no refleja con claridad la variacin real entre las edades, ninguna de las cuales se acerca a 400.2
Desvo estndar
La estadstica ms ampliamente utilizada para describir la dispersin de una distribucin es el
desvo estndar. El desvo estndar es la raz cuadrada positiva de la varianza: para encontrar
el desvo estndar, primero es necesario calcular la varianza y luego sacar su raz cuadrada. Si la
varianza de una distribucin es 400, el desvo estndar es 20; si la varianza es 9, el desvo estndar
es 3, y si la varianza es 100, el desvo estndar es 10.
La varianza se basa en los desvos de la meda, al cuadrado. Por lo tanto, su raz cuadrada, el
desvo estndar, se basa en la distancia simple, no elevada al cuadrado, de la media. Sin entrar en
detalles, el desvo estndar es e! promedio de las diferencias entre las observaciones y la media.
Por ejemplo, analicemos una clase donde las edades presentan un desvo estndar de 20 aos. Esto
nos indicara que las edades se dispersan, en promedio, aproximadamente 20 aos en cada direccin
a partir de la media. Conocer el desvo estndar ofrece una idea general del grado de dispersin.
Daremos otro ejemplo. La distribucin de la cantidad de hijos por familia en un pas en par
ticular podra tener una media de 4 y un desvo estndar de L Significara que, por cada familia
con exactamente cuatro hijos (desvo 0 de la media), bien podramos encontrar una con seis o dos
hijos (desvo de 2 hijos de la media). Sin embargo, podra no funcionar de esa forma. Podra ser
que la mitad de las familias tuvieran exactamente 5 y la otra mitad exactamente 3. O podra ser
que la mayora tuviera 4, pero unas pocas no tuvieran ninguno y otras pocas tuvieran 8 (vase fi
gura 2- 11). No obstante, conocer el desvo estndar brinda una nocin general del grado de dis
persin, aun cuando no indique la forma precisa de distribucin.
El desvo estndar no es exactamente el promedio de las diferencias entre las observaciones
y la media. Para ser precisos, el desvo estndar es la raz cuadrada del promedio de los desvos
cuadrticos de la media, Elevar los desvos al cuadrado, promediarlos, y luego calcular la raz
cuadrada, da un resultado ligeramente diferente al simple promedio de los desvos de los registros
con respecto a la media, Aun as, el resultado de este procedimiento tiene ventajas tcnicas que
superan la ligera desventaja de dar slo una descripcin aproximada de la variacin promedio con
respecto a la media (vase nota al pie N 2).

2 El alumno seguramente se estar preguntando por qu ios estadsticos no trabajan slo con los desvos, simplemente

haciendo que todos ios desvos sean positivos, y utilizando sus promedios. En realidad, en el pasado, ese era ei procedi
miento. El promedio de los desvos (tratando a todos los desvos com o positivos) se denomina desvo prom edio o des
vo m edio, En efecto, algunos psiclogos han hecho resurgir esta cuestin observando algunas ventajas sutiles del
desvo promedio (Catanzaro &TayIor, 1996), Sin embargo, a pesar de su simplicidad conceptual y de clculo, ei desvo
promedio no funciona muy bien como parte de procedimientos estadsticos ms complejos, debido a que resulta difcil
realizar manipulaciones algebraicas con una frmula que ignora los signos de algunos de sus nmeros.

F ig u r a 2 -1 1 . R ep resen ta ci n grfica d e varias p o sib le s d istrib u cion es d e un e je m p lo fic tic io d e c o m p o s i


c i n fa m ilia r e n e l q u e la m e d ia e s 4 y e l d e sv o estndar e s 1.

Frmulas para obtener la varianza y e desvo estndar


Hemos visto que la varianza es el desvo cuadrtico promedio con respecto a la media. Se calcula
con la frmula:
SD2 ~

(2-2)

SD2 es el smbolo de varianza. (Ms adelante aprenderemos sus otros smbolos, S1 y o 1, la letra
griega sigma minscula al cuadrado. Los diferentes smbolos corresponden a diferentes cir
cunstancias en las que se utiliza la varianza y, en algunos casos, incluso a clculos ligeramente di
ferentes).
SD es la abreviatura de desvo estndar; recalca que la varianza es el desvo estndar ele
vado al cuadrado. La parte superior de la frmula describe la suma de los desvos cuadrticos.

X se refiere a cada observacin en la distribucin. M es la media. Por lo tanto, X - M es la ob


servacin menos la inedia, es decir, el desvo. El ndice sobrescrito 2 indica que se debe elevar
el desvo a! cuadrado. Finalmente, el signo de suma (X) indica que se deben sumar todos los
desvos cuadrticos.
La suma de los cuadrados es un clculo importante en muchos procedimientos estadsticos;
por lo tanto, tiene su propio smbolo, SS. Por esta razn, algunas veces la frmula de la varianza
se escribe utilizando este smbolo en el numerador, en lugar de (X - M)2:
SD 2 =
N

(2-3)

Ya sea que se utilice el smbolo simplificado SS o la descripcin completa de la suma de cuadra


dos, la parte inferior de la frmula es simplemente N, la cantidad de observaciones. Es decir, la
frmula indica dividir la suma de cuadrados por la cantidad de desvos cuadrticos (la cantidad de
observaciones en la distribucin).
El desvo estndar es la raz cuadrada de la varianza. De modo tal que si se conoce la varian
za, la frmula es simplemente:
sd

~ 4 si ?

(2"4)

La frmula del desvo estndar comenzando desde el principio es la raz cuadrada del clculo de
la varianza:
cn = fi(X -M )2
N

(2-5)

( 2- 6)

Ejemplo de clculo de la varianza y el desvo estndar


La tabla 2-2 ilustra el clculo de varianza y desvo estndar del ejemplo de las sesiones de terapia.
(En la tabla se presume que ya hemos calculado que la media es de sesiones). Generalmente es
ms sencillo realizar los clculos utilizando una calculadora, especialmente una que incluya la
funcin para calcular la raz cuadrada.
Otro ejemplo de clculo de la varianza y el desvo estndar
La tabla 2-3 muestra el procedimiento aritmtico para calcular la varianza y el desvo estndar del
ejemplo referido a las interacciones sociales, (Con el fin de ahorrar espacio, la tabla muestra slo
las primeras y ultimas observaciones).
Sin entrar en detalles, este resultado significa que la cantidad de interacciones sociales de un
estudiante en una semana vara de la media un promedio de 11,49 puntos. El resultado tambin
puede representarse con un histograma (figura 2- 12).
Finalmente, analicemos el ejemplo referido al estudio de la cantidad de tiempo requerido pa
ra leer oraciones ambiguas. La tabla 2-4 muestra el clculo de estos datos (otra vez, slo con las

Tabla 2-2.
Clculo de varianza y desvo estndar del ejemplo referido a la cantidad de sesiones de terapia.
M ed ia
(ca n tid a d m ed ia
d e sesio n es)
6
6
6
6
6
6

6
6
6

O bservacin
(cantidad de
sesiones)
7
8
8
7
3
I
6
9
3
8

D e sv o
cu a d r tic
1
4
4
1
9
25
0
9
9
4
66

D esv o

2
2
1
-3
-5
0
3
-3
0

2: 0
Variari2a = SD 2 =

2 (X ~ M )2

SS

66

10

D esvo estndar = S D ^ - J S B 2 * 7 X 6 = 2,57

primeras y ltimas observaciones para ahorrar espacio). En trminos aproximados, el tiempo pro
medio que tarda un participante en leer una oracin ambigua vara 0,142 segundos de la media de
2,755 segundos. La figura 2-3 representa los datos mencionados.

T abla 2 -3.

Clculo de la varianza y el desvo estndar de la cantidad de interacciones sociales vividas por 94


estudiantes universitarios durante una semana.
C antidad de
interacciones

m ed ia d e
in tera ccion es

D esv o

D e sv o
cu a d r tic o

S3

48
15
33
3
21

1 7 ,40
17,40
17,40
17,40
17,40

3 0 ,6 0
- 2 ,4 0
15,60
- 1 4 ,4 0
3,60

9 3 6 ,3 6
5,76
2 4 3 ,3 6
2 0 7 ,3 6
12,96

35
9
30
8
26

17,40
17,40
17,40
17,40
17,40

17,60
- 8 ,4 0
12,60
- 9 ,4 0

3 0 9 ,7 6
7 0 ,5 6
158,76
8 8,36
73,96.

0,00

12,406,44

2:
X (X -M )2

12.406,44

94

Varianza = S D 2 *

- 1 3 1 ,9 8

D esv o estndar = TSX? = 7 1 5 X 9 8 * 1 1 ,4 9


Fuente: McLaughlin-Voipe et al. (1998).

Figura 2-12. D esc r ip c i n grfica d e l d e s v o estndar c o m o la d istan cia a lo largo d e la b ase de un histogram a, u tiliza n d o e l e je m p lo referid o a la cantid ad d e in tera ccio n es s o c ia le s v iv id a s en una sem ana. (F u e n te :
M cL a u g h lin -V o lp e e t al., 1 9 98).
T a b la 2 -4 .
C lc u lo d e la v a r ia n z a y el d e s v o e s t n d a r e n u n e s t u d io fic tic io d e l tie m p o d e le c tu r a d e o r a c io n e s
a m b ig u a s .
V alor
(tiem p o de lectu ra )

M ed ia
(tiem p o d e lectu ra )

D esvo

D e sv o
c u a d r tic o

2 ,7 2
2 ,8 4
2 ,6 3
2 ,5 1
2 ,5 4
2 ,9 8

2 ,7 5 5
2 ,7 5 5
2 ,7 5 5
2 ,7 5 5
2 ,7 5 5
2 ,7 5 5

- 0 ,0 3 5
0 ,0 8 5
- 0 ,1 2 5
- 0 ,2 4 5
- 0 ,2 1 5
0 ,2 2 5

0 ,0 0 1 2
0 ,0 0 7 2
0 ,0 1 5 6
0 ,0 6 0 0
0 ,0 4 6 2
0 ,0 5 0 6

2 ,5 2
2 ,6 6
2 ,7 4
2 ,7 3
2 ,8 8
2 ,8 5

2 ,7 5 5
2 ,7 5 5
2 ,7 5 5
2 ,7 5 5
2 ,7 5 5
2 ,7 5 5

0 ,0 5 5 2
0 ,0 0 9 0
0 ,0 0 0 2
0 ,0 0 0 6
0 ,0 1 5 6
0 .0 0 9 0
2 ,0 3 3 0

Varianza - S D 2 -

2 ( X ~ M ) 2 _ SS
_

2 ,0 3 3

100
D e sv o estndar = S D =

= 0 ,0 2 0 3

= V O 0203 = 0 ,142

0 ,2 3 5
0 ,0 9 5
0 ,0 1 5
0 ,0 2 5
0 ,1 2 5
0 .0 9 5
X : 0 ,0 0 0

Descripciones grficas del


desvo estndar como la distancia a lo
largo de la base de un histograma, utili
zando el ejemplo referido al tiempo ne
cesario (en segundos) para leer oraciones
ambiguas (datos ficticios).
F igura 2-13.

Frmulas de clculo de ia varianza y el desvo estndar


En investigaciones reales, los psiclogos frecuentemente deben calcular la varianza y el desvo
estndar de distribuciones que involucran una gran cantidad de casos, y los clculos generalmen
te incluyen decimales o grandes nmeros. Debido a ello, el proceso puede llevar demasiado tiem
po, aun utilizando una calculadora. Para resolver este problema, se desarrollaron ciertos mtodos
que simplifican los clculos. Una frmula simplificada con el fin arriba mencionado se denomina
frmula de clculo En el apndice de ste captulo presentamos las frmulas de clculo de la va
rianza y el desvo estndar.
Sin embargo, en la actualidad, las frmulas de clculo son interesantes principalmente desde
el punto de vista histrico. Los investigadores las utilizan slo cuando no disponen de computa
doras para realizar los clculos. De hecho, incluso muchas calculadoras estn preparadas de tal
modo que slo es necesario ingresar los datos y presionar una o dos teclas para obtener la varian
za y el desvo estndar.
En este libro presentamos las frmulas de clculo en los apndices de varios captulos, en ca
so de que algn alumno est realizando un proyecto de investigacin que incluya demasiados n
meros y no disponga de una computadora. Sin embargo, no consideramos que las frmulas de
clculo sean tiles para aprender estadstica. Ms bien, tienden a oscurecer el significado de los
clculos. Al realizar los ejercicios, conviene utilizar las frmulas que presentamos en cada captu
lo, ya que esas frmulas han sido diseadas para ayudar a profundizar la comprensin del signifi
cado de los clculos. Las frmulas que presentamos en los captulos se denominan frmulas de
definicin.
El propsito de este libro es ayudar a comprender los procedimientos estadsticos, y no con
vertir al alumno en una computadora, hacindole memorzar y aplicar frmulas de clculo que ra
ra vez volver a utilizar, si es que alguna vez lo hace. (De todos modos, para simplificar los
clculos reales, nuestros ejercicios generalmente utilizan pequeos grupos de nmeros enteros.
Para los alumnos que disponen de una computadora, la Gua de estudio y cuaderno de ejerci
cios para computadora [Study Guide and Computer Workbook), que acompaa este libro, inclu
ye material preparado especialmente para que adquieran experiencia realizando estadsticas del
modo en que normalmente lo haran los psiclogos, trabajando con programas estadsticos estan
darizados en una computadora).

La varianza como !a suma de cuadrados dividida por N -1


Un aspecto que debemos tener en cuenta es que los psiclogos a menudo utilizan una frmula de
la varianza ligeramente diferente a la que hemos visto, ya sea para definirla o calcularla. Nosotros
hemos definido la varianza como el promedio de los desvos cuadrtcos, es decir, como la suma
de cuadrados dividida por la cantidad de observaciones, SS/N. Sin embargo, en el captulo 9 vere
mos que en muchos casos es correcto definir la varianza como la suma de cuadrados dividida por
la cantidad de observaciones menos 1; en esos casos, la varianza es SS/(N - 1).
La varianza (o su raz cuadrada, el desvo estndar) que aparece en las publicaciones cientfi
cas, con frecuencia se calcula utilizando SS/(N ~ 1). Incluso cuando las calculadoras o computa
doras calculan automticamente la varianza o el desvo estndar, a veces lo hacen con ese mismo
mtodo. Pero no debemos preocupamos por esto ahora. El mtodo que estamos aprendiendo en
este captulo, la varianza - SS/N, es completamente correcto para los fines para los que lo hmos
estado utilizando (describir la variacin de un grupo de registros), para el material tratado en el
resto de este captulo (puntuaciones Z) y para el material que veremos en los captulos 3 al 8.
Mencionamos el otro mtodo aqu, la varianza = SS/(N~ 1), slo para evitar cualquier confusin
que pueda surgir cuando el alumno lea sobre la varianza o el desvo estndar en otros textos, o si
la calculadora o el programa de la computadora que el alumno utiliza arroja un nmero para el
desvo estndar que parece equivocado. Para simplificar las cosas, no trataremos la razn de ser y
el uso del mtodo N ~ 1 sino hasta que sea necesario, es decir, a partir del captulo 9.

PUNTUACIONES Z
Hasta aqu hemos aprendido a describir una distribucin de observaciones en funcin de la media
y la varianza. En esta seccin, aprenderemos cmo describir una observacin en particular segn
el lugar que ocupe dentro del grupo de observaciones en conjunto. Es decir, aprenderemos a des
cribir una observacin segn la misma se encuentre sobre o debajo del promedio y segn a qu
distancia hacia abajo o por encima del mismo est ubicada.
Supongamos que nos informan que alguien llamado Alan tom 9 sesiones con la psicoterapeuta (la misma a la cual nos hemos referido en este captulo). Supongamos tambin que desco
nocamos la cantidad de sesiones tomadas por oros pacientes con la misma terapeuta. En ese
caso, seria difcil decir si Alan asisti a muchas o pocas sesiones en relacin con otros pacientes.
Sin embargo, supongamos que s sabemos que la media es y el desvo estndar es 2,57. Con
esos datos, queda claro que Alan asisti a una cantidad de sesiones superior al promedio. Tambin
podemos ver que la cantidad de sesiones en las que Alan se excedi del promedio (3 sesiones
ms) era un poco ms alta que la cantidad de sesiones en que los pacientes de la terapeuta general
mente varan con respecto al promedio. La figura 2-14 muestra el caso grficamente.

Figura 2-14. R elacin entre la cantid ad d e s e


sio n e s tom adas por un paciente llam ad o A la n y
la distribucin general de las cantid ades d e s e
sio n e s tom adas por tod os lo s p acien tes d e una
terapeuta en particular (datos fic ticio s).

. : de todos !os pdemes!...

tomadas, por Alan

Cuadro 2-1 .> ;


La verdadera alegra (s, alegra) que provoca el anlisis esta d stico .

Estamos aprendiendo estadstica porque. .. Socid Psychology], ve suprofesin del mis-:


nos gusta, verdad? No? O tal vez s, des- ; : mo modo:
pues de todo. Porque si nos convertimos en
La mejor recompensa es, por mucbo, ... psiclogos, en algn momento plantearecuando uno:obtiene nueva informacin ;i
mos una hiptesis, recolectaremos datos y :
y comienza a analizarla y comienzan a .
los analizaremos. (Aun cuando planifiqu. surgir cosas que, al principio, y hasta...
mos nuestras carreras como psicterapeu- ,
cierto punto, son la confirmacin de lo '%;
tas, es posible que con el tiempo deseemos
que nos indujo a realizar- ei estudio, pero ; :
; s o m e t e r a p n ie b a a lg u n a id e a s o b r e la n a tu r a le z a d e n u e s tr o s p a c ie n t e s y s u s d if i-

despus tam bin surgen otras' cosas.;.'


;

Por qu. ocurre esto? ', l i n Intenta

c u lta d e s ). E s a h ip te s is , n u e s tr a p r o p ia id e a

encontrarle sen tido. S o n e l tipo d e ideas

o r ig in a l, y l o s d a to s r e c o le c ta d o s p a r a p r o -

q u surgen d e lo s datos.;. A d oro nl-

b a r ia s e r n m u y im p o r ta n te s p a r a n o s o tr o s ,

zarlos.

Incluso es posible que nuestro corazn lieBibb Latane, un eminente psiclogo cono-:
gu a latir emocionado al analizar las estacido, entre odas cosas, por su trabajo sobr-.
dsticas.
larkzn por la cuallas personas no Siempre
Veamos algunos comentarios de psL
intervienen para ayudar a otros qu s eri-\
clogos sociales que entrevistamos parantran en problemas, cuenta cnio espe:-.
nuestro libro l co raz n d e t'picogd:.
r^a.hsiisainentefr
social [The Heart o f Social Psycholgy] ' :
Los primeros resplandores de lo qu '. - ;
(Aron & Aron, 1989). Deborah Richardsurgi ...'[y] poder utilizarlos para forson, quien estudia relaciones interpers-.. .. 1 rur lo que^l^ta-srliipregnte

nales, .nos confi que para ella lo m ejor' d e .


guente.:. Unonecesita uthzar. todo
ser psic'Ioga social ea observar ios resul- .: que tiene. [...} cada pizca
lados estadsticos de los anlisis computacie:intuicin: Es cundo;sebbfine.eL?:kv^
rizados;
mayor fctOi es lo. menos parecido ;"
Es como armar un rompecabezas... Es
..
V la mtina;Uno est frente.a la realidad,;
una experiencia muy emocionante y
cara a cara con la esencia de loquees-. ..
positiva para m. A menudo tengo pe-
.=, _t de$arrollando/en f nwmntb\d^
nodos d euforia. Incluso cuando la
verdad. .
; \ - ''/
.'
informacin no arroja el resultdo que
Bill Gfaziano, cuyo, trabajo, integra la psicyo espero.... [existe una] respuesta psilogia social y de desn,lloJ:lm grn;dir ;i :;
colgica ... Es emocionante ver cmo
versin, slo gran diversin al anlisisde su
van surgiendo los ciatos, es realmente
informacin. Y del mismo modo, Mmgret .
como yo pens que sera? y luego,
Clark, quien estudia la emocin y la cogiii \
pensar en las alternativas.
cin, declara que lo ms divertido es obteA .
Harry Reis, ex editor de la seccin de Proce- . ner datos y analizarlos.
:
..
so Crupal y Relaciones nferpersonales de la *'
Queda claro entonces que la estadstica
Revista Cientfica de Psicologa Social y. de., .. .. al servicio-de nu^tKts-:prpjpiai$ idfbmti&Y
la Personalidad [.Journal of Personality and
vas puede ser realmente un placer. . [ : [ '

Qu es una puntuacin Z?
Una puntacin Z es la transformacin de una observacin que describe mejor el lugar que esa obser
vacin ocupa en la distribucin. Especficamente, una puntuacin Z indica a qu cantidad de desvos
estndar por encima de la media se encuentra dicha observacin (si es positivo), o bien por debajo de la
media (si es negativo). El desvo estndar se transforma as en una especie de patrn, una unidad de
medida propiamente dicha. En el ejemplo de la psicoterapia, .Adn, que asisti a 9 sesiones, tiene una
puntacin Z de +1,17. Es decir que Alan est 1,17 desvos estndar por encima de la media (un poco
ms de 1 desvo estndar de 2,57 sesiones por encima de la media). Otra paciente, Sarah, asisti a se
siones con la terapeuta, y presenta una puntuacin Z de 0, ya que el valor que le corresponde es coinci
dente con la media. Es decir, su valor observado es de 0 desvos estndar por encima o por debajo de la
media. Qu pasara con un paciente que asistiera slo a una sesin? Ese paciente habra asistido a 5
sesiones menos que el promedio, casi 2 desvos estndar por debajo de la media (una puntuacin Z de
-1,95). En funcin de la cantidad de sesiones, el paciente estara por debajo del promedio el doble de
veces de lo que varan tpicamente con respecto al promedio los pacientes de la terapeuta.
Puntaciones Z utilizadas como escaia
La figura 2-15 muestra, utilizando el ejemplo de las sesiones de terapia, una escala de puntuacio
nes Z dispuesta en comparacin con una escala de puntuacin bruta. (Una puntacin bruta es un
valor observado antes de ser convertido en una puntuacin Z). Las dos escalas se asemejan a una
regla con pulgadas de un lado y centmetros del otro, o a un termmetro con la escaia Fahrenheit
de un lado y la de Celsius del otro.
Otros ejemplos
En la prctica, las puntuaciones Z tienen muchos usos. Tambin son parte importante de muchos
de los procedimientos estadsticos que aprenderemos en lo que resta del libro. Es importante fa
miliarizarse con ellos.
Analicemos otro ejemplo. Supongamos que un psiclogo especializado en el desarrollo ob
serv a un nio de tres aos, llamado Peter, en una situacin estndar de laboratorio, mientras ju
gaba con otros nios de su edad. Durante la observacin, el psiclogo control la cantidad de
veces que Peter hablaba con los otros nios. El resultado, luego de varias observaciones, fue que
Peter habl con los otros nios aproximadamente 8 veces por hora de juego. Sin ningn patrn de
comparacin, sera difcil sacar alguna conclusin a partir de esta informacin. Supongamos, sin
embargo, que se saba, por investigaciones previas, que en similares condiciones la cantidad me
dia de veces que los nios hablan por hora de juego es 12, con un desvo estndar de 4. Con esa
informacin, ahora podemos ver que Peter habl con menos frecuencia que oros nios en gene
ral, pero no con una frecuencia extremadamente menor. Peter tendra una puntuacin Z de --1 (si
M = 12 y SD - 4, una observacin de 8 est 1 SD por debajo de la M). Supongamos que observa
mos conversar a Ian con otros nios 20 veces en una hora. Quedara claro que Tan es inusualmen
te locuaz, con una puntuacin Z de + 2 . Ian no slo hablara ms que el promedio, sino dos veces
ms de lo que los nios tienden a desviarse del promedio. (Vase figura 2-1 ).
F igura 2-15. E sc a la s de p u n tu a cio n es
Z y pu ntuacin bruta en e l c a so d e las
s e s io n e s d e psicoterap ia.

rjiuactotLj l'C'Lj?
'#f.i;

-2
:
i

' ~3
*I______
Cantidad de conversaciones por hora; 0

PuntuacinZ:.

: : -Vu
"i . .

;4-

.20

2-.

:24

Figura 2-16. C antidad da v e c e s por hora qu e d os n i os con versan , expresada e n p u n tu acion es brutas y pun
tu a cio n es Z (d atos fic ticio s).

Puntuaciones Z como patrones de comparacin generalizados


Otra ventaja de las puntuaciones Z es que, convirtiendo las observaciones de variables completamente
diferentes en-puntuaciones Z, podemos compararlas entre s. Con las puntuaciones Z, la media es
siempre 0 y el desvo estndar es siempre 1. Supongamos que los mismos nios de nuestro ejemplo
fueran medidos en una prueba de capacidad lingistica. Podramos comparar directamente las pun
tuaciones Z correspondientes a esa capacidad con las puntuaciones Z correspondientes al nivel de
conversacin con otros nios. Supongamos que Peter obtuvo una puntuacin bruta de 100 en la
prueba lingstica. Si la meda en la prueba era 82 y el desvo estndar era 6 , entonces Peter tiene
una capacidad lingstica claramente superior al promedio, con una puntuacin Z de + 3. Es impro
bable que el grado de conversacin con otros nios, menor al usual, demostrado por Peter, se deba a
una capacidad lingstica menor a la usual (vase figura 2-17).
El ejemplo nos muestra que, utilizando puntuaciones Z, podemos comparar directamente los
resultados de observaciones psicolgicas del grado de conversacin con los resultados de una
prueba de capacidad lingstica. Esto es casi tan fabuloso como poder comparar manzanas con
naranjas! Convertir un nmero en una puntuacin Z se asemeja a convertir los trminos y unida
des de medida desconocidos en otros que todos podamos entender; es como convertir codos y
pulgadas, por ejemplo, en centmetros. Es realmente una herramienta muy valiosa.

. Peter

'
Cantidad de-.
conversaciones
porhora:
Puntuacin Z:
Capacidad
lingstica

~3. ' 2 ' - i


h ---- k~~-----j----,0 ''

U'Uv: ;ve'- Ci

8 ' 12

16

+2
-----j _ i
20 , 24

SIS
-:~2\
-i
^ - h ~ - :..
64

70 ,

-76

0
+1
----:r-~* j~_
88, 94
82

Figura 2-17. E scalas d e puntuacin Z y pu ntaciones brutas


para la cantidad d e conversacio n e s por hora y la capacidad
lingistica, c o n las o b se rv a d o n e s -d e l prim er ni o en cada
una de ella s (datos ficticios).

Peter r,
i
T

+3
1Q

Frmula para convertir una puntuacin bruta en una puntuacin Z


Una observacin directa se denomina puntuacin bruta. Como hemos observado, una puntuacin
Z indica la cantidad de desvos estndar por encima de la media (o, si es negativo, por debajo),en

que se encuentra la puntuacin bruta. Para calcular una puntuacin Z, se resta la media a la pun
tuacin bruta, obteniendo el desvo. Luego se divide el desvo por el desvo estndar. En smbo
los, la frmula es la siguiente:
Z ~
SD

(2-7)

Por ejemplo, si aplicamos la frmula al ejemplo del nio con un registro de 100 en la prueba de
capacidad lingstica,, la frmula sera la siguiente:
g __ X - M _ 100 - 82 _ 18 _ ^
SD
6
6

Frmula para a conversin de una puntuacin Z en una puntuacin bruta


Para volver a convertir una puntuacin Z en una puntuacin bruta se invierte el proceso: se
multiplica la puntuacin Z por el desvo estndar y luego se le suma la media. La frmula es la
siguiente:

X = (ZXSD) + M

(2-8)

Por ejemplo, si un nio presenta una puntuacin Z de -1,5 en la prueba de capacidad lingsti
ca, quiere decir que se encuentra 1,5 desvos estndar por debajo de la media. Dado que el des
vo estndar en este caso es de puntos brutos, el nio est 9 puntos brutos por debajo de la
media. La media es 82. Por lo tanto, 9 puntos por debajo de ella es 73. Utilizando la frmula,
tendramos:

X = (Z)(SD) +M~ (-lt5)(6) + 82 ~ -9 + 82 ~ 73


Pasos para convertir una puntuacin bruta en una puntuacin Z
Para convertir una puntuacin bruta en una puntuacin Z;
1. Calcular el desvo: restar la media a la puntuacin bruta.
2. Calcular la puntuacin Z: dividir el desvo por el desvo estndar.

Pasos para convertir una puntuacin Z en una puntuacin bruta


Para convertir una puntuacin Z en una puntuacin bruta:
1. Calcular el desvo: multiplicar la puntuacin Z por el desvo estndar.
2. Calcular la puntuacin bruta: sumar la media al desvo.

Ejemplos de clculo de una puntuacin Z a partir de una puntuacin bruta y viceversa


Analicemos el primer ejemplo que utilizamos en el captulo 1, es decir, las puntuaciones de estrs
de 151 alumnos de estadstica (Aron e al., 1995). La media de esa distribucin era 6,46, y el des
vo estndar era de 2,30 (SS 797,5; SD2 = 797,5/151 = 5,28; SD = 5,28 = 2,30).

La figura 2-18 muestra la relacin entre las escalas de puntuaciones brutas y de puntuaciones
Z. Si la puntuacin bruta del estrs de un alumno era 9, ese alumno se encuentra claramente por
encima de la media. Especficamente, al utilizar la frmula obtendramos:
_ X ~ M = 9 -6 ,4 6 ^ 2,54 ^
(2-7)
SD
2,3
2,3
En comparacin, otro alumno presenta una puntuacin Z de -2,37, un nivel de estrs claramente
menor a la media. Utilizando la frmula, la puntuacin bruta exacta se calcula de la siguiente forma:

(Z)(SD) + M - ( - 2, 37) ( 2, 3) + 6,46 = - 5,45 + 6,46 = 1,0

Analicemos algunos ejemplos tomados del estudio sobre la cantidad de interacciones sociales vi
vidas por estudiantes en una semana (McLaughlin-Volpe et al., 1998). Recordemos que la media
era 17,4 y el desvo estndar 11,49. Un alumno que tuvo 17 interacciones en una semana presenta
un desvo de - 0,4 (es decir 17 - 17,4 = - 0,4). Por lo tanto, la puntuacin Z es - 0,03 (es decir
-0,4/11,49 - -0,03). Esta cantidad de interacciones se encuentra apenas por debajo de la media.
De modo similar, un estudiante que vivi 36 interacciones sociales en una semana presenta un
desvo de 18,6 (es decir, 3 6 -1 7 ,4 = 18,6). La puntuacin Z es 1,62 (es decir 18,6/11,49= 1,62).
Este alumno se encuentra a 1,62 desvos estndar por sobre la media en lo que se refiere a interac
ciones sociales vividas en el plazo de una semana.
Para hacerlo del modo inverso, supongamos que supiramos que la puntuacin Z de un
alumno fue 0,57. La puntuacin bruta de ese alumno (referido a la cantidad de interacciones
sociales) sera igual a la puntuacin Z por el desvo estndar ms la media: (0,57 x 11,49) +
17,4 = 23,95 (redondeando, esta persona tuvo 24 interacciones sociales). La figura 2-19 muestra
estas relaciones.
Finalmente, analicemos el ejemplo referido al tiempo de lectura de oraciones. Recorde
mos que en ese estudio calculamos que la meda de tiempo de lectura de 100 estudiantes era
2,755 segundos y el desvo estndar de 0,143 segundos. Un alumno con un tiempo de lectura de
2,88 segundos presenta una puntuacin Z calculada de la siguiente forma;

X-M
SD

2,88-2,755
0,143

0,125
0,143

. 0_

----- --------- -2=5 0,o /

Un alumno con una puntuacin Z de 2,0 presenta un tiempo de lectura calculado de la si


guiente forma:
X = (Z)(SD) + M " (2,0)(0,143) + 2,755 = 0,286 + 2,755 = 3,041

(1,0).
Alumno 2
'

Puntuacin Z:
V

-2

'
...- J

J",

,44 . : 1,86

4 I-', . f .!

-j

! '

, l".

Puntuac i n: de estrs:
' L"

,-3 ,

:
. 'y .

(9.0) . .
Alumno l

4,16

.0
..... .. " ,

+1

+ 2

6,46'' 8,76 '11,06

+3-------- 1

13,36

Figura 2-18. E sc a la s d e puntuad o n e s brutas y p u n tu a d o n e s Z


referid as a lo s v a lo res d e estrs
d e 151 a lu m n o s d e e sta d stica
(F u e n te : A ron, Paris, & A ron ,
1 9 9 5 ), c o n las ob se rv a c io n e s
d e d os alu m n os tom ad os c o m o
m uestra,

El tiempo de lectura de un alumno con una puntuacin Z de -1,1 es el siguiente:


X - (Z)(SD) + M = (~l,l)(0,143) + 2,755 =-0,157 + 2,755 = 2,598
La figura 2-20 ilustra estas relaciones.

Algunas caractersticas de las puntuaciones Z


La media de una distribucin de puntuaciones Z siempre es exactamente 0, debido a que la con
versin de observaciones a puntuaciones Z involucra restar la media de cada puntuacin bruta.
Para decirlo de otro modo, la suma de las puntuaciones Z positivas de una distribucin siempre
debe ser igual a la suma de las puntuaciones Z negativas de dicha distribucin.
El desvo estndar de una distribucin de puntuaciones Z siempre es exactamente 1, debido a
que la conversin de observaciones a puntuaciones Z involucra dividir cad desvo por el desvo
estndar. Adems, dado que el desvo estndar es 1, la varianza, es decir el desvo estndar eleva
do al cuadrado, tambin es siempre 1. La tabla 2-5 indica las puntuaciones Z correspondientes al
estudio de las sesiones de terapia, junto con los clculos de la media y el desvo estndar de esas
puntuaciones Z. Este ejemplo demuestra que, tratndose de puntuaciones Z, la media es 0 y el
desvo estndar (y varianza) es 1.
Las puntuaciones Z se denominan a veces puntuacin estndar, debido a que presentan valo
res estndares para la media y el desvo estndar. Tambin se debe a que, como vimos anteriormen
te, las puntuaciones Z brindan una especie de escala de medicin estndar para cualquier variable.
(Sin embargo, a veces el trmino puntuacin estndar se utiliza slo cuando las puntuaciones %
se refieren a una distribucin que es una curva normal. Como veremos ms adelante, en el captulo
5, las puntuaciones Z son aun ms tiles cuando la distribucin es una curva normal).
Adems, a veces se calculan puntuaciones similares a puntuaciones Z cuya media es un
nmero distinto de 0 y cuyo desvo estndar es un nmero distinto.de 1. Por ejemplo, en algu
nas pruebas utilizadas por psiclogos clnicos, se crean escalas especiales en las que la media
es 50 y el desvo estndar es 10. Por lo tanto, un registro de 65, en esta escala, sera igual a una
puntuacin Z de 1,5.

Figura 2-19. E sca la s de puntuaciones


brutas y puntuaciones Z referidas a
la cantidad d e interacciones so cia les
vividas por 9 4 alum nos durante una
sem ana, con las observaciones de
tres a lu m n o s to m a d o s c o m o m u e s
tra. (F u e n te : M cL a u g h lin -V o p e et
al., 1 9 9 8 ).

' Alumno 1 1 .Alumno 2

' /
; .'Puntuacin Z: - 3

-2

-l

. i

"0 1

- k - 1- 1
Regjstro de actitud:'.

F igura 2-20. E sc a la s de p u n tu a cio


n e s brutas y p u n tu a c io n e s Z r e fe
ridas al tie m p o d e lectu ra d e ora
c io n e s a m b ig u a s por parte d e 1 0 0
a lu m n o s (d a to s fic tic io s ), c o n lo s
registros d e tres c a so s to m a d o s c o
m o m u estra.

''.(24,0)''
Alumno 3 (17,0).
, ' (36,0)

' 1.

' 5,91 ..-1 7 ,4 0

(2,598):,
.A lu m no3--

;
: Puntuaciones1

'

-i

V L
+f

2,469

r.'.-----1------I

; . (2,88)
(3,041)
" .Alum no-1 A lum no2 ,

- ;
1.44

+3

2 8 ,8 9 , 40,3,8 -

.1

: ~ 3 ::- 2 : i - i . : L: o

: Ttempoe lectura':: 2,326

'+ 2

i:

2;6i2. .2,755. '2,898:

!..

; :+2 -v +3

4.

3,041 2,184

Clcalo de ia media y el desvo estndar de puntuaciones Z en el ejemplo de la cantidad de sesiones


de terapia.
Desvo de
Media
Desvo
Puntuacin Z
Cantidad de sesiones
cuadrtico
la puntuacin Z
punto Z
de la cantidad
(Puntuacin bruta)
de la puntuacin Z
de sesiones
0,15
0,39
0
0,39
7
8
8

7
3
1
6

9
3
8
2:

2X

0,61
0,61

0,15
1,37
3,80
0,00
1,37
1,37
0.61
10,04a

0,39
-1,17
-1,95
0,00
1,17
-1,17

0
0
0
0

0,39
-1,17
-1,95
0,00
1,17

-1,17

0.78
0,00

0,78

SD2 ^

0,78
0,78

0
0
0

0,7 8
0 ,7 8

0 ~

2 (X -A )2

SS

10

10

S> = Vl= 1
8 Si no hubiera errores de redondeo, el resultado sera igual a 10.

CONTROVERSIAS Y LIMITACIONES:
LA TIRANA DE LA MEDIA
Aun cuando el uso de la estadstica en psicologa es tan generalizado que pareciera ser la nica
herramienta o el nico lenguaje de esta disciplina, siempre ha existido una corriente en desacuer
do con el mtodo puramente numrico. Es nuestra intencin informar al lector, a lo largo del li
bro, sobre las controversias que existen en el campo de a psicologa con respecto a la estadstica.
Consideramos que un buen tema para comenzar a hacerlo es precisamente el debate referido al
abuso de las estadsticas.
El padre de la psicologa, Wihelm Wundt, pensaba que los experimentos y las estadsticas
deban limitarse a temas tales como la percepcin y la memoria, una opinin que rara vez se men
ciona. El mtodo apropiado para las otras reas de la psicologa era el anlisis y 1a interpretacin
del significado, procedimientos que prescinden de los nmeros (McLeod, 1996).
El conductismo se describe con frecuencia como la escuela de psicologa histricamente ms
dedicada a mantener este campo dentro de un mbito estrictamente cientfico. El conductismo se
inici alrededor del ao 1913, con el rechazo por el estudio de los estados interiores del individuo
debido a la imposibilidad de observarlos objetivamente. Pero el ms ardiente portavoz del con
ductismo, B. F. Skinner, se opona rotundamente a la estadstica. Skinner lleg incluso a decir:
Preferira ver a un graduado en psicologa asistir a un curso de fsico-qumica que de estadstica.
E incluira (presumiblemente antes que la estadstica) otras ciencias, incluso poesa, msica y ar
te (Evans, 1976, p. 93),
Por qu Skinner se opona tan rotundamente a la estadstica? l sostena que observar el com
portamiento es la mejor forma de comprenderlo, y se refera a la observacin de casos individuales.

Haca notar constantemente los datos que se perdan por promediar los resultados de varios casos.
Por ejemplo, Skinner (1956) mencionaba el ejemplo de tres ratones que coman en exceso: uno na
turalmente obeso, otro envenenado con oro y otro cuyo hipotlamo haba sido alterado. Cada uno
presentaba una curva de aprendizaje diferente (patrn de velocidad de aprendizaje) en relacin con
la destreza necesaria para presionar una barra y alcanzar el alimento; esto revelaba muchos aspec
tos acerca de los hbitos alimenticios ocasionados por cada una de las distintas enfermedades. Si se
hubieran sumado o unificado estadsticamente las curvas de aprendizaje, el resultado no hubiera re
presentado los hbitos alimenticios reales de ningn ratn real. Segn el mismo Skinner, estas tres
curvas Individuales contienen ms informacin de la que podra haber sido generada por medidas
que requirieran un tratamiento estadstico; sin embargo, las mismas sern analizadas con descon
fianza por muchos psiclogos porque representan casos individuales, (p. 232)
Diferente fue el pedido de precaucin emitido por la psicologa humanstica, cuyos comien
zos datan de la dcada de 1950 como tercera fuerza en contraposicin al conductismo y a la
principal alternativa del momento, el psicoanlisis freudiano. El tema central de la psicologa hu
manstica estableca que la conciencia humana deba ser estudiada ntegramente, como un todo,
exactamente como es experimentada por el individuo. No es posible explicar-totalmente la expe
riencia humana reducindola a nmeros (as como tampoco es posible explicarla reducindola a
palabras). La experiencia de un individuo es compleja y nica.
En el rea de la psicologa clnica y del estudio de la personalidad, a menudo se han levanta
do voces para argumentar que puede aprenderse mucho ms sobre aquello que es realmente im
portante en psicologa a partir del anlisis profundo de una persona, que respecto de promedios
entre varias de ellas. Es decir, el mtodo ideogrfico contra el nomo t tico, para utilizar los trmi
nos que Gordon Allport tom de Wiihelm Windelband (vase Hilgard, 1987). Y la base filosfica
del anlisis profundo de los individuos puede encontrarse en la fenomenologa, que naci en Eu
ropa despus de la Primera Guerra Mundial (vase Husserl, 1970).
La fenomenologa es una posicin filosfica opuesta al positivismo lgico. El positivismo l
gico sostiene que existe una realidad objetiva a ser conocida. Es la posicin filosfica que susten
ta tradicionalmente los esfuerzos cientficos. Se considera que la ciencia puede descubrir esa
realidad objetiva o verdadera dado que utiliza experimentos que cualquiera puede observar o re
petir para obtener los mismos resultados. Los fenomenlogos sostienen, sin embargo, que inclu
so estas reiteradas observaciones son en realidad hechos particulares realizados en forma
consciente. Uno no puede saber si lo que entiende por verde o la rata presion la barra siete ve
ces es lo que cualquier otro entiende por esas mismas palabras. Segn los fenomenlogos, no
existe una realidad objetiva de la cual todos podamos estar seguros.
En la actualidad, el principal desafo para la estadstica proviene del fuerte renacimiento del
inters en los mtodos cualitativos de investigacin. Ha habido una creciente preocupacin en
tre algunos psiclogos con respecto a que, luego de cien aos de investigacin estadstica cuanti
tativa, la psicologa ha producido lo que ellos consideran conocimientos de muy poca utilidad
social (Jessor, 1996). Esperan que, analizando cuidadosamente como un todo a unos pocos seres
humanos en su contexto se puedan obtener mejores resultados
Highlen y Finley (1996) describen cinco posibles posiciones filosficas que acompaan la in
vestigacin cualitativa. La primera adopta el positivismo lgico y busca una realidad objetiva a
travs de mtodos cualitativos. Tambin existe el pospositivismo, que sostiene la existencia de
una realidad verdadera pero que nunca conoceremos completamente. No obstante, esforzndonos
podemos acercamos a ella. La visin dei constructivismo subraya la existencia de mltiples rea
lidades. Cada uno de nosotros construye un significado a partir de la experiencia, y la psicologa
debera intentar comprender algunos de esos significados. La visin crtica tambin niega cual
quier realidad objetiva. Sostiene que toda ciencia sirve al propsito de alguien, y el propsito co

rrecto es la liberacin de los ms dbiles a travs de, por ejemplo, el feminismo o el neomarxismo. Finalmente, la visin postestructural persigne el objetivo de desafiar toda realidad social
mente establecida, la cual es considerada el producto de quienquiera que detente el poder. Si el
alumno an no ha considerado este tema, aconsejamos averiguar y leer al respecto para comenzar
a formar una opinin propia.
Cualquiera sea ia posicin filosfica subyacente, los mtodos cualitativos incluyen anlisis
de casos, etnografa, fenomenologa, interaccionismo simblico, anlisis de sistemas e investi
gacin de la accin1 (Hghlen & Fniey, 1996). Estos mtodos se desarrollaron principalmente en
antropologa, en donde el conducdsmo y el positivismo lgico nunca tuvieron la influencia que
lograron en la psicologa. Los mtodos cualitativos usualmente implican largas entrevistas u ob
servaciones de unos pocos individuos; mientras se realizan las entrevistas, el investigador alta
mente capacitado decide qu aspectos merecen ser recordados, registrados y analizados por
medio de otras preguntas y observaciones. Segn esta postura, la mente del investigador es la he
rramienta principal, ya que slo esa mente puede localizar las relaciones importantes entre las
muchas categoras de hechos que surgen de las palabras de quien responde.
Algunos psiclogos (p. ej., Kenney, 1995; McCracken, 1988) sostienen que los mtodos
cuantitativos y cualitativos pueden y deben complementarse. Primero deberamos descubrir las
categoras importantes a travs de un enfoque cualitativo, y luego determinar su incidencia en una
poblacin mayor a travs de mtodos cuantitativos. Este grupo de psiclogos sostiene que, con
frecuencia, los investigadores cuantitativos deciden apresuradamente cules son las categoras
importantes sin explorar primero la experiencia humana con respecto a ellas, a travs de entrevis
tas de preguntas abiertas u observaciones.
Tambin resultan de inters las opiniones muy originales del psiquiatra Cari Jung sobre lo
que l llamaba el estado de nimo estadstico. Tal como lo expresara la analista jungiana Mane
Louise von Franz (1979), tenemos un estado de nimo estadstico cuando caminamos por una
calle y observamos los cientos de rostros inexpresivos y comenzamos a sentimos disminuidos.
Nos sentimos simplemente uno ms de la multitud, comunes. O bien, cuando estamos enamora
dos, sentimos que la otra persona es nica y maravillosa; no obstante, cuando nuestro estado de
nimo es estadstico, nos damos cuenta de que la otra persona es comn, igual a muchas otras.
Von Franz seala, sin embargo, que si sucediera una catstrofe, cada persona respondera de
forma nica. En la vida existe al menos tanta irregularidad como regularidad.
El hecho de que esta mesa no levite sino que permanezca donde est slo se debe a que los miles y
miles y miles de millones de electrones que la forman tienden a comportarse de ese modo estads
ticamente. Pero cada electrn por s mismo podra comportarse de modo diferente, (p, rv-17)
Segn Franz, el estado de nimo estadstico es daino para el amor y la vida. Para contrarres
tarlo, se necesita un acto de lealtad para con nuestros propios sentimientos (p. rv-18). Los senti
mientos hacen que la vida, al igual que las relaciones y los actos parezcan nicos y les dan un
valor definido (pp. iv-18-rv-19). En particular, sentir la importancia de nuestras acciones indivi
duales hace menos posibles las inmoralidades, como por ejemplo la guerra y el homicidio. No po
demos contar los muertos como si fueran nmeros sino que debemos tratarlos como personas,
con emociones y objetivos, como nosotros mismos,.
Para resumir, podemos decir que siempre han existido buenas razones para limitar nuestro
pensamiento estadstico a su propio territorio, y dejar que nuestro corazn gobierne libremente
los otros.

LA MEDIA Y EL DESVO ESTNDAR


SEGN SE DESCRIBEN EN PUBLICACIONES CIENTFICAS
En ias publicaciones cientficas normalmente se hace referencia a la media y al desvo estndar.
Aunque la varianza y las puntuaciones Z son extremadamente importantes como pasos de procedi
mientos avanzados que aprenderemos ms adelante, rara vez son mencionadas en las publicaciones.
En algunas oportunidades, la media y el desvo estndar son incluidos en el texto de una pu
blicacin. Por ejemplo, nuestra psicoterapeuta ficticia podra escribir: La cantidad media de se
siones tomadas por los ltimos 10 pacientes fue 6,0 (SD ~ 2,57).
En ias tablas, frecuentemente se hace referencia a la media o al desvo estndar, en especial
cuando se involucran varios grupos o cuando los participantes en la investigacin son analizados
en varias condiciones diferentes. Por ejemplo, Orbach y sus colegas (1997), en un estudio realiza
do en Israel, compararon un grupo de pacientes suicidas de un hospital para enfermos con proble
mas mentales (individuos que haban realizado intentos serios de suicidio), pacientes no suicidas
de un hospital para enfermos con problemas mentales con diagnosis similares, y un grupo de con
trol (voluntarios de la comunidad). El objetivo del estudio era probar la teora de que los suicidas
tienen mayor tolerancia al dolor fsico; que su ms alto umbral de dolor hace que para ellos sea
ms sencillo realizar los dolorosos actos que implica un suicidio. Los investigadores realizaron
jas pruebas de rutina para medir el umbral de dolor y otras sensaciones, y entregaron varios cues
tionarios a los tres grupos. La tabla 2-6, reproduccin de la que aparece en su artculo, refleja la
media de cada grupo en todas las mediciones.

Tabla 2-6.
M edias y desvos estndar de medidas de dolor, tendencias suicidas, disociacin y medidas emocio
nales del grupo de estudio.

Suicidas
M ed ici n
Umbral de percepcin
Umbral de dolor
Tolerancia al dolor
M xim a tolerancia
E stim acin de magnitud
A traccin hacia la vida
A traccin hacia la muerte
R epulsin a la vida
R epulsin a la muerte
D isociacin afectiva
D iso cia ci n cognitiva
D iso cia ci n relacionada con e l control
D esesperanza
D epresin
A ngustia

Psiquitricos

SD

SD

3 8 ,09
4 5 ,37
4 8 ,2 9
2,55
0,54
2,88
3,62
3,02
1,85
2 ,3 6
2 ,1 0
2,07
10,06
2 ,8 6
2 ,3 6

5,31
4,81
2 ,6 0
2,43
0,12
0,98
1,04
0,92
0,82
0,67
0,72
0,73
5,99
1,21
0,90

3 5 ,9 3
4 2 ,2 8
4 6,68
0 ,6 6
0,57
3 ,4 8
2,62
2,41
2 ,8 0
2 ,1 2
1,76
1,93
5,55
2 ,3 0
2 ,0 4

3,14
3,68
3,04
1,29
0,08
0,91
0,87
0,76
1,04
0,49
0,37
0,57
4,23
0,90
0,88

Normales
M

SD

33,03
40,01
46,31
1,14
0,59
4,11
2 ,6 0
1,93
2 ,6 4
2,01
1,77
1,68
4,37
1,84
1,95

0 ,5 2
3,63
4 ,2 2
1,91
0,09
0 ,5 6
0 ,8 0
0 ,6 6
1,01
0 ,4 2
0 ,4 9
0,52
3 ,7 0
0,75
0,69

Nota: Altos ndices de atraccin hacia ia vida y repulsin a la muerte representan bajas tendencias suicidas; bajos ndi
ces de repulsin a la muerte y atraccin hacia la vida representan altas tendencias suicidas.
Fuente: Orbach, I. et al. (1997), tab. 1. Umbral y tolerancia al dolor fsico en adolescentes suicidas y no suicidas. R e
vista C ien tfica de P sic o lo g a d e A se so ra m ie n to y C ln ica {J o u rn a l o f C o n su ltin g a n d C lin ic a l P sych o lo g yj , 65,
6 4 6-652. Copyright, 1997, por la A sociacin Americana de Psicologa (American Psychological Association]. Reim
preso con autorizacin.

Como podemos observar en la tabla, coincdentemente con las predicciones de los investiga
dores, el grupo suicida presentaba un umbral ms alto de dolor que los otros dos grupos y difera
de stos tambin en varias otras medidas. (Cabe destacar especialmente la gran diferencia entre el
grupo suicida y los otros dos grupos en cuanto a la desesperanza')- Por supuesto, tal como lo in
dican los desvos estndar, hay mucha superposicin entre los grupos con respecto a estas medi
ciones. Es decir, aunque teniendo en cuenta el promedio, el grupo suicida presenta un mayor
umbral de dolor; existen muchos pacientes suicidas con umbrales de dolor menores a los de los
otros grupos, y muchos individuos no suicidas con mayor umbral de dolor.
La tabla 2-7 (tomada de Norcross et al., 1996) presenta un ejemplo particularmente interesan
te. No muestra desvos estndar pero s medias y medianas. Por ejemplo, en 1992, la media de as
pirantes a doctorados de asesoramiento psicolgico era 120,2, pero la mediana era slo 110. Esto
sugiere que existan ciertos programas con una gran cantidad de aspirantes que tomaban asimtri
ca la distribucin. De hecho, podemos ver en la tabla que en casi todos los casos, y tanto para so
licitudes como para inscripciones, las medias son usualmente mayores que las medianas. (Es
probable que resulte asombrosa la competitividad que presenta el ingreso a un doctorado en mu
chas de las reas de la psicologa. Segn nuestra experiencia, uno de los factores con bastante in
fluencia en este aspecto, es haber tenido xito en los cursos sobre estadstica).

Tabla 2-7.
Estadstica de solicitudes e inscripciones

por rea y ao: Doctorados.


Solicitudes

N de programas

Programa
Clnica
Cognitiva
Comunitaria
Asesoramiento
Desarrollo
Educacional
Experimental y general
Salud
ndustriai/organizacional
Personalidad
Percepcion/psicofsica
Fisologa/biopsicologa
Escolar
Social
Otras
Total

Inscripciones
M dn

M dn

1973a

1979a

1992

1973a

1979a

1992

1973a

1992

1992

1992

105

i 30

314.4

252,6

234

2
43
72
28
127

90,5
133,4
54,1
67,8
56,2

60
120
41
34
42

168
22
23

90,9
38,9
39,7
33,2

84
30
26.
25

no

20
23

25
1S

39,9
42,5

54,7
24,7

37
33

48
17

12,0
2,6
3,2
7,3
2,8
6,0
4,4
4,4
4,9
1,0

40
30
58
47

43
39
72
37
645

33,2
78,5
46,7
61,6
106,1

29,3
54,0
30,9
74,1
85,2

191,1
24,6
24,4
120,2
27,6
20,0
31,3
40.7
66,2
12,3
8,3
20,0
31,3
47,1
26,6
69,4

290

4
29
56
23
118

225
47
5
62
97
30
78
7
49
10
15
76
56

29
53
40
27

24
34
24
25

8
2
2
6
2
4
3
5
4
1
1
2
5
3
2
4

566

59

273
1,089

1979s

24
12
26
30
70
6
6
20
32
37
15
31

1,4
3,9
5,4
3,3
3,3
5,6

N ota: L os aos acadmicos corresponden a las ediciones de postrado de psicologa de 1975-1976,1981-1982, y 1994
respectivamente.
Fuente: Stoup y Benjamn (1982).
Fuente: Norcross, J. C., Hanych, J. M-, &Terranova, R. D. (1996), tab. 7. Postgrado de Psicologa: 1992-1993. P s ic lo
g o A m e ric a n o [A m erica n P s y ch o lo g ist), 51, 631-643. Copyright 1996, por la A sociacin Americana de Psicologa
[American Psychological Association]. Reimpreso con autorizacin.

Resumen
La media es un promedio comn, es decir, la suma de las observaciones dividida por la cantidad
de ellas. Expresado en smbolos, M - I XIN.
Otras formas alternativas menos comunes de descripcin de la tendencia central de una distri
bucin son la moda (el valor ms comn) y la mediana (el valor del registro medio despus de or
denar todas las observaciones de menor a mayor).
La variacin de un grupo de observaciones puede ser descripta a travs de la varanza, es de
cir, el promedio de los desvos cuadrticos de cada observacin con respecto a la media. Expresa
do en smbolos; SD2 =Z(X - M)2/N. La suma de los desvos cuadrticos tambin se simboliza
como SS. Por lo tanto SD2 = SS/N,
El desvo estndar es la raz cuadrada de la varianza. Expresado en smbolos: SD = "VSD2.
Para explicarlo en forma ms clara, es aproximadamente el promedio de las diferencias entre las
observaciones y la media.
Una puntuacin Z indica a cuntos desvos estndar por encima o por debajo de la media se
encuentra una puntuacin bruta. Entre otras cosas, las puntuaciones Z sirven para comparar ob
servaciones de variables que tienen diferentes escalas.
Siempre ha habido psiclogos que advirtieron los riesgos que implica el uso de la metodolo
ga estadstica, ya que en el proceso.de resumir los datos en un promedio se pierde informacin
sobre cada caso individual.
Las publicaciones cientficas generalmente hacen referencia a la media y al desvo estndar,
tanto en el texto como en las tablas. En cambio, rara vez se refieren a la varianza y a las puntua
ciones Z.

Trminos clave
- Tendencia central.
- Frmulas de clculo.
- Frmulas de definicin.
- Desvo.
- Media (M).
- Mediana.

- Moda.
- N.
- Puntuaciones brutas.
- Desvo cuadrtico.
- Desvo estndar (SD).
- Puntuaciones estndar.

Ejercicios
Los ejercicios implican la realizacin de
clculos (con la ayuda de una calculadora). La
mayora de los problemas estadsticos reales
se resuelven por computadora, pero aunque
exista la posibilidad de utilizar una computa
dora, es conveniente realizar estos ejercicios
manualmente para incorporar el mtodo de
trabajo.

- Suma de cuadrados (SS).


- Varianza (SD2).
- Puntuaciones Z.
-Z.

Para adquirir prctica en la utilizacin de


una computadora, para resolver problemas es
tadsticos, se puede utilizar la seccin de com
putacin de cada captulo, publicada en la Gua
de estudio y libro de tareas de computacin pa
ra el alumno [Students Study Guide and Com
puter Workbook] que acompaa este libro.
Todos los datos de esta seccin son ficti
cios (a menos que se especifique lo contrario).
Las respuestas a los ejercicios de la serie I
se encuentran al final del libro.

SERIE I
1. Para cada serie de observaciones deter
mine lo siguiente (muestre ios pasos a seguir):
a) media, b) mediana, c) SS (suma de cuadra
dos), d) varianza y e) desvo estndar.
Serie A: 32,28,24,28,28,31,35,29,26.
Serie B: 6 ,1 ,4 ,2 ,3 ,4 ,6 ,6 .
2. El 26 de diciembre, en Montreal, la
temperatura, medida en 10 oportunidades
elegidas al azar y en grados Celsius, fue de 5, -4, -1, -1,0, -8, -5, -9, -13, y -24. Describa
la temperatura tpica y la variacin de la tem
peratura a una persona que nunca ha asistido
a un curso de estadstica. Presente tres mane
ras diferentes de describir la temperatura t
pica y dos formas de describir a variacin,
explicando las diferencias entre ellas y cmo
fueron calculadas. (Aprender ms si intenta
escribir primero su propia respuesta, antes de
leer la nuestra. Su propia respuesta no nece
sariamente debe ser tan completa como la
respuesta modelo del libro), ;
3. Se realiza un estudio sobre la cantidad
de sueos narrados por 30 personas en psicote
rapia, durante un perodo de dos semanas. En
una publicacin que describe los resultados,
los autores informan: La cantidad media de
sueos fue 6,84 (SD ~ 3,18). Explique el sig
nificado del enunciado anterior a una persona
que nunca ha asistido a un curso de estadstica.
4. En una medicin de angustia, la media es
79 y el desvo estndar es 12. Cules son las
puntuaciones Z correspondientes a cada una de
las siguientes puntuaciones brutas? a) 81, b) 68,
c) 103.
5. En una prueba de inteligencia en par
ticular, la cantidad media de tems correctos es
231, y el desvo estndar 41. Cules son las
puntuaciones brutas en esta prueba para perso
nas con ci (Cociente intelectual) de a) 107, b) 83
y c) 100? (El a es igual a 100, ms 16 multipli
cado por la puntuacin Z. La medida de los ci
es 100 y el desvo estndar 16.) (Nota: para re
solver este problema, primero calcule la pun
tuacin Z correspondiente a cada ci; luego uti

lice esa puntuacin Z para calcular la puntua


cin bruta).
6.
Seis meses despus de divorciarse, ca
da uno de los ex esposos de una pareja realiza
una prueba para medir su adaptacin ai di
vorcio. El registro de la esposa es 63 y ei del
esposo 59. Por lo general, la media para mu
jeres divorciadas que realizan esta prueba es
60 (SD - 6); la media para hombres divorcia
dos es 55 (SD = 4). Cul de los dos se ha
adaptado mejor al divorcio en relacin con
otras personas divorciadas del mismo sexo?
Explique su respuesta a una persona que nun
ca ha asistido a un curso de estadstica.
S E R IE

II

1. Defina media, mediana y moda. Cite un


caso en el que la mediana sera la medida pre
ferida de la tendencia central.
2. Para cada serie de observaciones deter
mine lo siguiente (muestre los pasos a seguir):
a) media, b) mediana, c) SS (suma de cuadra
dos), d) varianza y e) desvo estndar.
Serie A; 2 ,2 ,0 ,5 ,1 ,4 ,1 ,3 ,0 ,0 ,1 ,4 ,4 ,0 ,1 ,4 ,
3 ,4 ,2 ,1 ,0
Serie B: 1.112, 1.245, 1.361, 1.372, 1.472
Serie C: 3,0,3,4,2,6,3,3,3,5,3,2
3. Un psiclogo interesado en el com por-.
tamiento poltico midi los pies cuadrados de.
los escritorios de los despachos de cuatro go
bernadores de los Estados Unidos de Nortea
mrica y de cuatro ejecutivos de alto nivel de
importantes corporaciones norteamericanas.
Las cifras correspondientes a los gobernadores
eran 44,36,52 y 40, Las cifras correspondien
tes a los ejecutivos eran 32,60,48 y 36. Calcu
le la media y el desvo estndar de los
gobernadores y de los ejecutivos, y explique su
clculo a una persona que nunca ha asistido a .
un curso de estadstica. Observe tambin de
qu forma difieren las medias y los desvos es
tndar e intente explicar el significado de esas
diferencias, suponiendo que estos casos repre
sentan a ios gobernadores y a los ejecutivos de
grandes corporaciones de los Estados Unidos
de Norteamrica en general.

4. Un estudio mide ia cantidad de das


que 216 empleados de una gran empresa fal
taron a su trabajo durante el ao anterior a la
medicin. Como parte de los resultados el in
vestigador informa lo siguiente: La cantidad
de das de ausentismo durante el ao anterior
{M - 9,21; SD ~ 7,34) fue... Explique la infor
macin contenida entre parntesis a una persona
que nunca ha asistido a un curso de estadstica.
5. En una medicin estndar de capacidad
auditiva, la media es 300 y el desvo estndar
es 20. a) Calcule las puntuaciones Z de las per
sonas que presentaron registros de 340, 310 y
260. b) Calcule las puntuaciones brutas de

aquellas personas cuyas puntuaciones 2, en es


ta prueba, fueron 2,4,1,5,0 y -4,5.
6.
La puntuacin de una persona en una
prueba de aptitud verbal es de 81, y de 6,4 en
una prueba de aptitud numrica. En el caso de
la prueba de aptitud verbal, la media para las
personas en general es 50 y el desvo estndar
es 20. En el caso de la prueba de aptitud num
rica, la media para las personas en general es 0
y el desvo estndar es 5. Cul es la mayor ap
titud de esta persona, la verbal o la numrica?
Explique su respuesta a una persona que nunca
ha asistido a un curso de estadstica.

APNDICE DEL CAPTULO: FRMULAS DE CLCULO OPTATIVAS DE


LA VARIANZA Y EL DESVO ESTNDAR
Se han desarrollado formas alternativas pero matemticamente equivalentes a las frmulas de
varianza y desvo estndar con el fin de facilitar los clculos cuando se realizan a mano, tal co
mo era necesario antes de la invencin de la computadora o de la calculadora con funcin para el
clculo del desvo.
Como mencionamos anteriormente, sta es la frmula de definicin para el clculo de la
varianza:
oD

2 _ Z (X -M )2

: SS

N
N
Es muy tedioso realizar este clculo a mano, ya que primero deberamos calcular el desvo de ca
da caso. Sin embargo, el numerador de esta ecuacin, la suma de cuadrados, puede manipularse
algebraicamente de modo tal que slo sea necesario utilizar la suma de todas las observaciones
(algo que ya habr sido calculado para encontrar la media) y la suma de los cuadrados de cada ob
servacin real (lo que resulta mucho ms rpido de calcular que tener que encontrar primero cada
desvo y luego elevarlo al cuadrado). Esta frmula alternativa es la siguiente;

S X 2 - ( J , X ) 2/ N

(29)

Observemos que EX2 implica que se eleva al cuadrado cada observacin y luego se suman esos
cuadrados. Por otro lado, (EX)2 implica que primero se suman todas las observaciones y luego se
eleva esa suma al cuadrado.
La frmula de clculo del desvo estndar es la raz cuadrada de la frmula de clculo de la
varianza;
SD =

EX2 ~(XX)2/1V
N

La tabla 2-8 muestra el clculo de la varianza y el desvo estndar de la informacin corres


pondiente a nuestro ejemplo sobre sesiones de terapia, utilizando la frmula de clculo. Compare
este clculo con el que aparece en la tabla 2-2, que se basa en la misma informacin pero utiliza la
frmula de definicin.
Tabla 2.8.
Clculo de la varianza y ei desvo estndar correspondiente al ejemplo sobre sesiones de terapia,
utilizando las frmulas de clculo.
Cantidad de sesiones
(X)

Cantidad de sesiones
al cuadrado
(X2)

49

8
8
7

64
64
49
9

1
6

36

9
3
8

81
9
64
426

2 :6 0

(2 X )W

426

6 0 7 1 0 _ 4 2 6 - 3.600/10 _

SDZ=
N

= V 6 j= 2 ,5 7

10

10

426 - 360 ^

10

66

=6,6

. D escrip cin d e l cap tu lo


Variable independiente o prdictora y
variable dependiente.
Cmo graficar correlaciones: diagrama
de dispersin.
Patrones de correlacin.
Clculo de un ndice del grado d
correlacin lineal: coeficiente
de correlacin de Pearsn;
Integracin de los distintos pasos.
Otros ejemplos.
Prueba de a significacin estadstica
del coeficiente de correlacin./
Cuestiones relacionadas con la
interpretacin del coeficiente de
correlacin.

Controversias y desarrollos recientes: v


qu es una gran correlacin?
Coeficientes de correlacin seguirse >
describen enpublcacjones cientficas.
Resuifien.
"T.-'
.
Trminos clave.
Ejercicios/
Apndice i del captulo: frmula de. : ;
clculo optativa para el .coeficiente de
"correlacin, v :
/yv/i
Apndice II del capitul: prueba de
v hiptesis y su potencia sobre el .
coeficiente de correlacin.

n un estudio realizado recientemente (Aron & Fraley, 1998), 84 alumnos universita


rios, que en el momento del estudio mantenan relaciones amorosas, completaron va
rios cuestionarios. Uno de los cuestionarios era una escala de intimidad (basada en
Siernber, 1986) que inclua tems tales como mantengo una relacin de mutuo en
tendimiento con mi pareja y recibo considerable contencin emocional de mi pare
ja". Otro cuestionario era una escala de idealizacin (basada en Murray, 1998) que preguntaba a
los alumnos cmo calificaban a sus parejas en cuanto a ingenio y ocurrencia, inteligencia,
seguridad en s mismo, y as sucesivamente. Investigaciones previas haban mostrado que la es
cala de idealizacin indica en qu medida un individuo percibe que su pareja posee esas caracte
rsticas positivas independientemente del grado en que su pareja realmente las posea (segn
las medidas obtenidas a travs del informe propio de la pareja en cuestin).
Uno de los resultados del estudio fue que cunto mayor era la intimidad que un individuo
crea tener con su pareja, ms la idealizaba. Es decir, en general, los estudiantes que presentaban
registros altos en la escala de intimidad tambin presentaban registros altos en la de idealizacin.
Los estudiantes que presentaban registros bajos en la escala de intimidad tendan a presentar re
gistros bajos en la escala de idealizacin.
Tambin podemos observar este patrn visuamente, La figura 3-1 muestra el grfico de ios
resultados arrojados por el estudio. Los valores de la escala de idealizacin se encuentran en el eje
vertical; los valores de la escala de intimidad se encuentran en el eje horizontal. Ambos valores
observados en cada estudiante se representa con un punto. El patrn general muestra que los pun
tos se ubican desde el ngulo inferior izquierdo hacia el ngulo superior derecho. Es decir, los va

lores bajos en una variable en general coinciden con valores bajos en la otra variable, y los valores
altos con los altos. Si bien el patrn est lejos de reflejar una coincidencia uno a uno, puede obser
varse una clara tendencia general.
Este patrn de valores altos en una variable que coinciden con los valores altos en la
otra variable, y bajos que coinciden con bajos, y moderados con moderados, es un ejemplo de
correlacin.
Existen innumerables ejemplos de correlacin: en el caso de los nios, existe correlacin en
tre la edad y la capacidad de coordinacin; con respecto a los estudiantes, generalmente supone
mos que existe correlacin entre la cantidad de tiempo de estudio y la cantidad aprendida; en
cuanto al mercado, usualmente suponemos que existe correlacin entre precio y calidad, que los
precios elevados coinciden con la buena calidad y los precios bajos con la mala calidad.
Este captulo explora la naturaleza de la correlacin, la forma de describirla grficamente, los
diferentes tipos de correlacin, la forma de calcular el coeficiente de correlacin (una medida del
grado de correlacin) y otros temas relacionados con la interpretacin de un coeficiente de corre
lacin. En el captulo 4 tratamos el modo en que se utiliza la correlacin para predecir el valor de
una persona con respecto a una variable basndonos en e valor de esa persona en relacin con
otra variable (por ejemplo, predecir las calificaciones de una persona en la facultad sobre la base
de sus calificaciones en la escuela secundaria). Al abordar los temas de la correlacin y de la pre
diccin, pasamos de la estadstica que trata una sola variable (captulos 1 y 2) a la estadstica refe
rida a la relacin entre dos o ms variable.

VARIABLES INDEPENDIENTES O PREDICTORAS


Y VARIABLES DEPENDIENTES__________________________________________
Sin embargo, antes de dedicamos al tema de la correlacin es necesario presentar algunos trmi
nos importantes. Al estudiar la relacin entre dos variables, frecuentemente pensamos en una va
riable como la causa y en la otra variable como el efecto. Por ejemplo, podramos considerar a
la intimidad como causa de la idealizacin. La variable considerada causa se denomina variable
independiente, y la considerada efecto se denomina variable dependiente. (La variable depen
diente se denomina as porque su valor depende del valor de la variable independiente. La varia
ble independiente, por el contrario, se denomina de ese modo porque su valor no depende de la
variable dependiente. En este pequeo mundo formado por slo dos variables, en el que una es
la causa de la otra, una es independiente y la otra es dependiente de la primera). En nuestro
ejemplo, la intimidad (causa) sera la variable independiente y la idealizacin (efecto) la varia
ble dependiente.
Sin embargo, tanto en el ejemplo mencionado como en muchos casos en psicologa, es posi
ble invertir la variable considerada causa y la variable considerada efecto. Fuera del laboratorio
de pruebas, idealizar a nuestra pareja, por ejemplo, podra hacemos sentir que la relacin es nti
ma, del mismo modo en que el hecho de sentir que la relacin es ntima podra hacemos idealizar
a nuestra pareja. La principal excepcin aparece en experimentos reales, en los que el experimen
tador controla el nivel de la variable independiente; por ejemplo, asignando personas de manera
aleatoria a diferentes niveles de esa variable (vase apndice A).
Muchas veces a los investigadores no les agrada utilizar los trminos variable independien
te y variable dependiente en estudios en los que dos variables se miden, simplemente, tal como
se manifiestan en un grupo de personas (como ocurre en nuestro ejemplo de intimidad e idealiza
cin). Sin embargo, aun cuando no podamos determinar con certeza cul es la causa y cul el
efecto, es posible utilizar el conocimiento sobre una variable para predecir los valores corrspon-

dientes a la otra variable. Por ejemplo, segn los hallazgos realizados en el estudio sobre intimi
dad e idealizacin, es razonable llegar a la conclusin de que es probable que las personas que
sienten una relacin especialmente ntima con sus parejas tambin las idealicen de una forma es
pecial. En ese caso, estamos utilizando la intimidad para predecir la idealizacin. No importa
realmente cul es la causa o efecto subyacente, siempre que intimidad e idealizacin estn firme
mente relacionadas.
Por lo tanto, al analizar dos variables relacionadas, algunos investigadores prefieren llamar a
aquella a partir de la cual realizan la prediccin, variable predictora. Sin embargo, la otra varia
ble generalmente contina denominndose variable dependiente, (El trmino adecuado para la
variable predicha es variable de criterio, pero este trmino rara vez se utiliza en psicologa, ex
cepto en algunos textos sobre estadstica). Segn lo acostumbrado, en nuestro libro generalmente
nos referiremos a una de las dos variables correlacionadas como la variable predictora, y a la otra
como la variable dependiente.
Ms adelante, en este mismo captulo, profundizaremos el tema de la causalidad, y en el cap
tulo 4 veremos exclusivamente la prediccin. Presentamos estos temas ahora en forma concisa,
porque al estudiar la correlacin es til poder emplear los nombres de las dos variables que se co
rrelacionan, y los nombres que hemos dado son los nombres convencionales. De hecho, es fre
cuente que en el campo de la psicologa lo que nos interese sea slo el grado en el que dos
variables se relacionan. Probablemente no sea necesario dar a una variable ninguna condicin es
pecial como causa de la otra o como base para realizar predicciones sobre la otra. Sin embargo, a
menudo los psiclogos se ven forzados a realizar tales distinciones aunque tengan que hacerlo en
forma arbitraria, simplemente para cumplir los estndares establecidos para la creacin de grfi
cos (como veremos muy pronto), Lo mismo sucede con la correlacin mltiple, que es ms com
pleja y que trataremos en el captulo 4.

CMO GRAFICAR CORRELACIONES: DIAGRAMA DE DISPERSIN


La figura 3-1 representa la correlacin entre intimidad e idealizacin: es un ejemplo de diagrama
de dispersin. Un diagrama de dispersin permite observar a simple vista el grado y el patrn de
relacin entre las dos variables.

Cmo confeccionar un diagrama de dispersin


La creacin de un diagrama de dispersin puede dividirse en tres pasos:
1. Dibujar los ejes y determinar qu variable se representa en cada uno de ellos. La variable
independiente o predictora se ubica en el eje horizontal, la variable dependiente en el vertical. En
la figura 3-1 ubicamos la variable intimidad en el eje horizontal y la variable idealizacin en el
vertical. Lo hicimos de ese modo porque en el estudio estbamos interesados en observar si el
grado de intimidad podra ser causa del grado de idealizacin.
2. Determinar la serie de valores que se van a utilizar para cada variable y marcarla en los
ejes. Los nmeros deben ir ascendiendo en cada eje, a partir del punto en el que los dos ejes se
cortan. Comnmente, comenzamos con el valor 0 con el menor valor que pueda tener la medi
da, y ascendemos gradualmente hasta llegar al mayor valor posible de esa medida. Cuando no
exista un valor mnimo o mximo posible, que sea evidente o razonable, comenzamos o termina
mos la serie con el valor mnimo o mximo presentado comnmente por las personas que confor
man el grupo de inters para el estudio. (Por otro lado, a diferencia del tipo de grficos descriptos
en el captulo 1, un diagrama de dispersin no se dibuja siguiendo la relacin de 1,5 a 1 para el an-

Figura

3 - 1 . D iagram a de dispersin que m uestra la co rrelacin entre intim idad e id e a liz a c i n d e 85 alum
n o s universitarios al describir sus actuales r ela cio n es am orosas. (Fuente: A ron & Fraley, 1998),

cho y para la altura respectivamente. Los diagramas de dispersin son cuadrados, con una rela
cin 1 a 1 para los ejes horizontales y verticales).
En la figura 3-1, el eje horizontal comienza con el valor 1 (el menor puntaje posible en la es
cala de intimidad, que es un promedio de varias preguntas contestadas cada una de ellas con refe
rencia a una escala del 1 al 9). El eje vertical comienza con 19, que es la menor puntuacin
posible de la escala de idealizacin (esta escala incluye 19 tems, clasificados del 1 al 9. El punta
je total de la escala es la suma de los 19 tems). El valor ms alto en el eje horizontal es 9,0, la m
xima puntuacin posible en la escala de intimidad. El valor ms alto en el eje vertical es 171, la
mayor puntuacin posible en la escala de idealizacin.
3,
Marcar un punto por el par de observaciones de cada persona. Ubicar el lugar en el eje ho
rizontal que corresponde al valor observado de la persona en la variable predictora, Luego mover
se haca arriba hasta llegar a la altura en el eje vertical que corresponde al valor observado de la
misma persona con respecto a esa variable, y marcar un punto bien claro.
Si en un mismo lugar coinciden dos casos, se puede escribir el nmero 2 en ese lugar o mar
car un segundo punto lo ms cerca posible del primero, si es posible tocndolo, pero dejando en
claro que en realidad hay 2 puntos en el mismo lugar.
Ejemplo
Supongamos que una empresa est pensando aumentar la cantidad de personal bajo el mando de
cada uno de sus gerentes de piso. Sin embargo, la empresa est preocupada por el estrs que sto

podra provocar a sus gerentes. La empresa supone que cuantas ms personas supervise un geren
te, mayor ser el estrs sufrido por l. Para analizar la situacin, un psiclogo laboral sugiere es
tudiar a cinco gerentes seleccionados al azar de entre todos los gerentes de piso de la empresa.
(En la prctica, debera utilizarse un grupo mucho mayor, pero aqu utilizaremos slo cinco casos
para simplificar el ejemplo). Se entrega a cada uno de los cinco gerentes un cuestionario de medi
cin de estrs en el cual los posibles registros van de 0 (estrs nulo) a 10 (estrs extremo). Los re
sultados podran ser como los que indica la tabla 3-1.
1. Dibujar los ejes y determinar qu variable representa cada uno de ellos. La empresa est in
teresada en el efecto causado en el nivel de estrs por la cantidad de empleados supervisados. Por
lo tanto, consideramos la cantidad de empleados supervisados como la variable predictora y ubi
camos esa informacin en el eje horizontal; el nivel de estrs es la variable dependiente y, por lo
tanto, debe ubicarse en el eje vertical. (Vase figura 3-2a).
2. Determinar la serie de valores que se van a utilizar para cada variable y marcarla en los
ejes. Para el eje horizontal, supongamos que en esta empresa no se permite a ningn gerente su
pervisar ms de 12 empleados. Por lo tanto, el eje horizontal va de 0 a 12. Eeje vertical va de 0 a
10, que son los lmites del cuestionario de medicin de estrs. (Vase figura 3-2b).
3. Marcar un punto por el par de observaciones de cada persona. En el caso del primer geren
te, la cantidad de empleados supervisados es . Localizamos el nmero en el eje horizontal.
Luego, subimos hasta alcanzar el nivel del nmero 7 en el eje vertical (el nivel de estrs del pri
mer gerente). Marcamos un punto en ese lugar (vase figura 3-2c). Seguimos el mismo procedi
miento con cada uno de ios cuatro gerentes restantes. El resultado debera ser el que muestra la
figura 3-2d.

PATRONES DE CORRELACIN
Hasta ahora hemos considerado aquellas situaciones en las que los valores altos coinciden con los
altos, los bajos con los bajos y los medianos con los medianos. A ese tipo de situacin se la deno
mina correlacin positiva. Debido a que el patrn que muestra el diagrama de dispersin se
aproxima a una lnea recta, es tambin un ejemplo de correlacin lineal.
Por ejemplo, en el diagrama de dispersin de la figura 3-1 se podra dibujar una recta que
muestre la tendencia general de los puntos, tal como lo hemos hecho en la figura 3-3. Del mismo
modo, se podra dibujar una recta en nuestro segundo ejemplo, como lo muestra la figura 3-4.
(Una de las razones por las que estos casos de correlaciones lineales se denominan positivas se
debe a que, en geometra, la pendiente de una recta es positiva cuando observarnos que la recta se
eleva a medida que desplazamos nuestra mirada desde la izquierda hacia la derecha del grfico.
En el captulo 4, aprenderemos reglas precisas para trazar tales rectas y determinar su pendiente).

T a b la 3 - 1 .
E m p l e a d o s s u p e r v i s a d o s y n iv e l d e e s t r s ( d a t o s f i c t i c io s ) .

E m p ic a d o s su p e r v isa d o s

N iv el d e e str s seg n c u estio n a rio

6
8

8
i

10

. $

, (^tidadde em|Me^ipryi$d<. .

io' ' ;

;;':,;0 V v V .;'2 ;;' :3

\:>lM';7vS

4-

5 6 7

8 9 10, II' 2 ' ..

:M ';-''\.V:;VCJantdd<ie'empleados soperrados.:

/. 0
' / '

3 4 / 5," 6

Q & } ;^

Can'Hilad d lic ^ ^ p le d p .4 ^ p ^ sa d p K V x ,1,' , ; " v ; ?

F ig u r a 3 -2 , C m o hacer un diagram a de dispersin , (a) S e determ inan los e je s, la variable pred ictora (e m
p le a d o s su p erv isa d o s) se ub ica en e l e je horizontal y la variable d ep en d ien te (n iv el d e estrs) en. e l e je verti
cal. (b ) S e m arca la serie v a lo res so b re lo s ejes, (c ) S e m arca el pu nto determ inad o por e l par d e valores
o b serv a d o s co rresp o n d ien tes al prim er gerente, (d ) S e m arca un punto d on d e s e cruza p or cad a par d e v a lo
res o b serv a d o s d e lo s c in c o gerentes.

Correlaciones negativas
A veces, la relacin entre las variables no es positiva. Por el contrario, los valores altos coinciden
con ios bajos y los bajos con los altos. A esto se denomina correlacin negativa. Por ejemplo, en
un estudio de las relaciones amorosas entre estudiantes (Aron & Fraley, 1998), ios investigadores
descubrieron que cuanto ms lejos de su pareja vive una persona (en funcin de los minutos de
viaje), menos cantidad de actividades comparte con su pareja. El diagrama de dispersin de la fi
gura 3-5 representa grficamente este patrn de correlacin.
Incluimos una recta en la figura para remarcar la tendencia general de los puntos; as, podemos
observar que a medida que la recta avanza hacia la derecha, tambin se dirige hacia abajo. Es de
cir. cuantas ms son las horas de viaje, menos actividades se realizan en pareja.

F ig u r a 3 -3 . D iagram a d e d isp ersi n de la figura 3-1 c o n un a recta q u e in d ica la ten d en cia general. (F u e n te :
A ron & Fraley, 19 9 8 ).

F ig u r a 3 -4 . D iagram a d e d isp e r si n d e la
figura 3 -2 d c o n una recta qu e in d ica la tend en
c ia general.

Una investigacin realizada por Bardsley y Rhodes (1996), dos psiclogos especializados en
organizaciones empresariales, ilustra tambin una correlacin negativa. A travs de un estudio
realizado con 174 obreros, descubrieron que el hecho de llegar tarde a trabajar tena una corre
lacin lineal negativa con la satisfaccin laboral. Cuanto mayor era el grado de satisfaccin la-

F ig u r a 3 -5 . D ia g ra m a de d isp ersi n c o n una recta q u e in d ic a la ten d en cia gen eral d e una correlacin n e g a
tiva entre d o s variables: d ista n cia en m in u to s d e v ia je y cantid ad d e activid ad es d iferen tes q u e e l p artici
pante realiza co n su pareja. (F u e n te : A ron & F raley, 1 9 9 8 ).

boral de los obreros, menos frecuentemente llegaban tarde. En otras palabras, cuanto menor era
el nivel de satisfaccin de los obreros, con ms frecuencia llegaban tarde a trabajar.

Correlaciones curvilneas
En algunos casos, la relacin entre dos variables no sigue una lnea recta positiva o negativa, sino
un patrn ms complejo denominado correlacin curvilnea. Por ejemplo, se sabe que hasta de
terminado nivel, una mayor ansiedad fisiolgica hace que uno se desempee mejor en cualquier
tarea (como por ejemplo, una prueba de matemtica). A partir de ese nivel, una mayor ansiedad
fisiolgica hace que el rendimiento empeore. Es decir, desde estar casi dormido hasta un nivel
moderado de ansiedad, la efectividad aumenta. Al superar ese nivel moderado, el aumento de la
ansiedad puede acelerar demasiado a un individuo, impidindole tener un buen rendimiento.
Este patrn curvilneo en particular est representado en la figura 3-6, en donde se observa que
sera imposible dibujar una lnea recta para describirlo. La figura 3-7 muestra algunos otros ejem
plos de relaciones curvilneas.
A travs del mtodo usual de clculo de la correlacin (mtodo que aprenderemos en este ca
ptulo) obtenemos el grado de correlacin lineal. Si el verdadero patrn de asociacin es curvil
neo, calcular la correlacin con el mtodo usual podra dar como resultado muy poca correlacin
o una correlacin nula. Por eso es muy importante observar los diagramas de dispersin para des
cubrir estas relaciones ms interesantes, antes de realizar correlaciones automticamente con el
mtodo usual, suponiendo que la tnica relacin posible sea una lnea recta.

F ig u r a 3 -6 . E jem p lo d e relacin
curvilnea: d e sem p e a en una tarea
y ansiedad.

ci n de d g ito s p o r sm b o lo s y m o tiv a ci n en nios,

Correlacin nula
Tambin es posible que no exista ningn tipo de relacin entre dos variables. Por ejemplo, si hi
ciramos un anlisis entre la creatividad y el numero de calzado, los resultados podran ser simi
lares a los que muestra la figura 3-8. Los puntos se dispersan en todas las direcciones, y no existe
lnea recta ni de ningn otro tipo que pueda considerarse indicio razonable de una tendencia. Esto
simplemente es una correlacin nula.
En investigaciones reales, algunas veces existe una relacin entre dos variables, pero al no ser
muy fuerte, es difcil notarla en un diagrama de dispersin. Esto suele suceder especialmente en
anlisis en los que se estudia a una gran cantidad de personas y la relacin entre las dos variables
es muy leve o subliminal. En esos casos, uno podra estar seguro de que la relacin es ms que
una coincidencia, justamente debido a su leve pero consistente presencia en un grupo tan grande
de personas. La figura 3-9 muestra un diagrama de dispersin con una leve correlacin lineal po
sitiva entre dos variables. Es posible observarla?
F ig u r a 3 -8 . D o s variab les sin a so c ia c i n entre s, cre
atividad y n m ero d e ca lza d o (d a to s fic ticio s).

F ig u r a 3 -9 . D iagram a de
dispersin en e l que se en
contr un a le v e co rrela
c i n lin e a l p o sitiv a entre
las d o s variab les.

CLCULO DE UN NDICE DEL GRADO


DE CORRELACIN LINEAL:
COEFICIENTE DE CORRELACIN DE PEARSON
Al observar un diagrama de dispersin obtenemos un indicio aproximado del tipo y grado de rela
cin entre dos variables. Sin embargo, observar el grfico no es un mtodo muy preciso. Es nece
sario obtener un nmero que represente el grado exacto de correlacin.

Grado de correlacin
El grado de correlacin indica en qu medida existe un patrn claro de alguna relacin en par
ticular entre dos variables. Por ejemplo, vimos que existe una correlacin lineal positiva cuan
do los valores altos coinciden con los valores altos, los medios con los medios y los bajos con
los bajos. Por lo tanto, el grado de una correlacin de este tipo determina cuntos valores altos
coinciden con otros tambin altos, y as sucesivamente. Del mismo modo, el grado de correla
cin lineal negativa indica cuntos valores altos de una variable coinciden con valores bajos de
la otra, y as sucesivamente. En cuanto a los diagramas de dispersin, un alto grado de correla
cin lineal significa que todos los puntos se encuentran muy cerca de una lnea recta (la recta
que se inclina hacia arriba o hacia abajo segn la correlacin lineal sea positiva o negativa).
Una correlacin lineal perfecta es aquella en la que todos los puntos estn ubicados exactamen
te sobre la lnea recta.

Determinacin del grado de correlacin lineal


Lo primero que necesitamos para determinar el grado de correlacin lineal es alguna forma de
medir qu es un valor alto o bajo, y en qu medida es alto o bajo un determinado valor alto o bajo.
(Otro mtodo, descripo en el captulo 4, consiste en determinar la distancia entre cada punto y la
lnea). El mtodo aqu propuesto implica comparar valores de diferentes variables en forma cohe
rente. Como vimos en el captulo 2, la mejor forma de resolver el problema de comparar manza
nas con naranjas es a travs de las puntuaciones Z.
A modo de revisin, una puntuacin Z es la-cantidad de desvos estndar a los que se encuen
tra una observacin de la media. No importa la escala con la cual se haya realizado la medicin; si
uno convierte las puntuaciones originales en puntuaciones Z, el efecto es el mismo. Una puntua
cin original alta (es decir, que se encuentra por encima de la media de los otros valores de la va
riable) siempre tendr una puntuacin Z positiva, y una puntuacin original baja (por debajo de la
media) siempre tendr una puntuacin Z negativa. Ms an, cualquiera sea la medida usada en
particular, las puntuaciones Z brindan un indicio estndar de cun alta o baja es cada puntuacin.
Por ejemplo, una puntuacin Z de 1 est siempre exactamente 1 desvo estndar por sobre la me
dia, una puntuacin Z de 2 est siempre dos desvos estndar por sobre la media. Las puntuacio
nes Z de una variable son directamente comparables con las puntuaciones Z de otra variable.
Existe otra razn por la cual se utilizan puntuaciones Z para calcular el grado de correlacin,
y est relacionada con lo que sucede si se multiplica un valor de una variable por un valor de la
otra variable, clculo que se denomina producto cruzado. Cuando se utilizan puntuaciones Z, el
clculo se denomina producto cruzado de puntuaciones Z. Si se multiplica una puntuacin Z
alta por una puntuacin Z alta, siempre se obtiene un producto cruzado positivo debido a que,
ms all de qu escala se utilice, los valores que se encuentran por sobre la media (valores altos)
se transforman en puntuaciones Z positivas, y un nmero positivo multiplicado por un nmero
positivo siempre produce un nmero positivo. Ms an, y esto es lo interesante, si se multiplica

una puntuacin Z baja por otra puntuacin Z baja, tambin se obtiene siempre un producto cruza
do positivo debido a que, ms all de qu escala se utilice, los valores que se encuentran por deba
jo de la media (valores bajos) se convierten en puntuaciones Z negativas, y un nmero negativo
multiplicado por un nmero negativo siempre produce un nmero positivo.
Cuando los valores altos de una variable coinciden con los altos de la otra, y los bajos de una
con los bajos de la otra, el producto cruzado de puntuaciones Z siempre ser positivo. Suponga
mos que tomamos toda una distribucin de valores observados y multiplicamos la puntuacin Z
de cada persona en una variable por la puntuacin Z de esa persona en la otra variable. El resulta
do de esta operacin, cuando ios valores altos coinciden con ios altos y los bajos con los bajos, es
que todos los productos resultarn positivos. Si luego sumamos esos productos cruzados de pun
tuaciones Z de todas las personas incluidas en el estudio, que son todos positivos, obtendremos un
gran nmero positivo.
Por otro lado, consideremos lo que sucedera con una correlacin lineal negativa, en la que
los valores altos coinciden con los bajos y los bajos con los altos. En cuanto a las puntuaciones Z,
esto significara multiplicar positivos con negativos y negativos con positivos, y obtendramos to
dos productos cruzados negativos que, sumados, daran como resultado un gran nmero negativo.
Finalmente, supongamos que no existe una correlacin lineal. En esa situacin, en algunos
casos los valores altos de una variable coincidiran con valores altos de la otra variable (y algunos
valores bajos coincidiran con valores bajos), dando como resultado productos cruzados positi
vos. En otros casos, los valores altos de una variable coincidiran con valores bajos de la otra (y
algunos valores bajos coincidiran con valores altos), dando productos cruzados negativos. Al su
mar los productos cruzados de todas las personas incluidas en el estudio, los productos cruzados
positivos y negativos se cancelaran unos a otros, dando un total cercano a 0 .
En cada una de las situaciones arriba mencionadas convertimos todos los valores en puntua
ciones Z, multiplicamos las dos puntuaciones Z de cada persona y sumamos los productos cruza
dos. El resultado es un gran nmero positivo, si existe una correlacin lineal positiva; un gran
nmero negativo, si existe una correlacin lineal negativa, y un nmero cercano a 0, si no existe
correlacin lineal.
Sin embargo, todava no hemos resuelto el problema de determinar el grado de una correla
cin positiva o negativa. Aparentemente, cuanto mayor sea el nmero, mayor ser la correlacin.
Pero a partir de qu nivel se considera que un nmero grande es tal, y qu nmeros grandes no lo
son tanto? No podemos definirlo simplemente por la suma de los productos cruzados, que aumen
ta slo por el hecho de incluir ms participantes en el estudio. (Es decir, un estudio con 100 parti
cipantes presentara una suma mayor de productos cruzados que el mismo estudio con slo 25
participantes).
La solucin a este problema es dividir la suma de productos cruzados de puntuaciones Z por
la cantidad de casos. Es decir, calculamos el promedio de los productos cruzados de puntua
ciones Z, que nunca podr ser mayor a + 1, y que en el caso de ser igual a +1, indicara una corre
lacin perfecta lineal positiva. Por otro lado, el valor mnimo de este promedio es -1, e indicara
una correlacin perfecta lineal negativa. En el caso de que no exista correlacin lineal, el prome
dio de los productos cruzados de puntuaciones Z ser 0.
Generalmente, las correlaciones no son perfectas. En el caso de una correlacin lineal positi
va que no es perfecta, el promedio de los productos cruzados de puntuaciones Z estar entre 0 y
+1. Para decirlo de otro modo, si la tendencia general de las puntuaciones es ascendente y hacia la
derecha, pero no coinciden exactamente con la lnea recta, este nmero estar entre 0 y +1. La
misma regla se aplica para las correlaciones negativas: el nmero estar entre 0 y - 1.

Francis Galton es considerado l invnibr


del clculo estadstico denominado corre
lacin, aunque Kar. Pearson y. otros desa
rrollaron las frmulas. En l captulo 14
(cuadro 14-1) aprenderemos algo sobre
Pearson, y en el captulo 9 (cuadr 9-1) so
bre William S. Gosset, otro importante es
tadstico precursor, inventor de la prueb .
Gosset era alumno y colega de Kari Pear
son. Pearson, a su vez, fue alumno y colega,
de Gal ton (a quien Pearson otorg todo el
crdito por el descubrimiento de la crrela-,
cin). En otras palabras, el mundo de la es
tadstica en ese momento perteneca a un
pequeo y selecto club britnico (vase
cuadro 16-1). De hecho, casi toda la ciencia
en general era una especie de club apenas
ms amplio. Por ejemplo, Galton estaba muy
influenciado tambin por su propio prim,
Charles Darwin.
De todos los miembros de este club,.
Galton era tal vez el ms tpico de su poca,'
un caballero cientfico, excntrico y acau-.
daiado. Adems de su trabajo-en estadsti
ca, posea un ttulo en medicina, explor el ,
Africa oscura, invent anteojos para leer
debajo dl agua, experiment con mapas:
estereoscpicos, incursion en la meteoro- ;
logia y antropologa y escribi un informe
sobre la recepcin de seales inteligibles
desde las estrellas.
Sobre todo, Galton era un contador
compulsivo. Algunos de sus recuentos eran
infames. Una vez, mientras asista a na c
tedra, cont las veces por minuto en que la
audiencia se impacientaba, buscando varia
ciones relacionadas con io aburrido dl te
ma tratado. En dos oportunidades se hizo
retratar y se dedic a contar las pinceladas
que daba el artista por hora, ,llegando a'la

conclusin de que cada retrato requera un


promedio d 20.000 pinceladas. Y mientras
caminaba por las caes de variis ciudades de las Islas Britnicas, claificl belleza
de los habitantes: femehinbs pulsando un
mecanismo de grabacin que llevaba en su. :
bolsillo con el que registraba bueno, re -: .
guiar o malo. . . . / ' /
: '
Sin embargo, el inters que consuma a :
Galton era contar la caritidad. de genios, cri- mnales y otros caracteres tpicos existentes
en las distintas familias. Quera compren
der cmo se produca cada tipo paira quer
a ciencia pudiera mejorar la raza hqmana: La. ;.
finalidad: sera estimular los gobiernos a .
imponer la eitgenesia, es decir, la procrea-v
cin selectiva orientada a.lograr uri mayor; :
nivel de inteligencia, comportamiento mo-ral adecuado y otras cualidades, que serian
deterininadas, por supuesto, por el eiigenis-, ta. (A partir de esa poca, la eugenesia cay en el descrdito)..El concepto de crrela-
cin surgi directaipnte de los 'primeros.y.
sencillos esfuerzos de Galton en. ese. sent-,
do: el estudio de la relacin; entre la altura d . :
los nios y sus padres. .
En realidad, gran parte;de l ciencia
estadstica, o. biometra, como la deno- ..
minaba Galton, surgi como- aplicacin de
la matemtica a temas relacionados con la
biologa y las ciencias sociales. Y de todos
ios clculos estadsticos, la correlacin fue;;,;
una herramienta..especialmente til :para;
estas ciencias en las que, por lo general,; no
podan realizarse experimentos:-riguroso .
tales como; los experimentos d procrea
cin en humanos. Al principio, el mtodo
de Galton para medir la tendencia con que
una cosa ocurra junto con otra pareca
ser casi el mismo que .para probar la causa

de.algo. Por ejemplo, si poda demostrarse


mtmticamente que la .mayora de las
personas'ms brillantes provenan de unas
pocas familias britnicas de alta alcurnia, y
la mayora de las personas numos inteli
gentes provenan de. .las familias., pobres,
: aparentemente se probara, que la inteli
gencia era producto de la herencia de cier
tos genes , (siempre que uno fuera lo
suficientemente prejuicioso como para pa

sar por alto las diferencias en cuanto a


oportunidades.educativas). El msmp/estu~.\
dio podr probar en forma ms convin
cente que si uno era miembro de una de las
;r a e jo i^ -a n ^
-.lstoriailo.
.. convertira.en un excelente ejemplo de la
facilidad con que se malinterpreta el signi
ficado de la correlacin.
/ / , ;
R eferentas:peers'(1987); Tankard {1984),-.:

El coeficiente de correlacin
El promedio de los productos cruzados de puntuaciones Z es, entonces, un excelente modo
de calcular el grado de correlacin lineal. Se lo denomina coeficiente de correlacin. Tam
bin se lo llama coeficiente de correlacin de Pearson (o, para ser muy tradicionales, coefi
ciente de correlacin producto-m om ento de Pearson), Lleva el nombre de Karl Pearson (a
quien presentaremos en el cuadro 4-1). Pearson, junto con Francis Galton (vase cuadro 3-1),
desempe un papel fundamental en el desarrollo del coeficiente de correlacin. El coefi
ciente de correlacin se representa con la letra r, que es la forma abreviada de regresin, un
concepto muy relacionado con la correlacin (que veremos en el captulo 4). Tambin es im
portante saber que en algunas publicaciones cientficas se hace referencia a los coeficientes
de correlacin como correlaciones de orden cero (veremos las razones para este nombre en
el captulo 17).
La figura 3-10 muestra diagramas de dispersin e indica el coeficiente de correlacin de va
rios ejemplos.

F igura 3-10. D iagram as d e d isp ersi n y c o e fic ie n te s d e correlacin d e d iversos e je m p lo s c o n d iferen tes gra
d o s d e co rrela ci n lin eal.

Figura 3-10. {continuacin)

La exposicin precedente puede resumirse en unos pocos smbolos, ia frmala del coeficiente de
correlacin:

r = ,ggx.gx,

(3-1)

N
r es el coeficiente de correlacin, Zx es la puntuacin Z de cada persona en la variable X, Zy es la
puntuacin Z de cada persona en la variable Y. ZxZy es igual al producto Zx por Zy (el producto
cruzado de puntuaciones 2 ) de cada persona, y 2 ZxZy es la suma de los productos cruzados de to
das las personas incluidas en el estudio. N es la cantidad de personas que participan en el estudio.
Uniendo todos los datos, 2ZxZy dividida por V, es el promedio de los productos cruzados de pun
tuaciones 2 .

Pasos que se deben seguir para calcular el coeficiente de correlacin


Los cuatro pasos que se deben seguir para calcular el coeficiente de correlacin son los
siguientes:
.1. Convertir todas las observaciones en puntuaciones Z. Para esto es necesario calcular ia me
dia y el desvo estndar de cada variable y luego la puntuacin Z correspondiente a cada valor ob
servado.
2 . Calcular el producto cruzado de las puntuaciones Z de cada persona. Es decir, por cada per
sona, multiplicar la puntuacin Z en una variable por la puntuacin Z en la otra variable.
3. Sumar todos los productos cruzados de puntuaciones Z.
4. Dividir el resultado por la cantidad de personas que participan en el estudio.

Frmula de definicin versus frmula de clculo para el coeficiente de correlacin


El procedimiento que acabamos de describir, basado en la frmula de definicin, esclarece la
lgica implcita en el clculo del coeficiente de correlacin. Seguir estos pasos en los ejerci
cios que presentamos a continuacin (y en los ejercicios al final del captulo) ayuda a incorpo
rar la lgica mencionada. Sin embargo, para calcular el coeficiente de correlacin en un
estudio real, casi siempre usaramos una computadora. La frmula de clculo que aparece en
el apndice I de este captulo facilitar mucho el trabajo, si alguna vez fuera realmente nece
sario. En un estudio real con muchos registros, calcular un coeficiente de correlacin manual
mente (o con una calculadora).
Ejemplo

Intentemos aplicar los pasos enumerados ai ejemplo del nivel de estrs de los gerentes.
1.
Convertir todas las observaciones en puntuaciones Z. Comenzando con la cantidad de em
pleados supervisados, la media es 7 (la suma, que es igual a 35, dividida por 5 gerentes) y el des
vo estndar es 2,37 (la suma de los desvos cuadrticos, 28, dividida por 5 gerentes, es igual a
una varianza de 5,6, cuya raz cuadrada es 2,37). En el caso del primer gerente, entonces, un valor
observado de 6 es una unidad por debajo de la media 7, y 1 dividido 2,37 es 0,42. Por lo tanto, la
puntuacin Z del primer gerente referido a la cantidad de empleados supervisados se ubica a 0,42
desvos estndares por debajo de la media o, lo que es igual, presenta una puntuacin Z de - 0,42.

Calculamos el resto de las puntuaciones Z del mismo modo y las ordenamos en las columnas co
rrespondientes de la tabla 3-2.
2 . Calcular el producto cruzado de las puntuaciones Z de cada persona. En el caso del primer
gerente, multiplicamos - 0,42 por 0,38: el resultado es -0,16. La ultima columna de la tabla 3-2
muestra los productos cruzados de iodos los gerentes.
3. Sumarlos productos cruzados de puntuaciones Z. Como lo indica la tabla 3-2, el total es 4,38.
4. Dividir el resultado del paso anterior por la cantidad de personas incluidas en el estudio, es
decir, 4,38 dividido 5 (la cantidad de gerentes incluidos en el estudio). El resultado es 0,876. Este
es el coeficiente de correlacin que, redondeado, es igual a 0,88. Aplicando la frmula del coefi
ciente de correlacin,
5 2 ^ 4 3 8
N
5
Dado que el coeficiente de correlacin calculado es positivo y cercano a 1, es decir, el mayor va
lor posible, podemos afirmar que estamos frente a una correlacin lineal fuertemente positiva.

INTEGRACIN DE LOS DISTNTOS PASOS.


OTROS EJEMPLOS
______________________________________________
En general, cuando nos encontramos frente a un problema relacionado con la correlacin, el m
todo adecuado consiste en hacer primero un diagrama de dispersin. Luego, si el diagrama de dis
persin no muestra un patrn curvilneo claro, se procede a calcular el coeficiente de correlacin.
Aun cuando no exista un patrn curvilneo, es conveniente observar un poco ms en detalle el dia
grama de dispersin. La idea es estimar en forma aproximada el grado y la direccin de la corre
lacin lineal, como forma de control en el caso de que haya errores al calcular concretamente ei
coeficiente de correlacin.

T a b la 3 - 2 .
C lc u lo d e l c o e fic ie n te d e c o r r e la c i n p a r a e l e je m p lo d e l n iv e l d e e s t r s d e lo s g e r e n te s
( d a t o s fic tic io s ).

C a n tid a d d e E m p le a d o s S u p e rv isa d o s (X )
X

X -M

-1

3
.10

-4

(X - M f
1

zx

- 0 ,4 2

a 35

SS

=7

SD3 =

5 ,6 0

SD

2 ,3 7

=
*

28

Y -M

1,27

.8 " :

0 ,4 2

'2-

Prod. C ruzados

T -M )2

Zy

0,38

25

S o I B
- 1 ,9 2

: 8 l ; . r .-2 (
1
-5

I--.V-M.; 0 ,4 2 A
16
-1 ,6 9

;V; "3' '

N ivel d e E str s (Y )

ZxZy

- 0 ,1 6
0 ,3 2

3 ,2 4

.. - 4 7 r i ;

2 = 30

SS - 3 4

M = 6

S D * = 6 ,8 0
SD = 2,61

0 ,0 0

0 ,0 0

2 Z x Z r = 4 ,3 8
r

0,88

'

Combinando los distintos procedimientos tratados en este captulo, los pasos a seguir son los siguientes:
1. Construir un diagrama de dispersin.
a ) D ib u ja r l o s e j e s y d e te r m in a r q u v a r ia b le v a e n c a d a u n o d e e llo s .

b) Determinar ia serie de valores que se van a utilizar para cada variable y marcarla en
los ejes.
c) Marcar un punto por el par de observaciones de cada persona.
2. Determinar si el patrn es claramente curvilneo. Si lo es, no se calcula el coeficiente de co
rrelacin (o si se lo calcula, debe tenerse en cuenta que slo se est describiendo el grado
de relacin lineal).
3. Estimar la direccin y el grado de correlacin lineal.
4. Calcular el coeficiente de correlacin.
a) Convertir todas las observaciones en puntuaciones Z.
c) Calcular el producto cruzado de las puntuaciones Z de cada persona.
d) Sumar los productos cruzados de puntuaciones Z.
e) Dividir el resultado por la cantidad de personas incluidas en el estudio.
5. Controlar el signo y el tamao del coeficiente de correlacin calculado, comparndolo con
la estimacin visual realizada a partir del diagrama de dispersin.
Como observamos anteriormente, en una investigacin real el coeficiente de correlacin se
calculara en cuestin de segundos utilizando una computadora. La mayora de ios paquetes de
computacin pueden realizar tambin un diagrama de dispersin (y algunos hasta explican cmo
se establecen sus ejes y escalas). Sin embargo, la finalidad de incluir los ejemplos (y resolver los
ejercicios al final del captulo) y aplicar todos estos pasos bastante tediosos es comprender la l
gica implcita en los resultados que, con tanta facilidad, surgen de la computadora.

Ejemplo
Supongamos que una persona que investiga el funcionamiento de la memoria realiza un experi
mento para comprobar la teora de que la cantidad de exposiciones a una palabra aumenta las pro
babilidades de que sea recordada. Dos individuos son elegidos al azar para observar una lista de
10 palabras una sola vez, otros dos individuos observan la lista dos veces, y as sucesivamente,
hasta llegar a ocho exposiciones de cada palabra, y 16 participantes en total. La tabla 3-3 indica
los resultados de este experimento ficticio. (Un estudio real de este tipo probablemente dara un
resultado ms curvilneo debido a que, en esta clase de investigaciones, cuanto mayor sea la can
tidad de exposiciones, menor ser el aumento relativo de palabras recordadas).
1. Construir un diagrama de dispersin.
a) Trazar los ejes y determinar qu variable deber marcarse en cada uno de ellos. Segn el
diseo del experimento, la cantidad de exposiciones es la variable independiente, por lo
que estar ubicada en el eje horizontal. La cantidad de palabras recordadas es la variable
dependiente, por lo que estar ubicada en el eje vertical (vase figura 3-1 la).
b) Determinar la serie de valores que se van a utilizar para cada variable, y luego marcarla
en los ejes. En el estudio que estamos analizando, la-cantidad de exposiciones vara de 1
a 8, pero comenzaremos con 0 para cumplir con las reglas convencionales. La cantidad
de palabras recordadas no puede ser menor que 0 ni mayor que 10, cantidad total de pa
labras en la lista (vase figura 3-1 Ib).

T a b la 3 - 3 .

Efecto del nmero de exposiciones en la cantidad de palabras recordadas.


Nmero de identificacin

Cantidad de exposiciones

Cantidad de palabras recordadas

c) Marcar los puntos determinados por el par de observaciones de cada persona. El primer
punto se ubica con coordenada 1 segn el eje horizontal, y 4 segn el eje vertical. Mar
cando cada uno de los punios, de este mismo modo, completamos el diagrama de disper
sin (vase figura 3- i 1c).
2. Determinar s el diagrama es claramente curvilneo. Parece existir una fuerte tendencia lineal.
3. Estimar la direccin y el grado de correlacin lineal. Los puntos van hacia arriba y hacia la
derecha, y la mayora de ellos estn ubicados muy cerca de una lnea recta imaginaria. Por
lo tanto, aparentemente se trata de una correlacin lineal positiva bastante fuerte.
4. Calcular el coeficiente de correlacin.
a) Convertir todas las observaciones en puntuaciones Z. La media de la cantidad de exposi
ciones es 4,50, con un desvo estndar de 2,29. Por lo tanto, la primera observacin, que
es igual a I, se ubica 3,5 unidades por debajo de la media, lo que implica 1,53 desvos
estndares debajo de la media, o sea Z = -1,53. Utilizando el mismo procedimiento para
todas las otras observaciones se obtienen las puntuaciones Z que aparecen en las colum
nas correspondientes de la tabla 3-4. (La tabla no indica los pasos para el cmputo del
desvo y del desvo cuadrtico utilizados para calcular el desvo estndar).
b) Calcular el producto cruzado de las puntuaciones Z de cada persona. Por ejemplo, el pri
mer producto cruzado es -1,53 por -0,74, lo que da un resultado de +1,13. Todos los
productos cruzados aparecen en la columna ubicada a la derecha en la tabla 3-4.
c) Sumar los productos cruzados de las puntuaciones Z. El total es 10,80.
d) Dividir el resultado por la cantidad de personas. El resultado de dividir la suma de los
productos cruzados de puntuaciones Z, 10,80, por la cantidad de personas, 16, es 0,68,
que es el coeficiente de correlacin. Es decir, r = 0,68.
5. Controlar el signo y el tamao del coeficiente de correlacin calculado comparndolo con
, la estimacin realizada a partir del diagrama de dispersin. El resultado calculado de +0,68
es, como esperbamos, una correlacin lineal positiva bastante marcada.

C orreteeoa

87

10 '
9

8
7
6

5
*.
.3

2
i-

..... ......................................... ; :

O.. i.' 2 ' .'3

Exposiciones

Exposiciones

(a) '

(b)

.10
.- 9

8'

S B illli!

. " v. . . .'^.::'i

i. - - :

' .-Vivvii

'0 1 2 -3 4-5 6 7 8
.

. Exposiciones. \ \r
"

(c)

y-?'

-S

"vi;"

Figura 3-11. Pasos que se deben seguir para confeccionar un diagrama de dispersin segn ios datos de la
tabla 3-3. (a) Establecer los ejes, la variable independiente (cantidad de exposiciones) en el eje horizontal,
la variable dependiente (cantidad de palabras recordadas) en el eje vertical; (b) determinar la serie de valo
res, y marcarlos en los ejes; (c) ubicar un punto por cada par de observaciones de cada uno de los 16 parti
cipantes (datos ficticios).

Otro Ejemplo
Supongamos que una psicloga educacional averigu la cantidad promedio de alumnos por clase
y los promedios de calificaciones en las pruebas de nivel de cinco escuelas primarias de determi
nado distrito escolar. La tabla 3-5 muestra los datos. La pregunta formulada por la psicloga es:
Cul es la relacin entre estas dos variables?
1. Construir un diagrama de dispersin.
a) Dibujar los ejes y determinar en cul se ubica cada variable. Dado que resulta razonable
pensar que la cantidad de alumnos por clase afecta las calificaciones en las pruebas de
nivel, y no al revs, podemos trazar en la parte inferior el eje correspondiente a la canti
dad de alumnos por clase.

Tabla 3-4.
Clculo d d coeficiente de correlacin del efecto producido por el nmero de exposiciones en la
cantidad de palabras recordadas (datos ficticios).
Id en tifica ci n
d el p a rticip a n te

-,
.

1
2 :
3
4
5

7
8 ;
9
10 V
11
12
13
14
15
16

;
:

1
2
2
3
3
4
4 '
5
5 r .,
6
7
7
8
. .8

Zx

C a n tid a d de p a la b ra s record ad as
(v ariab le d ep en d ien te)

C a n tid a d d e esp o sicio n es


(v a r ia b le in d ep en d ien te)

'

-1 ,5 3
-1 ,5 3
- 2 ,0 9
-1 ,0 9
-0 ,6 5
- 0 ,6 5
- 0 ,2 2
- 0 ,2 2
0 ,2 2
0 ,2 2
0,65
0,65
1,09
1,09
1,53'
1,53

72

M:
4,5 0
S D ~ i % m 6 = 2,29

Zy

- 0 ,7 4
-1 ,2 1
-1 ,2 1
.5
- 0 ,2 6
6
0,21
4
- 0 ,7 4
- 0 ,7 4
4
0,21
... 6

-0 ,2 6
5
0,68
.. ..
7 --,
2
1,68
1,62 ^
. v V - L , 9
0,21

V
- i,i5

. .;..c -L
1,62
9
1,15

.
'.v, . v
. 8;.
4
3.
3

^ 7 2 /1 6

P ro d u cto cru za d o
d e p u n tu a c io n es Z
2xZ y
1,13
1,85
1,32
0 ,2 8
-0 ,1 4
0,48
0 ,1 6
-0 ,0 5
- 0 ,0 6
- ' 0,15 ...-V:
- 1 ,0 9
i ,5
0,23
1,25
2,48
1,76
10,80

89
5.56
2,12

r = 0,68

Determinar la serie de valores que se van a utilizar para cada variable y marcarla en los
ejes. Presumiremos que las calificaciones en las pruebas de nivel van de 0 a 100. La can
tidad de alumnos por clase debe ser por lo menos de 1 (y seguramente la poltica de la
junta escolar exige que sean ms). No conocamos el mximo, as que supusimos que
poda ser 50.
c) Marcar un punto por cada par de observaciones obtenidas de las personas (en este caso,
de las escuelas). La figura 3-12 muestra el diagrama de dispersin completo.
2. Determinar si el diagrama muestra claramente una correlacin curvilnea. En trminos ge
nerales, la correlacin parece mantener un patrn lineal (aunque con tan pocos puntos es
difcil de decir).
b)

Tabla 3-5.
Promedios de cantidad de alumnos por clase y de calificaciones en las pruebas de nivel en cinco
escuelas primarias (datos ficticios).
E scu ela
p rim a ria

T am ao
de la cla se

C alificacin en la p ru eb a
d e ren d im ien to

M ain Street
Casat
Hara ad
Shady Grove
Jefferson

25
14
33
28
20

80
98
50
82
90

Figura 3-12. ltimo paso en la confeccin de un dia


grama de dispersin con la informacin contenida en
la tabla 3-5: se ha dibujado un punto por cada par de
observaciones de las cinco escuelas (datos ficticios),

:'15

SS;--4$43|5ap

3. Estimar la direccin y el grado de correlacin lineal. Los pumos tienen una direccin mar
cada haca abajo y hacia la derecha, indicando una fuerte correlacin lineal negativa.
4. Calcular el coeficiente de correlacin.
a) Convertir todas las observaciones en puntuaciones Z. La media de la cantidad de alum-
nos por case es 24 y el desvo estndar es 6,54. La puntuacin Z de la cantidad de alum
nos de la primera ciase, 25, es igual a (25 - 24)/6,54 - 0,15. Todas las puntuaciones Z
aparecen en la columna correspondiente de la tabla 3-6.
b) Calcular los productos cruzados de las puntuaciones Z de cada persona (en este caso,
de cada escuela). El primer producto cruzado es 0,15 x 0, que es igual a 0. El segundo
es -1,53 x 1,10, que es igual a -1,68. Todos los productos cruzados de las puntuaciones
Z aparecen en a columna de la derecha de la tabla 3-6.
c) Sumar los productos cruzados de las puntuaciones Z. El total es -4,52.
d) Dividir el total por la cantidad de personas (en este caso, escuelas). La suma (-4,52) divi
dida por 5 es igual a -0,90. Es decir, r - -0,90.
5. Controlar el signo y el tamao de coeficiente de correlacin calculado, comparndolo con
la estimacin realizada a partir del diagrama de dispersin. Un coeficiente de 4),90 con
cuerda perfectamente con la estimacin original que indicaba una fuerte correlacin lineal
negativa.
Tabla 3-6.
Clculo del coeficiente de correlacin entre las cantidades promedio de alum nos por case y de
calificaciones en ias pruebas de rendimiento en cinco escuelas prim arias (datos ficticios).
E s c u e la

T a m a o d e la d a s e

M ain Street
Casat
Harland
Shady Grove
Jefferson
2:
M:

Zx

25

0,15
4 ,5 3
1,38
0,61
-0 ,6 1

14
33
28
20
120
24

S D - ^24/5 = 6,5 4

C a lific a c i n e n la p r u e b a
d e r e n d im ie n to
Y

80
98
50
82
90 400
80
T l 328/5 - 16,30

p r o d u cto C ru za d o

Zy

Z*Zr

0,00
u o
-1 ,8 4
0,12
0,61

0 ,0 0
1,68
2,53
0,08
0,38
- 4 0 ,5 2
r = - 0 ,9 0

PRUEBA DE LA SIGNIFICACIN ESTADSTICA


DEL COEFICIENTE DE CORRELACIN
Por s mismo, el coeficiente de correlacin es un estadstico descriptivo. Describe el grado y la di
reccin de la correlacin lineal de determinado grupo de personas analizadas. Sin embargo, cuan
do realizamos una investigacin en el campo de la psicologa, por lo general estamos ms
interesados en una serie de observaciones en cuanto representan a una poblacin mayor que no se
ha analizado directamente. Por ejemplo, el psiclogo laboral entreg los cuestionarios sobre es
trs slo a cinco gerentes de la empresa, pero con la intencin de considerarlos tpicos represen
tantes de los otros gerentes de esa misma empresa. (En la prctica se necesitara un grupo con
muchas ms de cinco personas para lograr ese objetivo. Hemos utilizado cantidades pequeas de
personas en nuestros ejemplos para que sean ms fciles de comprender).
El problema, sin embargo, es que analizando slo algunas de las personas es posible elegir
por casualidad aquellas en las cuales los valores altos coinciden con los altos y los bajos con los
bajos, aun cuando, habiendo estudiado a todas las personas, no hubiera existido correlacin algu
na. Decimos que una correlacin es significativa si no resulta verosmil que hubisemos podido
obtener una correlacin de esa magnitud y si, en realidad, en el grupo completo no hubiera corre
lacin alguna. Especficamente, determinamos si esa verosimilitud es menor que algn bajo gra
do de probabilidad (p), como un 5% un 1%. Si esa verosimilitud es tan baja, decimos que la
correlacin es estadsticamente significativa con p < 0,05 llp < 0 ,01.
El mtodo y la lgica para determinar la significacin estadstica es el tema central de es
te libro a partir del captulo 5. Estaamos adelantando temas si intentramos explicarlos ahora.
De todos modos, para cuando hayamos completado los captulos siguientes, la lgica y los de
talles quedarn bien claros. (El apndice II de este captulo contiene la informacin necesaria
para aplicar estos conocimientos a la correlacin, pero en realidad no ser muy til hasta des
pus de haber completado el captulo 9). Slo mencionamos el tema aqu para dar una idea ge
neral de lo que significa, en caso de que al leer alguna publicacin cientfica que informe sobre
coeficientes de correlacin se haga referencia a la significacin estadstica p < 0,05, o a algu
na frase similar.

1J-'

4 4 Cuadro 3 -2 .

e m u u u , U U 9 U 1 y a . ; x nu a i i u u : i e > i a i H u a t u m u i c L d i i i c m c s t

de que s es grande, es gordo...

El concepto de correlacin no fue inventado


en realidad por los especialistas en estadsti-
ea. Es uno de ios procesos mentales ms b
sicos. Los primeros humanos deben haber
pensado en trminos, de correlaciones todo
el tiempo, al menos aquellos que sobrevi
vieron. Cada vez que nieva, los animales
que cazamos huyen. La nieve es sinnimo

de ausencia de animales. Cuando.vuelva .a


nevar tendremos que seguir a los animales
para no morir de hambre.
-.7, (
De hecho, la correlacin es un proceso.
mental tan tpicamente humano que pare
ceramos tener una organizacin psicolgi
ca tal que nos lleva a encontrar un. grado de
correlacin mayor, que el que en realidad

porque al encontramos por primera Vez cpn .


existe, como ocurra con ios aztecas, quie
experiencias diferentes pensamos ms yen
nes pensaban que ias buenas cosechas esta
ellas, procesndolas ms profundamente,
ban correlacionadas con los sacrificios
de modo que luego son ms fciles de re
humanos (esperemos que hayan estado
cordar (Johnson & Mullen, 1994). S nos .
equivocados!), o como los siguientes ejem
encontramos, por ejemplo, con miembros
plos del proceso denominado correlacin
ilusoria, tomados de. la psicologa social,. . de una minora que no vemos con frecuen
cia, o con actos negativos que .rara vez
Correlacin ilusoria es el trmino que
presenciamos o escuchamos, sin duda de
define la sobresmacin de la intensidad
dicaremos un tiempo a pensar en ellos. (Si .
con la que se relacionan dos variables (tam
los relacionamos en un par, ls analizamos
bin ha tenido otros significados especiales ,
en conjunto y vuelven a ' nuestra, memori;.
en eLpasado). Sin duda, ya deben haber
con mayor rapidez). Precer que tambin :
surgido en la mente, del lector algunas;
.pudiera ocurrir que continuemos procesan-;; correlaciones ilusorias' tnicas, raciales, se
do informacin acerca de grupos, personas .-
xuales relacionadas con ia edad, realmen
te- nocivas. Una fuente de correlacin ; y sus comportamientos, sin tener concin- )I
ilusoria es la tendencia a relacionar dos h a . ci de esos procesos, En lgn punt del.
proceso, o en momento de elaboiar un ji- :
chos poco frecuentes, y por lo tanto, fciles
de recordar. Supongamos que el grupo B s . ci, asociamos tis dlo debido a los gra- pos o personas que no encontramos con V
menos numeroso que el grupo A, y que se
frecuencia con los comportamientos ,poco : ;
sabe que un tercio de las personas de am-:
usuales (negativos) (McConneli, Sherman,
bos grupos comete, espordicamente, algu
. & Hamilton, 1994). .
, '-(;
nas acciones indeseables. En este tipo de
. De todos modos, la mayora de las cq-y.
situaciones, las investigaciones demuestran
rrelaciones ilusorias se 'producen coma:rr )
que el grupo B , a cuyos miembros se los ve
con menor frecuencia, ser en efecto culpasultado de los prejuicios.Los> .pr^uiaosyA
Sonteoras implcitas, y erihsq-hems^
do por muchas, ms acciones n:deseadas :
que el grupo A. Las cosas ocurren de ese: . incorporado. Por ejemplo, consideramos y
que Jemos hallado una mayor confirma-,
modo aun cuando ristah. mayores chances .
de que determinada: accin hayajsdo. c o -..
dn de la relacin entre dos caractersticas
metida por un integrante del grupo A, datio : .: sociales de la que en realidad se desprende
que. tiene ms; miembros. El problema es . de lo observado: habifidad/para; conducir y *
detenninada edad; nivel acadmico y'gnt^:y
que los hechos poco frecuentes se unen en -,
la memoria) Ser miembro del grupo menos' :v.. po tnico spcfico; determind fomia de y: hablar, vestirse o comportannto 1social y ;
numerso, y . ls comportamientos poco
residencia en. alguna
Un;,
frecuentes, forman una correlacin.'iluso
ria. Una consecuencia obvia es que recor
ejemplo muy interesante es que la mayora;
de los empresarios breen qu ef niveide'.s.a- ..
damos cualquier acto fuera de lo comn,
tisfaccin laboral y el1nivel de,desempe - :
llevado a cabo por un miembro de una mi
nora, mucho mejor de lo que recordamos
estn. estrechamente ligdos: cundo, en
cualquier acto fuera de lo comn realizado . ' realidad* la correlacin es bstante .baja, ;:
por un miembro de un grupo mayortario.
Muchas personas a quienes no les gusta su
trabajo pueden de todos modos desemp-- v-,
La correlacin ilusoria que nace' como,
fiarse a la perfeccin, mientras que otras
resultado de la distincin de eventos apareados (la vinculacin mental de dos he- '
muy entusiasmadas con su ocupacin reali-
chos poco .usuales) puede tener lugar ' zan su trabajo con desgano.
. : V ;y.:

Lo importante es 'que l prxima vez - estadstica puedetransformarse en una em-.v


.. que el lector se pregunte por qu est esforpresa romntica, en tanto representa un m o -'
. zndose tanto por aprender estadstica, pue- ;: do de vencer errores maiyados con lapreza ..'.
de resultarle til considerar que ese esfuerzo . de los nmeros, de: someter ios prejuicios. : constituye una bsqueda destinada a lograr
profanos con la honestidad de los datos.; .
, que sus procesos mentales sean ms justos... . Referendas; Hamn (19?1); Hamiltor. y Gifford '
Por ese; motivo, volvms- a afumar que la
.(1976); Johnson and Mullen (1994)..

CUESTIONES RELACIONADAS CON LA INTERPRETACIN


DEL COEFICIENTE DE CORRELACIN________________ _______________________
Un coeficiente de correlacin describe la direccin y el grado de la correlacin lineal entre dos
variables. Sin embargo, al interpretar un coeficiente de correlacin deben tomarse en cuenta algu
nas precauciones sutiles.
Causalidad y correlacin
Si dos variables presentan una correlacin lineal significativa, normalmente suponemos que exis
te algo que las correlaciona. Sin embargo, la direccin de causalidad (justamente, qu es la cau
sa de qu) no puede determinarse solamente a partir de la correlacin. En toda correlacin entre
dos variables X e Y, existen tres posibles direcciones de causalidad: X podra ser la causa de Y, Y la
de L, o algn tercer factor podra ser la causa de ambas, X e Y. Tambin es posible (y a menudo
probable) que exista ms de una direccin de causalidad.
Tomemos el ejemplo del estrs de los gerentes. El estudio comenz con la nocin implcita de
que supervisar un mayor nmero de personas (X) causa un aumento del nivel de estrs (Y). El re
sultado del estudio fue una marcada correlacin positiva entre X e Y, que ciertamente coincide
con la idea de que X es la causa de Y. Sin embargo, tambin coincide de la misma forma con la
idea de que Y es la causa de X . (Tal vez los gerentes que parecen sufrir de estrs sean considerados
muy trabajadores y ese sea el motivo por el cual sus superiores asignen mayor cantidad de perso
nas a su cargo). Tambin es posible que la correlacin sea el resultado de algn tercer factor que
cause que X e Y se desarrollen de manera conjunta. Por ejemplo, algunos sectores de la fbrica
podran necesitar ms personal y tambin generar ms estrs. Es decir, determinado sector de la
fbrica causa estrs y requiere de muchos empleados para supervisar.
Existe bastante confusin acerca de este asunto de la correlacin y la causalidad. El tema
se complica al existir dos usos de la palabra correlacin. Algunas veces se utiliza para descri
bir un procedimiento estadstico (como lo hemos hecho en este captulo), y otras veces se utili
za para describir un tipo de diseo de investigacin en el que se miden dos variables en un
grupo de personas, sin realizar una asignacin aleatoria de sujetos a determinados valores de
una de las variables (vase el apndice A). Comnmente, los diseos de investigacin correla
cinales son analizados estadsticamente utilizando el coeficiente de correlacin, y los diseos
de investigacin experimentales se analizan utilizando procedimientos que veremos en los ca
ptulos 9 al 13.

Sin embargo, existen excepciones. En este mismo captulo utilizamos un ejemplo en el que
los participantes eran asignados al azar en determinada cantidad de exposiciones y luego se me
da la cantidad de palabras recordadas. A partir de los datos obtenidos, calculamos un coeficiente
de correlacin. No obstante, en el estudio no se utiliz un diseo de investigacin correlaciona];
fue un verdadero experimento, ya que los participantes eran asignados al azar a diferentes valores
de la variable independiente. Por s mismo, el coeficiente de correlacin que calculamos no nos
indic nada acerca de la causalidad. Aun as, qued claro, por el diseo de investigacin, que la
nica direccin causal posible es que la cantidad de exposiciones haya causado la diferencia en la
cantidad recordada.
El coeficiente de correlacin y la reduccin proporcional de error
Un coeficiente de correlacin indica la fuerza o el grado de una relacin lineal; mayores valores
de r (valores alejados de 0) indican un mayor grado de correlacin. Es decir, una r de 0,4 signifi
ca que existe una correlacin lineal ms fuerte que una r de 0,2. Sin embargo, la mayora de los
investigadores sostendran que una r de 0,4 no es el doble de fuerte que una r de 0,2; Para compa
rar correlaciones ntre s, la medida utilizada por la mayora de los investigadores es r2, A esto se
lo denomina, por razones que veremos en el captulo 4, reduccin proporcional dei error (y
tambin proporcin de varianza explicada).
Una correlacin de 0,2 es equivalente a una r2 de 0,04, y una correlacin de 0,4 es equivalen
te a una r2 de 0,16. Por lo tanto, una correlacin de 0,4 implica en realidad una relacin cuatro
veces ms fuerte que una de 0,2 !
Restriccin del rango
Supongamos que un psicolgo especializado en educacin est interesado en la relacin entre el
grado que cursa un nio y los conocimientos sobre geografa. S el investigador estudiara el rango
completo de grados escolares, los resultados podran ser como los que aparecen en el diagrama de
dispersin de la figura 3- 13a. Es decir, el investigador podra encontrar una fuerte correlacin po
sitiva. Pero supongamos que el investigador hubiera estudiado slo los tres primeros grados (en

Figura 3-13. E jem p lo d e restriccin d el ra n g o com parand o d os d iagram as d e d isp ersin : (a) c u an d o s e
m uestra la serie d e va lo res c o m p le ta (grado e sc o la r y c o n o c im ie n to s sob re g eo g ra fa ) y (b ) cu a n d o se
restringe la s er ie d e v a lo res (a lo s prim eros tres grados).

los que se ensea poca geografa). El diagrama de dispersin (vase figura 3-13b) reflejara muy
poca, o casi ninguna correlacin (la correlacin calculada sera cercana a 0) y, sin embargo, el in
vestigador estara incurriendo en error si llegara a la conclusin de que el grado no est relaciona
do con los conocimientos sobre geografa en ninguno de los grados escolares.
El problema en este caso es que la-correlacin.est basada en una serie de observaciones que
incluyen slo un rango limitado de los valores posibles de una de las variables. (En este ejemplo
existe un rango limitado de grados escolares). Es errneo pensar en la correlacin como si se apli
cara a todo el rango de valores que podra tener la variable. Esta situacin se denomina restric
cin del rango.
Es fcil cometer estos errores al interpretar correlaciones, las cuales incluso aparecen oca
sionalmente en publicaciones cientficas y se oyen con frecuencia an mayor en discusiones in
formales sobre resultados de investigaciones. Por ejemplo, en el rea de los negocios, a veces se
intenta determinar si las pruebas de aptitud laboral reflejan lo exitosas que resultan ser en sus
funciones las personas contratadas. Por lo general, la relacin es baja, porque no se tiene en
cuenta que se contratan slo a las personas que tuvieron buenos resultados en las pruebas. Los
estudios que miden ei xito en el empleo incluyen slo e subgrupo que presenta los registros al
tos. La figura 3-14 grfica este ejemplo.
Falta de confiabilidad de la medicin
Como hemos sealado, puede considerarse que el coeficiente de correlacin describe la proximi
dad entre los puntos y una lnea recta en el diagrama de dispersin. Sin embargo, una de las razo
nes por las que los puntos pueden no estar ubicados cerca de la lnea es el error casual en la
medicin; por ejemplo, un cuestionario que incluye algunos tems ambiguos. Con frecuencia, en
psicologa, las mediciones no son perfectamente precisas o confiables (veremos este concepto
en el captulo 17 y en el apndice A). El resultado es que una correlacin calculada entre dos va
riables, tales como intimidad e idealizacin (para utilizar nuestro ejemplo anterior) resulta menor
de lo que sera si tuviramos medidas perfectas de estas variables.
La reduccin en una correlacin, debido a la falta de confiabilidad de las medidas, se denomi
na atenuacin. Los libros de estadstica ms avanzada y los textos sobre medicin psicolgica
describen frmulas para la correccin por atenuacin, que suponen que puede determinarse el
grado de confiabilidad de las medidas, cuestin que no siempre es posible. En algunas publica-

'

'( ^

Personas postulabas \

(bj Persbris.pdstua4s^;!;i v-

:.;;vgS;y:y:; y ,y 5 0 ;

Puntuacin en ia prueba

.'

Puntuacin en la prueba

Figura 3-14. E jem p lo d e l e fe c to c a u sa d o en la co rr e la c i n por la restriccin d e l rango.

:r y
'

m:

clones cientficas podremos ieer que ia correlacin ha sido "desatenuada o que la atenuacin ha
sido corregida. Significa que el investigador realiz ciertos clculos para aumentar las correla
ciones al nivel que se estim que tendran si se hubieran aplicado mediciones perfectas de las va
riables que se correlacionan.
Los procedimientos para corregir la atenuacin superan el alcance de este libro. Aun as, es
conveniente recordar la regla general que se aplica cuando las medidas son poco confiables, como
ocurre en el caso de algunos cuestionarios, procedimientos observacionales, o en las observa
ciones psicolgicas en general. Las correlaciones que aparecen en publicaciones que emplean
medidas poco confiables pueden subestimar sustancialmente la verdadera correlacin entre las
variables que estas medidas imperfectas pretenden revelar.

CONTROVERSIAS Y DESARROLLOS RECIENTES:


QUE ES UNA GRAN CORRELACIN?_______________________________________
Con respecto al coeficiente de correlacin existe en la actualidad una controversia sobre la defini
cin de una gran r. Tradicionalmente, en psicologa se consideraba una gran correlacin aqu
lla que era igual o superior a 0,50; moderada, aqulla de aproximadamente 0,30, y pequea,
aqulla cercana a 0,10 (Cohn, 1988). De hecho, en psicologa es raro obtener correlaciones ma
yores a 0,40. Aun cuando estemos seguros de que X es la causa de Y, seguramente no ser la-ni
ca causa. Si bien la intimidad provoca idealizacin, es slo uno de los muchos factores que la
causan. Todos los otros factores no forman parte de nuestra correlacin. Ninguna correlacin po
dra reflejar la historia completa. Las correlaciones pequeas son tambin causadas por la poca
confiabidad de muchas medidas psicolgicas.
Es tradicional advertir que una correlacin pequea no es muy importante aun cuando sea
estadsticamente significativa. (Como veremos ms adelante, una correlacin pequea puede
ser estadsticamente significativa si el estudio incluye una gran cantidad de participantes), Des
pus de todo, una correlacin de 0,10 equivale slo a un 1% de reduccin del error.
Ms an, incluso psiclogos experimentados dedicados a la investigacin, tienden a sobrestimar el grado de asociacin que representa un coeficiente de correlacin. Michael Oakes (1982),
en la Universidad de Sussex, dio a 30 psiclogos dedicados a la investigacin las dos columnas de
datos que muestra la tabla 3-7. Luego Ies pidi que estimaran r (sin realizar ningn clculo). Qu
T a b ie a 3 -7 .
T a b la p r e s e n ta d a a 3 0 p s ic lo g o s p a r a e s tim a r r.

Fuente: Oakes (1982).

2
3
4
5
6
7
8
9
10
11
12

1
10
2
9
5
4
6
3
11
8
7
12

jU
v

opina el lector? La intuicin de los investigadores britnicos (que como grupo estn, al menos,
tan bien capacitados en estadstica como los psiclogos de cualquier lugar del mundo) indicaba
desde -0,20 a +0,60, con una media de 0,24. Si el lector lo desea puede calcular la verdadera co
rrelacin. Es de 0,50! Es decir, que en forma abstracta los psiclogos dan a una correlacin de
0,50 un grado mucho ms alto de correlacin del que le otorgan cuando observan los datos reales
(datos que, aun con una r - 0,50, slo se vean como de 0,24).
Oakes dio a otro grupo de treinta investigadores slo la columna de X, y les pidi que comple
taran la columna de Y con nmeros tales que reflejaran una correlacin de 0,50 (nuevamente, s
lo utilizando su intuicin y sin realizar ningn clculo). Cuando Oakes calcul las correlaciones
i que representaban ios nmeros indicados por los investigadores, el promedio result ser de
En otras palabras, incluso los investigadores experimentados consideran que un coeficiente
relacin representa un grado de asociacin mayor de lo que en realidad implica.
Por el contrario, otros psiclogos sostienen que las pequeas correlaciones pueden ser muy
importantes tericamente, las cuales tienen mayor inferencia prctica por el hecho de que los pe
queos efectos pueden acumularse a lo largo del tiempo (Prentice & Miller, 1992).
Para demostrar la importancia prctica de pequeas correlaciones, Rosnow y Rosenthal
(1989b) ofrecen un ejemplo de un estudio actualmente famoso relacionado con el hecho de que
algunos mdicos tomaran o no aspirinas a diario, y la relacin de esa ingesta con los ataques
cardacos (Comisin Directiva del Grupo Mdico de Investigacin sobre Estudios Sanitarios
[Steering Committee of the Physicians Health Study Research Group], 1988). Los resultados de
mostraron que el hecho de ingerir aspirina estaba correlacionado en un -0,034 con los ataques
cardacos.1Es decir, produce aproximadamente un 0,1% de reduccin proporcional de error. Sin
embargo, consideremos la parte superior de la tabla 3-8 (en la que se describen los ataques carda
cos con im (Infarto demiocaxdio). La correlacin de slo 3,4 significaba que entre los ms de
20.000 mdicos que estaban incluidos en el estudio, existan 72 ataques cardacos ms en el gru
po que no tomaba aspirina. (De hecho, la parte inferior de la tabla indica que tambin existan 13
muertes ms por ataques cardacos en el grupo que no tomaba aspirina).
La parte central de la tabla 3-8 es especialmente interesante desde el punto de vista de la estadsti
ca. En esa parte de la tabla, los porcentajes correspondientes a cada grupo referido a los ataques
cardacos (ausencia d e a t y presencia de im ) estn divididos entre el porcentaje que tomaba y el
que no tomaba aspirinas (el grupo placebo). Observemos que la diferencia en porcentajes en cual
quiera de los grupos es de exactamente +3,4% -3,4%. (Por ejemplo, dentro del grupo que haba
sufrido ataques cardacos, el 48,3% que tomaba aspirinas menos el 51,7% del grupo placebo
equivale a -3,4%). Lo importante aqu es que 3,4% es exactamente igual al coeficiente de correla
cin (0,034).
No es una coincidencia. En este tipo de tablas, que se denominan del tamao del efecto a
una exposicin dicotomica, la diferencia de los porcentajes siempre resultar exactamente igual
al coeficiente de correlacin. Esto facilita sorprendentemente la comprensin de las correlaciones
en cualquier situacin en la que una de las variables representa el xito y el fracaso (como no su
frir un ataque cardaco o sufrirlo), y la otra variable representa la ciase de tratamiento recibido
(como aspirina o placebo). En este tipo de situaciones, la correlacin marca la diferencia en por
centajes entre el xito y el fracaso en relacin con el tratamiento recibido,

* Para calcular la correlacin entre tener un ataque cardaco y tomar aspirinas, tendramos que convertir las dos varia
bles en nmeros. Por ejemplo, podramos representar el hecho de tener un ataque cardaco con l , y no tenerlo con 0; de
forma similar, podramos considerar que estar en el grupo que consume aspirinas es igual a 1, y estar en ei grupo place
bo guai a 0. N o tiene importancia cul de los dos nmeros utilicemos para cada uno de los dos valores de cada variable.
Cualesquiera sean los dos nmeros utilizados, ei resultado ser el mismo despus de convertirlos en puntuaciones Z. La
nica diferencia que puede surgir en relacin con ios nmeros utilizados es que, segn a q u valor se aplique el nmero
mayor, esto determinar que la correlacin sea positiva o negativa.

T a b la 3 -8 .
E fe c to s d e la a s p ir in a en lo s a ta q u e s c a r d a c o s .
C o n d ici n

A u se n c ia de

im

P r e se n c ia de

10.933
10.845

Aspirina
Placebo

im

104
189

T a m a o d ei e fecto a u n a e x p o sic i n d ico t m ica


51,7
48,3
100,0

Aspirina
Placebo
Total
im

Aspirina
Placebo

no fa ta l

99
171

48,3
51,7
100,0
im

fatal

5
18

N ota: m = infarto de miocardio. Fuente: Com isin Directiva del Grupo M dico de investigacin Sobre Estudios
Sanitarios [Steering Committee o f the Physicians Health Study Research Group] (1988).

Ciertamente, un 3,4% de diferencia entre sufrir o no ataques cardacos es un dato interesante,


aunque es slo una pequea parte de lo que afecta a las personas que sufren ataques cardacos. No
deja de ser cierto que el 99,9% de la variacin, en cuanto a que la gente sufra o no ataques carda
cos, se debe a otros factores (dieta, ejercicio, herencia, etc.). Ms an, algunos estadsticos (por
ejemplo Strahan, 1991; Thompson & Schumacker, 1997) sostienen que este tamao del efecto a
la exposicin dicotmica distorsiona la situacin real, excepto cuando la frecuencia de los valores
de ambas variables estn en la relacin 50-50. (En este caso, la relacin entre aspirina y placebo
es cercana ai 50-50, pero con respecto a presencia y ausencia de m la relacin est muy lejos de
ser 50-50).
Otra discusin sobre la importancia de las pequeas correlaciones est basada en los mtodos
de investigacin. Prentice y Miller (1992) explican:
Demostrar que un efecto perdura aun bajo las circunstancias ms inverosmiles puede ser tan
impresionante (o en algunos casos, tal vez ms impresionante) que demostrar que el efecto contri
buye en una gran parte a la varianza (p. 163).
Algunos de los ejemplos de estos autores se refieren a estudios que demuestran una correlacin
entre el sentimiento de atraccin y las sentencias de culpabilidad o inocencia emitidas en juicios
(por ejemplo Sgall & strove, 1975). Lo importante es que las sentencias legales no deberan
ser afectadas por factores tan accidentales como el sentimiento de atraccin. Por lo tanto, s exis
ten estudios que demuestran que la atraccin est relacionada con las sentencias, aunque ms no
sea levemente, entonces nos convenceramos de la importancia que podra tener la atraccin por
su influencia en las opiniones sociales en general.

COEFICIENTES DE CORRELACIN SEGN SE DESCRIBEN


EN LAS PUBLICACIONES CIENTFICAS
Los coeficientes de correlacin aparecen en las publicaciones cientficas tanto en el texto como
en las tablas (algunas veces tambin se hace referencia al nivel de significacin, como por

ejemplo, $0-0,05). El resultado del estudio con el que comenzamos el captulo se describira en
el texto de la siguiente manera: Exista una fuerte correlacin positiva entre la idealizacin y la
intimidad, r ~ 0,74.
Las tablas de correlaciones son muy comunes cuando se trabaja con varias variables. Usualmente, se disea la tabla de modo que cada variable aparezca tanto en la parte superior como en el
margen izquierdo, y la correlacin entre cada par de variables se indica dentro de la tabla, a la que
se denomina m atriz de correlacin.
La tabla 3-9 proviene de una publicacin que describe los resultados de un gran estudio euro
peo sobre dietas alimenticias saludables (Wardle et al 1997). En este caso en particular, los auto
res incluyen las matrices de correlacin separadas una para mujeres y otra para hombres. El
ejemplo que presentamos aqu ilustra varias caractersticas tpicas del modo en que se disean las
matrices de correlacin. En primer lugar, podemos observar que no se indica la correlacin de
una variable consigo misma. En este ejemplo, el espacio se completa con un guin; con frecuen
cia slo se deja el espacio libre. Podemos observar tambin que slo la mitad superior de cada
matriz est completa. Esto ocurre porque completar la otra mitad sera repetitivo; por ejemplo, la
correlacin entre evitar las grasas con consumir fibras es la misma que la correlacin entre consu
mir fibras y evitar las grasas (en algunos casos se completa la mitad inferior y se deja en blanco la
mitad superior). Existe otra forma de resumir la informacin ahorrando espacio en la pgina: los
nombres de las variables aparecen slo en el costado de la tabla; en la parte superior slo se escri
ben los nmeros correspondientes a cada una de ellas. Finalmente, observamos que los coeficien
tes significativos estn indicados con un asterisco, y se incluye una nota al pie que explica el nivel
de probabilidad que representa el asterisco.
Observando el ejemplo, podemos ver, entre otras cosas, que las correlaciones entre evitar
grasas y consumir fibras son bastante altas (0,42 en el caso de las mujeres y 0,41 en el caso
de los hombres). Tambin es interesante el hecho de que exista muy poca o ninguna correla
cin entre consumir frutas diariamente y limitar las carnes rojas (0,00 para las mujeres y 0,01
para los hombres).

Tabla 3-9.
Correlaciones de Pearson entre las costumbres alimenticias de hombres y de mujeres.
S u b -e sc a la

1,
2,
3.
4.
5.

Evitar las grasas

Consum ir fibras
C om er fru tas diariamente
Limitar las carnes roj as
Limitar la sai

1.
2.
3.
4.
5,

Evitar las grasas

C om er fibras
C om er frutas diariamente
Limitar las carnes rojas
Limitar la sal

M ujeres (n = 9 ,182)
0 ,42*
0,16*

0,15*

0,41*

H om bres ( = 7 .3 0 4 )
0,13*
0,13*

0,14*
0,12*
0,05*

0,11*
0,09*
0.00
0,12*

0,12*
0,11*
0,02*

0,10*
0,08*
0,01*
0,07*

--

*p< 0,001.
Fuente: Wardie, J et ai. (1997), tab, 2. Prcticas alimenticias saludables de alumnos europeos. " P sico lo g a sa n ita r ia ,
16, 443-450, Copyright, 1997, por la Asociacin Americana de Psicologa (American Psychological Association].
Reimpreso con autorizacin.

RESUMEN
Un diagrama de dispersin muestra la relacin entre dos variables. En ei eje horizontal se ubican
los valores de ia variable independiente o predictora, ordenados de menor a mayor. En el eje ver
tical se ubican los valores de la variable dependiente, ordenados de menor a mayor. Cada par de
valores correspondientes a un individuo se marca con un punto.
Cuando en trminos generales los puntos del diagrama de dispersin siguen una lnea recta,
hablamos de una correlacin lineal. En una correlacin lineal positiva, la recta va hacia arriba y
hacia la derecha (es decir, los valores bajos coinciden con los bajos y los altos con los altos). En
una correlacin lineal negativa, la recta va hacia abajo y hacia la derecha (es decir, los valores ba
jos coinciden con los altos y los altos con los bajos). En una correlacin curvilnea, los puntos si
guen un patrn distinto de una simple lnea recta. Existe correlacin nula cuando los puntos no
siguen ningn tipo de patrn sistemtico.
El coeficiente de correlacin (r) indica el grado de correlacin lineal. Es el promedio de los
productos cruzados de puntuaciones Z Cuando existe una fuerte correlacin lineal positiva, el
coeficiente de correlacin es altamente positivo debido a que las puntuaciones Z positivas se mul
tiplican por positivas y las puntuaciones Z negativas por negativas. Cuando existe una fuerte co
rrelacin lineal negativa, el coeficiente de correlacin es altamente negativo debido a que las
puntuaciones Z positivas se multiplican por negativas y las puntuaciones Z negativas por positi
vas. Cuando no existe correlacin lineal, el coeficiente de correlacin es 0, debido a que las pun
tuaciones Z positivas son multiplicadas a veces por puntuaciones Z positivas, y otras por
puntuaciones Z negativas, mientras que las puntuaciones Z negativas son multiplicadas a veces
por puntuaciones Z negativas, y otras por puntuaciones Z positivas. Por lo tanto, los productos
cruzados positivos y negativos se cancelan entre s.
El mximo valor positivo posible d e r e s + l , r = +l , y ocurre cuando existe una correlacin li
neal positiva perfecta. El mximo valor negativo posible de r es -1, r = -1, y ocurre cuando existe
una correlacin lineal negativa perfecta.
Una correlacin generalmente est basada en valores observados de determinado grupo que
pretende representar a un grupo ms amplio. Cuando ios resultados de los procedimientos esta
dsticos (que aprenderemos ms adelante) no son coherentes con la idea de que la correlacin en
ese grupo ms amplio es 0 , decimos que la correlacin es estadsticamente significativa.
Las comparaciones del grado de correlacin lineal se consideran ms precisas si se realizan
con el cuadrado del coeficiente de correlacin (r1), llamado reduccin proporcional del error.
La correlacin no muestra la direccin de causalidad. Si dos variables, X e y, estn correla
cionadas, esto podra ser porque X est causando Y, Y est causando X, o un tercer factor est cau
sando X e Y.
Un coeficiente de correlacin puede representar la verdadera correlacin por debajo de su ni
vel verdadero si se basa en las observaciones de un grupo de estudio cuyo rango de valores es res
tringido, o cuyos valores se basan en medidas poco confiables.
Muchos psiclogos sostienen que el coeficiente de correlacin es una sobrestimacin de la
importancia de la asociacin entre dos variables. En efecto, los estudios realizados sugieren que
los psiclogos tienden a considerar cualquier coeficiente de correlacin en particular como repre
sentante de un mayor grado de asociacin del que realmente existe. Sin embargo, las pequeas
correlaciones pueden tener importancia prctica (que puede ser demostrada a travs del tamao
del efecto a una exposicin dicotmica, el cual describe la relacin entre dos variables con dos
valores cada una, y examinando la tabla 2 x 2 resultante). Las pequeas correlaciones tambin
pueden ser muy efectivas para demostrar ia importancia de una relacin cuando un estudio de
muestra que la correlacin se mantiene aun bajo lo que pareceran condiciones poco probables.

Las publicaciones cientficas generalmente presentan resultados correlacinales tanto en sus


textos, con el valor r (y algunas veces con el nivel de significacin), como en tablas especiales
(matrices de correlacin) que ilustran las correlaciones entre diversas variables.

Trminos clave
- Correccin por atenuacin.
- Correlacin.
- Coeficiente de correlacin (r).
- Matriz de correlacin.
- Producto cruzado de puntuaciones Z.
- Correlacin curvilnea.
- Grado de correlacin.

- Variable dependiente.
- Direccin de causalidad.
- Variable independiente.
- Correlacin lineal.
- Correlacin negativa.
- Correlacin nula.
- Correlacin perfecta.

Ejercicios
Los ejercicios implican la realizacin de
clculos (con la ayuda de una calculadora).
La mayora de los problemas estadsti
cos reales se resuelven por computadora,
pero aunque exista la posibilidad de utilizar
la, es conveniente realizar estos ejercicios
manualmente para incorporar el mtodo de
trabajo.
Para adquirir prctica en la utilizacin de
una computadora, para resolver problemas
estadsticos, se puede utilizar la seccin de
computacin de cada captulo, publicada en
la Guia de estudio y libro de tareas de compu
tacin para el alumno [Students Study Guide and Computer Workbook] que acompaa
este libro.
Todos los datos de esta seccin son ficti
cios (a menos que se especifique lo contrario).
Las respuestas a los ejercicios de la serie I
se encuentran al final del libro.

SERIE 1
Realice las siguientes tareas para los ejer
cicios 1 y 2; a) Confeccione un diagrama de
dispersin con las puntuaciones originales; b)
describa con palabras el patrn general de co

- Correlacin positiva.
- Variable predictora.
- Reduccin proporcional
del error (r2).
- Restriccin de rango.
- Diagrama de dispersin.
- Significacin estadstica.

rrelacin, si existe; c) calcule el coeficiente de


correlacin; d) explique la lgica de lo que ha
hecho, escribiendo como si se dirigiera a al
guien que nunca ha asistido a un curso de esta
dstica (pero que s entiende qu es la media, el
desvo estndar y las puntuaciones Z), y e) pre
sente tres direcciones de causalidad lgica
mente posibles, indicando en cada caso si se
trata de una explicacin razonable para la co
rrelacin segn las variables involucradas (y
por qu),
1.
Un investigador estaba interesado en la
relacin entre el grado de empatia de los psicoterapeutas y el nivel de satisfaccin de sus pa
cientes con la terapia. Como estudio piloto se
analizaron cuatro parejas de terapeutas y pa
cientes. Estos son los resultados:
N m ero de
p areja

E m p a tia d el
tera p eu ta

S a tisfa cci n
del p a cien te

1
2
3
4

70
94
36
48

4
5
2
1

2,
Un instructor pregunt a cinco alumnos
cuntas horas haban estudiado para un exa
men. A continuacin se detalla la cantidad de
horas de estudio y sus calificaciones.

H o r a s d e estu d io

C a lifica ci n en la p ru eb a

0
10

8
6

52
95
83
71
64

3,
En un estudio realizado a personas
recin se conocan, se midi el nivel de extra
versin de uno de los integrantes de la pareja y
el aprecio del otro integrante de la pareja por el
primero. Estos son los resultados:
E x tr a v er si n d e u n o
de los in teg r a n tes

A p recio p o r
ese in teg ra n te

P u n tu a c i n P u n tu a c i n

P u n tu a c i n P u n tu a c i n
o r ig in a l
Z

o r ig in a l

18
17
20
8
13
24
11
12
18
21

0,37
0,17
0 ,8 0
- 1 ,7 2
- 0 ,6 7
1,63
- 1 ,0 9
-0 ,8 8
0,38
1,00

8
9
6
1
7
1
3
5
7
3

1,10
1,47
0,37
-1 ,4 7
0 ,74
-1 ,4 7
-0 ,7 4
0 ,0 0
0 ,74
-0 ,7 4

En este ejercicio damos las puntuaciones Z pa


ra ahorrar tiempo de clculo, a) Construya un
diagrama de dispersin de las puntuaciones
originales; b) describa con palabras el patrn
general de la asociacin, si existe, y c) calcule
el coeficiente de correlacin.
4.
Chapman, Hobfoll y Ritter (1997)
trevistaron dos veces durante el embarazo a
68 mujeres de una zona cntrica y superpo
blada de una ciudad y a sus maridos (o no
vios); la primera vez, entre el tercer y sexto
mes de embarazo, y la siguiente vez, entre el
sexto y el noveno mes de embarazo. La tabla
3-10 muestra las correlaciones entre varias de
las medidas. Lo ms importante en esta tabla
es la correlacin entre lo que las mujeres in
formaban sobre su propio estrs, lo que los
hombres informaban sobre el estrs de sus
compaeras, la percepcin de las mujeres so
bre el apoyo brindado por sus parejas en la
primera y en la segunda entrevista y el nivel

de depresin de las mujeres en la primera y


en la segunda entrevista.
Explique los resultados de las medidas co
mo si estuviera escribiendo para una persona
que nunca ha asistido a un curso de estadstica.
Especficamente, a) explique qu significa un
coeficiente de correlacin, utilizando una de
que
las correlaciones como ejemplo; b) analice la
tabla y Juego comente los patrones de los re
sultados, indicando las variables que presentan
una correlacin relativamente fuerte y las que
no, y c) comente las limitaciones que deben te
nerse en cuenta al sacar conclusiones sobre
causalidad sobre la base de esta informacin,
utilizando como ejemplo una correlacin espe
cfica (nombre al menos una direccin de cau
salidad alternativa posible y explique por qu
esa alternativa es posible).
5. Para cada una de las siguientes situacio
nes, indique por qu el coeficiente de correla
cin podra ser una estimacin distorsionada
de la correlacin real (y qu clase de distorsin
esperara):
a) Puntuaciones en dos cuestionarios de
medicin de personalidad estn correlacionados.
b) La calidad de vida y la felicidad de un
grupo de millonarios estn correlacionadas.
6 . La siguiente informacin ha sido pre
parada de forma tal que las series de datos B
hasta D sean versiones levemente modificadas
de la serie A. Confeccione diagramas de dis
persin y calcule los coeficientes de correla
cin de cada serie de datos (slo damos la
en
solucin de las seres A y B).
S e r ie A

S e r ie B

Y
1

X
1

Y
l

3
4

2
3
4

2
3
4

2
3
5
4

X
i
2

S e r ie C

S e r ie D

1
2
3
4

5
2
3
4
1

1
2
3
4

1
4
3
2
5

7.
Un investigador est interesado en ave
riguar si un nuevo medicamento produce algn
efecto en caso de resfro. Ocho personas son
analizadas: cuatro toman el medicamento y
cuatro no (las que lo toman son calificadas con

un l t las que no, con un 0) y luego se registra si


se resfran (calificacin 1) o no (calificacin
0). A continuacin aparecen cuatro resultados
posibles. Calcule el coeficiente de correlacin
en cada caso (slo damos la solucin para las
posibilidades A y B).
P o s ib ilid a d
A

P o s ib ilid a d
B

que nunca asisti a un curso de estadstica (pe


ro que s comprende qu es la media, el desvo
estndar y las puntuaciones Z), y e) indique
tres direcciones de causalidad lgicamen
te posibles, explicando en cada caso si es una
direccin razonable de la correlacin segn las
variables involucradas (y por qu?).
1.
Se entrega a cuatro individuos una prue
ba de habilidad manual (los valores altos signi
fican mayor habilidad) y una prueba de ansiedad
(los valores altos implican mayor ansiedad).
Los valores observados de los cuatro individuos
son los siguientes:

P o s ib ilid a d P o s ib ilid a d
C
D

Toma Se
Toma Se
Toma S e
Toma S e
M ed. resfra M ed. resfra M e d , resfra M ed. resfra
0
0
0
0
1
1
1
1

1
1
1
1
0
0
0
0

0
0
0
0
3
1
1
1

1
i
1
0
1
0
0
0

0
0
0
0
1
1
1

1
1
0
0
1
1
0
0

1
1
1
0
0
0
0
0

0
0
0
0
1
1
1
1

P erso n a

H a b ilid a d

A n s ie d a d

1
2
3

1
1
2
4

10
8
4

SERIE II
Realice lo siguiente en los ejercicios 1 y 2 : a)
construya un diagrama de dispersin de las
puntuaciones originales; b) describa con pala
bras el patrn general de correlacin, si existe;
c) calcule el coeficiente de correlacin; d) ex
plique la lgica de lo que ha hecho, escribien
do como si estuviera hacindolo para alguien

~2

2.
Se controla de cerca a cuatro nios pe
queos durante un periodo de varias semanas
para medir qu cantidad de programas de tele
visin violenta miran y la medida de su com
portamiento violento hacia sus compaeros de
juego. Los resultados fueron los siguientes:

T a b la 3 - 1 0 .
C o r r e l a c i o n e s d e o r d e n c e r o d e l a s v a r i a b l e s d e l e s t u d io .

Variable
I. Estrs informado por mujeres
2. Estrs de mujeres informado
por hombres
3. Apoyo de pareja 1
4, Apoyo de pareja 2
5. Estado depresivo
6. Estado depresivo 2
7. Edad de las mujeres
8. Origen tnico de las mujeres
9, Estado civil de las mujeres
10. Paridad

0,17
-0,28*
-0,18
-0,27*
-0,18
0,23*
OJO
0,50*** 0,14
0,06
0,16
-0,19
-0,09
0,01
-0,18
0,19
0,13

044***
-0,34**
-0,42***
0,04
-0,16

0,12

- 0,11

-0,17
-0,41** * 0 55***
-0,24* -0*35*

0,14
0,11
0,24* -0,04
-0,17
OJO

-0,09
0,13 - 0,02

- 0,20 0,05 -0,34**


0,16 0,26* 0,31*

*p < 0,05; **p < 0,Q t, ***< 0,001.

Fuente: Chapman, H, A., Hobfoll, S. B., & Ritter, C. (1997), tab. 2. El hecho de que el compaero subestime el estrs
sufrido por ellas provoca angustia en las mujeres: estudio sobre mujeres embarazadas de zonas cntricas y superpobla
das de la ciudad. P e r i d ic o s o b r e P s ic o lo g a S o c ia l y d e P e r s o n a lid a d { J o u r n a l o f P e r s o n a l i t y a n d S o c ia l P s y c h o l o g y ] ,
73, 418-425. Copyright, 1997, por la Asociacin Americana de Psicologa [American Psychoogical Association],
Reimpreso con autorizacin.

C a n tid a d d e
C a n tid a d sem a n a l
a ccio n es
N m ero
(h o ra s) de T V v io len ta s o agresivas
d e c d ig o
vio len ta s
d e lo s n i o s
h a c ia c o m p a ero s
G 3368
R 8 904
C 9890
L 87 2 2

C alificacin
p o r p rolijid ad

X
Janet
Gareth
Grove
Kevin
Joshua

14
8
6
12

N i o

N ic o le

18
24
14
19
20
23
20
22
15
21

R e g istro s en
p r u e b a d e n v

zx

Zy

0 ,5 2
1,43
1,82
0 ,2 0
0,13
1,11
0,13
0,78
1,50
0 ,4 6

60
58
70
58
66
68
65
68
56
62

- 0 ,6 6
-1 ,0 9
1,47
- 1 ,0 9
0,62
1,04
0 ,4 0
1,04
-1 ,5 1
- 0 ,2 3

En los ejercicios 3 y 4, a) construya un diagra Susan


rew
ma de dispersin de las puntuaciones origina D
M arie
les; b) describa con palabras el patrn general Chad
de correlacin, si existe, y c) calcule el coefi
5. Como parte de un estudio ms amplio,
ciente de correlacin. En los dos ejercicios da
mos las puntuaciones Z para ahorrarle tiempo. Speed y Gangestad (1997) obtuvieron califi
caciones y nominaciones sobre diversas carac
3.
Supongamos que el Museo de Louvre
tersticas de 66 hombres de una fraternidad,
est interesado en la relacin entre la antige
otorgadas por sus compaeros de fraternidad. El
dad de una pintura y el inters del publico en siguiente prrafo fue tomado de la seccin de re
esa pintura. Durante una semana se controla la sultados del estudio:
cantidad de personas que se detienen a obser
L a popularidad romntica de los hombres e s
var a cada una de las O pinturas elegidas ai
taba significativam ente correlacionada con
azar. Los resultados son los siguientes:

T tu lo
d e la p in tu r a

C an tid ad
A n tig ed a d
d e p erso n a s
a p ro x im a d a q u e se detien en
(a o s)
a o b serv a rla

X
El Entierro
M ys Mar Ste Catherine
Las Baistas
E l T oilette
Retrato de Castiglione
Carlos I de Inglaterra
Crispin y Scapiti
D esnudo al Sol
E l B alcn
E l Circo

465
515
240
107
376
355
140
115
122
99

z*
1.39
1,71
- 0 ,0 9
0,96
0,80
0,67
-0 ,7 5
0,91
-0 ,8 6
-1 ,0 1

Zy

68 -0 ,6 9
71 0,59
123
1,19
0 ,8 2
112
48 -1 ,3 8
84 0 ,1 4
66 - 0 ,7 6
2,05
148
71 0,59
91
0 ,1 0

varias caractersticas: mejor vestimenta (r =


0,48), mayor atractivo fsico ( r = 0,47), ms
sociabilidad (r 0,47), ms confianza en s
m ism o ( r ~ 0,44), m ejor lder (r = 0,38), ms
divertido ( r - 0,37), ms satisfecho ( r ~ 0,32)
y m as independiente ( r = 0 ,2 8 ). Sin embargo,
inesperadamente, e l potencial de los hombres
en relacin con e l xito financiero no estaba
significativam ente correlacionado con su po
pularidad romntica (r - 0,10). (p. 931).

Explique los resultados como si estuviera escri


biendo para una persona que nunca ha asistido
a un curso de estadstica. Especficamente, a)
explique qu significa un coeficiente de corre
lacin utilizando una de las correlaciones como
ejemplo; b) explique, qu significa significati
vamente" y no significativamente", en gene
ral, refirindose al menos a un ejemplo espec
fico y c) especule sobre el significado del pa
4.
Un maestro de escuela crey notar que
trn de los resultados, teniendo en cuenta el te
los alumnos que se vestan ms prolijamente
ma de la direccin de causalidad.
eran, en lneas generales, mejores estudiantes.
6 . Seleccione arbitrariamente ocho nom
Para probar est idea, el maestro hizo que un bres personales completos, de ocho hojas dife
amigo calificara a cada uno de los alumnos rentes de la gua telefnica. Confeccione un
segn su prolijidad en el vestir. A continua-, diagrama de dispersin y calcule el coeficiente
cin detallamos las calificaciones por proliji de correlacin entre la cantidad de letras en el
dad, junto con las calificaciones de los alumnos primer nombre y en el apellido. Describa el re
en una prueba estandarizada de rendimiento sultado con palabras y sugiera una posible in
terpretacin de sus resultados.
escolar.

APNDICE I DEL CAPTULO: FRMULA DE CLCULO OPTATIVA DEL


COEFICIENTE DE CORRELACIN
Los pasos para calcular un coeficiente de correlacin pueden combinarse en una sola frmula pa
ra realizar clculos a mano (o con una calculadora) en un estudio con gran cantidad de participan
tes. Comnmente, los pasos para calcular una correlacin son: calcular a) las puntuaciones Z de
cada puntuacin original, b) los productos cruzados de las puntuaciones Z y c) el promedio de los
productos cruzados de las puntuaciones Z. (El alumno habr notado, ai realizarlos ejercicios, que
calcular las puntuaciones Z es particularmente tedioso cuando se trabaja a mano, especialmente si
primero es necesario calcular las medias y los desvos estndares). Con un poco de manipulacin
algebraica, la frmula puede transformarse en la que se indica a continuacin, (Aunque parezca
terrible, resulta realmente ms sencilla para aplicar en un estudio rea] con grandes cantidades de
participantes que si tuvieran que calcularse los resultados a mano).
r

jv s x r-(x x )(x r)
(3-2)

Cuando se utiliza este procedimiento resulta til organizar los datos en un cuadro de cinco colum
nas, formado por las columnas X, X2, 7, Y2, y los productos cruzados de XY. Cabe destacar que no
se mencionan las puntuaciones Z, y que los productos cruzados se calculan directamente sobre la
base de puntuaciones originales. Adems, tal como lo recordamos en el apndice del captulo 2,
IX 2 se logra tomando cada valor X y elevndolo al cuadrado, y luego sumando estos cuadrados;
por el contrario, (YX)2 se logra sumando todos los valores X (sin elevar al cuadrado ninguno de
ellos), y luego elevando el total al cuadrado.
La tabla 3-11 muestra el clculo correspondiente al ejemplo del estrs de los gerentes utili
zando esta frmula. Comprela con la tabla 3-2.

APNDICE II DEL CAPTULO; PRUEBA DE HIPTESIS Y SU POTENCIA


SOBRE EL COEFICIENTE DE CORRELACIN
Este material est dirigido a aquellos alumnos que ya han completado al menos hasta el captulo 9
y ahora vuelven a estudiar este captulo.

Significacin de un coeficiente de correlacin


La prueba de hiptesis de un coeficiente de correlacin sigue el proceso usual de cinco pasos. Sin
embargo, cabe destacar tres puntos importantes. Primero, la hiptesis nula establece, en lneas ge
nerales, que la correlacin en una poblacin como la observada no es diferente de la de una
poblacin .en la que la verdadera correlacin es 0. Segundo, si los supuestos (explicados en el
siguiente prrafo) se cumplen, la distribucin comparativa es una distribucin f con grados de li
bertad iguales a la cantidad de participantes menos 2. Tercero, el estadstico de prueba que corres
ponde al de correlacin en esa distribucin t se calcula utilizando la siguiente frmula:
(3-3)

Tabla 3-11.
C m p u to s d e l c o e fic ie n te d e c o r r e la c i n d e l e s tu d io s o b r e e l e str s d e lo s g e r e n te s , r e a liz a d o s c o n la
f r m u la d e c lc u lo (d a to s fic tic io s ).
N ivel d e estrs

E m p lea d o s su p erv isa d o s


X

X:

X!
36

8
3
10
8

64
9
100
64

35

273

y*

w xxr-

49
64
1

P r o d u c io s cru za d o s
XY

1
8
6

64
36

42
64
3
80
48

30

214

237

( 2 X )(X y)

U Z X * - (XXX ]

[V iv x r - ( X f ) 1 ]

(5X 237)
- (35X 30)

[V(5X 273)

[V (5X 214) - ( 3 0 X 3

- (3 5 )* ]

1.185 - 1.050
r ~ ------------------------------------------------------------------------------

(V 1.365 - 1 .2 2 5 }
135

135

135

(7 W )C f 0 )

( 11,83 ) ( 1 3 3 )4 )

154,26

Adems, queremos destacar que las pruebas de significacin de una correlacin, como por ejem
plo una prueba t, pueden ser de una o dos colas. Una prueba de una cola significa que el investiga
dor ha predicho el signo (positivo o negativo) de la correlacin2.
Los supuestos de las pruebas de significacin de un coeficiente de correlacin son algo com
plejos. Comnmente, ambas variables deberan estar normalmente distribuidas. Adems, la dis
tribucin de cada variable, condicionada por cada valor de la otra variable, debera tener
aproximadamente la misma varianza. Sin embargo, como ocurre con la prueba t y el anlisis de
varianza, los incumplimientos moderados de estos supuestos no son fatales.
A continuacin presentamos un ejemplo utilizando el estudio del estrs de los gerentes. Su
pondremos que los investigadores predijeron una correlacin positiva entre la cantidad de em
pleados supervisados y el estrs, la que ser probada a nivel 0,05.
1. Reformule el problema en forma de hiptesis de investigacin e hiptesis nula acerca de
las poblaciones. Las poblaciones de inters son las siguientes:
Poblacin 1; gerentes como los analizados en este estudio.
Poblacin 2: gerentes para los cuales no existe correlacin entre cantidad de empleados su
pervisados y estrs.
2 Dunlap y Myers (1997) encuentran un modo ms corto de descubrir la significacin de un coeficiente de correlacin.
Sucede que e l r necesario para una significacin de nivel 0,05 (dos colas) es muy aproximado a 2 fyN . Por ejemplo, pa
ra N ~ 5, necesitaramos una correlacin de 0,89 (2/^/5= 2/2,24 = 0,89). Dunlop y Myers tambin nos brindan una ma
nera ms corta para lograr una aproximacin a la cantidad de participantes necesarios para un poder de entre un 80% y
90%. El tamao de muestra necesario es simplemente 8 dividido r2. Por ejemplo, utilizando esta frmula, para r - 0,10,
la cantidad de participantes necesaria es 8 /0 ,102, es decir, 800.

La hiptesis nula establece que las dos poblaciones tienen la misma correlacin. La hiptesis de
investigacin establece que la poblacin 1 tiene una correlacin mayor que la poblacin 2. (Es de
cir, la prediccin es que la correlacin de la poblacin es mayor a 0).
2. Determine las caractersticas de la distribucin comparativa. Suponiendo que se cumplen
los supuestos (en la prctica, con slo cinco casos sera difcil de determinar), la distribucin
comparativa es una distribucin t con gl = 3. (Es decir, gl = N - 2 = 5 - 2 = 3).
3. Determine el punto crtico en la distribucin comparativa, en el cual la hiptesis nula debe
ra ser rechazada. La tabla (tabla B-2 del apndice B) muestra que para una prueba de una cola a
nivel 0,05, con 3 grados de libertad, necesitamos una t de al menos 2,353.
4. Determine el valor del estadstico de prueba. Calculamos una correlacin de r ~ 0,88 y
iV= 5. Aplicando la frmula para encontrar el t equivalente, obtenemos:

f . (4/^=2) (0,j|(./3) (0,8g(l,73) _


_
Vl_ r2
Vi -0,77
/o,2 3
0,48 '
5. Compare los valores obtenidos en los pasos 3 y 4 para decidir si se rechaza la hiptesis nu
la. El valor t de 3,17, obtenido de la muestra estudiada, es ms extremo que el punto crtico nece
sario de 2,353. Se rechaza la hiptesis nula y se sostiene la hiptesis de investigacin.
Tamao del efecto y potencia
El coeficiente de correlacin es, en s mismo, una medida del tamao del efecto. Las reglas de
Cohn (1988) para el coeficiente de correlacin establecen que el tamao del efecto de 0,10 es pe
queo, de 0,30 es mediano y de 0,50 es grande. La tabla 3-12 nos muestra la potencia aproximada,
y la tabla 3-13 el tamao mnimo de muestra para obtener una potencia del 80% (vase tambin
nota al pie 1), Se pueden encontrar tablas ms completas en Cohn (1988), pp. 84 95 y 101-102.

Tabla 3-12.
P o te n c ia a p r o x im a d a d e e st u d io s q u e u t iliz a n e l
c o e f i c i e n t e d e c o r r e l a c i n (r ) p a r a p r u e b a s d e h i p
t e s is c o n n iv e l d e s i g n i f i c a c i n d e 0 ,0 5 .

T a b la 3 - 1 3 .
C a n tid a d a p r o x im a d a d e p a r tic ip a n te s n e c e
s a r i o s p a r a lo g r a r u n 8 0 % d e p o t e n c i a e n u n
e s t u d io q u e u t iliz a e l c o e f ic ie n te d e c o r r e la
c i n (r ) p a r a p r o b a r u n a h i p t e s i s c o n n i v e l
d e s i g n i f i c a c i n d e 0 ,0 5 .

T a m a o d el efecto

D o s colas
Total N:

U na cola
Total N ;

aCasi 1,00.

T a m a o d e l e fe c to

Pequeo
(r ~ 0 ,1 0 )

M e d ia n o
(r = 0 ,3 0 )

G ran de
( r ss 0 ,5 0 )

10
20
30
40
50
100

0 ,0 6
0,07
0,08
0,09
0,11
0,17

0,13
0,25
0,37
0 ,4 8
0 ,5 7
0,86

0,33
0 ,6 4
0,83
0 ,9 2
0,97

10
20
30
40
50
100

0,08
0,11
0,13
0,15
0,1 7
0,26

0 ,2 2
0 ,3 7
0,50
0,6 0
0,69
0,9 2

0,4 6
0,75
0,9 0
0,9 6
0,98

D o s colas
U na cola

P equeo
( r := 0 ,1 0 )

M e d ia n o
(r -0 ,3 0 )

G ra n d e
( r = 0 ,5 0

783
617

85
68

28
22

Terminologa relacionada con la


prediccin bivariada.
Modelo de prediccin bivariada con
puntuaciones Z.
Prediccin bivariada con puntuaciones
originarias.

'
,>: La recta de regresin.
>: Error y reduccin proporcional dei
error.
: ".(A.v
Otro ejemplo de prediccin bivariada.

Extensin a regresin y correlacin

describen en publicaciones cientficas,


^ Resumen. .
^ Trminos clave. . .
^ Ejercicios^ :

n este captulo, y sobre la base de lo aprendido en el captulo 3, estudiaremos una de


las principales aplicaciones prcticas de los mtodos estadsticos: realizar prediccio
nes. Normalmente, se recurre a psiclogos de distintas especialidades para solicitar
opiniones fundamentadas (y precisas) sobre temas tales como, por ejemplo, cul es la
probabilidad de que el aspirante a un empleo se desempee correctamente si se lo con
trata, cunto puede ayudar un programa de lectura a un determinado alumno de tercer grado o cules
son las probabilidades de que un convicto con posibilidad de salir en libertad condicional cometa un
crimen si se lo libera. Aprender los intrincados detalles de la prediccin estadstica tambin ayudar a
profundizar la comprensin de otros contenidos de la materia, y preparar al alumno para temas fun
damentales en cursos de estadstica ms avanzados.
A lo largo del captulo analizaremos los procedimientos para realizar predicciones referidas a
una variable (como el promedio de calificaciones universitarias), sobre la base de informacin re
lacionada con otra variable (como por ejemplo, las calificaciones s a t ) . Luego veremos cmo esti
mar la precisin esperada de las predicciones que realizamos utilizando estos procedimientos.
Finalmente, presentaremos situaciones en las que se realizan predicciones referidas a una va
riable (como el g p a ) que se basan en informacin relacionada con otras dos ms variables (co
mo por ejemplo las calificaciones s a t y el g p a del colegio secundario).

TERMINOLOGA RELACIONADA CON LA PREDICCIN BIVARIADA


En la prediccin bivariada bivariada significa con dos variables), tambin llamada regresin
bivriada,:se utiliza el valor observado de una variable en una persona (por ejemplo, calificacio
nes sat) para realizar predicciones sobre el valor de esa persona en otra variable (por ejemplo,

universitario). A los fines de recordar la terminologa presentada en el captulo 3, diremos que


la variable que ayuda a realizar la prediccin (como por ejemplo las calificaciones s a t ) se deno
mina Variable predictora. (Lavariable predictora recibe con frecuencia, el nombre de variajble
inde'pjdien'te, especialmente si se la considera causa de la otra variable), 'ti# variable para la
cual se realizan las predicciones (como por ejemplo el g p a universitario) generalmente se deno
mina variable dependiente. (La variable dependiente en una prediccin recibe el nombre tcnico
de variable triterio; pero este nombre es poco comn en la mayora de las reas de investigacin
psicolgica). slmente se rotula la variable de prediccin con una X y la variable dependiente
con una Y. Es decir, se utiliza el valor observado de una persona en X para predecir el valor Y. (La
tabla 4-1 resume las distintas denominaciones de las variables).
Ya nos hemos referido a estos dos tipos de variables en nuestra exposicin sobre correlacin
en el captulo 3. Sin embargo, en ese contexto haba relativamente muy poca diferencia con res
pecto a cul era cul, ya que slo nos interesaba el grado de relacin entre ambas. En el contexto
de las predicciones, sin embargo, es esencial estar seguro respecto de qu variable se estn reali
zando las predicciones y cul se est utilizando como ayuda para realizarlas.
g pa

MODELO DE PREDICCIN BIVARIADA CON PUNTUACIONES Z


Es ms simple aprender la prediccin bivariada si primero estudiamos la prediccin utilizando
puntuaciones Z, El modelo de prediccin, o frmula, que utilizamos para realizar predicciones
con puntuaciones Z es el siguiente: la puntuacin Z que se predice para una persona en la variable
dependiente se calcula multiplicando un nmero determinado, denominado coeficiente de regre
sin, por la puntuacin Z de esa persona en la variable de prediccin.
Dado que estamos trabajando con puntuaciones Z, a las que tambin se denominan puntua
ciones estndar, el coeficiente de regresin en este caso recibe el nombre de coeficiente de re
gresin estandarizado y se simboliza con la letra griega beta O ). Simblicamente:
(4-1)
En esta frmula,ZY es el valor predicho de la puntuacin Z de una persona en particular, en la va
riable dependiente F; el smbolo sombrero significa 'Valor predicho de; (3 es el coeficiente de
regresin estandarizado; Zx es la puntuacin Z de esa persona en particular en la variable predic
tora X.
Supongamos que en determinada escuela el coeficiente beta para predecir el g p a universitario
(al graduarse) a partir del s a i (al ingresar) es 0,3. Determinada persona qae quiere ingresar a ese
colegio tiene un s a t que corresponde a dos desvos estndares por sobre la media (es decir, una

Tabla 4-1.
D e n o m i n a c i n d e l a s d o s v a r i a b l e s e n l a p r e d i c c i n b iv a r i a d a .
V a r ia b le a p a r t ir d e la
c u a l s e p r e d ic e

V a r ia b le q u e
s e p r e d ic e

Variable predictora
Variable independiente

Variable dependiente
Variable criterio

N om bre
N om bre alternativo
Sm bolo

Ejemplo

calificaciones sat

gpa

universitario

puntuacin 2 de +2). La puntuacin Z predicha para el g p a de esa persona sera 0,3 por 2, io que
da 0,6. Es decir, la puntuacin Z predicha de esa persona para el g p a de su facultad es 0,6 desvos
estndares sobre la media. En smbolos es:
Zy = O)(Zx) = (0,3)(2) = 0,6

Coeficiente de regresin estandarizado (p) como r


El mejor nmero para utilizar como beta es el coeficiente de correlacin (hecho que puede pro
barse matemticamente utilizando mtodos que exceden el alcance de un texto introductorio). Es
decir, en la prediccin bivariada, 3= r.
Para comprender mejor el tema, analicemos dos situaciones extremas. Primero, supongamos
que no existe correlacin alguna entre la variable de prediccin y la dependiente. Cuando r= 0,
conocer el valor de una persona en la variable de prediccin no nos ayuda a realizar predicciones;
es simplemente irrelevante. Por lo tanto, nuestra mejor prediccin es que la persona tendr un va
lor en la variable dependiente igual al promedio. Al trabajar con puntuaciones Z, el promedio es
siempre 0. Por lo tanto, un coeficiente beta de 0 asegura que cualquiera sea el valor en la variable
independiente, la prediccin siempre ser igual a 0 (ya que 0 veces cualquier nmero es 0):
Cuando r = 0: Zy ^ (P) (Zx) = (0) (Zx) = 0
Ahora analicemos la situacin extrema en la que existe una correlacin perfecta (r = i) entre la
variable de prediccin y una variable dependiente. Cuando nos encontramos frente a una correla
cin perfecta, la puntuacin Z en la variable predictora es siempre igual a la puntuacin Z en la
variable dependiente. Cabe recordar lo planteado en el captulo 3: una correlacin significa que
los altos coinciden con los altos y los bajos con los bajos. Los valores altos y los bajos son medi
dos precisamente por las puntuaciones Z, y una correlacin perfecta significa que los valores al
tos coinciden perfectamente con los altos y los bajos perfectamente con los bajos. Cualquier
nmero multiplicado por 1 es igual a s mismo, y cuando existe una correlacin positiva perfecta,
beta es 1 (cuando existe una correlacin negativa perfecta, beta es = - 1):
Cuando r = 1: ZY = (p) (Zx) = (1) (Zx) = Zx
Por lo tanto, cuando la correlacin entre la variable predictora y la dependiente es 0, el mejor nu
mero para beta es 0; cuando la correlacin es 1, el mejor nmero para beta es 1. No es sorprenden
te entonces que en los casos intermedios, cuando r se ubica entre 0 y I, el mejor nmero para beta
tambin se ubique entre 0 y 1.
Ejemplo
Analicemos nuevamente el ejemplo del nivel de estrs de los gerentes presentado en el captulo 3.
En ese ejemplo, la correlacin entre la cantidad de empleados supervisados y el nivel de es
trs de los gerentes era 0,88; es decir, r = 0,88. Por lo tanto, B ~ 0,88, y el modelo para predecir la
puntuacin Z del nivel de estrs de un gerente es multiplicar 0,88 por la puntuacin Z correspon
diente a la cantidad de empleados que supervisar el gerente. Supongamos que un nuevo gerente
fuera a supervisar a 10 empleados. Esto representara una puntuacin Z de empleados supervisa
dos igual a +1,27. (Cambiamos la puntuacin original ele 10 a puntuacin Z utilizando el procedi
miento aprendido en el captulo 2: Z = [X - M]SD). As, predeciramos la puntuacin Z del nivel
de estrs de este nuevo gerente multiplicando 0,88 por 1,27. El resultado es 1,12, lo que significa
qu se puede predecir que un gerente que supervisa 10 empleados tendr un nivel de estrs apenas
mayor a 1 desvo estndar por sobre la media. Segn la frmula:

Por el contrario, supongamos que el nuevo gerente supervisar slo a 3 empleados. En ese caso,
el modelo predecira una puntuacin Z del nivel de estrs igual a 0,88 x (1,69) (la puntuacin Z
correspondiente si la cantidad supervisada fuera 3), lo que da un resultado de - 1,49. Es decir:
Zy = {)(%) = (0,88)(-l,69) = -1,49

Por qu a veces la prediccin se denomina regresin?


Los psiclogos usualmente se refieren a este tipo de prediccin como regresin. El trmino pro
viene del hecho de que cuando existe una correlacin menos que perfecta entre dos variables, la
puntuacin Z de la variable dependiente es una fraccin de la puntuacin Z de la variable predictora (la fraccin equivale al valor de r). Como resultado, la puntuacin Z de la variable depen
diente se encuentra ms cerca de su meda. Es decir, sufre una regresin o retorno hacia un Z de 0.
En el ejemplo del estrs sufrido por los gerentes, el nuevo gerente que iba a supervisar a 10
empleados tiene una puntuacin Z correspondiente a empleados supervisados igual a 1,27, pero
la puntuacin Z predicha para el nivel de estrs ha "sufrido una regresin a slo 1,12.

PREDICCIN Bl VARI A DA CON PUNTUACIONES ORIGINALES


En esta seccin analizamos dos formas de. realizar predicciones utilizando puntuaciones
orignales.

Convertir puntuaciones originales en Z. Realizar las predicciones.


Convertir puntuaciones Z en originales
Una manera de realizar predicciones con puntuaciones originales es la siguiente:
1. Convertir la puntuacin original de la variable de prediccin (X) en una puntuacin Z (Zx).
2. Multiplicar beta (el coeficiente de correlacin) por esa puntuacin Z (Z^) para obtener la
puntuacin Z predicha de la variable dependiente (Z y).
3. Convertir la puntuacin Z predicha de la variable dependiente (Z y) en una puntuacin ori
ginal (K).
En el ejemplo del estrs sufrido por los gerentes, cuando queramos predecir el nivel de
estrs de un gerente que supervisaba 10 empleados, primero convertamos 10 en puntuacin
Z (Zx = 1,27) (paso 1). Luego encontrbamos la puntuacin Z predicha para el nivel de estrs
multiplicando beta por el punto Z coirespondiente a la cantidad de empleados supervisados. (0,88
y 1,27 daba una puntuacin Z predicha,Z^ de 1,12) (paso 2). El paso 3 (que no realizamos ante
riormente) es convertir esa puntuacin Z predicha de 1,12 nuevamente en puntuacin original. Utili
zando la frmula del captulo 2 para convertir una puntuacin Z en una puntuacin original, el
resultado es 8,92 (V = 8,92). Es decir, utilizando el procedimiento de regresin, predecimos que
un gerente que supervisa 10 empleados tendr un nivel de estrs de 8,92.
La tabla 4-2 describe estos pasos aplicados al otro ejemplo (el ejemplo del gerente que super
visara a 3 personas).

T a b la 4 -2 .

Resumen de los pasos que se deben seguir para realizar predicciones con puntuaciones originales, a
travs de las conversiones de original a Z y de Z a original, utilizando frmulas y tomando un
ejemplo como base.
Ejemplo

P a so

F rm u la

Zx -(X ~M x)!SDx
Zr* m Z x )

2
3

Y - ( S D y) ( Z y) + M y

Z x ~ ( 3 - 7 ) 1 2 ,3 7 * - 1 , 6 9
Z y ~ (0,8S)(X,69) = - - l,4

>'= (2 ,6 1 )( -1 ,4 9 ) + 6 = 2,11

A] realizar los tres pasos indicados anteriormente, se debe poner especial atencin en utilizar la
media y el desvo estndar de la variable correspondiente al pasar de puntuaciones originales a
puntuaciones Z y de puntuaciones Z a puntuaciones originales. En el paso 1, se trabaja slo con el
valor, la media y el desvo estndar de la variable predictora (A). En el paso 3, se trabaja slo con
el valor, la media y el desvo estndar de la variable dependiente (E).

Prediccin directa de puntuacin origina! a puntuacin original


Un procedimiento alternativo reduce a una sola frmula el proceso de los tres pasos anteriormen
te utilizado. Esta sola frmula toma en cuenta automticamente la conversin en puntuaciones Z
y de puntuaciones Z (pasos 1 y 3). Es decir, si en el modelo de prediccin se incluyen las frmu
las para la conversin en puntuaciones Z, y de puntuaciones Z, y se realizan algunas manipulacio
nes algebraicas, se puede lograr una sola frmula de prediccin con puntuaciones originales:
:Y = a + (b)(X)

(4-2)

Esta frmula hace hincapi en dos trminos que an no hemos analizado, b y a. b es el coeficien
te de regresin para puntuaciones originales, es similar a J5, el coeficiente de regresin estan
darizado, excepto que b se utiliza slo con puntuaciones originales y no es igual al coeficiente de
correlacin, a es la constante de regresin, se agrega al valor predicho en la variable dependien
te de puntuaciones originales, para tomar en cuenta las medias de las distribuciones de puntuacio
nes originales. (Trabajando con puntuaciones Z, no es necesario utilizar la constante de regresin
debido a que las medias de las puntuaciones Z de las variables siempre son iguales a 0).
El coeficiente de regresin para puntuaciones originales (b) y la constante de regresin (a)
pueden calcularse directamente conociendo las medias y los desvos estndares de las dos varia
bles, y beta (que en el caso de las predicciones bivariadas es r):
SDy
SDX
V

(4-3)

a = M Y -{b)(M x )

(4-4)

=0)

Segn nuestro ejemplo del estrs sufrido por los gerentes, r = Mx = l> SDX = 2,37, My - 6, y SDy=2,61.
Entonces,

=(p)fe)=(, (f)= ,10)


0 88

(0,88)(1

=0,97

K sa + (fe)(X) = -0,79 + (0,97XX)


Si un gerente supervisa a 10 individuos, el nivel de estrs predicho ser igual a:
y = -0,79+ {0,97 XX) = -0,79+ (0,97 )(10) = - 0,79 + 9,7 = 8,91
Si supervisa a 3 personas:
Y = - 0,79+(0,97)(X) = - 0,79+ (0,97 )(3) * -0,79+2,91 = 2,12
(Como puede observarse, teniendo en cuenta los redondeos, los resultados coinciden con los clcu
los realizados utilizando el mtodo de tres pasos, que implica conversin de original a Z, predic
cin, conversin de Z a original).
De un modo ms general, analicemos el significado de b y a segn lo ilustra el siguiente
ejemplo: el coeficiente de regresin para puntuaciones originales (b) de 0,97 significa qu cada
aumento de una persona supervisada est ligado a un aumento de 0,97 puntos sobre el valor que
se predice para el nivel de estrs de los gerentes. Si se supervisan dos personas, se multiplica 0,97
por 2; si son tres, 0,97 por 3.
La constante de regresin (a) de -0,79 significa que, adems, se ajusta la prediccin restando
0,79 puntos a la escala de estrs, cualquiera sea la cantidad de empleados. Justamente se trata de
una constante porque siempre se utiliza el mismo valor.
La constante de regresin de -0,79 tambin indica que si X es , el registro de estrs ser de
-0,79. (Sin embargo, en este caso X es la cantidad de empleados supervisados, y resulta improba
ble que un gerente no supervise a ningn empleado, lo cual es un hecho afortunado, ya que tam
bin es improbable que alguien pudiera tener menos de 0 estrs).

LA RECTA DE REGRESIN
Un modelo de prediccin puede visualizarse como una recta en un grfico, en el que el eje hori
zontal representa los valores de la variable predictora y e eje vertical representa los valores prdichos de la variable dependiente. (El grfico se dibuja del mismo modo que los diagramas de
dispersin aprendidos en el captulo 3). La recta a la que nos referamos se llama recta de regre
sin, y representa la relacin entre los valores de la variable predictora y los valores predchos en
la variable dependiente. La figura 4-1 grfica la recta de regresin correspondiente al ejemplo de
los empleados supervisados (variable predictora) y el nivel de estrs de los gerentes (variable de
pendiente). Siguiendo la recta de regresin se puede encontrar el nivel de estrs predicho a partir
de cualquiera de las cantidades de empleados supervisados. Las lneas punteadas indican las pre
dicciones calculadas para los gerentes que supervisaban 3 y 10 personas.
Pendiente de la recta de regresin
Es particularmente interesante la inclinacin de la recta de,regresin, a la cual se denomina pen
diente. La pendiente indica cunto se eleva la recta por cada unidad de incremento de la variable
predictora, En el ejemplo de la figura 4-1, la lnea se eleva 0,97 puntos de estrs por cada perso-

Figura 4-1. Recta de regresin correspon


diente al ejemplo en el que se utilizaron pun
tuaciones originales para predecir el estrs de
los gerentes, con la indicacin de los niveles
predichos de estrs para gerentes que supervi
san 3 y 10 empleados.

na adicional supervisada. De hecho, la pendiente de la lnea es exactamente b, el coeficiente de


regresin. .
Esta equivalencia entre la pendiente de la recta de regresin y b acenta el hecho de que un
coeficiente de regresin sirve como una especie de razn de cambio entre la variable predictora
y la dependiente. Es decir, el coeficiente de regresin indica cuntas unidades predichas de la va
riable dependiente se obtienen por una cantidad dada de unidades de la variable de prediccin. Es
como saber que en determinado da, con un dlar canadiense se adquieren cinco francos france
ses. (De todos modos, no se debe abusar de esta analoga. Al cambiar dinero, realizamos una tran
saccin ms o menos exacta. Con los modelos de prediccin, el cambio es entre una cifra real en
la variable predictora y una cantidad predicha en la variable dependiente. Excepto en el caso de
una correlacin perfecta, la prediccin no ser exacta).

Cmo trazar la recta de regresin


El primer paso es establecer los ejes y los rtulos del grfico, conforme a lo aprendido en el cap
tulo 3, para construir un diagrama de dispersin. La recta de regresin es una lnea recta, de modo
que slo se necesita calcular la ubicacin de cualquier par de puntos y dibujar la recta que pasa a
travs de ellos. Los pasos que se deben seguir son cuatro, y los ilustraremos con el ejemplo de ni
vel de estrs de los gerentes:
1. Dibujar y rotular los ejes para un diagrama de dispersin de dos variables, segn se descri
be en el captulo 3, con la variable predictora en el eje horizontal. (Se podra utilizar la regla mnemotcnica lo conocido forma una base estable para lo que se predice o prev en las alturas). La
figura 4~2a ilustra este paso aplicado al ejemplo del nivel de estrs de ios gerentes.
2. Escoger cualquier valor de la variable predictora, calcular el correspondiente valor predi
cho en la variable dependiente y marcar el punto en el grfico. Si se selecciona un valor de la va
riable predictora igual a 2, el valor predicho en la variable dependiente, segn nuestro ejemplo,
ser: Q,79+(0,97x 2) = 1,15. En la figura 4-2b se ha marcado este punto (X = 2, Y = 1,15).
3. Repetir el paso 2 comenzando con cualquier otro valor de la variable predictora. (Se po
dr dibujar la recta de forma ms precisa si se escoge un valor de la variable predictora bastan

te diferente del primero). Segn el ejemplo que estamos utilizando, si se selecciona un valor
de la variable predictora igual a 8, la puntuacin Y predicha de la variable dependiente ser
-0,79 + (0,97 x 8) = 6,97. En la figura 4-2c se ha marcado este punto (X=s & ,Y- 6,97).
(Cabe recordar entonces que, para trazar una recta de regresin, se seleccionan arbitrariamen
te dos valores cualesquiera de X y se calcula el valor predicho de Y correspondiente a cada uno de
ellus; por lo tanto, se puede trazar una recta de regresin sin necesidad de contar con ningn valor
de X en particular).

Figura 4-2. Pasos que se debes seguir para trazar una recta de regresin utilizando el ejemplo del nivel de
estrs de los gerentes, a) Se dibujan y rotulan los ejes; b) se marca el punto cuyas coordenadas son un valor
de la variable predictora (2) y el correspondiente valor predicho calculado para la variable dependiente
(1,15); c) se marca un punto cuyas coordenadas son otro valor de la variable de prediccin (8) y su corres
pondiente valor predicho calculado para la variable dependiente (6,97), y d) se dibuja una recta que pase
por los dos puntos marcados. El grfico tambin indica que por cada unidad de incremento de X, la recta se
eleva 0,97 unidades.

4. Dibujar la recta que pasa por los dos puntos marcados. La figura 4-2d muestra la recta.
Se puede controlar la precisin de la lnea trazada calculando cualquier otro tercer punto. Un
punto fcil de localizar es el punto donde X ~ 0. Cuando X ~ 0, el valor predicho de Y es la cons
tante de regresin (a). (Cuando X - 0, (b)(X) = 0; por lo tanto, lo nico que queda de la frmula de
regresin es a). Frecuentemente, el diagrama de dispersin se realiza de forma tal que el eje verti
cal est ubicado donde X = 0. En ese caso, el punto en el que la lnea de regresin corta el eje ver
tical es el punto donde el valor predicho en Y es igual a a. Por esta razn, la constante de regresin
a veces tambin se denomina ordenada al origen (la ordenada del punto donde la recta de regre
sin intersecta o corta al eje Y).
Para mayor control, en cuanto a la precisin de la recta trazada, es posible verificar si la pen
diente coincide con b, es decir, cunto se eleva la recta por cada unidad de incremento de la varia
ble predictora. La figura 4-2d muestra con lneas punteadas que la pendiente es 0,97: por cada
unidad de incremento de X, la recta se eleva 0,97 unidades.

ERRORY REDUCCIN PROPORCIONAL DEL ERROR


Cun precisas son las predicciones que se realizan utilizando los procedimientos que hemos descripto? Normalmente uno predice el futuro y no existe modo de saber con seguridad qu es lo que
suceder. Pero, sin embargo, s se puede realizar una estimacin.
La estimacin puede realizarse analizando cun preciso hubiera sido el modelo de prediccin
de habrselo utilizado para realizar predicciones de los valores con los que se calcul el coefi
ciente de correlacin en primer lugar. Es decir, primero se crea una norma de prediccin calculan
do el coeficiente de correlacin con los valores observados de un grupo de individuos en
particular que hayan sido estudiados. Luego se utiliza esta norma de prediccin para realizar
predicciones para esos mismos individuos. Se realizan predicciones para cada individuo, in
cluyendo el valor X de esa persona dentro de la norma de prediccin y calculando el valor Y pre-,
dicho para esa persona. (Hemos puesto las palabras prediccin y predicho entre comillas
porque en realidad ya se conoce el valor Y de cada persona. Se est utilizando la norma de predic
cin pero para predecir algo que, en principio, ya se conoce). Una vez obtenido el valor Y predi
cho para cada individuo del grupo que originalmente se analiz, se pueden comparar, esos
valores Y predichos con los valores Y observados de los individuos analizados, S la norma de
prediccin es buena, entonces los valores Y predichos deberan ser muy similares a los valores
Y observados.
Por ejemplo, en el caso de los gerentes, no hay forma de saber a ciencia cierta cun precisas
sern las predicciones del nivel de estrs de nuevos gerentes. Pero uno puede preguntarse cun
precisas hubieran sido esas predicciones s s.e hubiera utilizado este modelo para predecir el nivel
de estrs de los gerentes que ya se han estudiado. Analicemos los cinco gerentes utilizados como
ejemplo en el captulo 3, La correlacin entre cantidad de empleados supervisados y nivel de es
trs calculado en ese caso era de 0 ,88, y siguiendo los pasos para convertir esta informacin en
una norma de prediccin con puntuaciones originales, descubrimos que" = -0,79 + (,97)(X).
Una vez realizado lo anterior, ahora se puede aplicar esa norma nuevamente a estos mismos
cinco gerentes; por ejemplo, el primero de los cinco gerentes supervisaba a 6 personas y sufra un
nivel de estrs de 7. Aplicando la norma de prediccin, el nivel de estrs predicho para este ge
rente sera de -0,79 4- (0,97)(), lo que da como resultado un nivel de estrs predicho de 5,03.
Las primeras tres columnas de la tabla 4-3 indican la cantidad de empleados supervisados, los
niveles reales de estrs y los valores de estrs predichos utilizando el modelo de prediccin. Se
puede observar que los valores de estrs predichos son moderadamente cercanos a los valores

observados de estrs. (Ahora que hemos explicado el tema, dejaremos de poner comillas a las pa
labras "prediccin y "pre dicho al referimos a la utilizacin del modelo de prediccin para calcu
lar Y con respecto a cada persona del grupo original de individuos analizados. Tampoco hemos
utilizado comillas en la tabla 4-3, pero cabe recordar que stas predicciones se estn realizando
con individuos cuyos valores Y observados ya conocemos. El propsito de desarrollar este proce
so no es conocer ms acerca de los individuos originalmente analizados, sino ms bien controlar
ia precisin de nuestra norma de prediccin).
Error y error cuadrtico
El siguiente paso es utilizar las predicciones referidas a las personas originalmente analizadas pa
ra determinar la precisin de la norma de prediccin. Para ello, primero se calcula cun alejadas
estn las predicciones realizadas, utilizando la norma de prediccin, de los valores observados de
los individuos analizados originalmente. Esta distancia es lo que denominamos error, es decir,
para cada individuo, el error es el valor observado menos el valor predicho.
El procedimiento siguiente es elevar cada error al cuadrado, obteniendo errores cuadra ticos.
Es decir:
Error2

(4-5)

Utilizar errores cuadrticos soluciona el problema de que algunos errores sean nmeros positivos
(la prediccin fue menos que la observacin) y otros sean nmeros negativos (la prediccin supe
r a la observacin). Si no se elevan los errores al cuadrado, cuando finalmente se sumen, los
errores positivos y negativos se cancelarn entre s. (La misma situacin se plante en el captulo
2 cuando trabajamos con desvos con respecto a la media).
Los errores y errores cuadrticos correspondientes a los gerentes dei ejemplo aparecen en las
ltimas dos columnas de la tabla 4-3

Interpretacin grfica del error


La figura 4-3 muestra el diagrama de dispersin que representa el ejemplo del nivel de estrs su
frido por ios gerentes, con su correspondiente recta de regresin. En el grfico, los cinco pares de
valores observados estn indicados con puntos; los valores de estrs predichos para todos los va-

Tabia 4-3.
Clculo del error y del error cuadrtico utilizando puntuaciones originales del ejemplo del nivel de
estrs sufrido por los gerentes (datos ficticios).
E m p le a d o s
S u p e r v is a d o s

N iv e l d e E s t r s

X
6

O b serva d o
Y
7

8
3
10
8

8
1
8
6

P r e d ic h o
Y

5,03
6,97
2 ,1 2
8,91
6,97

E rror

E rr o r *

Y -Y

(Y - Y

1,97
1,03
- 1 ,1 2
-0 ,9 1
- 0 ,9 7

3,88
1,06
1,25
0,83
0 .9 4
Sum a = 7 ,9 6

lores correspondientes a la cantidad de empleados supervisados se encuentran a lo largo de la


recta de regresin. Por lo tanto, el error correspondiente a cualquier gerente en particular est
dado por la distancia vertical entre el punto correspondiente al valor observado de ese gerente y
la recta de regresin. Se han dibujado lneas de puntos para indicar el error en cada caso.

Reduccin proporcional del error


Ahora bien, cul es la utilidad de los errores cuadrticos? El modo ms comn de considerar la
precisin de nuestro modelo de prediccin es comparar la cantidad de error cuadrtico, que pro
bablemente existira utilizando el modelo de prediccin, con la cantidad de error cuadrtico que
existira sin utilizar el modelo. La estrategia a seguir es la siguiente: a) calcular la cantidad de
error cuadrtico que existira si predijramos utilizando el modelo de prediccin; b) calcular la
cantidad de error cuadrtico que existira prediciendo sin utilizar el modelo, y c) comparar las
dos cantidades cuadrticas.
La cantidad de error cuadrtico que existira utilizando el modelo de prediccin es la suma
de los errores cuadrticos. Es decir, slo hay que sumar los errores cuadrticos de todos los in
dividuos originalmente analizados. En el ejemplo del nivel de estrs de los gerentes, equivaldra a
la suma de la ltima columna de la tabla 4-3, que resulta ser 7,96. La suma de los errores cuadr
ticos se abrevia SSErr0r. Por lo tanto, en nuestro ejemplo, SSError = 7,96.
Cmo se calcula la cantidad de error cuadrtico sin el modelo? Supongamos que no se pu
diera utilizar el modelo de prediccin, es decir, que no se pudiera tener en cuenta el nivel de ca
da individuo en la variable de prediccin. La regla general es la siguiente: si no es posible
utilizar el modelo de prediccin, la prediccin ms acertada ser predecir con la media el valor
de cada individuo.
Tomando nuevamente el ejemplo de los gerentes, si no se supiera nada sobre la variable de
prediccin (cantidad de empleados que supervisa cada gerente), la mejor estrategia sera predecir
que un gerente tendr un nivel de estrs igual a la media. Es decir, si no se pudiera utilizar infor
macin sobre cantidades de empleados supervisados, la mejor estrategia sera predecir un valor
de estrs de 6 para cada gerente.

F ig u r a 4 -3 . D iagram a d e d isp ersin para e l e je m


p lo d el n iv e l d e estrs d e lo s geren tes, c o n la recta
de regresin trazada y ln ea s pu nteadas q u e in d i
can lo s errores (d istan cia vertical d e sd e e l valor
o b servad o, in d icad o por un pu nto, y e l valor p redi
c h o , ind icado por e l co rresp on d ien te pu nto u b i
cad o sobre la recta de regresin ).

Analicemos otro ejemplo. Supongamos que se intentara predecir el g p a universitario de una


persona, pero que no fuera posible utilizar un modelo basado en el s a t o cualquier otra variable de
prediccin. En ese caso, la mejor apuesta seria predecir que el g p a universitario de esa persona se
ra el o p a universitario medio de los alumnos de esa facultad.
Por lo tanto, a cantidad de error cuadrtico al predecir sin un modelo es la cantidad de
error cuadrtico calculado al predecir con la media cada valor observado. Es importante re
cordar que el error, en general, es el valor observado menos el valor predicho. Cuando el valor
predicho es la media, el error es el valor observado menos la media, el error cuadrtico es el cua
drado de ese nmero, y la suma de estos errores cuadrticos es el error cuadrtico total al pre
decir con la media; llamamos a este nmero ,*SXotai(Lo que ahora llamamos SSTotal es lo mismo que llamamos SS en el captulo 2, como parte del
clculo de la varianza. Definimos SS como la suma de los desvos cuadrticos con respecto a la
media. Un desvo con respecto a la media es igual al valor observado menos la media, que es
exactamente lo mismo que el error que resulta cuando la prediccin es la media).
Abora conocemos a ambos, (a) la suma de ios errores cuadrticos al predecir utilizando el
modelo de prediccin (SSEm() y (b) la suma de los errores cuadrticos al predecir utilizando la
media (55Total). La ventaja del modelo de prediccin es la ventaja de SSrror con respecto a SSXotaI,
es decir, la medida en la cual cometemos menos errores utilizando el modelo de prediccin que
utilizando la media. Con un buen modelo de prediccin, SSEmr debera ser menor que ,S'Totai.
La comparacin mencionada en el prrafo anterior es un indicador de la precisin del modelo
de prediccin, y se denomina redaccin proporcional del error. Para calcular la reduccin pro
porcional del error, primero se debe encontrar la reduccin del error, es decir, la diferencia entre
el error cuadrtico ai predecir utilizando la media (5>STota{) y el error cuadrtico utilizando el mo
delo de prediccin (&Snor). Es decir, se calcula 'Totai~ SSE[[0. Luego, el resultado, que es la re
duccin del error cuadrtico que se logra utilizando el modelo de prediccin, se divide por la
cantidad total del error. Se representa mediante la frmula:
R e d u c c i n proporcional d el error

Sfibrai

(4-6)

Es decir, utilizar la media para predecir no es un mtodo muy preciso porque produce mucho
error. Mediante el clculo descripto se comprueba cunto mejor se puede realizar la prediccin.
La proporcin de error cuadrtico en el que se incurrira utilizando la media se reduce utilizando
la norma de prediccin.
Analicemos una situacin en la que el modelo de prediccin no produce ninguna mejora en
comparacin con la prediccin que se realiza utilizando la media. En este caso, SSEaos es igual a
^Tciai (^Error nunca puede ser menor que SSTm). El modelo de prediccin no ha reducido el
error (S5Tok - SSEr0t ~ 0) y ha reducido un 0% el error total (Q/55 ^ = 0).
Ahora analicemos una situacin en la que el modelo de prediccin realiza predicciones per
fectas, sin ningn error. El modelo de prediccin ha reducido el error en un 100%. (Expresado
con la ecuacin, si i$'Error = 0, entonces el numerador ser SSTt - 0, SSTotal; dividir SSTo{al por
STo;ai da 1, o sea un 100%).
En la mayora de los casos reales, a reduccin proporcional del error se encuentra entre el
0% y el 100%.

Ejemplo
La tabla 4-4 indica las predicciones con puntuaciones originales, errores, errores cuadrticos, su
mas de errores cuadrticos y reducciones proporcionales del error en l estudio del nivel de estrs
de los gerentes. De la tabla se desprende que a travs del modelo de prediccin se reduce en un
77% el error en el que se incurrira utilizando la media como predictor.

Reduccin proporcional del error como r2


La reduccin proporcional del error siempre es igual al cuadrado del coeficiente de correlacin.
Es decir:
Reduccin proporcional del error = r2
(4-7)
Debido a esta equivalencia, r2 se utiliza generalmente como smbolo de la reduccin proporcional
del error.
Por ejemplo, en el estudio del nivel de estrs de los gerentes, el coeficiente de correlacin era
0,88, y 0,88 al cuadrado es 0,77. Es decir, r2 = 0,77. Este nmero (0,77) es exactamente igual al
que acabamos de calcular a travs de los valores predichos, errores, errores cuadrticos, sumas de
errores cuadrticos y reduccin proporcional del error cuadrtico.
Calculamos la reduccin proporcional del error tan laboriosamente slo para facilitarla com
prensin de este importante concepto. (Para incorporar la lgica, recomendamos realizar el mis
mo procedimiento con algunos ejemplos adicionales, como los que aparecen en los ejercicios).
Sin embargo, en un caso real de investigacin, se utilizara el procedimiento simple de elevar el
coeficiente de correlacin al cuadrado.
La reduccin proporcional del error a veces se denomina proporcin de varianza explica
da. Se utiliza este nombre porque SS7otli es una especie de medida de varianza a partir de la media
de la variable dependiente, y est muy relacionada con la varianza de la variable dependiente.
(SSTotai es lo mismo que SS en la frmula de varianza: es el nmero que al ser dividido por N da
como resultado la varianza). La reduccin proporcional del error indica cunto disminuye la
SSTQt3 o cunto explica el modelo de prediccin de esa TotaI. Por lo tanto, la reduccin propor
cionad del error es tambin la proporcin en que se reduce ese cierto tipo de varianza.

Tabla 4-4.
Clculo de la reduccin proporcional del error en el ejemplo del nivel de estrs de los gerentes
(datos ficticios).
Observacin

Prediccin utilizando la media

M e d ia

7
8
1
8
6

6
6
6
6
6

E rror

Utilizando el modelo de prediccin

E rro r1

1
2
4
-5
25
2
4
0
0
^To< a 34

S S ' ~ S S Pfrne

R educcin proporcional del error = ~ ~ ~ ------- ssc

^*Totaf

E rro r

5,03
, 97
2 ,1 2
8,91
6,97

1,97
1,03
-1 ,1 2
- 0,91
- 0,97

3 4 - 7 ,9
= ------

34

E rro r1

3,88
1,06
1,25
0,83
0,94
^ Etr* 7,96
26,04
=

= 0,77

j4______

Interpretacin grfica de la reduccin proporcional del error


Supongamos que se predijera la media para cada valor. En un grfico, la lnea que represente es
tas predicciones (todas referidas a la media) sera una recta horizontal. No importa cul sea el va
lor de la variable de prediccin, la prediccin en la variable dependiente es la misma, la media.
La figura 4-4 representa el diagrama de dispersin del ejemplo del nivel de estrs de los ge
rentes. Tambin ilustra la recta de regresin calculada con el modelo de prediccin y la recta hori
zontal de la prediccin utilizando la media. Se puede observar que, en la mayora de los casos, la
recta de regresin est ms cerca del punto que la recta horizontal. Es decir, la recta basada en el
modelo de prediccin, generalmente est ms cerca de los puntos que la recta basada en la predic
cin por la media. La reduccin proporcional del error puede considerarse como la medida en la
que la precisin de la recta de regresin es mayor que la precisin de la recta horizontal1.

OTRO EJEMPLO DE PREDICCIN BIVARIADA_______________ ______________


Apliquemos ahora los distintos aspectos de la prediccin bivariada al ejemplo del experimento
ficticio del captulo 3, que indaga sobre la memoria. La tabla 4-5 indica las medias y los desvos
estndares de las dos variables, as como tambin la correlacin entre ellas.

F igura 4-4. D ia g ra m a d e d isp ersi n co rresp o n d ien


te al e je m p lo d e l n iv el d e estrs d e lo s g eren tes,
q u e m u estra la recta d e regresin u tiliza n d o e l m o
d e lo d e p red icci n y la recta horizon tal qu e repre
sen ta las p red iccio n es realizad as utilizando la
m ed ia. L o s pu ntos qu e representan io s valores o b
serv a d o s, en gen eral, s e encuentran m s cerca d e la
recta de reg resi n que d e la recta horizontal.

1 Existe otra forma menos co m n de medir la precisin del modelo de prediccin, denominada error estndar de esti
macin. ndica, aproximadamente, la distancia promedio entre los puntos y la lnea de regresin. Expresado con pala
bras, es la raz cuadrada de promedio de los errores cuadrticos, en smbolos ^ I S S ^ Z J ). (El error estndar de
estimacin, com o indicador de la variacin de ios valores con respecto a lo que se esperara aplicando la norma de pre
diccin, es un mtodo paralelo a utilizar el desvo estndar com o indicador del desvo tpico de los valores con respec
to a la media). Sin embargo, el error estndar de estimacin rara vez se menciona en los artculos de investigacin
psicolgica. Por lo tanto, en este libro no nos concentramos en ese concepto. N o se debe confundir el error estndar de
estimacin con lo que a menudo se denomina simplemente error estndar (tcnicamente este ltimo es el error es
tndar del coeficiente de correlacin o el error estndar del coeficiente de regresin"), que est relacionado con la
significacin estadstica, y que trataremos en el captulo 7.

Al utilizar puntuaciones Z, el modelo de prediccin consistir en multiplicar beta, que es 0,68


(igual a r), por la puntuacin Z correspondiente a la cantidad de exposiciones.
Zi- = (P)(s*r)= C0,68

Supongamos que una persona sea expuesta siete veces a cada palabra. Siete es igual a una puntua
cin Z de 1,09. Entonces se podra predecir que la puntuacin Z de esa persona en la variable "pa
labras recordadas sera de 0,68 por 1,09. El resultado es una puntuacin Z predicha de 0,74 para
las palabras recordadas, Supongamos que otra persona observar cada palabra slo cuatro veces
(una puntuacin Z de -0,22 para las 4 exposiciones). En este caso, se predecira una puntuacin Z
de -0,15 para las palabras recordadas. Es decir, 0,68 x -0,22 = -0,15. Los dos ejemplos se repre
sentan por medio de las siguientes frmulas:
Para Z* = 1,09: ZK= (0) (Z*) = (0,68) (1,09) = 0,74
Para Z* = -0,22: Zy = (0) (Zx) - (0,68) (-0,22) = 0,15
Sin embargo, cabe recordar que existen dos mtodos. Primero, se puede proceder como acabamos
de hacerlo. Se puede convertir la puntuacin original de la variable de prediccin en puntuacin
Z, realizar la prediccin y luego convertir la puntuacin Z predicha de la variable dependiente en
una puntuacin original. En cuanto al resultado del primer ejemplo, una puntuacin Z predicha de
0,74 para las palabras recordadas es equivalente a una puntuacin original de 7,2 palabras recor
dadas. (La media de 5,6 ms el producto de Z de 0,74 por el desvo estndar de 2,1). Similarmen
te, una puntuacin Z predicha de -0,15 es equivalente a una puntuacin original de 5,3 palabras,
Es decir, 5,6 + (2,1 x [-0,15]) = 5,3.
Otra alternativa sera utilizar el modelo de prediccin con puntuaciones originales para aho
rrar algunos pasos. En ese caso, el clculo sera el siguiente:

* M Y ~ (b){Mx ) = 5,6 - (0,63 )(4,5) 5,6-2,84 = 2,76

Y~a +(b)(X) = 2,76+(0,63 )(Z)


S una persona accede a siete exposiciones:
Y

= 2,76+(0,63 )(X ) = 2,76 + (0,63)(7) = 2,76 + 4,4} = 7,17

Tabla 4-5.
Medas y desvos estndares del experimento acerca del efecto de la cantidad de exposiciones sobre
la cantidad de palabras recordadas (datos ficticios).

M ean
Standard deviation
Correlation

Cantidad de exposiciones
(variable predictora)

Cantidad recordada
(variable dependiente)

4,5
2,29

2,1

5,6
r=0,68

Si una persona accede a cuatro exposiciones:


r = 2,76 +( 0,63 XX) ~ 2,76 + (0,63 ){4) = 2,76 + 2,52 = 5,28
(Los resultados concuerdan con las cifras ms redondeadas que calculamos utilizando el mtodo
de transformacin de puntuaciones originales a Z, prediccin, y transformacin de Z a puntuacio
nes originales).
La figura 4-5 es un grfico que representa las dos variables y la recta de regresin correspon
diente a la frmula de prediccin, junto con las lneas punteadas, que indican las dos predicciones
aqu calculadas.
Qu podemos decir sobre la precisin de la prediccin? La tabla 4-6 muestra, para cada par
ticipante que intervino en el experimento, el valor observado, el valor que se hubiera predicho uti
lizando el modelo de prediccin, los errores (diferencias) y ios errores cuadrticos.
En este ejemplo, a suma de los errores cuadrticos, al predecir utilizando el modelo de pre
diccin (l$''Error), es de 39,65. Para calcular la reduccin proporcional del error, tambin se necesi
ta la suma del error cuadrtico al predecir utilizando la media (SSTotal), El resultado es 0,72. (Si el
alumno lo desea puede controlar el resultado calculndolo por s mismo). Cabe recordar que, pa
ra obtener SSTotal, primero se debe calcular cada valor menos la media para obtener el error. Lue
go se eleva al cuadrado cada uno de esos errores y se suman. Por ejemplo, en el caso del primer
participante, el error cuadrtico al predecir utilizando la media es el valor 4 menos la meda de
5,6, lo que da un error de - 1,6 y un error cuadrtico de 2,56).
En este ejemplo, utilizar la norma de prediccin reduce el error cuadrtico casi a la mitad, de
72 a 39,65. Para ser precisos, al dividirla reduccin de 32,35 por el &STo{aJ de 72, resulta en una re
duccin proporcional del error de 0,45 ( 45%). El mismo es representado mediante la frmula:
Reduccin proporcional del error =
Totai -^Error 72-39,65 _ 32,35 _ Q^
STota!
72
72

Figura 4-5. R ecta de regresin d e l e je m p lo d e la s


palabras recordadas, en la q u e s e in d ica la cantidad
p redicha d e palabras recordadas por in d iv id u os
q u e tu vieron cuatro y s iete e x p o s ic io n e s d e cada
palabra.

Esta cifra tambin coincide (teniendo en cuenta los redondeos) con el cuadrado del coeficiente de
correlacin.
Reduccin proporcional de error = r2 = 0,682 = 0,46
Finalmente, la figura 4-6 muestra el diagrama de dispersin con la correspondiente recta de regresin.

Tabla 4-6.
Valores observados y predlchos y errores en el experimento que indagan el efecto de la cantidad de
exposiciones sobre la cantidad de palabras recordadas (datos ficticios).
Sujeto
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

Cantidad de
exposiciones

Cantidad de
palabras recordadas

1
1
2
2
3
3
4
4
5
5
6
6
7
7
8
8

4
3
3
5
6
4
4
6
5
7
2
9
6
8
9
8

3,4
3,4
4,0
4,0
4,6
4,6
5,3
5,3
5,9
5,9
6,5
6,5
7,1
7,1
7,8
7,8

Error

Error3

0,6
-0,4
1,0
1,0
1,4
-0,6
-1,3
0,7
-0,9
1,1
-4,5
2,5
-1,1
0,9
-1,3
0,2

0,36
0,16
1,00
1,00
1,96
0,36
1,69
0,49
0,81
1,21
20,25
6,25
1,21
0,81
1,69
0,40

^Brror = 39,65

Figura 4-6. D iagram a d e d isp ersin d e l ejem p lo


qu e trata sobre la cantidad d e palabras recordadas,
c o n la corresp on d ien te recta d e regresin.

EXTENSIN A CORRELACIN Y RECRESIN MLTIPLES


Hasta aqu hemos aprendido a predecir el valor de una persona en la variable dependiente utili
zando el valor de esa misma persona en una sola variable predietora. Es decir, se predice una va
riable dependiente (como puede ser el nivel de estrs) sobre la base de una variable predietora
(como la cantidad de personal supervisado). Qu sucedera si se pudieran utiliza1*variables predictoras adicionales? Por ejemplo, al predecir el nivel de estrs de los gerentes, supongamos que
adems de la cantidad de personal supervisado, tambin se conociera el nivel de ruido y los pla
zos que cada gerente tiene que cumplir cada mes. Con esta informacin adicional, se podra reali
zar una prediccin del nivel de estrs mucho ms acertada.
La asociacin entre una variable dependiente y dos o ms variables se denomina correla
cin mltiple. Realizar predicciones en la situacin anteriormente descripta se denomina regresin
mltiple.2
Los detalles de la lgica y de los procedimientos de clculo, y los puntos delicados de la utili
zacin de la regresin mltiple exceden el alcance de un libro introductorio. Sin embargo, s po
demos presentar suficiente terminologa e ideas clave como para que, al leer artculos de
investigacin, se pueda comprender el tema en forma general.
Es importante comprender los fundamentos de la regresin mltiple dado que la misma es
muy comn en la investigacin psicolgica. La regresin mltiple se utiliza prcticamente en uno
de cada cinco artculos publicados en la revista cientfica de psicologa social ms importante
(Reis & Stiller, 1992). Es probablemente ms comn aun en artculos de investigacin de otras
reas de la psicologa, como la del desarrollo, la personalidad, la psicologa clnica y la'mayora
de las reas aplicadas. De hecho, la regresin mltiple es mucho ms comn que la regresin bivariada. En este captulo, hemos enseado la regresin bvariada con cierto detalle principalmen
te para crear los cimientos que permitan comprender este procedimiento ms abstracto.

Modelo de prediccin con puntuaciones Z para la regresin mltiple


En el caso de la regresin mltiple, cada variable predietora tiene su propio coeficiente de regre
sin. Para encontrar la puntuacin Z predicha de la variable dependiente, se multiplica la pun
tuacin Z de cada variable de prediccin por su beta (coeficiente de regresin estandarizado) y
luego se suman los productos obtenidos. En smbolos:
Zy = (,)(ZXl) -f

){ZX, ) + (3)(Zy3.)

(4-8)

En esta frmula, es el coeficiene de regresin estandarizado de a primera -variable predietora;


[2 y ($3 son los coeficientes de regresin estandarizados de la segunda y tercera variable. ZX{ es la
puntuacin Z de la primera variable predietora; Z%2 y Zx%son las puntuaciones Z de la segunda y
tercera variables predictoras (j^XZ^), significa multiplicar 3 por ZXl, y as sucesivamente.
Ms adelante se detalla el modelo de regresin mltiple correspondiente al ejemplo del nivel
de estrs de los gerentes. No hemos enseado1cmo calcular los pj correspondientes, debido a
que ese clculo est muy lejos del alcance de un texto introductorio. Por otro lado, en las investi
gaciones, casi siempre se calculan por computadora. En este modelo, el nivel de estrs es Y, la

2 Tambin existen procedimientos que permiten utilizar ms de una variable dependiente. Por ejemplo, podra ser

necesario averiguar' en qu medida la variable predietora cantidad de empleados" supervisados es adecuada, tanto
para d nivel de estrs com o para la cantidad de ausentismo, Los procedimientos que involucran ms de una variable
dependiente se denominan de "estadstica multivariada y son bastante avanzados. En el captulo 17 se presentan
algunos ejemplos.

. cantidad de empleados supervisados es X v el nivel de mido es X2 y la cantidad de plazos que se


deben cumplir por mes es Xy
Zy

- (0.51XZ*,) +(0,UXZ*2)+(0,33)(Z*,)

Supongamos que se intenta predecir el nivel de estrs de un nuevo gerente que tena una puntua
cin Z de 1,27 correspondiente a la cantidad de empleados para supervisar (una cantidad bastante,
alta), una puntuacin Z de -1,81 con respecto al ruido en las condiciones de trabajo (un bajo nivel
de ruido) y una puntuacin Z de 0,94 en relacin con la cantidad de plazos que se deben cumplir
por mes (una cantidad un poco alta de vencimientos). Para encontrar la puntuacin Z predicha del
nivel de estrs, se debe multiplicar 0,51 por la puntuacin Z de empleados supervisados, 0,11 por
la puntuacin Z de nivel de ruido y 0,33 por la puntuacin Z de los vencimientos. Luego, se deben
sumar los resultados.
Zy = (0,51 }(i,27) + (0,n)(l,81) + (0,33}( 0,94) = 0,65 +-0,20+0,31= 0,76
Por lo tanto, para un gerente que trabaja en esas condiciones se predecira una puntuacin Z de ni
vel de estrs de 0,76. Es decir, un nivel de estrs de aproximadamente tres cuartas partes de un
desvo estndar por sobre ia media.

Relacin entre los coeficientes beta de la regresin mltiple y las correlaciones comunes
Existe una diferencia particularmente importante entre la regresin mltiple y la prediccin cuan
do se utiliza slo una variable de prediccin. En la regresin bivariada, (3= r. En la regresin ml
tiple, en general [3 no es igual a r. Es decir, el beta de una variable predictora en particular no es
igual a la correlacin comn de esa variable predictora con la variable dependiente.' En la mayora
de los casos, beta ser menor (ms cercana a 0) que r.
La razn de esta discrepancia es que las variables predictoras generalmente estn correlacio
nadas entre s. Por lo tanto, parte de aquello que hace de una variable predictora un exitoso medio
de prediccin de la variable dependiente se superpone con lo que hace a las otras variables pre
dictoras exitosas para predecir la variable dependiente. Por lo tanto, las correlaciones de cada va
riable predictora con la variable dependiente son, en cierta medida, redundantes, ya que lo que
contiene cada variable de prediccin se superpone con lo que contienen las otras variables predic
toras. Sin embargo, et;o no sucede con los beta. En Ja regresin mltiple, beta se calcula de modo
que pueda ser la contribucin nica y distintiva de la variable predictora a la prediccin de la va
riable dependiente; Los coeficientes beta excluyen cualquier superposicin con otras variables de
prediccin.3
Analicemos el ejemplo del nivel de estrs de los gerentes. Cuando realizamos la prediccin
utilizando slo la cantidad de empleados supervisados, beta era igual al coeficiente de correlacin

3 Tcnicamente, la contribucin nica a la reduccin proporcional del error de una variable predictora, en e l contexto de
las otras variables de prediccin, es un clculo estadstico denominado correlacin s e m ip a r m l cuadrtica (ir 1), un
nmero que ocasionalmente aparece en artculos de investigacin. Sin embargo, es ms comn que ios investigadores
de aspectos psicolgicos informen slo las betas y luego hablen de ellas com o indicadores aproximados de la contribu
cin nica de una variable. Siempre que se tenga en cuenta que son "aproximados, esto resulta razonable, ya que beta
y sr2 estn estrechamente relacionadas. Una beta alta generalmente corresponde a una sr2 alta, el signo (positivo o ne
gativo) de una beta es siempre el mismo que el de una sr3, y la significacin de una beta es siempre la misma que la de
.sr2. En todo caso, debido a este uso comn (y adems porque tratar adecuadamente el tema de sr2 excede el alcance de
un texto introductorio), nuestra exposicin adopta esta interpretacin amplia de beta com o indicador de la contribucin
nica de una variable a la prediccin.

de 0,88. Ahora bien, en el ejemplo con regresin mltiple, el beta de empleados supervisados es de
slo 0,51. Beta es menor debido a que parte de lo que hace que la cantidad de empleados supervi
sados pueda predecir el nivel de estrs se superpone con aquello que hace que el ruido y ia canti
dad de vencimientos predigan el estrs. (Por ejemplo, parte de lo que hace que la cantidad de
personas supervisadas prediga el estrs es que esa cantidad de personas supervisadas aumenta el
nivel de ruido).

Regresin mltiple con puntuaciones originales


Al igual que con la regresin bivariada, en la regresin mltiple es posible utilizar una frmu
la de prediccin con puntuaciones originales. Con tres variables de prediccin y la constante
de regresin a (si este concepto no est muy presente en la memoria del alumno, es convenien
te que releyera la seccin de regresin bivariada con puntuaciones originales), la frmula es la
siguiente:

? = fl + (p1)(X1) + {62XX2) + (fr)XX3)

(4.9)

Supongamos que en el ejemplo del nivel de estrs de los gerentes contramos con la informacin
necesaria con respecto a los cuatro gerentes, y calculramos los datos utilizando un procedimien
to similar al que utilizamos para la regresin bivariada con puntuaciones originales. El modelo de
prediccin con puntuaciones originales podra ser el siguiente;
Y = -4,70+(0,56 )(X)+(0,06 )(X2)+(0,86)(X3)
Supongamos que un posible gerente iba a supervisar a 8 personas, con un muy alto nivel de ruido
de 85 decbeles y con 4 vencimientos por mes (ei cual es mayor que el promedio de 3). El nivel de
estrs esperado sera bastante alto:
Y = -4,70+ (0,56 )(8) + (0,06)(85) + (0,86)(4)
* -4,70 + 4,48 4- 5, + 3,44 = 8,32
Es decir, la prediccin del nivel de estrs de este gerente sera de 8,32.
Cada coeficiente de regresin de puntuaciones originales (b) es ia razn de cambio de las
puntuaciones originales de la variable predctora correspondiente, en el contexto de las otras va
riables de prediccin. As, a determinado nivel de cantidad de empleados supervisados y ruido,
cada vencimiento adicional aumenta el valor de estrs predicho en 0,86 puntos. De modo similar,
a cualquier nivel de empleados supervisados y cantidad de vencimientos, cada decibel de ruido
aumenta el valor de estrs predicho en 0,06 puntos; a cualquier nivel de ruido y cantidad de venci
mientos, cada persona adicional supervisada aumenta el valor de estrs predicho en 0,56 puntos.

Coeficiente de correlacin mltiple


El coeficiente de correlacin mltiple (generalmente simbolizado con R) describe la correla
cin total entre las variables predictoras, tomadas en su conjunto, y la variable dependiente.
Todas las variables predictoras contribuyen a Ja correlacin. Por lo tanto, R debe ser ai menos
tan alta como la correlacin individual ms alta de una variable predictora con respecto a la varia
ble dependiente. Sin embargo, por lo general cada variable predictora se superpone con las otras
en su asociacin con la variable dependiente. Por lo tanto, usualmente el coeficiente de correa-

cin mltiple es menor que la suma de las correlaciones de cada variable predictora con la varia
ble dependiente.
En el ejemplo del nivel de estrs de los gerentes, si suponemos que las tres r con respecto a la
variable dependiente son de 0,88 (empleados supervisados con respecto al nivel de estrs), 0,38
(nivel de ruido con respecto al nivel de estrs) y 0,63 (vencimientos con respecto a nivel del es
trs), la correlacin mltiple de la variable de estrs con las tres predctoras tomadas en conjunto
deber ser al menos de 0,88 (la mayor de las tres correlaciones). Es decir, la correlacin con las
tres variables en su conjunto no podra ser menor que la correlacin con cualquiera de ellas por
separado. Por otro lado, R no podra ser mayor que la suma de los valores r, que en este caso es
igual a 1,89 (0,88 + 0,38 + 0,63). De hecho, R, al igual que r, nunca podr ser mayor a 1. No im
porta cuntas variables de prediccin se utilicen. En el ejemplo, R - 0,96 (R tiene un rango de 0 a
1. A diferencia de r, R no puede ser negativa, por razones por las que no nos preocuparemos aho
ra. Cabe recordar, sin embargo, que beta o b, ya sea en la regresin bivariada o mltiple, pueden
ser negativas y mayores que 1).

Reduccin proporcional del error en la regresin mltiple


Finalmente, al igual que con la prediccin bivariada, se puede calcular la reduccin proporcional
del error. Error en la regresin mltiple es lo mismo que error en la regresin bivariada, de modo
que, si es necesario, es vlido repasar la exposicin que hemos hecho anteriormente sobre este te
ma, Como siempre, el error se calcula tomando e valor real y restndole el valor predicho. Sin
embargo, en este caso, el valor predicho se obtiene utilizando un modelo de prediccin de regre
sin mltiple. Una vez que se obtienen los valores predichos, el error cuadrtico, la suma de los
errores cuadrticos (SSEuot) y la reduccin proporcional del error cuadrtico, tambin se calculan
todos exactamente del mismo modo que con la prediccin bivariada. En la regresin mltiple, co
mo en la regresin bivariada, la reduccin proporcional del error compara SSEn0I con SSTotal (SSTo,
tai, cabe recordar, es la suma de los errores cuadrticos que surgen al utilizar la media de la
variable dependiente como valor predicho para esa variable). Asimismo, al igual que con la pre
diccin bivariada, el resultado es el cuadrado del coeficiente de correlacin (en este caso, i?2). En
el ejemplo, si R s 0,96, R2 = 0,92.
Finalmente, al igual que con la prediccin bivariada, R2 tambin es la proporcin de varianza
explicada. Es decir, R2 indica cunto de la variacin en la variable dependiente es explicada (pre
dicha) por e conjunto de variables de prediccin. En el ejemplo, el 92% de la variacin en el nivel
de estrs de los gerentes est explicada por la cantidad de empleados supervisados en el nivel de
raido y en la cantidad de vencimientos por mes.

Ejemplo de regresin y correlacin mltiples


Watts y Wrigh (1990) entregaron cuestionarios sobre delincuencia y consumo de sustancias a
estudiantes secundarios de sexo m asculino y a delincuentes convictos del mismo sexo que resi
dan en las instalaciones de la Comisin Juvenil de Texas. La tabla 4-7 muestra los resultados
correspondientes a uno de los grupos tnicos estudiados. Como se puede observar, existen coe
ficientes de correlacin considerables entre el nivel de delincuencia violenta y el consumo de
cada tipo de sustancia. Sin embargo, es interesante observar lo que sucede cuando las variables
predctoras se consideran en su conjunto (en la ecuacin de regresin mltiple). Los coeficien
tes beta varan considerablemente. Planteado como un modelo de regresin mltiple con pun
tuaciones Z, sera;

Prediccin

129

T a b la 4 - 7 .

Consumo de drogas como predictor de la delincuencia.


D r o g a co n su m id a
A lcohol
Tabaco
Marihuana
Otras drogas ilegales

0,415
0 ,415
0,513
0,7 1 2

-0 ,0 0 7
0 ,1 8 3
-0 ,0 4 6
0 ,6 7 7

R = 0 ,729 \ R l = 0,531

Fuente: Watts, W,, & Wright, L. (1990). "La relacin entre el consumo de alcohol, tabaco, marihuana y otras drogas ile
gales con la delincuencia entre adolescentes americanos-mexicanos, negros y blancos de sexo masculino. A d o lescen cia ,
2 5 ,1 7 1 -1 8 1 , Reimpreso con autorizacin.

D elincuencia (

0>007 )(Acoho ) "**( 0,183)(%Tabaco )

+ ( ~ 0 ,0 4 6 ) ( z Majihuana) + ( 0 ,6 7 7 )(Z 0tras)

Ai considerarlos en combinacin, el principal factor al realizar predicciones de delincuencia vio


lenta parecera ser el consumo de "otras drogas ilegales, y un factor secundario podra ser el con
sumo de tabaco. Es decir que conociendo el consumo'de otras drogas y de tabaco, el conocimiento
del consumo de alcohol y marihuana no agrega mucho a la capacidad para realizar predicciones
sobre la delincuencia. Por ejemplo, la prediccin sobre la base del consumo de alcohol es bastan
te importante si se lo considera individualmente (0,415), pero es casi insignificante (-0,007)
cuando se conoce el consumo de otras drogas. Esto sucede porque toda informacin para la pre
diccin, aportada por el conocimiento del nivel de consumo de alcohol, probablemente ya es
aportada por el conocimiento del nivel de consumo de otras drogas por parte de esa persona.
(Cabe recordar que para este estudio se utiliz un diseo de correlacin. Por lo tanto, no po
demos estar seguros de cul es la causa y cul el efecto. Muy bien podra ser que el consumo de
drogas fuera el resultado y no la causa de la delincuencia. Tambin es posible que un tercer factor,
como ei tipo de ambiente en el que fueron criados los jvenes, sea la causa tanto del consumo de
sustancias como del nivel de delincuencia.
Tambin se podra utilizar la frmula de regresin mltiple para realizar predicciones. Su
pongamos que estuviramos interesados en predecir el grado de delincuencia violenta de un jo
ven con una puntuacin Z de -1 en el consumo de alcohol, una Z de 0 (la media) con respecto al
consumo de tabaco, una Z de +1 con respecto al consumo de marihuana y una Z de -2 con respec
to al consumo de otras drogas ilegales. Utilizando el modelo de regresin mltiple con puntuacio
nes Z, la prediccin sera la siguiente:
Delincuencia = ("0,007}(~l) + ( 0,183)(0) + (~0,046)(1) +

(0,677)(~2)

= 0,007 + 0 +-0,046 +-1,354' =-1,393


En el caso de este joven, se predecira un registro bastante bajo de delincuencia violenta (1,393
desvos estndares por debajo de la media).

Supongamos que otro joven tena exactamente el mismo patrn, pero no con respecto a dro
gas ilegales, donde presentaba un alto nivel de consumo, digamos, una puntuacin Z de + 2.
^Delincuencia ~ ( ~ 0 ,0 0 7 ) ( - l ) + ( 0 ,1 8 3 ) ( 0 ) + ( - 0 , 0 4 6 ) ( l ) + ( 0 ,6 7 7 ) (2 )

= 0,007 + 0+ -0,046 +1,354 = 1,315


Para este joven se esperara un alto registro de delincuencia violenta.
Finalmente, analicemos el caso de un joven con el mismo patrn que el primero (el que pre
sentaba un bajo nivel de consumo de otras drogas ilegales y al que se le predijo una puntuacin Z
de -1,393), excepto que este joven fuma mucho, con una puntuacin Z correspondiente a consu
mo de tabaco de +2.

^ D elincuencia

{~0,007 ) ( ~ 4 ) + { 0,183)(2) + { - 0 , 0 4 6 ) ( l )

+ ( 0 , 6 7 7 ) ( 2)

= 0 ,0 0 7 + 0 ,3 6 6 + - 0 , 0 4 6 + - 1 , 3 5 4 = - 1 , 0 2 7

Aunque parezca sorprendente, para este joven tambin se esperara un nivel bajo de delincuencia
violenta, ya que uno podra asociar con la delincuencia el hecho de fumar mucho. En la mayora
de los casos, los ndices altos con respecto a fumar se asocian con la delincuencia, como lo indica
el r de 0,415. Sin embargo, la gente joven que fuma generalmente tambin consume otras drogas
ilegales (al menos as lo indica la informacin correspondiente a este grupo en este entorno par
ticular), y esa parecera ser la razn por la cual, cuando se consider separadamente el hecho de
fumar, sta estaba ms fuertemente asociado con la delincuencia.
Es el momento de hacer un parntesis. Esperamos que el ejemplo referido a predicciones so
bre el potencial criminal de una persona, y su posible encarcelamiento, haya cambiado la percep
cin del lector. Cuando utilizamos grandes estudios para realizar predicciones sobre una sola
persona, inmediatamente percibimos el estereotipo intrnseco y las posibles injusticias. No es de
extraarse que a menudo la gente desconfe de la estadstica. Pero ella es slo una herramienta pa
ra analizar el futuro, como lo son la intuicin o la experiencia clnica, y es tan compasiva como la
persona que la utiliza para tomar una decisin. Si una persona insensible cita nmeros fros pa
ra justificar una decisin prejuiciosa, no son los nmeros los que son fros. (En el cuadro 4-1 ofre
cemos un breve debate sobre el tema).
Antes de abandonar este estudio utilizado como muestra, ser ilustrativo examinar el R co
rrespondiente a esta informacin. El R de 0,729 es mayor que el r comn ms alto (que era
0,712). Sin embargo, R es en realidad considerablemente menor que la suma de los valores r indi
viduales, (De hecho, la suma dara como resultado ms de 1, lo cual, como mencionamos ante
riormente es, como valor de R, imposible). Finalmente, R2 es 0,531, Esto indica que si se
realizaran predicciones utilizando este modelo de regresin mltiple para cada joven del grupo
estudiado, el error cuadrico promedio en la prediccin de los valores observados de delincuen
cia sera un 53,1% menor que si se utilizara la media de los valores de delincuencia como predic
tor de los valores individuales. En trminos de proporcin de varianza explicada, el 53,1% de la
variacin en la delincuencia de este grupo es explicada por las variables de consumo de drogas.

En 1954, Paul Meehl escribi un pequeo


e inquietante libro titulado Prediccin es
tadstica versus prediccin clnica. En
sostena que cuando algunos expertos, ta
les como por ejemplo psiclogos clnicos
(o gerentes de negocios, analistas econ
micos, ingenieros o mdicos, entre otros),
utilizan los tipos de procesos cogntivos
internos no especificados, a los que co
mnmente llamamos intuiciones capaci
tadas, para realizar predicciones impor
tantes y decisivas, no son, en lneas ge
nerales, ni remotamente tan precisos co
mo podra serlo cualquier otro sujeto
empleando frm ulas muy simples y di
rectas, Por ejemplo, en el caso de la realiza
cin de un diagnstico psiquitrico, la
entrevista y el diagnstico de un clnico
supuestamente bien capacitado son me
nos tiles que una simple regla, como lo
es la del tipo utilizada en los procedi
mientos de regresin mltiple: Si la per
sona ya ha ingresado al hospital dos
veces, tiene ms de 50, y aparentemente
es suicida, entonces...
Durante la primera dcada que prosi
gui al cuestionamiento por parte de Meehl
acerca de la precisin de los expertos, se
realizaron considerables esfuerzos para re
futarlo. Pero, en general, el descubrimiento
de Meehl se ha mantenido (Dawes et al,
1993; Kleinmuntz, 1990): la cognicin hu
mana por s sola es, en lneas generales,
menos precisa al realizar predicciones que
el mtodo estadstico de anlisis de regre
sin. Y se trata de predicciones importan
tes: nos referimos a los diagnsticos, a las
que determinan una libertad condicional,.o
a decisiones comerciales y de ingeniera.
No debemos olvidar que hablamos de
predicciones, por lo cual los mtodos es

tadsticos tampoco son perfectos. Su. ven


taja principal es la coherencia, como un
apostador que dispone de un sistema para
jugar. Los seres humanos explicamos me
jor por qu sucedi algo despus de que
sucedi, porque entonces sabemos dnde ;
buscar la causa. Pero debido a que las pre
dicciones a menudo tienen serias conse
cuencias, an es desconcertante descubrir ;
que la lgica o la intuicin humana, des
pus de largas entrevistas o pruebas, pue- .
dan ser tan poco eficientes comparadas ',
con una simple frmula.
Naturalmente, el centro de la atencin .
se ha enfocado en el funcionamiento de la
cognicin, el por qu de su imperfeccin yqu puede hacerse para mejorarla, si es qu
algo puede hacerse. Su imperfeccin se de
be principalmente a que las personas sue-.
len realizar correlaciones ilusorias (vase.
cuadro 3-2) o son demasiado confiadas: no
llevan un registro de sus xitos y fracasos;:
para controlar si en realidad son precisos,
sino qu dan demasiada importancia, a. los
xitos recordados y olvidan sus fracasos.
Adems, lamentablemente, el excso de
confianza proviene en parte de la expereocia, que en. realidad rara vez ayuda dema
siado, ya que no aporta informacin acerca
del resultado de un proceso .(los clnicos
pueden realizar cientos de diagnsticos sin
enterarse luego si estaban en lo cierto). Fi
nalmente, la memoria y l cognicin huma
na pueden no tener la capacidad de manejar,
la informacin, como tampoco las opera
ciones necesarias para tomar ciertas deci
siones complejas.
Gran cantidad de investigaciones se
han dedicado al tema de cmo quitar el
sesgo a las decisiones humanas. Se puede
mostrar a ios profesionales en qu casos-la

intuicin ser ms precisa (por ejemplo,


cuando se necesita un trabajo rpido y por
lo tanto no delicado, o cuando basta con un
simple promedio) y cundo es preferible
utilizaruna frmula (cuando hay tiempo
para la deliberacin o cuando las reglas son
ms complicadas).
Tambin existe una cantidad considera
ble de trabajos sobre los. distintos instru
mentos de ayuda para la toma de decisiones,
como pueden ser los programas informti
cos que incluyen reglas para la toma de de
cisiones, aportadas por los mismos expertos!
En algunos casos, expertos bien informados
sobre la situacin particular pueden agregar
ms informacin intuitiva o subjetiva de l
timo momento (Holzworth, 1996; Whitecotton, 1996). Aunque los mecanismos de
ayuda para la toma de decisiones puedan pa
recer inflexibles, y por lo .tanto inhuma
nos, estos mecanismos y frmulas pueden
modificarse tantas veces como, sea.necesa-,.
rio. Lo que no debe hacerse con ninguno de!
estos mecanismos de ayuda es dejarlos de
lado cada vez. que una persona tiene un pre
sentimiento que le indica que puede desem
pearse mejor sin ellos.
Sin embargo, habiendo resumido todo
esto, Kleinmuntz (1990) observ que en la
mayora de los casos en los que es necesa-
ro tomar decisiones, an se utilizan los
dictmenes humanos en lugar de las frmu
las o frmulas combinadas, con cognicin, ;
que son ms acertadas. Cuando las apues
tas son altas, como en los casos de vida o
muerte, la mayora de las personas an tie-

ne ms confianza en las decisiones huma


nas, tal vez por la esperanza de quelaintuicin inspirada pueda acertar en un cas en
particular. Adems, las personas creen, tal
vez con razn, que los complejos patrones
que presentan las situaciones reales son
captados mejor por los expertos ms alle
gados y acostumbrados a esas situaciones;
En tercer lugar, las frmulas para la tma
de decisiones no existen o no estn al al
cance de las personas que las necesitan. Fi
nalmente, el costo de la creacin y prueba
de una frmula para la toma de decisiones
es, a menudo, prohibitivo.
'V
Aun as, la utilizacin de sistemas de
apoyo para a toma de decisiones est en
crecimiento. Por ejemplo, jugadores Exper
tos de ajedrez han desarrollado sistemas de
ayuda que algunas veces, pueden serjn s
inteligentes que sus propios creadores,,
por el simple hecho de ser completamente
coherentes. Es as como algunos jgadores
de ajedrez se sienten cmodos: utilizando
sistemas de apoyo para la toma d decisio
nes, cornei fm de mantener una lnea duran
te. ei jeg. Es lgico esperar que mdicos,
psiclogos clnicos e ingenieros tambin
adopten frmulas con reglas-generadas por
ellos mismos, particularmente para contra
rrestar los efectos, del cansancio o el inters
emocional. Posiblemente lleve tiempo, pe
ro todos tendremos que reconocer que pue
de ser ms humano evitar decisiones
subjetivas y preocupantes cuando existen
sistemas de apoyo objetivos.

Otro ejemplo
Analicemos otro ejemplo. Terpstra y Rozell (1997) realizaron un estudio sobre la manera en que
ios directores de personal de empresas obtienen informacin sobre nuevos desarrollos en su cam
po. Los investigadores enviaron cuestionarios a una muestra de grandes empresas norteamerica
nas elegidas al azar. Los cuestionarios solicitaban a los gerentes de personal que indicaran en qu
medida utilizaban distintas fuentes de informacin, incluidas fuentes acadmicas (tales como ar-

tcuios de investigacin), fuentes profesionales (tales como revistas profesionales de comercio) y


consultores profesionales. Los cuestionarios tambin indagaban sobre la rentabilidad de la em
presa durante los ltimos cinco aos.
La tabla 4-8 muestra los resultados, divididos por tipo de empresa. Examinemos los resulta
dos de las empresas de servicio. E R2 total era de 0,60, es decir, que al predecir la rentabilidad se
puede reducir un 60% del error cuadrtco, conociendo la medida en la que se utilizan estas dis
tintas fuentes de informacin. Ahora veamos las correlaciones bivariadas. Queda claro que las
fuentes acadmicas son muy importantes. La correlacin entre las fuentes acadmicas y la renta
bilidad era de 0,64, una correlacin bastante importante. La utilizacin de fuentes profesionales
tambin estaba fuertemente relacionada con la rentabilidad, mientras que la utilizacin de consul
tores como fuente de informacin tena una correlacin con la rentabilidad de slo el 0,23.
Pasemos ahora al coeficiente de regresin. Cabe destacar que son b y no beta, y qu'no es
tn estandarizados, aunque en su artculo los investigadores aclaran que antes de realizar el
anlisis de regresin mltiple convirtieron los valores de utilizacin de informacin en puntua
ciones Z. Por lo tanto, las variables predictoras, siendo todas puntuaciones Z, estn en la misma
escala. Es decir que las diferencias entre los b no se deben a que las variables predictoras estn
en diferentes escalas, sino a las diferencias entre las asociaciones particulares de cada b con la
variable dependiente.
La principal cuestin que se desprende de la tabla es que las fuentes acadmicas y profesio
nales presentaban las relaciones particulares ms importantes con respecto a la rentabilidad.
Sin embargo, examinar las cifras referidas a consultora resultar especialmente interesan
te con respecto a lo que significa la regresin mltiple. La consultora present una correlacin
bivariada positiva de 0,23 con la rentabilidad. Aun as, en el contexto de la regresin mltiple,
la relacin de la consultora con la rentabilidad es bastante negativa.4 Es decir, considerada por
s sola, una mayor consultora est ligada a una mayor rentabilidad. Pero si tenemos en cuenta
cualquier nivel fijo de informacin acadmica y profesional, a mayor consultora, menor renta
bilidad!
Una explicacin posible para esta aparente paradoja sera que el valor positivo de la consultora se superpone con la obtencin de informacin de otras fuentes. Tal vez las empresas interesa
das en obtener informacin utilizan ms todas las fuentes. Por lo tanto, la correlacin positiva
entre consultora y rentabilidad se debera a que ambas son causadas por un tercer factor (inters
en la informacin en general). En realidad, una vez que se toma en cuenta esta tendencia general
a obtener informacin, la consultora podra daar la rentabilidad debido a que es muy costosa.
Esta es slo una explicacin posible. Lo importante es que aplicar la regresin mltiple revel un
patrn de resultados que podra no haberse notado antes de la investigacin y que debera generar
ideas con una nueva orientacin.
Otro tema importante es que, al menos para el caso de las empresas de servicio, contar con un
gerente de personal que lee artculos de investigacin acadmica puede ser muy rentable.

4 Este es un ejemplo de lo que tcnicamente se denomina supresin. En el ejemplo que estamos analizando, puede con
siderarse que la asociacin positiva general con la rentabilidad presenta dos aspectos: una asociacin positiva y una
asociacin negativa. En este caso, el aspecto positivo se superpone con las otras variables de prediccin. Por lo tanto,
cuando se incluyen las otras variables de prediccin eti la regresin, se suprime la superposicin. (Es decir, su influ
encia es eliminada de la asociacin nica entre la consultora y la rentabilidad, representada por beta). El resultado es
que slo e l aspecto restante, la asociacin negativa, forma parte de beta. En trminos ms generales, la supresin ocurre
siempre que el coeficiente de regresin de detemiinada variable de prediccin es de signo opuesto a su correlacin
bivariada con la variable dependiente, (Existe otro tipo de situacin que tambin presenta supresin: cuando beta es
mayor que la correlacin bivariada).

(febla 4-8.
Resaltados del anlisis de regresin y correlacin de ia relacin entre utilizacin de fuentes de
informacin y rentabilidad en distintos tipos de empresas.
P ro d u cci n
F u en te d e
in fo rm a ci n
A cadm ico
Profesional
Consultara
R2
F

S e r v id o s

- 0 ,0 9
- 0 ,0 5
0 ,2 9
0 ,0 6
1,17

0 ,0 4
0 ,0 9
0,22*

0,7 2 * *
0 ,4 5 * *
- 0 ,3 6
0 ,6 0
6 ,6 i* *

0,6 4 * *
0 ,4 9 * *
0,23

V enta p or m a y o r /m e n o r
b

-0 ,0 8
0,08
-0 ,1 2
0 ,0 2
0,11

-0 ,0 7
-0 ,0 1
-0 ,1 1

F in a n ciera s
b

0,17
0 ,1 0
0 ,1 2
0 ,1 0
0,37

0 ,2 6
0,23
0,06

Nota: L os tamaos de las maestras, en el caso de empresas de produccin, servidos, venta por mayor o menor y
financieras eran de 63 a 6 5 , 1 6 a 1 8 ,2 0 a 2 2 y 1 3 a l5 , respectivamente. N o se realizaron anlisis en el rea de transporte
o comunicacin, com o tampoco en las reas de agricultura, minera o construccin, debido a restricciones con respecto
al tamao de las muestras.
*p < 0,10. * * p < 0 ,05.
Fuente: Teipstra, D. E., & Rozell, E. J. (1997), tab 6. Fuentes de informacin para recursos humanos y su relacin con
la rentabilidad institucional. P e r i d ic o so b re C ien cia d e l C o m p o rta m ien to A p lic a d a [J o u rn a l o f A p p lie d B eh a vio ra l
Scien ce), 3 3 ,6 6 -8 3 , Copyright, 1997, por el NTL nstitute, Inc. Reimpreso con autorizacin de Sage Publcations. Inc,

CONTROVERSIAS Y LIMITACIONES
Todas las limitaciones que se plantearon al tratar el tema de la correlacin (captulo 3) se aplican
en igual o mayor medida a la regresin bivariada y mltiple. Los clculos de regresin subesti
man el grado de posibilidad de prediccin si la relacin implcita es curvilnea, si el grupo estu
diado tiene un rango restringido o si las medidas no son perfectamente confiables. Es decir, en
cada uno de estos casos, R Y R%(y generalmente b y p) son menores de lo que deberan ser para
reflejar el verdadero grado de asociacin de las variables de prediccin con la variable dependien
te, La regresin por s sola tampoco indica la direccin de causalidad implcita. La direccin de
causalidad depende del .diseo experimental (vase apndice A). Es importante ser muy cuidado
so al leer artculos de investigacin ya que, incluso en las publicaciones, a veces los investigado
res pasan por alto estas limitaciones cuando analizan los resultados de regresiones complejas.
Existe actualmente una controversia con respecto a la regresin mltiple que cuestiona cmo
juzgar la importancia relativa de las diferentes variables de prediccin al predecir la variable de
pendiente. En cuanto a los fines de prediccin exclusivamente, los coeficientes de regresin (tanto
estandarizados como de puntuaciones originales) cumplen bien esa funcin, pero no necesaria
mente son ideales para comprender la importancia de los diferentes elementos de prediccin desde
el punto de vista terico. Como observamos anteriormente, un coeficiente de regresin indica la
contribucin particular de la variable predictora a la prediccin, independientemente de los otros
predictores. Una variable puede tener aparentemente una importancia bastante diferente en rela
cin con los otros predictores, cuando se predice slo a partir de ella, sin tener en cuenta esos otros
elementos (es decir, utilizando la correlacin ordinaria entre esa variable y la variable dependien
te). Por ejemplo, en el estudio de la delincuencia y el consumo de drogas, los coeficientes beta su
geran que el consumo de tabaco era ms importante en la prediccin de la delincuencia que el
consumo de marihuana, pero las correlaciones ordinarias sugeran exactamente lo contrario. iVfs
an, si se agregaran otras variables de prediccin, como el consumo de otras drogas ilegales, todo

el pair de coeficientes beta podra volver a cambiar. Qu importancia se le atribuye entonces a


una variable de prediccin que muestra tantas facetas diferentes en tantos contextos diferentes?
El problema surge en la regresin mltiple debido a que las variables predictoras estn corre
lacionadas entre s. Esta situacin se denomina m u ltico lin e a lid a d , y en cierto grado casi siempre
est presente en la regresin mltiple. Por lo tanto, es sorprendente que no exista un mtodo acor
dado sobre cmo juzgar la importancia relativa de las variables predictores. La falta de consenso
no se debe a la falta de propuestas: a lo largo de los aos se han estudiado una gran cantidad de
mtodos para solucionar este problema (vase Cohn & Cohn, 1983). La mayora de los exper
tos recomiendan utilizar toda la informacin disponible acerca de los distintos aspectos de impor
tancia relativa. Es decir, tener en cuenta tanto las correlaciones ordinarias como los coeficientes
de regresin sin olvidar la diferencia entre lo que cada uno de estos datos indica. El coeficiente
de correlacin indica la asociacin general de la variable predictora con la variable dependiente,
mientras que el coeficiente de regresin indica la asociacin individual de la variable predictora
con la variable dependiente, ms all de las otras variables de prediccin.
Adems de estas y otras controversias relacionadas con ios aspectos estadsticos, durante mu
chos aos ha existido una controversia que actualmente contina en vigencia y que se refiere a la
superioridad de la prediccin estadstica con respecto a mtodos ms intuitivos, humanistas o cl
nicos. En el cuadro 4-1 se plantea este tema.

LOS MODELOS DE PREDICCIN SEGN SE DESCRIBEN


EN ARTCULOS DE INVESTIGACIN
No es muy frecuente que los modelos de prediccin bvariadas sean citados en artculos de inves
tigacin psicolgica; en a mayora de los casos se informan las correlaciones simples. Algunas
veces se publican rectas de regresin de predicciones bivariadas. Esto ocurre generalmente cuan
do existe ms de un grupo y el investigador quiere ilustrar la diferencia en la norma de prediccin
entre los dos grupos. Por ejemplo, analicemos un experimento realizado por Nezlek et al. (1997).
En ese experimento, los participantes escribieron descripciones de s mismos y las intercam
biaron con otros cuatro alumnos que tambin participaban del estudio. Luego, cada alumno clasi
fic en forma privada a los otros alumnos con respecto a cunto les gustara trabajar con ellos en
la siguiente tarea. Se explic que slo tres de los cinco trabajaran juntos en dicha tarea. Luego, el
investigador inform a la mitad de los participantes que haban sido seleccionados para trabajar
en la siguiente tarea con el resto del grupo: sta era la condicin de inclusin. Los investigadores
dijeron al resto de los participantes que no haban sido escogidos para trabajar con los otros y que
trabajaran solos: la condicin de exclusin. (En realidad los investigadores decidieron al azar,
hecho que fue cuidadosamente explicado a todos los participantes cuando finaliz el estudio, pa
ra que nadie se sintiera mal).
Llegados a este punto, como parte de toda una serie de cuestionarios se preguntaba a los par
ticipantes cun aceptados se sentan. Previamente, al comienzo del estudio, los participantes ha
ban completado una escala de autoestima. La figura 4-7 muestra las lneas de regresin de los
dos grupos experimentales. Cada recta de regresin indica qu grado del nivel de autoestima pre
dijo sentimientos de aceptacin. Se puede observar que en el caso de los alumnos en condicin de
exclusin, exista una relacin muy marcada entre autoestima y aceptacin. Aquellos con alta au
toestima se sentan aceptados, aquellos con baja autoestima no se sentan para nada aceptados.
Sin embargo, en el grupo en condicin de inclusin, la autoestima influy mucho menos en el
sentimiento de aceptacin: todos se sentan bastante bien aceptados,

Figura 4-7. E fe cto s de la in c lu si n /e x c lu si n y d e


la autoestim a en la a cep tacin percibida. (F u e n te :
J, B K ow alsk i, R. M ., Leary, M . R ., B le v in s, T , &
H oigate, S . (1 9 9 7 ), g . I. C aractersticas d e la
person alidad qu e m oderan las r ea ccio n es al re cha20 interpersonal: dep resin y autoestim a . B oletn
d e P s ic o lo g a S o c ia l y P e rs o n a lid a d [ P e rs o n a lity
a n d S o c ia l P s y c h o lo g y B u lletin ), 2 3 ,1 2 3 5 - 1 2 4 4 .)

Como observamos anteriormente, los resultados de la regresin mltiple son comunes en los
artculos de investigacin, y a menudo se hace referencia a ellos en las tablas. Ya hemos visto
algunos ejemplos (tablas 4-7 y 4-8). Frecuentemente, las tablas incluirn algunos otros clcu
los estadsticos, adems de aquellos que hemos tratado. Algunos estn relacionados con la
significacin estadstica (vase en el captulo 3 una breve exposicin sobre la significacin
del coeficiente de correlacin); otros sern tratados en el captulo 17. De todos modos, es po
sible comprender casi toda la informacin importante incluida en esas tablas slo con lo
aprendido aqu.
Analicemos los resultados de un estudio realizado por Jehn y Shah (1997) sobre el desempe
o de grupos formados por tres personas que deban realizar en forma conjunta tareas fsicas y de
toma de decisiones en una situacin de laboratorio. Los investigadores grabaron las interacciones
en video y analizaron las cintas para estudiar varios aspectos de la interaccin grupal. La tabla
4-9 muestra el coeficiente de regresin para la prediccin del desempeo a partir de varias cuali
dades de interaccin. Se puede observar que la comunicacin positiva y la planificacin presentan
coeficientes beta relativamente bajos (y negativos), mientras que el compromiso, el control y la

T a b la 4 -9 .
R e s u m e n d e l a n lis is de r e g r e si n c o n v a r ia b le s d e p r e d ic c i n d e l d e s e m p e o .
V ariable
C om unicacin positiva
Planificacin
C om prom iso
Control
C ooperacin

SEB

0 ,288
0 ,062
1,340
1,210
0 ,7 8 0

0 ,228
0 ,055
0,134
0 ,049
0 ,1 5 4

-0 ,1 2 7
- 0 ,1 9 0
0 ,4 3 2 *
0,449*
0,376*

Nota: N = 106, R = 0,55.

*p<0,01.
Fuente: Jehn, K. A ., & Shah, P. P. {1997), tab. 4. Relaciones interpersonales y desempeo en las tareas: anlisis de los
procesos en grupos de amigos y conocidos. P e ri d ic o d e P s ic o lo g a S o c ia l y P erso n a lid a d , [J o u rn a l o f P erso n a lity
a n d S o c ia l P sych ology, ] 7 2 ,7 7 5 -7 9 0 - Copyright, 1997, por la A sociacin Americana de Psicologa [American Psycho
logical Association] Reimpreso con autorizacin.

cooperacin fueron predictores del desempeo mucho ms importantes. Adems, se observa (en
la parte inferior de la tabla) que la correlacin total de los cinco predictores con el desempeo
presentaba un R de 0,55, lo que constituye un dato sustancial.
Por otro lado, significa que a partir de estas cinco variables se explic menos de un tercio de
la varianza total del desempeo (es decir, Rz - 0,30). La tabla tambin incluye, adems de R y de
coeficientes de regresin estandarizados y no estandarizados (rotulados aqu con B mayscula),
otros clculos estadsticos: el error estndar (SE B) de cada B, El error estndar est relacionado
con la precisin en la estimacin de los coeficientes con respecto a la poblacin en general. Este
concepto ser ms fcil de comprender despus de haber ledo el captulo 7.

RESUMEN
La prediccin (o regresin) bivariada se utiliza para predecir valores de una variable dependiente
sobre la base de valores de una variable predictora. La mejor norma o modelo para predecir la
puntuacin Z de una persona en una variable dependiente es multiplicar un nmero denominado
coeficiente de regresin estandarizado (beta) por la puntuacin Z de esa persona en la variable
predictora. El mejor nmero para utilizar como coeficiente de regresin estandarizado en la pre
diccin bivariada es el coeficiente de correlacin.
Tambin se pueden realizar predicciones con puntuaciones originales convirtiendo el valor
observado de una persona en la variable predictora en la puntuacin Z correspondiente, multipli
cndolo por beta, y luego convirtiendo la resultante puntuacin Z predicha de la variable depen
diente nuevamente en una puntuacin bruta. Los tres pasos anteriores pueden combinarse en una
sola frmula que permite predecir la puntuacin original de una persona en la variable dependien
te, a partir, directamente, de la puntuacin original de esa persona en la variable predictora. Esta
frmula presenta dos partes principales: un coeficiente de regresin (denominado b) que se multi
plica por la puntuacin original de la persona en la variable dependiente y una constante de regre
sin (denominada d) que se suma al resultado. Si en un grfico con las dos variables se dibujan los
valores predichos, a travs de esta frmula para la variable dependiente se trazar la recta de re
gresin. La pendiente de la recta de regresin es igual al coeficiente de regresin para las puntua
ciones originales; la constante de regresin indica dnde esta recta cruza el eje vertical (es la
ordenada del punto de la recta con abscisa 0).
La exactitud de la prediccin puede estimarse aplicando el modelo de prediccin a los valores
en los que se bas la correlacin original. La diferencia entre cada valor observado y lo que hubie
ra sido predicho para ese individuo, utilizando el modelo de prediccin, se denomina error. Ele
vando estos errores al cuadrado y sumndolos obtenemos la suma de errores cuadrticos (55Error).
Luego, se compara SS-g^ con la suma de errores cuadrticos obtenida utilizando slo la media de
la variable dependiente como valor predicho (SSTotal). La reduccin del error cuadrtico lograda
utilizando el modelo (SSTotal - SSErT0[L dividida por el error cuadrtico al predecir utilizando la
media de la variable dependiente (&5To{aJ), se denomina reduccin proporcional de error o propor
cin de la varianza explicada, que es igual al cuadrado del coeficiente de correlacin.
En la regresin mltiple, se predice una variable dependiente utilizando dos o ms variables
predictoras. Cada variable predictora se multiplica por su propio coeficiente de regresin, y los
resultados se suman para realizar la prediccin. (Cuando se utilizan puntuaciones originales, tam
bin se suma una constante de regresin). Cada coeficiente de regresin indica la relacin del predictor con la variable dependiente en el contexto de las otras variables de prediccin. El
coeficiente de correlacin mltiple describe el grado general de asociacin entre la variable de
pendiente y las variables de prediccin tomadas en su conjunto.

Las regresiones bivariada y mltiple tienen las mismas limitaciones que la correlacin ordi
naria. Adems, en la regresin mltiple generalmente existe una ambigedad considerable al in
terpretar la importancia relativa de las variables predictoras.

Trminos clave
- Prediccin bivariada.
- Regresin bivariada.
- Error.
- Correlacin mltiple.
- Coeficiente de correlacin
mltiple (/?).
- Regresin mltiple.
- Modelo de prediccin.
- Proporcin de varianza
explicada (r2, R2).

- Reduccin proporcional
del erro^r2, R2).
- Frmula de prediccin con
puntuaciones originales.
- Coeficiente de regresin para
puntuaciones originales (b).
- Coeficiente de regresin.
- Constante de regresin (a).
- Recta de regresin.
- Pendiente.

Ejercicios
Los ejercicios implican la realizacin de clcu
los (con la ayuda de una calculadora). La ma
yora de los problemas estadsticos reales se
resuelve por computadora. Pero aunque exista
la posibilidad de utilizar una computadora, es
conveniente realizar estos ejercicios a mano
para incorporar el mtodo de trabajo.
Para adquirir prctica en la utilizacin de
una computadora, para resolver problemas es
tadsticos, se puede utilizar la seccin de compu
tacin de cada captulo, publicada en la G u a d e
e s tu d io y lib r o d e ta r e a s d e c o m p u ta c i n p a r a e l
a lu m n o [ S tu d e n ts S tu d y G u id e a n d C o m p u te r
W o r k b o o k ] que acompaa este texto.
Todos los datos de esta seccin son ficticios (a
menos que se especifique lo contrario).
Las respuestas a los ejercicios de la serie I se
encuentran al final del libro.

- Coeficiente de regresin
estandarizado (b).
- Suma de los errores
cuadrticos (S S Bnor).
- Error cuadrtico total al
predecir utilizando la media

SERIE 1
1. Un psiclogo especializado en deportes, que
trabaja con atletas de un deporte en particular,
ha descubierto que los valores observados en
una prueba de conocimientos sobre fisiologa
presentan una relacin de 0,4 con la cantidad
de lesiones sufridas durante el ao subsiguien
te. Ahora el psiclogo planea probar atletas
nuevos y utilizar esta informacin para prede
cir la cantidad de lesiones que pueden llegar a
sufrir, a) Indique la variable predictora, la va
riable dependiente y beta; b) escrba el modelo
de prediccin con puntuaciones Z, y c) indique
puntuaciones Z predichas para la cantidad de
lesiones que sufrirn los atletas cuyas puntua
ciones Z en la prueba sobre fisiologa son -2,
-1, 0, +1 y +2.
2.
Determine el modelo de prediccin con
puntuaciones orignales para los puntos (a) a
(g) que aparecen a continuacin. Construya
despus un slo grfico que muestre todas las
rectas de regresin, rotulando cada una con su
letra correspondiente, (Construya un grfico lo

suficientemente grande como para que las rec


tas queden claramente separadas).
V a ria b le
V ariable
d e p e n d ien te (K) d e p red icci n (V)
M
10

(a)
(b)

20
10
10
10
10
10

(c )

(d)
(e)
(f)
(g)

SD
2 ,0
2 ,0

2 ,0
2 ,0
4 ,0
2 ,0
2 ,0

SD

10
10
20
10
10
10
10

2 ,0
2,0
2 ,0
4,0
2,0
2,0
2,0

r
0 ,4
0,4
0,4
0,4
0 ,4
- 0 ,4
0,8

3. Un profesor ha descubierto que las notas


en el examen parcial predicen las notas en el fi
nal La frmula de prediccin con puntuacio
nes originales es:
Nota en el final = 40 + (0,5)(nota en el parcial)
Calcule las notas predichas para el examen
final de cada uno de ocho alumnos, cuyas no
tas en el parcial fueron 30, 40, 50, 60,70, 80,
90 y 100.
4. En el captulo 3, serie i, ejercicio 1, des
cribimos un''estudio en el cual un investigador
estaba interesado en la relacin entre el grado de
empatia que lograban los psicoterapeutas y el
grado de satisfaccin de sus pacientes con la te
rapia. Como estudio piloto, se analizaron cuatro
parejas de pacientes y terapeutas. Ms abajo se
detallan los resultados, incluso las medias y los
desvos estndares. El coeficiente de correlacin
era 0,90, y el SSTo(al correspondiente al grado de
satisfaccin del paciente era 10.
N m ero
d e p a reja
1
2
3
4
M
SD

E m p a tia
te ra p eu ta (X)
7 0 ,5 8
9 4 ,58
3 6 ,58
4 8 ,58
62
2 2 ,1 4

S a tisfa cci n
p a c ie n te ( 3 )
4,58
5 ,5 8
2 ,5 8
1,58
3

ciente-terapeuta; c) dibuje el diagrama de dis


persin e incluya en l Ja recta de regresin; d)
calcule el error y el error cuadrtico para cada
una de las cuatro predicciones; e) encuentre la
reduccin proporcional del error (utilizando
55E[TOr y 55Tolal); f) halle la raz cuadrada de la
reduccin proporcional del error calculada para
comprobar si concuerda con el coeficiente de
correlacin, y g) explique los procedimientos
realizados a alguien que comprende qu es la
media, el desvo estndar, las puntuaciones 2 y
el coeficiente de correlacin, pero que no sabe
nada ms sobre estadstica.
5.
En el captulo 3, el ejercicio 2 de la serie I
planteaba el caso de un instructor que pregunt a
cinco estudiantes cuntas horas haban estudia
do para un examen. Aqu mostramos la cantidad
de horas de estudio y las calificaciones, junto
con las medias y los desvos estndares. La co
rrelacin era de 0,84 y la SST(Jta correspondiente
a las calificaciones era de 1.110. a) Determine la
frmula de prediccin con puntuaciones origi
nales para predecir las calificaciones a partir de
las horas de estudio; b) utilice la frmula para
encontrar las calificaciones predichas para cada
uno de los cinco estudiantes; c) dibuje el diagra
ma de dispersin e incluya en l la recta de re
gresin; d) calcule el error y el error cuadrtico
para cada una de las cinco predicciones; e) de
termine la reduccin proporcional del error (uti
lizando SSEmr y SSTotal); f) saque la raz
cuadrada de la reduccin proporcional del error
calculada para comprobar si concuerda con el
coeficiente de correlacin, y g) explique los
procedimientos realizados a alguien que com
prende qu es la media, el desvo estndar, las
puntuaciones Z y el coeficiente de correlacin,
pero que no sabe nada ms sobre estadstica.

1,58

a)
Determine la frmula de prediccin con
puntuaciones originales para predecir la satis
faccin a partir de la empatia; b) utilice esta fr
mula para encontrar los valores de satisfaccin
predichos para cada una de las cuatro parejas pa

H o r a s de estu d io (X )
0
10
6
8
6
6
3,35

C alifica cio n es (30


52
95
83
71
64
73
14,90

6.
Interesados en la influencia que podra
ple en el que se incluyen la enseanza no social
ejercer el estilo con que una madre ayuda a su y el entrenamiento social como predictores de la
hijo a comprender las interacciones sociales aceptacin por parte de pares. La ecuacin 2
sobre la vida social real del nio, Mize y Pettt se refiere al modelo de regresin mltiple en el
(1997) realizaron los arreglos necesarios para que el estilo de reaccin y el entrenamiento so
filmar en video a 43 madres voluntarias y a sus cial se incluyen predictores de la aceptacin por
hijos de 3 a 5 aos de edad, en tres sesiones in parte de los pares. Explique el significado de los
dependientes. En la sesin principal, se mos resultados de aceptacin por los pares como si
traban a las madres y a los nios cintas de video
se estuviera escribiendo para una persona que
de otros nios que se comportaban de modo
comprende qu es una correlacin pero que nun
hostil o se rechazaban unos a otros; despus,
ca
ha odo hablar de anlisis de regresin o re
las madres discutan con los nios lo observado
en los videos. Luego, los psiclogos clasifica gresin mltiple. (Se puede ignorar la columna
ban a cada madre segn el entrenamiento so srj, correlacin semiparcial, vase nota al pie
cial, como por ejemplo, el modo en el que las nmero 3. Todos los datos necesarios para inter
madres haban ayudado a sus hijos a compren pretar esta tabla se encuentran en las columnas
der lo que haban visto y les haban sugerido r, R2 y beta).
7.
a) Sobre la base de la tabla 4-10, seccin
formas ms positivas de manejar la situacin.
Se clasificaron los videos de las madres y los aceptacin por los pares, escriba la ecuacin
nios jugando segn el estilo de reaccin de l (una ecuacin de regresin con puntuaciones
las madres, es decir, la calidez y la capacidad Z). Luego calcule la puntuacin Z predicha pa
de crear armona con los nios. Finalmente, en ra la aceptacin por los pares, correspondiente
la ltima sesin, se clasificaron los videos de a nios cuyas madres presentan las siguientes
los nios armando crucigramas en cuanto a la puntuaciones Z.
enseanza no social por parte de las madres,
E n tr e n a m ie n to
E n se an za
es decir, el modo en que las madres ayudaban a M a d r e
no socia l
so c ia l
sus hijos a desarrollar su capacidad de resolu
A
-2
0
cin de problemas. En otra etapa del estudio,
B
0
0
los investigadores realizaron preguntas a los
2
C
0
nios sobre cunto les gustaban los otros nios,
D
-2
0
Utilizando esta informacin, pudieron obtener
E
0
2
una medida general de cunta apreciacin goza
F
2
2
G
-1
2
ba cada nio, a lo que denominaron aceptacin
por parte de sus pares.
Los investigadores desarrollaron la hipte
b) Escriba la ecuacin 2 y calcule la pun
sis de que se podra predecir la aceptacin de
un nio por parte de sus pares a partir de lo tuacin Z predicha para la aceptacin por los
adecuada o inadecuada que fuera la madre co pares, correspondiente a nios cuyas madres
mo entrenadora social. Tambin desarrollaron presentan los siguientes puntuaciones Z:
la hiptesis de que la relacin entre el nivel de
M adre
E n tr e n a m ie n to
E stilo
entrenadora social de la madre y la aceptacin
social
de reaccin
por parte de los pares se sostendra aun en una
A
-2
0
ecuacin de regresin mltiple que incluyera
B
0
0
entrenamiento no social, y en una ecuacin de
C
2
0
-2
D
0
regresin que incluyera estilo de reaccin.
2
E
0
La seccin aceptacin por sus pares de
2
F
2
la tabla 4-10 muestra ios resultados. La ecua
1
-2
G
cin 1" se refiere al modelo de regresin mlti

T ab la 4-10.

Anlisis de regresin simultneo para la prediccin de la habilidad social, la agresin y la acepta


cin por los pares, clasificados por maestros en el estudio 1.
Criterio
Aceptacin por pares
V ariables de prediccin

Ecuacin 1:
Enseanza no social 0,21
Entrenamiento social 0,36*
Ecuacin 2:
0,34*
Estilo de recreacin
Entrenamiento social 0,36*

Habilidad social

Agresin

ri

Beta

R2

sri

0,10
0,30

0,10

0,14

0,32

0,15
0,31*

0,10

0,05
0,28

0,06 -0,35*
0,29 -0,41*** 0,22**

-0,23 -0,24
-0,32 -0,33*

0,19*

0,26 ' 0,27


0,28
0,29

0,25
0,3 F

0,13

0,18
0,25

0,18 -0,26
0,26 -0,41*** 0,20*

-0,16 -0,17
-0,36 -0,37*

R*

Beta

R2

*r i

Beta

Nota: sr, = correiacn semiparciai; n = 38.


V < 0,10; **p < 0,05; ***p < 0,01.
Fuente: M ize, J., & Pettit, G. S. (1997), tab. 2. Entrenamiento social brindado por las madres, estilo de relacin madrehijo, y competencia de los nios con sus pares: El medio es e mensaje? D e sa r ro llo In fan til, 6 8 ,3 1 2 -3 3 2 . Copyright,
1997, por la Sociedad de Investigacin del Desarrollo Infantil [Sociey for Research m Child Development] Inc. Reim
preso con autorizacin.

SERIE 11
1. Elija algo que resulte interesante pre
decir y busque la informacin necesaria para
poder predecirlo. (Ambas deberan ser cosas
que puedan medirse en una escala numri
ca). Luego escriba el modelo de prediccin,
anotando el nombre de la variable predictora
y el nombre de la variable dependiente. Ade
ms, estime un nmero para beta que tenga
sentido, teniendo en cuenta lo aprendido so
bre los valores que se estn prediciendo. Fi
nalmente, explique por qu se eligi ese
tamao de beta.
2. Determine el modelo de prediccin con
puntuaciones Z y el modelo de prediccin
con puntuaciones originales para cada uno de
los siguientes casos. Adems, prepare un solo
grfico que muestre todas las rectas de regre
sin ( puntuaciones originales) y rotule cada
una de ellas con la letra correspondiente desde
la (a) hasta la (e), y que sea lo suficientemente
grande como para que las rectas estn clara
mente separadas.

Variable
Variable
dependiente (F) de prediccin ( X )
(a)
(b)

(c)
(d)

(e)

SD

SD

0
5
0
0
0

1,0
1,0
5,0
1,0
1,0

0
5
0
5
0

1,0
1,0
5,0
5 ,0
1 ,0

r
0 ,3

0,3
0,3
0,3
0,0

3.
En el captulo 3, serie II, ejercicio 1,
cuatro individuos recibieron una prueba de
destreza manual (valores altos significan ma
yor destreza) y una prueba de ansiedad (valores
altos significan mayor ansiedad). A continua
cin indicamos los valores observados, medias
y desvos estndares. Calcule primero la corre
lacin entre destreza y ansiedad (o refirase a
la respuesta en el captulo 3). La SSTota[ corres
pondiente a ansiedad era 84.
a)
Determine la frmula de prediccin con
puntuaciones originales para predecir la ansie
dad a partir de la destreza; b) utilice la frmula
para calcular los valores de ansiedad predi
chos para cada uno de los cuatro individuos es

tudiados; c) dibuje el diagrama de dispersin e


incluya en l la recta de regresin; d) calcule el
error y el error cuadrtico para cada una de las
cuatro predicciones; e) calcule la reduccin
proporcional del error (utilizando SSEmx y SSTotai); saque la raz cuadrada de la reduccin
proporcional del error calculada para controlar
si concuerda con el coeficiente de correlacin,
y g) explique lo realizado a alguien que com
prende la media, el desvo estndar, las pun
tuaciones Z y el coeficiente de correlacin,
pero que no sabe nada ms sobre estadstica.
P e r so n a

D estreza

A n sied a d

1
2
3
4

1
i
2
4

10
8
4
-2
5
4 ,5 8

2
1,22

M
SD

4. Repita el ejercicio 3 resolviendo los


puntos desde (a) hasta (f), pero prediciendo es
ta vez la destreza a partir de la ansiedad. Luego
indique qu resultados son diferentes y cules
son iguales a los obtenidos en el ejercicio 3
(Nota; S5Total correspondiente a destreza es 6).
5. Ciertos psiclogos especializados en te
mas sociales que investigan temas relacionados
con la justicia penal estn interesados desde
hace mucho tiempo en la influencia de varios
factores en los sentimientos que despierta en el
pblico el castigo impuesto a los criminales.
Graham y sus colegas (1997) aprovecharon el
muy famoso juicio de la estrella de ftbol ame
ricano O. J. Simpson para probar algunos te
mas bsicos en este campo. Durante los prime
ros das despus de que Simpson fue acusado
de haber matado a su ex esposa, los investiga

P e r so n a

Control
Responsabilidad
Ira
Com pasin
Estabilidad
Expectativa

1
0
0
0
0
0

0
0
0
0

0
0
1
0
0
0

0
0
0
1
0
0

dores formularon una serie de preguntas sobre


e caso. Los investigadores estaban particular
mente interesados en las respuestas de 177 in
dividuos que crean probable que Simpson
fuera culpable y, en especial, en la creencia que
estas personas tenan respecto de la retribu
cin: hasta qu punto estaban de acuerdo o no
con la afirmacin el castigo debera hacer su
frir a Simpson lo que l hizo sufrir a otros. Los
investigadores se centraron en una cantidad de
posibles factores que influan sobre esas creen
cias. Los factores incluan el control (cunto
control crean ellos que Simpson tena sobre
sus acciones en el momento del crimen), la
responsabilidad (cun responsable por el cri
men crean ellos que l era), cunta ira sen
tan hacia l, cunta compasin sentan por
l, la estabilidad" (hasta que punto crean que
sus acciones representaban un comportamiento
estable o temporario) y la "expectativa (si crean
que volvera a cometer un crimen de esa ndole).
El informe deca:
L a tab la [4 -1 1 ] rev ela un a p o y o p arcial a
n u estras h ip te sis . C o m o era d e esp erar
s e , lo s p r e d icto res m s im p ortan tes en
cu a n to al o b jetiv o d e retrib u cin (h a cer
su frir a S im p so n ) fu eron la s d e d u c c io n e s
r ela cio n a d a s c o n la resp o n sa b ilid a d y las
e m o c io n e s m o r a le s d e ira y c o m p a si n .
L a esta b ilid a d y la e x p e cta tiv a
( p .337)

Explique estos resultados a una persona que


comprende qu es una correlacin pero que nun
ca ha escuchado hablar sobre anlisis de regre
sin o regresin mltiple. (Haga referencia slo
a la parte de la tabla sobre retribucin. La colum-

i
1

0
0
1

0
0
0
0
0

0
0
0

0
0

l
1
1
1
1

-l
-1
-1
1
1
1

E
0
0
0
0

fu e

ron [p red ictores] r elativam en te d b ile s .

a r, qu se refiere a significacin estadstica de Calcule el coeficiente de correlacin, deter


mine el modelo de prediccin con puntuacio
ios resultados, se puede ignorar).
. Sobre la base de la tabla 4-11 del ejerci nes orignales para predecir la altura de una
cio 5, escriba la ecuacin de regresin para persona a partir de la altura de su madre y pre
predecir la retribucin. Luego determine la pare un grfico que muestre la recta de regre
puntuacin Z predicha para retribucin corres sin. Finalmente, sobre la base del modelo de
pondiente a las personas desde A hasta J, cuyas prediccin determinado, prediga la altura de
puntuaciones Z en cada variable predictora se una persona de su mismo sexo cuya madre
mide a) 5 pies, b) 5 pies y 6 pulgadas y c) 6
detallan a continuacin.
pies. (Nota: Convierta las pulgadas en deci
7.
Pregunte a cinco alumnos de su mismo
sexo (cada uno proveniente de una familia di males de los pies o resuelva todo el problema
ferente) cul es su altura y la de sus 'madres. utilizando pulgadas),

Tabla 4-11.
Regresiones mltiples que predicen el castigo deseado a partir de variables de imputabilidad
(estudio 1).
C astig o d esea d o ________________________________________________ ______ _ _ _

Retribucin
P red icto res
Control
Responsabilidad
Ira
C om pasin
Estabilidad
Expectativa

-0 ,0 5
-0 ,1 7
- 0 ,3 0
-0 ,3 0
-0 ,0 1
- 0 ,1 0

R1

< 1,07***
-2 ,0 7 * * *
-4 ^ 4 * * *
-3 ,6 8 * * *
< 1 ,0 7 * * *
-1 ,3 3 * * *
-0 ,2 7 * * *

Rehabilitacin

-0 ,0 5
- 0 ,0 0
-0 ,1 1
- 0 ,3 9
- 0 ,3 4
-0 ,0 6

< 1,07***
< 1,07***
_ 4 * * *
-5 ,1 8 * * *
-4 ,8 5 * * *
< 1,07***
-0 ,3 7 * * *

Proteccin

-0 ,0 3
-0 ,0 4
-0 ,0 3
-0 ,0 7
- 0 ,1 9
-0 ,2 7

< 1,07***
< 1,07***
<1,07***
<1,07***
2 ,3 3 * * *
3,36***
0,17***

Disuasin

P
-0 ,1 5
- 0 ,1 9
- 0 ,0 4
- 0 ,1 3
- 0 ,0 4
- 0 ,0 8

1,90*
-2 ,1 5 *

<i;oo*
- 1 ,5 4 *
< 1 ,00*
- 1 ,0 4 *
- 0 ,1 8 *

Nota: (3 a coeficiente de regresin estandarizado.

*p < 0,05; ***p < 0,001.


Fuente; Graham, S., Weiner, B., & Zucker, G. S. ( 1 9 9 7 ) , ta b . 4 . Anlisis del castigo deseado y reaccin pblica con
respecto a O J.Sim pson basado en la imputabilidad". B o le tn d e P s ic o lo g a S o c i a l y d e P e r s o n a lid a d [ P e r s o n a lit y a n d
S o c i a l P s y c k o lo g y B u lle tin ] , 23, 3 3 1 - 3 4 6 . Copyright, 1997, por la Sociedad de Psicologa Social y de Personalidad
[Society for Personality and Social Psychology], Inc. Reimpreso con autorizacin de Sage Publications, Inc.

Algunos
componentes clave
de la estadstica
inductiva:
Curva normal, probabilidad
y poblacin versus muestra

Descripcin del captulo.


Distribucin normal.
Resumen.
Probabilidad.
Trminos clave.
Muestra y poblacin.
Ejercicios;'^
Relacin entre curva normal,
Apndice del captulo: reglas de la.
probabilidad y muestra versus poblacin.
probabilidad y probabilidades
Controversias y limitaciones.
condicionales.
. Curvas normales, probabilidades,,
muestras y poblaciones segn se
describen en publicaciones cientficas.
:

omnmente, los psiclogos realizan investigaciones para probar un principio terico


o la efectividad de algunos procedimientos prcticos. Por ejemplo, un psicofisilogo
podra medir los cambios en el ritmo cardaco desde antes hasta despus de resolver
un problema difcil, y las mediciones podran utilizarse luego para probar una teora
que predice que el ritmo cardaco debera cambiar despus de la solucin exitosa de
un problema. Un psiclogo especializado en temas sociales podra analizar la efectividad de un
programa de reuniones vecinales con el fin de fomentar la conservacin del agua. Tales estudios
se realizan con un grupo determinado de personas que participan en la investigacin, pero los in
vestigadores utilizan la estadstica nferencial para sacar conclusiones ms generales sobre prin
cipios tericos o procedimientos en estudio. Las conclusiones exceden el lmite del grupo
determinado de personas que participan en la investigacin.
En este captulo, al igual que en los captulos , 7 y 8, presentamos la estadstica nferencial,
que establece los cimientos para la mayor parte de lo que resta del libro. El captulo trata tres te
mas: curva normal, probabilidad y poblacin versus muestra. Es un captulo comparativamente
corto, el cual prepara el camino para los prximos, que son ms complejos.

DISTRIBUCIN NORMAL
En el captulo 1 observamos que los grficos de muchas distribuciones de variables estudiadas
por los psiclogos (al igual que muchas otras distribuciones naturales) presentan forma de cam
pana, aproximadamente simtrica y unimodal. Estos histogramas o polgonos de frecuencias con
forma de campana se aproximan a una distribucin matemtica precisa e importante denominada

distribucin norm al o, simplemente, curva norm al.1 (Con frecuencia tambin se la denomi
na distribucin de Gauss, en honor ai astrnomo Karl Friedrich Gauss. Sin embargo, si su des
cubrimiento puede atribuirse a alguien, realmente debera atribursele a Abraham De Moivre,
vase cuadro 5-1). La figura 5-1 muestra un ejemplo de curva normal.

Por qu la curva normal es tan comn en fa naturaleza?


Tomemos, por ejemplo, la cantidad de letras elegidas al azar que determinada persona puede re
cordar con precisin en diversas pruebas (con diferentes letras elegidas al azar en cada oportuni
dad). En algunas pruebas, la cantidad de letras recordadas puede ser alta, en otras, baja, y en la
mayora, las cantidades sern intermedias. Es decir, es probable que la cantidad de letras elegidas
al azar que una persona pueda recordar en diversas pruebas siga aproximadamente una curva nor
mal. Supongamos que la persona tiene una capacidad bsica para recordar de, digamos, siete le
tras, en este tipo de pruebas de memoria. Sin embargo, en alguna prueba en particular, el nmero
real recordado se ver afectado por diversas circunstancias, tales como ruido en la habitacin, es
tado de nimo de la persona en ese momento, una combinacin de letras confundidas inconscien
temente con algn nombre familiar, una secuencia de letras elegidas al azar que resulta ser casi
siempre la misma letra, etctera.
Las distintas circunstancias se combinan y hacen que la persona recuerde ms de siete pala
bras en algunas pruebas y menos de siete palabras en otras. 'No obstante, es muy probable que la
combinacin particular de estas circunstancias que ocurren en cualquier prueba se d esencial
mente por azar. Por lo tanto, en la mayora de las pruebas las circunstancias positivas y negativas
deberan prcticamente cancelarse unas a otras. Realmente no son muchas las chances de que
ocurran todas las circunstancias negativas juntas en una prueba y ninguna circunstancia positiva.
As, en general, la persona recuerda una cantidad media, una cantidad en la que todas las cir
cunstancias contrapuestas se cancelan entre s, y por eso son mucho menos comunes las cantida
des muy altas o muy bajas de letras recordadas.
Esto crea una distribucin que es unimodal, es decir, la mayora de los casos estn cerca del
medio y los menos estn en los extremos. Tambin crea una distribucin que es simtrica, porque
cualquier valor puede estar tanto por arriba como por debajo del medio. Que la curva sea unimodal

Figura S-l.
Una curva normal.

1La frmulade lacurva normal (cuando la mediaes 0 y el desvo estndares 1) es:


/W = ? 2 *
donde/(jc) es la altura de la curva enel puntox , y ir son las constantes matemticas usuales (aproximadamente 3,14 y
2,72 respectivamente). Sin embargo, los psiclogos Investigadores casi nuncautilizanesta frmula, ya que est inclui
daen los distintos programas paracomputadoras que realizanclculos estadsticos con curvas normales. Ycuando de
benrealizarel clculo manualmente, cualquierinformacin necesariasobre la curva normal aparece en tablas en los
libros de estadstica (porejemplo, la tabla B-l en la tUima parte de este libro).

; ~
. /y ' .
~
Cuadro 5-1.
,De Mivr, el excntrico desconocido que invent la curva normal.

La curva normal es un tema central en esta


dstica: es la base de la mayora de las teo
ras y procedimientos estadsticos. Si existe
una persona de la que pueda decirse que
descubri este principio fundamental de la
materia, esa persona es Abraham De Moivre, Este era un protestante francs que lleg a
Inglaterra a los 21 aos de edad, huyendo de.:
persecuciones religiosas en Francia, lugar
que en 1685 se negaba a los protestantes.
todas sus libertades civiles. En Inglaterra,.
De Moivre entabl amistad cn Isaac Newton, de quien se supone que muchas veces
contest preguntas diciendo: *Pregntale a
monsieur De Moivre, l sabe todo eso mejor
que yo. Sin embargo, como era extranjero,
De Moivre nunca pudo lograr la fama de los
matemticos britnicos con ios que trabaja-.
ba y que tanto lo respetaban. :
De Moivre era principalmente experto,
en el azar. En 1733, escribi un mtodo de .
aproximacin a la suma de los trminos del
desarrollo del binomio por tina serie, de don
de se deducen algunas reglas prcticas para
estimar el grado de asentimiento que se debe
otorgar a un determinado experimento. Su
trabajo describa esencialmente la curva nor
mal. Sin embargo, la descripcin se realizaba
slo en forma de ley. En realidad, De Mivre:
nunca traz la curva propiamente dicha, de
hecho, no estaba muy interesado en efl. .
Sus ideas sobre la distribucin normal
eran slo ua herramienta que desarroll
para calcular la probabilidad de que ocurra
una cantidad determinada de veces un he
cho para el que existen dos posibilidades,
como por ejemplo, arrojar una moneda,
cuando la cantidad de ensayos es muy gran
de. Hasta ese momento, se utilizaba una es
pecie de cuadro denominado tringulo

aritmtico para aproximar el resultado.


Pero el. cuadro tena que ser muy grande pa
ra, digamos, 1.000 tiros de moneda o. 1.000
mediciones que podan o no ser exactas (es
tos inconvenientes fueron enfrentados en pri
mer lugar por la astronoma y la psicofsica)..
De Moivre resolvi el problema con su m-,
todo de aproximacin.
Con frecuencia se otorga el crdito por 1'.
el descubrimiento de la curva normal a-L,
Pierre Laplace, un francs que permaneci
en su lugar de origen, o a Kari Friedrich
Gauss, alemn, o a Thomas Simpson, in
gls. Todos ellos trabajaron en el problema
de la distribucin de errores en torno a una u
.media, llegando incluso al punto de descri-
bir la curva o trazar aproximaciones de la
misma. Pero aun sin dibujarla, De Moivre
fue el primero en. calcular las reas debajo
de la curva normal en 1, 2 y 3 desvos es
tndar; Karl Pearson (de quien hablamos
en el cuadro .14-1), un importante estadista
co posterior, tuvo la fuerte conviccin de '
que De Moivre era ei verdadero descubri
dor de ese importante concepto. '
En Inglaterra,:,!DeqMqivre: era muy' ;:
apreciado tanto cdmp:hombre de. letras co- ,
m de nmeros; conoca en profundidad ;V:
todos los clsicos y poda, recitar escenas
completas d su querido. Misntropo de
Moliere. Sin. embargo,' com o. reconoc-:
miento a todo lo que senta.por su,Francia
natal, la Academia Francesa o eligi, po^. :
co antes de su muerte, miembro xtranjie-.
ro de la Academia de Ciricias. obstante, :
en Inglaterra no poda ser nombrado para
una posicin universitaria porque all tam
bin era considerado extranjero. Su vida
transcurri en la pobreza, sin posibilidades.; :
siquiera de casarse: Durante los primeros ..

aos trabaj como profesor visitante de


matemtica. Ms tarde, se hizo famoso por
permanecer todo el da sentado en Slaugh
ters Coffee House* en Long Acre, espe
rando a los aposfadores y aseguradores
(dos profesiones igualmente inciertas y pe
ligrosas antes de que se perfeccionaran las
estadsticas), quienes le pagaban pequeas
sumas de dinero para que les calculara pro
babilidades.
La inusual muerte de De Moivre ge
ner muchas leyendas. Trabaj mucho con
series infinitas, que siempre convergen
en cierto lmite. Cierta historia relata que
De Moivre comenz a dormir quince minu
tos ms cada noche hasta llegar a dormir
constantemente, y despus muri. Otra ver
sin cuenta que su trabajo en el caf lo llev
a tal grado de desesperacin que simple-

mente se acost a dormir hasta que muri;


Es probable que la versin ms exacta sea
la que dice que sufra cierta enfermedad
que lo haca dormir cada vez ms. En todo
caso, a los ochenta aos de edad slo po
da permanecer despierto cuatro horas por
da, aunque se deca que en esas horas su
tarea intelectual era ms febril que nunca..
Ms tarde, sus horas de vigilia se reduje
ron a una hora por da, y luego desapare
cieron. A los. 87 aos de edad, despus de
permanecer ocho das en cama, no despert
y fue declarado muerto por somnolencia.
Fue un hombre.suficientemente inteligen
te, no slo para inventar la curva noprnai
sino tambin por irse de este ifiundo^ des
cansando.

Referencias: Pearson (1978);Tankard (1984);

y simtrica no garantiza que sea cercana a una curva normal; sus colas podran ser demasiado altas
o demasiado bajas. Sin embargo, puede demostrarse matemticamente que, a la larga, si las cir
cunstancias ocurren realmente al azar, el resultado ser una perfecta curva normal. (La prueba pue
de encontrarse en algn texto de estadstica matemtica). Los estadsticos matemticos llaman a
este principio el teorema del lmite central. Veremos ms sobre este principio en el captulo 7.

La curva norma! y el porcentaje de casos ubicados entre la media y 1 y 2 desvos


estndar con respecto a ella
Debido a que la forma de ia curva normal es estndar, existe un porcentaje conocido de valores por
debajo y por encima en cualquier punto en particular. Por ejemplo, exactamente el 50% de los va
lores se encuentran por debajo de ia media, porque en cualquier distribucin simtrica la mitad de
ios valores se encuentran por debajo de la media. Ms interesante es, como lo muestra la figura 5-2,
que aproximadamente el 34% de los valores estn siempre entre la meda y 1 desvo estndar con
respecto a ella. (A propsito, podemos observar que en la figura 5-2 el punto correspondiente a 1
desvo estndar en la curva normal coincide con el lugar de la curva en el que sta comienza a ir
ms hacia fuera que hacia abajo).
Para ilustrar la utilidad del hecho de que la curva normal sea completamente estndar, consi
deremos los valores de ct. En muchas pruebas de inteligencia ampliamente utilizadas, el c medio
es 100, el desvo estndar es 16 y la distribucin de valores de c se considera aproximadamente
normal (vase figura 5-3). Conocer la curva normal y el porcentaje de valores entre la media y 1
'* N. de ia Trad.: Un coffee h ou se " es similar a lo que nosotros llamamos confitera o caf.

desvo estndar por sobre la media nos permite saber que aproximadamente el 34% de las perso
nas tienen registros C entre 100 (la media de los C) y 116 (el c a 1 desvo estndar por encima de
la media). Dado que la curva normal es simtrica, aproximadamente un 34% de las personas tienen
un c entre 100 y 84 (el valor ubicado a 1 desvo estndar por debajo de la media), y un 68% (34%
+ 34%) tiene un c entre 84 y 116.
Observando la curva normal podemos observar algo ms: existen muchos menos valores en
tre 1 y 2 desvos estndar de la media que entre la media y 1 desvo estndar con respecto a ella.
Aproximadamente el 14% de los valores se ubican entre 1 y 2 desvos estndar por sobre la media
(vase figura 5-2). De modo similar, siendo la curva normal simtrica, aproximadamente un 14%
de los valores se encuentra entre 1 y 2 desvos estndar debajo de la media. Por lo tanto, aproxi
madamente un 14% de personas tienen c entre 116 (1 desvo estndar sobre la media) y 132 (dos
desvos estndar sobre la media).
Ser muy til recordar estos nmeros: 34% y 14%. Las figuras indican el porcentaje de perso
nas por encima y por debajo de cualquier valor en particular slo con saber la cantidad de desvos
estndar por encima o por debajo de la media en que se encuentra dicho valor.
Tambin es posible, a partir de un porcentaje, invertir el mtodo y calcular la cantidad de des
vos estndar de la media a los que se encuentra determinada persona. Supongamos que nos infor
man que en determinada prueba una persona present un valor dentro del 2% ms elevado.
Suponiendo que los valores de la prueba tienen una distribucin aproximadamente normal, la per
sona debe tener un valor al menos de dos desvos estndar por encima de la media. Esto se debe a
que del 50% de los valores ubicados por encima de la media, el 34% se encuentra entre la media y
1 desvo estndar por encima de ella; y otro 14% se encuentra entre 1 y 2 desvos estndar sobre
la media. Eso deja un 2% (es decir, 50% - 34% -1 4 % = 2%).
De manera similar, supongamos que estamos seleccionando animales para un estudio y nece
sitamos examinar su agudeza visual. Supongamos tambin que la agudeza visual est normal-

Figura 5-2. Curva normal con porcentaje


aproximado de valores entre la media y 1,
2 y 3 desvos estndar por encima y por
debajo de la media,.

Puntuaciones Z ,*~3

- 2 ',, -

.0 ,

+2

+ 3 .-

Figura 5-3. Distribucin de valores c de diver


sas pruebas estndar de inteligencia (con M~ 100
ySD =\ 6).

68

84-

100

116

Valeres c ' .

132

mente distribuida, y que quisiramos utilizar animales con un nivel de agudeza visual ubicada en
los dos tercios centrales (un nmero cercano al 68%). En ese caso, seleccionaramos animales
que presentaron valores entre 1 desvo estndar por encima y 1 desvo estndar por debajo de la
media. Si conociramos la media y el desvo estndar de la prueba de agudeza visual, podramos
luego determinar las puntuaciones originales ms bajas y ms altas en cuanto a niveles de agude
za visual.

Tabla de la curva normal y puntuaciones Z


Los nmeros 34% y 14% son referencias tiles para ser usadas como regla prctica de clculo
aproximado cuando un valor no se ubica exactamente a 1 2 desvos estndar de la media. Estos
porcentajes nos dan una idea general del lugar en el que se ubica un valor en particular con res
pecto a los otros valores de la distribucin. Sin embargo, en muchas situaciones aplicadas y de in
vestigacin, los psiclogos necesitan informacin ms precisa. Afortunadamente, a causa de que
la curva normal est definida de modo exacto, dicha precisin es posible. Es posible calcular, por
ejemplo, el porcentaje exacto de valores entre dos puntos cualesquiera de la curva normal, no s
lo aquellos que se encuentran exactamente a 1 2 desvos estndar de la media. Es decir, es posi
ble determinar el porcentaje exacto de valores entre dos puntuaciones Z cualesquiera. Por
ejemplo, exactamente un 68,59% de valores tienen puntuaciones Z entre +0,62 y 1,68; exacta
mente un 2,81% de registros tienen puntuaciones Z de entre +0,79 y +0,89, y as sucesivamente.
Estos porcentajes exactos pueden obtenerse, con la frmula de la curva normal, aplicando el
clculo integral, Sin embargo, en la prctica, los psiclogos simplifican mucho el proceso. Los
estadsticos han elaborado tablas para la curva normal que indican el porcentaje de valores entre
la media (una puntuacin Z igual a 0) y cualquier otra puntuacin Z. Supongamos que necesita
mos saber el porcentaje de valores entre la media y una puntuacin Z de 0,62. Simplemente bus
camos 0,62 en la tabla y sta nos indica que el 23,24% de los valores se encuentran entre la media
y esa puntuacin Z.
En el apndice B (tabla B-l) hemos incluido una tabla de reas bajo la curva normal. Co
mo se observa, la tabla consta de dos columnas. La primera incluye las puntuaciones Z, y la co
lumna siguiente indica el porcentaje de valores entre la media y esa puntuacin Z. Podemos
observar tambin que las dos columnas se repiten varias veces en la pgina, por lo cual recomen
damos ser cuidadosos al buscar los datos para no confundir las columnas. Adems, la tabla indica
slo puntuaciones Z positivas, porque la curva normal es perfectamente simtrica y, por lo tanto,
el porcentaje de valores entre la media y, digamos, una Z de +2,38, es exactamente igual al por
centaje de valores entre la media y un Z de -2,38.
En nuestro ejemplo, encontraramos el nmero 0,62 en la columna correspondiente a Z y
luego, justo al lado de ese nmero, en la columna correspondiente a % entre media y Z, encon
traramos el nmero 23,24.
Tambin podemos invertir el proceso y encontrar la puntuacin Z que coincide con un por
centaje determinado de valores. Supongamos que nos informaran que el valor de Janice, en cuan
to a creatividad, se encontraba dentro del 10% ms elevado de los estudiantes de noveno grado.
Demos por hecho, adems, que los valores de creatividad siguen una curva normal. Podramos
calcular la puntuacin Z de Janice de la siguiente manera: primero tendramos que razonar que si
ella se encuentra dentro del 10%, entonces el40% de los estudiantes presentan valores entre el su
yo y la media. (Existe un 50% por encima de la media y ella est entre el 10% ms alto del total,
es decir,que queda afuera un 40%). Luego, debemos mirar la columna de la tabla correspondiente
a % entre media y Z hasta encontrar un porcentaje cercano al 40%. En este caso, el ms cercano
sera 39,97%. Finalmente, buscaramos en la columna Z a la izquierda de este porcentaje. La

puntuacin Z correspondiente al 39,97% es 1,28. Conociendo la media y el desvo estndar de los


valores de creatividad de estudiantes de noveno grado, podramos calcular la puntuacin original
de Janice en la prueba. Lo haramos transformando su puntuacin Z de 1,28 en una puntuacin
original utilizando el mtodo usual de conversin de puntuaciones Z en puntuaciones originales.

Procedimientos para calcular los porcentajes de valores a partir de puntuaciones


originales y puntuaciones Z, utilizando la tabla de reas bajo la curva normal
Basndonos en la explicacin anterior, ahora podemos rever sistemticamente los procedimien
tos para calcular los porcentajes de valores a partir de puntuaciones Z. Si estamos trabajando con
puntuaciones originales, debemos convertirlos primero en puntuaciones Z utilizando los mtodos
descriptos en el captulo 2, y luego proceder de la siguiente manera;
Primero realizamos un diagrama de la curva normal; marcamos el lugar en el que se ubica la
puntuacin Z y sombreamos el rea con respecto a la cual estamos intentando encontrar el por
centaje. Luego estimamos el porcentaje del rea sombreada sobre la base de la regla prctica,
50%-34%-14%. Al marcar la puntuacin Z, debemos aseguramos de ubicarla en el lugar correc
to por encima o por debajo de la media, segn sea positivo o negativo. Es importante hacer un dia
grama dei problema y realizar una estimacin aproximada, ya que de ese modo es mucho menos
probable que cometamos errores al realizar el clculo ms preciso.
Una vez que tenemos el diagrama y la estimacin aproximada, podemos continuar con el pro
ceso para encontrar el nmero exacto. El paso principal es buscar la puntuacin Z en la columna
Z de la tabla B-'l y buscar el porcentaje correspondiente en la columna entre la media y Z que
se encuentra al lado. Si lo que buscamos es el porcentaje de valores entre la media y esa pun
tuacin Z, esa sera nuestra respuesta final. Pero con frecuencia necesitaremos agregar un 50% a
este porcentaje. Esto es necesario cuando la puntuacin Z es positiva y buscamos el porcentaje to
tal que se ubica por debajo de esa puntuacin Z, o cuando la puntuacin Z es negativa y buscamos
el porcentaje total que se ubica por encima de esa puntuacin Z. En otras ocasiones tendremos
que restar al 50% el porcentaje obtenido. Esto es necesario cuando la puntuacin Z es positiva y
buscamos el porcentaje por encima de ella, o cuando la puntuacin Z es negativa y buscamos el
porcentaje por debajo de ella.
No es necesario memorizar las reglas que acabamos de mencionar. Es mucho ms fcil reali
zar un diagrama del problema y calcular si el porcentaje que obtenemos de la tabla es correcto tal
como est o si necesitamos sumar o restar un 50%.

Ejemplos
Analicemos algunos ejemplos utilizando valores de c i Supongamos que una persona tiene un a
de 125. Qu porcentaje de personas tiene mayores valores de ci? Antes de continuar necesitamos
convertir la puntuacin original en una puntuacin Z, Suponiendo que la media es de 100 y el des
vo estndar de 16, un valor ct de 125 es igual a una puntuacin Z de +1,56. Ahora que tenemos la
puntuacin Z, el primer paso es realizar el diagrama. En la figura 5-4 hemos sombreado el rea
por encima de la puntuacin Z de 1,56. Ahora queremos aproximar el porcentaje utilizando la re
gla 50%-34%-I4%. Una puntuacin Z de 1 tiene un 16% de valores por encima de ella (esto se
debe a que hay un 34% de valores entre ella y la media, y existe un 50% de valores en total por en
cima de la media; es decir, que queda un 16% de valores por encima de 1 desvo estndar). Como
vimos en uno de los ejemplos anteriores, por encima de una puntuacin Z de 2 se ubica el 2%
de los valores; por lo tanto, por encima de una puntuacin Z de 1,56 habr entre el 16% y el 2% de
los valores.

Despus de realizar el diagrama y estimar el porcentaje, estamos listos para calcularlo exacta
mente. En la tabla de reas de la curva normal, 1,56 en la columna Z coincide con 44,06 en la
columna % entre la media y Z. Por lo tanto, el 44,06 % de las personas tiene valores de ci entre
el a medio y un a de 125 (una puntuacin Z de +1,56). En una curva normal, el 50% de las per
sonas se encuentra por encima de la media. Dado que el 44,06% de las personas que se ubican por
encima de la media encuentran a su vez por debajo del a de la persona analizada, queda un res
to del 5,94% (50%-44,06%) de personas por encima del valor de la persona en cuestin. Esa es la
respuesta a nuestro problema (representado por la figura 5-4). Cabe destacar que el porcentaje
calculado se encuentra dentro del rango estimado utilizando la regla de aproximacin del
50%~34%~14%.
Analicemos ahora a una persona con un ci de 95. Qu porcentaje de personas presentan
mayores valores de ex que la persona analizada? Siguiendo el procedimiento acostumbrado para
convertir una puntuacin original en una puntuacin Z, un Cl de 95 es igual a una puntuacin Z
de -0,31. La figura 5-5 muestra el diagrama para esta situacin. Hemos sombreado el rea de la
curva superior a una puntuacin Z de -0,31. La puntuacin Z que analizamos se encuentra entre
0 y -1. Una puntuacin Z igual a 0 tiene un 50% de los valores por encima de s, y una puntua
cin Z de -1 tiene un 84% de los valores por encima de s (esto se debe a que un 34% de los va
lores se ubican entre -1 y 0 y otro 50% se ubica por encima de 0, lo que sumado da un total de
84%). Por lo tanto, entre un 50% y un 84% de los valores se ubicarn por encima de la puntua
cin Z d e -0,31.
Realicemos ahora el clculo exacto. La tabla de reas de la curva normal muestra que el
12,17% de los valores se encuentran entre la media y una puntuacin Z de 0,31. Debido a que la

Figura 5-4. Distribucin de valores de C :


la regin sombreada corresponde al por
centaje de valores que se ubican por enci
ma de un registro C de 125.

Figura 5-5. Distribucin de valores de CI:


la regin sombreada corresponde al por
centaje de valores que se ubican por enci
ma de un valor ci de 95.

curva normal es simtrica, sta es tambin el rea entre una puntuacin Z de -0,31 y la media. Por
lo tanto, el rea total sobre -0,31 es 12,17% ms el 50% que se ubica por encima de la media, lo
que da un total de 62,17%. (El resultado se encuentra dentro de nuestro rango de aproximacin
del 50% al 84%).
Por otro lado, podemos observar tambin que el porcentaje de valores por debajo de una pun
tuacin Z de -0,31 sera igual al 50% que se ubica por debajo de la media menos el 12,17% que
se ubica entre la media y -0,31, dejando un total del 37,81% de los valores por debajo de la pun
tuacin Z de -0,31.
Procedimientos para calcular puntuaciones originales y puntuaciones Z
a partir de porcentajes de registros, utilizando la tabla de reas bajo la curva normal
Obtener una puntuacin Z a partir de un porcentaje es similar a la obtencin de un porcentaje a
partir de una puntuacin Z. En ambos casos comenzamos realizando un diagrama del problema,
sombreamos el porcentaje aproximado, y realizamos una estimacin tambin aproximada de la
puntuacin Z utilizando los porcentajes del 50%-34%-14%. El resto del proceso es casi exacta
mente opuesto a ir de una puntuacin Z a un porcentaje. Mirando'el diagrama, calculamos el por
centaje entre la meda y el lugar en el que comienza o termina el sombreado. Por ejemplo, si
nuestro porcentaje es el 8% superior, entonces el porcentaje desde la media hasta donde comien
za ese sombreado es igual al 42%. S nuestro porcentaje es el 35% inferior, entonces el porcenta
je desde la media hasta donde comienza el sombreado es del 15%. Si nuestro porcentaje es el 83%
superior, entonces el porcentaje desde la media hasta donde termina el sombreado es del 33%.
Una vez que conocemos el porcentaje desde la media hasta donde comienza o termina el
sombreado, buscamos el nmero ms cercano que podamos encontrar en la columna de % entre
la media y Z en la tabla de reas bajo la curva normal. La puntuacin Z en la columna Z al la
do del porcentaje ser nuestra respuesta, a menos que la puntuacin Z que buscamos sea negativa.
La mejor forma de saber si es positiva o negativa es a partir de la aproximacin y del diagrama.
Si fuera necesario una respuesta final en puntuaciones originales, convertimos las puntuacin
Z en puntuaciones originales utilizando los mtodos aprendidos en el captulo 2.

Ejemplos
Una vez ms, utilizaremos en nuestros ejemplos los valores de ci. Qu a necesitara una persona
para estar dentro del 5% superior? La figura 5-6 muestra nuestro diagrama, donde se observa que
hemos sombreado ei rea que representa el 5% superior. Utilizando la regla del 50%-34%~14%,
podemos adelantar que la puntuacin Z correspondiente al 5% superior est entre +1 y +2. El cl
culo que realizamos fue el siguiente: del 50% que se encuentra por encima de la media, el 34% se
ubica entre la media y 1 desvo estndar, con lo cual queda un 16% superior a 1 desvo estndar.
Sin embargo, dado que hay un 14% entre 1 y 2 desvos estndar, queda slo un 2% superior a 2
desvos estndar.
Con respecto a la puntuacin Z exacta, primero averiguamos el porcentaje entre la media y el
lugar en el que empieza nuestra rea sombreada. En este caso, si ei 50% de las personas tienen va
lores de C superiores a la media, al menos un 45% de las personas presentan valores de ci ubica
dos entre la persona en cuestin y la media (50% - 5% = 45%). Buscando en la columna % entre
la media y Z en la tabla de reas bajo la curva normal, el valor ms cercano al 45% es 44,95%
(tambin podramos utilizar el 45,05%). Este porcentaje coincide con una puntuacin Z de 1,64
en la columna Z, Tal como lo esperbamos segn nuestra aproximacin inicial, la respuesta se
ubica entre +1 y +2.

Para averiguar la puntuacin original podemos utilizar la frmula del captulo 2: X =


M + (Z)(SD). Con un C medio de 100 y un desvo estndar de 16, llegaramos a la conclusin de
que para estar dentro del 5% superior, una persona necesitara un C de por lo menos 126,24.
Analicemos ahora qu valor de c estara dentro del 2,5% inferior. La figura 5-7 representa
nuestro diagrama del problema, sombreado en la paite correspondiente al 2,5% inferior. El 2%
inferior de una curva normal comienza en el segundo desvo estndar inferior a la media (igual
que el 2% superior comienza en +2). Por lo tanto, podemos estimar que nuestra respuesta estar
en algn punto cercano al -2. En trminos ms precisos, el 2,5% inferior significa que, al menos,
el 47,5% de las personas presentan valores de cr ubicados entre el valor de c que pretendemos de
terminar y la media (50% - 2,5% ~ 47,5%). En la tabla de reas de la curva normal, el 47,5% en la
columna % entre la media y Z coincide con una puntuacin Z de 1,96. Debido a que estamos
buscando una puntuacin Z por debajo de la media, el nmero ubicado en la tabla se transforma
en -1,96 (un nmero bastante cercano a nuestra estimacin de -2). Al convertir este resultado en
una puntuacin original, el c correspondiente al 2,5% inferior resulta ser un c de 68,64.

PROBABILIDAD*lo
El objetivo de la mayor parte de las investigaciones psicolgicas es probar la veracidad de una
teora o la efectividad de un procedimiento. Pero la investigacin cientfica de cualquier tipo s
lo puede llegar a la conclusin de que la veracidad o efectividad resultan ms o menos proba
bles; no puede proporcionamos el lujo de la certeza. La probabilidad es muy importante para las
ciencias. En particular, es muy importante para la estadstica inferencial, es decir, para los mto
dos utilizados por ios psiclogos para sacar conclusiones sobre teoras o procedimientos aplica
dos a partir de los resultados obtenidos en investigaciones.
La probabilidad ha sido estudiada durante siglos por matemticos y filsofos y, sin embargo,
an en nuestros das el tema despierta todo tipo-de controversias. Afortunadamente, slo necesita-

Fgura 5-6. Puntuacin Z y puntua


cin original c correspondientes al 5%
superior.

Figura 5-7. Puntuacin Z y puntua


ciones originales C correspondientes
al 2,5% inferior.

mos conocer unas pocas ideas clave para comprender y realizar los procedimientos de inferencia
estadstica que aprenderemos en este libro. Esos pocos puntos clave no son muy complejos; de
hecho, algunos alumnos los consideran intuitivamente obvios.

Interpretaciones de la probabilidad
En estadstica, generalmente definimos probabilidad como la frecuencia relativa con que espe
ramos que suceda un determinado resultado. Un resultado es la consecuencia de un experimen
to (o de casi cualquier situacin en la que la consecuencia no se conoce de antemano, como puede
ser que una moneda caiga cara arriba o que Hueva maana). La frecuencia indica cuntas veces
sucede determinado hecho. La frecuencia relativa es la cantidad de veces que determinado he
cho sucede en relacin con la cantidad de veces que podra haber sucedido, es decir, la razn en
tre la cantidad de veces en que algo sucede y la cantidad de veces que podra haber sucedido.
(Una moneda podra caer cara arriba 8 veces en 12 tiros, con una frecuencia relativa de 8/12
2/3). La frecuencia relativa esperada indica lo que esperaramos que suceda a largo plazo si re
pitiramos el experimento muchas veces. (En el caso de una moneda, esperaramos que en e lar
go plazo la moneda caiga cara hacia arriba una de cada dos veces). A esto se lo denomina
interpretacin de la probabilidad como la frecuencia relativa a largo plazo.
Tambin utilizamos la probabilidad para transmitir en qu medida estamos seguros de que su
ceder un hecho en particular. A esto se lo denomina interpretacin subjetiva de probabilidad.
Supongamos que decimos que existe un 95% de probabilidad de que nuestro restaurante favorito
est abierto esta noche. Podramos estar aplicando una especie de interpretacin de frecuencia re
lativa, lo cual implicara que si verificramos si ese restaurante estuvo abierto muchas veces en
das como hoy, descubriramos que en un 95% de esos das efectivamente estuvo abierto. Sin em
bargo, lo que en realidad queremos decir es probablemente ms subjetivo: en una escala del 0% ai
100%, calificaramos nuestra confianza en que el restaurante estar abierto con un 95%. Para de
cirlo de otro modo, sentiramos que una apuesta sera justa si se basara en que las chances de que
el restaurante va a estar abierto son del 95%,
La interpretacin que uno adopte no afecta la forma de calcular las probabilidades. Presenta
mos estos conceptos aqu por dos razones. Primero, queramos dar una idea un poco ms profun
da del significado del trmino probabilidad, el cual ocupar un lugar destacado durante el resto
del aprendizaje de estadstica, aun cuando, como sucede a menudo, este conocimiento ms pro
fundo no se convierta en un dogma. En segundo lugar, es de crucial importancia familiarizarse
con ambas interpretaciones para comprender algunas de las controversias ms encendidas dentro
de la estadstica, una de las cuales presentaremos al final de este captulo.

Clculo de probabilidades
En las aplicaciones estadsticas, las probabilidades se calculan con una proporcin de resul
tados exitosos, es decir, la cantidad de resultados favorables dividida por la cantidad de re
sultados posibles.
Analicemos la probabilidad de que al lanzar una moneda sta caiga cara hacia arriba. De los
dos resultados posibles (obtener cara o cruz), existe un resultado favorable (obtener cara), es decir,
una probabilidad de 1/2 0,5. Si tiramos un slo dado, la probabilidad de sacar un 2 (o cualquier
otra cara del dado) es de 1/6 0,17. Es decir, de los seis resultados posibles hay slo un resultado
favorable en particular. La probabilidad de tirar un dado y obtener un nmero 3 o menor es de 3/6,
0,5. De seis resultados posibles existen tres resultados favorables (un 1, un 2 o un 3).

V:. Analicemos un ejemplo un poco ms complicado. Supongamos que en una case hay 200 per
sonas, y que 30 son estudiantes avanzados. Si eligiramos alguien de la clase ai azar, la probabili
dad de escoger un estudiante avanzado sera 30/200, 0,15. Es decir, de 200 resultados posibles
existen 30 resultados favorables (elegir un estudiante avanzado).
Rango de probabilidades
Las probabilidades son razones (la cantidad de resultados favorables sobre el total de resultados
posibles). Esta razn no puede ser menor que 0 ni mayor que 1. Expresada en porcentajes, va del
0% al 100%. Algo que no tiene chances de ocurrir tiene probabilidad 0 y algo que ocurrir con
certeza tiene probabilidad 1. Cuando un hecho no puede ocurrir o es imposible, tiene probabili
dad 0, pero cuando a probabilidad de un hecho es baja, digamos un 5% o incluso un 1%, el hecho
es improbable o poco probable, pero no imposible.

Las probabilidades expresadas con smbolos


La probabilidad se simboliza generalmente con la letrap. El nmero real que representa una pro
babilidad por lo general es un decimal, aunque a veces se utilizan fracciones o porcentajes. As, si
Las chances son 50-50 usualmente se expresa por escrito p = 0,5, aunque tambin podra expre
sarse p = 1/2 p = 50%. Tambin es comn ver la probabilidad expresada por escrito como me
nos que algn nmero, utilizando el signo menos que (<). Por ejemplo, p<0,05 significa la
probabilidad es menor a un 5%.
Regas de probabilidad

Como mencionamos anteriormente, nuestra exposicin slo trata el tema de la probabilidad de


modo superficial. Uno de los aspectos que no hemos tenido en cuenta son las reglas para calcular
probabilidades relacionadas con experimentos o resultados mltiples (por ejemplo, cul es la pro
babilidad de tirar una moneda dos veces y que en ambos casos caiga cara hacia arriba?). Estas
normas se denominan regas de probabilidad y representan un papel muy importante en las bases
matemticas de muchos aspectos de la estadstica. Sin embargo, no es necesario conocer las re
glas de probabilidad para comprender el material cubierto por este libro. Ms an, estas reglas ra
ra vez se utilizan directamente al analizar los resultados de investigaciones psicolgicas. De todos
modos, en algunas publicaciones cientficas podramos ocasionalmente encontramos con refe
rencias a esos procedimientos; por lo tanto, en el apndice del captulo describimos las dos reglas
de probabilidad ms comnmente mencionadas.

Probabilidad y la distribucin normal


Hasta ahora hemos tratado principalmente probabilidades de hechos puntuales que podran
suceder como no suceder. Tambin podemos hablar de hechos ms generales que podran o
no suceder, como por ejemplo, lanzar un dado y obtener un 3 un nmero menor. Otro ejem
plo sera la probabilidad de elegir a alguien que tenga entre 30 y 40 aos de edad, en una calle
de la ciudad.
Si pensamos en la probabilidad en trminos de cantidad de resucitados favorables, sobre la
cantidad de casos posibles, la probabilidad puede equipararse adecuadamente con las distribucio
nes de frecuencias (vase captulo 1). Analicemos la distribucin de frecuencias que aparece en el
histograma de la figura 5-8. Del total de 50 nmeros, 10 son 7 mayores. Si estuviramos selec-

s
. . ..
Cuadro 5-2.
Pascal coirnriza a desarrollar la teora de la probabilidad
en las mesas de juego y ms tarde aprende apostar a Dios.

Mientras que en Inglaterra se utilizaba la esla teora de la probabilidad y con el trabajo


tadstica para tener una idea del ndice de
que terminara, dando' como resultado, la
. mortalidad y para probar la existencia de
curva normal.
Dios {vase cuadro 1-1), los franceses y los
No mucho;tiempo despus de resolver
italianos desarrollaron la estadstica alredeeste problema, Pascal se convirti repentidor de las mesas de juego. Exista un proble- : , ,namente en un religioso tan devoto como i
. ma en particular, denominado problema de
,los estadsticos ingleses. El coche en el
los puntos (el reparto de las apuestas en un : .que viajaba cruz desbocado un puente y
juego despus de interrumpirlo). Si se pea- , . vPascal se salv de ahogarse slo porque
saba realizar cierta cantidad de juegos, qu :: ,en el ultimo: instante se rompieron los; ti- v
parte de las apuestas debera llevarse cada
rantes de atelaje. Consider que esto era ' .,;
jugador segn el porcentaje ya jugado?: ;
una advertencia para que abandonara su
El problema fue tratado,' al menos, a
trabajo matemtico y se dedicara a la espartir del ao 1494 por Lea Pacioli, un
critura religiosa, formulando ms tarde la
amigo de Leonardo da Vinci. Pero permaApuesta d, P asearl e! valor de un juego
necio sin resolverse hasta el ao 1654,
est dado por el valor del premio multiplicuando fue presentado a Blaise Pascal por
cado .por las probabilidades de ganarlo;
el Caballero de Mr. Pascal, un nio propor lo tanto, .aun .cuando las probabilida-: ;
: dgio francs, asista reuniones de los ms des de que exista Dios sean bajas, debera,famosos matemticos franceses adultos, y
mos . apostar. p o r . l . alirtriacin d s. :
a los 15 aos de edad prob un importante
existencia, ya que el .valor del premio es
teorema de geometra. Junto con Fierre
infinito, mientras que el valor ci no creer;
Fermaf, otro famoso matemtico francs, . es slo placer mundano finito! .
Pascal resolvi el problema de ios puntos,
r. .
; :
y al hacerlo, comenz con el.desarroll de
Referencia; Tankard (1984).

cionando al azar personas, cada una con un nmero de estos asignados, habra 10 posibilidades
(resultados favorables) de 50 (todos los resultados posibles) de seleccionar una que tuviera asig
nado un nmero igual a 7 mayor. Por lo tanto, p - 10/50 = 0,2
La distribucin normal tambin puede considerarse como una distribucin de probabilidades.
La curva normal representa a una distribucin de frecuencias en la que se conoce la proporcin de
valores entre dos puntuaciones Z cualesquiera. Como hemos visto, la proporcin de valores entre
dos puntuaciones Z cualesquiera es la mismo que la probabilidad de seleccionar un valor entre
esas dos puntuaciones Z. Por ejemplo, la probabilidad de que un valor se encuentre entre la media
y una puntuacin de +1 (1 desvo estndar por encima de la media) es de aproximadamente un
34%, es decir, p - 0,34.

F igura 5-8. D istrib u ci n d e frecu en cia s (en form a de


h isto g ra m a ) d e la s e le c c i n d e 5 0 n m eros, en las
que la p robabilidad d e e le g ir e l 7 un nm ero m ayor
espz* 0 ,2 (1 0 /5 0 ).

l 2

3 4, 5

6{ 7

10

Es probable que lo que estamos diciendo haya sido obvio desde el principio. En algn sentido, el
hecho de que la curva normal pueda representar tanto a una distribucin de frecuencias como a
una distribucin de probabilidades, es meramente un tema tcnico. Slo lo mencionamos para
que no haya confusiones ms adelante, cuando hagamos referencia a la probabilidad de que un
valor est en un intervalo, como el rea sobre l bajo la curva normal.

MUESTRA Y POBLACIN
Presentaremos algunas ideas importantes utilizando el ejemplo de las habas. Supongamos que es
tamos cocinando una olla con habas y probamos una cucharada para ver si estn listas. En este
ejemplo, la olla con habas es la poblacin, la cantidad completa de elementos que nos interesan.
La cucharada es la muestra, la parte de la poblacin sobre la cual realmente tenemos informa
cin. La figura 5-9 grfica el ejemplo.
En la investigacin psicolgica, generalmente estudiamos muestras, no de habas sino de indi
viduos. Una muestra podra consistir en 50 mujeres canadienses que participan en determinado
experimento; la poblacin que uno podra tener el propsito de reflejar seran todas las mujeres
canadienses. En un sondeo de opinin, podramos seleccionar 1.000 personas de toda la pobla
cin con edad para votar de un determinado pas y preguntarles por quin votaran. Las opiniones
de esas L000 personas conforman la muestra. Las opiniones del todo el publico votante en ese
pas, respecto de quienes los encuestadores van a generalizar sus resultados, son la poblacin
(vase figura 5-10)2.
Por qu se analizan muestras y no poblaciones?
Como hemos visto, los investigadores realizan estudios para averiguar algo sobre una determina
da poblacin. Por lo tanto, sus resultados seran mucho ms precisos si pudieran estudiar la po
blacin completa, en lugar de un subgrupo de esa poblacin. Sin embargo, en la mayora de las

2 Estrictamente hablando, los trminos poblacin y m uestra se refieren a una serie de valores (nmeros o mediciones),
no a los participantes de la investigacin que fueron medidos. Por lo tanto, en el primer ejemplo, la muestra est forma;
da en realidad por ios valores observados de las 50 mujeres canadienses, y no por las 50 mujeres, mientras que la pobla
cin est conformada por los valores que se obtendran s se midieran todas las mujeres canadienses.

F igura 5-9. P o b la c io n e s y m uestras: e n (a), toda la o lla con hab as e s la p ob lacin , y la cucharada e s la m u e s
tra. E n (b), to d o e l crcu lo m a y o r e s la p o b la ci n y el crcu lo qu e se encuentra dentro de ste es la m uestra.
En (c ), e l h isto g r a m a s e refie re a la p o b la c i n , y lo s v a lo r e s so m b r e a d o s to m a d o s e n co n ju n to fo rm a n
la m u estra .

Figura 5-10. O tros ejem p los


d e p o b la cio n e s y m uestras.
E n (a), la p o b la ci n est
con form ad a por lo s valores
de todas la s m ujeres can a
d ien ses, y una m u estra est
form ada por lo s 5 0 valores
ob servad os particulares de
las 5 0 m u jeres c a n a d ien ses
estu d iad as. E n (b ), ia p o b la
c i n e st c on form ad a por las
p referen cias e n cu an to a v o
to d e toda la p ob la ci n en
edad d e votar d e un p a s, y
una m u estra e st form ada
p or la s p referen cias e n cuan
to a vo to d e la s 1 .0 0 0 perso
n as en edad d e votar d e e s e
p as, a las q u e s e le s r e a l i z
la en cu esta.

investigaciones esto no es practicable. Aun ms importante, el sentido de la investigacin es, por


lo general, poder realizar generalizaciones o predicciones acerca de hechos que estn ms all de
nuestro alcance. No sera investigacin cientfica probar nuestros tres automviles para ver cul
tiene mayor rendimiento por milla, a menos que nuestro objetivo fuera probar algo acerca del ren
dimiento por milla en cuanto a esos modelos de automviles en general. En otras palabras, un in
vestigador podra realizar un experimento sobre la manera en que las personas almacenan
palabras en la memoria a corto plazo, utilizando 20 alumnos como participantes en el experimen
to. Pero el objetivo del experimento no es averiguar cmo responden esos 20 alumnos en particu
lar a las condiciones experimentales. Ms bien, el objetivo es aprender algo acerca de la memoria
humana en esas condiciones.
La estrategia de la mayora de las investigaciones psicolgicas es estudiar una muestra de in
dividuos considerados representativos de la poblacin general (o de alguna poblacin determina
da en la que estamos interesados). De manera ms realista, los investigadores intentan estudiar a
aquellas personas que no difieren de la poblacin general de ningn modo sistemtico que pudie
ra influir en el tema en anlisis.
Por lo tanto, en la investigacin psicolgica (y en casi todas las investigaciones cientficas), lo
que se analiza es la muestra. La poblacin es algo desconocido sobre lo cual los investigadores
sacan conclusiones sobre la base de la muestra. La mayor parte de lo que aprenderemos en lo que
resta del libro est basado en la importante tarea de sacar conclusiones acerca de poblaciones, to
mando como referencia la informacin obtenida a partir de las muestras.

Mtodos de muestreo
Dado que existen tantas formas de seleccionar una muestra para un proyecto de investigacin en
particular, en el apndice A presentamos una exposicin sobre varios de estos mtodos {vase
tambin cuadro 5-3). Brevemente, podemos decir que en la mayora de los casos el mtodo ideal
para seleccionar una muestra de estudio se denomina seleccin aleatoria. El investigador consi
gue una lista completa de los miembros de la poblacin y selecciona al azar una cantidad para
analizar. Un ejemplo del mtodo de seleccin aleatoria sera escribir cada nombre en una pelotita
de ping pong, colocar las pelotitas en un gran recipiente, sacudirlo y vendarle ios ojos a una per
sona para que seleccione la cantidad necesaria. (En la prctica, la mayora de los investigadores
utilizan una lista de nmeros aleatorios generada por computadora. La manera en que las compu
tadoras o las personas pueden crear una lista de nmeros realmente aleatorios es una cuestin in
teresante en s misma que analizaremos en el cuadro 15-1).
Es importante distinguir la seleccin verdaderamente aleatoria de lo que podramos denomi
nar seleccin casual, como por ejemplo, elegir a quien est disponible o primero en la lista. Utili
zando el mtodo de seleccin casual, es sorprendentemente fcil elegir accidentalmente un grupo
de personas para estudiar que sean en realidad muy diferentes a la poblacin en su conjunto. Ana
licemos el caso de un estudio de actitud para con un profesor de estadstica. Supongamos que re
colectamos la informacin para anlisis de entre aquellos que en clase se sientan cerca de
determinado alumno. Ese anlisis estara afectado por todos los factores que influyen en la elec
cin del asiento, algunos de los cuales tienen que ver precisamente con el tema que estamos ana
lizando, como por ejemplo, en qu medida los alumnos estn conformes con el profesor o con la
clase. (De modo similar, pedirle informacin a las personas que se sientan cerca de determinado

alumno, dara como resultado obtener opiniones ms similares a las de ese alumno, de lo que re
sultaran las opiniones obtenidas por medio de una verdadera muestra aleatoria).
Desafortunadamente, en la investigacin psicolgica slo es posible estudiar muestras ver
daderamente aleatorias en algunas ocasiones. La mayor parte del tiempo, de hecho, se realizan
anlisis con aquellos que quieren o pueden participar de una investigacin. En el mejor de los
casos, como ya observamos, el investigador intenta analizar una muestra de individuos de quie
nes no se conozca ningn dato que pueda hacerlos sistemticamente no representativos de la po
blacin que se intenta analizar. Por ejemplo, supongamos que se realiza un estudio acerca de un
proceso que puede dar diferentes resultados segn las distintas edades de las personas. En ese
caso, el investigador puede intentar incluir en el anlisis personas de todas las edades. Otra alter
nativa es que el investigador sea cuidadoso al sacar las conclusiones, para que estas se refieran
slo al grupo correspondiente a la edad estudiada.

Terminologa estadstica relacionada con muestras y poblaciones


La media, la varianza y el desvo estndar de una poblacin se denominan parmetros pobladonales. Generalmente se desconocen los parmetros de una poblacin, y slo pueden estimarse a
partir de lo que sabemos acerca de una muestra tomada de esa poblacin. No probamos todas las
habas, sino slo una cucharada. "Estn listas es una estimacin referida a toda la olla.
Para recordar esta diferencia, resulta til saber que los parmetros poblacionales generalmen
te se simbolizan con letras griegas. El smbolo que representa la media de una poblacin es i, la
letra griega "mu; el smbolo que representa la varianza de una poblacin es a 2, y el smbolo que
representa su desvo estndar es a, la letra griega sigma minscula. Estos signos no aparecern
con mucha frecuencia, excepto mientras estudiamos estadstica, ya que, como dijimos anterior
mente, los investigadores rara vez conocen los parmetros poblacionales.
La media, la varianza y el desvo estndar que calculamos segn los registros de una muestra
se denominan estadsticos mustrales. Un estadstico muestral se calcula a partir de informacin
conocida. Los estadsticos mustrales son los que hemos estado calculando hasta ahora y se re
presentan por los smbolos que hemos estado utilizando: Mt SD2 y SD. La tabla 5-1 resume los di
versos smbolos.
Tabla 5-1.
Parmetros poblacionales y estadsticos mustrales.

B ase:
Sm bolos:
M edia
D esv o estndar
Varianza

Parmetro poblaconal

Estadstico muestral

(usualm ente descon ocid o)

{C alculado a partir d e datos con ocid os)

Valores d e la poblacin com pleta

Valores s lo de la muestra

Pcr
o*

M
SD
SD 2

Como lectores de resultados de sondeos o


encuestas que difunden los medios, lleg el
momento de estar mejor informados. En l
neas generales, los resultados de encuestas
pblicas realizadas correctamente se presen
tan junto con alguna afirmacin tal como:
Fuente: encuesta telefnica a 1.000 adultos
norteamericanos realizada el 4 y 5 de junio.
Error de maestreo +3%, escrita en letra me
nuda. Qu significa todo esto?
La encuesta Galup es un muy buen
ejemplo (Galiup, 1972), y no existe mejor
momento para comenzar que en 1948,
cuando las tres mejores empresas encuestadoras, Galiup, Crossley (para los peridicos
Hearst), y Roper (para Fortune), predijeron
equivocadamente la victoria de Tfaomas
Dewey contra Harry Truman para la presi
dencia de los E E .u t i. Sin embargo, la predic
cin de Galiup se bas en 50.000 entrevistas,
y la de Roper en 15.000. Por el contraro,
para predecir la victoria de George Bush en
las elecciones presidenciales de e e . u u . de
1988, Galiup utiliz slo 4,089 entrevistas.
Desde 1952, los encuestadores no han utili
zado nunca ms de 8.144 entrevistas, pero
con muy bajo error y sin equivocaciones
garrafales. Qu ha cambiado?
El mtodo utilizado antes de 1948, y
nunca repetido desde entonces, se denomi
naba maestreo por cuotas. A los entrevis
tadores se les asignaba una cantidad fija de
personas a entrevistar, con cupos estrictos
para completar en todas las categoras con
sideradas importantes, tales como lugar de
residencia, sexo, edad, raza y nivel econ
mico. Sin embargo, si cumplan con estos
datos especficos, podan entrevistar .a
quien quisieran. En los Estados Unidos, los
republicanos generalmente solan ser ms
fciles de entrevistar, ya que era ms pro

bable que tuvieran telfono y residencias


permanentes, y que sus viviendas fueran de
mejor nivel y que estuvieran ubicadas en
mejores vecindarios. Antes de 1948 no se.
le haba dado importancia a este leve ssg.
Los demcratas haban estado ganando du
rante aos por grandes mrgenes. En 1948,:
la eleccin fue muy reida, y e sesgo rp u -. .
blican produjo el vergonzoso error que ' ,
cambi para siempre los mtodos de son
deo de datos.
Desde 1948, Galiup y las otras empresas:
encuestadoras han utilizado lo que se deno
mina mtodo probabilstico. El muestreo
al azar simple es la forma ms pura del
mtodo probabilstico, pero aplicado a
una encuesta acerca de las elecciones pre- -.
sidenciales de los e e . u u . requerira elegir
los nombres de entre una lista de todos los - :
votantes de la nacin, lo cual significara:
una cantidad de personas demasiado gram
de. Luego debera encontrarse a cada per '
sona seleccionada en diferentes y alejados
lugares. Por lo tanto, se utiliza el muestren.
de agrupacin de escenarios mltiples:
Para describirlo someramente, s dividi a
los Estados Unidos en siete estratos del tc
mao de una comunidad, desde las grandes:
ciudades hasta las zonas rurales; estos grii-"
pos se dividieron en Siete regiones geogr
ficas (Nueva Inglaterra, Atlntica Media,
etc.), que a su vez se dividieron en zonas G.
menores de igual tamao, y luego s tm-/
ron manzanas d cada una de las zonas;.
siendo las probabilidades d seleccin'pro-/ .
porcionales a la cantidad de poblacin o Vi
viendas. Finalmente, se dio al entrevistador
un punto de partida elegido al azar en el
mapa y se le pidi que siguiera determina
da direccin, que pasara por cada casa si-:
guiendo el orden en que estaban ubicars y

que preguntara por el hombre ms joven ma


torio) que, a diferencia de los directorios
yor de 18 aos, o si no haba ningn hombre
telefnicos, incluye nmeros no inscriptos;
en la casa, por la mujer de mayor edad que
Ya sea que la encuesta se. realice por;
tuviera ms de 18. (Se ha descubierto que
telfono o cara a cara, habr un 35% 'de'
esta es la mejor manera de compensar la ten
las personas que no respondern a. pesar
dencia de que los hombres jvenes, todos
de los tres intentos de coiitactrlas. Esto,
los hombres y por ltimo las mujeres mayo
crea otro sesgo ms, que se toma en cuen
res, en ese orden, no se encuentren en sus
ta a travs de preguntas acerca de la canti
casas y, por lo tanto, no sean representados
dad de tiempo que la peron pasa en s
adecuadamente).
casa, para dar as un poco ms de impor-i
En realidad, dado que las encuestas te
tancia relativa a las respuestas d aquellos
lefnicas cuestan aproximadamente la ter
que pudieron ser contactados pero qu,
cera parte de lo que cuestan las encuestas
por lo general, pasd menos tiempo h'su
puerta a puerta, y que la mayora de la gen- 7 casa, y compensar a aqullos que no pu
te en la actualidad tiene telfono, con lo
dieron ser contactados.
.

7
que resulta reducido el sesgo de este mto
Ahora sabemos bastante sobr soldeos;
do en favor de la gente adinerada cmo su
de opinin. Aunque hemos dejado sin res
ceda en la poca de Traman, los llamados
puesta dos importantes preguntas: Por qu
telefnicos son actualmente el mtodo pre
se incluyen slo 1.000 entrevistas en un
ferido para realizar sondeos. Los llamados ., sondeo que pretende representara todos: los
telefnicos, tambin permiten que las com- 7 adultos de e e . u u . ? , y qu significa el tr-,.
putadoras disquen al azar, a travs de un
mino error de muestreo? Para contestar es-,
complicado sistema denominado rdd (Rantas preguntas debemos esperar hasta'el
dom Digit Daling, Discado de dgitos alea
captulo 7 (cuadro 7-1).
j
V ...

RELACIN ENTRE CURVA NORMAL, PROBABILIDAD


Y MUESTRA VERSUS POBLACIN
Como dijimos anteriormente, en la mayora de las investigaciones no conocemos los parmetros
poblacionales. Sin embargo, generalmente suponemos que la poblacin es aproximadamente nor
mal. Por lo tanto, los investigadores recolectan usualmente informacin acerca de una muestra
para realizar inferencias probabilstcas acerca de los parmetros de una poblacin normalmente
distribuida.
Analicemos un experimento realizado para averiguar si los alumnos aprenden ms cuando es
tudian todo de una vez o cuando el estudio se reparte a lo largo de un periodo de tiempo. Se selec
cionaron 60 alumnos al azar para participar en la investigacin. A una mitad, escogida tambin al
azar, se le asigna la tarea de estudiar todo de una vez y, a la otra mitad, la de estudiar la misma
cantidad de horas repartidas a lo largo de varias semanas. Al final de esas semanas, se toma un
examen a ambos grupos. El resultado es que existe una diferencia entre los dos grupos en cuanto
a las calificaciones medias en la prueba.
Ahora bien, analicemos el experimento en funcin del lenguaje que hemos estado utilizando
en este captulo. El grupo que estudi todo de una vez es una muestra. Esta muestra tiene el pro
psito de representar el desempeo de los alumnos en general, si tuvieran que estudiar todo de

:una sola vez. Es decir, esta muestra representa a una poblacin hipottica de alumnos a los que se
es asigna el estudio de un tema todo de una sola vez. El grupo que estudi durante un periodo de
tiempo es otra muestra. Esta muestra pretende representar el desempeo de los alumnos en gene
ral a quienes se les asign estudiar a lo largo de un periodo de tiempo. Por lo tanto, esta muestra
representa una poblacin hipottica de alumnos a quienes se les asigna estudiar un tema a lo largo
de un periodo de tiempo. La media de cada uno de los grupos estudiados es un estadstico muestral calculado a partir de los resultados del experimento.
Las poblaciones representadas por estas muestras ni siquiera existen realmente. Lo que s
existe es una poblacin general de alumnos, por supuesto, pero no una poblacin de alumnos a
quienes se Ies hayan asignado las condiciones mencionadas (excepto en trminos del experimen
to). Estamos interesados en analizar alumnos a los que en el futuro se les podran dar tales instruc
ciones; se trata de una poblacin desconocida. Generalmente, suponemos que estas poblaciones
desconocidas estn representadas por una curva normal, y lo hacemos simplemente porque la ma
yora de las distribuciones en psicologa lo estn. Sin embargo, no tenemos ningn fundamento
para realizar ninguna presuncin sobre la media y la varanza de esas poblaciones; son parme
tros poblacionales desconocidos. Cualquier conclusin que saquemos con respecto a los mismos
debe basarse en la informacin proveniente de los estadsticos maestrales.
Finalmente, el tema que nos interesa es un tema relacionado con la probabilidad. El razona
miento es un poco complicado, por lo cual le dedicamos la mayor parte del captulo 6. Sin embar
go, para tener una nocin previa del tema, analicemos la siguiente lgica: supongamos que las
verdaderas medias de las dos poblaciones (parmetros poblacionales) fueran de hecho las mis
mas. Conforme a esta suposicin, la forma en que los alumnos estudien no afecta el nivel de
aprendizaje. No obstante, cuando realizamos el experimento, las calificaciones medias de los dos
grupos en la prueba fueron diferentes, Entonces, dado nuestro supuesto de que no existe diferen
cia entre las poblaciones, cul es la probabilidad de que las medias de nuestras dos muestras pu
dieran ser tan diferentes como lo son en realidad? Si la probabilidad es baja, resulta poco
verosmil que nuestro supuesto de que no existe diferencia entre las poblaciones sea correcto y,
por lo tanto, lo rechazamos (el supuesto implica medias poblacionales iguales). Si rechazamos
ese supuesto acerca de la inexistencia de diferencias entre las poblaciones, nos queda la conclu
sin de que existe diferencia entre las poblaciones. Es decir, este resultado sostiene la conclusin
de que el modo de estudio de los estudiantes realmente afecta el nivel de aprendizaje.
La lgica que acabamos de describir puede parecer bastante intrincada, y de hecho lo es. Sin
embargo, es justamente ese tipo de razonamiento sobre probabilidades, muestras y poblaciones
el que fundamenta la mayor parte de la estadstica inductiva en psicologa. Es, en pocas palabras,
la lgica de lo que se denomina "prueba de hiptesis, concepto que estudiaremos paso a paso en
el captulo 6. No necesitamos analizar ese tema ahora, slo hemos introducido las ideas generales
para dar una nocin de la manera en que varios de los elementos tratados en este captulo se com
binan en los distintos tipos de problemas estadsticos que surgen de las investigaciones psicolgi
cas reales.

CONTROVERSIAS Y LIMITACIONES
Aun siendo temas bsicos, ios tres conceptos presentados en este captulo, la curva normal, la
probabilidad y las muestras y poblaciones, son temas que generan bastante controversia. Analiza
remos una importante controversia en relacin con cada uno de ellos.

La curva normal, es realmente tan normal?


Hemos mencionado que las distribuciones reales con frecuencia se aproximan mucho ai modelo
de curva normal. Es muy importante saber hasta qu punto esto es verdad, y no slo porque la
presuncin de modelo normal hace que las puntuaciones Z sean ms tiles. Como veremos en ca
ptulos posteriores, la mayora de las tcnicas estadsticas que utilizan los psiclogos suponen que
sus muestras provienen de poblaciones distribuidas normalmente. El tema de en qu medida es
razonable este supuesto ha sido una fuente de debate durante mucho tiempo. La postura predomi
nante ha sido que, debido al modo en como se desarrollen las medidas psicolgicas, la distribu
cin con forma de campana est prcticamente garantizada (Walberg, Strykowski, Rovai, &
Hung, 1984, p. 107). O, como lo expresaran Hopkins y Glass (1978), las mediciones en todas las
disciplinas resultan ser tan buenas aproximaciones a ella que uno podra pensar Dios ama la
curva normal!"
Sin embargo, siempre ha existido una persistente postura crtica que plantea la pregunta de si
la naturaleza en realidad se empaqueta tan prolijamente. Micceri (1989) present pruebas muy
consistentes en el sentido de que muchas medidas comnmente utilizadas en psicologa no arro
jan valores normalmente distribuidos en la naturaleza". Su estudio inclua pruebas de nivel y
capacitacin (como el sat y el GtE - Gradate Record Examination, Examen de inscripcin de
graduados), y pruebas de personalidad (como el mmpi - Minnessota Multiphasic Personality
Inventory, Inventario de personalidad multifactica), Micceri obtuvo series de datos y analiz las
distribuciones de los valores de 440 medidas psicolgicas y educativas que haban sido observa
das en muestras de gran tamao. Todas sus series de datos correspondan a muestras de ms de
190 individuos, y la mayora corresponda a muestras de ms de 1.000 (incluso un 14,3% corres
ponda a muestras de 5.000 a 10.293). Sin embargo, las muestras de gran tamao no fueron muy
tiles. Ninguna de las distribuciones investigadas pudo superar todas las pruebas de normalidad
(Micceri buscaba fundamentalmente asimetras, curtosis y protuberancias). Pocas medidas pre
sentaban distribuciones que siquiera se acercaban razonablemente al modelo de la curva normal.
Tampoco eran predecibles las variaciones: Las distribuciones analizadas mostraron casi todos
los casos concebibles de contaminacin (p. 162), aunque algunos eran ms comunes en cierto ti
po de pruebas. Micceri exhibe muchas razones obvias de esta anormalidad, tales como los efectos
piso y techo (vase captulo 2).
Qu importancia ha tenido el hecho de que las distribuciones de estas medidas fueran tan
anormales? Segn Micceri, simplemente se desconoce, y hasta que se sepa ms sobre el tema,
la opinin general entre los psiclogos continuar sosteniendo las tcnicas estadsticas tradi
cionales, con la matemtica implcita, que se basa en el supuesto de las distribuciones norma
les de poblacin. Cul es la razn de esta indiferencia en vista de descubrimientos como los
de Micceri? Sucede que en la mayora de las condiciones en las que se las utiliza, las tcnicas
tradicionales parecen dar resultados razonablemente exactos, aun cuando no se cumpla el re
querimiento formal de una distribucin normal de poblacin (p. ej. Sawilowsky & Blair,
1992). Este libro, en lneas generales, adopta la posicin mayoritaria que favorece la utiliza
cin de tcnicas tradicionales en todos los casos, excepto en los ms extremos. Sin embargo,
debemos tener en cuenta que existe una minora resonante de psiclogos que estn en desa
cuerdo con esto. En el captulo 15 presentamos algunas de las tcnicas estadsticas alternati
vas que esos psiclogos favorecen (tcnicas que no estn sustentadas por el supuesto de la
distribucin normal de las poblaciones).
Galton, uno de los pioneros ms destacados en el campo de los mtodos estadsticos (recor
demos el cuadro 3-1), opin sobre la curva normal: No conozco casi nada tan apropiado para im
presionar la imaginacin [...] si los griegos hubieran sabido de ella la hubieran personificado y

divinizado. Reina con serenidad y completa humildad en medio de la salvaje confusin (1889,
p. 66). Irnicamente, tal vez sea cierto que, al menos en psicologa, realmente reina en un aislamiento puro y austero, sin imitaciones reales siquiera cercanas a lo perfecto,
Qu significa realmente la probabilidad?
Ya hemos presentado la mayor controversia con respecto a la teora de la probabilidad, segn se
aplica a la estadstica en psicologa: el debate entre la interpretacin como frecuencia relativa a
largo plazo y la interpretacin subjetiva segn el grado de convencimiento. Sin embargo, en la
mayora de los casos, realmente no importa demasiado qu interpretacin se utiliza, pues los
clculos estadsticos son los mismos; Pero entre la minora de tericos que favorecen la interpre
tacin subjetiva, algunos sostienen una opinin bastante crtica de la rama principal del pensa
miento estadstico. En particular, han defendido lo que ha devenido en llamarse el mtodo
Bayesiano (por ejemplo, vase Phillips, 1973). El mtodo lleva el nombre de Thomas Bayes,
un disidente clrigo ingls de principios del siglo xvm, que desarroll un teorema de la probabi
lidad adecuadamente denominado Teorema de Bayes.
El teorema de Bayes puede ser probado matemticamente, y no es controvertido. Sin embar
go, sus aplicaciones en estadstica son fuertemente discutidas. Los detalles del mtodo exceden
el alcance de un texto introductorio, pero s podemos explicar claramente el principal tema en
disputa: ios bayesianos sostienen que la ciencia implica realizar investigaciones para adaptar
nuestras creencias preexistentes a la luz de las pruebas recopiladas. Por lo tanto, las conclusio
nes derivadas de un experimento siempre se encuentran dentro del contexto de lo que creamos
sobre el mundo antes de realizar el experimento. La comente principal, por el contrario, sostie
ne que es mejor no realizar ninguna presuncin sobre creencias preexistentes. Deberamos ana
lizar las pruebas tal como son, juzgando si el experimento ha mostrado algn efecto confiable (o
ningn tipo de efecto). Algunos estadsticos de la corriente principal reconocen que la descrip
cin bayesiana de la ciencia puede ser ms exacta. Sin embargo, no se sienten cmodos con la
utilizacin de los mtodos bayesianos en los clculos estadsticos de las investigaciones prcti
cas, porque adoptarlos significara que la conclusin obtenida a partir de cada estudio depende
ra demasiado de la creencia subjetiva del cientfico que est realizando el estudio. Y as, los
mismos resultados experimentales podran llevar a diferentes conclusiones si son analizados por
diferentes cientficos.
El mtodo bayesiano represent un enrgico (aunque nunca mayoritario) movimiento en la
estadstica aplicada a la psicologa durante las dcadas de 1960 y 1970. Desde entonces se ha
vuelto mucho menos prominente como movimiento, al menos bajo este estandarte. No obstante,
muchas de las cuestiones que surgieron de esta disputa continan siendo importantes bajo formas
diferentes. (Games, 1988; Gigerenzer & Murray, 1987; Leventhal & Huyn, 1996; Prentice & Mi11er, 1992).
M uestra y poblacin
La mayora de los procedimientos estadsticos que aprenderemos en el resto de este libro se basan
en el supuesto de que la muestra estudiada es una muestra aleatoria de la poblacin. Como ya se
alamos, sin embargo, esto rara vez sucede en la investigacin psicolgica. Lo ms frecuente es
que nuestras muestras incluyan a aquellos individuos que estn disponibles para participar en un
experimento, lo cual implica que la mayora de los estudios se realicen con alumnos universita
rios, voluntarios y animales de laboratorio que resulten convenientes y similares.

Algunos psiclogos se preocupan por este tema y han sugerido que ios investigadores necesi
tan utilizar diferentes mtodos estadsticos que realicen generalizaciones referidas slo a los tipos
de personas que en realidad estn siendo utilizadas en el estudio.3 Por ejemplo, estos psiclogos
sostendran que si nuestra muestra presenta una determinada distribucin anormal, deberamos
suponer que se pueden generalizar los resultados slo con respecto a una poblacin con la misma
distribucin anormal. En el captulo 1^ seguiremos analizando estas sugerencias.
Los socilogos, en comparacin con los psiclogos, estn mucho ms preocupados por la representatividad del grupo que estudian. Es mucho ms probable que se utilicen mtodos formales
de seleccin aleatoria y de grandes muestras en los estudios presentados en revistas especializa
das en sociologa (o en revistas cientficas de psicologa social orientadas a la sociologa), o al
menos que se trate el tema en sus publicaciones.
Por qu los psiclogos se sienten ms cmodos utilizando muestras que no son claramente
aleatorias? La razn ms importante es que estn interesados principalmente en las relaciones
entre variables. Si en determinada poblacin un aumento en X est relacionado con un aumento
en F, esa relacin debera sostenerse probablemente en otras poblaciones, y debera hacerlo inclu
so si los niveles reales de X e Y son diferentes entre las poblaciones. Supongamos que un investi
gador realiza el experimento que utilizamos como ejemplo en el captulo 3 y 4, probando la relacin
entre la cantidad de veces que se expone una lista de palabras con la cantidad de palabras recorda
das. Supongamos, adems, que el estudio se realiza con alumnos universitarios, y que el resultado
es que, a mayor cantidad de exposiciones, mayor cantidad de palabras recordadas. La cantidad
real de palabras recordadas de la lista bien podra ser diferente, en el caso de personas pertene
cientes a grupos sociales distintos, al de los alumnos universitarios. Por ejemplo, es probable que
expertos en ajedrez (quienes probablemente tengan la memoria altamente desarrollada) puedan
recordar ms palabras; personas que acaban d sufrir algn trastorno probablemente recuerden
menos palabras. Sin embargo, incluso en esos grupos, esperaramos que, a mayor cantidad de ex
posiciones de la lista, ms palabras fueran recordadas. Por lo tanto, es probable que la relacin
entre cantidad de exposiciones y cantidad de palabras recordadas sea aproximadamente la
misma en cada poblacin.
En sociologa, la representatividad de las muestras es mucho ms importante debido a que los
socilogos estn ms preocupados por la media y la varianza real de una variable en determinada
sociedad. As, un socilogo podra estar interesado en la actitud promedio hacia las personas ma
yores en la poblacin de un determinado pas. En ese caso, es extremadamente importante la ma
nera en que se realice el muestreo.

3 Frick (en prensa) sostiene que en la mayora de Jos casos tos investigadores psicolgicos no deberan pensar siquiera
en funcin de muestras y poblaciones, sino que ms bien deberan considerarse investigadores estudiando procesos. Un
experimento anatiza algn proceso en un grupo de individuos. Luego, el investigador evala la probabilidad de que el
patrn de resultados pudiera haber sido causado por factores casuales. Por ejemplo, el investigador analiza si una dife
rencia de medias entre un grupo experimental y uno de control podra haber sido causada por otros factores adems de
la manipulacin experimenta!. Frick sostiene que este modo de pensar es mucho ms parecido a la forma real en que los
investigadores trabajan, y afirma que presenta varias ventajas en cuanto a la sutil lgica de tos procedimientos de esta
dstica inductiva. Ser interesante ver la reaccin a la propuesta de Frick. En todo caso, seguir e l mtodo ms estndar
(tal com o se ensea en este libro) arroja exactamente los mismos resultados, lo cual es coherente con la manera en la
que la mayora de los psiclogos comprenden el razonamiento estadstico.

CURVAS NORMALES, PROBABILIDADES, MUESTRAS


Y POBLACIONES SEGN SE DESCRIBEN EN PUBLICACIONES CIENTIFICAS
Los temas tratados en este captulo se utilizan especialmente como base para comprender el
material expuesto en los captulos siguientes, y rara vez se nombran explcitamente en publi
caciones cientficas (excepto en artculos sobre mtodos o clculos estadsticos). Ocasional
mente, podremos ver que se menciona la curva normal en el contexto de la descripcin de
valores de una determinada variable. (En el captulo 15 proporcionamos ms informacin
acerca de este tema, e incluso algunos ejemplos tomados de publicaciones reales. En ese mis
mo captulo tambin analizamos circunstancias en las que los valores no siguen la distribu
cin normal).
Tampoco es comn que se mencione la probabilidad de manera directa, excepto en el con
texto de la significacin estadstica, tema que mencionamos brevemente en el captulo 3. En
casi cualquier publicacin que tengamos la oportunidad de leer, la seccin Resultados estar
llena de descripciones de distintos mtodos relacionados con la significacin estadstica, se
guidas de expresiones tales como p<0,05 p<0,01". La p se refiere a probabilidad, pero,
probabilidad de qu? Ese es el tema principal de nuestra exposicin sobre significacin esta
dstica en el captulo 6.
Finalmente, slo en algunas ocasiones encontraremos una breve mencin del mtodo utiliza
do para seleccionar la muestra de la poblacin. Por ejemplo, Alunan, Levine, Howard y Hamilton
(1997) realizaron una encuesta telefnica sobre las actitudes del pblico adulto norteamericano
hacia los agricultores de tabaco. En la seccin del artculo dedicada al mtodo, explican que los
que respondieron fueron seleccionados en forma aleatoria de una lista nacional de nmeros tele
fnicos (p. 117). As, Altman et. al. especificaban tanto la lista que utilizaron para elegir la po
blacin (el directorio nacional'de nmeros telefnicos) como el mtodo utilizado (seleccin
aleatoria) para obtener la muestra. Cabe destacar, sin embargo, que en tales encuestas el porcenta
je de respuesta de aquellos a quienes se llama por telfono generalmente es muy lejano al 100%.
En el ejemplo que estamos analizando, obtuvieron entrevistas con el 47% de las personas a las
que llamaron. Por lo tanto, aunque utilizaron el mtodo de seleccin aleatoria para contactar a
miembros potenciales de su muestra, la muestra propiamente dicha no fue aleatoria. La muestra
representa excesivamente cualesquiera sean las caractersticas que hacen que una persona est
disponible y dispuesta a responder una encuesta telefnica.

RESUMEN________________________________________
En muchas de las variables analizadas en la investigacin psicolgica, la distribucin de los valo
res presenta aproximadamente una forma de campana, simtrica y unimodal, a la que llamamos
curva normal. Dado que la forma de esta curva responde a una frmula matemtica exacta, existe
un porcentaje especfico de valores entre cualesquiera dos puntos de ella.
Las cifras importantes que conviene recordar con respecto a una curva normal son: un 34%
de los valores se encuentran entre la media y 1 desvo estndar por encima de la media, y un 14%
entre 1 y 2 desvos estndar por encima de ella.
Una tabla de reas de la curva normal indica el porcentaje de valores entre la meda y cual
quier puntuacin Z positiva en particular. Utilizando esa tabla, y sabiendo que la curva es simtri
ca y que el 50% de los valores se encuentran por encima de la media, podemos determinar el

porcentaje de valores por encima o por debajo de cualquier puntuacin Z en particular. Tambin
podemos utilizar la tabla para determinar la puntuacin Z correspondiente al punto en el que co
mienza un determinado porcentaje de valores.
La mayora de los investigadores psicolgicos considera que la probabilidad de un hecho es
su frecuencia relativa esperada. Sin embargo, algunos consideran a la probabilidad como el grado
subjetivo de convencimiento de que el hecho suceder. La probabilidad generalmente se calcula
como la razn entre la cantidad de resultados favorables y la cantidad total de resultados posibles.
Se simboliza con unap y tiene un rango de 0 (hecho imposible) a 1 (hecho cierto). El rea bajo la
curva normal indica la probabilidad de que los valores se ubiquen dentro de determinado interva
lo de valores.
Una muestra es un individuo o grupo analizado, por lo general en representacin de un grupo
mayor o poblacin que no puede ser analizado en su totalidad. Lo ideal es que la muestra sea se
leccionada de la poblacin utilizando un procedimiento estrictamente aleatorio. La media, la varanza y dems clculos de una muestra se denominan estadsticos mustrales. Cuando se refieren
a una poblacin, se denominan parmetros poblacionales y se simbolizan con letras griegas( p.,
para la media, o2 para la varianza y cr para el desvo estndar).
La mayora de las tcnicas que aprenderemos en el resto del libro utilizan inferencias probabilsticas para sacar conclusiones acerca de poblaciones, sobre la base de informacin obtenida a
partir de muestras. En este proceso, generalmente se presume que las poblaciones estn normal
mente distribuidas.
Existen controversias con respecto a cada uno de los temas principales. Una de las cuestiones
se refiere a si las distribuciones normales son realmente tpicas de las poblaciones de valores co
rrespondientes a las variables que estudiamos en psicologa. Otro debate, planteado por defenso
res del enfoque bayesiano de la estadstica, es si deberamos construir explcitamente los
procedimientos estadsticos de forma tal de tener en cuenta las expectativas subjetivas iniciales
del investigador. Finalmente, se ha discutido la representatividad de las muestras utilizadas por
los psiclogos, que en lneas generales no se obtienen a travs de una seleccin estrictamente
aleatoria, aunque existen tambin motivos para pensar que con respecto a los temas que estudian
la mayora de los psiclogos, este punto no tiene gran relevancia.
Las publicaciones cientficas rara vez exponen las curvas normales (excepto brevemente
cuando la distribucin que se est analizando parece no ser normal) o la probabilidad (excepto en
el contexto de las pruebas de significacin, descriptas al comienzo del captulo 6). Sin embargo,
en lneas generales s se describen los procedimientos de muestreo, especialmente cuando el estu
dio es un sondeo de datos; y se puede discutir la representatividad de una muestra cuando no hu
biera sido posible realizar un muestreo al azar.

Trminos clave
- Frecuencia relativa esperada.
- Seleccin casual.
- Interpretacin de la probabilidad
como la frecuencia relativa
a largo plazo.
- Curva normal,
- Tabla de reas de la curva normal.

Distribucin normal.
Resultado.
Poblacin.
Parmetros poblacionales.
Probabilidad (p).
Seleccin aleatoria.
Muestra.

- Estadsticos mustrales.
- Interpretacin subjetiva
de probabilidad.
-ji.

- a.

Ejercicios
Los ejercicios implican la realizacin de clcu
los (con la ayuda de una calculadora). La ma
yora de los problemas estadsticos reales se
resuelven por computadora, pero aunque exista
la posibilidad de utilizar una computadora, es
conveniente realizar estos ejercicios manual
mente para incorporar el mtodo de trabajo.
Para adquirir prctica en la utilizacin de
una computadora, para resolver problemas es
tadsticos, se puede utilizar la seccin de com
putacin de cada captulo, publicada en la Gua
de estudio y libro de tareas de computacin pa
ra el alumno [Students Study Guide and Com
puter Workbook] que acompaa este libro.
Todos los datos de esta seccin son ficti
cios (a menos que se especifique lo contrario).
Las respuestas a los ejercicios de la serie I
se encuentran al final del libro.

a -1,5, e) mayor a 2,10, f) menor a 2,10, g) ma


yor a 0,45, h) menor a -1,78 y i) mayor a 1,68?
3. Suponiendo que se trata de una distribu
cin normal, a) si una persona se encuentra en
tre el 10% superior de su pas en cuanto a
capacidad matemtica, cul es la puntuacin
Z de esa persona? b) Si la persona se encuentra
dentro del 1%, cul sera la puntuacin Z?
4. Analicemos una prueba de coordinacin
con distribucin normal, una media de 50 y un
desvo estndar de 10. Qu valor necesitara
una persona para estar entre el 5% superior?
Explique su respuesta a alguien que nunca ha
tomado un curso de estadstica.
5. Las siguientes cantidades de individuos
de una empresa recibieron atencin especial de
la gerencia de personal el ao pasado:*6
D rogas/alcohol
Asesor-amiento para crisis fam iliar
Varios
Total

SERIE I
1. Supongamos que las personas que vi
ven en determinada ciudad tuvieran una me
dia de 40 y un desvo estndar de 5 con respecto
a la preocupacin sobre el medio ambiente.
Suponiendo que estos valores referidos a la
preocupacin estn normalmente distribui
dos: Qu porcentaje aproximado de personas
presenta un registro a) mayor a 40, b) mayor a
45, c) mayor a 30, d) mayor a 35, e) menor a
40, f) menor a 45, g) menor a 30 y h) menor a
35? Cul es el valor mnimo que una persona
debe tener para estar en el i) 2%, j) 16%, k)
50%, 1) 84%, y m) 98% superior? (Utilice los
nmeros 50%-34%-I4% para resolver este
problema).
2. Una psicioga estudi la fatiga ocular
utilizando una medida particular que aplica a
los alumnos despus de 1 hora de trabajo escri
biendo en una computadora. Con esta medida,
la psicioga ha descubierto que la distribucin
presenta una curva normal. Qu porcentaje de
alumnos presenta una puntuacin Z a) menor a
1,5, b) mayor a 1,5, c) menor a -1,5, d) mayor

10
20
20
50

Si de los expedientes del ao pasado tuviera que seleccionar a alguien al azar, cul
es la probabilidad de que la persona sea del
grupo a) drogas / alcohol, b) familia, c) dro
gas / alcohol o familia, d) cualquier categora
excepto Varios, e) cualquiera de las tres
categoras?
6.
Una publicacin cientfica trata el tema
del nivel de autoestima de los alumnos secun
darios australianos. En la seccin en la que se
describen los mtodos aplicados se remarca
que se estudi una .muestra aleatoria- de
alumnos secundarios. Explique a una persona
que nunca ha realizado un curso de estadstica
o mtodos de investigacin qu significa esto y
por qu es importante.
SERIE li
1.
Se descubre que la cantidad de tiempo
que toma recuperarse fisiolgicamente de deter
minado estmulo est distribuida normalmen
te con una media de 80 segundos y un desvo
estndar de 10 segundos. Aproximadamente
qu porcentaje de registros (en tiempo de recu-

peracin) estar a) por encima de 100, b) por de


bajo de 100, c) por encima de 90, d) por debajo
de 90, e) por encima de 80, f) por debajo de 80,
g) por encima de 70, h) por debajo de 70, i) por
encima de 60 y j) por debajo de 60? Cul es el
periodo de tiempo ms largo que puede tardar
una persona en recuperarse y aun as pertenecer
al k) 2%, 1) 16%, m) 50%, n) 84% y o) 98% infe
rior? (Utilce los nmeros 50%-34%-14% para
resolver este problema).
2. Supongamos que las puntuaciones de
arquitectos en determinada prueba de creati
vidad estn distribuidas normalmente. Qu
porcentaje de arquitectos tiene puntuaciones
Z a) mayores a 0,10, b) menores a 0,10, c) ma
yores a 0,20, d) menores a 0,20, e) mayores a
1,10, f) menores a 1,10, g) mayores a -0,10,
y h) menores a -0,10?
3. En el caso del problema 2, cul es la
puntuacin Z mnima que puede tener un ar
quitecto en la prueba de creatividad para estar
dentro del a) 50% superior, b) 40% superior,
c) 60% superior, d) 30% superior y e) 20%
superior?
4. Supongamos que est diseando un pa
nel de instrumentos para una gran mquina in
dustrial que requiere un alcance de 2 pies
desde determinada posicin. Se sabe que el al
cance desde esa posicin para mujeres adultas
presenta una media de 2,8 pies, con un desvo
estndar de 0,5. El alcance para hombres adul

tos presenta una media de 3,1 pies con un des


vo estndar de 0,6. Tanto el alcance de las mu
jeres como de los hombres desde esa posicin
est normalmente distribuido. Si se implementa este diseo, qu porcentaje de mujeres no
podrn trabajar con ese panel de instrumentos?
Qu porcentaje de hombres no podr trabajar
con ese panel de instrumentos? Explique sus
respuestas a una persona que nunca ha tomado
un curso de estadstica.
5. Se realiza una encuesta en una facultad
con 800 alumnos, 50 miembros del claustro
docente y ISO empleados administrativos. Ca
da uno de estos 1.000 individuos aparece una
sola vez en el directorio telefnico del campo
universitario. Supongamos que tuviera que
abrir el directorio y sacar un nmero al azar pa
ra contactar. Cul es la probabilidad de que
sea a) un alumno, b) un miembro del claustro
docente, c) un miembro del personal adminis
trativo, d) un miembro del claustro docente o
un empleado administrativo y e) cualquiera,
excepto un miembro del claustro docente o
personal administrativo?
6. Supongamos que usted fuera a realizar
una encuesta a visitantes de su campo universi
tario y quiere que la encuesta resulte lo ms re
presentativa posible. Cmo seleccionara las
personas a encuestar? Por qu considera que
ese sera el mejor mtodo?

APENDICE DEL CAPITULO: REGLAS DE LA PROBABILIDAD


Y PROBABILIDADES CONDICIONALES
Las reglas de la probabilidad son procedimientos para calcular probabilidades que involucran
mltiples experimentos o resultados, Las dos reglas ms ampliamente utilizadas son la regla de
la adicin (tambin llamada la regla o) y la regla de la multiplicacin (tambin llamada la regla
y). En este apndice analizamos esas dos reglas y explicamos tambin el concepto de probabilida
des condicionales.

Rega de ia a d ic i n
La regla de la adicin se aplica a situaciones que involucran la probabilidad de obtener cualquiera
de dos o ms resultados mutuamente excluyentes. Resultados mutuamente excluyentes son
aquellos en los que la ocurrencia de un resultado hace que el otro resultado no suceda, como pue
den ser los resultados cara o ceca en un slo tiro de monedas o los resultados de uno o seis en un
slo tiro de un dado. En el caso de los resultados mutuamente excluyentes, la probabilidad de ob
tener algunos de ellos es la suma de las probabilidades individuales, Por lo tanto, en un slo tiro
de moneda, las posibilidades de obtener cara (que es de 0,5) o ceca (tambin de 0,5) es de 1,0 (0,5
ms 0,5). En un slo tiro de un dado, las posibilidades de obtener un 3 (1/6) un 5 (1/6) son
de 1/3 ( 1/6 +1/6). Si usted elige a un alumno de su universidad al azar, y en su universidad un 30% de
los alumnos son avanzados y un 25% son principiantes, la posibilidad de elegir a alguien que sea
avanzado o principiante es del 55%.
La regla formalmente se expresa:
p(A B) = p(A) + p(B)

(5-1)

Donde p(A B) es la probabilidad de obtener el resultado A o el resultado B; p(A) es la probabi


lidad de obtener el resultado A, y p (B ) es la probabilidad de obtener el resultado B.
La regla de adicin se aplica cualquiera sea la cantidad de resultados mutuamente excluyentes. Por ejemplo, p(A, B, C) = p(A) + p(B) + p(C).
Regla de ia multiplicacin
La regla de la multiplicacin s aplica a situaciones que involucran ms de un experimento. Per
mite calcular la probabilidad de obtener ambos de dos (o ms) resultados independientes. Los
resultados independientes son tales que el acontecimiento de uno no da al otro mayor ni menor
probabilidad de suceder. Obtener cara o ceca en un tiro de moneda es un resultado independiente
de obtener cara o ceca en un segundo tiro de moneda. La probabilidad de obtener ambos de ios
dos resultados independientes es el producto de (el resultado de multiplicar) las probabilidades
individuales. Por ejemplo, en un slo tiro de moneda, la posibilidad de obtener cara es de 0,5. En
un segundo tiro de moneda, la probabilidad de obtener cara (sin importar lo que se obtuvo en el
primer tiro) es tambin de 0,5. Por lo tanto, la probabilidad de obtener caras en ambos tiros de
moneda es de 0,25 (0,5 por 0,5). En dos tiros de un dado, la probabilidad de obtener un 5 en am
bos tiros es igual a 1/36, es decir, la probabilidad de obtener un 5 en el primer tiro (1/6), multipli
cada por la probabilidad de obtener un 5 en el segundo tiro (1/6). De modo similar, en una prueba
de seleccin mltiple con cuatro opciones para cada tem, la probabilidad de adivinar dos res
puestas correctas es de 1/16, es decir, la probabilidad de adivinar una respuesta correcta (1/4)
multiplicada por la posibilidad de adivinar la otra respuesta correcta (1/4),
Expresado por una frmula:
p(A y B) = p(A) xp (B)

(5-2)

Donde p(A y B) es la probabilidad de obtener el resultado A y el resultado B (suponiendo que son


resultados independientes).
La regla de ia multiplicacin se aplica cualquiera sea la cantidad de resultados independien
tes. Por ejemplo, p(A, B y C) ~ p(A) x p{B) x p(C).

Probabilidades condicionales
Existen otras reglas de la probabilidad (algunas de las cuales son combinaciones de las menciona
das anteriormente). La mayora involucra lo que se denomina probabilidades condicionales.
Una probabilidad condicional es la probabilidad de un resultado suponiendo que otro resulta
do ha ocurrido. Es decir, la probabilidad de un resultado est condicionada por la ocurrencia del
otro resultado. Por lo tanto, supongamos que la facultad A tiene un 50%. de mujeres y la facultad
B tiene un 60% de mujeres. Si seleccionamos una persona al azar, cul es la posibilidad de que
resulte seleccionada una mujer? Si sabemos que la persona es de la facultad A, la probabilidad es
del 50%. Es decir, la probabilidad de que resulte seleccionada una mujer, a condicin de que pro
venga de la facultad A, es del 50%. Diramos que, p(mujer ( facultad A) =0,5. De modo similar,
p(mujer / facultad B) = 60%.

DescripGn de! captulo

Un ejemplo de prueba de hiptesis.


Lgica central de la prueba de hiptesis.
El prcs de la prueba de hiptesis.
Pruebas de hiptesis de una y dos coias.
Controversias y limitaciones;
;

>
>

';

La prueba de hiptesis segn se describe


en ias publicaciones cientficas,
Resumen.
Trminos clve.

Ejercicios.

n el captulo 5 aprendimos los conceptos de curva normal, probabilidad y la dife


rencia entre una muestra y una poblacin. En este captulo, presentamos el tema
crucial de la prueba de hiptesis. La prueba de hiptesis es un procedimiento sis
temtico para determinar si los resultados de un experimento a travs del cual se
analiza una muestra, sustentan una teora o innovacin prctica determinada que
se aplica a una poblacin, La prueba de hiptesis es el tema central de todos los captulos res
tantes de este libro, como lo es tambin en la mayora de las investigaciones cientficas. Casi
todos las publicaciones de investigacin psicolgica utilizan la prueba de hiptesis.
Es nuestro deber advertir que, para la mayora de los alumnos, la parte ms difcil del curso es.
el manejo de la lgica bsica de este captulo y de los dos siguientes. Este captulo, en particular,
requiere cierta gimnasia mental. Aun cuando se comprendan todos los razonamientos.la primera
vez, es recomendable realizar una revisin completa. La prueba de hiptesis involucra un grupo
de ideas que, contempladas separadamente, no tienen mucho sentido. Por lo tanto, en este captu
lo aprenderemos una cantidad comparativamente grande de ideas al mismo tiempo. Mirando el
lado positivo, una vez que hayamos incorporado bien los temas de este captulo y de los dos si
guientes, estaremos acostumbrados a este tipo de material, y el resto del curso resultar sencillo.
Al mismo tiempo, hemos desarrollado esta introduccin a la prueba de hiptesis de la mane
ra ms sencilla posible, y dejamos para los captulos posteriores todo aquello que poda poster
garse. Por ejemplo, las investigaciones psicolgicas reales casi siempre involucran muestras
compuestas por muchos -a veces muchsimos- individuos. Sin embargo, para simplificar las co
sas, todos los ejemplos de este captulo se refieren a estudios en los que la muestra est formada
por un slo individuo. Pra lograrlo, hemos tenido que crear algunos ejemplos bastante extra
os, por eso es conveniente que el alumno recuerde simplemente que estamos construyendo los
cimientos que, en el captulo 9, lo prepararn para comprender la prueba de hiptesis tal como se
realiza en la realidad.

Este es el primer ejemplo ficticio y, necesariamente, extrao. Durante varios aos se ha desarro
llado un gran proyecto de investigacin. En el contexto del proyecto, se ha administrado a bebs
recin nacidos una vitamina especial, y luego se ha controlado su desarrollo durante los primeros
dos aos de vida. Hasta ahora, la vitamina no ha acelerado el desarrollo de los bebs. La distribu
cin de la edad en la que stos y todos los bebs comienzan a caminar est representada por la fi
gura 6-1. En ella observamos que la media es 14 meses, el desvo estndar es de 3 meses, y las
edades siguen una curva normal. Mirando la curva podemos observar que menos del 2% de los
bebs comienzan a caminar antes de los 8 meses de edad (estos bebs se encuentran 2 desvos es
tndar por debajo de la media de edad para comenzar a caminar). (La distribucin qu analiza
mos, si bien es ficticia, en realidad es bastante similar a la distribucin que los psiclogos han
probado en el caso de bebs europeos, aunque esa distribucin real es levemente asimtrica hacia
la derecha; Bindley, Filliozat, Kackenberg, Nicolet-Mesteri & Sand, 1966).
Uno de los investigadores del proyecto ha tenido una idea. Sobre la base de algunas nuevas
teoras, razona que si la vitamina que toman los bebs estuviera ms refinada, su efecto podra
ser notablemente mayor, y que los bebs que tomaran la versin con alto grado de refinamiento
deberan comenzar a caminar mucho antes que los otros bebs. (Supondremos que el proceso de
purificacin no poda de ningn modo hacer que la vitamina fuera daina para los bebs). Sin
embargo, refinar la vitamina de este modo eleva en gran medida el costo'de cada dosis; por lo
tanto, el equipo de investigacin decide probar el procedimiento con dosis suficientes para un
slo beb. Entonces, se selecciona al azar un beb del proyecto para suministrarle la versin al
tamente refinada de la vitamina, y se realiza un seguimiento de su progreso junto con el de todos
los otros bebs de mismo proyecto. Qu tipo de resultado llevara a los investigadores a sacar
la conclusin de que la vitamina altamente purificada hace que los bebs caminen a ms tempra
na edad?
Lo que acabamos de describir es el ejemplo de un problema que se resuelve a travs de la
prueba de hiptesis. Los investigadores pretenden sacar una conclusin acerca de si la vitamina
purificada hace que los bebs en general caminen antes de lo esperado. La conclusin referida a
los bebs en general, sin embargo, se basar en los resultados obtenidos, estudiando slo una
muestra. (En este extrao ejemplo, la muestra es un slo beb).

Figura 6-1. Distribucin de edades en que los bebs comienzan a caminar (datos ficticios).

Existe un mtodo estndar para encarar un problema de prueba de hiptesis. El investigador utili
zar el siguiente razonamiento: comnmente, las chances de que un beb comience a caminar a
los 8 meses de edad o antes seran menores al 2%. Por lo tanto, caminar a ios 8 meses es altamen
te inverosmil Pero qu sucede si el beb que estamos estudiando comienza a caminar a los 8
meses? S esto sucede, podremos rechazar la idea de que la vitamina especialmente purificada
no produce ningn efecto. Si rechazamos la idea de que la vitamina especialmente purificada no
produce ningn efecto, debemos aceptar la idea de que s produce un efecto. (La lgica de este
ejemplo es crucial para todos los siguientes temas del libro. Tal vez sea conveniente volver a leer
este prrafo).
En primer lugar, los investigadores han comprendido qu tendra que suceder para poder sa
car la conclusin de que el procedimiento de purificacin especial marca una diferencia. Habien
do comprendido esto previamente, los investigadores pueden entonces continuar con la
realizacin de su estudio. En este caso, realizar el estudio significa suministrar la vitamina espe
cialmente purificada a un determinado beb y observar a qu edad ese beb comienza a caminar.
Si el resultado del estudio muestra que el beb comienza a caminar antes de los 8 meses, entonces
concluirn que es inverosmil que la vitamina especialmente purificada no provoque una diferen
cia. Si es inverosmil que la vitamina especialmente purificada no provoque una diferencia, en
tonces la conclusin es que probablemente s la provoque.
Este tipo de razonamiento al revs, contrario a lo que uno predice, es el corazn de la estads
tica inferencial en psicologa. Es algo as como una doble negacin. Uno de los fundamentos de
este mtodo es que podemos determinar directamente la probabilidad de obtener un resultado ex
perimental determinado s la situacin de que no se produzca diferencia es verdadera. En el ejem
plo de la vitamina purificada, los investigadores saben cules son las probabilidades de que los
bebs caminen a diferentes edades si la vitamina especialmente purificada no produce ningn
efecto. Es la probabilidad de que un beb camine a distintas edades lo que ya conocemos por ana
lizar bebs en general, es decir, bebs que no han recibido vitamina especialmente purificada.
(Supongamos que la vitamina especialmente purificada no produce ningn efecto. En ese caso,-la
edad en la que los bebs comienzan a caminar es la misma, reciban o no la vitamina especialmen
te purificada. Por lo tanto, la distribucin es la que aparece en la figura 6-1, basada en las edades
en las que los bebs en general comienzan a caminar).
Sin esta reconocidamente tortuosa manera de enfocar el problema, en la mayora de los casos
no habra modo de probar una hiptesis. En casi todas las investigaciones psicolgicas, ya sea con
experimentos, encuestas u otro mtodo, sacamos conclusiones evaluando la probabilidad de obte
ner nuestros resultados de investigacin si fuera verdad lo contrario a lo que estamos prediciendo.
Es decir, generalmente predecimos algn tipo de efecto pero evaluamos si existe tal efecto obser
vando si es inverosmil la hiptesis de que ese efecto no exista.

EL PROCESO DE LA PRUEBA DE HIPTESIS


Volveremos a analizar la solucin del problema de prueba de hiptesis que utilizamos como
ejemplo estudiando cada paso con mayor detalle, as como tambin algunos de los trminos espe
ciales que se han utilizado. Al hacerlo, presentaremos un procedimiento de cinco pasos que se uti
lizar en el resto del libro.

Primero, tengamos en cuenta que los investigadores estn interesados en los efectos provocados
en los bebs en general (no slo en el beb en particular que ellos estudian). Por lo tanto, ser til
volver a plantear el problema en funcin de poblaciones. Con el propsito de analizar esta situa
cin, podemos decir que los bebs se dividen en dos grupos:
Poblacin 1: bebs que toman la vitamina especialmente purificada.
Poblacin 2: bebs que no toman la vitamina especialmente purificada.
La poblacin 1 se refiere a aquellos que reciben el tratamiento experimental. En nuestro
ejemplo, existe slo un caso real de poblacin 1. Sin embargo, ese nico beb representa un futu
ro grupo de muchos bebs que an no han nacido, y a quienes los investigadores pretenden apli
car sus resultados. La poblacin 2 representa una especie de lnea de base de lo conocido.
La prediccin del investigador est basada en una teora acerca de cmo funcionan las vitami
nas de este tipo. La prediccin es que los bebs de la poblacin 1 (aquellos que toman la vita
mina especialmente purificada) en general caminarn antes que los de la poblacin 2 (aquellos
que no toman la vitamina especialmente purificada). Una afirmacin de este tipo, acerca de la
diferencia entre poblaciones predichas sobre la base de una teora (o basada en la experiencia
prctica), se denomina hiptesis de investigacin. Para decirlo de modo ms concreto, decimos
que la prediccin establece que la media de la poblacin 1 es menor (los bebs que reciben la vi
tamina especial caminan antes) que la media de la poblacin 2. En smbolos, la hiptesis de in
vestigacin es p l< tu2.
Qu sucede si la prediccin es incorrecta? En ese caso, se mantiene la situacin contraria:
los bebs de la poblacin 1 (aquellos que toman la vitamina especialmente purificada) en general
no caminarn antes que los bebs de la poblacin 2 (aquellos que no toman la vitamina especial
mente purificada). Esta prediccin opuesta implica que no existe diferencia en cuanto al momen
to en que los bebs de la poblacin 1 y la poblacin 2 comienzan a caminar, es decir, comienzan
al mismo tiempo. Una afirmacin de este tipo, acerca de la ausencia de diferencia entre poblacio
nes, es el punto crtico opuesto a la hiptesis de investigacin. Se denomina hiptesis nuia por
que se utiliza generalmente para indicar una situacin en la que no existe diferencia entre dos
poblaciones (la diferencia es nula). En smbolos, la hiptesis nula es jtl = p2.1
La hiptesis de investigacin y la hiptesis nula son completamente opuestas. Si una es ver
dadera, la otra no puede serlo. Esta oposicin, y la concentracin directa en la hiptesis nula, es
un punto central de la lgica de la prueba de hiptesis. Por ese motivo, la hiptesis de investiga
cin, que finalmente es lo que realmente nos interesa, con frecuencia se denomina hiptesis al
ternativa. En realidad, la situacin es un poco irnica. Desde el punto de vista de nuestro inters
en el asunto, lo que ms nos importa es la hiptesis de investigacin. Sin embargo, desde el punto
de vsta de la prueba de hiptesis, el papel principal de la hiptesis de investigacin es su condi
cin de alternativa de la hiptesis nula.

* En este caso hemos simplificado ei tema. La hiptesis de investigacin implica que una poblacin caminar antes que
ia otra,
Por lo tanto, lo contrario implica que e l otro grupo caminar o bien al mismo tiempo o despus. A s, lo
contrario a la hiptesis de investigacin, en este caso incluye tanto la falta de diferencia com o una diferencia en direc
cin contraria a la predicha. En trminos de smbolos, si nuestra hiptesis de investigacin es jq c p j, entonces su
opuesto es p,j > Xj (el smbolo 5 significa mayor o igual a). Presentamos este tema con mayor detalle ms adelante
en este captulo. Por ahora, para simplificar el aprendizaje, algunas veces consideraremos que la hiptesis nula implica
que las dos poblaciones son esencialmente iguales, y otras veces consideraremos que implica que una poblacin es
igual u opuesta a la hiptesis de investigacin.

Una vez que hemos planteado la situacin en trminos de eleccin entre una hiptesis de investi
gacin y una hiptesis nula, el siguiente paso es analizar cmo podramos utilizar la informacin
que obtenemos sobre una muestra para realizar esta eleccin. La pregunta que planteamos es la
siguiente: dado un determinado resultado muestra! (en este caso, una observacin), qu probabi
lidad tenamos de obtener ese resultado si la hiptesis nula fuera verdadera?
Para responder esta pregunta, debemos saber cmo sera la situacin si la hiptesis nula fuera
verdadera. Es decir, necesitamos conocer los detalles de la distribucin de la poblacin de la cual
proviene la muestra si la hiptesis nula fuera verdadera. Si conocemos la distribucin de la pobla
cin de la que proviene nuestra muestra, y sabemos que se trata de una distribucin normal, nos
encontramos en una buena posicin: podemos determinar directamente la probabilidad de obte
ner cualquier valor determinado de esa distribucin utilizando una tabla de reas bajo la curva
normal.
Cmo podemos conocer los detalles de la poblacin de la cual proviene nuestra muestra si
la hiptesis nula es verdadera? Esto es posible porque, si la hiptesis nula es verdadera, ambas
poblaciones son iguales. Generalmente conocemos una de las poblaciones (poblacin 2); por lo
tanto, si la hiptesis nula es verdadera y las dos poblaciones son iguales, tambin conocemos la
otra poblacin (poblacin 1). En nuestro ejemplo, si la hiptesis nula es verdadera, ambas pobla
ciones siguen la curva normal, y presentan una media de 14 meses y un desvo estndar de 3 me
ses (vase figura 6-1).
En este libro llamaremos a la distribucin correspondiente a la situacin en la que la hiptesis
nula es verdadera, es decir, la distribucin con la que comparamos la muestra, distribucin com
parativa. (La distribucin comparativa a veces es denominada "modelo estadstico, y en la ma
yora de los casos tambin coincide con lo que se denomina una distribucin muestra, una. idea
que expondremos en el captulo 7). Es decir, en el proceso de la prueba de hiptesis, comparamos
los valores observados en la muestra con esta distribucin. Realizamos la comparacin calculan
do la probabilidad de obtener un valor tan extremo como el de nuestra muestra en esa distribucin
comparativa. En el ejemplo que estamos tratando, la distribucin comparativa es igual a la distri
bucin de valores de la poblacin 2, la poblacin a la que no se le ha aplicado el procedimiento
experimental.
3o paso: determinar el valor muestra! de corte en la distribucin comparativa,
en e! que debera rechazarse la hiptesis nula
Lo ideal sera que antes de realizar un estudio, los investigadores establezcan un objetivo con el
cual comparar su resultado, es decir, qu valor extremo necesitara tener la muestra para poder sa
car una conclusin confiable. Especficamente, determinar el valor que necesitara arrojar la
muestra para decidir rechazar la hiptesis nula, cun extremo debera ser ese valor para que resul
te demasiado improbable que pudiera obtenerse tal valor extremo si la hiptesis nula fuera verda
dera. A esto se lo denomina punto muestra] de corte (tambin se conoce con el nombre de
punto crtico).
Analicemos nuestro ejemplo de la vitamina purificada, en el que la hiptesis nula implica que
no importa si un beb recibe la vitamina especialmente purificada o no. Los investigadores po
dran decidir que si la hiptesis nula fuera verdadera, sera muy improbable que un beb camine a
los 8 meses o antes. Tratndose de dos desvos estndar por debajo de la media (caminar a ios 8
meses), slo podra ocurrir menos de un 2% de las veces. Por lo tanto, basndose en la distribu
cin comparativa, los investigadores establecen su punto muestral de corte incluso antes de reali

zar el estudio. Lo que estn haciendo es decidir por adelantado que, si el resultado de su estudio
es un beb que camina antes de los 8 meses, rechazarn la hiptesis nula.
Si el beb comienza a caminar antes de los 8 meses, los investigadores podrn rechazar la hi
ptesis nula, y si lo hacen, les quedar la hiptesis de investigacin. Entonces podrn decir que
se sostiene la hiptesis de investigacin.
Por otro lado, si el beb no comienza a caminar sino hasta despus de ios 8 meses, no podrn
rechazar la hiptesis nula. Cabe notar, sin embargo, que en este caso no podrn decir se sostiene
la hiptesis nula", ya que no rechazar la hiptesis nula crea una situacin ambigua. No pueden sa
carse conclusiones, excepto, concluir que se necesita realizar una mayor investigacin. Ms ade
lante continuaremos tratando este tema.
Al establecer por adelantado cun extremo deber ser. un valor para rechazar la hiptesis nu
la, los investigadores no utilizan por lo general un nmero real de unidades de la escala directa
de medicin (en este caso, meses). En cambio, establecen cun extremo debera ser un valor en
trminos de una probabilidad y de la puntuacin Z que corresponde a dicha probabilidad. En
nuestro ejemplo de la vitamina purificada, ios investigadores podran decidir que s la verosimi
litud de un resultado fuera menor del 2% (la probabilidad), rechazaran la hiptesis nula. Estar
dentro del 2% inferior de una curva normal significa tener una puntuacin Z de aproximadamen
te -2 menor. Por lo tanto, los investigadores estableceran -2 como la puntuacin Z de corte en
la distribucin comparativa para decidir que un resultado es Jo suficientemente extremo como
para rechazar la hiptesis nula.
Supongamos que los investigadores son todava ms cautelosos en cuanto al rechazo de la hi
ptesis nula. En ese caso, podran decidir que rechazarn la hiptesis nula slo si obtienen un re
sultado cuyas chances de ocurrir son del 1% menos. Entonces podran calcular la puntuacin Z
de corte correspondiente al 1%. Conforme a la tabla de reas bajo la curva normal, para tener un
valor dentro del 1% inferior de una curva normal, se necesita una puntuacin Z de -2,33 menor.
(En nuestro ejemplo, ana puntuacin Z de -2,33 corresponde a 7 meses). En la figura 6-2 hemos
sombreado el 1% de la distribucin comparativa, en el que una muestra sera considerada tan ex
trema que se rechazara la posibilidad de que surgiera de una distribucin como esa.
En general, los investigadores psicolgicos utilizan un corte en la distribucin comparativa
que coincide con una probabilidad del 5% de que un valor sea al menos tan extremo. Es decir, los

Figura 6-2. Distribucin de la edad en la que los bebs comienzan a caminar (datos ficticios).

investigadores rechazan la hiptesis nula si la probabilidad de obtener un resultado tan extremo


(si la hiptesis nula fuera verdadera) es menor al 5%. Esta probabilidad generalmente se escribe
como p<0,05\ No obstante, en algunas reas de investigacin, o cuando los investigadores quie
ren ser especialmente cautelosos, utilizan un corte dei 1% (p<0,01).
A estos porcentajes se los denomina niveles convencionales de significacin. Se describen
como nivel de significacin 0,05 nivel de significacin 0,01. Cuando el valor muestral es tn ex
tremo que ios investigadores rechazan la hiptesis nula, se dice que el resultado es estadstica
mente significativo.

4o paso: determinar ei valor muestral en la distribucin comparativa


El siguiente paso es realizar el estudio y encontrar el resultado real de la muestra. El investigador
calcula la puntuacin Z correspondiente a la puntuacin original de la muestra basndose en la
media y ei desvo estndar de la distribucin comparativa. sto indica al investigador dnde se
ubica su muestra en la distribucin comparativa.
Supongamos que los investigadores de nuestro ejemplo realizaron el estudio, y que el beb que
tom la vitamina especialmente purificada comenz a caminar a los 6 meses. La media de la distri
bucin comparativa con la que estamos comparando estos resultados es de 14 meses y el desvo es
tndar de 3 meses. Por lo tanto, un beb que camina a los 6 meses se ubica 8 meses por debajo de la
meda, lo que implica un desvo estndar de 2 2/3 por debajo de la media La puntuacin Z corres
pondiente al beb de la muestra en la distribucin comparativa es 2,67- La figura 6-3 muestra el va
lor correspondiente al beb de la muestra en la distribucin comparativa.

5o paso: decidir si se rechaza o no la hiptesis nula


Una vez que tenemos claro a) qu puntuacin Z debe tener la muestra en la distribucin compa
rativa para poder rechazar la hiptesis nula (paso 3) y b) la puntuacin Z real de la muestra ( pa-

so 4), esta decisin es completamente mecnica. Para determinar si se rechaza o no la hiptesis


nula, debemos comparar la puntuacin Z necesaria con la puntuacin Z reai Supongamos que
en nuestro ejemplo ios investigadores determinaron que se rechazara la hiptesis nula si la pun
tuacin Z de la muestra era menor a -2. Debido a que el resultado real fue -2,67, que es menor a
-2, se rechazara la hiptesis nula. Supongamos que hubieran elegido utilizar el nivel de signifi
cacin ms conservador del 1%. En ese caso, la puntuacin Z necesaria hubiera sido -2,33.
Siendo la puntuacin Z real igual a -2,67, aun con este criterio ms conservador se rechazara la
hiptesis nula.
Si los investigadores rechazan la hiptesis nula, lo que queda es la hiptesis de investigacin.
En este ejemplo, los investigadores pueden inferir que los resultados de su estudio sostienen la hi
ptesis de investigacin que indica que los bebs que toman la vitamina especialmente purificada
comienzan a caminar antes que los otros bebs.

Qu implica rechazaro no la hiptesis nula?


Queremos hacer hincapi en dos puntos relacionados con el tipo de conclusiones que podemos
sacar a partir del proceso de prueba de hiptesis. En primer lugar, supongamos que rechazamos la
hiptesis nula y que los resultados sostienen la hiptesis de investigacin (como en nuestro ejem
plo de la vitamina). Los investigadores an no diran que el resultado prueba la hiptesis de in
vestigacin o que ios resultados muestran que la hiptesis es verdadera. Esas palabras son
demasiado fuertes en este caso, ya que las conclusiones a las que se llega a travs de estudios de
investigacin siempre se basan en probabilidades. En la prueba de hiptesis, se basan en la poca
probabilidad de obtener determinado resultado si la hiptesis nula fuera verdadera. Decir que las
conclusiones estn comprobadas o que son verdaderas sera una exageracin. Tales afirmacio
nes son correctas para la lgica o la matemtica, pero utilizar estas palabras con respecto a con
clusiones resultantes de una investigacin cientfica es completamente poco profesional. (Es
correcto usar la palabra verdadero cuando se habla hipotticamente, por ejemplo, si la hipte
sis fuera verdadera, entonces..., pero no al hablar de una conclusin real).
En segundo lugar, y tal como lo mencionamos anteriormente, cuando un resultado no es io su
ficientemente extremo como para que rechacemos la hiptesis nula, no decimos que el resultado
sostiene la hiptesis nula. Un resultado que no es lo suficientemente determinante como para
que rechacemos la hiptesis nula slo Implica que el estudio no fue concluyente. Los resultados
pueden no ser lo suficientemente extremos como para rechazar la hiptesis nula, pero la hiptesis
nula podra ser falsa (y la hiptesis de investigacin verdadera). Supongamos que en nuestro ejem
plo la vitamina especialmente purificada tuviera slo un efecto leve, pero an as real. En ese caso,
no esperaramos que ningn beb que hubiera tomado la vitamina purificada camine mucho antes
que los otros bebs; por lo tanto, no podramos rechazar la hiptesis nula aunque esta fuera falsa.
La cuestin es que demostrar que la hiptesis nula es verdadera implicara demostrar que realmen
te no existe diferencia entre las poblaciones. No obstante, siempre es posible que esa diferencia existapero que sea mucho menor de lo que el estudio en particular podra detectar. Por lo tanto, cuando un re
sultado no es lo suficientemente extremo como para rechazar la hiptesis nula, los investigadores por lo
general slo dicen que los resultados no son concluyentes. Sin embargo, algunas veces, si los estudios
se han realizado utilizando grandes cantidades de procedimientos con un nivel de medicin muy preci
sa, la evidencia puede crear fundamentos en cuanto a la exactitud aproximada de determinada hiptesis
nula, Adems, algunas veces, los investigadores hablando informalmente describen la imposibilidad de
rechazar una hiptesis nula como un resultado que sostiene la hiptesis nula. Sin embargo, tcnica
mente, la expresin anterior es, por lo general, demasiado fuerte. (Ms adelante, en este captulo y en el
captulo S, continuaremos tratando este tema).

Resumen de los pasos de la prueba de hiptesis


A continuacin presentamos un resumen de los cinco pasos de la prueba de hiptesis:
1. Replantear el problema en funcin de la hiptesis de investigacin e hiptesis nula de las .
poblaciones.
2. Determinar las caractersticas de la distribucin comparativa.
3. Determinar el punto muestra! de corte en la distribucin comparativa, a partir del cual de
bera rechazarse la hiptesis nula.
4. Determinar el valor muestral en la distribucin comparativa.
5. Comparar los valores de los pasos 3 y 4 para decidir si se rechaza o no la hiptesis nula.
Otro ejemplo de prueba de hiptesis
Aqu presentamos otro ejemplo ficticio. Dos psiclogos especializados en personalidades des
preocupadas estn analizando la teora de que la felicidad surge de experiencias positivas. En par
ticular, los investigadores sostienen que si a una persona le sucede algo muy afortunado se pondr
muy feliz y continuar estndolo durante mucho tiempo. Por lo tanto, planifican el siguiente ex
perimento: de todas las personas adultas norteamericanas se seleccionar una al azar y se le rega
lar 1 milln de dlares, y seis meses despus se medir la felicidad de esa persona. En este ejemplo
ficticio ya se conoce cul es la distribucin correspondiente a la felicidad para la poblacin gene
ral de adultos de Norteamrica, que es la que representa la figura 6-4. En la prueba que se utiliza,
la felicidad tiene un valor medio de 70, el desvo estndar es 10, y la distribucin es aproximada
mente normal
Los psiclogos siguen el mismo procedimiento de prueba de hiptesis utilizado en el ejemplo
de la vitamina purificada. Consideran cul es el nivel de felicidad que debera sentir la persona
analizada para rechazar con confianza la hiptesis nula (que implica que recibir esa cantidad de
dinero no hace que las personas se sientan ms felices 6 meses despus). Si el resultado obtenido
por los investigadores muestra un muy alto nivel de felicidad, los psiclogos rechazarn la hipte
sis nula y concluirn que obtener 1 milln de dlares probablemente hace sentir ms felices a las
personas meses despus del hecho. Pero si el resultado no lo es suficientemente extremo, los in-

La hiptesis nula establece que no existe


diferencia entre las poblaciones represen
tadas por diferentes grupos o condiciones:
experimentales. Como hemos observado,
la regla general en estadstica es que un
estudio no puede determinar que la hip
tesis nula sea verdadera. Un estudio slo
puede indicar que no es posible rechazar
la hiptesis nula, es decir, que ese estudio
simplemente no aporta informacin. Ob
viamente, esos estudios no suelen publi
carse, aunque de hecho se podra evitar
una gran cantidad de trabajo si las perso
nas supieran que ciertas intervenciones,
medidas o experimentos no funcionaron an
teriormente. En realidad, Greenwald (1979).
informa que en algunas ocasiones se ha
considerado por mucho tiempo que algunas
ideas eran verdaderas slo porque unos po
cos estudios as lo mostraban, mientras que
muchos otros, no publicados, haban mos- .
trado lo contrario,

Frick (1995) ha sealado un problema


an ms serio con respecto al inflexi
ble desinters por la hiptesis nula:
Algunas veces puede ser verdad que
determinado elemento no tenga nin
gn efecto sobre otro. Este hecho no
significa que exista una relacin cero,
que no exista diferencia en absoluto
(la ausencia absoluta de diferencia es
un resultado improbable en la mayora
de los casos). Slo significara que el
efecto de un elemento sobre el otro es
tan pequeo que no tiene ninguna im
portancia prctica o terica,
El problema es saber cundo inferir
que la hiptesis nula (o algo cercano a ella)
podra ser verdadera. Frick (1995) propone

tres criterios. Primero, la hiptesis nula de


bera parecer posible. Segundo, obviamen
te los resultados del estudio deberan ser
coherentes con la hiptesis nula, por lo cual
no debera existir ninguna otra forma evi
dente de interpretarlos. Tercero, y ms im
portante an, el investigador debe haber .
realizado un gran esfuerzo por descubrir el
efecto cuya inexistencia pretende inferir.
Entre otras cosas, esto implica analizar una k
gran muestra y emplear una medicin su
mamente completa y susceptible. Si el es
tudio es un experimento, es importante que 7
se haya intentado' producir el efecto tili- :
zando una fuerte manipulacin y rigurosas
condiciones de prueba.
.. Frick seala que todo.esto deja un ele- ;
ment subjetivo en cuanto a l aceptacin '
de la hiptesis nula: Quin decide s el es- Vv
fuerzo del investigador fue lo suficiente
mente importante? Pero nos guste o no, las :
decisiones subjetivas son parte de la cien
cia. Por ejemplo, los editores deben decidir
si un tema es lo suficientemente importante
como para brindarle el espacio en su revis- ta. Ms an, a pesar de todo, la hiptesis
nula s aceptada en muchas ocasiones (por
ejemplo, muchos psiclogos aceptan la hi
ptesis nula con respecto al efecto de la
ESP-Extrasensory Perception, Percepcin
extrasensorial). Es ms conveniente debatir
los fundamentos para la aceptacin de la
hiptesis nula que, simplemente, aceptarla.
Cul es el objetivo de toda esta argu
mentacin? Queda claro que no rechazar la
hiptesis nula no es lo mismo que sostener
la. Pero Frick nos recuerda que existen si
tuaciones en las que la evidencia debera
convencemos de que algo similar a la hip
tesis nula podra ser la situacin verdadera.

vestigadores concluirn que no existe suficiente evidencia para rechazar la hiptesis nula y ios re
sultados del experimento seran, entonces, no concluyentes.
Ahora analicemos el procedimiento de prueba de hiptesis ms detalladamente segn este
ejemplo, siguiendo los pasos resumidos anteriormente.
1. Replantear el problema en fundn de hiptesis de investigacin e hiptesis nula de las
poblaciones. Las poblaciones de inters son h s siguientes:
Poblacin 1: personas que hace 6 meses recibieron 1 milln de dlares.
Poblacin 2: personas que hace 6 meses no recibieron 1 milln de dlares.
La prediccin de los psiclogos especializados en personalidad, basndose en esta teora de
la felicidad, es que las personas que forman la poblacin 1 se sentirn en general ms felices que
las personas que forman la poblacin 2 (en smbolos, M l>M2). La hiptesis nula implica que las
personas que forman la poblacin 1 (los que recibieron 1 milln de dlares) no se sentirn ms fe
lices que las personas que forman la poblacin 2 (aquellos que no recibieron 1 milln de dlares).
2. Determ inar las caractersticas de la distribucin comparativa. Llegado el momento
querremos comparar nuestra observacin con la situacin que se presentara si la hiptesis nula
fuera verdadera (para comprobar si podemos rechazar ese escenario). Si la hiptesis nula es ver
dadera, la distribucin de las poblaciones 1 y 2 sern iguales. Sabemos cul es la distribucin de
la poblacin 2, as que puede servimos como distribucin comparativa.
3. Determinar el punto muestral de corte en la distribucin comparativa, a partir del
cual debera rechazarse la hiptesis nula. Qu tipo de observacin sera suficientemente con
vincente como para rechazar la hiptesis nula? En este caso, supongamos que ios investigadores
decidieron por adelantado rechazar la hiptesis nula, por ser demasiado improbable, si los resul
tados pudieran ocurrir menos de un 5% de las veces si esa hiptesis nula fuera verdadera. Debi
do a que sabemos qu la distribucin comparativa es normal, podemos determinar a partir de la
tabla de reas bajo la curva normal que el 5% superior de los valores comienzan en una puntua
cin Z de aproximadamente 1,64. (Siendo la media de la distribucin comparativa igual a 70 y el
desvo estndar igual a 10, la hiptesis nula sera rechazada si el resultado de la muestra fuera
igual o mayor a 86,4. Es decir, siguiendo el mtodo usual para convertir una puntuacin Z en una
puntuacin original, 1,64 x 10 - 16,4, lo que sumado a la media de 70 da 86,4).
4. Determ inar el valor muestral en la distribucin comparativa. Observemos ahora los
resultados: seis.meses despus de entregar 1 milln de dlares a la persona elegida al azar, los in
vestigadores entregan a su ahora adinerado participante la prueba de nivel de felicidad. La pun
tuacin de la persona es 80. Como puede verse en la figura 6-4, una puntuacin de 80 corresponde
a una puntuacin Z de +1 en la distribucin comparativa.
5. Com parar los registros de los pasos 3 y 4 p ara decidir si se rechaza o no la hiptesis
nula. La puntuacin Z mnima, necesaria para rechazar la hiptesis nula, ha sido establecida en
+1,64 (la puntuacin Z que corresponde al 5% del nivel de significacin), y la puntuacin Z co
rrespondiente al individuo de la muestra es slo +1. Por lo tanto, la muestra no es lo suficiente
mente extrema como para damos fundamentos para rechazar la hiptesis nula. La hiptesis nula
no puede rechazarse, y los resultados del experimento no son concluyentes. Los investigadores
describen tal resultado como no significativo estadsticamente. La figura 6-5 muestra la distri
bucin comparativa con el 5% superior sombreado y la ubicacin del millonario que conforma
la muestra.
Un dato interesante es que Brickman, Coates y Janoff-Bulman (1978) realizaron un estudio
ms elaborado basndose en la misma cuestin, analizando a ganadores de la lotera como ejem
plos de personas a las que les ocurran hechos repentinos muy positivos. Sus resultados fueron si

milares a ios de nuestro ejemplo ficticio: 6 meses despus, el grupo ganador de dinero no era mu
cho ms feliz que las personas que no haban ganado ese dinero. Adems, descubrieron que otro
grupo estudiado por ellos, personas que haban quedado parapjicas a causa de accidentes, 6 me
ses despus no eran mucho menos felices que otras personas. Estos investigadores analizaron can
tidades bastante grandes de individuos e investigaron el tema de diversas maneras. Su conclusin
fue que si un hecho-importante en verdad provoca algn efecto duradero relacionado con la felici
dad, el efecto probablemente no es muy grande, Aparentemente, ganarse la lotera no es la res
puesta. (En otros estudios, p. ej. Suh, Dener & Fijita, 1996, se ha encontrado el mismo patrn).

PRUEBAS DE HIPTESIS PE UNA Y DOS COLAS________________________


Hasta aqu nuestros ejemplos de prueba de hiptesis se han basado en situaciones en as que nos in
teresaba slo una direccin del resultado. En el ejemplo de la vitamina purificada, los investigado
res estaban interesados en saber si el beb caminara antes que otros bebs. En el ejemplo sobre la
felicidad, los psiclogos especializados en el estudio de la personalidad esperaban que la persona
que recibiera 1 milln de dlares fuera ms feliz que las otras. Los investigadores que realizaron
estos estudios no estaban realmente interesados en la posibilidad de que el suministro de las vita
minas especialmente purificadas pudiera causar que los bebs tardaran ms en comenzar a cami
nar, o que la persona que'recibi 1 milln de dlares pudiera en realidad ser menos feliz.
Hiptesis direccional y pruebas de una cola

Los estudios acerca de la vitamina purificada y la felicidad son ejemplos que involucran hiptesis
direccionales. En cada caso, los investigadores estaban interesados en una direccin especfica del
efecto. Es importante observar que cuando un investigador propone una hiptesis direccional, la
hiptesis nula correspondiente es, tambin, en cierto sentido direccional. Si la hiptesis de investi
gacin establece que obtener 1 milln de dlares har ms feliz a una persona, la hiptesis nula es-

F ig u r a 6-S . D is tr ib u c i n d e v a lo r e s d e l n iv e l d e f e lic id a d c o n e l 5 % s u p e r io r s o m b r e a d o y la u b ic a c i n d e l
m illo n a r io q u e c o n fo r m a la m u e s tr a (d a to s f ic t i c io s ) .

tablece que el dinero no producir ningn efecto o har menos feliz a esa persona, (Expresado en
smbolos, si la hiptesis de investigacin es x3 > jx2, entonces la hiptesis nula ser
< ji2). Por
lo tanto, como ya hemos observado, en la figura 6-5, por ejemplo, para rechazar la hiptesis nula la
muestra deba arrojar un valor que se ubicara dentro del 5% superior, el extremo o cola superior de
la distribucin comparativa. (A los fines de rechazar la hiptesis nula, un valor ubicado en la otra
cola sera considerado del mismo modo que un valor ubicado en el medio d la distribucin). Por
esta razn, la prueba de una hiptesis direccional se denomina prueba de una cola.
Hiptesis no direccio nal y pruebas de dos colas

Sin embargo, a veces una hiptesis de investigacin implica simplemente que una poblacin ser
diferente de la otra, sin especificar si la diferencia la marcarn valores ms altos o ms bajos. Por
ejemplo, un psiclogo especializado en organizaciones empresariales puede estar interesado en el
impacto provocado en la productividad por un programa de capacitacin en relaciones sociales.
Es posible que el programa mejore la productividad al hacer ms placentero el ambiente de traba
jo. Pero tambin es posible que perjudique la productividad por incentivar a las personas a que
practiquen relaciones sociales en lugar de trabajar. En este caso, la hiptesis de investigacin im
plicara que el programa de relaciones sociales cambie el nivel de productividad. La hiptesis nu
la implicara que el programa no afecte la productividad en ningn sentido. Es decir, expresado en
smbolos, la hiptesis de investigacin sera jj, j ^ p,2, y la hiptesis nula sera p.t - jx2.
Siempre que una hiptesis de .investigacin establezca una diferencia, sin indicar la direccin
de esa diferencia, se la denomina hiptesis no direccional. Para probar la significacin de una hi
ptesis no direccional, uno debe analizar si un valor es extremo en cualquiera de las dos colas de
la distribucin comparativa. Por lo tanto, a esta prueba se la denomina prueba de dos colas.
Determ inacin de puntos de corte en pruebas de dos colas

Las pruebas de dos colas presentan una complicacin especial. Supongamos que el investigador
selecciona un nivel de significacin del 5%. En una prueba de una cola, el investigador rechaza la
hiptesis nula si la oservacin muestral se ubica dentro de uno de los extremos que contiene el 5%
de la distribucin comparativa. En una prueba de dos colas, podra suponerse que el investigador
utilizara el 5% superior cuando el valor es extremo en direccin hacia arriba, y el 5% inferior
cuando el valor es extremo en direccin hacia abajo. Sin embargo, si el investigador hiciera esto,
existira un total del 10% de la distribucin comparativa dentro del cual la hiptesis nula podra
ser rechazada. El nivel de significacin en realidad sera del 10%, porcentaje que la mayora de
los investigadores considerara muy peligroso. (Es decir, con un 10% de nivel de significacin,
uno podra rechazar la hiptesis nula con mucha facilidad aun cuando sta fuera verdadera).
Existe una solucin para este problema. Al realizar una prueba de dos colas, se divide el por
centaje de significacin entre las dos colas. Con un nivel de significacin del 5%, se rechazara la
hiptesis nula slo si la muestra fuera tan extrema que se ubicara dentro del 2 1/2 % superior o
dentro del 2 1/2 % inferior. De este modo, la posibilidad total de que la hiptesis nula sea verda
dera, determinada con anterioridad a la realizacin del estudio, se mantiene en un total del 5%.
Es importante sealar que al utilizar una prueba de dos colas; las puntuaciones Z de corte pa
ra un nivel del 5% son +1,96 y -1,96. En el caso de una prueba de una cola, el corte no era tan ex
tremo, +1,64 y -1,64, pero slo se tem'a en cuenta un lado de la distribucin. La figura 6-6a
representa esas situaciones. Utilizando un nivel de significacin del 1%, una prueba de dos colas.
(0,5% en cada cola) presenta cortes de +2,58 y -2,58, mientras que los cortes en una prueba de
una cola seran de +2,33 -2,33 (vase figura 6~6b).

Cundo u tilizar pruebas de una o dos colas?

Resulta ms fcil rechazar la hiptesis nula con una prueba de una cola que con una prueba de dos
colas, ya que el valor de la muestra no necesita ser tan extremo para que el resultado experimental
sea significativo. Sin embargo, esto tiene su costo, ya que con las pruebas de una cola, si el resul
tado es extremo en la direccin opuesta a la esperada, no puede considerarse significativo y no
importa cun extremo haya sido ese resultado.
En principio, se planifica una prueba de una cola cuando se trabaja con una hiptesis clara
mente direccional, y de dos colas cuando se trabaja con una hiptesis claramente no direccional.
En la prctica, la decisin no resulta tan simple. Incluso cuando una teora predice claramente un
resultado determinado, a veces descubrimos que el resultado es justamente el opuesto de lo que
esperbamos, y en ocasiones ese resultado opuesto puede ser realmente ms interesante. (Qu
hubiera sucedido si, como ocurre en todos los cuentos de hadas sobre genios y peces que conce
den deseos, recibir 1 milln de dlares y cumplir casi todos sus deseos hubiera hecho de ese indi
viduo una persona infeliz? El resultado hubiera sido realmente muy interesante). Utilizando las
pruebas de una cola corremos el riesgo de tener que ignorar resultados posiblemente importantes.
Debido a estas consideraciones, la utilizacin de las pruebas de una cola es discutida, aun
cuando la hiptesis sea claramente direccional. Para mayor seguridad, muchos investigadores uti
lizan pruebas de dos colas tanto para hiptesis direccionales como no direccionales. Si el resulta
do de la prueba de dos colas es significativo, entonces el investigador analiza el patrn de los
datos hallados-para determinar la direccin del resultado, considerando ai estudio significativo en
esa direccin.2 Cabe mencionar que, en la prctica, este es un procedimiento conservador, por el
hecho de que siendo los puntos de corte ms extremos para una prueba de dos colas, es menos ve
rosmil que una prueba de dos colas d un resultado significativo. Por lo tanto, si se obtiene un re
sultado significativo con una prueba de dos colas, uno puede estar ms seguro de sus
conclusiones. De hecho, en la mayora de las publicaciones cientfcas psicolgicas, a menos que
el investigador indique especficamente que utiliz una prueba de una cola, en lneas generales se
supone que utiliz una prueba de dos colas.
No obstante, cabe recordar que, por lo general, la conclusin final no es afectada realmente
por el hecho de que el investigador utilice una prueba de una o dos colas. Segn nuestra experien
cia, usualmente los resultados de las investigaciones o son tan extremos que seran considerados
significativos a travs de cualquier estndar razonable, o estn tan lejos de serlo que no seran
considerados significativos a travs de ningn procedimiento.
Qu sucede cuando un resultado arroja conclusiones menos precisas? La decisin del inves
tigador en cuanto a las pruebas de una o dos colas adquiere mayor importancia. En ese caso, el in
vestigador intentar utilizar el mtodo que arroje la conclusin ms exacta y menos controvertida,
ya que la idea es dejar que hasta donde sea posible, la naturaleza, y no la decisin del investiga
dor, determine la conclusin. Ms an, cuando un resultado no es completamente claro en uno u
otro sentido, la mayora de los investigadores se sentiran incmodos al sacar conclusiones defini
tivas sin realizar otros estudios.

2 Leventhal

y Huynh (1996) sostienen que este procedimiento en realidad es incorrecto. S uno est probando una
hiptesis no direccional, slo debera sacar conclusiones no direccionales. Sugieren que un mejor procedimiento sera
utilizar una prueba direccional de dos colas", que en realidad son dos pruebas simultneas de una cola (una en cada
direccin), As, si un investigador quisiera establecer un nivel de significacin total de 0,05, utilizara una prueba direc
cional de dos colas, en la que cada una de las dos subdivisiones de una cola utilizara el nivel 0,025. En cuanto a decidir
si un resultado es significativo o no, el mtodo de Leventhal y Huynh produce un resultado idntico al de la prueba de
uso ms-comn, no direccional de dos colas. El razonamiento de Leventhal y Huynh sobre las pruebas de dos colas
parece ms lgico (adems de tener otras ventajas tcnicas). Sin embargo, debido a que los investigadores an no han
adoptado ese mtodo (y dado que el resultado es el mismo), en este libro utilizamos el mtodo m is tradicional.

Ejem pio de prueba de hiptesis

utilizando una prueba de dos colas

Aqu presentamos otro ejemplo ficticio, pero esta vez utilizando una prueba de dos colas. Un gru
po de psiclogos clnicos de un centro residencial de tratamiento psiquitrico creen haber desa
rrollado un nuevo tipo de terapia que aliviar, en mayor grado que la terapia que se est utilizando
en ese momento, la depresin de los pacientes. Sin embargo, como sucede con cualquier trata
miento, no se puede descartar la posibilidad de que provoque peores resultados en algn paciente.
Por lo tanto, los investigadores probarn una hiptesis no direccional.
Los psiclogos procedern de la siguiente manera: seleccionarn al azar un paciente que re
cin ingrese para suministrarle la nueva terapia en lugar de la usual. (Por supuesto que en un estu-

Fgura 6 - 6 . Comparacin de puntos de corte segn el nivel d e Significacin p a r a pruebas de una y dos colas:
(a) nivel de significacin 0,05; (b) nivel de significacin 0,01, (Las pruebas de una cola en estos ejem plos
suponen que se predeca un valor alto).

dio real se seleccionara ms de un paciente, pero supongamos que una sola persona ha sido capa
citada para realizar la nueva terapia y que tiene tiempo para tratar slo a un paciente). La depre
sin del paciente se medir con una escala de depresin estndar que se aplica automticamente a
todos los pacientes despus de 4 semanas. Esa escala ha sido aplicada a los pacientes durante un
largo tiempo en este centro de tratamiento. Por lo tanto, es posible determinar por adelantado en
aquellos pacientes que recibieron la terapia usual la distribucin de los valores del nivel de de
presin a las 4 semanas. En nuestro ejemplo ficticio, esa distribucin sigue una curva normal con
una meda de 69,5 y un desva estndar de 14,1. (Las cifras mencionadas se aproximan a los valo
res de depresin obtenidos en una encuesta nacional de 75,000 pacientes psiquitricos a los que
se Ies suministr el m m p i , una prueba estndar ampliamente utilizada; Dahlstrom, Larbar, &
Dahlstrom, 1986). La figura 6-7 muestra esta distribucin.
El procedimiento de prueba de hiptesis se realiza, entonces, de la siguiente manera:

1.
Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de la
poblaciones. Las dos poblaciones de inters son:
Poblacin X: pacientes con diagnstico de depresin que recibieron la nueva terapia.
Poblacin 2: pacientes con diagnstico de depresin que recibieron la terapia estndar.
La hiptesis de investigacin supone que, al medir la depresin 4 semanas despus dei ingre
so, los pacientes que reciben la nueva terapia (poblacin 1) tendrn un valor diferente al de los pa
cientes que reciben la terapia actual (poblacin 2). En smbolos, ia hiptesis de investigacin es
M x ; M2. L o contraro a la hiptesis de investigacin, la hiptesis nula, supone que los pacientes
que reciben la nueva terapia tendrn el mismo nivel de depresin que los pacientes que reciben la
terapia usual. (Es decir, el nivel de depresin medido despus de 4 semanas ser el mismo para la
poblacin 1 y 2). En smbolos, la hiptesis nula es: jl^ = |i.

F ig u r a 6 -7 . D is tr ib u c i n d e io s v a lo r e s d e la e s c a la d e d e p r e s i n m m p i a 4 s e m a n a s d e l in g r e s o , c o r r e s p o n
d ie n t e s a p a c ie n t e s p s iq u i tr ic o s a lo s q u e s e l e s d ia g n o s t ic d e p r e s i n y q u e r e c ib e n la ter a p ia e s t n d a r (d a
to s f ic t i c io s ) .

Nivel de depresin:
Pimiiadn Z:

..

4! ,3-'

-2

55,4
*~l

69,5

.:o

83,6
+ 1-'

97,7 <

-VI ,

::: Depresin de! paciente


que conforma la muestra = 41
.
Z jb - 2,02

Figura 6-8. Distribucin de los valores de la escala de depresin m m h con el 2 1 /2 % superior e inferior

sombreado, el cual indica la ubicacin del paciente que conforma la muestra y que recibi la nueva terapia,
(datos ficticios).

2. Determinar las caractersticas de la distribucin comparativa. Si la hiptesis nula es


verdadera, las distribuciones de las poblaciones 1 y 2 sern iguales. Conocemos la distribucin de
la poblacin 2, por lo tanto, puede servir como distribucin comparativa. Como ya dijimos, pre
senta una curva normal con p = 69,5 y o = 14,1.
3. Determinar el punto mustral de corte en l distribucin comparativa, a p artir dei
cual debera rechazarse la hiptesis nula. El equipo de psiclogos clnicos selecciona un nivel
de significacin del 5%. Los investigadores han preparado una hiptesis no direccional, por lo
que se debe utilizar una prueba de dos colas. Esto significa que la hiptesis nula ser rechazada
slo s.i el valor del nivel de depresin del paciente en la distribucin comparativa se encuentra
dentro del 2 1/2 % superior o inferior de esa distribucin. Expresados en puntuaciones 2, los pun
tos crticos son +1,96 y - 1 ,96 (vase figura 6-8).
4. Determ inar el valor muestral en la distribucin comparativa. El paciente que recibi la
nueva terapia fue medido 4 semanas despus de su ingreso. El valor del paciente en la escala de
depresin fue de 41, lo que es igual a una puntuacin Z de -2,02 en la distribucin comparativa.
5. C om parar los valores de los pasos 3 y 4 para decidir si se rechaza o no la hiptesis
nula. Una puntuacin Z de -2,02 se ubica apenas por debajo de la puntuacin Z de -1,96, que es
donde comienza ei 2 1/2 % inferior de la distribucin comparativa. Se trata de un resultado tan ex
tremo que es improbable que hubiera ocurrido si el paciente representara una poblacin que no
fuera diferente de la poblacin 2. Por lo tanto, los psiclogos clnicos rechazaron la hiptesis nu
la. El resultado sostiene la hiptesis de investigacin que implica que la nueva terapia realmente
produce cambios en el nivel de depresin de los pacientes.

CONTROVERSIAS Y L IM IT A C IO N E S _________________________________
En los ltimos aos ha surgido una controversia importante acerca de la propia prueba de signifi
cacin, con un movimiento organizado por parte de un pequeo pero resonante grupo de psiclo
gos que pretendan prohibirlas. La sugerencia es radical, y sus consecuencias tendran un enorme
alcance (durante al menos medio siglo casi todas las investigaciones psicolgicas han utilizado
las pruebas de significacin). Probablemente, en las ms importantes revistas cientficas especia
lizadas en psicologa se haya escrito recientemente mucho ms acerca de esta controversia. El co
mienzo de una publicacin reciente ilustra la fuerza que ha adquirido el debate:
N o e s v e r d a d q u e u n g r u p o d e a c t iv is t a s r a d ic a le s to m a r a n a 1 0 e s t a d s t i c o s y 6 e d it o r e s c o m o
r e h e n e s e n la C o n v e n c i n d e la S o c i e d a d A m e r ic a n a d e P s i c o l o g a d e 1 9 9 6 y c o r e a r a n a p o y e n
la p r o h ib ic i n to t a l d e la s p r u e b a s y a n u le n la ( h i p t e s i s ) n u la , ( A b e s o n , 1 9 9 7 , p. 1 2 ),

Dado que se trata, hasta ahora, de la ms enrgica e importante controversia surgida en aos con res
pecto a la estadstica aplicada a la psicologa, trataremos los distintos temas relacionados con ella al
menos en tres diferentes oportunidades. En este captulo, nos concentraremos en algunos desafos
bsicos para la prueba de hiptesis. En los captulos 7 y 8 tocaremos otros temas relacionados con
aspectos de la prueba de hiptesis que ensearemos en esos captulos.
Antes de exponer esta controversia, queremos asegurar al alumno que no est aprendiendo la
prueba de hiptesis intilmente. No importa lo que suceda en el futuro, ya que es absolutamente
necesario comprender la prueba de hiptesis para poder encontrar el sentido de todas las publica
ciones cientficas publicadas en el pasado. Ms an, a pesar de la vehemente controversia que ha
surgido en los ltimos aos, es sumamente extrao ver nuevas publicaciones que no utilicen la
prueba de significacin, por lo que resulta dudoso que ocurra algn cambio importante en un futu
ro cercano. Finalmente, aun si se abandonara por completo la prueba de hiptesis, las alternativas
(que involcucran procedimientos que ensearemos en los captulos 7 y 8) requieren la compren
sin de prcticamente toda la lgica y de todos los procedimientos que tratamos aqu.
Cul es entonces la gran controversia? Algunos puntos del debate estn relacionados con su
tiles temas de lgica. Por ejemplo, una postura plantea si tiene sentido preocuparse por rechazar
la hiptesis nula cuando es extremadamente improbable que resulte verdadera una hiptesis que
supone que no se produce ningn tipo de efecto. Tratamos este tema brevemente en el cuadro 6-1.
Otro de los temas est relacionado con los fundamentos de la prueba de hiptesis en relacin
con las poblaciones y las muestras, debido a que en la mayora de los experimentos las muestras
que utilizamos de la poblacin definible no son seleccionadas de manera aleatoria. En el captulo
5 tratamos algunos puntos relacionados con este tema. Finalmente, algunos han cuestionado lo
adecuado de llegar a la conclusin de que si la informacin es inconsistente con la hiptesis nula,
esto debe ser considerado como evidencia de la hiptesis de investigacin. Esta controversia es
bastante tcnica, pero nuestra propia opinin es que lo que estamos haciendo es razonable, con
forme a recientes consideraciones sobre estos temas, (vase, p. ej. Cortina & Dunlop, 1997).
De todos modos, la queja ms considerada contraas pruebas de significacin, y que ha obte
nido el acuerdo prcticamente universal, es que las pruebas estn mal utilizadas. De hecho, los
opositores de las pruebas de significacin sostienen que aun si no existieran otros inconvenientes
con respecto a las pruebas, stas deberan ser prohibidas, simplemente por ser utilizadas con tan
ta frecuencia de un modo tan inadecuado. Son dos los casos de pruebas que se utilizan inadecua
damente, Una podemos analizarla ahora, la otra deber esperar hasta que hayamos tratado un
tema que ensearemos en el captulo 8.
Uno de los principales usos inapropiados de las pruebas es la tendencia de los investigadores
a decidir que, si un resultado no es significativo, queda demostrado que la hiptesis nula es verda

dera, Repetidamente hemos subrayado que cuando no se rechaza la hiptesis nula, los resultados
no son concluyentes. El error de llegar a la conclusin de que la hiptesis nula es verdadera, debi
do a la imposibilidad de rechazarla, es extremadamente serio, ya que pueden considerarse falsos
importantes mtodos y teoras slo porque determinado estudio no logr resultados lo suficiente
mente fuertes. (Como veremos en el captulo 8, es bastante fcil que una hiptesis de investiga
cin verdadera no resulte signicativa slo porque el estudio se realiz con pocas personas o
porque las medidas no eran muy precisas. De hecho, Hunter (1997) sostiene que en aproximada
mente el 60% de los estudios psicolgicos es probable que obtengamos resultados no significati
vos aun cuando la hiptesis de investigacin sea realmente verdadera).
Cul es entonces la solucin? El consenso general parece determinar que deberamos man
tener las pruebas de significacin, pero preparando mejor a nuestros alumnos para que no las uti
licen de manera inadecuada (a esto se debe que se haya hecho tanto hincapi en esos temas a lo
largo del libro), es decir que deberamos cuidamos de no perder una herramienta valiosa slo por
que no se a utilice en manera adecuada. Con el fin de tratar esta controversia, la a p a estableci un
comit formado por eminentes psiclogos renombrados por su experiencia en estadstica. En el
informe provisorio del Cuerpo de trabajo sobre inferencia estadstica [Task Force on Statistical
Inference] de la a p a (1996), llegaron a la siguiente conclusin:
Respaldamos una poltica de inclusin que admita en el arsenal del cientfico de investigacin
cualquier procedimiento que apropiadamente arroje algo de luz sobre el fenmeno de inters. En
este sentido, el Cuerpo de Trabajo no respalda ninguna accin que pueda ser interpretada como
prohibicin del uso de la prueba de significacin de la hiptesis nula o de los valores p en investi
gaciones y publicaciones psicolgicas, (p. 2)

LA PRUEBA DE HIPTESIS SEGN SE DESCRIBE


EN LAS PUBLICACIONES CIENTFICAS
En lneas generales, las pruebas de hiptesis aparecen en las publicaciones cientficas como parte
de uno de los procedimientos estadsticos especficos que ensearemos en captulos posteriores.
Para cada resultado de inters el investigador usualmente indica primero si el resultado fue esta
dsticamente significativo. Luego, por lo general el investigador da el nombre de la tcnica espe
cfica utilizada para determinar las probabilidades, como puede ser una prueba t, 6 F, %2
(tratadas en los captulos 9 al 14). Finalmente, indica el nivel de significacin, como por ejemplo
><0,05 ><0,01.
Reber y Kotovsky (1997), en un estudio acerca de la resolucin de problemas, describieron
uno de sus resultados comparando un grupo especfico de participantes dentro del grupo de con
trol general. Lo hicieron de la siguiente manera: Este grupo necesit un promedio de 179 movi
mientos para resolver el rompecabezas, mientras que el resto de los participantes de control
necesitaron un promedio de 74 movimientos, r(19) = 3,31, p<0,01 (p. 183). Cuando los investi
gadores escriben ><0,01, quieren decir que si la hiptesis nula fuera verdadera la probabilidad
de sus resultados sera menor a 0,01 (1%).
Como observamos anteriormente, la mayora de los psiclogos sostienen que un resultado
debera tener una probabilidad menor al 5% ><0,05) para ser significativo. Por el otro lado, si un
resultado se acerca, pero realmente no llega al nivel de significacin del 5%, de todos modos pue
de ser informado como "tendencia casi significativa o como casi significativo, con ><0,10.
Aun cuando un resultado sea claramente no significativo, de todos modos puede figurar el nivel p

real (por ejemplo, > = 0,27), o se puede utilizar la abreviatura N$, (por no significativo). Ade
ms, por lo general tambin se indicar si se utiliz una prueba de una cola. Como dijimos ante
riormente, salvo que se indique lo contrario, al leer publicaciones cientficas se supone que se
utiliz una prueba de dos colas.
Aun cuando el investigador haya elegido previamente el nivel de significacin, como por
ejemplo 0,05, pueden indicarse los casos en los que los resultados cumplen con estndares ms ri
gurosos. (Se supone que esto debe impresionar al lector). Por eso, en la misma publicacin pode
mos encontrarnos, por ejemplo, con resultados en ios cuales se indica p<0,05, y en otros
pcO.Oi, e incluso en otros p < 0 ,0 0 r\
Finalmente, en muchos casos los resultados de la prueba de hiptesis se muestran slo como
asteriscos en una tabla de resultados. En esas tablas, un resultado con un asterisco es significativo,
mientras que un resultado sin asterisco no lo es. Por ejemplo, la tabla 6-1 presenta los resultados
de una parte de un estudio realizado por Stipek y Ryan (1997), el cual compara alumnos de jardn de
infantes de condicin socioeconmica baja con otros econmicamente privilegiados. La tabla nos
proporciona las cifras correspondientes a variables medidas a travs de la observacin de nios en
el aula, e incluye las medias, los desvos estndar y el estadstico F (una indicacin del procedi
miento utilizado en este estudio para probar la significacin, procedimiento que trataremos en los
captulos 11 al 13). Lo que resulta importante observar en la tabla, para los fines que estamos tra
tando, son los asteriscos (y las notas correspondientes en la parte inferior de la tabla) que indican
los niveles de significacin de las distintas medidas. Podemos ver, por ejemplo, con respecto al de
seo de demostrar los logros, que los nios de bajo nivel socioeconmico (M ~ 0,20) marcaron re
gistros significativamente mayores a los de los nios econmicamente privilegiados (M = 0,04).
En el caso de sonre despus de terminar la tarea el patrn fue lo contrario.
No obstante, podemos observar que en cuanto a hacer comparaciones sociales positivas no
hubo diferencias significativas entre ios grupos (ias medias fueron 0,71 y 0,61, pero no fueron lo
suficientemente diferentes como para resultar significativas en este estudio). Por eso, no pode
mos concluir que en alumnos de jardn de infantes una mala condicin econmica tenga alguna
relacin con haber realizado comparaciones sociales positivas. Tambin sera equivocado llegar
a la conclusin de que una mala situacin econmica no tiene ninguna relacin con realizar
comparaciones sociales positivas. Como dijimos anteriormente, cuando un resultado no es lo su
ficientemente fuerte como para que se rechace la hiptesis nula, normalmente la mejor conclu
sin es que los resultados no son concluyentes.
Cabe mencionar que en todos estos ejemplos, los investigadores por lo general no hacen expl
cita la hiptesis de investigacin o a hiptesis nula, ni tampoco describen ninguno de los otros pa
sos del proceso en detalle. Se supone que el lector comprende perfectamente todo el proceso.

RESUMEN
La idea bsica de una prueba de hiptesis es analizar la probabilidad de que el resultado de un es
tudio pudiera haber sucedido aun si a situacin real implicase que el procedimiento experimental
no produjo ninguna diferencia. Si la probabilidad es baja, se rechaza el escenario de la no diferen
cia, y se sostiene la teora a partir de a cual surgi el procedimiento experimental La expectativa
de una diferencia es la hiptesis de investigacin, y la situacin imaginaria en la que no existe
ninguna diferencia se denomina hiptesis nula. Cuando un resultado fuera muy inverosmil, si la
hiptesis nula fuera verdadera; entonces se rechaza la hiptesis nula y se sostiene la hiptesis de

Tabla 6-1.
Valores medios de variables observadas en clase, relacionadas con la motivacin segn la situacin
socioeconmica.
C o n d ic i n

P riv ile g ia d o s

so cio e c o n m ica b a ja
V ariable d e m o tiv a ci n
D esea demostrar sus logros
Sonre despus de terminar la tarea
C om paracin social positiva
C om paracin social negativa
C om entarios sobre com petencia
B u sca ayuda
Incum plim iento
D iscip lina
Tristeza
Aburrimiento
Frustracin
N iv el d e esfuerzo

SD

SD

0 ,2 0
0 ,1 4
0,71
0,12
4 ,1 4
0,01
0,12
0 ,1 0
1,03
1,05
1,03
1,34

0,51
0,42
0,45
0,34
1,83
0 ,1 0
0,35
0,30
0,17
0,21
0 ,1 7
0,93

0,04
0,05
0,64
0 ,3 6
5,74
0,09
0,13
0 ,1 6
1,02
1,29
1,03
1,36

0 ,2 0
0 ,2 2
0,48
0 ,4 8
1,78
0,33
0 ,5 3
0 ,4 7
0 ,1 4
0 ,4 6
0,17
0,95

F ( l, 195)
9,94**
4,49*
0,01
2 1 ,24****
2 5 ,39****
5,14*
0,07
2 ,2 6
0,15
2 5 2 9 ***
0,02
0,28

< 0 ,0 5 ; * * p < 0,01; * * * p < 0,001; ****/> < 0,0001.


Fuente: Stipek, D,
& Ryan, R. H. (1997), tab. 4. Alumnos de jardn de infantes con desventajas econmicas: listos
para aprender pero con un camino ms largo para recorrer. P sic o lo g a d e l D e sa rro llo [ D e ve lo p m e n ta l P sy ch o lo g y],
33, 71 1 -7 2 3 . Copyright, 1997, por la A sociacin Americana de Psicologa [American Psychological Association],
Reimpreso con autorizacin.

investigacin. Si los resultados obtenidos no son muy extremos, se dice que el estudio no fue con
cluyente.
Los psiclogos usuaimente consideran un resultado como muy extremo si presenta menos de
un 5% de posibilidades, aunque algunas veces se utiliza un corte ms riguroso, del 1%. Estos por
centajes pueden aplicarse a la probabilidad de que un resultado sea extremo en una direccin pre
dicha (prueba direccional o de una cola), o a la probabilidad de que sea extremo en cualquiera de
las dos direcciones posibles (prueba no direccional o de dos colas). Para aplicar una poltica ms
conservadora, los psiclogos utilizan con frecuencia las pruebas de dos colas aun cuando ya ten
gan una prediccin especfica.
El proceso de prueba de hiptesis involucra cinco pasos:
1. Replantear el problema en funcin de la hiptesis de investigacin e hiptesis nula de las
poblaciones.
2. Determinar las caractersticas de la distribucin comparativa.
3. Determinar el punto muestra! de corte en la distribucin comparativa, a partir del cual de
bera rechazarse la hiptesis nula.
4. Determinar el valor muestral en la distribucin comparativa.
5. Comparar los valores de los pasos 3 y 4 para decidir si se rechaza o no la hiptesis nula.
Una gran controversia ha surgido recientemente con respecto a las pruebas de significacin.
Los crticos han planteado cuestiones sobre la lgica bsica de estas pruebas. Sin embargo, la
principal crtica plantea que, con mucha frecuencia, las pruebas son mal utilizadas. Una manera

que tienen ios investigadores para utilizar inadecuadamente las pruebas es interpretando que el no
rechazo de la hiptesis nula implica sostenerla.
En general, las publicaciones cientficas informan los resultados de la prueba de hiptesis in
dicando si fueron o no significativas y mostrando el nivel de corte de la probabilidad (general
mente del 5% 1%) segn el cual fue tomada la decisin.

Trminos Clave
Distribucin comparativa.
Niveles convencionales de
significacin (p<O,O5,.p<O,01).
Punto muestral de corte .

- Hiptesis direccional.
- Prueba de hiptesis.
- Hiptesis no direccional.
- hiptesis nula.

- Prueba de una cola.


- Hiptesis de investigacin.
- Estadsticamente significativo.
- Prueba de dos colas.

Ejercicios

2. Lea atentamente los tres puntos que


aparecen a continuacin y, a) indique cules
son las dos poblaciones que se comparan, b)
establezca la hiptesis de investigacin, c) es
tablezca la hiptesis nula y d) determine si se
debera utilizar una prueba de una o dos colas y
por qu.
i)
Los nios canadienses hijos de bibliot
carios tienen una mayor habilidad para la lec
tura que los nios canadienses en general?
n) El nivel de ingreso de los residentes de
determinada ciudad es diferente del nivel
de ingresos de los habitantes de la regin?
m) Las personas que han sufrido la expe
riencia de un terremoto tienen ms o menos
confianza en s mismas que la poblacin en ge
neral?
3. Basndose en ia informacin obtenida
de cada uno de los siguientes estudios, deter
mine si se rechaza o no ia hiptesis nula. En
cada caso, determine: a) la puntuacin Z de cor
SERIE I
te en la distribucin comparativa, a partir de
1,
Defina ios siguientes trminos utilizan
do sus propias palabras: a) hiptesis de investi la que debera rechazarse la hiptesis nula; b) la
gacin, b) hiptesis nula, c) procedimiento de puntuacin Z muestral en la distribucin compa
prueba de hiptesis, d) distribucin comparati rativa, y c) su conclusin. (Suponga que to
va, e) nivel de significacin 0,05, y f) prueba das las poblaciones estn normalmente dis
de una cola.
tribuidas).
Los ejercicios implican la realizacin de clcu
los (con la ayuda de una calculadora). La ma
yora de los problemas estadsticos reales se
resuelven por computadora, pero aunque exis
ta la posibilidad de utilizarla, es conveniente
realizar estos ejercicios manualmente para in
corporar el mtodo de trabajo.
Para adquirir prctica en la utilizacin de
una computadora, para resolver problemas es
tadsticos, se puede utilizar la seccin de com
putacin de cada captulo, publicada en la
Gua de estudio y libro de tareas de computa
cin para el alumno [Student's Study Guide
and Computer WorkbookJ que acompaa este
libro.
Todos los datos de esta seccin son ficti
cios (a menos que se especifique lo contrario).
Las respuestas a los ejercicios de la serie I
se encuentran al final del libro.

Registro
Colas
Estudio Poblacin muestra! p de la prueba
A
B
C
D
E
F
G
H
I

M'
10
10
10
10
10
10
10
12
12

CF

2
2
2
2
4
1
2
2
2

14
14
14
14
14
14
16
16
8

0,05
0,05
0,01
0,01
0,05
0,01
0,01
0,01
0,05

1 (prediccin alta)
2
1 ( prediccin alta)
2
1 ( prediccin alta)
2
2
2
1 { prediccin baja)

4, Una psicloga interesada en ios sentidos


del gusto y del olfato ha realizado una serie ex
tensiva de estudios en los que hace probar a
alumnos universitarios 20 tipos de alimentos
diferentes (damasco, chocolate, cereza, caf,
ajo, y otros). Cada alimento se suministra en
forma de gota que se vierte spbre la lengua. De
toda la poblacin de alumnos de la universi
dad, la cantidad media que los alumnos pueden
identificar correctamente entre estos 20 ali
mentos es 14, con un desvo estndar de 4. (Su
pongamos que todos los alumnos de esa
facultad son examinados como parte de una in
vestigacin mdica al comienzo de cada ao).
La psicloga tiene razones para creer que la
precisin de las personas, en esta prueba, est
ms relacionada con el olfato que con el gusto.
Por lo tanto, establece procedimientos especia
les que impiden utilizar el sentido del olfato
durante la prueba. Luego, la psicloga prueba
el procedimiento en un alumno seleccionado al
azar. El alumno identifica correctamente slo 5
alimentos. Utilizando el nivel de significacin
0,05, qu conclusin debera sacar la investi
gadora? Resuelva este problema utilizando ex
plcitamente los cinco pasos de la prueba de
hiptesis. Luego explique su respuesta a al
guien que nunca ha asistido a un curso de esta
dstica (pero que est familiarizado con los
conceptos de media, desvo estndar y puntua
ciones Z).
5. Un psiclogo est trabajando con perso
nas que han tenido un tipo particular de ciruga

mayor. El psiclogo propone la teora de que


una persona se recuperar ms rpido de la
operacin si los amigos y la familia estn en
la habitacin con el paciente durante las prime
ras 48 horas siguientes a la operacin. Se sabe
(en este ejemplo ficticio) que el tiempo de re
cuperacin est distribuido normalmente con
una media de 12 das y un desvo estndar de 5
das. El procedimiento se prueba con un pa
ciente seleccionado al azar, que se recupera en
18 das. Utilizando el nivel de significacin
0,01, qu conclusin debera sacar el investi
gador? Resuelva este problema utilizando ex
plcitamente los cinco pasos de la prueba de
hiptesis. Luego explique su respuesta a al
guien que nunca ha asistido a un curso de esta
dstica (pero que est familiarizado con los
conceptos de media, desvo estndar y puntua
ciones Z).
6.
Robins y John (1997) realizaron un es
tudio sobre el narcisismo (egolatra), en el que
se comparaban individuos que haban tenido
valores altos con individuos que haban obteni
do valores bajos (con tems tales como: Si yo
gobernara el mundo, ste sera un lugar me
jor). Tambin realizaban algunas otras pre
guntas, incluyendo un tem en el que se
preguntaba a los participantes cuntas veces se
miraban al espejo en un da tpico. Al informar
sobre los resultados, los investigadores obser
varon:
... tal c o m o s e hab a predicho, lo s in d ivi
d u o s c o n un a lto grado d e n arcisism o in
form aron q u e s e m iraban a l e sp e jo c o n
m s fr e cu en cia q u e lo s in d iv id u o s c o n un
bajo n iv e l d e n a rcisism o (A is = 5 ,7 vs
4 ,8 ).., p<Q ,05" (p. 39).

Explique este resultado a una persona que nunca


ha asistido a un curso de estadstica. (Concntre
se en el significado del resultado en cuanto a
la lgica general de la prueba de hiptesis y a la
significacin estadstica).

SERIE II
L Enumere los pasos del proceso de prue
ba de hiptesis y explique el procedimiento y
los.fundamentos de cada uno.

4. Un investigador ha descubierto que cier


2. Para cada uno de los puntos que se deta
llan a continuacin, a) indique cules son las tos sonidos hacen a las ratas mucho ms agre
dos poblaciones que se comparan, b) determine sivas, y predice que los sonidos tambin dis
la hiptesis de investigacin, c) determine la hi minuirn sus desempeos en cuanto a tareas de
ptesis nula y d) explique si se debera utilizar aprendizaje. Supongamos que se sabe que una
rata promedio, ordinaria, puede aprender a co
una prueba de una o dos colas y por qu.
rrer correctamente en un determinado laberin
0
En un experimento, se dan instrucciones
a los participantes para que resuelvan un pro to en 18 pruebas, con un desvo estndar de 6.
blema concentrndose en los detalles. Es di El investigador, entonces, prueba una rata or
ferente la velocidad con 3a que resuelven el dinaria en el laberinto, pero hacindole escu
problema las personas que han recibido tales char el sonido. La rata necesita 38 intentos
instrucciones, en comparacin con las perso para aprender el laberinto. Utilizando el nivel
nas a las que no se les ha dado ninguna instruc 0,05, qu conclusin debera sacar el investi
gador? Resuelva este problema utilizando ex
cin especial?
plcitamente ios cinco pasos de la prueba de
li) A partir de informes antropolgicos en
hiptesis. Luego explique su respuesta a al
los que se registra la condicin social de la
guien que nunca ha asistido a un curso de es
mujer en una escala de 10 puntos, se conocen
tadstica (pero que est familiarizado con los
la media y el desvo estndar en muchas cultu conceptos de media, desvo estndar y puntua
ras. Se descubre una nueva cultura en la que cin Z).
existe una organizacin familiar inusual. Tam
5. Un psiclogo especializado en temas de
bin se clasifica la condicin social de la mu familia ha desarrollado un elaborado progra
jer en esta cultura. Las culturas con una or- ma de capacitacin para contribuir a la adapta
organizacin familiar inusual brindan a la mujer cin de hombres sin hijos casados con mujeres
una condicin social ms elevada que ia$ cul con hijos adolescentes. Supongamos que se
turas en general?
sabe, a partir de investigaciones previas, que
m) Las personas que viven en grandes estos hombres, un mes despus de mudarse,
ciudades sufren ms enfermedades relaciona con la nueva esposa y sus hijos, sufren un ni
das con el estrs que las personas en general? vel de estrs de 85 con un desvo estndar de
3. A partir de la informacin correspon 15. Como experimento piloto, se prueba el
diente a cada uno de ios siguientes estudios, programa de capacitacin en un hombre selec
determine si se rechaza o no la hiptesis nula. cionado al azar de entre todos aquellos en de
En cada caso, establezca a) la puntuacin Z de terminada ciudad que, durante el mes anterior,
corte en la distribucin comparativa a partir de se haban casado con una mujer con un hijo
la cual debera rechazarse la hiptesis nula; b) adolescente. Despus del programa de capaci
la puntuacin Z muestral en la distribucin tacin, el nivel de estrs de ese hombre es 60.
comparativa, y c) su conclusin. (Suponga que Utilizando el nivel 0,05, qu conclusin de
todas las poblaciones estn normalmente dis bera sacar el investigador? Resuelva este pro
blema utilizando explcitamente los cinco
tribuidas).
pasos de la prueba de hiptesis. Luego expli
O bservacin
C olas
que su respuesta a alguien que nunca ha asisti
E studio Poblacin m uestra! p
de la p r u e b a
do a un curso de estadstica (pero que est
familiarizado
con los conceptos de media,
cr
Hdesvo estndar y puntuacin Z).
1 (prediccin baja)
A
8 0 0,05
100,0 10,0
2
B
74,3 11,8
80 0,01
. En una publicacin acerca de las campa
1 (prediccin baja)
L2
C
1 6 ,9
80 0,0 5
as en contra del tabaco, realizado en Massa2
80 0,05
D
88,1 12,7
chussetts en 1993 y 1995, Siegel y Biener

(1997) exponen los resultados de una encuesta


sobre e l consumo de tabaco y las distintas acti
tudes. La tabla 6-2 muestra ios resultados de
esta encuesta. Concentrndose slo en la pri
mera lnea (porcentaje que fuma > 25 por da),

explique qu significa el resultado a una perso


na que nunca ha asistido a un curso de estadsti
ca. (Concntrese en el significado del resultado
en cuanto a la lgica general de la prueba de hi
ptesis y a la significacin estadstica).

Tabla 6-2.
Algunos indicadores dei cambio en ei consumo de tabaco, exposicin ai e t s 3 , y actitudes del pblico
hacia las polticas de control de tabaco, Massachussetts, 1993-1995.

C o m p o r ta m ie n to d e fu m a d o res a d u lto s
Porcentaje que fuma > 25 cigarrillos diarios
Porcentaje que fum a < 1 5 cigarrillos diarios
Porcentaje que fuma antes de tra n scu rrid o s 3 0 m inutos de despertarse
E x p o sici n a l h u m o d e ta b a co en el a m b ien te
Porcentaje de trabajadores que inform an sobre
un lugar de trabajo en e l que no se fuma
M edia de horas de exposicin al ets en el trabajo
durante la sem ana anterior
Porcentaje de hogares en los que est prohibido fumar
A c titu d e s h a c ia las p o ltic a s de co n tro l del ta b a co
Porcentaje que apoya un m ayor aum ento de im puestos al tabaco
asignando lo s fondos al control del tabaco
Porcentaje que cree que la exposicin al ets es perjudicial
Porcentaje que apoya la prohibicin
de las mquinas expendedoras
Porcentaje que apoya la prohibicin del patrocinio de deportes
y eventos culturales por parte de las com paas d e tabaco

1993

1995

24
31
54

10*
49*
41

53

65*

4,2

2,3'

41

51*

78

81

90
54

84
64*

59

53*

Fuente: Biener y Romn, 1996.


*p < 0 ,0 5 .

Fuente; Siegei, M,, & Biener, L. (1997), tab. 4. Evaluacin del impacto de las campaas estatales contra el tabaco:
programas de control dei tabaco de Massachusetts y California. R evista C ien tfica d e A su n to s S o c ia le s { J o u rn a l o f S o
c ia l ssites ], 5 3 ,1 4 7 -1 6 8 . Copyright 1997 por la Sociedad para el Estudio Psicolgico de Asuntos Sociales [Society
for the Psychoiogical Stucly o f Social Issues], Reimpreso con Autorizacin.

Pruebas
de hipnosis
con medias
maestrales

V Desvo estndar de ia distribucin .


La distribucin de medias.
de la media muestral, pruebas de
Creacin de una distribucin de medias.
hiptesis sobre la media e intervalos
Caractersticas de una distribucin
de confianza segn se describen
de medias.

en publicaciones cientficas.
' Prueba de hiptesis sobre la distribucin > Resumen.''
demedias...
Trminos clave.
Estimacin e intervalos de confianza.
Ejercicios.
Controversias y limitaciones: Intervalos
de confianza o pruebas de significacin?

n el captulo 6 presentamos la lgica bsica de la prueba de hiptesis. Utilizamos


como ejemplos estudios en los que la muestra estaba formada por un slo individuo.
Sin embargo, cmo sealamos anteriormente, en la prctica, la investigacin psico
lgica usualmente utiliza muestras integradas por muchos individuos. En este cap
tulo nos basamos en lo aprendido hasta ahora y analizamos la prueba de hiptesis
con muestras de ms de un individuo, lo cual requiere, principalmente, analizar con cierto detalle
lo que denominamos distribucin de medias.

LA DISTRIBUCIN DE MEDIAS
La prueba de hiptesis en condiciones normales de investigacin, cuando se analiza una muestra
formada por muchos individuos, es exactamente igual a lo que hemos aprendido en el captulo 6,
con una importante excepcin. Cuando hay ms de una persona en la muestra surge un problema
especfico en e paso 2, al determinar las caractersticas de la distribucin comparativa. l proble
ma es que el valor muestral que nos interesa es la media del grupo de valores. Las distribuciones
comparativas que hemos estado analizando hasta ahora han sido distribuciones poblacionales de
valores individuales (por ejemplo, las edades en que cada beb en particular comienza a caminar
o la poblacin de valores individuales a partir de un cuestionario para medir el nivel de felicidad).
Comparar la media de una muestra de, digamos, 50 individuos con una distribucin de valores in
dividuales constituye una comparacin desigual, como comparar manzanas y naranjas. En cam
bio, cuando lo que nos interesa es la media de una muestra de 50, necesitamos una distribucin
comparativa formada por medias de muestras de 50 valores. A esta distribucin comparativa la
denominaremos distribucin de medias.
Para expresarlo ms formalmente, una distribucin de medias es una distribucin formada
por las medias de cada una de las numerosas muestras del mismo tamao seleccionadas al azar
entre la misma poblacin de individuos. (Los estadsticos tambin llaman a esta distribucin de
medias una distribucin en el muestreo de la media; sin embargo, en este libro utilizamos el
trmino distribucin de medias para que quede claro que estamos hablando de poblaciones y no
de muestras o distribuciones de frecuencias de una muestra).

La distribucin de medias es la distribucin comparativa adecuada cuando la muestra est


formada por ms de una persona. Por eso, en la mayora de las investigaciones resulta necesario
determinar las caractersticas de esa distribucin para poder realizar el paso 2 del procedimien
to de prueba de hiptesis.

CREACION DE

UNA DISTRIBUCION DE MEDAS

Podremos comprender mejor la idea de una distribucin de medias analizando cmo construir tal
distribucin a partir de una distribucin ordinaria de individuos. Supongamos que nuestra pobla
cin estaba compuesta por alumnos de grados elementales e inferiores -de determinada regincuya poblacin total es de 90.000 nios. Supongamos, adems (para que el ejemplo sea simple),
que hay exactamente 10.000 nios en cada grado, desde el primero hasta el noveno. La distribu
cin de poblacin sera rectangular, con una media de 5, una varianza de 6,67 y un desvo estn
dar de 2,58 (vase figura 7-1).
Supongamos que luego escribiramos el grado al que pertenece cada nio en una pelotita de
ping pong y que pusiramos las 90.000 pelottas plsticas en un recipiente gigante. El recipiente
contendra 10.000 pelottas con un nmero 1 escrito en ellas, 10.000 con un nmero 2, y as suce
sivamente. Mezclamos las pelottas en el recipiente, y luego extraemos dos, es decir, se extrae una
muestra aleatoria de dos pelottas. Supongamos que una pelotita tiene un nmero 2 y la otra tiene
un nmero 9. En ese caso, el grado medio de la muestra formada por el grado al que pertenecen
dos de los nios es 5,5, es decir, el promedio de 2 y 9. Entonces, volvemos a poner las pelottas en
el recipiente, mezclamos todas las pelottas, y seleccionamos otra vez dos peiotitas. Puede ser que
esta vez extraigamos dos cuatros, siendo 4 la media de la segunda muestra. Despus volvemos a
realizar el procedimiento, y en esa oportunidad extraemos un 2 y un 7, siendo a media 4,5. Hasta
aqu tenemos tres medias: 5,5,4 y 4,5.
Los tres nmeros mencionados en el prrafo anterior (cada uno de ellos es la media de una
muestra formada por los grados a los que pertenecen dos nios de escuela) pueden considerarse
una pequea distribucin en s misma. La media de esta pequea distribucin de tres nmeros es
4,67 (la suma de 5,5,4 y 4,5, dividida por 3); la varianza de esa distribucin es 0,39 (la varianza
de 5,5,4 y 4,5) y el desvo estndar es 0,62 (la raz cuadrada de 0,39). La figura 7-2 representa un
histograma de esta distribucin de tres medias.
Si continuramos con el proceso, el histograma de medias continuara creciendo. La figura
7~3a representa un ejemplo despus de seleccionar 10 muestras aleatorias de dos peiotitas cada

= 4 ,6 Z .
SD2. - 0,39.

' -M

5 0 = 0,62.

..5 /

'

0
L

2 '3

'

.4,

.5

Grado'.

Figura 7 -1 . D istrib u cin d e l grado d e 9 0 .0 0 0


e sc o la r e s (d atos fic ticio s).

Gr do'

ri-.'': t 7

; ': '

.9
F ig u r a 7 -2 . D istrib u cin de m ed ia s d e tres
m uestras aleatorias de lo s grados a lo s qu e
perten ecen dos e sc o la r e s, extradas de una
p o b la ci n conform ad a por lo s grados a los qu e
concurren 9 0 .0 0 0 e sc o la r e s (d atos fic ticio s).

una. La figura 7~3b representa el histograma de la distribucin de medias despus de seleccionar


20 muestras aleatorias de dos registros cada una. Despus de seleccionar 100 muestras aleatorias,
el histograma de la distribucin de medias podra verse como la figura 7-3c; despus de 1.000, co
mo la figura 7-3d. (En realidad, en lugar de utilizar 90.000 pelotitas de ping pong y un recipiente
gigante, creamos los histogramas de la figura 7-3 por medio de una computadora que realiz las
selecciones aleatorias).

Figura 7-3. Distribuciones de medias de muestras aleatorias de dos pelotitas cada una, extradas de una
poblacin de 90.000 pelotitas, de las cuales, cada 10.000, llevaban uno de los nmeros del 1 al 9. Las casti
dades de medias mustrales que incluye cada distribucin son (a) 10 medias mustrales, (b) 20 medias
mustrales, (c) 100 medias mustrales y (d) 1.000 medias mustrales. (El muestreo real fue simulado por
computadora).

En la prctica, los investigadores casi nunca tienen la oportunidad de seleccionar muchas


muestras diferentes de una poblacin. Lleva mucho trabajo poder lograr una sola muestra y estu
diar a la gente que la conforma. Sin embargo, afortunadamente podemos determinar las caracte
rsticas de una distribucin de muestras en forma directa utilizando algunas reglas simples, sin
necesidad de seleccionar siquiera una sola muestra. La nica informacin que necesitamos es: a)
caractersticas de la distribucin de ia poblacin de individuos y b) tamao de cada muestra. (Por
ahora no nos preocuparemos por cmo podramos conocer las caractersticas de la poblacin de
individuos). El trabajoso mtodo de construir una distribucin de medias en la forma que acaba
mos de hacerlo y el mtodo conciso que aprenderemos muy pronto, tienen el mismo resultado.
Hemos analizado el proceso de ese modo meticuloso slo porque sto ayuda a comprender el
concepto de una distribucin de medias.

CARACTERSTICAS DE UNA DISTRIBUCIN DE MEDIAS


Observemos tres temas relacionados con la distribucin de medias que construimos segn nues
tro ejemplo (segn aparece en la figura 7-3):
1. La media de la distribucin de medias result ser aproximadamente igual a la media de la
poblacin original formada por los grados individuales, de la cual se extrajeron las muestras (en
ambos casos la media fue 5).
2. La dispersin de la distribucin de medias result ser menor que la dispersin de la distri
bucin poblacional de la cual se extrajeron las muestras.
3. La forma de la distribucin de medias result ser aproximadamente normal (o al menos
unimodal y simtrica).
Sucede que los dos primeros de ios tres puntos anteriores son ciertos para todas las distribu
ciones de medias, y el tercero es cierto para la mayora de ellas.
Estos tres vnculos entre la distribucin de medias y la poblacin de individuos constituyen
los fundamentos de una serie de reglas simples que nos permiten determinar la media, la varianza
y la forma de una distribucin de medias sin tener que escribir en pelotitas plsticas ni seleccionar
interminables muestras, Las tres reglas, que pronto volveremos a analizar, se basan en el teorema
del lmite central, un principio fundamental en estadstica matemtica que ya hemos menciona
do en el captulo 5.
Analicemos ahora las tres reglas,

Regla 1: determinacin de la media de una distribucin de medias


La primera regla establece que la media de una distribucin de medias es igual a la media de la
poblacin de individuos de la cual se extrajeron las muestras. Cada muestra se basa en valores
seleccionados al azar de la poblacin de individuos. As, a veces, la media de una muestra ser
mayor que la media de toda la poblacin de individuos y, otras veces la media de una muestra
ser menor que la media de toda la poblacin de individuos. Sin embargo, no existe razn para
que las medias de estas muestras tiendan a ser consistentemente mayores o menores, en su con
junto, que la media de la poblacin de individuos. Si se seleccionan suficientes muestras, las me
dias altas y las medias bajas se equilibran entre s.
Podemos ver en la figura 7-3 que con un gran nmero de muestras, la media de la distribucin
de medias se toma muy similar a la media de la poblacin de individuos, que en este caso era 5. S
hubiramos mostrado un ejemplo con 10.000 medias mustrales, hubiramos estado an ms cer

ca del 5.-Se puede probar matemticamente que si tomramos una cantidad infinita de muestras,
la media de la distribucin de medias de estas muestras resultara ser exactamente igual a la me
dia de la distribucin de individuos.

Regla 2: determinacin de la varianza de una distribucin de medias


La figura 7-3 tambin muestra que una distribucin de medias estar menos dispersa que la po
blacin de individuos de la que se extrajeron las muestras. La razn es la siguiente: en una mues
tra aleatoria cualquier valor tiene posibilidades de ser seleccionado, incluso un valor extremo,
pero la posibilidad de seleccionar dos valores extremos en la misma muestra aleatoria es menor.
Ms an, para crear una media muestral extrema, los dos valores extremos tendran que serlo en
la misma direccin. Por lo tanto, aumentar las cantidades produce un efecto moderador. En cual
quier muestra, los extremos tienden a ser equilibrados por los valores centrales o por extremos en
la direccin opuesta. Esto hace que cada media muestral tienda hacia los valores centrales y se
aleje de los extremos. Habiendo menos medias extremas, la varianza de las medias es menor.
Analicemos nuestro ejemplo. En la poblacin hay muchos unos y nueves que crean una can
tidad considerable de dispersin. Es decir, si extrajramos muestras formadas por un slo valor,
aproximadamente una novena parte de las veces obtendramos un 1, y aproximadamente una no
vena parte de las veces obtendramos un 9. Sin embargo, si seleccionramos muestras de dos re
gistros por vez, obtendramos una muestra con una meda de 1 (es decir, en la que ambas pelotitas
fueran unos) o una media de 9 (en la que am bas pelotitas fueran nueves) con mucha menos fre
cuencia, ya que hay ms chances de obtener dos pelotitas que promedien un valor medio como el
5. (Esto se debe a que existen varias combinaciones que podran dar ese resultado: un 1 y un 9, un
2 y un 8, un 3 y un 7, un 4 y un 6 y dos 5).
Cuantos ms valores haya en cada muestra, menos dispersa ser la distribucin de medias
de esas muestras, ya que, con varios valores en cada muestra, es an ms extrao que los valo
res extremos de cualquier muestra no sean equilibrados por valores centrales o extremos en
otra direccin. Con respecto al ejemplo de las pelotitas de plstico, vimos que era bastante im
probable obtener una media de tomando muestras de dos pelotitas a la vez. Si seleccionra
mos tres pelotitas a la vez, obtener una muestra con una media de 1 (las tres pelotitas deberan
ser unos) sera an menos probable. Se hace cada vez ms probable la obtencin de medias con
valores centrales.
En nuestro ejemplo, utilizando muestras de dos pelotitas cada una, la varianza de la distribu
cin de medias ser aproximadamente 3,33, que equivale a la mitad de la varianza de la poblacin
de pelotitas individuales, que era de 6,61. Si hubiramos creado una distribucin de medias utili
zando muestras de tres pelotitas cada una, la varianza de la distribucin de medias hubiera sido de
2,22, es decir,, un tercio de la varianza de la poblacin de individuos. Si hubiramos seleccionado
al azar cinco pelotitas para cada muestra, la varianza de la distribucin de medias hubiera sido un
quinto de a varianza de la poblacin de individuos.
Los ejemplos anteriores cumplen una regla general, la segunda regla con respecto a la distri
bucin de medias: la varianza de una distribucin de medias es la varianza de la distribucin
de la poblacin de individuos dividida por el tamao de cada una de las muestras seleccionadas.
Esta regla se mantiene en todas las situaciones y se puede probar matemticamente.
A continuacin mostramos la frmula que representa la regla para calcular la varianza de la
distribucin de medias:
(7-1)

: En la frmala anterior, cr2, es la varianza de la distribucin de medias, cr2 es ia varianza de la


poblacin de individuos, y N es ei tamao de cada muestra.
En nuestro ejemplo, la varianza de la poblacin de grados individuales era 6,61, y haba
dos nios de escuela por muestra. La varianza de la distribucin de medias se calcula del si
guiente modo:
6,67
= 3,34
2
Para utilizar un ejemplo diferente, supongamos que una poblacin de individuos tuviera una va
rianza de 400, y quisiramos saber la varianza de una distribucin de medias de 25 valores obser
vados:

or =

400
= 16
25

El desvo estndar de una distribucin de medias es la raz cuadrada de la varianza de la distri


bucin de medias. Se representa bajo la frmula:
(T

7f

(7-2)

En la frmula anterior, o Mes el desvo estndar de la distribucin de medias.


Algunas veces, esta frmula se manipula algebraicamente para destacar la relacin entre el
desvo estndar de la poblacin de individuos y el desvo estndar de la distribucin de medias:
a M = -Jn

(7-3)

Debido a su importancia en la prueba de hiptesis, a veces se denomina al desvo estndar de la


distribucin de medias con un nombre especial propio: error estndar de la media o, para abre
viar, e rro r estndar. Este nombre representa la medida de error tpica de determinadas medias
mustrales como estimaciones de la media de la poblacin de individuos. Es decir, el error estn
dar de la media nos indica cunto se desvan de la media poblacional las medias particulares de la
distribucin de medias. Al final del captulo seguiremos tratando este tema en nuestra exposicin
sobre intervalos de confianza.

Regla 3: forma de una distribucin de medias


No importa cul sea la forma-de la distribucin original de valores individuales, ya que la distri
bucin de medas siempre tiende a ser unimdal y simtrica. En el ejemplo de los grados escola
res, la distribucin poblacional de los grados de los alumnos era rectangular (cada valor tena la
misma frecuencia). Sin embargo, la forma de la distribucin de medias era semejante a la de
una campana unimdal y simtrica. Si en nuestro ejemplo de la figura 7-3 hubiramos seleccio
nado muchas ms de 1.000 muestras, la forma habra sido .mucho ms claramente unimdal y
simtrica.
Una distribucin de medias tiende a ser unimdal debido al mismo proceso bsico de los ex
tremos equiparndose entre s que observamos al tratar el tema de la varianza: cuando se trata de

medias es ms posible que se den los valores centrales, y menos posible que se den las medias
extremas. La distribucin tiende a ser simtrica porque la falta de simetra (asimetra) es causada
principalmente por extremos, y al haber menos extremos hay menos asimetra. En nuestro ejem
plo de los grados escolares, la distribucin de medias que creamos result tan claramente simtri
ca debido a que la distribucin poblacional de los grados individuales era simtrica. Si la
distribucin de valores de l'a poblacin de individuos hubiera sido asimtrica hacia un lado, la dis
tribucin de medias hubiera sido asimtrica tambin, pero no tanto.
Cuantos ms valores haya en cada muestra, ms semejante ser la distribucin de medias a la
distribucin normal. Por lo tanto, la tercera regla establece que con muestras de 30 ms valores,
aun con una poblacin de individuos no normal, la distribucin de medias se aproximar mucho a
una distribucin norma! y los porcentajes en la tabla de reas bajo la curva normal sern extrema
damente precisos.1,2 Adems, siempre que la distribucin de valores de la poblacin de indivi
duos sea normal, la distribucin de medias ser normal, sin importar la cantidad de valores que
incluya cada muestra.

R e s u m e n d e la s r e g a s p a r a la d e t e r m in a c i n
d e la s c a r a c t e r s t ic a s d e u n a d is t r ib u c i n d e m e d i a s

A continuacin resumimos las tres reglas:


L La media de una distribucin de medias es igual a la media de la distribucin poblacional
de observaciones individuales,
2. La varianza de una distribucin de medias es la varianza de la distribucin de la pobla
cin de observaciones individuales dividida por el tamao de la muestra (cantidad de valores
observados de cada muestra (o*^ ~ cr2/jV). Su desvo estndar es la raz cuadrada de su varianza
K / H o |) 3. La forma de una distribucin de medias es, al menos, aproximadamente normal si a) cada
muestra incluye 30 valores o ms, o bien, b) la distribucin de observaciones de la poblacin de
individuos es normal. En otras circunstancias, aun presentar una tendencia a ser unimodal y
aproximadamente simtrica.
Estos principios estn representados grficamente en la figura 7-4.

Hemos ignorado el hecho de que una curva normal es una distribucin terica ininterrumpida. En la mayora de los
ejemplos de la vida real, los registros se ubican en intervalos especficos, Por lo tanto, una diferencia entre una curva
normal y la distribucin de medias de pelotitas de ping pong de nuestro ejemplo es que la curva normal es ininterrum
pida, Sin embargo, en la investigacin psicolgica, usualmente suponemos que, aun cuando nuestras mediciones se
realicen a travs de intervalos especficos, el objeto implcito que estamos midiendo es continuo,
3Ya hemos analizado en el captulo 5 el principio que establece la tendencia de la distribucin de medias hacia una cur
va normal. Aunque an no habamos estudiado la distribucin de medias, aun as utilizamos ese principio para explicar
por qu ia distribucin de tantos elementos en la naturaleza siguen una curva normal, En ese captulo lo explicamos co
mo consecuencia de las distintas influencias que se equiparan unas a otras para hacer surgir una influencia promedio
con la mayoria de ios registros cerca del centro y, unos pocos, a cada extremo. Ahora hemos explicado el mismo tema
utilizando la terminologa de una distribucin de medias, Pensemos en cualquier distribucin de registros individuales
en la naturaleza como representativa de una situacin en la que cada registro es efectivamente un promedio de una serie
aleatoria de influencias que actan sobre ese registro individual. Analicemos la distribucin del peso del canto rodado.
El peso de cada piedra representa una especie de promedio de todas las diferentes fuerzas que actuaron para que ese
canto rodado tenga un peso determinado.

Figura 7-4. Ilustracin de los principios de la relacin entre la distribucin de medias (curvas en la parte in

ferior) y la distribucin de la poblacin de observaciones individuales (curvas en la parte superior).

E je m p lo d e d e t e r m in a c i n d e la s c a r a c t e r s t ic a s d e u n a d is t r ib u c i n d e m e d ia s

Analicemos la distribucin de valores de una poblacin de alumnos que han rendido el g r e s . Su


pongamos que la distribucin es aproximadamente normal con una media de 500 y un desvo es
tndar de 100. Cules sern las caractersticas de una distribucin de medias realizada con
muestras de 50 alumnos cada una, seleccionados de esa poblacin?
1. Dado que la media de la poblacin es 500, la media de la distribucin de medias tambin
ser 500.
2. La varianza de la distribucin de medias es la varianza de la poblacin de observaciones in
dividuales dividida por la cantidad de individuos en cada muestra. Dado que el desvo estndar de
la poblacin de observaciones individuales es 100, la varianza de esa poblacin es 10.000. La va
rianza de la distribucin de medias es 10.000 dividido 50, es decir 200. Lo anterior se expresabajo la siguiente frmula,
2

10.000

200

N
50
El desvo estndar de la distribucin de medias es la raz cuadrada de la varianza de la distribu
cin de medias: ^200= 14,14.
3.
La forma de la distribucin de medias ser normal. Se cumplen nuestros dos requerimien
tos: la distribucin de valores de la poblacin de individuos es normal y la cantidad de individuos
en cada muestra es igual a 30 mayor. (Habra sido suficiente si se hubiera cumplido slo uno de
los requerimientos).

O t r o e j e m p lo d e d e t e r m in a c i n d e la s c a r a c t e r s t ic a s d e u n a d is t r ib u c i n d e m e d ia s

La Lista de Control de Adjetivos [Adjective Check List] (Gough & Heilbrun, 1983) es una prueba
de personalidad ampliamente utilizada. La prueba est formada por una lista de adjetivos tales co
mo capaz, activo, atltico, y as sucesivamente, y aquellos que realizan la prueba controlan la lis
ta para determinar si cada adjetivo puede aplicarse a s mismo. Una de las sub-pruebas de la Lista
de Control de Adjetivos se focaliza en la agresin (adjetivos tales como agresivo, peleador, dog
mtico). La prueba ha sido aplicada a gran cantidad de personas en el pasado, y se sabe que los va
lores en la escala de agresin presentan una distribucin asimtrica con una media de 51 y una
varianza de 93 (redondeando). Cules sern las caractersticas de una distribucin de medias
maestrales de esta poblacin de individuos si cada muestra contiene 10 individuos?
1. La media de la distribucin- de medias ser 51,1a misma que la media poblacional.
2. La varianza de la distribucin de medias ser 93, la varianza poblacional, dividida por 10
(tamao de cada muestra). El resultado es 9,3. Se representa bajo la frmula:
_ O - 93 - 9 j 3
cr;,2
M"
N
10
El desvo estndar de la distribucin de medias es la raz cuadrada de 9,3, lo que es lo mis
mo, 3,05.
3.
La distribucin de medias no ser normal porque la distribucin de la poblacin de indivi
duos no es normal, y la cantidad de individuos por muestra es slo 10. Sin embargo, como toda,
distribucin de medias, tendr tendencia a ser unimodal y ms simtrica que la distribucin de la
poblacin de valores individuales.
Revisin de tres clases de distribuciones
Hemos estudiado tres diferentes tipos de distribuciones: a) la distribucin de valores de una po
blacin de individuos, b) la distribucin de observaciones de una determinada muestra tomada de
esa poblacin y c) la distribucin de medias. La figura 7-5 ilustra estas tres distribuciones, y la ta
bla 7-1 las compara.

Figura 7-5. Tres tipos de distribuciones: (a) distribucin de valores de una poblacin de individuos, (b) dis
tribucin de observaciones de una determinada muestra tomada de esa poblacin y (c) distribucin de me
dias de todas las muestras posibles de un determinado tamao, tomadas de esa distribucin.

Tabla 7-1.
Comparacin de tres tipos de distribuciones.
Distribucin
poblaciona!

Distribucin
de una muestra
determinada

Forma

Valores de
todos los individuos
de la poblacin.
Podra ser
cualquier forma,
a menudo normal.

Valores de
los individuos de
unasola muestra.
Podra ser
cualquier
fonna.

Media

P-

Varianza

tr2

Desvo
estndar

cr

Contenido

Distribucin
de medias
Medias de muestras
tomadas al azar de la poblacin.
Normal, si la poblacin
es normal. Aproximadamente
normal, si las muestras
contienen >: 30 observaciones
cada una.

M ~ 1X 1N,

Calculado de las
observaciones tomadas
de la muestra
S D ^ K X -M f/N ,

or^-o-VjV

Calculado de las
observaciones tomadas
de la muestra
s d =Vsd?

PRUEBA PE HIPTESIS CON UNA DISTRIBUCIN DEMEDIAS_________


Ahora estamos listos para analizar las pruebas de hiptesis cuando existe ms de un individuo en
la muestra del estudio.
La distribucin de medias como distribucin comparativa en la prueba de hiptesis
En esta nueva situacin, la distribucin de medias proporciona la conexin decisiva entre la
muestra y la hiptesis nula. Supongamos que estamos estudiando una muestra de ms de una per
sona (situacin usual en las investigaciones). En ese caso, la distribucin de medias es la distri
bucin comparativa, la distribucin cuyas caractersticas se determinan en e paso 2 del proceso
de prueba de hiptesis. La distribucin de medias es la distribucin con la que se puede comparar
la media muesral para determinar cun verosmil es que dicha inedia muestra! hubiera sido selec
cionada si la hiptesis nula fuera verdadera.
Determinacin de la puntuacin Z de una media muestra! en la distribucin de medias
Cuando se realiza una prueba de hiptesis con una muestra de ms de un individuo puede surgir cier
ta confusin al determinar la ubicacin de la muestra en la distribucin comparativa. En ese caso,
lo que estamos determinando es la puntuacin Z de la media muestra! en la distribucin de me
dias, (Antes determinbamos la puntuacin Z de un slo individuo en una distribucin de valores
de una poblacin de individuos). El mtodo para convertir la media muestra! en una puntuacin Z

\
:
. Cuadro 7.-1. _
Algo ms sobre las encuestas: errores de muestreo
y errores l cnsiderar las muestras.

Volviendo ai cuadro 5-3, que trata acerca. ; muestra, El tamao de la propia poblacin: ":"
de sondeos y de la encuesta de Gallup, r^(de individuos), o la relacin del. tipa. '
cordarems que dejamos sin responder una
d la muestra con el de- Ja poblacin, :no! ,,
influye en sta frmula,

V
importante cuestin sobre la letra chica que
aparece cerca de los resultados de una en
Aun as, nuestra intuicin podra conti?;
cuesta,y que dice algo, as como: Informa- - : nuar dicndonos que.la antdad/nces'ari . :
cin proveniente de un sondeo telefnico 4 ' . para representar a todo el irimso pblico: ;
1.000 adultos estadounidenses, realizado e l de.los Estados Unidos dbela sr mayf W :;
slol-OOindividuos.Sinmb.argo,silopem" ;
4 y 5 de junio. Error de muestreo 3%. ;
Dijimos que tina .duda comn es pregum
samos.bien, cuando la muestra es sol una j
pequea parte de una poblacin muy grande^ . ,
tarse cmo se puede utilizar una cntidatj;tan pequea, como 1.000 individuos (an- . el tamao absoluto de l muestra es el nico: ;'
que rara vez se utiliza una cantidad; mucho
determinante de exactitud. se tamao abso-? i.
menor) para predecir la opinin de todq el . luto determina el impacto d los errores aleaA
pblico de los Estados Unidos..
torios de medicin y seleccin. /
Comencemos con el tema del tamao .
' Algunas veces: s influye el tamao t--...
de la muestra. De acuerdo a lo aprendido '
atyp de una muestra con respect a la po-', r
en este captulo, sabemos que cuando las
blacin; sto ocurre si. la poblacin es tari;
muestras son de gran tamao, como lo es
pequea que,: eliminr mtrrogaf:: l-:,-;.
una. muestra de 1.000 valores, se reduce',
gures,, aumenta- las chances de quedos res
mucho el desvo estndar de la distribu
tantes seari :entrevistados.' Pero- cuando la
cin de medias. Es decir,, la distribucin' ' .poblacin est formada por millones, eli-
minar a mil dos mil tendr un efecto prc- :;
de. medias mustrales se vuelve muy alta
y estrecha,, dispersa alrededor de la media ticamente nulo en las probabilidades de '
poblacionl. ' Por lo tanto, la media de
qu sean otros. Iqs entrevistados. Una en-,
cualquier muestra de ese tamao est muy
cuesta realizada a i.000 de entre un^'xniflni.'^i:1
cerca de la media poblacional. Para expre
.de votantes, o de entre 10 100 millones d
sarlo de otro modo, la varianza de la dis
votantes tendr esencialmente el .misino
tribucin de medias, que refleja cunto error casual. Lo importante es reducir des
: tiende a diferir cualquier media muestral
vos o : errores sistemticos, lo cual slo .
de la media poblacional, es la varianza de . puede ^lograrse a travs de una- planifica-/ .
cin muy cuidadosa.
. y .d d
la poblacin dividida por el tamao de la

no es diferente ai modo usual de convertir una puntuacin original en puntuacin Z. Sin embargo,
debemos ser cuidadosos para no confundimos, ya que el proceso involucra a ms de una media.
Es importante recordar que estamos manejando la media muestral como si fuera una simple ob
servacin individual. En otras palabras, la frmula ordinaria (del captulo 2) para convertir un va

lor original en puntuacin Z es Z - (X - M)SD, En la situacin que estamos tratando ahora, en


realidad estamos utilizando la siguiente frmula:
Z

(7-4)
vM

Por ejemplo, supongamos que la media muestral es 18 y que la distribucin de medias tiene una
media de 10 y un desvo estndar de 4, La puntuacin Z correspondiente a esta media muestral es
+2. Utilizando la frmula:
Z=

(jkf-jxjtf) _ 1 8 -1 0 _ 8
<*A

La Figura 7-6 ilustra el clculo anterior.

Ejemplo de prueba de hiptesis con una muestra de ms de un individuo


Recordemos el experimento ficticio presentado en los captulos 1 y 2 acerca de la lectura de ora
ciones ambiguas, En esos captulos, simplemente observamos la distribucin de los tiempos de
lectura cuando las oraciones se presentaban sin contexto. Ahora supondremos que los investiga
dores quieren probar una teora sobre la importancia del contexto. Por lo tanto, realizan un estu
dio analizando los tiempos de lectura cuando existe algn contexto para las oraciones ambiguas

Figura 7-6. Puntuacin Z correspon


diente a la media de determinada
muestra, ubicada en la distribucin de
medias.

Figura 7-7. Con respecto ai experimento ficticio del captulo i acerca de la lectura de oraciones ambi
guas, (a) distribucin poblacional de valores individuales, (b) distribucin de medias y (c)-distribucin
de la muestra.

que hace que sus significados sean un poco ms claros. El objetivo es establecer si el tiempo de
lectura ser ms rpido en estas condiciones. Por supuesto, tambin es posible que al proporcio
nar un contexto se demore la lectura por el hecho de hacer ms complicada la situacin.
Tambin supondremos que los investigadores han realizado muchos estudios previos con es
tas oraciones ambiguas presentadas sin contexto. A partir de esa investigacin supondremos que
los investigadores confan en que los tiempos de lectura de oraciones ambiguas, sin ningn con
texto de la poblacin en general, estn distribuidos de forma aproximadamente normal, con una
media de 2,75 segundos y una varanza de 0,02 segundos (cr = 0,14 segundos). La figura 7-7a
muestra la distribucin poblacional a la que nos referimos.
En el estudio que acabamos de describir se prueba a 40 individuos utilizando oraciones ambi
guas en contexto. El tiempo medio de lectura es de 2,71 segundos, (En el ejemplo que estamos
analizando conocemos la varanza poblacional antes de realizar el estudio. En este tipo de situa
ciones, la varanza muestral no se utiliza para nada en el proceso de prueba de hiptesis). La figu
ra 7-7c muestra la distribucin muestral.3

3En realidad, este estudio sera mucho mejor si los investigadores tuvieran tambin otro grupo de participantes a ios
que se les asignara al azar la realizacin de una prueba de velocidad de lectura de oraciones ambiguas sin contexto.
Confiar en informacin proveniente de estudios previos es unpoco arriesgado, porque las circunstancias en las que se
realizaron las pruebas durante uno y otro estudio pueden no ser idnticas. Sin embargo, nos hemos tomado algunas li
bertades con este ejemplo para ayudamos a introducirel proceso de prueba de hiptesis de aun paso por vez. En este
ejemplo, y en los otros del captulo, utilizamos situaciones en las que se contrasta unasola muestracon una poblacin
conocida. Apartirdel captulo 9, ampliamos el procedimiento depruebade hiptesis para adaptarlo a situaciones de
investigacin ms realistas, es decir, aquellas que involucranms de ungrupo de participantes yque incluyen poblacio
nes cuyas caractersticas se desconocen.

Qu deberan concluir los investigadores? Sigamos los pasos de la prueba de hiptesis.


1. Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de las
poblaciones. Las dos poblaciones son:
Poblacin 1: participantes que leen oraciones ambiguas en contexto,
Poblacin 2: participantes que leen oraciones ambiguas sin contexto.
La hiptesis de investigacin establece que existe una diferencia en el tiempo de lectura entre
las dos poblaciones, es decir, que l tiempo de lectura en contexto ser diferente al tiempo de lec
tura sin contexto: p., #
La hiptesis nula establece que no existe diferencia entre el tiempo de
lectura de las dos poblaciones: pj = p 2. Cabe mencionar que las hiptesis son no direccionales, Si
bien los investigadores esperan que el tiempo de lectura con contexto sea ms rpido, no pueden
descartar la posibilidad de que el contexto retarde el tiempo de lectura, resultado que adems se
ra bastante interesante.
2. Determinar las caractersticas de la distribucin comparativa. Si la hiptesis nula es
verdadera, la poblacin de individuos de la cual proviene nuestra muestra no es diferente de la po
blacin 2, cuya media y varianza conocemos. Lo que necesitamos calcular ahora son las caracte
rsticas de una distribucin de medias de muestras con 40 valores cada una, tomadas de esa
poblacin de individuos que conocemos.
Por lo tanto, seguimos las reglas para determinar las caractersticas de una distribucin de
medias: a) la media es igual a la media poblacional, en este caso 2,75 segundos y b) la varianza
es igual a la varianza poblacional dividida por la cantidad de valores de cada muestra. Aplicando
la frmula:
O02
0,0005
' 40 '
El desvo estndar es la raz cuadrada del resultado anterior, 0,022. Finalmente, c) la forma de la
distribucin ser cercana a una curva normal porque las muestras tienen ms de 30 valores cada
una. La figura 7~7b ilustra la distribucin de medias.
3. Determ inar el punto muestral de corte en la distribucin comparativa, a p artir del
cual debera rechazarse la hiptesis nula. Supongamos qne los investigadores decidieron utili
zar un nivel de significacin del 5%. Como observamos en el paso 1, han propuesto una hiptesis
no direccional, por lo que necesitamos una prueba de dos colas. Acabamos de determinar que la
distribucin comparativa es normal, por lo tanto, podemos consultar a tabla de reas bajo la cur
va normal para encontrar la puntuacin Z que marca el 21/2% inferior y superior. La tabla nos in
dica que para rechazar la hiptesis nula a un nivel del 5%, necesitamos una puntuacin Z de +1,96
mayor, 0 bien, de -1,96 menor. Las dos regiones del 2 1/2%, en las que la hiptesis nula sera
rechazada, son las que sostienen a las pequeas reas sombreadas (son muy difciles de ver) en las
dos colas de la distribucin de medias representada por la figura 7-7b.
4. D eterm inar el valor m uestral en la distribucin comparativa. La media muestral es
de 2,71 (vase figura 7~7c). A partir del paso 2, sabemos que la distribucin comparativa
(nuestra distribucin de medias) tiene una media de 2,75 y un desvo estndar de 0,022, Apli
cando la frmula:
(M - i-Ujv/) _ 2,71 - 2,75
crM
0,022

-0,04
0,022

5. Comparar los valores de los pasos 3 y 4 para decidir si se rechaza o no la hiptesis nula.
La puntuacin Z necsara para rechazar la hiptesis nula es 1,96. La puntuacin Z que obtuvi
mos es de slo -1,82. Por lo tanto, no podemos rechazar la hiptesis nula: el experimento no es
concluyente. Podemos observar el resultado grficamente en la figura 7-7b, la cual muestra que la
ubicacin de la media de nuestra muestra en la distribucin de medias no es tan extrema como pa
ra que sea claramente inverosmil que pueda ser seleccionada de esa distribucin.
No obstante, el resultado es casi lo suficientemente extremo como para rechazar la hiptesis
nula. Por lo tanto, los investigadores podran indicar que el resultado fue casi significativo o
cercano a la significacin, agregando tal vez que p<0,l0. (El punto de corte para la significa
cin a un nivel de 0,10, en una prueba de dos colas, es de 1,64). Pero con un resultado lmite co
mo este, el mejor consejo es repetir el experimento, tal vez con ms participantes. (El captulo 8
incluye una exposicin acerca de los efectos de aumentar la cantidad de participantes con respec
to a la probabilidad de que el experimento produzca un resultado significativo).

Otro ejemplo de prueba de hiptesis con una muestra de ms de un individuo


Este es otro ejemplo ficticio. Dos psiclogos especializados en educacin estn estudiando los
efectos que tienen las instrucciones en las pruebas de nivel acadmico cronometradas. Su teora
establece que si se instruye a quienes van a realizar la prueba para que contesten cada pregunta
con la primera respuesta que les venga a la mente, los resultados de las pruebas sern mejores.
Para analizar esa teora, ios investigadores organizaron que 64 alumnos de quinto grado, se
leccionados en forma aleatoria, rindieran una prueba de nivel acadmico estndar. La prueba se
toma de la manera comnmente utilizada, con una sola excepcin. Como parte del estudio, las
instrucciones para la prueba incluyen una indicacin adicional que aconseja a los alumnos a res
ponder cada pregunta con la primera respuesta que les venga a la mente. Cuando se toma la
prueba en la forma acostumbrada (es decir, sin esa indicacin extra en las instrucciones) la me
dia es de 200, el desvo estndar de 48 y la distribucin, representada grficamente en la figura
7-8a, aproximadamente normal
Qu tipo de resultado necesitaran los psiclogos expertos en educacin para concluir que el
procedimiento tiene algn efecto?
1. Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de las
poblaciones. Las dos poblaciones son:
Poblacin 1: alumnos de quinto grado que reciben instrucciones especiales.
Poblacin 2: alumnos de quinto grado que no reciben instrucciones especiales.
La hiptesis de investigacin establece que la poblacin de alumnos de quinto grado que rinden
la prueba con las instrucciones especiales, obtendr puntuaciones ms altas que la poblacin de
alumnos que rinden la prueba en la forma acostumbrada;
> jx2. La hiptesis nula establece que
las puntuaciones de la poblacin 1 no sern mayores que las de la poblacin 2; < p,2. (Cabe des
tacar que las hiptesis son direccionales).
2. Determinar las caractersticas de la distribucin comparativa. A partir del estudio ob
tenemos la media de una muestra formada por 64 observaciones (en este caso, de alumnos de
quinto grado). La distribucin comparativa debe ser la distribucin de medias de muestras forma
das por 64 valores cada una. Esa distribucin tendr una media de 200 (igual a la media pobladonal) y la varianza ser igual a la varianza poblacional dividida por la cantidad de individuos en la
muestra. La varianza poblacional es 2.304 (el desvo estndar poblacional de 48 elevado al cua
drado) y el tamao de la muestra es 64. Por lo tanto, la varianza de la distribucin de medias ser

Puntuaciones etisa prueba; 100 :


Puntuaciones Z': .' -2

Figura 7-8. C o n resp e c to al estu d io fic tic io b a sa d o e n e l d e sem p e o en una prueba estndar d e n iv el a c a d
m ic o , (a ) distrib u cin p o b ia cio n a l d e va lo res in d ivid u ales, (b ) distribu cin d e m e d ia s (d istrib u cin c o m p a
rativa) y (c ) distrib u cin d e la m uestra.

2.304/64, es decir, 36. El desvo estndar de la distribucin de medias es la raz cuadrada de 36, o
sea, 6. Finalmente, dado que en la muestra hay ms de 30 individuos, la forma de la distribucin
de inedias ser aproximadamente normal. La figura 7-8b muestra la distribucin de medias que
acabamos de describir.
3.
Determinar el punto muestral de corte en ia distribucin comparativa, a partir del
cual debera rechazarse la hiptesis nula. Una vez ms, supongamos que los investigadores
adoptan el nivel de significacin usual del 5%. Los investigadores que realizan este estudio tienen

una prediccin claramente direccional, y realmente no estn interesados en ningn efecto en di


reccin contraria. (Si las instrucciones especiales no mejoran las puntuaciones de la prueba, no
sern utilizadas en el futuro. Cualquier posible resultado que muestre un efecto negativo es irrele
vante). Por lo tanto, los investigadores rechazarn la hiptesis nula si el resultado se encuentra
dentro del 5% superior de la distribucin comparativa. La distribucin comparativa (la distribu
cin de medias) es una distribucin normal, por ende, podemos determinar el 5% superior a tra
vs de la tabla de reas bajo la curva normal. La parte que nos interesa bajo la curva normal
comienza en una puntuacin Z de +1,64, y el rea sombreada de la figura 7-8b muestra ese 5% su
perior.
4. Determinar el valor maestral en la distribucin comparativa. Los 64 alumnos de quinto
grado que realizaron la prueba aplicando las instrucciones especiales tenan una puntuacin me
dia de 22G,'(La figura 7-8c grfica la distribucin de esa muestra). Una media de 220 se encuentra
a 3,33 desvos estndar por encima de la media de la distribucin de medias:

z _ (A* " PAi) _ 220 - 200 r 20 ^


<rM
6
6
5, Com parar los valores de los pasos 3 y 4 para decidir si se rechaza o no la hiptesis nu
la. Establecimos que la puntuacin Z mnima necesaria para rechazar la hiptesis nula es +1,64.
La puntuacin Z correspondiente a la media muestral es de +3,33. Por lo tanto, los psiclogos ex
pertos en educacin pueden rechazar la hiptesis nula y concluir que se sostiene la hiptesis de
investigacin. Para decirlo con otras palabras, el resultado es estadsticamente significativo al ni
vel p<0,05. El resultado puede verse reflejado en la figura 7-8b, donde se observa cun extrema es
la media muestral en la distribucin de medias (la distribucin que se aplicara si la hiptesis nula
fuera verdadera). La conclusin final es que entre alumnos de quinto grado como los analizados,
las instrucciones especiales sin duda mejoran las puntuaciones en las pruebas.

ESTIMACION E INTERVALOS PE CONFIANZA


La prueba de hiptesis es el tema central de este libro. Sin embargo, existe otro tipo de cuestin
estadstica relacionada con la distribucin de medias que, algunas veces, resulta importante pa
ra la psicologa. Esa otra cuestin es la estimacin de la media de una poblacin desconocida
sobre la base de los valores mustrales. El tema es importante, por ejemplo, en investigaciones
a travs de encuestas, y como veremos ms adelante, tambin puede ser importante como m
todo alternativo de la prueba de hiptesis.
Estimaciones puntuales y estimaciones por intervalos
La mejor estimacin de la media poblaciona es la media muestral. En el estudio realizado con los
alumnos de quinto grado que recibieron instrucciones especales, la puntuacin media de la
muestra formada por los 64 individuos analizados era de 220. Por o tanto, 220 es la mejor esti
macin de la media correspondiente a la poblacin desconocida de alumnos de quinto grado que
podran, recibir instrucciones especiales. En este caso, estamos estimando el valor especfico de la
meda poblaciona. Cuando estimamos el valor especfico de un parmetro poblaciona, habla
mos de una estimacin puntual.
Tambin podemos encontrar un intervalo de posibles medias verosmil, el cual incluya la me
dia poblaciona. Por ejemplo, podramos decir estimativamente que un intervalo de 200 a 240 in~

cluye la verdadera media poblacional de alumnos de quinto grado que reciben instrucciones espe
ciales.4 A esto se lo denomina estimacin por intervalos.
P rin c ip io

general y terminologa relacionada con los intervalos de confianza

Cuanto ms amplia sea la estimacin por intervalos, mayor ser la certeza de que incluya la ver
dadera media poblacional. En el ejemplo de los alumnos de quinto grado podramos estar bastan
te seguros de que el intervalo de 100 a 340 incluye la verdadera media poblacional. Pero
estaramos arriesgndonos al fracaso si estimramos que la verdadera media poblacional est in
cluida en el intervalo de 219 a 221.
En general, necesitamos un intervalo lo suficientemente amplio como para aseguramos que in
cluya la media poblacional. A esto se lo denomina intervalo de confianza (a veces se abrevia ic).
Si queremos estar 95% seguros, necesitamos un intervalo del 95% de confianza. Un intervalo del
95% de confianza, en el ejemplo de los alumnos de quinto grado, abarca desde 208,24 hasta 231,76.
Es decir, sobre la base de la muestra analizada, podemos estar un 95% seguros de que un intervalo
de 208,24 a 231,76 incluye la verdadera media poblacional. (Pronto aprenderemos a calcular los in
tervalos). Los lmites superiores e inferiores de ios intervalos de confianza se denominan lmites de
confianza. En el ejemplo que estamos analizando, los lmites de confianza son 208,24 y 231,76.
Si queremos tener una seguridad an mayor al 95%, necesitamos un intervalo ms amplio. En
nuestro ejemplo, los lmites de confianza de un intervalo del 99% de confianza son 204,58 y 235,42.
Determinacin de los lmites de confianza
Los lmites de confianza se basan en la distribucin de medias. Lo que necesitamos saber es dn
de comienza y termina el 95% central de las medias en esa distribucin. Por lo tanto, necesitamos
encontrar los puntos de corte correspondientes al 2,5% inferior y al 2,5% superior, lo que deja un
total del 95% en el centro. (Para los intervalos del 99% de confianza necesitaramos calcular los
puntos ;que marcan el 0,5% superior e inferior, con lo cual dejaramos un 99% en el centro).
Comencemos con el lmite inferior. Como siempre, lo ms sencillo es pensar en funcin de
las puntuaciones Z. La puntuacin Z que marca el 2,5% inferior en una curva normal es -1,96.
(Este dato lo encontraremos en la tabla de reas bajo la curva normal). El ejemplo tiene una meda
de 220 y un desvo estndar de la distribucin de medias igual a 6. Por lo tanto, en esta distribu
cin de medias, una puntuacin Z de -1,96 corresponde a 208,24. (Es decir, utilizando el procedi
miento usual para convertir una puntuacin Z en una puntuacin original, convertimos la
puntuacin Z -1,96 en la puntuacin original 208,24).
El clculo del lmite superior funciona de la misma manera. La puntuacin Z que marca el
2,5% superior es +1,96 que, en la distribucin de medias, equivale a 231,76.
Pasos a seguir para el clculo de los intervalos de confianza

A continuacin presentamos los tres pasos para calcular intervalos de confianza. Al seguir estos
pasos se supone que la distribucin de medias es una distribucin aproximadamente normal.
1.
Determinar las caractersticas de la distribucin de medias utilizando el clculo acos
tumbrado. No obstante, cabe destacar que estamos interesados en la distribucin de medias co4 Segn }a lgica matemtica de la estadstica inferencia!, debemos considerar la media poblacional com o algo fijo. Los
intervalos de confianza pueden variar, pero la media poblacional es fija. Por lo tanto, podem os decir que estamos 95%
seguros de que nuestro intervalo de confianza incluye la media poblacional. N o deberamos decir que las chances de
que la media poblacional se encuentre dentro de intervalo de confianza son del 95%.

^respondiente a la poblacin que representa la muestra que estamos analizando (lo que hemos
llamado poblacin 1), y o en la distribucin de medias correspondiente a la poblacin con la
cual la estamos comparando (poblacin 2). Se estima entonces que la media de la distribucin
de medias es la media muestral. En cuanto a la varianza, afortunadamente, por lo general supo
nemos que la varianza de las dos poblaciones es la misma. Consecuentemente, podemos utili
zar la varianza conocida de la poblacin dada (poblacin 2) como base para calcular la varianza
de la distribucin de medias de la poblacin en la que estamos interesados (poblacin 1). (La
varianza de la distribucin de medias se basa slo en la varianza de la poblacin y en el tamao
de la muestra. Por lo tanto, la varianza de la distribucin de medias ser igual para ambas po
blaciones).
2. Utilizar la tabla de reas bajo la curva normal para encontrar las puntuaciones Z que coin
ciden con los porcentajes superiores e inferiores que nos interesan. Para un intervalo del 95% de
confianza, debemos buscar la puntuacin Z que coincide con el 2,5% inferior y el 2,5% superior
. Para un intervalo del 99% de confianza, debemos buscar la puntuacin Z que coincide con el
0,5% inferior y el 0,5% superior.
3. Convertir las puntuaciones Z en puntuaciones originales de la distribucin de medias. Esos
son los lmites de confianza superior e inferior.
Otro ejemplo de clculo del intervalo de confianza
Analicemos otro ejemplo. Calculemos el intervalo de confianza para el estudio basado en las ora
ciones ambiguas en el caso de los participantes que las lean en contexto. En ese caso, los 40 indi
viduos analizados de la manera mencionada tenan un tiempo medio de lectura de 2,71 segundos,
y sabamos por investigaciones anteriores que la poblacin de individuos que lea oraciones am
biguas sin ningn contexto tena una varianza de 0,02 segundos. Con esta informacin estamos
preparados para calcular el intervalo de confianza.
1. Determinar las caractersticas de la distribucin de medias. La media ser de 2,71 segun
dos. Suponemos que la poblacin de individuos puestos a prueba leyendo oraciones ambiguas en
contexto tendr la misma forma y varianza que la poblacin que lee sin contexto (o*2 = 0,02). Por
lo tanto, la distribucin de medias ser normal y tendr una varianza igual a 0,02/40 0,0005. El
desvo estndar es la raz cuadrada de este resultado, es decir, 0,022. (Cabe mencionar que obtu
vimos el mismo desvo estndar de la distribucin de medias que calculamos anteriormente al
realizar la prueba de hiptesis y concentramos en la distribucin de medias para la poblacin que
lee las oraciones sin contexto).
2. Utilizar la tabla de reas bajo la curva normal para encontrar las puntuaciones Z que co
rresponden al porcentaje superior e inferior que hayamos elegido. Suponiendo que queremos es
tablecer el intervalo usual del 95% de confianza, entonces buscaremos las puntuaciones Z que
corresponden al 2,5% superior e inferior. Como vimos anteriormente, el resultado es 1,96.
3. Convertir esas puntuaciones Z en puntuaciones originales de la distribucin de medias.
Con una media de 2,71 y un desvo estndar de 0,022, una puntuacin Z de -1,96 es igual a
una puntuacin original de 2,71 - (0,022 x 1,96), que da como resultado 2,667. De modo simi
lar, una puntuacin Z de +1,96 es igual a una puntuacin original de 2,71 + (0,022 x 1,96), que da
como resultado 2,753, Por lo tanto, los lmites del 95% de confianza son 2,667 a 2,753. Es decir,
sobre la base de los resultados del estudio, tenemos un 95% de confianza de que la verdadera me
dia del tiempo de lectura de oraciones ambiguas presentadas en contexto se encuentra entre 2,667
y 2,753 segundos.

La sutil lgica de los intervalos de confianza


La lgica de los intervalos de confianza es un poco ms sutil de lo que podra parecer a simple
vista. Esa sutileza est relacionada con el hecho de que los intervalos de confianza son estimacio
nes basadas slo en informacin sobre una muestra. Es decir, tal como sucede con la prueba de hi
ptesis, los intervalos de confianza involucran inferencia estadstica acerca de una poblacin
sobre la base de datos obtenidos de una muestra.
Para aclarar los puntos ms delicados de esta lgica, es til imaginar que, de algn modo, co
nocemos la media real de la poblacin. Por ejemplo, supongamos que de alguna forma sabemos
que la poblacin de alumnos de quinto grado que recibe instrucciones especiales (la poblacin 1
en los ejemplos anteriores) tiene una media de 210. (Nuestra atencin est puesta ahora en la po
blacin acerca de la cual estamos realizando estimaciones basndonos en la muestra. No debe
mos confundir esa poblacin con la poblacin 2, la que conocamos desde el principio y en la cual
los alumnos de quinto grado no reciban instrucciones especiales). En tal poblacin, un intervalo
del 95% de confianza estara ubicado alrededor de su media de 210. Utilizando el procedimiento
de clculo que conocemos, podemos calcular que existe una probabilidad del 95% de que cual
quier meda muestral se encuentre entre 198,24 y 221,76 (vase figura 7-9, intervalo a).
Si de hecho la verdadera media de la poblacin fuera 210, no hubiera sido sorprendente que,
al analizar una muestra de 64 alumnos, los investigadores especializados en educacin obtuvieran
una media de 220. Esta media muestral estara perfectamente incluida en los lmites del 95% de la
distribucin de medias.
Sin embargo, en las investigaciones, en general no conocemos la media de la poblacin que
estamos analizando. En realidad, los investigadores especializados en educacin no tendran for
ma de saber que la verdadera media de la poblacin de alumnos de quinto grado que reciben ins
trucciones especiales es 210. Todo lo que conocen es la media de su muestra particular. Aun as,
pueden utilizar la media muestral como estimacin de la media pobacional. Basndose en esa es
timacin, pueden calcular un intervalo del 95% de confianza, que ya hemos determinado que
abarcara desde 208,24 a 231,76. Con bastante seguridad, este intervalo de confianza contendra
la media real de la poblacin, por lo que la confianza en el intervalo est justificada. (Vase figu
ra 7-9, intervalo b)
De todos modos, supongamos que los investigadores especializados en educacin hubieran
realizado el estudio y hubieran descubierto que su muestra tena una media de 190. Continuamos
suponiendo que la verdadera media de la poblacin (que los investigadores desconocen) es 210, y
que el 95% de las veces las muestras de 64 individuos tomadas de esta poblacin deberan ubicar
se entre 198,24 y 221,76. Por lo tanto, obtener una muestra con una media de 190 es bastante im
probable; en verdad la probabilidad es menor al 5%, pero posible. De hecho, esperamos que el
5% de las veces las muestras presenten medias fuera del intervalo del 95%.
Supongamos que los psiclogos especializados en educacin continan con el estudio y
calculan el intervalo de confianza utilizando la media muestral de 190 como estimacin de la me
dia pobacional. Siguiendo las reglas usuales de clculo, obtendrn un intervalo del 95% de con
fianza que abarque desde 178,24 hasta 201,76. Por lo tanto, calcularan un intervalo de confianza
que no incluye la verdadera media pobacional. (Vase figura 7-9 intervalo c).
En resumen, cuando la media estimada se encuentra dentro de los lmites del 95% de la ver
dadera media pobacional, el intervalo de confianza incluir la verdadera media. Afortunadamen
te, el 95% de las veces la media estimada se encuentra dentro de los lmites del 95% de la media
pobacional real. En esos trminos, un 5% de las veces el intervalo de confianza calculado sobre
la base de la media estimada no incluir la verdadera media.

En otras palabras. El 95% de las veces que calculemos un intervalo de confianza, ste inclui
r la verdadera media; y el 5% de las veces, no. Por eso decimos que estamos un 95% seguros de
que el intervalo incluye la verdadera media. Sin embargo, nunca sabremos con certeza si nos en
contramos en la situacin del 95% del 5%. Siempre existe un 5% de chances de que la verdade
ra media no est incluida para nada dentro de la seccin calculada.
Intervalos de confianza y prueba de hiptesis
Adems de su valor en cuanto a la estimacin de la media poblacional, tambin podemos utilizar
los intervalos de confianza para realizar pruebas de hiptesis. Si un intervalo de confianza no in
cluye la media de la distribucin de la hiptesis nula, entonces el resultado es significativo. Esto
se debe a que estamos un 95% seguros de que el intervalo incluye la verdadera media poblacio
nal, y si ese intervalo del 95% no incluye la media de la poblacin 2, entonces existe menos de un
5% de chances de que la muestra hubiera podido surgir de la poblacin 2. En el ejemplo de las
instrucciones especiales para rendir el examen de nivel, el intervalo del 95% de confianza que
abarcaba desde 208,24 hasta 231,76 no incluye la media de 200 correspondiente a la poblacin de
alumnos de quinto grado que rinden el examen sin las instrucciones especiales. El resultado que
acabamos de mencionar es coherente con la conclusin que sacamos con anterioridad en este
mismo captulo, segn la cual el resultado era significativo utilizando el nivel 0,05. En el ejemplo
de las oraciones ambiguas, el intervalo del 95% de confianza con respecto a aquellos que lean las
oraciones en contexto, abarcaba desde 2,667 a 2,753 segundos. Ese intervalo en efecto, incluye la
media de tiempo de lectura (2,75) de la poblacin que lea las oraciones sin contexto. Por lo tanto,
tal como concluimos cuando utilizamos el procedimiento de prueba de hiptesis, el resultado no
es significativo aplicando el nivel 0,05.

F ig u r a 7 - 9 . E j e m p lo s d e in t e r v a lo s d e l
9 5 % d e c o n f ia n z a c o m p a r a d o s c o n d i s
tr ib u c io n e s d e m e d ia s b a s a d a s e n (a ) u n a
m e d ia p o b la c i o n a l c o n o c id a , ig u a l a
2 1 0 ; (b ) u n a m e d ia m u e s tr a ! ig u a l a 2 2 0 ,
y ( c ) u n a m e d ia m u e s tr a l d e 1 9 0 .

CONTROVERSIAS Y LIMITACIONES:
INTERVALOS DE CONFIANZA O PRUEBAS DE SIGNIFICACION?
E l a lu m n o r e c o r d a r q u e e n e l c a p t u lo 6 m e n c io n a m o s q u e , e n la a c tu a lid a d , e x i s t e u n e n r g i c o
d e b a te e n tr e lo s p s ic lo g o s a c e r c a d e la p r u e b a d e s ig n if ic a c i n . E n tr e lo s p r in c ip a le s te m a s
d e d e b a t e s e h a p r o p u e s t o q u e l o s p s i c l o g o s u t i l i c e n i o s i n t e r v a l o s d e c o n f i a n z a e n l u g a r d e la s
p r u e b a s d e s ig n ific a c i n .

Aquellos que estn a favor de reemplazar las pruebas de significacin con los intervalos de
confianza (p. ej. Cohn, 1994; Hunter, 1997; Schmidt, 1996) citan varias ventajas importantes.
Primero, como observamos anteriormente, ios intervalos de confianza contienen toda la informa
cin clave de una prueba de significacin,5 pero adems proporcionan informacin adicional; la
estimacin del intervalo de valores dentro del cual podemos estar bastante seguros de que se en
cuentra la verdadera media poblacional. Una segunda ventaja es que concentran la atencin en la
estimacin y no en la prueba de hiptesis. Algunos investigadores argumentan que el objetivo de
la ciencia es proporcionar estimaciones numricas de efectos, no slo decisiones en cuanto a si un
efecto es diferente de cero. Es decir, con las estimaciones (puntuales y por intervalos), tenemos
una idea clara del grado de importancia del efecto y del nivel de precisin de la estimacin. Con
las pruebas de hiptesis, sabemos si el efecto puede suceder en la direccin predicha, pero no el
grado de importancia del efecto en esa direccin.
Los intervalos de confianza son particularmente valiosos cuando los resultados no son signi
ficativos (Frick, 1995), porque conocer el intervalo de confianza otorga una idea de cun lejos de
la ausencia de efecto es probable encontrar la verdadera media. Si todo el intervalo de confianza
se encuentra cerca de la ausencia de efecto, podemos tener la certeza de que si an existe algn
efecto verdadero, ste probablemente sea pequeo. Por ejemplo, supongamos que se estudia un
grupo de personas despus de que son expuestas a un procedimiento que pretende afectar el IC.
La meda del grupo es 102, y el intervalo de confianza abarca desde 99 hasta 105. Esto dara un
resultado no significativo porque el intervalo incluye el valor 100, que es el IC medio.de la pobla
cin que no recibe el procedimiento especial Al mismo tiempo, dado que el intervalo de confian
za incluye otros nmeros diferentes de 100, en realidad es posible que exista un efecto real, Sin
embargo, el punto clave es que si de hecho existiera un efecto real, es probable que sea muy pe
queo, ya que estamos un 95% seguros de que ese efecto no implicara ms que una disminucin
de un punto o un aumento de 5 puntos. Por otro lado, supongamos que el intervalo de confianza
para este mismo estudio era de 89 a 115. Este resultado tambin sera no significativo (porque in
cluye el valor 100). Sin embargo, nos indicara que el estudio es realmente no concluyente: es po
sible que haya muy poco o ningn efecto (que la media poblacional de aquellos que reciben el
procedimiento sea cercana a 100), pero tambin es posible que exista un-efecto substancial (que
la verdadera media poblacional de aquellos que reciben el procedimiento implique una disminu
cin de hasta 11 puntos de IC, o un aumento de hasta 15 puntos de IC).
Una tercera ventaja, sostenida por aquellos que proponen los intervalos de confianza para
reemplazar las pruebas de significacin, es que existe menos probabilidad de que los investigado
res los utilicen errneamente. Como observamos en el captulo 6, un error generalizado en la uti
lizacin de las pruebas de significacin es concluir que un resultado no significativo implica que

5 A lgunos de los que proponen los Intervalos de confianza para reemplazar la prueba de significacin sostienen que de
beramos ignorar el vnculo con la prueba de hiptesis. Esta es la posicin ms radical en contra de la prueba de signifi
cacin. Es decir, estos psiclogos argumentan que todo el enfoque debera concentrarse en la estimacin, y que la
prueba de significacin de cualquier tipo debera ser relevante. En el captulo 8, veremos los fundamentos de esta po
sicin, junto con los argumentos contrarios.

no existe ningn efecto. Con ios intervalos de confianza es ms difcil caer en este tipo de error. Si
bien el intervalo de confianza que arroja un resultado no significativo incluir la media esperada
correspondiente a la ausencia de efecto, tambin incluir otros valores posibles. As, nos recuerda
que la verdadera meda poblacional podra muy bien ser diferente de la media correspondiente a
la ausencia de efecto.
A pesar de estas aparentes ventajas, es extremadamente raro encontrar intervalos de confian
za en la mayora de los diferentes tipos de publicaciones cientficas psicolgicas. En parte, esto
probablemente se debe a la tradicin y a que la mayora de los psiclogos han sido capacitados
para utilizar las pruebas de significacin, por lo que estn mucho ms acostumbrados a ellas. En
una publicacin cientfica, los intervalos de confianza tambin requieren una mayor descripcin.
Por ejemplo, qu sucedera en el caso de que tuviramos una tabla de resultados ms amplia. Se
ra sencillo agregar un asterisco en cada nmero para mostrar su significacin, por lo cual una ta
bla diseada de ese modo es fcil de leer. Con los intervalos de confianza, en lugar de un
asterisco, necesitaramos dos nmeros extra para cada resultado (los lmites de confianza superior
e inferior).
Otros psiclogos (p. ej. Abelson, 1997; Harris, 1997) indican dos razones para no abandonar
por completo las pruebas de significacin a favor de los intervalos de confianza. Primero, en algu
nos procedimientos estadsticos avanzados es posible realizar pruebas de significacin, pero no es
posible calcular intervalos de confianza. Segundo, del mismo modo que es posible cometer erro
res con las pruebas de significacin, tambin es posible cometer otros tipos de errores con los in
tervalos de confianza, especialmente debido a que la mayora de los psiclogos que realizan
investigaciones tienen menos experiencia en la utilizacin de estos ltimos.
Finalmente, la cuestin de los intervalos de confianza, en contraposicin con la significa
cin, tiene sus races en una mayor controversia entre estimacin y prueba de hiptesis, contro
versia que trataremos en el captulo 8. Sin embargo, para anticipar esa exposicin, podemos
sealar aqu que los intervalos de confianza, por lo general, tienen mucho ms sentido en situa
ciones de investigacin aplicada, mientras que las pruebas de significacin, con frecuencia, tie
nen mucho ms sentido n investigaciones con una orientacin ms terica.
Cualquiera sea el resultado de esta controversia sobre intervalos de confianza, es importante
comprenderlos, ya que podremos encontrarlos ocasionalmente al leer material relacionado con la
investigacin, y es posible que en el futuro aparezcan con ms asiduidad. No obstante, en la ac
tualidad no aparecen con frecuencia. Por eso, y para que la cantidad de material a aprender sea
manejable, decidimos no hacer hincapi en el tema de los intervalos de confianza en los prximos
captulos de este libro que tratan principalmente sobre pruebas de significacin en distintos tipos
de investigaciones..

DESVO ESTNDAR DE LA DISTRIBUCIN DE MEDIAS MUESTRALES,


PRUEBAS DE HIPTESIS SOBRE MEDIAS E INTERVALOS DE
CONFIANZA SEGN SE DESCRIBEN EN PUBLICACIONES CIENTFICAS
Como hemos mencionado varias veces, es bastante raro en psicologa realizar investigaciones en
las que se conoce la media y el desvo estndar de la poblacin. Hemos enseado ese tipo de si
tuacin principalmente porque es la base para comprender la prueba de hiptesis en situaciones
comunes de investigacin. En los raros casos en los que se realiza una investigacin en la que se
conoce la distribucin poblacional, con frecuencia se describe a travs de una prueba Z, porque
es la puntuacin.Z la que se compara con la distribucin normal.

Analicemos un ejemplo. Como parte de un estudio ms amplio, Wiseman (1997) tom una
prueba que mide el nivel de soledad entre un grupo de alumnos universitarios de Israel. Como
primer paso para analizar los resultados, Wiseman control que la media de la prueba del nivel
de soledad no fuera diferente a la de una distribucin de poblacin conocida a travs de un gran
estudio norteamericano de alumnos universitarios, realizado con anterioridad por Russell et al.
(1980). As, Wiseman inform:
El valor medio de soledad de la muestra israel actual era similar a los de la muestra universita
ria realizada por Russell et al. (1980), tanto para hombres (Israel: M - 38,74, SD = 9,30;
Russell; M= 37,06, SD ~ 10,91; z = 1,09, NS) como para mujeres (Israel: M =36,39, SD = 8,87; Rus
sell; M= 36,06, SD * 10,11; z = 0,25, NS) (p. 291).
En este ejemplo, el investigador os da el desvo estndar tanto de la muestra que est analizando
(el grupo israel) como de la poblacin (la informacin tomada del estudio de Russell). Sin em
bargo, al seguir los pasos para calcular cada Z (el valor muestral en la distribucin de medias), s
lo habra utilizado el desvo estndar poblacional. Observemos tambin que el investigador
consider la falta de significacin de la diferencia como sustento para determinar que las medias
mustrales eran similares a las medias poblacionales. De todos modos, el investigador fue muy
cuidadoso en no pretender que estos resultados mostraban que no exista diferencia alguna.
De todos los temas que hemos tratado en ste captulo, el que ms frecuentemente se mencio
na en una publicacin cientfica es el desvo estndar de la distribucin de medias, utilizado para
indicar la cantidad de variacin que podra esperarse entre las medias de muestras de determinado
tamao tomadas de la poblacin. En ese contexto, se lo denomina comnmente error estndar,
abreviado SE. Por ejemplo, Foertsch y Gemsbacher (1997) realizaron un estudio para analizar el
efecto de la utilizacin de pronombre ellos para evitar determinar el sexo de la persona a la cual
se hace referencia, aunque tradicionalmente este uso se considera gramaticalmente incorrecto.
Foertsch y Gemsbacher elaboraron la hiptesis de que utilizar ellos del modo mencionado no ten
dra un efecto importante en el tiempo de lectura. Analicemos la siguiente oracin: Un conduc
tor de camiones nunca debera conducir cansado, aun cuando ella est intentando realizar una
entrega a tiempo, porque muchos accidentes son causados por conductores que se duermen sobre
el volante. Como parte del estudio, los investigadores midieron el tiempo de lectura de esta ver
sin de la oracin y del de otras dos versiones, una reemplazando ella por l y otra remplazando
ella por ellos. En esta oracin, el antecedente (la primera clusula) se refiere a un conductor de
camiones, una profesin tpicamente masculina. En otras oraciones utilizadas por los investiga-'
dores, los antecedentes eran tpicamente femeninos (una enfermera) o neutrales (un corredor).
Estos son algunos de los resultados:
Tratndose de antecedentes masculinos, las clusulas con el pronombre ella {M59,5, SE =2,05) se
leyeron significativamente ms despacio que las clusulas con el pronombre l (M - 54,8, SE = 1,77)
o las clusulas con el pronombre ellos (M = 55,3, SE = 1,77) [...] Tratndose de antecedentes femeni
nos, las clusulas con el pronombre l (M = 58,7, SE = 1,66) se leyeron significativamente ms despa
cio que las clusulas con el pronombre ella (M - 52,9, SE = 1,64) o las clusulas con el pronombre
ellos (M = 52,7, SE = 1,67)". (p. 108)
El informe anterior nos proporciona el patrn de medias y una idea clara de la exactitud de
esas medias como estimaciones de las medias poblacionales. Analicemos las consecuencias
del primer error estndar (2,05). Conoce'r este dato nos indica que la media del tiempo de lec
tura de oraciones con antecedentes masculinos y clusulas con el pronombre ella, es de ms
de 2 errores estndar por encima del tiempo de lectura de oraciones con clusulas con los pro
nombres l o ellos.

Cuando los investigadores informan el error estndar de un resultado, tambin proporcionan


informacin para calcular el intervalo de confianza. Por ejemplo, suponiendo la distribucin nor
mal, calculemos el intervalo del 95% de confianza para oraciones con antecedentes masculinos y
clusulas con el pronombre ella. Dado que el S E (que es otra manera de denominar al desvo es
tndar de la distribucin de medias) es 2,05, el lmite superior del 95% de confianza es la media
ms el resultado de 1,96 x 2,05. Es decir, 59,5 ms 1,96 x 2,05, lo que da 63,52. El lmite inferior
es 55,48. Por lo tanto, tenemos un 95% de confianza de que el intervalo de 55,48 a 63,52 incluye
la verdadera media poblacional.
Los errores estndar aparecen tambin con frecuencia en publicaciones cientficas represen
tados por segmentos ubicados encima de las barras de un diagrama de barras. Esos segmentos so
bre las barras principales tambin se denominan barras de errores estndar, Por ejemplo, la
figura 7-10, tomada de la publicacin de Foertsch y Gemsbacher, grfica los mismos resultados
explicados anteriormente (ms otros adicionales).
Como ya hemos observado, los intervalos de confianza rara vez se mencionan directamente
en publicaciones cientficas psicolgicas, aunque pueden ser ms frecuentes en el futuro. El si
guiente es un ejemplo que pudimos encontrar entre material de lectura actual. Chiu, Hong y
Dweck (1997) realizaron un estudio que se concentraba en la tendencia de algunos individuos a
creer que las caractersticas de las personas son permanentes; Chiu et al. clasificaron a estos indi
viduos como tericos de entidades, porque ven a las otras personas como entidades invariables.
En particular, los investigadores intentaban probar la teora de que estos tericos tendran
ms propensin a tomar un slo hecho como evidencia de que la persona presenta determinada
caracterstica permanente. Como parte del estudio, describieron a los participantes una situacin

1 i;;;;
;j

f-Feme nino

Mascu!m
A

'

-:'

Neutra!

Antecedente

indefinido

::A/iA;-

Figura 7-10. E fe c to s d el tip o d e an teced en te (m a scu lin o , fe m e n in o , neutro o in d efin id o) y d el pronom bre
(l, e lla o e llo s ) en TL (T ie m p o de lectura por carcter), cu a n d o las ora cio n es se utilizaron sin referencia,
(E xp erim en to 1). {F u en te; F oertsch , J., & G em sb a ch er, M . A . (1 9 9 7 ), fig. 1, E n busca d e la neutralidad
d el gnero; E s e l e llo s sin g u la r un sustituto co g n iiv a m en te e fic ie n te d el l gen rico?" , C ie n c ia P s i
c o l g i c a [ P s y c h o l o g i c a l S c ie n c e ], 8, 108. C opyright, 1 9 9 7 , por la S o c ie d a d A m erican a de P sic o lo g a
[A m erican P s y c h o lo g ic a l S o c ie ty ]. R eim p reso c o n a u torizacin .]

en la que una persona se comportaba de forma ms amistosa que otra, y luego les preguntaron qu
persona sera ms propensa a ser amistosa en el futuro.
As informaron Chiu et al. uno de sus descubrimientos acerca de los tericos de entidades:
"Para ellos, si una persona result ser ms amistosa que otra en una determinada situacin, es ms
probable que la misma relacin se generalice a otras situaciones totalmente diferentes" (p. 23). El
sustento estadstico de esta conclusin fue descripto de la siguiente manera: La prediccin glo
bal de los tericos de entidades [acerca de la probabilidad de que la persona fuera amistosa] fue
significativamente mayor a 0,50 (95% IC - 0,5583 0,0348) (p. 23). Es decir que podemos te
ner un 95% de confianza de que, en la poblacin, la probabilidad real estara entre 0,5235 y
0,5931, todos nmeros superiores al 0,50 que esperaramos si los tericos de entidades hubieran
elegido al azar. Por el contrario, Chiu et al. descubrieron que los individuos que no eran tericos
de entidades tuvieron un nivel de prediccin significativamente menor al 0,50, con un intervalo
de confianza de 0,3648 a 0,4902.

RESUMEN*6
Al estudiar una muestra de ms de un individuo, la distribucin comparativa en el proceso de
prueba de hiptesis es una distribucin de medias de todas las muestras posibles de tamao igual
a la cantidad de casos que se estn estudiando. Podemos considerar que esa distribucin descri
be cul sera el resultado de a) tomar una gran cantidad de muestras, cada una con la misma can
tidad de unidades seleccionadas al azar de la poblacin de individuos y, luego b) crear una
distribucin de las medias de esas muestras.
La distribucin de medias tiene la misma media que la poblacin de observaciones. Sin em
bargo, tiene una varianza menor porque las medias mustrales tienen menos probabilidad de ser
extremas que las observaciones individuales. (Los extremos de cualquier muestra tienden a
equiparse con los valores centrales o los valores extremos en direccin opuesta). Especficamen
te, la varianza de ia distribucin de medias es la varianza de la poblacin de observaciones indi
viduales dividida por la cantidad de individuos que forma cada muestra (el desvo estndar es la
raz cuadrada de la varianza). La forma de la distribucin de medias se aproxima a la curva nor
mal si a) la poblacin de individuos sigue una curva normal o b) las muestras tienen 30 registros
cada una, o ms.
Las pruebas de hiptesis que involucran una sola muestra de ms de un individuo y una pobla
cin conocida se realizan de la misma forma que las pruebas de hiptesis presentadas en el captulo
6 (donde los estudios se realizaban con un slo individuo comparado con una poblacin de indivi
duos). La excepcin principal es que la distribucin comparativa es una distribucin de medias.
La mejor estimacin puntual de la media poblacional es la media maestral. Podemos deter
minar una estimacin por intervalo de la media poblacional basndonos en la distribucin de me
dias. Cuando la distribucin de medias sigue una curva normal, el intervalo del 95% de confianza
incluye todos los nmeros, desde 1,96 desvos estndar por debajo de la media maestral (lmite
de confianza inferior) hasta 1,96 desvos estndar por encima de la media maestral (lmite supe
rior de confianza). El intervalo del 95% de confianza es un intervalo de valores acerca del cual te
nemos un 95% de seguridad de que incluye la verdadera media poblacional.
Uno de ios aspectos del debate actual acerca de las pruebas de significacin plantea si los in
vestigadores deberan reemplazarlas por los intervalos de confianza. Aquellos que proponen los
intervalos de confianza sostienen que stos brindan informacin adicional, se concentran en la es
timacin y reducen la utilizacin incorrecta propia de las pruebas de significacin. Sin embargo,
los intervalos de c'rifianza rara vez se utilizan en las publicaciones cientficas psicolgicas, en

parte, debido a la costumbre y a la falta de familiaridad coa ellos, as como tambin a la incomo
didad que presenta su descripcin. Adems, aquellos que se oponen a basarse exclusivamente en
los intervalos de confianza sostienen que ios intervalos no pueden utilizarse en algunos procedi
mientos avanzados, que la estimacin no siempre es el objetivo deseado y que tambin los inter
valos pueden utilizarse de formas incorrectas propias de ellos.
El tipo de prueba de hiptesis descripfa en este captulo rara vez se utiliza en la investigacin
prctica (la hemos aprendido como escaln hacia otros temas). El desvo estndar de la distribu
cin de medias, con frecuencia denominado error estndar (SE), en ocasiones se utiliza para
describir la variabilidad esperada de las medias, particularmente en grficos de barra en los que el
error estndar puede representarse por la longitud de un segmento ubicado sobre o debajo de la
parte superior de cada barra.

Trminos clave
-

intervalo de confianza (.IQ .


Lhmtes.de confianza.
Distribucin de medias.
Estimacin por intervalos.
Media de una distribucin
de medias (mM).

Intervalo del 95%


de confianza.
Intervalo del 99%
de confianza.
Estimacin puntual.
Forma de la distribucin
de medias.

- Desvo estndar de una


distribucin de medias (aM).
- Error estndar de la media (SE).
- Varianza de una distribucin
de medas (o2^).
- Prueba Z.

nor que el desvo estndar de la distribucin


poblacional de observaciones individuales.
Los ejercicios implican la realizacin de clcu
2. En el caso de una poblacin de obser
los (con la ayuda de una calculadora). La ma vaciones individuales que tiene un desvo es
yora de los problemas estadsticos reales se tndar de 10, cul es el desvo estndar de la
resuelven por computadora, pero aunque exis distribucin de medias de muestras de los si
ta la posibilidad de utilizarla, es conveniente guientes tamaos: a) 2, b) 3, c) 4, d) 5, e) 10,
realizar estos ejercicios manualmente para in f) 20 y g) 100?
corporar el mtodo de trabajo.
3. Para cada uno de los casos del problema
Para adquirir prctica en la utilizacin de 2 calcule el intervalo del 95% de confianza (es
una computadora, para resolver problemas es decir, los lmites de confianza superior e infe
tadsticos, se puede utilizar a seccin de com rior). Suponga en cada caso que la muestra del
putacin de cada captulo, publicada en la Gua
investigador tiene una media de 100 y que la
de estudio y libro de tareas de computacin pa
poblacin sigue una distribucin normal.
ra el alumno {Student's Study Guide and Com
4. Cierta poblacin de individuos tiene una
puter Workbook] que acompaa este libro.
media
de 40, un desvo estndar de 6, y sigue
Todos los datos de esta seccin son ficti
una
distribucin
normal. Indique si cada una
cios (a menos que.se especifique lo contrario).
Las respuestas a los ejercicios de la serie I de las siguientes muestras est entre las que
tendran menos del 5% de probabilidad de ser
se encuentran al final del libro.
seleccionadas al azar de esa poblacin: a) una
muestra de 10 con una media de 44; b) una mues
tra de 1 con una media de 48; c) una muestra
SERIE I
de 81 con una meda de 42; y d) una mues
1.
Explique por qu el desvo estndar de
la distribucin de medias generalmente es me tra de 16 con una media de 42. En cada caso

Ejercicios

a) muestre los clculos por los cuales lleg a su


respuesta y b) incluya un diagrama de las dis
tribuciones involucradas.
5. Veinticinco mujeres de entre 70 y 80 aos
de edad fueron seleccionadas ai azar de la pobla
cin general de mujeres de esa edad para partici
par en un programa especial para disminuir el
tiempo de reaccin. Despus del curso, las muje
res teman un tiempo de reaccin promedio de
1,5 segundos. Suponiendo que el tiempo de reac
cin medio para la poblacin general de mujeres
de esa edad es 1,8, con un desvo estndar de
5 segundos (y que adems la poblacin es apro
ximadamente normal), cul sena su conclusin
acerca de la eficacia del curso? a) Siga los pasos
de la prueba de hiptesis (utilice el nivel 0,01).
b) Calcule el intervalo del 99% de confianza.
c) Explique su respuesta a alguien que est fami
liarizado con la lgica general de la prueba de hi
ptesis, la curva normal, las puntuaciones Z y la
probabilidad, pero que no est familiarizado con
la idea de una distribucin de medias o de un in
tervalo de confianza.
6. Una gran cantidad de personas obser
v un filme sobre un accidente automovilsti
co entre un automvil en movimiento y un
automvil detenido. Cada persona llen lue
go un cuestionario sobre cun verosmil es
que el conductor del automvil en movimien
to tuviera la culpa, conforme a una escala que
iba desde no tuvo la culpa = 0 hasta fue
completamente culpable = 10. La distribu
cin de las puntuaciones en condiciones ordi
narias sigue una distribucin normal, i = 5,5,
y a = 0,8. Se analizan las respuestas de dieci
sis individuos seleccionados al azar, a quie
nes se les cambi la redaccin de la pregunta.
En estas distintas condiciones, la pregunta
es: Cun verosmil es que el conductor del
auto que se estrell contra el otro fuera el
culpable? (La diferencia radica en que, en es
tas condiciones, en lugar de describir el he
cho en forma neutra, la pregunta utiliza la
frase se estrell). Utilizando estas instruc
ciones diferentes, los 16 participantes dieron
una media, en cuanto a la puntuacin de cul
pabilidad, de 5,9. El cambio de instruccio
nes aument significativamente la puntuacin

media de culpabilidad? a) Siga los pasos de


la prueba de hiptesis (utilice el nivel 0,05).
b) Calcule el intervalo del 95% de confianza.
c) Explique su respuesta a alguien que nunca
ha estudiado estadstica.
7.
Corte 90 papeles pequeos y escriba
10 veces los nmeros del 1 al 9, una en cada
papel. Ponga los papeles en un recipiente
grande y mzclelos. Ahora saque un papel,
escriba el nmero que se lee en el papel y regrselo al recipiente. Realice este mismo
procedimiento 20 veces. Cree un histograma
y calcule la meda y la varianza del resulta
do. Debera obtener una distribucin aproxi
madamente rectangular. Despus tome dos
papeles, calcule su media, antela y vuelva a
colocar los papeles en el recipiente.6 Repita
este proceso unas 20 veces. Cree un histo
grama y luego calcule la media y la varianza
de esta distribucin de medias. La varianza
debera ser aproximadamente la mitad de la
varianza anteriormente calculada. Finalmen
te, repita el proceso nuevamente, pero esta
vez sacando tres papeles por vez. La distri
bucin de medias de tres papeles por vez de
bera tener una varianza de aproximadamente
un tercio de la distribucin de muestras de un
papel cada una. Observe tambin que, a medi
da que aumenta el tamao de la muestra, sus
distribuciones se acercan a lo normal. (Si hu
biera comenzado con una distribucin de pape
les normalmente distribuida, las distribuciones
de medias hubieran estado bastante cerca de lo
normal, independientemente de la cantidad de
papeles de cada muestra).

5 Tcnicamente, ai sacar las muestras de dos papeles, de


bera hacerlo, sacando una, anotando el nmero y ponin
dola luego con las dems. Luego, sacando la otra,
escribiendo el nmero y ponindola nuevamente con las
dems. Estas dos observaciones se consideraran una
muestra de la cual se calculara la media. Lo mism o se
aplica a muestras de tres papeles. El proceso descripto se
denomina muestren con reem plazo. Sin embargo, con 90
papeles en un recipiente, sacar dos o tres papeles al mis
mo tiempo y ponerlos nuevamente con los dems ser
una aproximacin bastante cercana para este ejercido y
le ahorrar algo de tiempo.

normalmente con una media de 82 (de un to-.


L En qu condiciones es razonable supo tal de 100) y una varianza de 20. La distribu
ner que una distribucin de medias seguir una cin se basa en las posiciones obtenidas al
identificar las emociones expresadas por
distribucin normal?
miembros de su propia cultura (otros nortea
2.
Indique la media y el desvo estndar de
la distribucin de medias de cada una de las si mericanos). En el estudio que estamos anali
zando, el investigador organiza a 50 adultos
guientes situaciones:
norteamericanos para que identifiquen las
emociones de individuos de Indonesia. La
P ob lacin T am ao M u estra
precisin media de estos 50 individuos fue
M e d ia
V a ria n za
78, Utilizando un nivel de 0,05, cul debera
10
100
40
(a)
ser la conclusin del investigador? a) Siga los
10
100
30
(b)
100
20
10
pasos de la prueba de hiptesis, b) Calcule el
(c)
100
10
10
(A)
intervalo del 95% de confianza, c) Explique
(e)
10
50
10
su respuesta a alguien que nunca ha estudiado
100
40
20
(0
estadstica.
100
10
20
(g )
6.
Un psiclogo est interesado en las
condiciones
que afectan la cantidad de sue
3. Para cada uno de los ejemplos anterio
res, calcule el intervalo del 95% de confianza, os que las personas recuerdan por mes y en
suponiendo que el investigador tena una me los cuales se encuentran solos. Supondremos
dia muestra! de 80 en cada caso (y que las po que, basndonos en previas investigaciones
extensivas, se sabe que en la poblacin gene
blaciones siguen una distribucin normal),
4. Basndose en la informacin dada, esta ral la cantidad de tales sueos por mes sigue
blezca su conclusin para cada estudio. (Ase una distribucin normal, con g = 5 y = 4.
grese de indicar las caractersticas de la El investigador desea probar la prediccin
distribucin comparativa, el punto de corte, el que establece que la cantidad de sueos co
valor de la media muestral en la distribucin mo los descriptos ser mayor entre aquellas
comparativa y su conclusin en cuanto al re personas que recientemente hayan experi
chazo o no de la hiptesis nula. Todas las prue mentado un hecho traumtico. Por lo tanto,
el psiclogo analiza 36 individuos que han
bas de hiptesis son de dos colas).5
experimentado recientemente un hecho trau
mtico, hacindoles llevar un registro de sus
M ed ia
N ivel de
P ob lacin T am ao
sueos durante un mes. La media de sueos
m u estr a l m u estr a l sig n ifica c i n
en
los que se encuentran solos es 8. Llega
<7
Pra usted a la conclusin de que las personas
36
8
16
0,05
38
(a)
que han sufrido recientemente una experien
0,05
6
16
38
36
(b)
4
0,05
36
16
38
0
cia traumtica tienen una cantidad significa
4
16
38
36
0,01
(d)
tivamente diferente de sueos en los que se
4
34
0,01
16
38
(e)
encuentran solas? a) Siga los pasos de la
prueba de hiptesis (utilice el nivel 0,05).
5.
Un investigador est interesado en aveb) Calcule el intervalo del 95% de confianza.
riguar si las personas son capaces de identifi c) Explique su respuesta a alguien que est fa
car correctamente las emociones de personas miliarizado con la lgica general de la prueba
de otras culturas. Se sabe que utilizando de de hiptesis, la curva normal, las puntuaciones
terminado mtodo de medicin, las posicio Z y la probabilidad, pero que no est familiari
nes en cuanto a la precisin de los adultos zado con la idea de una distribucin de medias
norteamericanos en general estn distribuidas o intervalos de confianza.

SERIE El

P
P
P
P
P
P
P
P
P
P

Qu es la potencia estadstica?
P Potencia, tamao del efecto e intervalos
de confianza.
Alfa, beta y potencia.

M
eta-ansis.
. .
Clculo de la potencia estadstica.
P
Controversias
y
lim
itaciones:
continuacin
Tablas de potencia.
de la controversia acerca de la
Qu factores determinan la potencia de
significacin estadstica: tamao del efecto/
un estudio?
versus significacin estadstica.
Tamao del efecto.
P Potencia y tamao del efecto segn se
Tamao de la muestra.
describen en publicaciones cientficas.
Otros factores que influyen en la potencia, . P Resumen.
...v
Papel que desempea la potencia al disear P Trminos clave.
un experimento.
P Ejercicios.
La importancia de a potencia en a
evaluacin de los resultados de un estudio.

otencia es ia capacidad para cumplir objetivos. Por eso, una medida razonable de
potencia en cualquier situacfddi es la probabilidad de cumplir con los objetivos
en esa determinada situacin. El objetivo de un investigador que realiza un experi
mento es la obtencin de un resultado significativo, siempre que la hiptesis de in
vestigacin realmente sea verdadera. La potencia estadstica de un estudio es la
probabilidad de que ese estudio tenga un resultado significativo si la hiptesis de investigacin
es verdadera.
.... '
....
Calcular la potencia al planificar un estudio ayuda a definir la cantidad de participantes que
se van a utilizar. Adems, comprender el concepto de potencia es sumamente importante para
cualquiera que lea publicaciones de investigacin psicolgica; por ejemplo, para comprender los
resultados experimentales que no son significativos o resultados que son significativos estadsti
camente pero no en la prctica.
En este captulo, examinamos sistemticamente el concepto de potencia estadstica. Qu es,
cmo se calcula, qu tactores influyen en ella, y por qu es importante. Es nuestra obligacin ad
vertir que, a veces, este material acerca de la potencia puede resultar particularmente difcil de
captar. Pero vale la pena aprenderlo. Por eso, recomendamos ai lector ser paciente consigo mismo
y tomarse todo el tiempo que sea necesario. Estamos seguros de que lo lograr.
Como parte del proceso de aprendizaje de la potencia, el captulo tambin presenta la nocin
de tamao del efecto. Como veremos, el tamao del efecto es un punto crucial para comprender la
potencia, y un tema de considerable importancia en s mismo para comprender las investigacio
nes psicolgicas.

QU ES LA POTENCIA ESTADSTICA?__________________________________
Dijimos que ia potencia estadstica de un experimento es la probabilidad de que el estudio arroje
un resultado significativo si la hiptesis de investigacin es verdadera. Es importante tener en
cuenta que la potencia de un experimento implica determinada situacinNsi la hiptesis de investi
gacin es verdadera. No nos interesa lograr un resultado significativo si la hiptesis de investiga
cin es falsa.
Ahora bien, podramos preguntamos lo siguiente:Si la hiptesis de investigacin es verda
dera, no dar el experimento automticamente un resultado significativo? La respuesta es no;
puede ocurrir que la muestra particular que fue seleccionada de la poblacin no resulte lo sufi
cientemente extrema como para rechazar la hiptesis nula._

Ejemplo
Analicemos nuevamente el ejemplo del captulo 7 acerca de las instrucciones especiales a alum
nos de quinto grado que estn dando un examen estndar de nivel. En el proceso de prueba de hi
ptesis de este ejemplo comparamos dos poblaciones:
Poblacin 1:
Poblacin 2:

alumnos de quinto grado que reciben instrucciones especiales.


alumnos de quinto grado que no reciben instrucciones especiales.

La hiptesis de investigacin estableca que la poblacin 1 tendra puntuaciones ms altas que la


poblacin 2.
-Ho '
> lA ^
La distribucin superior de la figura 8-1 grfica la situacin en la que la hiptesis de inves
tigacin es verdadera. La distribucin inferior representa a la poblacin 2. Dado que estamos
interesados en medias de muestras formadas por 64 individuos, ambas distribuciones son dis
tribuciones de medias,
La distribucin inferior es tambin la distribucin comparativa, es decir, la distribucin de
medias que esperaramos para ambas poblaciones si la hiptesis nula fuera verdadera. El rea
sombreada en la cola derecha de la distribucin inferior es el rea en la cual rechazaramos la hi
ptesis nula si, como resultado del estudio, la media muestral se encontrara bajo esa rea. El rea
de rechazo sombreada comienza a 209,84 (una puntuacin Z de 1,64) y abarca un 5% de la distri
bucin comparativa.
La distribucin de medias superior es la que predicen los investigadores para la poblacin
que recibe instrucciones especiales (poblacin 1). En el captulo 7, nunca hablamos de esa distri
bucin, en parte porque la distribucin de la poblacin predicha es bastante imaginaria, a m enos
que la hiptesis de investigacin sea verdadera. Si la hiptesis nula es verdadera, la distribucin
de la poblacin 1 sera igual a la distribucin que se basa en la poblacin 2. Es decir, si la hipte
sis nula es verdadera, la distribucin de la poblacin 1 no estara desplazada hacia la derecha.
No obstante, para aprender el tema de la potencia, aqu analizamos la situacin en la cual la
hiptesis de investigacin es verdadera. En esa situacin, la media de la poblacin 1 se encuentra
ms hacia la derecha que la media de la poblacin 2 (distribucin comparativa). Es decir, en esa
situacin, las puntuaciones en el examen de nivel son, en promedio, mayores en la poblacin 1
que en la poblacin 2. Especficamente, la distribucin de medias superior (poblacin 1 predicha)
tiene una media de 208; la media de la distribucin comparativa es slo de 200, lo que muestra
que se espera que la poblacin que recibe las instrucciones especiales (poblacin 1) tenga una
media 8 puntos mayor,

Supongamos ahora que los psiclogos expertos en educacin realizan el experimento. stos
dan as instrucciones especiales a un grupo de 64 alumnos de quinto grado y calculan la puntua
cin media en el examep. Supongamos que la hiptesis de investigacin es verdadera. Recorde
mos que si la hiptesis de investigacin es verdadera, la media del grupo de 64 alumnos de quinto
grado pertenece a una distribucin semejante a la curva superior en la figura 8-1.
En este ejemplo, sin embargo, la distribucin superior de medias (tomada de la prediccin del
investigador sobre la poblacin 1) se encuentra slo levemente volcada hacia la derecha de la dis
tribucin comparativa. Es decir, los psiclogos predicen slo un pequeo aumento de los registros
(ocho puntos) a causa de las instrucciones especiales; por lo tanto, la distribucin superior se en
cuentra desplazada slo una pequea distancia hacia la derecha en comparacin con la distribu
cin inferior, que es la distribucin comparativa. Lo que la figura nos indica es que cualquier

Figura 8-1. D istrib u cio n es d e la s p u n tu a cio n es m ed ia s d e ex m e n e s r en d id os por 6 4 alum nos de quinto


g rado, tom adas d e un estu d io fic tic io d e a lu m n o s de qu into grado rin d ien d o un exam en estndar d e n ivel.
L a distribu cin d e m e d ia s inferior s e ba sa en una distribu cin c o n o c id a d e p u n tu acion es in d ivid u ales d e
a lu m n o s d e qu into grado qu e n o recib iero n n in g u n a instruccin e sp e c ia l en cuanto al e xam en (p ob lacin
2 ). L a d istribu cin d e m ed ia s superior se basa en una distribu cin predicha d e pu ntuacion es in d ivid u ales de
a lu m n o s d e qu into grado qu e recib iero n in stru ccio n es e sp e c ia le s en cuanto d ex a m e n (p o b la c i n 1). L os
in v estig a d o res predicen un a m e d ia d e 2 0 8 para e sta p ob lacin . L as reas som breadas de am bas distribu
c io n e s m uestran el rea bajo la cu a l ser rechazada la h ip tesis nula.

media tomada de ia distribucin superior no estar, probablemente, lo suficientemente volcada


hacia la derecha en la distribucin inferior como para rechazar la hiptesis nula. De hecho, me
nos de la mitad de la distribucin superior est sombreada. Para decirlo de otro modo, si la hip
tesis de investigacin es verdadera, la muestra que estudiamos es, en efecto, una muestra aleatoria
de ia distribucin que aqu aparece como poblacin 1. Sin embargo, las chances de que una mues
tra aleatoria de esa poblacin se encuentre bajo el rea sombreada estn por debajo del 50%.
Por ejemplo, supongamos que la muestra analizada, formada por 64 alumnos de quinto gra
do, tena una media de 208,5, tal como lo indica ia flecha en la figura. Dado que es necesario una
media de al menos 209,84 para rechazar la hiptesis nula, el resultado de este experimento no se
ra significativo. No lo sera, aun cuando la hiptesis de investigacin en realidad es verdadera (y
aun cuando el valor muestral es mayor que la media de la distribucin comparativa).
Indudablemente, es posible que los investigadores pudieran seleccionar una muestra de la
poblacin 1 con una media lo suficientemente alejada hacia la derecha como para ubicarse bajo
el rea sombreada (es decir, con un promedio en el examen lo suficientemente alto). Sin embar
go, dada la forma en la que hemos establecido el ejemplo, las chances de que el experimento n
resulte significativo son ms del 50%, aun cuando sabemos que la hiptesis de investigacin es
verdadera.
Cuando un estudio tiene chances de menos del cincuenta por ciento de resultar significativo,
aun s la hiptesis de investig
decimos que el estudio tiene baja poterna. Pero,
qu sucedera si la situacin fuera tal que se esperara que la curva superior estuviera corrida bien
a la derecha de la curva inferior, es decir, que la prediccin fuera que aquellos que rinden el exa
men con las instrucciones especiales tendrn puntuaciones realmente altas? (La figura 8-3 que
aparece ms adelante en el captulo es un ejemplo de este tipo de situacin). En la situacin des
cripta, la mayor parte bajo la curva superior estara sombreada, y casi cualquier muestra tomada
de esa curva superior estara bajo el rea de rechazo de la curva inferior. Lo anterior significa que
cuando uno realiza e estudio, la probabilidad de obtener un resaltado significativo sera alta, por
lo cual el estudio tendra potencia alta.

ALFA, BETA Y POTENCIA_______________ _______________________________


Al analizar la significacin estadstica y la potencia, es til pensar en funcin de tipos de erro
res que uno podra cometer al utilizar la prueba de significacin. Es importante comprender que
no estamos hablando de cometer errores con los clculos ni tampoco de utilizar los procedimien
tos equivocados. Estamos hablando de que, incluso cuando hacemos todo adecuadamente, aun
podemos sacar conclusiones errneas. Es decir, estamos hablando de error en el sentido de obte
ner un resultado equivocado de un procedimiento correcto. En ese sentido, podemos cometer dos
tipos de errores: error Tipo I y error Tipo II.1

Error Tipo 1y alfa


Supongamos que realizamos un estudio y establecemos el corte del nivel de significacin en un
nivel de probabilidad muy alto, como por ejemplo del 20%. En esas condiciones, la hiptesis nu
la sera rechazada muy fcilmente. Si realizramos muchos estudios de este tipo, con frecuencia
(aproximadamente un 20% de las veces) decidiramos que la hiptesis de.invesdgacin se susten
1 Ocasionalmente puedes llegar a escuchar mencionar el error Tipo III. Se trata de llegar a la conclusin de que existe
un resultado significativo en una determinada direccin cuando e efecto real es en la direccin opuesta.

a cuando, en realidad, no deberamos hacerlo. A esto se lo denomina error T ip o I La probabili


dad de cometer un error Tipo I, que se denomina alfa, es el nivel de significacin. Por lo tanto, en
la mayora de los estudios, alfa es igual a 0,05.
Ai realizar investigaciones, nunca sabemos a ciencia cierta s la hiptesis de investigacin o
la hiptesis nula son verdaderas. Los resultados del procedimiento de prueba de hiptesis pueden
o no llevamos a rechazar la hiptesis nula, pero, en cualquier caso, no estamos seguros de haber
tomado la decisin correcta.
Supongamos que las instrucciones especiales, en nuestro ejemplo de los alumnos de quinto
grado, en realidad no produjeron ninguna diferencia, y que la hiptesis nula era verdadera. Su
pongamos adems que al realizar el estudio, simplemente sucedi que los investigadores selec
cionaron, para recibir las nuevas instrucciones, a algunos alumnos que eran inusualmente buenos
en ese tipo de examen. Aunque es poco probable, podra suceder, y el efecto sera que los investi
gadores rechazaran la hiptesis nula y concluiran que las instrucciones especiales producen una
diferencia. Esta decisin de rechazar la hiptesis nula sera equivocada, error Tipo . Por supues
to, los investigadores no podran saber que cometieron un error de este tipo. La seguridad que tie
nen los investigadores es saber que la probabilidad de cometer tal error es baja (menos del 5% si
utilizamos el nivel de significacin de 0,05).'
Los errores Tipo I son una gran preocupacin para los investigadores psicolgicos, quienes
podran construir teoras completas y programas de investigacin, para no mencionar aplicacio
nes prcticas, sobre la base de conclusiones derivadas de pruebas de hiptesis que en realidad es
tn equivocadas. Debido a que estos errores son tan preocupantes, se los denomina Tipo I.
Como ya hemos sealado, los investigadores no pueden saber cundo han cometido un error
Tipo I; no obstante, pueden intentar realizar estudios en los que las posibilidades de cometer un
error Tipo I sean lo ms pequeas posibles. Supongamos que para determinado estqdio establece
mos el nivel de significacin en ?<0,05, que indica que rechazaremos la hiptesis nula si existe
menos de un 5% (0,05) de probabilidad de que pudiramos haber obtenido nuestro resultado si la
hiptesis nula fuera verdadera, AI rechazar a hiptesis nula en esas circunstancias, estamos ad
mitiendo hasta un 5% de probabilidades de obtener nuestro resultado aun cuando la hiptesis nu
la fuera realmente verdadera. Es decir, estamos admitiendo un 5% de probabilidad de cometer un
error Tipo I; alfa es igual al 5%.
Podramos disminuir alfa haciendo an menos probable el rechazo de la hiptesis nula por
error. Por ejemplo, utilizar un nivel 0,001 de significacin sera como contratar un seguro contra
el error Tipo I. En ese caso, habra menos de una posibilidad en mil de cometer el error Tipo I. Sin
embargo, al igual que cuando contratamos un seguro, a mayor proteccin, ms alto es el costo.
Existe un costo que pagar por establecer un nivel de significacin a un nivel demasiado extremo.
A continuacin hablaremos acerca de ese costo.

Error tipo II y beta


Si establecemos un nivel de significacin muy riguroso, como por ejemplo 0,001, corremos otro
tipo de riesgo. En ese caso, podemos realizar un estudio en el que la hiptesis de investigacin es
verdadera pero el resultado no es lo suficientemente extremo como para rechazar a hiptesis nu
la. Por lo tanto, el error que cometeramos sera no rechazar la hiptesis nula cuando, en reali
dad, la hiptesis nula es falsa. Este es el error Tipo n . La probabilidad de cometer un error Tipo;
II se denomina beta. (No debemos confundir esta beta con el coeficiente de regresin estandari
zado que explicamos en el captulo 4, al que tambin llamamos beta).

' Analicemos nuevamente el ejemplo sobre los alumnos de quinto grado. Supongamos que, en
verdad, dar las instrucciones especiales s hace que los alumnos de quinto grado se desempeen
mejor en el examen. Sin embargo, al realizar el estudio, los resultados no muestran ese patrn. Tal
vez, la muestra que seleccionamos al azar para probar las nuevas instrucciones incluan principal
mente alumnos de quinto grado con un nivel particularmente bajo para este tipo de examen. Co
mo hemos visto, aun cuando el procedimiento pueda haberlos ayudado a lograr un mejor
desempeo, de todos modos sus puntuaciones pueden no ser mucho ms altas que el promedio de
los alumnos de quinto grado que no recibieron instrucciones especiales. Los resultados no seran
significativos. Por lo tanto, haber decidido no rechazar la hiptesis nula, y rehusarse a sacar una
conclusin, sera un error Tipo II. Los errores Tipo II preocupan especialmente a los psiclogos
interesados en aplicaciones prcticas, ya que un error de este tipo podra provocar que no se implemente un procedimiento prctico til.
Al igual que con los errores Tipo I, no podemos saber cundo hemos cometido un error Tipo II.
Pero podemos intentar realizar nuestros estudios de forma tal de reducir la probabilidad de come
ter un error Tipo II. Una forma de contratar un seguro contra un error Tipo II es establecer un ni
vel de significacin muy indulgente, como por ejemplo p<0,10 incluso p<0,20. De ese modo,
aun cuando un estudio arroje una diferencia muy pequea, hay muchas chances de que los resul
tados sean significativos. No obstante, tambin hay que pagar un costo por esta pliza de seguros.
El costo es correr demasiado riesgo de cometer un error Tipo I.
Un error Tipo II ocurre cuando decidimos que el experimento no es concluyente (no rechaza
mos la hiptesis nula) y en realidad nuestra hiptesis de investigacin era verdadera. En ese caso,
el experimento no sustent la hiptesis de investigacin cuando debera haberlo hecho. Esta es la
situacin ilustrada en la figura 8-1. En ese ejemplo, se cometi un error Tipo II.
En la figura 8-1, beta es el rea no sombreada de la distribucin superior (distribucin que se
basa en la prediccin de la hiptesis de investigacin con respecto a l poblacin 1). Es el rea
donde, aun cuando la hiptesis de investigacin sea verdadera, una media no sera lo suficiente^mente extrema como para que podamos rechazar la hiptesis nula; es el rea de la distribucin su
perior que se encuentra a la izquierda del punto en el que comienza el rea alfa en la distribucin
inferior (comparativa).
La potencia de un experimento es la probabilidad de que si la hiptesis de investigacin es
verdadera, el experimento la sustente (rechace la hiptesis nula). Es decir, potencia es la probabi
lidad de no cometer un error Tipo II. Numricamente, potencia es 1 menos beta. En la figura 8-1,
la potencia es la porcin sombreada de la distribucin superior. En este ejemplo (el 50% del rea
bajo la curva), es menor a 0,5.

R elaci n entre los errores Tipo I y Tipo H

Al momento de establecer los niveles de significacin, protegerse contra un tipo de error aumenta
las chances de cometer el otro tipo de error. El costo de la pliza de seguros contra el error Tipo I
(establecer un nivel de significacin de, digamos, 0,001) es aumentar beta, la probabilidad de co
meter el error Tipo II. (Esto ocurre porque con un nivel de significacin extremo como 0,001, aun
si la hiptesis de investigacin es verdadera, los resultados deben ser demasiado contundentes pa
ra ser lo suficientemente importantes como para rechazar la hiptesis nula). El costo de la pliza
de seguros contra el error Tipo H (establecer un nivel de significacin de, digamos, 0,20) es au
mentar las posibilidades de cometer el error Tipo I. (Esto ocurre porque con un nivel de significa
cin como 0,20, aun si la hiptesis nula fuera verdadera, es bastante fcil obtener un resultado

significativo slo por haber seleccionado accidentalmente una muestra que, aun antes de realizar
el estudio, tema un nivel mayor o menor que la poblacin general).
La negociacin entre estos dos temas conflictivos se resuelve usualmente por convencin; a
eso se deben los niveles de significacin estndar del 5% y el 1%,
Tabla 8-1.
P o s i b l e s d e c i s i o n e s c o r r e c t a s y e r r n e a s e n la p r u e b a d e h i p t e s i s .

C o n d ici n real de la
h ip tesis de in vestigacin
(en la p r c tic a , d esco n o cid o )
V e r d a d e ra

, E nor.
, tipo u; :.
p = beta

Ctf . j

D ecisi n
.correcta;
. tipo s;
p = potencia

S e s o s tie n e la h ip te s is d e in v e s tig a c i n
(s e r e c h a z a la h ip te s is n u la )

E l e s tu d io n o e s c o n c lu y e n te
(n o s e p u e d e r e c h a z a r la h ip te s is n u la )

F a lsa

D ecisi n : '
conecta;.'
p .=.l - alfa. L v

Visin general de ios posibles resobados de la prueba de hiptesis


teniendo en cuenta alfa, beta y la potencia
La tabla 8-1 diagrama las posibles decisiones conectas y errneas en la prueba de hiptesis. En la
parte superior de la tabla encontramos las dos posibilidades en cuanto a la veracidad o no de la hi
ptesis de investigacin. (Esto nunca lo sabemos realmente). En el costado se plantea si, despus
de realizar la prueba de hiptesis, decidimos que los resultados a) sostienen la hiptesis de inves
tigacin (rechazan la hiptesis nula) o b) no son concluyentes (no rechazan la hiptesis nula).
Luego, la tabla muestra los dos modos de tomar la decisin correcta y los dos modos de co
meter el error que hemos analizado en esta seccin. Tambin muestra los nombres de la probabi
lidad de cada una de las cuatro posibles decisiones correctas o errneas.

CLCULO DE LA POTENCIA ESTADSTICA


La potencia de un experimento se puede calcular. En el ejemplo de los alumnos de quinto gra
do, calcular la potencia impliea c alculr l'rede la porcin sombreada en la distribucin su
perior de la figura 8-L Las distribuciones de medias son, por lo general, aproximadamente
normales, y este es claramente el caso del ejemplo que estamos analizando (ya que el tamao
de la muestra es mayor a 30). Por lo tanto, para realizar los clculos de la potencia utilizaremos
puntuaciones Z. Primero, calculamos la puntuacin Z correspondiente al punto en el que co
mienza el rea sombreada en la distribucin superior; luego, determinamos el rea correspon
diente a travs de la tabla de reas bajo la curva normal.

Ejem plo

Volvamos a analizar Ja figura 8-1 que representa grficamente las distribuciones de medias del
ejemplo de los alumnos de quinto grado. La poblacin de individuos que no recibe instrucciones
especiales tena una media de 200 y un desvo estndar de 48 (una varianza de 2.304). Los inves
tigadores analizaron una muestra de 64 alumnos de quinto grado. De ese modo, en el captulo 7
calculamos que el desvo estndar de ia distribucin de medias es 6 (es decir, V2VS04/64 - 6).
Anteriormente, en este mismo captulo, dijimos que los investigadores predijeron que las instruc
ciones especiales aumentaran la meda a 208. La figura 8-2 muestra las puntuaciones Z corres
pondientes a ambas distribuciones, basndose en estos nmeros.2

F ig u r a 8 -2 . D istrib u cio n es d e m e d ia s de 6 4 resu ltad os d e e x m e n e s, basadas e n d istrib u cion es predichas


(superior) y c o n o c id a s (in ferior) de un e stu d io fic tic io de alu m n os de q u in to g rad o qu e recib en instruc
c io n e s e sp e c ia le s antes d e rendir un e x a m en estndar d e n ivel. E n am bas d istrib u cion es se indican las pun
tu a cio n es Z y las pu ntuacion es o rig n a les corresp on d ien tes al pu nto de corte basado en la distribu cin
inferior. (E l punto d e corte corresp on d e a un n ivel d e sig n ific a c i n d e p < 0 ,0 5 , prueba d e una co la ).

2 Normalmente suponemos

que, independientemente de que la hiptesis nula sea verdadera (es decir, si las medias
d las dos poblaciones son iguales), las varianzas de ambas poblaciones sern iguales. Las distribuciones de medias de
ambas poblaciones tambin se basan en la misma cantidad de observaciones en cada muestra (en este ejemplo 64). Por
lo tanto, los desvos estndar de estas dos distribuciones d medias tambin sern iguales.

En el captulo 7 determinamos que, utilizando un nivel de significacin del 5%, con una prue
ba de una cola, para rechazar ia hiptesis nula necesitamos que la puntuacin Z correspondiente a
la media muestra1sea de, al menos, 1,64. Utilizando la frmula para convertir puntuaciones Z en
puntuaciones originales, la puntuacin Z determinada corresponde a una puntuacin original de
209,84, es decir, 200 + (1,64 x 6) = 209,84.
Como ya dijimos, ios investigadores predijeron una media de 208 para los alumnos de quinto
grado que reciben instrucciones especiales (poblacin 1). El punto de corte de 209,84 est 1,84
puntos de prueba por encima de la media general de 208 de esa distribucin, dando una puntua
cin Z de 0,31 (es decir, 1,84/6-0,31).
La tabla de reas bajo la curva normal muestra que un 12% del rea se encuentra entre la me
dia y una Z de 0,31. Por lo tanto, un 38% supera a la Z de 0,31. En otras palabras, un 38% de la
distribucin de medias predicha para la poblacin 1 se encuentra por encima de una puntuacin Z
de 0,31 (y por lo tanto el 38% de las medias se encuentran por encima de la puntuacin original
209,84),
La conclusin es la siguiente; suponiendo que la prediccin de los investigadores sea correc
ta, tienen slo un 38% de chances de que la muestra de 64 alumnos que analizaron arroje una me
dia lo suficientemente alta como para que el resultado sea significativo. Es decir, existe slo un
38% de chances d obtener una media mayor a 209,84, aun suponiendo que l hiptesis de inves
tigacin sea verdadera. Por lo tanto, decimos que la potencia de este experimento es del 38%, Be
ta, la probabilidad de cometer un error Tipo II, es del 62% (es decir, 100% ~ 38% = 62%).
Es importante observar que la forma en la que calculamos la potencia no tiene nada que ver
con el resultado real del estudio. De hecho, los investigadores por lo general calculan la potencia
antes de realizar el estudio.

Resum en

de los pasos para el c lcu lo de la potencia

En las condiciones del ejemplo que estamos analizando (la media de una sola muestra comparada
con una poblacin conocida), calcular la potencia incluye cuatro pasos;
( L;Reunir la informacin necesaria: a) la media y el desvo estndar de la poblacin 2 (distri
bucin comparativa)' y b)7a media predicha de i poblacin i (poblacin que recibi el procedi
miento experimental). Tambin resultar muy til crear un diagrama de las dos distribuciones de
modo similar a la figura 8-2.
jfXiDe terminar, en la distribucin comparativa, el punto de corte para rechazar la hiptesisTtrta.
j y Determinar la puntuacin Z del punto de corte anterior, pero en la distribucin de medias
de la poblacin que recibe la manipulacin experimental.
4.
Utilizando la tabla de reas bajo la curva normal, determinar la probabilidad de obtener un
registro ms extremo que esa puntuacin Z,3

O tro Ejemplo
Analicemos otro ejemplo ficticio. Una gran empresa est intentando decidir si adopta una nueva
poltica de promocin sanitaria. Conforme a esta nueva poltica, se evala a los empleados indivi
dualmente y se les brinda la capacitacin y el asesoramiento necesarios con respecto a distintos
3El mtodo descripto de clculo de la potencia (que es el nico mtodo de clculo de la potencia tratado en este libro)
supone que las distribuciones de medias estn normalmente distribuidas.

comportamientos relacionados conia salud (ejercicio, dieta, cigarrillo, etc.). Para probar la efecti
vidad de la poltica, los psiclogos de la empresa planifican el siguiente estudio: se seleccionarn
ochenta empleados al azar para participar del mismo, y al finalizar el ao se medir su estado ge
neral de salud conforme a una prueba estndar. La misma empresa ha realizado pruebas extensi
vas a sus empleados, por lo que los investigadores saben que en toda la empresa (la poblacin de
este estudio) la media en las pruebas estndar de salud es 58, el desvo estndar es 14, y los valo
res se distribuyen normalmente. Para que se justifique la realizacin del programa, debe producir
se una mejora de al menos 5 puntos (es decir, la media predicha es 63), Los psiclogos de la
empresa planifican utilizar un nivel de significacin de 0,05.
La figura 8-3 representa grficamente las distribuciones de medias correspondientes a las dos
poblaciones involucradas en este estudio. Cul es la potencia de este experimento?

1.
Reunir la informacin necesaria. En este ejemplo, la media de la distribucin comparativ
--f-. es 50'. La media predicha de la poblacin que recibe el procedimiento experimental es 63. La varianza de la poblacin es 196 (es decir, 142 ~ 196), por lo tanto, la varianza de la distribucin
de medias (distribucin comparativa) es 2,45 (196/80 = 2,45), lo que nos da un desvo estndar de
1,57 { V 45 = 1,57).
/(X> Determinar, en la distribucin comparativa, el punto de corte para rechazar la hiptesis
nula. Con un nivel de significacin del 5%, en una prueba de una cola, la puntuacin Z de corte es
+1,64. Una puntuacin Z de +1,64 es igual a una puntuacin original de 60,57 (es decir, 58 +
[1,64 x 1,57] = 60,57). Por io tanto, en la curva inferior (distribucin comparativa) de la figura
8-3,fiemos sombreado el rea a la derecha del punto 60,57. Es la regin alfa.
f 3 J Determinar la puntuacin Z del punto de corte anterior, pero en la distribucin de medias
correspondiente a la poblacin que recibe la manipulacin experimental. En esa distribucin (ba
sndonos en los valores predichos para la poblacin 1), una puntuacin original de 60,57 es igual
a una puntuacin.Z d e -1,55 (es decir, [60,57 - 63]/l,57 = -1,55), Por lo tanto, en la curva supe
rior de la figura 8-3, hemos sombreado el rea a la derecha del punto -1,55. Esa rea sombreada
indica la potencia del estudio, es el rea sobre la zona en la que la media de una muestra real sera
significativa con respecto a la distribucin comparativa.
4.
Utilizando la tabla de reas bajo la curva normal, determinar la probabilidad de obtener un
valor ms extremo que esa puntuacin Z. La tabla de reas bajo la curva normal indica aproxima
damente un 44% entre la media y una Z de 1,55. Estamos interesados en toda el rea a la derecha
de -L 5 5 , por lo tanto, existe un total del 44% entre -1,55 y la media, ms el.5.0% por encima de la
media, lo que da un total de 94%, La potencia de este experimento es del 94% (beta es del 6%).

TABLAS DE POTENCIA
L o s procedim ientos que hem os descripto para e l clcu lo de la potencia se aplican cuando estam os
frente a una poblacin conocida y frente a una sola m uestra. E n situaciones de investigacin m s
com plejas (que analizarem os en varios de lo s captulos siguientes), ca lcu la r la potencia es bastan
te m s trabajoso. P o r eso, generalm ente lo s investigadores buscan la potencia de un estudio u tili
zando cuadros esp eciales, denom inados ta b la s de p o ten cia. (E sta s tablas han sido preparadas
por Cohn, 1988, y K raem er & Thiem ann, 1987, entre otros). E n io s captulos sig u ien tes, con ca
da mtodo tratado darem os las tablas de potencia b sicas y verem os cm o u tiliza rla s. E n el apn
d ice B ofrecem os un n d ice de estas tablas bajo el nom bre de tabla B -5 .
La

lgica en la que se basan estas

tablas es precisam ente lo que hem os aprendido aqu, y u ti

liz a r la s tablas requiere exactam ente la m ism a inform acin que e l clcu lo d irecto de la potencia,
D e todos m odos, e l objetivo de este cap tulo es ayudar a com prender el concepto de potencia, y

o
4

F igura 8-3, D istrib u cio n es d e m ed ia s d e 8 0 o b se rv a c io n e s b asadas e n d istrib u cion es predichas (superior) y


c o n o c id a s (in ferior) d e p o b la cio n e s d e un e stu d io fic tic io d e e m p le a d o s q u e recib en un n u ev o program a d e
p ro m o ci n sanitaria. E n am b as distrib u cion es s e in d ican la s p u n tu acion es Z y las p u n tu acion es o rigin ales
co rresp o n d ien tes a l pu nto d e co rte d e la distrib u cin inferior (el p u n to d e corte corresp onde a un n iv el d e
sig n ific a c i n d e p < 0 , 0 5 , prueba d e una c o la ).

no slo calcular el nmero. Es especialmente importante comprender qu factores influyen en la


potencia y cmo se aplica todo esto a la planificacin de experimentos y a la interpretacin de los
resultados de las investigaciones.
v
. (['; / />?

QU FACTORES DETERMINAN LA POTENCIA PE UN ESTUDIO?


La potencia de un estudio depende de dos factores principales. El primero es el tamao del efecto/ A
predicho por la hiptesis de investigacin (tamao de efecto). El segundo factor principal es lav^.,.
cantidad de participantes que incluye el estudio (tamao de la muestra). La potencia tambin se (A., j

ve afectada por a) ei nivel de significacin elegido, b) si se utiliza una prueba de una o dos colas,
y c) e tipo de procedimiento de prueba de hiptesis utilizado.

TAMAO DEL EFECTO


Analicemos nuevamente el ejemplo de los investigadores expertos en educacin que estudian el
efecto de instrucciones especiales en alumnos de quinto grado que rinden un examen estndar pa
ra la evaluacin de nivel. Las figuras 8-1 y 8-2 reflejan la situacin en la que los investigadores
predijeron que aquellos que reciban instrucciones especiales (poblacin 1, curva superior) ten
dran una media ocho puntos ms alta que la de alumnos de quinto grado en general (poblacin
2). La figura 8-4 se refiere al mismo estudio. Sin embargo, refleja una situacin en la que los in
vestigadores predicen que aquellos que recibieron las instrucciones especiales obtendran una
media 16 puntos ms alta que la de los alumnos de quinto grado en general. Comparando la figu
ra 8-4 con la figura 8-2, podemos notar que existe mayor probabilidad de obtener un resultado
significativo si la situacin reflejada en la figura 8-4 es verdadera. Lo que sucede es que hay ms
superposicin de la curva superior con el rea sombreada en la distribucin comparativa.
Anteriormente calculamos que la probabilidad de obtener un resultado significativo (poten
cia), en el caso de la situacin reflejada en las figuras 8-1 y 8-2, es de slo el 38%. Si hiciramos
el mismo clculo para el caso de la situacin reflejada en la figura 8-4, descubriramos que la po
tencia es del 85%. (Tal vez al alumno le interese probar la veracidad de este dato). La idea general
es que cuanto mayor es la diferencia esperada entre las medias de las dos poblaciones, mayor po
tencia tiene el estudio.
La figura 8-5 ilustra dos distribuciones de medias basndose en el mismo ejemplo. Sin em
bargo, esta vez hemos cambiado el ejemplo de manera tal que la varianza sea mucho menor (el
desvo estndar en la distribucin de medias es exactamente la mitad de lo que era en las figuras
8-1,8-2 y 8-4). En esta versin, la media predicha es la original de 208 (de las figuras 8-1 y 8-2).
Sin embargo, ambas distribuciones de medias son mucho ms estrechas, por lo tanto, hay mucha
menos superposicin entre la curva superior y la inferior (la distribucin comparativa). El resulta
do es una potencia del 85%, mucho mayor que la de la situacin original en las figuras 8-1 y 8-2.
La idea, en este caso, es que, a menor varianza, mayor potencia.4
En conjunto, estos ejemplos ilustran el principio general que establece que, a menor superposicin entre las dos distribuciones, mayor ser la probabilidad de que el estudio arroje uii resultado
signiicnvo.'"Dos""distribuciones pueden tener poca superposicin, tanto por una gran diferencia
entre sus medias (figura 8-4) como por tener tan poca varianza, que incluso con una pequea dife
rencia ntre medias no' se superponen demasiado (figura 8-5). La figura 8-6 resume este principio
de modo ms general.
La medida en la cual dos distribuciones no se superponen se denomina |amJao.,dLeie6to,
porque" es la m edidaenla clia e lls x p e ^
i dos pobladones. Es
decir,'"cuanto mayor es la diferencia esperadaentr las medias d las dos poblaciones, mayor es el
tamao del efecto, y a menoFyHahH^^
s el tamao del efecto. En
cualquier'cascj, a mayoriainnrad&cnte^

4 Tai v ez haya resultado evidente para ei alumno que aumentamos la potencia a exactamente ei 85%, tanto al duplicar el
aumento predicho de las medias (como en la figura 8*4) o al reducir e desvo estndar de la distribucin de medas a la
mitad (com o en la figura 8-5). Pronto veremos las razones por las cuales cualquiera de estos dos cambios produce el
mismo resultado.

Al determinar la potencia antes de realizar el estudio, el tamao del efecto se calcula sobre la ba
se de dos nmeros. El primer nmero es ia prediccin del investigador en cuanto a la diferencia
entre las medias de las dos poblaciones. La prediccin se realiza sobre la base de determinada
(teora, de experiencia previa en investigaciones de este tipo, o de lo que sera la menor diferencia
S&jLEfsegundo nmero es el desvo estndar poblacional. En los casos que hemos analizado has
ta ahora, el desvo estndar (o la varanza) se conoce con anterioridad. (En captulos posteriores
analizaremos modos de estimar este dato cuando no se lo conoce).

Figura 8-5, D istr ib u c io n e s d e m ed a s d e 6 4 resultados d e e x m e n e s b asadas e n d istrib u cion es pred ich as


(curva superior) y c o n o c id a s (curva inferior) de un estu d io fic tic io d e alu m n o s d e q u in to grad o q u e r ec ib en
in stru ccio n es e sp e c a le s a ntes d e rendir un ex a m e n estndar para evaluar e l n iv e l. E n am b as d istrib u cion es
se ind ican las pu ntuacion es Z y lo s puntos d e corte basad os en la d istrib u cin inferior. (E l p u n to d e corte
corresp on d e a un n iv e l d e sig n ific a c i n d e p < 0 ,0 5 , prueba d e una c o la ). E n e ste e je m p lo , la m e d ia predicha
d e la distribu cin superior e s 2 f .

F igura 8-6. L as d istrib u cio n es d e m ed ia s p redichas y com parativas podran tener p o c a su p e r p o sici n (y en
e s e c a so e e sta d io tendra una p o ten cia alta) d e b id o a q u e (a) las d o s m e d ia s so n m u y d iferen tes o (b ) la
v a a n za e s pequ e a.
....
- . ,
. ......................

La regla para el clculo del tamao del efecto es la siguiente: dividir la diferencia predicha entre
las medas por el desvo estndar poblacional. La frmula sera la siguiente:
/

d - Hd ~t 2
a

(8-D

sJ5n estaJErmula? d es el smbolo del tamao del efecto (tambin conocido como d de Cohn.
(n captulos posteriores veremos otras medidas del tamao de efecto apropiadas para diferentes
situaciones, que se representan con otros smbolos). jXj es la media de la poblacin 1 (la media
predicha para la poblacin que recibe la manipulacin experimental); p,2 es la media de la poblar
cin 2 (distribucin comparativa), y cr es el desvo estndar de la poblacin 2. Es importante tener

en cuenta que al calcular el tamao del efecto, no utilizamos el desvo estndar de la distribucin
de medias (aM). En cambio, utilizamos el desvo estndar de la poblacin de observaciones origi
nales (cr). (Cabe mencionar tambin que slo nos interesa el cr de una poblacin, ya que en la
prueba de hiptesis generalmente suponemos que ambas poblaciones tienen el mismo desvo es
tndar. Ms adelante volveremos a tratar este tema).
En el primer ejemplo do este captulo (figuras 8-1 y 8-2), la diferencia entre las medias era 8 y
el desvo estndar de la poblacin original de individuos, alumnos de quinto grado, era 48. Por lo
tanto, el tamao del efecto era 8/48, es decir, 0,17. La frmula sera la siguiente:
M.i -p.2 _ 208 - 200 __ 8
cr
48
48

Analicemos ahora el ejemplo en el que la diferencia de medias era de 16 puntos de examen y el des
vo estndar poblacional tambin era 48 (figura 8-4). En ese caso, el tamao del efecto es 0,33
(16/48 = 0,33), es decir, el doble del anterior. De modo similar, analicemos el ejemplo en el que la
diferencia de medias era 8 pero con una poblacin con un desvo estndar de 24 (figura 8-5). En ese
ejemplo, el tamao de efecto tambin es de 0,33 (es decir, 8/24 ~ 0,33). (La potencia en los dos ca
sos tambin era la misma -85%-, debido a que todos los otros aspectos del estudio eran los mismos.
Por lo tanto, si tienen el mismo tamao del efecto, tendrn la misma potencia),

Un alcan ce ms general del tam ao del efecto

El tamao del efecto, como hemos visto, es la diferencia de medias dividida por el desvo estn
dar poblacional. Esta divisin estandariza la diferencia entre las medias y ubica la diferencia en
una escala adaptada al desvo estndar de la medida utilizada. Este proceso tiene el mismo tipo de
efecto que convertir una puntuacin original en una puntuacin Z, En ambos casos, el resultado
es una base estndar de comparacin con otros valores, incluso valores de diferentes escalas. Su
pongamos que dos estudios utilizan diferentes medidas. (Por ejemplo, un grupo de investigadores
expertos en educacin estudia el efecto de instrucciones especiales utilizando la Prueba de nive
les acadmicos de Jones con un ct = 48, y otro grupo de investigadores utiliza la Prueba de lo
gros acadmicos de Smith con un a = 17). Incluso en esta situacin, dado que las diferencias de
medias estn divididas por el desvo estndar, se puede comparar directamente el tamao del
efecto de los dos casos.
La estandarizacin que proporciona el tamao del efecto (d) es especialmente til porque
se basa en el desvo estndar de la poblacin de observaciones individuales (en lugar del des
vo estndar de la distribucin de medias). Esto significa que podemos utilizar d para compa
rar resultados de estudios muy diferentes, incluso de aquellos que utilizan diferentes tamaos
de muestras.
En resumen, supongamos que un estudio tiene un tamao de efecto (d) de 0,25. Esto siempre
significa que existe un cuarto de desvo estndar de diferencia entre las dos medias, independientemente del tamao de lalnestrayde Ja .i^edWa utilizada. Si un estudio tiene una d de 0,25, y otro
unarfde 2,0(di'ferencia de 2 desvos estndar entre las medias), sabramos que el efecto fue mucho
mayor en el segundo estudio, aun si las medidas utilizadas y la cantidad de participantes en los dos
estudios fueran completamente diferentes. (Ms. adelante en el captulo veremos que una aplica
cin importante del tamao del efecto se utiliza en el procedimiento denominado meta-anlisis,
el cual proporciona a los investigadores una herramienta precisa y objetiva para utilizar el tamao
del efecto, ton el fin de combinar y comparar ios resultados de distintos estudios acumulados

acerca de un tema determinado, como por ejemplo, la utilidad de determinado tipo de psicotera
pia o ia diferencia ente dos grupos de edades con respecto a una capacidad).

Reglas del tamao del efecto

i 'cx.1 -cCs (..,

Es difcil saber, antes de realizar un estudio, cules el tamao del. efecto que. debemos esperar;
si lo supiramos, no necestHftamos realzar la investigacin. Jacob Cohn (1988, 1992), un
psiclogo que ha trabajado mucho en lo que se refiere al desarrollo de los clculos estadsticos
relacionados con la potencia, ha colaborado en la solucin de este problema. Cohn ha estable
cido algunas reglas del tam ao del efecto basadas en los efectos descubiertos a travs de las
investigaciones psicolgicas en general. Estas reglas, al menos, indican al investigador cundo
considerar que un efecto es pequeo, mediano o grande. As, si el investigador cree que deter
minado estudio debera tener un efecto mediano, ahora cuenta con un nmero especfico que,
segn ha descubierto Cohn, es tpico de los efectos medianos, y que puede entonces utilizar
para calcular la potencia.

Figura 8-7. C om paracin d e pares de d istrib u cio n es p o b la cio n a le s d e in d iv id u o s q u e in d ican la s reg a s d e


C o h n para e l tam ao d e l e fe cto : (a) tam ao d e l e fe c t o p e q u e o ( d = 0 ,2 ), (b ) tam ao d el e fe c t o m e d ia n o
( d = 0 ,5 ) y (c ) gran tam ao d el e fe c to ( d = 0 ,8 ).

Potencia estada tica y tama o del efecto

249

Recordemos que hemos calculado el tamao del efecto como la diferencia predicha entre las
medias de las dos poblaciones dividida por ei desvo estndar poblacional. Cohn recomienda
que-para el tipo de situacin que estamos analizando en este captulo, deberamos pensar en un
pequeo tamao del efecto, aproximadamente 0,20, Con una d de 0,20, las poblaciones de ob
servaciones individuales tienen una superposicin de aproximadamente un 85%. sta es el tama
o del efecto de, por ejemplo, la diferencia de altura entre nias de 15 y l anos de edad (vase
figura 8-7a), que es de aproximadamente 1/2 pulgada de diferencia, con un desvo estndar de
aproximadamente 2,1 pulgadas. (Cuando en estos ejemplos hablamos de porcentaje de superposi
cin, nos referimos a la superposicin de las poblaciones de observaciones individuales. La canti
dad de superposicin de las distribuciones de medias ser menor segn ei tamao de la muestra),
Cohn considera que un tamao d efecto mediano es de 0,5, el cual implica una superposi
cin de aproximadamente el 67%, que es aproximadamente la diferencia de altura entre nias de
14 y 18 aos de edad (vase figura 8-7b). Finalmente, Cohn define un gran tamao del efecto en
0,80. Esto implica una superposicin de slo un 53%, que es aproximadamente la diferencia de
altura entre nias de 13 y 18 aos de edad (vase figura 8~7c). Las tres reglas del tamao del efec
to que acabamos de mencionar estn resumidas en la tabla 8-2,
Analicemos otro ejemplo. Como observamos anteriormente en este libro, muchas pruebas de
ci tienen un desvo estndar de 16 puntos. Un procedimiento experimental diseado para aumen
tar el ci, que tuviera un pequeo tamao del efecto, implicara un aumento del ci de 3,2 puntos ci.
(Una diferencia de 3,2 puntos a , entre la media de la poblacin que recibi el procedimiento experi
mental y la media de la poblacin que no lo recibi, dividida por el desvo estndar de la poblacin,
que es de 16, arroja un tamao del efecto de 0,20, es decir, d = 3,2/16 = 0,20). Un procedimiento ex
perimental con un tamao del efecto mediano aumentara el ci en 8 puntos. Un procedimiento expe
rimental con un gran tamao del efecto aumentara el ci en 12,8 puntos. Para dar otro ejemplo,
analicemos los registros del s a t ( o es aproximadamente 100). En una poblacin con una puntua
cin media de s a t igual a 500, los individuos que participaran de un procedimiento experimental
para aumentar los valores del s a t con un pequeo tamao del efecto lograran un valor medio de
520; aquellos que participaran de un procedimiento con un tamao del efecto mediano lograran
un valor medio de 550, y aquellos que participaran de un procedimiento con un gran tamao del
efecto lograran un valor medio de 580. Finalmente, la figura 8-8 representa grficamente tama
os del efecto pequeos y medianos aplicados a las distribuciones de medias del ejemplo de los
alumnos de quinto grado. Podemos observar que cuanto mayor es el tamao del efecto, mayor es
la potencia.
Las reglas del tamao del efecto establecidas por Cohn son importantes para los cientficos,
porque en la mayora de las investigaciones es difcil saber de antemano qu tamao del efecto
predecir. (Si uno no puede predecir el tamao del efecto, no
puede siquiera buscar la potencia en la tabla). Algunas ve
Tabla 8-2.
ces, los investigadores pueden basar sus predicciones en
Resumen de las reglas d Cohn
del tam ao del efecto para las
cuanto al tamao del efecto en investigaciones o teoras pre
diferencias de medias.
vias. Asimismo, tambin existe un mnimo tamao del efec
to que sera importante para algn objetivo prctico. Pero en
Tamao
Descripcin
la mayora de los casos, los investigadores estn analizando
v erb a l
del efecto (d)
un tema por primera vez, y slo tienen una idea vaga del ta
Pequeo
0 ,2 0
mao del efecto a esperar. Las reglas de Cohn ayudan a los
M ediano
0 ,5 0
investigadores a convertir esa vaga idea en un nmero.
Grande

0 ,8 0

Figura 8-8. D istrib u cio n es d e p o b la cio n e s d e m ed ia s pred ch as (a, b ) y c o n o c id a s (c ) en un estu d io fic ticio
de alu m n o s d e quinto grado qu e recib en in stru ccio n es e sp e c ia le s antes d e rendir un ex a m en estndar para la
e v a lu a c i n d e n iv el. E n la s d istrib u cio n es a, b y c s e in d ica n la s p u n tu acion es o rigin ales corresp on d ien tes a
la p u ntuacin Z d e corte que se m uestra en la distribu cin c . (E l punto d e corte est calcu la d o sobre la base
d e un n iv e l d e sig n ific a c i n p < 0 ,0 5 , prueba d e una c o la ). E n este e je m p lo (a) e s la distribu cin predicha
c o n un tam ao m e d ia n o d el e fe c to ( d = 0 ,5 , p o ten cia = 9 9 % ) , y (b ) e s la distribu cin predicha c o n un
tam ao p eq u e o d el e fe c to ( d ~ 0 ,2 , p o ten cia = 48% ).

Las reglas de Cohn para el tamao del efecto tambin son tiles para interpretar resultados de estu
dios. Nos proporcionan un parmetro para decidir acerca de la importancia del efecto de un estudio
con relacin a lo que es tpico en psicologa.

TAMAO DE LA MUESTRA
El otro factor de influencia importante en la potencia, adems del tamao del efecto, es la canti
dad de personas que integran la muestra estudiada. Bsicamente, a mayor cantidad de personas,
mayor potencia.
El tamao de la muestra influye en la potencia porque, a mayor tamao de muestra, menor es
el desvo estndar de la distribucin de medias. Si las distribuciones tienen un desvo estndar me
nor, son ms estrechas y, por ende, estn menos superpuestas. La figura 8-9 representa grfica
mente la situacin que se planteara en el ejemplo de alumnos de quinto grado s el estudio
incluyera 100 alumnos en lugar de los 64 del ejemplo original (figuras 8-1 y 8-2), La potencia en
este caso es del 51% (con 64 alumnos era del 38%). Con un estudio de 500 participantes, la po
tencia es del 98% (vase figura 8-10).

Figura 8-9. D istrib u cio n es d e m edias de 1 0 0 resultados de ex m e n e s (en lugar d e 6 4 , c o m o en las figuras 8-1
y 8 -2 ) basadas en distribu ciones predichas (superior) y con o cid a s (in ferior) d e un estu d io fic tic io rea liza d o a
a lum nos d e quinto grado qu e reciben instru ccion es e sp ec ia le s antes d e rendir un exam en estndar para la
ev a lu a ci n d e nivel. E n la s dos distribuciones se ind ican lo s pu ntos d e corte seg n la distribu cin inferior.
(E l pu n to d e corte corresponde a un nivel d e sig n ifica c i n d e p < 0 ,0 5 , prueba d e una co la ). P o ten cia 51% .

Situcffirfe

v _._.

de irivestigacin;

^,
b^sd'^nl poblacin

,"""'""'"',K!'','--'iW-v
"W ^*: '^-VViv'
m v > : :v '--^ .>y;^;:;^ v . > > : ? ^ A
Puntuaciones originales: 188

-viXI-:'1.1;,>

i Fbiitueioh^^

;^ ^ ; _ ^ J I r v ^ :r ^. ^

\ '!-'-l

V"

:'v';. V.::,? .".. :

SSW#8M
i Situacin de hiptesis nula ;'
:- (distribucin comparativa),
', basada en la poblacin 2

n i e n c M :fevV^v o ; '; i

:.U &r t
ri>
-.S
1PhSi l^
iill P

'.;*

!v y lIP i 5S*1^$? * 0 #

S S fliS lililislill
111
111
:-; ' -;:.v":"

m
{(::* viy'|.!-i:';; '' ;:;
S
8 B SeSfgiaS?

f lilila
SI

si
:'; y Puiituacioaeg. ori nafey ;18^S

? : -V Pptuaeiphe*^

Figura 8*10. D istrib u cio n es d e m ed ia s d e 5 0 0 resu lta d o s d e e x m e n e s, b asadas en d istrib u cion es predichas
(superior) y c o n o c id a s (in ferio r) d e un e stu d io fic tic io r ealizad o a alu m n os de q u in to grado q u e recib en
in stru ccio n es e sp e c ia le s antes d e rendir un ex a m e n estn d ar d e eva lu a c i n de n ivel. E n las d o s distribu
c io n e s s e in d ican lo s pu n tos de co rte seg n la d istrib u ci n inferior. (E l p u n to d e corte co rresp on d e a un
n iv e l d e sig n ifica c i n p < 0 ,0 5 , prueba d e una co la ). P o te n c ia 99% .

No debemos confundimos. Las distribuciones de medias pueden ser estrechas (y por lo tanto estar
menos superpuestas y tener ms potencia) por dos razones muy diferentes. Una razn es que las
poblaciones de individuos pueden tener desvos estndar pequeos. Este motivo est relacionado
con el tamao de efecto. La otra razn por la que las dos distribuciones de medias pueden ser es
trechas es que el tamao de la muestra sea grande. Este motivo es completamente independiente
del primero. El tamao de la muestra no tiene nada que ver con el tamao del efecto, y tanto el
primero como el segundo influyen en la potencia. Pero como veremos pronto, estas dos influen
cias distintas sobre la potencia llevan a pasos prcticos completamente diferentes para aumentar
la potencia al planificar un estudio.
C lcu lo del tam ao de m uestra n ecesario para determ inado nivel de potencia

La razn principal por la que los investigadores calculan la potencia al planificar un estudio es pa
ra decidir cuntos participantes incluir en el mismo. Dado que el tamao de la muestra es un fac

tor de influencia importante en la potencia, los investigadores necesitan estar seguros de tener su
ficientes participantes como para que sus estudios tengan un nivel de potencia bastante alto.
Un investigador puede calcular la cantidad necesaria de participantes revirtiendo los pasos
para el clculo de la potencia. Comenzamos con el nivel de potencia deseado, digamos, un 80%, y
luego calculamos cuntos participantes necesitaramos para obtener ese nivel de potencia. Supon
gamos que los psiclogos especializados en educacin, quienes realizaron el ejemplo de los
alumnos de quinto grado, estuvieran planificando ese'estudio y quisieran calcular cuntos alum
nos de quinto grado necesitan analizar. Siendo la diferencia de media predicha igual a 8, y el des
vo estndar de la poblacin conocida igual a 48, necesitaran 222 alumnos de quinto grado para
tener una potencia del 80%. En este momento no entraremos en detalles de clculo. (Sin embar
go, el alumno tal vez quiera intentar calcular este dato por s mismo. Sera interesante ver si pue
de llegar a la misma respuesta que nosotros utilizando los procedimientos que ha aprendido, pero
comenzando con una potencia del 80% y continuando con los pasos desde atrs hacia adelante
para obtener la cantidad necesaria de participantes). En la prctica, los investigadores utilizan ta
blas especiales que especifican cuntos participantes son necesarios en un estudio para tener un
alto nivel de potencia, segn un determinado tamao del efecto. Nosotros proporcionaremos ver
siones simplificadas de esas tablas para cada uno de los principales procedimientos de prueba de
hiptesis que veremos en los captulos siguientes.

Hace; ms .de tres dcadas, Jacob Cohn - considerados inexistentes). En estos estu
dios la potencia ni siquiera se discuta.,
(1962), un psiclogo, especialista en mto" Cohn calcul la potencia de los resul: dos estadsticos, public un anlisis) muy
conocido actualmente de la potencia, esta :' Vtados'de esas pubhcaciones. Al rio estar fadstica de estudios publicados en el vol- < ; miliarizado con muchos de los contenidos
men de 1960 de'la Revista Cientfica de ; de las distintas reas, analiz la potencia s e -.":;
Psicologa Patolgica y Social [Journal of ; gn tres supuestos del tamao .def efecto:
Abnormal and Social PsyckologyJ. Cohn : pequeo, mediano y grande. Descubri que
: observ que se prestaba gran importancia a . . si era pequea, los ^estudios; publicados
, nan slo una chance contra seis de detectar
la significacin, o tambin a si se haba co~
algn efecto. Ninguno, tena mayores chan-
. metido un error Tipo I (es decir, si se haba
cs que un 50%: Si supona un efecto me- rechazado equivocadamente la hiptesis .
. dian en:jalpqblcn, losestudios/tenan...
nula y a partir de los resultados se haba su chances apenas mayores a uh 8% d detec- ;
puesto cierto efecto que en realidad no . tar ese efecto, incluso un cuarto de ellos A:exista), Pero esencialmente no se prestaba ; ' tena menos de una chance contra tres! .Slo :
atencin a la posibilidad de un error .Tipo II
el supuesto de grandes efectos daba a los
(es decir,; si por error no s hubiera rechaza
. estudios, tal como estaban diseados, una
do la hiptesis nula y se hubiera ignorado
buena posibilidad de rechazar la hiptesis :
un efecto real debido a resultados no con . nula. Como el mismo Cohn lo expresara .,
cluyentes,.que de hecho algunas veces eran 1 toda una generacin de investigadores p-

dra gozar de un .empleo adecuado si se in


efecto durante los aos siguientes. De hecho, //
tentaran,repetir estudios interesantes que
,1a potencia de los estudios que apareciev'prginamente utilizaron tamaos de mues- : ron en la misma revista cientfica que
. tras inadecuados. Lamentablemente, aque
. Cohn haba . analizado (ahora: llamada
llos qu ms mereceran tales repeticiones
Revista Cientfica de Psicologa Patolgica .
[Journal o f Abnormal Psychologyl), en V
son los; qu seguramente, no han sido im
realidad haba disminuido con el correr de
presos', (p. 153) :
esos aos, y el bajo nivel de potencia.con
En la ltima oracin, Cohn se refiere
tinuaba pasando inadvertido. Slo dos de : ;;
.al hecho de que' muchos ms estudios que
sesenta y cuatro experimentos trataban el \
hubieran sido apropiados para la revista
tema de la potencia, y en estos dos no se
cientfica mencionada, probablemente nun
la haba estimado.
..
ca se escribieron porque los investigadores,
'-mMientras tanto,'en el 119 de los estudios
obtuvieron resultados no significativos, que
las probabilidades claramente indicaban, . publicados en esa edicin, la falta de signifL j
que estaban predestinados a obtener dado el /./cacin era tomada como una confirmacin .
bajo nivel de potencia de la mayora de lo s; . de la hiptesis nula, tai vez en un intent d e ..
adher alas admomcipnestiadipionals que Cj
; estudios en ese campo. Los experimentos
que fallaron, cuando en realidad sus hip C cuestionamos en pl cuadro 6-L St embarg,
Sedlmeier y Gigerenzer dsebnron que la
tesis nunca fueron adecuadamente proba
potencia media ett sos .estudios era slo de
das, representaban una gran cantidad de
0*25. Ciertamente, ;si cuando ls resultados
conocimiento que posiblemente se haya
favorecen la hiptesis nula vamos a tratarlos
perdido, y que tal vez nunca se vuelva a in
vestigar. Y esa prdida se debi simplemen-.: : *como xnformacin vahosa n s misma (nue- ;.
: te a la falta de inters en la potencia, en la ;/ vamente, vase cuadro. 6- I),rslo podremos. : hacerlo si la potencia es lo suficientemente '
mayora de los casos por la falta de clculo
alta como para que, si la hiptesis de invest(a travs del anlisis del tamao del efecto,
gacin fuera verdadera, el ..estudi ,tuviera al.
/ l nivel de significacin y la potencia) del

tamao ptimo de ia muestra para probar la : menos iguales chances de rfljarlp.V


,. Esta obstinada omisin por parte de los
hiptesis de la mejor manera posible. : , investigadores.esunpoco.soiprendente;;L :
Despus del anlisis realizado por Co
mayora de las vecs implicia qu realizan !
hn, se han llevado a cabo varios anlisis
todo su trabajo para nada./Aunque lo que :
similres acerca de la potencia, publica
intenten demostrar sea cirtOy tienn pocasV: ,
dos en determinadas revistas cientficas
(p. ej. el anfisis de Brewer de 1972 en la ; probabilidades de lograrlo. Y aparentemen-C i
te la metodologa en psicologa es tan mo-.;
Revista i Cientfica Americana de Investi
: noltica y fija que no puede iodificrse. .
gacin Educativa, [American Educational
. Sin embargo, en una publicacin .en Psic-:.
Research Journal] y el estudio de Chase
& Chase de 1976 en la Revista.Cientfica v logo Americano [American Psychologistfi
de Psicologa Aplicada [Journal o f Applied ' titulada Cosas' que 'he' aprendido' (hasta:./
ahora), Jacob Cohn (1990) recuerda.las:
Psychology]). Mientras tanto, en 1969 Co
dcadas anteriores desde un punto:de vista
hn public una gua para el anlisis de la
filosfico: .
' ,!
potencia en las ciencias sociales, y una ver
No me desespero. Recuerdo que W.:S.
sin revisada apareci en 1988. Aun as,
. Gosset, el muchacho que trabajaba en
en una publicacin d 1989, Sedlmeiery
: . una fbrica de cerveza y que public.
Gigerenzer observaron que las adverten
modestamente su trabajo como El
' '=
estudiante, publico la prueba t una
cias de: Cohn aparentemente no tuvieron

gvf:

antss< i e t r r ^ ^ z r P ti- V:
m erG u erra M und ial, y e s p r u b a no
.; ./ form p a ite d e lo s lib ros d e esta d stica
- a p licad '.la p s ic lo g s m o h a sta .d es- -.
pufes d e la S e g u n d a G urra M undial!
. E sta s c o sa s lle v a n tie m p o . P o r lo tarri

t, s i. l. a lu m n o iie g a r a a pu blicar, al; g o q u e c o n s id e r a r ea lm e n te b u en o , y.


trnscuxre u n a o o un a d c a d a d d o s ,
y c a si n a d ie p ^ ^ !p j^ t r li^ a te ^ w '
d e b e recordar la p ru eb a t y ten er con-!:
fia n za , (p . 13 i l ) : '

OTROS FACTORES QUE INFLUYEN SOBRE LA POTENCIA_____________


Existen otros tres factores (adems del tamao del efecto y del tamao de la muestra) que afectan
la potencia:
1. Nivel de significacin (alfa). Un nivel de significacin menos extremo (como 0,10) impli
ca ms potencia, y un nivel de significacin ms extremo (0,01 o 0,001) implica menos potencia.
Un nivel menos extremo de significacin da por resultado mayor potencia, porque cuando el nivel
de significacin no es muy extremo (como por ejemplo 0,10), el rea de rechazo sombreada bajo
la curva inferior es mayor. Por lo tanto, una mayor parte del rea, bajo la curva superior, est som
breada. Un nivel de significacin ms extremo da por resultado menor potencia, porque cuando
este nivel es ms extremo (como por ejemplo 0,01), el rea de rechazo sombreada bajo la curva
inferior es menor. Supongamos que en nuestra versin original del ejemplo de los alumnos de
quinto grado (figuras 8-1 y 8-2) hubiramos utilizado el nivel de significacin de 0,01 en lugar del
de 0,05. La potencia hubiera cado del 38% a slo el 16% (figura 8-11).
2. Prueba de una cola versus prueba de dos colas. Utilizar una prueba de dos colas hace
que resulte ms difcil obtener significacin en cualquiera de las colas. Por lo tanto, si se mantie
nen iguales todas las dems condiciones, la potencia ser menor con una prueba de dos colas que
con una de una cola. Supongamos que hubiramos utilizado una prueba de dos colas, en lugar de
una, en nuestro ejemplo de los alumnos de quinto grado. Como lo ilustra la figura 8-12, la poten
cia sera slo del 26% (comparado con el 38% de la versin original de una cola representada por
las figuras 8-1 y 8-2).
3. Tipo de procedimiento de prueba de hiptesis. A veces, el investigador puede elegir entre
ms de un procedimiento de prueba de hiptesis para realizar determinado estudio. En este libro
todava no hemos analizado ninguna situacin de este tipo, pero s lo haremos en el captulo 15.
Resumen de factores que influyen en la potencia
La tabla 8-3 resume el efecto de distintos factores en la potencia de un estudio.

PAPEL QUE DESEMPEA LA POTENCIA AL DISEAR UN EXPERIMENTO


Para planificar un estudio es crucial determinar su potencia. Cuando la potencia del estudio que
se planifica es baja, aun si la hiptesis de investigacin resultara verdadera, sena muy poco pro
bable que el estudio arroje resultados significativos. De ese modo, se estara desperdiciando el

tiempo y dinero que implican realizar el estudio. Por lo tanto, cuando se descubre que la potencia
de un estudio es baja, los investigadores intentan encontrar formas prcticas de aumentarlo hasta
un nivel aceptable.
Qu significa un nivel aceptable de potencia? Cohn (1988) sugiere que, por lo general, un
estudio debera tener aproximadamente un 80% de potencia para que valga la pena realizarlo. Ob
viamente, cuanto ms potencia, mejor. Sin embargo, los costos que implica obtener ms potencia
(como por ejemplo analizar una mayor cantidad de personas) hacen, con frecuencia, que hasta
una potencia del 80% est fuera de nuestro alcance.
Cmo podemos aumentar la potencia de una investigacin? En principio, la potencia de una
investigacin puede aumentarse cambiando cualquiera de los factores resumidos en la tabla 8-3.
Analicemos cada uno de ellos.

Figura 8-11. D istrib u cio n es de m ed ia s d e 6 4 resu ltad os d e e x m e n e s basadas en d istrib u cion es predichas
(superior) y c o n o cid a s (in ferior) de un e stu d io fic tic io rea liza d o c o n alu m n os de quinto grado q u e recib en
in stru ccio n es e sp ec ia le s antes d e rendir un e x a m en estndar para la eva lu a ci n d e n ivel. E n la s d o s distribu
c io n e s se ind ican las^puntuaciones Z y o r ig in a le s d e corte d e la distribu cin inferior. E l p u nto d e corte c o
rrespond ien te a un n iv el d e s ig n ific a c i n d e p < 0 ,0 1 , prueba d e una c o la (e n com p aracin c o n e l p < 0 ,0 5
d e l e je m p lo o rig in a l rep resen tado por la s fig u ra s 8-1 y 8 -2 ), P o ten cia 16%.

Figura 8-12. D istrib u cio n es d e m ed ia s d e 6 4 resultados d e e x m e n e s b asad as en d istrib u cio n es pred ich as
(cu rv a superior) y c o n o c id a s (curva inferior) d e un e stu d io fic tic io r ealizad o a alu m n o s d e q u in to grado que
recib en in stru ccio n es e sp e c ia le s antes d e rendir un e x a m e n estndar para la eva lu a c i n d e n iv e l. E n las d o s
d istrib u cio n es s e in d ican las pu ntuacion es Z y o r ig n a le s d e corte d e la distrib u cin inferior. L o s p u ntos d e
co rte co rresp o n d en a un n iv el d e sig n ifica c i n d e p < 0 ,0 5 , prueba d e d o s c o la s (e n com p a r a c i n c o n la
prueba d e u n a c o la d e l e je m p lo o rig in a l representado por la s figuras 8-1 y 8 -2 ). P o te n c ia = 26% .

I,
Aumentar la diferencia predicha entre medias poblacionaes. Un investigador no pued
simplemente aumentar en forma arbitraria su prediccin en cuanto a esta diferencia, Si lo hiciera,
aumentara la potencia calculada, pero en realidad no lograra que el estudio tuviera ms probabi
lidades de arrojar un resultado significativo. A veces, sin embargo, es posible cambiar el modo en
el que se realiza el estudio para que el investigador tenga motivos para esperar una mayor diferen
cia de medias. Analicemos nuevamente el ejemplo basado en el experimento acerca del impacto
producido por instrucciones especiales en los resultados de los exmenes realizados por alumnos
de quinto grado. Una manera de aumentar la diferencia de medias esperada podra ser trabajar
con instrucciones ms elaboradas, explicarlas con ms detenimiento, tal vez dar tiempo para que

T a b la 8 - 3 .
F a c to r e s q u e in f lu y e n e n la p o te n c ia .

C a r a c t e r s tic a s d e l e s t u d io

Tamao del e fe cto ( d)

A u m e n t a la p o t e n c ia

D is m in u y e l a p o t e n c ia

d Grande

d Pequea

Grandes diferencias

Pequeas diferencias

a pequeo

a grande

Tamao de m uestra (N )

/V grande

N pequeo

N iv el d e sign ificacin (a )

a indulgente, alto
(tal co m o 0 ,0 5 0 ,1 0 )

a riguroso, bajo
(tal com o 0,01 0,001)

Prueba de una cola versus


prueba d e dos colas

U na co la

D os colas

T ipo d e procedim iento de


prueba de hiptesis utilizado

Vara

( d [p.j - M^j/cr)
E l tam ao del efecto com bina
las d os caractersticas siguientes:
D iferencia hipottica entre
m edias poblacionals

P-i - m-2)
D e sv o estndar
poblacional (o )

. Vara

las practiquen, y otros cambios por el estilo. Una desventaja de este mtodo es que puede ser dif
cil o costoso; o bien, puede requerir la utilizacin de un procedimiento experimental que no es
igual al procedimiento al cual deseamos que se apliquen los resultados del estudio.
2. D ism in u ir el desvo estnd ar poblacional. Existen al menos dos modos de disminuir el
desvo estndar poblacional de un estudio. Un mtodo es realizar el estudio utilizando una pobla
cin menos diversa que la poblacin que se plane utilizar originalmente. En el ejemplo basado
en el examen 'de evaluacin de nivel realizado por alumnos de quinto grado, podramos utilizar
slo alumnos de quinto grado de determinado sistema escolar suburbano. La desventaja es que
los resultados se aplican slo a esa poblacin ms especfica.
Otro mtodo para disminuir el desvo estndar poblacional es utilizando condiciones y medi
das de prueba ms precisas. Por ejemplo, realizar la prueba en una situacin estandarizada o en un
ambiente de laboratorio controlado produce generalmente una variacin general menor entre las
observaciones (lo cual tiene como resultado un menor desvo estndar). De manera similar, utili
zar pruebas con instrucciones claras y procedimientos precisos, en cuanto al modo de realizar las
respuestas, tambin reduce la variacin. Si estos cambios resultan prcticos, son mtodos exce
lentes para aumentar la potencia, aunque por lo general el estudio ya es de por s lo ms riguroso
posible.
3. Aumentar el tamao de la muestra. El mtodo ms directo para aumentar la potencia de
un experimento es mediante el anlisis de una mayor cantidad de personas. Naturalmente, si esta
mos analizando astronautas que caminaron por la luna, existe un lmite para esa cantidad. Sin em
bargo, en las situaciones reales de investigacin el tamao de ia muestra es el principal mtodo
para modificar un estudio con el fin de obtener suficiente potencia.

4. Utilizar un nivel de significacin menos riguroso. Comunmente, el nivel de significa


cin debera ser bastante riguroso de manera que proteja razonablemente el estudio del error Tipo
l Normalmente, este nivel ser de 0,05. Por lo tanto, es raro que se pueda hacer mucho para au
mentar la potencia en este sentido.
5. Utilizar una prueba de una cola. Utilizar una prueba de una o dos colas depende de la l
gica de la hiptesis que se est estudiando. Por lo tanto, ai igual que con el nivel de significacin,
es raro que exista gran posibilidad de eleccin con respecto a este factor.
6. Utilizar un procedimiento de prueba de hiptesis ms sensible. Esto es adecuado si es
que existen alternativas. En e captulo 15 analizaremos algunas de las opciones de este tipo. Sin
embargo, por lo general el investigador comienza con el mtodo ms sensible, razn por la cual
no se puede hacer mucho ms en este sentido.
La tabla 8-4 resume algunos mtodos prcticos para aumentar la potencia de un experimento
planificado.

Tabla 8-4.
Resumen de mtodos prcticos para aumentar la potencia de un experimento planificado.
C a ra cterstica s de! e stu d io

R ecu rso s p r c tic o s p ara


a u m en ta r la p o ten cia

D e sv e n ta ja s

D iferencia predcha entre


inedias poblaeonales
(l-C| -

Aumentar la intensidad del


procedim iento experimental.

Puede no ser
prctico o
puede distorsionar
el significad o d e l estudio .

D e sv o estndar (cr)

U tilizar una poblacin


con menor dispersin.

Puede no
haber disponible:
dism in uye la posibilidad
de generalizar.

U tilizar circunstancias de
prueba estandarizadas o
controladas, o bien, m edicion es
m s precisas.

N o siem pre
resulta prctico,

Tamao de m uestra (AO

U tilizar un tamao mayor.

N o siem pre resulta prctico,


puede ser costoso.

N iv el de sig n ifica ci n ( a )

U tilizar un nivel m s indulgente


de significacin (com o 0 ,1 ).

A um enta
alfa, la posibilidad
d e error T ipo .

Pruebas de una cola versus


pruebas de dos colas

Utilizar pruebas de una cola.

Puede no ser
apropiado para la l gica
d el estudio.

T ipo de procedim iento


de prueba de hiptesis

U tilizar un procedim iento


m s sensible.

Puede no existir otro


dispon ible o apropiado.

LA IM PORTANCIA DE LA POTENCIA EN LA EVALUACIN DE LOS


RESULTADOS DE U N ESTUDIO
Al interpretar los resultados de las investigaciones es muy importante comprender el concepto de
potencia estadstica, como tambin, qu factores la afectan.

Qu papel cumple la potencia cuando un resultado es significativo?:


significacin estadstica versus significacin prctica
Hemos aprendido que un estudio con un mayor tamao del efecto tiene ms posibilidades de resul
tar significativo. Pero tambin es posible que un estudio con un tamao del efecto muy pequeo re
sulte significativo. Es ms probable que esto suceda cuando el estudio tiene un alto nivel de
potencia debido a otros factores, especialmente en el caso de una muestra de gran tamao. Analice
mos un estudio en el que entre todos los alumnos que rinden el s a t en determinado ao, se seleccio
na al azar una muestra de aquellos 10.000 cuyo primer nombre comienza con cierta letra.
Supongamos que su media en el s a t es de 504, en comparacin con una media de 500 (o = 100) en
el SAr de toda la poblacin. Ese resultado seria significativo al nivel 0,001, pero su tamao del efec
to es un minsculo 0,04. Es-decir, la prueba de significacin nos indica que podemos estar bastante
seguros de que hay un efecto, que la poblacin de alumnos cuyo primer nombre comienza con esa
letra tiene puntuaciones en el s a t ms altas que la poblacin general de alumnos. Pero en realidad,
el efecto no es muy importante; el tamao del efecto (o simplemente la diferencia de medias) deja
en claro que la diferencia es muy leve. Las distribuciones de las dos poblaciones se superponen tan
to que sena de poca utilidad en cualquier caso individual saber con qu letra comienza el primer
nombre de una persona.
El mensaje que queremos transmitir con este ejemplo es que existen dos pasos en la evaluacin
de un estudio. Primero, debemos considerar si el resultado eses tadsticamente significativo. Si lo
es, esto significa que consideramos que existe un efecto real. Luego debemos analizar si e l tamao
del efecto es lo suficientemente grande como para que el resultado sea til o interesante. Este se
gundo paso es especialmente importante si el estudio tiene posibles implicancias prcticas. (A ve
ces, tratndose de un estudio que prueba asuntos puramente tericos, puede ser suficiente
simplemente tener la certeza de que existe un efecto en una determinada direccin. Cuando veamos
las controversias volveremos a tratar este punto).
Si la muestra era pequea, podemos suponer que un resultado significativo probablemente tam
bin es importante en la prctica, Pero si el tamao de la muestra es muy grande, debemos tener en
cuenta directamente el tamao del efecto, ya que, en un caso as, es bastante probable que sea de
masiado pequea como para ser til.
Las implicancias de lo que acabamos de decir constituyen, en parte, una paradoja. La mayora
de las personas supone que cuanto ms participantes intervienen en-un estudio, ms importante se
r su resultado. En algn sentido, la realidad es justamente al revs. Siendo todos los dems factores
los mismos, si un estudio con slo unos pocos participantes resulta ser significativo, esa significa
cin debe ser el resultado de una gran tamao del efecto. Un estudio con una gran cantidad de parti
cipantes, que resulta estadsticamente significativo, puede tener o no un gran tamao del efecto.
Es importante observar tambin que, por lo general, no es una buena idea comparar el nivel de
significacin de dos estudios para determinar cul de los dos tiene resultados ms importantes. Por
ejemplo, un estudio con una cantidad pequea de participantes, que es significativo al nivel 0,05,
bien podra tener un gran tamao del efecto. Al mismo tiempo, un estudio con una gran cantidad de
participantes, que es significativo al nivel 0,001, bien podra tener un tamao del efecto pequeo.

Sin embargo, el nivel de significacin efectivamente nos indica algo. Esto es, cunta seguri
dad podemos tener en cuanto a poder rechazar la hiptesis nula, es decir, que existe un efecto dis
tinto de cero. Cuanto menor es el nivel p, mayor es la evidencia de un efecto distinto de cero
(Frick, 1997). Sin embargo, definitivamente no ocurre que, a menor nivel/?, mayor es el efecto. Si
dos estudios fueran idnticos en todos los dems factores, un nivel p menor significara un mayor
efecto. Pero si los estudios son diferentes, especialmente si son diferentes en cuanto a tamao de
muestra, la relacin del nivel p con el tamao del efecto es ambigua. Un nivel p pequeo podra
ser el resultado de un gran tamao del efecto, pero bien podra ser tambin la consecuencia de
un gran tamao de muestra. Por lo tanto, el nivel p indica la fuerza de la evidencia en favor de un
efecto distinto de cero. El nivel p no indica el tamao de ese efecto distinto de cero. (Debido a la
importancia de este tema, volveremos a retomarlo ms adelante en este mismo captulo).
Qu papel cumple la potencia cuando un resultado no es significativo?
En el captulo 6 vimos que un resultado no significativo es un resultado no concluyente. Sin em
bargo, a menudo nos gustara poder llegar a la conclusin de que existe muy poca o ninguna dife
rencia entre las poblaciones. Puede ocurrir esto?
Analicemos la relacin de la potencia con un resultado no significativo. Supongamos que no
obtuvimos un resultado significativo y la potencia del estudio era baja. En ese caso, el estudio es
no concluyente. No obtener un resultado significativo puede haber sido la consecuencia de que la
hiptesis de investigacin fuera falsa, pero tambin puede haber sido el resultado de que el estu
dio tuviera una potencia demasiado baja (por ejemplo, por tener muy pocos participantes).
Por el otro lado, supongamos que no obtuvimos un resultado significativo pero la potencia
del estudio era alta. En ese caso, parece improbable que la hiptesis de investigacin sea verda
dera. En estos casos (en los que existe una alta potencia) un resultado no significativo es un ar
gumento bastante fuerte contra la hiptesis de investigacin. Esto no significa que todas las
versiones de la hiptesis de investigacin sean falsas. Por ejemplo, es posible que las poblacio
nes sean slo levemente diferentes (y que la potencia haya sido calculada suponiendo una gran
diferencia).
En sntesis, el resultado no significativo de un estudio con baja potencia es verdaderamente
no concluyente. Sin embargo, el resultado no significativo de un estudio con una potencia alta su
giere que, o bien la hiptesis de investigacin es falsa o bien existe un efecto menor del que se
predijo al calcular la potencia. Tambin volveremos a tratar este tema ms adelante.
La tabla 8-5 resume el papel de la significacin y el tamao de la muestra en la interpretacin
de resultados experimentales:
T a b la 8 - 5 .
P a p e l d e la s i g n if i c a c i n y d e l t a m a o d e la m u e s t r a e n la in t e r p r e t a c i n d e r e s u lt a d o s e x p e r i m e n t a le s .

R e su lta d o esta d stic a m e n te


sig n ifica tiv o

T am ao
d e m u estra

Si

Pequeo

Si

Grande

No

Pequeo

No

Grande

C o n c lu si n
R esultado importante
Podra o no tener
im portancia en la prctica
N o concluyente
H iptesis de investigacin
probablem ente falsa

POTENCIA, TA M A O DEL EFECTO E INTERVALOS P E C O N FIA N Z A


Dado cualquier tamao del efecto, a mayor potencia, ms estrechos son los intervalos de confian
za. La razn es la siguiente: dado cualquier tamao del efecto, cuanto mayor sea la potencia, ms
estrecha ser la distribucin de las medias mustrales; y cuanto ms estrecha sea la distribucin
de las medias mustrales, menor ser el intervalo de confianza.
Ahondemos un poco en este tema. Primero analicemos la potencia. La principal influencia en
la potencia, adems del tamao del efecto, es el tamao de la muestra. No importa cul sea el ta
mao del efecto. Cuando la potencia es mayor, el tamao de la muestra es mayor. S el tamao de
la muestra es mayor, la distribucin de medias es ms estrecha, ya que la varianza de la distribu
cin de medias es la varianza de la distribucin de observaciones individuales dividida por el ta
mao de la muestra.
Analicemos ahora ios intervalos de confianza. Veamos cmo construiramos un intervalo de
confianza del 95%. El paso principal es determinar en la distribucin de medias mustrales los
puntos correspondientes a 1,96 desvos estndar por debajo, y 1,96 desvos estndar por encima
de la media muestra!. En trminos de las puntuaciones Z, este intervalo es siempre el mismo. Pe
ro su amplitud en puntuaciones originales depende completamente del desvo estndar de la dis
tribucin de medias. Si la distribucin de medias es estrecha (con una varianza y un desvo
estndar pequeos), el intervalo de confianza es estrecho.
Las implicancias son por dems interesantes. Analicemos un estudio no significativo pero
con baja potencia debido al pequeo tamao de muestra. El intervalo de confianza ser muy am
plio, incluyendo efectos cero o pequeos al igual que efectos muy grandes. Por lo tanto, los resul
tados son verdaderamente no concluyentes. Por otro lado, analicemos un estudio no significativo
pero con alta potencia debido a un gran tamao de muestra. El intervalo de confianza ser muy
estrecho, y todos los valores dentro de l representarn un efecto cero o muy pequeo. En ese ca
so, tendremos mucha ms seguridad de que se sustenta algo semejante a la hiptesis nula.
Existe otro punto que vale la pena mencionar con respecto a la relacin de los intervalos de
confianza con la potencia y el tamao del efecto. A veces los investigadores indican los interva
los de confianza en tomo a los tamaos del efecto! As, podramos encontrar un estudio infor
mando un resultado y agregando algo as como
= 0,34, 95%, IC =0,21 a 0,47. Esto es
particularmente comn en un procedimiento de investigacin especial que combina tamaos del
efecto de muchos estudios diferentes. Ese procedimiento, denominado meta-anlisis, es tratado en
la prxima seccin.

META-ANLISIS_______________________________________________________
El meta-anlisis es un desarrollo importante de los ltimos aos en la estadstica, que ha tenido un
profundo efecto en la psicologa. El meta-anlisis es un procedimiento que combina resultados de
diferentes estudios, incluso resultados para los cuales se utilizan diferentes mtodos de medicin,
con el fin de sacar conclusiones generales. Al combinar resultados, el tema crucial es la combina
cin de tamaos del efecto. A modo de ejemplo, un psiclogo especializado en temas sociales po
dra estar interesado en los efectos causados en los prejuicios por las amistades entre personas de
distintas razas, tema sobre el cual se han realizado una gran cantidad de encuestas. El estudio pro
porcionara un tamao del efecto general. Tambin indicara cmo difieren los tamaos del efec
to en los estudios realizados en diferentes pases o en cuanto a los prejuicios hacia diferentes
grupos tnicos. (Para encontrar un ejemplo de este tipo de meta-anlisis vase Pettigrew, 1997.
Para encontrar otro ejemplo de meta-anlisis vase el cuadro 8-2).

.
Cuadro 8-2.
M agnitudes d e e fe c to d e (a relajacin y la m ed ilacin :

bre mt (meditacin trascendental) fue de.


En la dcada de 1980, los resultados de las
0,70 (lo que indica una diferencia promedio
investigaciones sobre la meditacin y la re
de 0,70 desvos estndar en la medida de'; .
lajacin fueron objeto de considerable con
angustia entre aquellos que practicaban este :
troversia. Varas revisiones tradicionales del
material existente con respecto a estas reas
procedimiento de meditacin y aquellos .
haban arrojado conclusiones contradicto
que eran parte de los grupos de control).
rias en cuanto a si alguna de esas tcnicas
Ese tamao del efecto ea significativamen
te mayor que el tamao-dl efecto d cual
era beneficiosa y, de ser as, cules lo eran.
quiera de los otros grupos.. EL tamao del '
Eppley, Abrams y Shear (1989) decidieron
efecto promedio correspondiente a 44 est-' estudiar el tema en forma sistemtica,, reali
dios sobre todos ios otros tipos de medita- ':
zando un meta-anlisis de los efectos de va
rias tcnicas de relajacin sobre la angustia
clon fue 0,28, el de los 30 estudios sobre
crnica (es decir,' no una angustia tempora
relajacin progresiva fue de 0,38 y el de los
ria sino continua).
37 estudios sobre otras formas de relajacin
Eppley y sus colegas eligieron la an
fue de 0,40;
gustia crnica para su meta-anlisis, por
Pero en realidad, el meta-anlisis recin
que se trata de un problema preciso rela
haba comenzado. Haba muchas sub-varia- ,
cionado con muchos otros temas de salud
bles de inters. Por ejemplo, al observar las dimental y, aun as, en s mismo es un tema
ferentes poblaciones de participantes, la s ..
que muestra bastante coherencia entre na
personas que haban sido seleccionadas co
prueba y otra en las que se utiliza la mis
mo altamente angustiadas contribuan en
ma medida, como tambin entre diferen
mayor grado al tamao del efecto, y las p- :
tes medidas.
Elaciones seleccionadas en la prisin y los ;
Los investigadores recopilaron el ma
individuos ms jvenes aparentemente, saterial publicado siguiendo los procedimin-.
abanms provecho de la mt. No se prqd- .
tos habituales: no slo leyeron las revistas
jo ningn efecto en e l.tamao del efecto
cientficas especializadas sino tambin li
como resultado de ia capacidad de los ins
bros y tesis doctorales no publicadas. Uno
tructores, las expectativas de los. partid -:
de ios aspectos ms complicados del me
pautes, el hecho de que los: participantes ; .
ta-anlisis es estar seguro de qite uri ha
fueran voluntarios o seleccionados l azar:
encontrado todas las investigacines rela
para las determinadas condiciones, la pre
cionadas con el tema.
disposicin (le .experimentador (los resiil- . :
Par concluir la investigacin, Eppley . tados de la mt en realidad eran ms fuertes '
y sus colegas compararon los tamaos del
cuando se eliminaban los datos del invest
efecto correspondientes a cada uno de los
gador que estaba aparentemente: en: favor .
cuatro mtodos principales de meditacin
de la mt), las distintas medidas d angustia
y relajacin que han sido estudiados en in
y los diseos d la investigacin.
vestigaciones sistemticas. El resultado fue
Una clave del alto rendimiento' de la
que el tamao del efecto (d de Cohn) pro
MT pareca estar n el hecho de que las tc-'
medio correspondiente a los 35 estudios so- nicas que involucraban concentracin pro- .

;
:,
i.

ducan un efecto significativamente: menor,. . .


mientras que en la m t , un punto muy espe^. .
; cales la enseanza de un proces espontneo.'y sin esfiierzo. Los investigadores: . ..
crean que la otra diferencia podra estar en '
: . jo s manteas o sonidos,, utilizados: en la m t ;
: que, segn, se dice,, provienen de ua muy. .
. a n t i g u a t e a d i c i n y ,, a d e m s ,, s o n s e l e c c i n

snscrito Seleccionados al azar o palabras


inglesas seleccionadas para cada partici-y
. pante o obtuvieron los. mismos resultados >.
fuertes.. :
' y'.. ,;'y,
; ' Cualquiera sea la. razn, los autores llegtn a la conclusin, de que existen.fundamento para ser optimistas en cuanto a que;

j . . a m e n o s ' a l g u n o s p r o c e d i m i e n t o s de: t r a t i s

. n a d o s : p r / c a d a l n m o ; p o r e l in s t r u c t o r ; . . .

m ie n t o a c tu a le s , p e d e n e fe c t iv a m e n te r e d u - :

/ E x i s t e n ^ i n v e s t i g a c i o n e s q u e .m t f ic r i- q u e 1 < . . c i r . l a a n g u s t i a c r n i c a , ( p . 9 7 3 j P o r l o t a n t o j
. d i f e r e n t e s . s o n i d o s s'' p r o d u c e n d i f e r e n t s v ...
::

e f e c t o s ; . Y t o n s t e m e t a La n l i s i s , l o s i m t p -

;.

(to s d e m e d it a c i n q u e e m p le a n s o n id o s , d e l ;

s i e i le c to r e s p r o p e n s o a p r e o c u p a r se p o r p e -

; . v .q u e s : 'C o s s /b o r a ^ u n e x a i m ^ d e ; e s t a d s
a ,:. p u e d e t e n e r n c u e n t a e s t o s r e ^ lt d s . i :

Las revisiones de recopilaciones de estudios acerca de un tema en particular, a travs del


meta-anlisis, son una alternativa de las tradicionales publicaciones de revisin narrativa del
material existente. Esas revisiones tradicionales describen y evalan cada estudio, y luego inten
tan sacar alguna conclusin general. La cantidad de revisiones realizadas a travs del meta-anli
sis aument significativamente durante la dcada de 1980 (Myers, 1991), y parece estar
transformndose en el mtodo estndar para la revisin de material existente. En los ltimos aos,
incluso se han publicado meta-anlisis de meta-anlisis. Sin embargo, tal como lo refleja la tabla
8-6, estas publicaciones son especialmente comunes en las reas ms aplicadas de la psicologa, y
menos comunes en las reas ms tericas.
Tabla 8-6.
Cantidad de artculos meta-analticos publicados en varias reas de la psicologa
(hasta mediados de 1987).

Sub-disdplina
Educacin
Terapiapsicolgica
Psicologa industriai/empresarial
Psicologa social
Diferencias sexuales
Psicologa aplicada a la salud
Salud mental
Personalidad
Psicologa experimental
Psicologa del desarrollo

Frecuencia
115
100
44
43
28
27
26

16
13
8

Fuente: Cooper, H. M. & Lemks, K. M. (1991), tab. i. Sobre el papel del meta-anlisis en la psicologa social y de la
personalidad. Boletn de Psicologa Social y de la Personalidad {Personality and. Social Psychology Bulletin}, 17,
2 4 5 -2 5 1 . Copyright, 1991, por la Society for Personality and Social Psychology, [Sociedad de Psicologa Social y de la
Personalidad] Inc. Reimpreso con autorizacin de Sage Publications Inc.

CONTROVERSIAS Y LIMITACIONES: CONTINUACIN


DE LA CONTROVERSIA ACERCA D LA SIGNIFICACIN ESTADSTICA.
TAMAO DEL EFECTO VERSUS SIGNIFICACIN ESTADSTICA
En los captulos 6 y 7, abordamos el tema de la controversia que actualmente se desarrolla sobre
el valor de las pruebas de significacin, incluso el argumento que sostiene que frecuentemente
son mal utilizadas. Dijimos que existan dos modos principales de utilizar inapropiadamente las
pruebas de significacin que preocupan seriamente a los psiclogos, una de las cuales es que los
resultados no significativos son interpretados irreflexivamente como evidencia de que en realidad
no existe ningn efecto. En vista del material tratado en este captulo, podemos comprender con
mayor claridad por qu este error es realmente un problema. Los resultados no significativos po
dran ser consecuencia de un efecto muy pequeo o inexistente, o bien, simplemente de un bajo
nivel de potencia del experimento.
En el captulo 6, dijimos que pospondramos la discusin dei otro modo de utilizar inapropia
damente las pruebas de significacin hasta que hubiramos tratado determinado material en un
captulo posterior. Ese material era el tamao del efecto, y ahora estamos en condiciones de anali
zar ese tema postergado. La utilizacin inadecuada a la cual nos referimos ocurre cuando un re
sultado significativo es interpretado irreflexivamente como un resultado importante; es decir,
se confunde significacin con un gran tamao del efecto.
Hablando en forma general, la significacin estadstica se refiere a la probabilidad de que pu
diramos haber obtenido nuestro patrn de resultados en forma casual. Como lo explic Frick
(1997), la significacin se refiere a la fuerza de la evidencia en favor de un efecto distinto de cero.
Si nuestro resultado es significativo a nivel 0,05, tenemos una evidencia bastante buena. Si es sig
nificativo a nivel 0,01, es una evidencia an mejor.
Sin embargo, como hemos visto en este capitulo, un resultado significativo puede no ser im
portante en el sentido de implicar un gran tamao del efecto. Por ejemplo, si el tamao de la
muestra fuera grande, un resultado con un pequeo tamao del efecto podra ser estadsticamente
significativo a p < 0,001. En ese caso tendramos mucha confianza en que el verdadero efecto es
distinto de cero, pero el tamao de ese efecto distinto de cero an sera muy pequeo. Llegara
mos a la conclusin de que tenemos un efecto real pero muy leve. De modo similar, si el tamao
de la muestra fuera lo suficientemente pequeo, un resultado con un gran tamao del efecto po
dra no ser estadsticamente significativo en absoluto. En ese caso, la mejor estimacin en cuanto
al tamao del efecto es que la misma es grande. Pero no tendramos ninguna certeza ni siquiera de
que ese efecto realmente existe; podra ocurrir que el efecto fuera muy pequeo o incluso en di
reccin opuesta.
Una destacada psicloga, al escribir sobre este problema (Sean, 1997), observ que a pala
bra significativo es desafortunada, ya que en lenguaje ordinario significa importante". De he
cho, ella recomend que se cambiara el nombre por algo as como confiable. (Ese nuevo
nombre tambin presentara problemas, dado que el trmino confiabilidad tambin tiene un signi
ficado especial en estadstica). En cualquier caso, no es probable que el nombre cambie a corto
plazo. Por lo tanto, es importante que al leer o realizar investigaciones psicolgicas recordemos la
diferencia entre el uso especial que se da en psicologa a la palabra significacin, y la forma en la
que se la utiliza en el lenguaje comn.
Tal como observamos en el captulo , la mayora de los psiclogos no consideran que la uti
lizacin inapropiada de las pruebas de significacin sea razn suficiente para dejarlas de lado.
Sostienen, en cambio, que deberamos realizar un mayor esfuerzo para evitar tales utilizaciones
inapropiadas.

Sin embargo, este no es ei fin del problema. Muchos de aquellos que se oponen a las pruebas
de significacin sostienen que, aun cuando son utilizadas apropiadamente, las pruebas de signifi
cacin no reflejan el verdadero sentido de las investigaciones. Aseguran que la psicologa se re
fiere fundamentalmente al tamao del efecto, y no se trata de saber si un resultado es distinto de
cero. Ya hemos visto una versin de esta discusin en el captulo 7, con la sugerencia de que ios
investigadores utilicen ios intervalos de confianza en lugar de las pruebas de significacin. La
versin completa de esa propuesta (que no analizamos en ese momento) es que en realidad debe
ramos informar sobre el tamao del efecto, con un intervalo de confianza apropiado para ese ta
mao del efecto.
Adems de los argumentos arriba mencionados, aquellos que proponen el uso del tamao del
efecto sostienen que ste suministra informacin que puede ser comparada con otros estudios, y
utilizada para acumular informacin de estudios independientes como modo de investigacin
acerca del progreso en determinado campo. Los tamaos del efecto son componentes cruciales
del meta-anlisis, y muchos de aquellos que proponen el tamao del efecto, de hecho, no slo
proponen el meta-anlisis sino que lo ven como la tendencia del futuro en la psicologa.
Existen, sin embargo, argumentos contrarios a favor de las pruebas de significacin (y en
contra del uso exclusivo del tamao del efecto). Uno de esos argumentos establece que cuando el
tamao de la muestra es pequeo, an es posible obtener un gran tamao del efecto por casuali
dad. Por lo tanto, si estamos interesados en el resultado de un determinado estudio, que utiliz una
muestra pequea, las pruebas de significacin nos protegen de tomar los resultados de ese estudio
demasiado en serio. De manera similar, existen casos en los que un tamao del efecto muy peque
o es, de todos modos, importante (vase el tratamiento de este tema en el captulo 3)'. En una si
tuacin de ese tipo, es crucial saber si se puede confiar en que el resultado no es casual. Aun as,
muchos de aquellos que sostienen estos argumentos estn de acuerdo con qe se ha exagerado la
importancia de la significacin. La mayora sostiene que la significacin debera ser calculada e
informada siempre, pero que el tamao del efecto tambin debera ser calculado y debera drsele
ms importancia en la discusin de los resultados.
Existe, adems, otra posicin que sostiene que en algunas circunstancias los tamaos del
efecto son engaosos, por lo cual slo deberamos confiar en las pruebas de significacin. Chow
(1988, 1996), por ejemplo, realiza una diferenciacin entre las investigaciones orientadas a la
aplicacin y aquellas orientadas a la teora. En la investigacin aplicada, los psiclogos estn in
teresados en saber el tamao real del efecto de un programa determinado o ei tamao de la dife
rencia real entre dos grupos determinados. En esas circunstancias, Chow est de acuerdo con que
el tamao del efecto es una buena idea. Sin embargo, al realizar investigaciones tericas, Chow
sostiene que la situacin es bastante diferente. Es en esas situaciones en las que el tamao del
efecto es irrelevante y hasta engaoso.
Analicemos un experimento acerca del efecto de la familiaridad en el reconocimiento de in
formacin. El objetivo de este estudio es analizar la forma bsica en que la familiaridad afecta el
procesamiento de informacin. Un estudio podra exponer a diferentes personas a palabras cono
cidas y no conocidas, y observar cuntas milsimas de segundos es lleva reconoceras. El tamao
del efecto de tal estudio nos dira muy poco con respecto a la interpretacin de los resultados del
estudio. La interpretacin depende de toda clase de detalles sobre cmo se realiz el estudio, co
mo por ejemplo, qu grado de familiaridad o falta de familiaridad teman las palabras utilizadas,
de qu forma especfica fueron presentadas las palabras, y aspectos semejantes. Lo que importa
en un estudio de este tipo, segn Chow, es que a) la prediccin de una diferencia en el reconoci
miento de palabras conocidas y no conocidas fuera generada a partir de la teora, b) que los resul
tados fueran coherentes con lo predicho (segn lo demuestre la significacin estadstica) y que
c) as se sustente la teora.

La investigacin no es fundamentalmente terica slo en el campo de la psicologa cognitiva.


Otros ejemplos de investigacin esencialmente terica incluyen estudios experimentales acerca
de motivaciones para la atraccin interpersonal, de la medida en que los cambios qumicos influ
yen en los procesos nerviosos, de cmo los nios desarrollan el lenguaje, o de cmo vara la me
moria con respecto a hechos emocionales y no emocionales.
De hecho, es probable que el equilibrio actual entre la utilizacin de pruebas de significacin
y tamaos del efecto se encuentre simplemente en lo que uno podra esperar de los temas que se
ala Chow. En las reas de la psicologa aplicada se le est dando una importancia creciente al ta
mao del efecto, pero en reas ms tericas de la psicologa es ms raro ver menciones explcitas
de la magnitud del efecto. Nuestra opinin es que incluso en investigaciones orientadas a la teo
ra, la prdida potencial (al colocar el nfasis donde no corresponde) que implica la inclusin del
tamao del efecto, probablemente se vea compensada por, entre otros beneficios, la utilidad para
futuros investigadores de poder contar con esa informacin, lo cual les dara la posibilidad de
calcular la potencia al planificar sus propios estudios.

POTENCIA Y TAMAO DEL EFECTO SEGN SE DESCRIBEN EN


PUBLICACIONES CIENTFICAS
La potencia es tenida en cuenta principalmente por los psiclogos cuando planifican un estudio.
(Por ejemplo, con frecuencia es un tema principal en propuestas para tesis y en pedidos de finan
ciacin para gobiernos o instituciones). Como hemos visto, la potencia tambin representa un pa
pel importante cuando los psiclogos evalan conclusiones de las publicaciones cientficas. De
hecho, la funcin de la potencia aparece a veces en artculos publicados al exponer la interpreta
cin de resultados, especialmente en aquellos no significativos. El que sigue es un ejemplo toma
do de una de nuestras propias publicaciones.
En esta investigacin (Aron et. al., 1997), pusimos a personas extraas en pareja y les pedi
mos que charlaran siguiendo una serie de instrucciones diseadas para ayudarlos a lograr afini
dad. Luego de 45 minutos, cada individuo respondi en forma privada algunas preguntas sobre
cunta afinidad senta con respecto a su compaero. (Combinamos sus respuestas para formar lo
que denominamos compuesto de afinidad). En uno de los^estudios, probamos si la afinidad se
ra afectada por a) juntar a los extraos basndonos en la concordancia de sus actitudes o b) hacer
creer al participante que lo habamos juntado con alguien que pensbamos que io apreciara.
El resultado en ambos casos -la coincidencia de actitudes y la expectativa de ser apreciadofue que no hubo diferencias significativas en el compuesto de afinidad (p. 567). Despus, argu
mentamos que nuestros resultados sugeran que exista muy poco efecto verdadero de esas varia
bles sobre la afinidad:
Este estudio presentaba una potencia de aproximadamente un 90% de lograr efectos significativos (...] con
respecto a las dos variables manipuladas, si en realidad exista un gran efecto de este tipo ( d = 0,8). D e hecho,
la potencia es de aproximadamente un 90% si se trata de encontrar al menos un efecto cuasi significativo
(p < 0,10) de tamao mediano ( d = 0,5). Por lo tanto, parece improbable que hubiramos podido conseguir
estos resultados si de hecho existe ms que un efecto pequeo... fp. 567).

Cada vez es ms comn (aunque sigue siendo una excepcin) que las publicaciones mencionen el
tamao del efecto. Por ejemplo, Caspi et al. (1997) analizaron informacin de un estudio longitu
dinal a gran escala de una muestra de nios nacidos alrededor de 1972 en Dunedin, Nueva Zelan
da. En una de las partes del estudio, Caspi et. al. compararon a los 94 individuos de su muestra

que, a los 21 aos, eran dependientes del alcohol (claramente alcohlicos), contra los 863 que no
lo eran. Los investigadores compararon estos dos grupos en cuanto a las puntuaciones obtenidas
en pruebas de personalidad a los 18 aos de edad. Sin embargo, dado que el tamao de la muestra
era tan grande, los investigadores saban que incluso pequeas diferencias podran resultar esta
dsticamente significativas. Por lo tanto, al describir la planificacin de su anlisis, observaron:
Adems de probar la hiptesis de que las diferencias entre los grupos son estadsticamente significativas, calcu
lamos los tamaos del efecto (d ) de las diferencias obtenidas donde, definindolas operativamente, 4 = 0 ,2 es un
tamao del efecto pequeo, d =~05 es un tamacTdei efecto mediano y d = 0,8 es una gran tamao del efecto
(Cohn, 1 9 8 8 ^ ^ X 0 5 5 ? ----------------------

...................................... .........

...............................

El siguiente es un ejemplo tomado de la seccin Respuestas de la publicacin:


Los jvenes que a los 21 aos de edad eran dependientes del alcohol, a los 18 aos tuvieron puntuaciones
ms bajas en cuanto a T radicionalism o ( d = 0 ,4 9 ), Prevencin de D aos ( d = 0,44), Control (d - 0,64)
y Cercana Social (4 = 0,40); y ms altos en cuanto a Agresin ( d ~ 0,86), A lienacin ( d = 0,66), y Reac
cin de Estrs (4 ~ 0,50).

Es ms habitual que se informe sobre el tamao del efecto en los meta-anlisis, en los que se com
binan y comparan resultados de diferentesj^ETm ae^
estos
es tudiosmeta-anafticos7 me luyendo H defc adro
modo de ejemplo de la forma en que es
tos estudios realmente describen los resultados en funcin del tamao del efecto, analicemos un
famoso meta-anlisis realizado por Shapiro y Shapiro (1983). Ellos revisaron 143 estudios sobre
los efectos de psicoterapias que utilizaban razonablemente mtodos de sonido. Entre sus resulta
dos exista una comparacin de la efectividad de las terapias en general en diferentes tipos de pa
cientes (a los que denominaban la categora objetivo). La tabla 8-7 ilustra la cantidad de
estudios (N), el porcentaje que representa esa cantidad en relacin con todos los estudios revisa
dos, el tamao del efecto promedio y el desvo estndar de los tamaos del efecto. A partir de es
ta tabla podemos observar que los mayores beneficios de la psicoterapia se encontraron en los
estudios que se concentraban en personas con fobias, y los menores beneficios en estudios que se
concentraban en personas con angustia y depresin. Sin embargo, sobre la base de las medidas de
Cohn, an el efecto menor era grande.

Tabla 8-7.
Categoras objetivo y tamao de efecto.
Categoras objetivo
A ngustia y depresin
Fobias

Tamao de efecto

SO

30
76

0,67

0 ,6 2

18

1,28
1,10
0,95

0,85
0,75

0,80

0,71

Problem as fsico s y de hbitos


Problemas sociales y sexuales

106
76

A ngustias por el desem peo

126

26
18
30

0 ,8 8

Fuente: Shapiro, D. A. & Shapiro, D. (1983), tab. 5." Investigacin comparativa de resultados de terapias: implicancias
metodolgicas del meta-anlisis. R e v is ta C ie n tf ic a d e P s i c o lo g a d e A s e s o m m i e n t o y C ln ic a [ J o u r n a l o f C o n s u ltin g
a n d C lin ic a l P s y c h o l o g y I 5 1 ,4 2 -5 3 . Copyright, 1983, por la Asociacin Americana de Psicologa [American Psycho
logical Association]. Reimpreso con autorizacin del autor.

RESUMEN
La potencia estadstica de un estudio es la probabilidad de que se obtenga un resultado significa
tivo si la hiptesis de investigacin es verdadera.
En la prueba de hiptesis, se dice que se cometi un error Tipo I si el investigador rechaza la
hiptesis nula cuando en realidad la hiptesis de investigacin es falsa. La probabilidad de un
error Tipo I se denomina alfa, siendo alfa igual al nivel de significacin. Un error Tipo II ocurre
cuando el investigador no rechaza la hiptesis nula, pero en realidad la hiptesis de investigacin
es verdadera. La probabilidad de un error de Tipo II se denomina beta. La probabilidad de no co
meter un error Tipo II (1 beta) es la potencia de un experimento.
Para calcular la potencia (en el caso de una poblacin conocida y de una sola muestra), pri
mero determinamos el punto de corte acorde con el nivel de significacin en puntuaciones origi
nales, sobre la distribucin comparativa. La potencia es la probabilidad de obtener una media de
al menos esa magnitud en la distribucin de la poblacin 1 (la poblacin expuesta al tratamiento
experimental). Sobre la base de una media hipottica especfica de la poblacin 1 (y si se supone
una curva normal con la misma varianza conocida que la poblacin 2), se puede determinar la
puntuacin Z de ese punto de corte en la distribucin comparativa. La probabilidad de exceder
esa puntuacin Z, la potencia del estudio, puede encontrarse en la tabla de reas bajo la curva
normal,
Existen dos factores principales que afectan la potencia: el tamao del efecto y el tamao de
la muestra. El tamao del efecto (d) toma en cuenta la diferencia predicha entre medias (cuanto
mayor es la diferencia, mayor es la magnitud de efecto) y la varianza de la poblacin (cuanto me
nor es la varianza poblacional, mayor es la magnitud de efecto). El tamao del efecto es la dife
rencia entre las medias poblacionales dividida por el desvo estndar de la poblacin. El tamao
del efecto influye en la potencia, ya que a mayor tamao del efecto, menor es la superposicin en
tre las distribucionevS de medias de la poblacin predicha y el rea de rechazo de la distribucin de
medias correspondiente a la poblacin comparativa. Las reglas del tamao del efecto de Cohn
establecen que un efecto de 0,2 es pequeo, de 0,5 es mediano y de 0,8 es grande. El tamao del
efecto es importante en s mismo, ya que es un medio estandarizado para evaluar y comparar estu
dios, el cual no est afectado por el tamao de la muestra o la escala de medicin.
A mayor tamao de muestra, mayor ser la potencia; porque a mayor muestra, menor es la
varianza de la distribucin de medias, de forma tal que para una determinado tamao del efecto
existe menor superposicin entre las distribuciones.
La potencia tambin es afectada por el nivel de significacin (cuanto ms extremo, tal como
0,01, menor es la potencia) debido a la utilizacin de una prueba de una o dos colas (con menor
potencia en el caso de utilizarse una prueba de dos colas), y por el tipo de procedimiento de prue
ba de hiptesis utilizado (en el caso ocasional que pueda elegirse el procedimiento).
Las principales aplicaciones prcticas para aumentar la potencia de un experimento planifica
do consisten en aumentar el tamao del efecto y el tamao de la muestra.
Los resultados significativos de un estudio con alta potencia (como puede ser un estudio con
una muestra de gran tamao) pueden no tener importancia prctica. Los resultados no significati
vos de un estudio con baja potencia (como puede ser un estudio con una muestra de tamao pe
queo) dejan abierta la posibilidad de que aparezcan resultados significativos si se aumenta la
potencia.
Con un determinado tamao del efecto, los estudios con ms potencia (es decir, con muestras
mayores) tienen intervalos de confianza ms cortos. A veces los tamaos del efecto son informa
dos junto con los intervalos de confianza.

El meta-anlisis es un procedimiento reciente para combinar sistemticamente los efectos de


estudios independientes, fundamentalmente sbrela base de los tamaos del efecto.
Los psiclogos disienten con respecto a la importancia relativa de la significacin en oposi
cin al tamao del efecto, y en la interpretacin de resultados experimentales. Los psiclogos con
orientacin terica parecen otorgar mayor importancia a la significacin, mientras que ios inves
tigadores de temas de aplicacin dan mayor importancia al tamao del efecto.
Los informes sobre investigaciones a veces incluyen argumentaciones acerca de la potencia,
especialmente cuando evalan resultados no significativos. El tamao del efecto cada vez aparece
con ms frecuencia en las publicaciones cientficas, y es estndar en aquellas que emplean
meta-anlisis.

Trminos clave
-A lfa (a).
-B eta (p).
- Tamao del efecto (<).

Reglas del tamao del efecto.


- Meta-anlisis.
- Tablas de potencia.

Ejercicios
Los ejercicios implican la realizacin de clcu
los (con la ayuda de una calculadora). La ma
yora de los problemas estadsticos reales se
resuelven por computadora, pero aunque exis
ta la posibilidad de utilizarla, es conveniente
realizar estos ejercicios manualmente para in
corporar el mtodo de trabajo.
Para adquirir prctica en la utilizacin de
una computadora, para resolver problemas es
tadsticos, se puede utilizar la seccin de Com
putacin de cada captulo, publicada en la
Gua de estudio y libro de tareas de computa
cin para el alumno {Students Study Guide
and Computer Workbook] que acompaa este
libro.
Todos los datos de esta seccin son ficti
cios (a menos que se especifique lo contrario).
Las respuestas a los ejercicios de la serie I
se encuentran al final del libro.

SERIE I
1. Defina alfa y beta.
2. Para cada uno de los siguientes estu
dios, realice un cuadro de las cuatro posibles

- Potencia estadstica.
~ Error Tipo L
- Error Tipo H.

decisiones correctas e incorrectas y explique


qu significara cada una de ellas. (Cada cua
dro debera estar diseado de manera seme
jante a la tabla 8-1, pero dentro de los cuadros
debe incluir los resultados reales utilizando
los nombres de las variables involucradas en
el estudio).
a) Estudio sobre si el aumento del tiempo
de descanso mejora el comportamiento de los
alumnos en la clase.
b) Estudio sobre si los individuos daltnicos distinguen mejor los matices del gris que la
poblacin en su totalidad.
c) Estudio comparativo de los individuos
que alguna vez han asistido a psicoterapia y el
pblico en general, para observar si son ms
tolerantes con las perturbaciones de los dems
que la poblacin en general.
3.
Aqu le presentamos informacin acerca
de diferentes posibles versiones de un experi
mento, cada una de las cuales involucra una so
la muestra. (Se supone que el investigador
puede tener cierto control sobre el desvo es
tndar y la media predicha de la poblacin
cambiando los procedimientos). Determine la
potencia y el tamao del efecto de cada una;
luego realice un diagrama de las distribuciones

que se superponen, mostrando las reas que re


presentan alfa, beta y la potencia. (Suponga
que todas las poblaciones tienen una distribu
cin normal).
M ed ia
p red ch a
P o b la ci n

(a)
(b)
(c)
(d)
(e)
(i)

90
90
90
90
90
90

X
4
4
2
4
4
4

91
92
91
91
91
91

N ivel
de
N sig n ifica c i n

100
100
100
16
100
0 0

0,05
0,05
0,05
0,05
0,01
0,05

U na
odos
c o la s
1
1
1
1
1
2

4. Basndose en una determinada teora


acerca de la creatividad, un psiclogo predice
que los artistas son personas ms dispuestas a
comer riesgos que ia poblacin en general. La
poblacin general presenta una distribucin
normal con una media de 50 y un desvo estn
dar de 12, segn el cuestionario sobre riesgo
que el psiclogo piensa utilizar. El psiclogo
espera que los artistas tengan un valor prome
dio de 55, segn ese mismo cuestionario. El
psiclogo piensa analizar a 36 artistas y probar
la hiptesis a un nivel de 0,05. Cul es la po
tencia de este estudio? Explique su respuesta a
alguien que comprende la prueba de hiptesis
con medias mustrales pero que nunca ha
aprendido el concepto de potencia.
5. Usted lee un estudio en el que el resulta
do es apenas significativo a nivel 0,05. Des
pus observa el tamao de la muestra. Si la
muestra es muy grande (en lugar de muy pe
quea), cmo debera afectar esto su interpre
tacin de a) la probabilidad de que la hiptesis
nula sea realmente verdadera y b) la importan
cia prctica del resultado? Explique su res
puesta a una persona que comprende la prueba
de hiptesis pero que nunca ha aprendido el
concepto de potencia.
6. Cul es el efecto en la potencia de un
estudio de cada uno de los siguientes aspectos?
a) Una mayor diferencia predicha entre las
medias poblacionales.
b) Un mayor desvo estndar poblacionaj.
c) Un mayor tamao de muestra,

d) Utilizar un nivel de significacin ms


exigente (p. ej. 0,01, en lugar de 0,05).
e) Utilizar una prueba de dos colas en lu
gar de una.
7.
Enumere dos situaciones en las que sea
til tener en cuenta la potencia, indicando cul
es la utilidad de cada una.

SERIE 11
1. Qu significa la potencia estadstica de
un experimento?
2. Para cada uno de los siguientes estudios
realice un cuadro de las cuatro posibles decisio
nes correctas e incorrectas, y explique qu sig
nificara cada una. (Cada cuadro debera estar
diseado de manera semejante a la tabla 8-1,
pero dentro de los cuadros debe incluir el re
sultado real utilizando los nombres de las va
riables involucradas en el estudio).
a) Estadio sobre si las criaturas que nacen
prematuramente comienzan a reconocer los
rostros despus de lo que lo hacen los dems
nios en general.
b) Estudio sobre si los alumnos secunda
rios que reciben programas de prevencin del
Hiv en sus colegios tienen mayor probabilidad
de practicar sexo seguro que otros alumnos se
cundarios.
c) Estudio sobre si la memoria para ideas
abstractas se reduce si la informacin se pre
senta en colores que distraen la atencin.
3. Aqu le presentamos informacin sobre
diferentes posibles versiones de un experi
mento planificado, cada una referida a una so
la muestra. (Se supone que el investigador
puede tener cierto control sobre el desvo es
tndar y la media predicha de la poblacin
cambiando los procedimientos). Determine la
potencia y el tamao del efecto de cada una.
Despus realice un diagrama de las distribu
ciones que se superponen mostrando las reas
que representan alfa, beta y la potencia. (Su
ponga que todas las poblaciones tienen una
distribucin normal).

cantidad media identificada correctamente au


mentar a 74. El psiclogo planea probar 20
participantes con estas condiciones, utilizando
P o b la ci n
el
nivel 0,05. Cul es la potencia de este es
2 .
Mtudio? Explique su respuesta a alguien que
0
50
0,05
0,5
0,1
l
a)
0,5
comprende la prueba de hiptesis con medias
0
50
0,5
0,05
1
b)
0
10,0
50
0,5
0,05
1
c)
mustrales pero que nunca ha aprendido el
0
0,5
0 ,5
100
0,0 5
1
d)
concepto de potencia.
0,5
0
0,5 2 0 0
0,05
1
e)
5. Usted lee un estudio que, por muy poco,
0 ,5
0,5 4 0 0
0
0 ,0 5
2
0
no arroja resultados significativos al nivel 0,05.
Es decir, el resultado no es significativo. Des
4.
Un psiclogo est planificando un estudio
acerca del efecto de la motivacin en el desem pus, observa el tamao de la muestra. Si la
peo de un participante, en una tarea de atencin muestra es muy grande (y no muy pequea),
que involucra la identificacin de ciertas letras cmo afecta esto su interpretacin de a) la
en una sucesin de letras que pasan a gran ve probabilidad de que la hiptesis nula sea real
locidad. El investigador sabe, por su larga ex mente verdadera y de b) la probabilidad de que
periencia, que en condiciones experimentales la hiptesis nula sea realmente falsa? Explique
ordinarias, la poblacin de alumnos que parti sus respuestas a una persona que comprende la
cipan en esta tarea identifica, en promedio, 71 prueba de hiptesis pero que nunca ha aprendi
de las letras claves (de 100 que se presentan); do el concepto de potencia.
6. Usted est planificando un estudio que,
que el desvo estndar es 10, y que la distribu
cin es aproximadamente normal. El psiclogo de acuerdo con sus clculos, tiene una potencia
predice que si al participante se le paga un d bastante baja. Nombre seis alternativas de las
lar por cada letra identificada correctamente, la que dispone para aumentar la potencia.
M ed ia
p redicha

N ivel
de
N sig n ifica c i n

U na
ods
c o la s

; >; Introduccin a a prueba t ia prueba


Resumen,,
pa|ra una sola muestra.
> Trminos clave.
) La prueba f para medias dependientes. <
; Ejercicios.
> :Spuest0s de !a prLieba t
:
: V Apndice del captulo: Frmulas de
Tamao del efecto y potencia de |a
clculo opcionales correspondientes
prueba t para medias dependientes.
a la prueba f para medias dependientes.
ri Controversias y limitaciones.
Las pruebas segn s describen.
en publicaciones cientficas.

esta altura, el alumno debe creer que lo sabe todo acerca de la prueba de hiptesis.
Sin embargo, se sorprender: lo que ha aprendido hasta ahora no le resultar muy
til como psiclogo. Por qu? Los procedimientos para prueba de hiptesis descriptos hasta ahora fueron, por supuesto, requisitos previos absolutamente necesa
rios para lo que estamos por aprender, Sin embargo, estos procedimientos
involucraban la comparacin de un grupo de valores observados con una poblacin conocida, y
cuando se realizan investigaciones reales, con frecuencia se comparan dos o ms grupos de valo
res observados entre s, sin ninguna informacin directa acerca de las poblaciones. Por ejemplo,
podran utilizarse dos valores correspondientes a cada una de las diferentes personas, tales como
las puntuaciones en una prueba de angustia antes y despus de la psicoterapia; o la cantidad de
palabras familiares recordadas, en comparacin con las no familiares, en un experimento acerca
de la memoria. O tambin se podra utilizar un valor por cada una de las personas que forman dos
grupos, tales como un grupo experimental y un grupo control, en un estudio acerca del efecto de
la prdida del sueo en la resolucin de problemas.
Estos tipos de situaciones de investigacin se encuentran entre las ms comunes en psicolo
ga, donde la nica informacin disponible proviene de las muestras. Nada se sabe acerca de las
poblaciones de donde provienen esas muestras. Particularmente, el investigador desconoce la va
ri anza de las poblaciones involucradas, la cual es un componente crucial en el paso 2 del proceso
de prueba de hiptesis (determinar las caractersticas de la distribucin comparativa).
En este captulo, analizamos primero la solucin al problema de no conocer la varianza poblacional. Comenzamos con una situacin de prueba de hiptesis especial, comparando la me
dia de una sola muestra con una poblacin de a cual conocemos la media pero no a varianza.
Luego, despus de haber aprendido cmo se maneja este inconveniente de no conocer la va
rianza poblaciona, proseguimos con la situacin en la cual directamente no hay poblacin co
nocida, una situacin en la que todo lo que tenemos son dos observaciones por cada una de las
personas de un grupo.

Los procedimientos de prueba de hiptesis que aprenderemos en este captulo, en los que no
se conoce la varianza poblacional, son ejemplos de lo que se denominan pruebas t. Las pruebas
a veces se denominan t de Studenf, porque sus principios fundamentales fueron desarrollados
originalmente por William S. Gosset, quien public sus artculos bajo el seudnimo de Student
(vase cuadro 9-1).

Cuadro 9 -1 .
W illiam S. G osset, alias Student:
n o era un m atem tico sino..un "hom bre prctico".

^Wtani'S. Gosset se gradu en Oxford en tro tiempo, n tena-idea de la yari'anza de.. .'
:v;.
vv.v y ; V;;;;v :
199 y obtuvo su diploma n matemtica y vsU poblacin.
. Gosset estaba a la altura de las circns- ;
qumica; En el mismo ao sucedi que los
fabricantes de cerveza de Guinness, en Du- / ancis, aunque en ese momento slo l le ,
saba. Para sus colegas de la.fbrica de cr- . ;
bln, Irlanda, estaban buscando cientficos
veza, era un profesor de matemtica'y no. .'
jvenes para que, por primera vez en la his
un dign fabricante de cerveza. .Para sus ;
toria, analizaran la fabricacin d la cervecolegas estadsticos, principalmente lo del
. za de manera cientfica. Gosset obtuvo uno '
Laboratorio de Estadstica de Datos B ioi-.
de esos, puestos, y no fard en sumergirse en
la cebada, los lpulos y cubas para la ela- . . gicos de la Universidad de Londres;, era un
simple, fabricante de cerveza y no un rater .
boracin de la cerveza.
El problema consista en hallar l for- ; . mticq propiamente dicho.. En., resumen, ;.:
Gosset era esa clase de cientfico qu n
ma de que la calidad de la cerveza fuera.
tiene inconveniente en aplicar sus talentos ,
"; menos variable, y especialmente descubrir.
:
la causa de las malas tandas. Un cientfico ; a vida prctica.;-;
De hecho; pareca disfrutar de'esa vida;/.;
que se preciar de serlo recomendara, sin
real: cultivando peras, pescando, jugando
duda, la realizacin, de experimentos; Pero
golf; construyendo botes, esquiando, n- .
un negocio como el de l elaboracin de ::
cerveza no poda darse el lujo de gastar di- : dando bnbicicleta (y jugando las bochas . '
sobre cspd, despus d. que se quebr, la .
ero en experimentos qu incluan grandes
pierna al estrellar su auto-un Ford modelo
cantidades d cubs algunas de las cuales
T de dos plazas al que llamaba Uacama vo- .,;
iban perderse, omo lo sabra cualquier
ladora, ~ contra n:poste d luz); Disfrutafabricante de cerveza. Por lo tanto, Gosset
fia especialmente de las .heriamientas sim{. .
se vio forzado a analizar la probabilidad de
; qu cierta especi d cebada produjera una pies que podan aplicarse a cualquier csa;..
cerveza de psima calidad, dado que el exv ; frmulas simples; que poda calcular meh- ; ;
talmente. (^n amigo lo describa como un ,
. periment poda consistir slo en has po;
cas tandas .de cada especie. A est prbleina - experto carpintero* aunque afirmaba que
se sumaba el hecho de que l no tena la '. . Gosset realizaba casi toda su carpintera fi-;
na slo cohun cortaplumas);
menor idea de. la yriabilidd de las espe
. De sa. manera, Gosset; descubri- l
cies de cebada; tal vez algunos campos ;
distribucin t e invent la prueba (la sihK .;
dieran mejor cebada al ser plantadas con la
misma especie (suena famili.ar?):. Pobre. . ptez misma, comparada coa la mayora d
los clculos estadsticos), para, aquellas si- .'
Gosset, al igual quedos psiclogos de nues-i
.

tuaciones en las. que las muestras soh pe, se lo pidieron. Hasta el da de. hoy, la mayo
: : quenas y se desconoce la variabilidad de. la ra de los estadsticos llaman a la. distribu-,
cin t la de Student, ' porque Gosset
poblacin que se supone de un.tamao muescriba
baj o el seudnimo de Studenf,

^cho ms grande. La mayor paite de su trasimplemente para que la fbrica de cerveza


:; bajo lo realiz en el reverso de sobres,.con
' Guinness no tuviera que admitir pbiica. muchos errores menores de aritmtica que
. mente que a veces elaboraban una mala
, tuvo que corregir .luego. Como suele ocu*
tanda d crveza1.
.
rrir, public su trabajo sobre Mtodos, pa: . ra la elaboracin de cerveza slo.cuando
R frenciast Prs (1987); Stiglec (986); Tankard
algunos editores de las revistas cientficas
(1984).; .
v
7

INTRODUCCIN A LA PRUEBA T:
PRUEBA TPARA UNA SOLA MUESTRA
Comenzaremos con la siguiente situacin: tenemos los registros de una sola muestra y queremos
comparar esos datos con una poblacin de la cual conocemos la media pero no la varianza. La
prueba de hiptesis, en este caso, se denomina prueba t para una sola muestra. (Tambin la lla
man prueba f de una muestra). La prueba t para una sola muestra funciona bsicamente de la
misma forma que lo aprendido en el captulo 7. Hay slo dos importantes cuestiones nuevas: pri
mero, ya que no conocemos la varianza poblacional, debemos estimarla. Segundo, cuando se de
be estimar la varianza de la poblacin, la forma de la distribucin comparativa es levemente
diferente a una curva normal.

Ejemplo
Supongamos que el peridico de cierta facultad informa acerca de una encuesta informal que
muestra que los estudiantes de la facultad estudian un promedio de 2,5 horas por da. Sin embar
go, uno de los alumnos considera que los estudiantes que viven en el mismo alojamiento estu
diantil que l estudian mucho ms que esa cantidad de horas. Elige al azar 16 alumnos del edificio
y les pregunta cunto estudian cada da. (Supondremos que son todos honestos y precisos). El re
sultado que obtiene es que estos 16 alumnos estudian un promedio de 3,2 horas por da. En ese
caso, el alumno debera concluir que los estudiantes de su alojamiento estudian ms que el pro
medio de horas que lo hacen los de la facultad? O debera concluir que sus resultados son tan
cercanos a ese promedio de la facultad que la pequea diferencia de 0,7 horas podra bien deberse
a que accidentalmente ha seleccionado 16 de los residentes ms estudiosos del alojamiento estu
diantil?
El primer paso del proceso de prueba de hiptesis es replantear el problema en funcin de hi
ptesis sobre poblaciones. Existen dos poblaciones:
P o b la ci n 1:
P o b la ci n 2:

el tipo de estudiantes que viven en el edificio del alumno que realiza el estudio.
el tipo de estudiantes de la facultad en general.

La hiptesis de investigacin establece que ios alumnos de la poblacin 1 estudian ms


que los alumnos de la poblacin 2; la hiptesis nula establece que los alumnos de la poblacin
1 no estudian ms que los alumnos de la poblacin 2. Hasta aqu el problema no es diferente al
del captulo 7.
El segundo paso es determinar las caractersticas de la distribucin comparativa. La media de
esta distribucin ser de 2,5, el nmero arrojado por la encuesta a los alumnos de la facultad en
general (poblacin 2).
La siguiente parte del segundo paso es encontrar la varianza de la distribucin de medias. En
este ejemplo nos encontramos con otro tipo de inconveniente; hasta aqu, siempre hemos cono
cido la varianza de la poblacin de observaciones individuales. Utilizando esa varianza, luego
calculbamos la varianza de la distribucin de medas. En este caso, la publicacin no inform
la varianza de la cantidad de horas de estudio de la facultad en general. Entonces el alumno lla
ma al peridico. Lamentablemente, el periodista no calcul la varianza, y los resultados de la en
cuesta original ya no estn disponibles. Qu hacer en ese caso?
Principio bsico de a prueba t: estimar la varianza poblacional
a partir de los valores mustrales
Si no conocemos, la varianza de la poblacin de observaciones, la podemos estimar a partir de lo
que s conocemos; los valores observados de las personas que forman la muestra. Segn la lgica
de la prueba de hiptesis, se considera que el grupo de personas que analizamos es una muestra
aleatoria de determinada poblacin. La varianza de esa muestra debera reflejar la varianza de la
poblacin. S la poblacin presenta mucha dispersin (existe mucha varianza entre los valores),
entonces una muestra seleccionada al azar de esa poblacin debera tener mucha dispersin; si la
poblacin es muy compacta, con poca dispersin, no debera haber mucha dispersin tampoco en
la muestra. Por lo tanto, se podra utilizar la dispersin de los valores de la muestra para realizar
una presuncin fundamentada de la dispersin de los valores de la poblacin. Es decir, podramos
calcular la varianza de las observaciones mustrales, y ese clculo sera similar a la varianza de
los valores poblacionales. ( Vase figura 9-1 ).

F ig u r a 9 - i . V arianzas m u strales y las p o b la cio n e s d e d on d e provien en las m uestras.

Sin embargo, existe un pequeo obstculo. La varianza de una muestra generalmente ser le
vemente menor que la varianza de la poblacin de donde proviene la muestra. Por est razn, la
varianza de la muestra es una estimacin sesgada de la varianza pobacional.
Por qu la varianza de la muestra es levemente menor que la de la poblacin? La varianza se
basa en desvos con respecto a la media. La varianza de una poblacin se basa en desvos con res
pecto a la media de esa poblacin. Por otro lado, la varianza de una muestra se basa en desvos
con respecto a la media de esa muestra. La media de una muestra es el punto de equilibrio ptimo
para sus registros, Por lo tanto, los desvos de los registros de una muestra con respecto a su me
dia sern menores que los desvos con respecto a cualquier otro nmero. La media de la muestra
generalmente no es exactamente igual a la media de la poblacin de donde proviene. Consecuen
temente, los desvos de los registros de una muestra con respecto a la media de la muestra gene
ralmente sern menores que los desvos de los registros de esa muestra con respecto a la media de
la poblacin.
Supongamos que conociramos la media poblacional de la que proviene la muestra y utiliz
ramos esta media para comparar el desvo de cada registro de la muestra. La varianza calculada
de este modo sera una estimacin no sesgada de la varianza poblacional.
Lamentablemente, no conocemos la media de la poblacin de la cual proviene la muestra. La
muestra proviene de la poblacin 1. En este caso, slo conocemos la media de la poblacin 2. Pe
ro las medias de las dos poblaciones son iguales slo si la hiptesis nula es verdadera, y eso es
precisamente lo que estamos probando. (Independientemente de si la hiptesis nula es verdadera
o no, nosotros s suponemos que ambas poblaciones tienen la misma varianza).
Afortunadamente, podemos calcular una estimacin no sesgada de la varianza poblacional.
Lo que hacemos es realizar una correccin al calcular la varianza, basadas en los valores mustra
les que refleja con exactitud la medida en que la media de una muestra tiende a variar con respec
to a la verdadera media de la poblacin. Esta estimacin no sesgada se calcula cambiando
ligeramente la frmula ordinaria de varianza. La manera comn de calcular la varianza es tomar
la suma de los desvos cuadrticos y dividirla por la cantidad de valores observados. Segn el pro
cedimiento modificado, tomamos la suma de los desvos cuadrticos pero la dividimos por la can
tidad de valores menos 1. Dividir por una cantidad ligeramente menor hace que el resultado de la
divisin (la varianza) sea ligeramente mayor.
Sucede que dividir por la cantidad de valores menos 1 aumenta la varianza resultante slo lo
suficiente como para que sea una estimacin no sesgada de la varianza poblacional. A propsito,
no sesgada no significa que la estimacin ser exactamente la verdadera varianza de la pobla
cin; slo significa que el mtodo produce estimaciones cuyo promedio coincide con esa verda
dera varianza. (La estimacin sesgada, la varianza muestral calculada en la forma usual, ser
sistemticamente demasiado baja).
El smbolo de la estimacin no sesgada de la varianza poblacional es S2. La frmula es la
usual, pero con la divisin por N - 1 en lugar de N:
_ %(XM) __ SC
N- 1 ~N - 1

(9-1)

el desvo estndar poblacional estimado es la raz cuadrada de la varianza poblacional estimada,

s=dF

(9-2)

Volvamos al ejemplo de las horas de estudio y calculemos la varianza poblacional estimada utili
zando los 16 valores mustrales. Primero, calculamos la suma de los desvos cuadrticos. (Resta
mos la media muestral a cada uno de los valores, elevamos al cuadrado esos desvos, y los

sumamos). Supongamos que realizamos este clculo y el resultado es 9,6 (SC = 9,6). Para obtener
la varianza poblacionai estimada, dividimos esta suma de desvos cuadrticos por la cantidad de
valores mustrales menos 1, En la muestra hay 16 valores, entonces el tamao de la muestra me
nos 1 es 15. El resultado es 0,64. Es decir, 9,6/15 es igual a 0,64. La frmula es la siguiente:

tf-1

- 1 16-1

15

Grados de libertad
El mnimo por el cual dividimos (la cantidad de valores menos 1) para calcular la varianza pobla
cionai estimada tiene un nombre especial. Se lo denomina grados de libertad, porque es la canti
dad de valores mustrales libres para variar. Se trata de un concepto un poco complicado. La
idea bsica es que, al calcular la varianza, primero debemos conocer la media; si conocemos la
media y todos los valores de la muestra excepto uno, con un poco de aritmtica podemos calcular
aqul valor que desconocemos. (Si al alumno le agradan las aventuras matemticas, puede inten
tarlo con algunos ejemplos para comprobar como funciona). Por lo tanto, una vez que conocemos
la media, uno de los valores de la muestra no tiene libertad de tomar cualquier valor posible. En
tonces, los grados de libertad son la cantidad de valores menos 1. Se expresa por la frmula,
g l-N - 1

(9-3)

donde gl representa los grados de libertad. En nuestro ejemplo, gl =* 16 - 1 ~ 15. (En algunos ca
sos, que aprenderemos en captulos posteriores, los grados de libertad se calculan de forma lige
ramente diferente, debido a que en esos casos es diferente la cantidad de valores libres para variar.
En todos los casos planteados en este captulo, g l ~ N - 1).
La frmula para calcular la varianza poblacionai estimada, con frecuencia, se escribe utili
zando gl en lugar de N - 1:
^
o X(X-M )2 SC
s = ~ i r ~ = gi

Determinacin del desvo estndar de la distribucin de medias


a partir de una varianza poblacionai estimada

Una vez que hemos estimado la varianza de la poblacin, calcular el desvo estndar de la distri
bucin comparativa implica los mismos procedimientos aprendidos en el captulo 7. Es decir,
consideramos la distribucin comparativa como una distribucin de medias. Al igual que antes,
podemos calcular su varianza como la varianza de la poblacin de individuos dividida por el ta
mao de la muestra. La nica diferencia es que en lugar de conocer la varianza de la poblacin de
observaciones individuales hemos tenido que estimarla. Como siempre, el desvo estndar de la
distribucin de medias es la raz cuadrada de su varianza. La frmula es la siguiente,
(9-5)

(9-6)

Es importante tener en cuenta que cuando estamos utilizando una varianza poblacional estima
da, los smbolos para la varianza y el desvo estndar de la distribucin de medias utilizan S en
lugar de o-.
En el ejemplo que estamos analizando, el tamao de la muestra era l, y la varianza poblacio
nal estimada que acabamos de calcular era 0,64. La varianza de la distribucin de medias, sobre la
base de esa estimacin, ser 0,04. Es decir, 64 dividido 16 es igual a 0,04. El desvo estndar es
0,2, la raz cuadrada de 0,04. La frmula es la siguiente,

Cabe advertir que para encontrar la varianza de una distribucin de medias siempre se divide la
varianza poblacional por el tamao de la muestra, y esto ocurre ya sea porque conocemos la va
rianza de la poblacin o slo porque la estimemos. En el ejemplo que estamos analizando, dividi
mos la varianza poblacional, que habamos estimado, por 16. Slo cuando realizamos la
estimacin de la varianza poblacional dividimos por el tamao de la muestra menos 1. Es decir,
los grados de libertad se utilizan slo cuando estimamos la varianza de la poblacin de observa
ciones individuales.
Forma de la distribucin comparativa al utilizar una varianza poblacional estimada.*
ia distribucin t
En el captulo 7 dijimos que mientras sea razonable suponer que la distribucin poblacional si
gue una curva normal, la forma de la distribucin de medias tambin seguir una curva normal.
Esto cambia cuando estamos realizando una prueba de hiptesis utilizando una varianza pobla
cional estimada. Cuando eso ocurre, contamos con menos informacin cierta y existe ms posi
bilidad de error. El efecto matemtico es que las medias extremas son ligeramente ms
probables que en una curva normal. Ms an, cuanto menor sea el tamao de la muestra, mayor
ser esa tendencia, ya que estamos estimando la varianza de la poblacin basndonos en menos
informacin.
Cul es el resultado de todo lo anterior cuando realizamos una prueba de hiptesis con una
varianza estimada? El resultado es que la distribucin de medias (la distribucin comparativa) no
seguir exactamente una curva normal. Por el contrario, la distribucin comparativa sigue una
curva matemticamente definida que se denomina distribucin t.
En realidad, existen muchas distribuciones t. Su forma vara segn los grados de libertad de la
muestra utilizada al estimar la varianza poblacional. (Sin embargo, para un determinado grado de
libertad, existe slo una distribucin t). En general, todas las distribuciones t parecen a la vsta
una curva normal, con forma de campana, completamente simtricas y unimodales. La distribu
cin f se diferencia ligeramente porque sus colas son ms gruesas (es decir, existen algunos valo
res ms en los extremos). La figura 9-2 ilustra la forma de una distribucin t en comparacin con
una curva normal

Figura 9-2. D istrib u ci n f com parada c o n


la distribucin norm al.

Esta sutil diferencia de la forma afecta los valores extremos necesarios para rechazar la hiptesis nu
la. Para rechazar la hiptesis nula necesitamos estar en una zona extrema bajo la curva normal, co
mo por ejemplo el 5% superior. Sin embargo, si hay ms valores extremos, el punto en el que
comienza el 5% superior est ms alejado, hacia afuera de la curva. Por eso, es necesaria una media
muesral ms extrema para obtener significacin al utilizar una distribucin t que al utilizar una cur
va normal.
La medida en que la distribucin t difiere de la curva normal depende precisamente de los
grados de libertad en la estimacin de la varianza pobacional. La distribucin t difiere ms de la cur
va normal cuando la estimacin de la varianza pobacional se basa en una muestra muy pequea, de
modo que los grados de libertad son bajos. Por ejemplo, utilizando la curva normal, el punto de corte
para una prueba de una cola a nivel 0,05 es 1,64. En una distribucin t con 7 grados de libertad (es de
cir, con un tamao de muestra de 8), el punto de corte correspondiente al 5% en una prueba de una co
la es 1,895. Si la varianza pobacional estimada se basa en una muestra mayor, digamos una muestra
de 25 (de modo que gl - 24), el punto de corte es 1,711. Si el tamao de la muestra es infinito, la dis
tribucin es igual a la curva normal. (Por su puesto, si el tamao de tu muestra fuera infinito, inclui
ra toda la poblacin0- Pero incluso con tamaos de muestra de 30 ms, la distribucin te s casi
idntica a la curva normal.
Antes de aprender cmo encontrar realmente el punto de corte utilizando una distribucin t,
volvamos primero brevemente al ejemplo de la cantidad de horas que estudian cada noche los
alumnos del edificio de dormitorios . Finalmente tenemos todo lo que necesitamos para comple
tar el segundo paso, que se refiere a las caractersticas de la distribucin comparativa. Ya hemos
visto que la distribucin de medias tendr una media de 2,5 horas y un desvo estndar de 0,2. So
bre la base de lo que acabamos de analizar, ahora podemos agregar que la forma de la distribucin
comparativa ser una distribucin i con 15 grados de libertad.1

1 Los estadsticos hacen una sutil distincin en este caso entre la distribucin comparativa y la distribucin de m e
dias. H em os evitado presentar esta distincin aqu y en captulos posteriores para simplificar e l tratamiento de un te
ma que-ya es de por s bastante complicado. Pero para aquellos que estn interesados en e l tema diremos que la
distincin puede entenderse de la siguiente manera: el procedimiento general de prueba de hiptesis, tal com o lo
presentamos en e l captulo 7, puede describirse com o la comparacin de una puntuacin 2 con la m edia de 3a m ues
tra, donde Z = ( M ~ (i)/
y donde o u = w VN, y luego a comparacin de esta puntuacin Z c o n un punto Z de cor
te de la tabla de reas de la curva normal. Describim os este proceso utilizando la distribucin de inedias com o
distribucin comparativa.
L o s estadsticos diran que en realidad e s ta m o s comparando la puntuacin Z, calculada con una distribucin de la pun
tuacin Z (que e$ simplemente una curva normal estndar). D e modo similar, en el caso de una prueba t, ios estadsticos
consideran que el procedimiento es como calcular una puntuacin r (similar a una puntuacin Z pero calculada utilizan
do un desvo estndar estimado), donde t = ( M - iL)IS ,, donde
y luego comparar la puntuacin t calcula
da con un punto de corte t tomado de una tabla de distribucin i. Por lo tanto, de acuerdo con la lgica estadstica
formal, a distribucin comparativa es una distribucin de la puntuacin , y no de medias.

Determinacin del valor muestra! de corte para


rechazar la hiptesis nula: utilizacin de la tabla f
El tercer paso del proceso de prueba de hiptesis es determinar el punto de corte para rechazar la
hiptesis nula. Existe una distribucin t diferente para cada nmero de grados de libertad en par
ticular. Sin embargo, para no llenar hojas y hojas con tablas para cada posible distribucin , se
utiliza una tabla simplificada que incluye slo los puntos de corte cruciales. En el apndice B in
cluimos esta tabla t (tabla B-2).
En el ejemplo que estamos analizando, tenemos una prueba de una cola (nos interesa saber si
los alumnos del edificio en cuestin estudian ms que los alumnos de esa facultad en general).
Creemos que podemos utilizar el nivel de significacin del 5% ya que e costo de un error Tipo I
(rechazar equivocadamente la hiptesis nula) no es grande. Tenemos 16 participantes, lo que da
15 grados de libertad para la estimacin de la varianza poblacional.
La tabla 9-1 incluye una parte de una tabla t similar a la tabla B-2. Buscamos la columna correspon
diente al nivel de significacin 0,05 para pruebas de una cola, luego descendemos por esa columna has
ta la lnea correspondiente a 15 grados de libertad. El nmero crucial de corte es 1,753. Esto significa
que rechazaremos la hiptesis nula si la media muestra! se encuentra a 1,753 o ms desvos estndar por
encima de la media en la distribucin comparativa. (Si estuviramos utilizando una varianza conocida
hubiramos encontrado el punto de corte en una tabla de reas bajo la curva normal. La puntuacin Z ne
cesaria para rechazar la hiptesis nula, sobre la base de la curva normal, hubiera sido 1,645).
Hay otro tema que queremos destacar acerca de la utilizacin de la tabla t. En la tabla t com
pleta que se encuentra en el apndice, existe una lnea para cada grado de libertad, desde el 1 has
ta el 30. Luego, para cada cinco grados de libertad (35,40,45, etc.), hasta 100. Supongamos que
el estudio incluyera grados de libertad que se encuentran entre dos valores. Para mayor seguridad,
deberamos utilizar los grados de libertad inferiores ms cercanos a los de la muestra que se en
cuentren en la tabla. Por ejemplo, si estuvieras realizando un estudio en el que hubieran 43 grados
de libertad, utilizaramos la lnea de la tabla correspondiente a 40 g l
Tabla 9-1.
Puntos de corte para las distribuciones t con grados de libertad del 1 a 17. (Se indica el punto de
corte para el ejemplo acerca de las horas de estudio).
Pruebas de una cola
gl

OJO

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,364
1,356
1,350
1,345
1,341
1,337
1,334

0 ,0 5

6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,813
1,796
1,783
1,771
1,762
1,753
1,746
1,740

Pruebas de dos colas

0,01

OJO

31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,897
2,822
2,764
2,718
2,681
2,651
2,625
2,603
2,584
2,567

6,314
2,920
2,353
2,132
2,015
i,943
1,895
1,860
1,833
1,813
1,796
1,783
1,771
1,762
1,753
1,746
1,740

0 ,0 5

12,706
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,201
2,179
2,161
2,145
2,132
2,120
2,110

0,01

63,657
9,925
5,841
4,604
4,032
3,708
3,500
3,356
3,250
3,170
3,106
3,055
3,013
2,977
2,947
2,921
2,898

Determinacin del valor correspondiente a la media muestral


en la distribucin comparativa: el punto t
El cuarto paso del proceso de prueba de hiptesis es la determinacin del valor muestral en la dis
tribucin comparativa. En captulos anteriores, esto implicaba ubicar la puntuacin Z en la distri
bucin comparativa (la cantidad de desvos estndar a los que se encontraba el valor muestral con
respecto a la media en la distribucin de medias). Cuando la distribucin comparativa es una dis
tribucin t hacemos exactamente lo mismo. La nica diferencia es que antes, cuando la distribu
cin comparativa era una curva normal, ei valor que calculbamos en ella se llamaba puntuacin
Z; ahora estamos utilizando una distribucin t como distribucin comparativa, por lo tanto, el va
lor que calculamos sobre ella se denmina puntuacin t. La frmula es la siguiente,

t==tJ

(9- 7)

En el ejemplo que estamos analizando, la media muestral de 3,2 est a 0,7 horas de la media de la dis
tribucin de medias. Es decir, a un total de 3,5 desvos estndar de la media (es decir, 0,7 horas dividi
do por el desvo estndar de 0,2 horas es igual a 3,5). En otras palabras, la puntuacin t en el ejemplo
es 3,5. Aplicando la frmula se obtiene:

0,2

0,2

'

Determinacin de rechazar o nq a hiptesis nula


El quinto paso de la prueba de hiptesis es comparar los valores, de los pasos 3 y 4 para decidir si
se rechaza la hiptesis nula. Este paso es exactamente igual en el caso de la prueba t que en el ca
so estudiado en los captulos anteriores. Comparamos el punto de corte del paso 3 con el punto
muestral en la distribucin comparativa de! paso 4. En el ejemplo que analizamos, el punto t de
corte era 1,753, y el punto t real! de nuestra muestra era 3,5. Conclusin: se rechaza la hiptesis
nula y se sostiene la hiptesis de investigacin que estableca que los alumnos del edificio de dor
mitorios en cuestin estudian ms que los alumnos del resto de la facultad.
La figura 9-3 representa grficamente las distribuciones del ejemplo que acabamos de analizar.

Resumen de la prueba de hiptesis


cuando se desconoce la varianza pobladonal
La prueba de hiptesis, cuando se desconoce la varianza de la poblacin, es exactamente igual a la
prueba de hiptesis descripta en el captulo 7, pero con cuatro excepciones; a) en lugar de saber por
adelantado la varianza de la poblacin, sta se estima a partir de la muestra (utilizando la frmula
para la estimacin no sesgada, S2 - SC/gl)\ b) en lugar de seguir una curva normal, la distribucin
comparativa sigue una distribucin t con gl igual al nmero de valores observados de la muestra
menos i ; c) en lugar de buscar el punto de crte, correspondiente al nivel de significacin elegido
en una tabla de reas bajo la curva normal, utilizamos una tabla t, y d) el valor muestral en la dis
tribucin comparativa, en lugar de llamarse puntuacin Z, se denomina puntuacin t. La tabla 9-2
compara las dos situaciones sistemticamente.

Figura 9-3, D istrib u cion es relacion adas c o n e l ejem p lo


d e la s horas d e estu d io.

T a b la 9 -2 .
P r u e b a d e h ip te s is c o n u n a s o ia m e d ia m u e s tr a l, y e n la q u e s e d e s c o n o c e la v a r ia n z a d e ia
p o b la c i n {p r u e b a t) e n c o m p a r a c i n c o n io s c a so s e n lo s q u e s e c o n o c e la v a r ia n z a p o b la c k m a l.

P aso s de ia p ru e b a d e h ip te sis
1. Replantear e l problem a en funcin de
hiptesis de investigacin e hiptesis
nula sobre las poblaciones.
2. Determ inar las caractersticas de la
distribucin comparativa :
M edia poblacional

D ife r en cia c o n lo s c a so s en lo s q u e s e c o n o ce
ia v a r ia n z a p o b la cio n a l
N o hay diferencia en e l m todo.

N o hay diferencia en e l m todo.

Varianza poblacional

Se estim a a partir d e la muestra.

D e sv o estndar de la
distribucin de m edias m aestrales

N o hay diferencia en e l m todo


(pero se basa en la varianza
poblacional estim ada).

Forma d e la distribucin com parativa

S e utiliza la distribucin t con

g/=N~ 1.
3. Determ inar e l punto d e corte correspondiente
al nivel de significacin elegido.

S e utiliza la tabla t .

4. Determ inar el valor m uestral


en la distribucin comparativa.5

N o hay diferencia en e l m todo


(pero se denom ina punto t).

5. Comparar lo s valores d e lo s pasos 3 y 4


para decidir si se rechaza la hip tesis nula.

N o hay diferencia en e l m todo.

O tro ejemplo de prueba t con una sola muestra


Analicemos otro ejemplo ficticio. Supongamos que un investigador estaba estudiando los efectos
psicolgicos de una inundacin devastadora en una pequea comunidad rural. Especficamente,
el investigador estaba interesado en saber si las personas se sentan ms o menos esperanzadas
despus de la inundacin. El investigador selecciona 10 personas al azar para que completen un
pequeo cuestionario. El punto principal del cuestionario solicita a los individuos que clasifiquen
en qu medida se sienten esperanzados, utilizando una escala de 7 puntos que va desde extrema
damente desesperanzado (1), pasando por neutro (4), hasta extremadamente esperanzado
(7). La tabla 9-3 muestra los resultados y clculos de la prueba t para una sola muestra; la figura
9-4 representa grficamente las distribuciones involucradas.
El investigador estaba interesado en saber si las respuestas estaran ubicadas consistentemen
te por encima o por debajo del punto medio de la escala (4). Los pasos de la prueba de hiptesis
son los siguientes;
1. Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula sobre
poblaciones. Existen dos poblaciones:
Poblacin 1: personas que sufrieron la inundacin.
Poblacin 2: personas que no estn ni esperanzadas ni desesperanzadas.
La hiptesis de investigacin establece que las dos poblaciones producirn valores diferentes.
La hiptesis nula establece que producirn ios mismos valores.
2. Determinar las caractersticas de la distribucin comparativa. Si la hiptesis nula es
verdadera, la media de las dos distribuciones poblacionales ser 4. Por otro lado, la varianza de
estas distribuciones poblacionales se desconoce; debe ser estimada a partir de ia muestra. Tal co
mo lo indica la tabla 9-3, la suma de los desvos cuadrticos con respecto a la media muestral es
32,10. Por lo tanto, la varianza poblacional estimada es 3,57, es decir, 32,10 dividido por 9 grados
de libertad (10 - 1 ) es igual a 3,57.
La distribucin de medias tendr una media de 4 (igual a la media poblacional), su varianza es la
varianza poblacional estimada dividida por el tamao de la muestra, 3,57 dividido 10 es igual a 0,36.
La raz cuadrada de este resultado, es decir, el desvo estndar de la distribucin de medias, es 0,60.
3. Determ inar el valor muestral de corte en la distribucin comparativa, a p artir del
cual debera rechazarse la hiptesis nula. El investigador desea ser muy cauteloso en cuanto a
concluir equivocadamente que la inundacin produjo una diferencia. Por lo tanto, decide probar
la hiptesis al nivel 0,01. La hiptesis no era direccional (es decir, no se especific una direccin
determinada de la diferencia con respecto a la media de 4; cualquiera de los dos resultados habra
sido de inters); por lo tanto, el investigador utiliza una prueba de dos colas y busca el punto de
corte en la tabla 9-1 (o en la tabla B-2 del apndice B), correspondiente a una prueba de dos colas
y a 9 grados de libertad. El nmero que indica la tabla es 3,250. Por lo tanto, para rechazar la hi
ptesis nula el investigador necesita un t de 3,250 mayor, o bien un t de -3,250 menor.
4. D eterm inar el valor muestral en la distribucin comparativa. La media muestral, que
es de 4,7, se encuentra a 0,7 puntos de escala de la media de la hiptesis nula, que es de 4,0. La di
ferencia implica 1,17 desvos estndar en la distribucin comparativa con respecto a la media de
esa distribucin (0,7/0,6 - 1,17); f 1,17,
5. Com parar los valores de los pasos 3 y4 para decidir si se rechaza o no la hiptesis nula.
El t de 1,17 no es tan extremo como el 3,250 que se necesitaba para rechazar la hiptesis
nula; por lo tanto, el investigador no puede rechazarla. El estudio no es concluyente. (Si el inves
tigador hubiera utilizado una muestra ms grande, que tuviera ms potencia, el resultado podra
haber sido bastante diferente).

T a b la 9 -3 .
D a to s y a n lis is d e u n a p r u e b a t p a r a u n a s o la m u e s tr a r e f e r e n te a u n e s t u d io d e la c la s ific a c i n
d e l n iv e l d e e s p e r a n z a d e 1 0 in d iv id u o s d e s p u s d e h a b e r s u f r id o u n a in u n d a c i n d e v a s ta d o r a
(d a to s fic tic io s ).
D ife r en cia c o n r esp e c to

D ife r en cia cu a d r tic a c o n resp ecto

a la m ed ia

a ia m ed ia

C la sifica ci n

ix-m

X~M)2

(X)
(
5
0,3
0 ,0 9
3
- 1 ,7
2,89
6
1,3
1,69
2
- 2 ,7
7,29
7
2,3
5,29

1,3
1,69
7
2,3
5,29
4
-0,7
0,49
2
-2,7
7,29
5
0,3
0,09
X:
47
0
32,10
M = I X / N = 4 7 /1 0 = 4,7.
g l = N - = 0 - l = 9.
p = 4 ,0 .
S 2 = S C / g h 3 2 ,1 0 /(1 0 - 1) = 32 ,1 0 /9 = 3,57.
S h - S 2 /N = 3^57/10 = 0,3 6 .
.
^ 3 6 = 0,60.
t necesaria para un nivel de significacin del 1%, con g l = 9, en una prueba de dos colas = 3,250.
real de ia muestra, t = ( M ~ p )/S M= (4,7 - 4 )/0 ,6 = 0 ,7 /0 ,6 = 1 , 1 7 .
D ecisin: no se rechaza la hiptesis nula.

Resumen de ios pasos a seguir para realizar una prueba t para una sola muestra
La tabla 9-4 resume los pasos de la prueba de hiptesis cuando se trabaja con observaciones de
una sola muestra y con una poblacin de la cual se conoce la media pero no la varianza.

LA PRUEBA t PARA MEDAS DEPENDIENTES


Hasta aqu hemos analizado ejemplos en los que conocemos la media de la poblacin pero no la
varianza. Este tipo de investigacin es muy poco comn. Por lo general, uno no conoce siquiera
la media poblacional! Ahora nos dedicaremos a una situacin de investigacin comn en la que se
desconocen la media y la varianza de la poblacin. Este tipo de situacin involucra estudios en los
que se observan dos valores por cada una de las distintas personas. Por ejemplo, un psiclogo es
pecializado en fisiologa podra medir el patrn e e g (,Electroencephalogram, Electroencefalogra
ma) (ondas cerebrales), comparando el e e g de cada persona mientras realiza tareas abstractas
en contraposicin, a cuando realiza tareas concretas. El tipo de investigacin en el que cada perso
na es medida ms de una vez se denomina diseo de medidas repetidas. (Tambin se conoce co
mo diseo ntra-sujeto". Vase en el apndice A el resumen de las clases ms importantes de
diseos de investigacin).

Figura 9-4. D istrib u cio n es relacion adas c o n e l e jem


p lo a cerca d e l n iv el d e esp eran za d e i n d i v i d u o s d e s
p u s d e hab er sufrido una in u n d a ci n devastadora.

Tabla 9-4.
P a s o s a s e g u ir p a r a

realizar una prueba f para una sola muestra.

1. Replantear el problem a en funcin de hiptesis de investigacin e hip tesis nula sobre poblaciones.
2 . Determ inar las caractersticas de la distribucin comparativa.
a) La m edia es igual a la m edia poblacional conocida.
b) E l desv o estndar se calcula de la siguiente forma:
. i)

Calcular la varianza poblacional estimada: S 1 = S C fg l.

ii) Calcular la varianza de la distribucin de inedias:

= SV N .

i) Calcular e l d esv o estndar


c ) La form a es la de una distribucin t con A i - 1 grados de libertad.
3. D eterm inar e i valor maestral de corte en la distribucin comparativa, a partir dei cual se debera rechazar la
hiptesis nula.
a) D eterm inar los grados de libertad, el nivel de significacin deseado, y la cantidad de colas de la prueba
(una o dos).
b) B uscar e l punto de corte correspondiente en la tabla f.
4. Determ inar el valor muestra! en la distribucin comparativa t = ( M - \x)SM .
5. Comparar los valores de lo s pasos 3 y 4 para decidir si se rechaza o no la hiptesis nula.

En uno de ios diseos de medidas repetidas ampliamente utilizado se mide al mismo individuo
antes y despus de alguna intervencin psicolgica o social. Por ejemplo, un psiclogo empresarial
podra medir los das de ausencia laboral de 80 trabajadores antes y despus de la presentacin de un
nuevo programa de promocin sanitaria.
En esta situacin comn de diseo de medidas repetidas, en la que cada persona es medida
dos veces, el procedimiento de prueba de hiptesis utilizado se denomina prueba t para medias
dependientes. Se denominan medias dependientes porque las medias de cada grupo de valores
(p. ej. valores anteriores y valores posteriores) dependen entre s en cuanto pertenecen a la misma
persona. (En el captulo' 10 analizamos el caso en el que un investigador compara valores de dos
grupos diferentes de personas, es decir, un diseo de investigacin analizado a travs de una
prueba t para medias independientes).
La prueba t para medias dependientes es exactamente igual a la prueba t para una sola mues
tra, excepto que a) utilizamos algo llamado diferencias y b) suponemos que la media poblacional
es 0. Veamos ahora cada uno de estos nuevos aspectos.

Diferencias
En un diseo de medidas repetidas, la muestra incluye dos valores por cada persona en lugar de
uno slo. Esto se maneja convirtiendo los dos valores por persona en uno slo. El truco es crear
diferencias; tomamos los valores de cada persona y restamos uno al otro.
Analicemos el ejemplo acerca del eeg.El psiclogo especializado en fisiologa realizar una
resta por cada persona: la medida del eeg de la persona durante la tarea abstracta menos la medi
da del eeg de la misma persona durante la tarea concreta. As, se obtiene una sola diferencia abs
tracto-menos-concreto para cada persona. Similarmente, si tomamos el ejemplo de las ausencias
laborales, el psiclogo empresarial realizar la siguiente resta por cada persona: la cantidad de
das perdidos despus del programa menos la cantidad de das perdidos antes del programa. El re
sultado sera una diferencia posterior-menos-anterior para cada empleado.
Cuando se trata de un valor anterior y de un valor posterior, generalmente tomamos el valor
posterior y le restamos el anterior, para obtener una medida del cambio. En otros casos, tal como
el ejemplo del Eeg,realmente no importa culse resta a cul, siempre que lo hagamos de la mis
ma manera con todas las personas de la muestra.
Una vez que tenemos la diferencia de cada persona del estudio, realizamos el resto del pro
cedimiento de prueba de hiptesis utilizando las diferencias. Es decir, procedemos como si se
tratara de un estudio de una sola muestra de valores, los cuales, en este caso, resultan ser las di
ferencias.2

Poblacin de diferencias con media 0


Hasta esta parte del libro, siempre hemos sabido cul era la media de la poblacin 2 (poblacin
con la que comparbamos la muestra). Por ejemplo, en la encuesta sobre las horas de estudio en el
edificio de dormitorios de la facultad, sabamos que la media poblacional de alumnos de la facul

2 Tambin podemos utilizar una prueba t para medias dependientes en una situacin en la que tenemos valores de pares
de participantes en ia investigacin. Analizamos cada par com o si fuera una persona y calculamos una diferencia por
cada pr. Por ejemplo, supongamos que tenemos 30 parejas de matrimonios y estamos comparando edades de esposos
y esposas para ver si los esposos son sostenidamente mayores que las esposas, Podramos calcular para cada pareja una
diferencia de la edad del esposo menos la de la esposa. Luego realizaramos el resto de la prueba de hiptesis del m is
mo modo que cualquier otra prueba t para medias dependientes. Cuando la prueba r para medias dependientes se utiliza
de este modo, a veces se la llama prueba t para diseos apareados o prueba l de com paraciones pareadas.

tad era, en general, 2,5 horas. Sin embargo, ahora estamos utilizando diferencias, y por lo general
no conocemos la media poblacional de las mismas.
La solucin es la siguiente; comnmente, la hiptesis nula en un diseo de medidas repetidas es
tablece que no hay diferencia entre los dos grupos de valores. Por ejemplo, la hiptesis nula del estu
dio realizado por el psiclogo especializado en fisiologa es que la actividad e e g ser la misma al
hacer tareas abstractas o concretas. Similarmente, la hiptesis nula del estudio acerca de la promo
cin sanitaria establece que las inasistencias laborales sern iguales antes y despus de presentar el
programa de promocin sanitaria. Por lo tanto, al utilizar diferencias usualmente comparamos una
hiptesis de investigacin que establece una diferencia predicha, con una hiptesis nula que esta
blece una diferencia nula.
El punto clave es el siguiente: Qu significa diferencia nula? Es decir, qu significa decir
que en la poblacin, en lneas generales, la diferencia entre los dos valores de una persona es nu
la? Es lo mismo que decir que la media de la poblacin de diferencias es 0. En otras palabras, de
cir que la diferencia entre los dos valores es nula es equivalente a decir que el promedio de las
diferencias es cero.
Por lo tanto, al trabajar con diferencias suponemos una poblacin comparativa artificial de di
ferencias que tiene una media poblacional igual a 0.
Ejemplo de prueba para medias dependientes
Olthoff (1989) analiz la calidad de l comunicacin entre parejas comprometidas tres meses an
tes y tres meses despus del matrimonio. Uno de los grupos estudiados estaba formado por 19 pa
rejas que haban recibido el acostumbrado curso prematrimonial por parte de los ministros que
iban a celebrar su matrimonio. (Para que el ejemplo no se complique, nos concentraremos slo en
este grupo, y nicamente en los esposos que forman el grupo. Los valores de las esposas eran si
milares, aunque un poco ms variados, hacindolos algo ms complicados como ejemplo para
aprender el procedimiento de la prueba ).
Los valores de los 19 esposos estn enumerados en las columnas Antes y Despus de la
tabla 9-5, seguidas del anlisis completo de la prueba t, (Las distribuciones involucradas apare
cen en la figura 9-5). La media de los valores anteriores fue 116,316 y la media de los valores
posteriores fue 104,263. Lo ms importante, sin embargo, son las diferencias, que tambin he
mos calculado. La media de los registros diferenciales es -12,05. En promedio, la calidad de co
municacin de estos maridos disminuy aproximadamente 12 puntos.
Es significativa esta disminucin? En otras palabras, cun probable es que esta muestra de va
lores de cambio sea una muestra aleatoria de una poblacin de valores de cambio cuya media es 0?
Realicemos el procedimiento de la prueba de hiptesis.
I. Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de las po
blaciones, Las dos poblaciones son:
Poblacin 1: maridos que asisten al curso prematrimonial acostumbrado.
Poblacin 2: maridos cuya calidad de comunicacin anterior al matrimonio no cambia des
pus de casados.
La hiptesis de investigacin establece que la poblacin 1 es diferente de la poblacin 2, es
decir, los maridos que asisten al acostumbrado curso prematrimonial (tal como los maridos que
analiz Olthoff) s cambian en cuanto a calidad de comunicacin antes y despus del matrimonio.
La hiptesis nula establece que las poblaciones son iguales, que los maridos que asisten al acos
tumbrado curso prematrimonial no cambian en cuanto a la calidad de su comunicacin antes y
despus del matrimonio.

Figura 9-5. D istrib u cion es relacion adas c o n e l


eje m p lo d e O lth o ff (1 9 9 3 ) de una prueba t para
m ed a s d ep en d ien tes.

Es importante destacar que no tenemos informacin real acerca de los maridos de la poblacin 2.
Los maridos del estudio son una muestra de la poblacin 1 de maridos. Si la hiptesis de investi
gacin es correcta, es probable que los maridos de la poblacin 2 ni siquiera existan. Slo con el
propsito de realizar la prueba de hiptesis, establecimos la poblacin 2 como una especie de gru
po comparativo de hombres en pareja. Es decir, establecimos un grupo comparativo con el prop
sito de analizar maridos que, si se miden antes y despus del matrimonio, no mostraran ningn
cambio.
2. Determinar las caractersticas de la distribucin comparativa. Si la hiptesis nula es
verdadera, la media pobiaconai de las diferencias es 0. La varianza poblacional de las diferencias
puede estimarse a partir de la muestra de las diferencias. Tal como lo indica la tabla 9-5, la suma
de los desvos cuadrticos de las diferencias con respecto a la media de diferencias es 2.772,9. Al
haber 19 maridos en el estudio, existen 18 grados de libertad. Dividiendo la suma de los desvos
cuadrticos por los grados de libertad, obtenemos una varianza poblacional estimada de 154,05.
La distribucin de medias (de esta poblacin de diferencias) tendr una media de 0, al igual
que la media poblacional; su varianza ser la varianza poblacional estimada (154,05) dividida por
el tamao de la muestra (19), lo que da 8,11. El desvo estndar es la raz cuadrada de 8,11, que es
2,85. Dado que Olthoff estaba utilizando una varianza poblacional estimada, la distribucin com
parativa es una distribucin t. La estimacin de la varianza poblacional se realiz sobre la base de
18 grados de libertad, por lo tanto, esta distribucin comparativa es una distribucin t para 18 gra
dos de libertad.
3. Determ inar el punto de corte en !a distribucin comparativa, apartir del cual debera
rechazarse la hiptesis nula. Olthoff utiliz una prueba de dos colas porque no exista razn evi-

Tabia 9-5.
Anlisis de la prueba t referida a los registros de calidad de comunicacin antes y despus del ma
trimonio, realizado a 19 esposos que no recibieron ninguna capacitacin especial en cuanto a comu
nicacin.
Desvo de las diferencias
E sp o so

C a lid a d d e
c o m u n ic a c i n

Antes
A
B
C
D

D ife r e n c ia
(d e s p u s a n tes)

Q
R
S

115
125
96
115
119
82
93
109
72
104
107
118
102
115
83
87
121
100
118

-1 1
-8
-3 0
0
11
-2 7
-3 1
11
-2 3
-1 6
-1 1
-8
-1 9
-1
-1 1
-1 8
-2
-2 5
-1 0

S;

2 .2 1 0

1.981

-2 2 9

F
G
H
I
J
K
L
M
N
O
P

D e s v o
c u a d r t ic o

Despus

126
133
126
115
108
109
124
98
95
120
118
126
121
116
94
105
123
125
128

con r e sp e c to a
la m e d ia
d if e r e n c ia !

1,05
4,05
-1 7 ,9 5
12,05
23,05
-1 4 ,9 5
-1 8 ,9 5
2 3,05
-1 0 ,9 5
- 3 ,9 5
1,05
4,05
- 6 ,9 5
11,05
1,05
- 5 ,9 5
10,05
- 1 2 ,9 5
2,05

1,1
16,4
3 2 2 ,2
145,2
5 31,3
233,5
359,1
531,3
119,9
15,6

1,1
16,4
48,3
122,1

1,1
35,4
101,0
167,7
4 ,2

2.772,9

Para las diferencias:

= -229/19 = -12,05.

p, = 0 (tom ado com o base comparativa de ausencia d e cam bio).

5* = SC/g 2.772,9/(19 -1) = 154,05.


^ = ^=154,05/19 = 8,11.
4 = ^ = C ==2,85.
t necesario para e l nivel 5%, con g l = 18 y prueba de d os c o la s = 2 , 1 0 1 .
t - ( M ~ jju)/5y = (-12,05 - 0)/2,85 = -4,23.
D ecisin : s e rechaza la hiptesis nula
Fuente: O lthoff (1989).

dente para predecir un aumento o una disminucin en la calidad de la comunicacin. La tabla B-2
indica que utilizando un nivel de significacin de 0,05 y 18 grados de libertad para rechazar la hi
ptesis nula, se necesita un punto t de +2,101 mayor, o bien de -2,101 menor.
4.
D eterm inar el valor muestral en la distribucin comparativa. La muestra de Olthoff te
na una media de diferencias de -12,05. Es decir, la media estaba 12,05 puntos por debajo de la
media de distribucin de medias, que es igual a 0. El desvo estndar de la distribucin de medias
que calculamos era de 2,85. Por lo tanto, la media de las diferencias -12,05 se encuentra 4,23 des
vos estndar por debajo de la media de la distribucin de medias, es decir, la muestra de diferen
cias de Olthoff corresponde a un punto t de - 4,23

Figura 9-6. Capacidad de comuni


cacin de esposas que reciben ca
pacitacin prematrimonial sobre
comunicacin y de esposas que no
reciben dicha capacitacin (sobre
la base de Olthoff, 1989).

5. C om p arar los valores de los pasos 3 y 4 p ara d ecid ir si se rechaza o no la hiptesis n ula.

El t de -4,23 de la muestra de diferencias es ms extremo que el t 2,101 necesario. Por lo tanto,


podemos rechazar la hiptesis nula. El resultado sugiere que los maridos analizados por Olthoff
pertenecen a una poblacin en la que la calidad de comunicacin de los maridos despus del ma
trimonio es diferente de lo que era antes (es menor).
El estudio real de Olthoff era ms complejo. Tal vez resulte interesante saber que se descubri
que las esposas tambin mostraban esta disminucin en cuanto a calidad de comunicacin despus
de casadas. Sin embargo, un grupo similar de parejas comprometidas, a quienes sus ministros die
ron capacitacin especial sobre capacidad de comunicacin (mucho mayor que la acostumbrada
sesin breve) no mostraron una disminucin significativa en la calidad de comunicacin marital
despus del matrimonio (vase la figura 9-6). De hecho, actualmente existe gran cantidad de inves
tigacin que indica que la calidad marital de todo tipo disminuye en lneas generales (p. ej., Kamey
& Bradbury), y los cursos intensivos sobre capacidad de comunicacin pueden ser muy tiles para
reducir o eliminar esta disminucin (Markman et al., 1993).

Otro ejemplo de prueba / para medias dependientes


Aqu tenemos otro ejemplo. Un investigador est interesado en el efecto producido por el mido
en la coordinacin entre el pulso y la vista de los cirujanos. El investigador toma una prueba es
tndar de coordinacin entre el pulso y la vista a nueve cirujanos en ambas condiciones, silen
ciosa y ruidosa (no mientras operaban, por supuesto). La prediccin era que la coordinacin de
los cirujanos es mayor en condiciones de silencio. (Lo ideal sera que cualquier efecto que pu
diera producir prctica o fatiga, por realizar dos veces la prueba de coordinacin entre el pulso y
la vista, sea equiparado poniendo a prueba primero una mitad de los cirujanos en condiciones de
ruido, y la otra mitad, tambin primero, en condiciones de silencio. El apndice A describe este
diseo contrabalanceado).
La tabla 9-6 indica los resultados de este estudio ficticio. Tambin muestra el clculo de las
diferencias y todos los otros clculos de la prueba t para medias dependientes. La figura 9-7 re
presenta grficamente las distribuciones involucradas. Los siguientes son ios pasos de la prueba
de hiptesis:
1. Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de las
poblaciones. Las dos poblaciones son:

Poblacin 1: cirujanos como los analizados en el estudio.


Poblacin 2: cirujanos cuya coordinacin es la misma en condiciones de silencio o ruido.
La hiptesis de investigacin establece que la media de las diferencias de la poblacin 1 (silencio
so menos ruidoso) es mayor que la de la poblacin 2. Es decir, la hiptesis de investigacin establece
que los cirujanos se desempean mejor en condiciones de silencio. La hiptesis nula establece que la
diferencia, en cuanto a desempeo de la poblacin 1, no es mayor que la de la poblacin 2. Es decir, la
hiptesis nula establece que los cirujanos no se desempean mejor en condiciones de silencio.
2. Determ inar las caractersticas de la distribucin comparativa. Si la hiptesis nula es
verdadera, la media poblacional de las diferencias es 0. Cul es la varianza de esta poblacin de
diferencias? Estimndola a partir de la muestra de diferencias, es la suma de los desvos cuadrticos de las diferencias con respecto a su meda, dividida por los grados de libertad. El resultado
aparece en la tabla 9-6 y es igual a 7,5. La distribucin comparativa es una distribucin de medias;
la varianza es la varianza de la distribucin de observaciones individuales (en este caso una va
rianza estimada) dividida por el tamao de la muestra: 7,5/9 = 0,83. El desvo estndar de la dis
tribucin de medias es 0,91 (la raz cuadrada de 0,83). La forma de la distribucin comparativa
ser una distribucin t con 8 grados de libertad.
3. Determ inar el punto de corte en la distribucin comparativa, a p a rtir del cual debera
rechazarse la hiptesis nula. Estamos trabajando con una prueba de una cola porque haba una
base razonable para predecir la direccin de la diferencia. Supondremos que el investigador que
ra ser conservador y utiliz un nivel de significacin del 1%. Con 8 grados de libertad, la tabla B-2
indica que es necesario un punto t de al menos 2,897 para rechazar la hiptesis nula.
4. D eterm inar el valor m uestral en la distribucin comparativa. La diferencia media de
la muestra, que es igual a 2, se ubica 2,20 desvos estndar (de 0,91) por encima de la media de la
distribucin de medias, que es igual a 0.
5. Com parar los valores de los pasos 3 y 4 para decidir si se rechaza o no la hiptesis nula.
El valor muestral de 2,20 es menos extremo que el punto de corte t de 2,897. Por lo tanto, no se
puede rechazar la hiptesis nula. El experimento no es concluyente. (A propsito, si el investiga
dor hubiera establecido el nivel de significacin en 0,05, el resultado hubiera sido significativo).
Tercer ejemplo de prueba t para medias dependientes
Un psiclogo especializado en desarrollo est estudiando la sensibilidad de los nios frente a extra
os, utilizando un nuevo tipo de medida. Tiene la posibilidad de medir a 10 nios a los 3 meses de
edad y hacerlo nuevamente a los 4 meses. Su prediccin es que habr un aumento de sensibilidad.
La tabla 9-7 indica los resultados de este estudio ficticio, junto con el clculo de las diferencias
y todos los otros clculos de la prueba t para medias dependientes. La figura 9-8 representa grfica
mente las distribuciones involucradas. Los pasos de la prueba de hiptesis son los siguientes.

1.
Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de la
poblaciones. Las dos poblaciones son:
Poblacin 1: nios como los analizados en este estudio.
Poblacin 2: nios cuya sensibilidad hacia extraos es la misma a los 3 meses que a los 4
meses de edad.
La hiptesis de investigacin establece que la media de las diferencias de la poblacin 1 (sen
sibilidad hacia extraos a los 4 meses menos sensibilidad a ios 3 meses) es mayor que la de la po
blacin 2. La hiptesis nula establece que la media de las diferencias de la poblacin 1 no es
mayor que la de la poblacin 2.

T abla 9-6.
P ru eb a t de un estu d io acerca de la coord in acin entre el p u lso y la vista, en el q u e se m id e a nu eve
ciru ja n o s en con d icion es de silen cio y ruido (d atos ficticios).

Cirujano
i
2
3
4
5
6
7
8
9
S:

Condiciones
Silencio
18
21
19
21
17
20
18
16
20
170

Ruido
12
21
16
16

19
19
16
17
16
152

D iferencia

Desvo

6
0
3
5
-2
1
2
-1
4
18

6 -2 = 4
. -2
1
3
_4
-1
0
-3
2
0

Desvo
Cuadrtico
16
4
1
9
16
1
0
9
4
60

Para las diferencias:


M= 18/9 = 2,0.
p. = 0 (tomado como base comparativa de ausencia de cambio).
SZ_ sc/gi =60/(9 - 1) = 60/8 = 7,5.
= S*/N= 7,50/9 = 0,83.

SM= '^ = 'lQ W = 0,9l.

t necesario para un nivel de significacin del 1%, gl t ={M~


= (2,00 - 0)/0,9 i = 2,20.

8 y prueba de una cola = 2,897.

Decisin: no se rechaza la hiptesis nula..

Figura 9-7. D istribuciones relacionadas con el estudio


ficticio acerca de la coordinacin entre el pulso y la
vista en condiciones de ruido y silencio.

2. Determ inar ias caractersticas de la distribucin comparativa. La media poblacional es


una diferencia igual a 0. La varianza poblacional estimada, segn lo indica la tabla 9-7, es igual a
0,39, La distribucin comparativa ser una distribucin t con 9 grados de libertad, una media de 0
y un desvo estndar de 0,20.
3. Determ inar el punto muestral de corte en ia distribucin comparativa, a p artir del
cual debera rechazarse la hiptesis nula. Estamos trabajando con una prueba de una cola (por
que exista base razonable para predecir la direccin de la diferencia). La tabla B-2 indica que uti
lizando un nivel de significacin del 5% y 9 grados de libertad, es necesario un punto t de al
menos 1,833 para rechazar la hiptesis nula.
4. D eterm in ar el valor muestral en la distribucin comparativa. El cambio de la media
muestral, que es igual a 0,14, se ubica 0,70 desvos estndar (de 0,20 cada uno) por encima de la
media de la distribucin de medias, que es igual a 0.
5. C o m p arar los valores de los pasos 3 y 4 p ara d ecid ir s i se rechaza o no la hiptesis nula.

El t muestral, que es igual a 0,70, es menos extremo que el t necesario de 1,833. Por lo tanto, no se
puede rechazar la hiptesis nula. El estudio no es concluyente.

Resumen de los pasos a seguir para la realizacin de una prueba f


para muestras dependientes
La tabla 9-8 resume los pasos para la realizacin de la prueba t para medias dependientes. El
apndice del captulo incluye las frmulas de clculo optativas para facilitar la realizacin de la
prueba t para medas dependientes en forma manual, cuando se trabaja con una gran cantidad de
diferencias.

SUPUESTOS DE LA PRUEBA

T*lo

Como ya hemos visto, al utilizar una varianza poblacional estimada, la distribucin comparativa es
una distribucin t. Sin embargo, la distribucin comparativa ser exactamente una distribucin t s
lo si la distribucin de observaciones individuales sigue una distribucin normal. De lo contrario, la
distribucin comparativa tendr alguna otra forma (generalmente desconocida),
Por lo tanto, hablando estrictamente, una poblacin normal es condicin necesaria dentro de la
lgica y de la matemtica de una prueba t. Una condicin de este tipo en un procedimiento de prue
ba de hiptesis se denomina supuesto. Se dice que.una distribucin poblacional normal es un su
puesto de la prueba t. El efecto de este supuesto es que si la distribucin poblacional no es normal,
es tcnicamente incorrecto utilizar la prueba t.
Lamentablemente, por lo general no sabemos si la poblacin es normal, ya que cuando realiza
mos una prueba t, usualmente todo lo que tenemos para trabajar son ios valores mustrales, Afortu
nadamente, como vimos en el captulo 5, las distribuciones en las investigaciones psicolgicas con
mucha frecuencia se aproximan a la curva normal. (Esto tambin se aplica a ias distribuciones de
diferencias). Adems, los estadsticos han descubierto que, en la prctica, aun cuando la poblacin
se encuentre bastante lejos de lo normal, con la prueba se obtienen resultados razonablemente pre
cisos. En otras palabras, se dice que la prueba t es robusta ms all de incumplimientos moderados
del supuesto de una distribucin poblacional normal. Es interesante la forma en que los estadsticos
calculan la robustez de una prueba, tema que describiremos en el cuadro 10-1 del captulo 10.
Existe una situacin razonablemente comn en la que utilizar una prueba f para medias depen
dientes puede dar resultados seriamente distorsionados. Es el caso en el que realizamos una prueba
de una cola y la poblacin es muy asimtrica (con una de las colas mucho ms larga que la otra).

T a b la 9 -7 .
P r u e b a t d e u n e s tu d io a c e r c a d e la s e n s ib ilid a d d e 1 0 n i o s h a c ia lo s e x tr a o s , m e d id a a lo s 3 y a
lo s 4 m e s e s d e e d a d (d a to s fic tic io s ).

N i o

1
2
3
4
5
6
7
8
9
10
S:

E dad
3 m eses
10,4
12,6
11,2
10,9
14,3
13,2
9,7
11,5
10,8
13,1
117,70

4 m eses
10,8
12,1
12,1
11,4
13,9
13,5
10,9
11,5
10,4
12,5
1 19,10

D ife r en cia

0 ,4
- 0 ,5
0 ,9
0,5
0 ,4
0 ,3
1,2
0 ,0
- 0 ,4
- 0 ,6
1,4

D esvo

0,26
-0 ,6 4
0,76
0,36
-0 ,5 4
0,16
1,06
-0 ,1 4
-0 ,5 4
-0 ,7 4
0

D esv o
C u ad rtico

0,07
0,41
0,58
0,13
0,29
0,03
1,12
0 ,0 2
0,29
0,55
3,49

Para las diferencias:


M = 1,4/10 = 0,14.

li = .
= S C /g l = 3 ,4 9 /(1 0 - 1 ) - 3 ,4 9 /9 = 0,39.
S i = SYiV = 0 ,3 9 /1 0 = 0,039..

0 0 3 9 = 0,20.

necesario para el nivel de sign ificacin 5%, g l = 9 y prueba de una cola = 1,833.
t ~ (M -

= (0 ,1 4 - 0 )/0 ,2 0 = 0,70.

D ecisin: no se rechaza la hiptesis nula..

F igura 9-8. D istr ib u c io n e s relacion ad as c o n un e stu


d io fic tic io a cerca d e la sen sib ilid a d d e n i o s hacia
extraos, a lo s 3 y a lo s 4 m e s e s de edad.

Tabla 9-8.
Pasos para la realizacin de una prueba t para medias dependientes.

1. Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de las poblaciones.


2. Determ inar las caractersticas de la distribucin comparativa.
a) Convertir los dos valores de cada persona en una diferencia. R ealizar todos los pasos restantes utilizando
las diferencias.
b) C alcular la m edia de las diferencias.
c) Presumir una m edia poblacional igual aO: p - 0 .

d) Calcular la varianza poblacional estimada de diferencias S 2 = S C /g l.


e) Calcular la varianza de la distribucin de medias de diferencias:

=SVN.

f) Calcular el desvo estndar de la distribucin de medias de las diferencias: S M =


g) La forma es la de una distribucin t con gl = N ~ 1.
3. Determinar el punto de corte en la distribucin comparativa, a partirdel cual debera rechazarse la
hiptesis nula.
a) Determ inar el nivel de significacin deseado y si se utilizar una prueba de una o dos colas.
b) Buscar el punto de corte indicado en una tabla .
4. D eterm inar el valor muestral en la distribucin comparativa: t ~ ( M 5. Comparar los valores de los pasos 3 y 4 para decidir si se rechaza o no la hiptesis nula.

Cmo sabemos que la poblacin es muy asimtrica? Un caso puede ser aquel en el que la mues
tra de diferencias es muy asimtrica. Si la muestra es muy asimtrica, es probable que la pobla
cin de donde proviene la muestra sea muy asimtrica tambin. Otro caso es aquel en el que
existen razones para pensar que se produce un efecto techo o piso que hace que la distribucin sea
asimtrica porque los valores de un lado no pueden ser mayores o menores a determinado punto.
Existen varias alternativas para reemplazar la prueba t, cuando hay razones para creer que reali
zarla violara seriamente el supuesto de normalidad y dara resultados distorsionados. En el cap
tulo 15 veremos esas alternativas.

TAMAO DEL EFECTO Y POTENCIA DE LA PRUEBA


PARA MEDIAS DEPENDIENTES

Tamao de efecto
El tamao del efecto, en un estudio en el que se utiliza una prueba t para medias dependientes, se
calcula del mismo modo que en el captulo 8. Es la diferencia entre las medias poblacionales divi
dida por el desvo estndar de la poblacin: (jXj - jx2)/ cr. Sin embargo, al utilizar diferencias, la
media de la poblacin 2 usualmente es 0 (es decir, cuando se trabaja con diferencias, r,2s = 0). Es
to simplifica la situacin:

d .... (m-i ~0) _ Mu


(7

(9-8)

O"

Es importante recordar que cuando se utiliza esta frmula, \xl es la media predicha de la poblacin
de diferencias y cr es el desvo estndar de las poblaciones de diferencias.
Las reglas del tamao del efecto de una prueba t para medias dependientes son las mismas
que aprendimos para el caso analizado en el captulo 8: un tamao del efecto pequeo es igual a
0,20, uno mediano es igual a 0,50, y uno grande es igual a 0,80.
Analicemos un ejemplo. Un psiclogo especializado en deportes planifica un estudio acerca
de las actitudes hacia compaeros de equipo antes y despus del juego. Realizar un cuestiona
rio sobre actitudes dos veces, una antes y otra despus del juego. Supongamos que la diferencia
mnima entre antes y despus, que puede tener cierta importancia, es de 4 puntos del cuestiona
rio. Supongamos adems que sobre la base de investigaciones relacionadas con el tema, el inves
tigador calcula que el desvo estndar de las diferencias del cuestionario de actitud es
aproximadamente de 8 puntos. As, (ij = 4 y a ~ 8. Aplicando la frmula para calcular el tamao
del efecto, d - p/(7 - 4/8 = 0,50, Conforme a las reglas del tamao del efecto, el estudio planifi
cado tiene un tamao del efecto mediano.
Si deseramos estimar el tamao del efecto despus de haber realizado el estudio, dividira
mos la media real de las diferencias de la muestra por el desvo estndar estimado de la poblacin
de diferencias.

Es importante recordar que, en sta frmula, tanto M como S se refieren a diferencias. Adems, S
es el desvo estndar de la poblacin de observaciones individuales (es decir, en este caso, de las
diferencias de los individuos). No es lo mismo que SM, el desvo estndar de la distribucin de
medias (de diferencias).
Analicemos nuestro primer ejemplo de prueba t para medias dependientes, el estudio acerca
del cambio de los maridos en cuanto a la calidad de la comunicacin. En ese estudio, la media de
las diferencias era -12,05, y el desvo estndar poblacional estimado de diferencias seria 12,41.
Es decir, calculam os la varianza estim ada de registros diferenciales (S2) y nos da
154,05; 'Vs2 = 12,41. Por lo tanto, el tamao de efecto se calcula como d = M/S - -12,05/12,41
= -0,97. Se trata de un tamao del efecto muy grande. (El signo negativo de tamao del efecto
significa que el gran efecto era una disminucin).

Potencia
La tabla 9-9 indica la potencia aproximada a un nivel de significacin de 0,05 para los tamaos
del efecto pequeos, medianos y grandes, correspondientes a pruebas de na o dos colas. En el
ejemplo del psiclogo especializado en deportes, el investigador esperaba un tamao del efecto
mediano (d - 0,50). Si planificara realizar un estudio utilizando el nivel 0,05, con una prueba de
dos colas y con 20 participantes, el estudio tendra una potencia de 0,59. Lo cual significa que si
la hiptesis de investigacin es realmente verdadera y tiene un tamao del efecto mediano, existe
un 59% de chances de que el estudio resulte significativo.
La tabla de potencia (tabla 9-9) tambin es til cuando leemos el resultado no significativo de
algn estudio publicado. Supongamos que un estudio que utiliza una prueba t para medias depen
dientes tuviera un resultado no significativo. El estudio prob la significacin al nivel 0,05, con

T a b la 9 -9 .
P o te n c ia a p r o x im a d a d e e s tu d io s e n lo s q u e s e u tiliz a la p r u e b a t p a r a m e d ia s d e p e n d ie n te s e n p r u e
b a s d e h ip te s is c o n n iv e l d e s ig n ific a c i n d e 0 ,0 5 .
R eg istro s de
d iferen cia s
d e la m u estr a ( N )

T am a o de efecto
P equeo
( d = 0,20}

M e d ia n o
( d = 0 ,5 0 }

G ran de
(d ^ 0 ,8 0 )

Prueba d e dos colas


10
20
30
40
50
100

0 ,0 9
0 ,1 4
0 ,1 9
0,2 4
0,2 9
0,2 5

0,32
0,59
0,77
0,88
0,94
$

0 ,6 6
0,93
0 ,9 9
*

.Prueba de una cola


10
20
30
40
50
100

0,15
0 ,2 2
0 ,2 9
0,35
0,4 0
0,63

0,46
0,71
0,86
0,93
0,97

0,78
0,96
*
*

*
*

*La potencia es casi 1.

una prueba de dos colas, y contaba con 10 participantes. Deberamos concluir que, en efecto, no
existe ninguna diferencia entre las poblaciones? Probablemente no. Aun suponiendo un tamao
de efecto mediano, la tabla 9-9 indica que existe slo un 32% de chances de obtener un resultado
significativo en este estudio. Analicemos ahora otro estudio que result no significativo, en el que
tambin se utiliz el nivel de significacin 0,05 y una prueba de dos colas, pero que contaba con
100 participantes. La tabla 9-9 indica que existira un 63% de chances de que el estudio resultara
significativo si existiera incluso un tamao del efecto real pequeo en la poblacin. Si en la pobla
cin hubiera un tamao del efecto mediano, la tabla indica que existira casi un 100% de chances
de que el estudio resultase significativo. Por lo tanto, en este estudio con 100 participantes podra
mos concluir, a partir de los resultados, que en la poblacin probablemente no existe ninguna di
ferencia o que, en el mejor de los casos, existe una muy pequea.
Para que la tabla 9-9 resultara simple, hemos incluido slo la potencia correspondiente a unas
pocas cantidades diferentes de participantes (10,20, 30, 40, 50 y 100). Estos datos deberan ser
suficientes para el tipo de evaluaciones aproximadas que se realizan al analizar resultados de pu
blicaciones cientficas.*3.

3 Cohn (1988, pp. 28-39) proporciona tablas ms detalladas en cuanto a cantidades de participantes, niveles de tamao
del efecto y niveles de significacin. S i se utilizan sus tablas, debe tenerse en cuenta que la d a la que se hace referencia
est basada en realidad en una prueba / para medias independientes (que es la situacin que trataremos en el captulo
10). Para utilizar esas tablas para una prueba t para Medias dependientes, primero se debe multiplicar el tamao del
efecto deseado por 1,4. Por ejemplo, si el tamao del efecto es 0,30, para utilizar las tablas de Cohn consideraramos
que es de 0,42 (es decir, 0,30 x 1,4 - 0,42). La tnica otra diferencia con respecto a nuestra tabla es que Cohn descrihe
el nivel de significacin con la letra a (por nivel alfa), con un subndice de 1 2, haciendo referencia a una prueba de
una o dos colas. Por ejemplo, una tabla que en la parte superior indica al = 0,05 significa que es una tabla para p < 0,05,
con una cola,

Planificacin del tamao de la muestra


La tabla 9-10 indica la cantidad aproximada de participantes necesarios para tener un 80% de po
tencia con tamaos de efecto pequeos, medianos o grandes, utilizando pruebas de una o dos co
las con nivel de significacin de 0,05. (Ochenta por ciento es un nmero comnmente utilizado
por los investigadores como potencia mnima para que tenga sentido realizar un estudio). Supon
gamos que planificamos un estudio en el que esperamos tener una gran tamao del efecto y utili
zramos un nivel de significacin de 0,05, con dos colas. La tabla indica que slo necesitaramos
14 participantes para tener una potencia del 80%. Por otro lado, un estudio en el que se utiliza el
mismo nivel de significacin y en el que se realiza una prueba de dos colas, pero en el que se es
pera slo un pequeo tamao del efecto, necesitaramos 196 participantes para tener una potencia
de! 80%.4

La potencia de estudios en los que se emplea la prueba para medias dependientes


Los estudios que utilizan diferencias (es decir, estudios que emplean el diseo de medidas repeti
das) presentan con frecuencia tamaos del efecto considerablemente mayores a los de otros tipos
de diseos de investigacin con la misma cantidad de diferencia esperada entre las medias. Si los
tamaos del efecto son mayores, entonces la potencia es mayor. Es decir, probar a cada uno de ios
participantes de un grupo dos veces (una vez en unas condiciones y otra vez en otras condiciones)
usualmente da como resultado un estudio con alta potencia. En particular, este tipo de estudio da
ms potencia que dividir a los participantes en dos grupos y probar una vez a cada grupo (un gru
po en unas condiciones y el otro grupo en las otras condiciones). De hecho, los estudios en los
que se utilizan diferencias generalmente tienen ms potencia que aquellos en los que se utiliza el
doble de participantes probados slo una vez cada uno.
Por qu los diseos de medidas repetidas tienen tanta potencia? La razn es que el desvo estn
dar de las diferencias generalmente es bastante bajo. (El desvo estndar de las diferencias es el valor
por el cual realizamos la divisin para obtener el tamao del efecto cuando utilizamos diferencias).
En un diseo de medidas repetidas, la nica variacin es la de las diferencias. La variacin entre par
ticipantes en cuanto a los valores en cada una de las prueba no forma parte de la variacin involu
crada en el anlisis, ya que las diferencias comparan a los participantes consigo mismos. William S,
Gosset fue, en esencia, el inventor de la prueba t (vase cuadro 9-1). ste supo aprovechar el mayor
nivel de potencia de los estudios con medidas repetidas en una controversia histricamente intere
sante acerca de un experimento relacionado con la leche, el cual se describe en el cuadro 9-2.

Tabla 9-9.
C a n tid a d a p r o x im a d a d e p a r tic ip a n te s n e c e s a r io s p a r a lo g r a r u n 80 % d e p o t e n c ia e n la p r u e b a t
p a r a m e d ia s d e p e n d ie n te s , e n p r u e b a s d e h ip te s is c o n u n n iv e l d e s ig n ific a c i n d e l 0 ,0 5 ,
T am a o d e l efecto

D o s colas
U na cola

Pequeo

M ediano

Grande

( d = 0 ,2 0 )

( d - 0,5 0 )

( d = 0 ,8 0 )

196
156

33
26

14
12

4 Cohn (1988, pp. 54-55) proporciona tablas ms detalladas que indican la cantidad necesaria de participantes para
otros niveles de potencia adems del de 80% (y tambin para otros tamaos del efecto adems de las de 0 ,2 0 ,0 ,5 0 y
0,80, as como tambin para otros niveles de significacin). D e todos modos, para la utilizacin de esas tablas se deben
tener en cuenta ias mismas indicaciones que en la nota al pie N 3).

En el ao 1930, se realiz en Escocia un


importante experimento sanitario que invo
lucraba a 20.000 alumnos. Su principal ob
jetivo era comparar el crecimiento de un
grupo de nios, a quienes se les haca beber
leche regularmente, con el de otros nios
que formaban parte del grupo control. Los
resultados obtenidos indicaron que aque
llos que tomaban leche mostraban un creci
miento mayor.
Sin embargo, William S. Gosset, un
estadstico de la poca {vase cuadro 9-1),
estaba asombrado por la manera en que se
realiz el experimento. Haba costado
7.500, lo que en 1930 era una inmensa
cantidad de dinero, y se haba realizado
errneamente! Los grandes estudios del es
tilo del que tratamos eran muy populares en
tre los estadsticos de la poca porque
parecan imitar las grandes cantidades que
se encuentran en la naturaleza, Gosset, por
el contrario, siendo fabricante de cerveza,
estaba obligado a utilizar en sus estudios
cantidades muy reducidas, las tandas expe
rimentales de cerveza eran muy costosas y,
con frecuencia, era reprendido por los ver
daderos estadsticos debido a los pequeos
tamaos de muestra que utilizaba. No obs
tante, Gosset sostena que ninguna cantidad
de participantes era lo suficientemente gran
de cuando no se realizaba una asignacin
estrictamente aleatoria. Y en el estudio
mencionado, se permiti a los maestros
intercambiar a los nios de un grupo a otro

si sentan pena por alguno que crean que


poda beneficiarse ms al recibir la leche!
(Vase en el apndice A una exposicin 7
acerca de la asignacin aleatoria de los par-. ;
tici pautes a cada grupo). .
f'Y f
De todos modos, es an ms interesan- ;
te, en vista de lo aprendido en est captulo, . 7
que Gosset demostrara que los investigado- 7
res podran haber llegado al mismo resulta- '
do utilizando 50 pares de gemelos, lanzando t
una moneda para determinar cul de cada 1!
par estara en el grupo que consumira la le
che (y atenindose a los resultados de ese
sorteo). Desde luego, el clculo estadstico
que se utilizara sera la prueba /, tal como la f
aprendimos e este captulo, es decir, la
prueba t para medias dependientes. . ..
Ms recientemente, el desarrollo .del'-,
anlisis de la potencia, que presentamos en ..
el captulo 8, ha reivindicado completamen- ;
te a Gosset. Ya no quedan, dudas de que pue-
den utilizarse, precisamente, cantidades
sorprendentemente pequeas de participan
tes cuando el investigador puede encontrar ;
la manera de realizar un diseo de medidas
repetidas en el que las diferencias son la
.unidad bsica de anlisis (en este caso, cada 1
par.de gemelos sera un participante). Tai :
como el mismo Gosset podra haberles di
cho, ios estudios que utilizan la prueba t pa- ,
ra medias dependientes pueden tener una
sensibilidad extremadamente alta.
Referencias: Peters (1987); Tankard (1984).

CONTROVERSIAS Y LIMITACIONES
Las principales controversias con respecto a la prueba t estn relacionadas con sus ventajas y des
ventajas relativas en comparacin con varias alternativas, las cuales se discutirn en mayor detalle
en le captulo 15. (Los mismos temas surgen tambin con respecto a los procedimientos que trata
remos en los captulos 10 al 13). Existe, sin embargo, una consideracin que queremos comentar
aqu. Esta se relaciona con todos los diseos de investigacin en los cuales los mismos participan
tes se prueban antes y despus de alguna intervencin experimental. (Es el tipo de situacin para
la evaluacin en la que con frecuencia se utiliza la prueba t para medias dependientes).
Medir simplemente a un grupo de personas antes y despus de algn procedimiento experi
mental, sin ningn tipo de grupo control que no experimente el procedimiento, puede tener una
potencia alta, pero es un diseo de investigacin dbil en cuanto a la claridad de las conclusiones
que puede producir (Cook & Campbell, 1979). Como se describe detalladamente en el apndice
A, aun cuando tal estudio produzca una diferencia significativa, quedan muchas explicaciones al
ternativas posibles en cuanto a la razn por la cual ocurri tal diferencia. Por ejemplo, los partici
pantes podran haber madurado o mejorado de todos modos durante ese perodo, o tal vez otros
hechos ocurrieron en el transcurso del tiempo entre una prueba y otra, o los participantes que no
recibieron beneficios pueden haber abandonado el experimento. Incluso es posible que la propia
prueba inicial causara cambios que, de otro modo, no podran haber ocurrido.
No obstante, es importante observar que las dificultades que presentan las investigaciones en
las que se prueba a las personas antes y despus de alguna intervencin, se comparten slo leve
mente con el tipo de estudio en el que los participantes son probados en dos condiciones diferen
tes, como por ejemplo de ruido y silencio, probando primero a una mitad en unas condiciones y a
la otra mitad, tambin primero, en las otras condiciones.

LAS PRUEBAS SEGN SE DESCRIBEN


EN LAS PUBLICACIONES CIENTFICAS
Las publicaciones cientficas describen usualmente las pruebas en un formato bastante estndar
que indica los grados de libertad, el punto t y el nivel de significacin. Por ejemplo, f (24) = 2,80,
p < 0,05 indica que el investigador utiliz una prueba i con 24 grados de libertad, obtuvo un pun
to t de 2,80, y el resultado fue significativo al nivel 0,05. Tambin puede establecerse si se utiliz
una prueba de una o dos colas (si no se indica nada al respecto, debemos suponer que el investiga
dor utiliz una prueba de dos colas). En lneas generales se indican las medias, y a veces los des
vos estndar1de cada prueba. Rara vez se indica el desvo estndar de las diferencias.
Si el estudiante del ejemplo acerca de los alumnos del edificio de dormitorios hubiera infor
mado los resultados en una publicacin cientfica, lo hubiera hecho ms o menos as; La muestra
tomada del edificio de dormitorios en el que resido produjo una media de 3,2 horas de estudio
(SD ~ 0,80). Sobre la base de una prueba para una sola muestra (una cola), el resultado era signi
ficativamente diferente a la media conocida de 2,5 horas correspondiente a la facultad en general,
t (15) s= 3,50, p < 0,01. Los investigadores del ejemplo ficticio acerca de las vctimas de la inun
dacin podran haber redactado sus resultados de la siguiente manera: El grado de esperanza in
formado por nuestra muestra de vctimas de la inundacin (M - 4,7, SD = 1,89) no fue
significativamente diferente del punto medio de la escala (4,0), (9) - 1,17.
Como ya observamos, los psiclogos rara vez utilizan una prueba f para una sola muestra.
Presentamos esta prueba t principalmente como paso previo para la ms ampliamente utilizada
prueba f para muestras dependientes. No obstante, a veces las publicaciones cientficas pueden

llegar a informar acerca de una prueba r para una sola muestra. Por ejemplo, Weller y Weller
(1997) realizaron un estudio acerca de la tendencia de las mujeres que viven juntas a sincronizar
sus ciclos menstruales. Para realizar el anlisis estadstico, compararon los valores obtenidos por
las mujeres que participaron dei estudio, de una medida de sincronizacin de pares de mujeres
que viven juntas (poblacin 1), con el grado de sincronizacin de esos pares de mujeres, esperado
en forma casual (poblacin 2). Es decir, crearon una especie de poblacin artificial con una media
de lo que se esperara si no hubiera sincronizacin, y analizaron los resultados con pruebas pa
ra una muestra (p. 147). La tabla 9-11 indica esos resultados. Cada lnea de la tabla es una prue
ba t independiente para una sola muestra. La primera lnea es una prueba que compara los
registros de sincronizacin de 6,32 de los 30 pares de hermanas compaeras de cuarto (la muestra
de lo que llamaramos poblacin 1) con'un registro de sincronizacin esperado de 7,76 (lo que de
nominaramos la media de la poblacin 2). La lnea muestra esos datos ms la diferencia de 1,44,
el desvo estndar de esta diferencia -que es igual a 3,40-, el punto de 2,27 y el nivel p de 0,011.
Un detalle importante es que la columna t en realidad est escrita como 7(1). Esto no es lo estn
dar y realmente no significa que su distribucin t tena un grado de libertad. Suponemos que sig
nifica que se trata de una prueba para una sola muestra.
Como mencionamos anteriormente, la prueba t para medias dependientes es mucho ms co
mn. Olthoff (1989) podra haber informado del siguiente modo su resultado en el ejemplo que
utilizamos anteriormente: Exista una disminucin significativa de la calidad de comunicacin,
decreciendo de 116,32 antes del matrimonio a 104,26 despus del matrimonio, (18)=2,76,/? <0,05,
dos colas. El investigador que realiz el estudio ficticio acerca de los cirujanos podra haber re
dactado lo siguiente: La media de desempeo dei grupo que trabaj en condicin silenciosa fue
18,89, mientras que el rendimiento del grupo que trabaj en condicin ruidosa fue 16,89. La dife
rencia no result estadsticamente significativa a nivel 0,01, incluso con una prueba de una cola,
(8) - 2,20. Para dar otro ejemplo, Holden et. al. (1997) compararon las actitudes informadas por
madres con respecto al castigo corporal de sus hijos desde antes hasta despus de 3 aos de tener
a su primer hijo. El cambio promedio en las actitudes anteriores y actuales de las mujeres fue
significativo, (107) = 10,32,/? < 0,001... (p, 485). (El cambio implic que despus de tener a su
primer hijo tenan sentimientos ms negativos con respecto al castigo corporal).
Los investigadores tambin presentan con frecuencia las medias de ios grupos en una tabla.
Por ejemplo, Pezdek y sus colegas (1997) recordaron a cada uno de los integrantes de un grupo de
alumnos universitarios varios hechos que supuestamente les haban sucedido cuando tenan ocho
aos de edad, Se les pidi a los alumnos que describieran el hecho con algn grado de detalle. Es
tas descripciones fueron clasificadas por cantidad de palabras recordadas y cantidad de unidades
de ideas recordadas. Tambin se pidi a los alumnos que clasificaran cada hecho en cuanto a la
claridad con la que lo recordaban y en cuanto al nivel de seguridad que tenan con respecto a que
el hecho efectivamente haba ocurrido. Algunos de los hechos realmente haban ocurrido y algu
nos podran haber ocurrido pero no ocurrieron. (Los investigadores se haban comunicado con las
madres de los alumnos con anterioridad, con el permiso de los estudiantes). Como es tpico en ta
les investigaciones, muchos de los alumnos equivocadamente recordaron haber experimentado
los hechos falsos. Estos son ios resultados:
Para in v e stig a r la s d ifer e n c ia s p o te n c ia le s entre r ecu erd o s de h e c h o s r ea les y r ecu erd o s d e h e
c h o s fa ls o s , c o m p a r a m o s varias ca ra c te r stic a s d e lo s r ecu erd o s d e 13 su je to s qu e recordaron
al m e n o s un h e c h o fa lso . S e r ea liza ro n pruebas de s ig n ific a c i n d e d o s c o la s c o n e sta in fo rm a
c i n , y e l resu lta d o a p a rece en la [tabla 9 -1 2 ], E n c o m p a r a c i n c o n lo s r ec u e r d o s d e h e c h o s
fa ls o s , al recordar h e c h o s verd ad eros se e m p le a n s ig n ific a tiv a m e n te m s p alab ras, (12) ~
4 ,5 4 , p < 0 ,0 0 1 , y m s u n id a d es d e id e a s, (12) = 3 ,4 3 , p < 0 ,0 1 . Por lo tanto, e l resu lta d o de lo s

recuerdos de hechos verdaderos, en comparacin con los de hechos falsos, podra ser diferen
ciado en cuanto a la cantidad de nuevos detalles dados con respecto a cada uno; se dieron casi
el doble de detalles con respecto a los hechos verdaderos que a los falsos. En comparacin con
ios recuerdos de hechos falsos, el recuerdo de los hechos verdaderos tambin estaba relaciona
do con clasificaciones significativamente superiores de claridad, f(i2) = 3,99, p < 0,01; y de
certeza, (12) * 2,73, p < 0,02 (p. 438).
Es importante observar que en este ejemplo nunca hicieron referencia al nombre de la prueba de
significacin. Sin embargo, sabemos que se trata de una prueba t porque utilizan la t al describir
los resultados, Adems, podemos damos cuenta de que es una pmeba t para medias dependientes
porque estn comparando los valores de cada participante en cuanto al recuerdo de hechos verda
deros y al recuerdo de hechos falsos, cada uno con su propio valor.

Tabla 9-11.
Sincronizacin menstrual y valores esperados (por das).
G ru p o /m es
Compaeras - hermanas
M es 1
M es 2
M es 3
A m igas ntim as - com paeras
M esi
M es 2
M es 3
Fam ilias
M es 1
M es 2
M es 3

V alor de
sin c ro n iz a ci n

V alor
e sp era d o

30 .
30
29

6,32
6 ,2 4
7 ,4 0

7 ,7 6
7 ,7 6
7 ,7 6

39
39
31

5,73
6,01
7 ,4 4

7,75
7,7 5
7 ,7 5

18
18
17

5,80
6,09
7 ,1 9

7 ,7 0
7 ,7 0
7 ,7 0

D iferen cia

SD

1,44
1,52
0,36

3,40
3,08
3,08

2,27
2,66
0,57

0,011
0 ,0 0 4

2,02
1,74
0,31

3,84
4,25
4,61

3,25
2 ,5 2
0 ,8 8

< 0 ,0 0 0
0,006
0,19

1,90
1,61
0,51

2,74
1,89
2,71

2 ,8 6
3,52
0,75

< 0 ,0 0 0
< 0 ,000
0,23

0 ,2 8 0

Fuente: Weller, A. & Weller, L. (1997), tab. 1. Sincronizacin menstrual en condiciones ptimas: Familias nmades.
R evista C ien tfica d e P s ic o lo g a C o m p a ra tiva [J o u rn a l o f C o m p a ra tiv e P s y ch o lo g y ], H i , 143-151. Copyright, 1997,
por la Asociacin Americana de Psicologa [American Psychological Association]., Reimpreso con autorizacin.

Tabla 9-12.
Medias (y desvos estndar) de medidas que comparan el recuerdo de hechos verdaderos y falsos
del experimento 1.
Hecho recordado
M ed ida
Cantidad d e palabras recordadas * * *
Cantidad de unidades d e ideas recordadas**
Puntuacin en claridad***
Puntuacin en certeza**

Verdadero
2 7 ,7 9 (8 ,8 1 )
6,33 (2 ,5 3 )
6 ,9 0 (0 ,1 7 )
6,88 (0 ,2 1 )

Falso
15,42 (7,69)
3,23 (1,55)
4 ,0 0 (0 ,1 8 )
5 ,0 0 (0,21)

a L a escala de puntuacin iba de 1 (bajo) a 10 (alto).


* p < 0 ,0 2 , dos colas; * * p < 0,0 1 , dos colas; ***p < 0 ,0 0 1 , dos colas.
Fuente: Pezdek, K-, Finger, K,, & Hodge, D. (1997), tab. 2. Fijacin de falsos recuerdos de la niez: el papel de la
plausibidad de un evento, C ien cia P s ic o l g ic a [ P s y c k o lo g ic a l S c ie n c e j, 8, 439, Copyright, 1997, por la Asociacin
Americana de Psicologa [American Psychological Society], Reimpreso con autorizacin.

RESUMEN
Cuando no se conoce la varianza poblacional se utilizan los cinco pasos estndar de la prueba de
hiptesis. No obstante, en este caso debemos estimar la varianza poblacional a partir de los valo
res mustrales, utilizando una frmula que divide la suma de los desvos cuadrticos por los gra
dos de libertad ( g l ~ N - 1). Adems, cuando no se conoce la varianza, la distribucin comparativa
de medias es una distribucin t (cuyos puntos de corte se indican en una tabla t). Una distribucin
t posee colas ligeramente ms pesadas que las de una curva normal (exactamente en qu medida
son ms pesadas depende de cun pocos sean los grados de libertad). Finalmente, en este caso, se
denomina punto t a la cantidad de desvos estndar con respecto a la media a la que se encuentra
la media muestral en la distribucin t.
La prueba para medias dependientes se utiliza en estudios en los que cada participante pre
senta dos valores, como por ejemplo un valor anterior y uno posterior. En esta prueba t, primero
se calcula una diferencia para cada participante; luego se realizan los usuales cinco pasos de la
prueba de hiptesis con las modificaciones descriptas en el prrafo anterior y se convierte a la po
blacin 2 en una poblacin de diferencias con una media de 0 (ausencia de diferencia).
Un supuesto de la prueba t es que la distribucin poblacional es una curva normal.. Sin embar
go, aun cuando no lo sea, la prueba t usuamente es bastante exacta. La principal excepcin en el
caso de la prueba t para medas dependientes es cuando la poblacin de diferencias es altamente
asimtrica y trabajamos con una prueba de una cola.
El tamao del efecto de un estudio en el que se utiliza una prueba t para medias dependientes
es la meda de las diferencias dividida por el desvo estndar de esas diferencias. Existen tablas
especiales en las que se pueden encontrar la potencia y el tamao de muestra necesarios para ob
tener una potencia del 80%. La potencia de estudios en los que se utilizan diferencias es usual
mente mucho mayor que el de aquellos estudios en los que se utilizan otros diseos con la misma
cantidad de participantes.
Investigadores expertos en metodologa sealan que las investigaciones que involucran a un
slo grupo probado antes y despus de algn hecho interpuesto, sin un grupo control, deja abier
tas muchas explicaciones alternativas de cualquier cambio observado.
En las publicaciones cientficas, las pruebas t se informan utilizando un formato estndar, por
ejemplo, (24) = 2,80, p < 0,05.

Trminos clave
- Supuesto.
- Estimacin sesgada.
- Grados de libertad (gl).
~ Diferencias.
- Diseo de medidas repetidas.

- Robustez.
- Distribucin t.
- Punto t.
~ Tablar.
- Pruebas t

~ Prueba t para una sola muestra.


- Prueba / para medias dependientes.
- Estimacin no sesgada de la varianza
poblacional (S2).

Ejercicios
Los ejercicios implican la realizacin de clcu
los (con la ayuda de una calculadora). La ma
yora de los problemas estadsticos reales se
resuelven por computadora, pero aunque exis

ta la posibilidad de utilizarla, es conveniente


realizar estos ejercicios manualmente para in
corporar el mtodo de trabajo.

Para adquirir prctica en la utilizacin de


una computadora, para resolver problemas esta
dsticos, se puede utilizar la seccin de compu
tacin de cada captulo, publicada en la Gua de
estudio y libro de tareas de computacin para el
alumno [Student's Study Guide and Computer
Workbookj que acompaa este libro.
Todos los datos de esta seccin son ficti
cios (a menos que se especifique lo contrario).
Las respuestas a los ejercicios de la serie i
se encuentran al final del libro.

su respuesta con un histograma de la distribu


cin maestral y grficos de la distribucin pobacional y la distribucin de medias, indique
el punto y los puntos de corte correspondien
tes al nivel de significacin seleccionado, y
c) explique su respuesta a alguien que nunca ha
tomado un curso de estadstica.
3.
Para cada uno de los siguientes estudios
en los que se utilizan diferencias, determine si
la diferencia media es significativamente dife
rente de 0. Adems, calcule el tamao del
efecto (si en la tabla no se indican los gl, utili
ce el t correspondiente al valor gl menor ms
SERIE I
cercano).
1.
En cada uno de los estudios que apare
cen a continuacin, se est comparando la me
Varianza
Nivel
Media de las
Cantidad
dia de una sola muestra con una poblacin de
de
de diferencias diferencias pobiacional
de la muestra de la muestra est. de las dif. Colas signifie.
la cual se conoce la media pero no la varianza.
Decida si el resultado de cada uno de estos es (a) 2 0
1,7
0,05
8,29
1
tudios es o no significativo.
(prediccin
alta)
Tamao
Media
Media
Varianza
Nivel
maestral pobiacional pobiacional muestra!
de
estimada
Colas signifie.

(a)

(N)

(fri

(S*2)

64

12,40

9 ,0 0

(a )

1 1 ,00

0,05

(prediccin
baja)
(b)

(c)

49
400

1.006,35
52,00

317,91
7 ,0 2

1.009,72 2
0,01
52,41 ' 1
0,01
(prediccin

____________________________________ alta)________

(b)
(c)

164
15

2,3
-2,2

4 1 4,53
4 ,0 0

2
0,05
0,01
1
(prediccin

__________________________ N a)_______ _
4.
En cuatro ciudades del Valle Central de
California se implemento, en agosto de 1997,
un programa para reducir la cantidad de des
perdicios. La cantidad de basura en las calles
(cantidad promedio en libras de basura reco
lectada por manzana, por da) se midi durante
seel mes de julio anterior al comienzo del progra
ma y, luego, el siguiente julio, despus de que
el programa hubiera estado en efecto durante
un ao. Los resultados fueron los siguientes:

2.
Supongamos que un candidato que
postula como jefe de polica afirma que reducir
el tiempo promedio de respuesta a emergencias a
menos de 30 minutos, que es considerado el
tiempo de respuesta promedio para emergen
Ju lio 1997
Ju lio 1998
cias bajo el mandato del jefe de polica actual. C iud ad
No existen registros anteriores, por lo tanto, Fresno
2
19
no podemos determinar el desvo estndar real M erced
4
10
de esos tiempos de respuesta. Gracias a esta Bakersfield
18
9
campaa, l es elegido jefe de polica, y aho Stockton
1
19
ra se guardan ios registros cuidadosamente.
Los tiempos de respuesta durante el primer
Utilizando un nivel de significacin del
1%, hubo una disminucin significativa de la
mes son 26, 30,28,29,25, 28, 32,35,24 y 23
cantidad de desperdicios? a) Realice los cinco
minutos.
Utilizando un nivel de significacin del pasos de la prueba de hiptesis; b) ilustre su
5%, cumpli l su promesa? a) Realice los respuesta con un histograma de la distribucin
cinco pasos de la prueba de hiptesis; b) ilustre muestra! y con grficos de la distribucin po-

blacional y la distribucin de medias, indique


el punto t y los puntos de corte correspondien
tes al nivel de significacin seleccionado; c)
calcule el tamao del efecto, y d) explique su
respuesta a alguien que comprende los concep
tos de media, desvo estndar y vari&nza pero
que no sabe nada ms sobre estadstica.
5.
Cul es la potencia de cada uno de
siguientes estudios (sobre la base de un nivel
de significacin de 0,05)?
T am a o d el efecto

C olas

(a)

Pequeo

20

(b)

M ediano

20
30

(c)

M ediano

(d)

M ediano

30

1
1
1
2

(e)

Grande

30

. Un psiclogo realiza un estudio acerca


de ilusiones perceptivas en dos condiciones di
ferentes de iluminacin. Veinte participantes
fueron probados cada uno en las dos condicio
nes distintas. El experimentador inform: La
media de ilusiones efectivas fue 6,72 en condi
ciones de luminosidad y 6,85 en condiciones
de iluminacin dbil, una diferencia no signifi
cativa, f(19) = 1,62". Explique el resultado a
una persona que nunca ha asistido a un curso
sobre estadstica. Asegrese de utilizar en su
respuesta grficos de las distribuciones.
7.
Se realiz un estudio acerca de las
ractersticas de la personalidad a 100 alumnos
que fueron probados al comienzo y al final de
su primer ao de facultad. Los investigadores
informaron los resultados en la siguiente tabla:

dad. (Considere que los SD de la tabla corres


ponden a lo que hemos clasificado como S, la
estimacin no sesgada del desvo estndar de
la poblacin), b) Explique el significado de la
tabla a una persona que nunca ha asistido a un
curso de estadstica.
los
SERIE 11

1.
En cada uno de los siguientes estudios
se compara a la media de una sola muestra con
una poblacin de la cual se conoce la media
pero no la varanza. Decida, en cada caso, si el
resultado es o no significativo. (Si los gl no
aparecen en la tabla, utilice el t correspondien
te al valor gl menor ms cercano). Asegrese
de indicar todos sus clculos.
Tamao
Media
muestra! poblaciona!

Desvo
estndar
estimado

CAO

( )

(5)

(a)

16

100,31

2 ,0 0

(b)
(c)

16
16

0 ,4 7
6 8 ,9 0

4 ,0 0
9 ,0 0

Media
maestral
m

Nivel
de
Colas signifie.
(a )

100,98
1
0,05
(prediccin
alta)
0 ,0 0
2
0 ,0 5
3 4 ,0 0
1
0,01
(prediccin
baja)

2.
Existen teoras biolgicas que sostienen
que los humanos se han adaptado a su ambien
te fsico. Una de estas teoras sostiene la hip
ca
tesis de que las personas seguiran espont
neamente un ciclo de 24 horas de sueo y vigi
lia, aun cuando no fueran expuestas al patrn
usual de la luz solar. Para probar esta nocin,
ocho voluntarios contratados fueron ubicados
E sca la de
(individualmente) en una habitacin en la que
p e r s o n a lid a d
O to o
P r im a v e r a D ife r e n c ia
no haba luz del exterior, ni relojes, ni ninguna
M
SD
M
SD
M
SD
otra indicacin del transcurso del tiempo. Po
Angustia
16,82 4,21 15,32 3,84 1,50** 1,85
dan encender o apagar las luces cuando qui
Depresin
89,32 8,39 86,24 8,91 3,08** 4,23
sieran. Despus de un mes en la habitacin,
Introversin
59,89 6,87 60,12 7,11 0,23
2,22
cada individuo mostr una tendencia a desa
Neurosis
38,11 5,39 37,32 6,02 0,89* 2 4,21
rrollar un ciclo estable. Sus ciclos al finalizar
el estudio fueron los siguientes; 25,27,25,23,
*p < 0,05; **p < 0,01.
24,25,26 y 25.
a)
Concentrndose en las diferencias, cal Utilizando un nivel de significacin del
cule los valores t para cada escala de personali 5%, qu conclusin sacaramos con respect

a la teora de que 24 horas es el ciclo natural?


(Es decir, la duracin promedio del ciclo en
estas condiciones es significativamente dife
rente al de 24 horas?), a) Realice los cinco pa
sos de la prueba de hiptesis, b) Ilustre su
respuesta con un histcgrama de la distribucin
maestral y grficos de la distribucin poblacional y la distribucin de medias, e indique el
punto t y los puntos de corte correspondientes
al nivel de significacin seleccionado, c) Ex
plique su respuesta a alguien que nunca ha
asistido a un curso de estadstica.
3.
Cuatro individuos con alto nivel de
lestero iniciaron una dieta intensiva: evitan las
comidas con alto contenido'de colesterol y to
man suplementos especiales. Sus niveles de
colesterol antes y despus de la dieta fueron los
siguientes:
P a r tic ip a n te

A n te s

D esp u s

J.K .

287

255

L.M .M
A .K .

305
243

269
245

R.O .S.

309

247

Utilizando un nivel de significacin del


5%, se produjo un cambio significativo del ni
vel de colesterol? a) Realice los cinco pasos de
la prueba de hiptesis, b) Ilustre su respuesta
con un histograma de la distribucin muestral
y con grficos de la distribucin poblacional y
la distribucin de medias, e indique el punto t y
los puntos de corte correspondiente al nivel de
significacin seleccionado, c) Calcule el tama
o del efecto, d) Explique su respuesta a al
guien que nunca ha asistido a un curso de
estadstica.
4.
Un tribunal orden a cinco personas
nadas por exceso de velocidad a que asistieran
a un taller. Un mecanismo especial incorpora
do en sus autos mantuvo un registro de sus ve
locidades durante 2 semanas antes y despus
de participar del taller. Las velocidades mxi
mas de cada persona durante 2 semanas antes y
2 semanas despus de participar del taller fue
ron las siguientes:

P a r tic ip a n te
L .B .
J.K .
R .C .
R .T .

J.M.

A n te s

D esp u s

65
62
60
70
68

58
65
56
66
60

Utilizando un nivel de significacin del


5%, deberamos concluir que es probable
que una persona conduzca.a menor velocidad
despus de participar de un taller de trabajo?
a) Realice los cinco pasos de la prueba de hi
ptesis. b) Ilustre su respuesta con un histo
cograma de la distribucin muestral y con gr
ficos de la distribucin poblacional y la distri
bucin de medias, e indique el punto t y los
puntos de corte correspondiente al nivel de sig
nificacin seleccionado.'c) Calcule el tamao
del efecto, d) Explique su respuesta a alguien
que est familiarizado con la prueba de hipte
sis con poblaciones conocidas, pero que nunca
ha aprendido nada sobre las pruebas .
5,
Se midi la cantidad de oxgeno consu
mido por seis individuos durante dos periodos
de 10 minutos mientras permanecan sentados
con los ojos cerrados. Durante un periodo, es
cuchaban una excitante historia de aventuras;
durante el otro, escuchaban msica tranquila.
(El orden de las condiciones era el opuesto pa
ra una mitad de los participantes).
P a r t ic ip a n t e

H is t o r ia

M s ic a

1
2
3
4
5
6

6 ,1 2
7 ,2 5
5 ,7 0
6 ,4 0
5 ,8 2
6 ,2 4

5 ,3 9
6 ,7 2
5 ,4 2
6 ,1 6
5 ,9 6
6 ,0 8

pe Sobre la base de los resultados indicados


es menor el consumo de oxgeno cuando es
cuchan msica? Utilce un nivel de significa
cin del 1%. a) Realice los cinco pasos de
prueba de hiptesis, b) Ilustre su respuesta con
un histograma de la distribucin muestral y
con grficos de la distribucin poblacional y de
la distribucin de medias, e indique el punto y
los puntos de corte correspondiente al nivel de

significacin seleccionado, c) Calcule el tama significacin del 5%. a) Realic los cinco pa
o del efecto, d) Explique su respuesta a al sos de la prueba de hiptesis, b) ilustre su
guien que comprende el concepto de media, respuesta con un histograma de la distribu
desvo estndar y varianza pero que no sabe cin de muestras y con grficos de la distri
nada ms sobre estadstica.
bucin poblaconal y de la distribucin de
6,
A cinco alumnos de segundo ao se les to
medias, e indique el punto t y los puntos de
m un examen de evaluacin del nivel de in corte de significacin, c) Calcule la magnitud
gls antes y despus de recibir instrucciones so de efecto, d) Explique su respuesta a alguien
bre gramtica bsica. Sus registros fueron los si que comprende el concepto de media, desvo
guientes:
estndar y varianza pero que no sabe nada
ms sobre estadstica.
E s t u d ia n te
D esp u s
A n te s
7.
Se realiz un estudio comparando la ac
A
20
18
tividad
sindical
de empleados de 10 plantas du
B
18
22
rante dos dcadas diferentes. El investigador
C
17
15
D
17
16
inform un aumento significativo de la activi
12
E
9
dad sindical, t (9) - 3,28, p < 0,01. Explique
este resultado a una persona que nunca ha to
Es razonable concluir que futuros alum mado un curso de estadstica. Asegrese de uti
nos lograran registros ms altos despus de lizar grficos de las distribuciones en su
recibir las instrucciones? Utilice un nivel de respuesta.

Apndice del captulo: frmulas de clculo opcionales para


la prueba t para medias dependientes
Para realizar una prueba t para medias dependientes, despus de convertir los valores en diferen
cias, los pasos usuales son: a) calcular la media de las diferencias; b) calcular la suma de los des
vos cuadrticos de las diferencias con respecto a la media de esas diferencias; c) calcular la
varianza estimada de la distribucin poblaconal de diferencias individuales (5a); d) calcular el
desvo estndar estimado de la distribucin de medias de las diferencias (SM), y e) calcular el pun
to t. Combinando algunos de estos pasos y aplicando algunas manipulaciones algebraicas, una
vez que hemos convertido todos los datos en diferencias, podemos utilizar las siguientes frmulas
de clculo para encontrar S y t.

wY2

(9- 10)

N~ l

(9- 11)

La tabla 9-13 indica el clculo de la prueba t para medias dependientes correspondiente al es


tudio ficticio acerca de la coordinacin entre el pulso y la vista de cirujanos, utilizando las frmu
las de clculo. Compare estos clculos con los de la tabla 9~6 correspondiente a la misma
informacin pero utilizando frmulas de definicin.
T a b ln 9 - 1 3 .
C l c u l o d e la p r u e b a t p a r a m e d i a s d e p e n d i e n t e s c o r r e s p o n d i e n t e a l e j e m p l o a c e r c a d e la c o o r d i n a
c i n e n t r e e l p u l s o y l a v i s t a d e c i r u j a n o s , u t i l i z a n d o l a s f r m u l a s d e c l c u l o . ( D a t o s f ic t i c io s ) .
C ir u ja n o

1
2
3
4
5
6
7
8
9
S:
SAT- - (ZX )V N

N~
%XIN
SI'f

C o n d ic io n e s
S ile n c io
18
21
19
21
17
20
18
16
20
170

1 8 / 9 _____ 2
2 .7 4 /V 9

D if e r e n c ia c u a d r t ic a

(X )

(X2)
36
0
9
25
4
1
4
1
16
96

R u id o
12
21
16
16
19
19
16
17
16
152

9 6 - 1879

V 9 -1

D ife r e n c ia

6
0
3
5
-2
1
2
-1
4
18

96 - 3 2 4 /9 _

V
m _2_

~ 2 ,7 4 /3 ~ 0 ,9 1

9 6 -3 6 _ JO _ f f ?

~ X8 ~

UDescripcin del captulo


;

Esrateg bsica de la prueba fpaia^yp


La prueba i para Inedias inlepedlbt$$Vv^;4;
medias dependientes: la distribucin de
; segn se describen en los artculos de. ^
diferencias entre medias.
. . investigadqi (
;:\b:
Pasos de la prueba de hiptesis con una Resumen,
i-"'prueba t para medias independientes.
p . Trminos clave:
: Premisas d la prueba para mdlas ;
Problemas prcticos.
";:
independientes.
'.'v-'v!'
-v
-_s_
.
Apndice del capitulo: formulas de
Tamao del efecto y potencia de la
; clculo opcionales de la prueba tpar:
prueba para medias independientes,
medias independientes;

ste captulo analiza la prueba de hiptesis para los casos en los que se comparan dos
muestras, tales como un grupo experimental y un grupo de control. Son situaciones
en las que se realiza una prueba t debido a que las varianzas poblacionales no se co
nocen y, por lo tanto, deben estimarse. Bn este caso, la prueba se denomina prueba
t para medias independientes, porque se comparan medias de dos grupos de per
sonas completamente separados, cuyos valores son independientes el uno del otro. La prueba
para medias independientes se contrapone con la prueba t para medias dependientes analizada en
el captulo anterior, n la que haba dos grupos de valores, pero ambos provenan del mismo gru
po de personas (como es el caso de las mismas personas medidas antes y despus de un programa
de asesoramiento).

ESTRATEGIA BSICA DE LA PRUEBA t PARA MEDIAS INDEPENDIENTES:


LA DISTRIBUCIN DE DIFERENCIAS ENTRE MEDIAS
La prueba t para medias independientes funciona de la misma manera que la prueba de hiptesis
que ya hemos aprendido, con una excepcin fundamental: el resultado clave del estudio es una di
ferencia entre las medias de las dos muestras. Por lo tanto, la distribucin comparativa debe ser
una distribucin de diferencias entre medias.

Contenido de una distribucin de diferencias entre medias


La distribucin especial a la que nos referimos se encuentra, en un sentido, a dos pasos de las po
blaciones de observaciones de individuos: en primer lugar, tenemos una distribucin de medias
por cada poblacin de observaciones de individuos, y luego construimos una distribucin de dife-

rene ias entre pares de medias (cada una de las cuales proviene de una de esas dos distribuciones
de medias). Pensemos que ia distribucin de diferencias entre medias se construye de la siguiente
forma: a) se selecciona al azar una media de la distribucin de medias de la poblacin 1, b) se se
lecciona al azar una media de la distribucin de medias de la poblacin 2 y c) se resta (es decir to
mamos la media de la distribucin de medias de la poblacin 1 y le restamos la media de la distri
bucin de medias de la poblacin 2). El resultado es una diferencia entre las dos medias
seleccionadas. Luego se repite el proceso creando una segunda diferencia, es decir, la diferencia
entre las nuevas medias seleccionadas. Repitiendo este proceso una gran cantidad de veces se
crea una distribucin de diferencias entre medias.
Ilustracin de la lgica general d la prueba t para medias independientes
La figura 10-1 representa grficamente la creacin lgica completa que implica una distribucin
de diferencias entre medias. En la parte superior estn las dos distribuciones poblacionales cuyas
caractersticas desconocemos. No obstante, s sabemos que si la hiptesis nula es verdadera, las
dos medias poblacionales son iguales, es decir, la hiptesis nula establece que jr, =
Tambin
podemos estimar las varianzas poblacionales sobre la base de la informacin obtenida a travs de
la muestra (las varianzas estimadas sern S \ y 5 |).
Debajo de cada distribucin poblaciona se encuentra la distribucin de medias correspon
diente a esa poblacin. Utilizando la varianza poblaciona estimada y sabiendo el tamao de cada
muestra, podemos calcular la varianza de cada distribucin de medias utilizando el mtodo acos
tumbrado (es decir, la varianza poblaciona de origen dividida por el tamao de la muestra).
Debajo de las dos distribuciones de medias, y creada a partir de ellas, se encuentra la crucial
distribucin de diferencias entre medias. Dado que la varianza de esta distribucin se estima fi
nalmente sobre la base de las varianzas poblacionales estimadas, podemos considerarla una dis
tribucin t. El objetivo de una prueba t para medias independientes es decidir si la diferencia entre
las medias de las dos muestras reales es ms extrema que la diferencia de corte en la distribucin
de diferencias. Las dos muestras reales aparecen (como histogramas) en la parte inferior.
No debemos olvidar que todo el procedimiento es, en realidad, una especie de complicado
castillo en el aire. Existe slo en nuestras mentes para ayudamos a tomar una decisin basada en
los resultados de un experimento real. La nica realidad concreta en todo este procedimiento son

F i g u r a 1 0 - 1 . P a s o s p ara la c r e a c i n
b u c i n d e d if e r e n c ia s d e m e d ia s .

las dos muestras de valores realmente observadas. Las varianzas poblacionales se estiman sobre la
base de esos valores muestra.les. Las varianzas de las dos distribuciones de medias se basan comple
tamente en las varianzas poblacionales estimadas (y en los tamaos de las muestras). Y, como vere
mos pronto, las caractersticas de la distribucin de diferencias entre medias se basan en las dos dis
tribuciones de medias que mencionamos anteriormente.
Aun as, el procedimiento es poderoso. Tiene el poder de la matemtica y una lgica implci
ta: ayuda a desarrollar un conocimiento general basado en los datos especficos de un estudio en
particular.
Teniendo una visin general de la lgica bsica, ahora nos dedicaremos a cinco detalles cla
ve: a) la media de la distribucin de diferencias entre medias, b) la varianza poblaciona estimada,
c) la varianza y el desvo estndar de la distribucin de diferencias entre medias, d) la forma de la
distribucin de diferencias entre medias y e) el punto t correspondiente a la diferencia entre las
dos medias particulares que estn siendo comparadas.
Media de !a distribucin de diferencias de medias
En una prueba t para medias independientes se tienen en cuenta dos poblaciones; por ejemplo,
una poblacin de la cual se extrae el grupo experimental y otra poblacin de la cual se extrae el
grupo de control. En la prctica, el investigador no conoce la media de ninguna de las poblacio
nes, pero efectivamente sabe que si la hiptesis nula es verdadera, esas dos poblaciones tienen la
misma media. Si las dos poblaciones tienen la misma media, la distribucin de medias de cada
una de ellas tendr tambin a misma media. Si se seleccionan ai azar dos muestras de dos distri
buciones con la misma media, las diferencias de las medias de estas muestras aleatorias, a la lar
ga, deberan compensarse en 0. El resultado de toda esta lgica es que cualesquiera sean los datos
especficos del estudio, el investigador sabe que si la hiptesis nula es verdadera, la distribucin
de diferencias de medias tiene una media de 0.

Estimacin de la varianza poblaciona


En el captulo 9 aprendimos a estimar la varianza poblaciona utilizando los valores mustrales. Era
el resultado de la suma de los desvos cuadrticos dividido por los grados de libertad (el tamao
de la muestra menos 1).
Para realizar una prueba t para medias independientes, debera ser lgico suponer que las po
blaciones de las cuales provienen las dos muestras tienen la misma varianza. (Si la hiptesis nula
es verdadera, tambin tienen la misma media. Pero sea la hiptesis nula verdadera o no, debemos
estar en condiciones de suponer que las dos poblaciones tienen la misma varianza). Por lo tanto,
cuando estimamos la varianza a partir de los valores de cada muestra estamos obteniendo dos es
timaciones separadas de lo que debera ser el mismo nmero (la varianza de cada muestra es una
estimacin de lo que se supone que es igual para las dos poblaciones). En la prctica, las dos esti
maciones no sern idnticas, pero como se supone que las dos estn estimando lo mismo, la me
jor solucin es promediar las dos estimaciones para obtener la mejor estimacin, nica y general.
A esto se lo denomina estimacin combinada de la varianza poblaciona (52Combiliada).
Al realizar el promedio, tambin debemos tener en cuenta el hecho de que si una muestra
es mayor que la otra, es probable que la estimacin que produzca sea ms precisa (porque se basa en
mayor informacin). Si las dos muestras fueran exactamente del mismo tamao, podramos sim
plemente sacar un promedio simple de las dos estimaciones. Pero cuando no lo son, necesitamos
realizar ciertos ajustes en nuestro promedio para dar ms valor relativo a la muestra mayor. Nece
sitamos un promedio ponderado, un promedio relativzado segn la cantidad de informacin

que proporciona cada muestra. Para ser precisos, lo que importa no es la cantidad de valores de
cada muestra sino la cantidad de grados de libertad (la cantidad de valores menos 1).
Por lo tanto, cuando creamos un promedio ponderado ste tiene que basarse en los grados de
libertad. El procedimiento consiste en calcular en qu proporcin contribuye cada muestra con
los grados de libertad totales; despus multiplicamos esa proporcin por la estimacin provenien
te de cada muestra y, finalmente, sumamos los dos resultados y obtenemos la estimacin ponde
rada. La frmula que expresa el principio que acabamos de describir es la siguiente;

<1(W)
En la frmula precedente, $'2Combirta(iaes estimacin combinada de la varianza poblacional,
g l{ son los grados de libertad correspondientes a la poblacin 1, y gl2 son los grados de liber
tad correspondientes a la poblacin 2, (No debemos olvidar que cada gl es la cantidad de valo
res mustrales menos 1). glTotal son los grados de libertad totales (g/To{at = g l{ + gt2). ] es la
estimacin de la varianza poblacional sobre la base de los valores de a muestra que proviene de
la poblacin 1; S \ es la estimacin sobre la base de los valores de la muestra que proviene de la
poblacin 2.
Analicemos un estudio en el que la estimacin de la varianza poblacional, sobre la base de un
grupo experimental de 11 participantes, es 60, y la estimacin de la varianza poblacional sobre la
base de un grupo de control de 31 participantes es 80. La estimacin del grupo experimental
se basa en 10 grados de libertad (11 participantes menos 1); la estimacin del grupo de control se
basa en 30 grados de libertad (31 participantes menos 1). La informacin total sobre la que se ba
sa la estimacin son los grados totales de libertad, en este caso, 40. Por lo tanto, el grupo experi
mental proporciona un cuarto de la informacin (10/40 = 1/4), y el grupo control proporciona tres
cuartos de la informacin (30/40 = 3/4).
Despus multiplicamos la estimacin del grupo experimental por 1/4 y obtenemos 15 (es
decir, 60 x 1/4 = 15), y la estimacin del grupo de control por 1/4 y obtenemos 60 (es decir, 80
x 3/4 = 60). Sumando los dos resultados obtenemos una estimacin de 15 ms 60, es decir de
75. Aplicando la frmula:
^Combinada:

M sfW
g Total '
'

) = ~ ( 6 0 ) + ~ (80)
40
40V

Total \ 2 /

= 1 ( 6 0 ) + | ( 8 0 } = 15 + 6 0 = 7 5

Cabe mencionar que este procedimiento no da el mismo resultado que un promedio simple (sin
ponderar). Un promedio simple dara una estimacin de 70 (es decir, [60+80J/2 = 70). Nuestra es
timacin combinada ponderada, igual a 75, est ms cerca de la estimacin realizada slo sobre la
base del grupo de control que de la estimacin realizada tnicamente sobre la base del grupo expe
rimental. As es como debe ser, porque la estimacin del grupo de control se bas en mayor infor
macin. Por otro lado, an sigue siendo un tipo de promedio. Ser evidente que hemos cometido
un error en los clculos si este nmero no se encuentra entre las dos estimaciones. (Tambin re
sultar evidente el error de clculo si no obtenemos un nmero ms cercano a la estimacin que
proviene de la muestra mayor).

Clculo de a varianza de cada una de las dos distribuciones de medias


La estimacin combinada de la varianza poblacional es la mejor estimacin para ambas poblacio
nes. (No debemos olvidar que para realizar una prueba t para medias independientes, debemos es
tar en condiciones de suponer que las dos poblaciones tienen la misma varianza). Sn embargo,
aunque las dos poblaciones tienen la misma varianza, las distribuciones de medias tomadas de
ellas usualmente no tienen la misma varianza, ya que la varianza de una distribucin de medias es
la varianza poblacional dividida por el tamao de la muestra. Por lo tanto, aun cuando la varianza
poblacional sea la misma para las dos poblaciones, si los tamaos de las muestras son diferentes,
entonces las dos distribuciones de medias tendrn diferentes varianzas. Expresado en frmulas:
2
o2

^Combinada

( 10 - 2 )

..^Combinada

(10-3)

Su * - ~ ;

Analicemos nuevamente el ejemplo del estudio en el que haba 11 individuos en el grupo experi
mental y 31 en el grupo de control. En ese ejemplo, descubrimos que la estimacin combinada de
la varianza poblacional era 75. Por lo tanto, para el grupo experimental, la varianza de la distribu
cin de medias sera 75/11, es decir 6,82; y en el grupo de control, la varianza sera 75/31, es de
cir, 2,42. (Es importante recordar que al calcular varianzas estimadas dividimos por los grados de
libertad, pero cuando calculamos la varianza de una distribucin de medias, que no involucra nin
guna estimacin adicional, dividimos por la cantidad real de observaciones en la muestra). Apli
cando las frmulas,
<2 _ ^Combinada 75

<,0

-------- I T 6'82
= ^C^binada = 2 42
31
Varianza y desvo estndar de la distribucin de diferencias de medias
La varianza de la distribucin de diferencias de medias (^Diferenciad es la suma de la varianza
de la distribucin de medias proveniente de la poblacin 1 y la varianza de la distribucin de me
dias proveniente de la poblacin 2, Esto se debe a que, al calcular una diferencia entre dos nme
ros, la variacin de cada uno contribuye a la variacin total de la diferencia. Es como restar un n
mero en movimiento de un objetivo en movimiento. Se representa porla frmula:
2

^Diferencia

2
+ Sm2

(10-4)

El desvo estndar de la distribucin de diferencias de medias (5Difererida) es la raz cuadrada de la


varianza:
^Diferencia

^Diferencia

(10-5)

Analicemos nuevamente el ejemplo del estudio con 11 individuos en el grupo experimental y


31 en el grupo de control. Descubrimos que la varianza de la distribucin de medias del grupo ex
perimental era 6,82, y 3a varianza de 3a distribucin de medias del grupo de control era 2,42. La
varianza de la distribucin de diferencias entre medias sera entonces 6,82 ms 2,42, lo que da un
total de 9,24. Por lo tanto, el desvo estndar de esta distribucin es la raz cuadrada de 9,24, que
es 3,04. La frmula es la siguiente:
^Diferencia ~

6,82 + 2,42 ~ 9,24

^Diferencia ~ v ^Diferencia ~~ V9,24

3,04

Forma de la distribucin de diferencias de medias


La distribucin de diferencias de medias se basa en la utilizacin de varianzas poblacionales esti
madas; por lo tanto, la distribucin comparativa es una distribucin t. La estimacin de la varian
za de esa distribucin se basa en estimaciones en las que se utilizan dos muestras; por lo tanto, los
grados de libertad de esa distribucin t son la suma de los grados de libertad de las dos muestras.
Se representa bajo la frmula,
(10-6)
hoxrh+Sl2
La novedad en este caso es que g/Total, los grados de libertad totales de ambas muestras juntas, son
tambin los grados de libertad de la distribucin t
Bn el ejemplo con un grupo experimental de 11 y un grupo de control de 31, los grados de
libertad totales seran 40 (es decir, 11 - 1 = 10; 31 - 1 = 30, y 10 + 30 = 40). Para determinar el
punto necesario para la significacin, buscamos el punto de corte en la tabla t en la lnea co
rrespondiente a ios 40 grados de libertad. Supongamos que estuviramos realizando una prue
ba de una cola utilizando un nivel de significacin de 0,05. La tabla i indica que con 40 grados
de libertad, para un resultado significativo, la diferencia entre las medias debe ser de al menos
1,684 desvos estndar por encima de la diferencia media de 0 en la distribucin de diferen
cias de medas.

El punto t para la diferencia entre ias dos medias reales


El punto que calculamos en el paso 4 de la prueba de hiptesis se encuentra de la siguiente ma
nera: primero, calculamos la diferencia entre las dos medias (es decir, restndole una a la otra).
Despus, calculamos dnde se ubica esa diferencia en la distribucin de diferencias entre me
dias, es decir, dividimos la diferencia por el desvo estndar de esa distribucin. Se expresa bajo
la frmula:
(10-7)
Por ejemplo, supongamos que la media de la primera muestra es 198 y la media de la segunda
muestra es 190. La diferencia entre estas dos medias es 8 (es decir, 198 - 190 = 8). Calculamos
que el desvo estndar de la distribucin de diferencias entre muestras es, en este ejemplo, 3,04,
es decir, un punto t de 2,63 (8/3,04 = 2,63). n otras palabras, en este ejemplo la diferencia de las

dos medias se encuentra 2,63 desvos estndar por encima de ia inedia de la distribucin de dife
rencias de medias. Se expresa bajo ia frmula,
M

~ M 2

^ D ife r e n c ia

1 9 8 -3 8 0 _

3 ,0 4

3 ,0 4

_ 2>63

PASOS DE LA PRUEBA DE HIPTESIS


CON UNA PRUEBA (PARA MEDIAS INDEPENDIENTES
Sobre la base de los cinco pasos de la prueba de hiptesis, existen tres aspectos nuevos de una
prueba tp ara medias independientes: a) la distribucin comparativa ahora es una distribucin de
diferencias de medias (afecta el paso 2), b) los grados de libertad para encontrar el punto de corte
en la tabla %se basan en dos muestras (afecta el paso 3) y c) el valor muestral se'basa en la diferen
cia entre las dos medias (afecta el paso 4).

Ejemplo de prueba f para medias independientes


Norman y Aron (1997) realizaron una serie de experimentos para probar la prediccin de su teo
ra, la cual planteaba que las parejas que realizan juntas actividades excitantes aumentan su satis
faccin marital En el primero de los estudios, parejas casadas se acercaron al laboratorio para
una evaluacin. Desde el punto de vista de las parejas, la sesin implicaba llenar cuestionarios
acerca de sus matrimonios, ser filmados en video mientras nteractuaban en una actividad inu
sual, y despus llenar ms cuestionarios acerca de su matrimonio. Sin embargo, sin que las pare
jas lo supieran, la primera serie de cuestionarios en realidad era un pretexto, la actividad era una
manipulacin experimental, y la segunda serie de cuestionarios era una prueba posterior. Las ac
tividades se establecieron de tal forma que a algunas parejas les tocaron actividades excitantes y a
otras les tocaron actividades neutras. La actividad excitante era un juego cooperativo fisiolgica
mente excitante; la actividad de control era una tarea fsica lenta y repetitiva que cada uno de los
miembros de la pareja realizaba por su cuenta. De las 28 parejas que participaron en el estudio, 15
se asignaron al azar a la actividad excitante y 13 a la actividad de control. (El plan original haba
consistido en tener cantidades iguales en los dos grupos, pero algunas parejas que participaron no
pudieron ser utilizadas por distintas razones, como por ejemplo, que uno de los miembros de la
pareja no llenara correctamente los cuestionarios).
Siguiendo los procedimientos tpicos de los experimentos relacionados con la psicologa so
cial, los investigadores incluyeron algunas preguntas al final de la sesin para controlar si la mani
pulacin experimental haba producido las experiencias esperadas durante la actividad. La tcnica
se denomina control de manipulacin . Por ejemplo, las preguntas de control de manipulacin in
cluan: En qu medida le result excitante la tarea? y cun interesante le pareci la tarea?
La figura 10-2 representa grficamente la prueba t que compara los valores de control de ma
nipulacin correspondientes a las dos condiciones; la tabla 10-1 indica los valores y clculos del
mismo ejemplo. Sigamos tambin los cinco pasos completos de la prueba de hiptesis.
1.
Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de las po
blaciones. Las dos poblaciones son:
Poblacin 1: parejas que participan en las tareas excitantes.
Poblacin 2: parejas que participan en las tareas de control.

La hiptesis de investigacin estableca que las parejas de ia poblacin 1 tendran puntuaciones


ms altas que las parejas de la poblacin 2 en cuanto a lo estimulante de las tareas (preguntas de
control de manipulacin): (ij > ji2. Es decir, se trata de una hiptesis direccional. La hiptesis nu
la estableca que las parejas de la poblacin 1 no tendran puntuaciones ms altas que las parejas
de la poblacin 2: p.j < jXj.
2.
D eterm inar ias caractersticas de ia distribucin comparativa. Como ya observamos
la media de la distribucin de diferencias de medias casi siempre es 0, ya que lo que nos interesa
es saber si existe una diferencia mayor a 0 entre las dos poblaciones. La varianza poblacional, es
timada a partir de las dos muestras de parejas, resulta ser 0,33 y 2,77.1La estimacin combinada
de la varianza poblacional es el promedio ponderado de las dos varianzas anteriores: 14/26 por
0,33 y 12/26 por 2,77. El resultado es 1,45. La varianza de cada distribucin de medias, es decir,
la estimacin combinada dividida por el tamao de cada muestra (1,45/15 y 1,45/13), es igual a

Figura 10-2. Distribuciones relacionadas con el ejemplo de control de manipulacin en una prueba t para
medias independientes. (Fuente: Norman & Aron, 1997).
1 En este ejemplo, ias varianzas estimadas de las dos poblaciones son sustancialmente diferentes. Esto genera objecio
nes en cuanto al supuesto de que ambas poblaciones tienen la misma varianza. Al final del captulo, veremos el tema
del supuesto de iguales varianzas poblacionales. en. forma general. N o obstante, en este ejemplo, utilizar mtodos alter
nativos que no requieran del supuesto produce resultados similares.

Tabla 10-1.
Prueba t para medias independientes correspondiente al control de manipulacin de la excitacin
experimentada, comparando las condiciones de excitacin con las de control.
Parejas en la condicin de excitacin

Parejas en la condicin de control

R e g is tr o

D e s v o
d e la m e d ia

D e s v o
c u a d r tic o
d e la m e d ia

8,75
8,92
9 ,5 0
8 ,5 0
8,17
8,67
8,17
8,83
9,17
9 ,0 8
8,75
7,0 8
8,42
9,1 7
8,33

0,12
0,29
0,87
- 0 ,1 3
- 0 ,4 6
0 ,0 4
- 0 ,4 6
0 ,2 0
0,5 4
0,4 5
0,1 2
-1 ,5 5
-0 ,2 1
0,54
-0 ,3 0

0,01
0,08
0 ,7 6
0 ,0 2
0,21
0 ,0 0
0,21
0,0 4
0 ,2 9
0 ,2 0
0,01
2 ,4 0
0,04
0,29
0,09

9 ,5 0
5,00
4,83
8,42
9 ,0 0
5,25
6,75
5,67
6,17
4 ,0 0
6,5 0
6,5 0
5,67

4,65

8 3 ,2 6

129,51

R e g istr o

D e s v o
d e la m e d ia

3 ,1 0
- 1 ,4 0
- 1 ,5 7
2,02
2 ,6 0
-1 ,1 5
0,35
- 0 ,7 3
-0 ,2 3
- 2 ,4 0
0,10
0,10
- 0 ,7 3

D e s v o
c u a d r t" 0
d e la m e d ia

9,61
1,96
2,46
4,08
6,76
1,32
0,12
0,53
0,05
5,76
0,01
0,01
0,53

33,20

= 3 3 ,2 0 /1 2 = 2,77

! = 8,63; 5 2j = 4 ,6 5 /1 4 * 0,33; U 2 =6,40;

iV( - l = 14;iV2 = 13 ; g l2 = N 2 ~ 1 = 12
^Toiaf " <^1 +

1 4 + 1 2 = 26

^ b i ^ = 7 ^ ( f ) + - p ( s I)=X0.33)+|(2,77)=0,54(033)+0,4<i(2,77)=0,I8tl37=l,45
Total

Sg, =

Total

= 1145/15 = 0,097

% = S . " 2= 1' ' = 0'i n


+

= 0,097 + 0 ,1 1 2 = 0,209

* = ' 5 ^ = * 3 * = M 57

t necesario para nivel 1 % , g l= 2 6 , con prueba de una coia = 2 ,479


t ~

- M 2)/S m t ^

= (8 ,6 3 - 6 ,4 0 )/0 ,4 5 7 = 2 ,2 3 /0 ,4 5 7 = 4,88

Conclusin: se rechaza la hiptesis nula; se sostiene la hiptesis d e investigacin.


Fuente: Norman & Aron (1997).

0,097 y 0,112. Sumando estas varianzas obtenemos la varianza de la distribucin de diferencias


entre medias, 0,209. La raz cuadrada de esta varianza, es decir, el desvo estndar de la distribu
cin de diferencias de medias, es 0,457. La forma de la distribucin comparativa ser una distri
bucin con un total de 26 grados de libertad.
3. D eterm inar el punto muestral de corte en la distribucin comparativa, a partir del
cual debera rechazarse la hiptesis nula. El ejemplo requiere una prueba de una cola porque
se predijo una direccin particular de la diferencia entre las dos poblaciones. Dado que todo el ex
perimento depende del xito de la manipulacin, los investigadores son particularmente conser-

vadores al establecer el nivel de significacin. Para una prueba de una cola con un nivel de 0,01,
con 26 grados de libertad, la tabla del apndice B (tabla B-2) indica que necesitamos un t de al
menos 2,479 para rechazar la hiptesis nula.
4. Determinar el valor muestral en la distribucin comparativa. El punto t es la diferencia
entre las dos medias mustrales de 2,23 (8,63 - 6,40 = 2,23) dividida por 0,457, el desvo estndar
de la distribucin de diferencias de medias. El resultado es una puntuacin t de 4,88 (es decir,
= 2,23/0,457 = 4,88).
5. Com parar os registros de los pasos 3 y 4 para decidir si se rechaza o no la hiptesis
nula. El valor t de 4,88, correspondiente a la diferencia entre las medias de las dos condiciones, es
mayor que el t necesario de 2,479. Por lo tanto, los investigadores podran rechazar la hiptesis
nula con confianza. La hiptesis de investigacin se sostiene: las parejas que participan de las
condiciones de excitacin informan que la actividad Ies resulta ms excitante de lo que informan
las parejas que participan en las condiciones de control. Por lo tanto, los investigadores podan
confiar en que su manipulacin experimental estaba funcionando en la forma deseada. (Por su
puesto, el siguiente paso era ver si la manipulacin experimental produca el aumento predicho de
satisfaccin marital y amor romntico).
Un dato interesante es que el anlisis de los resultados completos de este estudio indicaron
que las parejas en condiciones excitantes mostraron un aumento significativamente mayor de la
satisfaccin marital y del amor romntico entre antes y despus de la actividad, (Es fcil interpre
tar estos resultados sabiendo que la manipulacin experimental s produce la sensacin esperada).
Otros resultados de los estudios de Norman & Aron descartaron algunas explicaciones alter
nativas del efecto encontrado, y un estudio anterior (Reissman et al., 1993) descubri el mismo
efecto fuera del laboratorio en condiciones ms realistas. Tomados en conjunto, estos estudios
brindan una evidencia preliminar de que realizar actividades excitantes juntos puede ser una for
ma de aumentar la calidad marital de las parejas casadas.
Un segundo ejemplo de prueba t para medias independientes
Valenzuela (1997) compar el cuidado maternal recibido por chicos pobres que estaban o no des
nutridos. Una de sus medidas fueron ndices acerca de la forma en que la madre ayudaba a su hijo
en una tarea estndar de armado de rompecabezas (la observacin se realiz durante visitas a las
madres en sus casas, como parte de la investigacin).
Los resultados obtenidos indicaron que las madres de los 43 nios adecuadamente alimenta
dos tenan una media, en cuanto a la calidad de ayuda, de 33,1, y una varianza poblaciona estima
da de 201,64. Las madres de los 42 nios crnicamente desnutridos tenan una meda de 27,0 en
esta medida, con una varianza poblaciona estimada de 134,56.
La figura 10-3 representa grficamente la prueba t que compara la calidad de ayuda en las dos
condiciones; la tabla 10-2 indica los valores y clculos correspondientes. A continuacin realiza
mos los cinco pasos de la prueba de hiptesis.

1.
Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula d
poblaciones. Las dos poblaciones son las siguientes:
Poblacin X: madres de nios pobres adecuadamente alimentados.
Poblacin 2: madres de nios pobres crnicamente desnutridos.
La hiptesis de investigacin estableca que las madres de la poblacin 1 tendran diferentes
ndices que las madres de la poblacin 2 en cuanto a la calidad de ayuda brindada a sus hijos. Va
lenzuela predijo que la poblacin 1 tendra ndices ms altos que los de la poblacin 2. Sin embar

go, siguiendo la prctica convencional en cuanto a estudios de este tipo, se utiliz una prueba de
significacin no direccional. (La ventaja de este tipo de prueba es que brinda la posibilidad de en
contrar resultados significativos en la direccin opuesta a la prediccin). Por lo tanto, la hiptesis
de investigacin realmente probada fue que las madres de la poblacin 1 tendran ndices diferen
tes a los de las madres de la poblacin 2; en smbolos, |X1-t- p2. La hiptesis nula estableca que las
madres de la poblacin 1 tendran ndices iguales a los de las madres de la poblacin 2;
jx,.
2.
D eterm inar las caractersticas de la distribucin comparativa. Como es habitual, la
media de la distribucin de diferencias de medias ser 0, La estimacin combinada de la varian
za poblacional es el promedio ponderado de las estimaciones de varianza poblacional realizados
sobre la base de cada una de las dos muestras: 42/83 por 201,64 y 41/83 por 134,56. El resultado
es 168,77. La varianza de cada distribucin de medias, es decir, la estimacin combinada dividi
da por el tamao de cada muestra (168,77/43 y 168,77/42), es 3,92 y 4,02. Sumando los dos re
sultados anteriores obtenemos la varianza de la distribucin de diferencias de medias, 7,94. La
raz cuadrada de esa varianza, es decir, el desvo estndar de la distribucin de diferencias de
medias, es 2,82. La forma de la distribucin comparativa es una distribucin t con un total de 83
grados de libertad.

F igura 10-3. D istribuciones relacionadas co n el ejem plo acerca de madres de ni os pobres adecuadam ente a li
m entados en com paracin con m adres de ni os pobres crnicam ente desnutridos. (F u en te: V alenzuela, 1997).

3. Determinar el punto de corte en la distribucin comparativa, a p artir del cual debera


rechazarse la hiptesis nula. El punto de corte que necesitamos es el de una prueba de dos colas
al nivel usual de 0,05, con 83 grados de libertad. Dado que la tabla t del apndice B (tabla B-2) no
incluye los datos para 83 grados de libertad, utilizamos el gl menor ms cercano, que es 80. Obte
nemos as un punto de corte de 1,990 (En realidad son dos puntos simtricos: -1,99 y +1,99).
4. Determinar el valor muestra! en la distribucin comparativa. La puntuacin t es la di
ferencia entre las dos medias mustrales dividida por el desvo estndar de la distribucin de dife
rencias de medias. El resultado es un t de 2,16. (Es decir, t = 6,1/2,82 = 2,16).
5. Com parar los valores de los pasos 3 y 4 para decidir si se rechaza o no la hiptesis nula.
La puntuacin t de 2,16, correspondiente a la diferencia entre las medias de las dos condiciones, es
ms extremo que el punto t necesario de 1,99. Por lo tanto, el investigador podra rechazar la hipte
sis nula. Se sostiene la hiptesis de investigacin: las madres dlos nios adecuadamente alimen
tados brindan una mejor calidad de asistencia a sus nios que las madres de nios crnicamente des
nutridos. (La tabla 10-7 indica los resultados completos de este estudio en la seccin en la que
tratamos el modo en que se describen los resultados de las pruebas t para medias independientes en
las publicaciones cientficas).
Un tercer ejemplo de prueba t para medias independientes
Aqu presentamos otro ejemplo, esta vez utilizando datos ficticios (de forma tal que podemos ha
cer que los nmeros sean especialmente fciles de manejar). Supongamos que un psiclogo espe
cializado en rehabilitacin ha desarrollado un nuevo programa de capacitacin laboral para
Tabla 10-2.
Prueba t para medias independientes del estudio acerca de la calidad de asistencia brindada por
madres de nios chilenos pobres adecuadamente alimentados, en comparacin con madres de nios
chilenos pobres crnicamente desnutridos.
N ios adecuadam ente alimentados:
W, = 43; Ij - A!, - 1 = 42; Af, = 33,1;

= 2 0 1,64

N i o s crnicam ente desnutridos:


N 2 = 42; g lz =
- 1 = 41; M 2 = 27,0; S \ = 134,56
8 h M ' 8 l i * g l2 = 42 + 4 1 - 8 3

gl,
W l

gL

Tw.l

42

41

83

83

= 0.51(201,64) + 0,49(134,56) = 1020,84 + 65,93 = 168,77


168,77/43 = 3,92

t,= S ,+Sa = W2 + 4-02 = 794

t necesario con nivel 5%, g l - 83 (utilizando un gf= 80 d e la tabla) y prueba de dos c olas = 1,990
t = ( M x ~ A /2)/y Difc(eflCia = <33,l - 2 7 , 0 )/2 ,8 2 = 6 ,1/2 ,8 2 = 2,16

C onclusin: se rechaza la hip tesis nula; se so stien e la hip tesis de investigacin.


Fuente: Valenzuela (1997).

personas que no han sido capaces de mantener un empleo. Catorce personas acuerdan participar en
el estudio, y el investigador escoge al azar siete de esos voluntarios para formar el grupo expe
rimental que realizar el programa de capacitacin especial. Los otros siete voluntarios forma
rn el grupo de control que realizar un programa de capacitacin laboral ordinario. Despus
de finalizar los programas de capacitacin (de ambos tipos), los 14 son ubicados en empleos si
milares.
Un mes despus, se le pide al empleador de cada voluntario que califique el desempeo del
participante utilizando una escala de 9 puntos. La tabla 10-3 indica los resultados ficticios y el
anlisis completo de la prueba t La figura 10-4 representa grficamente el anlisis. Realicemos
tambin el anfisis paso a paso, siguiendo el procedimiento de prueba de hiptesis.
1. Replantear e problema en funcin de hiptesis de investigacin e hiptesis nula de
poblaciones. Las dos poblaciones son las siguientes:
Poblacin 1: individuos que no podan mantener un empleo y que, po lo tanto, participan en el
programa de capacitacin laboral especial.
Poblacin 2: individuos que no podan mantener un empleo y que, por lo tanto, participan
en un programa de capacitacin laboral ordinario.
Es posible que el programa especial tenga efectos positivos o negativos en comparacin con
el programa ordinario, por lo cual ambos resultados son de inters. Por lo tanto, la hiptesis de in
vestigacin establece que las medias de las dos poblaciones son diferentes: p,E p,2. Se trata de
una hiptesis no direccional. La hiptesis nula establece que las medias de las dos poblaciones
son iguales: jXj = jx2.
2. D eterm inar las caractersticas de la distribucin comparativa. La distribucin de
diferencias entre medias tendr una media de 0, como es habitual. Determinamos su desvo es
tndar de la siguiente manera; a) calculando la varianza poblacional estimada sobre la base de
cada muestra; b) calculando la estimacin combinada; c) en el caso de cada poblacin, divi
diendo la estimacin combinada por el tamao de cada muestra para obtener la varianza de ca
da distribucin de medias; d) sumando las varianzas de las dos distribuciones de medias para
obtener la varianza d la distribucin de diferencias de medias, y e) calculando la raz cuadrada
de esa varianza. Como lo indica la tabla 10-3, todo este proceso da como resultado un desvo
estndar de 1,10. La forma de la distribucin comparativa es una distribucin t con un total de
12 grados de libertad.
3. Determinar el punto de corte en la distribucin comparativa, a p artir del cual debera
rechazarse la hiptesis nula. Los investigadores utilizan e nivel de significacin usual de 0,05 y
una prueba de dos colas (ya que la hiptesis no es direccional). Buscando estos datos en la tabla ,
en la lnea correspondiente a 12 grados de libertad, descubrimos que necesitamos un punto f de al
menos 2,179.
4. D eterm inar el valor m uestral en la distribucin comparativa. La diferencia de me
dias dividida por el desvo estndar de la distribucin de diferencias entre medias es una pun
tuacin t de 2,73.
5. Comparar los valores de los pasos 3 y 4 para decidir si se rechaza o no ia hiptesis nula,
La puntuacin de 2,73 es ms extrema que el 2,179 necesario. Por lo tanto, los investigadores re
chazaran la hiptesis nula y concluiran que se sostiene la hiptesis de investigacin: el nuevo
programa de capacitacin laboral es efectivo.

Figura 10*4. D istr ib u c io n e s rela cio n a d a s c o n un e x p e rim e n to fic tic io q u e prueba un n u e v o p ro g ra m a d e


c a p a c ita c i n laboral.

Resumen de los pasos a seguir para la realizacin de una prueba


para medias independientes

La tabla 10-4 resume los pasos a seguir para realizar una prueba t para medias independientes. En
el apndice del captulo se encuentran las frmulas de clculo, las cuales sern de gran utilidad si
alguna vez es necesario calcular manualmente una prueba de medias-independientes (sin una
computadora) para un estudio real con una gran cantidad de participantes. Sin embargo, para un
mejor aprendizaje, recomendamos insistentemente que los ejercicios se resuelvan utilizando las
frmulas de definicin y los procedimientos que se indican en la tabla 10-4.

SUPUESTOS DE LA PRUEBA t PARA MEDIAS INDEPENDIENTES


La primera suposicin en una prueba t para medias independientes es igual a la suposicin en
cualquier prueba f: se supone que las distribuciones poblacionales son normales. En la prctica,
esto implica un problema slo si se considera que las dos poblaciones tienen distribuciones mar
cadamente asimtricas y en direcciones opuestas. En general, la prueba f se aplica bastante bien
en la prctica aun cuando las formas de las distribuciones poblacionales sean moderadamente di
ferentes de la curva normal."

Tabla 10-3,
Clcalos de una prueba f para medias independientes correspondientes a un experimento de
evaluacin de la efectividad de un nuevo programa de capacitacin laboral (utilizando la calificacin
de los empleadores) para personas que anteriormente no haban podido mantener sus empleos.
G r u p o e x p e r im e n ta l
(r e c ib e e l p r o g r a m a e s p e c ia l)

1:

R e g istr o

D e s v o d e
la m e d ia

D e s v o
c u a d r tic o
d e la m e d ia

6
4
9
7
7
3
6

0
-2
3
1
1
-3
0

0
4
9
1
1
9
0

42

24

G r u p o d e c o n tr o l
(R e c ib e e l p r o g r a m a e s t n d a r )

R e g is tr o
6

D e s v o
d e la m e d ia

D e s v o
c u a d r tic o
d e la m e d ia

3
-2
2
0
-2
-2
1

9
4
4
0
4
4
1

21

26

l
5
3
l
i

M v = 6; S ] = 2 4 /6 = 4 ;M 2 = 3; S f = 2 6 /6 = 4 ,3 3
N ^ l - . g l , JV, - 1 ==6;AT2 = 7 ; g l 2 = N 2 - l ~ 6

S^Ibtal = 8 1 + ^ 12 = 6 + 6 = 12
(Sf) + - ' 7 T 1(4)4 i f <433) '34>4 5<4-33>= 2 m 4 2-17' 417
8hot*i
Shtmi
12
12
^ - ^ ^ , = 4 , 1 7 / 7 = 0,60
=

= 0 ,6 0 + 0 ,6 0 = 1 , 2 0

^Diferencia = ^D iferencia = ^ 2 0 M 0

necesario para un nivel

5%, g l =

12, 5 % y prueba de dos colas = 2 ,1 7 9

t = ( M l ~ M 2) /S Dferenck = (6 ,0 0 ~ 3 , 0 0 ) / U 0 = 3 ,0 0 /1 ,1 0 = 2,73

C onclusin: se rechaza la hiptesis nula; se sostien e la hip tesis de investigacin.

En una prueba t para medias independientes existe una segundo supuesto muy importante, que ya
hemos mencionado: se supone que las dos poblaciones tienen la misma varianza. (Aprovechamos
este supuesto cuando promediamos las estimaciones de cada una de las muestras). Sin embargo,
una vez ms sucede que en la prctica la prueba t da resultados bastante precisos aun cuando exis
ten diferencias considerablemente grandes entre las varianzas poblacionales, particularmente
cuando existe la misma cantidad ~o prcticamente la misma cantidad- de observaciones en las
dos muestras, (Cmo sabemos que la prueba t se aplica adecuadamente a pesar de incumpli
mientos moderados de las presunciones? Vase en el cuadro 10-1 la descripcin de lo que se de
nomina Mtodo de Montecarlo).
Sin embargo, la prueba t puede dar resultados bastante engaosos si a) los valores mustrales
sugieren que las poblaciones son muy diferentes de lo normal, b) las varianzas son muy diferentes
o c) coexisten ambos problemas. En esos casos, existen alternativas al procedimiento ordinario de
prueba t, algunas de las cuales trataremos en el captulo 15.

Tabla 10-4.
Pasos a seguir para la realizacin de una prueba t para medias independientes.
1. Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de las poblaciones.
2. Determinar las caractersticas de la distribucin comparativa.
a) La media ser 0.
b) Calcuiar el desvo estndar.
i) Calcular las varianzas poblacionaies estimadas sobre la base de cada muestra (es decir, calcular dos
estimaciones),
ii) Calcular una estimacin combinada de a varianza poblacionai.

S2

Combinada

__ A

(s i )+ J ! l s >)
brocal

( g t { a N l - 1 and g t 2 = N t ~ U g ^ =

gl} + gty

iii) C alcular la varianza de cada distribucin de medias:

= ^combinada/Wi and S

= ^Combinada /N2

iv) Calcular la varianza d e la distribucin de diferencias de medias:


^Piferfincia =

v) Calcular e l desvo ......


estndar
de la distribucin de diferencias de medias:
Di fewncia

c)

^Difere ncia

D eterm inar la forma; ser una distribucin t con g / Toia( grados de libertad.

3) Determinar el punto de corte en la distribucin comparativa, a partir del cual debera rechazarse la hiptesis nula
a) Determinar los grados de libertad (g/TwaJ), el nivel de significacin deseado, y las colas de la prueba (una o dos).
b) B uscar el punto de corte apropiado en la tabla f. Si no aparece el g l exacto, se utiliza el g l inm ediatam ente
inferior al buscado.
4) D eterm inar el valor m uestral en la distribucin comparativa: t = ( M l - M ,)/S p ift(f neia
5) Comparar io s valores de los pasos 3 y 4 para decidir si se rechaza o no la hip tesis nula.

TAMAO DEL EFECTO Y POTENCIA DE LA PRUEBA


PARA MEDIAS INDEPENDIENTES

Tamao del efecto


El tamao del efecto en la prueba t para medias independientes es la diferencia entre las medias
poblacionaies dividida por el desvo estndar de la poblacin de observaciones individuales. Se
expresa bajo la frmula,
d~

(10-8)
cr
Las reglas de Cohn (1988) de la prueba t para medias independientes son las mismas que en to
das las situaciones que hemos tratado hasta ahora: 0,20 para un tamao del efecto pequeo, 0,50
para un tamao del efecto mediano y 0,80 para una gran tamao del efecto.
Analicemos un ejemplo de clculo de este tipo de tamao del efecto. Supongamos que un
psiclogo especializado en temas ambientales est trabajando en una ciudad con altos niveles
de contaminacin en el aire. El psiclogo planifica un estudio acerca de la cantidad de ejerci
cios resueltos en una prueba de creatividad durante un periodo de una hora. El estudio compara
el desempeo en dos condiciones: en la condicin experimental, cada participante realiza la

prueba en una habitacin con un puricador de aire especial; en la situacin de control, cada par
ticipante realiza la prueba en una habitacin sin el puricador de are, El investigador espera
que el grupo de control obtenga probablemente valores similares a otros que han realizado esta
prueba en el pasado, es decir, con una media de 21, pero que el grupo experimental se desempe
e mejor y que tenga una media aproximadamente de 29. Se sabe por investigaciones anterio
res que la prueba en cuestin tiene un desvo estndar de aproximadamente 10. Por lo tanto.
p,j = 29, p-2 = 21, y o-= 10. Dadas estas cifras, d = ( jjlj ~ jx2)/or = (29 - 21)/10 = 0,80, es decir, una
gran tamao del efecto.
Cuando se utiliza informacin de un estudio ya realizado, el tamao del efecto se estima co
mo la diferencia entre las medias mustrales dividida por la estimacin combinada del desvo es
tndar poblaconal (la raz cuadrada de la estimacin combinada de la varianza poblacional). Se
expresa bajo la frmula,
, .M i-M i
Combinada

(10-9)

Analicemos el estudio de Valenzuela (1997) acerca de la calidad de la asistencia brindada por las
madres a sus hijos. La media muestral de madres de nios adecuadamente alimentados era 33,1;
la media muestral de madres de nios crnicamente desnutridos era 27,0. Calculamos que la esti
macin combinada de la varianza poblacional era 168,77; el desvo estndar era, por lo tanto,
12,99. La diferencia de medias era 6,1 y, al dividirla por 12,99, obtenamos un tamao del efecto
igual a 0,47, es decir, un tamao del efecto mediano. La frmula es la siguiente,
_ 33,1-27,0 . 6,1 _ Q1?
Combinada
12,99
12,99

Potencia
La tabla 10-5 indica la potencia aproximada correspondiente a un nivel de significacin de 0,05,
para tamaos del efecto pequeos, medianos y grandes, y para pruebas de una y dos colas. Anali
cemos nuevamente el ejemplo acerca de la psicologa ambiental, en el que los investigadores e s -.
peraban un gran tamao del efecto (d = 0,80). Supongamos que el investigador planifica realizar
un estudio utilizando un nivel de 0,05, con una prueba de una cola y 10 participantes. Utilizando
la tabla, el estudio tendra una potencia de 0,53, lo que implica que, aun si la hiptesis de investi
gacin es realmente verdadera y tiene un gran tamao del efecto, existe slo un 53% de posibili
dades de que el estudio resulte significativo.
Analicemos otro tipo de ejemplo. Supongamos que hemos ledo un estudio que utiliza una
prueba t para medias independientes, el cual tuvo un resultado no significativo utilizando un nivel
de significacin de 0,05 en una prueba de dos colas con 50 participantes en cada grupo. Debera
mos concluir que, en realidad, no existe ninguna diferencia entre las poblaciones? La conclusin
parece bastante injustificada, ya que la tabla 10-5 indica que el estudio tendra una potencia de s
lo 0,17 para un tamao del efecto pequeo. Lo anterior sugiere que si ese pequeo efecto de he
cho s existe en las poblaciones, el estudio no lo reflejara. Por otro lado, tambin podemos con
cluir que si existe una verdadera diferencia entre las poblaciones, probablemente no es una gran
diferencia, ya que la tabla 10-5 indica una potencia de 0,98 para un gran tamao del efecto, lo que
implica que si existiera un gran efecto, casi con seguridad sera reflejado por el estudio.

,,
'.Cuadro'! 0-1.
Los mtodos de Mostrearlo, >bien, cuando la matemtica
s convierte slo en un experimento y la estadstica
_ depende de un ju g o Je.azar.

El nombre Montecarlo, con el que se deno


minan ciertos mtodos (por la famosa ciu
dad monegasca de veraneo y de juegos de
azar), se adopt hace slo unos pocos aos.
Pero el mtodo en s mismo tiene su origen
algunos siglos atrs, en la poca en la que
los matemticos dejaban sus lpices o tizas
y salan a intentar un experimento real'para
probar la interpretacin particular de un
problema de probabilidad. Por ejemplo, en
1777, Buffon describi en su Essai d Arithmtique morale, un mtodo de clculo de la
razn entre el dimetro de un crculo y su
circunferencia, lanzando una aguja sobre
una superficie plana con lneas paralelas.
Presumiendo que la aguja cayera al azar
en cualquier posicin, uno poda calcular
las posibilidades de que cayera en ciertas
posiciones, como por ejemplo, la posibi
lidad de que tocara las lneas o no y de que
cayera en ciertos ngulos. El trmino M on
tecarlo refleja, sin duda, la antigua inter
pretacin de los matemticos y estadsti
cos en cunto a que muchos de sus proble
mas eran similares a aquellos que involu
craban juegos de azar (recordemos a Pascal
y al problema de los puntos descripto en el
cuadro 5-2).
La utilizacin generalizada de los m
todos de Montecarlo se hizo posible con el
advenimiento de las computadoras, ya que
la esencia de los estudios de Montecarlo
es la interaccin entre el azar y las proba
bilidades, lo que significa someter a prueba
una gran cantidad de posibilidades. De he
cho, la primera aplicacin de los mtodos
de Montecarlo ocurrid en el campo de la
fsica nuclear, dado que el comportamien
to de las partculas, al ser esparcidas por
un rayo de neutrones, es tan complicado y

tan cercano a lo aleatorio que resolver l 7


problema matemticamente partir de.
ecuaciones era prcticamente imposible, y
Sin embargo* simulando artificialmente las ..
condiciones estadsticas de lo. que esen- ;
cialmente eran experimentos fsicos, era y
posible comprender el mundo fsico, o l 7
menos aproximarse a l de manera ms L :
adecuada.
El alumno seguramente recordar el '
movimiento browniano que nos mostraban :
en las clase de qumica o fsica en la escue- .
la secundaria. Su estudio es un buen ejem- :
plb de un problema Montecarlo, Se trata,
en lneas generales, de partculas atmicas, J
esta vez en un fluido, libres para hacer una ,
cantidad casi ilimitada de cosas practica- .y
mente al azar. De hecho, el movimiento :
browniano se ha comparado con la cami- . ;
nata al azar de un borracho: en cualquier
momento, el borracho podra moverse en
cualquier , direccin; Pero el problema se -y:
simplifica limitando al borracho (o a la par- ;y
tcula) a una cuadrcula imaginaria. :
Imaginemos :1a, cuadrcula de las ca- y'ylies de una ciudad; Imaginemos tambin y
que hay una pared alrededor de la ciudad que ;
el borracho no puede cruzar (de la misma y
manera que las partculas deben tener un l - . :
mite y no pueden avanzar eternamente). En .
el lmite (la pared), el borracho: debe pagar
una multa, que tambin vara al azar. El objetivo de este ejemplo es determinar cunto ;
cuesta el azar (todos los movimientos, as
como tambin todas las consecuencias fi
nales.) Por lo tanto, la cantidad de posibles
recorridos es enorme.
El ejemplo de la caminata al azar nos
lleva a la caracterstica principal de los'm
todos Montecarlo: requieren la utilizacin .

las computadoras tienen lmites, los estu 1de nmeros aleatorios. Podemos'encontrar
una explicacin acerca de estos nmeros
dios Montecarlo son probados slo en una V
serie representativa de esas variaciones. Otro |
ms adelante en el cuadro 154.
Volvamos ahora a lo que nos interesa,
inconveniente ms especfico es que exis- i
es decir, la utilizacin de ios estudios Monten buenas razones para pensar que algunas |
tecario para probar cul ser el resultado de
de las variaciones que no se analizan son
los incumplimientos de ciertos supuestos
mucho ms semejantes a la vida real que ;
en las pruebas estadsticas. Por ejemplo, la
aquellas que se han estudiado (vase en el
computadora puede crear dos poblaciones
captulo 5 la controversia acerca d cun
con medias idnticas, mientras que los otros
comn es realmente la curva normal). Fi
parmetros son establecidos por el investi
nalmente, cuando intentamos decidir la uti
gador estadstico de maneta que violen al
lizacin de un clculo o prueba estadstica .
gn supuesto importante. Las pobla- ciones
en particular, en cualquier situacin: espec
podran ser asimtricas hacia cierto lado, o
fica, n tenemos idea de la poblacin de la .
bien, las dos poblaciones podran tener vacual proviene la muestra: E una pobla- :
rianzas diferentes.
cin semejante a alguna de aquellas sobre \ :
Despus se toman muestras aleatorias
las cuales se ha realizado un estudio Monde cada una de estas dos extraas poblacio
tecaro o no? Saber simplemente que los es
nes (recordemos, fueron inventadas por
tudios Montecarlo han demostrado que aluna computadora), se comparan las medias
gunos clculos y pruebas; estadsticas son
mustrales utilizando el procedimiento usual
robustos a pesar de incumplimientos a dis
de prueba t, con las usuales tablas i, con to
tintos tipos de supuestos, no prueba que lo :
dos los supuestos. Se selecciona una gran
sean en cualquier situacin determinada. S-: .
cantidad de tales pares de muestras, gene
lo nos da cierta esperanza en cuanto a que
ralmente alrededor de 1.000, y se calcula : ekistn ms posibilidades de que utilizar
una prueba t para cada par. La cuestin es:
: :ese clculo o. prueba estadstica sea seguro
Cuntas de esas 1.000 pruebas f sern sig-.
y justificable.
nificativas al nivel de significacin del 5%?
En todo caso, los estudios Montecarlo
Lo ideal sera que el resultado sea aproxi; son un ejemplo' perfecto del modo en que
madamente d15%, 50 de las 1.000. Pero
las computadoras han cambiado la ciencia.
qu sucedera si el 10% (100) de esas
Shzeidr (1966) lo expres de la siguiente .
pruebas, supuestamente a nivel 5%, resul
manera:
tara significativo? Qu sucedera si fuera
L as com pu tadoras han produ cid o u n a ' v
slo el 1%? Si se dieran este tipo de resul
;
' rev o lu ci n n ica en, la ;m a te m tic a .1 ;
tados, entonces ese incumplimiento en par
M ientras q u e anteriorm ente una in ves- ; :
ticular de. presunciones en la prueba t no
: tig a c i n d e un p r o c eso aleatorio se
podra ser tolerado. Pero de hecho, la ma
c o n sid e ra b a : c o m p le ta tan pronto c o
yora de los incumplimientos (excepto los
m o fu era red ucida a una d e scr ip c i n
muy extremos), controlados con el mtodo. ;
: ' analtica, actu alm en te, en. m u ch os c a
descripto, no crean grandes cambios enlos
s o s e s c o n v e n ie n te rsoiver u n proble- ::
vlores p .
m a a n a ltico red u cin d o lo ai p roceso
Los mtodos Montecarlo son todo un
aleatorio corresp on d ien te y lu e g o si.
suceso para la estadstica, pero como todo,
m u lan d o e s e p ro ceso (p. v ii).
.
tambin tienen sus desventajas, y por lo tanto
En otras palabras, en lugar de que la mate
sus crticos. Uno de los inconvenientes es
mtica nos ayude a analizar experimentos, :que el modo en que las poblaciones pueden
son los experimentos los que pos estn ayu
violar las presunciones es casi ilimitado en
dando a analizar la matemtica. .
cuanto a sus variaciones, y dado que incluso

Tabla 10-5.
Potencia aproximada de estudios en los que se utiliza la prueba t para medias independientes, pro
bando la hiptesis a un nivel de significacin de 0,05.
Cantidad de participantes en cada grupo

Prueba de una cola


10
20
30
40
50
100
Prueba d e dos colas
10
20
30
40
50
100

Tamao del efecto


Pequeo
(0,20)

M ediano
(0,50)

Grande
(0,80)

0,11
0,15
0,19
0,22
0,26
0,41

0,29
0,46
0,61
0,72
0,80
0,97

0,53
0,80
0,92
0,97
0,99
*

0,07
0,09
0,12
0,14
0,17
0,29

0,18
0,33
0,47
0,60
0,70
0,94

0 ,3 9
0,69
0,86
0,94
0,98
*

Casi 1.
Nota: basado en Cohen (1988), pp. 28 -3 9 .

La potencia cuando los tamaos de las muestras no son iguales


La potencia es mayor cuando los participantes de un estudio se dividen en dos grupos iguales. Por
ejemplo, un experimento con 10 personas en el grupo de control y 30 en el grupo experimental es
mucho menos potente que uno con 20 personas en cada grupo.
Existe un problema prctico al calcular la potencia a partir de las tablas cuando los tamaos
de muestra no son los mismos. Como en la mayora de las tablas de potencia, la tabla 10-5 supone
cantidades iguales en cada uno de los dos grupos. Qu debemos hacer cuando las dos muestras
tienen distinta cantidad de participantes? En lo que a la potencia respecta, ocurre que la media
armnica de los dos tamaos desiguales de muestra nos indica el tamao de muestra equivalente
que tendramos con dos muestras iguales. El tamao de muestra que proviene de la media arm
nica se representa bajo la siguiente frmula:
Media armnica . =

(10-10)
N1+ N2

Analicemos un ejemplo extremo en el que hay personas en un grupo y 34 personas en el otro. La


media armnica es aproximadamente 10:
Media armnica - C M X W )
N{ + N 2

0(6X34)
6 + 34

408
40

Por lo tanto, aunque tenemos un total de 40 participantes, el estudio tiene la potencia de un estu
dio con muestras ijguales, de un tamao de slo 10 personas en cada grupo. (Es decir, un estudio
con un total de 20 participantes habra tenido exactamente la misma potencia). Supongamos que
el investigador est utilizando el nivel 0,05, una prueba de dos colas, y espera un gran tamao del

Tabla 10-6.
Cantidad aproximada de participantes necesarios en cada grupo (suponiendo que las muestras son
de igual tamao) para obtener una potencia dei 80% en una prueba t para medias independientes,
probando la hiptesis a un nivel de significacin de 0,05.
Tamao del efecto

U na coa
D o s colas

Pequeo
(o a o )

M e d ia n o
(0,50)

G ran de
(0,80)

310
393

50
64

20
26

efecto. La tabla 10-5 indica que el estudio tendra una potencia de aproximadamente 0,39 (el n
mero correspondiente a 10 participantes en cada grupo). Sin embargo, supongamos que el inves
tigador hubiera podido organizar el estudio dividiendo los 40 participantes en dos grupos de 20,
En ese caso, el estudio habra tenido una potencia de 0,69.

Planificacin del tamao de la muestra


La tabla 10-6 indica la cantidad aproximada de participantes necesarios para obtener una potencia
del 80% para tamaos del efecto estimados pequeos, medianos o grandes, utilizando pruebas de
una o dos colas, con un nivel de significacin de 0,05 en iodos los casos.*2 Supongamos que se pla
nifica un estudio en el que se espera un tamao del efecto mediano, y en el que se utilizar el nivel
de significacin de 0,05, con una prueba de una cola. Basndonos en la tabla 10-6, necesitaramos
50 personas en cada grupo (100 en total) para tener una potencia del 80%. Si realizramos un es
tudio con el mismo nivel de significacin, pero en el que pudiramos esperar un mayor tamao
del efecto, necesitaramos slo 20 personas en cada grupo (40 en total).

CONTROVERSIAS Y LIMITACIONES
Una vieja controversia se refiere a lo que usualmente llamamos el problema del exceso de prue
bas f \ Las cuestiones bsicas se presentan en todo tipo de prueba de hiptesis, no slo en la
prueba f. Sin embargo, analizamos el problema ahora porque tradicionalmente se ha tratado en
este contexto.
Supongamos que se realizan una gran cantidad de pruebas t como parte del mismo estudio.
Por ejemplo, podemos estar comparando dos grupos con cada una de. 17 medidas diferentes, co
mo pueden ser diferentes indicadores de memoria en una tarea en la que se emplea la capacidad
de recordar varias sub-escalas de pruebas de inteligencia o diferentes aspectos de interacciones
observados entre nios. Cuando se han realizado varias pruebas t en el mismo estudio, la posibili
dad de que cualquiera de ellas resulte significativa a un nivel, digamos, del 5%, es realmente ma
yor al 5%. S se realizan 100 comparaciones independientes, a un nivel del 5%, en promedio 5 de

2 Cohn (1988, pp. 54-55) proporciona otras tablas que indican las cantidades necesarias de participantes para otros ni
veles de potencia adems dei 80%, para tamaos del efecto distintos de 0 ,2 0 ,0 ,5 0 y 0,80, y para otros niveles de signi
ficacin. Si es suficiente saber cul es la cantidad aproximada, Dunlap y Myers (1997) han desairoitado una forma ms
corta de encontrar la cantidad aproximada de participantes necesarios para estudios que utilizan a prueba t para medias
independientes. Para un 50% de potencia, la cantidad de participantes necesarios por grupo es aproximadamente
8/d2 + I. Para un 80%-90% de potencia, 16/d2 + 2.

ellas sern significativas slo por azar. Es decir, aproximadamente 5 sern significativas aun si no
existiera ninguna diferencia real entre las poblaciones que las pruebas t estn comparando.
La cuestin fundamental no es controvertida. Todo el mundo est de acuerdo con que existen
inconvenientes en un estudio que incluye una gran cantidad de comparaciones. Todo el mundo es
t de acuerdo que en un estudio de ese tipo, si slo unos pocos resultados son significativos, las
diferencias reflejadas deberan ser revisadas muy cuidadosamente. La :ontroversa surge en
cuanto a cun cuidadoso se debe ser y en cuanto a qu cantidad implica slo unos pocos. Una
de las razones que da lugar a la controversia es que, en la mayora de los casos, las muchas com
paraciones que se realizan no son independientes, y la posibilidad de que una resulte significativa
est relacionada con la posibilidad de que otra resulte significativa.
Veamos el siguiente ejemplo. Un estudio compara una muestra de abogados con una muestra
de doctores con respecto a 100 rasgos de personalidad. Supongamos ahora que el investigador
simplemente realiza 100 pruebas t. Si las 100 pruebas t fueran realmente independientes, espera
ramos que, en promedio, 5 resultaran significativas slo por azar. De hecho, existen tablas para
calcular con bastante precisin las chances de que cualquier cantidad determinada de pruebas t
resulte significativa. De todos modos, el problema es que, en la prctica, estas 100 pruebas no
son independientes. Muchos de los distintos rasgos de personalidad probablemente estn correla
cionados, como es el caso de las escalas que miden el dogmatismo y la confianza en s mismos. Si
los doctores y los abogados difieren en cuanto a dogmatismo, probablemente tambin tendrn di
ferencias en cuanto a confianza en s mismos. Por lo tanto, ciertas seres de comparaciones pue
den tener ms o menos probabilidades de resultar significativas por azar, de tal forma que 5 en
100 puede no ser un indicador preciso de cuntos resultados significativos esperar por azar.
Existe adems otra complicacin: en la mayora de los casos, las diferencias en algunas de las
variables son ms importantes que en otras. Algunas comparaciones pueden probar directamente
una teora o la efectividad de algn procedimiento prctico, y otras pueden ser ms explorato
rias. Esta complicacin, junto con el problema de la falta de independencia, ha llevado a una va
riedad de soluciones conflictivas. En el captulo 12 presentaremos algunas de esas soluciones
cuando analicemos una situacin relacionada con este tema, situacin que surge en estudios que
comparan ms de dos grupos.

LA PRUEBA t PARA MEDIAS INDEPENDIENTES


SEGN SE DESCRIBE EN PUBLICACIONES CIENTFICAS
Generalmente, una prueba t para medias independientes se describe en ls investigaciones cient
ficas por medio de las medias de las dos muestras (y a veces tambin de los desvos estndar),
adems de la forma estndar de proporcionar los nmeros t. Por ejemplo, (38) = 4,72, p < 0,01
Los resultados del ejemplo de Norman y Aron (1997) podran ser redactados de la siguien
te manera: En cuanto a los tems del control de la manipulacin, las puntuaciones fueron ms
altas en el caso de las parejas que formaban el grupo que realiz actividades excitantes
(M = 8,63) que en el caso de las parejas del grupo de control (M = 6,40); (26) = 4,88, p < 0,01,
prueba de una cola.
Con frecuencia, los resultados de pruebas t para medias independientes se presentan en ta
blas. La tabla 10-7, indica los resultados de una cantidad de pruebas para medias independientes
pertenecientes al estudio de Valenzuela (1997) acerca de nios pobres desnutridos o no. La cuarta
lnea a partir de abajo indica los resultados de la parte del estudio que hemos utilizado como
ej emplo en es te captulo.

Tabla 10-7.
Comparacin de grupos adecuadamente alimentados y crnicamente desnutridos segn medidas
demogrficas y de relacin entre madre e hijo.*
Grupo
adecuadamente
alimentado
M edida

Materna y familiar

(n =43)
M
SD

45,30
Ingresos totales
5,7
Tamao familiar
Cantidad de hermanos
2,6
31,4
Edad del padre
7,2
Educacin del padre
Edad de la madre
28,6
7,0
Educacin de la madre
59,2
Peso de la madre (kg.)
153,6
Estatura de la madre (cm.)
Sensibilidad materna
5,63
Cuestionario sobre salud
10,8
(registro total)
Escala de adaptacin marital
84,7
(registro total)
Nio
18,5
Edad (meses)
103,72
Peso
98,3
Estatura
Funcionamiento madre-hijo
Sensibilidad materna
7,7
3,4
Control materno
2,8
Insensibilidad materna
7,9
Cooperacin del nio
1,2
Sumisin compulsiva del nio
Dificultad del nio
2,5
2,2
Pasividad del nio
Resolucin de problemas
37,9
Apoyo materno
Calidad de asistencia materna
33,1
Competencia social del nio
19,9
Demostracin de poder del nio 15,6
7,4
Sentimientos negativos del nio

Grupo
crnicamente
desnutrido
( = 42)

SD

valor /

9,0
2,2
0,8
5,6
2,8
4,7
2,6
10,0
5,6
2,4

44,7
5,2
2,8
29,6
6,8
27,6
6,1
53,3
150,5
2,1

10,0
1,4
0,8
6,9
2,9
5,7
2,9
10,0
6,4
1,5

0,30
1,18
0,85
1,29
0,64
0,84
1,39
2,5
2,31
8,14

0,77
0,24
0,39
0,20
0,52
0,40
0,17
0,01
0,02
0,0001

3,9

10,7

5,3

0,08

0,93

26,6

73,8

32,9

1,59

0,11

1,4
7,3
2,8

18,4
81,6
92,9

1,5
3,9
3,3

0,33
17,40
7,93

3,8
4,1
2,9
4,5
3,2
2,8
2,7

7,3
4,2
2,4
6,8
2,1
3,5
2,4

3,6
3,7
3,1
4,1
3,8
3,4
2,6

0,58
0,98
0,67
0,12
0,12
0,39
0,36

0,59
0,36
0,53
0,24
0,26
0,71
0,72

10,6
14,2
4,1
5,3
4,2

30,54
27,0
15,7
12,5
9,4

7,9
11,6
3,8
4,5
4,8

3,62
2,16
4,78
2,85
2,00

0,001
0,03
0,0001
0,006
0,050

0,74
0,0001
0,0001

*Las medidas de peso y estatura de los nios estn indicadas en forma de porcentajes del peso y medidas segn la edad,
conforme a las normas del Centro Nacional de Estadsticas Sanitarias.
Fuente: Valenzuela, M. (1997), tab. 1. Sensibilidad materna en una sociedad en desarrollo: el contexto de la pobreza
urbana y la desnutricin infantil crnica". Psicologa de Desarrollo (Developmental PsychologyJr 33, 845-5)55.
Copyright, 1997, por la Asociacin Americana de Psicologa [American Psychological Association], Reimpreso con
autorizacin.

La tabla 10-8 es otro ejemplo, tomado de un estudio realizado por Frisch, Shamsuddn y Kurtz
(1995), en el que 293 mujeres estudiantes de medicina en Malasia fueron entrevistadas acerca de
sus opiniones en cuanto a fumar, y en cuanto a si fumaban o no los miembros de sus familias y sus
amigos. La tabla compara aquellas estudiantes que tienen hermanos fumadores con aqullas cu
yos hermanos no fuman. (La publicacin no explica cmo se resolva el problema de que la per-

sona tuviera dos hermanos, uno fumador y otro no fumador), Las medidas fueron: conocimiento
(de los riesgos para la salud ocasionados por estar rodeado de fumadores), actitud (hacia estar ro
deado de fumadores), esfuerzos (para evitar estar rodeado de fumadores) y responsabilidad como
mdico (de informar a los pacientes sobre los riesgos para la salud ocasionados por estar rodeado
de fumadores). En todas las escalas, el puntaje estaba establecido de tal forma que el ms alto es
tuviera a favor de fumar. Los valores ms bajos significaban mayor preocupacin acerca de los
riesgos para la salud.
La primera lnea de la tabla indica que aquellas que tenan un hemano fumador presentaban
valores ms altos en la escala de conocimiento, lo que significa que esas estudiantes tenan menos
conocimiento acerca de los riesgos de estar con fumadores. La segunda lnea indica que aquellas
que tenan un hermano fumador tenan una actitud ms positiva hacia estar con fumadores (es de
cir, no consideraban que era una causa de riesgo para la salud).
Es importante notar que algunos de estos resultados no fueron significativos. Cul debera
ser la conclusin? Analicemos lo que piensan las estudiantes acerca de la responsabilidad como
mdico. En esta comparacin, haba 41 estudiantes con hermanos fumadores y 73 con hermanos
no fumadores. Aplicando la frmula de la meda armnica observamos que, en lo que respecta al
clculo de la potencia, hay 52,5 participantes por grupo. Es decir,
M ed ia a rm n ica =

(2)(jV iX M >) _ (2 X 4 1 X 7 3 ) _ 5 .9 8 6
41+73

N{ + N2

52,5

114

Una vez que sabemos qu tamao de muestra utilizar, podemos buscar la potencia en la tabla 10-5
buscando la hilera de 50 participantes (el nmero ms cercano a 52,5 en la tabla) para una prueba
Tabla 10-8.
Prueba t para medias, acerca del conocim iento, las actitudes y el esfuerzo relacionados con el hecho
de ser fum ador pasivo, segn la condicin de fum ador y con respecto al grupo total y a hombres y
mujeres separadam ente.
Herm ano
fum ador
G rupo total

H erm ano
no fum ador

Valor t

Sig.

N*

Actitud
Esfuerzos
Resp. M dico*

2,03 (96)
1,95 (94)
2,36 (92)
1,78(95)

1,88(140)
1,70(137)
2,23(133)
1,61 (142)

2,61
3,29
1,88
2,02

0,01
0,001
0,061
0,04

H om bres
Conocimiento
Actitud
Esfuerzos
Resp. Mdico*

2,15(54)
2,08(54)
2,50(52)
1,81 (54)

1,92(69)
1,83 (67)
2 3 1 (66)
1,65 (69)

2,97
2,12
1,87
1,27

0,004
0,036
0,064
0,207

M ujeres
Conocimiento
Actitud
Esfuerzos
Resp. Mdico*

1,87 (42)
1,77 (40)
2,17(40)
1,76(41)

1,85(71)
1,57(70)
2,15(67)
1,58(73)

0,30
2,43
0,26
1,51

0,767
0,0 i 8
0,797
0,136

Conocimiento

'
Responsabilidad com o mdicos
Fuente: Frisch, Shamsuddn Se Kurtz (1995),

de dos colas. Descubrimos que la potencia del estudio, para resultar significativa con un pequeo
tamao del efecto, es slo de 0,17. Por otro lado, la potencia del estudio en el caso de un tamao
del efecto mediano es 0,70, y en el de un tamao del efecto grande es 0,98. As, si en realidad te
ner un hermano fumador produce un pequeo efecto, dicho efecto probablemente no habra sido
reflejado por el estudio. Por otro lado, supongamos que en realidad haba un efecto mediano de
ese tipo; en ese caso, el resultado del estudio probablemente habra sido significativo; y si el efec
to fuera grande, casi con seguridad el estudio habra resultado significativo. Por l tanto, con bas
tante confianza podemos inferir de este estudio que el hecho de tener un hermano fumador proba
blemente no produce una gran diferencia en las opiniones de las mujeres estudiantes de medicina
de Malasia, en cuanto a la responsabilidad del mdico de informar a sus pacientes acerca de los
riesgos de estar con fumadores. Pero no podemos concluir que no podra haber un pequeo efec
to en ese sentido.

RESUMEN
Una prueba t para medias independientes se utiliza para realizar pruebas de hiptesis con dos
muestras de observaciones. La diferencia principal con una prueba para una sola muestra, o una
prueba t para medias dependientes, es que la distribucin comparativa es una distribucin de dife
rencias entre medas mustrales. Esta distribucin puede considerarse construida en dos pasos:
cada poblacin de individuos produce una distribucin de medias y luego se crea una nueva dis
tribucin de diferencias entre pares de medias tomadas de esas dos distribuciones de medias.
La distribucin de diferencias de medias tiene una media de 0, y es una distribucin t con el
total de los grados de libertad de las dos muestras. El desvo estndar se calcula en varios pasos:
a) se utiliza cada muestra para estimar la varianza poblacional; b) se supone que ambas poblacio
nes tienen la misma varianza, y se realiza una estimacin combinada sacando un promedio pon
derado de las dos estimaciones (multiplicando cada estimacin por la proporcin con que contri
buye su muestra a los grados totales de libertad y sumando los resultados); c) se divide la
estimacin combinada por la cantidad de observaciones de cada muestra para obtener la varianza
de la distribucin de medias de cada poblacin; d) se suman esas dos varianzas para obtener la va
rianza de la distribucin de diferencias de medias, y e) se calcula la raz cuadrada.
Los supuestos en la prueba t para medias independientes son las siguientes: las dos poblacio
nes estn normalmente distribuidas y tienen la misma varianza. Sin embargo, .la prueba t otorga
resultados bastante precisos aun cuando la situacin real sea moderadamente diferente de lo que
indican los supuestos.
El tamao del efecto de una prueba t para medias independientes es la diferencia entre las
medias dividida por el desvo estndar. La potencia es mayor cuando los tamaos de las muestras
de los dos grupos son iguales. Cuando no lo son, se utiliza la media armnica de los dos tamaos
mustrales para buscar la potencia en las tablas.
Cuando se realizan demasiadas pruebas de significacin en el mismo estudio, como en el ca
so de una serie de pruebas t que comparan dos grupos con respecto a varias medidas, la posibili
dad de que cualquiera de las comparaciones resulte significativa por azar al nivel del 0,05 es ma
yor a 0,05. La forma de adaptacin de los clculos para resolver este problema es controvertida,
aunque la mayora est de acuerdo con que en una situacin de ese tipo los resultados deberan ser
interpretados con mucho cuidado.
Cuando las publicaciones cientficas informan acerca de pruebas t para medias independien
tes, el investigador usualmente incluye los grados de libertad, el punto t y el nivel de significa
cin. Tambin pueden informarse los resultados de estas pruebas a travs de una tabla.

Trminos clave
- Distribucin d diferencias
- Desvo estndar de la
de medias.
distribucin de diferencias
- Media armnica.
demedias (Difercncia).
~ Estimacin combinada de la varianza - Prueba t para medias
poblaconai 0$^ombinala).
independientes.

Ejercicios
Los ejercicios implican la realizacin de clcu
los (con la ayuda de una calculadora). La ma
yora de los problemas estadsticos reales se
resuelven por computadora, pero aunque exis
ta la posibilidad de utilizarla, es conveniente
realizar estos ejercicios manualmente para in
corporar el mtodo de trabajo.
Para adquirir prctica en.la utilizacin de
una computadora, para resolver problemas
estadsticos, se puede utilizar la seccin de
computacin de cada captulo, publicada en
la Gua de estudio y libro de tareas de compu
tacin para el alumno [Studems Study Guide
and Computer Workbook] que acompaa es
te libro.
Todos los datos de esta seccin son ficti
cios (a menos que se especifique lo contrario)
Las respuestas a los ejercicios de a serie I
se encuentran al final del libro.

-Varianza de la
distribucin de
diferencias entre
medias (5^iferencii).
- Promedio ponderado.

Grupo experimental
i)
ii) iii)

30
20
30

12,0
12,0
12,0

S2
2,4
2,4
2,2

Grupo de control

30
40
30

11,1
113
1U

S2
2,8
2,8
3,0

3. Un psiclogo social que estudia la co


municacin masiva divide al azar a 82 volunta
rios en dos grupos experimentales. A 61 se los
instruy para que se informaran durante un
mes slo a travs de la televisin, y a 21 para
que se informaran durante un mes slo a travs
de la radio. (Es un misterio por qu el investi
gador no asign iguales cantidades de volunta
rios a las dos condiciones!). Finalizado el mes,
todos los participantes fueron puestos a prueba
con respecto a su conocimiento acerca de va
rias cuestiones polticas. El investigador no te
na ninguna prediccin sobre cul era la fuente
de informacin que hara que las personas es
tuvieran mejor informadas, es decir, el investi
gador slo predijo que habra algn tipo de di
ferencia. Los resultados del estudio fueron los
SERIE i
siguientes: ei grupo que se inform por TV: M
1. a) Explique en qu casos utilizara una ~ 2 4 ,$ 2~ 4; el grupo que se inform por radio:
prueba t para medias dependientes y cundo M - 26, S2 = 6. Utilizando el nivel 0,01, cul
una prueba t para medias independientes.
debera ser la conclusin del psiclogo social?
b) Invente un ejemplo sobre cada tipo de estu a) Realic los cinco pasos de la prueba de hip
dio que no est en el libro ni se haya dado en tesis. b) Calcule el tamao del efecto, c) Ilustre
clase.
su respuesta con un diagrama similar al de las
2. Para cada uno de los siguientes experi figuras 10-2 a 10-4. d) Explique sus respuestas
mentos, a) decda s la diferencia entre las con a alguien que nunca ha tomado un curso de es
diciones es estadsticamente significativa a ni tadstica,
vel 0,05 (con prueba de dos colas), b)
4. Un psiclogo especializado en educa
determine el tamao del efecto y c) la potencia cin estaba interesado en saber si la utilizacin
del nombre del alumno en un cuento afectaba
aproximada (segnla tabla 10-5).

la concentracin del nio mientras lea. Se asig


naron seis nios al azar para leer un cuento en
condiciones normales (utilizando nombres co
mo Dick y Jane). Otros cinco nios leyeron
versiones del mismo cuento, pero con el nom
bre de cada uno de ellos en lugar del de uno de
los personajes de la historia. El investigador
midi cuidadosamente cunto tardaba cada ni
o en leer el cuento. Los resultados aparecen
ms adelante. Utilizando el nivel 0,05, dira
que incluir el nombre del nio produce alguna
diferencia? a) Realice los cinco pasos de la
prueba de hiptesis, b) Calcule el tamao del
efecto y la potencia, c) Ilustre su respuesta con
un diagrama similar al de las figuras 10-2 a 1~
4. d) Explique su respuesta a alguien que com
prende la prueba f para medas dependientes
pero no conoce nada acerca de la prueba f para
medias independientes.*lo
C

Cuento normal

Cuento con ei nombre del nio

Alumno

Tiempo
de lectura

Alumno

A
B
C
D

2
5
7
9
6
7

H
I

Tiempo
de lectura
4
16
11
9
8

Explique el significado de estos resultados


a una persona que nunca ha tomado un curso
de estadstica. (Aseglrese de incluir el tema
del tamao del efecto y la potencia. Al calcular
la potencia, puede suponer que los dos grupos
de cada comparacin tenan aproximadamente
el mismo tamao de muestra).
6.
Cul es la cantidad aproximada de par
ticipantes necesarios para tener una potencia
del 80% en cada uno de los siguientes estudios
planificados, suponiendo que existe la misma
cantidad de participantes en los dos grupos y
utilizando en todos el nivel de significacin de
0,05? (Asegrese de calcular la cantidad total
de participantes necesarios, no slo la cantidad
necesaria para cada grupo).
. Esperado

Esperado

Estudio
a
b
c
d

107
22.5
14
480

cr
84
31,5
2,5
50

149
16,2
12
520

Colas
1
2
1
2

SERIE H

1. Explique con sus propias palabras cmo


determinara la varianza de la distribucin de
diferencias de medias (ilustre su respuesta con
5.
Van Aken y Asendorpf (1997) realizaron
$ u n estudio a 139 nios alemanes de 12 aos de un diagrama que represente grficamente todas
edad. Todos los nios completaron un cuestio las distribuciones involucradas).
2. Para cada uno de los siguientes experi
nario general sobre autovaloracin y fueron
entrevistados con respecto al apoyo que reci mentos, a) decida si la diferencia entre las dis
ban de sus madres, padres y compaeros de tintas condiciones es estadsticamente signifi
clase. Luego, los investigadores compararon, el cativa al nivel 0,05 (prueba de dos colas) y b)
nivel de autovaloracin entre aquellos con al determine el tamao del efecto (d) y la poten
tos y bajos niveles de apoyo para cada tipo de cia aproximada (a partir de los datos de la ta
apoyo recibido. Los investigadores informaron bla 10-5).
lo siguiente:
Grupo experim ental
G rupo de control
E

S e descubri una menor autovaloracin


general en los nios con madres que les
brindaban un bajo n ivel de apoyo ((1 3 7 )
= 4 ,5 2 , p < 0 ,001, d - 0,78) y co a padres
que les brindaban un bajo nivel d e ap oyo
( / ( l 3 7 ) = 4 ,0 3 , p < 0,001, d = 0,6 9 ) [...]
Tambin se descubri una autovaloracin
m enor en nios que slo teman com pae
ros que le brindaban un bajo nivel de apo
y o (t(137) = 2 ,04, p < 0,05, d * 0,35).

i)
ii)
iii)

10
40
10

604
604
604

S2 N
60
60
20

10
40
40

M
607
607
607

S2
50
50
16

3.
Un psiclogo desarrolla la teora de que
las personas pueden escuchar mejor despus de
comer una comida abundante. Se dividieron al

la prueba impresa en papel amarillo fueron 17,


19,28,21 y 18. Las puntuaciones de los cuatro
participantes que completaron la prueba en pa
pel verde fueron 20,26,17 y 24. Utilizando el
nivel 0,05, una cola (prediciendo menores pun
tuaciones de angustia con el papel amarillo),
cul debera ser la conclusin del investiga
dor? a) Realice los cinco pasos de la prueba
de hiptesis, b) Calcule el tamao del efecto y
la potencia, c) Ilustre su respuesta con un dia
grama semejante al de las figuras 10-2 a 10-4,
d) Explique sus respuestas a alguien que com
prende la prueba t para medias dependientes
pero que no conoce nada sobre la prueba t para
medias independientes.
Grupo comida abundante Grupo comida frugal
6.
Escudero, Rogers y Gutirrez (1997) fil
Sujeto Capacidad
Sujeto Capacidad
maron
en
vdeo
a 30 parejas que discutan un
auditiva
auditiva
problema marital en su laboratorio. Las cintas
A
22
D
19
de video fueron luego evaluadas sistemtica
B
25
E
23
25
C
F
21
mente segn varios aspectos relacionados con
la comunicacin entre la pareja, tales como do
4. Veinte estudiantes asignados al azar a un
minacin y calidad positiva o negativa del sen
grupo experimental reciben un programa de
timiento (emocin) expresado entre ellos. Uno
instruccin; 30 participantes de un grupo
de los principales intereses del estudio era com
de control no lo reciben. Despus de 6 meses,
se prueba a ambos grupos en cuanto a sus co parar parejas que estaban teniendo problemas
nocimientos. El grupo experimental tiene una de relacin con aquellas que no los tenan. Las
media de 38 en la prueba (con un desvo estn 18 parejas del grupo que tena problemas fue
dar poblacional estimado de 3); l grupo de con ron reclutadas de entre aquellos que haban re
trol tiene una media de 35 (con un desvo es currido por ayuda a una clnica marital; se los
tndar poblacional estimado en 5). Utilizando e.l llamaba el grupo clnico. El grupo que no te
nivel 0,05, cul debera ser la conclusin del ex na problemas fue reclutado a travs de anun
perimentador? a) Realice los cinco pasos de la cios, y se los denominaba el grupo no clnico.
prueba de hiptesis, b) Calcule el tamao del (Los dos grupos, de hecho, tuvieron valores
efecto y la potencia, c) Ilustre su respuesta con drsticamente diferentes en una prueba estn
un diagrama similar al de las figuras 10-2 a 10-4. dar de satisfaccin marital). La tabla 10-9 pre
d) Explique sus respuestas a alguien que com senta algunos de los resultados. (Se pueden ig
prende la prueba t para medias dependientes pe norar las flechas y signos ms y menos que
ro no conoce nada sobre la prueba t para medias estn relacionados con la manera en que ellos
clasificaron la interaccin. Adems, ignore la
independientes.
5. En un estudio acerca del efecto de los nota al pie sobre transformacin arco-seno;
colores para calmar la angustia, se compararon explicaremos este concepto en el captulo 15).
las puntuaciones en una prueba de angustia de Concentrndose en la dominacin y en la su
participantes que completaron la prueba .im misin, explique qu significan estos resulta
presa en papel amarillo tenue, con las puntua dos a una persona que nunca ha asistido a un
ciones de participantes que completaron la curso sobre estadstica. (Asegrese de tratar el
prueba en papel verde chilln. Las puntuacio tema del tamao del efecto y la potencia. Al
nes de los cinco participantes que completaron calcular la potencia, puede suponer que los dos
azar 6 individuos para comer una comida abun
dante o una comida frugal. Despus de comer,
se prob el sentido auditivo de los participan
tes. Los valores observados de capacidad audi
tiva (los nmeros ms altos indican mayor ca
pacidad) aparecen ms adelante. Utilizando el
nivel 0,05, dira que los resultados sostienen
la teora dei psiclogo? a) Realice los cinco
pasos de la prueba de hiptesis, b) Calcule el
tamao del efecto y la potencia, c) Ilustre su
respuesta con un diagrama semejante al de las
figuras 10-2 a 10-4. d) Explique sus respues
tas a alguien que nunca ha asistido a un curso
de estadstica.

Tabla 10-9.
Diferencias de razones bsicas para parejas clnicas y no clnicas acerca del control en la relacin y
el sentim iento no verbal expresado en proporciones ( S D en parntesis).
Situacin de pareja

Media clnica

Diferencias
ntergrupales

Media no-clnica

Dominacin (? )
Nivelacin (>)
Sumisin ( i )
Cdigos dobles

0,452 (107)
0,305(0,061)
0,183 (0,097)
0,050(0,028)

0,307 (0,152)
0,438 (0,065)
0,226(0,111)
0,024(0,017)

3,06*
5,77**
1,12
2,92*

Sentimiento positivo (+)


Sentimiento negativo (-)
Sentimiento neutro (0)
Cdigos dobles (+ /-)

0,127 (0,090)
0,509(0,192)
0,344 (0,110*)
0,019(0,028)

0,280(0,173)
0,127 (0,133)
0,582(0,089)
0,008 (0,017)

3,22*
5,38**
6,44**
2,96*

Nota: las proporciones de cada cdigo de control y de cada sentimiento fueron convertidas utilizando la transformacin
arco-seno para utilizaras en comparaciones ntergrupales *p <0,01; **p <0,001; (gl = 28).
Fuente: Escudero, V., Rogers, L. R &Gutirrez, E, (1997), tab. 3. Patrones de control en la relacin y de sentimiento
no verbal en parejas clnicas y no clnicas". Revista Cientfica de Relaciones Sociales y Personales {Journal of Social
andPersonal Relationships}, 14,5-29. Copyright 1997 por Sage Publications, nc. Reimpreso con autorizacin de
Sage Publications.

grupos de cada comparacin tenan aproxima 16 nombres masculinos. (Tendr que excluir
damente el mismo tamao muestra!).
aquellos nombres cuyo gnero no est seguro).
7.
Quines tienen primeros nombres msCalcule una prueba t para medias independien
largos, los hombres o las mujeres? Tome un tes utilizando esas dos muestras. (Asegrese de
directorio telefnico y utilice los nmeros alea destacar a qu ciudad pertenece el directorio te
torios que le proporcionamos a continuacin lefnico que utiliz).
para seleccionar una pgina. En la primera p
1 2 ,7 9 , 1 0 , 9 7 , 5 3 , 7 4 , 1 5 , 5 5 ,4 1 , 1 2 8 ,5 7 , 9 3 ,
gina (pgina 12), busque el primer nombre clara
9 4 ,3 1 ,6 8 ,5 1 6 ,6 0 ,5 6 ,7 ,9 3 ,4 3 ,9 1 ,5 7 ,5 8 ,3 8 ,
mente femenino y anote la cantidad de letras de
120, 14, 38, 57, 743, 98, 471, 38, 66, 20, 32,
ese nombre. Haga lo mismo 16 veces (busque la
6 0 , 4 3 ,7 8 ,2 9 , 3 9 , 1 7 ,3 1 , 1 2 , 6 1 ,1 0 0 , 80, 35,
pgina correspondiente al nmero indicado,
3 1 ,9 9 ,2 2
etc.). Despus busque la cantidad de letras de

Apndice del captulo: frmulas de clculo optativas


de la prueba t para medias independientes
El procedimiento descripto en este captulo, sobre la base de frmulas de definicin, involucra
clculos de a) la media (M) de cada muestra, b) la varianza poblacional estimada (S2) sobre la
base de los valores de cada muestra, c) la estimacin combinada de la varianza poblacional
^Combinada) la varianza de la distribucin de medias (S^) de cada poblacin, e) la varianza y
el desvo estndar de la distribucin de diferencias entre medias (6 ^ ferencia y ^Diferencia) y f)
punto t.

Los primeros dos pasos (calcular M y S2 para cada muestra) pueden calcularse utilizando las
frmulas de clculo de los captulos 2 y 9; estos clculos estadsticos por lo general estn disponi
bles directamente en las calculadoras. Existe, sin embargo, una frmula especial de clculo que
combina los pasos c) a e) para obtener el desvo estndar de la distribucin de diferencias entre
m edias (^Diferenciad'

( 10-11)

Despus se calcula t en la forma usual: (M1- iV/2)/SDferenda.


La tabla 10-10 indica los clculos de SDiferencia (y 0 utilizando la ecuacin 10-11, en la compa
racin realizada por Valenzuela (1997) entre la asistencia instructiva brindada por las madres de
nios pobres adecuadamente alimentados y la proporcionada por las madres de nios pobres cr
nicamente desnutridos. Compare estos clculos con los de la tabla 10-2.
Tabla 10-10.
Clculos de la prueba t para medias independientes correspondientes al estudio acerca de la calidad de
asistencia por parte de madres de nios pobres chilenos adecuadamente alimentados en comparacin
con nios pobres chilenos crnicamente desnutridos, utilizando la frmula de clculo para
Nios adecuadamente alimentados
Nx= 43; gtx= V, - 1 = 42;
Nios crnicamente desnutridos

Ml = 33,1; S \ =201,64

N2= 42; gl2= N2~ 1 41 ; M2= 27,0; S \ = 134,56

83

---------- (0,047)
83

= V(168,50X0,047) =

fH = 2,81

necesario para nivel 5%, gl =83 (utilizando gl ~ 80 de la tabla), y prueba de dos colas = 1,990
r - ( M t - M 2)/S d m , = (33, i - 27.OV2.81 =

6,1/2,81

2,17.

Conclusin: se rechaza la hiptesis nula y se sostiene la hiptesis de investigacin.


Fuente: Valenzuela (1997).

Introduccin
al anlisis
de la varianza

D escrip cin d e c a ptulo


Lgica bsica del anlisis de varianza.
Realizacin de un anlisis de varianza.
: Prueba de hiptesis con anlisis de ,
varianza.
; Supuestos de! anlisis de varianza; ;
7 Tamao del efecto y potencia en el
anlisis de varianza.

Controversias y limitaciones: asignacin


aleatoria versus seleccin sistemtica.
El anlisis de varianza segn se describe
; en las publicaciones cientficas. :
Resmen.
Trminos clave.
: Ejercicios.

indy Hazan y Philip Shaver (1987) realizaron los arreglos necesarios para que el
Rocky Mountain News, un importante peridico de la zona de Denver, imprimiera
una encuesta que se distribuira con el diario. La encuesta inclua la pregunta que
aparece en la tabla 11-1, cuya finalidad es realizar una medicin de estilos de
vinculacin. Aquellos que eligieron la primera opcin son individuos seguros;
los que eligieron la segunda, evasivos, y los que eligieron la tercera, ansiosos-ambivalentes. Lo
estilos de vinculacin mencionados se consideran formas diferentes de actuar y pensar en lo que
respecta a las relaciones personales estrechas, formas que se desarrollan a partir de la experiencia
de cada persona con quienes se hicieron cargo de cuidarlos desde temprana edad (p. ej. Mckelson
et al., 1997). Los lectores tambin respondieron preguntas acerca de una cantidad de aspectos.relacionados con el amor, entre los que se inclua el nivel de celos que experimentaran. Posterior
mente, Hazan y Shaver compararon el nivel de celos registrado para personas con diferentes
estilos de vinculacin.
Con una prueba t, Hazan y Shaver podran haber comparado las medias de los valores del ni
vel de celos entre dos de los estilos de vinculacin. Pero, en realidad, estaban interesados en las
diferencias entre los tres, estilos de vinculacin. El procedimiento estadstico para probar diferen
cias entre medias de varios grupos se denomina a n o v a (Analysis o f Varianee, Anlisis de varanza), (El anlisis de varianza se podra utilizar para un estudio con slo dos grupos, pero la prueba
t, que en ese caso da los mismos resultados, es ms simple).
En este captulo, presentamos el anlisis de varianza concentrndonos en la situacin en la
que los diferentes grupos comparados tienen la misma cantidad de valores observados. La situa
cin ms complicada, en la que la cantidad de personas en cada grupo no es la misma, ser trata
da en el captulo 12. En el captulo 13, completamos el estudio del anlisis de varianza analizando
situaciones en las que los distintos grupos se organizan a partir de ms de una dimensin. Por
ejemplo, en el mismo anlisis podramos tener en cuenta tanto el sexo como el estilo de vincula
cin, con lo cual se crearan seis grupos en total (femenino seguro, masculino seguro, femenino

Tabla 11-1.
Pregunta utilizada en la encuesta realizada por Hazan y Shaver (1987) a travs de un peridico.
Cul de las siguientes posibilidades describe mejor sus sentimientos? [Marque una],
(] Me resulta relativamente fcil acercarme a los dems y me siento cmodo si confo en ellos y s que con
fan en ra. En lneas generales no me preocupo por la posibilidad de ser abandonado o de que alguien se
acerque demasiado a m.
[ ] Estar cerca de otros me hace sentir un poco incmodo; me resulta difcil confiar completamente en los
dems y permitirme depender de ellos. Me pone nervioso que alguien se acerque demasiado a m, y mis
parejas a menudo me piden una relacin ms ntima de la que puedo mantener sintindome cmodo.
[ j Me parece que los dems no quieren acercarse a m tanto como yo quisiera. Con frecuencia me preocupo
porque pienso que mi pareja realmente no me ama o no va a querer permanecer a mi lado. Quiero unirme
completamente con otra persona, y este deseo a veces las ahuyenta.
Fuente: Hazan & Shaver (1987), p. 515.

ansioso, etc.), formados conforme a las dos dimensiones: sexo y estilo de vinculacin. El caso
que acabamos de describir se conoce como anlisis factorial de varianza. Para acentuar la dife
rencia con el anlisis factorial de varianza, lo que aprenderemos en este captulo y el siguiente se
denomina con frecuencia anlisis de varianza de un criterio. (No debemos preocupamos ahora
si el concepto de dimensiones resulta confuso. Ya lo trataremos pausada y sistemticamente en el
captulo 13; slo lo mencionamos ahora para que el alumno no se sorprenda si llegara a encon
trarse con esos trminos).

LGICA BSICA DEL ANLISIS DE VARIANZA


La hiptesis nula en un anlisis de varianza establece que las diversas poblaciones que se com
paran tienen la misma media. Por ejemplo, en el estudio de Hazan y Shaver la hiptesis nula es
tablecera que las poblaciones de personas seguras, ansiosas y evasivas presentan todas el mismo
nivel de celos, es decir, que la media en cuanto a celos es la misma en las tres poblaciones. La hi
ptesis de investigacin establecera que el nivel de celos difiere entre las tres poblaciones, es
decir, que sus medias no son todas iguales.
La prueba de hiptesis con anfisis de varianza trata de probar si las medias mustrales difie
ren ms de lo que esperaramos si la hiptesis nula fuera verdadera. Sorprendentemente, esta
cuestin sobre medias se responde analizando varianzas (por eso el nombre anlisis de varian
za). (Para expresarlo de modo ms simple, nos concentramos en las varianzas porque cuando es
tamos interesados en el grado en el que difieren varias medias entre s, lo que estamos estudiando
es la variacin entre esas medias).
Por lo tanto, para comprender la lgica del anlisis de varianza nos dedicaremos a estudiarlas.
Particularmente, comenzamos analizando dos formas diferentes de estimar las varianzas poblacionales. Como veremos, el anlisis de varianza es una comparacin de los resultados de estas
dos maneras diferentes de estimar las varianzas de la poblacin.
Estimacin de Ja varianza poblacional a partir de la variacin dentro de cada muestra
En el anlisis de varianza, como en la prueba t, no conocemos las verdaderas varianzas poblacionales, pero al igual que con la prueba t, la varianza de las poblaciones puede estimarse a partir de
los valores de cada muestra. Tambin, al igual que con la prueba t, en el anfisis de varianza supo
nemos que todas las poblaciones tienen la misma varianza. Como se supone que todas las pobla-

dones tienen la misma varianza, las estimaciones realizadas a partir de los valores de cada mues
tra pueden combinarse o promediarse para formar una sola y mejor estimacin. La estimacin
combinada resultante se denomina estimacin intragrupal de la varianza poblacionai. Lleva
este nombre porque es un promedio de las estimaciones calculadas completamente a partir de los
valores dentro de cada muestra.
Lo ms importante que debemos recordar acerca de esta estimacin intragrupal es que no se
ve afectada por el hecho de que la hiptesis nula sea verdadera. Es decir, la estimacin ser la
misma ya sea porque las medias poblacionales son todas iguales (como lo seran si la hiptesis
nula fuera verdadera) o porque las medias poblacionales son diferentes (como lo seran si la hip
tesis nula no fuera verdadera). La estimacin ser la misma porque slo se concentra en la varia
cin dentro de cada poblacin, y no importa cun alejadas estn las medias de las distintas
poblaciones.

Estimadn de ia varianza poblacionai a partir de la variacin


entre las medias mustrales
En esta seccin veremos el otro modo de estimar la varianza poblacionai. La media de cada mues
tra es un nmero por s mismo. Si existen varias muestras, hay varios nmeros, y estos nmeros
tendrn una verdadera variacin entre s. Sucede que la variacin entre esas medias nos ofrece
otro modo de estimar la varianza en las poblaciones de las que provienen las muestras. La forma
en que esto funciona es un poco intrincada, por lo que recomendamos prestar mucha atencin a la
siguiente seccin.
Cuando la hiptesis n u la es verdadera. En primer lugar analizaremos la situacin en la que la
hiptesis nula es verdadera, de modo que todas las muestras provienen de poblaciones con la misma
media. No debemos olvidar que estamos suponiendo que todas las poblaciones tienen la misma va
rianza (y adems todas son normales). Por lo tanto, si la hiptesis nula es verdadera, todas las pobla
ciones son idnticas (tienen la misma media, varianza y forma).
Si trabajamos con muestras de varias poblaciones idnticas, aun cuando las poblaciones sean
idnticas, las muestras sern levemente diferentes entre s, y sus medias tambin lo sern. En qu
medida pueden ser diferentes las medias? Eso depende de cunta variacin haya dentro de cada
poblacin. Si una poblacin tiene muy poca variacin entre los valores que la conforman, enton
ces las medias de las muestras de esa poblacin tendern a ser muy similares entre s. Lo mismo
ocurre con las medias de varias poblaciones idnticas; la media de la muestra de una de las pobla
ciones tender a ser similar a la media de una muestra de cualquier otra.
Qu sucede si varias poblaciones idnticas presentan mucha variacin entre los valores que
las conforman? En ese caso, si tomamos una muestra de cada poblacin, las medias de esas
muestras podran fcilmente ser muy diferentes entre s y, al serlo, habr entre ellas una gran va
rianza. El tema es que cuanta ms varianza haya dentro de cada una de varias poblaciones idn
ticas, mayor varianza habr entre las medias mustrales cuando se seleccione una muestra de
cada poblacin.
Veamos un ejemplo. Supongamos que estuviramos estudiando muestras formadas por seis
nios de cada una de las tres grandes clases (las poblaciones del ejemplo). Si cada clase estuviera
formada por nios que tuvieran 9 10 aos de edad, las medias de las tres muestras seran valores
entre 9 y 10, es decir que no habra mucha varianza entre esas medias. Pero si cada clase estuvie
ra formada por nios de 5 a 15 aos de edad, las medias de las tres muestras probablemente varia
ran bastante. Es decir, la variacin entre las medias mustrales est directamente relacionada con
el grado de variacin dentro de cada una de las poblaciones de las que provienen las muestras. A

mayor variacin en cada poblacin, mayor variacin entre las medias de las muestras tomadas de
esas poblaciones.
Analicemos el ejemplo de las poblaciones de estilos de vinculacin seguro, ansioso y evasivo
estudiado por Hazan y Shaver. Por supuesto que habr alguna varanza en el nivel de celos de las
diferentes personas dentro de cada una de esas poblaciones. Pero supongamos por ahora que
las tres poblaciones tienen todas la misma media en cuanto al nivel de celos (como sucedera si la

Figura 13.-1. Las medias de muestras provenientes de poblaciones idnticas no sern idnticas. Las medias
mustrales que provienen de poblaciones con menos variacin, variarn menos (a). Las medias mustrales
que provienen de poblaciones con ms variacin, variarn ms (b). Las medias pobiacionales se indican
con un tringulo; las medias mustrales con una X.
;

hiptesis nula fuera verdadera). Aun en el caso en que todas tuvieran la misma media, es probable
que la muestra de una poblacin no tenga exactamente la misma media que la muestra de una se
gunda poblacin. Del mismo modo,es probable que la muestra de una tercera poblacin sea leve
mente diferente de las de las otras dos. Y as sucesivamente. Ms an, cunto ms vare cada una
de esas poblaciones internamente, ms variarn las medias de muestras tomadas de esas pobla
ciones. Variaran incluso si, de hecho, las medias poblacionales fueran idnticas.
La figura 11-1 representa grficamente el principio que hemos estado analizando. Las tres
poblaciones idnticas de la izquierda tienen poca varanza, y las tres poblaciones idnticas de la
derecha registran una gran varanza. En cada serie de tres poblaciones idnticas, aun cuando las
medias de las tres poblaciones sean iguales, las medias de las muestras provenientes de esas po
blaciones no son iguales! Es muy importante destacar que las medias de las poblaciones con me
nos varanza son ms cercanas (tienen menos varanza entre s) y que las medias de poblaciones
con ms varanza estn ms dispersas (tienen ms varanza entre s).
Ya hemos visto que la variacin entre las medias de muestras tomadas de poblaciones idnti
cas est directamente relacionada con la variacin de los valores dentro de cada una de esas po
blaciones. Esto tiene una implicancia muy importante: sera posible estimar la varanza dentro de
cada poblacin a partir de la variacin entre las medias de las muestras. Es decir, podramos utili
zar la variacin de las medias mustrales para calcular el grado de variacin en la poblacin de
donde provienen esas muestras.
Tal estimacin se denomina estimacin m tergrupal de la varanza poblacional. (Lleva es
te nombre porque se basa en la variacin entre las medias de las muestras, es decir, de los gru
pos). Ms adelante, en ste captulo, veremos cmo se calcula realmente esta estimacin.
Hasta aqu, la lgica que hemos analizado supone que la hiptesis nula es verdadera, en cuyo
caso no existe variacin entre las medias poblacionales. Veamos ahora qu sucede cuando la hi
ptesis nula no es verdadera y s lo es la hiptesis de investigacin.
Cuando la hiptesis nula no es verdadera. Si la hiptesis nula no es verdadera y la hipte
sis de investigacin s lo es, las propias poblaciones tendrn diferentes medias. En ese caso, la va
riacin entre las medias de muestras tomadas de esas poblaciones sigue siendo el resultado de la
variacin dentro de las poblaciones. La diferencia radica en que, en este caso, en el que la hipte
sis de investigacin es verdadera, la variacin entre medias mustrales es causada adems por la
variacin entre las medias poblacionales. Es decir, en este caso las medias mustrales se disper
san por dos razones diferentes: a) por la variacin dentro de cada una de las poblaciones y b) por
la variacin entre las poblaciones. La figura 11-2a representa grficamente tres poblaciones con
las mismas medias y las medias mustrales provenientes de ellas (es decir, la misma situacin que
en la figura 11-1, a y b). La figura 11-2b representa grficamente tres poblaciones con diferentes
medias y las medias de las muestras tomadas de ellas (es decir, la situacin que acabamos de expli
car). Vale la pena observar que las medias de las muestras estn ms dispersas en la figura 1l-2b
que en la figura 11-2a, aun cuando las variaciones dentro de las poblaciones sean las mismas en
11-2b y en 11-2a. Esta dispersin adicional (varanza) que representa la figura 11-2b se debe a
que las poblaciones tienen diferentes medas.
En resumen, la estimacin intergrupal de la varanza poblacional se calcula sobre la base de
la variacin entre las medias mustrales. Si la hiptesis nula es verdadera, esa estimacin es una
indicacin precisa de la variacin dentro de las poblaciones. Pero si la hiptesis nula es falsa, este
mtodo de estimacin de la varanza'poblacional se ve influenciado tanto por la variacin dentro
de las poblaciones como por la variacin entre ellas. Por lo tanto, no proporcionar una estima
cin precisa de la variacin dentro de las poblaciones porque tambin estar afectada por la va
riacin entre las poblaciones. La diferencia que acabamos de mencionar tiene implicancias
importantes: es lo que hace del anlisis de varanza un mtodo de prueba de hiptesis basado en la
existencia o no de diferencias entre las medas de diferentes grupos.

Figura 11-2. Las medias mustrales que provienen de poblaciones cuyas medias son diferentes (b) variarn
ms que las medias mustrales que provienen de poblaciones cuyas medias son iguales (a). Las medias
poblacionales se indican con un tringulo; las medias mustrales con una X.

Comparacin de las estimaciones intragrupal e intergrupa! de la varianza poblacional


La tabla 11-2 resume lo que hemos visto hasta ahora con respecto a las estimaciones intragrupal
e intergrupa! de la varianza poblacional, tanto cuando la hiptesis nula es verdadera como cuan
do tambin lo es la hiptesis de investigacin. Cuando la hiptesis nula es verdadera, las estima
ciones intragrupal e intergrupal se basan en lo mismo; literalmente, son estimaciones de la
misma varianza poblacional. Cuando la hiptesis nula es verdadera, ambas estimaciones debe
ran ser aproximadamente iguales (slo aproximadamente iguales, ya que estamos hablando de
estimaciones). Otro modo de describir la similitud entre la estimacin 'intergrupal y la estima
cin intragrupal, cuando la hiptesis nula es verdadera, es la siguiente: la razn entre estimacin
intergrupal y la estimacin intragrupal debera ser aproximadamente 1. Por ejemplo, si la esti
macin intragrupal es 107,5, la estimacin intergrupal debera ser de alrededor de 107,5, de for
ma tal que la razn fuera aproximadamente 1 (la razn se calcula dividiendo uno de los nmeros
por el otro).
De todos modos, la situacin es bastante diferente cuando la hiptesis nula no es verdadera.
Como lo indica la tabla 11-2, cuando la hiptesis de investigacin es verdadera, la estimacin intergrupal es influenciada por dos fuentes de-variacin: a) la variacin de los valores dentro de ca
da poblacin y b) la variacin de las medias de las poblaciones entre s. Sin embargo, incluso
cuando la hiptesis de investigacin es verdadera, la estimacin intragrupal contina siendo
influenciada slo por la variacin dentro de las poblaciones. Es decir, que cuando la hiptesis de in
vestigacin es verdadera, la estimacin intergrupal debera ser mayor. En este caso, la razn de la

Tabla 11-2.
Fuentes de variacin de las estimaciones intragrupal e intergrupa! de la varianza.
V a r ia c i n
d e n t r o d e la s
p o b la c io n e s

La hiptesis nula u verdadera


Estimacin intragrupal causada por
Estimacin intergrupal causada por
La hiptesis de investigacin es verdadera
Estimacin intragrupal causada por
Estimacin intergrupal causada por

V a r ia c i n
e n tr e la s
p o b la c io n e s

X
X
X
X

estimacin intergrupal y la estimacin intragrupal debera ser mayor que 1. Por ejemplo, la esti
macin intergrupal podra ser 638,9 y la estimacin intragrupal 107,5, dando una razn de
638,9/107,5, lo que es igual, de 5,94. Es decir, si dividimos la estimacin mayor, la intergrupal,
por la menor, la intragrupal, no obtenemos 1, sino un nmero mayor.
Lo que acabamos de describir es el principio fundamental del anlisis de varianza. Cuando la
hiptesis nula es verdadera, la razn entre la estimacin de varianza intergrupal y la estimacin de
varianza intragrupal debera ser aproximadamente 1, pero cuando la hiptesis de investigacin es
verdadera, la razn debera ser mayor a 1. Por lo tanto, si calculamos la razn y sta resulta mucho
mayor a 1, podemos rechazar la hiptesis nula. Es decir, no es verosmil que la hiptesis nula pue
da ser verdadera ya que la estimacin intergrupal es mucho mayor que la estimacin intragrupal.
La razn F
Esta razn fundamental entre las estimaciones intergrupal e intragrupal de la varianza se denomi
na razn F. (La F se debe a Sr Ronald Fisher, un destacado estadstico que desarroll el anlisis
de varianza; vase cuadro 11-1).
La distribucin F y la tabla F
Ya hemos mencionado que cuando la razn fundamental entre la estimacin intergrupal y la esti
macin intragrupal (la razn F) es mucho mayor a 1, podemos rechazar la hiptesis nula. La si
guiente pregunta es: Cunto mayor a 1 necesita ser la razn para que podamos rechazar la
hiptesis nula con confianza?
Conforme a lo que el alumno seguramente ya debe haber imaginado, los estadsticos han de
sarrollado los clculos matemticos de una distribucin F y han preparado tablas de razones F.
Para cualquier situacin determinada, simplemente buscamos en una tabla F cun extremo debe
ser una razn F para rechazar la hiptesis nula a, digamos, un nivel 0,05. (Ms adelante, en este
captulo, aprenderemos a utilizar la tabla F).
Para dar un ejemplo de la razn F, volvamos al estudio acerca del estilo de vinculacin reali
zado por Hazan y Shaver (1987). Los resultados de ese estudio, en cuanto al nivel de celos, fueron
los siguientes: la estimacin de varianza poblacional intergrupal era de 23,19. (Este nmero se
calcula sobre la base de las medias de las tres muestras de estilo de vinculacin, que eran 2,17,
2,88 y 2,57; pronto aprenderemos a realizar estos clculos). La estimacin intragrupal de varian
za poblacional era 0,53. (Este nmero se calcul combinando las estimaciones de la varianza de

Ronald A. Fisher, contemporneo de WiUiam Gosset (vase cuadro 9-1) y de Karl


Pearson (vase cuadro 14-1), fue proba
blemente el ms brillante y productivo de
los miembros del cerrado grupo de esta
dsticos britnicos. A lo largo del proceso
de elaboracin de trescientos trabajos y de
siete libros, desarroll muchos de los con
ceptos clave de la ciencia moderna: varianza, anlisis de varianza, estadsticas
(en el sentido de describir una muestra, en
oposicin con los parmetros de una po
blacin), niveles de significacin, hipte-,
sis nula, y. casi tambin de todas las ideas
bsicas del diseo de investigacin, ade
ms de sealar la importancia fundamen
tal de la aeatorizacin.
Una de las tantas leyendas familiares
cuenta que el pequeo Ronald, nacido en el
ao 1890 en East Finchey, un suburbio del
norte de Londres, estaba tan fascinado por
la matemtica que, un da, a los 3 aos de
edad, al ser puesto frente a. su silla alta para
el. desayuno, le pregunt a su niera: Qu
es la mitad de la mitad? Cuando se le ex
plic que era un cuarto, pregunt Qu es
la mitad de un cuarto? Al recibir la res
puesta :quiso saber qu era la mitad de un
octavo. Ante la siguiente respuesta supues
tamente pens un momento y dijo Enton
ces supongo que la mitad de un dieciseisavo
debe ser un treintaidosav. En fin, hsto-
ras de nios.
Sin embargo, cuando fisher lleg a la
adultez, parece haber estado muy lejos de
ser adorable. Algunos observadores atribu
yen esta caracterstica al hecho de que tuvo
una madre fra y poco emotiva. Cualquiera
sea la razn, durante su vida, Fisher se vio
involucrado en profundas enemistades, in
cluso con alumnos que previamente haban

sido sus ms cercanos aliados, y quienes :;


verdaderamente deberan haber, sido sus
compaeros de investigacin.. Cuando le
hablaban en broma l contestaba con .serie- : :
dad mortal; cuando los dems estaban se
rios l bromeaba. En una oportunidad,
relata Wliam G. Cochran (otro estadstico,
reconocido), estaba por cruzar una calle'
junto don Fisher. l momento no era el m s ,'
indicado y , ante la vacilacin de Cochran,.
Fisher lo increp: Ah, vamos!, no nos- 1
lastimar un poco de seleccin natural !, y
Cochran. tmidamente arriesg su vida.. .
La poca compasin de Fisher se exten-. ..
da tambin a sus lectores:: su estilo no slo
era terriblemente oscuro .sino que, confie-.
cuencia, omita explicitar importantes s u -. .
puestos y pruebas. Gosset mismo expres,
que cuando Fisher comenzaba una oracin
con evidentemente, eso significaba dos .
horas de arduo trabajo antes de que uo
pudiera tener esperanzas de discernir por.
qu l tema era evidente. Otro estadstico .
busc excusarlo, sin embargo, diciendo:
que Fisher hablaba en un nivel escasa
mente comprendido por el resto de la hm
manidad. Y es verdad que era invariable
mente admirado y respetado pbr su traba-;
jo, aunque no por sus modales.
De hecho, su falta de empatia se extenda
a toda la humanidad. Al igual: que. Gatonj
Fisher estaba a favor de la eugenesia; favo
reca todo aquello que pudieraaumentr el ndice de natalidad de las clases altas y . profesionales, como tambin de los artesa
nos capacitados. l no slo pensaba que la'
anticoncepcin era una mala idea '-tema
que las personas cuya descendencia era .
menos deseable recurrieran a ella en me
nor proporcin-, sino que defenda el in- .
fantcidio como herramienta de la funcin J

evolutiva. Probablemente tambin haya si


dad profesional de mayor influencia tal vez do un acto de justicia que sus oportunida . hay sido la invitacin a la Facultad del Es^
des de experimentar con la reproduccin
tado de lovva, en Ames, en los veranos, d
nunca hayan llegado ms all de la crianza
1931 y 1936 (donde, segn se dice, estaba
de sus propios hijos y de algunos cultivos de',
muy perturbado por el terrible, calor quepapa y trigo. . .
guardaban sus sbanas todo.el da en el re
Lo que con ms fuerza influy en Fsher
frigerador).: En .Ames; Fisher provoc una
fueron probablemente sus catorce aos de
fuerte impresin en Qeorge Snedecor, un
trabajo en una estacin experimental agrco
profesor de matemtica estadounidense.,
la llamada Rothamsted, en Hertfordshire, 25. que tambin investigaba problemas agrcomillas al norte de Londres. En Rothamsted,.
las. Posteriormente, Snedecor escribi un'
Fisher, al igual que Gosset en su fbrica de
, libro sobre estadstiea aplicd.a a laagricul-.;
cerveza en Dubln, enfrent todo, tipo de
tura, que tomaba muchas ideas del trabaj
problemas prcticos, tales como averiguar s i ..
de Fisher en Rothamsted. El libro, difundi..
las aplicaciones anuales de abono mejora- '
a tal:punto las ideas d Fishrsbre estds-.
ban el rendimiento del campo a largo plazo o
. tica y diseo d e:investigacin; que su. se -:
si eran la causa de misteriosas disminuciones
. gunda edicin vendi 100.000 copias. C. .
de produccin luego d muchas dcadas. Tal
Durante su estada en Ames, Fisher.
vez fue este aislamiento de las disputas perso
tambin se gan la admiracin de E. ; F. '
nales entre los acadmicos de Londres y la
lindquist, profesor de educacin en i.UniA
cercana a los temas reales los que ayudaron
versidad de lowa, con sede en la misma ci-:.
Fisher a concentrarse en el desarroll de la es-, dad. l siguiente libro He Lindquist estuvo
tadstica como una poderosa herramienta me
totalmente permeado con las ideas de Fisher
todolgica.
aplicadas al campo de la educacin;y la psi-:; .
Aunque con el tiempo Fishr accedi,
al cargo de titular de la ctedra de Eugene- : coioga, reas en las que han desempeado
. un papel primordial hasta la actualidad.
sia en el University College, su; oportuni

cada poblacin sobre la base de los valores de cada muestra). La razn entre las estimaciones de
varianza intergrupal e intragrupai (23,19/0,53) resulta ser 43,91; es decir F = 43,91. La razn F
calculada es considerablemente mayor a 1. De hecho, la razn F necesaria para rechazar la hip
tesis nula al nivel 0,05 es slo 3,01. Kazan y Shaver rechazaron con confianza la hiptesis nula, y
concluyeron que el nivel de celos vara segn el estilo de vinculacin.

Una analoga
Para algunos estudiantes, la siguiente analoga les resulta de gran ayuda para comprender el anli
sis de varianza, La analoga se realiza con lo que los ingenieros llaman razn seal-ruido. Por
ejemplo, la capacidad de comprender las palabras en una conversacin por telfono celular con in
terferencia depende de la potencia de la seal, en contraposicin con la cantidad de ruido aleatorio.
En el caso de la razn F en e! anlisis de varianza, la diferencia entre las medias de las muestras se
equipara con la seal, es la informacin de inters, y la variacin dentro de las muestras se equipa
ra con el ruido. Cuando la variacin entre las muestras es lo suficientemente grande en compara
cin con la variacin dentro de las muestras, la conclusin es que existe un efecto significativo.

REALIZACIN DE UN ANLISIS DEVARIANZA


Luego de haber estudiado la lgica bsica del anlisis de varianza, analizaremos un ejemplo para
ilustrar los detalles. (Utilizamos un estudio ficticio para que los nmeros sean simples).
Supongamos que un psiclogo especializado en temas sociales est estudiando la influencia
del conocimiento de la existencia de antecedentes crimnales en la percepcin del jurado con res
pecto a la culpabilidad o inocencia del acusado. El investigador recluta 15 voluntarios que han si
do seleccionados para integrar un jurado (pero que todava no han actuado en un juicio). El
investigador les muestra una filmacin de video de un juicio de cuatro horas de duracin en el que
una mujer es acusada de entregar cheques falsos. Antes de ver la cinta, se entrega a todos los par
ticipantes una hoja de antecedentes con la edad, estado civil, educacin y otros datos sobre la
acusada. La hoja es la misma para los 15 participantes, con una diferencia: en el caso de 5 de los
participantes, la ltima seccin de la hoja dice que la mujer ha sido condenada varias veces antes
de entregar los cheques falsos. (Llamaremos a los participantes que recibieron esta versin de la
hoja de antecedentes grupo del informe delictivo). En el caso de otros 5 de los participantes,
la ltima seccin de la hoja dice que la mujer tiene una historia delictiva completamente limpia
(grupo del informe en blanco). Finalmente, en el caso de los cinco participantes restantes, la
hoja no hace ninguna mencin acerca de antecedentes delictivos (grupo sin informacin).
Los participantes son asignados a los grupos al azar. Despus de ver los videos del juicio, los
15 participantes califican a la acusada con una escala de 10 puntos, que va desde completamente
seguro de que es inocente" (1) a completamente seguro de que es culpable (10). Los resultados
del estudio ficticio se indican en la tabla 11-3. La tabla muestra que las medias de los tres grupos
son diferentes (8,4 y 5), pero que adems hay bastante variacin dentro de cada uno de los tres
grupos (las estimaciones de varianza poblacional realizadas a partir de los valores de estos
tres grupos son 4,5,5,0 y 6,5).
Necesitamos realizar tres clculos para probar la hiptesis que establece que las tres pobla
ciones son diferentes: a) una estimacin de varianza poblacional sobre la base de la variacin de
los valores dentro de cada muestra; b) una estimacin de la varianza poblacional sobre la base de
las diferencias entre las medias de los grupos, y c) la razn de las dos, es decir, la razn F. (Ade
ms, necesitamos el punto de corte correspondiente al nivel de significacin elegido tomado de
una tabla F). Analicemos cada uno de estos clculos por vez.
Tabla 11-3.
Resultados del estudio acerca de antecedentes delictivos. (Datos ficticios).
Grupo del informe delictivo

Grupo del informe en blanco


D e s v o

D e s v o
D e s v o d e

c u a d r tic a

la m e d ia

C a lific a c i n

10

X:

D e s v o d e

Q u a d r tic o

D e s v o

d e la m e d a

C a lif ic a c i n

la m e d ia

d e la m e d ia

C a lif ic a c i n

2
~1

4
1

l '

-3

4
6

-3

-1

3
7
_4

18

20

5
10
JS

J>

40

M = 4 0 /5 = 8.
5*= 18/4 = 4,5

Grupo sin informacin

2 0 /5 = 4
= 5 ,0

S2 - 2 0 /4

D e s v o d e

c u a d r tic a

la m e d ia

d e la m e d ia

-1
1.

9
3
_3

4
-2
-2

1
16
4
4

20

25

26

U ~

2 5 /5 = 5

^ = 2 6 / 4 = 6 ,5

La varianza poblacional puede estimarse a partir de cualquiera de los grupos (es decir, a partir de
cualquier muestra) utilizando el mtodo usual para estimar la varianza poblacional a partir de una
muestra. Primero, calculamos la suma de los desvos cuadrticos, es decir, tomamos el desvo de
cada registro con respecto a la media de su grupo, elevamos el desvo al cuadrado y sumamos to
dos los desvos cuadrticos. Segundo, dividimos esa suma de desvos cuadrticos por los grados
de libertad del grupo (los grados de libertad de un grupo constituyen la cantidad de valores obser
vados en el grupo menos 1). En el ejemplo, como lo indica la tabla 11-3, esto da una varianza po
blacional estimada de 4,5 sobre la base del grupo del informe delictivo, una estimacin de 5,0
sobre la base del grupo del informe en blanco, y una estimacin de 6,5 sobre la base del grupo sin
informacin.
No debemos olvidar que en el anlisis de varianza, al igual que en la prueba t, se supone
que las poblaciones tienen la misma varianza. Dado que estas estimaciones pertenecen a po
blaciones que se supone tienen la misma varianza, las estimaciones basadas en los valores de
cada muestra estn estimando todas el mismo nmero (la verdadera varianza poblacional).
Adems, dado que los tamaos de muestra en este ejemplo son iguales, cada grupo representa
una estimacin basada en la misma cantidad de informacin; por lo tanto, podemos combinar
estas estimaciones de varianza realizando un promedio ordinario. El resultado es una estima
cin general de la varianza poblacional sobre la base de la variacin dentro de los grupos, que
es igual a la suma de 4,5, 5,0 y 6,5 (o sea 16) dividida por la cantidad de grupos (o sea 3). El
resultado es 5,33.
La varianza estimada sobre la base de la variacin de los valores dentro de cada uno de los gru
pos es la estimacin ntragrupal de la varianza. Se simboliza como S2DmtI0 CMDentr(). CMDen{roes
la abreviatura de eudrado medio dentro. El trmino cuadrado medio de los cuadrados es otro
nombre de la varianza, ya que la varianza es la media de los desvos cuadrticos. (La 52Dej3ro
CMDenlt0 tambin se denomina a veces varianza del error", y se simboliza como S2Efror CMError.)
La frmula para la estimacin ntragrupal de varianza, cuando los tamaos de las muestras
son iguales, es:

(U -l)

En la frmula, S 2 es la varianza poblacional estimada sobre la base de los valores del primer gru
po (el que proviene de la poblacin 1); S \ es la varianza poblacional estimada sobre la base de los
valores del segundo grupo; S
es la varianza poblacional estimada sobre la base d los valores
del ultimo grupo, (Los puntos, o elipsis, en la frmula indican que debemos completarla con la
varianza poblacional estimada correspondiente a todos los otros grupos que hay en el anlisis).
^Gruposes la candad grupos.
Utilizando esta frmula para realizar los clculos, obtenemos:
<?2
0 Dentro ~

5?+2+---+5?fJitl-mo 4,5+ 5,0+ 6,5 __ 16,3


"
3
3

Determinar la estimacin intergrupai de la varianza poblacional involucra dos pasos: primero, es


timar a partir de unas pocas medias (las medias mustrales) la varianza de una distribucin de me
dias (la distribucin de todas las medias mustrales posibles de una poblacin de observaciones
individuales). Segundo, sobre la base de la varianza de esa distribucin de medias, calcular la va
rianza poblacional de observaciones individuales,
Estimacin de la varianza de la distribucin de medias. Podemos considerar que las me
dias mustrales fueron tomadas de una distribucin de medias mustrales. Seguimos el procedi
miento usual utilizando los valores de una muestra para estimar la varianza de la poblacin de
donde provienen esos valores. En este caso, consideramos las medias mustrales como los valo
res y la distribucin de medias como la poblacin de donde provienen esos valores. Todo esto
queda reducido a los siguientes pasos: comenzamos calculando la suma de los desvos cuadrtieos (calculamos la media de las medias mustrales, calculamos el desvo de cada media muestral
con respecto a la media de medas, elevamos al cuadrado cada uno de esos desvos y, despus su
mamos los desvos cuadrrteos). Luego, dividimos esa suma de desvos cuadrticos por los gra
dos de libertad, que es la cantidad de medias menos 1.
Lo anterior se expresa bajo la siguiente frmula (cuando los tamaos de las muestras son
iguales),

2 _ X(M~GM)2
M

Skntre

(U-2)

En la frmula mencionada arriba, S 2M es la varianza estimada de la distribucin de medias (esti


macin basada en las medias de las muestras del estudio). M es la media de cada una de las mues
tras. GM. es la gran meda, la media general de todos los valores, que es tambin la media de las
medias. gfE son los grados de libertad en la estimacin intergrupal, la cantidad de grupos me
nos 1. Lo anterior se expresa bajo la frmula,
g^Entre ^Grupos " 1

(11"3)

En el ejemplo referido a los antecedentes delictivos, las tres medias son 8,4 y 5. Los clculos apa
recen en la tabla 11-4.
De la varianza estimada de la distribucin de medias a na varianza estimada de la po
blacin de valores observados. Lo que acabamos de calcular a partir de una muestra de unas po
cas medias es la varianza estimada de una distribucin de medias. A partir de ese dato queremos
estimar la varianza de la poblacin (la distribucin de valores individuales) en la que se basa esa
distribucin de medias. En el captulo 7 vimos que la varianza de una distribucin de medias es
menor que la varianza de la poblacin en la que se basa (la distribucin de valores individuales).
Esto ocunre porque las medias tienen menos posibilidades de ser extremas que los valores indivi
duales (ya que es poco probable que varios valores extremos en la misma direccin puedan que
dar incluidos en una misma muestra). Especficamente, en el captulo 7 aprendimos que la
varianza de una distribucin de medias es la varianza de la distribucin de valores individuales di
vidida por la cantidad de valores de cada muestra.

Tabla 11-4.
Varianza de la distribucin de medias, estimada sobre la base de las medias de los tres grupos
experimentales del estudio referido a los antecedentes delictivos (datos ficticios).
Medias
mustrales

Desvos de la
gran media

Desvo cuadrtco
de ia gran media

m
4
8
5

(M-GM)
-1,67
2,33
-0,67

(M~~GMf
2,79
5,43
0,45

-0,01

8,67

X;

= 17/3 5,67; SjA ~ %{M-

8,67/2 - 4,34.

Ahora, sin embargo, vamos a revertir lo que hicimos en el captulo 7, en el que calculamos la va
rianza de la distribucin de medias dividiendo la varianza de la distribucin de observaciones in
dividuales por el tamao de la muestra. Ahora vamos a calcular la varianza de la distribucin de
valores individuales multiplicando la varianza de la distribucin de medias por el tamao de la
muestra. {Vase tabla 11-5). Es decir, para obtener la varianza poblacional de observaciones indi
viduales, multiplicamos la estimacin de la varianza de la distribucin de medias por el tamao
de la muestra. El resultado de este proceso es la estimacin intergrupal de la varianza. Lo anterior
se expresa bajo la frmula (en los casos en que los tamaos de muestra son iguales),
sL

< 5 C ^ k = 0S)(")

d i-* )

En la frmula arriba mencionada, 5 | ntre CMEtitre es la estimacin de la varianza poblacional so


bre la base de la variacin entre las medias (la estimacin intergrupal de varianza), n es la canti
dad de observaciones de cada muestra.
Volvamos al ejemplo referido a los antecedentes delictivos, en el que haba 5 individuos en
cada muestra y una varianza estimada de distribucin de medias de 4,34. En ese ejemplo, multi
plicando 4,34 por 5 obtenemos una estimacin intergrupal de varianza poblacional igual a 21,7.
Se expresa bajo la frmula,
L *

C M ^ = (S X iO = (4,34)(5) =21,7

Resumiendo, el procedimiento de estimacin de la varianza poblacional, sobre la base de las dife


rencias entre las medias de los grupos, es el siguiente: a) calcular la varianza estimada de la distri
bucin de medias y luego b) multiplicar esa varianza estimada por la cantidad de observaciones
de cada grupo.
Tabla 11-5.
Comparacin del clculo de varianza de una distribucin de medias a partir de la varianza de una
distribucin de observaciones individuales al revs.
D e distribucin de individuos a distribucin de m edas;
D e distribucin de m edias a distribucin d e individuos:

= S 2!N
= S 2 - ( S ^ ) (/V)

Figura 11-3,
U n a d istrib u ci n i l

Clculo de la razn F
La razn F es el cociente entre la estimacin intergrapal de la varianza poblaconal y la estima
cin intragrupal de la varianza poblaconal, Se representa bajo la frmula,

(11-5)

^Dentro

CM)emro

En el ejemplo que analizamos, el ratio entre intergrupal e intragrupal es el cociente entre 21,7 y
5,33. Realizando la divisin obtenemos una razn F de 4,07. Se expresa,bajo la frmula,
p ^Entre

^ CMgniJe

^Denteo

La distribucin

^^Deiitro

^ 21,7 __^
^ ,3 3

El siguiente paso es determinar .el punto de corte a partir del cual se considera que F es lo sufi
cientemente grande como para rechazar la hiptesis nula. Esto requiere una distribucin de razo
nes F que podamos utilizar para establecer qu es una razn F extrema.
En la prctica, simplemente buscamos el punto de corte necesario en una tabla. Pero para en
tender de dnde proviene el nmero de la tabla, necesitamos comprender la distribucin F. La
manera ms fcil de comprender esta distribucin es analizar cmo haramos para elaborar una.

Supongamos que comenzamos con tres poblaciones idnticas. Despus, seleccionamos al


azar cinco valores de cada una, y sobre la base de esas tres muestras (de cinco valores cada una),
calculamos la razn F. (Es decir, utilizamos estos valores para calcular una estimacin intergrapal y una estimacin intragrupa!, y despus dividimos la primera por la segunda). Digamos que ai
realizar ese proceso, la razn F a la que llegamos es de 1,36. Ahora bien, seleccionamos otras tres
muestras al azar de cinco valores cada una y calculamos la razn F utilizando estas tres muestras.
Tal vez obtenemos una F de 0,93. Si realizamos todo este proceso muchas veces, finalmente ob
tendremos muchas razones F. La distribucin de todas las razones F posibles calculadas del mo
do descripto (utilizando muestras aleatorias de poblaciones idnticas) se denomina distribucin
F. La figura 11-3 muestra un ejemplo de distribucin F. (Existen muchas diferentes distribucio
nes F, y cada una tiene una forma levemente distinta. La forma exacta depende de cuntas mues
tras tomemos cada vez y de cuntos valores haya en cada muestra, pero la forma general es
similar a la que aparece en la figura).
En realidad, nadie se dedica a elaborar su propia distribucin F del modo arriba mencionado.
Se trata de una distribucin matemtica cuyas caractersticas exactas pueden encontrarse a partir
de una frmula. Tambin puede probarse matemticamente que si tuviramos la paciencia de se
guir este procedimiento el tiempo necesario, obtendramos el mismo resultado.
Como podemos observar en la figura 11-3, la distribucin F no es simtrica sino que tiene
una larga cola hacia la derecha. La razn de esta asimetra positiva es que una distribucin F
es una distribucin de razones de varianzas, y las varianzas siempre son nmeros positivos (una
varianza es un promedio de desvos cuadrticos, y cualquier nmero elevado al cuadrado es posi
tivo). Una razn entre un nmero positivo y otro nmero positivo nunca ser menor a 0. Pero na
da impide que una razn sea un nmero muy alto. Por lo tanto, las razones F no pueden ser
menores que 0 y pueden ser bastante altas.1(La mayora de las razones F se apilan cerca del valor
1, pero se dispersan ms sobre el lado positivo, donde tienen espacio para dispersarse).
La tabla F
La tabla F es un poco ms complicada que la tabla t, ya que existe una distribucin Fdiferente se
gn los grados de libertad utilizados en la estimacin intergrupal de varianza y segn los grados
de libertad utilizados en la estimacin ntragrupai de varianza. Es decir, deben considerarse dos
tipos distintos de grados de libertad para buscar el punto de corte necesario. Unos son los grados
de libertad entre, que tambin se denominan grados de libertad delnumerador. Se trata de los
grados de libertad utilizados en la estimacin intergrupal de la varianza; el numerador de la razn
F. Los otros son los grados de libertad dentro, tambin denominados grados de libertad del
denominador. Son los grados de libertad totales en el clculo de la estimacin ntragrupai de la
varianza, es decir, el denominador de la razn F.

1 Es posible, por casualidad, que F s e a mayor o menor a 1 en cualquier situacin en particular. Tanto la intergrupal co
mo la ntragrupai son slo estimaciones, y ambas pueden variar un poco aun cuando la hiptesis nula sea verdadera. Si
F es considerablemente mayor a 1, rechazamos la hiptesis nula que establece que en realidad todas las poblaciones
tienen la misma media, Pero qu sucede si F es considerablemente menor, a 1? Esto rara vez sucede. Cuando ocurre,
podra indicar que existe menos variacin entre los grupos de la que se esperara por casualidad; por lo tanto, algo est
restringiendo la variacin entre los grupos. Una causa podra ser que, al organizar el experimento, se equiparen los su
jetos entre los grupos en cuanto a determinadas variables (tales com o edad o inteligencia) que resulten estar relaciona
das con la variable bajo estudio. Una implicancia de esta posibilidad es que equiparar grupos de este modo, antes de
realizar el estudio, podra realmente evitar un resultado significativo. Aun si existen diferencias reales entre las medias
de la poblacin, la influencia de estas diferencias en la estimacin intergrupal puede ser compensada por el efecto de la
equiparacin. Este tema es tratado ms adelante en el captulo.

Los grados de libertad entre son la cantidad de grupos menos 1 (porque ese es el grado de liber
tad utilizado para calcular la estimacin intergrupal de la varianza). Se expresan bajo la frmula,
k = * W .~ 1
("->
Los grados de libertad dentro son la suma de los grados de libertad de todos los grupos (ya que
todas sus estimaciones estn incluidas en ia combinacin). Se expresan bajo la frmula,
8 l Dentro 8 l t + S l2 + - + 8 ltimo

C1 1

En el ejemplo referido a los antecedentes delictivos, los grados de libertad entre son 2 (3 medias
menos 1). Aplicando la frmula,

^Entre ~ ^Grupos~ 1 = 3 - 1 = 2.
Los grados de libertad dentro son 12, ya que cada grupo tiene 4 grados de libertad en los que se
basa la estimacin (5 registros menos ) y hay 3 grupos en total que, sumados, dan como resulta
do 12 grados de libertad. Aplicando la frmula,
8lmo = ( 5 l) +

8Encca ~= 8\ + 82

(5 l) + (5~ 1) 4 + 4

+ 4=

12.

Buscaramos entonces el punto de corte en una distribucin F con 2 y 12 grados de libertad.


Como lo indica la tabla 11-6, con el nivel 0,05 se necesita una razn F de 3,89 para rechazar
la hiptesis nula. (Con el nivel 0,01 se necesitara una F de 6,93). La tabla F completa aparece
con el nombre de tabla B-3 en el apndice B.

Tabla 11-6.
Puntos de corte en la distribucin F. (Informacin parcial).
G rados de
lib er ta d d el
d e n o m in a d o r

N iv e l de
sig n ifica ci n
i

10

11

12

13

0,01
0,05
0 ,1 0
0,01
0,05
0,1 0
0,01
0,05
0 ,1 0
0,01
0,05
0,10

10,05
4,97
3,29
9,65
4,85
3,23
9,33
4,75
3,18
9,07
4,67
3,14

Nota: La tabla completa es la tabla B-3 del apndice B.

G ra d o s de lib er ta d d el n u m era d o r
5
2
3
4
7,56
5,64
6,00
6,55
4 ,1 0
3,33
3,71
3,48
2,93
2,52
2,61
2,73
7,21
5,32
6,22
5,67
3,98
3,20
3,36
3,59
2 ,5 4 . 2,45
2,86
2 ,6 6
6,93
5,07
5,41
5,95
3,11
3,89
3,26
3,49
2,81
2,40
2,61
2,48
6 ,7 0
4 ,8 6
5 ,7 4
5,21
3,41
3,03
3,81
3 ,1 8
2 ,7 6
2 ,4 3
2,35
2 ,5 6

5,39
3 ,2 2
2 ,4 6
5,07
3,10
2,39
4 ,8 2
3,00
2,33
4 ,6 2
2 ,9 2
2,28

PRUEBA DE HIPTESIS CON ANLISIS DE VARIANZA


Analicemos cmo funcionan estos pasos en el experimento referido a los antecedentes delictivos.
1. Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de las
poblaciones. Existen tres poblaciones:
Poblacin 1: jurados a quienes se inform que el acusado tena antecedentes delictivos.
Poblacin 2: jurados a quienes se inform que el acusado no tena antecedentes.
Poblacin 3: jurados a los que no se dio informacin acerca de los antecedentes del acusado.
La hiptesis nula establece que las tres poblaciones tienen la misma media (p^ = |x2 = p,3). La hi
ptesis de investigacin establece que las medias poblacionales son diferentes,
2. Determinar las caractersticas de la distribucin comparativa. La distribucin compa
rativa es una distribucin F con 2 y 12 grados de libertad.
3. D eterm inar el punto muestral de corte en la distribucin comparativa, a p artir del
cual debera rechazarse la hiptesis nula. Utilizando la tabla F para el nivel 0,05 de significa
cin, la razn F necesaria es 3,89.
4. Determinar el valor muestral en la distribucin comparativa. En el anlisis de varianza, la distribucin comparativa es una distribucin F, y el valor muestral en esa distribucin es,
por lo tanto, la razn F. En el ejemplo, la razn F que calculamos era 4,07.
5. C om p arar los valores de los pasos 3 y 4 p ara decidir si se rechaza o no la hipte-:
sis nula. En el ejemplo que estamos analizando, la razn F calculada es ms extrema que el
punto de corte ai nivel 0,05 de significacin. Por lo tanto, el investigador rechazara la hiptesis
nula que establece que los tres grupos provienen de poblaciones con la misma media. El resul
tado sugiere que provienen de poblaciones con diferentes medias; que las personas expuestas a
diferentes tipos de informacin (o a la falta de informacin) acerca de los antecedentes delicti
vos de un acusado, en una situacin de este tipo calificarn de forma diferente a acusado en
cuanto a su culpabilidad.2

Otro ejemplo
Mikulincer (1998) realiz una serie de estudios en Israel utilizando la misma medida de clasifica
cin de estilo de vinculacin que vimos anteriormente en este captulo (vase tabla 11-1). Uno de
sus estudios inclua a 30 alumnos universitarios (10 para cada estilo de vinculacin), todos los
cuales tenan relaciones amorosas serias. Como parte del estudio, cada noche cada alumno anota
ba si durante el da su pareja haba hecho algo que traicionara su confianza. Los participantes ano
taban hechos tales como que su pareja llegaba muy tarde a un encuentro acordado o que
olvidaba comentar al participante algn plan de importancia. Los resultados, junto con los
clculos del anlisis de varianza, se indican en la tabla 11-7. A continuacin, se detallan los pasos
de la prueba de hiptesis.

2 Varios estudios reales han investigado sobre el hecho de si conocer ios antecedentes delictivos del acusado afecta la
probabilidad de que sea condenado. En trminos generales, la conclusin parece ser razonablemente coherente con la
del estudio ficticio aqu descripto. Para una revisin de tales estudios, vase Dae y Wrightsman (1982).

Tabla 11-7.
Cantidad de hechos que traicionan la confianza de individuos cometidos por sus parejas durante
tres semanas con tres estilos distintos de vinculacin.
E s t ilo d e v in c u la c i n

n
M

5
2
D istribucin F:

A nsoso-am bivalente

Evasivo
10
3 ,7 0
1,89
3,57

Seguro
10
2 ,1 0
1,66
2,7 6

10
4 ,2 0
1,93
3,72

%^Entr ~ ^Grupos - l = 3 - I = 2
S W r o " S h + g l 2 + . . . + g l )limo = (1 0 - l ) + ( 1 0 - 1) + ( 1 0 - - 1 ) = 9 + 9 + 9 = 27
F necesaria c o n un nivel de significacin de 0,05 tom ado de la tabla F , g l ~ 2 , T I : 3,36.
E stim acin intergrupal de varianza poblacional:
Tabla e n donde se encuentra la S 2 para las tres m edias

Seguro
Evasivo
A nsoso-am bvalente

SL,

-1 ,2 3
0,37
0,87

2,1 0
3,70
4,2 0
2 : 1 0 ,0 0
G M : 3,33

S i = X (M - GM) 2fglBnc = 2 ,4 1 /2 -

D e sv o cu a d r tic o

D esvo

1,51
0 ,1 4
0,76
2,41

% (M ~ -G M )2

1,205

W = (1.205) CIO) = 12,05

Estimacin intragrupal de varianza poblacional:

( ,

Dentro u

Razn F;

^Dentro

=S

+ . . . > * 2,76 + 3,57 + 3,72

-------------------- --------

^ J S 2^

N,Grupos

C M EnJ C M

------------ - --------------

l 0 '0 5

= 3,35

3
D^ Q = 12,05/3,35

= 3,60'

Fuente: MIkulmcer{1998).

1. Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de las


poblaciones. Existen tres poblaciones.
Poblacin 1: alumnos con un estilo de vinculacin seguro.
Poblacin 2: alumnos con un estilo de vinculacin evasivo.
Poblacin 3: alumnos con un estilo de vinculacin ansoso-ambivalente.
La hiptesis nula establece que estas tres poblaciones tienen la misma media (pj = p 2 ~ |x3). La
hiptesis de investigacin establece que sus medias son diferentes.
2. Determ inar las caractersticas de a distribucin comparativa. La distribucin compa
rativa ser una distribucin F. Sus grados de libertad son calculados de la siguiente manera: la es
timacin de la varianza intergrupal se basa en tres grupos, dando 2 grados de libertad. La
estimacin intragrupal se basa en 9 grados de libertad (10 participantes) en cada uno de los tres
grupos, dando un total de 27 grados de libertad.
3. Determ inar el punto m uestral de corte en la distribucin comparativa, a p artir del
cual debera rechazarse la hiptesis nula. Utilizando la tabla B-3, en el apndice B, buscamos

en la columna correspondiente a 2 grados de libertad en e numerador y nos detenemos en la fila


correspondiente a 27 grados de libertad del denominador. Utilizaremos el nivel 0,05 de significa
cin. El punto de corte F es de 3,36.
4, Determ inar el valor muestra! en la distribucin comparativa. Este paso requiere la de
terminacin de la razn F de la muestra. Calculamos e numerador, la estimacin intergrupal de la
varianza, en dos pasos. Primero estimamos la varianza de la distribucin de medias de muestras
con 10 observaciones. Lo hacemos utilizando las tres medias reales como s fueran nmeros indi
viduales. Tomamos sus desvos cuadrtcos con respecto a sus medias, lo que da un total de 2,41,
y dividimos el resultado por los grados de libertad, que son 2. El clculo da 1,205. El segundo pa
so es convertir esta estimacin de varianza de una distribucin de medas en una estimacin de
varianza de una poblacin de observaciones individuales. Se logra multiplicando la varianza de la
distribucin de medias por el tamao de muestra de cada media: multiplicamos 1,205 por 10. El
resultado es una estimacin de 12,05, que es el numerador de la razn F, es decir, la estimacin de
la varianza poblacional basada en la variacin entre grupos.
El denominador de la razn F, es decir, la estimacin intragrupa de varianza, es el promedio
de las estimaciones de varianza poblacional calculado a partir de cada muestra. (En este punto de
bemos tener cuidado de no equivocamos y utilizar estimaciones del desvo estndar de la pobla
cin), En el estudio que estamos analizando, el promedio de 2,76, 3,57 y 3,72 es 3,35. Este es
nuestro denominador de la razn F, es decir, la estimacin de la varianza poblacional basada en la
variacin dentro de los grupos.
La razn F es la estimacin intergrupal dividida por la estimacin intragrupa, lo que da 3,60
(es decir, 12,05/3,35 = 3,60).
5. C om parar los valores de ios pasos 3 y 4 p a ra decidir si se rechaza o no la hiptesis
nula. La razn F calculada es 3,60. Este resultado es ms extremo que el punto de corte corres
pondiente a un nivel de significacin 0,05, que es de 3,36. Por lo tanto, Mikulincer rechaz la
hiptesis nula. Poda concluir que la cantidad de traiciones a su confianza, por parte de sus pa
rejas, informada durante un perodo de 3 semanas por alumnos con los tres distintos estilos de
vinculacin, era diferente. Esta conclusin era coherente con la hiptesis de Mikulincer basada
en teoras sobre la vinculacin.

Resumen de los pasos a seguir para la prueba de hiptesis


utilizando el anlisis de varianza
La tabla 11-8 resume los pasos involucrados en un anlisis de varianza del tipo que hemos estado
estudiando en este captulo.

SUPUESTOS DEL ANLISIS DE VARIANZA_________ _____________________


Los supuestos del anlisis de varianza son bsicamente los mismos que los de la prueba t para me
dias independientes. Es decir, obtenemos resultados estrictamente precisos slo cuando las po
blaciones siguen una distribucin normal y tienen la misma varianza. Adems, al igual que con la
prueba t, en la prctica obtenemos resultados bastante aceptables aun cuando las poblaciones son
moderadamente distintas de lo normal y tienen diferencias moderadas en cuanto alas varianzas.
Como regla, podemos decir que si la estimacin de varianza del grupo con la mayor estima
cin no es mayor a 4 5 veces la varianza del grupo con la menor estimacin, y los tamaos de
muestra son iguales, las conclusiones deberan ser adecuadamente precisas.

Tabla 11-8.

Pasos a seguir para realizar un anlisis de varianza (cuando los tamaos de muestra son iguales).
1. Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de las poblaciones.
2. D eterm inar las caractersticas de la distribucin comparativa.
a) La distribucin comparativa es una distribucin F
b) L os grados de libertad dei numerador son la cantidad de grupos m enos 1:

^Grupos ^'

c) L os grados de libertad del denom inador so n la sum a de lo s grados d e libertad de cada grupo (la cantidad
en el grupo m enos 1): g /Dewro * g l } + g l 2 + . . . + g /ltim0.
3,

Determinar el punto de corte en la distribucin comparativa, a partir del cual debera rechazarse la hiptesis nula.
a) D eterm inar el nivel de significacin deseado,
b) B uscar en una tabla F el punto de corte indicado, utilizando los grados d e libertad calculados en e l paso 2.

4. D eterm inar el valor maestral en la distribucin comparativa. (Ser una razn F ).


a) Calcular la estim acin inergrupal de varianza poblaciona (S f ntte CMEn(re).
i) C alcular las medias de cada grupo.
i) Calcular una varianza estim ada sobre la base de las m edias de los grupos.

S* =2W-GM)Vgtn
iii) Convertir la estim acin d e ia varianza de una distribucin de m edias en una estim acin d e la varianza
de una poblacin de individuos, m ultiplicndola por la cantidad de observaciones de cada grupo:
b) Calcular ia estim acin intragrupal de varianza poblaciona f^ e(ltro CM'Da((0).
i) C alcular estim aciones de ia varianza poblaciona sobre la base d e los valores observados de cada grupo:
para cada grupo, S 2 = X (X - M ) V (n - 1) = S C I g l.
ii) Promediar las estim aciones de varianza:
^Datura ^ ^ D e n tro = (5^ + 5 2 + . + 5 2) kima)VGr])pos
c) C alcular la razn F: F = S ^ J S ^ w F = C M tJ C M D^ m
5. Comparar los valores de lo s pasos 3 y 4 para decidir si se rechaza o no la hip tesis nula.

Si el incumplimiento del supuesto de normalidad es grave, podemos utilizar procedimientos es


peciales que tienen en cuenta ese incumplimiento, ya sea transformando la distribucin para ha
cerla ms normal o bien no utilizando l supuesto de distribucin normal. Presentaremos estos
procedimientos en el captulo 15, Si el incumplimiento del supuesto de igual varianza es serio,
podemos utilizar procedimientos especiales que, de hecho; establecen un.punto de corte de razn
F ms exigente para determinar si el resultado es significativo a determinado nivel (como por
ejemplo el 5%). Estos procedimientos se describen en textos ms avanzados.

TAMAO DEL EFECTO Y POTENCIA DEL ANLISIS DE VARIANZA

Tamao del efecto


El tamao del efecto en el caso del anlisis de varianza es un poco ms complejo que en una prue
ba l Con la prueba /, sacamos la diferencia entre las dos medias y la dividimos por el desvo es
tndar. En el anlisis de varianza, tambin podemos dividir por el desvo estndar; sin embargo,
en ese caso tenemos ms de dos medias, por lo cual no queda claro cul es el equivalente a la dife-

renda entre medias, es decir, el numerador en el clculo del tamao del efecto. Cohn (1988) su
giere que en el anlisis de varianza deberamos considerar el tamao del efecto como la variacin
entre medias. Especficamente, Cohn recomienda utilizar el desvo estndar de la distribucin de
medias. As, define el tamao del efecto del anlisis de varianza (f) como el desvo estndar de
la distribucin de medias dividido por el desvo estndar de las observaciones individuales.3 Para
valores de poblacin verdaderos conocidos (o predichos) la frmula es la siguiente:
( 11- 8)

Dentro

Para estimar el tamao del efecto de un estudio ya realizado,

Am,

(U-9)

^Dentro

Las medidas de Cohn para el tamao del efecto del anlisis de varianza son: 0,10 para un efecto
pequeo, 0,25 para un efecto mediano y 0,40 para un gran tamao de efecto.
Analicemos nuestro experimento ficticio acerca de los antecedentes delictivos. En el estudio
calculamos que S^, la varianza estimada de la distribucin de medias basada en las medias de las
tres muestras, era igual a 4,34. SM, la raz cuadrada de S ^, es 2,08. Calculamos que 5^ei0, la esti
macin de la varianza de cada poblacin de individuos, basada en las estimaciones de varianza
utilizando los valores de cada grupo, era igual a 5,33.5Dentr0, la raz cuadrada de S$entxo, es 2,3 i .
Aplicando la frmula para el tamao del efecto estimado a partir de un estudio completo,
f =* Sm- = ^ = 0,90
^Dentro

2,31

Se trata de un tamao del efecto muy grande (gracias a nuestros datos, ficticios).
En el estudio referido a los estilos de vinculacin realizado porMikulmcer (1998),
, _
^Dentro

... I, * = 0,60
L 830

En este caso, tambin tenemos un gran tamao del efecto. Tanto en el estudio acerca de los ante
cedentes delictivos como en el estudio realizado por Mikulincer, esperaramos un tamao del
efecto importante slo por saber que F fue significativa en un estudio con tamaos de muestra pe
queos (vase captulo 8).
Tambin sucede que, con un poco de manipulacin algebraica, podemos estimar el tamao
del efecto slo conociendo F y la cantidad de observaciones en cada grupo. La frmula es,
( 11- 10)

3 En ei captulo 12, despus de que hayamos presentado el mtodo del modelo estructural para el anlisis de varianza,
aprenderemos cmo calcular otro tipo de tamao del efecto, la proporcin de varianza justificada. Este indicador del
tamao del efecto est relacionado con el mismo concepto en el anlisis de regresin (captulo 4), por eso tiene un sig
nificado ms directo para muchos investigadores, y lo veremos con frecuencia. En el captulo 12 trataremos la relacin
de / con este indicador del tamao del efecto.

Por ejemplo, en el estudio acerca de los antecedentes delictivos habamos calculado que F era
4,07, y haba cinco personas en cada grupo. Utilizando la frmula,
7=

( p _ -f,07 _ 2,02 ^
'vr
TZ
S
~ 2,24

Para el estudio acerca del estilo de vinculacin realizado por Mikulincer (1998),
f - =
-0,60
f 4n
V0 3,16
(Los resultados son iguales a los que calculamos utilizando las estimaciones de varianza). La fr
mula que acabamos de ver es muy til cuando se evala el tamao del efecto de un estudio en una
publicacin cientfica, en las que con frecuencia no se proporcionan detalles sobre las varianzas.

Potencia

La tabla 11-9 indica la potencia aproximada para un nivel de 0,05 de significacin, con tamaos
del efecto pequeos, medianos y grandes; tamaos de muestra de 10,20,30,40,50 y 100 por gru
po, y para tres, cuatro o cinco grupos. Los anteriores son los valores ms comunes de los distintos
parmetros que influyen sobre la potencia.4
Analicemos un estudio planificado que compara cinco grupos delO participantes cada uno,
con expectativa de un gran tamao del efecto (0,40), y que utiliza el nivel 0,05 de significacin.
Basndonos en la tabla 11-9, el estudio tendra una potencia de 0,56, lo que implica que aun si la
hiptesis de investigacin es en efecto verdadera y tiene un gran tamao del efecto, existe slo un
poco ms del 50 % de posibilidades (56%) de que el estudio resulte significativo.
Como observamos en captulos anteriores, determinar la potencia es especialmente til cuan
do se interpretan las implicancias prcticas de un resultado no significativo. Por ejemplo, supon
gamos que hemos ledo un estudio que utiliza un anlisis de varianza para cuatro grupos de 30
participantes cada uno, en el que el investigador informa un resultado no significativo al nivel
0,05 de significacin. La tabla 11-9 indica una potencia de slo 0,13 para un tamao del efecto
pequeo. Esto sugiere que aun si dicho efecto leve existe en la poblacin, hubiera sido muy im
probable que este estudio resultara significativo. Pero la tabla indica una potencia de 0,96 para un
gran tamao del efecto, lo que sugiere que si existiera un gran efecto en la poblacin, casi segura
mente se habra reflejado en el estudio.
P lan ificaci n del tam ao m uestral

La tabla 11-10 nos indica la cantidad aproximada de participantes necesarios en cada grupo para
tener un 80% de potencia al nivel 0,05 de significacin, con tamaos estimados del efecto peque
os, medanos y grandes y en estudios con tres, cuatro y cinco grupos.5 Por ejemplo, supongamos
4 Cohen (1988, pp. 289-354) proporciona tablas ms detalladas. Al utilizar estas tablas, se debe observar que el valor u
en ia parte superior de cada una de las tablas se refiere a gEntre, el cual en el caso de un anlisis de varianza de un crite
rio es la cantidad de grupos menos 1, y no la cantidad de grupos, como sucede en la tabla I i -9.
5 Cohen (1988, pp. 381-389) nos proporciona tablas ms detalladas. Sise utilizan, se debe tener en cuenta la nota a pie
nmero 4 de ste captulo.

Tabla li-9.
P o ten cia a p ro x im ad a p a ra estu d ios q u e u tiliza n el an lisis de varian za p rob an d o la h ip tesis a nivel
0,05 de sign ificacin .
Tamao del efecto
Participantes por grupo (n )
Tres grupos (g L ntr- 2)
10
20
30
40
50
100
Cuatro grupos (gfFntre * 3)
10
20
30
40
50
100
Cinco grupos ( g L nlI = 4 )
10
20
30
40
50
100

Pequeo
(0,10)

Mediano
(0,25)

Grande
(0,40)

0,07
0,09
0,12
0,15
0,18
0,32

0,20
0,38
0,55
0,68
0,79
0,98

0,45
0,78
0,93
0,98
0,99
*

0,07
0,10
0,13
0,16
0,19
0,36

0,21
0,43
0,61
0,76
0,85
0,99

0,51
0,85
0,96
0,99
*
*

0,07
0,10
0,13
0,17
0,21
0,40

0,23
0,47
0,67
0,81
0,90
*

0,56
0,90
0,98
*
*
*

*Casi 1,

que estamos planificando un estudio que involucra cuatro grupos, del cual esperamos un tamao
del efecto pequeo (y utilizramos el nivel 0,05 de significacin). Para obtener una potencia del
80% necesitaramos 274 participantes en cada grupo, un total de 1.096. Sin embargo, suponga
mos que pudiramos adaptar el plan de investigacin de tal forma que fuera razonable predecir un
gran tamao del efecto (tal vez utilizando medidas ms precisas y una manipulacin experimental
ms poderosa). En ese caso, necesitaramos slo 18 participantes para cada uno de los cuatro gru
pos, un total de 72.

T abla 11-10.
C an tid ad ap ro x im ad a de p articip an tes n ecesarios en ca d a gru p o (su p on ien d o qu e las m u estras
ten g a n el m ism o tam ao) para lo grar u n 80% d e p o ten cia en u n anfisis de varian za de un criterio
qu e p ru eb a la h ip tesis al nivel 0,05 d e sign ificacin .
Tam ao del efecto

Tres grupos (g/Ewe = 2)


Cuatro grupos (g lEae = 3)
Cinco grupos (gEn(re = 4)

Pequeo
(7= 0,10)
322
274
240

Mediano
(7= 0,25)
52
45
39

Grande
(7= 0,40)
2
18
16

CONTROVERSIAS Y UM TACONES: A SIG N A C I N ALEATORIA


VERSUS SELECCIN SISTEMTICA
Existe una controversia relacionada con el anlisis de varianza que se refiere al diseo de experi
mentos. Comnmente, la forma ptima de emprender un experimento es utilizando asignaciones
totalmente aleatorias para las condiciones experimentales (vase apndice A). Sin embargo, in
cluso con la asignacin aieatoria contina existiendo cierta variacin aleatoria debido a las dife
rencias entre los participantes, lo cual agrega confusin al experimento. Por lo tanto, algunos
investigadores modifican la asignacin aleatoria estricta preparando sus estudios de modo de
asegurarse que los participantes de cada grupo experimental sean, en lneas generales, semejan
tes en cuanto a una o ms variables relevantes para el estudio. Analicemos un estudio en ei que
alumnos de cuarto grado sern asignados a uno de los tres diferentes programas experimentales
de matemtica. Es probable que los investigadores quieran asegurarse que el ci promedio y la
capacidad promedio para la matemtica sean iguales en cada uno de los grupos antes de comen
zar el experimento.6
La controversia acerca de la utilizacin.de equiparacin de grupos, para minimizar las dife
rencias promedio en las variables relevantes, est relacionada con el efecto que ese procedimien
to tiene sobre la potencia del anlisis de varianza para probar el resultado del estudio. La
seleccin sistemtica reduce artificialmente la variacin natural entre muestras (a tal punto que
las variables sobre las cuales se realiza la equiparacin estn relacionadas con la variable estudia
da). S disminuimos la variacin aleatoria entre las muestras, la variacin general entre medias, es de
cir, el numerador de la razn F, en lneas generales sena menor. Por el contrario, el denominador
de la razn F, la estimacin intragrupal de la varianza, no es afectada por el hecho de que se reali
ce una equiparacin de grupos o una asignacin aleatoria ordinaria. Si reducimos el numerador
y mantenemos igual el denominador, la razn F slo puede disminuir. Una razn F menor signifi
ca menor posibilidad de obtener un resultado significativo, aun si existe una verdadera diferencia
de medias entre las poblaciones representadas por las condiciones experimentales; es decir, dis
minuye la potencia. (Lo que acabamos de describir se contradice con lo que nos dira nuestra in
tuicin, ya que, a primera vista, reducir la confusin debera aumentar la potencia. El problema
radica en que estamos reduciendo la confusin de manera despareja; por lo tanto, la confusin
que normalmente contribuira a la estimacin intergrupal de la varianza se pierde, mientras que la

6 Una forma de realizar esta seleccin sera comenzar con un grupo de todos los participantes disponibles. Primero se
leccionaramos al azar tantos com o fueran necesarios para el primer grupo. Luego seleccionaramos ai azar alumnos
adicionales para cada uno de los otros grupos, unos pocos por vez, adaptando las inclusiones coherentemente hasta que
los tres grupos tuvieran los mismos promedios de ci y capacidad matemtica. En este tipo de equiparacin de grupos, la
estructura resultante sigue siendo un verdadero experimento: el experimentador determina en qu grupo se incluye un
participante utilizando procedimientos aleatorios; cualquier nio tiene las mismas posibilidades de pertenecer a cual
quiera de los tres grupos. N o se debe confundir esta clase de equiparacin de grupos (la equiparacin que vem os en es
ta seccin) con otros dos tipos de equiparacin. Uno de estos otros tipos de equiparacin se realiza cuando la
asignacin aleatoria no e s posible. Se intenta seleccionar personas de diferentes poblaciones preexistentes, de forma tal
que las muestras sean lo ms similares posibles. Un ejemplo sera un estudio en el que se comparen hombres y mujeres
o personas de tres nacionalidades diferentes. En tal estudio, no podramos asignar a las personas al azar a los grupos de
los diferentes sexos o nacionalidades, pero podramos intentar que los grupos que estudiamos sean similares en cuanto
a la edad, preparacin educativa, y as sucesivamente. Es un mtodo mucho menos riguroso que la verdadera asigna
cin aleatoria a los grupos.
Existe un segundo tipo de equiparacin que no estamos tratando aqu, que es una especie de equiparacin uno-a-uno.
Por ejemplo, un investigador podra seleccionar series de tres estudiantes, en las que los tres estudiantes son muy sim i
lares y, luego, a partir de cada serie, los tres son asignados al azar a cualquiera de las tres condiciones experimentales.
Este tipo de equiparacin individual, que no es controvertida, es casi siempre ventajosa, pero rara ve 2 prctica.

confusin que contribuye a la estimacin intragrupai de varianza permanece igual). Por lo tanto,
la recomendacin tradicional en la mayora de los libros de diseo experimental es que no se uti
lice este tipo de equiparacin de grupos al programar los experimentos.
Sin embargo, Ross y Klein (1988) han cuestionado esta recomendacin tradicional. Ellos re
conocen que con la equiparacin de grupos, el numerador de la razn F (y por lo tanto la razn F
en su totalidad), en lneas generales se reduce. Pero tambin sealan que esto sucede en lneas ge
neraies, y que es bastante posible que, en determinadas situaciones que pueden especificarse, la
razn F en realidad aumente por causa de ese procedimiento.
Ross y Klein realizaron una serie de estudios de Montecario (vase cuadro 10-1) para deter
minar el efecto real de la equiparacin de grupos en distintas condiciones. El resultado de sus es
tudios fue que utilizar la equiparacin de grupos, en comparacin con la asignacin aleatoria
ordinaria, a) es conveniente si la hiptesis nula es verdadera, en cuanto a que se reduce la posibi
lidad de cometer un error Tipo I (rechazar equivocadamente la hiptesis nula); b) no es conve
niente cuando la hiptesis de investigacin es verdadera, pero las diferencias reales entre las
medias grupales son pequeas debido a que, en este caso, la potencia se reduce, y c) es convenien
te cuando la hiptesis de investigacin es verdadera y las diferencias reales entre las medas gru
pales son grandes porque, en este caso, la potencia aumenta. De todos modos, en todos tos casos
la mejor opcin es utilizar la equiparacin de gmpos, pero analizando los resultados con un pro
cedimiento estadstico ms sofisticado denominado anlisis de covarianza (brevemente descripto en el captulo 17). El anlisis de covarianza tiene en cuenta sistemticamente ios valores
observados en cada participante en las variables en las que se realiza a equiparacin. Lamenta
blemente, este procedimiento no puede ser utilizado en muchos casos, ya sea porque no pueden
cumplirse los exigentes supuestos o porque la informacin necesaria no est disponible. Por lo
tanto, cuando en un estudio es factible la equiparacin de grupos, sta parece recomendable en las
situaciones a) y c) establecidas por Ross y Klein, aun s el procedimiento especial de anfisis de
covarianza no puede utilizarse, y el querido y viejo anfisis de varianza estndar s.

EL ANLISIS DE VARIANZA SEGN SE DESCRIBE


EN LAS PUBLICACIONES CIENTFICAS
Un anlisis de varianza del tipo que hemos analizado en este captulo usualmente se describe en
una publicacin cientfica a travs del F, los grados de libertad, y el nivel de significacin, por
ejemplo, F (3 ,67) = 5,81, p< 0,01. Las medias grupales generalmente se informan en una tabla,
aunque si hay slo unos pocos grupos y slo una o unas pocas medidas, las medias pueden apare
cer en el texto. Volviendo al ejemplo del experimento referido a los antecedentes delictivos, po
dramos describir los resultados del anlisis de varianza de la siguiente manera: Las medias
correspondientes al grupo de antecedentes delictivos, al grupo sin antecedentes delictivos, y al
grupo sin informacin eran 7,0,4,0 y 5,0 respectivamente, F(2,12) = 4,07, p < 0,05.
El siguiente ejemplo fue tomado de una publicacin. Grilo et al. (1997) son psiclogos clni
cos interesados en la relacin de la depresin y la utilizacin de substancias qumicas con los tras
tornos de personalidad. Los trastornos de personalidad son caractersticas y comportamientos
problemticos y persistentes que exceden el rango usual de las diferencias individuales. Los in
vestigadores realizaron entrevistas para evaluar trastornos de personalidad en adolescentes inter
nados en hospitales psiquitricos con alguno de estos tres diagnsticos: alto grado de depresin,
abuso de substancias qumicas y ambos, es decir, depresin y abuso de substancias qumicas. Las
cantidades medias de trastornos de personalidad fueron las siguientes: alto grado de depresin

M = 1,0; abuso de substancias M ~ 0,7; ambas condiciones M - 1,9. Los investigadores informa
ron: Los tres grupos de estudio diferan en el promedio de trastornos de personalidad diagnosti
cados. F(2tll2 ) =10,18, p < 0,0001. En este estudio, como en la mayora de los casos que
involucran anlisis de varianza, es comn que los investigadores posteriormente realicen algn
anlisis sistemtico para averiguar qu medias difieren significativamente de qu otras medias.
Ese tema ser tratado en el captulo 12.

Resumen
El a n o v a prueba la hiptesis de que hay diferencias entre las medias de varias poblaciones. El
procedimiento compara dos estimaciones de la varianza poblacional. Una, denominada estima
cin intragrupal, que se determina por el promedio de las estimaciones de la varianza realizadas
a partir de cada una de las muestras. La otra, denominada estimacin ntergrupaT, se basa en la
variacin entre las medias mustrales.
La razn F es igual a la estimacin intergrupal dividida por la estimacin intragrupal. La hi
ptesis nula establece que todas las muestras provienen de poblaciones con la misma media. Si la
hiptesis nula es verdadera, la razn F debera ser aproximadamente 1, ya que las dos estimacio
nes de la varianza poblacional se basan en lo mismo, la variacin dentro de cada poblacin. Pero
si la hiptesis de investigacin es verdadera, y las muestras provienen de poblaciones con diferen
tes medias, la razn F debera ser mayor a 1, ya que la estimacin intergrupal se ve, en ese caso,
influenciada tanto por la variacin dentro de las poblaciones como por la variacin entre las po
blaciones, mientras que la estimacin intragrupal contina afectada slo por la variacin dentro
de cada una de las poblaciones.
Cuando las muestras tienen el mismo tamao, la estimacin intragrupal de la varianza poblacional es el promedio de las estimaciones de la varianza poblacional calculadas a partir de cada
muestra. La estimacin intergrupal de la varianza poblacional se realiza en dos pasos: primero, se
estima la varianza de la distribucin de medias sobre la base de las medias de las muestras reales
(para realizar este clculo se utiliza la frmula usual de estimacin de la varianza poblacional a
partir de valores mustrales). En segundo lugar, se multiplica la estimacin anterior por el tamao
de la muestra de cada grupo. A travs de este segundo paso obtenemos la varianza de la distribu
cin de valores individuales a partir de la varianza de la distribucin de medias.
Los supuestos del anlisis de varianza son los mismas que los de la prueba t; las poblaciones
deben estar normalmente distribuidas y tener las mismas varianzas. Se ha descubierto que el an
lisis de varianza, al igual que la prueba t, otorga resultados razonablemente precisos aun cuando
se violen moderadamente los supuestos.
El tamao del efecto en el anlisis de varianza puede calcularse como el desvo estndar de la
distribucin de medias dividido por el desvo estndar de la distribucin de observaciones indivi
duales. En el caso de un estudio ya realizado, tambin se puede calcular como la raz cuadrada de
F dividida por la raz cuadrada de la cantidad de participantes en cada grupo. La potencia depen
de del tamao del efecto, de la cantidad de personas que participan en el estudio, del nivel de sig
nificacin y de la cantidad de grupos.
Asignar participantes sistemticamente a los grupos experimentales, para asegurar prome
dios similares en cuanto a variables de fondo, generalmente reduce la potencia. Esto ocurre por
que el procedimiento reduce la contribucin de varianza aleatoria a la estimacin intergrupal,
pero no a la estimacin intragrupal. Sin embargo, en ciertas condiciones el procedimiento puede
aumentar la potencia.

Trminos clave
- ANOVA.

- Grados de libertad intergrupales


-Estimacin intergrupal de la varianza
poblacional (Sntre CMEntre).
- Grados de libertad del denominador

- Distribucin F.
- Razn F.
~ Tabla F.
- Gran media iGM).
- Grados de libertad
del numerador (gEntre).

- Grados de libertad
intragrupales (g/DenlX0).
- Estimacin intragrupal
de la varianza poblacional
^Dentro ^ ^^Dentro^'

^Denro^*
- Tamao del efecto del anlisis
de varianza (j).

Ejercicios

(a) Grupo 1 Grupo 2 Grupo 3


10
10
10
6,8
6,8
7,4
S2 0,82
0,90
0,80
(b) Grupo 1 Grupo 2 Grupo 3 Grupo 4

n
M

Los ejercicios implican la realizacin de clcu


los (con la ayuda de una calculadora). La ma
yora de los problemas estadsticos reales se
resuelven por computadora, pero aunque exis
ta la posibilidad de utilizarla, es conveniente
realizar estos ejercicios manualmente para in
corporar el mtodo de trabajo.
Para adquirir prctica en la utilizacin de
una computadora, para resolver problemas esta
dsticos, se puede utilizar la seccin de compu
tacin de cada captulo, publicada en la Gua de
estudio y libro de tareas de computacin para el
alumno [Students Study Guide and Computer
Workbook] que acompaa este libro.
Todos los datos de esta seccin son ficti
cios (a menos que se especifique lo contrario)
Las respuestas a los ejercicios de la serie I
se encuentran al final del libro.

n
M
S

SERIE I

(a) Grupo 1

Grupo 2

Grupo3

8
1.
Para cada uno de los siguientes estudios,
8
decida si se puede rechazar la hiptesis nula que
7
establece que los grupos provienen de poblacio
9
nes idnticas. Utilice el nivel 0,05. Adems, calcu (b) Grupo 1
le el tamao del efecto y la potencia aproximada
12
de cada uno. (Asegrese de mostrar todos sus
04
clculos. Observe tambin que con respecto a los
12
04
estudios b y c indicamos S, y no S2).

6
6
5
7
Grupo 2

4
4
3
5
Grupo 3

10
02
10
02

8
0
8
0

25
25
25
25
94
124
101
105
24
25
31
28
(c) Grupo 1 Grupo 2 Grupo 3 Grupo 4 Grupo 5

n
M
S

25
94
24

25
101
28

25
124
31

25
105
25

25
106
27

2.
Para cada uno de los siguientes estu
dios, decida si se puede rechazar la hiptesis
nula que establece que los grupos provienen de
poblaciones idnticas. Utilice el nivel 0,01.
Adems, calcule el tamao del efecto y la po
tencia aproximada de cada uno. (Asegrese de
mostrar todos sus clculos).

3,
Se le pidi a un psiclogo de un hospital
mental entre los prisioneros difiere segn el ti
mental privado que determine si exista alguna po de instalaciones de la prisin. El investiga
diferencia clara en la duracin del perodo de dor selecciona al azar 40 prisioneros de cada
internacin de pacientes con diferentes catego uno de los tres tipos principales de prisin de
ras de diagnstico. Analizando a los ltimos un Estado determinado de los e e . u u . y realiza
cuatro pacientes en cada una de las tres catego exmenes para determinar la necesidad de cui
ras ms importantes, los resultados (en trmi dado de la salud mental de los prisioneros. En
nos de semanas de internacin) fueron los la publicacin que describe los resultados, el
siguientes;
investigador informa las medias de cada grupo
en cuanto a necesidad de cuidado de la salud
Categora de diagnstico
mental, y luego agrega; La necesidad de cui
dado de la salud mental entre prisioneros de
T r a s to rn o s
T r a s to r n o s
T r a s to r n o s r e la c io n a d o s co n
los tres tipos de sistemas penitenciarios pare
a f e c tiv o s
c o g n itiv o s
la s d r o g a s
ce ser claramente diferente, F(2, 1 1 7 )- 5,62,
7
12
08
p < 0,01. Explique el significado de lo ante
6
08
10
rior a una persona que nunca ha asistido a un
5
09
12
6
i!
10*45
curso sobre estadstica.
. Qu clase de palabras son ms largas,
Utilizando un nivel 0,05, existe alguna dife los sustantivos, los verbos o los adjetivos? To
rencia significativa en la duracin del perodo me un diccionario, busque hojas al azar (utili
de internacin entre las distintas categoras de zando los nmeros aleatorios que aparecen
diagnstico? a) Realice los cinco pasos de la debajo) y descienda por la columna hasta que
prueba de hiptesis, b) Explique su respuesta a encuentre un sustantivo. Anote su longitud (en
alguien que comprende todo lo relacionado cantidad de letras). Haga lo mismo con 10 sus
con la realizacin de una prueba t para medias tantivos diferentes. Repita el proceso con 10
independientes pero que nunca ha escuchado verbos y luego con 10 adjetivos. Despus reali
hablar del anlisis de varianza.
ce un anfisis de varianza comparando los tres
4. Un estudio comparaba la intensidad del
tipos de palabras. Adems, suponiendo que
amor no correspondido entre tres grupos: i) 50
existe una gran tamao del efecto, cul es la
individuos que estaban experimentando un amor
potencia de este estudio (a un nivel de 0,05), y
no correspondido, que tenan una media de in
cuntas palabras de cada tipo seran necesarias
tensidad experimentada = 3,5, S2 = 5,2; ii) 50
para
tener una potencia del 80%?.
individuos que haban experimentado anterior
mente un amor no correspondido y describan su
experiencia retrospectivamente, M = 3,2,S2- 5,8
y iii) 50 individuos que nunca haban experi
mentado un amor no correspondido pero des
criban cmo pensaban que se sentiran si les
ocurriera, M - 3,8, 2 = 4,8. Determine la sig
nificacin de la diferencia entre los grupos uti
lizando el nivel del 5%. a) Realice los cinco
pasos de la prueba de hiptesis, b) Calcule el
tamao del efecto y la potencia, c) Explque-su
respuesta a alguien que nunca ha asistido a un
curso de estadstica.
5. Un investigador est preocupado porque
considera que la necesidad cuidado de la salud

651, 73, 950, 320, 5 6 4 , 666, 7 3 6 , 7 6 8 , 661, 484,


990, 379, 3 2 3 , 2 1 9 , 7 1 5 , 472, 176, 811, 167, 612,
102, 4 5 2 , 849, 6 1 5 , 2 2 8 , 352, 851, 9 8 1 , 821, 834,
7 1 9 ,5 2 5 , 9 0 7 ,4 4 8 ,4 , 335, 6 7 1 ,1 1 8 ,4 0 3

SERIE Ii
1.
Para cada uno de ios siguientes estu
dios, decida si se puede rechazar la hiptesis
nula que establece que los grupos provienen de
poblaciones idnticas. Utilice el nivel de 0,05.
Adems, calcule el tamao del efecto y la po
tencia aproximada de cada uno. (Asegrese de
mostrar todos sus clculos).

que su respuesta a alguien que comprende to


do lo relacionado con la realizacin de una
prueba t para medias independientes pero que
nunca ha escuchado hablar del anlisis de vaG ru p o 2
3
rianza.
10
4. Son diferentes los alumnos de distin
12
tas facultades en cuanto a su sociabilidad? Se
6
seleccionaron al azar 25 alumnos de cada una
G rupo 2
3
de las tres facultades de una determinada ciu
n
5
5
M
10
14
dad, y se les pidi que informaran acerca de la
S2
4
6
cantidad de tiempo que dedicaban cada da a
(d ) G r u p o 1
3
G ru p o 2
las relaciones sociales con otros alumnos. Los
n
5
5
resultados
para la facultad X fueron una me
M
10
12
dia de 5 y una varianza poblacional estimada
&
2
3
de 2; para la facultad Y, M = 4, S2 = 1,5, y pa
2. Para cada uno de los siguientes estudios,
ra la facultad Z, M - 6, S2 = 2,5. Cul sera
decida si se puede rechazar la hiptesis nula
su conclusin? Utilice el nivel 0,05. a) Reali
que establece que los grupos provienen de poce los cinco pasos de la prueba de hiptesis.
blaciones idnticas. Utilice el nivel 0,05. Adeb) Calcule el tamao del efecto y la potencia.
ms, calcule el tamao del efecto para cada uno.
c) Explique su respuesta a alguien que nunca
(Asegrese de mostrar todos sus clculos).
ha asistido a un curso de estadstica.
5. Se realiza un experimento en el que 60
participantes completan una prueba de perso
(a) G r u p o 1
G ru p o 2
G ru p o 3
1
8
1
nalidad de cada uno, pero no acerca d la for
2
7
2
ma en que los participantes se ven a s mismos.
1
1
8
En
realidad, se asignan i 5 alumnos al azarpara
7
2
2
completar la prueba segn el modo en que
G rupo 3
(b ) G r u p o 1
G rupo 2
piensan que los ven sus madres (es decir, la
4
1
8
2
5
7
forma en que creen que sus madres completa
4
8
1
ran la prueba para describir a los propios parti
5
7
2
cipantes); 15 para completarla segn lo haran
sus padres con respecto a ellos; 15 para com
3.
Un psiclogo especializado en asuntospletarla segn lo haran sus mejores amigos
empresariales estaba interesado en averiguar si con respecto a ellos, y 15 para completarla se
los individuos que trabajaban en diferentes gn lo haran sus profesores con respecto a
sectores de la empresa tenan diferentes actitu ellos. Los resultados principales aparecen en la
des hacia la misma. Los resultados correspon tabla 11-11. Explique estos resultados a una
dientes a las tres personas entrevistadas del persona que nunca ha asistido a un curso de es
rea de ingeniera fueron 10,12 y 11; los resul tadstica.
tados de los tres del rea de comercializacin
6. Corte 100 papelitos de aproximadamen
6 ,6 y 8; los resultados de los tres miembros de te el mismo tamao y escriba un uno en 16 pa
contadura, 7 ,4 y 4; y los resultados de ios tres pelitos, un dos en 34 papelitos, un tres en 34
de produccin, 14, 16 y 13 (los nmeros ms papelitos, y un cuatro en 16 papelitos (est
altos indican actitudes ms positivas). Exista creando una distribucin aproximadamente
una diferencia de actitud significativa hacia la normal). Ponga los papelitos en un recipiente o
empresa entre empleados de diferentes secto sombrero, mzclelos, extraiga dos, anote los
res de la misma al nivel 0,05? a) Realice los nmeros que extrajo, y vulvalos a introducir
cinco pasos de la prueba de hiptesis, b) Expli en el recipiente. Despus extraiga otros dos,
(a) G r u p o 1
5
10
S2
4
(b ) G r u p o 1
n
10
A#
10
&
4
(c) G r u p o 1

n
M

G rupo

5
12
6

G rupo
5
14
5
G ru p o
10
14
5
G ru p o
5
18
5
G rupo
5
14
2 ,5

anote sus nmeros, y vulvalos a introducir; y


finalmente otros dos, anote sus nmeros y vul
valos a introducir. (En un sentido estricto, de
bera realizar la muestra con reemplazo"; eso
significa volver a introducir cada uno de los papelitos despus de anotar el nmero, y no los dos
juntos, pero queremos ahorrarle un poco de
tiempo, y en este caso la modificacin del pro
cedimiento no causar gran diferencia). Calcu
le un anlisis de varianza para los tres grupos
de dos valores cada uno, seleccionados al azar.

Anote la razn F y repita todo el proceso de


seleccin y anlisis de varianza nuevamente,
Realice todo el proceso al menos 20 veces y
cree un polgono de frecuencias con sus resul
tados. Lo que est creando es una distribu
cin F para 2 (3 grupos - 1) y 3 (4 - 1 en cada
uno de los tres grupos) grados de libertad. En
qu punto comienza el 5% superior de sus va
lores F? Compare ese resultado.con el punto de
corte del 5% indicado en la tabla F del apndice
B para 2 y 3 grados de libertad.

Tabla 11-11.
Medias de las escalas principales de medicin de la personalidad correspondientes a cada condicin
experimental (datos ficticios).
E sc a la
Conform idad
E xtroversion
M adurez
C onfianza
en s m ism o

*p <0,05;

< 0,01.

M a d re

P a d re

A m igo

P r o fe so r

24
14
15
38

21
13
15
42

12
15
22
27

16
13
19
32

F (3 ,5 6 )

4 ,2 1 * *
2,05
3,11*
3 ,58*

El modelo
estructural
en el anlisis
I de varianza

D e sc r ip c i n d ei capitulo
Principios del modelo estructural.
Controversias, limitaciones y desarrollos
recientes.
''
Utilizacin del modelo estructural para
realizar un anlisis de varianza.
El anlisis de varianza con modelo
estructural y las comparaciones
.X.
Tablas del anlisis de varianza.
mltiples segn se describen en
Anlisis de varianza con grupos de
publicaciones cientficas^
tamaos desiguales.' .
Resumen. .
..:
:
Resumen de ios procedimientos de

Trminos
clave.
clculo del anlisis de varianza
utilizando el modelo estructural.
;. ' Ejercicios.
Apndice I del captulo: frmulas de
^ Comparaciones mltiples/
clculo Optativas para la suniade
Supuestos del anlisis de varianza con
cuadrados n un anlisis de varianza d
muestras d taanos desiguales.
:;/
U
critrio. L L
'i--/'i:;^ - r f
Tamao del efecto y potencia.

n el captulo 11 presentamos la lgica bsica del anlisis de varianza. A modo de re


visin, podemos decir que el principio fundamental es que se realizan dos estima
ciones de la varianza poblacional. Una, denominada estimacin intergrupal de la
m varianza poblacional (52Entre CEntre), se basa en la variacin entre las medias de*
1

* los grupos. La otra, denominada estimacin intragrupal de la varianza poblacional


(^Dentro ^ ^D entro^se ^asa en Ia variacin de los registros dentro de cada uno de los grupos. Si la
hiptesis nula es verdadera, las dos estimaciones de la varianza poblacional deberan ser aproxi
madamente iguales y, por ende, la razn entre la estimacin intergrupal y la estimacin intragrupal, es decir, la razn F, debera ser aproximadamente 1. En cambio, cuando la hiptesis nula es
falsa, la estimacin intergrupal estar influida por la diferencia entre las medias pobiacionales.
Por lo tanto, la estimacin intergrupal ser mayor que la intragrupal, y la razn F ser mayor a 1.
En la prueba de hiptesis comparamos la razn F calculada con un punto de corte (obtenido de la
tabla F). El punto de corte es el extremo inferior de un intervalo de valores mayores que 1, el cual
se extiende sin lmite. La probabilidad de obtener una razn F en ese intervalo es del 5% (o del
1%) si la hiptesis nula es verdadera.
Partiendo de esta base, en el captulo 12 exploramos una forma alternativa, pero matemtica
mente equivalente, de interpretar el anlisis de varianza. Esa alternativa se denomina modelo es
tructural. Si bien tambin se aplica la lgica central aprendida en el captulo 11, el modelo
estructural proporciona una forma diferente y ms flexible de calcular las dos estimaciones de va
rianza poblacional. Este nuevo mtodo facilita el manejo de aquella situacin en la que la canti-

dad de individuos de cada grupo no es la misma, situacin especial que analizamos en este captu
lo. Adems, al comprender el modelo estructural podremos entender con mayor profundidad la
lgica implcita del anlisis de varianza. Finalmente, la comprensin del mtodo del modelo es
tructural ayudar a entender la forma en que las computadoras presentan los resultados del anli
sis de varianza.

PRINCIPIOS DEL MODELO ESTRUCTURAL

Particin de la desviacin
La idea central del modelo estructural requiere pensar en trminos de desviacin. En primer lu
gar, existe la desviacin de una observacin con respecto a la gran media. La gran media es la me
dia de todas las observaciones, independientemente del grupo en el que se encuentran. En el
ejemplo del estudio acerca de los antecedentes delictivos, analizado en el captulo 11, la gran me
dia de los 15 valores observados era 85/15 - 5,67. En el ejemplo del estudio referido a estilos de
vinculacin, estudiado en el mismo captulo, la gran media de las 30 observaciones con respecto
a la traicin de la confianza era 3,33.
Despus debemos pensar que la desviacin con respecto a la gran media tiene dos partes:
a) la desviacin de la observacin con respecto a la media de su grupo y b) la desviacin de la me
dia de su grupo con respecto a la gran media. Analicemos a un participante en el estudio acerca de
los antecedentes delictivos que calific la culpabilidad del acusado con 10. La gran media de las
calificaciones de culpabilidad de todos los participantes era 5,67. La calificacin de la persona en
cuestin presenta una desviacin total de 4,33 (10 - 5,67 - 4,33). La media, nicamente del gru
po de antecedentes delictivos, era 8. Por lo tanto, la desviacin de la calificacin de esta persona
con respecto a la media de su grupo es 2 (es decir, 10 - 8 = 2), y la desviacin de la media grupal con
respecto a la gran media es 2,33 (es decir, 8 - 5,67 = 2,33). Es importante observar que esas dos
desviaciones (2 y 2,33) suman la desviacin total de 4,33. La figura 12-1 grfica lo anterior. Es
conveniente estudiar este concepto hasta comprenderlo bien.

i /lorbse'rvadq

'Mediadel grupo

: y "'- Gran media-

\ , i:''Desviacin de valor observado "i / 1_-Qeswacih


''! y :,, y y'
' '
coa respecto a t-med'"~, -*+*- y ,dc grupo con respect 4. Mr,-y %
, Vi'"."
"de su grupo ' . , 1 i- . . -a la gran media' y - - tV'"-!
i '\
,y ( 19 - 8 = 2 }' V
' -V . ' ; (8 - 5,(57 = 2,33j;-'W . . : L ?

- Desviacin dlos, valores o b s e r v a d o s - , -7 ' : ;


con respecto a la.gran'meda-.' , y ->-j -

Figura 12-1. E jem p lo tom ado d e un e stu d io fic ticio acerca d e an teced en tes d e lic tiv o s, e n e l q u e se repre
sen ta la d e sv ia c i n d e la o b serv a ci n d e un ind ividu o c o n resp ecto a la gran m ed ia c o m o la su m a d e la
d e sv ia c i n d e la o b serv a ci n ind ividu al c o n respecto a la m ed ia d e su grupo, m s la d e s v ia c i n d e la m ed ia
d e su grupo c o n resp ecto a la gran m edia.

Suma de las desviaciones cuadrticas


El siguiente paso en la utilizacin de estas diferentes desviaciones es elevar a cada una al cuadra
do y sumar cada tipo de desviaciones cuadrticas de todos los participantes. El resultado es la su
ma de desviaciones cuadrticas de cada tipo de desviacin. Sucede que la suma de desviaciones
cuadrticas de cada observacin con respecto a la gran media es igual a a) la suma de las desvia
ciones cuadrticas de cada observacin con respecto a la media de su grupo ms b) la suma de las
desviaciones cuadrticas de la media del grupo de cada-observacin con respecto a la gran inedia.
El principio que acabamos de explicar se puede expresar con una frmula:
Z{X~GM)2 ~Z{ X~ M) 2 + Z{M~GM)2
CTotal = CDentro+CEntre
En esta frmula, Z (X - GM)2 5CJotal es la sum a de desviaciones cuadrticas de cada ob
servacin con respecto a la gran media, sin tener en cuenta el grupo en el que se encuentra la
observacin. X ( X ~ M) 2 SCDentro es la suma de la desviacin cuadrtica de cada observacin
con respecto a la media de su grupo, sumado al de todos los participantes.
- GM)2
SCEntre es la suma de la desviacin cuadrtica de la media del grupo al que pertenece cada ob
servacin con respecto a la gran media (nuevamente, en la suma interviene la de todos los par
ticipantes).
Esta regla se aplica slo a las sumas de las desviaciones cuadrticas. Si tomamos las observa
ciones individualmente, la suma de las desviaciones siempre coincide, pero no la de las desviacio
nes cuadrticas.
Estimaciones de la varianza poblacional
a partir de la suma de desviaciones cuadrticas
Ahora estamos listos para utilizar las sumas de las desviaciones cuadrticas para calcular las dos
estimaciones de la varianza poblacional necesarias. Para hacerlo, dividimos cada suma de desvia
ciones cuadrticas por los grados de libertad correspondientes. La estimacin intergrupal de la
varianza poblacional (5^,,^ CMEm) es la suma de las desviaciones cuadrticas de la media gru
pa! de cada observacin con respecto a la gran media (CEntre), dividida por ios grados de libertad
en los que se basa (g/Entre, la cantidad de grupos menos 1). Lo anterior se expresa bajo la siguien
te frmula,
2
TL(M-GM)2
C^Entre ~
E"re filEntre
,

Entre

( 12- 2)

%ntre

La estimacin intragrupal de la varianza poblacional (>5<E>entro CADentro) es la suma de las des


viaciones cuadrticas de cada observacin con respecto a la media de su grupo (SCD(tr0), dividi
da por los grados totales de libertad en los que se basa (g/Dentro; la suma de los grados de
libertad de todos los grupos, es decir, la cantidad de observaciones del primer grupo menos 1,
ms la cantidad de observaciones del segundo grupo menos 1, etc.) Lo anterior se expresa ba
jo la frmula,
2
^Dentro

S(X-M )*
SCD M
j
^^Dentro" ,
Dentro

^Dentro

(12-3)

Es importante mencionar que hemos ignorado ia suma de desviaciones cuadrticas de cada


observacin con respecto a la gran media (SCTota!). Esta suma de cuadrados es til principalmente
para controlar nuestra aritmtica. Recordemos que SCTota = SCDerCr0 + SCgritre.
La figura 12-2 nuevamente representa la particin de la desviacin en dos partes, pero esta
vez acenta la estimacin de la varianza poblacional con la que se relaciona cada desviacin.
Relacin del enfoque del modelo estructural con el mtodo del captulo 11
Los mtodos que acabamos de describir para el clculo de las estimaciones intragrupal e intergrupal de la varianza, utilizando el modelo estructural, dan exactamente el mismo resultado que los
mtodos que aprendimos en el captulo 11. (Si al alumno le divierte realizar manipulaciones alge
braicas, podra intentar llegar a las frmulas anteriores a partir de las que acabamos de aprender).
De todos modos, los procedimientos que realizamos para calcular esas estimaciones son bas
tante diferentes. En el caso del enfoque del modelo estructural que vemos en este captulo, cuan
do desarrollamos el mtodo de estimacin intragrupal de la varianza, en realidad nunca calcu
lamos la estimacin de varianza de cada grupo para luego promediarlas. Del mismo modo, en el
caso de la estimacin intergrupal, con el mtodo del modelo estructural, nunca multiplicamos
ningn nmero por la cantidad de observaciones de cada muestra. Sin embargo, lo importante es
que, con ambos mtodos, obtenemos las mismas estimaciones intragrupal e intergrupal de varian
za. Por lo tanto, de cualquier modo, los componentes utilizados para calcular la razn F son los
mismos. Y de todas maneras, el resultado es el mismo.
La lgica implcita en el anlisis de varianza con el modelo estructural es tambin esencial
mente la misma que la que aprendimos en el captulo 11, pero con un pequeo cambio. Lo que
permanece igual es el hecho de que si la hiptesis nula es verdadera, las dos stimaciones de la
varianza poblacional deberan ser prcticamente iguales, y si la hiptesis nula es falsa, la estima
cin intergrupal debera ser mayor (porque las diferencias entre las medias poblacionales contri
buyen a ello) que la estimacin intragrupal. El cambio radica en el nfasis. El mtodo que
aprendimos en el captulo 11 hace hincapi en los grupos ntegros, comparando una varianza ba
sada en las diferencias entre medias grupales con una varianza basada en el promedio de las varianzas grupales. El modelo estructural pone el acento en las observaciones individuales.
Compara una varianza basada en las desviaciones de las medias de los grupos a los que pertene-

Valorobservado,

.' \ \ 'M ed iad efgL p oL ;

c -V;;L

\ 'i .Desviacin dei valor observado. '.;;-; ^piylaplSn; d la-iedia..'- ri l con ;rsp ectrlan jfed faj'.v^
- L':L
r?1j a g r a n m d i a \ - "LL;
;<
. (bse d la cstimcrjL L fff;
^
: i? '-.Lintragrupal:d.vadanka^; fl:
- I . jY'' ' ''' -):; Desvial^lcLs% lores:obsm^^cS^^:::.L -L y y v ^ ^ ^ :;
" v j / : : .

: \ o n r e s p e t o - a l a ^

l 'i L - y ^ V O 'V L L L - 1-!

12-2. La desviacin de las observaciones con respecto a la media de su grupo es la base para la esti
macin intragrupal de la varianza poblacional. La desviacin de la media del grupo con respecto a la gran
media es la base de la estimacin intergrupal de la varianza poblacional.

Figura

cen los valores observados individuales con respecto a la gran media, con una varianza basada en
los desvos de los valores observados individuales con respecto a la media de su grupo. El mtodo
del captulo 11 se concentra directamente en los aspectos que contribuyen a la estimacin general
de la varianza poblacional; el modelo estructural se concentra directamente en los aspectos que
contribuyen a las partes en que se descomponen las desviaciones de las observaciones con respec
to a la gran media.
Las diferencias lgicas mencionadas anteriormente son bastante sutiles y, finalmente, se re
ducen a lo mismo. Entonces, s tanto los clculos como la lgica se refieren a lo mismo, por qu
debemos aprender dos formas diferentes de razonar ese tema? Hemos analizado el mtodo del ca
ptulo 11 principalmente porque es ms intuitivo. Es especialmente til para ayudar a comprender
de qu se tratan las estimaciones de la varianza poblacional, y por qu deberan ser iguales cuan
do la hiptesis nula es verdadera y diferentes cuando no lo es. Adems, con el mtodo del captu
lo 11 podemos calcular un anlisis de varianza en forma directa a partir de medias y varianzas de
grupos, sin necesidad de trabajar directamente con las observaciones.
Sin embargo, como dijimos al comienzo del captulo, es importante presentar el modelo es
tructural porque a) ha sido el ms utilizado (en parte porque es ms cercano a las frmulas de
clculo que durante tanto tiempo dominaron el razonamiento de todos), b) es ms flexible, y por
lo tanto ms fcil de utilizar cuando se trabaja con grupos de tamaos desiguales y con el anlisis
factorial de varianza (presentado en el captulo 13) y c) est relacionado con un mtodo matem
tico fundamental que queramos estar seguros de exponer a aquellos alumnos que podran llegar a
asistir a cursos ms avanzados de estadstica.

. El anlisis de.varianza es una maravillosa .


fluencia de la variable y el otro to. (Vase;; idea bsica que.vale la pena analizar un

;V poco ms, por dos motivos: primero, por- !;


Por ejemplo, para obserVar el efecto d;
V que en. la. medida que el alumno lea orea- ' I iniciar, una conversacin :.amistQsav; hac-:
lice investigaciones ir progresivamente. mos que un grupo converse .con un extra
adoptando esa'manera, de razonar ;y, se- . cada, da durante una semana, y que otro y
gundo, porqu de hecho es l forma en la
grupo no haga riada en. .especial. Despu;.
v;
;();vVVVr-;;V' . y
&
'.;
; ; . AI realizar cigiuiqf .inVestgaciii' (0 y ; caiitidiad^-de.; n V & ;im s^^
' ai intentar decidirfa:cfidad-^
: 'sipirsd'ss produjo algriafdiSenci^r"
qu estamos leyerdo)j. que ns interesa-1 nifprinamos. en is ds gmpos;lainfluem f :
saber es si determinada variable realinnte
. cia . de cualquier, otro factor que pudiera ;
origina alguna diferencia.'Organizamos ds::. causar sa:misma' dferencia: .:nadie; debe^ .
. (o m s)grupos para poder, mostrar:que
asociarse a un club o ir a.estas draht esa::
. cualquier diferencia en los resultados exissemana. Tambin intentamos controlar cualte puramente porque uri grupo.recibi la in- .. quier otro efecto aleatorio que pudiera '

provocar suficiente variacin como para fa


lindros violetas y latas amarillas, construi
cilitar que un grupo presentara diferencias
mos la informacin de forma tal que las va
por razones accidentales, y no utilizamos
riables importantes sean el color de pelo y el
personas muy diferentes a lo normal en
sexo de la persona (convertimos a la perso
cuanto a su atractivo fsico o que no hablen
na en e numerador, la varianza intergrupal).
el idioma con fluidez. (El procedimiento
El recipiente puede variar y no es importananteriormente descripto no es igual que la
. te. (lo convertimos en el denominador, la va
equiparacin de grupos, discutida en el ca
rianza ntragrupal). Pero si vemos muchos
ptulo 11, segn la cual los grupos son
otros
tipos de personas poniendo cartas siiri-,
iguales con respecto a alguna variable).
pre
en
cajas abovedadas color azul brillante,
Este tipo de razonamiento estndar
sabemos
que las cajas, son la diferencia ihacerca del diseo de la investigacin es pa
tergrupal
que importa, y las personas,(slo
ralelo a la lgica del anlisis de varianza,
elementos aleatorios (en Canad, seran ca
una tcnica puramente estadstica. Como lo
expresa uno de los libros de texto clsicos
jas rojas).
sobre diseo de investigacin (Derlinger,
Del mismo modo, como ingenuos psi
1973): La principal funcin tcnica del di
clogos podemos interesamos por el con
seo de la investigacin es controlar la va
cepto, denominado honestidad. Es una
rianza (p. 306). Es decir, los investigadores
caracterstica de ciertas personas o todos
buscan maximizar la varianza de la variable
tienen su precio? Sin duda, cada uno haexpresada por la hiptesis de investigacin
. br observado a distintas personas y situa-,
(el numerador, o varianza intergrupal), y
piones durante su vida, y tendr su propia
controlar las variables accidentales que no
teora
ai respecto. Esa teora refleja qu. asestn bajo estudio (las que. contribuyen a l ..
;
pecio
consideramos
mayor, es decir,, el n-;
denominador,'o varianza ntragrupal). Por lo '
merador, la caracterstica de honestidad, o
tanto, el anlisis de la varianza es muy simi
ei denominador, el -efecto de situaciones!
lar a la forma de pensar cuando planifica
, (tales cmo el monto de un soborno, la po
mos un experimento.
sibilidad de que los dems se enteren si uno
Tambin dijimos, sin embargo, que el
anlisis de varianza es similar a la forma en
fue honesto, etctera).
que siempre hemos pensado. Kelley (1971)
Si el alumno est familiarizado don el
sugiri que, en el fondo, todos somos cien
trabaj del psiclogo Jean Piaget, espe
tficos, puesto que todos formulamos hip
cialista en el campo del desarrollo, reco
tesis y las sometemos a prueba; y el mtodo
nocer, que el tipo de razonamiento, del
que utilizamos para distinguir y tomar de
anlisis d varianza es parte de lo qu l
cisiones acerca de la causalidad aplica el
llamaba operaciones frmales, el estil
razonamiento del anlisis de varianza. Su
de pensamiento abstracto normalmente
pongamos que estamos de visita en un pas,
adquirido alrededor de los 14 aos. Por lo
y mientras viajamos observamos a una mu
tanto,
n deberamos tener inconvenientes
jer rubia que arroja cartas dentro de una ca
en comprender el anlisis de varianza,
ja azul brillante con forma abovedada. Si
inocentemente, lo hemos estado utilizan-,
vemos otras mujeres rubias arrojando car
do durante aos!
tas dentro de cajas verdes, cajones rojos, ci-

UTIUZACIN DEL MODELO ESTRUCTURAL PARA REALIZAR UN


ANLISIS DE VARIANZA
La tabla 12-1 indica los clculos completos utilizando el modelo estructural para realizar un an
lisis de la varianza del estudio acerca de los antecedentes delictivos. La tabla muestra los tres ti
pos de desviaciones y desviaciones cuadrticas de cada observacin. Por ejemplo, en el caso de la
primera persona, la desviacin con respecto a la gran media es 4,33 (el 10 menos la gran media de
5,67), y esa desviacin elevada al cuadrado es 18,74. La desviacin de la observacin con respec
to a la media de su grupo es 2, y esa desviacin elevada al cuadrado es 4, Finalmente, a desvia
cin de la media del grupo de la observacin con respecto a la gran media es 2,33, y esa
desviacin elevada al cuadrado es 5,43. Cabe notar que la desviacin de la meda del grupo de ca
da observacin con respecto a la gran media (en este caso 2,33) es Igual para todas las observacio
nes de un mismo grupo. Al final de cada columna, tambin hemos sumado las desviaciones
cuadrticas de cada tipo.
La parte inferior de la tabla 12-1 indica los clculos del anlisis de varianza. Primero, calcula
mos las tres sumas de desviaciones cuadrticas (5CTotal, CDentJ.0 y CE[ltre). El siguiente paso es
controlar la exactitud del clculo; lo hacemos siguiendo el principio que establece que la suma de
las desviaciones cuadrticas de cada observacin con respecto a la gran media es igual a la suma
de los otros dos tipos de desviaciones cuadrticas.

Tabla 12-1.
Anlisis de varianza del estudio acerca de los antecedentes delictivos (datos ficticios)
utilizando el mtodo del modelo estructural (comparar con tablas 11-3 y 11-4).
G r u p o co n a n tec e d e n te s d elictivos

10
7
5
10
8

X - GM
Desviacin
Desviacin cuadrtica
4 ,3 3
1 ,3 3
0 ,6 7
4 ,3 3
2 ,3 3

1 8 ,7 4
1 ,7 7
0 ,4 5
1 8 ,7 4
5 ,4 3

X-M
Desviacin
Desviacin cuadrtica
2
1
3
2
0

45J3

40

4
1

9
4
0

M - GM
Desviacin
Desviacin cuadrtica
2 ,3 3
2 ,3 3
2 ,3 3
2 ,3 3
2 ,3 3

5 ,4 3
5 ,4 3
5 ,4 3
5 ,4 3
5 ,4 3
2 7 ,1 4

18

M ss 4 0 /5 = 8
G ru p o sin an teced en tes delictivos
X

5
I
3
7
4

X ~ GM
Desviacin
Desviacin cuadrtica
0 ,6 7
-4 ,6 7
-2 ,6 7
1 ,3 3
-1 ,6 7

20

0 ,4 5
2 1 ,8 1
7 ,1 3
1 ,7 7
2 ,7 9
33^95

2 0 /5 = 4

X -M
Desviacin
Desviacin cuadrtica
1
-3
-1
3
0

1
9
1
9
0
20

M - GM
Desviacin
Desviacin cuadrtica
-1 ,6 7
-1 ,6 7
-1 ,6 7
-1 ,6 7
-1 ,6 7

2 ,7 9
2 ,7 9
2 ,7 9
2 ,7 9
2 ,7 9
1 3 ,9 5

G ru p o sin inform acin sobre a n te c e d e n te s


X ~ GM
D e s v ia c i n
D e s v ia c i n c u a d r tic a

- 1 ,6 7
0 ,3 3
3,33
-2 ,6 7
-2 ,6 7

4
6

9
3
3

X~M
D e s v ia c i n
D e s v ia c i n c u a d r tic a

2 ,7 9
0,11
11,09
7 ,1 3
7,13

-1
1
4
-2
-2

1
1
16
4
4

285

25

M - GA
D e s v ia c i n
D e s v ia c i n c u a d r tic a

-0 ,6 7
- 0 ,6 7
- 0 ,6 7
0 ,6 7
-0 ,6 7

26

0,45
0,45
0,45
0,45
0 ,4 5
2,25

M = 2 5 /5 = 5

Sum as de desviaciones cuadrticas:

2(X - GMf 6 SCTo(ai - 4 5 ,1 3 + 3 3 ,9 5 + 28,25 = 107,33


S(X - M f S C D&n(I0 - 1 8 + 20 + 26 = 64
t(M - GMf 6 S C Eme * 2 7 ,1 4 + 13,95 + 2,2 5 = 4 3,34
Control (SCTw| = 5 C De1(f0 + 5 C gnt(e),
&

. 107,33; S C ^ + SCBfltre = 64 + 4 3 ,3 4 - 107,34

(lev e diferencia debido a error de redondeo)


Grados de libertad:
n*, = * - 1 = 1 5-1*14
' d-,=* , +S'2+ --

C oatrol ( g i ^ =

+SIo=(5-1) +<5- 1) + (5- 1)=4 +4 + 4 =12


+ S m j - 1 4 = 12 + 2

E stim aciones d e varianza poblacional:


^Dentro ^ ^ D e n tro = ^ D a rtto ^ D e O tto =
S U

^33

* S C ^ J g l Enw = 4 3 ,3 4 /2 21 ,67

R azn F: F = S U ^ U . 6 C M *

- 21 >6 7 /5 >3 3 = 4 07

Los grados de libertad, el siguiente paso que aparece en la tabla, se calculan de la misma forma
que en el captulo 11. Ms abajo, la tabla indica los clculos de las dos estimaciones cruciales de
varianza poblacional. Las calculamos dividiendo cada suma de desviaciones cuadrticas por los
grados de libertad correspondientes. Finalmente, la tabla muestra el clculo de la razn F, realiza-
do de forma usual, dividiendo la estimacin intergrupal de la varianza por la estimacin intragrupal de varianza. Todos esos nmeros, grados de libertad, estimaciones de varianza y F son iguales
(con diferencias de redondeo) a las cifras calculadas en el captulo 11.

TABLAS DE ANALISIS DE VARIANZA


Una tabla de anlisis de varianza presenta los resultados de un anlisis de varianza basndose
en el enfoque del modelo estructural. Estas tablas son producidas automticamente por la mayo-

ra de los programas de anlisis de varianza para computadoras. Una tabla estndar de anlisis de
varianza tiene cinco columnas. La primera columna est encabezada, por lo general, con el ttulo
"Fuente, y contiene el tipo de estimacin de varianza o desvo involucrado (intergrupal, inragrupai y total). La siguiente columna se titula habtualmente S C \ y contiene los diferentes ti
pos de sumas de desviaciones cuadrticas. La tercera columna es gl, y contiene los distintos
tipos de grados de libertad. La cuarta columna es CM, que se refiere a los cuadrados medios. Es
decir, CM es SC dividido por gl, la estimacin de la varianza. CM es, como siempre, lo mismo que
S2. Sin embargo, en una tabla de anlisis de varianza, la varianza casi siempre es representada co
mo CM. La ltima columna es F, la razn F. Cada fila de la tabla se refiere a una de las estima
ciones de varianza. La primera fila corresponde a la estimacin intergrupal de varianza.
Generalmente aparece debajo de la columna Fuente como intergrupal o grupal, aunque al
gunas veces se la denomina modelo o tratamiento. La segunda fila corresponde a la estimacin
intragrupal de varianza, aunque algunas veces se la denomina error. La ltima fila es la suma de
los cuadrados sobre la base de la desviacin total de cada observacin con respecto a la gran media,
La tabla 12-2 es una tabla de anlisis de varianza completa con los datos tomados del ejemplo
referido al estudio de los antecedentes delictivos. Los diseos realizados por computadora algu
nas veces utilizan un orden diferente para las columnas y omiten SC CM, pero nunca los dos.
T a b la 1 2 -2 .

Tabla de anlisis de varianza correspondiente al estudio acerca de antecedentes delictivos,


(datos ficticios).
F u en te
Intergrupal
Intragrupal
Total

SC

4 3 ,3 4
64
107,33

gl
2

12
14

CM

21,67
5,33

4,07

ANLISIS DE VARIANZA CON GRUPOS DE TAMAOS DESIGUALES


Ya sea que los grupos tengan la misma cantidad de valores observados o no, la lgica bsica del
anlisis de varianza es la misma. En ambos casos, es una comparacin de estimaciones de la va
rianza poblacional sobre la base de la variacin intergrupal versus la intragrupal. Sin embargo, los
procedimientos para el clculo de estimaciones intragrupales e intergrapales de la varianza, que
aprendimos en el captulo 11, son bastante difciles de utilizar con grupos de tamaos desiguales.
Los procedimientos requieren adaptaciones complejas para dar la ponderacin adecuada ala
informacin obtenida de ios grupos de tamaos desiguales. Por otro lado, el mtodo del modelo
estructural funciona de forma tal que, automticamente, realiza las adaptaciones necesarias para
grupos de tamaos desiguales,*1

1 Una ventaja del mtodo que aprendimos en ei capitulo 1 , adems de su utilidad para clarificar la lgica implcita, es
que permite calcular un anlisis de varianza utilizando slo las medias y las varianzas poblacionales estimadas. Esto
puede resultar rito cuando la informacin ordinaria no est disponible; por ejemplo, ai calcular un anlisis de varianza
basndonos en medias y desvos estndar informados en una publicacin cien tfica . Por io :tanto, si los tamaos de las
muestras no fueran iguales, la siguiente es la forma de determinar las estimaciones de varianza poblacional utilizando
el mtodo del captulo 11.

El clculo de |,entol con d istin to s tamaos de muestra es una extensin directa del mtodo que aprendimos en el ca
ptulo 10 para ?c0(a,!l,(i4>Ia estimacin combinada de la varianza poblacional. Es decir,
es Ia suma de la ^ponIndos por los g totales de
la ponderacin
racin ios
derada de cada grupo, siendo
3 g / del grupo en cuestin (su Vmenos 1) am an
todos los grupos. Es decir,

Ejemplo
Analicemos un ejemplo ficticio. Un investigador de un centro de tratamiento del alcoholismo rea
liza un estudio acerca de la satisfaccin del paciente con tres mtodos diferentes de tratamiento,
utilizados en el centro. Los llamaremos tratamiento A, tratamiento B y tratamiento C. El investi
gador asigna al azar a cada uno de los 10 pacientes disponibles para que reciban uno de estos tra
tamientos; a 4 pacientes Ies toca el tratamiento A, a 3 pacientes el tratamiento B y a 3 pacientes el
tratamiento C. Dos semanas ms tarde, el investigador mide la satisfaccin de los pacientes con
respecto a los tres tratamientos en una escala del 1 (bajo nivel de satisfaccin) al 20 (alto nivel de
satisfaccin). La tabla 12-3 muestra los resultados, los clculos y la tabla del anlisis de varianza.
La figura 12-3 representa grficamente las distintas distribuciones involucradas. Seguiremos el
procedimiento habitual de prueba d hiptesis paso a paso.
1. Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de las
poblaciones. Existen tres poblaciones.
Poblacin 1: alcohlicos que reciben el tratamiento A.
Poblacin 2: alcohlicos que reciben el tratamiento B.
Poblacin 3: alcohlicos que reciben el tratamiento C.
La hiptesis nula establece que las tres poblaciones tienen la misma media. La hiptesis de inves
tigacin establece que no todas tienen la misma media.
2. Determinar las caractersticas de la distribucin comparativa. La distribucin compa
rativa en un anlisis de varianza es siempre una distribucin F. Calculamos sus grados de libertad
del mismo modo que lo hemos venido haciendo hasta ahora. La estimacin ntergrupal de la
varianza es la cantidad de grupos menos 1. Existen tres grupos, por lo tanto glntre es 2. El
gl D
es la cantidad de observaciones de cada grupo menos uno. Hay 3 grados de libertad en el
primer grupo (4 observaciones menos 1) y dos grados de libertad en cada uno de los otros grupos;
por lo tanto, g/Dentro es 7. Es decir, se trata de una distribucin F para 2 y 7 grados de libertad.

^Dentro ;

i
+

-H)1

2 + -- + ltimos '

j .______ ltimos

2
ih +i k +1'1* ltimos'
.

Calcular la
es un poco ms complejo. Primero, calculamos la gran media general (que no es slo la media de
las medias). Para calcular la gran media, primero multiplicamos la media de cada grupo por la cantidad de observacio
nes de ese grupo, sumamos los resultados de todos los grupos y dividimos la suma por la cantidad total de observacio
nes. Se expresa bajo la frmala,
CM -

+ ( ^ ) 2 ) + ~ + (^ltimos) (rcltimos )
n { +rt2

+ ltimos

D espus calculamos 5 | tfe: calculamos la desviacin de la media de cada grupo con respecto a la gran media; elevamos
la desviacin al cuadraoq; multiplicamos las desviaciones cuadrticos de cada grupo por la cantidad de observaciones
del grupo; sumamos los resultados de todos los grupos y dividimos esa suma por los grados de libertad intergrupales
{Eiit* = e n tid a d de grupos menos 1). Se expresa bajo la frmula,
c2
(/V/j- G M f { n x) + { M 2
, Entre ~

3. Determinar el punto muestral de corte en ia distribucin comparativa, a partir del


cual debera rechazarse la hiptesis nula. Utilizando la tabla F del apndice B (tabla B-3), bus
camos en la columna correspondiente a 2 grados de libertad en el numerador y nos detenemos a
los 7 grados de libertad del denominador. Utilizando el nivel 0,05 de significacin (el nmero del
medio), encontramos un punto de corte de 4,74.
4. Determinar el valor muestra! en la distribucin comparativa. Dado que la distribu
cin comparativa es una distribucin de razones F, este paso implica calcular la razn F de la
muestra (utilizando ei mtodo estudiado en este captulo). El numerador es la estimacin intergrupal de varianza. Se basa en la desviacin de la media del grupo de cada observacin con res
pecto a la gran media. Por ejemplo, la media del grupo de la primera observacin es 10, y la gran
media es 7. La desviacin es 3, y la desviacin cuadrtica es 9. Sumando las 10 desviaciones
cuadrticas de este tipo obtenemos 66, que aparece en la tabla del anlisis de varianza bajo la co
lumna SC, en la fila Intergrupal. Despus, dividimos la suma de las desviaciones cuadrticas
por los grados de libertad ntergrupales (gEntre). El resultado, como lo indica la tabla del anfisis
de varianza, bajo CM, resulta ser 33. Es decir, 33 es el numerador, la estimacin intergrupal de la
varianza poblacxonal.

Tabla 12-3.
Anlisis de varianza del estudio acerca de tratamientos de alcoholismo (datos ficticios).
Tratamiento A
X

- GM

X ~ M

Tratamiento B
M - GM

D esv' D e s v 1 D e sv D e s v ' D e sv

8
13
10
9
40

1
6
3
2

1
36
9
4
50

~2

3
0

-1

4
9
0
1
14

3
3
3
3

X - GM

D esv' D e s v 1

D esv1

7
3
8

9
9
9
36

0
-4
1

17

18

A = 40/4 = 10

0
16
1

Tratamiento C
M - GM

X ~ M

1
-3
2

1
9
4

-I
-1
-1

14

: 18/3 := 6

Nota: Desv = Desviacin. Desv! = Desviacin cuadrtica


GM

(40 + 18 + 12)/10 * 70/10 * 7

+^2 + + ^umo U -

D + (3 -- 1) + (3 - 1) = 3 + 2 + 2 = 7

^Grupos 1 = 3 - 1 =*2
F necesario para g l ~ 2 , l al nivel 0,05 4,74
S C r m = 50 + 17 + 35 * 102
S^Bnac ~

^-Dentro = 14 + 14 + 8= 36
* ^ , 3 6 +3+27*66

TABLA DEL ANLISIS DE VARIANZA:


FUENTE
Intergrupal
ntragrupal
Total

SC

GL

66

36

7
9

102

CM

33
5,14

Conclusin: Se rechaza la hiptesis nula.

6,42

D e s v D e s v 1'D e s v D e s v 1

1
1
I
3

X -G M

M ~ GM

X - M

D e sv D e s v 1 D esv D e sv 1D esv D e sv

6
4
2

-I
-3
-5

12

Ai* 1 2 /3 = 4

1
9
25
35

0
-2

4
0
4
8

-3
-3
-3

9
9
9
27

El denominador de la razn F es la estimacin intragrupal de la varianza poblacionaL Se basa


en las desviaciones de cada observacin con respecto a la media de su grupo. Por ejemplo, la pri
mera observacin es 8 y ia media de su grupo es 10. Esto da una desviacin de -2 y una desvia
cin cuadrtica de 4. Sumando las 10 desviaciones cuadrticas de este tipo, obtenemos 36.
Dividimos 36 por los grados de libertad intragrupals, que son 7, y obtenemos 5,14.
La razn F, como siempre, es a estimacin intergrupai dividida por la estimacin intragru
pal. El resultado es 6,42.
Al utilizar el mtodo tratado en este captulo, y al trabajar manualmente, conviene a esta altu
ra calcular la suma de las desviaciones cuadrticas de cada observacin con respecto a la gran
media, que aparece en la lnea correspondiente a Total de la tabla. De ese modo podemos con
trolar ios clculos aritmticos, ya que esta suma debera ser igual al total de las otras dos sumas de
desviaciones cuadrticas. (En este caso, 66 ms 36 es igual a 102).

5.
C o m p arar ios valores obtenidos en los pasos 3 y 4 p a ra d ecid ir s i se rechaza o no la h i
ptesis nula. La razn F de 6,42 es ms extrema que el punto de corte F de 4,74 correspondiente al
nivel 0,05 de significacin. Por lo tanto, el investigador puede rechazar la hiptesis nula. Si esta

F ig u r a 1 2-3.

Distribuciones relacionadas con el estadio ficticio acerca del tratamiento del alcoholismo.

fuera informacin real, el investigador podra concluir que los tres tratamientos tienen diferentes
efectos en cuanto a la satisfaccin de pacientes, como los suyos con respecto a sus tratamientos.

Otro Ejemplo
Ahora examinaremos informacin ficticia basada en resultados de un estudio real realizado por
Clark et al. (1997). Los investigadores estudiaron tres grupos de pacientes: pacientes con pnico,
pacientes con angustia generalizada y pacientes con fobia social. Tambin incluyeron un grupo
comparativo de personas que no eran pacientes. Como parte inicial del estudio, compararon ios
cuatro grupos sobre la base de varias medidas estndar. La tabla 12-4 se basa en los descubrimien
tos reales de los investigadores a travs de las pruebas de ansiedad. (El patrn de los resultados es
el mismo. Sin embargo, para que el ejemplo fuera simple, hemos utilizado muchos menos partici
pantes y hemos transformado ios valores individuales en nmeros agradables, enteros y pequeos.
Los resultados del estudio real se indican en la tabla 12-8, ms adelante en este captulo). La tabla
12-4 tambin presenta los clculos principales y la tabla del anlisis de varianza. La figura 12-4 re
presenta grficamente las distintas distribuciones relacionadas con el estudio. A continuacin,
analizamos el ejemplo siguiendo e procedimiento normal de prueba de hiptesis paso a paso.

Tabla 12-4,
Anlisis de varianza de valores de ansiedad basado aproximadamente en Clark et al. (1997).
(Datos ficticios).
Pacientes
con pnico

No pacientes
D e s v ia c io n e s c u a d r tic a s

X -G M X -M M -G M

8
10

4
0

9
22

32

1
0

4
4

4
1

4
4

16

D e s v ia c io n e s c u a d r tic a s

X -G M X - M M -GM

11
10
2

0
4

0
1
1

33

M-- =32/4 = 8
GM

itf = 3 3 /3 = 11
= (32 + 33 + 22 + 33)/12 = 10

1
1
1

D e s v ia c io n e s c u a d r tic a s

X -G M X -M M -G M

10
12

22

= 22 + 5 + 4 + 3 = 34

ANALISIS DE VARIANZA:

Fuente

SC

gl

rttergrupa!
Irtragrupal
Total

24

10

34

8
11

CM
8
1,25

Conclusin: se rechaza la hiptesis nula.

F
6 .4

X - G M X - M M - GM

11
11
11

1
1
1

0
0
0

~4

"2

33

~3

* #2 + + ^ltirao = ^ ~ 1) + (3 ~ 1) + (2 - 1} + (3 - 1) = 3 + 2 + 1 + 2 = 8

^emro *6 + 2 + 2 + 0=10

D e s v ia c io n e s c u a d r tic a s

1
1

M = 22 /2 a 11

F necesario para g i - 3 , 8 ai nivel 0,05= 4,07

Paciente con
fobia social

1
1

= * -1 = 12-1*11

^Dentro

5 ^

Paciente con angustia


generalizada

M ~ *3 3 /3 = 11

1
1
1

: Se supone qu ias distribuciones de poblacin son normales y tienen la misma varianz. Tienen la misma media
O (si la hiptesis nula es verdadera), o tienen diferentes medias (si la hiptesis de iqvestigci.es verdadera): . . .

Pn n
8
10
12
Personas.que no
son pacientes

i ......i
8
10 12
Pacientes que sufren
de pnico

8
10 12
Pacientes que sufren
de angustia generalizada

11 _
8
10
12
Pacientes que sufren
de foba social

Distribuciones de muestras

Figura 12-4.
D istr ib u c io n e s r ela cio n a d a s con e l an lisis d e varianza d e la in form acin fic ticia basado aproxim ad am ente
en C lark e t al.

1, Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de las


poblaciones. Existen cuatro poblaciones:
Poblacin 1: personas que no son pacientes.
Poblacin 2: pacientes que sufren de pnico.
Poblacin 3: pacientes que sufren de angustia generalizada.
Poblacin 4: pacientes que sufren de fobia social.
La hiptesis nula establece que las cuatro poblaciones tienen la misma media en cuanto al nivel
de ansiedad. La hiptesis de investigacin establece que no todas tienen la misma media en cuanto al nivel de ansiedad.
2. Determ inar las caractersticas de la distribucin comparativa. La distribucin compa
rativa es una distribucin F con 3 y 8 grados de libertad, tal como lo indica la figura 12-4.

3. Determinar e! punto muestral de corte en la distribucin comparativa, a partir del


cual debera rechazarse la hiptesis nula. La tabla B-3 indica que con 3 grados de libertad en el
numerador y 8 en el denominador, el punto de corte al nivel 0,05 es de 4,07 (vase figura 12-4).
4. Determinar el valor muestral en la distribucin comparativa. La tajala 12-4 indica los
clculos de la razn F de la muestra, utilizando el mtodo del modelo estructural tratado en este ca
ptulo, El numerador es la estimacin intergrupal de la varianza que se basa en la desviacin de la
media del grupo de cada observacin con respecto a la gran media, es decir, 8. El denominador es
la estimacin intragrupal de ia varianza que se basa en la desviacin de cada observacin con res
pecto a la media de su grupo, es decir, 1,25. Por lo tanto, la razn F es 6,4 (es decir, 8/1,25 = 6,4).
5. Com parar los valores obtenidos en los pasos 3 y 4 para decidir si se rechaza o no la hi
ptesis nula. El F muestral igual a 6,4 es mayor ai punto de corte F de 4,07. Por lo tanto, pode
mos rechazar la hiptesis nula y concluir que los cuatro grupos tienen diferentes niveles de
ansiedad (vase figura 12-4).

RESUMEN DE LOS PROCEDIMIENTOS PARA EL CLCULO DEL


ANLISIS DE VARIANZA UTILIZANDO EL MODELO ESTRUCTURAL
La mitad superior de la tabla 12-5 resume los pasos para la realizacin de un anlisis de varianza
utilizando el mtodo tratado en este captulo. La mitad inferior muestra una tabla del anlisis de
varianza con los smbolos de todas las partes insertados en cada seccin, donde, usualmente, iran
los nmeros. Ms abajo hay una tabla del anlisis de varianza del mismo estilo, con las distintas
frmulas donde generalmente iran los nmeros. Es importante tener en cuenta que la nica dife
rencia con lo que hicimos en el captulo 11 se encuentra en el paso 4, en los puntos que van del b
al g. No debemos olvidar tampoco que este es el mtodo que se utiliza cuando los grupos tienen
tamaos desiguales.
El apndice del captulo nos proporciona las frmulas de clculo para el anlisis de varianza
basado en el mtodo del modelo estructural (y por lo tanto adecuadas para utilizar con muestras
de tamaos desiguales). Esas frmulas sern tiles cuando no se pueda utilizar una computadora
y cuando sea necesario calcular un anlisis de varianza de este tipo para un estudio real con una
gran cantidad de participantes. Sin embargo, para aprender la lgica del anlisis de varianza reco
mendamos insistentemente que los ejercicios se realicen utilizando las frmulas de definicin y
los procedimientos indicados en la tabla 12-5.

COMPARACIONES MLTIPLES
Rechazar la hiptesis nula en un anlisis de varianza implica que las medias poblacionales no son
todas iguales. Lo que no queda claro, sin embargo, es cules son las medias poblacionales que di
fieren entre s. Por ejemplo, en el estudio acerca de los antecedentes delictivos, los miembros del
jurado que formaban el grupo al que se le inform la existencia de antecedentes delictivos fueron
los que asignaron el mayor nivel de culpabilidad (M - 8); los miembros del jurado que no recibie
ron informacin al respecto fueron los segundos en cuanto al nivel de culpabilidad asignado
(M - 5), y los miembros del jurado a los que se inform que el acusado no tena antecedentes de
lictivos fueron los que asignaron el nivel ms bajo de culpabilidad (M = 4). A partir de los resulta
dos del anlisis de varianza, concluimos que las verdaderas medias de las tres poblaciones que
representaban estos grupos no eran todas iguales. Sin embargo, no sabemos qu medias de qu
poblaciones en particular son significativamente diferentes entre s. Ni siquiera existe garanta de

T a b la 1 2 -5 .
P a s o s , s m b o lo s y f r m u la s p a r a c a lc u la r u n a n lisis de v a r ia n z a u t iliz a n d o el m to d o d e l m o d e lo
e s t r u c tu r a l (g r u p o s d e ta m a o s ig u a le s o d e s ig u a le s ).

Pasos d e la

p r u e b a d e h ip te s is

1. Replantear e i problem a en funcin de hip tesis de investigacin e hip tesis nula de las poblaciones.
2. Determ inar las caractersticas de la distribucin comparativa.
a) L a distribucin comparativa ser una distribucin F.
b) Los grados de libertad del numerador son la cantidad de grupos m enos 1; g /Entre = /VGfupos - 1 .
c) L os grados de libertad del denom inador son la sum a de io s grados de libertad de cada grupo
(la cantidad de observaciones de cada grupo m enos 1): g l MttQ - g l { + g lj + . . . + g l$ ]mo.
d) Controlar la exactitud de los c lc u lo s a s e g u r n d o s e de q u e gDintto m s g IEnu< sum an g !rm
(que es la cantidad total de casos m enos 1).
3. D eterm inar e l punto muestral de corte en la distribucin comparativa, a partir del c u a l debera rechazarse la
hip tesis nula.
a) Determinar e l nivel de significacin deseado.
b) B uscar e l punto de corte correspondiente a la tabla F.
4.

Determ inar e l valor muestral en la distribucin comparativa (ser un razn F ).


a) C alcular la m edia d e cada grupo y la gran m edia de todas Jas observaciones.
b) Calcular las siguientes desviaciones para cada observacin:
i)

La desviacin con respecto a la gran m eda ( X ~ G M ).

ii) La desviacin con respecto a la m edia de su grupo (X - M ).


a i) La desviacin de la m edia de su grupo con respecto a la gran m edia (Ai - G M ).
c) Elevar al cuadrado cada una de esas d esviaciones.
d) Calcular las sum as de cada uno de estos tres tipos de desviaciones cuadrticas

e)

Controlar la exactitud de ios clculos asegurndose de que SCDen{(0 + SCb(W= 'CTorar

f)

Calcular la estim acin intergrupai de varianza: S C ^ J g Entw.

g) Calcular la estim acin intragrupal de varianza: 'CDeMf0/g /Dewo.


h) Calcular la razn F : F = S l attJ S 6 F -

C M EnilJ C M DeriV0.

5. Comparar los resultados obtenidos en los pasos 3 y 4 para decidir si se rechaza o no la hip tesis nula.
S m b o lo s c o r r e s p o n d ie n t e s a c a d a p a r t e
d e u n a n lis is d e v a r ia n z a
SC

gt

CM

Intergrupai

^ E n tre

^Emte

^^E n tie ^ ^ Entre)

Intragrupal

W o

^Dentro

^^Deiitro ( ^Dentro)

Total

^"Total

^Total

F u en te

F r m u la s corr e sp o n d ie n tes a c a d a parte


d e un a n lisis de v arian za
F u en te

SC

Intergrupai

X (M -G M )2

Intragrupal

M X - VI)2

Total

M X-CM )2

gl
N

Grupos

CM

^E irt/^E iitre

8*1 + 8*2 + ' ' + ^ttimo


N - 1

C M i'J C M

Demw

^ D m ro

que los dos grupos ms extremadamente diferentes (el grupo que recibi informacin de antece
dentes delictivos y el grupo al que se le inform que no existan antecedentes delictivos) represen
ten poblaciones con medias diferentes y, ciertamente, no queda claro si la media de la poblacin
correspondiente al grupo que no recibi informacin al respecto es diferente de cualquiera de las
medias de las poblaciones representadas por los otros dos grupos.
Cuando se determina cules son las medias que difieren entre s se dice que se realizan com
paraciones mltiples, porque frecuentemente se comparan varios pares de medias. Las compa
raciones mltiples son un tema complejo muy tratado en cursos de estadstica en psicologa de
nivel intermedio. Adems, es un tema controvertido.
Existe un punto en el que casi todo el mundo est de acuerdo. Por lo general no es suficiente
calcular simplemente una serie de pruebas r, una para cada posible par de medias, ya que si no se
aplican modificaciones, es muy probable que este tipo de procedimiento arroje lo que aparente
mente es un resultado significativo. Por ejemplo, con tres grupos existiran tres pruebas t posibles
(el grupo 1 comparado con el 2, el 2 con el 3 y el 1 con el 3). Supongamos que utilizamos el nivel
0,05, de forma tal que cada una de las tres pruebas t posibles tengan una probabilidad 0,05 de re
sultar significativas equivocadamente. La probabilidad de que al menos una de las pruebas de la
serie de tres pruebas t resulte significativa por equivocacin, es aproximadamente del 15%. Con
cuatro grupos, podra haber seis comparaciones. Lo cual significa que si usramos el nivel 0,05
para cada prueba, tendramos un riesgo total de casi el 30% de que, al menos, una resulte signifi
cativa slo por casualidad.2 Ms an, un investigador puede necesitar hacer comparaciones adi
cionales que no comparan simplemente a un grupo con otro; por ejemplo, se puede comparar, el
promedio de tres grupos con un cuarto grupo (tal vez los primeros tres son diferentes tipos de gru
pos experimentales y el cuarto es el grupo de control). La cantidad de comparaciones, aun con
una cantidad bastante pequea de grupos, puede ser considerablemente grande.
La controversia surge cuando los estadsticos intentan ponerse de acuerdo acerca de la mejor
alternativa para no realizar simplemente un puado de pruebas t. Las soluciones disponibles de
penden, en parte, de la situacin.
Comparaciones planificadas
Existe un tipo de situacin que se presenta cuando el investigador ha decidido previamente obser
var unas pocas comparaciones en particular que estn directamente relacionadas con la teora o
con alguna aplicacin prctica. A esto se lo denomina comparaciones planificadas (o, a veces,
comparaciones a priori o contrastes planificados), porque han sido planificadas previamente a
la realizacin del estudio. (Estas comparaciones tambin son lo que habitualmente se denominan
contrastes lineales). Analicemos nuevamente el ejemplo del estudio acerca de los antecedentes
delictivos. El investigador podra decidir previamente que las nicas comparaciones de inters
son a) el grupo que recibi los antecedentes delictivos con el grupo al que se inform que no exis
tan antecedentes delictivos y b) el grupo que recibi los antecedentes delictivos con el grupo que
no recibi informacin i respecto.

2 En realidad, la probabilidad de obtener al menos un resultado significativo por casualidad, de tres, al nivel 0,05, es
0 ,43; y de obtener al menos uno de seis, es de 0,265. La frmula para tres pruebas e s ! - (1 - ot)(l - ot){l - a ), en don
de a representa el nivel de significacin. Adems, es evidente que toda esta cuestin est muy relacionada con e l tema
de demasiadas pruebas r que analizamos en el captulo 10. La cuestin planteada en ese captulo se refera a dos gru
pos con diferencias en varias variables. En este caso, estamos hablando de diferencias entre varios grupos en cuanto a
una variable. Por supuesto, algunas veces se presentan a la vez varios grupos y varias variables.

Un mtodo ampliamente utilizado para analizar las comparaciones planificadas es el proce


dimiento Bonferroni (tambin llamado la prueba de Dunn), que se basa en la idea de utilizar
un nivel de significacin ms exigente para cada comparacin. El resultado es que la probabilidad
total de que cualquiera de las comparaciones resulte significativa por error sigue siendo razona
blemente baja. Por ejemplo, si cada una de dos comparaciones planificadas utilizara el nivel
0,025 de significacin, la probabilidad total de que cualquiera de ellas resulte errneamente signi
ficativa an sera de menos del 0,05. Con tres comparaciones planificadas, podramos utilizar el
nivel 0,017 (3 por 0,017 es igual a 0,05). A veces, los investigadores que tienen dos o tres contras
tes planificados simplemente utilizan el nivel 0,01 para cada uno, ya que se trata de un caso con
un punto de corte con el que estn familiarizados y que resulta fcil de encontrar en las tablas.

Comparaciones p o s t

hoc

Una situacin muy diferente a la de las comparaciones planificadas es aquella en la que, des
pus de haberse realizado el estudio, el investigador simplemente busca entre los resultados
tratando de descubrir cules son los grupos que difieren entre s. A estas comparaciones se las
denomina comparaciones post hoc (o comparaciones a posteriori), porque no se planifican
previamente,
Cuando se realizan comparaciones post hoc, se deben tener en cuenta todas las posibles com
paraciones para calcular la probabilidad total de que cualquiera de ellas resulte significativa. Por
ese motivo, utilizar el procedimiento Bonferroni para las comparaciones post hoc es seguro, pero
cualquiera de las comparaciones presenta muy baja potencia. El nivel 0,05 se divide en tantas par
tes que, obtener alguna comparacin significativa, sera extremadamente raro. Por lo tanto, los es
tadsticos han desarrollado una variedad de procedimientos para utilizar en estas bsquedas
exploratorias. Los procedimientos mencionados intentan mantener el alfa general a un nivel cer
cano al 0,05, sin reducir de manera demasiado drstica la potencia. Algunos de estos procedi
mientos aparecen en las publicaciones descriptos por los nombres de aquellos que los desarro
llaron; los mtodos Scheff, Tukey, Heuman-Keuls y Duncan son ios ms utilizados. An se dis
cute qu procedimiento es ms conveniente en distintas condiciones. Las distintas posibilidades y
controversias acerca de este tema son tratadas en cursos de estadstica de nivel medio.

Efecto producido por los diferentes mtodos de realizacin


de las comparaciones mltiples
Las comparaciones planificadas casi siempre tienen ms potencia que las comparaciones
post hoc. Adems, cuantas menos comparaciones se planifican, mayor es la potencia. A veces, un
investigador est, antes de realizar el estudio, en una posicin que le permite disminuir la canti
dad de comparaciones. Si antes de realizar el estudio existen slidos fundamentos para realizar
slo determinadas comparaciones, sto puede aumentar mucho la potencia del estudio. Sin em
bargo, segn nuestra experiencia, en la mayora de las situaciones reales de investigacin el resul
tado es bastante parecido, cualquiera sea el procedimiento utilizado. Si un resultado es tan
ajustado como para que el mtodo s influya, en cualquier caso es probable que se deba tomar el
resultado con verdadera precaucin. Lo que realmente importa es que el investigador utilice un
mtodo apropiado para enfrentar los riesgos de las comparaciones mltiples, y no que simple
mente realice series de 50 pruebas r como si cada una fuera un mundo aparte.

SUPUESTOS DEL ANLISIS DE VARIANZA


CON MUESTRAS DE TAMAOS DESIGUALES
En el captulo 11 analizamos los supuestos del anlisis de varianza. Sin embargo, cuando los ta
maos de los grupos no son aproximadamente iguales, el anlisis de varianza es mucho ms sen
sible al incumplimiento del supuesto que establece que las varianzas deben ser iguales. De hecho,
con tamaos de muestras desiguales el anlisis de varianza se toma sospechoso cuando las esti
maciones de las varianzas poblacionales ms extremadamente diferentes (entre aquellas de dis
tintos grupos) son incluso tan diferentes como 1 1/2 vez una de la otra.

TAMAO DEL EFECTO Y POTENCIA3


En el captulo 11 presentamos el concepto de / , un indicador del tamao del efecto para el anli
sis de varianza. / sigue siendo un tamao del efecto completamente adecuado, ya sea que el an
lisis de varianza se calcule utilizando el mtodo del captulo 11 el mtodo del modelo estructural
descripto en este captulo. Sin embargo, una desventaja de / es que su significado no es fcil de
captar intuitivamente incluso para los investigadores ms experimentados.
No obstante, existe otra medida comnmente utilizada del tamao del efecto en el anlisis de
varianza, cualquiera sea el mtodo aplicado. (No podamos presentar antes esta medida alternati
va porque se la calcula utilizando elementos del mtodo del modelo estructural). Primero descri
biremos la medida y la forma en que se calcula; luego veremos cmo se interpreta y por qu
proporciona una indicacin ms intuitivamente, significativa que / acerca del tamao del efecto.

Proporcin de )a varianza explicada


Un indicador del tamao del efecto en el anlisis de varianza, adems de f , es la proporcin de la
varianza explicada (i?2). Vale la pena observar que utilizamos el mismo smbolo, R2, para la pro
porcin de la varianza explicada en el anlisis de varianza que para la proporcin de la varianza
explicada en la correlacin y regresin mltiples (vase captulo 4). En ambos casos, la propor
cin de la varianza explicada describe hasta qu punto la variacin en la variable dependiente
puede ser explicada (predicha o justificada) por la variable independiente. En el anlisis de va
rianza, ia variable independiente se refiere al grupo al que pertenece una persona. Por lo tanto, el
grado en el cual la variacin en la variable dependiente es explicada por la variable independien
te, es el grado en el cual el valor observado particular de una persona est relacionado o determi
nado por el grupo al que pertenece dicha persona. (En el captulo 16 seguiremos hablando sobre
los muchos vnculos entre el anlisis de varianza y la correlacin y regresin mltiples).
Para ser precisos, R2 es la proporcin total de la variacin de las observaciones con respecto a
la gran media que est explicada por la variacin entre las medias de los grupos. Se calcula utili
zando las sumas de ios cuadrados, y es igual a la suma de cuadrados intergrupal (SCEn[l.e) dividida
por la suma de cuadrados total (5CTota!). Se expresa bajo la frmula,
pi2 _ Bntre
^Totai
3Ai redactar esta seccin suponemos que el alumno ya ha completado el captulo 4.

(12-4)

Analicemos una vez ms el estudio referido a los antecedentes delictivos. En ese ejemplo, la
suma de las desviaciones cuadrticas de las observaciones con respecto a la gran media era
107,33, y la suma de las desviaciones cuadrticas de las medias de los grupos de las observacio
nes con respecto a la gran media era 43,44. Por lo tanto, la proporcin de la variacin total expli
cada por la variacin entre los grupos es 43,44/107,33 40%. Se expresa bajo la frmula,
r 2 = _jEbS-. SCxotai

..yI 4 ~ o 40
1 0 7 ,3 3

Qu sucede si, como ocurre con frecuencia en los estudios publicados, las sumas de los cuadrados
no estn disponibles. Tambin es posible calcular R2 directamente a partir de F y de los grados de
libertad. La frmula es la siguiente:
*2 =

-----(J7)(^Emre}+^Dentro

(i 2-5)

Por ejemplo, en el estudio acerca de los antecedentes delictivos,


W
W

t o W

e ntre)________

8 ,1 4

8 ,1 4

8 ,1 4 + 1 2

2 0 ,1 4

(4 ,0 7 ){2 )
( 4 ,0 7 ) ( 2 ) + 1 2

Interpretacin de la proporcin de !a varianza explicada


La proporcin de la varianza explicada es una medida til del tamao del efecto, ya que lleva im
plcito su significado directo en su propio nombre y, adems, los investigadores estn familiariza
dos con R2 por su utilizacin en ia regresin. Finalmente, la proporcin de varianza explicada es
til porque su raz cuadrada, R, es una especie de coeficiente de correlacin con el que la mayora
de los investigadores estn muy familiarizados ( v a s e captulos 3 y 4).
R2 es una proporcin de dos nmeros positivos (SCEntrJSCl0X^}, por lo tanto, tiene un mnimo
de 0 y un mximo de 1. Sin embargo, en la prctica es raro que, en un anlisis de varianza, el R2
llegue siquiera a 0,50. La tabla 12-6 indica las reglas de Cohn (1988) para el tamao del efecto
correspondiente a i?2, junto con valores comparables correspondientes a f y R. (Con estos valores
an podemos utilizar las tablas de potencia y de tamao de muestra del captulo 11, cuando traba
jamos con i? o i?2 en lugar de f). Es importante observar que aun un gran tamao del efecto para
R 2 es de tan slo aproximadamente el 14% y que, adems, en los tres niveles de tamao del efec
to indicados, f y R son bastante similares.4 Sin embargo, a niveles muy altos no lo serian tanto;
por ejemplo, una / de 1,0 corresponde a una R de 0,71. Sin embargo, a los niveles de tamao del
efecto comunes en el anlisis de varianza, puede ser bastante til considerar a / como aproxima
damente correspondiente a un coeficiente de correlacin.

4 La relacin exacta entre R2 y f e$ R2 = / 2/( 1 + f 1) y f = '!R2/( i- R2). Sin embargo, si intentamos calcular una a partir
de la otra utilizando informacin tomada de un estudio real, tos resultados no coincidirn exactamente con lo que obte
nemos cuando calculamos cada una directamente. Esto ocurre porque / se basa en desvos estndar de poblacin esti
mados, y R 1 es una descripcin directa de informacin de la muestra.
'

T a b la 1 2 -6 .
R e g la s d e C o h e n p a r a ta m a o s d e l e fe c t o e n u n a n lis is d e v a r ia n z a d e u n c r ite r io .
T a m a o d e l e fe cto
P equeo

M e d ia n o

G ra n d e

0 ,1 0

R
R2

O JO
0 ,0 1

0,2 5
0 ,2 4
0 ,0 6

0,40
0,37
0 ,1 4

Tambin debemos saber que otro nombre comn para esta medida dei tamao del efecto (ade
ms de J?2) es T|2, la letra griega eta al cuadrado; rj2 tambin se conoce como razn de corre
lacin.

CONTROVERSIAS, LIMITACIONES Y DESARROLLOS RECIENTES________


El anlisis de varianza se utiliza comnmente en situaciones en las que se comparan tres o ms
grupos. (S se comparan dos grupos, se puede utilizar una prueba t). Sin embargo, Rosnow y Ro
senthal (1989) sostienen que esas pruebas difusas o colectivas no son muy tiles. Sostienen
que, en casi todos los casos cuando probamos la diferencia general entre tres o ms grupos, he
mos probado un aspecto en el cual casi con seguridad no estamos interesados, (p. 1281) En qu
aspectos estamos efectivamente interesados? Concretamente en comparaciones entrepares espe
cficos, ya sea entre dos grupos o bien entre uno y una combinacin de grupos.
Rosnow y Rosenthal defienden la idea de que, al calcular el anlisis de varianza, deberamos
analizar slo comparaciones planificadas. Esas comparaciones planificadas deberan reemplazar
por completo la prueba F general (es decir, la difusa o colectiva prueba F) para decidir si se puede
rechazar la hiptesis de la inexistencia de diferencias entre las medias poblacionales. Tradicionaimente, las comparaciones planificadas, cuando se utilizan son un complemento de la prueba F
general; por eso, sta sera una idea bastante revolucionaria.
Analicemos un ejemplo. Orbach et al. (1997) realizaron un estudio que utilizamos en el cap
tulo 2, como ejemplo de cmo se describen las medias y desvos estndar en las publicaciones
cientficas. Los investigadores compararon un grupo de pacientes suicidas de un hospital psiqui
trico (individuos que haban cometido serios intentos de suicidio), pacientes no suicidas de un
hospital psiquitrico con diagnsticos similares y un grupo de control de voluntarios tomados de
la comunidad. El objetivo del estudio era probar la teora de que los individuos suicidas tienen
mayor tolerancia ai dolor fsico. La idea era que su mayor umbral de dolor les facilita la realiza
cin de los dolorosos actos que implica un suicidio. Los investigadores realizaron a los tres gru
pos pruebas estndar para medir el umbral de dolor, otras pruebas sensoriales y una variedad de
cuestionarios. La siguiente es la descripcin del anlisis:
Para an a liza r la h ip te sis d e l e stu d io r ea liza m o s una s er ie d e d o s c o n tr a ste s lin e a le s para cad a
m e d id a de d o lo r [...] E l prim er con tra ste lin ea l, c o n tr a s te d e c a p a c id a d s u ic id a , com paraba al
grupo su ic id a c o n lo s otro s d o s gru p o s no s u ic id a s (in tern os p siq u i tr ic o s y particip an tes d e
co n tro l). E l s e g u n d o contraste co m p a ra b a a lo s d o s gru p os n o su ic id a s [.,,] N o c a lc u la m o s una F
c o le c tiv a p r e v ia p o rq u e r ea liza m o s c o m p a r a c io n e s d e gru p os p rev ia m en te p la n ifica d a s, la s cu a

le s probaban la h ip te sis d e l e stu d io . D e b id o a qu e s e n ecesitab an c o m p a r a c io n e s m ltip le s , e l


a lfa s e e sta b le c i en 0 ,0 1 para e v ita r e l error T ip o I,
E l contraste d e capacidad s u ic id a fu e sig n ifica tiv o en cuanto al umbral d e sen sa c i n trm ica, T ( l,
9 5 ) = 2 1 ,6 4 , p < 0 ,0 1 ; um bral d e dolor, F ( l , 9 5 ) = 2 3 ,6 5 , p < 0,0 1 ; tolerancia al d olor jP (1, 9 5 ) =
6 ,5 5 , p < 0 ,0 1 , y tolerancia m x im a F { 1 ,9 5 ) = 16,05. N o se encontr d iferen cia sig n ifica tiv a entre
e l grupo su icid a y lo s grupos no su ic id a s en la m edid a estim ad a de tam ao. U n a n lisis d e las m e
dias d e la tabla 1 [ v a s e tabla 2 -6 ] s o stie n e nuestra h ip tesis principal: lo s participantes su icid a s,
c o m o se esperaba, presentaban um brales m s altos de d olor y sen sib ilid a d , m a y o r toleran cia al d o
lor, y tenan m s p o sib ilid a d e s q u e lo s o tr o s internos y e l grupo d e control d e tolerar la tem peratu
ra m x im a adm inistrada. E s interesan te observar qu e la segu n d a ser ie d e contrastes n o revel
d iferen cias sig n ifica tiv a s entre lo s internos con problem as psiqu itricos y lo s participantes d e c o n
trol, en cuanto a ninguna de la s c in c o m ed id as d e dolor, (p. 6 4 8 )

El estudio de Orbach et al. ejemplifica el consejo de Rosnow y Rosenthal de utilizar comparacio


nes planificadas en lugar de un anlisis de varianza general. Pero este mtodo todava no ha sido
adoptado en forma generalizada, y an es controvertido. La principal preocupacin es muy simi
lar a la tratada en el captulo 7 acerca de las pruebas de una y dos colas. Si adoptamos las compa
raciones planificadas altamente dirigidas, que recomiendan Rosnow y Rosenthal, perdemos la
posibilidad de encontrar diferencias inesperadas que no se planificaron inicialmente.

ANLISIS DE VARIANZA CON EL MODELO ESTRUCTURAL


Y COMPARACIONES MLTIPLES SEGN SE DESCRIBEN
EN LAS PUBLICACIONES CIENTFICAS
En el captulo 11, vimos que los resultados de los anlisis, de varianza se describen generalmente
en las publicaciones cientficas a travs del F y la significacin. La mayora de los programas pa
ra computadoras proporcionan usualmente una tabla del anlisis de varianza del estilo que pre
sentamos en este captulo. Ms an, cuando los investigadores estaban menos familiarizados con
los detalles acerca de la forma en que se realizaba el anlisis de varianza, era comn que las publi
caciones cientficas incluyeran una versin abreviada de una tabla del anlisis de varianza; por
eso, algunas veces se pueden llegar a ver esas tablas en las publicaciones ms antiguas. Actual
mente, la utilizacin y comprensin del anlisis de varianza es tan generalizada que es raro en
contrar esas tablas en las publicaciones cientficas.
Existe un aspecto que no hemos tenido en cuenta hasta ahora en cuanto a la forma en que el
anlisis de varianza aparece en las publicaciones cientficas, y que depende del material tratado
en este captulo. En lneas generales, al informar los resultados de cualquier anlisis de varianza
los investigadores tambin darn los resultados de las comparaciones mltiples. Algunas veces
las comparaciones se describen en el texto de la publicacin. Los resultados podran mencionar'
que las comparaciones planificadas se realizaron entre los grupos A y C y entre los grupos C y
D. Ambas resultaron significativas. Anteriormente, en el estudio de Orbach et al. acerca de pa
cientes suicidas y tolerancia al dolor, vimos un ejemplo de este modo de informar los resultados.
En el caso de las comparaciones post hoc, los investigadores utilizan con frecuencia un pro
cedimiento en el que agregan pequeas letras a lado de las medias en las tablas. Comnmente,
las medias con la misma letra no son significativamente diferentes entre s, y las que tienen dife
rentes letras s lo son. Por ejemplo, la tabla 12-7 presenta los resultados reales de las medidas de
experiencias amorosas en el estudio de Hazan y Shaver (1987) (nuestro primer ejemplo en el ca
ptulo 11). Analicemos la primera fila (los resultados sobre la felicidad). Los grupos evasivos y

ansiosos-ambivalentes no son significativamente diferentes entre s, dado que tienen la misma le


tra (a). Pero ambos son significativamente diferentes en cuanto a felicidad, comparados con el
grupo de individuos seguros que tiene una letra diferente (b). En la fila correspondiente a los ce
los, sin embargo, los tres grupos difieren entre s.
Como segundo ejemplo, se reproduce la tabla 12-8 del estudio de Clark el al. (1997) que uti
lizamos anteriormente como ejemplo en este captulo (con nmeros basados aproximadamente
en los resultados reales que aqu aparecen).
Al leer los resultados de comparaciones post hoc, veremos que se nombran muchos procedi
mientos diferentes, incluyendo Neuman-Keuls, h s d de Tukey", rango mltiple de Duncan y
Scheff, Pero como ya dijimos, estos procedimientos son slo diversos mtodos para probar di
ferencias, realizados de distintas formas para intentar asegurar que la probabilidad de que cual
quiera de ellas resulte significativa por error no sea inaceptablemente alta.
Por ejemplo, Miller (1997) pidi a 147 alumnas mujeres que miraran diapositivas de artculos
de revistas que incluan, entre otras cosas, fotos de hombres atractivos. Mientras observaban los ar
tculos, se midi su excitacin fsica (potencia conductora de la piel); despus de mirar las diapositi
vas se les pidi que calificaran el atractivo y cunto les gustara conocer a cada persona que apareca
en los artculos. Como parte de su anlisis, Miller compar los resultados de mujeres que no estaban
. relacionndose con nadie, mujeres que mantenan relaciones casuales y mujeres que mantenan re
laciones exclusivas, La tabla 12-9 indica los resultados del estudio de Miller. Es interesante obser
var la mencin a la prueba de rango mltiple de Duncan.

T a b la 1 2 -7 .

Medias de subescalas de amor correspondientes a los tres estilos de vinculacin (muestra tomada
de un peridico).
N o m b r e esca la
Felicidad
Amistad
Confianza
Tem or al acercam iento
A ceptacin
Extrem os em ocionales
C elos
Preocupacin obsesiva
Atraccin sexual
D eseo de unin
D eseo de reciprocidad
Amor a primera vista

E v a siv o
3.1 9
3 .1 8 ,
3,1
2 ,3 0
2 ,8 6 a
2 ,7 5 ,
2 ,5 7 ,
3 .0 1 ,
3 ,2 7 a
2 ,8 1 a
3 ,2 4 a
2 ,9 1 a

A n sio so a m b iv a len te
3 .3 1 ,
3,19
3 .1 3 ,
2,15
3 ,0 3 b
3,Q5b
2 ,8 8 h
3 ,2 9 b
3 ,4 3 b
3.25
3 ,5 5 b
3 ,l 7 b

Seguro
3,5 l b
3 ,5 0 b
3,43
1,88
3 ,0 1 ,
2,36
2 ,1 7 ,
3 .0 1 ,
3,27
2 .6 9 ,
3 ,2 2 a
2 ,9 7 a

F (2 ,5 7 1 )

14,21***
2 2,96***
16,21***
22,6 5 * * *
4 ,66**
27,54***
43,9 1 * * *
9,47***
4S*
22,6 7 * * *
14,90***
6,00**

Nota: Dentro (le cada fila, las medias con diferentes subndices difieren segn el nivel 0,05 de significacin, de acuerdo
con la prueba de Scheff,
*p < 0,05; * * p < 0,01; ***p < 0,001.
Fuente: Hazan, C, & Shaver, P. (1987), tab, 3. "Amor romntico conceptuado como un proceso de vinculacin. R e v is
ta d e P s ic o lo g a S o c i a l y d e la P e r s o n a lid a d ( J o u r n a l o f P e r s o n a lity a n d S o c i a l P s y c k o lo g y ] , 52,5 1-524. Copyright,
1987, por la Asociacin Americana de Psicologa. Reimpreso con autorizacin.

Tabla 12-8.
Estudio 2: medias y desviaciones estndar correspondientes a las caractersticas de los participantes.
M (y S D ) p o r G r u p o

Pnico

Angustia
Generalizada

Fobia
Social

(n ==33)
40, l b (9,6)
49,5b (9,5)

(n ==73)

STA

(n = 45)
33,0a (7,1)
48,8b (12,1)

34,9a (8,9)
46,4b (10,0)

( ==45)
33,0a (6,9)
29,2a (5,4)

Inventario de depresin
de Beck
VAS-Ansiedad
VAS-Depresin
VAS-Felicidad

15,3b (: m
23,0b OS,6)
21,8b (21,1)
53,1b (16,3)

18,3c (10,2)
28,8b (22,1)
' 29,4b (21,1)
55,7b (17,0)

(7,8)
12,8b
25,0b (18,2)
24,7b (18,5)
53,0b (17,1)

2, l a (2,2)
5,6a (9,4)
8,2a (11,3)
74,5a (15,1)

Variable
Edad

No pacientes

Nota: Las medias con diferentes subndices difieren significativamente ( p < 0,01): STai { S ta te - T r a it A n x ie t y In v e n o ry ,
S ta te S u b s c a t e , Inventado de ansiedad o estado, subescala de estado); vas ( V is u a l a n a l o g m s c a l e , Escala anloga v i
sual).
Fuente: Clark, D. M,, et al. (1997), tab, 3, Malas interpretaciones de sensaciones corporales en enfermos con pnico.
R e v is ta d e p s i c o l o g a c ln ic a y c o n s u ltiv a ( J o u r n a l o f C o n s u ltin g a n d C li n i c a l P s y c h o lo g y ] , 6 5 ,2 0 3 -2 1 3 . Copyright,
1997, por la Asociacin Americana de Psicologa. Reimpreso con autorizacin.

Tabla 12-9.
Efectos del tipo de relaciones.
T ip o d e rela ci n
N in g u n a

M e d id a d e p e n d ien te
P otencia conductora de la piel
D e se o de con ocer al objetivo
A tractivo fs ic o percibido del objetivo

14,6 b

154,

Casual

Exclusiva

1 9 ,l b
15,3 b
1 7 ,l b

15,8,

11.2,
13,8a

N o ta ; L o s nmeros m s altos reflejan m ayor excitacin, deseo d e conocer ai objetivo y atractivo percibido; para
io s d os ltim os te m s , el rango posible era 1 -1 9 . D entro de cada fila, las m edias con diferentes subn dices difie
ren significativam ente (p < 0 ,0 5 ), prueba de rango m ltiple d e Duncan.
F u en te: M iller, R . S. (1 9 9 7 ), tab. 4. "D esatento y satisfecho; com prom iso en la relacin y atencin a alternati
vas . Revista sobre Psicologa Social y de Personalidad [Journal of Personality and Social Psychology] , 7 3 ,
7 5 8 -7 6 6 . C opyright, 1997, por la A so cia ci n Am ericana d e P sicologa. R eim preso con autorizacin.

Existe un enfoque alternativo del anlisis de vaxianza, qtie se denomina modelo estructural. En el
enfoque del modelo estructural, la desviacin de cada observacin con respecto a la gran media
se divide en dos partes: a) la diferencia entre el valor observado y la media de su grupo y b) la di
ferencia entre la media de su grupo y la gran media. Estas desviaciones, al elevarse al cuadrado y
sumarse y dividirse por los grados de libertad adecuados, dan las mismas estimaciones de las varianzas intragrupaies e intergrupales que las obtenidas utilizando el mtodo del captulo 11. Sin
embargo, el modelo estructural es ms flexible y puede aplicarse a estudios con muestras de ta
maos desiguales.

Los clculos realizados a travs del modelo estructural usualmente estn resumidos en una
tabla del anlisis de varianza, con una columna para la fuente de variacin (intergrupal, inragrupal y total), las sumas de desviaciones cuadrticos (SC), los grados de libertad (gl)> las estimacio
nes de la varianza poblacional (CM, que es igual a SClgl) y F (que es igual a CMEn(J CMDentt0).
Los supuestos son los mismos que los de cualquier anlisis de varianza, aunque el anli
sis con grupos de tamaos desiguales es un poco ms sensible a los Incumplimientos de los
supuestos.
Un anlisis de varianza es seguido generalmente de comparaciones mltiples, planificadas o
post hoc, las cuales analizan las diferencias entre pares o subgrupos especficos de medias. Dichas
comparaciones tienen que protegerse contra la posibilidad de obtener algunos resultados significa
tivos slo por casualidad, debido a que pueden realizarse una gran cantidad de comparaciones.
La proporcin de varianza explicada (i?2), tambin denominada eta cuadrado (rj2), es una me
dida del tamao del efecto del anlisis de varianza. Es 5CE[ltre dividida por
Algunos expertos recomiendan que en lugar de utilizar un anlisis de varianza para realizar
comparaciones difusas y generales entre varias medias, los investigadores deberan planificar
previamente la realizacin de comparaciones planificadas especficas, apuntadas directamente a
las cuestiones tericas.

Trminos clave
-

Tabla del anlisis de varianza. - Comparaciones planificadas. - Modelo estructural.


- Suma de desviaciones
Procedimiento Bonferroni.
- Comparaciones post hoc.
cuadrticas
Eta cuadrado (Tj2 ).
~ Proporcin de varianza
explicada (R2).
Comparaciones mltiples.
SCTotai).

Ejercicios
Los ejercicios implican la realizacin de clcu
los (con la ayuda de una calculadora). La ma
yora de los problemas estadsticos reales se
resuelven por computadora, pero aunque exista
la posibilidad de utilizarla, es conveniente reali
zar estos ejercicios manualmente para incorpo
rar el mtodo de trabajo.
Para adquirir prctica en la utilizacin de
una computadora, para resolver problemas esta
dsticos, se puede utilizar la seccin de compu
tacin de cada captulo, publicada en la Gua de
estudio y libro de tareas de computacin para el
alumno {Studenfs Study Guide and Computer
Workbook] que acompaa este libro.
Todos los datos de esta seccin son ficti
cios (a menos que se especifique lo contrario).
Las respuestas a los ejercicios de la serie I
se encuentran al final del libro.

SERIE 1

1.
Los datos mostrados a continuacin son
los mismos que aparecen en el ejercicio 2 de la
serie I del captulol 1. Resuelva el mismo pro
blema utilizando el mtodo del modelo estruc
tural y compare su respuesta con la respuesta
lograda en el captulo 11 (utilice el nivel 0,01).
Asegrese de mostrar sus clculos y de incluir
una tabla del anlisis de varianza.
Grupo 1
8
8
7
9

Grupo 2
6
6
5
7

Grupo 3
4
4
3
5

2,
Calcule un anlisis de varianza para
siguientes datos (al nivel de significacin del
1%). Asegrese de mostrar sus clculos y de
incluir una tabla del anlisis de varianza.

los
puntuaciones atribuidas generales son 13,8,10
y 9; tres programas que utilizan el mtodo B,
en el cual sus puntuaciones atribuidas son 5, 7
y 6, y otros tres programas que utilizan el m
todo C, en el cual sus puntuaciones atribuidas
Grupo 1 Grupo 2 Grupo 3 Grupo 4
son 4, o y 2. Sobre la base de esas muestras,
71
82
68
78
deberamos concluir que los programas que
67
82
70
76
utilizan diferentes mtodos tienen diferentes
82
grados de efectividad? Utilice el nivel 0,05.
3.
Para cada una de ios siguientes conjun
Escriba un informe a una comisin del gobier
tos de datos, calcule a) las medias de cada gru no explicando sus conclusiones. El informe
po, b) un anlisis de varianza utilizando el debera escribirse de forma tal que lo compren
mtodo del modelo estructural (al nivel de sig dan funcionarios que tal vez nunca hayan asis
nificacin del 5%) y c) R2. (Al realizar el paso tido a un curso sobre estadstica.
b, asegrese de mostrar todos sus clculos y de
6.
Van Lange et al. (1997) realizaron un e
incluir una tabla del anlisis de varianza).
tudio en el que los participantes tomaban parte
en una tarea de juegos estndar. En la tarea de
Grupo 2
Grupo 1
Grupo 3
juegos, el participante realiza una serie de deci
0
1
(0
3
siones en cuanto a otorgarse puntos a s mismo o
4
1
2
a otra persona. Utilizando los resultados de esta
2
5
3
tarea, se puede clasificar a cada participante se
Grupo 3
Grupo 1
Grupo 2
gn su orientacin en cuanto a valores socia
0
1
( )
3
les' como pro-social (tiende a ser cooperativo
5
0
3
2
y favorecer resultados igualitarios para s mismo
1
2
4. Un investigador est interesado en los y para otros), "individualista (busca obtener la
niveles de autoestima de profesores de tres ma mayor cantidad posible para l mismo sin preo
terias diferentes. Los niveles de autoestima de cuparse por el resultado logrado por otros) o
los cuatro profesores de lengua analizados fue competitivo (se preocupa porque su resultado
ron 2, 2, 3 y 5. Los niveles de autoestima de los sea mejor al de los dems). Una de las hiptesis
tres profesores de matemtica analizados fue de Van Lange et al. estableca que las personas
ron , 4 y 5. Los niveles de autoestima de los pro-sociales tendran ms hermanos que los
cinco profesores de ciencias sociales analiza integrantes de los otros dos grupos. Sus resulta
dos fueron 9, 6, 7,10 y 13. Sostienen los re dos mostraron un efecto significativo general,
sultados una diferencia en los niveles medios F(2,535) = 4,82, p < 0,01. (p. 739) Luego, lo
de autoestima de los tres distintos tipos de pro informan de la siguiente forma:
fesores (al nivel 0,05)?
Coherentemente con la hiptesis que relaciona
a)
Realice el anlisis de varianza. b) Calcu hermanos y carcter pro-social de la persona
le R2. c) Explique su respuesta a alguien que
la cantidad de hermanos es mayor en el caso de
comprende los conceptos de media, varianza y
las personas pro-sociales (M = 2,03, SD ~ 1,56)
varianza poblacional estimada (incluyendo las
que en caso de ios individualistas (M ~ 1,63,
nociones de muestra, poblacin y grados de li
SD = 1,00) y los competitivos (M= 1,71, SD = 1,35).
bertad), pero que no sabe nada ms sobre esta
Comparaciones planificadas realizadas poste
dstica.
riormente revelaron un contraste significativo
5. Un estudio comparaba la efectividad de
entre pro-sociales versus individualistas y com
los programas de prevencin del abuso de dro
petitivos, F(l, 535) = 9,14,p < 0,005. Las dife
gas. En toda Norteamrica existen cuatro pro
rencias entre individualistas y competitivos no
gramas que utilizan el mtodo A, en el cual sus
fueron significativas, (pp. 739-740)

Explique el significado de todo lo anterior a al


guien que nunca ha tomado un curso de esta
dstica.

SERIE II

(ii)

Grupo 1
0
2

Grupo 2
0
2

Grupo 3
4
6

4. Un investigador dedicado al tema del


descanso compar el efecto de tres tipos de al
teraciones dei sueo (ser despertado en distin
tos intervalos) en la agilidad mental al da
siguiente. Originalmente, haba 12 participan
tes en la investigacin que fueron asignados al
azar a una de las tres condiciones ( 4 por con
dicin). Sin embargo, uno de los participantes
del programa I de alteracin no cumpli las
instrucciones, y la informacin proveniente
de ese participante no pudo utilizarse en el
anlisis, lo cual dio como resultado muestras
de tamaos desiguales. Los resultados de la
medida de agilidad mental fueron las si
guientes: programa I de alteracin: 120, 140,
140; programa II de alteracin: 130, 150,120,
140; programa III de alteracin: 100, 90, 110,
120. Sostienen los resultados un efecto dife
rente en la agilidad mental producido por los
tres tipos de programas de alteracin (al ni
vel 0,05)? a) Realice el anlisis de varianza.
b) Calcule R2. c) Explique su respuesta a al
guien que comprende los conceptos de meda,
Grupo 1 Grupo 2 Grupo 3 Grupo 4 Grupo 5 varianza y varianza estimada de poblacin (in
cluidas las nociones de muestra, poblacin y
2
4
1
3
2
grados de libertad) pero que no sabe nada ms
11
12
10
7
8
sobre estadstica.
6
8
5. El ejercicio 5 de la serie II del captulo
10 era una prueba t para medias independien
tes, correspondiente a un estudio acerca de los
3.
Calcule un anlisis de varianza para
efectos
del color para calmar la angustia.
cada uno de los siguientes conjuntos de da
tos, utilizando el mtodo del modelo estruc Comparaba los valores en las pruebas de an
tural para cada una (a un nivel dei 5% de gustia realizadas por individuos en papel ama
significacin). Adems, calcule R2. Asegre rillo pastel o papel verde chilln. Los valores
se de mostrar sus clculos y de incluir una observados de los cinco participantes que rea
tabla completa del anlisis de varianza para lizaron la prueba impresa en papel amarillo
fueron 17, 19, 28, 21 y 18. Los valores de los
cada una.
cuatro participantes que completaron la prue
ba en el papel verde fueron 20, 26, 17 y 24.
Grupo 2
Grupo I
Grupo 3
Calcule un anlisis de varianza con estos da
0
4
0
tos. (Est utilizando el a n o v a para una situa
2
2
6
cin con slo dos grupos). Si saca la raz
0
cuadrada de la razn F, debera obtener lo
2
1. El ejercicio 3 de la serie II dei captulo
11 era un anlisis de varianza que investigaba
si los individuos que trabajaban en diferentes
reas de una empresa tenan diferentes actitu
des hacia la misma. Los resultados, en cuanto a
actitudes positivas para las tres personas anali
zadas del rea de ingeniera, fueron 10, 12 y
11; para los tres del rea de comercializacin,
fueron, , 6 y 8; para los tres de rea de conta
dura, 7, 4 y 4 y para los fies del rea de pro
duccin, 14, 16 y 13. Resuelva el mismo
problema utilizando el mtodo del modelo es
tructural y compare su respuesta con la res
puesta del captulo 11. (Asegrese de mostrar
todos sus clculos y de incluir una tabla com
pleta del anlisis de varianza).
2. Calcule un anlisis de varianza para
los siguientes datos (al 5% de nivel de signi
ficacin). Asegrese de mostrar sus clculos
y de incluir una tabla completa del anlisis de
varianza.

mismo (teniendo en cuenta el error de redon


deo) que el valor t que calcul utilizando la
prueba t para medias independientes (veremos
esta relacin entre la prueba t y el anlisis de
varianza en el captulo 16).
. Cialdini y sus colegas (1997) pidieron a
sus participantes que indiquen hasta qu grado
ayudaran a una persona en problemas. Por
ejemplo, en una pregunta se es peda que indi
caran cunta ayuda le daran a una persona que
acababa de ser desalojada de su departamento.
Las posibles respuestas iban desde no hacer
nada, pasando por opciones intermedias tales
como llevar en auto a la persona a buscar un
nuevo departamento, hasta opciones extremas
tales como invitar a la persona a vivir con uno
indefinidamente. Se asignaba a los participan

tes a una de las cuatro condiciones segn quin


fuera la persona necesitada: a) casi un extrao,
b) un conocido, c) un buen amigo, d) un fami
liar cercano. Cialdini et al. informaron:

Realizamos un anova probando nuestras ex


pectativas generales en etiano a que una rela
cin ms cercana aumentara la voluntad de
ayudar. Ese anlisis produjo un efecto alta
mente significativo que sostena nuestra hip
tesis, F(3, 82) = 33,28, p < 0,001- La [tabla
12-10] presenta las medias de ayuda relacio
nadas con cada uno de los niveles de cercana
de la relacin.
Explique los resultados a una persona que nunca
ha tomado un curso sobre estadstica. (Concn
trese slo en la lnea superior de la tabla, en los
resultados en cuanto a la ayuda del estudio 1).

Tabla 12-10.
Medias de registros en cuanto a la ayuda, la preocupacin emptica y la entereza como una funcin
del nivel de cercana de la relacin y de la situacin de necesidad.

Situacin de necesidad
Estudio 1: Desalojo
Ayuda
Preocupacin emptica
Entereza
n

Estudio 2: Nios hurfanos


Ayuda
Preocupacin emptica

Entereza
n
Estudio 3: Llamada telefnica
Ayuda
Preocupacin emptica
Entereza
n

Casi

extrao
1,20
3,04*

1,52*
*

22

4,13
4,42*
1,90*

15

E n te r e z a
n

N i os hurfanos
Ayuda

Preocupacin emptica
Entereza
n

Eamiliar
cercano

4,13h
4,36*
3,16*
22
b

6,63
4,21?
4,52*
20

6,89
4,50?
4,57b
22 e

6.11,

7,96b
5,85b
5,24*
17 c
l,54b
4,55*
4,43*
20 b

9,0lb
5,82b
4,66*
19 b

5,52?
3 ,i r
17 b

1,55.
4,66b
4,66b
19 b

0,80,
2,87*
2,17*
33 *

18

1,77.
3,56
2,16*
27

3,63h
4,34b
3 5*b
19

5,88
4.90L
5,00
20

6,95,
5,66
5,66<3
16

4,15
4,53*
2,40*
20 '

5,36
4,51*
3,02*
23 *

8,23b
5,41*
4,48*bb
19 b

8,83.
6,21b
4,80*
20 *

D esalojo

Ayuda
Preocupacin emptica

Nivel de cercana de la relacin


Buen
Conocido
amigo

0,98 ,b
3,49*,b
3,16*

N ota: Dentro de cada fila, las medias que tienen el mismo subndice no son significativamente diferentes segn la prue
ba de Tukey.
Fuente: Cialdini, R. B., Brown, S. L., Lewis, B, P., Luce, C ,, & Neuberg, S. L, (1997), tab, 1, Reinterpretacin de la
relacin empatia-altruismo: cuando uno en uno es igual a entereza". Revista de Psicologa Social y de Personalidad
{Journal of Personality and Social Psyckologyj.'IX 4 8 1 -4 9 4 . Copyright, 1997, por la Asociacin Americana de Psico
loga. Reimpreso con autorizacin.

Apndice I del captulo: frmulas de clculo optativas


para las sumas de cuadrados en un anlisis de varianza
de un criterio
Las siguientes son frmulas de clculo para las sumas de los cuadrados:
SOTotal' 2X7

jx f
N

( 12- 6)

(S X ,f t (SX;)2 ,
SC Entre"

r m in o ) 2 -------m 2
.^A--------------

ltim o

(12-7)

^Detttro ~ ^Total ^Enae

(12-8)

X v X2... -Xtjnimo son ls va^ores observados en cada grupo, y N v V2,..., nuimo son la cantidad de
observaciones de cada grupo.
La tabla 12-11 muestra los clculos del ltimo ejemplo completo del captulo, con la aplica
cin de estas frmulas. Compare estos clculos con los indicados en la tabla 12-4, en la que se
aplican frmulas de definicin.

Tabla 12-11.
Anlisis de varianza de valores de ansiedad basado aproximadamente en Clark et al. (1997), en el
que se aplican frmulas de clculo para las sumas de las desviaciones cuadrticas. (Datos ficticios).

Mo pacientes

7
8
10
7

49
64
100
49

Pacientes
con pnico

n
10
12

Pacientes
con angustia
generalizada

X
10
12

X1

121
100
144

Pacientes con
fobia social

X
11
11
11

X2
100
144

X3
21
121
121

33
22
244
363
X: 32
262
33
365
XX 32+ 33+22 + 33 = 120
IT- = 262 + 365 + 244 + 363 = 1,234
202
v,
(xxy
14.400 ......
s e T ^ x r - y -1.234-------- = 1.234 ~ - 1.234 - -1.200 = 34
12
12
sce W + W + ..
Elltt0
rt,
n2

y (XX)1 32a 332 22a

IV

n
ltima
1.024 1,089 484 1.089 14,440
12
4 3 2 T 3
=256 + 363 + 242 + 363 -1,200 = 24

^Dentro "T
ro,.i
ral~ 5

24 =10
Entre' 34

33a 120a
3 12

Anlisis de
Varianza
Factorial

Descnpcin del cptulo


> Lgica bsica de ios diseos factoriales y
los efectos interactivos.
> Lgica bsica del anlisis de varianza de
dos criterios de clasificacin,
^ Potencia y tamao del efecto del anlisis
factorial de varianza.
Extensiones y casos especiales dei . -\
anlisis factorial de varianza. .
> Controversias, limitaciones y desarrollos
.recientes..:
:
v=.v ;:
V
Los reso liados del anal sis factora! de .
, varianza segn se describen en las
publicaciones cientficas,

; ResumenL; ;
L
1Trnii os clav. Ai- >:- ;'
Ejercicios.
^ Apndice I del.capulp: formulas de
, clculo optativas para el anlisis de
^^^yarj^
Apndice II del capitul: anlisis d
varianza de un criterio con medidas
L V rjK tijdi^

n este captulo presentamos el anlisis de varianza factorial, una extensin de los


procedimientos aprendidos en los captulos 11 y 12. El anlisis de varianza fac
torial proporciona un enfoque altamente flexible y eficiente para analizar resul
tados de cierto tipo de experimentos complejos que son ampliamente utilizados
en psicologa.
Comenzaremos el captulo analizando con detenimiento la naturaleza de estos complejos di
seos factoriales de investigacin; luego expondremos brevemente el razonamiento y los procedi
mientos de clculo de un anlisis de varianza factorial. En este captulo hemos invertido la
presentacin del material por una buena razn. La lgica y la terminologa de los diseos experi
mentales probablemente sean nuevos para el alumno, mientras que el razonamiento y los procedi
mientos de clculo involucrados en la realizacin de un anlisis de varianza factorial son una
extensin bastante directa de lo aprendido en el captulo 12.

LGICA BSICA DE LOS D ISE O S FACTORIALES


Y DE LOS EFECTOS INTERACTIVOS
Presentaremos el anlisis de varianza factorial a travs de un ejemplo. Lambert y sus colegas
(1997) estaban interesados en la forma en que los estereotipos afectan las evaluaciones que hace
mos de los dems. Por ejemplo, con frecuencia las personas aplican estereotipos relacionados con
la edad y el sexo para evaluar si alguien tendr xito en un determinado empleo. Lambert et al. es
taban especialmente interesados en la forma en que la influencia de los estereotipos se ve afecta

da por a) la conciencia de que el estereotipo no es adecuado para una determinada circunstancia y


b) nuestro estado de nimo. Crean que las personas se ven afectadas en menor medida por los es
tereotipos cuando stos no son apropiados y, en especial, que no se ven afectadas por ellos cuan
do se sienten tristes.
Por lo tanto, Lamber! et al,, realizaron el siguiente experimento. Se pidi a los participan
tes que actuaran como entrevistadores laborales. Su tarea era realizar una evaluacin prelimi
nar acerca de la conveniencia de un individuo para determinado empleo1(p. 1010), puesto que
en todos los casos era el de un asistente de vuelo. Despus se entreg a los participantes un cu
rrculum de un solicitante que inclua la foto de una mujer muy atractiva y, sobre la base de
esa informacin, se preguntaba a los participantes cules eran las posibilidades de que la con
trataran, utilizando una escala del 0 (para nada) al 10 (extremadamente). El experimento utiliz
el estereotipo del atractivo fsico, que incluye la tendencia a pensar que las personas atractivas
son especialmente competentes.
Los investigadores lograron que la mitad de ios participantes se sintieran tristes antes de leer
el currculum, supuestamente como parte de otro experimento. A esos participantes se les pidi
que pensaran en un episodio de sus vidas que los haya hecho sentir muy tristes y, que incluso
hoy en da, los sigue poniendo tristes cuando lo recuerdan (p. 1004) Lo que acabamos de descri
bir era la condicin de tristeza. La otra mitad de los participantes, a quienes no se les dio ninguna
instruccin en particular, formaron la condicin neutra.
La segunda influencia de inters para los investigadores era el hecho de que el estereotipo
fuera el apropiado. Se entreg a los participantes una descripcin de un buen asistente de vuelo,
que variaba en cuanto ai grado de importancia del atractivo fsico para el puesto. Para la mitad de
los participantes de cada uno de los grupos, la descripcin subrayaba la capacidad de resolver y
analizar problemas de forma racional y analtica (p. 1010); esta era la condicin del estereotipo
inapropiado. Para los otros participantes, la descripcin subrayaba la satisfaccin de los pasajeros
y la forma en que la apariencia contribua a ello; esta era la condicin del estereotipo apropiado.
En resumen, haba dos manipulaciones experimentales: tristeza en contraposicin a neutro, y
la descripcin de puesto, adecuada al estereotipo, en contraposicin con la inadecuada.
Lambert y sus colegas podran haber realizado dos estudios: uno comparando participantes
tristes con neutros, y otro comparando participantes que recibieron descripciones de puesto ade
cuadas al estereotipo con los de las descripciones no adecuadas al estereotipo. Pero en lugar de
eso, decidieron analizar en un slo estudio los efectos de ambas circunstancias, es decir, el estado
de nimo y la calidad del estereotipo. Analizaron cuatro grupos de participantes (vase tabla 13-1):
a) aquellos en condicin de tristeza y con el estereotipo apropiado, b) aquellos en condicin de
tristeza y con el estereotipo inapropiado, c) aquellos en condicin neutra y con el estereotipo
apropiado y d) aquellos en condicin neutra y con el estereotipo inapropiado.

T a b la 1 3 - 1 .
D i s e o f a c t o r i a l u t iliz a d o p o r L a m b e r t e t a l. ( 1 9 9 7 ) .

E sta d o de nim o

oa.

T r is te

N e u tro

Apropiado

a , y . v ;c

Inapropiado

'- y i r f ; r i d

Definicin del diseo factorial de investigacin


El estudio de Lamber! et al. (1997) es un ejemplo de un estudio con diseo factorial de investi
gacin, en el que se analiza de una sola vez el efecto de dos o ms variables formando grupos
con cada combinacin de dichas variables. En el ejemplo que hemos presentado, existen dos ni
veles de estado de nimo (triste y neutro) y dos niveles de calidad del estereotipo (apropiado e
inapropiado), que permiten cuatro combinaciones posibles. Lamben et al. utilizaron todas ellas
en su estudio.
Un diseo factorial de investigacin presenta una importante ventaja con respecto a la reali
zacin de estudios de cada variable por separado: la eficiencia. Con un diseo factorial podemos
analizar ambas variables de una sola vez, sin necesidad de convocar el doble de participantes. En
el ejemplo presentado, Lambert et al. pudieron utilizar un slo grupo de participantes para anali
zar los efectos del estado de nimo y de la calidad del estereotipo.
Efectos interactivos
Existe una ventaja an ms importante del diseo factorial de investigacin. Este diseo brinda la
posibilidad de analizar los efectos de la combinacin de dos o ms variables. En el ejemplo que
estamos analizando, el estado de nimo y la calidad del estereotipo podran afectar la contrata
cin en un modo simple y aditivo. Lo que queremos decir es que las influencias combinadas po
dran ser la suma de las influencias separadas; por lo tanto, si aumenta una de esas influencias, y
tambin la otra, entonces el efecto general, que es la suma total de los dos efectos individuales, tam
bin ser mayor. Por ejemplo, supongamos que sentirse triste predispone a contratar a alguien y,
similarmente, el hecho de que el estereotipo sea apropiado predispone a contratar a una persona.
Si estos dos efectos son simplemente aditivos, entonces los participantes del grupo que se siente
triste y que recibi el estereotipo apropiado sern los ms predispuestos a contratar a la persona;
los participantes del grupo neutro, que recibieron el estereotipo inapropiado, sern los que tengan
menos predisposicin a contratar a la persona, y aquellos en las otras dos condiciones tendran
una predisposicin intermedia para contratar a la persona en cuestin.
Tambin podra suceder que una variable tuviera cierto efecto y la otra no. O que tal vez nin
guna variable tuviera ningn efecto. En la situacin aditiva, o en la que slo una variable o
ninguna tienen efectos, observar a las variables en combinacin no agrega ninguna informacin
interesante.
Sin embargo, tambin es posible que la combinacin de las dos variables cambie el resultado.
De hecho, Lambert et al. predijeron que el efecto del estereotipo inapropiado sera especialmente
fuerte en la condicin de tristeza. Esta prediccin se basaba en la nocin de que cuando nos senti
mos tristes, estamos ms predispuestos a rever nuestras reacciones iniciales, irreflexivas, basadas
en un estereotipo.
El anterior es slo un ejemplo del modo en que diferentes condiciones podran combinarse en
formas que no esperaramos al conocer slo el efecto de cada factor separadamente. Veamos otro
ejemplo. Supongamos que sentirse triste disminuye la posibilidad de contratar a alguien cuando el
estereotipo es inapropiado, pero que aumenta la probabilidad de contratar cuando el estereotipo es
apropiado (es decir, que la tristeza hace que las personas presten ms atencin a lo apropiado de la
situacin). Incluso, otra posibilidad sera que el nico grupo que tenga altas probabilidades de con
tratar a la persona sea aquel en el que el estereotipo es apropiado y el estado de nimo neutro, es
decir, estando triste, se clasifica con bajo nivel a todos en general, pero con un estado de nimo
neutro, se presta atencin a lo adecuado del estereotipo y se clasifica con un nivel alto a aqul cuyo

Tabla 13-2.
Posibilidad media de contratacin en el estudio de Lambert et ai. (1997),
Estado de nimo
T r is te

Apropiado

Inapropiado

N e u tro

5,80
5,83 .

6,75 '

atractivo fsico es adecuado. Existen tambin otras posibilidades (sera interesante que el alumno
pensara algunas y razonara su significado en relacin con los temas que estamos estudiando).
Todas aquellas situaciones en las cuales la combinacin de variables tiene un efecto especial
son ejemplos de lo que se denomina efecto interactivo. Un efecto interactivo ocurre cuando el
efecto de una variable depende del nivel de la otra variable. En el estudio de Lambert et a l, exis
ta un efecto interactivo. Si observamos la tabla 13-2 veremos que el resultado fue que los partici
pantes del grupo apropiado-triste presentaban las mayores posibilidades de contratar al solicitante;
el grupo inapropiado-neutro le segua en orden de posibilidad, y los otros dos grupos eran los que
tenan menos posibilidades (estando casi al mismo nivel). Analicemos la parte del resultado en el
que el grupo triste-inapropiado presenta menos posibilidades de contratar que el grupo neutroinapropiado. Esta parte del resultado sostiene la teora del investigador que establece que, cuando
uno se siente triste, puede contrarrestar sus estereotipos. (Qu sucede con el hecho de que el gru
po apropiado-triste sea el que presenta ms posibilidades de contratar? Los investigadores reco
nocieron que este resultado era inesperado y difcil de explicar (p. 1011).
Supongamos que los investigadores haban analizado la calidad del estereotipo y el estado
de nimo en dos estudios separados. Habran llegado a la conclusin de que cada factor tena s
lo un leve efecto. El promedio de posibilidad de contratacin, siendo el estereotipo apropiado, es
6,77 (es decir, el promedio de 5,80 y 7,73 es igual a 6,77), y en los casos en los que el estereoti
po es inapropiado, el promedio es 6,29. La posibilidad promedio de contratacin, en el caso de
los que se sienten tristes, es de 6,78, contra 6,28 de aquellos en la condicin neutra. Por lo tanto,
siguiendo el mtodo de los dos estudios independientes, los resultados importantes se hubieran
pasado totalmente por alto. Los resultados ms importantes estaban relacionados con la combi
nacin de los dos factores. Ya se empieza a percibir la importancia de descubrir los efectos de
la interaccin?
Terminologa
El estudio de Lambert et al. se analizara con lo que se denomina un anlisis de varianza de dos
criterios de clasificacin (el que se aplica a un diseo factorial de investigacin de dos facto
res). Por el contrario, las situaciones que analizamos anteriormente en los captulos 11 y 12 (co
mo el estudio acerca del estilo de vinculacin o el experimento con antecedentes delictivos) eran
ejemplos de estudios analizados utilizando un anlisis de varianza de un criterio. Se dice que
estos estudios tienen un criterio nico de clasificacin porque analizan el efecto de una sola varia
ble (como por ejemplo, el efecto del estilo de vinculacin de una persona o de la informacin
acerca de los antecedentes delictivos del acusado).
Algunos estudios investigan el efecto de tres o ms variables juntas. Por ejemplo, Lambert et
al. tambin queran estar seguros de que sus resultados no estaban afectados por el sexo. Por lo

Figura 13-1.
D is e o factorial d e tres factores u tilizad o en el
e stu d io d e L am bert e t al. (1 9 9 7 ).

tanto, en otro anlisis dividieron cada uno de sus cuatro grupos en dos subgrupos: mujeres y hom
bres. A travs de esa divisin se crearon ocho combinaciones: mujeres tristes con el estereotipo
apropiado, hombres tristes con el estereotipo apropiado, mujeres tristes con el estereotipo inapro
piado, y as sucesivamente. La figura 13-1 representa grficamente la serie completa de agrupa
ciones. El anlisis que describimos estudiaba la influencia de tres variables al mismo tiempo. Se
requieren tres dimensiones para diagramar este tipo de estudios, por eso se lo denomina diseo
factorial de tres factores, (El resultado indic que no se producan efectos significativos relacio
nados con el sexo, ni generales ni en interaccin con el estado de nimo, ni con la calidad del es
tereotipo o la combinacin de los dos). Es posible realizar diseos factoriales de cuatro factores o
ms, aunque no son sencillos de diagramar. Sin embargo, la mayora de las investigaciones psico
lgicas se limitan a diseos factoriales de dos factores y, ocasionalmente, de tres.
En un anlisis de dos criterios, cada variable o criterio de clasificacin (cada dimensin en
el diagrama) es un posible efecto principal. S el resultado de una variable, haciendo un promedio
a travs de las categoras de la otra u otras variables, es significativo, se trata de un efecto princi
pal. Lo anterior es completamente diferente de un efecto interactivo, que se basa en la combina
cin de variables. En el estudio bsico de Lambert et al. en dos sentidos, exista la posibilidad de
dos efectos principales y de un efecto interactivo. Los dos efectos principales posibles son la cali
dad del estereotipo y el estado de nimo, y el efecto interactivo posible es el de la combinacin de
la calidad del estereotipo con el estado de nimo. En un anlisis de varianza de dos criterios,
siempre se prueban dos posibles efectos principales y una posible interaccin.
Cada combinacin de grupos en un diseo factorial se denomina casilla. La meda de ios va
lores observados de cada agrupacin se denomina media de a casilla. Por ejemplo, en el estu
dio de Lambert et al. existen cuatro casillas, por ende, existen cuatro medias de casillas, una para
cada combinacin de los niveles de calidad del estereotipo y del estado de nimo. Es decir,
una casilla se refiere al estereotipo apropiado y al estado de nimo triste (como lo muestra la
tabla 13-2, su media es 7,73); otra casilla se refiere al estereotipo inapropiado y al estado de
nimo triste (5, 83); otra casilla se refiere al estereotipo apropiado y el estado de nimo neutro
(5,80), y otra casilla se refiere al estereotipo inapropiado y el estado de nimo neutro (6, 75).
Las medias segn una sola variable se denominan medias marginales. Por ejemplo, en el es
tudio de Lambert et al. hay cuatro medias marginales, una media correspondiente a todos los parti
cipantes que trabajan con el estereotipo apropiado (como vimos anteriormente, 6,77), una para
todos los participantes que trabajan con el estereotipo inapropiado (6,29), una para todos ios par
ticipantes que se sienten tristes (6,78) y una para todos los participantes con estado de nimo neu

tro (6,28). (Las inedias que acabamos de mencionar no aparecen en las tablas porque estbamos
interesados principalmente en la interaccin).
Para observar el efecto principal debemos concentramos en las inedias marginales. Para
observar el efecto interactivo, debemos concentramos en el patrn de medias de las casillas
individuales.
Reconocimiento e interpretacin de los efectos interactivos
Es muy importante comprender los efectos interactivos, ya que en muchos experimentos constitu
yen el punto principal de la investigacin.
Como ya hemos visto, un efecto interactivo ocurre cuando el efecto de una variable depende
del nivel de otra variable. Los resultados del estudio de Lambert et al. (tabla 13-2) muestran un
efecto interactivo, ya que el efecto de la calidad del estereotipo es diferente con un estado de ni
mo triste que con un estado de nimo neutro.
Un efecto interactivo puede explicarse de tres modos; con palabras, con nmeros o con un
grfico. Podemos describir un efecto interactivo con palabras diciendo que ocurre cuando el efec
to de una variable depende del nivel de otra variable. En nuestro ejemplo de Lambert et al. pode
mos decir que el efecto de la calidad del estereotipo depende del nivel del estado de nimo
(tambin podemos decir que el efecto del estado de nimo depende del nivel de la calidad del es
tereotipo. Los efectos interactivos son completamente simtricos, es decir que podemos descri
birlos desde el punto de vsta de cualquiera de las variables).
Podemos observar un efecto interactivo numricamente analizando el patrn de las medias de
las casillas. Si existe un efecto interactivo, las diferencias de las medias de las casillas de una fila
no sern iguales a las diferencias de las medias de las casillas de la otra fila. Analicemos el ejemplo
de Lambert et al. En la fila del estereotipo apropiado hay una diferencia positiva entre las medias de
las casillas; los participantes que se sentan tristes clasificaron las posibilidades de contratacin
(7,33) mucho ms altas que los participantes con estado de nimo neutro (5,80). En consecuencia,
hay una diferencia positiva de 1,93 (es decir, 7,73 - 5,80 = 1,93). Sin embargo, si observamos la fi
la del estereotipo inapropiado, aquellos que se sentan tristes calificaron la posibilidad de su proba
bilidad de contratacin (5,83) a menor nivel que aquellos con estado de nimo neutro (6,75). La
diferencia entre estado de nimo triste y neutro, para los participantes con el estereotipo inapropia
do, es de -0,92.
La tabla 13-3 indica las medias marginales y de casilla correspondientes a seis posibles resul
tados de un estudio factorial ficticio de dos criterios, que buscaba la relacin de la edad y la edu
cacin con el ingreso. La edad se divide en dos niveles (menores, entre 25 y 29; en contraposicin
con mayores, aquellos que tienen entre 30 y 34) y la educacin en otros dos niveles (secundaria
en contraposicin con universitaria). Los resultados ficticios que presentamos en este caso estn
exagerados con el fin de dejar en claro cundo hay efectos interactivos y cundo efectos principa
les. En la realidad, con frecuencia se encuentran pequeas diferencias de medias en la direccin
de un efecto interactivo o uno principal, que no son lo suficientemente grandes como para ser es
tadsticamente significativas.

Tabla 13-3.
Posibles inedias de resoltados de un estudio acerca de la relacin de la edad y la educacin con el in
greso. (Datos ficticios, miles de dlares).
Educacin
secundaria

Educacin
universitaria

20
20

20

Mayores
Total

20

25

Menores

i
Total

'

Menores

i w

Total

35

Educacin
universitaria

20

3 _

25

Educacin
Educacin
secundaria universitaria

Total

Educacin
secundaria

20 .
: 20

25

15

20

30

Total

. 25

' '40 . . 30
35'

35

Resultado F

Educacin
universitaria

Total

r~---10. OOA: 20
20
40/:A 30

Resultado

10
10
6 \ 60
35

Tota!

30

Resultado D

Mayores

Educacin
secundaria

30

Educacin Educacin
secundaria universitaria

Resultado C

Resultado 8

Resultado A

Educacin
Secundaria

20

Total

3oy.

'' 3" ,
25

Educacin
universitaria

V:

S-V-
40

En el resultado A, existe una interaccin. Observamos que en la fila Menores no existe diferen
cia de ingresos por educacin; pero en la fila Mayores, la media de la casilla correspondiente a
la educacin universitaria es mucho mayor que la media de la casilla correspondiente a educacin
secundaria. Una manera de expresar verbalmente lo anterior sera la siguiente: La educacin no
est relacionada con el ingreso en el caso del grupo Menores5, pero en el caso del grupo M ayo
res', las personas con educacin universitaria ganan mucho ms que aquellas con menor nivel de
educacin".
El resultado ficticio B tambin refleja una interaccin. En la fila Menores", la media de in
greso correspondiente a la educacin secundaria es mayor a la media de ingreso correspondiente
a la educacin universitaria; sin embargo, en la fila Mayores la media de ingreso correspon
diente a la educacin secundaria es menor. Expresado verbaimente, este patrn indica que entre
las personas de menor edad, aquellos con slo una educacin secundaria ganan ms dinero (tal
vez porque ingresaron al empleo con anterioridad o porque las ciases de empleos que desempe
an comienzan con un nivel superior); sin embargo, entre las personas de mayor edad, aquellos
con una educacin universitaria ganan ms dinero.
El resultado ficticio C no refleja un efecto interactivo. En la fila Menores, la media de edu
cacin secundaria es 20 puntos menor que la media de educacin universitaria. Lo mismo ocurre
en la fila Mayores . Expresado en palabras, lo anterior significa que, ya sean menores o mayo
res, las personas con educacin universitaria ganan $20.000 ms.
El resultado ficticio D tampoco refleja interaccin, ya que en ninguna de las filas existe dife
rencia alguna. Independientemente de la educacin, las personas mayores ganan $50.000 ms.
El resultado ficticio E refleja una interaccin. En la fila Menores, la media correspondiente
a la educacin universitaria es 10 puntos mayor; pero en la fila Mayores, la media correspon
diente a la educacin universitaria es 20 puntos mayor. Por lo tanto, si bien entre las personas me
nores, los que tienen educacin universitaria ganan un poco ms, entre las personas mayores, los
que tienen educacin universitaria ganan mucho ms.

Finalmente, el resultado F tambin refleja un efecto interactivo. Existe una diferencia menor
en la fila Menores que en la fila Mayores . Al igual que el resultado E, este patrn indica que,
en el caso de las personas menores, aquellas que tienen educacin universitaria ganan un poco
ms; pero entre las personas mayores, aquellas con educacin universitaria ganan mucho ms.1
La tabla 13-4 indica los posibles resultados de otro estudio ficticio. En este experimento fac
torial, las dos variables manipuladas experimentalmente son el grado de dificultad de la tarea (f
cil en contraposicin con difcil) y el nivel de excitacin psicolgica (baja, moderada o alta). La
excitacin, en este estudio, se refiere al nivel de ansiedad del participante con respecto a la impor
tancia de realizar bien la tarea. La variable que se est midiendo es el nivel de desempeo del par
ticipante en una serie de tareas aritmticas. La interpretacin de las posibles interacciones es la
siguiente:
Resultado A: no hay interaccin. Las medias de las casillas en la fila Fcil no difieren en
tre s, y las medias de las casillas en la fila Difcil" tampoco. S existe un efecto principal: la difi
cultad de la tarea afecta el desempeo; la excitacin no.
Resultado B: no hay interaccin. Las medias de las casillas en la fila Fcil aumentan de a
10, de bajo a moderado y de moderado a alto. Lo mismo ocurre con las medias de las casillas en la
fila Difcil. Nuevamente existe slo un efecto principal: la excitacin afecta el desempeo; la
dificultad de la tarea, no.
Resultado C: no hay interaccin. Las medias de las casillas en la fila Fcil aumentan de a
10, de bajo a moderado y de moderado a alto; lo mismo sucede con las medias de las casillas en la
fila Difcil. En este ejemplo, existen dos efectos principales: la excitacin afecta el desempeo
y la dificultad de la tarea tambin.
Resultado D: existe interaccin. El patrn de las medias de las casillas en la fila Fcil"
muestra un aumento de a 10, de bajo a moderado, y otro aumento de a 10, de moderado a alto. El
patrn que describimos anteriormente no es el mismo que el de las medias de las casillas en la fi
la Difcil", donde nuevamente el aumento es de a 10 de bajo a moderado, pero de 40 de modera
do a alto. Por lo tanto, en todos los casos, el desempeo con tamas fciles o difciles tiende a
mejorar con el aumento de la excitacin. Sin embargo, el impacto entre excitacin alta y modera
da es mucho mayor para tareas difciles que para tareas fciles.
Resultado : existe interaccin. El patrn de las medias de las casillas en la fila Fcil"
muestra un aumento de a 10 y luego una disminucin de a 10. Este patrn es bastante diferente al
de la fila Difcil", donde observamos una disminucin de a 10 y luego un aumento de a 10. En el
caso de las tareas fciles, el mejor desempeo se produce en la condicin de excitacin modera
da; en cambio, para las tareas difciles, el peor desempeo se produce en la condicin de excita
cin moderada.
Resultado P: existe interaccin. En la fila Fcil, las medias de las casillas aumentan a me
dida que avanzamos, mientras que en la fila Difcil disminuyen. En el caso de las tareas fciles,
a mayor excitacin, mejor es el desempeo; en el caso de las tareas difciles, la excitacin inter
fiere con el desempeo. (El resultado F es el ms cercano a un descubrimiento psicolgico bien
fundamentado, el cual se conoce como la Ley de Yerkes-Dodson).

! Sobre la base de las estadsticas realizadas en 1990 p o r la Secretara de Educacin de ios Estados Unidos, 3a situacin
actual en ese pas es muy cercana al resultado F, aunque no tan extrema. En ambas franjas de edad, las personas con
educacin universitaria ganan ms que aquellas que tienen slo educacin secundaria, pero la diferencia e s un poco
mayor en la franja de personas mayores. Sin embargo, es importante recordar que el hecho de que una persona reciba o
no educacin universitaria tambin est relacionado con la ciase social de sus padres y con otros factores que pueden
afectar el ingreso ms de o que lo hace la educacin.

Tabla 13-4.
Algunos resultados posibles de un experimento acerca del efecto del grado de dificultad y la excita
cin sobre el desempeo. (Datos ficticios).

Fcil

R esu ltad o B

Excitacin
Baja Moderada Alta

Total

Excitacin
Baja Moderada Alta

10

Difcil
Total

15

Fcil

v v #

Total

10

'

Total

Excitacin
Baja Moderada Alta

10

10A

10

TiV;

:2a y.

30 y.

20

10

20 :

. (:20 \:U

20 '

20

; 10

20

3 " 20

20 'ri

30

40 ^

10

20

30

15

25

35

15

15

Resultado D

Difcil

R esu ltad o C

20

Resultado E
30-

20

10

'20

:20 '6 0 -

30

20

' 10

15

15

20

45

'

Total

soy

Resultado F

Tarea

R esu lta d o A

13,3

10

'20A;:

1 20 ' 16,7

30

:V-20^

15

20

20

30
10'
20

Identificacin grfica de los efectos interactivos


Otra forma comn de interpretar los efectos interactivos es mediante la representacin grfica del
patrn de las medias de las casillas. Por lo general, la representacin grfica se realiza a travs de
un grfico de barras.2 La figura 13-2 es una reproduccin de la publicacin del estudio de Lambeit et al. Los grficos de las figuras 13-3 y 13-4 muestran los grficos de los resultados ficticios
que acabamos de analizar (los que aparecen en las tablas 13-3 y 13-4, respectivamente).
Acerca de los grficos que mencionamos arriba cabe destacar lo siguiente: siempre que exis
te una interaccin, el patrn de las barras de una seccin del grfico ser diferente del patrn de la
otra seccin del grfico. As, en la figura 13-2, el patrn correspondiente a inapropiado-triste est
un escaln ms abajo, pero el patrn correspondiente a apropiado-triste est un escaln ms arri
ba. El hecho de que las barras tengan diferentes patrones es precisamente una forma grfica de in
dicar que el patrn de diferencias entre las medias de las casillas de una fila y de la otra no es el
mismo.
Analicemos la figura 13-3. Observemos primero los resultados C y D. En los resultados C, las
series de barras que representan ios grupos Menores y Mayores tienen el mismo patrn, am
bas aumentan de a 20. En el resultado D, arabas son parejas. En los resultados C y D, las barras
que representan al grupo Menores y las que representan al grupo Mayores tienen el mismo
patrn. El C y el D eran los ejemplos en donde no haba interaccin. En todos los otros resultados,
en los que s haba interaccin, los patrones de las barras no son paralelos. Por ejemplo, en el re
sultado A, las dos barras que representan al grupo Menores estn parejas, mientras que las ba-

2 La utilizacin de grficos de barras para representar las medias de las casillas de un anlisis de varianza, cuando exis
te un efecto interactivo, se ha convertido en e l mtodo estndar en los ltimos aos. Anterioimente, era ms comn uti
lizar grficos de lneas. Veremos este tema y ejem plos referidos al mism o en la seccin donde tratamos la descripcin
del anlisis factorial de varianza en las publicaciones cientficas.

rras que representan al grupo Mayores indican un aumento. En los resultados B, las barras que re
presentan al grupo Menores muestran una disminucin, en el caso de la educacin universitaria,
con respecto a la secundaria, mientras que las barras que representan el grupo Mayores muestran
un aumento en el caso de la educacin universitaria con respecto a la secundaria. En los resultados E
y F, tanto las barras que representan al grupo Menores como ai Mayores muestran un aumento,
pero las barras que representan al grupo Menores muestran un aumento menor que las barras que
representan al grupo Mayores.
Analicemos la figura 13-4. Los resultados A, B y C muestran la ausencia de interaccin den
tro de cada resultado, y los patrones de las barras que representan la excitacin baja, moderada y
alta son iguales. En el resultado D existe interaccin, que se refleja en la figura de la siguiente ma
nera: las barras dentro del nivel bajo son parejas al igual que dentro del nivel moderado; pero en
tre las barras que representan el nivel de excitacin alto, hay un aumento en la condicin de tarea
difcil con respecto a la tarea fcil. La interaccin del resultado E se ve en tos aumentos en ios ni
veles bajo y alto de excitacin y, por otro lado, en la disminucin en el nivel moderado de excita
cin. La interaccin del resultado F se refleja en el hecho de que existe un aumento entre las
barras del nivel bajo, mientras que las barras del nivel moderado son parejas, y una disminucin
en la barra que representa la condicin difcil.
La figura 13-5 muestra una alternativa diferente a la de la figura 13-4 en cuanto a la forma de
representar grficamente los resultados de la tabla 13-4. En este caso, hemos agrupado las barras
correspondientes a las condiciones difcil y fcil . Las barras que representan la tarea fcil con
excitacin baja, moderada y alta estn ubicadas una al lado de la otra, y las barras que representan
la tarea difcil, con excitacin baja, moderada y alta, se encuentran tambin una al lado de la otra.
Esta alternativa de agrupacin es completamente equivalente en significado y produce exacta
mente las mismas conclusiones. Por ejemplo, en el resultado A las tres barras de tarea difcil son
parejas, al igual que las tres barras de tarea fcil. En el resultado C, donde tampoco hay interac
cin, las tres barras de tarea fcil aumentan con el mismo patrn que las tres barras de tarea dif
cil. Sin embargo, analicemos el resultado D, donde s existe una interaccin. El patrn de las

Figura 13-2.

Calificaciones con respecto a la candidata


fsicamente atractiva para el empleo, como
una funcin de la concepcin del atractivo
fsico (inapropiado en contraposicin con
apropiado) y del estado de nimo manipu
lado (triste en contraposicin con neutro).
Experimento 3. Los nmeros mayores in
dican una mayor posibilidad de contrata
cin del objetivo para el empleo [Fuente:
Lambert, A. IKhan, S. R., LickelB. A. &
Fricke, K. (1997), fig. 1. El estado de ni
mo y la correlacin con estereotipos positi
vos en contraposicin con los negativos.
R e v is ta c ie n tfic a d e P s ic o lo g a S o c ia l y d e
P e r s o n a lid a d [ J o u r n a l o f P e r s o n a l i t y a n d
S o c i a l P s y c h o l o g y ] 72,1002-1016. Copy

right 1997, por la Asociacin America


na de Psicologa. Reimpreso con Auto
rizacin]

Estado d is m o t r ^

Iripropad<5:

n^Cbnce^jiSb'del!

'.- -.

Api^id) :

Resultado A'

6050-;.v

60. '

''

50-

4>:--:- ' -:^ : - 4 : P s s

' '1v-.r Merines

. Resultado C

Resultado B
. '

50-

40-

i Mayores

.'..Metires,;

Mayores-."-..
Nivel educativo
O Eciucacidn secundaria
fH Educacin UnWetsitiiria

::' :.;ly Resut^;E:::yV:::y

:Ms notes ' .:

Mayores. :

. -\ Menores ..

VA:' ; '

Mayores.

Resiitd F ;

........

Menores.".

"

.... "'.............

/Mayores':'-

Figura 13-3.

Grficos de los resultados ficticios de la tabla 13-3.

barras que representan la tarea fcil es diferente del patrn de las barras que representan la tarea
difcil. Existe un escaln mayor entre la excitacin moderada a alta en las barras de la tarea difcil
que en las de tarea fcil.
Tambin podemos identificar efectos principales a partir de estos grficos. En la figura 13-3,
se mostrara un efecto principal de la edad si las barras que representan al grupo de menor edad
fueran todas ms altas o ms bajas que las barras que representan al grupo de mayor edad. Por
ejemplo, en el resultado C, las barras que representan al grupo de mayor edad son claramente ms
altas que las barras del grupo de menor edad. Qu sucede con el efecto principal de las barras
que no estn agrupadas, como son, en este caso, la educacin universitaria en contraposicin con
la secundaria? En el caso de las barras no agrupadas, debemos observar si el patrn general au
menta o disminuye. Por ejemplo, en el resultado C tambin existe un efecto principal de la educa
cin, porque el patrn general de las barras aumenta en cuanto a la educacin universitaria con
respecto a la educacin secundaria, y lo hace tanto para el grupo de menor edad como para el de
mayor edad. El resultado D muestra un efecto principal de la edad (las barras del grupo de mayor
edad son ms altas que las barras del grupo de menor edad). Sin embargo, el resultado D no mues-

Resultado A

Tarea

Fcil.
Difcil

' ' Resultado F

V.';;

;:; .;v"

Exciiack5ri:v\!:

! Ail

F igura 13-4.

Grficos de los resultados ficticios de la tabla 13-4.

tra un efecto principal de la educacin; el patrn es parejo tanto para las barras que representan al
grupo de mayor edad como para las que representan al grupo de menor edad. El resultado A en la
figura 13-4 muestra un efecto principal del grado de dificultad de la tarea, pero no del nivel de ex
citacin, ya que las alturas promedio de las barras son las mismas para la excitacin baja, modera
da y alta; mientras que dentro de cada nivel de excitacin, las barras aumentan de fcil a difcil.
Relacin entre efectos interactivos y principales
Es posible que cualquier combinacin de efectos principales e interactivos sea significativa. Por
ejemplo, puede ocurrir que todas sean significativas, como lo muestra el patrn del resultado F
en la tabla 13-3, segn el cual observamos que los alumnos mayores ganan ms (efecto principal
de edad), los alumnos universitarios ganan ms (efecto principal del nivel de educacin), y el ni
vel hasta el cual los alumnos universitarios ganan ms depende de la edad (efecto interactivo).
De modo similar, en el resultado D de la tabla 13-4, vemos que, en lneas generales, las per
sonas se desempean mejor en tareas difciles (efecto principal relacionado con la dificultad de
la tarea) y con mayores niveles de excitacin (efecto principal relacionado con el nivel de excita
cin), pero el efecto producido por la dificultad de la tarea slo se observa en relacin con altos
niveles de excitacin (interaccin). (Cabe destacar, de todos modos, que el efecto principal pro
ducido por la dificultad de la tarea, es decir, el mayor promedio logrado al realizar tareas ms di-

Resultado A

viV'
'

' 40

Resultado B

'y V''T yL.404

30

20
V'iO

'

Baja Moderada j^ita/ Baja Moderada Alta'


' ;.Excitacin,. '
: Excitacin

: :Y8aj Moderada, Alta Baja Modelada Alta .


Excitacin ' i Excitacin

Excitacin

:r Excitacin

...

Figura 13-5.

Grficos alternativos (en relacin con la figura 13-4) de los resultados ficticios que aparecen en la tabla 13-4.

fciles, se debe en su totalidad al alto nivel de excitacin. Ms adelante seguiremos tratando este
tipo de situaciones).
Tambin puede existir un efecto interactivo sin efectos principales. El resultado B de la tabla
13~3 es un ejemplo de lo anterior. El nivel promedio de ingreso es el mismo para Menores y
Mayores (no existe efecto principal de la edad), y es el mismo para personas con educacin uni
versitaria o secundaria (no existe efecto principal del nivel de educacin). De manera similar, en
el resultado F de la tabla 13-4, el desempeo promedio es el mismo pralos niveles bajo, modera
do y alto de excitacin (no existe efecto principal del nivel de excitacin), y es el mismo para ta
reas fciles y difciles (no existe efecto principal del nivel de dificultad de la tarea). Sin embargo,
en ambos ejemplos existen claras interacciones.
El ejemplo de Lambed; et al. (1997) que analizamos anteriormente es, en realidad, un ejemplo
de interaccin sin efectos principales (vase tabla 13-2 figura 13-2). Es verdad, que en lneas ge
nerales, los participantes que se sentan tristes calificaron sus posibilidades de contratar de forma
ms alta que los participantes con estado de nimo neutro. Sin embargo, la diferencia no fue lo su
ficientemente importante como para resultar significativa desde el punto de vista estadstico. De
modo similar, la diferencia entre las condiciones en las que el estereotipo era apropiado o inapro
piado no fue lo suficientemente importante como para ser significativa. Es decir, que en ese estu
dio slo el efecto interactivo era significativo. (En la prxima seccin principal veremos cmo se
calcula realmente si un efecto es lo suficientemente importante como para ser significativo).

Tambin puede ocurrir que exista un efecto principal significativo junto con una interaccin,
o slo un efecto principal significativo, o bien que no existan ni efectos principales ni interactivos
que sean significativos. Sera interesante observar cuntas de esas posibilidades se pueden identi
ficar en las dos series de resultados ficticios de las tablas 13-3 y 13-4.
Cuando no existe interaccin, el efecto principal tiene un significado directo. Sin embargo,
cuanto existe una interaccin junto con un efecto principal, debemos ser cuidadosos al sacar con
clusiones acerca del efecto principal. Analicemos el resultado D del ejemplo relacionado con la
excitacin y la dificultad de la tarea (tabla 13-4). Suponiendo que las diferencias son lo suficien
temente importantes como para ser significativas, existen dos efectos principales y una interac
cin. Pero como observamos anteriormente, el efecto principal de la dificultad de la tarea se debe
completamente a la casilla en la que se combinan el alto nivel de excitacin y la tarea difcil. Se
ra engaoso realizar cualquier afirmacin acerca de la comparacin de tareas difciles con tareas
fciles en general, sin tener en cuenta que el efecto realmente depende del nivel de excitacin.
A veces, el efecto principal se mantiene claramente por encima de cualquier interaccin.
Analicemos nuevamente el resultado D del ejemplo acerca de excitacin y dificultad de la tarea.
En ese resultado, el efecto principal de la excitacin se mantiene por encima de la interaccin.
Tanto en el caso de las tareas fciles como de las difciles ocurre que el bajo nivel de excitacin
produce el menor nivel de desempeo, la excitacin moderada produce el segundo desempeo en
la escala, y el nivel alto de excitacin produce el mejor desempeo. (Aun as, existe una interac
cin porque el grado en el cual un alto nivel de excitacin produce mejor desempeo que la exci
tacin moderada es mayor para las tareas difciles que para las tareas fciles).

LGICA BSICA PEI ANLISIS DE VARIANZA DE DOS CRITERIOS


El procedimiento estadstico para analizar los resultados de un experimento factorial en dos senti
dos se denomina anlisis de varianza de dos criterios. La lgica bsica es la misma que la que
aprendimos en los captulos 11 y 12. En cualquier anlisis de varianza se calcula una razn F; y
esa razn F compara la estimacin de la varianza poblacional, basada en la variacin entre las
medias de los grupos de inters, con la estimacin de la varianza poblacional basada en la varia
cin dentro de los grupos.
Las tres razones Fde un anlisis de varianza de dos criterios
En un anlisis de varianza de dos criterios, existen tres razones F: uno para el efecto principal de
la columna, uno para el efecto principal de la fila y uno para el efecto interactivo. El numerador de
cada una de estas razones F ser una estimacin intergrupal de la varianza poblacional, basada n
los grupos que se comparan al analizar determinado efecto interactivo o principal. La estimacin
intragrupal de varianza es la misma para las tres razones F: siempre ser el promedio de las esti
maciones de varianza poblacional calculadas a partir de las observaciones internas de cada una de
las casillas.
Lgica de la determinacin de las razones F
para los efectos principales de columnas y de filas
Una manera de comprender cmo se realiza el anlisis de los efectos principales es la siguiente.
Analicemos el efecto principal de columnas. Calculemos la siguiente razn F: el numerador es
una estimacin intergrupal de la varianza basada en la variacin entre las medias marginales de

columnas. E! denominador es una estimacin intragrupal de la varianza basada en el promedio de


las estimaciones de la varianza a partir de cada una de las casillas. Pensemos en el ejemplo del es
tudio de Lambert et al. (1997). La razn F correspondiente al estado de nimo (la variable de las
columnas segn como hemos diagramado el cuadro) se calcula de la siguiente forma. El numera
dor, la estimacin intergrupai de la varianza, se. basa en la diferencia entre la media marginal del
estado de nimo triste y la media marginal del estado de nimo neutro, El denominador, la estima
cin intragrupal de la varianza, se basa en el promedio de las estimaciones de la varianza poblaciona'l calculadas a partir del interior de las cuatro casillas.
El procedimiento para el efecto principal de las las mantiene la misma lgica. Se calcula uti
lizando una estimacin intergrupa! de la varianza basada en la diferencia entre las dos medias
marginales de las filas. (En el estudio de Lambert et al. las medias marginales de las filas son la
media de todos los participantes con estereotipo apropiado y la media de todos los participantes
con estereotipo inapropiado)
La figura 13-6a muestra la estimacin intergrupai columna" de la varianza, basada en la di
ferencia entre la media de las observaciones de la primera columna (rea sombreada) y la media
de las observaciones de la segunda columna (rea sin sombrear). La figura 13-b muestra la esti
macin intergrupai fila, basada en la diferencia entre la media de las observaciones de l fila su
perior (rea sombreada) y la media de las observaciones de la fila inferior (rea no sombreada).
Finalmente, la figura 13-6c muestra la estimacin intragrupal de la varianza" (utilizada para to
das las razones F), basada en la variacin entre las observaciones de cada una de las casillas.
Lgica de la determinacin de ia razn f de los efectos interactivos
La lgica de la razn F de un efecto interactivo es un poco ms compleja. Se traa tambin de una
razn entre una estimacin intergrupai y una estimacin intragrupal. La estimacin intragrupal es
el promedio usual de las estimaciones de la varianza poblaciona, calculado a partir de todas las
casillas individuales. Lo que resulta ms complejo es el clculo de la estimacin intergrupai de la
varianza a partir del efecto interactivo.
Una forma consiste en considerar al efecto interactivo como una descripcin de las posibles
combinaciones restantes despus de analizar los efectos principales de las columnas y las filas. Es
decir, en un diseo 2 x 2 , los efectos principales han agrupado a las cuatro casillas en filas y co-

Figura 13-6.

Diagrama de ayuda para comprender un anlisis de varianza factorial 2x2: (a) estimacin intergrupai co
lumna de a varianza basada en la diferencia entre la media de los participantes en la primera (sombreada) y
la segunda (no sombreada) columna; (b) estimacin intergrupai fila, basada en la diferencia entre la media
de los participantes de la fila superior (sombreada) e inferior (no sombreada), y (c) estimacin intragrupal de
varianza basada en la variacin entre las observaciones de cada casilla.

En el cuadro 12-1 vimos que el anlisis de


varianza simula la forma en que los investi
gadores en el campo de la psicologa plani
fican la investigacin, como tambin la
forma n que todos pensamos. Conociendo
ese paralelismo -sea que los investigadores
realicen la comparacin conscientemente o
no- es probable que con frecuencia utilicen
el modelo bien definido del anlisis de varianza como gua de su propia lgica, Y lo
hacen no slo cuando analizan informacin
o cuando disean una investigacin; proba
blemente, tambin utilizan el anlisis de
varianza como metfora cuando teorizan.
Estudiar estadstica es, en cierto sentido, un
entrenamiento en cuanto a la manera de ver
el mundo.
Un clar ejemplo del modo en que la
estadstica influye en la forma de pensar de
los psiclogos acerca de su objeto de estu
dio, y no slo sobre la informacin recopi
lada, es el estudio de la personalidad. En
los aos 60, el campo de la personalidad
cambi para siempre a travs del trabajo de
Walter Mischel (1968). Mischel pareca ha
ber demostrado que, como rega general, la
circunstancia (el semforo ponindose en
rojo, por ejemplo, o una persona bien vesti
da pidiendo ayuda) era un mejor elemento
de prediccin de cmo va a actuar una per
sona que cualquier otro rasgo de la perso
nalidad (por ejemplo, que una persona sea
cautelosa o altruista por naturaleza). Aco
sados, los tericos de la personalidad -que
eran de formacin psicodnmca- lucha
ron por defenderse dentro de las reglas de
juego que Mischel haba establecido: Cun
to de la varianza del comportamiento poda

422

Es tads tic a pa ra psic oEoga

realmente predecirse travs de medidas 1


de la personalidad? s decir, que los teri
cos de la personalidad se vieron obligados
a pensar estadsticamente. .
' ' -;:
Uno de los resultados de este desafo ;
ha sido lo que se dio en llamar interaccio- .
nismp (p. ej i:Endler & Magnusson, 1976). ",
El interaccionismo representa la idea de
que el comportamiento se predice mejor a i
travs de la interaccin entre la persona y la .
circunstancia. De inmediato adivinamos
cul ..fue el mtodo estadstico que m a y o r ,
influencia tuvo en este campo (lo estamos -j
analizando en este captulo),
.
.
Por ejemplo, de. acuerdo con este modlo, ni la ansiedad como rasgo de persona- :
lidad, ni la crcuristncia de rendir l s a t , es ;
tan buen elemento de prediccin del estado .:
de ansiedad como saber que una persona I
con determinada tendencia la ansiedad
percibe el hecho de rendir el s a t como una
circunstancia angustiante. El acento sta ' .
puesto en l hecho de que l comporta
miento es alterado constantemente por la Y
disposicin interna del individuo en interaccin con su percepcin de las cambian
tes circunstancias.
; Sigamos a un hombre ansioso a travs .
de algunas situaciones. Puede sentirse an ;
ms o menos ansioso a medida que pasa de :
la circunstancia del examen a una j^aya/de : 1
estacionamiento oscura y vaca, segn la
interaccin que se produzca entre su rasgo
de ansiedad y su percepcin de esa hueva . ;
circunstancia. Lo mismo suceder cuando
vaya en camino hacia su casa en Ja autopis- :
ta, abra el portn dei garaje y entre en una
casa vaca.
. v

De acuerdo con el interaccionismo, la


persona no es un componente pasivo sino
un agente activo intencional en el proce
so de interaccin (Endler & Magnusson,
1976 p. 968). Lo importante de la circuns
tancia es nuevamente, su significado para
la persona.
Los interaccionistas admiten que este
tipo de modelo estadstico es an demasa-.
do mecnico y lineal. En el mundo real
existe un intercambi constante entre la
circunstancia y la persona, algo ms pareci
do a na transaccin que a una interaccin!
No obstante, sostienen que para probar es
tos modelos se necesitan herramientas esta
dsticas ms complicadas, Y estn. llegan
do; por ejemplo, Kenny (1995) predice que
dentro de 10 aos el anlisis basado en e l '
historial de sucesos y el modelo de niveles,
mltiples sern herramientas estndar para
el anlisis de informacin. Por so, a medi
da que los. expertos en Estadstica produz

can metodologas ms - complicadas,- ; los


tepricos.de la personalidad las adoptarn, :
no slo como herramientas para el anlisis
de infonnacinsno tambin cmo .mode- ;
los d la influencia mutua- entre el interior
de las persona y su mundo exterior.
Esa misma influencia de la estadstica
en la teoria se repite en el rea de la cogni
cin, la percepcin y el aprendizaje (Gigerenzer & Munay (1987), entre muchas
otras reas de la. psicologa.; En cierto senti- ;
do, podramos decir que los pioneros de la
estadstica ahora estn deterimnandrio slo .la. complejidad posible'de 1 investiga-:'
dn psicolgica sino tambin la profundi
dad dej a propia, formulacin terica. .Estn
aduendose, de los canales a travs de los
cuales fluye el patrn real de pensamiento,
de los psiclogos y, porlo tanto,, al menps
en la actualidad, estn dando forma y diri
giendo gran parte de nuestra comprensin
de la psicologa.

lumnas, pero tambin es posible agrupar las casillas de un modo diferente. La figura 13-7, basada
en el estudio de Lambert et a l, muestra una posible organizacin restante de las cuatro casillas en
dos agrupaciones mayores: a) una agrupacin de dos casillas formada por la casilla superior iz
quierda (estereotipo apropiado y estado de nimo triste) junto con la casilla inferior derecha (este
reotipo inapropiado y estado de nimo neutro), y b) otra agrupacin de dos casillas formada por la
casilla inferior izquierda (estereotipo inapropiado y estado de nimo triste) y la casilla superior
derecha (estereotipo apropiado y estado de nimo neutro). La estimacin intergrupal de la varian
za, segn el efecto interactivo, puede entonces ser determinada a partir de la variacin entre las
medias de estas dos agrupaciones.
Con un diseo 2 x 2 , existe slo una combinacin de pares de casillas que y no fueron teni
das en cuenta por las organizaciones en columnas y en filas, el patrn de agrupacin representado
por el ejemplo en la figura 13-7. Pero con diseos mayores de dos criterios, como por ejemplo un
diseo 2 x 3 , existe ms de una forma de combinar las agrupaciones, y todas deben tenerse en
cuenta. Por eso, calcular la estimacin intergrupal de la varianza a partir de un efecto interactivo,
cuando tratamos con situaciones distintas del diseo 2 x 2 , puede ser bastante complicado. Afor
tunadamente, sucede que calcular la estimacin intergrupal de la varianza, segn el efecto de la
interaccin, es mucho ms directo desde el punto de vista del modelo estructural que aprendimos
en el captulo 12.

F igura 13-7.

Interaccin como comparacin de la media de las observa


ciones de las casillas sombreadas (estado de nimo neutro,
estereotipo apropiado y estado de nimo triste, estereotipo
inapropiado) con la meda de las observaciones en las casi
llas no sombreadas (estado de nimo triste, estereotipo apro
piado y estado de nimo neutro, estereotipo inapropiado) del
estudio de Lamber! et al. (1997).

Modelo estructura! para el anlisis de varianza de dos criterios


Desde la perspectiva del modelo estructural, el desvo general de cada observacin con respecto a
la gran media puede dividirse en varios componentes. En un anlisis de dos criterios, existen cua
tro componentes de ese desvo general (vase tambin la figura 13-8):
1. El desvo de las observaciones con respecto a la media de su casilla (que se utiliza en la es
timacin intragrupal de la varianza poblacional).
2. El desvo de la media de la fila de la observacin con respecto a la gran meda (que se utili
za en la estimacin ntergrupal de la varianza poblacional a partir del efecto principal de la varia
ble diagramada a lo largo de las filas).

F igu ra 3-8.

Clculo del desvo de cada observacin con respecto a la gran media.

3. El desvo de la media de la columna de la observacin con respecto a la gran media (que se


utiliza en la estimacin intergrupal basada en el efecto principal de la variable diagramada a lo
largo de las columnas).
4. Un desvo restante, que queda despus de restar los otros tres desvos-,al desvo general con
respecto a la gran media (es el que se utiliza en la estimacin intergrupal del efecto interactivo).
Es recomendable tomarse un momento para estudiar la figura 13-8, ya que es la mejor mane
ra de comprender y recordar lo que estamos explicando.
Clculos del anlisis de varianza de dos criterios
Ai realizar un anlisis de varianza utilizando el modelo estructural, las razones F se obtienen a)
calculando todos los desvos de cada tipo, b) elevndolos al cuadrado, c) sumando los desvos
cuadrticos de cada tipo para obtener las sumas de los desvos cuadrticos, d) dividiendo cada su
ma de desvos cuadrticos por los grados de libertad correspondientes para obtener las estimacio
nes de la varianza y e) dividiendo las distintas estimaciones de la varianza intergrupales por las
estimaciones de la varianza intragrupales.
Las sumas de los cuadrados se calculan con las siguientes frmulas:

SCFlte = S(MF,to-GM}2

(13-1)
C 3' 2)

Interaccin =

% ,

,,9

(13-3)

S((Jf-<3W ) - (X - ifJ-tJlF U ,, - G W )-(C olu m n -,-O *0j"

SCDe[,tr0=X(X~A)2

03-4)

SCToa =S.(X~GM)

(13-5)

En las frmulas anteriores. SCFltos, 5CColumn, S C aata6a y S C D am son las sumas de los cuadrados de las filas, de las columnas, de las interacciones y de las intragrupales de las casillas.
El signo suma (X) indica que se deben sumar todas las observaciones que corresponden (no
slo todas las filas o columnas o casillas). GM es la gran media; X es la observacin; AfPia y
^Columnason *as meclias de la fila o la columna de una observacin, y M es la media de la casi
lla de una observacin.
Como es usual, las diferentes sumas individuales de cuadrados forman la suma total de cua
drados. (Este dato se puede utilizar para controlar los clculos aritmticos). La frmula es la si
guiente,
^Total ~ apilas + ^Coiumnas + ^Interaccin ^Dentro
(13-6)
Las frmulas de las estimaciones de la varianza poblacional son, por lo general, las sumas de los
cuadrados divididas por los grados de libertad;
<SC*fFas

(13-7)
Filas

<?2
A ruA
^ Columnas
-'Columnas0
Coluroas ~~
Sl Columnas

(13-8)

SL *6 6 C M lnKtacc6 =

(13-9)

sL w o 6

^nieraccion

= i rs

(I3. 10)

%^Dentro

En las frmulas anteriores,


CMFMs es la estimacin de la varianza poblacional calcula
da a partir de las filas; 52Col(jm_ 3 CMCoimlU es la estimacin de varianza poblacional calcu
lada a partir de las columnas; s \ lterac,fi CMinteraccin es la estimacin de varianza poblacional
calculada a partir de la interaccin; ^ ^ n0 CMDentro es la estimacin intragrupal de varianza
poblacional
Las razones F se calculan dividiendo las estimaciones de la varianza poblacional, calculadas
a partir de los diferentes efectos, por la estimacin intragrupal de la varianza poblacional:
^Filas =

r2
0 fulas

Columnas ~

$Dentro

interaccin

C^Filas
L^Dentro

-Columnas a
c2
u
S Dentro

(13-11)

^Columnas

interaccin a
2

-'Dentro

(13-12)

Dentro

Interaccin

(13-13)

"^Dentro

En Las frmulas anteriores, FPias es la razn F del efecto principal de las filas; FColuranas es la ra
zn F del efecto principal de las columna, y FMeraccin es la razn F del efecto interactivo.
Antes de seguir avanzando, es necesario que veamos cmo se calculan los distintos grados de
libertad y cmo se disea la tabla del anlisis de varianza.
Grados de libertad en el anlisis de varianza de dos criterios
Grados de libertad de las estimaciones intergrupales de varianza a p artir de los efectos
principales. Los grados de libertad de cada efecto principal (cada estimacin intergrupal de va
rianza) son iguales a la cantidad de niveles de la variable menos 1. Por ejemplo, si existen dos ni
veles, como sucede en cada efecto principal en el estudio de Lambert et al, hay 1 grado de
libertad. En los ejemplos que analizamos anteriormente, relacionados con los niveles de excita
cin y de dificultad de la tarea, el efecto principal de las columnas (nivel de excitacin) tena tres
niveles y, por lo tanto, ese efecto principal tena 2 grados de libertad.
Lo anterior se expresa bajo las siguientes frmulas,
o Columnas = ^Columans *

(1 3 -1 4 )

y
^Filas ~ ^Filas

(1 3 -1 5 )

En las frmulas anteriores, AfColumnas - cantidad de columnas, y WFilas = cantidad de hileras.


Grados de libertad de la estimacin de la varianza a p artir del efecto interactivo. Los grados
de libertad de la estimacin intergrupal de varianza, calculados a partir del efecto interactivo, son
iguales a la cantidad total de casillas menos la cantidad de grados de libertad de los dos efectos
principales menos 1. En el estudio de Lambert et al,, hay cuatro casillas, y cada efecto principal
tiene un grado de libertad. Es decir, quedan 2 grados de libertad a los que se les resta 1 ms, y que
da 1 para la interaccin. En los ejemplos relacionados con el nivel de excitacin y dificultad de la
tarea, haba casillas. El efecto de las columnas tena 2 grados de libertad, y el efecto de las filas
(tarea fcil versus tarea difcil) tena 1. Es decir, hay 3 grados de libertad, y al restar 1 ms quedan
2 grados de libertad para la interaccin.
Lo anterior se expresa bajo la siguiente frmula,
^^Interaccin ~ ^Casillas

^Columnas ~~ ^Fiias ~ ^

(1 3 -1 6 )

En la frmula anterior, 2/Casjllas cantidad de casillas.


Si aplicamos la frmula al estudio de Lambert e al.,
^Interaccin ~ " ^ C a s i l l a s ^ C o l u m n a s ~ f ^ f iia

~1

4 1

1 1

Si aplicamos la frmula al ejemplo acerca de la excitacin y la dificultad de la tarea,


^Interaccin ^Casillas ^C olum nas ^ F ila ~ 1

1
- 1 2

Grados de libertad de la estimacin m tragrupal de varianza poblacional. Como es habitual,


los grados de libertad intragmpales son la suma de los grados de libertad-de todos los grupos (en
este caso, todas las casillas). Tomamos ia cantidad de observaciones de cada casilla, le restamos 1
y despus sumamos el resultado de todas las casillas. Lo anterior se expresa bajo ia siguiente fr
mula,
(13-17)
^Dentro " Bl\ + Slt + + ^ltimo
En la frmula anterior, gl{ + gl2 + . . . + glx]timQson los grados de libertad de cada casilla (la canti
dad de registros de la casilla menos 1) sucesivamente, desde la primera casilla hasta la ltima.
G ra d o s totales de lib ertad . Los grados totales de libertad, generalmente son la cantidad de re
gistros menos 1. Se expresa bajo la frmula,

(13-18)
^Total ~ N ~ 1
Tambin podemos calcular los grados totales de libertad sumando todos los grados individuales
de libertad (los de las columnas, de las filas, de la interaccin y de las intragmpales). Teniendo en
cuenta lo anterior, podemos controlar los clculos aritmticos realizados al calcular los grados de
libertad. La frmula es la siguiente,
(13-19)
Tabla para un anlisis de varianza de dos criterios
La tabla del anlisis de varianza de un anlisis de dos criterios es similar a la que hemos visto en
el captulo 12 (donde estbamos realizando anlisis de varianza de un criterio). Sin embargo, con
un. anlisis de varianza de dos criterios se incluye una lnea para cada efecto intergrupal. La tabla
13-5 muestra el diseo.

Tabla 13-5.
Diseo de una tabla de anlisis de varianza para un anlisis de varianza de dos criterios^
F u en te
Intergrupa;
Colum nas
Filas
Interaccin
Interacciones
Totai

SC

gl

CM

Fitos
se
".interaccin
^ D e a ito

^Columnas
g Fta
^interaccin
^Dentro

^^Coiumnas
C M ^

^ T o ta l

S^Totai

ir "1

" interaccin
^ D e n tro

V
Columnas
MFilas
^Interaccin

Ejemplo de clculo de un anlisis de varianza de dos criterios


Wong y Csikszentmihaly (1991) realizaron un estudio en el cual, durante una semana, 170 alum
nos de escuela portaron equipos buscapersonas y se los llamaba a intervalos aleatorios (aproxi
madamente cada 2 horas durante el da). Cada vez que reciban una llamada, los alumnos deban
llenar un formulando indicando qu estaban haciendo en ese momento. El estudio era un diseo
factorial 2 x 2 que analizaba el efecto del sexo y el nivel de los alumnos obtenido en una prueba
acerca del deseo de relacionarse. La variable medida era la cantidad de ocasiones, durante la se
mana, en las que el alumno estaba realizando actividades sociales cuando se lo llamaba. (Tambin
haba otras variables, pero nos concentraremos slo en stas).
Las medias de casilla y marginales de los resultados aparecen en la tabla 13-6, exactamente
como fueron informadas por Wong y Csikszentraihalyi. Sin embargo, para que el ejemplo sea
simple a los efectos del aprendizaje, hemos inventado valores que producen las mismas medias de
casillas y marginales pero incluyen slo 10 participantes por casilla. La taba 13-7 incluye estos
valores y los clculos de todos los desvos.

Tabla 13-6.
Medias de casillas y marginales de la cantidad de veces que se encontr a los participantes en
actividades sociales.
D eseo d e r elacin
B a jo

| M u c h a c h o s j-10,30
M u c h a c h a s [ '15,75

13,03

Fuente: Wong & Csikszentmihaly, 1991.

A ito
9,22

9,76

18,51;

17,13

13,87

13,45

Tabla 13-7.
Observaciones, desvos cuadrticos y sumas de desvos cuadrticos de los datos ficticios basados en el
estudio de Wong y Csikszentmihatyi (1991).
Bajo nivel de deseo de relacionarse

Alto nivel de deseo de relacionarse

(^ColuimuI
X

(X -G M f

(X -M f

-G M )-

JNT-

~ GM f

Muchachos

12,1

8,8

1.82
4,20
5,06
6,50
9,92
13,32
14,06
15,60
17,22
21,62

103,0

109,32

11,4

11,2
10,9
10,3
9,8
9,7
9,5
9,3

Muchachas
17,4
15,60
13,32
17,1
11,22
16,8
10,56
16,7
4,20
15,5
3,42
15,3
2,40
15,0
3,80
15,4
0,72
14,3
14,0
0,30
65,54
157,5

0,56

0,12
2,10
3,06
12,64

9,20

0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18

0,92
0,92
0,92
0,92

1,80

9,20

0,92
0,92
0,92
0,92
0,92
0,92
0,92
0,92
0,92
0,92

22,0
20,5
19,9
19,1
18,5
17,4
17,0
17,1
17,1
16,5

73,10
49,70
41,60
31,92
25,50
15,60
12,60
13,32
13,32
9,30

2,72
3,96
1,93
0,35

1,23
2,28
1,99
1,99
4,04

13,54
13,54
13,54
13,54
13,54
13,54
13,54
13.54
13,54
13,54

1,80

9,20

185,1

285,96

29,95

135,40

135,40

0,20

1,80

0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18

13.54
13,54
13,54
13,54
13,54
13,54
13,54
13,54
13,54
13,54

1,10

0,92
0,92
0,92
0,92
0,92
0,92
0,92
0,92
0,92
0,92

14,50

2,74
1,82

0,90
0,06

0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18

193,42

1,80

1,00

13,62
13,62
13,62
13,62
13,62
13,62
13,62
13,62
13,62
13.62
136,20

92,2

136,20

0,25
0,36
0,64

INT*

9,20

2,25

10,12

0,00

-G M )'

8,2
6,6

0,92
0,92
0,92
0,92
0,92
0,92
0,92
0,92
0,92
0,92

0,81
0,36

11,1
10,2

(^Columna

3,53
1,39
0,96
0,34

0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18

1,21

^fi'a
-G M f

5,52
9,30
10,56
13,32
18,06
18,92
20,70
22,56
27,56
46,92

13,62
13,62
13,62
13,62
13,62
13,62
13,62
13,62
13,62
13,62

3,24

(X -G M )1 ( X -M f

10,4

9,8
9,2
9,1
8,9
8,7

0,00
0,01
0,10
0,27
1,04

6,86

0,00

0 ,9 2

0,92
0,92
0,92
0,92
0,92

~ media de la casilla de la observacin.


= media de la fila de la observacin.
^Columna3 media de la columna de la observacin.
INT
as desvo residual de la observacin para la interaccin
M

M h

Ejemplo de los clculos de desvos utilizando la primera observacin en la casilla correspondiente a los muchachos
con bajo nivel:
(X -G M f *

(12,1 - 13,45)a 1,35a = 1,82

(X~M)! = (12,1 - 10,30)4ss 1,8o2= 3,24


(M m
(M Caiam i

GMf

GMf~

= (9,76 - 13,45)s = -3,69* = 13,62


(13,03 - 1 3 ,45)1- -0,42 = 0,18

{NT* [ ( X - G M ) ~ ( X - M ) ~ ( M ^ ~ G M ) - ( M ^ ^ ~ G M ) f = [(~,35) - (1,80) - (-3,69) - (-0,42)J2

(-1,35 ~ 1,80 + 3,69 + 0,42) 0,96 = 0,92


S C roM
S C Demo
SCm

= 109,32 + 193,42 + 65,54 + 285,96 = 654,24


= 10,12+ 14,50+ 12,64+ 29,95= 67,21
= 136,20 +136,20 + 135,40 + 135,40 = 543,20
a
1,80+ 1,80+ i,80+ 1,80 = 7,20
9,20+
9,20+
9,20+ 9,20= 36,80

Control de exactitud: SCToia = 654,24; S C ^ + SCm + 5CColirats +


(Los resultados contemplan diferencias de redondo).

= 67,21 + 543,20 + 7,20 + 36,80 = 654,41

T a b la 1 3 - 8 .
C lc u lo d e u n a n lis is d e v a r ia n z a u t iliz a n d o s u m a s d e c u a d r a d o s , s o b r e la b a s e d e l e s t u d io d e
W o n g y C s i k z e n t m i h a l y i ( 1 9 9 1 ) . ( D a t o s F i c t i c i o s ) . *1
F punto d e corte para el efecto principal del sex o ( g l = 1 ,3 6 ; p < 0 ,05) ~ 4 ,1 2 ( g l = 1, 35 de la tabla)
F punto de corte para el efecto principal de deseo de relacionarse para (g = 1, 36; p < 0 ,0 5 ) = 4 ,1 2
F punto de corte para e l efecto Interactive ( g l = 1 , 36; p < 0 ,0 5 ) = 4 ,1 2

F u en te

SC

S exo
54 3 ,2 0
D e se o de relacionarse
7 ,2 0
S ex o por d eseo de relacionarse 3 6 ,8 0
67,21
Dentro de las casillas

si

1
1
1
36

CM

543,20
7,20
36,80
. 1,87

2 9 0 ,4 8
3,85
19,68

S e rechaza la hiptesis nula.


N o se rechaza la hiptesis nula.
S e rechaza la hiptesis nula.

La tabla 13-8 muestra los valores correspondientes al punto de corte F y a la tabla del anlisis de
varianza. La figura 13-9 representa los resultados grficamente. Analizaremos el ejemplo si
guiendo el procedimiento habitual de prueba de hiptesis paso a paso.

1.
Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de las
poblaciones para cada efecto principal y efecto interactivo. Existen cuatro poblaciones:
Poblacin 1,1: muchachas que tienen un nivel bajo de deseo de relacionarse.
Poblacin 1,2: muchachas que tienen un nivel alto de deseo de relacionarse.
Poblacin 2,1: muchachos que tienen un nivel bajo de deseo de relacionarse.
Poblacin 2,2: muchachos que tienen un nivel alto de deseo de relacionarse.
La primer hiptesis nula establece que las poblaciones combinadas de muchachas (poblacio
nes 1,1 y 1,2) tienen la misma media que las poblaciones combinadas de muchachos (2,1 y 2,2),
en cuanto a la cantidad de veces que se involucraron en actividades sociales. Esta es la hiptesis
nula que prueba el efecto principal del sexo (muchachas en contraposicin con muchachos). La
hiptesis de investigacin establece que las poblaciones de muchachas y de muchachos tienen di
ferentes medias.
Figura 13-9.
G rfico de lo s datos fic tic io s (sim p li
fic a d o s) b asados e n lo s resultados d el
e stu d io d e W o n g y C sikszentm dhalyi
(1 9 9 1 ).

La segunda hiptesis nula establece que las poblaciones combinadas de aquellos con bajo de
seo de relacionarse (poblaciones 1,1 y 2,1) tienen la misma media que las poblaciones combina
das de aquellos con alto deseo de asociacin (poblaciones 1,2 y 2,2), con respecto a la cantidad de
veces que se involucraron en actividades sociales. Esta es la hiptesis nula que prueba el efecto
principal del deseo de relacionarse (bajo en contraposicin con alto). La hiptesis de investiga
cin establece que las poblaciones con alto y bajo nivel de deseo de relacionarse tienen diferentes
medias.
La tercer hiptesis nula establece que la diferencia entre la cantidad media de actividades so
ciales de las dos poblaciones de muchachas (poblacin 1,1 menos poblacin 1,2) ser la misma
que la diferencia entre las medias de las dos poblaciones de muchachos (poblacin 2,1 menos po
blacin 2,2). Esta es la hiptesis que prueba el efecto interactivo. (Tambin podra haberse plan
teado, sin cambiar el significado, como la diferencia entre las dos poblaciones con bajo nivel de
deseo, igualando la diferencia entre las dos poblaciones con alto nivel de deseo). La hiptesis de
investigacin establece que estas diferencias no sern iguales.
2. Determ inar las caractersticas de las distribuciones comparativas. Las tres distribucio
nes comparativas sern distribuciones F. Los grados de libertad de ios denominadores sern la su
ma de los grados de libertad de cada una de las casillas (la cantidad de observaciones de la casilla
menos 1). En este caso, hay 10 participantes en cada una de las cuatro casillas, es decir, 9 grados
de libertad por casilla; queda un total de 36. El numerador de la distribucin comparativa del
efecto principal del sexo tiene 1 grado de libertad (2 filas menos 1); el numerador del efecto prin
cipal del deseo de relacionarse tambin tiene 1 grado de libertad, y el grado de libertad del nume
rador del efecto interactivo es, nuevamente, 1 (es la cantidad de casillas, 4, menos los grados de
libertad de las columnas, menos los grados de libertad de las filas, menos 1). Como control de la
precisin del clculo de los grados de libertad, los tres numeradores ms los grados de libertad del
denominador son igual a 1 + 1+ 1+ 36 = 39; lo que es igual al total de grados de libertad calcula
dos como la cantidad de participantes menos 1 (es decir, 40 - 1 = 39).
3. Determinar los puntos de corte en las distribuciones comparativas, a p artir de los
cuales debera rechazarse cada hiptesis nula. Utilizando el nivel 0,05 de significacin, la ta
bla B-3 indica un punto de corte para 1 y 35 grados de libertad de 4,12 (el ms cercano disponible
en la tabla debajo de 1 y 36). Los grados de libertad y el nivel de significacin son los mismos, en
este caso, para ambos efectos principales y para el efecto de interaccin; por lo tanto, el punto de
corte tambin es el mismo para los tres efectos.
4. Determ inar los valores m ustrales en cada distribucin comparativa. Este paso re
quiere el clculo de tres razones F, que, como hemos visto, requiere calcular primero varios des
vos, elevarlos al cuadrado y sumarlos. La tabla 13-7 indica los desvos cuadrticos de cada
participante.
Para ahorrar espacio, la tabla indica slo los desvos cuadrticos. Sin embargo, debajo de la
tabla de desvos cuadrticos mostramos un ejemplo de la forma de clculo de los desvos cuadr
ticos de la primera observacin. Dos consejos son especialmente tiles para el clculo del desvo
en el efecto interactivo: a) se debe prestar mucha atencin a los signos de los cuadrados que se es
tn restando y b) no se debe olvidar que el desvo interactivo, antes de elevarse al cuadrado, se
calcula a partir de los desvos originales no elevados al cuadrado, y no de los desvos cuadrticos.
Despus los desvos cuadrticos individuales se suman para obtener 5CTotai, y as sucesiva
mente, como lo indica la siguiente parte de la tabla 13-7. Es importante recordar que las sumas de
los distintos desvos cuadrticos (CDemro SCFiias, SCColumoas, SCImeracdJ conforman el desvo
cuadrtico total. Sin embargo, si tomamos a un slo participante, los distintos desvos cuadrticos
no dan el desvo cuadrtico general a la observacin con respecto a la gran media. La tabla 13-7
tambin indica el control de la exactitud de los clculos: la suma de ios desvos cuadrticos con

respecto a la gran media es igual al total de las sumas de las otras cuatro clases de desvos cuadrticos (teniendo en cuenta las diferencias de redondeo),
Existe otro detalle importante con respecto a los clculos, que se indican en la tabla 13-7. Co
mnmente, en un anlisis 2 x 2 todos los desvos cuadrticos de las filas son iguales (como lo son
todos los desvos cuadrticos de las columnas y todos los desvos cuadrticos de la interaccin).
La pequea diferencia (136,20 contra 135,40) entro los desvos cuadrticos de las filas de la parte
inferior y las de la parte superior se debe simplemente a diferencias de redondeo al calcular las
medias de las filas.
Los siguientes pasos se indican en la tabla 13-8 del anlisis de varianza. Primero, ingresamos
la suma de los desvos cuadrticos de la tabla anterior para cada estimacin de la varianza, y ade
ms los grados de libertad del paso 2. Despus utilizamos esos datos para calcular el resto de la
tabla (los cuadrados medios y los valores F). Las conclusiones se indican en el extremo derecho
de la tabla y se detallan en el punto 5.
5.
n u las.

C o m p a rar los valores de los pasos 3 y 4 p ara d ecid ir si se rechazan o no la s hiptesis

La razn F calculada para el efecto principal del sexo, de 290,48, es mucho mayor que el
punto de corte de 4,12. Por lo tanto, podemos rechazar la hiptesis nula que establece que las poblciones de muchachas y muchachos tienen la misma cantidad media de actividad social. Es de
cir, el efecto principal del sexo es significativo. El F de 3,85, correspondiente al efecto principal
de la necesidad de relacionarse, no lleg ai 4,12, punto de corte necesario. Se puede decir que es
te efecto se ha acercado a la significacin pero no la ha alcanzado. Finalmente, el efecto interacti
vo F de 19,68 excede el punto de corte de 4,12; por lo tanto, el efecto interactivo tambin es
significativo. (En el estudio real se encontr el mismo patrn bsico, el efecto principal del sexo y
el efecto interactivo eran significativos, mientras que el efecto principal del deseo de relacionarse
se acerc pero no lleg a la significacin). Antes de continuar, seria una buena idea que el alumno
intentara explicar con palabras el significado de esta interaccin.
La figura 13-9 representa grficamente el patrn de medias. Como podemos observar en el
grfico (y por las medias de casillas de la tabla 13-6), el efecto principal del sexo se debe a que las
muchachas participan en ms actividades sociales que los muchachos. El efecto interactivo se de
be a que el deseo de relacionarse est asociado con la mayor cantidad de actividad social de las
muchachas, pero bsicamente no relacionado con la cantidad de actividades sociales de los mu
chachos. Es decir, exista una diferencia entre la cantidad de actividades de muchachas con alto
nivel y aquellas con bajo nivel de deseo de relacionarse. Pero entre muchachos, la diferencia casi
no exista (incluso se daba levemente en la direccin contraria). Esta es la razn por la cual, en ge
neral, combinando muchachos y muchachas, ei deseo de relacionarse pareca tener poca o ningu
na influencia en las actividades. Una vez ms podemos observar cmo se descubre una relacin
interesante entre las variables a travs de la aplicacin del anlisis de varianza para analizar efec
tos interactivos.

Un segundo ejemplo de clculo de un anlisis de varianza de dos criterios.


Blanchard, Lilly y Vaughn (1991) realizaron un estudio referido a las influencias sobre la expre
sin de la reaccin al racismo. En este estudio se contactaron 72 mujeres blancas no graduadas
mientras se dirigan de una clase a otra, y se les pidi que participaran en una encuesta sobre qu
tendra que hacer la facultad en respuesta a los annimos raciales. Se trataba de un diseo 2 x 3 .
El factor de dos niveles se divida en aquellas alumnas a las que se les peda que respondieran
en forma privada (por escrito) y a las que se les peda que respondieran en forma pblica (oral
mente al investigador sin que nadie ms escuchara). El factor de tres niveles era la direccin de la
influencia. Un tercio de las alumnas estaba en condicin de ausencia de influencia, en la que

simplemente completaban una encuesta sin nadie presente, excepto e! experimentador. Este era
un nivel del factor. En el caso de los otros dos tercios de las almonas, antes de que pudieran co
menzar a contestar se invitaba a otra alumna a participar. La otra alumna en realidad era una alia
da del experimentador, y se arregl que ella siempre contestara primero. Sus opiniones o eran
muy antirracistas o no eran antirracistas en absoluto, creando as los otros dos niveles del factor,
influencia antirracista e influencia no antirracista,
Para favorecer la claridad de la explicacin, una vez ms hemos construido datos que concuerdan con el patrn bsico de los descubrimientos reales del estudio, pero que incluye muchos
menos participantes. Tambin hemos utilizado valores con nmeros enteros. Los resultados, utili
zando estos valores, estn representados grficamente en la figura 13-10* La tabla 3-9 indica las
observaciones, los desvos cuadrticos, los clculos intermedios y la tabla del anlisis de varianza. Seguiremos este ejemplo paso a paso.
L R ep lan tear el problem a en fu n d n de hiptesis de investigadn e hiptesis n u la de las
pobladones p ara cada efecto p rin cip a l e interactivo . Existen seis poblaciones:
Poblacin 1,1:
Poblacin 1,2:
Poblacin 2,1:
Poblacin 2,2:
Poblacin 3,1:

alumnas que responden pblicamente con influencia antirracista.


alumnas que responden en forma privada con influencia antirracista.
alumnas que responden pblicamente sin influencia.
alumnas que responden en forma privada sin influencia.
alumnas que responden pblicamente con influencia no antirracista.
Poblacin 3,2: alumnas que responden en forma privada con influencia no antirracista.

La primera hiptesis nula establece que las poblaciones combinadas de alumnas que respon
den pblicamente (poblaciones 1,1,2,1 y 3,1) tienen la misma media que las poblaciones combi
nadas de alumnas que responden en forma privada (poblaciones 1,2, 2,2 y 3,2), en cuanto a ia
expresin de actitudes antirracistas. Esta es la hiptesis nula para probar el efecto principal de la
modalidad de la respuesta (pblica contra privada). La hiptesis de investigacin establece que

Figura 13-10.
G rfico d e io s d atos fic tic io s (s im p li
fic a d o s) basad os en lo s resu ltad os d el
e stu d io d e B lanchard, L illy y V aughn.

Influencia

las poblaciones de alumnas que responden pblica y privadamente tienen diferentes medias en
cuanto a la expresin de actitudes antirracistas.
La segunda hiptesis nula establece que no existe diferencia entre las medias de las poblacio
nes combinadas expuestas a influencia antirracista (poblaciones 1,1 y 1,2), las poblaciones com
binadas no expuestas a ninguna influencia (poblaciones 2,1 y 2,2) y las poblaciones combinadas
expuestas a influencia no antirracista (poblaciones 3,1 y 3,2). Esta es la hiptesis nula que prueba
el efecto principal de la direccin de la influencia. La hiptesis de investigacin establece que
esas tres poblaciones combinadas tienen diferentes medias.
La tercera hiptesis nula establece que el patrn de las medias de las tres poblaciones que res
ponden en pblico (poblaciones 1,1,2,1 y 3,1) ser igual al patrn de las medias de las tres poblacio
nes que responden en privado (poblaciones 1,2, 2,2 y 3,2). Esta es la hiptesis nula que prueba el
efecto interactivo. (Tambin podra plantearse del siguiente modo sin cambiar el significado: la dife
rencia entre las poblaciones que responden en pblico y en privado ser la misma al comparar las
dos poblaciones con influencia antirracista, las dos poblaciones que no reciben influencia, y las dos
poblaciones con influencia no antirracista). La hiptesis de investigacin establece que el patrn de
las medias de las tres poblaciones que responden pblicamente difiere del patrn de las mechas de las
tres poblaciones que responden en forma privada.
2. D eterm in ar la s caractersticas de la s d istrib uciones com parativas. Las tres distribucio
nes comparativas sern distribuciones F con grados de libertad del denominador, iguales a la su
ma de los grados de libertad de cada una de las casillas (la cantidad de observaciones de la casilla
menos 1). En este caso, hay 4 observaciones en cada una de las seis casillas, lo que da 3 grados de
libertad en cada uno, y un total de 18. El numerador de la distribucin comparativa del efecto
principal de la modalidad de respuesta tendr 1 grado de libertad (2 columnas menos 1); el nume
rador del efecto principal de la direccin de la influencia tendr 2 grados de libertad (3 filas me
nos 1), y los grados de libertad del numerador correspondiente al efecto interactivo tambin ser 2
(la cantidad de casillas, 6, menos los grados de libertad de las columnas, 1, menos los grados de
libertad de las filas, 2, menos 1). Como control de la exactitud, los grados de libertad de los tres
numeradores ms los grados de libertad del denominador son igual a 1+2+2+18-23, cantidad que
coincide con los grados de libertad totales calculados como la cantidad de participantes menos 1
(24-1=23).
3. D eterm in ar los puntos de corte en la s distrib uciones co m p arativas, a p a rtir de ios
cuales se debera rech a za r cada hiptesis nula. Utilizando el nivel 0,05 de significacin, la ta

bla B-3 indica los puntos de corte que aparecen justo debajo de las casillas y las medias margina
les en la parte superior de la tabla 13-9.
4. D eterm in ar los valores m ustrales en cada d istrib ucin com parativa. Este paso re
quiere de tres razones F; se calculan todos los desvos, se los eleva al cuadrado, se los suma y se
los divide por los grados de libertad para obtener los cuadrados medios. Finalmente, se calculan
las razones de los distintos cuadrados medios intergrupales y cuadrados medios ntragrupales. La
tabla 13-9 ndica todos los clculos anteriores.
5. C o m p arar los valores de los pasos 3 y 4 para decidir si se rechazan o no la s hiptesis
n u las. La razn F, que result ser 0, para el efecto principal de la modalidad de respuesta, cierta
mente no es significativa. (Si bien se basan en resultados reales, los nmeros especficos son in
ventados. Utilizando informacin real, seria muy improbable obtener un F exactamente igual a
0). El F calculado en 11,7, para el efecto principal de la direccin de la influencia, es claramente
significativo. Excede en mucho el punto de corte de 3,56. Finalmente, la razn F del efecto inte
ractivo igual a 1,7 no alcanz el punto de corte 3,56 necesario. Por lo tanto, los resultados no son
concluyentes para esta hiptesis. La figura 13-10 representa grficamente el patrn de las medias.
Para observar en el grfico el efecto principal de la direccin de la influencia, debemos comparar

Tablal3-9.
Clculos del anlisis de varianza de la informacin ficticia basada en los resultados del estudio de
Banchard, Lilly y Vaughn (3991),
Modalidad de respuesta
P b lic a P r iv a d a

c a In flu e n c ia a n ir r a c is ta W : 21:
o S5 A u se n c ia d e in flu en cia 21'') :;2iv-;
S .a In flu e n c ia n o a n ir r a c is ta -fil ; 18'
20

22

21

17

20

20

Punto de corte F necesario para el efecto principal de la modalidad de respuesta ( g l =1 ,18; p < 0,05) - 4,41,
Punto de corte F necesario para el efecto principal de la direccin de la influencia ( g l = 2,18; p < 0,05} 3,56.
Punto de corte F necesario para el efecto interactivo ( g l - 2,18; p < 0,05) = 3,56.
Modalidad privada de respuesta

Modalidad pblica de respuesta


X

{ X - G M )7 (X - M f l

(^c'olunuia
- g m y-

IN T

(X -G M fl

'(X -W )1

19
24

4
9

I
J.
4

21
20

I
16

0
_1

4
4
4
_4

18

14

16

0
0
0

24
18

16
4
4

_0

9
9
l
1

1
1
__1

24

20

9
9
9
_9
36

0
0
0

influencia anirracista
4
25
25
20
0
9
23
9
0
24
J 6
.1
50
14
Ausencia de influencia
4
1
22
4
19
1
22
1
4
J)
21 _ i

16

i
i
i

0
0
0
_0
0

9
9
9

0
0
0

1
1
1

_G

J.
4

10

^Co/Mmna
- G M )1 JTVr

-G M )1

Influencia no anirracista
16
0
16
9
1
19
13
9
49
16
16
_0
82
18

0
0
_0

4
4

22
20

J)

36

_0

18

21

16
17

9
4
_ i
14

16
_9

30

g m

1
1
1

0
0
0

J.
4

0
0
0
J)

0
0
0
1

0
1
l

J.
4

=s media de la casilla de ia observacin


Mgia
- meda de ia fila de la observacin
M Cotumi media de la columna de Sa observacin
INT
ss desvo residual de la observacin para la interaccin
M

Ejemplo de clculo de los desvos, utilizando la primera observacin en la casilla pblica anirracista:
( X - G M y * ( 2 5 -2 0 )'=
( X - M ) 1 - (25-23)' =

5'= 25,
3? = 4.

(MRa - G frff = (22 - 20)' = 2! = 4.

W C(umna- GM? = (20 - 2Q)1 0** 0.

INT2 { ( X - G M ) - (X- M) -

- GM) -

( M CfAmm

QM)f

= (5 - 2 - 2 -O )2= 14 1

=50 + 184-10 + 24 + 82 + 30 = 214


= 1 4 + 1 4 + 6 + 2 0 + 1 8 + 1 4 = 86
S C S I , = 0+ 0+ 0+ 0+ 0+ 0= o .
sd r
=16 + 16+ 4 + 4 + 36 + 36=112
4 + 4 = 16
^merced*. = 4+ 4 * 0 +
Sean
S C L

Fuente
Direccin de la influencia (filas)
Interaccin (columnas x filas)
Dentro de las casillas

i ^Dentro +
SC
;)
0

112
16

86

+ ^Columna
gl

1
2
2

18

CM

56

4,8

86+ 0 + 1 1 2 + 16 = 214
1
0
No se rechaza la hiptesis nula.
11,7
1,7

Se rechaza la hiptesis nula.


No se rechaza la hiptesis nula.

las alturas promedio de los pares de barras. La comparacin sugiere que este efecto principal se
debe a que el grupo que recibi influencia antirracista expres las actitudes ms antirracistas; el
grupo que recibi influencia sin direccin expres un grado intermedio de actitud antirracista, y
el grupo que recibi influencia no antirracista expres actitudes antirracistas mucho menores.
Tambin podemos observar que el patrn de las barras es diferente dentro de cada par, sugiriendo
un posible efecto interactivo. Sin embargo, la interaccin no fue lo suficientemente fuerte en este
estudio como para ser considerada significativa. (Es raro encontrar patrones de barras completa
mente idnticos en estos grficos, del mismo modo que es raro obtener medias exactamente igua
les). Si analizamos el patrn de medias en la parte superior de la tabla 13-9 notaremos el mismo
patrn de resultados.

Resumen de ios procedimientos para realizar un anlisis de varianza de dos criterios


La tabla 13-10 resume los pasos de la prueba de hiptesis, y la tabla 13-11 muestra la tabla del
anlisis de varianza y las frmulas para un anlisis de varianza de dos criterios. Como ya hemos
visto en captulos anteriores, con respecto a otros procedimientos tambin existen frmulas de
clculo de las sumas de los cuadrados que los investigadores utilizaban antes del advenimiento de
la computadora. Estas frmulas facilitan la realizacin manual de los clculos (o con una calcula
dora) cuando se analizan resultados de un estudio real con una gran cantidad de observaciones en
cada casilla. En el apndice I, al final del captulo, se pueden encontrar las frmulas de clculo
tradicionales y un ejemplo solucionado con dichas frmulas. Sin embargo, una vez ms recomen
damos insistentemente que al resolver los ejercicios del libro, se utilicen las frmulas de defini
cin y los procedimientos que aparecen en las tablas 13-10 y 13-11.
Las frmulas de definicin a ias que nos referimos arriba refuerzan los principios implcitos.
que son, en definitiva, los principales elementos que el alumno est intentando aprender.
Supuestos def anlisis de varianza de dos criterios
Los supuestos de un anlisis factorial de varianza son, en su mayora, los mismos que los del an
lisis de varianza de un criterio que analizamos en el captulo i 1. Del mismo modo, las cuestiones
relacionadas con los efectos producidos por el incumplimiento de esos supuestos tambin son, en
gran medida, las mismas que las del anlisis de varianza de un criterio. (De hecho, como observa
mos en el captulo 11, esos supuestos y cuestiones tambin son, en gran parte, los mismos que los
de la prueba t para medias independientes). No obstante, con el anlisis factorial de varianza, los
supuestos de normalidad de poblacin e igualdad de varianzas se aplican a las poblaciones que
corresponden a cada casilla.

POTENCIA Y TAMAO DEL EFECTO


EN EL ANLISIS FACTORIAL DE VARIANZA
En un anlisis factorial de varianza calculamos la potencia y el tamao del efecto casi del mismo
modo que en el anlisis de varianza de un criterio (vase captulos 11 y 12). La diferencia princi
pal radica en que ambos se calculan separadamente para cada efecto principal e interactivo. Es
muy posible, por ejemplo, que la potencia de uno de los efectos principales sea mucho mayor que
la del otro efecto principal, Del mismo modo, es posible que el efecto interactivo tenga ms o me
nos potencia que los efectos principales. Es decir, que para planificar un estudio de forma segura

1.

Replantear e l problem a en funcin de hiptesis de investigacin e hip tesis nula de las poblaciones para
cada efecto principal y efecto interactivo.

2.

Determ inar las caractersticas d e las distribuciones comparativas.


a) L os grados de libertad del numerador de la distribucin F del efecto principal de las colum nas
son la cantidad d e colum nas m enos 1 : /C(llumMi= AfColutnnas - 1 .
b) Los grados de libertad del numerador de la distribucin F del e fe cto principal de las filas son la cantidad
de fila s m en os 1 : g lB ^
c) L os grados d e libertad del numerador de la distribucin F del efecto interactivo son la cantidad de casillas
m enos los grados de libertad de las colum nas, m enos lo s grados de libertad de las filas, m enos 1 :
^Interaccin ~ ^Casillas ~ ^Columnas ~ filas
d) Las distribuciones comparativas sern distribuciones F c o n grados d e libertad del denom inador, igual a
la sum a de lo s grados d e libertad de cada casilla (la cantidad de casos en la casilla m enos 1 ):

^Dentro "
e)

3.

S e controla la exactitud de lo s clculos asegurndose d e que todos los grados de libertad sum en
los grados de libertad totales: g lT m 1 = JV- 1 * gDemo + $Ccumi3 + g Fias + M nteracc,r

D eterm inar los cortes m ustrales en las distribuciones com parativas, a partir d e lo s cuales se debera
rechazar cada hiptesis nula,
a) Determ inar los niveles de significacin deseados.
b) B uscar lo s puntos de corte adecuados en una tabla F (tabla f-3).
D eterm inar los valores m ustrales en cada distribucin comparativa (sern razones F ).
a) Calcular la m edia de cada casilla, fila y colum na m s la gran m edia de todas las observaciones.
b) Calcular lo s siguientes desvos de cada observacin.
1)

El desv o con respecto a la gran media: X ~ G M .

li) E l d esv o con respecto a la m edia de su casilla X ~ M .


iii) E l d esv o de la m edia de su fila con respecto a la gran m edia: M Fja - GM.
iv ) El d e sv o de la m edia de su colum na c o n respecto a la gran media: M Co]tln)(ia - G M .
v ) E l d e sv o co n respecto a la gran m edia m en os tod os ios otros desvos: d esv o Interactivo =
( X - G M ) ~ ( X - M ) ~ (M Rja - GMMAfp^umna - G M ). (Para calcular este d esvo es necesario
asegurarse de utilizar los d esv o s no cuadrticos y de prestar m ucha atencin a lo s signos).
c ) Elevar cada uno d e lo s d esv o s al cuadrado.
d) Calcular las sum as de cada uno de lo s distintos tipos de d esvos cuadrticos

^TotaU ^Dentro ^Columna

^Interaccin)'

e) C o n tr o la r ia e x a c titu d de lo s clculos asegurndose de que la sum a de lo s d esvos cuadrticos, basados


en el d esv o de cada observacin con respecto a la gran m edia, sea igual a la sum a de todas las otras
sum as d e d esv o s cuadrticos. '^'Total ^Dentro + ^Columna * ^ F iia + ^Interacctir

f)

Calcular la estim acin intergrupal de varianza para cada efecto principal e interactivo (CM Co|umoas
Filas
^Columnas = ^ C oColumnas
lu m n as^' 5CColumna
o lu m n a f1i
l a s ^Filas ^ F i i a s a p i l a s * ^ In teracc i n

OSj.Interaccin ~ SCn(eraCt5ntgl^

g ) Calcular la estim acin intragrupal de varianza { C M ^ ^ &


- 5 C 0t
/g /Dmt0).
/C2
h) C alcular las razones F para cada efecto principal e interactivo ( r Cofumnas = S i Columnas

Dentro
^C o lu rru tas^p ^ D en tio ^ F iia = ^ F ita ^ D e n tto ^ ^ P i i a ^ ^ D e n t r o 1
_na <j2
/C2
F
JC M r,
M,
Interaccin
Interaccin'^
^ Dentro.
u C
^ "interaccin'D
entro*

r interaccin

5. Comparar lo s valores obtenidos en los pasos 3 y 4 para decidir si se rechazan o no las hip tesis nulas.

Tabla de anlisis de varianza:


Fuente

SC

ntergrapa:
Columnas
Filas
interaccin
Dentro
Total

CM

gi
^"Columnas

Columnas
^ R ta
interaccin

^EtCfaccdn

^D entro

^Dentro

^Columnas^

^'^Interaccin ^ ^ Interaccin)

[i

Columnas
^Flas
F interaccin

d^Toral ( Sratajl

Frmulas para cada seccin de la tabla de anlisis de varianza:


Fuente

SC

Intergrupal:
Columnas
Filas
Interaccin

S C M o ^ -G M *
i(M n h ~G M ?
S((X - GM)

CM

gl
_ 1

^ C o lu m n a /^ C o lu m n a s

C o ta m a s

"*
^ C a silla s ^Columnas ^Fite ~ ^

S C ftlJ

g l i + gl~i
N- 1

'^ ''D c n iro /l ^Dentro

fila s

f i l a s

g l\ ntcrceciti

^ ^ C o lu m n a /^ iD c n fro
^ F ils ^ D c m ro
^ '^ i n t c a c c i n ^ ^ D e n t r o

-(x -m
- ( M Fth~ G M )

Dentro
Total

K x -m 1
K X -G M )1

^ ltim o

Definiciones de los smbolos bsicos:

M1MColumna:
GM =

Casillas"
Aci0
n Casillas '

x=

suma de los nmeros correspondientes de todos los casos (no casillas),


media de la casilla de la observacin,
media de la fila de la observacin.
media de la columna de la observacin.
gran media de todas las observaciones,
cantidad de casillas.
cantidad de filas.
cantidad de columnas.
cada observacin.
cantidad total de casos en el estudio:

necesitamos contar con suficientes participantes como para que el efecto con el menor tamao del
efecto esperado tenga una potencia adecuada. Del mismo modo, al evaluar los resultados de un
experimento factorial, debemos tener en cuenta el tamao del efecto de cada efecto principal e in
teractivo separadamente.
Tamao de! efecto
El tamao del efecto de cada efecto principal e interactivo se puede calcular como f (tal como lo
hicimos en el captulo 11) o como R2, la proporcin de varianza explicada (tal como lo hicimos en
el captulo 12). (No debemos olvidar que R2 tambin se denomina frecuentemente eta2). Sin em
bargo, en el anlisis de varianza factorial, y especialmente cuando se utiliza el mtodo del mode
lo estructural como lo hemos hecho en este captulo, es ms sencillo trabajar con la proporcin de
varianza explicada adaptando levemente el procedimiento aprendido en el captulo 12.

En el captulo 12 describimos la proporcin de varianza explicada como la proporcin de los


desvos cuadrticos de las observaciones con respecto a la gran media, que estaba explicada por
los desvos de las medias grupales con relacin a la gran media. En un anlisis de varianza de un
criterio, R2 = SCBnJ S C TotllV
Analicemos ahora el caso del efecto de las columnas en un anlisis de varianza de dos crite
rios. Ciertamente, podemos sustituir SCEntre por SCCoumn,s. Tiene sentido considerar al numera
dor de la proporcin mencionada como la suma de los desvos cuadrticos de las medias de las
columnas con respecto a la gran media, es decir, la varianza creada por el efecto de la variable re
lacionada con las columnas, y no que sea explicada de otro modo.
Sin embargo, qu sucede con el denominador, el total de la varianza a ser explicada en parte
por la varianza debido a las columnas? En un anlisis de dos criterios, los desvos cuadrticos de
cada observacin con respecto a la gran media ahora estn parcialmente explicados por los efectos
de las filas y los aspectos interactivos, al igual que por el efecto de las columnas. Pero cuando eva
luamos la proporcin de varianza explicada por el efecto de las columnas, no nos interesa lo que
realiza el efecto de las filas o el efecto interactivo. No debe responsabilizarse al efecto de las co
lumnas por la varianza que ya es explicada por el efecto de las filas y el efecto interactivo. Por lo
tanto, los desvos cuadrticos a ser explicados por las columnas deberan incluir slo aquellos des
vos cuadrticos todava no explicados por las filas y la interaccin. Para expresarlo en frmulas,
p2

^Columnas ~

_______ ^Columnas
^Total ~ ^'las ~

(13-20)
Interaccin

Simplemente,
%i)as

^Fiias
^-'Total ^Columnas ^interaccin

^interaccin

(13-21)

^-'interaccin________
^-Total

-^-Columnas

(13-22)

a p ila s

Tcnicamente, cada uno de los clculos anteriores es una R2 parcial, porque describen la pro
porcin de varianza explicada por un efecto despus de excluir los otros efectos. (Volveremos a
tratar el tema de correlaciones parciales en el captulo 17).
En el ejemplo basado en el estudio realizado con los equipos de radio llamadas por Wong y
Csikszentrnihalyi, R2 se hubiera calculado de la siguiente forma:
/Columnas (D eseo

e realacion arse):

______ ^-Coiiimnas______
SCpjas ^^interaccin

^Flas (S e x o ) j

7 ,2 0

7 ,2 0

6 5 4 ,2 4 - 5 4 3 2 0 -3 6 ,8 0

7 4 ,2 4

__________ -^-Filas______
SCrotai ~ *5Q:ointnnas ~ *->Qnte
5 4 3 ,2 0

__ 5 4 3 ,2 0

6 5 4 , 2 4 - 7 , 2 0 - 3 6 , 8 0 ~ 6 1 0 ,2 4 ~

0,10

____^^interaccin ________
^interaccin (In tera cci n );

SGfotal ^Qolurnnas ^^tlas


3 6 ,8 0

3 6 ,8 0

z a i a Z?to- sanoo ~ 1ni M

= 0 ,3 5

Sobre la base de las reglas de Cohn para R2 en el anlisis de varianza, segn las presentamos en
el captulo 12, existe un enorme tamao del efecto, es decir, una R2 alta para el sexo y adems un
buen tamao del efecto para la interaccin. El efecto no significativo del deseo de relacionarse te
na un tamao del efecto entre mediano y grande. (En el estudio real, los tamaos del efecto eran
mucho ms pequeos. En el ejemplo, los tamaos del efecto son tan grandes porque invenamos
datos con mucha menos varianza que en el estudio real, con el fin de que se pudieran observar los
patrones con claridad).
Si un estudio slo proporciona los valores F y los grados de libertad, se aplica la frmula que
vimos en el captulo 12, R2 = (F)(glnatc&)l[(F)(glBnttc)+glVtmol sustituyendo los F y los grados de
libertad del efecto correspondiente.
nZ

^Columnas

r2
Fll3S

f e i urnnasX^Columnas)
( ^Columas)

(1 3 -2 3 )

^Columnas) ^ ^Dentro

f e a s )(gPiias )

(1 3 -2 4 )

{^Fiias X^Filas ) + ^Dentro

____ (^imeracctnXo interaccin )


^ In te ra c c i n 1

(13-25)

(^nteraenX^nte raccin) * ^Dentro

Por ejemplo, en el estudio realizado con los equipos de radio llamada, el deseo de relacionarse era el
efecto principal de las columnas. Calculamos FColumnas en 3,85, los grados de libertad para este efect0 (^Columnas) en 1, y los grados de libertad intragrupales de las casillas (g/DenEf0) en 36. Por lo tanto,
^Columnas

( Columnas X-^Coiumnas)
(^Columnas )(^Coiumnas) ^
(3 ,8 5 )(1 )

g a m ito

3 ,8 5

~ ( 3 , 8 5 ) ( l ) + 3 6 ~ 3 9 ,8 5

Potencia
En un anlisis factorial de varianza, la potencia de cada efecto est influenciada por el diseo ge
neral. Por ejemplo, un efecto de columnas de tres niveles, tendr distinta potencia si se cruza con
un efecto de filas de dos niveles o si se craza con un efecto de filas de tres niveles. Por lo tanto, el
anlisis de la potencia es diferente segn la cantidad de niveles de un efecto y, teniendo en cuenta
cada cantidad de niveles, segn la cantidad de niveles con que se cruce.
Para simplificar las cosas, veremos las cifras relacionadas con la potencia slo para las tres si
tuaciones ms comunes del anlisis de varianza de dos criterios; todos los efectos en un diseo
2 x 2, un efecto principal de dos niveles (dos filas o dos columnas) en un diseo 2 x 3 y un efecto

principal de tres niveles (tres filas o tres columnas) en un diseo 2 x 3 . (La potencia de la interac
cin en un diseo 2 x 3 es la misma que la del efecto principal de tres niveles). La tabla 13-12 in
dica la potencia aproximada al nivel 0,05 de significacin para cada una de las situaciones
mencionadas, con tamaos del efecto pequeos, medianos y grandes, y con tamaos de casillas
de 10,20,30,40,50 y lOO.*3
Analicemos un estudio planificado 2 x 2 con 30 participantes por casilla y con un tamao me
diano del efecto esperado (R2 ~ 0,06), a realizarse con el nivel 0,05. El estudio que mencionamos
arriba tendra una potencia de 0,78, es decir, que si la hiptesis de investigacin en efecto es ver
dadera y tiene un tamao del efecto mediano, las posibilidades de que el estudio resulte significa
tivo es de aproximadamente el 78%. O veamos un ejemplo tomado de una publicacin, en el que
se encontr un resultado no significativo para un efecto interactivo en un anlisis de varianza
2 x 3 con 20 participantes por casilla. Basndonos en la tabla, para un tamao del efecto pequeo
el poder del estudio es de slo 0,14. Es decir, que aun si ese efecto pequeo existe en la poblacin,
sera muy improbable que el estudio resultara significativo. Por el contraro, la tabla muestra una
potencia de 0,98 para un gran tamao del efecto; por lo tanto, si existiera un gran efecto en la po
blacin, casi con seguridad hubiera resultado significativo en el estudio.

Tabla 13-12.
Potencia aproximada de estudios realizados con un anlisis de varianza 2 x 2 2 x 3 con respecto a
hiptesis probadas a un nivel 0,05 de significacin.
Tamao del efecto

N p o r C a silla
P equeo

(f=0J0)
(R = 0,10)
(? = 0,01)

M e d ia n o
( f = 0 ,2 5 )
(R = 0 ,2 4 )
(R 2 = 0 ,0 6 )

G ra n d e
( f = 0 ,4 0 )
( R - 0 ,3 7 )
(R 2 = 0 ,1 4 )

Todos lo s efecto s en un anlisis 2x2:

10
20
30
40
50

200

0,09
0,13
0 ,1 9
0,24
0,29
0,52

0,33
0 ,6 0
0,78
0,89
0,94
*

0,68

0,46
0,77
0,92
0,97
0,99
#

0,84
0,99
*
*
*
$

0,94
0,99
*
*
*

E fecto principal de dos niveles en un anlisis 2x3:

10
20
30
40
50

100

0,11
0,1 8
0,2 6
0,3 4
0,41
0,7 0

E fecto de tres niveles y efecto interactivo en un anlisis 2x3:


0,09
20
0,36
0,14
0 ,6 7
20
30
0,21
0,86
0,27
40
0 ,9 4
0,32
50
0,98
*
0,59
100

0,76
0,98
&
*

*Casi 1.

3 Cohn (2988, p.389-354) proporciona tablas ms detalladas. Sin embargo, utilizar esas tablas con el diseo factorial
requiere algunos clculos preliminares, tai como lo explica Cohe en las pginas 364-379.

Planificacin del tamao de la muestra


La tabla 13-13 indica la cantidad aproximada de participantes necesarios por casilla para obtener
una potencia del 80% a un nivel 0,05 de significacin, con tamaos del efecto estimados peque
os, medianos y grandes y para los mismos casos incluidos en la tabla de potencia.4
Supongamos que queremos planificar un anlisis de varianza 2 x 3, en el que predecimos un
gran tamao del efecto para el efecto principal en la variable de tres niveles, y un tamao del efec
to mediano para los otros efectos principales y para el efecto interactivo. Para obtener una poten
cia del 80% (al nivel 0,05 de significacin), necesitaramos 11 participantes por casilla para el
efecto principal de tres niveles, 22 por casilla para el efecto principal de dos niveles y 27 por casi
lla para el efecto interactivo. Dado que el experimento se realiza completo de una sola vez, debe
mos tener al menos 27 participantes por casilla (a menos que decidamos arriesgamos a tener
menor potencia para el efecto interactivo). En consecuencia, deberamos reclutar 162 participan
tes (27 para cada una de las seis casillas del diseo 2 x 3).

EXTENSIONES Y CASOS ESPECIALES


DEL ANLISIS FACTORIAL DE VARIANZA
El anlisis de varianza es una tcnica extremadamente verstil. Con el anlisis de varianza de un
criterio o de dos criterios, tal como los hemos descripto aqu y en los captulos 11 y 12, se pueden
analizar muchas situaciones de investigacin. Existen otras tcnicas que son ms complejas o en
las que hay que tener en cuenta aspectos especiales. No podemos, en este libro introductorio, en
trar en detalles de los procedimientos estadsticos necesarios para manejar todas las posibilida
des. (Esos procedimientos se incluyen en la mayora de los textos de estadstica de nivei intermedio
para la psicologa, como tambin en los que se suelen denominar libros de diseo experimen
tar). Sin embargo, podemos describir algunas de las variaciones o aspectos a tener en cuenta, de
modo de brindar una idea de las modificaciones bsicas que deben realizarse a ios procedimien
tos ya aprendidos.

Tabla 13-13.
Cantidad aproximada de participantes necesarios en cada casilla (suponiendo igual tamao de
muestras) para obtener una potencia del 80% en estudios que utilizan el anlisis de varianza 2 x 2
2 x 3 , probando las hiptesis a un nivel 0,05 de significacin.
Tamao del efecto
P equeo
(f * 0 ,1 0 )
(R ^ O J O )
(R l = 0 ,0 1 )

2 x 2 : todos lo s efectos
2 x 3: e fe cto principal en dos niveles
efecto principal en tres niveles y efecto interactivo

197
132
162

M e d ia n o

Cf * 0,2 5 )
(R = 0 ,2 4 )
(R 1 = 0 ,0 6 )
33

G ra n d e
( f = 0 ,4 0 )
(R = 0 ,3 7 )
(R* ~ 0 ,1 4 )

22

14
9

27

11

4 Cohn (1988, pp. 381-389) proporciona tablas ms detalladas. Para utilizaras es indispensable leer primero las pgi
nas 396-403 de Cohn.

Diseos de anlisis de varianza de tres criterios o ms


La extensin ms directa del anlisis de varianza de dos criterios es la de ios experimentos que in
cluyen diseos de tres criterios de clasificacin o ms. En esos casos, el anlisis se realiza exacta
mente como lo hemos descripto en este captulo, excepto por la existencia defecto s principales e
interactivos adicionales.
A veces un experimento incluye variables que slo son de inters si interactan con las va
riables ms importantes. Ejemplos de tales variables son el orden de presentacin o cul de dos
experimentadores realizaron el estudio con cada participante. En los casos que acabamos de
mencionar, el investigador puede comenzar con un anlisis de varianza factorial de varios crite
rios. Si las variables de inters secundario no tienen efectos interactivos significativos con las
variables de inters primario, se vuelve a realizar el anlisis ignorando las variables secundarias.
El diseo se convierte entonces en un anlisis de varianza ms manejable, de dos o tres criterios;
se dice que el anlisis resultante se ha plegado sobre las variables que se estn ignorando. Por
ejemplo, en el estudio de Lambert et al. acerca del estado de nimo y de la calidad del estereotipo,
los investigadores primero realizaron un anlisis de tres criterios que inclua el sexo, (Anterior
mente en este captulo, figura 13-1, incluimos un diagrama del caso anterior). Cuando descubrie
ron que no existan efectos principales ni interactivos en relacin con el sexo procedieron a realizar
un anlisis de dos criterios, plegado sobre el sexo (es decir, el sexo no se tuvo en cuenta en el an
lisis en dos sentidos).

Anlisis de varianza de medidas repetidas


En todas las situaciones que hemos analizado en este captulo y en los captulos 11 y 12, las dife
rentes casillas o agrupaciones se basan en valores de diferentes individuos, A veces, sin embargo,
un investigador mide al mismo individuo en varias situaciones diferentes. (Si existen slo dos si
tuaciones diferentes, como por ejemplo antes y despus del tratamiento, podemos utilizar una
prueba t para medias dependientes, como la descripta en el captulo 9). Analicemos un estudio en el
que el investigador mide la velocidad de reconocimiento de una saba cuando est inserta en tres
tipos de palabras: palabras familiares, palabras no familiares, y sonidos que no forman palabras.
En un estudio de este tipo, es comn que se exponga a cada participante a una gran cantidad de
palabras de cada tipo ordenadas al azar. Como resultado de ese procedimiento se obtiene una can
tidad promedio de errores por cada participante, para cada clase de palabra. Otro tipo de ejemplo
es el de un estudio acerca de los efectos de la psicoterapia, en el que se mide la depresin de los
pacientes antes, inmediatamente despus, y nuevamente a los 3 meses despus de haber asistido a
terapia. En los dos ejemplos anteriores, tenemos tres grupos de valores observados, sin embargo,
cada serie de tres observaciones pertenece a la misma persona. En el ejemplo de las distintas cla
ses de palabras, cada participante tiene una observacin (tiempo promedio de respuesta) hecha
por cada una de las tres ciases de palabras; en el ejemplo de la psicoterapia, cada individuo tiene
una observacin hecha (nivel de depresin) por cada una de las tres ocasiones (antes, inmediata
mente despus, 3 meses despus).
Los estudios mencionados en los prrafos anteriores son ejemplos de diseos de medidas
repetidas. Los diseos de medidas repetidas son analizados con un anlisis de varianza de
medidas repetidas. El nombre se debe a que los mismos participantes, son medidos repetidas
veces. Este tipo de diseo y anlisis tambin se denomina diseo intra-sujeto y anlisis de va
rianza intra-sujeto, porque la comparacin se realiza con respecto al interior de los diferentes
participantes o sujetos, y no entre ellos. (La Asociacin Americana de Psicologa recomienda la
utilizacin del trmino participante ms que el de sujeto).
Anlisis devarianza factorial

44 3

A veces, una variable de medidas repetidas se cruza en el mismo estudio con una variable co
mn entre participantes. Por ejemplo, en el estudio acerca de la terapia podra haber un grupo de
control que no hiciera terapia pero que fuera probado en las mismas tres ocasiones que los dems.
En ese caso se estara realizando un diseo 2 (grupo de terapia contra grupo de control) x 3 (antes,
despus, 3 meses despus), en el que la primera variable es del tipo usual entre participantes, co
mo las que hemos estado utilizando hasta ahora, y la segunda es una variable del tipo de medidas
repetidas. Incluso es posible tener dos factores de medidas repetidas o combinaciones an ms
complejas,
Los diseos experimentales que incluyen una o ms variables de medidas repetidas son bas
tante comunes, pero son controvertidos en cuanto a la forma en que deberan analizarse. Una de
esas formas involucra una extensin bastante directa de los procedimientos que hemos aprendido.
El apndice II de este captulo describe esos procedimientos para un anlisis de varianza de medi
das repetidas de un criterio. Sin embargo, los supuestos que deben cumplirse para que este mto
do d resultados precisos son bastante exigentes y, a menudo, no se cumplen en la prctica. Por
eso, algunos investigadores han sostenido enrgicamente que los diseos de medidas repetidas
usualmente deberan analizarse utilizando un procedimiento mucho ms complejo denominado
anlisis de varianza multivariable. Otros investigadores defienden el procedimiento normal
modificado, pero realizan una adaptacin a los grados de libertad utilizados para determinar el
punto F de corte.
El mejor mtodo, en trminos tanto del error Tipo I como del error Tipo II, sigue siendo con
trovertido y complejo (el tema ha sido tratado recientemente por Keselman, Lx & Keselman,
1996; Algna & Keselman, 1997). Al igual que con otros temas controvertidos que hemos tratado,
en la mayora de las situaciones reales de investigacin los resultados no difieren demasiado con
los distintos mtodo utilizados; sin embargo, si los resultados son muy ajustados, es aconsejable
no considerarlos tan concluyentes sin realizar una mayor investigacin.

CONTROVERSIAS, LIMITACIONES Y DESARROLLOS REGENTES__________


En esta seccin veremos dos antiguas controversias con respecto al anlisis factorial de varianza.
Una cuestin trata sobre lo que se debe hacer cuando hay distinta cantidad de participantes en las
diversas casillas. La otra cuestin trata sobre el modo de manejar una situacin en la que una de
las variables no es categrica sino numrica cuantitativa, situacin generalmente denominada
dicoomizacin de una variable.

Cantidad desigual de participantes en las casillas


Qu sucede cuando realizamos un anlisis factorial de varianza del modo que hemos descripto y
en el cual las casillas no tienen la misma cantidad de participantes? En general, aun utilizando el
mtodo del modelo estructural, se obtienen resultados distorsionados. (El anlisis de varianza de
un criterio, con el mtodo de modelo estructural que describimos en el captulo 12, s funciona
correctamente tanto con tamaos de casillas iguales o desiguales. La situacin es ms complica
da, sin embargo, con un anlisis de varianza de dos criterios o ms).
Ha habido mucha controversia con respecto al tema mencionado en el prrafo anterior. Un
mtodo al que a veces recurren investigadores desalentados consiste en eliminar registros al azar
de aquellas casillas que tienen demasiados, pero este mtodo desperdicia potencia. Actualmente
se considera en forma generalizada que la solucin denominada anlisis de varianza de cuadra-

dos mnimos es el mtodo ptimo, y la mayora de ios programas para computadora que calculan
el anlisis de varianza disponen de esta opcin; algunos incluso ia utilizan automticamente, a
menos que se les indique lo contrario. (El mtodo, mencionado se basa en el anlisis de regresio
nes mltiples, del cual hemos aprendido algo en el captulo 4). Cuando los tamaos de las casillas
son iguales, este mtodo da el mismo resultado que el mtodo ordinario.
El resultado de utilizar el mtodo de cuadrados mnimos es que se empareja la influencia de
cada casilla sobre los efectos principales e interactivos, que es en realidad lo que se busca. Sin
embargo, un documento influyente (Mlligan, Wong & Thompson, 1987) sugiri que este mtodo
es especialmente susceptible al incumplimiento de los supuestos de normalidad poblacional o de
igualdad de las varianzas poblacionales. (Lamentablemente, otros mtodos tradicionales del an
lisis factorial de varianza con tamaos desiguales de casillas son exactamente tan susceptibles co
mo el anterior). Por lo tanto, la mejor recomendacin para los investigadores es disear estudios
que utilicen casillas del mismo tamao. Adems, al igual que suceda con la prueba t, para una de
terminada cantidad de participantes a potencia es mayor cuando se conforman con ellos grupos
de igual tamao para asignarlos a las diferentes casillas.

Dicotomzacin de variables numricas


Supongamos que un psiclogo especializado en desarrollo midi la angustia y la habilidad social
en un grupo de nios. El psiclogo despus observ sus comportamientos en un grupo de juego
con otros nios, concentrndose en sus reacciones agresivas. Para observar los resultados de este
estudio, el investigador dividi a los nios en dos grupos segn sus puntuaciones de angustia, for
mando un grupo de alto nivel de angustia y otro de bajo nivel' de angustia; despus los dividi
nuevamente por a mitad segn las habilidades sociales, formando un grupo con habilidades so
ciales altas y otro con bajas. Las combinaciones dieron como resultado cuatro grupos: alta angus
tia, alto nivel de habilidades sociales; alta angustia, bajo nivel de habilidades sociales, y as
sucesivamente. Habiendo dividido a ios nios del modo descripto, el investigadorrealiz un an
lisis de varianza 2 x 2 comparando el alto nivel contra el bajo nivel de angustia segn el alto nivel
contra el bajo nivel de habilidades sociales. A travs del anlisis, el investigador pudo observar si
exista un efecto principal de la angustia sobre la agresin, un efecto principal del nivel de habili
dades sociales sobre la agresin, y/o un efecto interactivo de la angustia y las habilidades sociales
sobre la agresin.
Lo que debemos observar en este caso es que el investigador dividi a los nios en dos grupos
segn la angustia y las habilidades sociales, Analicemos primero la angustia. En el estudio, la an
gustia era una variable numrica cuantitativa considerada continua; sin embargo, el investigador
ignor todas las delicadas gradaciones y simplemente dividi al grupo por la mitad, formando un
grupo con alto nivel de angustia y otro con bajo nivel de angustia. Como resultado, todos los par
ticipantes del grupo con alto nivel de angustia eran tratados como si tuvieran la misma puntua
cin, y todos los de la agrupacin con bajo nivel de angustia eran tratados como si tuvieran la
misma puntuacin.
El tipo de divisin que acabamos de describir se denomina dicotomzacin, es decir, conver
tir la variable en una dicotoma o en dos modalidades. Dado que la dicotomzacin se realiza
usualmente tomando a aqullos por encima y por debajo de la mediana, el proceso descripto tam
bin se denomina divisin por la mediana de las puntuaciones. (Es menos comn que los inves
tigadores dividan por la media, pero ya sea que se utilice la mediana o la media, no se produce
gran diferencia). En el ejemplo que analizamos, el investigador tambin dicotomiz (realiz una
divisin por la mediana) segn las habilidades sociales.

La ventaja de dicotomizar variables numricas es que posibilita la realizacin de un anlisis de


varianza factorial, con todas las ventajas que hemos visto en este captulo relacionadas con la efi
ciencia y con la posibilidad de realizar pruebas de efectos principales y de interaccin en el mismo
estudio. Adems, la mayora de los psiclogos estn familiarizados con el anlisis de varianza y
comprenden rpidamente tales resultados. Muchos psiclogos estn menos familiarizados con ios
procedimientos alternativos (basados en regresiones mltiples), que logran prcticamente el mismo
resultado pero no requieren de la dicotomizacin.
Una desventaja importante de la dicotomizacin es que gran cantidad de informacin se pier
de cuando se reduce a dos todo el rango de valores, es decir, en alto o bajo. Desde otro punto de
vista, tambin podra decirse que la medicin se hace mucho menos precisa. Uno de los resulta
dos de este proceso es que el tamao del efecto y la potencia de un estudio con dicotomizacin
son mucho menores que cuando se utilizan los valores originales. Cohn (1983) calcul que la re
duccin de la potencia y del tamao del efecto jes de entre un 20% y un 66%! Sugiri que es equi
valente a descartar uno o dos tercios de la muestra, (p. 253)
Por otro lado, muchos investigadores dicotomizan sus variables alegando que el efecto es
conservador, perdiendo aumentar la probabilidad de un error Tipo II (no rechazar la hiptesis
nula cuando en realidad es falsa), pero no aumenta la probabilidad del error Tipo I (rechazar la
hiptesis nula cuando es verdadera). Dicho de otro modo, la dicotomizacin reduce la precisin
de modo tal que resulta ms difcil, y no ms fcil, obtener resultados significativos. Por lo tan
to, si un estudio descubre un resultado a pesar de la dicotomizacin, podemos confiar en que se
trata de un efecto real. Ms an, sostienen que si el tamao del efecto es menor de lo que podra
ser sin dicotomizacin, al menos podemos confiar en que no hemos sobrestimado el tamao de
efecto. La dicotomizacin contina siendo muy comn en las investigaciones ya que facilita el
clculo y la interpretacin de los resultados.
Casi todos los que han escrito acerca de esta cuestin estn de acuerdo con que el anlisis an
terior es el correcto, pero slo hasta cierto punto. En lneas generales, el efecto de la dicotomiza
cin de una sola variable es conservador. Por ejemplo, supongamos que el investigador slo
comparara nios con alto y bajo nivel de angustia con respecto a la agresin (sin considerar las
habilidades sociales). En ese caso, el procedimiento sera conservador en el sentido de que la pro
babilidad de obtener significacin disminuye cuando no existe efecto verdadero.
Por supuesto que una decisin como la anterior es tambin excesivamente conservadora,
ya que no se descubrirn los verdaderos resultados y los verdaderos tamaos del efecto sern su
bestimados. Tambin sucede que existe una falta de exactitud general. El efecto de la dicotomi
zacin es conservador en lneas generales. Pero en algn caso en particular, la inexactitud de la
dicotomizacin podra funcionar en favor de la hiptesis del investigador, aumentando inade
cuadamente el tamao del efecto y haciendo que una verdadera ausencia de diferencia resulte
significativa en el estudio.
Ms an, Maxwell y Delaney (1993) han demostrado que cuando se dicotomizan dos varia
bles (como en el ejemplo de la angustia y las habilidades sociales), ya no puede asumirse que el
impacto sea conservador, En una cantidad de situaciones muy comunes dentro de la investigacin
psicolgica, dicotomizar dos variables puede tener consecuencias opuestas a las de un efecto con
servador, aun en lneas generales. Segn Maxwell y Delaney, uno debera ser especialmente es
cptico en cuanto a los resultados de estudios que utilizan un anlisis de varianza de dos criterios,
en el que ambas variables han sido dicotomizadas.
Existe otra desventaja de la dicotomizacin en el anlisis factorial de varianza. En la mayora
de los casos, cuando dividimos dos variables numricas por sus medianas, las casillas resultantes
en el anlisis 2 x 2 por lo general no son iguales, dando lugar a una mayor reduccin de la poten-

ca y a los problemas de susceptibilidad, y al incumplimiento de supuestos que tratamos en la


seccin anterior.
A pesar de las diversas dificultades mencionadas, la dicotomizacin (incluso la de dos varia
bles en un anlisis de varianza de dos criterios) es an sorprendentemente comn en la investiga
cin psicolgica. Es nuestra impresin, sin embargo, que est desapareciendo rpidamente.

RESULTADOS DEL ANLISIS FACTORIAL DE VARIANZA


SEGN SE DESCRIBEN EN LAS PUBLICACIONES CIENTFICAS
En un anlisis factorial de varianza, los resultados comnmente se presentan con una descripcin
en el texto, ms una tabla. El texto indica la razn F y la informacin que ste implica para cada
efecto principal e interactivo. La tabla indica las medias de casilla y, a veces, tambin las medias
margnales. Si existe un efecto interactivo, en lugar de (o adems de) una tabla puede haber un
grfico. Por Ejemplo, Lambert et al. describieron de la siguiente manera el resultado que utiliza
mos como ejemplo:
El anlisis de las intenciones de los participantes de contratar al objetivo revel slo un efecto sig
nificativo, la interaccin predtcha entre el estado de nimo y el tipo de empleo, F (X, 57) = 11,46,
p < 0,001. La informacin pertinente a esta interaccin aparece en la figura [13-2] (p. 1011).
Hasta hace poco, era ms comn que los investigadores mostraran los efectos interactivos utili
zando una especie de grfico lineal Analicemos un ejemplo; Gump y Kulik (1997) realizaron un
estudio para probar una teora acerca de condiciones que promovan las relaciones interpersonaies. Especficamente, predijeron que es ms probable que uno se relacione con otra persona
cuando uno est bajo amenaza y cuando la otra persona est enfrentando la misma amenaza. Co
mo parte de estudio, se asignaron participantes ai azar a esperar o no un procedimiento experi
mental doloroso. La anterior era la manipulacin en cuanto a la amenaza (alta contra baja). En
todas las condiciones haba otro participante en la habitacin. A la mitad de ios participantes se
les dijo que ese otro participante estaba en el mismo experimento y, por lo tanto, enfrentaba una
situacin similar de amenaza o de no amenaza; la otra mitad supona que el otro participante for
maba parte de un experimento totalmente diferente y, por lo tanto, no esperaba la misma situa
cin de amenaza o no amenaza. Esta era la manipulacin en cuanto a la similitud de la situacin
(similar contra dismil). A medida que se informaba al participante acerca de la amenaza a travs
de un auricular, los experimentadores observaron cunto tiempo pasaba cada participante miran
do a su compaero.
En este anlisis surgi una interaccin significativa entre la amenaza hacia e! participante y la simili
tud de la situacin, jF(1, 77) - 5,57, p = 0,02. Ningn otro efecto result significativo. Como se obser
va en la figura [13-11J, queda claro que un alto nivel de amenaza produjo que se mirara ms a un
compaero al que se crea en la misma situacin, en comparacin con aqul al que se crea en una si
tuacin diferente, mientras que esa diferenciacin no ocurri en el caso de participantes bajo una
amenaza de bajo nivel.
El tipo de grfico que presentaron Gump y Kulik (figura 13-11) tiene la ventaja de hacer que el
patrn de la interaccin sea muy claro, aun comparado con el usual grfico de barras. La razn
por la que los grficos de lneas como el del ejemplo se han vuelto menos comunes en los ltimos
aos, es que son levemente engaosos, en el sentido de que la lnea implica que existe un efecto
continuo. Por ejemplo, en el estudio de Gump y Kulik haba una condicin de alto nivel de ame
naza y otra de bajo nivel de amenaza. Las lneas dan la impresin de que el patrn de cada condi-

F igura 13-11.

Estudio 1: efecto de ia amenaza y la


similitud de situacin en el tiempo
transcurrido mirando a un compae
ro. [Fuente: Gump, B- B. & Kulk, J.
A, (1997), fig. 1. Estrs, relacin y
contagio emocionar. R e v is ta C ie n t
f i c a d e P s i c o l o g a S o c i a l y d e la P e r
s o n a l i d a d ( J o u r n a l o f P e r s o n a lity
a n d S o c i a l P s y c h o lo g y } , 72, 305-

319. Copyright, 1997, por la Asocia


cin Americana de Psicologa. Reimimpreso con autorizacin].

ctn de similitud es continuo de bajo a alto nivel de amenaza. Supongamos que los investigadores
hubieran incluido una condicin intermedia de amenaza. Es posible que el resultado para esa condi
cin no estuviera en absoluto en el lugar en el que la lnea del grfico en cuestin indica que debera
estar. Los grficos de barra, por el contrario, no reflejan nada en cuanto a ios niveles intermedios,
simplemente muestran los resultados de cada nivel de la variable probada.

Resumen
En un diseo de investigacin factorial los participantes son divididos en grupos segn las combi
naciones de las variables cuyos efectos estn siendo analizados. A travs de los diseos factoria
les podemos analizar los efectos de dos (o ms) variables sin necesidad de convocar el doble de
participantes. Adems, estos diseos hacen posible el anlisis de efectos interactivos, es decir, los
efectos de las combinaciones de las dos variables. Especficamente, un efecto interactivo ocurre
cuando el efecto de una variable depende del nivel de la otra variable. Un efecto principal es el
efecto promedio general de una variable, ignorando el efecto de la otra variable. Los efectos prin
cipales e interactivos pueden describirse verbal, numrica y grficamente.
Los clculos de un anlisis de varianza de dos criterios siguen el mtodo del modelo estructu
ral. La estimacin intragrapal de varianza pobacional es, en realidad, una estimacin de varianza
poblacional a partir del interior de las casillas. Se basa en los desvos de cada registro con respec
to a la media de su casilla. Existen tres diferentes estimaciones intergrupales de varianza: una pa
ra las diferencias de la dispersin de la variable a travs de las filas, otra para las diferencias de la
dispersin de la variable a travs de las columnas y una para la interaccin de las variables de fila
y de columna. El efecto de las filas se basa en los desvos entre las medias de las filas y la gran
media, y el efecto principal de las columnas se basa en los desvos entre las medias de las colum
nas y la gran media. El efecto interactivo se basa en el desvo restante entre las observaciones y la
gran media despus de restar todos los otros desvos con respecto a la gran media (desvos de las
medias de las casillas, las medias de filas y las medias de columnas). Para obtener las estimacio
nes reales de varianza poblacional, esos distintos desvos (interno, filas, columnas' e interactivo)

se elevan al cuadrado, se suman y se dividen por sus grados de libertad. Las razones F para los
efectos de fila, columna e interactivo se calculan dividiendo las estimaciones de varanza poblacional, correspondientes a cada uno de ellos, por la estimacin inragrupal de casilla de la varianza poblaciona.
..
En un anlisis factorial de varianza se calcula el tamao del efecto y la potencia separada
mente para cada efecto principal e interactivo. El indicador ms til del tamao del efecto es la
proporcin de varianza explicada, R2 (tambin denominada eta2), En un anlisis de varianza de
dos criterios, se calcula R2 para cualquier efecto principal o interactivo en particular de la siguien
te forma: se divide la suma de los cuadrados correspondientes a ese efecto en particular por la par
te de la suma total de cuadrados que queda despus de restarle la suma de los cuadrados
correspondientes a los otros dos efectos.
El anlisis factorial de varianza puede extenderse a diseos de ms de dos criterios e incluso
puede utilizarse para manejar estudios de medidas repetidas.
Existen dos antiguas controversias con respecto al anlisis factorial de varianza. Una se basa
en la forma de manejar situaciones con tamaos desiguales de casilla. El mtodo de cuadrados
mnimos se considera usualmente el mejor, pero la solucin ptima es trabajar con casillas del
mismo tamao. La otra controversia se basa en la conveniencia de realizar una dicotomizacin de
variables continuas para realizar un anlisis de varianza. El procedimiento de dicotomizacin ca
da vez est siendo menos comn; generalmente se considera mejor utilizar procedimientos ms
avanzados que conservan todos los valores de cada variable.
Los resultados del anlisis factorial de varianza incluyen con frecuencia descripciones grfi
cas de Jos resultados, particularmente cuando el efecto interactivo es significativo. Por lo general
se utilizan grficos de barra, pero, a veces, se incluyen grficos de lneas.

Trminos clave
- Casilla.
- Media de casilla.
- Dicotomizacin.
-Anlisis factorial de varianza.
- Diseo factorial de investigacin.
- Efecto interactivo.
- Anlisis de varianza de
cuadrados mnimos.

Efecto principal.
Medias marginales.
Divisin por la mediana.
Anlisis de varianza
de un criterio.
- Anlisis de varianza
de medidas repetidas.

Ejercicios
Los ejercicios implican la realizacin de clcu
los (con la ayuda de una calculadora). La ma
yora de los problemas estadsticos reales se
resuelven por computadora, pero aunque exis
ta la posibilidad de utilizarla, es conveniente
realizar estos ejercicios manualmente para in
corporar el mtodo de trabajo.

- Diseo factorial
de tres criterios.
- Anlisis de varianza
de dos criterios.
- Diseo de investigacin
factorial de dos criterios.

Para adquirir prctica en la utilizacin de


una computadora, para resolver problemas esta
dsticos, se puede utilizar la seccin de compu
tacin de cada captulo, publicada en la Gua de
estudio y libro de tareas de computacin para el
alumno [Students Study Guide and Computer
Workbook] que acompaa este libro.
Todos los datos de esta seccin son ficti
cios (a menos que se especifique lo contrario)
Las respuestas a los ejercicios de la serie I
se encuentran al final del libro.

2. Un psiclogo especializado en deportes


realiz un estudio acerca del efecto de un pro
1,
Cada una de las siguientes es una tabla
grama de motivacin en las lesiones entre ju
de medias que muestra los resultados de un es gadores de tres deportes diferentes. El cuadro
tudio con diseo factorial. Suponiendo que que sigue a continuacin muestra el diseo.
cualquier diferencia es estadsticamente signi Par? cada uno de ios siguientes posibles patro
ficativa, para cada tabla a) realice dos grficos nes de resultados, cree una serie de medias de
de barra que muestren los resultados (en un casilla, calcule las medias marginales y reali
grfico agrupe las barras segn una variable y ce un grfico de barras de los resultados: a) efec
en el otro grfico agrupe las barras segn la to principal del tipo de deporte y ningn otro
otra variable); b) indique qu efectos se encon efecto principal o interactivo; b) efecto prin
traron (principales e interactivos), si los hay, cipal del programa o la ausencia de progra
ma y ningn otro efecto principal o interactivo;
y c) describa el significado del patrn de me
c) ambos efectos principales sin interaccin;
dias (es decir, la existencia de cualquier efec
d) efecto del programa o la ausencia de programa
to principal o interactivo, o so ausencia) con y una interaccin, pero sin efecto principal del ti
palabras.
po de deporte; e) ambos efectos principales y una
i) Variable medida: ingreso (miles de dlares). interaccin.
Variable medida; Cantidad de lesiones por
E dad
persona
durante 10 semanas.
J o v en M a y o r
SERIE 1

20

I n fe r io r
S u p e r io r

D eporte

- 35

25

B a s e b a ll

100

ii) Variable medida: promedio de califica


ciones.
E sp ec ia lid a d

vi
2
fj

C ie n c ia
C o m u n id a d

f* A r te s L ib e r a le s

2,1
. 2,8

A r te

2,8
: 2,1

iiz) Variable medida; das de enfermedad


por mes.
Sexo
F e m e n in o M a s c u lin o

a
P a s a n te s

2,0

. 2 ,5

O S u p e r v is o r e s

3,1

3 ,6

iv) Variable medida: calificacin de la cali


dad del restaurante (de 1 a 10).
C iudad
N e w York C h ica g o V ancouver

O
o

'S

C a ro

M o d era d o

B arato

7
'

6
5

C on p ro g ra m a
de m o t i v a c i n
Sin p r o g r a m a d e
m o tiv a c i n

F tb o l

B asket

'
________________________
------------------------------------- -

3. a) Cul seria la potencia de cada uno de


los efectos en el estudio del ejercicio 2 si el in
vestigador tiene 40 participantes por casilla
utilizando un nivel de 0,05, y suponiendo ta
maos del efecto medianos? b) Cuntos parti
cipantes en total serian necesarios para un 80%
de potencia si el investigador espera que todos
los tamaos del efecto sean grandes?
4. Un psiclogo realiza un estudio para
comparar la efectividad relativa de tres tipos
diferentes de terapia en pacientes con diferen
tes diagnsticos. Pacientes con dos tipos de
diagnsticos fueron asignados al azar a uno de
los tres tipos de terapia. Haba dos pacientes
por casilla. Sobre la base de los resultados que
aparecen abajo a) realice el anlisis de varanza; b) realice una tabla de medias de casilla y
marginales; c) calcule los tres tamaos de efec
to, y d) describa los resultados con palabras
(indique qu efectos son significativos y, en
base a ellos, cmo comprender el patrn de
medias de casilla). Utilice el nivel 0,05.

el hecho de conocer caractersticas de determi


nada persona, las cuales eran contrarias a lo
2
6
3
D iagnstico I
que se esperara del estereotipo. Especfica
2
I
4
mente, analizaron la posibilidad de que la in
11
7
D iagnstico II
8
formacin extremadamente contraria pueda
9
9
10
tener un efecto boomerang, es decir, reforzar el
5.
Un psiclogo que analiza el sistema ju
estereotipo.
dicial realiza un estudio acerca del efecto de la
Se preseleccionaron los participantes para
simpata y del nerviosismo del acusado en la el estudio sobre la base de respuestas a un
predisposicin a condenarlo. Cada participante cuestionario que inclua una pregunta en la que
ley la misma transcripcin tomada de un jui calificaban a los agentes r r p p (Relaciones P
cio real en el que la culpabilidad o inocencia de blicas) en cuanto a su grado tpico de extraver
un acusado de sexo masculino era bastante am sin. La mayora de las personas consideran
bigua. Todos los participantes vieron tambin que los agentes RRPP son extrovertidos. Sn
un breve vdeo que supuestamente mostraba al embargo, los investigadores seleccionaron un
acusado en el estrado. Sin embargo, la actua grupo de participantes, los partid- pantes de
cin del protagonista del video era diferente estereotipo extremo, que haban clasificado
para los distintos participantes, incluyendo las a los agentes RRPP como extremadamente ex
cuatro posibilidades de simpata contra la falta trovertidos. El otro grupo, denominado de es
de ella y el nerviosismo contra la ausencia del tereotipo moderado, haba clasificado a los
mismo. Despus de observar la cinta, los parti agentes r r f p como slo moderadamente intro
cipantes calificaron la posibilidad de que el vertidos. Durante el estudio real, a algunos par
acusado fuera inocente (en una escala de 1, muy ticipantes se les dio una descripcin de un
improbable, a 10, muy probable). Los resulta- determinado agente r r p p que era muy introver
. dos de los primeros 12 participantes del estu tido y, por lo tanto, desviado en extremo de las
expectativas usuales que indican que los agen
dio fueron los siguientes:
tes RRPP son extrovertidos. Era la condicin de
desvo extremo. A los otros participantes no se
S im p a ta
F a lta d e sim p a ta
les dio ninguna descripcin en especial, era la
condicin de control. Mas tarde, se pregunt a
N erviosism o
7
3
4
8
todos los participantes qu pensaban con res
2
6
pecto a los agentes r r p p .
Kunda y Oleson (1997) informaron ios re
7
A usencia de
3
sultados de la siguiente manera:
nerviosism o
3
5
T erapia A

T era p ia B

T era p ia C

a) Realice el anlisis de varianza. b) Construya


una tabla de medias de casilla y marginales,
c) Calcule los tamaos del efecto, d) Explique
los resultados y la forma en que lleg a los mis
mos a alguien que est familiarizado con el an
lisis de varianza de un criterio (incluyendo el
mtodo del modelo estructural) pero no con el
anlisis factorial de varianza.
6.
Kunda y Oleson (1997) realizaron un
estudio acerca de estereotipos, que se concen
traba en el efecto de informacin contraria al
estereotipo. Por informacin contraria definan

U n a n o v a d e 2 (e ste re o tip o p revio) x 2 (c o n


d ic i n ) arroj un a in teraccin sign ificativa,
F ( l , 4 2 ) = 5 ,6 9 , p < 0 ,0 5 , ind ican d o qu e e l im
p acto d el ob jetivo en lo s estereo tip o s de los
participantes d ep en d a de sus estereo tip o s pre
v io s. C o m o s e ob serva en la figu ra [1 3 -1 2 ], los
participantes de ester e o tip o extrem o ex p u esto s
ai ob jetivo altam en te introvertido llegaron a
considerar a lo s a g e n te s RRPP c o m o an m s
extrovertid os d e lo q u e lo h ic ie r o n lo s con tro
le s d e e x tr em o s...[a ] e fe c to b o o m e r a n g [...] S e
o b serv u n patrn d iferen te para lo s partici
pan tes d e estereo tip o m od erado. S u s estereo ti
p o s n o fu eron afectad os por la e x p o s ic i n al
m ism o o b jetiv o [...] E l a n o v a tam bin revel

F igura 13-12.

Calificaciones medias de a extraversin


de agentes r r p p realizada por participan
tes con estereotipos previos, moderados
o extremos, que fueron expuestos a un
agente r r p p extremadamente introverti
do o a ningn objetivo (controles). Los
nmeros ms altos indican mayor extra
versin de los r r p p . [Fuente: Runda, Z.,
& Oeson, K . C . (1997), figura 4. Cuan
do las excepciones confirman la regla:
cmo el extremismo de una desviacin
determina el impacto de los ejemplos des
viados en los estereotipos. R e v is ta C ie n

: 'Jl Participantes de estereotipo .


-, "
/ ' Yrodcrda". j*yo."-V./; V '.PSUSBI ^
!' ':'r : excrmo'i'it

:V ; v ;/-S

VVf ?,4i;

tfic a d e P s ic o lo g a S o c ia l y d e P e r so
n a li d a d [J o u r n a l o f P e r s o n a lity a n d S o
c i a l P s y c h o lo g y ] , 72,965-979. Copyright,

1997, por la Asociacin Americana de Psi


cologa. Reimpreso con autorizacin.

un gran efecto de los estereotipos previos,


F(l, 42<9 = 38,94, p < 0,0001, indicando, lo
cual no es sorprendente, que los participantes de
estereotipo extremo continuaron considerando a
los agentes RRPP como ms extrovertidos de lo
que lo hicieron los participantes de estereotipo
moderado. Tambin hubo un efecto marginal de
la condicin, F(I, 42) = 2,89, p < 0,10, que se
deba c la r a m e n te e n su totalidad a los partici
pantes de estereotipo extremo, (p. 974).

co agrupe las barras segn una variable y en el


otro grfico agrupe las barras segn la otra va
riable); b) indique qu efectos se encuentran
(principales e interactivos), si existen; c) des
criba el significado del patrn de medias (es
decir, cualquier efecto principal o interactivo o
la ausencia de los mismos) con palabras,
i) Variable medida: intensidad de atencin.

Describa brevemente el significado de estos re


sultados a una persona que nunca ha asistido a
un curso de estadstica. (Evite entrar en deta
lles de clculo; slo incluya la lgica bsica
del patrn de medias, los resultados significati
vos, los tamaos del efecto y los aspectos rela
cionados con la interpretacin de resultados no
significativos).

SERIE 1
1. Cada una de las siguientes es una tabla
de medias que muestra los resultados de un estudio con diseo factorial. Suponiendo que
cualquier diferencia es estadsticamente significativa, para cada tabla a) realice dos grficos
de barra mostrando los resultados (en un grfi-

P ro g ra m a
_

ca sca n u eces
R e g u la r

M oderno

20

. .'.'"i 15

io

- '5.V-:

V .i5

A veces
N e fito

ii)
Variable medida: nivel de aprobacin
del presidente de EEUU.
---------------- ____________
O e s te
M e d ia
B a ja

. 70.
50

E s te

Sur

45- : F\55. : 50
V25'--. :v 35
: 30

iii) Variable medida: satisfaccin con res


pecto a la educacin.

Id iom a

Sexo

S
W
O
Q

F e m m in a

M a s c u lin o

<g

H o la n d s

R um ano

S u eco

P rrafo

o .2?

O ra c i n

N in g u n o

3.
En determinado colegio secundario, se
probaron tres tipos de programas de enseanza
1 ao
. 4
. . 4 , ...
de ingls, historia y matemtica a travs de vi
n o.
Sanos
... 9 - 9
deos, Despus, los investigadores midieron el
nivel de aprendizaje. Haba dos alumnos por
casilla. Sobre la base de los resultados que apa
iv) Variable medida: nivel de envidia del
recen abajo, a) realice una tabla de medias de
xito de otra persona.
casilla y marginales y trace un grfico de ba
rras de las mismas; b) realice los cinco pasos
N iv e l d e x ito
de la prueba de hiptesis (utilice el nivel 0,05 de
significacin); c) calcule los tres tamaos del

G ra n d e Pequeo
efecto, y d) describa los resultados con pala
I
A m ig o
,8
5
bras (indique qu efectos son significativos y,
4
:l "
^ 8 E x tra o
sobre la base de ellos, cmo interpreta el pa
trn de medias de casillas).
2.
En este estudio se instruy a participan
In gls
H is t o r ia M a t e m t ic a
tes de habla inglesa para que intentaran leer
durante media hora un prrafo escrito en uno Programa Tipo A
3
2
15
14
3
3
de tres idiomas que desconocan. Leyeron el p
6
6
18
rrafo despus de que se les dijera la idea princi Programa Tipo B
10
5
8
pal de todo el prrafo o slo la idea principal de Programa T ipo C
1
13
2
la primera oracin, o bien despus de que no se
3
4
0
les dijera nada sobre e significado del prrafo.
4.
Para cada una de las siguientes series de
Se les dio la traduccin de algunas palabras.
informacin realice un anlisis de varianza, in
Despus los investigadores midieron cuntas
cluyendo una tabla de medias de casilla y margina
de las otras palabras pudieron traducir correc
les y un grfico de barras de las medias de casilla.
tamente. El cuadro que sigue a continuacin
muestra el diseo. Para cada uno de los siguien (i)
C o n d ic i n E x p e r i m e n t a l
tes posibles patrones de resultado, cree una
A
B
serie de medias de casilla, calcule las medias
Grupo I
0
3
marginales y realice un grfico de barras de los
I
2
1
3
resultados: a) efecto principal del idioma y nin
Grupo 2
3
0
gn otro efecto principal o interactivo; b) efecto
2
1
3
1
principal del conocimiento del significado y
(ii)
C on d icin E x p e rim e n ta l
ningn otro efecto principal o interactivo; c) am
A
B
bos efectos principales pero sin interaccin;
Grupo 1
0
0
d) efecto principal del idioma y una interaccin,
1
1
1
1
pero sin efecto principal del conocimiento del
Grupo 2
3
3.
significado; e) ambos efectos principales y una
2
2
3
3
interaccin.
1 m es

(jjj)

rior. Desmarais y Curts informaron sus resul


tados de la siguiente manera:

C o n d ic i n E x p e r im e n ta l
A

Grupo

Se analizaron ios pagos auto-asignados por los


participantes con un a n o v a 2 x 3 (sexo de los
1
3
participantes x ingreso percibido recientemen
Grupo 2
0
3
te). En contra de la prediccin, en cuanto a que
1
2
el ingreso reciente influira en el pago asignado
1
3
por ellos mismos, ia informacin revel que no
5,
Desmarais y Curts (1997), dos psiclo exista diferencia de adjudicacin de pago cau
sada por el ingreso percibido, F(2, 66) = 1,99,
gos sociales canadienses, realizaron un estudio
ns (vase [tabla 13-14]), Adems, no hubo in
relacionado con la forma en que mujeres y
teraccin signicativa entre sexo y el ingreso
hombres evalan su propio valor como em
percibido, F(2,66) - 0,61, ns. En concordancia
pleados. Estudios previos haban demostrado
con investigaciones previas sobre percepcin
que cuando se les daba la posibilidad de deci
de ingreso merecido, los hombres se pagan a
s mismos montos significativamente ms al
dir cunto deberan ganar por una tarea experi
tos (M = $3,99) que las mujeres ( M ~ $2,74),
mental, las mujeres usualmente se establecan
F(l, 66) =5,86,p <0,02. (p. 143).
una paga menor. Los investigadores esperaban
que este patrn fuera afectado por el monto en Describa brevemente el significado de estos re
particular que mujeres y hombres haban reci sultados a una persona que nunca ha asistido a
bido como pago por trabajo real en el pasado un curso de estadstica. (Evite entrar en deta
reciente. Realizaron el procedimiento experi lles de clculo; slo incluya la lgica bsica
mental habitual en el que se le pidi a estudian del patrn de medias, los resultados significati
tes mujeres y hombres que se asignaran un vos, los tamaos de efecto y las cuestiones re
sueldo, pero tambin se pregunt a los partici lacionadas con la interpretacin de los resul
pantes cunto haban ganado el verano ante tados no significativos).

Tabla 13-14.
Media de pago auto-asignado por una tarea experimental, dividido por categoras segn el sexo y el
ingreso percibido el verano anterior.
I n g r e s o d e l v e r a n o e n te r io r
B a jo

Sexo
Hom bres
M ujeres

5,03
3,13

SD

1,71

1,68

M e d ia n o
SD
M

3,17
2,65

3 ,0 0
1,89

A lto
M

3,77
2 ,4 4

SD

2 ,7 7
1,65

Nota: Los estudiantes de ia categora de bajos ingresos ganaron menos de $6,00/hr; los estudiantes de la categora de
medianos ingresos ganaron entre $7,50 y $8,50/hr; los alumnos de la categora de altos ingresos ganaron ms de $10,00
la hora. Para cada casilla, n = 12. Slo fue significativo el efecto principal del sexo, p < 0,02.
Fuente: Desmarais, S. & Curts, J. (1997), tab. 1. Sexo y percepcin del ingreso merecido: prueba de los efectos del in
greso percibido. R e v is ta c ie n tfic a d e P s ic o lo g a S o c ia l y d e la P e r so n a lid a d [ J o u rn a l o f P e r so n a lity a n d S o c ia l
P sy ck o lo g y], 72, 141-150. Copyright, 1997, por la A sociacin Americana de Psicologa. Reimpreso con autorizacin.

Apndice del captulo: frmulas optativas de clculo


para el anlisis de varianza de dos criterios
Esta seccin proporciona las frmulas de clculo para un anlisis de varianza de dos criterios, que
no requieren el clculo de desvos para cada individuo. Al igual que las otras frmulas presenta
das en este captulo, slo se aplican cuando hay igual cantidad de participantes por casilla.
La frmula de clculo para la suma total de desvos cuadrticos es igual a la frmula 12-6 (y
la misma que para SC en la frmula 12-9).
sq .ot= X X 2 - 9 !

(13-26)

En la frmula anterior, XX2 es la suma de los cuadrados de todas las observaciones; (XX)2 es el
cuadrado de la suma de todas las observaciones, y N es la cantidad total de observaciones.
La frmula para el efecto intergrupal general tambin es igual a la anterior (frmula 12-7),
excepto que los subndices ahora se refieren a casillas en lugar de grupos.

f e + f e + ... ,(SJC0ln.of ( S * f
n
n'
n
N

Entre

(13-27)

En esta frmula, (ZK{)2 + (EX2)2


+ (XX^{tiraa)2 son los cuadrados de las sumas de las observa
ciones de cada casilla; n es la cantidad de participantes de cada casilla.
La suma de los cuadrados intragrupales es el total menos el intergrupal:
^Dentro = ^Total ^Entrc

( *^-28)

La frmula para la suma de los cuadrados de filas es una versin modificada de la frmula gene
ral de los intergrupales (13-27):
( XXFl]as 1 ) ( XXFijaSl

SC Filas
Fila

Fila

Fila

(13-29)

En la frmula anterior: (XXFilai)2, (XFUa2)2 .... (^ F iialttna)2 son ls cuadrados de las sumas de to
das las observaciones de cada fila; nRla es la cantidad de participantes en cada fila.
La frmula general intergrupal para columnas sigue el mismo principio:
(XXoiumnai) ^ (^Columna?)
S C C olu m n as

Columna

(sx0lolumna ltima
Columna

Columna

(xxy
V

(13-30)

Tabla 13-15.
Clculo de sumas de cuadrados para un anlisis de varianza de dos criterios basado en Blanchard
et al. (1991), utilizando frmulas de clculo. (Datos ficticios).

X*

19
24

36!
576
441
400
1.778

In flu en cia a n t i r r a c i s t a
XX
XX*
176
3.908

576
324
484
400
1.784

A u sen cia d e in flu e n c ia


XX
XX*
168
3 .5 5 4

16
17
72

324
441
256
289
1,310

A u sen cia no a n tirr a c ista


XX
XX*
136
2.352

240

4.872

X*
X
Influencia antirracista
25
625
20
400
23
529
576
24
C asilla X: 92
2 .1 3 0

21
20
84

A usen cia de influencia


484
22
361
19
484
22
441
21
1.770
C asilla X: 84

24
18

22
20
84

A u sen cia n o antirracista :


256
16
361
19
169
13
256
16
1.042
C asilla X: 64

18

21

4.942

C olum na X:24Q

Filas

M o d a lid a d d e
resp u esta p rivad a

M o d a lid a d d e
r esp u esta p b lica

Total XX = 4 8 0
Total XX* = 9 .8 1 4
^Total
s e *Entre

2 3 0 .4 0 0
A>iji
XXV
480*
----------= 9 . 8 1 4 - ' -------------- -- 9 .8 1 4 - 9 .6 0 0 =
S X X * - - 7 T ==9.814
24
24
92*
= __4, ,
4

84*
4

7 .0 5 6

8 .464
4

84*
84*
+ - . 4-.....
4
4

-- :4

-- +

480*

~4

7 .056
+ --------- :

72*

64*

4. 1...... 7 .0 5 6
-------- :

_
4 .0 9 6

' + ---------:-------+

5.184

2 3 0 .4 0 0

24

= 2, 116 + 1.764 + 1.764 + 1,764 + 1-024 + 1.296 - 9 .6 0 0 = 128


-^Dentro

S C * ,

- s c ^ - s c , Entre =
' 214-128 =
.

RFas

3 0 .9 7 6

( 'FM'
W + . . . + (Mm J - C W
N
n,Pilas
Filas

28 .2 2 4

.... 8 .....+ T

seColumnas

18.496
+

a x (Columna 1^ (^"^Coimnna 2y

12

240*
+

136a

24~

. ^ C o lu m n a

5 7 ,600

12

480*
24

= 3.872 + 3.528 + 2 .3 1 2 - 9 .6 0 0 = 112

. ( ^ C o lu m n a llintt'y
+ , . . i...............

480*

.800 + 4 .8 0 0 - 9 ,6 0 0 = 0

230 .4 0 0

176*

' 24

Columna

240*

86

(220*

5 7 .600

230.4 0 0

12

24

En la frmula anterior: (2XCo


)2, (XXCouIBna2)2
(XXColuroialtima)2 son los cuadrados de las
sumas de todas las observaciones ae cada columna; Co!timna es la cantidad de participantes de ca
da columna.
Finalmente, la suma de cuadrados para la interaccin se calcula sobre la bgse de lo que queda
despus de restar las sumas de cuadrados de filas y columnas a la suma general de cuadrados intergmpaes:
^Interaccin ^Bntre ^Filas ^Columnas
(13-31)
La tabla 13-15 muestra los clculos utilizando las frmulas anteriores para el clculo de las
sumas de los cuadrados del ejemplo que utiliza datos ficticios basados en el estudio de Blan
chard et. al. (1991). Compare esos clculos con los de la tabla 13-9, que aplica las frmulas de
definicin.

Apndice II del captulo: anlisis de varianza


de medidas repetidas de un criterio
Podemos realizar un anlisis de varianza de medidas repetidas de un criterio utilizando los proce
dimientos para ei anlisis de varianza de dos criterios, modificado en un aspecto crucial. Igual
que con un anlisis de varianza de dos criterios comn, tratamos los grupos (condiciones) como
factores, usualmente como columnas. La modificacin radica en las filas; en lugar de ser otros facto
res, son participantes. Es decir, hay un participante por fila y cada participante tiene un valor en
cada columna. Por lo tanto, las casillas tienen slo una observacin cada una.
La suma de los cuadrados de las columnas (el factor grupo de medidas repetidas) ser la mis
ma que calculamos comnmente. Ser el numerador en el anlisis de varianza. Sin embargo, no
podemos utilizar la variacin dentro de la casilla como denominador. Precisamente porque no
existe variacin dentro de la casilla! Hay una sla observacin por casilla, y no puede existir nin
guna variacin con una sola observacin. En su lugar, el denominador se basa en la suma de cua
drados de la interaccin. La suma de valores de la interaccin tambin se calcula de la forma
acostumbrada. Se basa en el desvo que queda despus de restar los otros desvos. En este caso,
son los desvos que quedan despus de restar los desvos intergupales de las columnas (el factor
grupo) e intergrupales de las filas (de los participantes). No restamos los desvos intragrupales de
las casillas, ya que con una observacin por casilla no hay nada que restar en ese caso. El impac
to de todo este procedimiento es que el trmino por el cual realizamos la divisin, es decir, el de
nominador, no incluye la variacin entre participantes (la variacin de fila). El denominador es
menor y, por lo tanto, es probable que el F sea mayor.
En resumen, el procedimiento para calcular un anlisis de varianza de medidas repetidas es el
siguiente:
1. Colocar los nombres de los grupos de observaciones en la parte superior (el factor de me
didas repetidas) y destinar una fila para cada participante.
2. Calcular de la forma acostumbrada las sumas de los cuadrados correspondientes al total
(desvos cuadrticos de cada observacin con respecto a la gran media), a las columnas (desvos
cuadrticos de la media de la columna de cada registro con respecto a la gran media) y a las filas
(desvos cuadrticos de la media de la fila de cada observacin con respecto a la gran media). Ca
be destacar que al calcular la suma de los cuadrados de las filas, las medias de las filas son iguales
al valor medio de cada participante.

3. C alcular ia suma de los cuadrados correspondiente aJa interaccin, calculando eJ desvo de


cada observacin como su desvo con respecto a ia gran media menos el desvo de la media de su
columna con respecto a la gran media y menos el desvo de la media de su fila con respecto a la
gran media.
4. Calcular de la forma acostumbrada los grados de libertad correspondientes a las columnas
(la cantidad de columnas menos 1), a las filas (cantidad de filas menos 1) y a la interaccin (canti
dad de casillas menos los grados de libertad de las filas y las colum nas, menos 1).
5. Calcular de la forma acostumbrada los cuadrados medios (las estimaciones de varanza po~
blacional) correspondientes a las columnas y a la interaccin. E n el caso de las columnas, im plica la
suma de cuadrados de columnas dividida por los grados de libertad de las columnas; en el caso de la
interaccin, im plica la suma de cuadrados de interaccin dividida por los grados de libertad de la in
teraccin. Cabe destacar que no calculamos la estimacin de vaiianza poblacional basada en las fi
las debido a que sera la varanza entre participantes, que no es de nuestro inters.
6. Calcular la razn F p a ra el efecto de medidas repetidas. D ivid ir el cuadrado medio corres
pondiente a las columnas por el cuadrado medio correspondiente a la interaccin.
7. Comparar el F con el punto F de corte basndose en los grados de libertad del numerador
(colum nas) y del denominador (interaccin) adecuados.
L a tabla 13-16 indica las observaciones, clculos y una tabla de anlisis de varanza, para un
anlisis de varanza de medidas repetidas correspondiente a un ejemplo ficticio. E l ejemplo utiliza
do es un estudio de errores al reconocer una slaba inserta en uno de tres diferentes tipos de palabras:
una palabra fam iliar, una palabra no fam iliar, o un sonido que no es una palabra. (Supondremos que
cada tipo de palabra es presentado 30 veces de forma tal que haya un mnimo de 0 errores y un m
ximo de 30). Lo s participantes son cuatro.

Tabla 13-16.
Anlisis de varianza de medidas repetidas de un criterio sobre un estudio de errores de
reconocimiento por parte de cuatro participantes al ser expuestos cada uno a slabas objetivo
insertas en palabras familiares, no familiares y sonidos que no forman palabras. (Batos ficticios).
I
M e d id a : c a n t id a d d e e r r o r e s
T ip o d e p a la b r a
P a la b r a
f a m i lia r

Participante
A

9
6

B
C
D

X
M

11
10

2
6
5

36
9

16
4

F ila

S o n id o
n o p a la b r a

P a la b r a
n o f a m i lia r

0
1
4

12

9
21
18

3
7
6

8
2
GM = 5

D e s v o s c u a d r r te o s c o n r e s p e c to a la g r a n m e d ia
P a r tic ip a n te

P a la b r a f a m ilia r
X

C ol

16

fil

A
B
C
D

1
36
25

16
16
16
16

1
4
4
1

78

64

10

SCm

P a la b r a n o f a m ilia r
In t

C ol

1
0
0

4
9
1
0

1
1
1
.1 ,

14

S o n id o n o p a la b r a

In t

Col

0
0
0
0

25
16
1
4

9
9
9
9

1
4
4
1

1
1
0
0

10

46

36

10

fil

1
4
4

= 78 + 14 + 4 6 = 138

^Columnas" 6 4 + 4 + 3 6 ~ 104
SCm s
= 1 0 + 1 0 + 1 0 = 30
^Interaccin^ 2 +

0+

2=

Control: S C ^ = 5C CoIomnas +

8^tcu

= 104 + 3 0 + 4 = 138

12- 1 = 11

^Columnas

3 ~ 1 *

b .

4~ = 3

^Interaccin" H 2 3 = 6
Control:

= gl&iumnas + g /Fiias + gln(erKcin = 2 + 3 + 6 = 11

Punto de corte F para el efecto de medidas repetidas (colum nas) (gl 2 ,6 ; p < 0 ,0 5 ): 5 , 4
T abla d el a n lisis d e v a ria n za

Fuente

SC

gl

CM

C ondicion es intergrupales (colum nas) 104


Participantes (filas)
30
Error (Interaccin)
4
Total
138

2
3
6
11

52

C onclusin: S e rechaza la hiptesis nula, .

0,67

F
77,6

f il

In t

Pruebas
chi-cuadado

Descripcin del captulo

'

El estadstico chi-cudrad y la prueba ' Controversias y limitaciones.


chi-cuadrado de bondad de ajust?.
. > Pruebas chi-cadrdo segn se described
Prueba chi-cuadrado de independencia.
en publicaciones cientficas.

^ Supuestos d !a$ pruebas chi-cuadrado.


( Resumen.
tamao del efecto y potencia en la: , . ^ Trminos clave;
prueba chi-cuadrado de independencia.,
Ejercicios^

n este captulo analizamos los procedimientos de prueba de hiptesis con variables


cuyos valores son categoras, tales como preferencias religiosas o color de pelo. Los
procedimientos.a los que nos referimos se concentran en la cantidad de personas de
las diferentes categoras ms que en la media de alguna dimensin.

Ejemplo

Analicem os un ejemplo. Harter et al. (1997) estaban interesados en tres estilos de relaciones amo
rosas: un estilo autnomo concentrado en s m ism o, un estilo de relacin en el que la atencin es
t puesto en el otro, y un estilo de mutua reciprocidad. Para reunir inform acin acerca de los
estilos mencionados, realizaron una encuesta por medio de peridicos con tems que evaluaban
tanto los estilos de aquellos que respondan como la percepcin de aquellos que respondan con
respecto al estilo de sus parejas. Una de las predicciones del investigador estableca que los hom
bres que se describan a s mism os como autnomos y concentrados en s mismos casi segura
mente describiran a sus parejas como personas que ponan su atencin en el otro.
Harter y sus colegas descubrieron lo siguiente. D e los 101 hombres en su estudio que se des
cribieron como autnomos concentrados en s m ism os, el 49,5% (50 hombres) informaron el ti
po de pareja predicha, comparado con el 25,5% (26 hombres) que informaron tener parejas
autnomas concentradas en s mismas y el 24,5% (25 hombres) que informaron tener parejas con
el estilo de reciprocidad.: (p. 156)
Supongamos que las parejas de estos hombres hubieran tenido las mismas probabilidades de
tener cada uno de los tres estilos de relacin. S i ese fuera el caso, entonces aproximadamente
33,66 (1/3 de los 101) de las parejas de estos hombres deberan haber pertenecido a cada uno de
los tres estilos diferentes. L a inform acin que estamos manejando aparece en la segunda y terce
ra columna de la tabla 14-1. L a segunda columna (frecuencia observada) indica el detalle de los
estilos de relacin de pareja realmente observados, y la tercera columna (frecuencia esperada)
indica el detalle que se esperara si los diferentes estilos de pareja hubieran tenido exactamente la
misma probabilidad de ocurrir.

T a b la 1 4 -1 .

Frecuencias observadas y esperadas de los estilos de relacin de las parejas de hombres autnomos
concentrados en s mismos.

Estilo
de pareja

Frecuencia Frecuencia
observada1 esperada Diferencia
(O )
(E)
iO-B)

Relacin con el centro de atencin


puesto en el otro
Autnomo concentrado en s mismo
D e reciprocidad

50
26
25

33,67
33,67
33,67

16,33
-7,67
-8,67

Diferencia
cuadrtica
(O -E f

Diferencia
cuadrtica
ponderada segn la
frecuencia esperada
( 0 - E)2E

266,67
58,83
75,17

7,92
1,75
2,23

aFuente: Harter et ai. (1997).

Queda claro que existe una diferencia entre lo que realmente se observ y el detalle de lo que se
hubiera esperado si los estilos fueran igualmente probables. L a cuestin es la siguiente: Debera
mos suponer que la discrepancia observada no es ms que la que esperaramos slo por casuali
dad en una muestra de este tamao? Supongamos que las m ujeres de los tres estilos tienen las
mismas probabilidades de ser parejas de los hombres concentrados en s mism os en general (la
poblacin). Aun as, en cualquier muestra en particular tomada de esa poblacin no esperaramos
que las com posiciones de los estilos de parejas fueran perfectamente iguales. Pero si la composi
cin de la muestra est muy lejos de ser pareja, dudaramos de que las com posiciones de los esti
los de pareja en la poblacin fueran realmente iguales. E n otras palabras, tenemos una situacin
de prueba de hiptesis muy parecida a la que hemos estado considerando hasta ahora, aunque con
una diferencia importante.
E n las situaciones descriptas en captulos anteriores, los valores observados siem pre han sido
valores numricos referidos a alguna dimensin, como por ejemplo, una puntuacin en una prue
ba estndar de evaluacin de nivel, de la duracin de una relacin, la calificacin de la efectividad
de un empleado por parte del empleador en una escala de 9 puntos, la cantidad de errores en la
identificacin de palabras, y as sucesivamente. Por el contrario, ei estilo de relacin de pareja de
un hombre es un ejemplo de lo que en el captulo 1 denominamos v ariab le nom inal (o variable
categrica). Una variable nominal es aquella en la que la inform acin es la cantidad de personas
en cada categora. (Se denominan variables nominales porque las diferentes categoras o niveles
de la variable se identifican con nombres en lugar de nmeros).
L a prueba de hiptesis con variables nominales es una de las denominadas pruebas chi-cua
drado.1 L a s pruebas chi-cuadrado fueron desarrolladas originalmente por K arl Pearson (vase
cuadro 14-1).

EL ESTADSTICO CHI-CUADRADO
Y LA PRUEBA CHI-CUAPRAPO DE BONDAD DE AJUSTE_________ _

L a idea bsica de cualquier prueba chi-cuadrado es que se compara la forma con que el esquema
de reparticin observado de personas en varias categoras se ajusta a un esquema esperado (como

1Chi es la letra griega x; se pronuncia ca.

' ^ v ' ' ;

y ' yy .

-,

Karl Pearson, inventor dei chi-cuadrato y chro de controversias.


' ' 1 41" ~f * \

^ ^

'5 't ^

t t

-I

n>f

K a rl Pearson, hijo de un abogado .de Yorkshire, naci en el ao 1857. Pearson es mu


chas veces aclamado como e l fundador de .
la s ciencia estadstica. L a m ayora de sus
;virtudes y de sus vicios se reveln en lo que
l relat a su colega Ju lia Bell- como sus
pm ros recurds: estaba sentado en su
sillita alfa, con el pulgar en la boca, cuando .
le dijerph que dejara de hacerlo o si no su
pulgar iba a desaparecer. Pearson mir sus .
.dos pulgares y silenciosam ente concluy:
No veo que el pulgar que me llevo a la bo
ca sea para nada ms pequeo que el Otro;
me pregunto s me estarn mintiendo/ Lo
anterior refleja la confianza que Pearson te
na en s mismo y en las pruebas obtenidas
por la observacin, corno tambin su ne
gacin a la autoridad. Tam bin podemos
\ observar su tendencia a dudar del carcter
de las personas con quienes no estaba de
acuerdo.
Pearson estudi matemtica gracias a
: una beca qn Cambridge. Poco despus de in
gresar, pidi que s lo excusara de las clases
obHgatrias. de teologa y del servicio reli
gioso. Sin embarg, en cuanto accedieron a
su pedido, Pearson asisti al servicio reli
gioso. E l decano lo convoc para que le die
ra uiia explicacin, y Pearson declar que no
haba pedido que s lo excusara del servicio
religioso, sino del servicio religioso obli
gatorio!
.
Despus d graduarse, Pearson viaj y
estudi en Alem ania, donde practic la
doctrina socialista y, como l mismo lo'des
criba, se convirti en un libre pensador .
A l regresar a Inglaterra, elabor un trabajo
escrito bajo un seudnimo, en el que ataca
ba a la cristiandad, y en 1885 fund un club
de hombres y mujeres para promover la dis
cusin de las relaciones entre los sexos. E l

'

'

-n

t,

club desapareci, pero gracias a l conoci


a su esposa, M ara 3harp,;
: Pqarson finalmente se volc a la esta- ;
dstica debido a su inters por probar la
teora de; la evolucin, y adems estaba especialment influenciado por la.obra de S ir . :
. Franis Galton (vase cuadro 3-1). P e a r-. :
son, qu era mejor matemtico, vio en las ;
; ideas de correlacin de Galton, una form a',
de .convertir la psicologa, la antropologa y .
: la sociologa en campos tan cientficos
co-
'
mo lo eran la fsica y la qum ica. Esperaba' \
/ evitar la cuestin de la causalidad a travs y
de la utilizacin de esta categora ms am- '
pita de correlacin, asociacin, o contin
gencia (con un rango de , independencia,
a 1 unidad de causalidad . Ningn fen
meno es causal -expres. Todos los fe
nmenos son contingentes, y el problema :
.y que enfrentrnosles el.pe medir el grado de .
contingencia. /
/yT y.y;/ yf;
. Durante toda su vida, Pearson fue muy 1
controvertido y tuvoduna fuerte voluntad,
especialmente citando se. trataba d. seudo y
. ciericial y d la mscafada d Ja teologa, la ..:
. m etafsica o las apelaciones' la utrjdad. y
i bajo el pretexto d la ciencia. Incluso pensapa que 1 fsica; deba dejar d utilizar p a -.
' labras como tm , lueirzaL
m ateria
porque neran fetaenos obsrVabesl
L a m ayor parl d su investigacin, en' tre 1893 y 1901, se concentr en las leyes .
de la herencia y la evolucin, pr necsi,taba m ejores mtodos estadsticos para rea
liza r su trabajo. Entonces s volc a otros
temas, realizando finalmente su: nis faino- ;
sa contribuin, la prueba chi-cuadrado.
Pearson tambin invent, el mtodo de
clculo d la correlacin utilizado en la ac
tualidad (vase captulo 3), y acu los tr-,;
minos histogram a, a sim e tra jj^ rre la ci n

esp u ria. Cuando, sinti quedas revistas es


pecializadas en biologa no apreciaban ade
cuadamente su trabajo, fund la fam osa. .
revista especializada en estadstica, llam a
da Biomtrxi. Durante su vida. Pearson
llev la estadstica de la situacin de mate
ria ampliamente ignorada a una posicin
prim ordial para el mtodo cientfico, espe
cialmente en las ciencias naturales.
Lamentablemente, Pearson era fanti
co de la eugenesia, el perfeccionamiento
de la raza humana a travs de la reproduc
cin selectiva y, ms tarde, su obra fue uti
lizada por los nazis como justificacin de
su trato a los judos y otras m inoras tni
cas. Pero a medida que Pearson envejeca,
sus opiniones enfrentaron fuerte resistencia
y mucho descrdito por parte de otros esta
dsticos ms jvenes, lo que slo sirvi pa
ra poner a Pearson en contra de cada vez
una m ayor cantidad de colegas.

D e hecho, a lo largo de su vida, Pear


son fue un hom.bre que provoc amistades
devotas, o, por el contrario, profunda- averi)
sin. W illiam S. Gosst {vase cuadro 9-1),
el inventor de la prueba t, fue uno de sus.
amigos. S ir Ronald Fisher, inventor- del;
anlisis de varianza y hombre relacionado'
con actitudes an ms extremas (como las;,
descriptas en el cuadro 11-1), fue uno d
los peores enemigos de Pearson (y; el ana-.
ble, pacfico Gosset, amigo de ambos, estaba:
siempre intentando suavizar ios problemas
entr ellos). E n 1933, Pearson finalmente
se. retir, y fue Fisher, nada m enos, quin
tom su lugar en la ctedra de Eugenesia d :
Galton en la Universidad d Londres: ' Erb
1936, los dos comenzaron su ms punzante '. 'i
discusin; Pearson m uri'ese mismo ao.

R e fe r e n c ia s : Pe ters ( 1987); S tiglen ( 986) ^ [


Tankara(1984).
; -ri

por ejem plo, un esquema de reparticin uniforme). Con respecto al ejemplo acerca del estilo de
relacin, estamos comparando el esquema observado de 50, 26 y 25 con el esquema de reparticin
esperado de aproximadamente 34 (33,67) para cada estilo. Un esquema de reparticin de la canti
dad de personas esperadas en cada categora es, en realidad, una distribucin de frecuencias como
las que aprendimos en el captulo 1. Por lo tanto, una prueba chi-cuadrado se describe ms for
malmente como la comparacin de una distribucin de frecuencias observadas con una distribu
cin de frecuencias esperadas. E n general, la prueba de hiptesis im plica, primero, calcular las
discrepancias entre las frecuencias observadas y las frecuencias esperadas y, despus, observar
si esas discrepancias son mayores de lo que se esperara por casualidad.
Em pecem os analizando de qu modo encontramos esa discrepancia entre las frecuencias ob
servadas y esperadas. L a discrepancia entre lo observado y lo esperado en cualquier categora es
simplemente la frecuencia observada menos la frecuencia esperada. Por ejem plo, veamos nueva
mente el estudio de Harter et al. Con respecto a los hombres con parejas concentradas en el otro,
la frecuencia observada de 50 es 16,33 puntos mayor de la frecuencia esperada de 33,67 (no debe
mos olvidar que la frecuencia esperada es 1/3 de 101). E n la segunda categora, la diferencia es
-7 ,6 7 , y en la tercera -8,67. L a s diferencias mencionadas aparecen en la cuarta columna (D ife
rencia) de la tabla 14-1.
L a s diferencias no se utilizan directamente ya que algunas son positivas y otras negativas y,
por lo tanto, se cancelaran entre s. Este problema se resuelve elevando cada diferencia al cuadra
do. (Se trata de la misma estrategia que vim os en el captulo 2 cuando trabajamos con las diferen
cias de valores observados al calcular la varianza). E n el ejemplo acerca del estilo de relacin, la

diferencia cuadrtica correspondiente a parejas concentradas en el otro es de 13,33 al cuadrado, o


266,67; en el caso de las parejas concentradas en s m ism as, es de 58,83; y en el caso de las pare
ja s con estilo de reciprocidad, 75,17. Estas diferencias cuadrticas aparecen en la quinta columna
de la tabla 14-1.
E n el ejemplo de Harter et al., las frecuencias esperadas son las m ism as en todas las catego
ras. Pero en otras investigaciones, las frecuencias esperadas para las diferentes categoras pue
den no ser iguales. L a diferencia efectiva entre lo observado y lo esperado tiene diferente
im portancia segn el tamao de la frecuencia esperada. Por ejemplo, una diferencia de 8 perso
nas, entre lo observado y lo esperado, es una discrepancia mucho m ayor si la frecuencia espera
da es 10 que si lo esperado es 1,000. S i la frecuencia esperada es 10, una diferencia de 8
significara que la frecuencia observada fue de a 18 de 2, frecuencias tajantemente diferentes
de 10. Pero s la frecuencia esperada es 1.000, una diferencia de 8 es slo una leve desigualdad.
Significara que la frecuencia observada fue de 1.008 6 de 992, frecuencias que son slo leve
mente diferentes de 1.000.
Cm o obtenemos un nmero adecuado de discrepancia (la diferencia cuadrtica) entre lo
observado y lo esperado con respecto a una categora en particular? L o que necesitamos hacer es
adaptar o ponderar la desigualdad de modo tal de tener en cuenta la frecuencia esperada para esa
categora. Lo anterior se logra simplemente dividiendo la diferencia cuadrtica de una categora
por la frecuencia esperada para esa categora. Entonces, si la frecuencia esperada para determina
da categora es 10, dividim os,la diferencia cuadrtica por 10, S i la frecuencia esperada para la ca
tegora es 1.000, dividim os la diferencia cuadrtica por 1.000. De ese modo, ponderamos cada
diferencia cuadrtica segn ia frecuencia esperada. Esta ponderacin ubica la diferencia cuadrti
ca en una escala comparativa ms adecuada.
Volvamos al ejemplo que analizbamos. E n el caso de los hombres con parejas concentradas
en el otro, ponderaramos la desigualdad dividiendo a diferencia cuadrtica de 266,67 por 33,67,
y el resultado sera 7,92. E n el caso de aquellos con parejas concentradas en s m ism as, 58,83
dividido 33,67 da 1,75; y en el caso de ios hombres con parejas con estilo de reciprocidad, 75,17 d ivi
dido 33,67 da 2,23. Las desigualdades ajustadas (diferencias cuadrticas divididas por las fre
cuencias esperadas) aparecen en la ltim a columna de la tabla 14-1.
Lo que resta es obtener un nmero general de discrepancia entre las frecuencias observadas y
esperadas. Este ltim o paso se realiza sumando los resultados de todas las categoras. E s decir, to
mamos el resultado de la diferencia cuadrtica dividida por la frecuencia esperada de la primera
categora, sumamos el resultado de la diferencia cuadrtica dividida por la frecuencia esperada de
la segunda categora, y as sucesivamente. En el ejemplo de Harter et al. sera igual a 7,92 ms
1,75 ms 2,23, y dara un total de 11,90.
E l nmero final (la suma de las diferencias cuadrticas ponderadas) es un indicador general
de la discrepancia entre las frecuencias esperadas y observadas. Esa cantidad se denomina esta
dstico chi-cuadrado. Se expresa bajo la frmula,

En la frmula anterior, x2es estadstico chi-cuadrado. S es el signo de suma, que ndica que de
bemos sumar todas las categoras distintas. O es la frecuencia observada de una categora (la can
tidad de personas realmente encontradas en esa categora a travs del estudio). E es la frecuencia
esperada de una categora (en el ejemplo que analizam os, se basa en lo que esperaramos si hubie
ra la m ism a cantidad en todas las categoras).

Aplicando la frmula ai ejemplo de Harter et al.,

2 ^(O-E)2 (50~*33,67)2 , (26-~33,67)2 >(25~33,67)2 tl


E
33,67
33,67
33,67

Resumen de los pasos a seguir para e! clculo del estadstico chi-cuadrado


1. Encontrar las frecuencias observadas, reales, de cada categora.
2. Determ inar las frecuencias esperadas para cada categora.
3. Calcu lar las frecuencias observadas menos las esperadas para cada categora.
4. Elevar al cuadrado las diferencias de cada categora.
5. D ivid ir cada diferencia cuadrtica por la frecuencia esperada para cada categora.
6. Sumar los resultados del paso 5 de todas las categoras.

La distribucin chi-cuadrado
E l siguiente paso es averiguar si el estadstico chi-cuadrado que hemos calculado representa una
discrepancia mayor a la que podra ocurrir por casualidad. Para responder esta pregunta necesita
mos saber cules son las probabilidades de que el chi-cuadrado tome valores de distintos interva
los por casualidad. E s decir, necesitamos la distribucin del estadstico chi-cuadrado que
ocurrira por casualidad. Sucede que siempre que el estudio tenga una cantidad razonable de per
sonas, la distribucin del estadstico chi-cuadrado es bastante prxim a a una distribucin mate
mtica conocida que se denomina, por supuesto, distribucincbi-cuadrado.
L a manera exacta de la distribucin chi-cuadrado depende de los grados de libertad. En una
prueba chi-cuadrado, los grados de libertad son la cantidad de categoras que son libres de variar
en cuanto a sus frecuencias, dndose como conocido el total de participantes. E n el ejemplo acer
ca del estilo de relacin hay tres categoras. S i conocemos la cantidad total de personas y tambin
sabemos la cantidad que corresponde a dos de las categoras, automticamente podemos calcular
la cantidad de participantes en la tercera categora. E n un estudio como el del ejemplo que esta
mos analizando, si hay tres categoras, hay dos grados de libertad.
L a figura 14-1 indica las distribuciones chi-cuadrado para varios grados de libertad. Segn se
observa en la figura, las distribuciones son todas asim tricas hacia la derecha. Esto se debe a que
el ch-cuadrado no puede ser menor a 0, pero puede tener valores muy altos. (E l chi-cuadrado de
be ser positivo porque se calcula sumando un grupo de fracciones en las que el numerador y el de
nominador deben ser todos positivos. E l numerador necesariamente es positivo porque est
elevado al cuadrado, y el denominador necesariamente es positivo porque la cantidad de personas
esperadas en determinada categora no puede ser negativa, no se puede esperar que haya menos
que ninguna persona!).

La tabla chi-cuadrado
Lo ms importante acerca de la distribucin chi-cuadrado para una prueba de hiptesis es el pun
to de corte que indica que un chi-cuadrado es lo suficientemente grande como para rechazar la hi
ptesis nula. Por ejemplo, supongamos que queremos utilizar el nivel de significacin de 0,05. En
ese caso, necesitamos saber qu punto de la distribucin chi-cuadrado tiene el 5% de los chi-cuadrados por encima de s mismo. Una tablachi-cuadradoproporciona los puntos de corte para los dis
tintos niveles de significacin y para varios grados de libertad. L a tabla 14-2 muestra una parte de
una tabla chi-cuadrado como la que aparece en el apndice B (tabla B -4). Analicem os el ejemplo

referido al estilo de relacin, en el que haba dos grados de libertad. L a tabla muestra que el pun
to de corte ch-cuadrado para un nivel de 0,05, utilizando una distribucin chi-cuadrado con 2
grados de libertad, es 5,992.
La prueba chi-cuad rad o de bondad de ajuste
Ahora contamos con toda la inform acin necesaria para probar la hiptesis en el ejemplo de H ar
ter et al. Cabe recordar que el chi-cuadrado que calculam os para el ejemplo era de 11,90. Adem s,
acabamos de encontrar el punto de corte correspondiente al ejemplo (utilizando el nivel 0,05 de
significacin), que es de 5,992. Comparando los dos nmeros mencionados anteriormente, el
chi-cuadrado del estudio es claramente superior al punto de corte. Por lo tanto, los investigadores
que realizaron el estudio rechazaron la hiptesis nula, es decir, la rechazaron por considerar de
masiado improbable que la discrepancia que observaron pudiera haber ocurrido si, de hecho, la
poblacin de hombres concentrados en s mism os tuviera una cantidad igual de parejas de cada
estilo de relacin. Pareca, ms razonable sostener que los estilos de relacin de las parejas de ese
tipo de hombres eran realmente diferentes.
Acabamos de realizar un procedimiento de prueba de hiptesis completo del ejemplo de H ar
ter et al. E l ejemplo inclua diferentes cantidades de personas en tres niveles de una determinada
variable nominal (el estilo de relacin de las parejas de hombres concentrados en s m ism os). E s
te tipo de pruebas chi-cuadrado, que incluye niveles de una sola variable nominal, se denomina
prueba chi-cuadrado de bondad de ajuste. (M s adelante, en el captulo, analizaremos situa
ciones que incluyen ms de una variable nominal a la vez).

Pasos de ia prueba de hip tesis: ejem plo


Reveamos el proceso de realizacin de una prueba chi-cuadrado de bondad de ajuste. U tilizare
mos el mismo ejemplo, pero esta vez seguiremos sistemticamente los cinco pasos estndar. A lo
largo del proceso, tambin analizaremos algunos detalles.
1.
R ep lan tear el problem a en funcin de hiptesis de investigacin e hiptesis n u la de las
poblaciones. Las dos poblaciones son:
Poblacin X: hombres concentrados en s mismos como los que intervienen en el estudio.
Poblacin 2: hombres concentrados en s mismos cuyas parejas pertenecen en igual cantidad
a los tres estilos de relaciones.

Figura 14-1.
Ejemplos d e d istrib u cio n es chi-cuad rad o para diferen tes grados de libertad.

Tabla 14-2.
P a rte de una tabla chi-cu ad rad o.
N iv el d e sign ificacin
Si
i
2

3
4
5

0 ,1 0
2 ,7 0 6
4,6 0 5
6 ,2 5 2
7 ,7 8 0
9 ,2 3 7

0,05
3,841
5,992
7,815
9,488
11,071

0,01
6,635
9,211
11,345
13,277
15,087

L a hiptesis de investigacin establece que la distribucin de las personas en las categoras de las
dos poblaciones es diferente; la hiptesis nula establece que es igual.
2. D eterm in ar la s caractersticas de !a d istrib ucin com parativa. L a distribucin compa
rativa en este caso es una distribucin chi-cuadrado con dos grados de libertad. (U na vez que co
nocemos el total, slo las cantidades en dos categoras pueden variar libremente).
E s importante no confundimos con la terminologa. L a distribucin comparativa es la distri
bucin con la que comparamos el nmero que resume todo el patrn del resultado. Con una prue
ba t, este nmero es el punto , y utilizam os una distribucin t. Con un anlisis de varianza, es la
razn F, y utilizam os una distribucin F. D el mismo modo, con una prueba chi-cuadrado, la dis
tribucin es una distribucin chi-cuadrado.
Decim os que puede surgir cierta confusin, ya que al preparamos para utilizar la distribucin
chi-cuadrado comparamos una distribucin de frecuencias observadas con una distribucin de
frecuencias esperadas. Pero la distribucin de frecuencias esperadas no es una distribucin com
parativa en el sentido en el que utilizam os ese trmino en el paso 2 de la prueba de hiptesis.
3. D eterm in ar el punto de corte en la distrib ucin co m p arativa, a p a rtir del cu al debera
rechazarse la hiptesis n u la. Buscamos el punto de corte en la tabla chi-cuadrado segn el nivel
de significacin y los grados de libertad del estudio. E n este caso, utilizam os el nivel 0,05 de sig
nificacin y determinamos, en el paso 2, que haba 2 grados de libertad. Basndonos en la tabla,
el chi-cuadrado de corte es igual a 5,992.
4, D eterm in ar el valo r m uestral en la distrib ucin com parativa. E l valor muestral es el
chi-cuadrado calculado a partir de la muestra. En otras palabras, este es el paso en el que se reali
zan todos los clculos; es decir, para cada categora necesitam os calcular las frecuencias espera
das, las diferencias entre las frecuencias esperadas y observadas elevadas al cuadrado, y dividir
ese resultado por la frecuencia esperada. Sumando los resultados de todos estos clculos para ca
da categora obtenemos el chi-cuadrado del estudio. E n el ejemplo que estamos utilizando el re
sultado es 11,90.
5, Com parar los valores obtenidos en los pasos 3 y 4 para decidir s se rechaza o no la hipte
sis nula. Dado que el punto de corte para rechazar la hiptesis nula es 5,992 y el chi-cuadrado de
nuestra muestra es 11,90, podemos rechazar la hiptesis nula. Se sostiene la hiptesis de investi
gacin que establece que las dos poblaciones son diferentes. E s decir, los investigadores conclu
yen que las parejas de hombres concentrados en s mismos no tienen las mismas probabilidades
de presentar los tres estilos de relacin.
'

Otro ejemplo
Analicem os otro ejemplo. Un equipo de investigacin ficticio formado por psiclogos clnicos
desea probar una teora que establece que la salud mental se ve afectada por el nivel de cierto m i
neral incluido en la dieta alim enticia. A l m ineral lo llamaremos Q. E l equip4de investigacin ha
localizado una regin de los Estados Unidos cuyo suelo presenta una alta concentracin del mine
ral Q y, debido a ello, ese mineral se encuentra en el agua que las personas consumen y en los ali
mentos que se siembran en el lugar. L o s investigadores realizan una encuesta a personas mayores
que han vivido toda su vida en esa rea, concentrndose en los trastornos de la salud mental. De
las 1.000 personas entrevistadas, 134 haban experimentado en algn momento de su vida un tras
torno relacionado con la angustia, 160 haban sufrido alcoholism o o drogadiccin, 97 trastornos
de estados anm icos (tales como depresin crnica) y 12 haban sufrido esquizofrenia; 597 nunca
haban experimentado ninguno de los problemas anteriores. (E n este ejemplo, ignoraremos lo que
ocurre cuando una persona ha sufrido ms de uno de los trastornos).
Los psiclogos compararon los resultados con lo que se esperara sobre la base de una gran
encuesta realizada al pblico en general de los Estados Unidos. En esa encuesta, el 14,6% de los
adultos en algn momento de sus vidas sufre de trastornos relacionados con la angustia, e 16,4%
padece alcoholism o y drogadiccin, el 8,3% sufre trastornos del estado anm ico y el 1,5% padece
esquizofrenia, mientras que el 59,2% no experimenta ninguno de esos trastornos (Regier et a i,
1984), S i la muestra de 1.000 no es diferente de la poblacin general de Estados Unidos, el 14,6%
de ellos (146) deberan haber sufrido trastornos relacionados con la angustia, el 16,4% (164) de
beran haber padecido alcoholism o y drogadiccin, y as sucesivamente. L a cuestin planteada
por los psiclogos clnicos es la siguiente: sobre la base de la muestra que hemos estudiado, po
demos concluir que los porcentajes de los diferentes problemas mentales sufridos por las perso
nas de esta regin son diferentes a los de la poblacin de los e e . u u . en general?
L a tabla 14-3 indica las frecuencias observadas y esperadas y los clculos de la prueba ehicuadrado.

1. Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de las


poblaciones. L a s dos poblaciones son:
Poblacin 1: l a s p e r s o n a s
Poblacin 2: l a p o b l a c i n

d e la r e g i n d e
de

e e .u u

e e .u u

. c o n a lto n iv e l d e l m in e r a l

Q.

L a hiptesis de investigacin establece que la distribucin de cantidades de personas, entre las


cinco categoras de salud mental, es diferente en las dos poblaciones; la hiptesis nula establece
que es igual.
2. Determinar las caractersticas de la distribucin comparativa. L a distribucin compa
rativa es una distribucin chi-cuadrado con 4 grados de libertad (es decir, 5 categoras - 1 = 4).

3. Determinar el punto de corte en ia distribucin comparativa, a partir del cual debera


rechazarse la hiptesis nula. Utilizarem os el nivel de significacin estndar del 5% , y hay, se
gn vim os, 4 grados de libertad. Por lo tanto, la tabla 14-2 (o la tabla B~4 del apndice B ) indica
que los psiclogos clnicos necesitan un chi-cuadrado de al menos 9,488 para rechazar la hipte
sis nula. L a figura 14-2 representa la situacin grficamente.
4. D eterm in ar el valo r m u estral en la d istrib u ci n com p arativa. L a tabla 14-3 indica
ios clculos del chi-cuadrado. Se sigue e! procedimiento usual: encontrar la diferencia entre las
frecuencias observadas y esperadas de cada categora, elevarlas al cuadrado, d ividir cada una
por' la cantidad esperada para cada categora, y luego sum ar los resultados de las distintas cate
goras. E l resultado es un chi-cuadrado de 4,09.

'Babia 14-3,
Frecuencias observadas y esperadas y prueba chi-cuadrado de la bondad de ajuste de distintos tipos
de trastornos de la salud mental en una regin de EEUU con alto nivel d el m ineral Q, comparada con
la poblacin de e e . u u . en general. (Datos ficticios).
C o n d ici n

O b se rv a d a

A ngustia
A lcoh olism o y drogadiccin
Trastornos del estado anm ico
Esquizofrenia
N inguna de las anteriores

E sp e r a d a

134
160
97
12
597

146 (14,6%
16 4 (1 6 ,4 %
83 ( 8,3%
15 ( 1,5%
592 (59,2%

X
X
X
X
X

1.000)
1.000)
1.000)
1.000)
1.000)

Grados de libertad = 5 categoras - 1 = 4


Punto de corte chi-cuadrado necesario, g l = 4 , nivel 0 ,0 5 :9 ,4 8 8
,

{O -E f

(1 3 4 - 1 4 6 ) *

146

164

.. -12* t -4*
~ 146

(1 6 0 - 1 6 4 ) *

164

(9 7 - 83)*

(1 2 -1 5 )*

(5 9 7 -5 9 2 )*

83

15

592

14* ; -3* t

5* _

144

16

196

25

83

592 ~

146

164

83

15

592

15

= 0,99 + 0 ,1 0 + 2 ,3 6 + 0,60 + 0,04 = 4,09


Conclusin: no se rechaza la hiptesis nula.

5.
C o m p a rar los valores de los pasos 3 y 4 p ara d ecid ir si se rechaza o no la hiptesis nu
la . E l chi-cuadrado de 4,09 es mucho menos extremo que el punto de corte de 9,488 {vase figura
14-2). Lo s investigadores no pueden rechazar la hiptesis nula; el estudio no es concluyente. (No
habiendo podido rechazar la hiptesis nula con una muestra tan grande, es razonable suponer que
s i existe alguna diferencia entre las poblaciones, esa diferencia es bastante pequea).

Un tercer ejemplo
Supongamos que una profesora de una gran universidad est dando un curso de introduccin a la
estadstica a 200 alumnos. L a clase ya ha terminado de rendir su p arcial Anteriormente, la profe
sora siempre ha calificado con una curva aproximada a la distribucin normal, es decir, el 2,5%
superior de los alumnos obtuvo A , el siguiente 14% recibi B , el siguiente 67% recibi C , el si
guiente 14% recibi D y el 2,5% ms bajo recibi F.

Figura 14-2.

Distribucin chi-cuadrado (gl = 4) correspondiente al ejemplo


del mineral Q, que muestra el punto de corte para el rechazo de
la h ip te sis nula al nivel 0 ,0 5 .

Este ao, sin embargo,- la profesora ha decidido asignar las calificaciones segn el porcentaje
del examen realizado correctamente; un 90% ms es una A , entre un 80% y 89% una B , y as su
cesivamente. L a pregunta que la profesora se plantea entonces es la siguiente: sobre la base de la
muestra de este semestre formada por 200 calificaciones de parciales a travos del nuevo sistem a,
existe alguna razn para creer que el nuevo sistem a produce una distribucin diferente de ca lifi
caciones?
L a tabla 14-4 ndica las frecuencias observadas y esperadas y los clculos de la prueba
chi-cuadrado.
1. R ep lan tear el problem a en funcin de hiptesis de investigacin e hiptesis nula de las
poblaciones. La s dos poblaciones son:
Poblacin 1: alumnos calificados segn el nuevo sistema (que tiene en cuenta sus calificacio
nes sin importar el nivel de los otros alumnos de la clase).
Poblacin 2: alumnos calificados con una curva de distribucin normal.
L a hiptesis de investigacin establece que las poblaciones son diferentes; la hiptesis nula esta
blece que las poblaciones son iguales.
2. D eterm in ar las caractersticas de la d istrib uci n com parativa. L a distribucin compa
rativa es una distribucin chi-cuadrado con 4 grados de libertad (5 categoras ~ = 4).
3. D eterm in ar el punto de corte en la d istrib u ci n co m p arativa, a p a rtir del cu al se de
b era re ch a za r la hiptesis n ula. L a profesora es conservadora en cuanto a sus decisiones es
tadsticas y, por lo tanto, elige el nivel 0,01. U tilizando la tabla 14-2 (o la tabla B -4) para 4
grados de libertad, el profesor necesita un chi-cuadrado de al menos 13,277 para rechazar la h i
ptesis nula.

Tabla 14-4.
Frecuencias observadas y esperadas y prueba chi-cuadrado de bondad de ajuste del ejemplo de ca
lificaciones parciales. (Datos ficticios).
C a lifica ci n

O b se rv a d a

A
B
C
D
F

10
34
140
10
6

E sp er a d a
5
28
134
28
5

( 2,5%
(14,0%
(67,0%
(14,0%
( 2,5%

X
X
X
X
X

200)
200)
200)
200)
200)

Orados de libertad = 5 categoras - 1 = 4


Punto de corte chi-cuadrado necesario, g l - 4 , nivel 0 ,0 1: 13,277
,
X

O -E f

(1 0 5

(3 4 -2 8 )*

( 1 4 0 - 134)z

(1 0 -2 8 )*

28

134

28

28

134

~18J ,
ll
----- T* ---28
5

= 5 + 1 ,2 9 + 0 ,2 7 + 1 1 ,5 7 + 0,20*= 18,33
C onclusin: S e rechaza 3a hiptesis nula.

25

(6 5

324
* - + - * + . ----- 1
28
134
28

4. D eterm in ar el valo r m aestral en la d istrib ucin com parativa. Para calcular el chi-cuadrado, primero calculam os las frecuencias esperadas m ultiplicando los porcentajes esperados por
la cantidad en la muestra. Para el prim er grupo (calificacin A ), la profesora esperaba un 2,5% se
gn el sistema de curva normal que haba utilizado previamente; 2,5% x 200 = 5. Por lo tanto, pa
ra las calificaciones A , ella esperaba una frecuencia de 5. Segn el antiguo sistema, el 14% habra
obtenido una B , lo que da una frecuencia esperada de 28 alumnos de su clase de 200. L a tabla 14-4
indica el resto de las frecuencias esperadas ms los clculos del chi-cuadrado. Como se observa
en la tabla, el resultado es un chi-cuadrado de 18,33.
5. C o m p a rar los valores obtenidos en los pasos 3 y 4 p ara d eterm in ar si se rechaza o no
a hiptesis n u la. E l chi-cuadrado necesario para rechazar la hiptesis nula era 13,277. E l chicuadrado de la muestra es 18,33. Por lo tanto, la profesora puede rechazar la hiptesis nula y con
cluir que las poblaciones son diferentes (vase figura 14-3). E l nuevo mtodo de calificacin no
produjo una distribucin normal de las calificaciones de la clase. S i bien no se predijo la direccin
de la diferencia, un anlisis de los valores de las categoras muestra que, en este ejem plo, utilizar
el mtodo de calificacin por puntos dio como resultado que ms alumnos obtuvieran A , B C , y
menos alumnos obtuvieran D y F.

PRUEBA CHI-CUADRADO DE INDEPENDENCIA


H asta ahora hemos observado a distribucin de una variable nominal con varias categoras, tales
como estilos de relacin de las parejas de los hombres. De hecho, es bastante raro que este tipo de
situacin ocurra en la investigacin. Comenzamos con un ejemplo de ese tipo principalmente
porque es un buen escaln para llegar a la situacin ms comn de investigacin real, la situacin
que trataremos a continuacin.
L a situacin ms comn en la que se utiliza el chi-cuadrado es aquella en la que existen dos
variables nominales, cada una con varias categoras. Por ejemplo, Harter et al. podran haber esta
do interesados en saber si a clasificacin de las parejas de hombres concentrados en s mismos
era diferente de la clasificacin de las parejas de hombres concentrados en el otro u hombres con
estilo de reciprocidad. S i ese hubiera sido su propsito, habramos tenido dos variables nomina
les. E l estilo de relacin de las parejas habra sido la prim era variable nominal, y el estilo de rela
cin propio de los hombres habra sido la segunda variable nominal. L a prueba de hiptesis, en
este tipo de situaciones, se denomina prueba chi-cuadrado de independencia. Pronto veremos
el porqu de este nombre.
Analicem os el siguiente estudio ficticio. Lo s investigadores de una gran universidad realizan
una encuesta a 200 miembros del personal que viajan diariamente a su trabajo. A los miembros

Figura 14-3.
D istrib u ci n chi-cuad rad o ( g i ~ 4 ) d el eje m p lo acerca d el
siste m a d e c a lific a c io n e s, que m u estra e l pu nto de corte
para e l r ech a zo d e la h ip tesis nula al n iv el 0 ,0 1 .

del personal se les pregunta acerca del tipo de transporte que utilizan, y si prefieren acostarse tem
prano y levantarse temprano (personas diurnas) o acostarse tarde y levantarse tarde (personas
nocturnas). Lo s resultados se reflejan en la tabla. 14-5. Observemos las dos variables nominales;
a) tipo de transporte, con tres niveles y b) tendencia de descanso, con dos niveles.

Tabias de contingencia
L a tabla 14-5 es un ejemplo de una tab la de contingencia, aquella en la que se establecen las dis
tribuciones de dos variables nominales de modo que refleje las frecuencias de sus combinaciones
y tambin los totales. Una tabla de contingencia es sim ilar a las tablas utilizadas en los diseos
factoriales de investigacin que se analizan con un anlisis de varianza de dos criterios (vase ca
ptulo 13). Sin embargo, en una tabla de contingencia, los nmeros son frecuencias y no medias.
E l nmero en cada categora o combinacin de categoras es una cantidad de individuos, no un
promedio de registros de determinada clase. Por lo tanto, en la tabla 14-5, el 60 en la combinacin
autobs-diurna expresa cuntas personas diurnas toman autobs. No es un promedio ni nada que
se le parezca.
L a tabla 14-5 es un ejemplo de tabla de contingencia 3 x 2 porque tiene tres niveles de una va
riable cruzados con dos niveles de otra variable (no importa qu dimensin se nombre primero). Tam
bin es posible crear tabias de contingencia mayores, como por ejemplo d e 4 x 7 6 x !8 . Las tablas
ms pequeas, las tablas de contingencia 2 x 2 , son las ms comunes.

Independencia
E ! objetivo en el ejemplo que estamos analizando es saber si existe alguna relacin entre el tipo de
transporte que utilizan las personas y el hecho de que sean personas diurnas o nocturnas. S i no
existe relacin, la proporcin de personas diurnas y nocturnas ser la misma entre los que viajan
en autobs, los que comparten los autos y los que van con sus propios autos. O para decirlo de
otro modo, si no existe relacin, la proporcin de personas que viajan en autobs -com parten los
autos y conducen sus propios autos-, es la m ism a en el caso que se trate de personas diurnas o
nocturnas. No importa cmo se describa. L a situacin de ausencia de relacin entre las variables
en una tabla de contingencia se denomina independencia.2

Tabla 14-5.
Tabla de contingencia de frecuencias observadas de personas diurnas y nocturnas que utilizan dife
rentes medios de transporte. (Datos ficticios).
M edio de transporte
A u to b s

A u to m v il c o m p a r tid o

.60 /

e i |

D iu r n a

N o c tu r n a

''2 0 7

T otal

80

Total
A u to m v il p r o p io

120 ( 60% )

3 o

80 ( 40% )
50

70

2 0 0 (1 0 0 % )

2 El trmino independencia se utiliza usualmente para referirse a la ausencia de relacin entre dos variables nominales.
Sin embargo, si el alumno ya ha estudiado e l captulo 3, puede resultarle til pensar en la independencia com o algo si
milar a la situacin de falta de correlacin o coeficiente de correlacin 0 (r = 0).

Muestra y poblacin
Segn los resultados de la encuesta observados en el estudio, las proporciones de personas noc
turnas y diurnas de la muestra varan de acuerdo con los diferentes medios de transporte. Por
ejemplo, los que viajan en autobs se dividen en 60-20, es decir, tres cuartas partes de los que via
jan en autobs son personas diurnas. Entre las personas que viajan en su propio auto, la divisin
es 30-40, es decir, una leve mayora son personas nocturnas. Aun as, debemos tener en cuenta
que la muestra es de slo 200 personas, y es posible que en la poblacin mayor, el tipo de trans
porte que utiliza una persona sea independiente del hecho de que esa persona sea diurna o noctur
na. L a gran pregunta es si la falta de independencia en la muestra es lo suficientemente grande
como pararechazar la hiptesis nula de independencia en la poblacin.

Utilizacin del chi-cuadrado en una prueba de independencia


Para probar si la falta de independencia en una muestra es lo suficientemente grande como para
rechazar la hiptesis nula de independencia en la poblacin, se requieren dos elementos. E n pri
mer lugar, necesitamos un nmero que refleje la desigualdad entre el patrn de la muestra y lo
que esperaramos si el patrn de la muestra reflejara perfectamente una poblacin en la que hu
biera independencia. E se nmero es el estadstico chi-cuadrado. E n segundo lugar, necesitamos
conocer la distribucin de ese estadstico si la hiptesis nula fuera verdadera, es decir, la distribu
cin chi-cuadrado.
Tal como hicim os en el ejemplo referido al estilo de relacin, debemos calcular un chi-cua
drado y compararlo con un punto de corte chi-cuadrado tomado de una tabla. Lo nuevo en este ca
so son los detalles en cuanto a la forma de calcular el chi-cuadrado y en cuanto a la forma de
calcular los grados de libertad para buscar el punto de corte en la tabla chi-cuadrado.

Determinacin de las frecuencias esperadas


Tal como hicim os anteriorm ente, para calcu lar el chi-cuadrado com param os las frecuencias
observadas con las esperadas. L a novedad en este caso es que ahora tenemos que calcu lar d i
ferencias entre lo observado y lo esperado para cada com binacin de categoras, es decir, para
cada ca silla de la tabla de contingencia (cuando haba slo una variable nom inal, calculba
mos estas diferencias slo para cada categora de la nica variable nom inal). L a novedad ms
importante del procedim iento est relacionada con el clculo de lo que deberan ser las fre
cuencias esperadas.
L a tabla 14-6 es la tabla de contingencia correspondiente a la encuesta del ejemplo. Esta vez
hemos incluido la frecuencia esperada (entre parntesis) al lado de cada frecuencia observada. E s
recomendable ir analizando la lgica que indican los dos prrafos siguientes m ientras se observan
los nmeros mencionados.
Para calcular frecuencias esperadas suponemos que las dos variables son independientes, es
decir, en este ejemplo, suponemos que el transporte y la tendencia de descanso son independien
tes (suponemos esto al calcular las frecuencias esperadas porque es con la independencia con lo
que queremos comparar nuestras frecuencias observadas). S i son independientes, entonces las
proporciones entre las casillas superiores e inferiores de cada columna de transporte deberan ser
iguales. Por ejemplo, la proporcin de personas diurnas que viajan en autobs debera ser igual a
la proporcin de personas diurnas entre aquellos que comparten los autos, e igual a la proporcin
de personas diurnas que utilizan su propio auto. De hecho, todas estas proporciones deberan ser
iguales a la proporcin de personas diurnas en la encuesta en general. Para decirlo de otro modo,

T a b la 14*6.
T a b la d e c o n tin g e n c ia d e fr e c u e n c ia s o b s e r v a d a s (y e sp e r a d a s ) d e p e r so n a s d iu r n a s y n o c tu r n a s q u e
u tiliz a n d ife r e n te s tip o s d e tr a n s p o r te . (D a to s fic tic io s ).

M edio d transporte
A u to b s

.2

32

na
<
&
O
-a g
g *

D iu r n a

! , 60 (4 8 )a

N o c tu r n a

T o ta l

A u to m v il c o m p a r tid o

A ;

3 0 (3 0 )

A vA

Total
A u to m v il p r o p io

3 0 (4 2 ) ;

120 (60% )

2 0 (3 2 )

2 0 (2 0 )

4 0 (2 8 ),

8 0 (40% )

80

50

70

2 0 0 (100% )

1 Las frecuencias esperadas estn entre parntesis.

el patrn proporcional de personas diurnas y nocturnas en cada columna debera ser igual que al de
toda la distribucin. Lo anterior significara que el medio de transporte no afecta la proporcin de per
sonas diurnas y nocturnas, y que el medio de transporte es independiente de la proporcin de perso
nas diurnas y nocturnas.
Analicem os ahora los nmeros reales de la encuesta del ejemplo. En total existe un 60% de per
sonas diurnas y un 40% de personas nocturnas. Por lo tanto, si el medio de transporte es indepen
diente del hecho de ser una persona diurna o nocturna, este 60% -40% debera mantenerse en cada
columna (cada tipo de transporte). En primer lugar, el 60% -40% total debera mantenerse en el
grupo de personas que viajan en autobs, es decir, que en la casilla de la personas diurnas que to
man el autobs esperaramos una frecuencia del 60% sobre 80, es decir, 48 personas. L a frecuen
cia esperada para las personas nocturnas que toman autobs es 32 (es decir, el 40% de 80 es 32).
Del mismo modo, analicemos las frecuencias esperadas para la columna de aquellos que comparten
el automvil. L a columna debera dividirse en 60% -40% ; por lo tanto, se espera que su total de 50
personas se divida en un 60% - 40% , dando como resultado una frecuencia esperada de 30 personas
diurnas que viajan en automviles compartidos (es decir, el 60% de 50 es 30) y 20 personas noctur
nas que viajan en automviles compartidos (es decir, el 40% de 50 es 20). La s frecuencias esperadas
para la columna de personas que viajan en sus propios automviles se calculan del mismo modo, y
dan 42 y 28, tal como lo muestra la tabla 14-6.
Lo anterior se expresa bajo la frm ula,
=( 0 C )

(14-2)

En la frm ula, E es la frecuencia esperada para una casilla en particular (la combinacin de cate
goras); R es la cantidad de personas observadas en la fila de esa casilla; N es la cantidad total de
personas, y C es la cantidad de personas observadas en la columna de esa casilla. (Aun si se con
funden las casillas y las columnas, la frecuencia esperada resulta la mism a).
Aplicando la frmula a las personas diurnas que viajan en autobs,

E=

= ( ^ ) ( 8 0 ) = ( 0.60)(80) = 48

Observando la tabla 14-6 en su totalidad, vemos que las frecuencias esperadas suman los mismos
totales de columnas y filas que las frecuencias observadas. Por ejemplo, en la primera columna

(autobs), las frecuencias esperadas de 32 y 48 suman 80, al igual que las frecuencias observadas
de 60 y 20 de la misma columna. D e modo sim ilar, en la fila superior (diurna), las frecuencias es
peradas de 48, 30 y 42 suman 120, el mismo total de las frecuencias observadas de 60, 30 y 30.
Para controlar los clculos aritmticos, es siempre una buena idea asegurarse de que las frecuen
cias esperadas y observadas sumen los mismos totales tanto de fila como de columna.

Clculo del chi-cuadrado


Una vez que conocemos las frecuencias observadas y esperadas, podemos calcular el ch-cuadrado del mismo modo que en la prueba chi-cuadrado de bondad de ajuste. Lo s pasos y las frmulas
son exactamente las m ism as. L a nica diferencia es que ahora calculam os la diferencia cuadrtica
ponderada para cada ca silla y luego las sumamos (antes hicim os lo mismo para cada categora y
no haba casillas para combinaciones de categoras porque haba slo una variable nom inal). Aba
jo indicamos cmo funciona el proceso aplicado a la encuesta del ejemplo:

E
es

(60 -48)2 . (3 0 -3 0 )2 , (30 -42)2 , (2 0 -3 2 )2 , (2 0 -2 0 f


-f*

48

........ 4* *

30

4"

42

, (4 0 -2 8 )2

"4*'--------------- 4*..............

32

20

28

= 3+0+3,43 + 4,5 + 0 + 5,14=16,07

Grados de libertad
Como siempre, antes de que podamos probar la significacin debemos saber cules son los gra
dos de libertad. Lo s grados de libertad para el chi-cuadrado de una tabla de contingencia son la
cantidad de columnas menos 1 por la cantidad de filas menos 1. Se expresa bajo la frm ula,

( 1 )
E n la frmula anterior, ^Coumas es la cantidad de columnas y Nmas es la cantidad de filas. S i apli
camos esta frmula a la encuesta del ejemplo,
8

- (WFte -1) = (3 - 1)(2 -1) = (2)(1) = 2

Una tabla de contingencia con muchas casillas puede tener relativamente pocos grados de liber
tad, ya que en una prueba chi-cuadrado los grados de libertad son la cantidad de categoras libres
de variar una vez que se conocen los totales. Con una prueba chi-cuadrado de independencia, la
cantidad de categoras se convierte en la cantidad de casillas; los totales ahora incluyen totales de
fila y columna al igual que el total general. Si conocemos los totales de fila y de columna, conta
mos con mucha inform acin.
Analicem os el ejemplo acerca de la tendencia de descanso y los medios de transporte. S i co
nocemos las frecuencias de las primeras dos casillas superiores, por ejemplo, y todos los totales
de fila y columna, podramos calcular todas jas otras frecuencias. L a tabla 14 -7 muestra la tabla de
contingencia correspondiente al ejemplo que analizamos, con slo los totales de fila y columna (y
el total general) y las frecuencias de esas dos casillas. Podemos completar el resto de la fila supe
rior calculando que, si hay un total de 120 (el total de esa fila) y las otras dos casillas dan 90 entre
las dos (60 + 30), entonces slo quedan 30 que se ubican en la casilla de autom vil propio. S i co-

Tabla 14-7.
Tabia de contingencia que incluye las frecuencias observadas marginales y de dos casillas, con el fin
de ilustrar el clculo de los grados de libertad.

A u to b s

3 <n
0 a
E* a

D iu r n a

-8 i

N o c tu r n a

S '*

60

A u to m v il c o m p a r tid o

30

A u to m v il p r o p io

"

"
- y**-..

i 2 0 (60% )
80 (40% )

80

T o ta l

50

70

2 0 0 (100% )

nocemos las frecuencias de todas las casillas de personas diurnas y los totales de columnas para
cada tipo de transporte, entonces la frecuencia de cada casilla correspondiente a las personas noc
turnas es igual al total de su columna menos las personas diurnas de esa columna. Por ejemplo,
hay SO personas que viajan en autobs y 60 son personas diurnas, entonces los 20 restantes deben
ser personas nocturnas. Por lo tanto, en este ejem plo, aunque hay seis celdas, hay slo 2 grados de
libertad; entonces, hay slo dos casillas cuyas frecuencias son realmente libres de variar una vez
que tenemos todos los totales de fila y columna.

Prueba de hiptesis
Con 2 grados de libertad, la tabla 14-2 (o tabla B -4) muestra que el punto de corte chi-cuadrado
necesario para tener significacin a un nivel de 0,01 es 9,211. E l chi-cuadrado de 16,07 del ejem
plo es mayor que ese punto de corte. Por lo tanto, podemos rechazar la hiptesis nula que estable
ce que en la poblacin las dos variables son independientes.

Pasos de la prueba de hiptesis y prueba chi-cuadrado de independencia: un ejemplo


Acabamos de realizar una prueba de hiptesis completa utilizando la prueba chi-cuadrado de in
dependencia. Sin embargo, una vez ms ser til rever el proceso, pero esta vez siguiendo siste
mticamente los cinco pasos de la prueba de hiptesis.
1. Replantear el problema en fundn de hiptesis de investigacin e hiptesis n u la de la s
poblaciones. L a s dos poblaciones son:

Poblacin 1: personas como las entrevistadas.


Poblacin 2 : personas para las cuales ser nocturna o diurna es independiente del tipo de
transporte utilizado para ir a trabajar.
L a hiptesis nula establece que las dos poblaciones son iguales, y que en general las proporciones
que utilizan diferentes tipos de transporte son las mismas para las personas diurnas y nocturnas.
L a hiptesis de investigacin establece que las dos poblaciones son diferentes, y que entre las per
sonas en general, las proporciones que utilizan diferentes tipos de transporte varan segn se trate
de personas diurnas o nocturnas.

Para decirlo de otro modo, la hiptesis nula establece que las dos variables son independien
tes (no estn relacionadas entre s). L a hiptesis de investigacin establece que no son indepen
dientes (que estn relacionadas entre s).
2. D eterm in ar las caractersticas de la d istrib ucin com parativa. L a distribucin compa
rativa es una distribucin chi-cuadrado con 2 grados de libertad. S i conocemos la cantidad de par
ticipantes de dos casillas y los totales de fila y columna, todas las dems cantidades pueden
determinarse. O bien, utilizando la regla para tablas de contingencia, la cantidad de casillas libres
de variar es la cantidad de columnas menos 1 por la cantidad de filas menos 1.
3. D eterm in ar el punto de corte en la distrib ucin co m p arativa, a p a rtir del cu al debera
rechazarse la hiptesis nula. Utilizam os la m isma tabla que para cualquier prueba chi-cuadrado.
E n el ejemplo, estableciendo un nivel de 0,01 de significacin con 2 grados de libertad, necesita
mos un chi-cuadrado de 9,211.
4. D eterm in ar el valo r m aestral en la distrib ucin com parativa. En el ejemplo, encontra
mos un chi-cuadrado de 16,07.
5. C o m p a rar los valo res obtenidos en los pasos 3 y 4 p a ra determ inar si se rechaza o no
la hiptesis n ula. E l chi-cuadrado necesario para rechazar la hiptesis nula es de 9,211, y el chicuadrado del ejemplo es de 16,07 (vase figura 14-4). Por lo tanto, podemos rechazar la hiptesis
nula. Se sostiene la hiptesis de investigacin que establece que, en la poblacin, las dos variables
no son independientes. E n consecuencia, las proporciones del tipo de transporte utilizado para ir a
trabajar difiere segn se trate de personas diurnas o nocturnas.

U n segundo ejem plo


En el ao 1994, R iehl realiz un estudio para analizar la experiencia universitaria de alumnos de
prim er ao que eran la primera generacin de la fam ilia en asistir a la universidad. Lo s alumnos
fueron comparados con otros alumnos que no eran la prim era generacin de la fam ilia que asista
a la universidad (todos los alumnos pertenecan a la Universidad de Indiana). U na de las variables
que m idi R iehl fue si los alumnos abandonaban o no los estudios durante el prim er semestre.
L a tabla 14-8 muestra los resultados y los porcentajes correspondientes a los grupos de aban
dono y no abandono, ms las frecuencias esperadas (entre parntesis) basadas en esos porcenta
je s. Debajo de la tabla de contingencia se encuentran los clculos de la prueba chi-cuadrado de
independencia.

Figura 14-4.
D istrib u ci n ch i-cu a d ra d o (gl = 2 ) d e l e je m p lo a cerca d e la
te n d en cia d e d e s c a n so y m e d io d e transporte, q u e m u estra e l
p u n to d e co rte para rechazar la h ip tesis nula al n ivel 0 ,0 1 .

1. Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de las


poblaciones. Las dos poblaciones son:
Poblacin 1: alumnos como los entrevistados.
Poblacin 2: alumnos cuyo abandono o continuidad en la facultad durante-.el prim er semestre
es independiente del hecho de ser o no la prim era generacin en la fam ilia que
asiste a la universidad.
L a hiptesis nula establece que las dos poblaciones son iguales y que, en general, si los alumnos
abandonan o no durante el primer semestre es independiente de que sean la primera generacin de
su fam ilia que asiste a la universidad. L a hiptesis de investigacin establece que las poblaciones
no son iguales. En otras palabras, la hiptesis de investigacin establece que los alumnos como los
entrevistados, no son iguales a la poblacin hipottica en la que abandonar no est relacionado con
que sean la primera generacin.
2. D eterm in ar la s cara cterstica s de la d istrib u ci n com parativa. E s una distribucin
chi-cuadrado con 1 grado de libertad.
3. D eterm in ar el punto de corte en la distrib ucin com p arativa, a p a rtir del cu al debera
rechazarse la hiptesis nula. Utilizando el nivel 0,01 y 1 grado de libertad, el chi-cuadrado ne
cesario para alcanzar significacin es 6,635. L a figura 14-5 representa grficamente este clculo,
4. D eterm in ar el valo r m uestral en la distrib ucin com parativa. Para calcular el chi-cua
drado, primero debemos calcular las frecuencias esperadas para cada casilla. La s frecuencias
mencionadas se calculan m ultiplicando los porcentajes esperados por la cantidad en la muestra.
Por ejemplo, analicemos los abandonos de la prim era generacin. E n general, los abandonos re
presentan el 7,9% de los alumnos; por lo tanto, si la hiptesis nula fuera verdadera, los abandonos
deberan representar el 7,9% de los 730 alumnos de la prim era generacin. E s decir, la frecuencia
esperada para los abandonos de la prim era generacin es 57,7 (7,9% x 730 = 57,7). Una vez que
hemos calculado las frecuencias esperadas para cada casilla, el resto del anlisis chi-cuadrado s i
gue el procedimiento habitual que im plica calcular la diferencia de cada casilla, elevarla al cua
drado, dividirla por la frecuencia esperada y sum ar los resultados de todas las casillas. Como lo
indica la tabla 14-8, el resultado es un chi-cuadrado de 6,73.

5. Comparar los valores obtenidos de los pasos 3 y 4 para determinar si se rechaza o no


la hiptesis nula. E l chi-cuadrado de 6,73 es m ayor que el punto de corte de 6,635 (vase figura
14-5), Por lo tanto, la conclusin es rechazar la hiptesis nula. E s decir, a juzgar por una muestra
de 2.045 alumnos de la Universidad de Indiana, lo s alumnos que son la prim era generacin de su
fam ilia en asistir a la universidad tienen ms posibilidades que los dems alumnos de abandonar
durante el prim er semestre. (No debemos olvidar, por supuesto, que podra haber m uchas razo
nes para este resultado).

Un tercer ejemplo
Janice Steil y Jennifer H ay (1997) realizaron una encuesta a profesionales (abogados, doctores,
banqueros, etc.) acerca de cules eran las personas con las que se comparaban cuando pensaban
en su situacin laboral (salario, beneficios, responsabilidades, nivel social, etc.). U na de las cues
tiones de mayor inters era averiguar cuntos profesionales se comparaban a s mism os con per
sonas de su propio sexo, del sexo opuesto, o ambos.
L a tabla 14-9 muestra los resultados junto con el porcentaje correspondiente a cada tipo de
comparacin, ms las frecuencias esperadas (que aparecen entre parntesis) sobre la base de esos
porcentajes. Debajo de la tabla de contingencia estn los clculos de la prueba chi-cuadrado de
independencia.

T a b la 1 4 -8 .
R e su lta d o s y c lc u lo s d e la p r u e b a ch i-c u a d ra d o d e in d ep en d e n c ia q u e p r u e b a si la p r im e r a gen eracin
d e a lu m n o s u n iv er sita r io s d ifiere d e o tra s en cu an to a a b a n d o n o de e stu d io s d u ra n te el p r im e r sem estre.
G en e r a ci n q u e asiste a la u n iversid ad
P r im e r a

73

Abandono
C o n tin u id a d

Z=

T otal

O tr a s

(57.7)

89

(103,9)

162 (7,9% )

6 5 7 (6 7 2 ,3 )

1 ,2 2 6 (1 .2 1 1 ,1 )

1,583 (92,1% )

730

1,315

2,045

IXtfm. - 1) - (2 - 1X2 - I) = (1X0 = 1

Punto d e corte chi-cuadrado necesario, g l = 1, nivel 0,01: 6,635

( O - ) *1

( 7 3 - 5 7 ,7 )*

5 7 ,7

*
15,3s

-1 4 ,9 s

(8 9 - 1 0 3 ,9 ) '
+

-1 5 ,3 '

103,9

(6 5 7 - 6 7 2 ,3 ) '
+

672,3

( 1 ,2 2 6 -1 .2 1 1 ,1 )'
+

1.211,1

14,9'

57,7 + 103,9 + 6 7 2,3 + 1.211,1


234,1

222

234,1

222

= 57 ,7 * 103,9 * 67 2 ,3 + 1.211,1
= 4 ,0 6 + 2 ,1 4 + 0,35 + 0,1 8
= 6,73
C onclusin: se rechaza la hiptesis nula.
N ota: 1. Con un anlisis 2 x 2 , las diferencias y las diferencias cuadrticas (numeradores) de las casillas son idnticas.
Bn el e je m p lo q u e analizamos, las diferencias se deben al redondeo. 2. Fuente: Riehl (1994). E l chi-cuadrado exacto

(6,73) es levemente diferente al informado en el artculo (7,2) debido a diferencias de redondeo.

1.

R ep lan tear el problem a en funcin de hiptesis de in

vestigacin e hiptesis n u la de la s poblaciones. L a s dos po


blaciones son:
Poblacin 1: profesionales como los entrevistados.
Poblacin 2 : profesionales para quienes el propio sexo es
independiente del sexo de aquellos con quie
nes comparan su situacin laboral.
L a hiptesis nula establece que las dos poblaciones son iguales,
que en general los hombres y mujeres profesionales no difieren
en cuanto al sexo de aquellos con quienes comparan su situa
Figura 14-5.
D is t r ib u c i n c h i-c u a d r a d o
( g l = I ) d el e je m p lo d e R ieh l
(1 9 9 4 ), q u e m uestra e l punto
d e co rte para rechazar la h i
p tesis nu la al n iv el 0 ,0 1 .

cin laboral. L a hiptesis de investigacin establece que las po


blaciones no son iguales, que los profesionales como los
entrevistados no son iguales a la poblacin hipottica en la que
hombres y mujeres no difieren en cuanto al sexo de aquellos
con quienes comparan sus situaciones laborales.

2. D eterm in ar la s ca ra cterstica s de la d istrib u ci n co m p arativa. E s una distribucin


chi-cuadrado con 2 grados de libertad.
3. D eterm in ar ei punto de corte en la d istrib uci n com p arativa, a p a rtir del cual debe
ra rech azarse la hiptesis n ula. U tilizando el nivel 0,05 y teniendo 1 grado de libertad, el
chi-cuadrado necesario para la signicacin es 5,992. L a figura 14-6 representa grficamente
este clculo.
4. D eterm in ar el valor m uestral en la distrib ucin com parativa. Como siempre, primero
calculam os las frecuencias esperadas para cada casilla m ultiplicando los porcentajes esperados
por la cantidad en la muestra. Por ejemplo, el 39% de los profesionales en general se comparan
con otros del mismo sexo. S i la hiptesis nula es verdadera y las variables son independientes, se
espera que el 39% de los 59 hombres se comparen con otros del mismo sexo; la frecuencia espe
rada de hombres que se comparan con otros del mismo sexo es 23 (es decir, 39% x 59 = 23). (Pro
bablemente el alumno ya haya notado que en este ejemplo las frecuencias esperadas para cada
tipo de comparacin son las m ism as entre las dos columnas. S i bien no es lo acostumbrado en una
tabla de contingencia de 2 x 3, en el ejemplo resulta de ese modo porque existe la m ism a cantidad
de personas en cada columna).

Tabla 14-9.
Resultados y clculos de la prueba chi-cuadrado de independencia que prueba si hombres y muje
res difieren en cuanto al sexo de las personas con las que comparan su situacin laboral.
T o ta l

R esp u esta
M u je r e s

H om bres
M is m o s e x o

[ .

S e x o o p u e s to

A m bos sexos

j- . 2 6 (2 7 )

4 6 (39,0% )

2 9 ;( 2 3 ) U L

18 (15,3% )

4 '(9 :;f t i nu : i ;# ( 9 | ;

5 4 (4 5 ,8 % )

59

118

59

= W o * - IXWb . -1 ) = (2 - 1X3 -1 ) = (1X2) = 2


C hi-cuadrado necesario, g l = 2, nivel 0 ,0 5 :5 ,9 9 2

_ (O-Ef
K

( 2 9 - 2 3 ) 2( 1 7 - 2 3 ) 1 ( 4 ~ 9 ) s
23

E
e

-6 *

36

36

23
9^

25

25
+ 9

(1 4 - 9 ) 5

_ -l*

l2

23 + 23 * 9

1,57 + 1,57 + 2,78 + 2 ,7 8 + 0,04 + 0,04 = 8,78

(2 6 - 27)a

(2 8 -2 7 )1

27

27

+ 27 + 27

C onclusin: se rechaza ia hiptesis nula.


Fuente: Steil & Hay (1997), El chi-cuadrado calculado aqu (8,78) es levem ente diferente del informado en la publica
cin (8,76) debido a diferencias de redondeo.

Una vez que calculam os las frecuencias esperadas para cada. )


casilla, el resto del anlisis chi-cuadrado sigue el procedimiento L
habitual: calcular la diferencia para cada casilla, elevarlas alo
cuadrado, dividirlas por las frecuencias esperadas y sumar lo s :
resultados de todas las casillas. Tal como lo ndica la tabla 14-9,
el resultado es un chi-cuadrado de 8,78.

5.
Comparar los valores obtenidos en los pasos 3 y 4 p
determinar si se rechaza o no la hiptesis nula. E l chi-cuadra
do de 8,78 es mayor que el punto de corte de 5,992 (vase figura ::

Figura 14-6.

Distribucin chi-cuadrado

(gl =2) del ejemplo de Steil y


Hay (1997), que muestra el
punto de corte para rechazar
la hiptesis nula al nivel 0,05.

14-6); por lo tanto, podemos rechazar la hiptesis nula. E s decir,: ;


basndonos en el ejemplo, el sexo de las personas con las que s e :
comparan los profesionales con respecto a su situacin laboral '
es probablemente diferente para hombres y mujeres. A l analizar :
las frecuencias de las casillas observadas, la mayor diferencia
parece ser que las mujeres tienen aproximadamente las mismas
probabilidades de compararse con otras personas del mismo se
xo o del sexo opuesto, mientras' que es mucho ms probable que
los hombres se comparen con personas del mismo sexo que con
las del sexo opuesto.

SUPUESTOS DE LAS PRUEBAS CHI-CUADRADO


L a prueba chi-cuadrado no requiere los supuestos usuales de normalidad de la poblacin, de
igualdad de varianzas u otros sim ilares. E x iste, sin embargo, un supuesto clave: no debe existir
ninguna relacin especial de ninguno e los valores observados con algn otro valor observa-..
do. Bsicam ente, lo anterior significa que no se pueden u tilizar las pruebas chi-cuadrado usua
les si las observaciones se basan en las m ism as personas puestas a prueba ms de una vez.
Tomemos, por ejem plo, un estudio en el que 20 personas fueron probadas para observar si la
distribucin de su marca preferida de cereal para el desayuno cambi entre antes y despus de
una campaa reciente sobre nutricin. Lo s resultados de ese estudio no podran ser probados
con el chi-cuadrado usual.

TAMAO DEL EFECTO Y POTENCIA


DE LAS PRUEBAS CHI-CUADRADO DE INDEPENDENCIA
E n las pruebas chi-cuadrado de independencia podemos calcular un tamao del efecto estimado
utilizando el chi-cuadrado que calculam os. E l tamao del efecto estimado indica el grado de rela
cin entre las dos variables nominales. En un caso extremo, dos variables nominales podran no
tener ninguna relacin, es decir, ser independientes la una de la otra. E n esa situacin de ausencia
de relacin, el tamao del efecto estimado es cero. En otro caso extremo, las dos variables po
dran estar perfectamente relacionadas entre s, lo cual significara que saber en qu categora se
encuentra una persona con respecto a una variable nominal nos indicara exactamente en qu ca
tegora se encuentra con respecto a la otra variable nominal. (Por ejemplo, supongamos que el re
sultado del estudio de R iehl hubiera sido que todos los alumnos de la primera generacin
abandonan y que ninguno de los otros alumnos lo hace. En ese caso, existe una relacin perfecta.
Por lo tanto, si sabemos que una persona es un alumno de la prim era generacin sabramos que es

482

Estadstica para psicologa

de ios que abandonan, y si supiramos que alguien es alumno de generaciones siguientes a la p ri


mera, sabramos que no es de los que abandonan). Cuando existe una relacin perfecta, el tamao
del efecto chi-cuadrado estimado resulta ser 1,0. E n la mayora de los casos reales, la relacin de
dos variables nominales se ubica entre la ausencia de relacin (independiente).y una relacin per
fecta. Por lo tanto, la estim acin del tamao del efecto chi-cuadrado comnmente se encuentra
entre 0 y 1. Cuanto ms cerca se encuentra de 0 el tamao del efecto estimado, menor ser la rela
cin, o bien, ms cerca estarn de la independencia las dos variables nominales. Cuanto ms cer
ca est de 1 el tamao del efecto estimado, mayor ser la relacin o ms cerca estarn las dos
variables nominales de una relacin perfecta.3
E n una tabla de contingencia 2 x 2, la medida de asociacin se denomina coeficiente phi (<j>).
E s la raz cuadrada del resultado de la divisin del chi-cuadrado por la cantidad de personas en to
da la muestra. Se expresa bajo la frmula:

(14-4)

Las reglas de Cohn (1988) para el coeficiente phi establecen que 0,10 es un tamao del efecto
pequeo, 0,30 es un tamao del efecto mediano y 0,50 es un gran tamao del efecto.
Por ejemplo, en el estudio de R iehl acerca de la prim era generacin de estudiantes universita
rios, el chi-cuadrado que calculam os era de 6,7, y haba 2.045 personas en el estudio. Aplicando
la frmula para el coeficiente phi,

Se trata de un tamao del efecto muy pequeo. Lo s resultados con respecto a la significacin nos
indican que la mayor probabilidad de que los alumnos de primera generacin abandonen los estu
dios, probablemente no es casual. Pero el coeficiente phi nos indica que, en la prctica, esa dife
rencia no casual no puede ser un factor muy importante. (En el captulo 8 tratamos aquellas
situaciones en la que un resultado es estadsticamente significativo pero cuyo tamao de efecto es
muy pequeo).
E l estadstico phi slo se aplica cuando existe una situacin 2 x 2 . Podemos decir que el esta
dstico p h i de C ra m e r es una extensin del coeficiente phi ordinario, que puede aplicarse a ta
blas de contingencia mayores de 2 x 2. (E l phi de Cram er tambin se conoce como la V de
Cram er, y a veces se escribe <j)c Vc). Se calcula del mismo modo que el coeficiente phi ordina-

3 S e alumno ya ha estudiado el captulo 3, puede resultarle til considerar un tamao de efecto chi-cuadrado estima
da com o un coeficiente de correlacin. D e hecho, en ei caso de una tabla de contingencia 2 x 2, la estimacin es real
mente idntica al coeficiente de correlacin. Supongamos que tomramos las dos variables de una tabla de
contingencia 2 x 2 y arbitrariamente hiciramos que uno de ios valores de cada uno fuera 1 y el otro fuera igual a 0, Si
despus calculramos un coeficiente de correlacin entre las dos variables, el resultado seria exactamente el mismo que
el coeficiente phi descripto en el siguiente prrafo {no obstante, segn qu categoras de cada variable hayamos trans
formado en 1 en 0, la correlacin ser negativa o positiva). Las regas de Cohn de tamaos del efecto pequeos, m e
dianos y grandes para el coeficiente phi, que se describen a continuacin, tambin son exactamente las mismas que las
de un coeficiente de correlacin.

rio, excepto que en lugar de dividir por N, se divide por el resultado de la m ultiplicacin de N por
los grados de libertad del lado menor de la tabla (g/Menoc). Se expresa bajo la frmula,
(14-5)

de Cramer =
^O(^Menor)

En el ejemplo acerca de las preferencias de transporte, el chi-cuadrado era de 16,07 y la cantidad


total de personas entrevistadas era 200. Lo s grados de libertad del lado ms pequeo de la tabla
(en este caso las filas) era 1. E l phi de Cram er es la raz cuadrada del resultado de dividir 16,07
por 200 por 1, es decir, 0,28. L o anterior se expresa bajo la frmula,

fm f

x2

<\> d e C ram er =:
W

) { g t U cn

or)

V 8 = 0 ,2 8

(200)(l)

En el estudio de Steil y H ay acerca del sexo con el que hombres y mujeres profesionales se com
paraban a s mismos, calculam os un chi-cuadrado de 8,78, y se entrevist a 118 profesionales.
Lo s grados de libertad del lado ms pequeo de la tabla (en este caso las columnas) era 1. E l phi
de Cram er es 0,27 (la raz cuadrada de 8,78 dividido 118 es 0,27). Lo anterior se expresa bajo la
frmula:
8 ,7 8

d e C ram er=

(ri)(gjvfenor )

= V 0 ^ 0 7 = 0 ,2 6

(H 8 )()

L a s reglas de Cohn para el tamao del efecto del phi de Cram er dependen de los grados de liber
tad del lado menor de la tabla. L a tabla 14-10 muestra las reglas de Cohn para el tamao del
efecto del phi de Cram er (1988), correspondientes a tablas cuyo lado menor es 2 ,3 y 4. Cabe des
tacar que cuando el lado menor de la tabla es 2, el grado de libertad es 1 y, por lo tanto, los tama
os del efecto que indica la tabla para esa situacin son los mism os que para el coeficiente phi
ordinario. (Dado que m ultiplicar por 1 no produce ningn cambio, el clculo tambin arroja el
mismo resultado, tal como sucede en los dos ejemplos que analizam os anteriormente).
Basndonos en la tabla, en el ejemplo del transporte existe un tamao del efecto aproximada
mente mediano (0,28), es decir, una relacin mediana entre el tipo de transporte utilizado y el he
cho de que se trate de una persona diurna o nocturna.

Tabla 14-10.
Reglas de Cohen para el phi de Cramer.
M en o r d im en si n de
la ta b la de c o n tin g en cia

2 Q>Lfcttor ~ ^)
2 lo^Veaor ~ 2 )
^ 0>(vfcnor - 3)

T am a o d el e fe cto
P equeo

M e d ia n o

G ra n d e

OJO
0,07
0 ,0 6

0 ,3 0
0,21
0J7

0 ,5 0
0,35
0 ,2 9

Potencia y tamao de muestra necesarios


para ia prueba chi-cuadrado de independencia
L a tabla 14-11 muestra la potencia aproximada al nivel 0,05 de significacin, para tamaos del
efecto pequeos, medianos y grandes y tamaos totales de muestra de 2 5 ,5 0 ,1 0 0 y 200. Se indi
ca la potencia para tablas con 1 , 2 , 3 y 4 grados de libertad.4
Por ejem plo, analicem os k potencia de un estudio planificado de 2 x 4 (gl - 3 ) con 50 per
sonas, con un tamao del efecto esperado mediano (phi de Cram er - 0,30), que se realizar
con un nivel de 0,05. U tilizando la tabla 14-11, el estudio m encionado tendra una potencia de
0,40, es decir, que si la hiptesis de investigacin en realidad es verdadera y el tamao del
efecto real es m ediano, existe aproximadamente un 40% de posibilidades de que el estudio re
sulte significativo.
L a tabla 14-12 indica la cantidad total aproximada de participantes necesarios para obtener
una potencia del 80% , con tamaos del efecto pequeos, medianos y grandes, a un nivel 0,05 de
significacin, para pruebas chi-cuadrado de independencia con 2 , 3 , 4 y 5 grados de libertad.3 Por

Tabla 14-11.
P o t e n c i a a p r o x im a d a p a r a u n a p r u e b a c h i- c u a d r a d o d e in d e p e n d e n c ia e n la q u e s e p r u e b a la
h ip te s is a n iv e l 0 ,0 5 d e s ig n ific a c i n .
g T otal

T a m a o d e l efecto

N T otal
P equeo
($*0,10)

M e d ia n o

G ra n d e

Hy * 0 , 3 0 )

(4) = 0 ,5 0 )

25
50
100
200

0,08
0,11
0,17
0 ,2 9

0 ,3 2
0 ,5 6
0,85
0,9 9

0 ,7 0
0 ,9 4

25
50
100
200

0,07
0,0 9
0,13
0,23

0,25
0 ,4 6
0 ,7 7
0,97

0,60
0,90

25
50
100
200

0,07
0 ,0 8
0 ,1 2
0 ,1 9

0,21
0 ,4 0
0,71
0 ,9 6

0 ,5 4
0 ,8 6
0 ,9 9
*

25
50
100
200

0,0 6
0,08
0,11
0,17

0,19
0 ,3 6
0 ,6 6
0 ,9 4

0 ,5 0
0 ,8 2
0 ,9 9
*

*Casi i.

4 Cohen (1988, pp. 228-248) proporciona tablas ms detalladas. Las tablas de Cohen se basan en un tamao del efecto
denominado w, que es equivalente al phi pero no al phi de Cramer. En la pgina 222, Cohen ofrece tambin una til ta
bla de conversin de phi de Cramer a w.
5 Cohen (1988, pp, 253-267) proporciona tablas ms detalladas. Para utilizar esas tablas, debe tenerse en cuenta lo indi
cado en la nota al pie na 4. Adems, Duniap y Myers (1997) han demostrado que, con una tabla 2 x 2, la cantidad apro
ximada de participantes necesarios para una potencia de 80 - 90% es 8/<f>2.

Tabla 14-12.
Cantidad total aproximada de participantes necesarios para una potencia del 80% en una prueba
chi-cuadrado de independencia, en la que se prueba la hiptesis al nivel 0,05 de significacin.
T am ao d el efecto

g l T otal
P equeo
(<$> = O J O)

1
2
3
4

783
964
1.090
1.194

M e d ia n o

G ra n d e

f<|> = 0 ,3 0 )
87
107
121
133

f<t> = 0 ,5 0 )
26

39
44
48

ejemplo, supongamos que planificamos un estudio con una tabla de contingencia 3 x 3 (gl~ 4),
que esperamos un gran tamao del efecto y que utilizam os el nivel 0,05 de significacin. De
acuerdo con la tabla, slo necesitaramos 48 participantes (aproximadamente 5 6 por casilla).

CONTROVERSIAS Y LIMITACIONES____________________________________
H ace m edio sig lo , Lew is y Burke (1949) publicaron un trabajo memorable acerca de la u tili
zacin inadecuada del chi-cuadrado. Enum eraron nueve errores comunes aparecidos en publi
caciones y dieron numerosos ejem plos de cada uno de ello s. Con una sola excepcin, su obra
sigue vigente a travs de los aos. Lo s errores siguen com etindose, y an siguen considern
doselos errores.
L a nica excepcin de esa descripcin crtica es el error que L ew is y B urke consideraban la
debilidad ms comn en la utilizacin del chi-cuadrado: frecuencias esperadas demasiado ba
ja s. E n la actualidad, aparentemente esperar cantidades pequeas para las casillas puede no ser
un problema tan grave. Lew is y Burke, como la m ayora de los autores de textos sobre estads
tica de su tiempo, sostenan que cada casilla de una tabla de contingencia (y cada categora de
una prueba de bondad de ajuste) debera tener una frecuencia esperada de tamao razonable.
Recomendaban un m nim o de 10, siendo 5 la cantidad lm ite inferior. Otros recomendaban ci
fras que iban del 1 al 20. Incluso S ir Ronald Fish er (1938) tom partido, recomendando 10 co
mo mnim o. A sim ism o, otros recomendaban que el m nim o deba ser una proporcin del total,
o que dependa del hecho de que las frecuencias esperadas fueran iguales o no. (A propsito,
cabe m encionar que lo que se estaba debatiendo eran frecuencias m nim as esp erad as, no fre
cuencias observadas)
Desde el ao 1949, cuando Lew is y Burke publicaron su trabajo, han habido algunas investi
gaciones sistem ticas acerca de cules eran exactamente los efectos de pequeas frecuencias es
peradas. (En esos estudios se aplican los mtodos de M ontecario; vase cuadro 10-1). C u l es la
conclusin? A l igual que en la m ayora de las reas, la controversia an no est totalmente defini
da. Sin embargo, una importante revisin de las investigaciones realizadas sobre el tema (Deiucchi, 1983) plantea dos conclusiones principales:

1.
"Como norma general, el chi-cuadrado puede usarse apropiadamente en casos en que lo
valores esperados son m ucho m enores a lo s que anteriorm ente se consideraban p erm isi
bles" (p. 168). Incluso frecuencias esperadas tan bajas como 1 por casilla pueden ser aceptables
en trminos del error Tipo I, siempre que en total exista una cantidad razonable de individuos.

Aparentemente, el principio ms importante es que la cantidad de individuos debera ser, al me


nos, cinco veces la cantidad de casillas. Por ejemplo, una pequea frecuencia esperada sera acep
table en una tabla de contingencia 2 x 2, si hubiera al menos 20 participantes en el estudio.*6
2.
Sin embargo, D elucchi cita a un investigador que concluye que, aunque puede ser acepta
ble utilizar el chi-cuadxado con pequeas frecuencias esperadas (en el sentido de que a la larga no
produce demasiados errores Tipo I). de todos modos no es un mtodo muy sensato, ya que la po
sibilidad de obtener un resultado significativo, aun si la hiptesis de investigacin es verdadera,
puede ser bastante escaso. E s decir, con pequeas frecuencias esperadas, la potencia es muy baja
y entonces se corre el riesgo de que se produzcan errores Tipo II.

LAS PRUEBAS CHI-CUADRADO SEGN SE DESCRIBEN


EN LAS PUBLICACIONES CIENTFICAS
Lo s informes de pruebas chi-cuadrado generalmente incluyen las frecuencias en cada categora o casi
lla, al igual que los grados de libertad, la cantidad de participantes, el chi-cuadrado calculado y el nivel
de significacin. Por ejemplo, Harter et al. informaron sus hallazgos con respecto al estilo de rela
cin de los hombres concentrados en s mismos como x2(2, n = 101) = 11,89, p < 0,005" (p. 156).
Veamos otro ejemplo completo de prueba chi-cuadrado de bondad de ajuste. Sandra M oriarty
y Shu-Ling Everett (1994) realizaron un estudio acerca del modo de m irar televisin. En el marco
del estudio, un grupo de alumnos de posgrado visitaron 55 hogares diferentes y observaron a los
televidentes durante sesiones de 45 minutos. Una parte de los resultados comparaba qu cantidad
de personas observadas podan ser incluidas en una de cuatro categoras diferentes:

zapping (cambiar de canal muy rpidamente), la categora dominada por el tipo de comportamiento
ms activo, ocurri con ms frecuencia en el 33% de las sesiones (n - 18). La categora pastoreo (cu
riosear los canales durante algunos perodos) domin el 24% de las sesiones ( n - 13), y un 22% corres
ponda a cada una de las categoras de visin continua y prolongada (n = 12). Las diferencias no fueron
estadsticamente significativas (x2 = 1,79, gl~3,p> 0,05),
El

L a s publicaciones de pruebas chi-cuadrado de independencia proporcionan a m ism a inform a


cin bsica acerca de los chi-cuadrados. Por ejem plo, los resultados del estudio de S te il y Hay
sobre los profesionales se inform aron del siguiente modo: x 2 (2, N - 118) ~ 8,76, p < 0,05
(p. 432).
Veamos otro ejemplo tomado de una publicacin acerca del modo en que se informa una
prueba chi-cuadrado de independencia. John Lydon y sus socios (1997) realizaron un estudio que
comparaba relaciones a larga distancia y locales. Lo s investigadores primero repartieron cuestio
narios a un grupo de alumnos un mes antes de que dejaran sus casas para comenzar su primer se-

6 Supongamos que tenemos una tabla mayor a 2 x 2, con una categora o casilla que tiene una frecuencia esperada ex
tremadamente pequea (o incluso una frecuencia esperada moderadamente pequea si la cantidad de participantes
tambin es pequea). Una solucin es combinar categoras relacionadas para aumentar la frecuencia esperada y redu
cir la cantidad total de casillas. S in embargo, la anterior es una solucin de ltimo recurso si la adaptacin se realiza
basndose en los resultados del experimento. El problema es que se estara capitalizando el hecho de conocer e l resul
tado. La mejor solucin es agregar personas al estudio, pero si esto no fuera factible, a veces se puede aplicar un pro
cedim iento alternativo, denominado prueba exacta de Fisher, que se describe ea algunos textos sobre estadstica de
nivel intermedio. .

mestre en la Universidad Me G il (tiempo 1). Algunos de estos alumnos teman parejas que vivan
en el rea de M cG ill, otros teman parejas que vivan lejos de M e G il. Lo s investigadores se pusie
ron en contacto con los participantes nuevamente durante el semestre de otoo, preguntndoles por
el estado actual de sus relaciones de pareja (tiempo 2). E l siguiente es el informe de sus resultados:
De ios 69 participantes
55 estaban involucrados en relaciones a larga distancia y 14 en relaciones
locales (parejas que vivan dentro de los 200 km de donde vivan ellos). Coherentemente con nuestras
predicciones, 12 de las 14 relaciones locales estaban intactas al tiempo 2 (86%), mientras que slo 28
de las 55 relaciones a distancia permanecan intactas (51%). x2( L =69) = 5,55, p < 0,02. (p. 108)
Aunque Lydon et a l no indicaron el tamao del efecto de resultado significativo, podemos calcu
larlo a partir de la inform acin proporcionada. E l clculo estadstico apropiado para el tamao del
efecto es el coeficiente phi, ya que se trata de una tabla chi-cu adrado 2 x 2 (local contra larga dis
tancia x intacto contra terminada). S i aplicam os la frmula:

E l resultado de la frmula sugiere que existe un tamao del efecto moderado.

Resumen
La s pruebas chi-cuadrado son pruebas de hiptesis para variables nominales. E l chi-cuadrado m i
de el grado de discrepancia entre frecuencias esperadas y observadas de varios niveles o catego
ras. Se calcula encontrando la diferencia entre la frecuencia observada y la frecuencia esperada
de cada categora o combinacin de categoras, elevando esa diferencia al cuadrado (para elim i
nar signos positivos y negativos) y dividindola por la frecuencia esperada (para que las diferen
cias cuadrticas sean ms proporcionales a las cantidades involucradas). Luego se suman los
resultados de todas las categoras o combinaciones de categoras. L a distribucin chi-cuadrado es
una distribucin conocida, y los puntos de cortes pueden encontrarse en una tabla estndar.
L a prueba chi-cuadrado de bondad de ajuste se utiliza para probar la hiptesis de que una dis
tribucin de frecuencias de dos o m s categoras de una variable nominal coincide con una distri
bucin esperada. (Las frecuencias esperadas se basan, por ejemplo, en una teora o en una
distribucin de otro estudio o circunstancia). E n este tipo de pruebas, las frecuencias esperadas se
indican de antemano o se basan en algunos porcentajes esperados (como-por ejemplo, el mismo
porcentaje para todos los grupos). Lo s grados de libertad son la cantidad de categoras menos 1.
L a prueba chi-cuadrado de independencia se u tiliza para probar la hiptesis sobre la relacin
entre dos variables nominales, es decir, si el esquema de repeticin de los participantes en la cate
gora de una variable tiene el mismo patrn proporcional dentro de cada una de las categoras de
la otra variable. Lo s datos se exponen en una tabla de contingencia, en la que las dos variables se
cruzan y las cantidades de participantes de cada combinacin se ubican dentro de cada una de las
casillas resultantes. L a frecuencia esperada para una casilla, si las dos variables son independien
tes, es el porcentaje de todas las personas en ja fila de la casilla m ultiplicado por la cantidad total
de personas en la columna de esa casilla. Lo s grados de libertad para la prueba de independencia
son la cantidad de columnas menos 1, m ultiplicada por la cantidad de filas menos 1.
E l tamao del efecto estimado para una prueba chi-cuadrado de independencia (ei grado de
asociacin), con una tabla de contingencia 2 x 2, es el coeficiente phi; y con tablas mayores, es el

phi de Cramer. Ptii es la raz cuadrada del resultado de la divisin del chi-cuadrado calculado por
la cantidad de participantes. E l phi de Cram er es la raz cuadrada del resultado de la divisin del
chi-cuadrado, calculado por el producto de la cantidad de participantes por los grados de libertad
de la dimensin ms pequea de la tabla de contingencia. Estos coeficientes v^n de 0 a 1; 0 indica
una independencia perfecta y 1 una relacin perfecta. U n phi de 0,10 se considera un tamao del
efecto pequeo, de 0,30 un tamao del efecto mediano y de 0,50 un gran tamao del efecto.
Las pruebas chi-cuadrado no tienen supuestos relacionados con las distribuciones normales
de sus variables, pero s requieren que la categora o casilla en la que se incluye a un participante
sea independiente de la categora o casilla de cualquier otro participante.
L a frecuencia nnnima aceptable para una categora o casilla ha sido tema de controversias.
Actualmente, el mejor consejo es tener en cuenta que, incluso pequeas frecuencias esperadas, no
aumentan seriamente las posibilidades de un error Tipo X, siempre que haya al menos una canti
dad de individuos igual a cinco veces la cantidad de categoras (casillas).
No obstante, las pequeas frecuencias esperadas reducen seriamente la potencia y deben evi
tarse siempre que sea posible.

Trminos clave
-

Variable categrica.
Distribucin chi-cuadrado.
Chi-cuadrado (x 2).
Tabla chi-cuadrado.
Prueba chi-cuadrado de
bondad de ajuste.

- Prueba chi-cuadrado
de independencia.
- Tabla de contingencia.
- Phi de Cramer.
- Frecuencia esperada.

Ejercicios
Lo s ejercicios im plican la realizacin de clcu
los (con la ayuda de una calculadora). L a ma
yora de los problemas estadsticos reales se
resuelven por computadora, pero aunque exis
ta la posibilidad de utilizarla, es conveniente
realizar estos ejercicios manualmente para in
corporar el mtodo de trabajo.
Para adquirir prctica en la utilizacin de
una computadora, para resolver problemas es
tadsticos, se puede utilizar la seccin de com
putacin de cada captulo, publicada en la

Gua de estudio y libro de tareas de computa


cinpara el alumno [Student's Study Guide and
Computer Workbook] que acompaa este libro.
Todos los datos de esta seccin son ficti
cios (a meaos que se especifique lo contrario).

Independencia.
Variable nominal.
Frecuencia observada.
Coeficiente phi (<f>).

L a s respuestas a los ejercicios de la serie I


se encuentran al final del libro.

SERIE I
1.
Calcule una prueba chi-cuadrado de
bondad de ajuste para cada uno de los siguien
tes casos (utilice el nivel 0,05 para cada uno):
C a teg o ra

E sp era d o

O b se rv a d o

A
B
C
D
E

20%
20%
40%
10%
10%

19
11
10
15
15

C a teg o ra

E sp er a d o

O b servad o

I
n

30%
50%
20%

100
100

ni

100

1
2

C antidad
en el p a sa d o

100

3
4

300
50
50

C a teg o ra

O bservado*

Artes
C iencias
Hum anidades

37

O b serv a d o
38
124

22
16

21
32

a Lo esperado es la misma cantidad en cada categora.

2. Un director de una pequea clnica de


psicoterapia intenta planificar la contratacin
de personal temporario para que colabore con
la tarea de admisin de los pacientes, y se pre
gunta s la actividad de la clnica difiere entre
las distintas temporadas del ao. El ltimo ao
ingresaron 28 nuevos pacientes en invierno, 33
en primavera, 16 en verano y 51 en el otoo.
Sobre la base de la informacin del ao ante
rior, el director debera concluir que existe
una diferencia entre las distintas estaciones?
(Utilice un nivel de 0,05) a) Realice los cinco
pasos de la prueba de hiptesis, b) Explique su
respuesta a una persona que nunca ha tomado
un curso de estadstica. (Nota: este ejercicio es
similar al ejemplo de Harter et al., en el que se
calcula un chi-cuadrado para una sola variable
nominal. No se trata de una prueba chi-cuadra
do de independencia y no incluye tablas de
contingencia).
3. Foiwell et al. (1997) entrevistaron a un
grupo de adultos, de 54 aos o mayores, acerca
de la relacin que mantenan con sus herma
nos. Una de las preguntas planteaba si haba
ocurrido algn cambio en la proximidad emo
cional a travs de los aos. Descubrieron que
43 de los entrevistados percibieron cambios
en la proximidad emocional de las relaciones
con sus hermanos
[y] 14 no informaron
cambios en la proximidad de la relacin con
sus hermanos (p. 846). Tambin probaron si
la diferencia era mayor de lo que se esperara
por casualidad (que sera una proporcin de
50 y 50). Un anlisis chi-cuadrado revel que
los entrevistados percibieron cambios en la

proximidad de las relaciones con sus herma


nos (x*23= 14,75, gl = 1, a = 0,05). (p. 846)
a)
Calcule usted mismo el chi-cuadrad
(muestre su trabajo). Sus resultados deberan
ser iguales a los anteriores, teniendo en cuenta
las diferencias por redondeo, b) Explique el re
sultado a una persona que nunca ha tomado un
curso de estadstica.
4.
Realce una prueba chi-cuadrado de in
dependencia para cada una de las siguientes
tablas de contingencia (utilice el nivel 0,01).
Adems, calcule el ph o phi de Cramer para
cada una:

10

16

16

10

10

16

16

10
10 10

100 106
106 100

100 160
160

10

10

16

oi

C a teg o ra

16 16
10 16

16

16

10

10
16

5.
Un psiclogo especializado en educa
cin est interesado en saber si los alumnos
que utilizan mquinas de escribir o procesado
res de texto (o ninguno de ellos) para escribir,
cuando realizan tareas en sus hogares, tienden
a utilizar lapicera o lpiz cuando toman apun
tes en clase. El investigador entrevista a 200
alumnos. Los resultados aparecen en la tabla
que sigue a continuacin. Existe una relacin
significativa entre estas dos variables? (Utilice
el nivel 0,05). a) Realice los cinco pasos de la
prueba de hiptesis, b) Calcule el phi de Cra
mer. c) Explique su respuesta a una persona
que nunca ha tomado un curso de estadstica.
Artefacto utilizado
en sus hogares

1 e

M q u in a d e P r o c e s a d o r

V
s
t
S
mr
V* T
g o*
S

L a p ic e r a
P p iz

e s c r ib ir

d e te x to s

.; 42 . ;

' 62.
38

18

N in g u n o

26
14

6.
Un analista poltico est interesado e
saber si existe relacin entre la comunidad en
la que vive una persona y la opinin de esa per
sona con respecto a una futura iniciativa de vo-

tacin acerca de la conservacin del agua. El


analista entrevista a 90 personas telefnica
mente y obtiene los resultados que aparecen
a continuacin. A un nivel de 0,05, est rela
cionada la opinin con la comunidad? a) Rea
lice los cinco pasos de la prueba de hiptesis,
b) Calcule el phi de Cramer y la potencia, c) Ex
plique su respuesta a una persona que nunca ha
tomado un curso de estadstica.
Comunidad Comunidad Comunidad

A fa vo r
E n c o n tr a
N o e m ite o p in i n

12

.18.

12

' 3
:

SERIEN
1. Calcule una prueba chi-cuadrado de
bondad de ajuste para cada uno de los siguien
tes casos (utilice el nivel 0,01 para cada uno de
ellos):23
C a tegora

E sp er a d o
2%
14%
34%
34%
14%
2%

1
2
3
4
5

'

15 '

C ategora

P rop orcin
e sp era d a

O b servad o
5
15
90

120
50

20
O b servad o

12 ; '

A
B
C

1/3

1/6
1/2

10
10
10

7.
Shi et al. (1997) entrevistaron a 558 m
2. Calcule una prueba chi-cuadrado para
dicos que realizan atencin primaria en Caroli
cada
uno de los siguientes casos utilizando el
na del Sur, concentrndose en las diferencias
nivel 0,05. En cada ejercicio, la distribucin
entre aquellos que han tratado o no a pacientes
esperada es que las frecuencias sean iguales en
con hv/ seda. Algunos de los resultados apare todas las categoras. (Se trata de ejercicios si
cen en la tabla 14-13. (La tabla indica porcen milares al ejemplo de Harter et al. en los que
tajes, no nmeros reales). Concntrese en el realizamos un chi-cuadrado para una sola va
resultado que aparece cerca del final y que riable nominal. No son pruebas chi-cuadrado
muestra la relacin entre la cantidad de horas de independencia y no incluyen tablas de con
que el mdico generalmente ejerce por semana tingencia).
y el hecho de que el mdico hubiera tratado o
a ) 5 1 0 5 b) 10 15 10 c) 1 0 2 0 10 d ) S 1 5 5
no a pacientes con hv/ sida ; el resultado tiene
3. Una investigadora necesita estar segu
un chi-cuadrado de 15,1. a) Calcule usted mis
ra de que la muestra para su estudio no deje
mo el chi-cuadrado (muestre su trabajo); sus de ser representativa de la distribucin de
resultados deberan ser iguales a los indicados, grupos tnicos de su comunidad. La muestra
teniendo en cuenta las diferencias de redon incluye 300 blancos, 80 africanos america
deo. (Para resolver el ejercicio deber convertir nos, 100 latinos, 40 asiticos y 80 personas
los porcentajes en nmeros reales. Observe de otros grupos tnicos. En la comunidad, se
que los porcentajes dados son los porcentajes gn registros de censos, hay un 48% de blan
de las personas en la columna. Por lo tanto, en cos, un 12% de africanos americanos, un
el caso de los mdicos que ejercen 40 horas por 18% de latinos, un 9% de asiticos y un 13%
de otros grupos tnicos. Es la muestra repre
semana o menos y han tratado a pacientes con
sentativa o no de la poblacin de la comuni
hiv/ seda, el 11% es igual a 37 mdicos. (Es de
dad? (Utilice el nivel 0,05). a) Realice los
cir, 11% x 335 = 37, redondeando para obtener cinco pasos de la prueba de hiptesis, b) Ex
la cantidad entera de mdicos ms cercana), b) plique su respuesta a una persona que nunca
Calcule el phi de Cramer. c) Explique su resul ha tomado un curso de estadstica. (Nota: el
tado a una persona que nunca ha tomado un ejercicio es similar al ejemplo de Harter et
al., en el que realizamos un chi-cuadrado pacurso en estadstica.

T a b la 1 4 - 1 3 .
C a r a c t e r s tic a s d e m o g r fic a s d e lo s m d ic o s e n tr e v is ta d o s (e n p o r c e n ta je s ).

T o ta l

C a r a cter stic a s

f /V - 5 5 8 )

Especialidad de atencin primaria


Prctica fam iliar
34
M edicina interna
18
3
Enferm edades infecciosas
Pediatra
11
O bstetricia/ginecologa
14
Otras
21
Edad
S35
16
3 5 -4 4
41
4 5 -5 4
21
5 5 -6 4
15
65 m s
8
S exo
M asculino
89
Fem enino
11
Origen tnico
M inoras
9
Raza blanca
91
Horas por sem ana en que
ejerce m edicina clnica
< 4 0 horas
16
21
4 0 - 4 9 horas
> 50 horas
63
Voluntad d e atender
3,1
P acientes con mv/stDA*

N o han
H a n tr a ta d o
t r a ta d o
p a c ie n te s c o n p a c ie n t e s c o n
HTV/SWA
HTV/SIDA
(n - 3 3 5 )

(n = 2 2 3 )

X2

36

31
14

53,8***

21
.

0
11
22

23

17

5
7

20

10

44

37

21
12
3

88
12
9
91

11
21
68
3,4

E stadstico t

3 4 ,1 * * *

21
18
14
0,7

89

11
8

0,1

'

92

15,1***

23

21
56
5

2,7

3 ***

Nota: E s p o sib le que los porcentajes no sumen 100 debido a redondeo. La mayora de lo s entrevistados (51%)
brindaron servicios a menos de 10 pacientes con hv / sida , un 4% a 10-19 pacientes, un 1% a 20-29 pacientes, un 1% a
30-39 pacientes y un 3% a 4 0 ms pacientes.
aLa variable se midi en una escala de 5 puntos que iba del 1 = nunca a 5 = siempre.

***<0,01.
Puente: Sbi, L., et a. (1997), tab. 1. M dicos de atencin primaria y barreras contra la atencin a personas con
HTV/sTDA . E va lu a ci n & P ro fe sio n e s rela c io n a d a s c o n la s a lu d (E va lu a o n & The H e a lth P ro fessio n s], 20, 164-187.
Copyright 1997, por Sage Publcatons, Inc. Reimpreso con autorizacin de Sage Publications.

ra una sola variable nominal. No es una prue


ba chi-cuadrado de independencia y no inclu
ye tablas de contingencia).
4. Realice una prueba chi-cuadrado de in
dependencia para cada una de las siguientes ta
blas de contingencia (utilice el nivel 0,05 y
adems calcule el phi o phi de Cramer y la po
tencia de cada una).

V8
S 16

8 . 8;' 8
8 s 8
8, a 16

-832

; 8 "8-' .8
1 $ 8 i-
8 8 32

8 8 8
8 '8 8
8 8 48

5. La siguiente tabla muestra los resultados


de una encuesta realizada a una muestra de

personas que asisten al ballet, distribuidas se


gn el tipo de ubicacin que adquirieron y se
gn la regularidad con la que asisten al ballet.
Existe una relacin significativa? (Utilice el
nivel 0,05). a) Realice los cinco pasos de la
prueba de hiptesis, b) Calcule el phi d Cramer. c) Explique su respuesta a una persona
que nunca ha tomado cursos de estadstica.

devueltas completas. Por lo tanto, e l porcentaje


de respuesta del grupo experimental fue del
63% {164/300-39 = 0,63). D e las 300 encuestas
enviadas por correo ai grupo de control, 40 no
fueron entregadas y 118 fueron devueltas in
completas. Por lo tanto, el porcentaje de res
puestas del grupo de control fue del 43%
(118/300 - 4 0 = 0,45). A travs de una prueba
chi-cuadrado que comparaba los porcentajes de
respuestas de los grupos experimental y de

Asistencia
R egu lar

P latea
3? - G alera prin cipal
os
d e p a lc o s
O -3
G alera

20
20
40

control descubri que el incentivo de $1 haba

O casion al

80 .
20 .:.
; 80

6.
Everett et al. (1997) realizaron una
cuesta por correo a una muestra de mdicos
elegidos al azar. A la mitad se les ofreci $1 si
enviaban el cuestionario (este era el grupo ex
perimental); a la otra mitad se la utiliz como
grupo control. El objetivo del'estudio era com
probar si aun un pequeo incentivo aumentara
el porcentaje de devoluciones de encuestas en
viadas a mdicos. Everett et al, informan sus
resultados de la siguiente forma:
De las 300 encuestas enviadas por correo al
grupo experimental, 39 no fueron entregadas; 2
fueron devueltas sin completar, y 164 fueron

mejorado de forma estadsticamente significa


tiva e l porcentaje de respuesta en comparacin
con el grupo de control [x2( l , N - 5 2 1 ) = 16,0,

p <0tG01j.
a) Calcule usted mismo el chi-cuadrado y
en
muestre su trabajo. Sus resultados deberan
ser iguales a los indicados en el prrafo ante
rior, teniendo en cuenta las diferencias de re
dondeo. (Cuando resuelva este ejercicio no
olvide que se basa slo en las respuestas que
no fueron devueltas sin entregar. Por lo tanto,
en el caso del grupo experimental hubo un to
tal de 261 respuestas, de las cuales 164 fue
ron devueltas completas y las restantes 96
no), b) Calcule phi. c) Explique el resultado a
una persona que nunca ha tomado un curso
de estadstica.

Estrategias a
aplicar cuando las
distribuciones
poblacionales
no son normales:
Transformaciones de datos, pruebas
de rango y orden y mtodos intensivos
por computadora

Descripcin del captulo


i Supuestos de losprocedimientos
! ; i estndar de prueba d hiptesis.
Transformaciones de datos,
i: ^ Pruebas de rango y orden.
Mtodos intensivos porcomputadora.
Comparacin de mtodos.
L vL
j .^;^.\'Cntroversi^XV/:. yy:.-:.:,.,:

;;.-^^Pra^e)dimiiitols/qejSe/utnizam cuando
las poblaciones parecen no normales,
segn se describen en las publicaciones
.piei^flcas^^ ^
r
:'-';^\
/'jResiincieri/ V' i'LyoV
>: Xrminos clave.
:y Ejercicios.

ste captulo analiza los procedimientos de prueba de hiptesis cuando no podemos


suponer que las distribuciones poblacionales son siquiera aproximadamente norma
les. Al mismo tiempo, analizamos situaciones en las que no podemos cumplir con
otros requisitos de los procedimientos ordinarios de prueba de hiptesis, como por
ejemplo cuando las poblaciones no tienen las mismas varianzas. Primero, revisare
mos brevemente la funcin que cumplen los supuestos en los procedimientos estndar de prueba
de hiptesis. Luego, analizamos tres mtodos utilizados por investigadores psicolgicos cuando
los resultados de un estudio no cumplen con los supuestos usuales: transformaciones de datos,
pruebas de rango y orden y mtodos intensivos por computadora.

SUPUESTOS DE LOS PROCEDIMIENTOS


ESTNDAR DE PRUEBA DE HIPTESIS
Como vimos en los captulos 9 al 13, para realizar una prueba o un anlisis de varianza es nece
sario que se cumplan ciertos supuestos. En los procedimientos de prueba de hiptesis mencio
nados, trabajamos con las observaciones de un estudio como si pertenecieran a poblaciones
mayores, aunque desconocidas. Uno de los aspectos supuestos es que las poblaciones involu
cradas tienen una distribucin normal; el otro supuesto principal es que las poblaciones tienen
la misma varianza.
Si el alumno ya ha estudiado el captulo 3, en lo que se refiere al coeficiente de correlacin
recordar que la correlacin es un procedimiento descriptivo. Sin embargo, en muchas investiga
ciones, el coeficiente de correlacin se calcula utilizando valores de una muestra de manera que el
investigador pueda realizar generalizaciones acerca de una poblacin. Cuando el propsito es el
descripto, el coeficiente de correlacin es ms preciso si las variables que se correlacionan pro

vienen de poblaciones distribuidas normalmente. Adems, se puede calcular una prueba de signi
ficacin del coeficiente de correlacin (vase apndice II dei captulo 3) y, tambin en ese caso, es
muy importante el supuesto de normalidad.1
En captulos anteriores tambin aprendimos que se obtienen resultados exactos incluso cuan
do un estudio sugiere que las poblaciones cumplen con los supuestos de curva normal y de igual
varianza en forma muy imprecisa. Sin embargo, el tema que nos preocupa en este caso son las si
tuaciones en las que queda claro que las poblaciones no son ni siquiera cercanas a lo normal, o que
ni siquiera estn cerca de tener iguales varianzas. S en esas situaciones se utiliza la prueba r o el
anlisis de varianza ordinarios, se pueden obtener resultados muy incorrectos. Por ejemplo, po
dramos realizar todos los clculos correctamente y decidir rechazar la hiptesis nula conforme a
esos resultados. Sin embargo, si las poblaciones no cumplen con los supuestos estndar, el resul
tado podra-ser incorrecto (incorrecto en cuanto a que en lugar de existir realmente un 5% de pro
babilidad de obtener los resultados si la hiptesis nula es verdadera, en realidad podra haber un
15% 20% de probabilidad!).
No debemos olvidar que los supuestos se refieren a las poblaciones y no a las muestras. Es
bastante probable que una muestra no siga una curva normal aunque provenga de una poblacin
que s lo hace. La figura 15-1 representa grficamente histogramas de varias muestras, cada una
tomada al azar de una poblacin que sigue una distribucin normal. (En la figura se observa que
cuanto menor es la muestra, ms difcil es notar que proviene de una poblacin normal). Por su
puesto, es bastante probable que poblaciones no normales produzcan cualquiera de esas muestras
tambin, Lamentablemente, la muestra es todo o que tenemos cuando realizamos un estudio. Lo
que los investigadores hacen es trazar un histograma que represente la muestra y, si el grfico no
es significativamente diferente de lo normal, los investigadores suponen que la poblacin de don
de proviene es normal. Cuando se trata de normalidad, la mayora de los investigadores psicolgi
cos considera que una distribucin es inocente hasta que se demuestre lo contrario.
Una situacin comn en la que un investigador podra dudar del supuesto en cuanto a que
la poblacin sigue una distribucin normal, es cuando existe un efecto techo o piso (vase cap
tulo 1). Otra situacin comn que origina las mismas dudas es aquella en la que la muestra tie
ne valores atpicos, casos extremos a uno o a ambos lados de la distribucin muestral. La figura
15-2 representa grficamente algunos ejemplos de distribuciones con casos atpicos. Los casos
atpicos son un gran problema para ios mtodos estadsticos que utilizamos comnmente, ya
que estos se basan, en ltima instancia, en desvos cuadrticos de la media. Al encontrarse tan
lejos de la meda, un caso atpico tiene una gran influencia cuando elevamos al cuadrado su
desvo con respecto a la media. El resultado es que un slo caso atpico, si es lo suficientemen
te extremo, puede hacer que una prueba estadstica resulte significativa aun cuando todos ios
otros valores no io haran. Un caso atpico tambin puede hacer que un resultado que sin l se
ra significativo, no lo sea.

1A l calcular la significacin de la regresin (captulo 4) suponemos que en la poblacin, para cada nivel de la variable de
prediccin, la variable dependiente es normal. Tambin suponemos que la varianza de la variable dependiente es la
misma para cada nivel de la variable de prediccin. En la correlacin (captulo 3), el requisito es an ms estricto, siendo
necesario que cada variable y las combinaciones de variables tengan distribuciones normales. Textos ms avanzados pre
sentan mtodos sofisticados para identificar si se cumplen los supuestos mencionados. Sin embargo, al menos podemos
considerar que los supuestos no han sido cumplidos si los datos de la muestra sugieren que en la poblacin la distribu
cn general con respecto a la variable dependiente (en la regresin), o a ambas (en la correlacin), no es normal.
.

/V= 10, M -0,18, SD = l,] i

"2,0 -1,5 ~i,0 -0,5

0 , 0,5

1,0

1,5 2,0';

V 30, M = 0,27; SD ='0,5S7


12

S- '

.MI

4
i

N= 10, Af= 0,22,.


-

= M. '

^ '&

IlMS

"A: f e s c ; '
-2,0 -{,5 -1,0 -0,5

0,5

SlllliS

fri:

{,0

v ":

,5; :2,0;.:--y

o -
-2,0' - i.5 ~:l-.0 -0,5; 0jV~

0,5 4,0: 1,5. 2,0

10, M * 0,04,52) =.,13

Figura 15-2.
Distribuciones coa casos atpicos en uno o arabos lados.

Figura 15-1.
Histogramas de varias muestras elegidas al azar,
tomadas cada una de una poblacin normal con
|X = 0 y a = I.

TRANSFORMACIONES DE DATOS
Un procedimiento ampliamente utilizado cuando los valores de la muestra no parecen provenir de
una poblacin normal es cambiar los valores! Por supuesto que no se inventan, aunque eso puede
parecer antes de que expliquemos el procedimiento. El mtodo consiste en que el investigador
aplique algn procedimiento matemtico a cada valor, como calcular la raz cuadrada, para hacer
que una distribucin no normal se acerque ms a lo normal. (Algunas veces este procedimiento
tambin logra que las varianzas de dos o ms grupos se asemejen ms). El proceso que describi
mos en el prrafo anterior se denomina transformacin de datos. Una vez que hemos realizado
una transformacin de datos, si se cumplen los otros supuestos podemos entonces calcular una
prueba t, un anlisis de varianza o una correlacin ordinaria y, as, obtener resultados precisos.

La transformacin de datos tiene una ventaja importante con respecto a otros procedimientos
que aprenderemos para trabajar con poblaciones no normales; una vez que hemos realizado una
transformacin de datos, podemos utilizar procedimientos familiares y sofisticados de prueba de
hiptesis.
Analicemos un ejemplo. Las medidas de tiempo de reaccin usualmente son muy asimtricas
hacia la derecha. Hay muchas respuestas cortas (rpidas) y unas pocas, pero a veces muy extre
mas, largas (lentas). Es improbable que los tiempos de reaccin que aparecen en la figura 15-3
provengan de una poblacin que sigue una curva normal; en realidad es probable que la propia
poblacin de tiempos de reaccin sea asimtrica.
Sin embargo, supongamos que sacamos la raz cuadrada de cada tiempo de reaccin. La ma
yora de los tiempos de reaccin sern apenas afectados. Un tiempo de reaccin de 1 segundo
contina siendo 1; un tiempo de reaccin de 1,5 segundos se reduce a 1,22. Pero los tiempos de
reaccin muy lentos, los que crean la larga cola hacia la derecha, son reducidos sustancalmente;
Por ejemplo, un tiempo de reaccin de 9 segundos se reduce a 3, y un tiempo de reaccin de 16
segundos (la persona realmente estaba distrada y se olvid de la tarea que estaba realizando) se
reduce a 4. La figura 15-4 muestra el resultado despus de sacar la raz cuadrada de cada tiempo
de la distribucin asimtrica representada en la figura 15-3. Despus de una transformacin raz
cuadrada, parece mucho ms probable que la distribucin de ios tiempos de reaccin provenga
de una poblacin con una distribucin normal (de valores transformados).
Legitimidad de la transformacin de datos
Es un engao el proceso que describimos? Lo sera si se realizara slo con algunos valores o de
algn otro modo que hiciera el resultado ms favorable a la prediccin del investigador. Sin em
bargo, en las investigaciones reales, el primer paso despus de recopilar y registrar los datos (y
controlar su precisin) es observar si sugieren que las poblaciones cumplen con los supuestos. Si
los datos sugieren que las poblaciones no cumplen con los supuestos, entonces el investigador
realiza transformaciones de datos. La prueba de hiptesis se realiza slo despus del control men
cionado y cualquier transformacin necesaria.2
No debemos olvidar que cualquier transformacin de valores debe realizarse con todos los
valores de esa variable, no slo con los de un subgrupo determinado. Lo ms importante es que,
cualquiera sea el procedimiento de transformacin que utilicemos, el orden de los valores siem
pre es el mismo. Un valor original, que es el segundo ms alto de un grupo de valores, continuar
siendo el segundo ms alto en el grupo de valores transformados.
Puede parecer que el procedimiento distorsiona de algn modo la realidad para adecuarla a la
estadstica. En algunos casos, esta es una preocupacin legtima. Supongamos que se analiza
la diferencia de ingresos entre dos grupos. Probablemente no nos interese cunto difieren los

7 U n a v e z q u e s e com pleta un estu d io, y antes de realizar cualquier c lcu lo estad stico descriptivo o prueba d e signifi
ca ci n , lo s investigadores prim ero controlan cu id ad osam en te q u e toda !a inform acin haya sid o registrada correcta
m en te e ingresad a c o n precisin e n la com putadora. D esp u s controlan cada variable en cu an to a la form a de su d is
tribucin, para ver s i su p ob lacin difiere seriam ente d e lo norm al, p roceso qu e se denom ina exp lo ra ci n d e datos. La
exp loracin d e datos es un trabajo ted ioso, y lo s investigadores estn naturalm ente a n sio so s d e encontrar lo antes posi
b le la form a en la que fu nciona el estudio. S in em bargo, io s investigadores experim entados han aprendido que vale la
pena p osponer la prueba d e h ip tesis para realizar n bu en anfisis exploratorio d e datos. E s m u y frustrante realizar
tod o tipo d e anlisis y lu eg o descubrir qu e e l trabajo ha sid o un a prdida d e tiem p o porque hab a u n error en el ingreso
d e la in form acin o porque una d e las variables n ecesitab a ser transform ada. (D e h ech o , es peor q u e una prdida de
tiem p o. E l investigador pu ed e entu siasm arse o desanim arse m u ch o co n su s supuestos resultados y lu e g o descubrir que
las c o n clu sio n es no tenan s en tid o y q u e d eb e co m en za r to d o e l p roceso nu evam ente).

F ig u r a 1 5 -3 .

Distribucin asimtrica de tiempos de


reaccin (datos ficticios).

F ig u r a 1 5 -4 .

Datos de la figura 15-3 despus de ia


transformacin raz cuadrada.

dos grupos con respecto a la raz cuadrada de sus ingresos, sino que lo importante es la diferen
cia en dlares reales.
Por otro lado, analicemos el cuestionario sobre autoestima. Las puntuaciones del cuestionan
rio no tienen ningn significado directo. Las puntuaciones ms altas indican mayor autoestima; .
las puntuaciones ms bajas, menor autoestima. Sin embargo, cada unidad de aumento en la prue
ba no necesariamente est relacionada con una cantidad igual de aumento en la autoestima de un .
individuo. Es verosmil que la raz cuadrada de cada incremento de una unidad est directamente:
relacionada con la autoestima de una persona. De modo similar, si analizamos el ejemplo utiliza
do anteriormente acerca del tiempo de reaccin, medido en segundos, la medicin parecera tener
un significado directo. Sin embargo, incluso en ese caso, la variable implcita, eficiencia del pro
cesamiento del sistema nervioso, puede no estar directamente relacionada con la cantidad de se
gundos. Probablemente es una operacin compleja que sigue alguna regla matemtica desconocida
(aunque siempre esperaramos que los tiempos ms cortos indicaran un procesamiento ms efi
ciente, y tiempos ms largos un procesamiento menos eficiente).
En los ejemplos anteriores, el patrn implcito de la variable es desconocido. Por lo tanto,'
no existe razn para pensar que la versin transformada sea un reflejo menos preciso de la reali
dad que la versin original. Y la versin transformada puede cumplir el supuesto de normalidad.
Tipos de transformaciones de datos
Existen distintos tipos de transformaciones de datos. Ya hemos ilustrado una transformacin raz
cuadrada: en lugar de utilizar cada valor, se utiliza su raz cuadrada. Las figuras 15-3 y 15-4 ilus
tran un ejemplo, y la figura 15-5 representa grficamente el efecto general; una distribucin asi
mtrica hacia la derecha se transforma en una distribucin menos asimtrica hacia la derecha des
pus de. la transformacin raz cuadrada. Para expresarlo numricamente, los nmeros moderados
se convierten en nmeros levemente menores y los nmeros altos se convierten en nmeros mu
cho menores. El resultado es que el lado derecho es empujado hacia el centro.

Figura 15-5.

Distribuciones a las que se les apli


can las transformaciones apropia
das: (a) moderadamente asimtrica
hacia la derecha, se aplica a la trans
formacin raz cuadrada; (b) marca
damente asimtrica hacia la derecha,
se aplica a la transformacin iog, y
(c) extremadamente asimtrica hacia
la derecha, se aplica a la transforma
cin inversa.

Qu sucede si ia distribucin es asimtrica hacia ei otro lado (hacia la izquierda)? En este ca


so, primero podemos reflejar todos los valores, es decir, restarlos a un nmero alto de modo que
todos se reviertan. Despus de reflejar los valores, una distribucin que era asimtrica hacia la iz
quierda se transforma en asimtrica hacia 1a derecha, y una transformacin raz cuadrada produ
cir el efecto correcto. Sin embargo, cuando reflejamos los valores, al analizarlos resultados fina
les debemos recordar que hemos revertido la direccin de los valores. Lo que se sola considerar
un valor alto ahora es un valor bajo, y viceversa.
Otra transformacin muy comn es la transformacin log. Una transformacin log tiene l
mismo efecto general que la transformacin raz cuadrada. Hace que una distribucin asimtrica
hacia ia derecha sea menos asimtrica hacia ia derecha. Pero ia transformacin log es ms severa.
Puede convertir en normal a una distribucin incluso ms extremadamente asimtrica. La figura
15-5b representa grficamente la situacin descripta.
El alumno seguramente recordar, de las clases de matemticas de la escuela secundaria, que
un logaritmo es el exponente al que se debe elevar un nmero base (como por ejemplo 10) para
obtener el nmero original. Por ejemplo, el logaritmo d 100 de base 10 es 2; para obtener el n
mero 100 debemos elevar 10 a la segunda potencia (lo elevamos al cuadrado). En otras palabras,
2 es el valor correspondiente a 100 despus de una transformacin log (utilizando logaritmos con
base 10). El logaritmo de 1.000 sera 3; 10 a la tercera potencia (al cubo) es 1.000; 3 es el valor
correspondiente a 1.000 despus de una transformacin log. El logaritmo de 10 es 1 (cualquier
nmero a la primera potencia es el mismo nmero) y el logaritmo de 1 es 0 (cualquier nmero ele
vado a 0 es I), El valor 10 se transforma en 1 y el valor 1 se transforma en 0. Los nmeros inter
medios tienen logaritmos con cifras decimales. El logaritmo de 50 es 1,70; de 60 es 1,78; de 8 es
0,90, y de 328 es 2,52. Un rango de 1 a 1.000 se ha reducido a un rango de 0 a 3, siendo el efecto
mucho mayor cuanto ms altos son los nmeros.
No es necesario calcular logaritmos, el clculo se realiza con cualquier calculadora. Uno de los
aspectos ms importantes que debemos recordar es que una transformacin log produce exacta
mente el mismo efecto que una transformacin raz cuadrada, slo que en mayor grado. Se aplica
ra cuando la distribucin de los datos fuera tan asimtrica hacia la derecha que una transformacin
a ia raz cuadrada tampoco puede convertir' la distribucin en una distribucin aproximadamente
normal.
Otro tipo comn de transformacin es la transformacin inversa. En este caso, se toma el
nmero inverso al valor, es decir, se lo convierte en el denominador de una fraccin en la que el
numerador es 1. El inverso de 10 es 1/10 (0,1); el inverso de 5 es 1/5 (0,2); el inverso de 1.000 es
1/1.000 (0,001). Lo importante es que una transformacin inversa tambin produce el mismo
efecto que las transformaciones raz cuadrada y log, pero es an ms extrema que la transforma
cin log. La transformacin inversa es til para datos demasiado asimtricos, incluso para ser
convertidos en normales porua transformacin log. La figura 15-5c representa grficamente es
ta situacin.
Adems, la transformacin inversa automticamente revierte la direccin de los registros. Por
ejemplo, en trminos de valores originales, 5 es menor que 10. Despus de una transformacin in
versa, el orden se revierte. La versin invertida de 5 es 1/5 (0,2), que es un nmero mayor a la ver
sin invertida de 10, que es 1/10 ( 0,1). Para mantener los datos en orden, los investigadores al
gunas veces reflejan los valores antes o despus de una transformacin inversa. Como una doble
negacin, el proceso reubica los datos en su direccin original.
Existen otras transformaciones. Por un lado, todas las transformaciones que hemos analizado
hasta ahora corrigen una distribucin asimtrica. Otras transformaciones tratan problemas de curtosis y de distribuciones abultadas. Las distribuciones basadas en proporciones o porcentajes a
menudo estn lejos de ser normales, pero pueden corregirse con lo que se denomina una distribu

cin arco-seno. Se trata de una funcin trigonomtrica disponible en algunas calculadoras y en i


mayora de los programas de estadstica para computadoras. Otras transformaciones que pode-;-:
mos encontrar son las transformaciones logit y probf\ al igual que transformaciones a distin-,
tas potencias, tales como transformaciones cuadradas o cbicas.
No daremos ejemplos de todos estos otros tipos de transformaciones. Aprender las transfor
maciones cuadrada, log e inversa ayudar a captar el principio bsico y, adems, son las trans-'
formaciones ms comunes. Lo principal acerca de los otros tipos de transformaciones es que to
das utilizan el mismo principio en cuanto a tomar cada valor y aplicarle algn clculo aritmtico,
usualmente para que la serie de valores sea ms parecida a una distribucin normal. Una vez
ms, cualquiera sea la transformacin utilizada, un valor que se encuentra entre otros dos valo
res siempre permanece entre esos, mismos dos valores.
Ejemplo de transformacin de datos

Analicemos un estudio ficticio en el que cuatro nios con valores altos en una prueba sobre alta
sensibilidad son comparados, en cuanto a la cantidad de libros ledos durante ei ao anterior, con
cuatro nios que tuvieron valores bajos en la misma prueba. (La nocin general de persona altar
mente sensible se describe en Aron, 1996 y Aron & Aron, 1997). Basndonos en la teora, el in
vestigador predice que los nios altamente sensibles habrn ledo ms libros. La tabla 15-1 refle
ja los resultados.
Comnmente, en un estudio de este tipo, que incluye una comparacin de dos grupos inde
pendientes, deberamos utilizar una prueba t para medas independientes. Pero la prueba f para
medias independientes es igual a iodos los procedimientos de prueba de hiptesis aprendidos (ex-
cepto el chi-cuadrado); requiere que la poblacin madre de observaciones de cada grupo est or-.
malmente distribuida. En este estudio, sin embargo, la distribucin de la muestra es muy asimtri
ca hacia la derecha, y los valores tienden a acumularse a la izquierda formndose una larga cola
hacia la derecha. Por eso parece probable que la poblacin de observaciones de cantidad de libros ;
ledos (tanto para nios sensibles como para los no sensibles) tambin sea asimtrica hacia la de
recha. Adems, a la luz de lo que se est midiendo, la forma descripta de la distribucin poblacional parece razonable: un nio no puede leer menos que ningn libro; pero una vez que un nio co
mienza a leer, es fcil que lea muchos libros en un ao.

Tabla 15-1.
Resultados de un estudio que compara nios altam ente y no altam ente sensibles con relacin a a
cantidad de libros ledos durante el ao anterior (datos ficticios).
Altamente sensible
No
0
3
10
22
35
8 ,7 5
9 5 ,5 8

Si
17
36
45
75
173
4 3 ,2 5
5 8 4 ,0 0

Tambin podemos observar que las varianzas poblacionales estimadas sobre la base de las
dos muestras son significativamente diferentes, 95,58 contra 584, otra razn par no querer pro
seguir con una prueba t ordinaria.
Sin embargo, supongamos que realizamos una transformacin raz cuadrada de las observa
ciones (tabla 15-2). El resultado es que ambas muestras son mucho ms adaptables a una curva
normal, y la transformacin tambin parece razonable en cuanto al significado de los nmeros.
La cantidad de libros ledos pretende ser una medida del inters literario; por lo tanto, la diferen
cia entre 0 y 1 libro es una diferencia mucho mayor que la que existe entre 20 y 21 libros.
La tabla 15-3 muestra la prueba utilizando los valores transformados. Como lo indica la ta
bla, la diferencia entre los grupos es significativa.3
Otro ejemplo de transformacin de datos
Esta vez analizaremos un ejemplo ficticio que incluye una correlacin. Si el alumno an no ha es
tudiado el captulo 3, debera pasar por alto esta seccin.
Un psiclogo especializado en educacin realiza un estudio acerca de la relacin entre la pun
tuacin en una prueba de lgebra y la nota de nivel escolar, probando a cuatro alumnos de la es
cuela. La figura 15-6 muestra el diagrama de dispersin; la tabla 15-4 mustralas observaciones y
los clculos del coeficiente de correlacin.
Como se desprende de la figura y de la tabla, existe cierto grado de correlacin. Sin embar
go, si observamos nuevamente la lista de valores observados y el diagrama de dispersin, el nio
con 95 puntos en la prueba de lgebra sobresale entre los dems. El valor 95 es un caso atpico.
Para decirlo de otro modo, las puntuaciones de la prueba de lgebra son asimtricos hacia la de
recha; se agrupan cerca del lmite inferior de las puntuaciones de la prueba y tienen una larga co
la que llega al valor 95, que se ubica lejos a la derecha. Las notas de nivel escolar no son muy di
ferentes de lo que se hubiera esperado si provinieran de una poblacin normal. Las notas se
agrupan cerca de la mitad (el 6 y el 7) y luego se dispersan un poco ms, en forma pareja, para
ambos lados (el 4 y el 9).

Tabla 15-2,
Transformacin raz cuadrada de los registros de la tabla 15-1.
A lta m en te sen sib les
______ SL

N o ______
X

'FX

<X

0
3
10
22

0,0 0
1,73
3,16
4 ,6 9

17
36
45
75

4 ,1 2
6,00
6,71
8,66

3 Si hubiramos realizado el anlisis utilizando los valores originales sin transformar, r sena igual a (43,25'- 8,75)/13,04
2,65, un t levemente menor pero an significativo. Por supuesto, no hubiera sido correcto realizar e l anlisis de ese
modo. Si el anlisis realizado con valores no transformados hubiera producido un resultado diferente, el resultado co
rrecto hubiera sido el logrado sobre la base de los valores transformados.

Tabla 15-3.
Clculos de una prueba t para medias independientes aplicando la transformacin raz cuadrada a
los valores observados del estudio acerca de los libros ledos por nios altamente sensibles contra los
no altamente sensibles (datos ficticios).
Punto de corte f para nivel 0,05 de significacin, g l = (4 - 1) + (4 - 1) = 6, una cola = -1 ,9 4 3 .

Altamente sensible
No

0,0 0
1,73
3,1 6
4,69
2:
M=

4,12
6,00
6,71
8,66

9,58
9 ,5 8 /4 = 2 ,4 0
12,03/3 = 4,01

S> =

2 5 ,4 9
2 5 ,4 9 /4 = 6,37
1 0,56/3 = 3,52
combinado"

3 ,7 7 /4 = 0,94

^ ^

=0^

3 ,7 7 /4 = 0 ,9 4

0^4 = 1,88

W nica = ^ 8 8 = 1.37
= ( 6 ,3 7 - 2 , 4 0 ) / ! ,37 = 2 ,9 0
C onclusin: se rechaza la hiptesis nula.

Qu debemos hacer entonces con la distribucin de la prueba de lgebra? Primero, en casos co


mo este, en los que hay un slo y claro caso atpico, probablemente deberamos controlar que o
existan errores de calificacin o intentar averiguar si ese individuo en particular era de algn mo
do atpico con respecto a la poblacin bajo estudio (como por ejemplo, alguien que estuviera en
un programa acelerado de aprendizaje de matemtica o cuya madre fuera una matemtica famo
sa). Sin embargo, suponiendo que nada se sabe, ni se puede averiguar, la otra solucin es transfor
mar las puntuaciones de la prueba para que no sean asimtricas. Adems, la segunda alternativa
tambin resulta razonable en este caso, ya que no tiene ningn valor especial conocer la cantidad
original de los tems correctamente respondidos en la prueba.
Los valores son asimtricos hacia la derecha, as que probablemente necesitemos utilizar una
transformacin raz cuadrada, log o inversa. Podemos comenzar intentando una transformacin
raz cuadrada. A travs de la transformacin mencionada, las puntuaciones de la prueba de lge
bra se transforman de 1,4,10 y 95 a 1,2,3,2 y 9,7. La situacin ha mejorado pero contina sien
do bastante asimtrica hacia la derecha. Se necesita una transformacin ms extrema. Podramos
intentar una transformacin log. Utilizando una calculadora (con tecla para logaritmo con base
10), calculamos los logaritmos para 1,4,10 y 95. Los resultados fueron 0,0,6,1 y 1,98. Esta vez
la distribucin resultante es slo levemente asimtrica haca la derecha, y parece ser una probable
candidata a la muestra seleccionada de una poblacin (de valores transformados a logaritmos), en
la que la mayora de los valores se agrupan n el medio y hay una cantidad menor, pero pareja, de
valores en los dos extremos.
Habiendo encontrado una transformacin adecuada, ahora podemos intentar nuevamente nues
tra correlacin. La figura 15-7 muestra el diagrama de dispersin, y la tabla 15-5 muestra los clcu-

F igura 15-6.
D iagram a de d isp ersin d e un e stu d io acerca
d e la nota d e n iv e l e sc o la r y la pu n tu acin en
una prueba de lgebra, (D a to s fic tic io s ).

Tabla 15-4.
Registros y clculos de un estudio que correlaciona las notas de nivel escolar y las puntuaciones en
una prueba de lgebra (datos ficticios).
P u n tu a ci n e n la p ru eb a
O r ig in a l

1
4
10
95

no
27,5
39,1

N o ta d e n iv el esc o la r
O r ig in a l

- 0 ,6 8
-0 ,6 0
- 0 ,4 5
10,73

4
6
9
7
26
6,5

P r o d u cto cru za d o

zr
-1 0 ,4 7
-0 ,2 9
1,47
0 ,2 9

1,00
0,17
-0 ,6 6
0 ,5 0
r =

1,01
0,25

1.7

ios. La correlacin calculada con ios valores transformados a logaritmos es de 0,65. La correlacin
calculada utilizando valores no transformados, como lo muestra la tabla 15-4, es de slo 0,25.
La tabla 15-5 tambin indica los clculos de la significacin del coeficiente de correlacin (el
procedimiento est tomado del apndice n del captulo 3). Incluso con una correlacin tan alta,
como de 0,65, con slo cuatro participantes existe insuficiente potencia para rechazar la hiptesis
nula. (Cuando se trabaja con una correlacin, la hiptesis nula establece que la correlacin en la
poblacin es 0). Sin embargo, al menos fue correcto calcular esta prueba t, en el sentido de que
habamos cumplido el supuesto de distribuciones normales. (Supongamos que hubiramos calcu
lado incorrectamente t para la correlacin de 0,25 a partir de los valores sin transformar. El t hu
biera sido de slo 0,37, contra 1,21 con los valores transformados).

PRUEBAS DE RANGO Y ORDEN


Otra forma de solucionar el problema de las distribuciones no normales es utilizar un tipo espe
cial de transformacin en la que los valores se transforman en rangos. Supongamos que tenemos
una muestra con los valores 4 ,8 ,1 2 y 64. Sera en verdad sorprendente obtener una muestra as si
la poblacin fuera realmente normal. Una transformacinde rango y orden cambiara los valo

F ig u r a 15-7.

D iagram a de d isp ersi n d el e stu d io a cerca d e


las n otas d e n iv el e sc o la r y la s p u n tu acion es e n
una prueba d e lg eb ra rep resen tado p o r la f i
gura 1 5 -6 , d esp u s d e una transform acin lo g
de las pu ntuacion es en la prueba d e lgebra
(d atos fic ticio s).

Tabla 15-5.
Observaciones y clculos de un estudio que correlaciona la nota de nivel escolar y las puntuaciones
en una prueba de lgebra transformadas a logaritmos (datos ficticios).
Puntuacin en la prueba . Nota de nivel escolar
O r ig in a l

0 ,0 0
0 ,6 0
1,00
1,98
3,5 8
0,9 0
0 ,7 2

Zx

-1 ,2 5
- 0 ,4 2
0 ,1 4
1,50

O rig in a l
4
6

9
7

Producto cruzado

zY
1,84
0,12
0,21
0 ,4 4

-1 ,4 7
-0 ,2 9
1,47
0,29

26
6,5
1.7

r =

2,61
0,65

Prueba de significacin:
Punto de corte f necesario (n ivel 0 ,0 5 , g l = 2, una cola) = 2 ,9 2 0

t = (r^~2)l4l^? = (0 ,6 5 ) ( l,4 1 ) A /i- 0 ,6 5 * = 0 ,9 2 /0 ,7 6 = 1,21


C onclusin: no s e rechaza la hip tesis nula que establece que r = 0 .

res a 1,2,3 y 4; el 1 para el nmero ms bajo del grupo, el 2 para el siguiente ms bajo, y as su
cesivamente.
La nica complicacin de la transformacin de rango y orden surge cuando existen dos o ms
valores iguales. La solucin usual.para Ios-casos en los que existen valores iguales es darle a cada
uno el promedio de los rangos correspondientes. Por ejemplo, a los valores 12, 81, 81,107 y 154
les corresponderan los rangos 1,2,5,2,5,4 y 5,
Convertir los valores en rangos es una especie de transformacin de datos, pero a diferencia
de las transformaciones que hemos analizado hasta ahora, una transformacin de rango y orden
no se utiliza para producir una distribucin normal, aunque, en efecto, produce una distribucin
particular. La distribucin que se obtiene a partir de una transformacin de rango y orden es rec
tangular, con la misma cantidad de valores (uno) para cada valor (la nica excepcin son los valo
res iguales). Los rangos producen el efecto de dispersar los valores en forma pareja.

Existen diversos procedimientos especiales de prueba de hiptesis que utilizan datos trans
formados en rangos. Se los denomina pruebas de rango y orden. Tambin tienen otros dos nom
bres comunes: dado que los datos de una poblacin con cualquier tipo de distribucin pueden
transformarse en rangos, estas pruebas a veces se denominan pruebas libres de distribucin; y
dado que la distribucin de valores convertidos en rangos no es estimada sin que se conoce con
exactitud, las pruebas de rango y orden no requieren la estimacin de ningn parmetro (valores
de la poblacin). (Por ejemplo, no hace falta estimar ia varianza de una poblacin porque pode
mos determinarla exactamente si sabemos cuntos valores la forman y que esos valores han sido
transformados en rangos). Por eso, los procedimientos de prueba de hiptesis basados en rangos
tambin se denominan pruebas no paramtricas.
Los procedimientos ordinarios de prueba de hiptesis que hemos aprendido (prueba t y anli
sis de varianza) son ejemplos de pruebas paramtricas. El chi-cuadrado, al igual que las pruebas
de rango y orden, se considera una prueba no paramtrica; sin embargo, es libre de distribucin s
lo en el sentido de que no existen supuestos sobre la forma de las distribuciones poblacionales. No
obstante, los trminos Ubre de distribucin y no paramtrico generalmente se utilizan en forma
indistinta; las sutilezas con respecto a la diferencia entre esos trminos son materia de debate entre
los estadsticos.
Las pruebas de rango y orden tienen la ventaja adicional de poder utilizarse cuando los valores
reales del estudio son rangos; por ejemplo, un estudio que compara el nivel social de dos clases de
graduados. Adems, algunas veces son cuestionables los valores numricos exactos de los nmeros
de una medida utilizada en determinado estudio. Por ejemplo, un investigador tiene la intencin de
aplicar una medida numrica en el sentido usual, siendo 7 tan superior a 5 como 12 lo es de 10 (el in
vestigador pretende que sta sea una medicin intervalar; vase captulo 1). Sin embargo, en reali
dad slo est seguro de que los nmeros estn ordenados correctamente: 7 es mayor que 5,10 es ma
yor que 7, y as sucesivamente. En ese caso, el investigador podra utilizar una medicin de rango y
orden para no sobrestimar la calidad del instrumento o procedimiento de medicin.
En realidad, el tema es algo controvertido. Analicemos, por ejemplo, una escala en la que
1 = en desacuerdo; 2 = medianamente en desacuerdo; 3 = medianamente de acuerdo, y 4 = de
acuerdo. Los significados implcitos en los nmeros, estn dispersos en forma pareja en la esca
la numrica? Queda claro que los resultados tienen sentido como datos de rango y orden -cierta
mente, 2 muestra ms aprobacin que 1, 3 ms que 2 y 4 ms que 3. Por eso, algunos psiclogos
sostienen que, en la mayora de los casos, no deberamos suponer que tenemos mediciones inter
valares, y deberamos convertir nuestros datos en rangos y utilizar una prueba de significacin de
rango y orden. Otros investigadores sostienen que las pruebas estadsticas paramtricas resultan
razonablemente precisas incluso con mediciones de rango y orden reales, y que al cambiar todos
los datos a rangos se puede perder informacin valiosa. La cuestin sigue sin resolverse.
Idea general acerca de las pruebas de rango y orden
La tabla 15-6 muestra el nombre de las pruebas de rango y orden con las que se sustituira cada
procedimiento paramtrico ordinario de prueba de hiptesis que hemos aprendido. Cuando se in
dica ms de una prueba posible, los procedimientos son aproximadamente equivalentes.4
A continuacin describimos en forma general el modo en que se realizan estas pruebas, inclu
yendo un ejemplo. Sin embargo, no daremos toda la informacin necesaria para realizar una de
esas pruebas en la prctica; slo presentamos estas tcnicas porque seguramente aparecern en

4 E xiste una prueba no pararatrica ampliamente utilizada, adems de las pruebas chi-cuadrado, que no se basa en
registros de rango y orden. S e ia denom ina p ru eb a de sig n os. Una prueba de signos se utiliza en lugar de una prue
ba r para medias dependientes. Se crea la serie de valores diferenciales y luego se suman slo los nmeros positivos.

publicaciones cientficas, y porque su lgica es la base de un procedimiento alternativo que s en


searemos a utilizar. Ese procedimiento alternativo tiene casi la misma funcin que las pruebas
de rango y orden, y es ms parecido a las tcnicas ya aprendidas.

Lgica bsica de las pruebas de rango y orden


Analicemos un estudio que incluye un grupo experimental y un grupo control. (Es una situacin
tpica en la que, si se cumplieran todos los supuestos, los psiclogos utilizaran una prueba t para
medias independientes). Si quisiramos utilizar una prueba de rango y orden, primero transfor
maramos todos los valores observados en rangos, ordenando los valores de menor a mayor, sin
importar si la observacin pertenece al grupo experimental o de control. Si los dos grupos fueran
de valores tomados al azar de una sola poblacin, deberan haber aproximadamente las mismas
cantidades de rangos altos y bajos en cada grupo (es decir, si la hiptesis nula es verdadera, los
rangos de los dos grupos no deberan ser muy diferentes). Debido a que la distribucin de rangos
puede calcularse con exactitud, los estadsticos pueden calcular la probabilidad exacta de obtener
cualquier divisin determinada de rangos en dos grupos si, de hecho, los dos grupos fueran toma
dos al azar de poblaciones idnticas.
En realidad, la forma para que esto funcione consiste en que el investigador convierta todos
los valores observados en rangos, sume el total de los rangos del grupo con los valores menores y
luego compare ese total con un punto de corte indicado en una tabla especial de estos puntos de
corte de significacin para totales de rangos en este tipo de situaciones.
Ejemplo de prueba de rango y orden
La tabla 15-7 muestra el clculo de una prueba de suma de rangos de Wilcoxon para el tipo de si
tuacin que describimos anteriormente. Este ejemplo utiliza la misma informacin que nuestro
primer ejemplo de transformacin de datos, el estudio ficticio sobre cantidad de libros ledos por
nios altamente sensibles comparado con los ledos por nios no altamente sensibles. La lgica
es algo diferente, por eso recomendamos tener paciencia para esperar la explicacin.

Tabla 15-6.
Principales pruebas de rango y orden equivalentes a las principales pruebas paramtricas.
P r u e b a s p a r a m tr ic a s o r d in a r ia s

P r u e b a s d e r a n g o y or d e n e q u iv a len te s

Prueba t para m edias dependientes


Prueba de rango con signos de W ilcoxon
P r u e b a i pra m edias independientes. , Prueba de sum a de rangos de; W ilcoxon o pm ebaJ7 d lyiann-W hitney
A n lisis d e variahz' ...... ....... ...........* Prueba H d K nisk-W atiis
"......... . ' .............................
Prueba t pra co rrela ci n .: -V
' _"j." rh d Speam an o tau de K h d lls
i
.
.
.
;.........

Si no existe diferencia promedio, aproximadamente la mitad de ios valores diferenciales debera ser positiva y la mi
tad negativa. Si la cantidad de positivos es considerablemente mayor o considerablemente menor a la mitad, e resul
tado estara en contra de una hiptesis nula que establece que la verdadera poblacin de valores diferenciales tiene
una diferencia promedio igual a cero. Los textos estadsticos de nivel intermedio usualmente incluyen una tabla don
de buscar los puntos de corte de significacin de una prueba de signos.

Como se desprende de la tabla, en primer lugar determinamos el punto de corte de significa


cin, como haramos en cualquier procedimiento de prueba de hiptesis-(el punto de corte se basa
en una tabla que no hemos proporcionado pero que se puede encontrar en la mayora de los textos
de estadstica de nivel intermedio). El siguiente paso fue ordenar los rangos de ipenor a mayor; des
pus, sumar el grupo que se espera que tenga el total ms bajo. Luego, el total se compara con el pun
to de corte. En el ejemplo que analizamos, el total de los rangos del menor no fue mayor que el
punto de corte; por lo tanto, se rechaza la hiptesis nula.
Utilizamos la prueba de suma de rangos de Wlcoxon, aunque podramos haber utilizado la
prueba U de Mann-Whitney, que da un resultado final matemticamente equivalente y se basa en
la misma lgica. Slo difiere en los detalles de clculo.

La hiptesis nula en una prueba de rango y orden


La hiptesis nula en una prueba de rango y orden no es exactamente igual a la de tma prueba paramtrica ordinaria. Una prueba paramtrica compara las medas de los dos grupos; su hiptesis nu
la establece que las dos poblaciones tienen la misma media. En una prueba de rango y orden lo
equivalente a la media es el rango medio (la mediana de los valores no convertidos a rango). Por
ejemplo, supongamos que cinco valores no convertidos a rango fueran 11, 12,14, 19 y 20. Sus
rangos correspondientes son 1, 2, 3, 4 y 5. El rango medio es 3, que corresponde a la mediana de
los valores no transformados a rangos, es decir, el valor 14. Por lo tanto, consideramos a una prue
ba de rango y orden como la comparacin de medianas de los dos grupos, cuya hiptesis nula es
tablece que las dos poblaciones tienen la misma mediana.
Aproximaciones a ia curva normal en pruebas de rango y orden
Las tablas como las descriptas, para la suma mxima de rangos para rechazar la hiptesis nula,
son muy engorrosas si se utilizan tamaos de muestras entre moderados y grandes, con grupos

Tabla 15-7.
Clculos de una prueba de suma de rangos de Wcoxon basados en el estudio acerca de los libros
ledos por nios altamente sensibles en comparacin con los ledos por nios no altamente sensibles
(datos ficticios).
Punto de corte: sum a m xim a de rangos en e l grupo no altam ente sen sib le para un nivel 0 ,0 5 de significacin,
una cola (de una tabla estndar) = 1 1 .
A lt a m e n t e s e n s ib le
No

Si

R ango

Rango

0
3
10
22

1
2
3

17
36
45
75

4
6
7
8

2:

5
11

C om paracin con e l punto de corte: la sum a de rangos del grupo que s e predijo tendra lo s registros m s bajos;
11, iguala pero no e x ced e al punto d e corte de significacin.
C onclasin: se rechaza la hip tesis aula.

desiguales. Y el problema se torna realmente inmanejable con diseos ms complicados. Por eso /
se han desarrollado varias aproximaciones que utilizan las sumas de rangos en una frmula q u :
produce una puntuacin Z, Si la puntuacin Z se encuentra en la regin superior sobre la cual es-:\
t el 5% del rea, bajo la curva normal (2,5% para una prueba de dos colas), el resultado se cn- -"
sidera significativo. Con frecuencia, cuando las publicaciones cientficas informan las pruebas de
rango y orden indican la puntuacin Z que mencionamos.

Utilizacin de pruebas paramtricas con datos transformados en rangos

Conover e Imn (1981) demostraron que no es necesario realizar los procedimientos de clculo ;/
especiales de las pruebas de rango y orden. Se pueden obtener aproximadamente los mismos resultados si transformamos los valores observados en rangos y luego aplicamos la aritmtica ;
usual para calcular una prueba paramtrica ordinaria, como por ejemplo una prueba t. (El proce- :
dmiento descripto funciona en el caso de una prueba , un anlisis de varianza de un criterio, y;.:
en la significacin del coeficiente de correlacin. No funciona tan bien con el anlisis de variam /
za de dos criterios).
El resultado de utilizar una prueba paramtrica con valores transformados en rangos no ser tan/
preciso como los de la prueba paramtrica ordinaria o la prueba de orden y rango. No sern tan pr- '
cisos como los de la prueba paramtrica ordinaria porque no se cumple el supuesto de distribuciones:;
normales, ya que, en realidad, cuando se trabaja con rangos la distribucin es rectangular. Tampoco ;;
sern tan precisos como los de las pruebas de orden y rango porque la prueba paramtrica utiliza la
distribucin t F en lugar de las tablas especiales que utilizan las pruebas de orden y rango, las cua
les se basan en probabilidades exactas de obtencin de ciertas divisiones de rangos. Sin embargo, la
aproximacin parece ser bastante buena.5
Ejemplo de prueba paramtrica ordinaria
despus de una transformacin de rango y orden
La tabla 15-8 muestra los clculos de una prueba t ordinaria para medias independientes realizada
con los datos ficticios acerca de nios sensibles, utilizando el rango de cada nio en lugar del n
mero real de libros ledos por ellos. Nuevamente, obtenemos un resultado significativo.

MTODOS INTENSIVOS POR COMPUTADORA

__________________ _

En los ltimos aos, gracias a la disponibilidad de computadoras ha adquirido practicidad toda


una nueva serie de mtodos de prueba de hiptesis. Las principales tcnicas se denominan prue
bas de aleatorizacin y boots trap. Los mtodos mencionados difieren en algunos detalles im
portantes. Sin embargo, su lgica es lo suficientemente parecida como para que podamos trans
mitir la idea bsica concentrndonos en uno de ellos: las pruebas de aleatorizacin.

5 Un investigador particularmente preocupado por la precisin podra calcular F utilizando los valores transforma
dos a rangos, y despus convertir el resultado en el resultado exacto de una prueba de rango y orden, utilizando una fr
mula de conversin establecida por Conover e Imn (1981), Luego buscara ese nmero en la tabla apropiada de prue
bas de rango y orden.

Tabla 15-8.
Clcalos de ana prueba t para medias independientes utilizando rangos en lugar de los valores
originales del estudio acerca de libros ledos por nios altamente sensibles en comparacin con los
ledos por nios no altamente sensibles (datos ficticios).
Punto de corte t para el nivel 0,05 de significacin, gl = (4 - 1) + (4 - 1) = 6, una cola = -1,943

2
M=
S =

Altamente sensible
No
Si
4
l
6
2
7
3
_
25
11
11/4 = 2,75
25/4 = 6,25
8,75/3=2,92
8,75/3=2,92

C2
oM~

2,92/4 = 0,73

Combinada ~

2,92/4 = 0,73

= .73 + 0,73 = 1,46


=

U1

= (2 ,7 5 ~ 6 , 2 5 ) / l , 2 I = - 2 ,8 9
C onclusin: se rechaza la hip tesis nula.

Prueba de afeatorzacin bsica


Supongamos que tenemos dos grupos de observaciones, uno que proviene de un grupo experi
mental y otro de un grupo de control. Supongamos tambin que las medias de los dos grupos di
fieren en cierto grado. Abora analicemos qu sucede si mezclramos todas esas observaciones ig
norando de qu grupo provienen. Si calculramos la diferencia entre las medias de esos dos
grupos establecidos al azar, cul es la probabilidad de que todo ese proceso diera como resultado
una diferencia media tan grande como la encontrada originalmente por la propia agrupacin de
las.observaciones? Si la diferencia media entre los grupos originales es bastante pequea, es muy
probable que podamos obtener una diferencia media de ese tamao a travs de las agrupaciones
casuales. Pero si la diferencia media de los grupos originales es bastante grande, al crear grupos al
azar por lo general no obtendremos una diferencia de igual tamao. Si las agrupaciones por azar
produjeran un resultado del tamao de las agrupaciones originales menos del 5% de las veces, po
dramos estar bastante seguros de que las agrupaciones originales eran bastante diferentes de lo
que esperaramos por casualidad. Por lo tanto, el hecho de comparar agrupaciones reales de ob
servaciones con agrupaciones aleatorias de observaciones es una forma de realizar una prueba de
significacin.
Una prueba de aleatorizacin, en este tipo de situaciones, en realidad establece rpidamente,
por computadora, cada una de las posibles divisiones de las observaciones en dos grupos de los
tamaos pertinentes. Luego determina cuntas de esas posibles organizaciones presentan una di
ferencia tan extrema como las diferencias realmente observadas entre los dos grupos. S menos
del 5% de las posibles organizaciones arrojan diferencias tan extremas como las originales, el re
sultado-es significativo. Se puede rechazar la hiptesis nula que establece que los dos grupos po
dran haber presentado esa diferencia en una divisin aleatoria. (La lgica descripta es similar a la

utilizada para descubrirlas probabilidades en las pruebas de rango y orden, pero, en este caso, ls
observaciones no fueron convertidas primero en rangos).

Ejemplo de prueba de aleatorizacin


La tabia 15-9 muestra un ejemplo resuelto de lo Hue realmente hara una computadora en el caso
de una prueba de aleatorizacin aplicada al ejemplo del estudio ficticio acerca de dos grupos y de
la cantidad de libros ledos.
A continuacin describimos los pasos de una prueba de aleatorizacin con respecto a la dife
rencia entre las medias de dos grupos. (No debemos olvidar que en los casos reales las computa
doras realizan todo el proceso. Sin embargo, tanto aqu como en los ejercicios seguimos el proces
paso a paso, para que el alumno pueda comprender rpidamente los resultados del procedimiento
al verlos en las impresiones emitidas por las computadoras o en las publicaciones cientficas. En
el futuro, este puede convertirse en un mtodo de uso muy comn en la medida en que los investi
gadores psicolgicos se adapten a todas las posibilidades ofrecidas por las computadoras de alta
velocidad.
1. Determinar la diferencia entre las medias de los dos grupos reales. En el ejemplo, la dife
rencia media de cantidad de libros ledos era 34,5.
2. Determinar cuntas maneras posibles de formar dos grupos hay y cun alta debera ser la
diferencia media real para estar en el 5% ( 1%) superior. Existen reglas que determinan cuntas
posibles combinaciones seran necesarias. Esas reglas se describen en algunos textos de estadsti
ca de nivel intermedio, tratadas como permutaciones y combinaciones. Ya que en investigaciones
reales nunca realizaramos manualmente una prueba de aleatorizacin, dejaremos el tema de las
reglas para futuros cursos. (En los ejercicios de este captulo pedimos al alumno que calcule algu
nas pruebas de aleatorizacin con pequeas cantidades de valores, con el fin de que incorpore el
principio de las mismas. En esos casos, indicaremos cuntas combinaciones son necesarias).
En el caso que venimos analizando, con 8 participantes divididos en dos grupos de cuatro
existen 70 maneras posibles de formar los grupos. Cada una de esas 70 divisiones produce una di
ferencia entre las medias de los dos grupos resultantes formados por cuatro registros. De esas 70
diferencias, el 5% superior son las 3,5 diferencias superiores. La diferencia media real tendr que
estar entre las tres superiores para que podamos rechazar la hiptesis nula (a mnos que en el ter
cer lugar coincidan ms de una media). (Si quisiramos utilizar una prueba de dos colas, utiliza
ramos e 2,5% superior e inferior de las 70 diferencias, es decir, slo la diferencia superior e infe
rior).
3. Agrupar las observaciones de cada divisin posible en dos grupos (del tamao de las agru
paciones originales). Como ya dijimos, existen procedimientos sistemticos para realizar todas
las combinaciones, pero esto es algo que en una situacin real de investigacin la computadora lo
hara automticamente. La tabla 15-9 muestra las 70 divisiones."
4. Calcular la diferencia media entre ios grupos de cada divisin. Por ejemplo, en la segunda
divisin que aparece en el ejemplo, las medias son 7,5 para el grupo No y 44,5 para el grupo
Si, dando una diferencia entre las medias igual a 37. Debajo de cada una de las 70 divisiones se
indican las diferencias entre las medias.
5. Ordenar las diferencias de menor (ms negativa) a mayor. En el ejemplo hay 70 diferen
cias, que van desde una diferencia de -37, donde los no altamente sensibles presentan una mayor
cantidad de libros ledos, a +37, donde los altamente sensibles presentan una mayor cantidad de
libros ledos.

Tabla 15-9.
Clculos de una prueba de aleatorizacin basada en el estudio que compara nios altamente sensibles y
no altamente sensibles en cuanto a la cantidad de libros ledos durante el ao anterior (datos ccios).
R esultados reales:

Altamente sensibles
Na

0
3
10
22
35
8,75

17
36
45
75
173
43,25

D iferen cia real = M Si - M N<) - 34,5


Para rechazarla hiptesis nula: la diferencia m edia obtenida debe ubicarse entre e l 5 % superior de diferencias
medas. Con 7 0 diferencias medias, debe estar entre las tres diferencias superiores.

Todas las divisiones posibles (70) de las ocho observaciones en dos grupos de cuatro cada uno:
Real
No

^S-^No

No

Si
22

0
3
10

36
45
75

No

Si

No

22
0
3
17
10
45
36
11
2 7 ,5

0
3
10
45

10
22 V-iZS.;:
;K- 34,5 .

No

Si

No

Si

No

Si

0
3
22
45

10
17
36
75

0
3
22
75

10
17
36
45

0
3
17
36

10
22
45
75
24

37

17

No

No

Si

No

0
3
45
75

10
22
17
36
~ 9 ,5

0
10
22

No

Si

0
10
17
75

3
22
36
45

No

Si
22

17
36

0
3
10

11

25

23

5/
10
36
45

No

17
36

0
3
22

17

25
31

Si

No

10
0
17
3
45
22
3 5 25
21,5

Si

No

Si

No

Si

No

Si

0
10
3
22
17
36
45
75
19,5

0
3
17
75

10
22
36
45
4 ,5....

0
3
36
45

10
22
17
75

0
3
36
75

10
22
17
45

Si

No

No

Si

3
36
45
12 75
2 7 ,5

0
10
22
36

3
17
45
75
18

0
3
10
17
22
36
45
75
13 ,5

No

No

Si

Si

0
10
36
45

3
22
17
75
6 ,5

No

No

Si

No

0
10
22
75
1
No

3
17
36
45
,5

10
Si

No

Si

0
3
10
22
17
45
36
75
20,5

0
10
17
45

3
22
36
75
16

Si

No

Si

No

Si

0
3
10
22
36
17
75
45
- 3,5

0
3
10
22
45
17
7 5 . 36
-1 3 " '

0
3
22
10
17 45
36
75
14,5

0
22
17
45

3
10
36
75

0
22
17
75

3
10
36
45
-5

Si

No

No

Si

No

3
17
10
36
22
4 5 . 75
C

0
17
36
75

0
3
17
10
45
22
36
75
-1 6 ,5

Si
3

No

Si

No

Si

No

Si

No

0
22
36
45

3
10
17
75

3
0
10
22
17
36
45
75
- 1 4 ,5 .

0
22
45
75

3
10
17
36
- 19

0,5

No

Si
22

Si

*Sl

^St ^No

V Si
.7.177
; 36

Si

3
10
22
45
12"""'

10

10
36
22
45
17
75
-2 6 :

No

Si

No

Si

17
3
10
22

0
3
10
22
-34,5

22
36
45
Z5

0
3
10
17
-37

No

Si

No

Si

No

Si

10
17
36
75

0
3
22'
45

10
17
36
45

0
3
22
75

10
22
45
75

0
3
17
36
-24

Ms r MN

-1 7

Msi

Si

0
17
3
45
10
75
36
-2 7 ,5

-2

No
22

Si

0
3
10
45

17
36
75

Si

10
36
45
75

0
3
22
17
31

No

Si

10
0
17
3:
45 22
75 36
-2 1 ,5

Si

No

Si

No

Si

0
10
3
22
17
36
75
45
- 4 ,5

10
22
17
75

0
3
36
45
10

10
22
17
45

0
3
36
75

No
3

Si

No
3

S
0
10
17
22
36
75
45
1,5

No
3
22

Si

No

Si

0
10
45
17
75
36
- 2 0 ,5

3
22
36
75

0
10
17
45
16
Si

Si

No

Si

No

Si

0
3
45
75

3
0
36
10
45
22
17
75
- 2 7 ,5

3
17
45
75

0
10
22
36
-18

No

Si

No

Si

No

Si

No

Si

3
22
36
45

0
10
17
75
-1

3
22
17
75

0
10
36
45
6 ,r

3
22
17
45

0
10
36
75
8,5

3
22
17
36

0
10
45
75

S
0
22
36
45
-0 ,5

No

Si

No

Si

3
10
17
45

0
22
36
75
14,5

3
10
17
36

0
22
45
75
19

No
3

3
10
17
75

No

0
3
10
75

0
22
3
36
17
75
45
-1 9 ,5

No
10

Si

No

17
36

Si

-8

10
22
17
36
9 ,5

No
22

23

No

M s - M No

M S ~ ^N o

No
22

0
17
10
36
22
. 75
45
-1 3 ,5

13
Si

0
17
36
45

10
22
75
-3

No

Si

No

Si

No

0
3
10 2 2
17
45
36
75
- 1 4 ,5

3
10
36
75

0
22
17
45
-10

3
10
36
45

0
22
17
75
5

Si

No
3

Si

No
3

Si

No

No
3

0
17
36
75

10
22
45
12

0
17
10
22
45
36
75
16,5

0
36
45
75

10
22
17
26

Las setenta diferencias ordenadas de menor (ms negativa) a mayor:


- 3 7 , -3 4 ,5 , - 3 2 , - 2 7 ,5 , -2 7 ,5 , - 2 6 , -2 1 ,5 , - 2 4 , - 2 3 , -2 0 ,5 , -1 9 ,5 , - 1 6 , -1 6 ,5 , - 1 7 , - 1 8 , - 1 9 , -1 4 ,5 , - 1 4 ,5 , -1 3 ,5 ,
- 1 3 , - 1 2 , - 1 0 , - 1 0 , - 9 ,5 , - 8 ,5 , - 8 , - 6 ,5 , - 5 , - 5 , - 4 ,5 , -1 ,5 , - 3 , - 2 , - 1 , - 0 , 5 ,0 , 5 , 1 , 1 , 5 , 2 , 3 , 4 , 5 , 5 , 5 , 6 , 5 , 8 , 8 , 5 ,
9 , 5 , 1 0 , 1 0 , 1 2 , 1 3 , 1 3 , 5 , 1 4 , 5 , 1 4 , 5 , 1 6 , 1 6 , 5 , 1 7 , 1 8 , 1 9 , 1 9 , 5 , 2 0 , 5 , 2 1 , 5 , 2 3 , 2 4 , 2 6 , 2 7 , 5 , 2 7 , 5 , 3 1 , ^ 37
Conclusin: a diferencia media real se ubica entre las tres superiores. Se rechaza la hiptesis nula.

6,
Comparar el punto de corte con el lugar en donde se ubica la diferencia real dentro de la lis
ta ordenada, para determinar si se rechaza o no la hiptesis nula. En el ejemplo que analizamos, la
diferencia real de +34,5 es la segunda superior, ubicndose en un lugar entre las tres superiores,
tal como se requera. Podemos rechazar la hiptesis nula.
Otro ejemplo de prueba de aleatorizacin
Esta vez analizaremos el ejemplo de la prueba de lgebra y del nivel escolar del captulo anterior, que
incluye una correlacin. Si el alumno an no ha estudiado el captulo 3, debera saltear esta seccin.

Tabla 15-10.
Clculos de una prueba de aleaorizacin basada en el estudio que correlaciona la nota de nivel
escolar y la puntuacin en una prueba de lgebra (datos ficticios).
Para rechazar la hiptesis nula: la correlacin real debe ser la m ayor de las 24 correlaciones .posibles para poder
rechazar a hiptesis nula al nivel d el 5%, con prueba de una cola.

Correlaciones de todas las posibles combinaciones ene las opa (Observaciones de pruebas de lgebra) y
os NE (Niveles escolares).
Real
OPA
1
4
10
95

NE
6
9
7
4
r - -0,79

OPA
NE
1
9
4
7
4
10
95
6
r = -0,24

OPA NE
1
7
4
4
10
6
25____ 2
r = 0,79

OPA
1
4
10
25.

OPA NE
1
7
4
6
0
9
25____ 4
r = -0,76

OPA NE
1
9
4
4
10
6
7
95
r = 0,12

OPA
NE
1
7
4
6
10
4
15 ___ 2
r - 0,75

OPA NE
1
4
4
7
10
6
25____ 2
r = 0,82

OPA NE
I
4
4
9
7
10
21
<5
r =0,52

OPA
1
4
.10
95

NE
7
4
9
6

OPA NE
4
1
4
9
10

95 ___1
r 0,18

OPA
1
4
10
21.

OPA
1
4
10
95

OPA NE
1
6
4
4
10
7
2 1 ___ 2
r ==0,82

NE
6
9
4
7

OPA NE
1
6
4
7
4
10
95 ___2
r = 0,76

OPA
NE
1
9
4
4
10
7
6
21.
- 0,18

OPA NE
1
9
4
7
10
6
95
4
r = -0,84

OPA
1
4
10
21_

OPA
1
4
10
95

OPA NE
1
7
4
9
10
4
95
6
r = -0,22

95-' 7
-, r = 0,25.

O1
u
OPA
1
4
10
95
K

O
IE

OPA NE
1
4
4
6
10
7
95
9
r s=0,84

NE
6
9
4
7
r ~ 0,11

NE
4
7
9
6
-0,08
r=

NE
9
7
6
4
-0,84

NE
6
4
9
7

-t
il
o
V
Ka)

OPA .NE
1 4

NE
9
6
7
4
r ~ -0,82

OPA
1
4
10
21

NE
7
9
6
4
r ==0,82

Correlaciones de menor a mayor:


-0,84, -0,84, -0,82, -0,79, -0,76,-0,24, -0,22, -0,18, -0,11, -0,08, 0,11, 0,11, 0,12,0,18, 0,22,E p ] 0,52,
0,75,0,76,0,79, 0,82, 0,82,0,82,0,84
C onclusin: no se rechaza la hiptesis nula.

Una de las formas de realizar una prueba de aleatorizacin de una correlacin implica calcular
una correlacin entre cada posible combinacin de observaciones de las dos variables (sin combinar
nunca dos observaciones de la misma variable). Con cuatro participantes, existen 24 combinaciones
posibles de este tipo. Para que una correlacin sea significativa al 5%, la correlacin de la combina
cin real de observaciones de la muestra real debe ser la mayor de las 24 correlaciones posibles. La
tabla 15-10 muestra los clculos de la prueba de aleatorizacin. Utilizando este procedimiento, la
correlacin no result significativa. (Es el mismo resultado que obtuvimos anteriormente en el cap
tulo para el mismo ejemplo, utilizando una transformacin log).

Prueba de aleatorizacin aproximada


Hemos ilustrado la prueba de aleatorizacin utilizando muestras muy pequeas. Aun as, existan
bastantes posibles divisiones de las observaciones en cada ejemplo. Con muestras ms grandes (y
ms realistas), la cantidad de distintas divisiones rpidamente se hace inmanejable, incluso para
la mayora de las computadoras. Por ejemplo, una comparacin entre dos grupos de siete partici
pantes cada uno tiene 3.432 divisiones posibles; una comparacin de 10 participantes por grupo
tiene 184.756. Con 20 por grupo, hay 155.120.000 posibles divisiones! En la prctica, an la ma
yora de las computadoras no estn en condiciones de manejar verdaderas pruebas de aleatorizacin con ios tamaos de muestra comunes en la investigacin psicolgica.
Para solucionar este problema, los estadsticos han desarrollado lo que se denomina prueba
de aleatorizacin aproximada. La computadora selecciona al azar una gran cantidad de posibles
divisiones de la muestra, tal vez 100 incluso 1.000. Los resultados logrados utilizando estas di
visiones seleccionadas al azar se consideran, entonces, representativos de lo que encontraramos
si utilizramos realmente cada divisin posible. (El proceso es similar a un estudio Montecarlo,
escrpto en el cuadro 1-L Cmo algo tan metdico como una computadora produce tantos n
meros aleatorios?, vase el cuadro 15-1).
El otro mtodo que mencionamos al comienzo, el boot strap, tambin trabaja del mismo mo
do: la computadora genera una gran cantidad de selecciones aleatorias, y el resultado real se com
para con los resultados tericamente posibles que ha seleccionado la computadora. Las nicas di
ferencias entre los procedimientos residen en los tipos de divisiones o combinaciones de
observaciones que se seleccionan aleatoriamente; pero estos son asuntos tcnicos que exceden el
alcance de un libro de nivel introductorio.

COMPARACIN DE MTODOS
Hemos analizado tres mtodos para realizar pruebas de hiptesis cuando las muestras parecen
provenir de poblaciones no normales: transformacin de datos, pruebas de rango y orden y mto
dos intensivos por computadora, tales como las pruebas de aleatorizacin. Cmo decide un in
vestigador el mtodo a utilizar?
Las transformaciones de datos tienen la ventaja de permitir aplicar las tcnicas paramtrics
familiares a los valores transformados. Pero las transformaciones no siempre funcionan. Es decir,
puede no existir ninguna transformacin razonable que produzca valores normales en todos los
grupos. Adems, las transformaciones pueden distorsionar las observaciones de modo que se
pierda el significado original.
Los mtodos de rango y orden pueden aplicarse independientemente de las distribuciones.
Son especialmente adecuados cuando las observaciones originales son rangos, y tambin son ti
les cuando las observaciones no siguen claramente un patrn numrico simple (medicin interva

lar), situacin que algunos psiclogos consideran bastante comn. Ms an, la lgica de los m
todos de rango y orden es simple y directa, y no requiere construcciones elaboradas de distribu
ciones hipotticas o parmetros estimados.
Sin embargo, los mtodos de rango y orden no son tan familiares para aquellos que leen pu
blicaciones cientficas, y tampoco han sido desarrollados para muchas situaciones complejas.
Otro problema es que la lgica simple de las pruebas de rango y orden se pierde si existen mu
chos rangos iguales. Finalmente, al igual que los mtodos de transformacin de datos, los mto
dos de rango y orden distorsionan los datos originales, perdindose informacin. Por ejemplo,
en la misma muestra, una diferencia entre 6,1 y 6,2 podra ser un rango, pero la diferencia entre
3,4 y 5,8 tambin podra ser un rango.6
Los mtodos intensivos por computadoras, tales como las pruebas de aleatorizacin aproxi
mada, no requieren ninguno de los dos supuestos principales de las pruebas paramtricas ordina
rias. Ms an, al igual que las pruebas de rango y orden, tienen una lgica directa propia que es
muy atractiva, evitando todo el proceso de construccin de distribuciones estimadas de pobla
cin, distribuciones de medias, etc. Los mtodos intensivos por computadora son tambin extre
madamente flexibles. Se los puede utilizar en casi cualquier situacin imaginable en la que pudie
ra aplicarse una prueba de hiptesis. Por lo tanto, frecuentemente pueden utilizarse cuando no
existen otros tipos de pruebas disponibles, paramtricas o de cualquier otro tipo.
La principal desventaja de los mtodos intensivos por computadora es que son bastante nue
vos; por lo tanto, los detalles y ventajas relativas de varios de los mtodos no han sido bien apro
vechados. Ms an, por ser nuevos, en la mayora de los casos los paquetes estadsticos estndar
para computadoras no los incluyen. Los mtodos intensivos por computadora recin estn em
pezando a aparecer en las publicaciones cientficas, pero es probable que su aplicacin aumente
con rapidez.
Riesgo relativo de cometer errores Tipo I y Tipo il
Cul es la precisin de los distintos mtodos en cuanto a que el nivel del 5% realmente implica
que existe un 5% de probabilidad de rechazar incorrectamente la hiptesis nula? y cmo afectan
la potencia los distintos mtodos?
Cuando se cumplen los supuestos de las pruebas paramtricas, estas pruebas son tan buenas o
mejores que cualquiera de las alternativas. Lo expresado en el prrafo anterior es cierto en cuanto
a la proteccin contra los errores Tipo I y Tipo II, situacin que era de esperarse, ya que se dan las
condiciones para las cuales fueron diseadas las pruebas paramtricas.
Sin embargo, cuando no se cumplen los supuestos de las pruebas paramtricas, las venta
jas relativas de los tres posibles procedimientos alternativos que hemos analizado no son del
todo claras. De hecho, los mritos relativos de los distintos procedimientos son temas de acti
va controversia, sobre los cuales se publican muchos artculos cada ao en las revistas espe
cializadas en estadstica.
La razn de la controversia es que el procedimiento ms adecuado depende de los tipos de
distribuciones involucradas. Una distribucin no normal puede serlo de muchas maneras (vase
captulo 5). Sucede que los efectos de los diferentes mtodos sobre los errores Tipo I y Tipo II va-

6 Otra ventaja tradicional de las pruebas de rango y orden ha sido su facilidad de clculo, Excepto por el trabajo de con

vertir las observaciones en rangos, los clculos reales de la mayora de estos procedimientos son muy sim ples, compa
rados con los de las pruebas paramtrcas. Actualmente, con la utilizacin de las computadoras, es igualmente fcil cal
cular cualquier tipo de procedimiento. Con algunos paquetes estadsticos estndar para computadoras, es realmente
mucho menos problemtico calcular las pruebas paramtricas. Adems, a veces ia prueba de rango y orden apropiada
puede no estar disponible.

Cuadro 15^r. D e d n d e provienen los nm eros aleatorios?

Para ser aleatorios, los nmeros deben ser


obtenidos teniendo todos la misms proba
bilidad de ser seleccionados. Es decir, la
posibilidad de que surja culquier nmero
debe ser totalmente independiente de las
posibilidades del nmero que surja con an
terioridad o posterioridad a l. Una de las
muchas aplicaciones importantes de los n
meros aleatorios son los mtodos estadsti
cos intensivos por computadora, tal como
lo hemos visto en este captulo. Tambin
son fundamentales para los estudios Montecarlo (vase cuadro 10-1), estudios que
se utilizan para probar el efecto del incum
plimiento de la normalidad y otros supues
tos de las pruebas estadsticas paramtricas,
y que constituyen uno de los medios con
los que cuentan los psiclogos para saber
si necesitan utilizar los mtodos descriptos
en este captulo. Sin embargo,'los nmeros
aleatorios son, en s mismos, un tema inte
resante.
La primera tabla de nmeros aleatorios
se cre en 1927. Con anterioridad a esa fe
cha, se utilizaban mtodos mecnicos tales
como dispositivos para mezclar. El alumno
seguramente recordar a William S. (f~
denf) Gosset (cuadro 9-1). Para obtener sus
nmeros aleatorios, Gosset mezcl y extra
jo nmeros de un mazo de 3.000 cartas.
Luego, en 1927, Karl Pearson incentiv
a L. H, C. Tppett para que publicara cierta
tabla. Tppett consideraba que extraer cartas
numeradas de una bolsa era insatisfacto
rio; por eso seleccion dgitos del censo
de 1925. Ms tarde, en 1938, R. A, Fisher y
Fraak Yates publicaron una lista basada^ en
logaritmos. Casi al mismo tiempo, tambin
fue presentada una cantidad de mtodos de
control de aleatoredad.

Ms tarde, se hicieron comunes solu- A;


ciones fsicas ms sofisticadas. Una de llas '7
consista en hacer brillar un rayo d luz
a intervalos regulares sobre un disco gira- A;
torio dividido en secciones. Otro mtodo
utilizaba la radiacin de sustancias rdioacA:(I
vas: registraba la cantidad de partculas':
detectadas durante cierto periodo; si la cantil
dad era impar, estableca el contador n 1;:?:^
si era par, en; 0, y luego generaba listas de. Lj
nmeros a. partir de agrupaciones de esos 7?;
dgitos binarios. Un tercer sistema emplea-- i;
ba una vlvula electrnica que emita un .
sonido que poda ser amplficado;los vaio-A-.
res fluctuantes de la potencia de salida eran. \i
valores aleatorios.
Todos estos mtodos fsicos eran una A
incomodidad: era necesario guardar los n- . ;
meros si iban a ser reproducidos o utiliza- A
dos nuevamente, y todos los aparatos uli-, .i
zados eran difciles de mantener. Por eso,
en la actualidad, con frecuencia se utilizan A
computadoras para crear nmeros seudo- A
aleatorios, utilizando alguna ecuacin es- :
pedal, como elevar grandes nmeros al v
cuadrado y tomar un grupo central de los
dgitos resultantes. Pero estos nmeros, en ;
un sentido muy sutil, no son aleatorios sino ^
predecibles por el propio hecho de que ha- :
ba una intencin en el diseo de la ecua-
cin: crear azar (vaya paradoja). Tambin
existe el inconveniente de que las ecuacio
nes puedan degenerarse y comenzar a re- ;
petir secuencias. Finalmente, no importa
cmo se genere la lista. Existe controversia :'
acerca de las consecuencias de la utiliza
cin reiterada de la misma tabla.
El tema de la dificultad de crear algo
libre de orden o inteligencia parece estar
indicando algo. Dejaremos que el alumno :
lo decda.

ran segn el tipo de distribucin de que se trate. Incluso, para determinado tipo de distribucin,
una tcnica podra resultar mejor cuando los grupos tienen las mismas cantidades y otra cuando
las cantidades en cada grupo son distintas; o bien, un mtodo podra ser mejor con un gran tama
o de muestra y otro con una muestra pequea. Ms an, al comparar grupos, las distribuciones
de los grupos pueden incluir diferentes tipos de distribuciones no normales.
Aunque se han realizado muchos estudios comparando los distintos mtodos (vase cuadro
10-1 acerca de los estudios Montecarlo), an sabemos muy poco sobre la efectividad relativa de
estos mtodos en la mayora de los casos. An peor, en muchas situaciones, un investigador pue
de tener la nocin de que una muestra no proviene de una poblacin normal, pero no de qu tipo
particular de poblacin no normal se trata. Por lo tanto, incluso los estudios que se han realizado
comparando los distintos procedimientos con determinadas formas de poblacin no normal, pue
den no ser demasiado tiles al momento de enfrentar los resultados de un estudio real.
Es posible que algn da se realice la suficiente investigacin que abarque las suficientes can
tidades de situaciones como para que surjan patrones que nos den pautas prcticas adecuadas. Por
el momento, segn nuestra opinin, los investigadores deben confiar en otros criterios (como los
presentados en este captulo) para seleccionar entre las distintas alternativas, cuando los supues
tos no se han cumplido. Sin embargo, desde el punto de vista de la lectura de investigaciones (un
tema que trataremos a continuacin), lo que necesitamos es poder comprender la lgica del pro
cedimiento en particular que ha elegido el investigador. Decidir si fue elegido correctamente, tal
vez sea una tarea que exceda los conocimientos del alumno en esta instancia, razn por la que
puede relajarse hasta los prximos cursos y futuros avances en el rea.

CONTROVERSIAS
Todos los temas tratados en este captulo son controvertidos, especialmente, la conveniencia de
las transformaciones de datos, los riesgos de utilizar procedimientos paramtricos cuando se
desconocen las distribuciones poblacionales, hasta qu punto es apropiado tratar a las medidas
tpicas en psicologa como si produjeran mediciones de intervalares y las ventajas y desventa
jas de los mtodos intensivos por computadora. (Judd et al. 1995 nos ofrecen una revisin re
ciente de las controversias).

PROCEDIMIENTOS UTILIZADOS CUANDO


LAS POBLACIONES NO PARECEN NORMALES,
SEGN SE DESCRIBEN EN LAS PUBLICACIONES CIENTFICAS__________
La utilizacin de los procedimientos que hemos descripto en este captulo parece tener altibajos
de popularidad en las diferentes reas de la psicologa. En algunas reas, durante ciertos aos po
demos encontrar muchos estudios que utilizan transformaciones de datos' y no ver nunca una
prueba de rango y orden. En otras reas, podemos encontrar exactamente lo contrario. Y los mto
dos intensivos por computadora aplicados a la psicologa son un desarrollo tan nuevo que proba
blemente podamos encontrarlos slo en unos pocos de los ms recientes estudios, con frecuencia
en circunstancias en las que no existe ningn procedimiento alternativo evidente.
Las transformaciones de datos se mencionan comnmente justo antes de la descripcin del
anlisis que utiliza los valores transformados. Por ejemplo, Connors et al. (1997) realizaron un
estudio concentrndose en la alianza entre el paciente y el terapeuta en los tratamientos de alcoho
lismo. Antes de informar los resultados de su estudio, comentaron lo siguiente:

Las variables tales como el porcentaje de das de abstinencia y tragos por da, con frecuencia se alejan :;de la normalidad debido a la asimetra y a ios efectos techo y piso. En respuesta a esto, la variable del.
porcentaje de das de abstinencia fue sometida a una transformacin arco-seno, y la variable de los tra- '
gos por da fue sometida a una transformacin raz cuadrada; en cada caso, el procedimiento se realizV
para mejorar la distribucin (p. 592).
A continuacin, presentamos un ejemplo de una prueba de rango y orden en un estudio de inves
tigacin realizado por Ford et al. (1997), que se concentr en la relacin de ciertos factores d la
personalidad con el tratamiento de trastornos de estrs postraumatico (una condicin psicolgica
que resulta de un hecho traumtico como el que podra ser experimentado durante una guerra o
como resultado de un ataque violento). El factor de personalidad de inters para los investigado
res se basaba en una versin moderna de la teora psicoanaltica freudiana denominada relacio
nes objeto, que se refiere al impacto psicolgico de nuestras primeras relaciones, principal
mente con nuestros padres (los objetos de estas relaciones tempranas). Los investigadores basa
ron sus medidas sobre las relaciones objeto en una entrevista clnica concentrada en temas tales
como la capacidad de dedicarse a una relacin estrecha y la capacidad de tener una imagen com
pleja de los otros (p. ej. no ver a una persona como completamente buena o completamente mala),
Al informar sus resultados, abreviaron la medida de entrevista clnica como ro-c (Relaciones ob
jeto). La distribucin de registros de las RO-c no era normal (era bimoda).
Uno de sus anlisis se concentraba en la asociacin de las relaciones objeto con el hecho de
que una persona contine con el tratamiento hasta completarlo o lo interrumpa prematuramente,
informaron sus resultados de la siguiente manera;
Seis de los 74 participantes interrumpieron prematuramente el tratamiento [...] Los seis pacientes que
interrumpieron prematuramente no difieren del resto de la muestra en cuanto a ninguna variable de
mogrfica o de prueba preliminar [...] S difieren en forma estadsticamente significativa de aquellos
q u e completaron el tratamiento en cuanto a las r o - c , con valores menores segn la prueba U de
Mann-Whitney no paramtrica (Z=-3,43, p < 0,001) (p. 554).
Se puede observar que informa un valor Z, lo que sugiere que en lugar de utilizar la prueba U de
Mann-Whitney directa utilizaron el procedimiento de aproximacin normal.
Finalmente, un estudio realizado por Caspi y Herbener (1990) nos ofrece un ejemplo del m
todo intensivo por computadora informado en una publicacin cientfica. Como parte del estudio,
los investigadores analizaron la estabilidad a largo plazo de la personalidad de 252 individuos que
fueron probados primero en el ao 1970 y luego nuevamente en el ao 1981. En cada prueba, los
participantes completaron la prueba de personalidad denominada ilQ sorf \ Se trata de un tipo es
pecial de procedimiento de prueba en el que el participante recibe cierta cantidad de cartas, cada
una con un rasgo de personalidad. El participante luego pone estas cartas en pilones, clasificndo
las desde para nada descriptiva hasta altamente descriptiva . Lo particular del mtodo, sin
embargo, es que el participante debe ubicar las cartas en pilones de determinados tamaos, tama
os que corresponden a una curva normal, con ms cartas en el medio y menos en los extremos.
Para estudiar la estabilidad, Caspi y Herbener tuvieron que correlacionar los Q sort de los dos
periodos. Sin embargo, los autores observaron que las correlaciones entre ios Q sort (correlacio
nes 2), del modo en que se utilizaban en su estudio, tenan algunas propiedades estadsticas inu
suales. Los autores explicaron:
Realizamos lo que esencialmente sera una prueba de aleatorizacin. Especficamente, el perfil <2sort
de cada sujeto en el ao 1970 fue correlacionado con su perfil del Q sort en 1981 para todos los sujetos
del mismo sexo
Para cada sexo [...] generamos 100 muestras aleatorias para comparar con las co
rrelaciones Q reales indicadoras de la estabilidad de la personalidad
En el caso de las [...] mujeres,
las 100 pruebas no arrojaron valores que excedieran la media muestral [de correlaciones de los perfiles
de cada sujeto en 1970 y 1981] (0,49) (p. 253).
En cuanto a los hombres, los resultados fueron similares.

Resumen
La prueba , el anlisis de varianza y la prueba de. significacin del coeficiente de correlacin su
ponen que las poblaciones siguen una distribucin normal. Cuando las muestras sugieren que las
poblaciones estn muy lejos de lo normal (por ejemplo, debido a casos atpicos), utilizar los pro
cedimientos ordinarios arroja resultados incorrectos.
Un mtodo a utilizar, cuando la poblacin parece no ser normal, es transformar los valores,
como por ejemplo sacando la raz cuadrada de cada valor para que la distribucin de los valores
transformados aparente representar una poblacin normalmente distribuida. Otras transformacio
nes comunes para distribuciones asimtricas se realizan calculando el logaritmo de cada valor o
su inverso. Despus de realizadas las transformaciones pueden aplicarse los procedimientos ordi
narios de prueba de hiptesis.
Otro mtodo para resolver el problema es ordenar todas las observaciones del estudio por
rango. Las pruebas especiales de rango y orden (a veces denominadas no paramtricas o libres de
distribucin) utilizan principios bsicos de probabilidad para determinar la posibilidad de que los
rangos estn irregularmente distribuidos en el grupo experimental.
Una prueba de aleatorizacin es un ejemplo del mtodo intensivo por computadora, que
analiza cada posible disposicin de las observaciones de un estudio para determinar la probabili
dad de que la disposicin obtenida (en trminos, por ejemplo, de la diferencia de medias entre
los grupos) surja por casualidad. Sin embargo, dado que incluso con computadoras las pruebas
de aleatorizacin no son prcticas con muestras de tamaos razonables, se utilizan otros mto
dos intensivos por computadora. Por ejemplo, 1.000 de las posibles disposiciones son seleccio
nados al azar y la distribucin de sus diferencias de medias se compara con la obtenida en la
.muestra real.
Las transformaciones de datos permiten utilizar tcnicas paramtricas que resultan familia
res, pero no siempre pueden ser aplicadas y pueden distorsionar el significado de los datos. Los
mtodos de rango y orden pueden aplicarse a muchas series de datos; son especialmente ade
cuados con rangos o datos similares, y tienen una base conceptual directa. Pero las tcnicas de
rango y orden no son ampliamente conocidas y no han sido desarrolladas para muchas situacio
nes complejas de anlisis de informacin. Al igual que con otras transformaciones de datos, la
informacin puede perderse o el significado distorsionarse. Los mtodos intensivos por computa
dora son ampliamente aplicables, a veces incluso en situaciones para las cuales no existe otro
mtodo disponible. Adems, tienen una atrayente lgica bsica. Pero a los investigadores no les
resultan muy familiares; al ser nuevos, sus posibles limitaciones no estn bien resueltas; y pue
den ser difciles de emprender ya que no se incluyen en programas estndar para computado
ras. Cuando se supone que la poblacin no es normal, no existe demasiado acuerdo acerca de
cul de las tcnicas es ms conveniente en cuanto al riesgo relativo de cometer los errores Tipo I
y Tipo L
Las publicaciones cientficas generalmente describen las transformaciones de datos justo an
tes del anlisis que las utiliza. Los mtodos de rango y orden se describen, mayormente, como
cualquier otro tipo de prueba de hiptesis. Los mtodos intensivos para computadoras, por ser
menos conocidos, por lo general se describen con bastante detalle.

Trminos clave
- Pruebas de aieatorizacin aproximada.
- Transformacin de datos.
- Pruebas libres de distribucin.
-Transformacin inversa.
- Transformacin log.

- Pruebas no paramtricas. -Transformacin de rango


y orden.
~ Pruebas paramtricas.
- Pruebas de aieatorizacin. - Reflejar.
- Pruebas de rango y orden. - Transformacin raz
cuadrada.

Ejercicios
2. Cules de las siguientes distribuciones
mustrales sugieren que la distribucin poblacional probablemente no es normal? Explique
por qu.
a) 41,52,74,107,617
b) 221,228,241,503,511,521
c) 0,2,0,3,0,5,0,6,0,7,0,9,0,11
d) -6, -5 ,-3 ,1 0
e) 11,20, 32,41,49,62
3. Un Investigador compara el tamao t
pico de familia en 10 culturas, 5 del grupo
idiomtico A y 5 del grupo idiomtico B. Los
nmeros correspondientes a las culturas del
grupo A son 1,2,2,5,4,3,3,8 y 7,2. Los nme
ros correspondientes a las culturas del grupo B
son 2,1,9,2,5,7,6,7 y 4,8. Sobre la base de es
tas 10 culturas, difiere el tamao tpico de la
familia en las culturas de diferentes grupos
idiomtcos? Utilice el nivel 0,05. a) Realice
una transformacin raz cuadrada (para sim
plificar las cosas, redondee los valores trans
SERIE I
formados para que tengan un slo decimal),
1.
Para la distribucin de los 30 valores
b) Realice una prueba f para medias indepen
que aparecen abajo, a) trace un histograma (ba
dientes utilizando los valores transformados
sado en frecuencias agrupadas) de los valores
(muestre su trabajo), c) Explique lo que ha he
tal como aparecen; b) realice una transforma
cho y por qu a una persona que est familiari
cin raz cuadrada y un histograma (de fre
zada con la prueba t pero no con la transfor
cuencias agrupadas) de los valores transfor
macin de datos.
mados, y c) convierta los valores originales en
4. Un investigador asigna participantes al
rangos y trace un histograma (agrupado) de-los
azar para que observen uno de tres tipos de pe
mismos,
lculas: una tiende a entristecer a las personas,
9,28, 4,16,0,7,25,1,4,10,4, 2,1,9,16,11, otra tiende a alegrar a las personas y una terce
12, 1, 18,2, 5,10,3,17,6,4,2,23,21,20
ra tiende a poner furiosas a las personas. Des-

Los ejercicios implican la realizacin de clcu


los (con la ayuda de una calculadora). La ma
yora de los problemas estadsticos reales se
resuelven por computadora, pero aunque exis
ta la posibilidad de utilizarla, es conveniente
realizar estos ejercicios manualmente para in
corporar el mtodo de trabajo.
Para adquirir prctica en la utilizacin de
una computadora, para resolver problemas esta
dsticos, se puede utilizar la seccin de compu
tacin de cada captulo, publicada en la Gua de
estudio y libro de tareas de computacin para el
alumno [Students Study Guide and Computer
Workbook] que acompaa este libro.
Todos los datos de esta seccin son ficti
cios (a menos que se especifique lo contrario)
Las respuestas a los ejercicios de la serie I
se encuentran al final del libro.

pus se pide a los participantes que califiquen


unas series de fotos de individuos en cuanto al
nivel de honestidad que reflejan. Las califica*
ciones dei grupo que vio la pelcula que causa
tristeza fueron 201, 523 y 614; las calificacio
nes del grupo que vio la pelcula que causa
enojo fueron 136, 340 y 301 y las calificacio
nes del grupo que vio la pelcula que causa ale
gra fueron 838,911 y 1.007. a) Transforme las
observaciones en rangos, b) Realice un anlisis
de varianza de un criterio con los valores trans
formados en rangos (utilice el nivel 0,05 de
significacin y muestre su trabajo), c) Expli
que lo que ha hecho y por qu a una persona que
comprende el anlisis de varianza pero no las
transformaciones a rango o las pruebas no para
mtricas.
5.
Un estudio compara el rendimiento
personas en la realizacin de una tarea origi
nal: si la realizan a solas o en presencia de un
amigo. Los valores correspondientes a los par
ticipantes que estn solos son 9,5 y 4; los valo
res correspondientes a los participantes que
realizan la tarea frente a un amigo son 3,1 y 0,
a) Realice una prueba de aleatorizacin com
parando los dos grupos. (Utilice p < 0,05, una
cola, prediciendo mayores valores para los que
realizan la tarea a solas), b) Explique lo que hi
zo a una persona que nunca ha asistido a un
curso de estadstica.
Nota: con tres participantes en cada grupo,
existen 20 formas diferentes de realizar dos
agrupaciones con los seis registros:
9 3 94 94 94 9 3 9 5
5 1 5 1 5 3 33 4 1 4 3
4 0 3 0 1 0 0J 3j0 LP

9 5 9 3
4 3 3 4
P 1 JLp

95
34
CU.

9 5
14
0_3

3 9 4 9 49 4 9 5 9 5 9
1 5 15 3 5 3 5 14 3 4
0 4 0 3 0 1 10 0 3 0 1

59 5 9
34 4 3
i 0 01

39
43

5 9
4 1

10 3 0

6. Miller (1997) realiz un estudio acerca


del compromiso en una relacin amorosa y la
atencin prestada a alternativas atractivas. En
el estudio, se le mostr a los participantes una
serie de diapositivas de personas atractivas. Al
comienzo de la seccin de Resultados, Miller
observa:

L o s in fo rm es p rop ios in d ica d o s en e l n d i


c e de a te n c i n a alternativas y e l tiem p o
efe ctiv a m e n te transcurrido analizan do las
d iap ositivas atractivas d el se x o o p u esto
...] eran p o sitivam en te asim tricos; por lo
tanto, lo s d atos fu eron transform ados a lo
garitm os (p. 7 6 0 ).

Explique lo que aqu se describe (y por qu


se realiza) a una persona que comprende la
estadstica paramtrica ordinaria pero que
nunca a escuchado hablar de transformacio
nes de datos.

SERIE II
L Con la distribucin de 20 valores que
aqu presentamos a) realice un histograma
de
(basado en frecuencias agrupadas) de los valo
res tal cual los presentamos; b) realice una
transformacin log y un histograma (de fre
cuencias agrupadas) de los valores transfor
mados, y c) transforme los valores originales
en rangos y realice un histograma (agrupado)
de los mismos. (Nota; para realizar la trans
formacin log utilice una calculadora con la
funcin log para calcular logaritmos o una
computadora).
2, 2 0 7 , 8 9 4 , 107, 11, 7 9 , 1 1 2 , 9 3 8 , 7 9 1 , 3 , 1 3 ,
8 9 ,1 .0 0 4 ,9 2 ,1 .0 1 6 ,1 0 7 ,8 7 ,9 1 ,8 7 0 ,9 2 1

2. Cul de las siguientes distribuciones


mustrales sugiere que la distribucin poblacional probablemente no es normal? Por qu?
a) 281,283,287,289,291,300,302
b ) 1 , 4 , 6 , 6 , 7 , 7 , 9 , 13

c) 7,104,104, 104,1.245,1.247,1.248,
1.251
d) 68,74,76,1,938
e) 407,2,407,5,407,6,407,9
3. Un psiclogo realiza un estudio a seis
electricistas desempleados, correlacionando la
cantidad de semanas sin empleo con la satis
faccin marital. Los resultados aparecen abajo,
a) Realice un diagrama de dispersin y calcule
la correlacin entre los valores dados, b) Reali
ce una transformacin a la raz cuadrada de los
valores correspondientes a las semanas sin em

pleo. c) Realice un diagrama de dispersin y


calcule la correlacin utilizando los valores
transformados, d) Compare los resultados de
los dos mtodos. (Nota: el ejercicio supone que
el alumno ya ha estudiado el captulo 3).

9 4

14

14

14

04 0 4

0 4

04

0 4

0 4=.

3 0

30

9 0 9 0

31 91

91

19

19

1 3

9j

.:

5. Un estudi compar a los alumnos del


primer y segundo ao de facultad en cuanto a :
la cantidad de amigos ntimos. Los investiga
Semanas desetnpleado Satisfaccin marital
dores predijeron que los alumnos de segund :
2
8
ao tendran ms amigos ntimos. Los cinco :
1
9
alumnos de primer ao que participaron de la ;
9
6
prueba informaron 2, 0, 2, 1 y 1. Los cinco
16
3
25
5
alumnos de segundo ao que participaron de
4
7
la prueba informaron. 3, 4, 1, 2 y . Realice
una prueba de aleatorizacin aproximada con
4.
Un investigador realiz un experimento
estos datos de la siguiente manera: a) Calcule
organizado en tomo a un importante discurso
la diferencia de medias entre los dos grupos
televisado del presidente de los e e . u u . Inme
reales, b) Escriba la cantidad de amigos ntimos
diatamente despus del discurso, tres partici
para cada participante en una tarjeta, c) Mezcle
pantes fueron asignados al azar para escuchar
las 10 tarjetas y colquelas boca arriba en dos
los comentarios del comentarista poltico del
grupos de cinco. Calcule la media de las prime
canal de televisin. A otros tres se les asign
ras cinco y calcule la diferencia con la media
pasar el mismo tiempo con la televisin apaga
de las segundas cinco, y luego antela, d) Vuel
da, reflexionando tranquilamente sobre el dis
va a mezclar y repita ese proceso 40 veces,
curso. Despus, los participantes de ambos gru
e) Determine cuntas de las 40 veces obtuvo
pos completaron un cuestionario que evaluaba
cunto del contenido del discurso recordaban diferencias de medias tan altas como la mues
con precisin. El grupo que escuch a los co tra real.
6. Carey et al. (1997) desarrollaron un pro
mentaristas present los valores 4,0 y 1. El gru
grama
diseado para mejorar la motivacin
po que reflexion tranquilamente present los
con
el
fin
de evitar los riesgos de infeccin con
valores 9,3 y 8.
Escuchar a los comentaristas afect el re Htv. Despus, analizaron su efectividad con un
cuerdo del discurso? Utilice el nivel 0,05, una grupo de mujeres de ciudad de baja posicin
cola, prediciendo mayores valores para el gru econmica que fueron asignadas al azar para
po que reflexion tranquilamente sobre el dis recibir el programa o formar parte del grupo de
curso. a) Realice una prueba t para medas control. Todas las mujeres fueron medidas an
independientes, b) Realice una prueba de alea- tes, 3 semanas despus y 12 semanas despus
torizacin con los datos, c) Compare los resul de que el grupo experimental participara del
tados utilizando los dos mtodos, d) Explique programa. Una de las medidas aplicadas en el
lo que ha hecho y los resultados a alguien que estudio se refera a la comunicacin sexual, co
est familiarizado con la prueba t pero no con mo por ejemplo, hasta qu punto las mujeres,
segn lo que ellas informaban, haban hablado
pruebas de aleatorizacin.
Nota: las 20 formas diferentes de formar con sus parejas sobre sexo seguro y pruebas de
dos agrupaciones con estos seis valores son las Htv, Antes de describir los anlisis sobre esta
variable, Carey et al. observaron lo siguiente:
siguientes:
Los valores de comunicacin eran positiva
4 9 41 41 4 1 4 0
4 0 4 0 40 4 0 4 0
mente asimtricos en las tres ocasiones; trans
0 3 03 09 0 9
13
1 9 1 9 9 1 9 1 3 1
formaciones log 10 (x + 1) fueron la mejor
JJS 2 1 1 1 1 1
8 9
3_8 1 1 1 1
9J
11
correccin para lograr normalidad y fueron

utilizadas en anlisis sucesivos (p.536), Ex


plique qu es lo que se describe aqu (y por qu
se realiza) a una persona que comprende la es
tadstica paramtrica ordinaria pero que nunca
ha odo hablar sobre transformaciones de da
tos. (Puede ignorar la parte del x + 1. A ttu

lo informativo le explicamos que los investiga


dores sumaron un 1 a cada valor antes de reali
zar la transformacin og porque algunos valo
res de comunicacin eran .igual a 0, y no se
puede calcular el logaritmo de 0).

Integracin
de contenidos:
el modelo
lineal general

Breve revisin de correlacin


y regresin mltiples,
> Relacin entre los principales
mtodos estadsticos,
> Revisin de los principios
de la regresin y la correlacin
mltiples,
N- Introduccin al modelo lineal general.
!
. El modelo lineal general y
la regresin / correlacin mltiples.
P- Regresin y correlacin bivariadas
como casos especiales de
regresin / correlacin mltiple.
^ La prueba t como caso especial
del anlisis de varianza.

> La prueba t como caso especial de la


prueba de significacin de! coeficiente
de correlacin.
^ El anlisis de varianza como caso
^
especial de la prueba de significacin
coeficiente de correlacin mltipla*
Eleccin de pruebas estadsticas,
Los supuestos y el modelo lineal general.
' Controversias y limitaciones.
Resumen, :
Trminos clave,
^ Ejercicios,

1 propsito de este captulo es unificar y profundizar los conocimientos acerca de las


principales tcnicas aprendidas: el anlisis de varianza, la prueba t, la correlacin y la
regresin; a la vez que constituye una revisin completa de las tcnicas mencionadas.

RELACIN ENTRE IOS PRINCIPALES MTODOS ESTADSTICOS


Ms del 90% de los estudios publicados en 1988 por las ms prestigiosas revistas especializadas
en psicologa social empleaban pruebas t, anlisis de varianza, correlacin o regresin mltiples
(Reis & Stiler, 1992). Probablemente, ya se hayan hecho evidentes muchas semejanzas entre
estos cuatro mtodos y las otras tcnicas estadsticas aprendidas a lo largo del libro. De hecho,
las tcnicas estn ms relacionadas de lo que podramos creer: muchas de ellas no son ms que
simples variaciones matemticamente equivalentes entre s, y la mayora tienen su origen en la
misma frmula general. Lo anterior se debe a que existe una lgica central que sustenta todos es
tos mtodos. La lgica central se basa en una frmula general que los estadsticos matemticos
denominan modelo lineal general. (El modelo lineal general no tiene ninguna relacin especial
con el modelo estructural del anlisis de varianza).

Figura 16-1.
Relacin entre las cuatro priricfe:
pales tcnicas estadsticas.

Por lo tanto, vamos a concentramos en los cuatro grandes, todos ellos casos especiales del modelo
lineal general y, por ello, sistemticamente relacionados. Es posible que en el proceso emerjan mu
chas de las intuiciones que habamos percibido parcialmente con respecto a lo aprendido.
Para expresarlo en forma breve (y luego profundizar sobre el tema), la tcnica ms general es la
regresin/correlacin mltiples (captulo 4), siendo la correlacin bivariada (captulo 3) un caso es
pecial de la misma. Finalmente, la prueba t (captulos 9 y 10) deriva directamente de la correlacin
bivariada o del anlisis de varianza. La figura 16-1 representa grficamente las vinculaciones men
cionadas.
Cuando decimos que un procedimiento es un caso especial de otro, queremos decir que el pri
mero puede deducirse de la frmula del segundo. Por eso, cuando utilizamos los procedimientos
ms especializados obtenemos el mismo resultado que hubiramos obtenido con el procedimien
to ms general. Para ser ms concretos, si viajramos a una isla desierta a realizar una investiga
cin psicolgica y slo pudiramos llevar un programa de computacin para realizar las pruebas
estadsticas, nos convendra elegir uno que realizara correlacn/regresin mltiples. Con ese
programa podramos lograr todo lo que se obtiene con programas ms especializados de correla
cin bivariada, pruebas f y anlisis de varianza.
En este captulo investigamos tales vnculos. Primero, revemos brevemente la idea de regresin/correlacin mltiples que presentamos en el captulo 4, y en ese contexto analizamos una de
finicin formal del modelo lineal general. Despus, examinamos cada uno de los vnculos: la
regresin / correlacin mltiples con la correlacin bivariada; el anlisis de varianza con la prue
ba , y la regresin / correlacin mltiples con el anlisis de varianza.

REVISIN DE LOS PRINCIPIOS DE LA REGRESIN


Y LA CORRELACIN MLTIPLES
Repasemos brevemente el principio de regresin y correlacin vistos en los captulos 3 y 4. En
primer lugar, recordemos la idea bsica de prediccin bivariada (tambin denominada regresin
bivariada) que implica formular una regla sistemtica para predecir el valor de una persona en
cuanto a determinada variable dependiente, a travs del anlisis del valor de esa persona en la va
riable de prediccin (o independiente). Por ejemplo, predijimos los niveles de estrs de nuevos
gerentes, a partir del conocimiento de la cantidad de personas que supervisaran. La regresin

mltiple es aquella situacin en la que se predice basndose en dos o ms variables de prediccin;


por ejemplo, predecir el nivel de estrs de nuevos gerentes utilizando la cantidad a supervisar ms
el nivel de mido y la cantidad de decisiones a tomar por mes.
Podemos crear normas de prediccin tanto con puntuaciones Z como con puntuaciones origi
nales. En este captulo, nos concentramos en la opcin de las puntuaciones originales, ya que a
travs de ellas se observa con mayor facilidad la relacin con el modelo lineal general. Una regla
de prediccin para la regresin mltiple con tres variables de prediccin, trabajando con puntua
ciones originales, sera la siguiente: el valor a predecir para una persona con respecto a la variable
dependiente es la suma de un nmero en particular (la constante de regresin, denominada a),
ms un coeficiente de regresin para puntuaciones originales ( b j por el valor de la persona en
cuestin en la primera variable de prediccin (X(); ms un segundo coeficiente de regresin para
puntuaciones originales (2) por el registro de la persona en la segunda variable de prediccin
(X2), ms un tercer coeficiente de regresin para puntuaciones originales (b3) por el valor de la
persona en la tercera variable de prediccin (X3).
La frmula es la siguiente:
f = a + (fcl)(X,)+(i2)(X2)+ (^ )(X 3 )

(16-1)

donde Y es el valor predicho de la variable dependiente.


Por ejemplo, en el caso del nivel de estrs de los gerentes, presentado en el captulo 4, sugeri
mos que una posible regla de prediccin de puntuaciones originales, para un caso con tres varia
bles de prediccin, podra ser la siguiente:
E strs - - 4 , 7 0 + ( 0 , 5 6 cantid ad d e p erso n a s s u p e r v isa d a s )
+ (0 ,0 6 ruido m e d id o en d e c ib e le s )
+ (0 ,8 cantid ad d e p la z o s a cu m p lir por m e s )

As, si un presunto gerente fuera a supervisar slo a cuatro personas en un rea con 50 decibeles
de mido, y tuviera slo un plazo a cumplir por mes, el nivel de estrs predicho sera calculado de
la siguiente manera:

E strs - - 4 , 7 0 + (0 ,5 6 )(4 ) + ( 0 ,0 6 X 5 0 ) + ( ,8 6 )(l)


= 4 ,7 0 + 2 ,2 4 + 3 + 0 ,8 6 * 1,40

La prediccin del nivel de estrs del gerente sera muy baja (1,40).
Tambin es posible describir el grado general de relacin entre la variable dependiente y la
combinacin de variables de prediccin. Este dato se denomina coeficiente de correlacin ml
tiple y se simboliza con una R. R debe ser al menos tan grande como la correlacin bivariable
ms pequea entre cualquiera de las variables de prediccin y la variable dependiente. R2 es la
reduccin proporciona! del error cuadrtico lograda utilizando la regla de prediccin para re
gresin mltiple, en contraposicin con la simple prediccin de la variable dependiente a partir
de su propia media.

Finalmente, se puede probar la significacin de una correlacin mltiple (y de la correspon


diente reduccin proporcional del error) utilizando un procedimiento en el que la hiptesis nula
establece que la correlacin mltiple de la poblacin es 0,
En este captulo, nos referiremos a todo el procedimiento de regresin mltiple y correlacin
mltiple en su conjunto como regresin/correlacin mltiples. Es una costumbre ampliamente
utilizada y simplifica la exposicin.

INTRODUCCIN AL MODELO LINEAL GENERAL*123


Una forma de expresar el modelo lineal genera! es vindolo como una relacin matemtica entre
una variable dependiente y una o ms variables de prediccin. El principio bsico establece que el
valor de una persona en determinada variable dependiente (como por ejemplo el nivel de estrs)
es la consecuencia de la suma de varias influencias:
1. Cierta influencia fija que ser igual para todos los individuos, tales como la naturaleza del
procedimiento de prueba o los impactos de la biologa humana y la sociedad.
2. Influencias de otras variables que hemos medido en las que las distintas personas tienen re
gistros diferentes, tales como cantidad de personas supervisadas, nivel de raido y cantidad de de
cisiones por mes.
3. Otras influencias no medidas, que son las que producen el error.
La influencia 1 corresponde a la constante de regresin () en la ecuacin de regresin mltiple.
La influencia 2 corresponde a todos los pares de b y X, (b2)(X), (b7)(X2), y as sucesivamente, en la
ecuacin de regresin mltiple. La influencia 3 se refiere a los errores de prediccin. (Si existiera una
correlacin mltiple de 1,0 no existira la influencia 3). As, el modelo lineal general se puede expre
sar simblicamente de la siguiente manera:
Y = a + (^XXj) + (b2)(X2) + {b3)(Xz) + . . . +

(16-2)

En la frmula precedente, Y es el valor real de una persona en la variable dependiente, a es


la influencia fija que se aplica a todos los individuos (influencia 1). b es el grado de in
fluencia de la primera variable de prediccin (influencia 2); es decir, el coeficiente de regre
sin para puntuaciones originales, que despus se multiplica por la puntuacin original de
la persona en la primera variable de prediccin, X r b2, b3> y as sucesivamente, son las in
fluencias de las variables de prediccin 2, 3, y as respectivamente, e es el error, la suma de
todas las otras influencias (influencia 3) en el valor de la persona en Y. Es decir, e es lo que
queda despus de haber tenido en cuenta todos los dems elementos de prediccin.
La frmula precedente, segn se observa, es casi idntica a la de la regresin mltiple,
pero con dos excepciones. Primero, en lugar del valor Y predicho (7) ubicado a la izquierda,
tenemos el valor real Y. Segundo, incluye el trmino de error (e), debido precisamente a que
la frmula busca el valor real de Y, y los valores a y b comnmente no predicen en forma
perfecta. El trmino de error (e) se agrega para justificar esa discrepancia.
As, el modelo lineal general es la enunciacin de las influencias que forman el valor de
un individuo en una variable determinada. Se denomina modelo lineal porque si realizra
mos un grfico de la relacin entre las variables dependiente y de prediccin, la figura for
mada sera una lnea recta. Es decir, la relacin sera constante, en el sentido de que no es
curvilnea. La influencia que acta como tasa de cambio (el coeficiente de regresin) de ca-

da variable de prediccin siempre es la misma. En trminos matemticos, se dice que la


ecuacin es lineal porque no incluye trminos elevados al cuadrado (o elevados a mayores
potencias).1
Probablemente, el alumno tambin haya escuchado que varios procedimientos estadsti
cos utilizan un modelo de cuadrados mnimos. Se trata de un modelo en el que los valores
a y b del modelo linea! general (o de una regla de prediccin de regresin mltiple), para
una variable dependiente en particular, se determinan de modo de crear la menor cantidad
posible de error cuadrtico, idea que ya hemos tratado extensamente.

MODELO LINEAL GENERAL Y REGRESlN/CORRELACiN MLTIPLES


El vnculo entre el modelo lineal general y la regresin/correlacin mltiples es muy estre
cho; son prcticamente lo mismo. Tradicionalmente, no se los ha equiparado porque se con
sideraba que el modelo lineal general estaba implcito en otras tcnicas, tales como la
correlacin bivariada y el anlisis de varianza, adems de la regresin / correlacin mlti
ples. Sin embargo, en los ltimos aos, los psiclogos han advertido (p. ej. Cohn & Cohn,
1983) que estas otras tcnicas pueden derivar de la regresin / correlacin mltiples al igual
que del modelo lineal general.

REGRESIN Y CORRELACIN Bl VARI A DAS COMO CASOS


ESPECIALES DE REGRESIN / CORRELACIN MLTIPLES
La regresin bivariada, es decir, la prediccin de una variable dependiente a partir de una variable
de prediccin, es un caso especial de regresin mltiple, la prediccin de una variable dependien
te a partir de una cantidad cualquiera de variables de prediccin. Asimismo, la correlacin biva
riada, la relacin entre una variable de prediccin y una variable dependiente, es un caso especial
de correlacin mltiple, la relacin entre una cantidad cualquiera de variables de prediccin y una
variable dependiente.

LA PRUEBA X COMO CASO ESPECIAL DEL ANALISIS DE VARIANZA*1


La relacin del modelo lineal general con la correlacin y la regresin es bastante directa. La rela
cin del modelo lineal general (o de la correlacin y la regresin) con la prueba t y el anlisis de
varianza es menos directa. Sin embargo, antes de dedicamos a esa relacin, analicemos primero
el vnculo entre la prueba t y el anlisis de varianza.

1 Existen mtodos ingeniosos de introducir furtivamente trminos elevados al cuadrado o a mayores potencias en los
procedimientos del modelo lineal. Por ejemplo, podramos crear una variable nueva, transformada, en la que cada valor
estuviera elevado al cuadrado. Luego se podra utilizar esa variable transformada en una ecuacin de modelo lineal co
mo una variable original. As, en la ecuacin no aparecera en realidad ningn trmino elevado al cuadrado. Este peque
o truco resulta extraordinariamente valioso. Por ejemplo, ciertos textos sobre regresin mltiple (p. ej, Cohen &
Cohen, 1983; Darlington, 1990) muestran la forma de utilizar ese tipo de procedimientos para trabajar con relaciones
curvilneas a travs de mtodos estadsticos diseados para relaciones lineales.

Tanto la prueba t como el anlisis de varianza son procedimientos para probar a diferencia ;
entre medias de grupos. La prueba t se utiliza cuando existen slo dos grupos.2 El anlisis de va- ..
danza con razn F, se utiliza generalmente slo cuando existen ms de dos grupos. Sin embargo,
no existe motivo para no utilizar un anlisis de varianza slo con dos grupos. Cuando existen slo
dos grupos, la prueba t y el anlisis de varianza producen conclusiones idnticas.
r y F son estrictamente idnticos slo cuando se trabaja con dos grupos. Cuando existen ms
de dos grupos, no podemos realizar una prueba t ordinaria. Por eso decimos que la prueba t es un 7
caso especial del anlisis de varianza. La prueba-es matemticamente idntica al anlisis de va
rianza en el caso particular en el que existen slo dos grupos (pronto analizaremos un ejemplo). :
Comprensin intuitiva de ia reiacin entre los dos procedimientos
Un modo de percibir el vnculo entre los dos procedimientos es a travs de la analoga con el co
eficiente seal-ruido que presentamos en el captulo 11 para explicar el anlisis de varianza. La
idea es que la razn F del anlisis de varianza es una medida del grado en el cual la seal (anlo
ga a la diferencia entre las medias de grupo) excede el ruido (anlogo a la variacin interna de ca
da uno de los grupos). La misma idea se aplica a la prueba , que en realidad tambin determina el
grado en el cual la seal (la diferencia entre las medias de los dos grupos) excede el ruido (el des
vo estndar de la distribucin de diferencias de medias, que tambin se basa en la variacin inter
na de los grupos).
Paralelismos entre la lgica bsica de los dos procedimientos
El anlisis de varianza se basa en el clculo de una razn F (que despus se compara con el punto
de corte tomado de una tabla basada en una distribucin F). La razn F es la estimacin de la va
rianza pobiacional que se basa en la variacin entre las medias de dos o ms grupos, dividida por
la estimacin de la varianza pobiacional basada en la variacin dentro de cada uno de esos gru
pos. Es decir, la razn Fes una fraccin en la cual el numerador se basa en las diferencias entre
los grupos comparando sus medias, y el denominador se basa en la variacin dentro de cada uno
de los grupos.
La prueba t se basa en el clculo de un valor f (que despus se compara con un punto de corte
previamente definido, tomado de una tabla basada en una distribucin i). El valor es la diferen
cia entre las medas de los dos grupos dividida por el desvo estndar de la distribucin de dife
rencias de medias. El desvo estndar de la distribucin de diferencias de medias se calcula
utilizando una estimacin combinada de la varianza que se basa en el promedio de la varianza
dentro de cada uno de los dos grupos. El valor t es una fraccin en la que el numerador es la dife
rencia entre los grupos comparando sus medias, y el denominador se basa en la variacin dentro
de cada uno de los grupos.
En otras palabras, como lo indica la seccin superior de la tabla 16-1, tanto una razn F como
un valor t son fracciones en las cuales el numerador se basa en las diferencias entre las medias de
los grupos y el denominador se basa en las varianzas dentro de los grupos.1

En este captulo, nos concentramos en la prueba de hiptesis para medias independientes (y tambin en el anlisis de
varianza para diseos intersujetos). Sin embargo, las conclusiones finales son las mismas que con respecto a la prue
ba t para medias dependientes. Se trata de un caso especial de anlisis de varianza de medidas repetidas. Adems, tan
to la prueba r para medias dependientes c o m o el anlisis de varianza de medidas repetidas, son casos especiales de
regresin i correlacin mltiples. De todos modos, el vnculo entre estos mtodos y la correlacin mltiple involucra al
gunos niveles extra de lgica que no analizamos aqu, para concentramos en las ideas principales del captulo.


Cuadro 16-1.
~La poca dorada de la estadstica: cuatro muchachos en Londres.

En el ltimo captulo de su pequeo libro .

Tankard tambin plantea. tres impori.. (


tantes factores; sociales especficos:d esa. >
kard (1984) trata el interesante hecho de
poca dorada de la estadstica. En primer ..
que las cuatro tcnicas estadsticas ms
lugar, hay que tener en cuenta el papel que v
comunes fueron creadas por cuatro ingle-, desempeaba la bmetra, que intentaba . v
ses nacidos dentro de un periodo de sesen- .
probar matemticmnte: la teora: d e 'la
ta y ocho aos, tres de los cules tirabaevolucin. La biometr ejerci influencia /.
jaban en las cercanas de Londres (y el
cuarto, Gosset, a pesar de estar atascado en v a travs de l lectur que Gltqn hizo, .de?a fbrica de cerveza en Dubln, visitaba
' Darwin y de la influencia de Gaitpn sbre,. ::
Pearsn. En. segundp lugar,;, este .periodo.: yi
Londres para estudiar y se mantena eri
presenci
el comienzo de l. contratacin. :
contacto con todo lo que estaba sucediendo....
masiva, en. el sector industrial y agrcola; :
en esa ciudad). Cul era el motivo? 1
En primer lugar, Tankard senta qu la de graduados universitarios con capacita- ij
proximidad y comunicacin de esos perso
cin matemtica avrizd: Y.:eh,trcr Iu-> ;i
najes fueron importantes para la creacin gar, desde la poc de.'Newton, l U niveride una masa crtica de mentes, qu se
sidd de Cambridge' habr sido; una fenteysuele relacionar con-una poca de oro para ' especial y centralizaddd matemtips bri-?'v
el descubrimiento y la creatividad. En se
liantes para Inglateifa. Podan dsenrinarseL ;
gundo lugar, como sucede frecuentemente
por toda la industria britmcyLam'svrv;
con los descubrimientos importantes, cada v
travs de su alma mter comn permlmecr /:
uno enfrent complicados problemas prc
;
ticos o anomalas que los impulsaron ha- ;. en contacto tanto con los. alurmios.Cohp.
entre s, y tambin al tanto de lo ififimps ''
ca las soluciones que descubrieron. (Nin
' 7 '''y? yf P l S i f
guno se propuso simplemente inventar- un y - descubrimientos.
' Finalmente, Tankard dedk lguns; p-y^;:;
mtodo estadstico). Gaton (cuadro 3-1)
estaba interesado en las caractersticas de labras clidas, casi poticas, l hist0ri.de :^
padres e hijos; Pearson (cuadro 14-1) en la
' esta- ciencia-; en gnral y a su 'pPc'dPrady i
medicin de la concordancia entre'una:se
.'en particular: ,-y
.
-:vl
rie de observaciones y una curva terica. ..
En realidad, es djLSbil' cqicia{^i3de*<^z^riv';
El problema de .Gosset (cuadro 9-1) eran
.. puede rotularse l estadstic
;j
las pequeas muestras ocasionadas por las
diosa e inanimada. Besp&:{ile$cudn-y
condiciones econmicas de la industria c e r-.. v
fiar bajo-, la superficie de sta:discplira y?y
vecera, y Fisher (cuadro 1-1) estaba estu-
prctica y poderosa, comprndein.qu; yPtii
diando los efectos del abono en las plan
ms de una vez, ha logrado producir.fiiri ; y ;
taciones de papas. (Tankard seala que la
tes pasiones y enrgjcosdeb^es;:nti-l%':e:;
edad no fue un factor comn. La edad en
las personas. Y siendo la estadstica pro-;
la que estos cuatro hombres realizaron su
mayor contribucin flucta entre los 31 y
ducto de .la. mente-^humMaYsih
los aos).
continuar hacindolo(p.4'iy...

Los pioneros de la estadstica, James Tan-

Relacin matemtica entre los dos procedimientos


En los-casos en los que hay slo dos grupos, la frmula para calcular el valor t es precisamente la
raz cuadrada de la frmula para la razn F. A la mayora de los alumnos no les interesar el ori
gen preciso de esta relacin, pero tiene una consecuencia importante. Si calculamos un valor /, se
r exactamente la raz cuadrada del resultado que obtendramos si calculramos una razn F de la
misma serie de observaciones. Por ejemplo, si calculramos un t igual a 3 y despus calculramos
un F con los mismos datos, el F sera igual a 9. Asimismo, veamos qu ocurre con los puntos de
corte indicados en una tabla f: son exactamente la raz cuadrada de los puntos de corte indicados
en la columna de la tabla F que utilizamos cuando realizamos un anlisis de varianza con dos gru
pos (es decir, en la parte de la tabla F en la que los grados de libertad del numerador son igual al).
Un aspecto particular.de la equivalencia matemtica d &t y F ayudar a comprender el modo
en que dos series de clculos, aparentemente tan diferentes, encierran en realidad lo mismo. Una
diferencia aparente entre los dos procedimientos es el modo en que los afecta el tamao de la
muestra. En el anlisis de varianza, el tamao de la muestra es parte del numerador. Tal como vi
mos en el captulo 11; el numerador de la razn F es la estimacin de la varianza poblacional que
utiliza la diferencia entre las medias multiplicada por la cantidad de observaciones en cada grupo.
Es decir, 5 | nte ~ GS^Xri). En la prueba /, el tamao de la muestra es parte del denominador. Como
vimos en el captulo 1 0 , el denominador de la prueba t utiliza la estimacin combinada de la va
rianza poblacional dividida por la cantidad de observaciones de cada grupo.
F< rWir 9
d'sri
. e2
c2 , c2 . c2 c2
/ ^ _S l ^ S l________
ombiJ N ..2).
u c u ^diferencia
diferencia diferencia
Wi + M 2 1 tf L con_____
Sin embargo, esta aparente contradiccin se resuelve, porque rauliphcar el numerador de
una fraccin por un nmero tiene exactamente el mismo efecto que dividir el denominador por
ese mismo nmero. Por ejemplo, tomemos la fraccin 3/8. Si multiplicamos el numerador por 2
nos da 6/8, 3/4; si dividimos el denominador de 3/8 por 2 tambin nos da 3/4,3
Tabla 16-1.
Algunos vnculos de la prueba t para medias independientes y el anlisis de varianza.
Pruebai

Anlisis de varianza

E l numerador de t es la diferencia
entre las m edidas de dos grupos.

El numerador .de F s e basa, en parte, en la variacin entre


las m edias de d os o m s grupos.

E l denom inador de t s e basa, en parte,


El denom inador de F se calcula com binando las estim ae n la com bin acin d e las estim aciones de varianza cio n es de varianza poblacional calculadas a partir de cada
poblacional calculadas a partir de cada grupo
grupo.
E l denom inador de im p lic a
dividir por la cantidad d e registros.

C uando s e utilizan dos grupos,

g/ = (At ~ i) + (A ,-l)

t = FF

E l numerador de F involucra la m ultiplicacin por


la cantidad de observaciones. (M ultiplicar un numerador
por determinado nm ero tiene e l m ism o efecto
qu e dividir e l denom inador por ese m ism o nmero).

C uando se utilizan d os grupos, F ~ t1


'Dentro

1) +

(fl2-

i ) + +(^ltimo

3 Otras diferencias aparentes (tal como la supuesta diferencia entre el numerador de la razn F, que se basa en una esti
macin de varianza, y el numerador dei punto t, que es una simple diferencia entre medias) presentan una unidad sub
yacente similar. Pero aqu no trataremos esos temas.

T a b la 1 6 -2 ,
C lc u lo s d e la p r u e b a t y el a n lis is d e v a r ia n z a c o r r e s p o n d ie n te s a u n e x p e r im e n to a c e r c a d e la e fe c
tiv id a d d e u n n u e v o p r o g r a m a d e c a p a c ita c i n la b o r a l (d a to s fic tic io s ).
G r u p o ex p e rim e n ta l
(P ro g r a m a e sp ec ia l)

4
9

1
7
3
6
X

( W
0

-2
3
1
1
-3

4
9
1
1
9

1
5
3
1
1
4

24

21

42

M = 6

^ =7

*2

X,
6

G ru p o d e con trol
(P rogram a e st n d a r)

S ] = 2 4 /6

=4

1=6

(X2-A /

3
-2
2

9
4
4

-2
-2
1

4
4
1

0-

2= 3

2= 7

C lcu lo s d e la p r u e b a t

2-

26

$|-= 2 6 /6 = 4 ,3 3
. ^ 2= N 2 - l = 6

C lcu los d e l anova


N um erador

D iferen cia m edia = 6 ,0 0 - 3 ,0 0 = 3 ,0 0

^Entre ^Grupos ~ ^ ~ 2

1 -1

G M = ( + 3 )/2 - 9/2 4,5

X (M - G M ? = (6 - 4,5)2 + (3 - 4 ,5 )3
'
= 1 ,5 * + -1 ,5

= 2 ,2 5 + 2 ,2 5 = 4 ,5 -

D e n o m in a d o r

C2

combinada

12

<4) + ( - ~ - |( 4 ,3 3 )

= (0 ,5X 4) + (0 ,5 )(4 ,3 3 ) = 2 ,0 0 + 2,17 = 4 ,1 7

g
^diferencia "

+ $M2 ~ ^ o m i n a J ^ O + ^combinada^ " 1

dentro

sf+s l + +

CM,

4 + 4,33

Grupos

= (4 ,1 7 /7 )+ (4 ,1 7 /7 )
8,33

= 0 ,6 0 + 0 ,6 0 = 1 ,2 0

= 4 ,1 7

W i a =^

^ = U 0
G r a d o s d e L ib e r ta d

8 ^ i =8h +8l2= 6 ^ 6 = ^
C o rte
t necesario con g l = 12 a nivel 5%,

dos c o la s= 2 ,1 7 9

Adentro 8 ^i + 8^2 * />^GUioao 6 + 6 = 12/ necesario con g l = 1,2 a nivel :

= 4,75
R eg istro en la d istr ib u ci n c o m p a ra tiv a

t = ( M l - M 2) / SD m . = (6 ,0 0 - 3 .0 0 V U 0 = 3 ,0 0 /1 , 10 = 2,73

55

Conclusiones
Se rechaza a hiptesis nula.
Se sostiene la hiptesis de investigacin.

Se rechaza la hiptesis nula.


Se sostiene la hiptesis de investigacin.

Clculos que ejemplifican la identidad de los dos procedimientos


La equivalencia se ver con mayor claridad a travs de un ejemplo de los clculos correspondien
tes. La tabla 16-2 muestra los clculos de t y F para uno de los ejemplos de prueba t del captulo
10. Se trata del experimento ficticio que prueba la efectividad de un nuevo programa de capacita
cin laboral para individuos que previamente no han sido capaces de mantener sus empleos. Es
importante observar: a) La estimacin combinada de la varianza pobiacional de la prueba t
^combinada ~ 4,17) es igual a la estimacin intergrupal de la varianza poblaconal del anlisis de
varianza (S2Deiltro = 4,17), ambas calculadas como parte del denominador, b) Los grados de liber
tad de la distribucin t (g l =12) son exactamente iguales a los grados de libertad del denominador
de la distribucin F ( g l D m m - 12). c) El punto de corte t para rechazar la hiptesis nula (2,179) es
la raz cuadrada del punto de corte F para rechazar la hiptesis nula (Vi,75 = 2,179). d) El esta
dstico t calculado con esta informacin (2,73) es la raz cuadrada del F calculado (V7,55 = 2,75,
la diferencia se debe al redondeo). Y e) la conclusin es la misma: con ambos mtodos rechaza
mos la hiptesis nula.

LA PRUEBA TCOMO CASO ESPECIAL DE LA PRUEBA


DE SIGNIFICACIN DEL COEFICIENTE DE CORRELACIN
La relacin entre el coeficiente de correlacin y la prueba t no es para nada obvia. Incluso, mu
chos investigadores psicolgicos se han dado cuenta del vnculo recientemente. El coeficiente de
correlacin es el grado de relacin entre dos variables; la prueba t trata sobr la significacin de la
diferencia entre dos medias poblacionales. Cul es la conexin posible? Una conexin es que
ambos utilizan la distribucin para determinar la significacin.
En el captulo 3 todava no habamos analizado la lgica de la prueba de hiptesis, por lo tan
to, slo podamos exponer la significacin de un coeficiente de correlacin en trminos muy ge
nerales. Con todo lo que ya hemos aprendido, ahora podemos explicarla con ms precisin. l
procedimiento sigue los cinco pasos estndar de prueba de hiptesis. Sus caractersticas principa
les son: a) la hiptesis nula establece que la poblacin tiene una correlacin igual a 0; b) la distri
bucin comparativa es una distribucin t con. tantos grados de libertad como la cantidad de
participantes menos 2, y c) el valor en la distribucin comparativa es un valor t calculado a partir
del coeficiente de correlacin utilizando la frmula; t ~ rvF P T H b r2. (Para mayores detalles, in
cluso un ejemplo y el anlisis de cuestiones, relacionadas con el tamao de efecto y la potencia,
vase el apndice II del captulo 3). Es importante sealar que la clave de todo el proceso es con
vertir el coeficiente de correlacin en un valor t.
Sin embargo, conocer este procedimiento no nos permite discernir con claridad por qu se
puede convertir al coeficiente de correlacin en un valor t con el propsito de realizar una prueba

de hiptesis. Tampoco nos explica la conexin entre el t basado en el coeficiente de correlacin y


la prueba t aplicada para probar la diferencia entre las medias de dos grupos. A estos temas nos
dedicaremos ahora.
Diferencias grupales expresadas como relaciones entre variables
Generalmente pensamos en el coeficiente de correlacin como la relacin entre una variable de
prediccin (o independiente) y una variable dependiente. Probar la significacin de un coeficien
te de correlacin implica preguntarse si podemos rechazar la hiptesis nula que establece que en
la poblacin no existe relacin entre las dos variables (que en la poblacin, r = 0),
La prueba t para medias independientes analiza la diferencia entre dos medias poblacionales
sobre la base de las medias de dos muestras. Las muestras se miden segn una variable depen
diente, Lo que diferencia a los dos grupos es la variable independiente o de prediccin. En nues
tro ejemplo de la seccin anterior, la variable independiente era la que indicaba si los participantes
reciban el nuevo programa de capacitacin laboral o el programa ordinario. La hiptesis nula
puesta a prueba establece que el grupo al que pertenece el participante (la variable de prediccin)
no tiene ningn efecto sobre la variable dependiente. La prueba t est analizando si en la pobla
cin en general existe alguna relacin entre la variable de prediccin y la dependiente, Si volve
mos a analizar la oracin anterior, veremos que se ha reconstruido la prueba convirtindo-la en
una relacin entre la variable de prediccin y una variable dependiente.
En otras palabras, un coeficiente de correlacin significativo ndica que la variable de predic
cin y la dependiente estn relacionadas. Una prueba t de medias independientes, que resulta sig
nificativa, indica que la variable de prediccin y la dependiente estn relacionadas. Ambas indican
lo mismo,
Variables numricas de prediccin en comparacin con variables
nominales de prediccin dictomtcas
A esta altura el alumno podra objetar: La variable de prediccin en un coeficiente de correla
cin es una variable numrica, tal como la cantidad de personas supervisadas o el promedio de ca
lificaciones en el colegio secundario. La variable de prediccin en una prueba t para medias
independientes es una variable con exactamente dos valores, las dos categoras, tales como un
grupo experimental en comparacin con un grupo de control
S, es verdad. Esa es precisamente la diferencia entre los casos en los que utilizamos un coefi
ciente de correlacin y aquellos en los que utilizamos una prueba para medias independientes.
Generalmente, tanto para el coeficiente de correlacin como para la prueba t para medias in
dependientes, la variable dependiente puede tener un rango de valores numricos. Sin embargo,
con respecto a la variable de prediccin existe una diferencia. En el caso del coeficiente de corre
lacin, la variable de prediccin, al igual que la variable dependiente, tambin es tpicamente nu
mrica. Por ejemplo, una correlacin entre cantidad supervisada y nivel de estrs es una relacin
entre variables numricas. En una prueba t para medias independientes la situacin es diferente;
en ese caso, la variable de prediccin tiene exactamente dos valores, los que de ningn modo son
nmeros. La variable de prediccin en una prueba t es una variable nominal con slo dos valores
(dlcotmicas). Tiene dos categoras distintas, como por ejemplo, pertenecer al grupo experimen
tal o al grupo de control.

Cerrando l brecha entre las variables numricas y las variables nominales dicotmicas
Cmo podramos cerrar esa brecha? Supongamos que otorgamos arbitrariamente dos nmeros a
la variable nominal con dos categoras. Por ejemplo, llamemos 1 al grupo experimental y 2 al gru
po de control. (Utilizar otros dos nmeros cualesquiera, finalmente produce exactamente el mis
mo resultado al convertir todo en puntuaciones Z para calcular el coeficiente de correlacin. Los
dos nmeros que utilicemos y, especficamente, a qu categora apliquemos el nmeio ms alto,
determinar simplemente el signo positivo o negativo del resultado final).
Una vez que hemos convertido de este modo una variable de prediccin nominal, con dos ca
tegoras para una prueba f de medias independientes, en una variable numrica (con slo dos va
lores, debemos admitir); podemos proceder a calcular el coeficiente de correlacin y, finalmente,
determinar su significacin.
Ejemplo de la equivalencia d clculo entre la prueba t
y la prueba de significacin del coeficiente de correlacin
La tabla 16-3 indica los clculos) del coeficiente de correlacin y su significacin, con los valores
del mismo ejemplo de prueba t que utilizamos anteriormente.' (Para que la tabla fuera razonable-

Tabla 16-3.
Clculo del coeficiente de correlacin y de una prueba de hiptesis sobre el coeficiente de correlacin
con los datos de la tabla 10-3 (y tabla 16-2), en el que se convierte la variable de prediccin (indepen
diente) en una variable numrica con los valores 1 (para el grupo experimental) 2 (para el grupo de
control).
Variacin de prediccin
(experimental versus control)

Ordinario Zx

Ordinario-

1
1
1
1
1
1

2
2
2
2
2
2
2
2 21

6
4
9
, 7.
7
3
6
6

5
3
1
1 .
J
63
4,5 .
= 2,41)

A =1 , 5
= 0,5)

(SD
gl = N - 2 =

Variable dependiente
(calificacin del empleador)

-1
-I
-1
-1
-1

-1 .
1
1
1
" 1
1
1
1
0
0
'
(SD

ty

0,62
-0,21
1,87
1,04
1,04 '
-0,62
0,62
0,62
-1,45
0,21

0,62
-1,45
-1,45
-0,21
0
0

Producto
cruzado

' r
-0,62
0,21
-1,87
-1,04
1,04
0,62
0,62
0,62
1,45
0,21
-0,62
-1,45
-1,45
-0,21
-8,71
r = -0,62

14-2= 12.

Punto de corte t con g l = 12 a nivel 5%, dos colas = 2,1 7 9 .


=
-0,62^ 14 - 2/v 1- (-0,62)3= ~O,62V0Wl-0,38 = -0,62(3,46)/V)~2= -2,15/0,79 = -2,72
Conclusin: Se rechaza la hiptesis nula; se sostiene la hiptesis de investigacin.

mente simple, hemos excluido los clculos del desvo estndar de cada variable, que se utilizan para
calcular las puntuaciones Z), Es importante sealar que, en esta estructura de correlacin, a cada in
dividuo le corresponden dos observaciones: a) un 1. un 2, segn la persona se encuentre en el gru
po experimental (el grupo que recibe el nuevo programa de capacitacin laboral) o en el grupo de
control (el grupo que recibe el programa estndar), y b) un valoren la variable dependiente, que es la
calificacin de desempeo laboral determinada por el empleador un mes ms tarde. La correlacin
resultante es -0,62. Aplicando la frmula para convertir una correlacin en una puntuacin i, obte
nemos un t de -2,72. Es el mismo t que habamos calculado anteriormente (2,73) utilizando los pro
cedimientos de la prueba t (tablas 10-3 y 16-2). La pequea diferencia se debe al redondeo. La
diferencia de signos est relacionada con el hecho de que a un grupo se le adjudica arbitrariamente
el nmero 1 y al otro el nmero 2. Los grados de libertad, y por ende el punto de corte t necesario pa
ra alcanzar la significacin y llegar a una conclusin, tambin son iguales a los utilizados cuando
calculamos con los mismos datos una prueba t para medias independientes.
Tal como lo ilustra el presente ejemplo, la prueba de significacin del coeficiente de correla
cin da el mismo resultado que la prueba t comn. Sin embargo, decimos que la prueba t es un
caso especial del coeficiente de correlacin, porque la prueba t es slo una instancia particular
del coeficiente de correlacin, es decir, es la situacin en la que la variable de prediccin tiene
slo dos valores.
interpretacin grfica de a relacin de la prueba f con el coeficiente de correlacin
Analizando la situacin grficamente, podemos ver con mayor agudeza la relacin entre t y r. Es
posible realizar un grfico con los datos de una prueba t para medias independientes a travs de
un diagrama de dispersin, como lo haramos para un coeficiente de correlacin con una variable
de prediccin de slo dos valores. De hecho, los grficos realizados con ia misma informacin
son iguales. Analicemos uno. La figura 16-2 muestra el diagrama de dispersin con la correspon
diente recta de regresin que representa los datos del estudio acerca de la capacitacin laboral. La
variable de prediccin tiene slo dos valores; por lo tanto, en el diagrama de dispersin todos los
puntos se alinean sobre esos dos valores. Es importante resaltar que la recta de regresin pasa a

Figura 16-2.
Diagrama de dispersin y recta de regre
sin del ejemplo acerca de la capacidad
laboral, originalmente analizado con una
prueba t para medias independientes, con
un valor de 1 para el grupo experimental
y 2 para el grupo control

travs de! medio de cada serie de puntos. En realidad, si a! realizar un diagrama de dispersin con
los resultados de una prueba t, calculramos la recta de regresin, esa recta siempre caera exacta
mente en la media de cada serie de puntos. Es decir, la recta de regresin pasa por la ubicacin
que representa la media de cada grupo, ya que en cada serie de observaciones, el mejor nmero de
prediccin es siempre la media (en el sentido de producir el mnimo error cuadrtico).
Ahora analicemos algunos patrones posibles en este tipo de diagrama de dispersin. La figu
ra 16-3a representa un caso en el que las dos medias son casi iguales. En ese caso, la pendiente de
la recta de regresin es prcticamente 0; la correlacin es baja y no es significativa. De hecho, con
los datos del ejemplo, la correlacin es 0,10. Utilizando la frmula de la prueba t para el coefi
ciente de correlacin, con 20 participantes, el resultado es un t de 0,43;
t = r ^ - 2 / C 7 = 0 ,lV 2 0 ~ 2 /v 'l-Q ,12 - 0,43.

Figura 16-3.

Tres posibles diagramas de dispersin de datos analizados con una prueba t para medias independientes, en
los que las medias de los dos grupos son (a) casi iguales; (b) diferentes pero con datos que estn muy disper
sos (gran varianza combinada o gran desvo estndar de la distribucin de la diferencia de medias maestra
les), y (c) muy diferentes, con datos que no estn ampliamente dispersos.

Del mismo modo, pensando en trminos de una prueba t para medias independientes, habien
do tan poca diferencia entre las medias de los dos grupos, la prueba t tampoco ser significativa.
Los datos del ejemplo presentan una diferencia de media de 7,39 -1 ,6 0 = 0,21. Con un desvo es
tndar de la distribucin de diferencias entre medias de 0,48, el t es de -0,44: =,(Ml -.M2)/SDifcrejlcia
= (7,39 - 7,60)/0,48 = -0,44. Con diferencia de redondeo (e ignorando el signo), es el mismo re
sultado que obtenemos utilizando el mtodo de la correlacin.
La figura l-3b representa un caso en el que las medias de los dos grupos son algo diferentes
pero en donde los puntos de cada grupo estn an ms dispersos. En ese caso, nuevamente la rec
ta de regresin es un elemento de prediccin muy pobre. Una vez ms, el coeficiente de correla
cin, aunque no es igual a 0, de todos modos sera bastante bajo y no significativo. De hecho, con
los datos del ejemplo, r - 0,10, el cul no es estadsticamente significativo. En la prueba t para
medias independientes realizada con estos mismos datos, el efecto de la dispersin de los puntos
es una mayor varianza poblacional estimada para cada grupo. A la vez, lo anterior causa una esti
macin de varianza combinada considerable y un gran desvo estndar de la distribucin de dife
rencias entre medias. Dado que en una prueba t se divide la diferencia de medias por el desvo
estndar de la distribucin de diferencias entre medias, cuanto ms grande es el desvo estndar,
menor ser el t que resulte. Los datos del ejemplo arrojan una diferencia de medias de 0,52 y un
desvo estndar de la distribucin de diferencia de medias de 1,21. El resultado es un t de 0,43
que, claramente, no es significativo.
Por el contrario, la figura 16-3c representa un caso en el que existe una gran diferencia entre
las medias con una variacin relativamente pequea entre los puntos que rodean a cada media.
Como resultado, la lnea de regresin es muy til como elemento de prediccin, dando un alto
coeficiente de correlacin. (Aplicando los datos del ejemplo, r = 0,65 y t = 3,63, segn se calcula
a partir de r para probar su significacin). Asimismo, la gran diferencia de media y la pequea va
rianza dentro de cada grupo contribuyen a un gran t cuando se calcula utilizando una prueba t pa
ra medias independientes. En este ejemplo, la diferencia media es -2,17 y el desvo estndar de la
distribucin de diferencias entre medias es 0,59; por lo tanto, t es -3,68 (la diferencia con el t cal
culado utilizando r se debe al redondeo).
El principio representado grficamente por las figuras que acabamos de analizar es que la
prueba t para medias independientes y la prueba de significacin del coeficiente de correlacin
dan los mismos resultados, porque ambas son mayores cuando la diferencia entre las dos medias
es grande yla variacin entre las observaciones de cada grupo es pequea.

EL ANLISIS DE VARIANZA COMO CASO ESPECIAL DE LA PRUEBA


DE SIGNIFICACIN DEL COEFICIENTE DE CORRELACIN MLTIPLE
La relacin entre el anlisis de varianza y la correlacin mltiple es paralela a la relacin que aca
bamos de analizar entre la prueba t para medias independientes y el coeficiente de correlacin (bivariado) ordinario. En ambas relaciones, uno de los dos estadsticos parece referirse a las dife
rencias entre medias y el otro a las asociaciones entre variables. La resolucin de esta diferencia
aparente es la misma. El anlisis de varianza analiza si existe una diferencia, en la variable depen
diente, entre las medas de los grupos que representan diferentes niveles de una variable de predic
cin (o independiente). El mtodo de la correlacin encara la situacin como una relacin entr la
variable dependiente y los diferentes niveles de la variable de prediccin. Por ejemplo, en el estu
dio de Hazan y Shaver (1987) que analizamos en el captulo 11, acerca del estilo de relacin y los
celos, ios investigadores descubrieron que el anlisis de varianza mostraba una diferencia signifi-

Tabla 1 6 - 4.

Clculo de la reduccin proporcional de! error con observaciones originales y anlisis de varianza,
mtodo de! modelo estructural, con los datos de la tabla 10-3.
REDUCCIN PROPORCIONAL DEL ERROR

Variable dependiente
(calificacin del empleador)

Variable de prediccin
(experimental versus control)
C d ig o

C a lific a c i n

P r e d ic h o

D ife r e n c ia

D ife r e n c ia
c u a d r tic a

1
1
l
1
1
1

2
2
2
2
2
2
2

6
4
9
7
7
3
6
6
1
5
3
1
1
4

6
6
6
6
6
6
6
3
3
3
3
3
3
3

0
-2
3
1
1
-3
0
3
-2
2
0
-2
-2
1

0
4
9
1
1
9
0
9
4
4
0
4
4
1

2 - S S * or = 50

Suma de cuadrados utilizando la media general


como regla de prediccin (no se muestra el clculo): SSTotaJ= 81,5
Reduccin proporcional del error cuadrtico
r = 0,39; r =

SS.Totai ~

^E n ro f _

SS.Total

81,5-50

31,5

81,5

8L5

= 0,39

'039 = 0,62.

CLCULO DEL MODELO ESTRUCTURAL DE UN ANLISIS DE VARIANZA DE UN CRITERIO


GM =

4,5

Grupo experimental
(programa especia!)
*i
6
4
9
7
7
3
6
X:

x-

GM

D esv

D esv7

1,5
-0,5
4,5
2,5
2,5
"1,5
1,5

2,25
0,25
20,25
6,25
6,25
2,25
2,25
39,75

X - A
Dcv
D esv7
0
0
4
-2
3
9
1
1
1
1
-3
9
0
0
24

Grupo de control
(programa estndar)
M-

GM

D esv

D esv1

1,5
1,5
1,5
1,5
1,5
1,5
1,5

2,25
2,25
2,25
2,25
2,25
2,25
2,25
15,75

Nota: Desv = Desvo; Desri = Desvo cuadrtico

6
1
5
3
1
1
4
X:

X - GM
D esv

D esv2

1,5
-3,5
0,5
-1,5
-3,5
-3,5
-0,5

2,25
12,25
0,25
2,25
12,25
12,25
,25
41,75

D e s v
3
-2
2
0
-2
-2
1

M - GM
D e sv 1 D esv

9
4
4
0
4
4
1
26

-1,5
-1,5
-1,5
-1,5
-1,5
-1,5
-1,5

D esv1

2,25
2,25
2,25
2,25
2,25
2,25
2,25
15,75

Sum a de d esv o s cuadrrteos:


( X ~ G M )l SSTotal = 39,75 + 41 ,75 = 81,5
2 ( X - M f S S ema = 2 4 + 26 = 50
2 ( M - G M f <5 S S a m ~ 15,75 + 1 5 ,7 5 = 31,5
Control (SCTou! = 5C cn(fe + SCentte): 81,5 = 50 + 3 1,5
Grados d e libertad:
= N - 1 = 1 4 - 1 = 13

Estim aciones de varianza poblacional:

= S C Tota/ g l Totil = 8 1 ,5/13 = 6,27

^dentro = Sl i +
+ - *- + ^ltimo = 6 + 6 = 1 2
Centre ^grupos 1 2 - 1 - 1

SL
= S C d^ J g l im 0 = 5 0/12 = 4,17
^
C M ^ = S C ^ J g l ^ m 31,5/1 = 3 1 , 5

Control (g lTot, = g lDentro + g t EnJ : 13 = 12 + 1

a z n F: F =

6 C M ^ J C M ^ = 31,5/4,17 - 7,55

& = eia2 = S C m J S C Tm i = 31. ,5/81,5 = 0,'39

cativa entre los tres estilos de relacin (la variable independiente o de prediccin) con respecto a
los celos (la variable dependiente). Por el contrario, un enfoque correlacional describira este re
sultado como una asociacin significativa entre la variable del estilo de relacin y la variable de
los celos.
Anlisis de varianza para dos grupos como caso especial de significacin
de una correlacin bivariada
El vnculo entre el anlisis de varianza y la correlacin es ms fcil de captar si interpretamos ai
coeficiente de correlacin como la raz cuadrada de la reduccin proporcional del error con ob
servaciones orignales ( v a s e captulo 4), y al anlisis de varianza utilizando el mtodo del mode
lo estructural (captulo 12). La parte superior de la tabla 16-4 indica los datos de la correlacin del
ejemplo acerca del experimento realizado con la capacitacin laboral. Sin embargo, esta vez apa
recen cdigos asignados a los grupos experimental y control, a las observaciones originales, a los
valores predichos y a los errores cuadrticos, al igual que a los clculos para la reduccin propor
cional del error. La parte inferior de la tabla 16-4 indica los clculos del anlisis de varianza con
los mismos datos, utilizando el mtodo del modelo estructural.
Existen varios vnculos claros. Primero, la suma de los errores cuadrticos, calculada en la co
rrelacin cuando se utiliza la regla de prediccin bivariable (SCError = 50), es igual a la suma de des
vos cuadrticos intragrupaes (5Cdenao) correspondientes al anlisis de varianza. Por qu son
iguales? El anlisis de correlacin est calculando el error como la diferencia con respecto al valor
predicho, y el valor predicho es la media de cada grupo. Es decir, en el anlisis de correlacin la su
ma de los errores cuadrticos es el resultado de elevar al cuadrado y sumar la diferencia entre cada
valor y la media de su grupo (que es la prediccin para cada registro en su grupo). El anlisis de va
rianza est calculando la suma de los errores cuadrticos intragrupaes exactamente del mismo mo
do, la suma de los desvos cuadrticos de cada observacin con respecto a la media de su grupo.
Segundo, la suma de los errores cuadrticos en el anlisis de correlacin, cuando para prede
cir se utiliza la media general de la variable dependiente (5CTota = 81,5), es igual a SCXotal en el
anlisis de varianza (tambin 81,5). Son iguales porque el anlisis de correlacin est calculando
este error como el desvo cuadrtico de cada observacin con respecto a la media general de todas
las observaciones de la variable dependiente, y el anlisis de varianza est calculando la suma de

los desvos cuadrticos de cada observacin con respecto a la gran media, que es la media general
de todas las observaciones de la variable dependiente.
Tercero, la reduccin del error cuadrtico -la suma de cuadrados utilizando la media para
predecir (81,5) menos la suma de cuadrados del error utilizando la regla de prediccin bivariada
(50)~ es igual a 31,5. Este resultado coincide con la suma de cuadrados intergrupales (SCentre,
que es igual a 31,5) en el anlisis de vaanza. La reduccin de error en el anlisis correlaciona! es
equivalente a lo que agrega la regla de prediccin con respecto a conocer slo la media. En este
caso, la recta de prediccin estima la media de cada grupo; por lo tanto, la reduccin del error
cuadrtico de cada observacin es la diferencia cuadrtica entre la media del grupo de esa obser
vacin y la media general. SCmtgt, en el anlisis de varianza, se calcula sumando, por cada partici
pante, las diferencias cuadrticas entre la media del grupo del participante y la gran media.
Finalmente, la reduccin proporcional del error (r2, tambin denominada proporcin de va
rianza explicada), en el anlisis de correlacin, es exactamente igual a la proporcin de varianz
explicada (.R2 o eta2), una de las medidas del tamao del efecto que estudiamos en el anlisis de
varianza (ambas son igual a 0,39).
Tambin, ambas nos indican la proporcin de la variacin total en la variable dependiente,
que se explica a travs de su relacin con la variable independiente. A esta altura no debera sor
prendemos que estos nmeros sean iguales; ya hemos visto que los trminos que forman tanto el
numerador como el denominador, son los mismos en las frmulas de t2-y R2.
Segn lo observado, los vnculos entre correlacin y anlisis de varianza son bastantes profun
dos. De hecho, algunos investigadores calculan la significacin de un coeficiente de correlacin in
sertando las distintas sumas de cuadrados que ste produce en una tabla de anlisis de varianza y
calculando F. El resultado es idntico al producido por cualquier otro mtodo de clculo de la signi
ficacin del coeficiente de correlacin. Si calculamos e t correspondiente a la correlacin, el resul
tado es la raz cuadrada del F que obtendramos utilizando ese procedimiento.
.
Anlisis de varianza para ms de dos grupos
como caso especial de correlacin mltiple
Recordemos la tctica que empleamos al analizar la prueba t para medias independientes, como ca
so especial de prueba de significacin del coeficiente de correlacin. En ese caso pudimos calcular
un coeficiente de correlacin con los datos de la prueba t, convirtiendo arbitrariamente las dos cate
goras de la variable nominal de prediccin en dos nmeros distintos cualesquiera (en el ejemplo,
utilizamos 1 para el grupo experimental y 2 para el grupo de control). El problema es ms complejo
cuando la variable de prediccin incluye ms de dos categoras, como sucede en un anlisis de va
rianza para ms de dos grupos.
*
Tuvimos xito al asignar arbitrariamente dos nmeros cualesquiera a las dos categoras,
porque, en ese caso, no tienen importancia los nmeros en particular -slo deben ser diferen
tes. Cuando calculamos una correlacin convertimos las observaciones de cada variable en pun
tuaciones Z, y el proceso tiene en cuenta el grado de diferencia entre los dos nmeros. Pero
asignar cualquier nmero arbitrariamente, cuando existen tres o ms grupos, no funciona. Cua
lesquiera sean los tres nmeros que elijamos, implican alguna relacin particular entre los gru
pos, y no todas las relaciones sern iguales.
En el captulo 11, analizamos un ejemplo en el que el investigador comparaba los distintos
grados de culpabilidad de un acusado indicados por participantes, bajo tres condiciones: los que
crean que el acusado tena antecedentes delictivos; los que crean .que no tema antecedentes, y
aquellos a los que no se es haba hecho mencin de los antecedentes. Supongamos que asignra
mos arbitrariamente un 1 al primer grupo, un 2 al segundo y un 3 al tercero. Esto implicara que
544

E s tadstica p ara p sicologa

consideramos que esos tres niveles son valores igualmente distanciados de una variable numrica
que representa el conocimiento de los antecedentes delictivos. Convertir los valores 1, 2 y 3 en
puntuaciones Z no sera una solucin, ya que, de todos modos, continuaran dispersos en forma
pareja y en el mismo orden. En este ejemplo en particular podramos pretende^ considerar que los
tres grupos estn ordenados, comenzando por el de antecedentes delictivos yfinalizando con el
que fue informado de la ausencia de antecedentes, quedando el grupo que no recibi informacin
en medio de los otros dos. Sin embargo, aun as no quedara claro que en esta dimensin los gru
pos estn separados en forma pareja.
Generalizando, cuando trabajamos con tres grupos, no tenemos una base preestablecida para
ubicar a los grupos en un orden determinado, mucho menos para decidir cmo deberan disper
sarse. Por ejemplo, en un estudio que compara actitudes de cuatro nacionalidades centroamerica
nas diferentes, la nacionalidad es la variable de prediccin; sin embargo, las cuatro nacionali
dades no pueden convertirse en cuatro valores de una sola variable numrica.
De todos modos, existe una solucin inteligente para este problema. En lugar de intentar
transformar una variable nominal, con ms de dos categoras, en una sola variable numrica, po
demos convertirla en varias variables numricas con dos niveles cada una.
El procedimiento es el siguiente: supongamos que la variable de prediccin tiene cuatro catego
ras, por ejemplo, cuatro nacionalidades centroamericanas: costarricense, guatemalteca, nicaragen
se y salvadorea. Una variable de prediccin podra ser el hecho de que el participante fuera
costarricense: 1 si lo es y 0 si no lo es. Una segunda variable de prediccin sera el hecho de que el
participante fuera guatemalteco: 1 0. Una tercera variable de prediccin sera el hecho de que el par
ticipante fuera nicaragense: 1 0. Podramos tener incluso una cuarta variable que establezca que el
participante es salvadoreo; sin embargo, sucede que, en este ejemplo, si un participante tiene valor 0
en las primeras tres variables, por eliminacin debe ser salvadoreo (porque existen slo cuatro posi
bilidades). En general, identificar todos los niveles de una variable nominal requiere una variable me
nos que la cantidad de niveles de la variable nominal.
Volviendo al ejemplo, el resultado del procedimiento descripto es que la nacionalidad de cual
quier participante se describe a travs de los valores en tres variables numricas, cada una con las
posibilidades de ser 1 0. Por ejemplo, un participante costarricense tendra un 1 en la opcin cos
tarricense y ceros en las opciones guatemalteco y nicaragense. Cada participante guatemalteco
tendra un 1 en la opcin guatemalteca y ceros en las opciones costarricense y nicaragense. Cada

Tabla 16-5.
E jem p lo de codificacin n om in al para la n acion alid ad d e d iez p articip an tes en u n e stu d io ficticio de
p articip an tes de cuatro n a cio n alid ad es cen troam erican as.

P a r ticip a n te
1
2
3
4
5
6
7
8
9
10

N a cio n a lid a d
G uatem alteca
N icaragense
Salvadorea
N icaragense
C ostarricense
C ostarricense
Salvadorea
N icaragense
C ostaricense
Guatem alteca

V ariable 1
C o sta rice n se o n o

V ariab le 2
G u a tem a lte c a o n o

V ariab le 3
N ic a ra g en se o no

0
0
0
0
1
1
0
0
1
0

1
0
0
0
0
0
0
0
0
1'

0
1
0
1
0
0
0
1
0
0

Tabla 16-6.
E je m p lo d e c o d ific a c i n n o m in a l p a r a la c o n d ic i n e x p e r im e n ta l d e q u in c e p a r t ic ip a n t e s d e l eje m p lo
d e a n te c e d e n te s d e lic tiv o s (d a to s fic tic io s ).
V ariab le d e p red icci n o in d ep en d e n te

Participante
1
2
3
4
5

7
8
9
10
11
12
13
14
15

Condicin
experimental
A ntecedente delictivo
A ntecedente delictivo
A ntecedente delictivo
A ntecedente delictivo
A ntecedente delictivo
S in antecedentes
Sin antecedentes
Sin antecedentes
Sin antecedentes
S in antecedentes
S in inform acin
S in inform acin
S in inform acin
S in inform acin
S in inform acin

Variable 1;
antecedentes
delictivos o no
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0

V ariab le d e p e n d ie n te

Variable 2: Calificacin del participante


con respecto a la
sin antecedentes
culpabilidad del acusado
o no
10
0
0
0
0 .
0
1
1
1
1
1

0
0
0
0

7
5
10
8
5
1
3
7
4
4
6
9
3
3

participante nicaragense tendra ceros en las opciones costarricense y guatemalteca. Cada partici
pante salvadoreo tendra ceros en las tres variables. (A propsito, puede utilizarse cualquier par de
nmeros para cada variable nominal de dos valores; utilizamos 1 y 0 slo por conveniencia). La ta
bla 16-5 muestra el funcionamiento de esta codificacin aplicada a 10 participantes ficticios.
Todo el procedimiento descrpto se denomina codificacin nominal. (Convertir en 1 y 2 a los
niveles del ejemplo de la prueba t, para calcular un coeficiente de correlacin, tambin fue un ca
so de codificacin nominal para una variable nominal de dos categoras). En el ejemplo que esta
mos analizando ahora, el resultado de la codificacin nominal es que la variable de prediccin, en
lugar de ser una variable nominal con cuatro categoras, ahora se ha convirtido en tres variables
numricas pero, con slo dos valores cada una. Crear una serie de variables numricas con dos va
lores, tal como acabamos de describir, evita e! inconveniente de crear una jerarquizacin falsa de
los cuatro niveles.
La tabla 16-6 muestra otro ejemplo de codificacin nominal, esta vez aplicado a los participan
tes del ejemplo relacionado con los antecedentes delictivos. El resultado es que la variable de pre
diccin, en lugar de ser una variable nominal con tres categoras, ahora se transform en dos
variables numricas (con slo dos valores cada una, 0 1). Generalizando, en un anlisis de varianza se puede codificar toda variable independiente nominal para convertirla en una serie de variables
numricas de dos valores. La serie estar formada exactamente por una variable menos que la canti
dad de niveles que tena la variable nominal. (No es coincidencia que resulte el mismo nmero que
los grados de libertad de la estimacin ntergrupal de varianza poblacional).
Esa capacidad para codificar una variable nominal independiente, y convertirla en una serie
de variables numricas de dos valores en el anlisis de varianza, es una transicin importante que
hace posible la realizacin de un anlisis de correlacin mltiple. Tomemos nuevamente el ejem-

po de los antecedentes delictivos. Habiendo realizado la codificacin nominal, ahora podemos


calcular la correlacin mltiple de las dos variables numricas de prediccin junto con la variable
dependiente, el nivel de culpabilidad. El resultado final (en trminos de nivel de significacin y
R2) ser idntico al del anlisis de varianza.
El procedimiento de codificacin nominal que hemos descripto aqu implica la conversin de
una variable nominal de prediccin de un anlisis de varianza, en distintas variables numricas de
dos niveles para una correlacin mltiple.
Este procedimiento es extremadamente flexible y puede extenderse a los casos ms comple
jos del anlisis factorial de varianza. En verdad, lo importante no es que podamos realizar una co
dificacin nominal; en la mayora de los casos, una computadora lo har por nosotros. Lo
realmente importante es comprender el principio que hace posible la conversin de un problema
de anlisis de varianza en un problema de regresin mltiple. (Si el alumno est interesado en el
tema de la codificacin nominal, vase Cohn & Cohn, 1983, captulo 5. Incluye una descrip
cin detallada y de fcil lectura).

ELECCIN DE PRUEBAS ESTADSTICAS


Hemos visto que los cuatro procedimientos estadsticos principales que hemos aprendido en este
libro se pueden considerar casos especiales de regresin / correlacin mltiples. El alumno se
preguntar por qu no aprendemos slo una tcnica, regresin / correlacin mltiple, y resolve
mos todos los casos utilizando esa misma tcnica. Podramos -y si lo hiciramos obtendramos
resultados completamente correctos en todos los casos. De hecho, tal como lo indicamos al co
mienzo, si tuviramos que aprender slo un procedimiento para analizar datos estadsticos por
computadora, deberamos aprender la regresin / correlacin mltiples.
Entonces, por qu alguien utilizara, digamos, una prueba t en lugar de un anlisis de varian
za? Simplemente porque es un procedimiento tradicional y ampliamente comprendido. En la ac
tualidad, cuando se comparan dos grupos, la mayora de los investigadores esperan encontrar una
prueba . (De todos modos, la situacin est cambiando rpidamente a medida que los investiga
dores se vuelven cada vez ms sofisticados). Resulta extrao, y de algn modo ampuloso, ver un
anlisis de varianza donde funcionara una prueba l, aunque, de hecho, considerarlo ampuloso es
un resabio de aquellos tiempos en los que se realizaban los clculos a mano, y un anlisis de va
rianza era ms difcil de realizar que una prueba t.
Utilizar un coeficiente de correlacin (y la prueba de significacin correspondiente) en un ca
so con dos grupos, en lugar de una pmeba t ordinaria, confundira a aquellos que no fueran esta
dsticamente sofisticados (como lo era el alumno, antes de leer este captulo). Asimismo, analizar
un experimento con varios grupos utilizando la regresin / correlacin mltiples, en lugar del
anlisis de varianza, confundira a esos mismos lectores poco sofisticados.
En estos casos, parte de la confusin surge de una cuestin que analizamos en el captulo 3, y
que vale la pena repetir. Muchos confunden la diferencia entre un diseo de investigacin ex
perimental y correlaciona! con la diferencia entre mtodos estadsticos. Un verdadero diseo experi
mental de investigacin es aquel en el que se asignan individuos al azar a diferentes niveles de la
variable de prediccin (tales como las condiciones experimental y de control). La asignacin
aleatoria que mencionamos facilita determinar que los diferentes niveles de la variable de predic
cin causaron algunas diferencias que dieron como resultado la variable dependiente. En el caso
de un diseo de investigacin correlacional, las variables de prediccin e independiente se miden
tal como existen. Un ejemplo de ese tipo de diseo sera una encuesta acerca de la relacin entre
el tiempo compartido y la satisfaccin marital. Cuando un estudio del tipo mencionado arroja un

.V
\
Cuadro 16-2.
Dos mujeres establecen una posicin con respecto ai sexo y la estadstica.

abarcaban has ta el anlisis de varan- :;;!


Uno de los textos de estadstica avanzada
za. Pero en esa poca, a nadie s e .
ms tiles escritos hasta el momento, es el
enseaba el anlisis de varianza mu- - V, U
libro Utilizando estadstica mutivariada
tivariadb. Los paquetes estadsticos'
lUsing Multivariate Statistics], de Brbara
que realizaban ese tijp d' anlisis '
Tabachnick y Linda Fidell (1996), dos psi~
llegaron posteriormente pero, cmo "yUyj
clogas de la Universidad del Estado de Ca
comprenderlos?
" ,
'
lifornia en Northridge dedicadas a la inves
(En el captulo 17 'presentaremos el ima
tigacin. Estas dos mujeres se conocieron
del anlisis mltivnad de varianza),. '
durante un almuerzo en la facultad poco des
Tanto Fidell como Tabachnick haban: ;i.i
pus de que Tabachnick fuera contratada. Fi
investigado
y aprendido por su cuenta,, asisV: ,;
dell recuerda que acababa de terminar un
.
tiendo
a
los
cursos necesarios,: leyendo, pre-T
curso de francs y otro de lgebra matriguntando
a
otros que conocan, mejor los, -;'
cia, slo por el placer de aprender (En esa
programas,
probando
qu suceda si hacan ;!;;
poca era una persona muy seria). Se pre
esto
o
aquello
con
los
datos. Ahora las dos 14
guntaba qu actividad emprender cuando
Tabachnick sugiri que tomaran juntas ca- mujeres se preguntaban por qu resultaba .i
todo tan difcil, y si otros estaran volvienT
ses de danzas rabes. Fidell pens no est do
a inventar esa misma rueda en selitisf;
mal algo frvolo para variar. Se equivocaba." '
As comenz la colaboracin ntre ellas; : . mo momento; Decidieron volcar su propia;. '.:
invencin de la rueda en un libro; .
Despus de las lecciones de danza, martteY as comenzaron quince aos de cdnan largas discusiones sobre estadstica. Eii
laboracin
sin conflictos informa Fidell: :
particular, descubrieron que compartan la(Hecho que merece compararse con las ene-;;/
fascinacin, y consternacin, por los nove- '
mistades narradas en otros cuadros de est-;!;
dosos clculos estadsticos posibles a travs
de los nuevos paquetes estadsticos para mismo libro). Las autoras no tuvieron focon-;/.
veniente en encontrar un editor, y el libro,
computadoras. El problema era dar sentido
que actualmente'vapor la tercera edicin,;&/ 1
a los resultados.
"ha vendido muy bien.'( pesar del hecho .; '
Fidell describi la situacin de la si
guiente forma:
. de que sus ttulos preferidos, tales como Yy ;
libro de estadstica, multivdriddo. de Ftina :
Tena esta enorme serie de datos ,para
analizar y surgieron una cantidad enr- ;
"yScheherazade; Las mil y una variables? Elyd
me de bonitos nmeros ordenados en
libro rosa, borroso de estadstica; Pieia\pfe*d-'.
pequeas y prolijas columnas, pero no
so con la estadstica mutivariada,. fueron ,
estaba segura del significado de todos
desechados, por el editor. Sin .embarg, s
ellos, e incluso no saba si mi informa-'
uno observaba con atencin la portada de la
cin haba violado algn supuesto cr
primera edicin, poda ver una bailarina ra
tico, Saba que existan algunos, pero
be oculta en el diseo).
no saba nada acerca de ellos. Lo ante
Fidell subraya que tanto ella como Ta- .
rior ocurri en 1975. Yo me haba ca
bachnick se consideran analistas de datos ypacitado en la Universidad de Michigan
profesoras: no son estadsticas tericas o
y mis conocimientos sobre estadstica

prcticas, no han creado mtodos, simple- ,


do conquistarlos, y s me dan mdia opr-r- :
mente ios h a n :popularizado hacindolos
^n idad| lp igrar.
- ms accesibies; Sin embargo;.pueden nom~ Cualquiera sea la razn.; la/estdstca^-.
. brf docenas de miijres. qu- han tenido
v es una- rama de la matemtica qu, .segn '
xito como estadsticas tericas. Segn. Hv. .Fidl, las mujeres -con frecuencia, conside^;^
delly l. estadstica, s' un rea en la que l a :
r p jprfctamnte lgicaj perfectamente ra- ;
'mujer- pticurmrite parece- destacarse y.
zpab, y luego; cori el tiempo, algo que:
sentirse cmoda.-AI ensear a alumnos nerealmente-pueden disfrutar. Seguramente ;
. vos, .speciaimrite a aqullois intiridads
son buenas nott
mchs. lectoras;
. por la matemtica, .descubren quepor una.. vez puede hcer. que se relajen, debido a
.. que; frecuentemente descubren que disfru.: :tan; de la estadstica. Ella les dice, pretn-; v k e f& re n c i : ritrvs.t;)rso; cnvLmda;Fidliy.: :

resultado signieativo, sustenta la existencia de una asociacin entre las dos variables, pero no
indica cul de las variables es causal de la otra (o si alguna tercera variable en comn podra estar
causando ambas).
Generalmente, los verdaderos diseos experimentales de investigacin involucran la asigna
cin, a dos o ms niveles de la variable de prediccin. Tradicionalmente, estos experimentos han
sido analizados utilizando una prueba t o un anlisis de varianza. De hecho, hasta hace poco tiem
po atrs, en muchos casos no se enseaba la regresin / correlacin mltiples a los psiclogos ex
perimentales como parte de su capacitacin profesional. Eran experimentalisfas y no deban
condescender a la correlacin.
Los diseos correlacinales de investigacin se utilizan comnmente cuando no es posible
realizar experimentos. Con frecuencia miden la respuesta de determinadas personas con respecto
a dos o ms variables numricas, sin tener la posibilidad de que esas personas experimenten com
pletamente una de las variables. (La edad, el nivel de ingresos, el nivel de educacin, etc., son
ejemplos de variables con las que no es posible poner en prctica la asignacin aleatoria). Asimis
mo, a los socilogos, economistas y otros cientficos sociales no se les ensea la prueba t ni el
anlisis de varianza como parte de su capacitacin, debido a que la regresin / correlacin es el
mtodo apropiado de anlisis del cual dependen por completo.
Los diseos experimentales son claramente ventajosos. Por asociacin, tanto los diseos co
mo la estadstica correlacinales provocan una menor impresin y, fcilmente, se los confunde.
Sin embargo, no existe razn para que un verdadero experimento no pueda asignar personas al
azar a varios niveles numricamente diferentes de una variable numrica de prediccin. (Utiliza
mos un ejemplo de este tipo en el captulo 3, en el que las personas eran asignadas a diferentes
cantidades de exposicin de una palabra). Un experimento real de ese tipo se analiza adecuada
mente slo con un coeficiente de correlacin (y la correspondiente prueba de significacin). Si se
intentara reducir esos niveles de exposicin a dos grupos, por ejemplo la comparacin de aquellos
con gran cantidad de exposiciones de las palabras con aquellos con poca cantidad de exposicio
nes, se perdera informacin y sera un mtodo estadstico ms deficiente (entre otros aspectos, el
anlisis tendra menos potencia).

Asimismo, existen estudios que utilizan diseos correlacinales de investigacin en los que, sin
embargo, una de las variables tiene slo dos niveles, como por ejemplo, el gnero. O podramos
realizar un estudio con una variable con categoras, con ms de dos niveles, como por ejemplo la
nacionalidad. En esos casos, seguramente podramos analizar los resultados utilizando una prueba
o un anlisis de varianza, pero eso no cambiara el hecho de que los estudios hayan utilizado dise
os de investigacin correlacinales, en los que resulta difcil discernir la causa y el efecto.
Cabe recalcar que cuando los investigadores seleccionan un mtodo estadstico en lugar
de otro, es posible que la decisin est ms relacionada con la costumbre, lo que se ve
bien, e incluso con una confusin, que con cualquier diferencia matemtica o lgica entre
los procedimientos.
Existe una gran ventaja en utilizar la correlacin (o la regresin / correlacin mltiples s es
necesario) en lugar de la prueba t o el anlisis de varianza. El mtodo correlaciona! proporciona
informacin directa acerca del grado de relacin entre la(s) variable(s) de prediccin y la variable
dependiente, a la vez que permite realizar una prueba de significacin. La prueba t y el anlisis d
varianza slo brindan la significacin estadstica. (S bien con cualquiera de los procedimientos
recin mencionados podemos calcular el tamao del efecto, con un coeficiente de correlacin o
un coeficiente de correlacin mltiple se obtiene automticamente una indicacin del tamao del
efecto con el coeficiente de correlacin o regresin en s mismo).
Otra ventaja de la correlacin (y la regresin / correlacin mltiples) es que maneja automti
camente el tema de las distintas cantidades de participantes en los grupos que se comparan. Con
un anlisis de varianza de un criterio, cuando las cantidades de participantes en ios grupos son de
siguales necesitamos utilizar procedimientos ms complicados. Pero, al menos en estos casos, el
anlisis de varianza de un criterio proporciona resultados precisos.
Por el contrario, al realizar un anlisis de varianza de dos o ms criterios, si en las casillas hay
distintas cantidades de participantes, los procedimientos estndar del anlisis de varianza realr
mente fallan, en el sentido de que su aplicacin distorsiona los resultados. En la mayora de los
casos, la mejor solucin es replantear el problema a modo de regresin / correlacin mltiples.*4

LOS SUPUESTOS Y EL MODELO LINEAL GENERAL


Otra similitud de las diferentes tcnicas basadas en el modelo lineal general es que todos los pro
cedimientos de prueba de hiptesis comparten los mismos supuestos. En el caso de la prueba t y
el anlisis de varianza, los principales supuestos se refieren a que todas las poblaciones represen
tadas por los grupos tengan la misma varianza y sigan una distribucin normal. Los supuestos de
las pruebas de significacin de correlacin, y de regresin / correlacin mltiples, son bsicamen
te los mismos, excepto que son un poco ms complicado expresarlos.
El supuesto que se refiere a la misma varianza poblacional en la prueba / y en el anfisis de
varianza coincide en la correlacin (y la correlacin mltiple) con la igualdad de las varianzas en
a parte de la poblacin relacionada con cada nivel de la variable de prediccin. Imaginemos un
diagrama de dispersin con una recta de regresin, La varianza alrededor de la recta de regresin

4 La mayora de los programas para computadoras realizan el proceso mencionado automticamente cuando se Ies indi
ca ejecutar un anlisis de varianza factorial en el que las cantidades de registros en las casillas no son iguales. Sin em
bargo, en algunos programas debe darse especialmente la orden para que realicen e l proceso mencionado o, de lo
contrario, utilizan las frmulas del anlisis de varianza ordinario y arrojan resultados engaosos.

debera ser igual en cada punto a lo largo de la recta. Por ejemplo, supongamos que las observa
ciones de los niveles inferiores de una variable de prediccin tuvieran mucha variacin en la va
riable dependiente, pero que las observaciones en los niveles altos de la variable de prediccin
tuvieran muy poca variacin en la variable dependiente. Esto violara el principio de igualdad de
las varianzas poblacionales. El principio general de igualdad de las varianzas poblacionales, a to
dos ios niveles de una de las variables, se denomina homoscedasticidad,
En el caso de la correlacin y la regresin, el supuesto que se refiere a las distribuciones nor
males de poblacin se convierte en el requerimiento de que, cada variable, y todas en conjunto,
estn normalmente distribuidas (lo que se denomina distribucin normal bivariad a).
Como hemos visto, todas las tcnicas del modelo lineal general arrojan resultados bastante
precisos en una amplia gama de situaciones, excepto cuando la cantidad de participantes es muy
pequea o cuando se violan significativamente los supuestos. En verdad, estos distintos mtodos
constituyen las principales herramientas de la investigacin psicolgica.

CONTROVERSIAS Y LIMITACIONES
El modelo lineal general, en s mismo, no es muy controvertido; es simplemente una enuncia
cin matemtica de una relacin entre variables. De hecho, su papel como base de las tcnicas
estadsticas ms importantes an no ha sido ampliamente comprendido por los investigadores
en ejercicio.
Sin embargo, el mtodo de los cuadrados mnimos dentro del modelo lineal general es un po
co ms controvertido. Una alternativa es minimizar el error absoluto en lugar del error cuadrtico.
(Una ventaja del mtodo mencionado es que, en lugar de utilizar la raz cuadrada dei promedio de
los desvos cuadrticos como la medida ms comn de variacin, usaramos simplemente el pro
medio de los valores absolutos de los desvos, dando as mucha menos influencia de distorsin a
los valores atpleos).
De todos modos, las principales crticas relacionadas con el modelo lineal general son las que
involucran la prueba de hiptesis. Son las criticas que hemos estado tratando a lo largo del libro,
incluso su carcter robusto por el incumplimiento de los supuestos y la importancia del tamao
del efecto o la prueba de significacin.
Existen tambin crticas en otro sentido, que valen la pena mencionarlas aqu. Se trata de cr
ticas que estn relacionadas con el papel que juega la estadstica en la ciencia en general, pero
que, en la prctica, se formulan ms frecuentemente en el contexto de los procedimientos ms im
portantes basados en el modelo lineal general. Se trata de la causalidad. Hemos tratado el tema
hasta cierto punto en el captulo 3 y nuevamente en este captulo, cuando analizamos el problema
de deducir una direccin de causalidad a partir de un estudio que no utiliza asignaciones aleato
rias a los distintos grupos. Pero existe una cuestin an ms profunda con respecto a este tema;
Cul es el significado de causalidad?
Baumrind (1983) ha delineado dos interpretaciones de la causalidad que se utilizan en la
ciencia. Una, a la que denomina teora de la causalidad basada en la regularidad, encuentra sus
races en filsofos tales como David Hume y John Stuart Mili (al igual que en antiguos cientfi
cos, incluyendo a Galileo). Esta perspectiva sostiene que consideramos a X causa de Y si a) X e Y
estn relacionadas regularmente, b) X precede a Y y c) no existen otras causas anteriores a X que
pudieran causar a X y a Y. En psicologa, abordamos el punto a buscando una correlacin signifi
cativa entre X e Y; abordamos el punto b, si es posible, a travs de nuestro conocimiento de la si
tuacin (en una correlacin entre ser el primognito de una familia y sufrir luego de angustia,
podemos excluir la posibilidad de que la angustia sufrida ms tarde durante la vida de una perso

na sea la cansa de que esa persona sea primognita) o diseando un experimento para averiguarlo
(manipulando X antes de medir y). El punto c) est relacionado con el tema de la correlacin en
tre X e Y, debido a una tercera variable que es causa de las dos primeras. Lo ideal sera abordar el
tema a travs de la designacin aleatoria a los grupos, pero si no es posible solucionar el tema de
este modo, se utilizan como estrategia substitua varios mtodos estadsticos para igualar a los
grupos con respecto a terceros factores propuestos. (En el captulo 1? analizamos algunas de esas
estrategias).
Como psiclogos, slo a veces nos encontramos en posicin de realizar el tipo de investiga
cin experimental rigurosa que nos proporciona una fuerte base para sacar conclusiones con res
pecto a la causa y el efecto. As, gran parte de la crtica y de la controversia relacionada con la
investigacin de aplicacin prctica, 'en la que generalmente es ms difcil aplicar mtodos rigu
rosos, frecuentemente gira alrededor de esos temas. Por ejemplo, si el matrimonio y la felicidad
estn correlacionados, el matrimonio hace ms felices a las personas, o las personas felices se
casan y permanecen casadas?
Existe otra visin de la causalidad, una visin an ms exigente que considera las condicio
nes de la teora de la regularidad como requisitos previos para determinar una causa, pero esas
condiciones no son suficientes por s mismas. Esta segunda visin, a la que Baumrind llama teo
ra generativa de la causalidad, encuentra sus races en Aristteles, Toms de Aquino e Immanuei Kant. La visin generativa se enfoca en la dinmica con que X afecta Y, el proceso intrnseco
por el cual una est conectada con la otra. Es el modo en que interpretan la causalidad la mayora
de las personas no relacionadas con la ciencia (o la filosofa). La idea misma de causalidad puede
haber surgido como metfora de experiencias tales como desear que mi brazo se mueva (evento X),
y se mueve (evento Y). Los cientficos tambin toman muy seriamente esta visin de causalidad,
aun si ofrece desafos mucho ms complejos. Se aborda principalmente a travs de la teora y del
anlisis cuidadoso de procesos intermedios. Pero incluso aquellos que recalcan la importancia de
esta segunda visin reconoceran que demostrar una conexin confiable entre X e Y (a travs de l
significacin estadstica, por ejemplo) es importante, al menos, para identificar los vnculos que re
quieren investigacin para determinar la verdadera conexin causal.
Finalmente, tambin existen aquellos que sostienen, con algunos buenos argumentos, que de
mostrar la causalidad no debera ser un objetivo de la psicologa cientfica. Pero ya hemos tenido
suficiente controversia para un captulo.

Resumen
El modelo lineal general equipara el valor de una variable para cualquier individuo con la suma
de una constante, ms la influencia parcial y ponderada de cada una de otras variables, ms el
error. El coeficiente de correlacin y la regresin / correlacin mltiples (y las correspondien
tes pruebas de significacin), a prueba t y el anlisis de varianza, son todos casos especiales
del modelo lineal general.
La regresin / correlacin mltiples es prcticamente idntica al modelo lineal general, y la
regresin y correlacin bvariadas son casos especiales de regresin / correlacin mltiples, en
los que existe slo una variable de prediccin.
La prueba t para medias independientes se puede deducir matemticamente del anlisis
de varianza. Es un caso especial del anlisis de varianza en el que hay slo dos grupos. La
puntuacin t es la. raz cuadrada de la razn F, calculados con los mismos datos. Existen
muchas similitudes en las formas de realizar los dos procedimientos: los numeradores de t y

F se construyen sobre las diferencias entre las medias de los grupos; los denominadores de
ambos se construyen sobre la varanza interna de los grupos; el denominador de t incluye la
divisin por la cantidad de participantes y el numerador de F incluye la multiplicacin por
la cantidad de participantes; y los grados de libertad de t son iguales a los-grados de libertad
del denominador de F.
La prueba t para medias independientes tambin es un caso especial de la prueba de signifi
cacin del coeficiente de correlacin. Una correlacin mide el grado de relacin de una varia
ble de prediccin o independiente con una variable dependiente. Del mismo modo, al indicar la
diferencia entre las medias de los grupos, la prueba t identifica una relacin entre la variable cu
yos grupos estn divididos, es decir, la variable independiente o de prediccin con la variable
dependiente. Si asignamos el valor 1 a cada participante en uno de los dos grupos y el 2 a cada
participante en el otro grupo (o dos nmeros diferentes cualesquiera), y despus calculamos
una correlacin de esos valores con la variable dependiente, la significacin de la correlacin
ser igual que la producida por la prueba t. Si dibujamos un diagrama de dispersin con los da
tos mencionados obtendramos una columna de valores observados para cada grupo, y la lnea
de regresin pasara por las medias de cada uno de ellos. Cuanto ms diferentes sean las me
dias, mayor ser la reduccin proporcional del error con respecto a utilizar la gran media, y ma
yor ser la puntuacin basada en una comparacin de las medias de los dos grupos.
El anlisis de varanza y la correlacin / regresin tambin presentan muchas similitudes.
5CTot3, en la regresin y en el anlisis de varanza, se refiere a ios desvos de cada observacin
con respecto a la media de todas las observaciones de la variable dependiente. Las medias grpales en un anlisis de varanza son los valores predichos para cada individuo en la regresin;
as, SCno( y SCD(ntc0 son iguales. La reduccin de error cuadrtico (SCTojal - SCEm[) en la re
gresin es igual a la suma de los desvos cuadrticos de las medias de los grupos de observacio
nes con respecto a la gran media
j) en el anlisis de varanza. Finalmente, la
reduccin proporcional del error de la regresin (r2 o R2), en la regresin, es igual a la propor
cin de varanza explicada (R2 o eta2) por el tamao del efecto en el anlisis de varanza.
Todo anlisis de varanza puede plantearse como una regresin mltiple, transformando las
categoras que representan los diferentes grupos en una o ms variables numricas dicotrnicas. En sentido estricto, el anlisis de varanza es un caso especial de regresin mltiple, en el
que las variables de prediccin se establecen del modo descripto precedentemente.
Todos ios mtodos mencionados comparten los mismos supuestos en cuanto a que las dis
tribuciones de la poblacin son normales y tienen igual varanza en todos los niveles de la va
riable de prediccin.
La prueba , ei anlisis de varanza y ia correlacin pueden plantearse como regresin / co
rrelacin mltiples; sin embargo, la prctica convencional hace que estos procedimientos conceptualmente idnticos se utilicen en diferentes contextos de investigacin, como si en realidad
fueran diferentes.
Con respecto a la causalidad, la teora de la regularidad identifica a X como causa de Y, si X
e Y estn relacionadas, X precede a Y, y no existe un tercer factor que preceda a X y pudiera
causar ambas. La teora generativa sostiene que, adems, debe comprenderse claramente el me
canismo por el cual X afecta Y. Los procedimientos estadsticos pueden demostrar una relacin
entre X e Y, e incluso a veces pueden contribuir con evidencia contra una tercera variable pro
puesta como causa de X e Y, Toda otra prueba de que X sea causa de Y depende del conocimien
to de ia situacin, del diseo experimental y del anlisis terico.

Trminos clave
- M odelo lineal general.

- Modelo de cuadrados
mnimos.

- Codificacin nominal.

Ejercicios
de corte t al cuadrado y antelo al lado del t, c)
Busque y anote, al lado de los cuadrticos, los
puntos de cortes para distribuciones F con 1
grado de libertad en el numerador y 5 ,1 0 ,1 5 y

Lo s ejercicios im plican la realizacin de clcu


los (con la ayuda de una calculadora). L a ma
yora de los problemas estadsticos reales se
resuelven por computadora, pero aunque exis
ta la posibilidad de utilizarla, es conveniente
realizar estos ejercicios manualmente para in
corporar el mtodo de trabajo.
Para adquirir prctica en la utilizacin de
una computadora, para resolver problemas es
tadsticos, se puede utilizar la seccin de compu
tacin de cada captulo, publicada en la Gua de

estudio y libro de tareas de computacin para


el alumno [Student's Study Guide and Compu
ter Workbook] que acompaa este libro.
Todos los datos de esta seccin son ficti
cios (a menos que se especifique lo contrario).
La s respuestas a los ejercicios de la serie I
se encuentran al final del libro.

20 grados de libertad como denominadores.


(Lo s resultados deberan ser iguales, con dife
rencias de redondeo).
2.
A continuacin aparecen tres series de da
tos. E n el caso de las prim eras dos series de
datos, adems de las medias y las varianzas pobiacionales estimadas, incluim os la informa
cin correspondiente a la prueba t. En el tercer
caso debe calcular usted m ism o esa ultim a in
formacin. Adem s, para cada caso, calcule un
anlisis de varianza de un criterio. Observe las
sim ilitudes entre a) el glety el gl del deno
minador de F, b) el punto de corte t y la raz
cuadrada del punto del corte F , c) >^Combnada y

^Dentro ?
vaior y la raz cuadrada de la
razn F . t y F corresponden al nivel 0,05; las
1.
a) Busque y anote el punto de corte t ai
pruebas t son de dos colas.
nivel 0,05 (dos colas), correspondiente a 5 ,1 0 ,
15 y 20 grados de libertad, b) Eleve cada punto

SERIE 1

Grupo
experimental
N

(0
(ii)
(i)

30
36
16

12,0
100
73

Grupo
control
S2

2,4
40

30
36
16

n ,i

104
75

Prueba t
2,8
48

t n e c e s a r io

S2
v combinada

58
70

2,004
1,995

2,6
44

2,16
2,56

3. E l grupo A est formado por 10 perso


nas, cuyos valores observados presentan una
media de 170 y una estimacin de la varianza
de 48. E l grupo B tambin est formado por 10
personas: M = 150, S2 = 32. Realice una prueba
t para medias independientes (dos colas) y un
anlisis de varianza; calcule los dos procedi
mientos en las mitades de una misma pgina y
disponga los clculos de forma paralela uno al
lado del otro. (E s decir, cree una tabla sim ilar,
en cuanto a diseo, en la parte inferior de la ta
bla 16-2). U tilice el nivel 0,05.
4. C alcule un anlisis de varianza con los
valores que se enumeran a continuacin; luego
calcule un anlisis de regresin, incluyendo el
correspondiente diagrama de dispersin (y la
recta de regresin) indicando el coeficiente de
correlacin (entre el grupo en el que se encuen
tran los sujetos y sus valores observados), de
terminando la reduccin proporcional del error
a travs del mtodo extenso en el que se calcu
lan los valores predichos y se determina el error
cuadrtico medio utilizando esos valores; por
ltim o, confeccione un cuadro que indique las
coincidencias de los resultados.

G rupo A

G rupo B

13
16
19
18
19

11
7
9

6.
Explique los vnculos principales entre
la regresin mltiple y el anlisis de varianza.

SERIE li
1. a) Busque y anote el punto de corte F al
nivel 0,01 para distribuciones con 1 grado de li
bertad en el numerador y 1 0 ,2 0 ,3 0 y 60 grados
de libertad en el denominador, b) Calcule la
raz cuadrada de cada uno y antela al lado del
corte, c) Busque los puntos de corte de la distri
bucin t al nivel 0,01 (dos colas), utilizando,
1 0 ,2 0 ,3 0 y 60 grados de libertad, y antelos al
lado de las correspondientes races cuadradas
de F. (Lo s resultados deberan ser idnticos, te
niendo en cuenta las diferencias de redondeo).
2. A continuacin enumeramos tres series
de datos, todos ellos tomados del ejercicio 2,
serie II, del captulo 10. S i no calcul antes las
pruebas t para estos datos, hgalo ahora, pero
esta vez utilizando el nivel 0,01 de dos colas.
Luego, en cada caso, calcule adems un anli
sis de varianza de un criterio (tambin al nivel
0,01). Observe las sim ilitudes entre a) e lg de t
y el gl del denominador de F , b) el punto de
corte t y la raz cuadrada del punto de corte F ,
c > ^Combinada y CM Demro y d > e l v a lo r f y la raz

cuadrada de la razn F .

G ru p o
ex p e rim e n ta l
N

5 . C o n lo s v a lo r e s q u e s e e n u m e r a n a c o n t i
n u a c i n , c a lc u le u n a p r u e b a
d e p e n d ie n te s

(u tiliz a n d o

t para

el

10

m e d ia s in

(i)

0 ,0 5 ,

GO

40

(i )

10

n iv e l

c o la ), e l c o e f ic ie n t e d e c o r r e la c i n

una

(e n tr e e l

G ru p o
con trol

S2

S2

604

60

10

607

50

604

60

40

607

50

604

20

10

607

16

g r u p o e n e l q u e s e e n c u e n tr a n lo s p a r tic ip a n te s
y s u s v a lo r e s o b s e r v a d o s ) y e l

tpara

la s i g n i f i

c a c i n d e l c o e f ic ie n t e d e c o r r e la c i n (u tiliz a n d o la f r m u la

t ~W

t f - 2 / V l - r 2).

G ru p o A

G ru p o B

0 ,7
0 ,9
0 ,8

0 ,6
0 ,4
0 ,2

3.
Realice una prueba t para medias inde
pendientes (dos colas) y un anlisis de varianza
con los valores que aparecen a continuacin.
R ealice los clculos en las mitades de una m is
ma pgina y coloque los clculos paralelamen
te, uno al lado del otro, (E s decir, cree una tabla
sim ilar, en cuanto al diseo, en la parte inferior
de la tabla 16-2). U tilice el nivel 0,01.

Grupo A

GrupoB

o
1
o

4
5
6

---------------. . .
.
4. Con los d~t?s del eJerc1~10 3.(anterior),
c~lcule un anl.lSis d~. regresin, mcluya un
d~agrama de disix:rs10n y calcule el coeficiente de correlactn (en?"~ el grupo en el
que se encuentran los participantes y sus valores observados), determinando la reduccin
proporcional del error a travs del mtodo
extenso en el que se calculan los valores predichos y luego se determina el error cuadrtico medio utilizando esos valores; despus
calcule la significacin de la correlacin (utilizando la frmula t = dN - 21 rt=r2' y elevando luego t al cuadrado). Finalmente,
realice un cuadro que muestre las coincidencias de los resultados.
5. Con los valores enumerados a continuacin, calcule a) una prueba t para medias
independientes (nivel 0,05, dos colas); b) el
coeficiente de correlacin (entre el grupo en el
que se encuentran los participantes y sus valo-

5 56

Estadstica para psicologa

res observados) y el t para la significacin (I~


coeficiente de correlacin; e) un anlisis di
varianza (nivel 0,05), y d) el coeficien
chi-cuadrado y phi (para el chi-cuadrado, e~(
una tabla de contingencia 2 x 2 en la cual un~
dimensin sean los grupos y la otra dimeni;ii
se refiera al valor O 1 de los participantes et
la medida dependiente). e) Confeccione un;
tabla con las similitudes de Jos clculos y 0 ,
resultados.

6. Explique la codificacin nominal.


---------------~
GroupB
GroupA

o
o
o
o
o
o
o
o
o
o
o
o

o
o
o
o
o
o

1
l
l
1

1
1

1
l
1
l
1

Comprensin
de los procedimientos
estadsticos avanzados
que aparecen en
publicaciones cientficas

multivariado) y mancova {M u ltiv a ria te


A n a iy sis p f C p y a ra n ce, A n lisis d e

. Breve revisin de correlacin


y regresin mltiples.
. Regresin mltiple jerrquica
y por pasos.
Correiacin parcial.
Confiabilidad.
Anlisis factorial.
Modelo causal.

ancova

(A n ly sis o C o v a ria n ce ,

Anlisis

de covarianza).
MANOVA (M u ltiv a ria te A h a ly sis o

V a riance,

Anlisis de varianza

covarianza muitivariado).
Repaso genera! de tcnicas estadsticas.
Controversia: Debera ser controvertida
la estadstica?
Cmo leer resultados en publicaciones
cientficas que incluyentcnicas
estadsticas que ho nos son familiares?
Resumen.
Trminos clave.
Ejercicios.

a m ayora de las investigaciones ledas por alumnos de psicologa utilizan uno o


ms de los procedimientos que hemos aprendido a travs de este libro. Sin embargo,
a veces aparecern procedimientos que no se ensean sino en cursos de estadstica
ms avanzados. Afortunadamente, esos procedimientos son, por lo general, exten
siones directas de lo que ya hemos aprendido; tal vez no tan directas como para en
tender todos sus detalles y lim itaciones, pero s para poder comprender la idea general de lo que
se est realizando con los datos resultantes del estudio.
Podemos dividir esos procedimientos estadsticos avanzados en aquellos que se concentran
en las asociaciones entre variables y aquellos que se concentran en las diferencias entre los gru
pos (aunque, tal como hemos aprendido en el captulo 16, esa distincin es algo artificial). Lo s
procedimientos que trataremos primero se concentran en asociaciones entre variables. Todos
ellos son bsicamente extensiones y elaboraciones de lo aprendido en los captulos 3 y 4 sobre
correlacin y regresin. Despus de una breve revisin de la regresin m ltiple como base de los
dems procedimientos, presentamos las regresin m ltiple jerrquica y la gradual, la correla
cin parcial, la conabilidad, el anlisis factorial y el modelo causal. Luego nos abocamos a las
tcnicas que se concentran en las diferencias entre grupos. Se trata bsicam ente de extensiones
o elaboraciones de lo aprendido en los captulos 11. a 13 sobre el anlisis de varianza. Incluim os
en este grupo a los procedim ientos de anlisis de covarianza, anlisis de varianza m uitivariado y
an lisis de covarianza m ultivariado. L a controversia del captulo cuestiona si la estadstica de
bera ser controvertida. Finalm ente, concluim os el captulo con una exposicin acerca de cmo
actuar cuando encontramos publicaciones cientficas que utilizan tcnicas estadsticas que no
conocemos.

BREVE REVISIN DE LA CORRELACIN Y LA REGRESIN MLTIPLES


E n el captulo 4 hemos aprendido la correlacin y la regresin m ltiples (y en el captulo 16 he
mos repasado esas tcnicas brevemente). L a correlacin m ltiple se basa en la relacin de una va
riable dependiente con la combinacin de dos o ms variables de prediccin. En un ejemplo :
ficticio que utilizam os en el captulo 4, exista una correlacin m ltiple (i?) de 0,96 entre el nivel
de estrs experimentado por varios gerentes y la combinacin de la cantidad de empleados que
supervisaban, el nivel de ruido en el lugar de trabajo y la cantidad de decisiones que deban tomar
cada mes.
Tambin aprendimos que la regresin m ltiple es la prediccin de una variable dependiente
sobre la base de dos o ms variables de prediccin. (Cabe recordar que la regresin es simplemen
te la forma de prediccin de la correlacin). L a reglas de prediccin de la regresin m ltiple pre
senta un coeficiente de regresin para cada variable de prediccin. S i se conoce el valor obser
vado de una persona en las variables de prediccin, se m ultiplica ese valor de cada variable de
prediccin por el coeficiente de regresin de esa variable. L a suma de los productos ser el valor pre
dicho para esa persona en la variable dependiente. Cuando se trabaja con puntuaciones Z , los coe
ficientes de regresin son coeficientes de regresin estandarizados, denominados valores
ponderados beta (p). Por ejemplo, con tres variables independientes, la ecuacin de la regla de
prediccin es la siguiente:

r -M ^ J +MzxJ+M zx,)
E n el ejemplo del estrs sufrido por ios gerentes, la regla de prediccin de regresin m ltiple con
puntuaciones Z era la siguiente:

^Estrs = (031)(Zanple,dM)+(0,U)(ZRuido)+(033)(ZDecis ion es)


Cuando se trabaja con puntuaciones originales, el coeficiente de regresin para puntuaciones ori
ginales (b) se m ultiplica por la puntuacin original en cada variable de prediccin, y se suma la
constante de regresin de puntuaciones originales (a). L a siguiente es la frmula con tres varia
bles independientes:

E n el ejemplo del estrs de los gerentes, la regla de prediccin de regresin m ltiple con puntua
ciones originales era la siguiente:

Y = - 4 , 7 0 + ( ,5 6 ) ( E m p le a d o s ) + ( 0 ,6 ) ( R u id o ) + ( 0 , 8 6 ) ( D e c is io n e s )

E n la correlacin y regresin m ltiples, los investigadores pueden determinar la significacin es


tadstica tanto del coeficiente de correlacin mltiple general (R) como de cada beta individual
( b). E n la m ayora de los casos, si el R general no es significativo, el investigador no prueba la
significacin de los coeficientes betas individuales. Sin embargo, es bastante probable que el coe
ficiente R general sea significativo pero que algunos de los coeficientes betas no lo sean. Por
ejemplo, la correlacin significativa general podra ser el resultado de la fuerte influencia de una
sola variable de prediccin, con leves contribuciones por parte de las otras variables.

REGRESIN MLTIPLE JERRQUICA Y POR PASOS


Regresin mitipie jerrquica
A veces, los investigadores estn interesados en observar la influencia de diversas variables de
prediccin en forma secuencial. E s decir, Ies interesa saber, en primer lugar, cul es la correlacin
entre la primera variable de prediccin y la variable dependiente. En segundo lugar, les interesa
saber cunto agrega a la correlacin mltiple general el hecho de incluir una segunda variable de
prediccin. Luego, el investigador puede estar interesado en saber cunto ms se agrega incluyen
do una tercera variable de prediccin, y as sucesivamente. E l procedimiento que acabamos de
describir es conocido con el nombre de regresin m ltiple je r rq u ica .
E n las investigaciones que utilizan la regresin m ltiple jerrquica, la cantidad agregada su
cesivamente por cada variable a la prediccin general se describe usualmente en trminos de un
aumento de R 2 (proporcin de varianza explicada).
Analicem os un ejemplo. M acDonald y sus colegas (1997) analizaron la relacin de varios
factores con los p t s d (Posttraumatic stre ss d is o rd e r , Trastornos de estrs postraumtico) de vete
ranos de guerra. Lo s psiclogos reclutaron una muestra comunitaria de 756 veteranos de la G ue
rra de Vietnam oriundos de Nueva Zelanda, que inclua 161 maores (los maores son el pueblo
polinesio autctono de Nueva Zelanda). L a tabla 17-1 indica los resultados del anlisis de regre
sin jerrquica realizado por los psiclogos. L a primera variable que se tom en cuenta (paso 1)
era la exposicin al combate, que por s misma tena una R2 de 0,07; los dos asteriscos indican
que el resultado es significativo. E l segundo paso fue agregar una serie de variables relacionadas
con la experiencia m ilitar en Vietnam . L a serie completa de variables aument el R2 de 0,07 a
0,171, un aumento (cambio en i?2) de 0,101. (E n la tabla, los investigadores sealan un aumento
de 0,100. L a diferencia probablemente se deba al redondeo de las cantidades indicadas en la tabla
para cada etapa).
T a b la 1 7 - 1 .

Coeficientes de regresin, valores R2y cambio en R2, correspondientes a la exposicin al combate,


las variables de experiencias en Vietnam y la raza, que predicen el ptsd .
C o eficien te b eta esta n d a r iz a d o
V ariable d e p red icci n
E xposicin al com bate
E xposicin m ilitar en Vietnam
T iem po de servicio en Vietnam
Rango
R o en com bate
E sp eciaiizacin m ilitar I a
E sp eciazacin m ilitar 2 a

P aso 1

P aso 2

P aso 3

0,2 6 6 * * *

0 ,3 0 0 * *

0,297**

-0 ,0 3 5
-0 ,3 1 6 * *
0 ,153*
0,015
0,044

-0 ,0 3 6
-0 ,3 1 4 * *
0,154*
0 ,017
0,044

0 ,171**
0 ,100*

-0 ,0 2 4
0,171**
0,001

Raza6
R2
C a m b io en R 2

0,0 7 0 * * *

*p < 0 ,0 1 ; * * p < 0,001.


Variable nominal: especia lizacin militar l (infantera/no infantera); especializacin militar 2 (artillera / no artillera).
bVariable dicotmica (maor/no maor).
Fuente: M acDonald, C , Chamberlain, K., & Long, N . (1997), tab. 2. Raza, combate y estrs postraumtico [ptsd] en
una maestra comunitaria de veteranos de la Guerra de Vietnam oriundos de Nueva Zelanda. R e v is ta c ien tfica d e es
trs tra u m tico [Jou rnal o fT ra u m a tic S tre ss], 1 0 ,1 2 3 . Copyright, 1997, por la Sociedad Internacional de Estudios s o
bre Estrs Traumtico. Reimpreso con autorizacin.

Finalm ente, en el paso 3 se agreg a raza (m aor o no). L a inclusin de la variable raza no aumen
t mucho el R2.
Lo s resultados son especialmente interesantes debido a que la correlacin bivarada directa
entre la raza y los p t s d era significativa. Aun as, l a regresin jerrquica muestra que a raza no
predice el estrs postraumtico si ya se ha tenido en cuenta l a experiencia en combate y la sita-
cin m ilitar. E n otras palabras, el efecto aparente de la raza probablemente se deba a que la expo
sicin al combate y la experiencia m ilitar de los maories eran diferentes.
Analicem os otro ejemplo. Hermann y sus colegas (1997) realizaron un estudio de nios bajo
tratamiento de bionretroalimentacin de la migraa. E l objetivo del estudio era identificar varia
bles que predijeran el xito de ese tipo de tratamiento y, para eso, los investigadores midieron la
aj (Actividad de las jaquecas) al finalizar un programa de 8 semanas de tratamiento. L a a i era una
variable que resuma factores tales como la frecuencia y la intensidad de los dolores de cabeza.
Lo s investigadores tambin midieron una cantidad de variables de prediccin, que incluan la AJ
preexistente (antes de que comenzara el tratamiento), los problemas de conducta segn la c b c l
(Child Behavior Checklist, Lista de verificacin del comportamiento infantil), incluyendo la inte
riorizacin y exteriorizacin del comportamiento, las aflicciones psicosom ticas, la edad y las va
riables fam iliares segn la f e s (Family Environment Scale, E scala de ambiente fam iliar), incluso
el ndice de relaciones fam iliares, la organizacin y el control
Lo s investigadores utilizaron la regresin jerrquica para observar si las dems variables de
prediccin agregaban algo a la prediccin de la efectividad por encim a de la aj preexistente. En
realidad, realizaron dos regresiones jerrquicas diferentes. Una, a la que llam aron modelo 1, exa
minaba si las variables referidas al nio (comportamiento y edad) aportaban alguna contribucin
por encim a de la a j preexistente. L a otra, e l modelo 2, examinaba si las variables fam iliares apor
taban alguna contribucin por encima de la aj previa a la lnea de base. Lo s investigadores infor
maron sus resultados de la siguiente forma:

Tabla 17-2
Prediccin del efecto de determinado tratamiento a travs de la regresin m ltiple jerrquica.
M o d e lo y p a so

R 2 T otal

M odelo 1
0,39
Paso 1. AJ previa a la lnea de base
Paso 2. CBCL: interiorizacin del comportam iento
CBCL: exteriorizacin .del comportam iento
A fliccio n es psicosom ticas
Edad
M odelo 2
0,03
P a s o l, aj previa a la ln ea de base
Paso 2. FES: ndice de relaciones fam iliares
FES: organizacin
fes : control
Nota,- a j actividad de las jaquecas;
te familiar.

cbcl

gl

5 ,2 6

3,3*

P
- 0 ,0 4

R 2A

0,02
- 0 ,2 7
0,57*

0,7
0,37

0,02
0,01

0,7
0 ,0 6

3,9*

0,37*
-0 ,4 3 *
4 ,2 7

0 ,2
-0 ,1 8
-0 ,0 4
- 0 ,0 6
- 0 ,0 5

= Lista de verificacin del comportamiento infantil; f e s = Escala de ambien

*p < 0,05.

Fuente: Hermann, C., Blanchard, E. B., & Flor, H. (1997), tab. 5. 'Tratamiento de biorretroalimentacia para la migra
a: prediccin del efecto del tratamiento. R e v ista cien tfica d e p s ic o lo g a d e a seso ra m ien to y c ln ic a (J o u rn a l o f C on
su ltin g a n d C lin ical P sy ch o lo g y ] 65, 611-616. Copyright, 1997, por la Asociacin Americana de Psicologa, Reimpreso
con autorizacin.

U tiliza n d o la reg resi n m ltip le jerrq uica, s e evalu aron in d ep en d ien tem en te las caractersticas
d e l n i o (m o d e lo i ) y e l a m b ien te fa m ilia r (m o d e lo 2 ) c o m o fa cto res d e p red iccin d el e fe c to del
tratam iento. Para controlar la s d iferen cia s d e la ln ea d e b a se, se in g r e s prim ero la a j previa a la
ln e a d e b a se. L as variables qu e reflejan la s caractersticas d el n i o y lo s a sp ectos d el fu n c io n a
m ien to fa m ilia r resp ectiv a m en te, fu eron in g resa d o s c o m o ser ie s en e l p a so 2 . . . (pp. 6 1 3 -6 1 4 )

Regresin mltiple por pasos


Con frecuencia, especialmente en un estudio exploratorio, el investigador puede haber medido
muchas variables de prediccin potenciales y, adems, necesitar seleccionar aquellas que aportan
una contribucin til a la prediccin general. Por lo general, esto se logra con la regresin m lti
ple p o r pasos. L a forma ms comn de la regresin m ltiple gradual funciona del siguiente mo
do: un programa de computacin realiza un proceso paso a paso, seleccionando primero la
variable que presenta la mayor correlacin con la variable dependiente. S i esa correlacin no es
significativa, el proceso se detiene, ya que, incluso el mejor elemento de prediccin no es til. Pe
ro si esa prim era correlacin es significativa, el proceso contina. E l siguiente paso es seleccionar
la variable de prediccin que, en combinacin con la primera, presenta el R ms elevado. Enton
ces, la computadora verifica si la combinacin im plica una mejora significativa por encim a de la
m ejor variable de prediccin independiente. S i no lo e$, el proceso se detiene. S i realmente im pli
ca una mejora significativa, el programa contina. E l siguiente paso es seleccionar cul de las res
tantes variables de prediccin al analizarse en combinacin con las dos primeras, crea el R
mltiple ms elevado, Luego,se verifica la com binacin para observar si im plica una mejora sig
nificativa para la prediccin por encim a de los dos primeros factores de prediccin, E l proceso
contina hasta que se incluyen todas las variables de prediccin o hasta que el punto en el cual
agregar cualquiera de las restantes no im plica ninguna mejora significativa. L a tabla 17-3 muestra
un diagrama de procedimiento descripto, al que se denomina por pasos, porque avanza de a un
paso a la vez.1 E l siguiente es un ejemplo tomado del estudio que acabamos de analizar acerca de
los elementos de prediccin de la efectividad de un tratamiento de biorretroalimentacin para n i
os con migraa. Adems de las regresiones jerrquicas, Hemann et al. tambin realizaron una re
gresin gradual. E l informe es el siguiente:
S e c a lc u l una regresin gradual [...] c o n fin e s e x p lo ra to rio s, com p aran d o en form a d irecta tod as
las variables d e p re d ic c i n en tre s , e x c e p to la aj p rev ia a la ln ea d e base. C o m cid en tem en te c o n
e l m o d e lo 1, la e d a d ( j i = 0 , 3 8 ) y la s a flic c io n e s p sic o so m tic a s (|3 = 0 ,3 9 ) resultaron variab les e x i
tosas para la p re d ic c i n d e l e fe c to d e l tratam iento, ju stific a n d o e l 35% d el m ism o , F ( 3 , 2 8 ) = 4 ,9 ,
p < 0 ,0 1 (p. 6 1 4 ).

Lo que los autores quieren decir es que, de las diversas variables de prediccin (que eran siete), la
proporcin de varianza justificada por dos de ellas (edad y aflicciones psicosom ticas) no era au
mentada significativam ente al in cluir tambin cualquiera de las variables restantes.

1 Tcnicamente, lo descripto es una regresin por pasos hacia adelante". Algunos investigadores prefieren comenzar
con una regla de prediccin que incluya todas las variables de prediccin para observar luego cunta capacidad de pre
diccin se pierde al eliminar el factor de prediccin menos til. S i no se pierde mucha capacidad de prediccin, se eli
mina la siguiente variable menos til, y as sucesivamente. El proceso contina hasta que queda una pequea serie de
variables cuyo poder de prediccin se reduce significativamente al eliminar e l factor de prediccin menos til. Este
procedimiento alternativo se denomina regresin por pasos hacia atrs". En la mayora de los casos, las regresiones
por pasos hacia adelante o hacia atrs producen aproximadamente ios m ism os resultados; realmente, la utilizacin de
uno y otro proceso no denota gran diferencia sino que se trata ms bien de una cuestin de preferencia del investigador.

Tabla 17-3.
Proceso de regresin mltiple gradual.
Paso 1:

Paso 2:

Paso 3:

B uscar todas las variables de prediccin


poten ciales y encontrar ia mejor correlacin
bivariada con la variable dependiente.
Probar la significacin.
S i la correlacin no es significativa, --------------------------------------------------D E T E N E R SE
S i la correlacin es significativa, incluir esa
variable en todos los pasos siguientes y ----- > C O N T IN U A R
Buscar entre todas las restantes variables
potenciales de prediccin aqulla que
com bin e mejor co n las ya incluidas
para predecir a variable dependiente.
Si ninguna otra resulta sig n ifica tiv a ,----------------------------- --------------- s>- D E T E N E R SE
Si existe una que es significativa,
incluirla en todos los siguientes
pasos y --------------------------------------------------------------REPETIR E L PA SO 3
PARA E N C O N T R A R
'
L A M EJO R V A R IA B L E D E
PR E D IC C I N E N T R E L A S RESTANTES

E s preciso hacer ana advertencia en cuanto a la regresin gradual: la frm ula de prediccin re
sultante es el grupo de variables que m ejor predice la variable dependiente, basndose en la
m u estra a n a liza d a . Sin embargo, sucede con frecuencia que cuando se analizan las mismas
variables con una nueva muestra, la m ejor com binacin de variables resulta ser, en cierto mo
do, diferente.

Comparacin entre la regresin jerrquica y regresin por pasos


L a s regresiones jerrquicas y graduales son sim ilares en aspectos importantes. Con ambos mto
dos se agrega una o ms variables a la vez y se verifica si lo que se ha agregado aumenta significa
tivamente la prediccin. Sin embargo, tambin existe una diferencia importante: en la regresin
jerrquica, el orden en que se agregan las variables de prediccin se basa en algn plan o teora,
establecido de antemano por el investigador. En cam bio, en la regresin por pasos no existe nin
gn plan in icia l; la computadora simplemente calcula cules son las variables que ms conviene
agregar, hasta llegar al punto en el que agregar ms variables no im plica ninguna contribucin
adicional.
A s, la regresin jerrquica se utiliza en investigaciones basadas en una teora o en algn co
nocimiento sustancial previo, mientras que la regresin por pasos es til en los estudios explora
torios en los que no existe un resultado esperado, o bien, en investigaciones aplicadas en las que
se busca la m ejor frmula de prediccin sin importar su significado terico.

CORRELACIN PARCIAL
L a co rrelaci n p a rcia l es otra tcnica ampliamente utilizada en a psicologa de la personalidad
y del desarrollo, en la psicologa cln ica y social y en varias otras reas aplicadas a la psicologa.
L a correlacin parcial es el grado de asociacin entre dos variables, por encim a de la influencia

de otra u otras variables. Supongamos que un investigador necesita saber hasta qu punto el estrs
sufrido por una persona en la vida marital est relacionado con el tiempo que esa persona ha esta
do casada. Sin embargo, el investigador es consciente de que parte de lo que podra relacionar al
estrs marital con el tiempo de casado, es que las personas que llevan ms tiempo casadas proba
blemente tengan hijos, y ese hecho podra causar estrs m arital. Por lo tanto, calcular simplemen
te la correlacin entre el estrs m arital y el tiempo de m atrim oni sera engaoso; lo que el
investigador necesita saber es la relacin que existira entre el estrs y el tiempo de matrimonio si
todas las parejas tuvieran la misma cantidad de hijos. O , para decirlo de otra manera, el investiga
dor necesita que, de algn modo, la inform acin derivada del estrs y el tiempo de matrimonio no
incluya lo aportado por la cantidad de hijos de ese matrimonio. Lo anterior se logra mediante la
correlacin parcial.
En el caso mencionado anteriormente, el investigador calculara una correlacin parcial entre
el estrs m arital y el tiempo de matrimonio m anteniendo constante la cantidad de hijos. E l pro
cedimiento tambin se describe como exclusin o control de la cantidad de hijos (los trminos
mantener constante , excluir y controlar tienen el mismo significado y pueden utilizarse in
distintamente). E l clculo estadstico real de la correlacin parcial se denomina coeficiente de
co rrelaci n p a rcia l. Este presenta valores desde el -1 al +1 y se considera igual a una corre
lacin comn entre dos variables, excepto por el hecho de que existe una tercera variable que es
t siendo controlada.
E l siguiente es otro modo de ver la correlacin parcial: en el ejemplo que hemos estado men
cionando, el investigador podra calcular la correlacin entre el estrs y el tiempo de matrimonio
utilizando slo personas que no tuvieran hijos; luego podra calcular la misma correlacin slo con
aquellos que tienen un slo hijo, y as sucesivamente. Cada una de esas correlaciones analizadas
independientemente no se ven afectadas por las diferentes cantidades de hijos, ya que entre las
personas estudiadas en cada una de las correlaciones no existe esa diferencia. Despus, el investi
gador podra calcular algn tipo de promedio entre las diferentes correlaciones, ninguna de las
cuales ha sido afectada por la cantidad de hijos. E l promedio entre esas correlaciones es la correla
cin parcial. Se trata literalmente de una correlacin que mantiene una cantidad constante de hijos.
En realidad, los clculos de una correlacin parcial son bastante directos, y no es necesario
realizar todas esas correlaciones individuales ni el promedio de ellas. Sin.em bargo, el resultado
del proceso es el mismo que si se realizaran esos clcu lo s.2
L a correlacin parcial, en lneas generales, se utiliza para seleccionar una de varias explica
ciones tericas alternativas de las relaciones entre variables. Supongamos que un investigador
descubre una correlacin comn entre el estrs marital y el tiempo de matrimonio, y est interesa
do en utilizar ese resultado para sustentar la teora de que el paso del tiempo hace que las personas
se sientan ms estresadas con respecto al matrimonio, ya que cada miembro de la pareja da por
sentado al otro. Sin embargo, el investigador tambin es consciente de que otra explicacin posi
ble sera que cuando las personas llevan ms tiempo de casadas, probablemente tienen ms hijos,
y el hecho de tener hijos podra crear estrs en el matrimonio. S i se descubre una correlacin en
tre el estrs y el tiempo de matrimonio, aun despus de controlar la cantidad de hijos, la ltim a ex
plicacin alternativa referida a la cantidad de hijos se toma improbable.
2 La correlacin parcial est muy relacionada con la regresin mltiple. Por ejemplo, un coeficiente de regresin indica
en qu medida una variable en particular es adecuada para predecir la variable dependiente, dado cualquier nivel de to
das las otras variables de ia ecuacin. Adems, en la regresin mltiple jerrquica, la contribucin que surge ai agregar
una variable a aquellas ya incluidas en la ecuacin, indica, en efecto, lo que esa variable aporta independientemente de
todas las dems. (El nombre formal de lo que una variable aporta en una regresin- mltiple jerrquica es ia correlacin
semiparciar*), Para comprender de manera general una publicacin cientfica, digamos que la correlacin parcial, ei
coeficiente de regresin y ia cantidad aportada por una variable en la regresin jerrquica, indican algo similar: la rela
cin entre dos variables independientemente de otra u otras variables.

T a b la 1 7 -4 .
C o r r e la c i n b iv a r ia d a y p a r c ia l q u e in d ic a n la s r e la c io n e s e n tr e la s e s c a la s d e r e p r e s i n e in s e g u r i
d a d y la s p r e o c u p a c io n e s a u to c r tic a s e in t e r p e r s o n a le s .
r B iv a ria d a
E sc a la
R epresin
Padres
M adres
inseguridad
Padres
M adres

I n te r p e r s o n a l

A u to c r tic a

0 ,1 2
0,08

0 ,2 3 * * *
0 2 3 * **

0,2 4 * * *
0 ,3 3 * * *

0,13
0,12*

r P a r c ia l
I n te r p e r s o n a l

0 ,0 0
-0 ,1 2 *
0,20**
0,29***

A u to c r tic a

0,18**
0,14*
0 ,0 2
- 0 ,0 7

N ota; Anlisis de correlaciones parciales que evalan las relaciones entre la represin {o inseguridad) y las inquietudes :
depresivas con control de la inseguridad (o represin) y de la depresin adolescente.
*p < 0,05; * * p < 0 ,0 1 ; ***/? < 0,001.

Fuente: Frank, S. J., Poorman, M. O., & Van Egeren, L. A. (1997), tab. 5. Percepcin con respecto a las relaciones con
sus propios padres por parte de adolescentes internados con preocupaciones depresivas y estado de depresin". Revista'-,
cien tfica d e p s ic o lo g a cln ic a infantil [J o u rn a l o f C lin ic a l C h ild P sy c h o lo g y ], 26, 2 05-215. Copyright 1997 por
Lawrence Erlbaum A ssociates, Inc. Reimpreso con autorizacin.

E l siguiente ejemplo fue tomado de una investigacin real: Frank y sus colegas (1997) realizaron
un estudio de las inquietudes depresivas de adolescentes y su relaciones con sus propios padres.
Los investigadores se concentraron en dos aspectos de las inquietudes depresivas: la preocu
pacin autocrtica y la preocupacin interpersonal. Tambin se concentraron en dos aspectos de
lo que denominaron conflicto de separacin-individuacin con los padres, es decir, en qu me- :
dida los adolescentes perciban represin por parte de sus padres (ejerciendo un fuerte control so
bre sus comportamientos) y hasta qu punto los adolescentes se sentan inseguros con respecto a
sus padres. Frank et al. informaron el resultado de los anlisis de la siguiente forma:
D e sp u s c o rrela cio n a m o s las esca la s d e p ercep cin -in seguridad y rep resin, referid as a lo s pa. dres y las m adres, co n lo s valores d e in q u ietu d es autocrticas e in terp erson ales. L a tabla [1 7 -4 ] re
su m e lo s a n lisis d e correlacin bivariada y parcial, E n lo s an lisis p arciales s e co n tro l un
a sp ecto d e l c o n flic to d e sep aracin rn d ivid u acn [....] y c a d a tip o d e inq uietud d epresiva.
A u n q u e la m a g n itu d d e las co rrela cio n es no e s tan am p lia, e l patrn gen eral d e io s resu ltad os que
m u estra [la] tabla e s sig n ifica tiv o . L o s a d o le sce n tes q u e percib an q u e lo s padres reprim an su s in
ten tos d e sep aracin presentaban m s prob ab ilid ad es d e tener in q u ietu d es au tocrticas, m ientras
q u e lo s a d o le sce n tes que reco n o ca n qu e e llo s m ism o s estaban ex p erim en tan d o tem o res y an sie
dades c o n resp ecto a la sep aracin presentaban m s probab ilidad es d e preocu pares por inq uietu
d es interperson ales (p. 2 1 1 ).

CONF1ABIUPAP_________
E s poco comn que, en psicologa, las medidas sean perfectamente precisas. (Tratamos breve
mente el tema en el captulo 3 y lo analizamos con ms detalle en el apndice A ). E l grado de co
herencia o estabilidad de una m edicin se denomina conabUidadL En lneas generales,- la

confiab ilid ad im plica hasta qu punto se obtendra el mismo resultado si se hiciera la misma me
dicin nuevamente a la misma persona bajo las mismas circunstancias. Calcular la confiabiiidad
de un procedimiento de medicin es un tema clave en casi todas las reas de investigacin psico
lgica, sin importar si los procedimientos son cuestionarios, entrevistas, observaciones de com
portamientos, reacciones fisiolgicas u otros. Lo s clculos estadsticos de la confiabiiidad aparecen
con frecuencia en las publicaciones cientficas.
Una forma de evaluar la co nfiab iiidad de una m edicin es hacerla dos veces con el mismo
grupo de personas, y la correlacin entre esas dos pruebas se denomina confiabiiidad por p ru e
ba-reprueba, Sin embargo, este mtodo comnmente no resulta prctico o apropiado. Por ejem
plo, el mtodo no sena aplicable si, al realizar la pnieba una vez, influye en la realizacin de la
prueba por segunda vez (como sera el caso de una prueba de inteligencia).
Con muchas m ediciones, tales como la m ayora de los cuestionarios, tambin se puede
evaluar la co n fiab iiid ad , correlacionando el valor promedio de una m itad de los tem s con el
valor promedio de la otra mitad, Por ejem plo, se podra correlacionar el valor de todos los
tem s im pares con el valor de todos los tem s pares. S i la persona est respondiendo coheren
temente, deberamos obtener una correlacin alta. Este procedim iento se denomina co nfiab i. iid a d p o r d ivisi n en m itades
E l problem a que surge al u tilizar e l mtodo de m itades es el modo en que se las divide.
E n m uchos casos tiene sentido d ivid ir los tem s en pares e im pares, pero podra ocurrir que
por casualidad esta divisin diera una correlacin dem asiado baja o demasiado alta. A fortu
nadamente, existe una solucin ms general; se puede d ivid ir la prueba en m itades, de todas
las form as posibles, y calcu lar la correlacin utilizando cada una de las d ivisiones. E l prome
dio de esas correlaciones se denomina alfa de C ro n b a ch (a ). (E x iste una frm ula no dema
siado com pleja para realizar ese procedimiento, que produce el mismo resultado que prom ediar
todas las posibles correlaciones entre m itades. Por supuesto, en la actualidad, alfa ca si siem
pre se calcu la con una computadora).
E l alfa de Cronbach es la medida de co n fiab iiid ad ms ampliamente utilizada, y tambin
se la puede considerar como la descripcin del grado en que cada tem est asociado con cada
uno de los otros tem s. D escribe la coherencia general de la prueba, es decir, en qu m edi
da las respuestas altas coinciden con las altas y las bajas con las bajas en todos los tem s de la
prueba.
Generalm ente, en psicologa una prueba debera presentar una co n fiab iiid ad (m edida a
travs del alfa de Cronbach) de al menos 0 ,7 , y preferentem ente cercana a 0,9, para que la
prueba sea til. Sin embargo, algunas veces se consideran adecuadas alfas de 0,6 m enores.
U n contexto en el cual la co n fiab iiid ad es casi siem pre discutida es en e l de las publica
ciones cien tficas, cuyo objetivo es, principalm ente, la creacin de una nueva m edida. Por
ejem plo, Sellers y sus colegas (1997) desarrollaron un cuestionario para evaluar la identidad
de la raza negra entre am ericanos africanos. A l desarrollar la escala identificaron una canti
dad de aspectos de la identidad de la raza negra, creando un M I8I (Multidimensional Inven
tory of Black Identity, Inventario m ultidim ensional de identidad de la raza negra) que incluye
diversas sub-escalas. Uno de lo s distintos mtodos que utilizaron para evaluar la solid ez de la
escala como medida fue determ inar la co n fia b iiid a d de cada sub-escala y, tam bin, hacerlo
con alum nos africanos am ericanos tanto en una universidad para alumnos de raza negra co
mo en otra universidad en la que predom inaban los alum nos de raza blanca. L a tabla 17-5 in
dica los resultados de ese aspecto del estudio. (L a ln ea correspondiente al inters por lo
pblico est en blanco en la tabla, porque era una sub-escala que incluyeron originalm ente
pero luego descartaron durante el proceso de desarrollo de la m edida). Sellers et al. resum en
del siguiente modo los descubrim ientos que presenta la tabla; L a s versiones revisadas de las

escalas y sub-escalas del m i b i mostraron una adecuada coherencia interna [...] L o s alfas de
Cronbach de las sub-escalas iban desde un 0,60 bajo (aspecto privado) a un 0,79 (nacionalis
m o). L o s alfas eran sim ilares en cada una de las facultades (p. 810).

T a b la 1 7 -5 .
E s t a d s tic a d e s c r ip tiv a p a r a el m ibi p o r fa c u lta d y p a r a la m u e s tr a c o m p le ta .
U n iv e r sid a d con
p red om in io d e raza b la n ca

M u e stra co m p le ta
E sc a la
P osicin central
Inters priv.
Inters pb.
Integracin cultural
Hum anista
M inora
N acionalism o

a d e C ro n b a ch
0,77
0,6 0

5,23
6,2 5 a

1,08
0,7 0

0,73
0 ,7 0
0,76
0,79

SD

4,9 2 a
5 ,1 5 a
4 ,7 8 a
4 ,2 7 a

0,91
0,84
0 ,8 2
0,99

a d e C ro n b a c h
0,78
0,55

0,66
0,68
0,75
0,78

5,20
6,38

5,165,33
4,82
4,02

SD

1,14
0,59

0 ,8 0
0 ,8 0
0,80
0,96

U n iv ersid a d
a fro -a m erica n a
(X d e C ro n b a ch

0,75
0,61

0,74
0,69
0,77
0,74

SD

5,28
6,05

0,98
0,81

4,55
4,87
4,70
4,67

0,94
0,81
0,86
0,90

N ota: Priv = Privado; Pub = Publico.


:1Denota medas significativamente diferentes entre las dos muestras con un a = 0,01.
Fuente; Selers, R, M ., Rowey, S. A. 1., Chavotts, T. M,, Sheiton, J. N ., & Smith, M. A. (1907), tab. 2. Inventario
multidimensional de identidad de la raza negra: una investigacin preliminar de la confiabilidad y validez del constructo. R evista c ien tfica d e p s ic o lo g a s o c ia l y d e la p e rs o n a lid a d [J o u rn a l o fP e r s o n a lity a n d S o c ia l P s y ch o lo g y }, 73,
805-815. Copyright, 1997, por la Asociacin Americana de Psicologa. Reimpreso con autorizacin.

ANALISIS FACTORIAL
E l a n lisis fa cto ria l se u tiliza cuando el investigador ha m edido a los participantes con res
pecto a una gran cantidad de variables. E l an lisis factorial ndica ai investigador qu varia
bles tienden a agruparse, es decir, qu variables tienden a correlacionarse entre s y no con
otras. Cada agrupacin de ese tipo (grupo de variables) se denom ina facto r. L a conexin rela
tiva de cada una de las variables originales con un factor es la carg a fa c to ria l de esa variable
en ese factor. (L a s variables presentan cargas en todos los factores, pero generalm ente tendrn
cargas altas slo en uno). L a s cargas factoriales pueden considerarse co'mo la correlacin de la
variable con el factor y, al igual que las correlaciones, van desde - 1 , asociacin negativa per
fecta con el factor, pasando por 0, ausencia de relacin con e l factor, hasta +1, correlacin
positiva perfecta con el factor. Normalmente, se considera que una variable contribuye sig n ifi
cativam ente en un factor slo si presenta aproximadamente una carga de 0,3 m ayor ( de
-0 ,3 menor). Algunos investigadores utilizan lo s niveles 0 ,3 5 ,0 ,4 0 , e incluso niveles ms al
tos, como norma para decidir si una carga factorial es lo suficientem ente importante como pa
ra considerar que la variable forma parte del factor.
E l anlisis factorial en s mismo incluye una serie de frmulas relativamente com plejas que
comienzan con las correlaciones entre todas las variables y terminan con una serie de cargas fac
toriales, as como tambin otros datos, tales como la cantidad de varianza, del total de variacin
entre las variables, que son explicadas por cada factor. En realidad existen varios mtodos, de al
gn modo diferentes, para realizar un anlisis factorial; as, el investigador cuenta con cierta li-

Tabia 17-6,
C argas fa ctoriales de tem s de la s cu atro su b -esca ia s ideolgicas*
te m
Integracin cultural 5
Integracin cultural 4
Integracin cultural 6
Integracin cultural 7
Integracin cultural 2
Integracin cultural 3
Integracin cultural 1
Integracin cultural 9
Integracin cultural 8
Hum anista 7
Hum anista 1
Hum anista
Hum anista 2
Hum anista 8
H um anista 4
Hum anista 5
Hum anista 3
Hum anista 9
M inora 8
M inora 3
M inora 9
M inora 5
M inora 1
M inora 4
M inora 7
M inora 2
M inora 6
N acionalista 7
N acionalista
N acionalista 1
N acionalista 3
N acionalista 4
N acionalista 5
N acionalista 2
N acionalista 9
N acionalista 8

F a cto r 1

F a c to r 2

0,74
0,7 2
0,5 7
0,42
0,37
0,36
0,33
0,32
0,30
0,41
0,31
0,3 6

0,43
0,35
0,41
0,63

F a c to r 3

F a cto r 4

- 0 ,3 0
0,48
0,41
0 ,6 5
0,6 2
0,5 7
0,5 0
0 ,4 2
0 ,3 8
0,3 7
0,31
0 ,2 2

0 ,3 4
0,31
0,35

- 0 ,4 0
-0 ,3 3
- 0 ,5 4
-0 ,5 1
-0 ,5 0
-0 ,5 1

0,50

-0 ,3 2
-0 ,5 3
- 0 ,4 0
-0 ,5 2
0,72
0,60
0,58
0,50
0,42
0,42
0 ,4 0
0,38
0,33

0 ,3 0

0,70
0,63
0,62
0,54
0 ,5 0
0,45
0 ,4 0
0 ,3 2
0 ,2 8

N ota: slo se enumeran las cargas mayores a 0,30, con excepcin de los tems Humanista 9 y Nacionalista 8. Los valo
res en negrita son los predichos por e l mcbi.
Fuente: Sellers, R. M ., et al. (1997), tab. 1. Inventario mutdimensional de identidad de la raza negra, investigacin
preliminar de confiabilidad y validez de constructos. R e v ista cien tfica d e p s ic o lo g a so c ia l y d e la p e r s o n a lid a d [ J o u r
n a l o f P erso n a lity a n d S o c ia l P s y c h o lo g y ], 7 3 ,8 0 5 -8 1 5 . Copyright, 1997, por la Asociacin Americana de Psicologa.
Reimpreso con autorizacin.

bertad para seleccionar entre una variedad de mtodos, cada uno de los cuales puede dar resulta
dos levemente diferentes.
Sin embargo, la parte ms subjetiva del anlisis factorial reside en el nombre que se le da al
factor. A l leer una publicacin cientfica que inform a acerca de un anlisis factorial, primero de
bera analizarse si el nombre que el investigador da a un factor describe adecuadamente las varia
bles que lo conforman.
...

E n el caso del estudio que acabamos de analizar, Sellers et al. tambin realizaron varios an
lisis factoriales como parte del desarrollo de su medida de identidad de la raza negra. L a tabla
17-6 indica resultados de un anlisis factorial de los tems de sus cuatro escalas ideolgicas. Los
investigadores describen el anlisis de la siguiente forma:
La tabla [17-6] presenta la solucin con cuatro factores del anlisis factorial de las sub-escalas
ideolgicas. Debido al modo en el que se realizaron las operaciones con la escala ideolgica,
planteamos la hiptesis de que cada sub-escala ideolgica se agrupara como un factor nico, pero
que podra haber cierta superposicin en la solucin final y las cargas seran moderadas [...] Para
ser coherentes, y como mtodo para reducir los tems, se conservaron las nueve cargas superiores
de cada sub-escala. Todas las cargas resultantes, excepto dos, fueron superiores a 0,30, ubicndo
se la mayora en un rango moderado (de 0,40 a 0,65). En muchos casos, los tems presentaban car
gas en dos factores, pero la serie de factores de la solucin final tena cargas adecuadas para cada
uno de los tems de la sub-escala. Los cuatro factores explicaban aproximadamente el 56% de la .
varianza. En unos pocos casos, tems que tenan cargas adecuadas en los factores de forma cohe
rente con nuestro modelo presentaban, en efecto, una carga ms alta en otro factor (p. ej. integra
cin cultural 7, integracin cultural 8). E l anlisis de los contenidos del tem sugiere que esos
tems representan actitudes polticas coherentes con nuestra teora acerca de las dos ideologas y,
probablemente, presenten cargas altas en ambos factores en estudios subsiguientes (pp. 809-810).

MODELO CAUSAL

>

_________________________ ________________

En el caso de las tcnicas de modelo causal, al igual que en el anlisis factorial, el investigador ha
probado a una cantidad de personas segn una cantidad de variables, pero a diferencia del anlisis
factorial, el objetivo de las tcnicas de modelo causal es analizar si el patrn de correlaciones en
tre las variables se ajusta a la teora previa del investigador con respecto a qu variables son la
causa de cules otras.
Las tcnicas de modelo causal son ampliamente utilizadas en psicologa. Primero presentare
mos el mtodo antiguo del anlisis de senderos y, despus, pasaremos al mtodo ms moderno y
ms elaborado de modelo de ecuacin estructural. 7

Anlisis de senderos
En el an lisis de senderos, el investigador crea un diagrama con flechas que conectan las varia
bles. La s flechas o senderos indican las conexiones causa-efecto entre las'variables segn la teo
ra del investigador. Despus, el investigador calcula coeficientes de senderos para cada uno de
los senderos. E l coeficiente de senderos es sim ilar a beta en la regresin m ltiple: ndica en qu
medida un cambio en la variable al comienzo de la flecha se relaciona con un cambio en la varia
ble al final de la flecha. (E l coeficiente se calcula de forma tal que excluye la influencia de cual
quier otra variable que tenga flechas hacia la variable ubicada al final de la misma flecha).
Analicem os el siguiente ejemplo: M acKinnon-Lew is y sus colegas (1997) realizaron un estu
dio examinando las variables de prediccin de la aceptacin social, por parte de sus pares, de ni
os de 8 a 10 aos de edad. La s principales variables de prediccin que utilizaron fueron las
calificaciones de los nios en cuanto a la aceptacin o al rechazo de sus padres, las calificaciones
de los pares en cuanto a aceptacin y agresin, y los conflictos con hermanos segn se observaron
en una interaccin experimental. Probaron varios modelos causales diferentes y llegaron a la con
clusin de que el ms apropiado era el que llamaron modelo 1 .

L a figura [1 7 -1 ] rep resen ta gr fica m en te lo s c o e fic ie n te s de sen d ero s estandarizados d el m o d elo


L e in d ic a q u e los herm anos en cu y a s m adres se p ercib a y o b servab a m ayor rechazo, se reporta
ban y observaban m s a g resiv o s entre s qu e a q u ello s herm anos cu y a s m adres m ostraban m enor
r ech a zo . M s an, lo s ni os qu e experim entaban rela cio n es entre herm anos m s,,agresivas tenan
m ayo res probab ilidad es d e qu e sus pares lo s consideraran a g resiv o s y eran m en o s acep tad os por
e llo s . A u n q u e no s e r ev e l una in flu en cia paterna directa en la agresivid ad entre herm anos, s se
e v id e n c i un e fe c to ind irecto c o m o resultado d el h e c h o d e q u e un a m enor a cep tacin paterna esta
ba r ela cio n a d a c o n un m ayor rech a zo por parte d e la m adre (p. 1027).

En el diagrama de senderos mencionado, los senderos ms importantes presentaban coeficientes


significativos en las direcciones predichas. Por lo tanto, M acKinnon-Lew is et al. interpretaron los
resultados como un apoyo favorable para su teora.

Modelo de ecuacin estructural


E l m odelo de ecuacin estru ctu ral lleva tambin el nombre, entre otros, de modelo de varibl
latente; otro nombre cmo por ejemplo L is re l, es el nombre de uno de los programas de computa
cin especficos utilizado para ese tipo de anlisis. Bsicam ente, el modelo de ecuacin estructu
ral es slo una extensin especial del anlisis de senderos. A l igual que este ltim o, incluye un
diagrama de senderos con flechas entre las variables y coeficientes de senderos para cada flecha.
Sin embargo, el modelo de ecuacin estructural presenta varias ventajas importantes con res
pecto al antiguo mtodo de anlisis de senderos, Una ventaja considerable es que el procedimien
to nombrado proporciona, en primer lugar, un indicio general de la concordancia entre la teora
(segn se describe en el diseo de senderos) y los datos. E sa indicacin de concordancia general
se denomina ndice de concordancia o ndice de la bondad de ajuste. S,'e utilizan varios ndices
de concordancia diferentes pero, en general, se considera que una concordancia de 0,9 mayor es
una concordancia adecuada (usualmente el mximo es 1).
En el modelo de ecuacin estructural tambin se puede calcular una especie de prueba de signi
ficacin, en cuanto a si los datos concuerdan con la teora. Decim os una especie de prueba de sig
nificacin porque la hiptesis nula, en este caso, establece que la teora concuerda con los datos.
Para decirlo en otras palabras, un resultado significativo im plicara que la teora no concuerda con
los datos; en otras palabras, un investigador que intenta demostrar una teora esperar que la prue
ba de significacin arroje un resultado no significativo! Sin embargo, en muchos casos los partici
pantes son tantos que, aun existiendo una concordancia adecuada, el resultado es significativo
debido a que la potencia es tan alta que, incluso, un leve desvo de la concordancia adecuada resul
ta significativo; por lo tanto, algunas veces los investigadores informan una concordancia significa
tivamente inadecuada pero luego la ignoran y se concentran en los ndices de concordancia.
Una segunda ventaja considerable del modelo de ecuacin estructural, con respecto al anli
sis de senderos comn, e^ q ueelp rm erp ,p tilizalo gue;denom nam os y a r ia b ^ latentest-Uaa?Ka-s
rafile latente es aquella qu'na.e.s medida realmente sino quem presenta la: variable;.real que .pl
investigador deseara medir, pero slo puede aproximar a travs de medidas reales. Por ejemplo,
una variable latente podra ser la clase social, la que el investigador intenta aproximar a travs de
distintas variables medidas, tales como el nivel de ingresos, los aos de educacin, el prestigio del
empleo y los metros cuadrados de la vivienda. Ninguna de esas variables medidas puede sustituir
adecuadamente la clase social (aunque algunas pueden hacerlo m ejor que otras). Lo que se nece
sita es algn tipo de promedio ponderado el cual tenga tambin en cuenta que, en su conjunto, el
grupo de variables medidas tampoco refleja en forma perfecta la variable latente.
En el modelo de ecuacin estructural, los clculos matemticos se establecen de modo que la va
riable latente resulte una combinacin de las variables medidas, combinadas de modo tal de utilizar

Figura 17-1.
Modelo de senderos de asociaciones entre variables de paternidad y maternidad, agresin entre hermanos,
agresin entre pares y aceptacin social. Se indican los coeficientes de senderos estandarizados.
* * p < 0 ,0 1 ; * * * p < 0 ,0 0 1 .

[Fuente: MacKinnon-Lewis, C Starnes, R., Volling, B., & Johnson, S. (1997), ftg. 1. "Percepciones de la paternidad y
maternidad com o variables de prediccin de las relaciones entre los nios y sus hermanos o pares. P s ic o lo g a d e D e sa
rro llo [D e v elo p m en ta l P sych ology] 3 3,1024-1031. Copyright, 1997, por la Asociacin Americana de Psicologa. Reim
preso con autorizacin].

slo lo que tienen en comn entre s. L a idea es que lo que tienen en comn es el verdadero valor con
respecto a aqullo de lo cual todas reflejan una parte. (Una variable latente es, en realidad, sim ilar a
un factor en el anlisis factorial, en el sentido de que el factor no se mide directamente sino que repre
senta una combinacin ponderada de las diferentes variables que lo componen).
Tal como lo indica el ejemplo de la figura 17-2, en el diagrama de senderos de un modelo de
ecuacin estructural las variables que realmente se miden por lo general se representan en cuadra
dos o rectngulos, y las variables latentes en crculos u valos. Cabe destacar que en la figura las
flechas van desde las variables latentes (las que se encuentran dentro de los crculos) hacia las va
riables medidas (aquellas dentro de los recuadros), para reflejar ia idea de que la variable latente
es la causa im plcita de las variables medidas, siendo estas ltim as la m ejor forma posible de me
dir la verdadera variable latente.
Tambin es importante observar que todas las otras flechas conectan variables latentes. En la
m ayora de los casos, el modelo de ecuacin estructural funciona de la siguiente manera: las va
riables medidas se utilizan para suplir las variables latentes, y el anlisis se concentra en las rela
ciones causales (los senderos) entre estas ltimas. (Finalmente, con respecto a las pequeas flechas,
que parecen no provenir de ningn lado, diremos que reflejan la existencia de cierto error (otras
causas que no foeron medidas) que tambin afecta a variable. Son flechas de error71o alteracin
que generalmente se omiten en las publicaciones cientficas para que la figura resulte ms simple,
pero que de todos modos estn im plcitas).

Figura 17-2.
Diagrama de senderos de
un modelo de ecuacin estructural

Ejemplo de modelo de ecuacin estructural


E l ejemplo que aqu brindamos proviene de un estudio realizado por Kw an y sus colegas (1997),
el cual analizaba las variables de prediccin de la satisfaccin con respecto a la vida en general,
concentrndose en el papel de la autoestima y la armona social. U n dato particularmente intere
sante con respecto al estudio es que la prediccin indicaba que la relacin entre la autoestima y la
armona social con la satisfaccin, en cuanto a la vida en general, sera diferente en las distintas
culturas. En culturas ms com unitarias, como es el caso de muchas culturas asiticas, la armona
social tendra mayor importancia. Sin embargo, en culturas ms individualistas, tales como la ma
yora de las culturas americanas y europeas, la autoestima tendra mayor relevancia. Como parte
del enfoque hacia las diferencias culturales, los investigadores tambin midieron ei autoconcepto
independiente (en qu medida una persona destaca el desarrollo y los logros personales) y el au
toconcepto interdependente (hasta qu punto una persona destaca el hecho de tener buenas rela
ciones y congeniar con los dems). E l estudio se realiz con 389 alumnos universitarios de
Estados Unidos y Hong Kong.
L a figura 17-3 representa grficamente los resultados bsicos, concentrndose en los senderos
entre las variables latentes. (Para que los diagramas sean simples, a veces las variables medidas ni
siquiera se incluyen en el diagrama publicado). E n este ejemplo en particular, los investigadores
presentan dos series de coeficientes de senderos estandarizados para cada sendero. L o s coeficien
tes de sendero que no estn entre parntesis corresponden a la muestra de los alumnos de Hong
Kong; los que estn entre parntesis, a la muestra de Estados Unidos. Cabe destacar que el im pac
to del autoconcepto no es muy diferente en las dos culturas. Por ejemplo, los participantes de las
dos culturas muestran aproximadamente el mismo grado de asociacin entre la autoestima con la
medida en la que una persona destaca la independencia. Lo ms interesante, sin embargo, es que el
sendero desde la autoestima a la satisfaccin con la vida en general es mayor en el caso de la mues
tra de Estados Unidos, mientras que el sendero desde la armona en las relaciones hacia la satisfac
cin con la vida es mayor en la muestra de Hong Kong.

F ig u r a 1 7 -3 .
M o d e lo fin al d e la e sc a la d e a u to co n cep to .
194, en e l c a s o d e la m u estra d e H o n g K on g y N = 184, en e l
d e la m uestra de E stados U n id o s, L as e lip se s representan con stru ctos latentes; lo s r ectan gu litos representan
in d icad ores; las fle c h a s qu e van d esd e lo s constructos latentes h a c ia lo s in d icad ores d e scrib en cargas fa cto
riales, y las fle c h a s qu e relacion an co n stru cto s latentes entre s representan c o e fic ie n te s d e sen d eros. S e in
d ica n lo s c o e fic ie n te s d e sen d ero s estandarizados y s e om itieron las cargas factoriales y lo s errores de
m e d ic i n para qu e e l diagram a resulte m s claro. L os n m eros entre parn tesis so n lo s c o e fic ie n te s corres
p o n d ien tes a la m uestra d e e e .u u ., y lo s nm eros que no estn entre p arntesis son lo s c o e fic ie n te s d e la
m uestra d e H o n g K on g. T odos e sto s c o e fic ie n te s resultaron sig n ifica tiv o s a p < 0 ,0 5 m enor. [F u en te:
K w an, V. S ., B o n d , M . H ., & S in g e lis ,T . M . (1 9 9 7 ), fig. 1. E x p lic a c io n e s pan cu lturales d e sa tisfa c c i n con
resp ecto a la v id a en general: agregan d o la arm ona en las rela cio n es a la au to estim a , R e v is ta C ien tfica d e
P s ic o lo g a S o c ia l y d e la P erso n a lid a d (Jou rn al o f P erso n a lity a n d S o c ia l P sych o lo g y), 7 3 , 1 0 3 8 -1 0 5 1 . C opyright,
1 9 97, por la A so c ia c i n A m erican a d e P sic o lo g a . R eim p reso c o n autorizacin.]

Algunas limitaciones del modelo causal


E s importante ser consciente de que no existe demasiada magia detrs de estos mtodos m aravi
llosos, ya que los mismos siguen dependiendo siempre del razonamiento profundo del investiga
dor. Supongamos que todos ios senderos predichos de un diagrama de anlisis de senderos
resultan significativos, y que el modelo de ecuacin estructural en general presenta una concor
dancia excelente. Aun en ese caso, es bastante probable que otros patrones de causalidad (otras
formas de disponer las flechas) pudieran funcionar tan adecuadamente o mejor.

Otras alternativas podran disponer las flechas en las direcciones contrarias o realizando co
nexiones diferentes, o bien, el patrn podra in cluir variables adicionales que no aparecen en el
diagrama original. Por lo tanto, todo tipo de modelo causal indica, en el mejor de los casos, que
los datos son coherentes con la teora, pero los m ism os datos podran tambin ser coherentes con
teoras bastante diferentes. Lo ideal sera que el investigador pruebe diseos alternativos y pueda
demostrar que los datos no concuerdan adecuadamente con ellos, pero que. al mismo tiempo,
siempre pueden existir alternativas que el investigador ni siquiera haya pensado.
Adem s, el modelo causal, y todas aquellas tcnicas que hemos estudiado hasta ahora y que
dependen bsicamente de las correlaciones, estn sujetas a las precauciones que sealamos en los
captulos 3 y 4. L a ms importante de esas precauciones es la que acabamos de recalcar: la asocia
cin no demuestra direccin de causalidad; es ms, estas tcnicas slo tienen en cuenta en forma
directa las relaciones lineales. Finalm ente, si existe alguna restriccin del recorrido, los resulta
dos se distorsionan (generalmente tienden a arrojar menores coeficientes de senderos).
Por lo tanto, no debemos dejarnos arrollar por la sofisticacin matemtica de una tcnica tal
como el modelo de variable latente. E s verdad que la tcnica resulta til, a veces hasta m aravi
llosam ente til, pero tambin es cierto que, si no se ha realizado una asignacin aleatoria a los
grupos, la direccin causa y efecto contina siendo ambigua. S i las relaciones im plcitas son
curvilneas o existen otras lim itaciones, tales como la restriccin del recorrido, por lo general es
incluso ms probable obtener resultados engaosos con los procedimientos ms sofisticados que
con las sim ples correlaciones bvariadas.

ANLISIS DE COVARIANZA
Hasta este punto del captulo hemos analizado procedimientos estadsticos que hacen hincapi en
las asociaciones entre variables, los cuales son bsicamente elaboraciones sofisticadas de la co
rrelacin y la regresin. Ahora nos dedicaremos a los procedimientos que se basan en las diferen
cias entre las medias grupales, y que son esencialm ente elaboraciones del anlisis de varanza.
Entre los anlisis mencionados anteriormente, una de las elaboraciones ms ampliamente uti
lizadas es el a n c o va . En este anlisis, el investigador realiza un anlisis de varanza comn, pero
antes ajusta las variables de modo de librarse del efecto de algunas variables adicionales no de
seadas. E s decir, el a n c o v a es al anlisis de varanza lo que la correlacin parcial es a la correla
cin ordinaria. L a variable controlada o excluida se denomina covariable. E l resto de los
resultados se interpretan como cualquier otro anlisis de varanza.
Analicem os un ejemplo. Capaldi y Patterson (1991) realizaron un estudio acerca de la adap
tacin de nios al colegio primario, comparando la adaptacin de nios que, desde su nacimiento,
haban experimentado diferentes niveles de transiciones paternas. Lo s diferentes niveles de
transicin paterna eran los siguientes: ausencia de transicin, prdida del padre, nuevo padrastro
y dos o ms padrastros nuevos. Los autores informan, un a n o v a mostr que existan diferencias
significativas entre los grupos de transicin, F(3 ,1 7 0 ) = 7,53, p < 0,001. (E l patrn formado por
las medias de los cuatro niveles coincida con lo predicho en cuanto a que, a mayores transiciones
paternas, ms insatisfactoria era la adaptacin del nio).
Sin embargo, los investigadores eran conscientes de que las fam ilias de los nios que forma
ban los cuatro niveles de transicin pertenecan a diferentes s s e (situaciones socio-econm icas) y
tenan diferentes niveles de ingreso. Podran estas .diferencias, y no las diferencias en cuanto a
niveles de transicin, ser la causa im plcita de las diferencias de adaptacin?

D e sp u s, prob am os la h ip te sis d e que la s d iferen cias entre lo s grupos d e transicin eran funda
m en ta lm en te una fu n c i n d e las diferencias d e sse e in g r e so s. Para probar e sa p resu n cin s e reali
z un anova c o n la s covariab les de sse e in g reso per cpita. La d ifer e n c ia en tre lo s grupos d e
transicin co n tin u sien d o sig n ifica tiv a ,

F(5 ,1 6 7 ) = 4 ,0 , p <0 ,0 1

(p p. 4 9 2 -4 9 3 ).

(E l patrn de medias fue el mismo en este anlisis que en el original). Aunque ellos no utilizaroh
el trmino especfico, un a n o v a con covariables es un anfisis de covarianza.

ANLISIS DE VARIANZA MULTIVARIADO


Y ANLISIS DE COVARIANZA MULTI VARIADO
Todos los procedimientos que hemos tratado hasta aqu en el libro, incluso los tratados en este
captulo, incluyen slo una variable dependiente. Pueden existir dos o incluso muchas variables
independientes o de prediccin, como en el caso de la regresin m ltiple o el anfisis factorial de
varianza; pero en todos los casos, slo ha existido uiia variable dependiente.
E n esta seccin, analizam os temas de estadstica m ultivariada, es decir, procedimientos utili
zados cuando existen dos o ms variables dependientes. Especficam ente, nos concentramos en
los dos procedimientos mufiivariados ms ampliamente utilizados: elaboraciones multivariadas
del anfisis de varianza y del anfisis de covarianza. Son versiones del anfisis de varianza y cova
rianza que pueden manejar ms de una variable dependiente.
E l manova es un anfisis de varianza en el que pueden existir varias variables dependientes.
Usualm ente, estas variables dependientes son diferentes m edidas de prcticamente la misma co
sa, como por ejemplo, tres escalas diferentes de compromiso poltico o tres pruebas diferentes
de habilidad para la lectura. Los resultados del manova se interpretan bsicam ente del mismo
modo que ios de un anlisis de varianza comn. Supongamos que se estudian tres grupos y s
mide a cada participante segn cuatro variables dependientes. E l m a n o v a dara un F general, y
un nivel de significacin de la diferencia entre los tres grupos, en trminos del grado de desi
gualdad en cuanto a la combinacin de las cuatro variables.
Guando los investigadores encuentran una diferencia significativa general entre grupos a tra
vs de un m a n o v a , se entiende que los grupos difieren en la combinacin de las variables depen
dientes. Comnmente, los investigadores tambin querrn saber s los grupos se diferencian en
alguna o en todas las variables dependientes tomadas en forma individual. Por lo tanto, es comn
que despus de un m a n o v a se realice una serie de anlisis de varianza comunes, uno para cada
una de las variables dependientes. Lo s anfisis de varianza individuales se denominan a veces
anfisis de varianza univariado (en contraposicin con el anfisis mu tvariado), porque cada
uno tiene slo una variable dependiente. A l igual que con oros anfisis univariados, generalmen
te incluyen comparaciones m ltiples, tales como las pruebas de contrastes lineales.
Analicem os un ejemplo. DeGarm o y Forgatch (1997) analizaron un grupo de madres divor
ciadas, concentrndose en el respaldo que reciban de su confidente ms cercano, E l confidente
era a veces un amigo ntimo, a veces un miembro de la fam ilia, y otras una pareja con la que con
vivan. E n el estudio, tanto las madres como los confidentes fueron entrevistados conforme a va
rias medidas; tambin se los observ interactuando, y los investigadores codificaron la interaccin
en forma sistem tica. L o s distintos mtodos utilizados crearon unas cuantas medidas de la rela
cin entre la madre y su confidente ntimo, incluyendo tres medidas de respaldo por parte del con
fidente, cuatro medidas de aspectos negativos del confidente y cuatro medidas de la intimidad de
la relacin.

Un aspecto del estudio se concentraba en cmo difera la relacin con el confidente en el ca


so de que el mismo fuera un amigo, un miembro de la fam ilia o la pareja con la que convivan.
DeGarm o y Forgatch describieron el anlisis de la siguiente manera:
S e realizaron a n lisis d e varianza m u ltiv a ria d o
a sp e c to s n eg a tiv o s

y d e in tim id a d c o n

y u n ivariado

c o n lo s in d ica d o resjd e resp ald o de

r esp e c to a a m ig o s c er c a n o s, fam ilia res y parejas d e c o n v i

v e n c ia . L a tab la [1 7 -7 ] in d ic a lo s v a lo r e s m e d io s , la s p ruebas d e d ife r e n c ia s y lo s con trastes s ig


n ifica tiv o s.
S e encontraron diferencias significativas entre los tipos de relacin manova de los indicadores,

F(20,254) = 4,10,P < 0,001 (p. 340).

T a b la 1 7 -7 .

Medias y desvos estndar de los indicadores de constructo segn el tipo de relacin con el confidente.
Amigo (1)
In d ica d o res d e co n stru cto
R espaldo observado en el confidente
Interpersonal
Afabilidad
E m ocional
A sp ecto s negativos d el confidente
Irritabilidad segn
el propio inform e
Irritabilidad segn
el inform e de intimidad
D epresin
Intimidad de a relacin
Intim idad segn
ei inform e de la madre
Intim idad segn
e l inform e del confidente
Com plejidad segn
inform e de la madre
Com plejidad segn
inform e del confidente

Familiar (2)

SD

3,3 4
3,39
1,04

0,67
0 ,8 6
0 ,3 6

3 ,3 5
3 ,2 4
0 ,9 6

1,91

0 ,8 4

1,36
1,06

SD

Pareja (3)
C o n tr a s te s
s ig n ifica tiv o s

SD

0,63
0,94
0,37

2 ,9 2
2,68
0 ,6 9

1,21

5,93**
6,58**

0,35

12,17***

1,70

0,70

2,25

0,65

5,27**

0 ,5 0
0 ,3 2

1,33
0,93

0,35
0,36

1,48
0,95

0 ,4 0
0,34

1,65
2,02

3,18

0,73

3,1 9

0,75

3,65

0,58

5,94**

3 >1,2

3,05

0 ,7 8

3,29

0,69

3,48

0,64

4,62**

3 > 1

1,91

0,8 4

2,2 9

0,74

2,87

0,33

22,5 2 * * *

3 > 1 ,2

2,01

0,74

2,19

0,75

2,73

0,55.

13,36***

3 > 1 ,2

0,65

F ( 2 ,135)

1,2 > 3
, 2 > 3
1,2>3

3 >2

N ota: rts = 6 5 ,3 3 y 40 para cada tipo de relacin, es decir, amigos, familiares y parejas respectivamente.

**p <0,01; ***p < 0,001.


Fuente: DeGarmo, D. S., & Forgatch, M . S. (1997), tab. 2. Determinantes del respaldo observado en el confidente hacia
Jas madres divorciadas: R ev ista C ien tfica d e P sic o lo g a S o c ia l y d e la P e r so n a lid a d ( J o u rn a l o f P erso n a lity a n d S o c ia l
P sy c h o lo g y ), 7 2 ,3 3 6 -3 4 5 . Copyright, 1997, por la Asociacin Americana de Psicologa. Reimpreso con autorizacin.

DeGarm o y Forgatch debatieron despus los resultados del anlisis de varianza univariado y los
contrastes subsiguientes. Por ejem plo, observaron que el anlisis de varianza mostr un patrn
segn ei cual se observaba que las parejas proporcionaban menor respaldo (p. 340).

Un anlisis de covarianza en el que existe ms de una variable dependiente se denomina ,


m a n c o v a y un anlisis de covarianza comn es, precisamente,
paralela a la diferencia entre un m a n o v a y un anlisis de varianza comn. E s decir, un m a n c o v a
es un m a n o v a en el que existe una o ms covariables (variables que se mantienen constantes o son
controladas).
mancova . L a diferencia entre un

REPASO DE LAS DISTINTAS TECNICAS ESTADISTICAS


L a tabla 17-8 indica de modo sistem tico las diferentes tcnicas que hemos estudiado en este ca
ptulo, junto con los otros procedimientos paramtricos tratados en el resto del libro. Se puede po
ner a prueba lo aprendido cubriendo la columna de la derecha y adivinando de qu procedimiento
estadstico se trata.

Tabla 17-8,
Principales tcnicas estadsticas.
A so c ia c i n
0
d iferen cia

C a n tid a d de
V ariables
in d ep en d ien tes

C a n tid ad de
V ariables
d ep en d ien tes

S e co n tr o la
a lgu n a
variab le?

A sociacin

No

Correlacin/regresin
bivaribles

A sociacin

Cualquiera

No

R egresin m ltiple
(in cluso la regresin
jerrquica y gradual)

A sociacin

Si

C orrelacin parcial

A so cia ci n

M uchas, no diferenciadas

A so cia ci n

No

M uchas, con patrones causales esp ecificad os

N om bre de
la t c n ic a

C o eficien te de coafiabilidad
A nlisis factorial
A nlisis de senderos
D iseo de ecuacin
A n lisis d e covarianza
en sentido nico; prueba t

D iferencia

No

D iferencia

Cualquiera

No

D iferen cia

Cualquiera

Si

A nlisis de covarianza

D iferen cia

Cualquiera

Cualquiera

No

A nlisis de covarianza
m ultivariable

D iferencia

Cualquiera

Cualquiera

Si

A nlisis de covarianza

A nlisis d e covarianza

CONTROVERSIA:
DEBERA SER CONTROVERTIDA LA ESTADSTICA?____________________
L a m ayora de los libros de estadstica, incluso ste, ensean mtodos estadsticos de un modo
bastante estereotipado, casi como impartiendo una verdad absoluta. Sin embargo, a medida que
avanzamos, tambin hemos intentado m ezclat esa prolija imagen con nuestras exposiciones
acerca de las distintas controversias. Usualm ente, se considera que esto resulta confuso para los
alumnos, (Aunque cuando esos alumnos aprendieron otras reas de la psicologa, la compren
sin de las mismas se construy, eso esperamos, a partir de la presentacin de controversias: la
investigacin de tal persona demostr tal cosa, pero el estudio realizado por esta otra persona
mostr una im perfeccin en la investigacin anterior, mientras que el estudiante de la primera
demostr que era una excepcin, y as sucesivam ente). Por lo tanto, en esta ltim a seccin de
controversias intentaremos crear an ms confusin.
En el cuadro 17-1 describimos el desarrollo histrico de la estadstica actual, a partir de un h
brido de dos visiones diferentes conocidas como los mtodos de Fisher y de Neyman-Pearson. Se
supona que ese matrimonio pondra fin a la lucha con respecto a cul es el mtodo ms adecuado,
pero de hecho, aunque la mayora de los psiclogos se sienten conformes con el hbrido, otros, ta
les como Gigerenzer y sus socios (Gigerenzer & Murray, 1987; Gigerenzer et al. 1989; Sedlm eier
& Gigerenzer, 1989), no estn para nada satisfechos. Tampoco lo estn Jacob Cohn (1990) ni
Robert Rosenthal (p. e j. Rosnow & Rosenthal, 1989b), dos psiclogos muy conocidos por sus con
tribuciones a las tcnicas estadsticas y cuyos trabajos sobre temas tales como potencia, tamao de
efecto, hiptesis nula, meta-anlisis y otros hemos mencionado a lo largo de todo el libro.
Gigerenzer y M urray (1987) sostienen que los puntos de vista de Fisher y de Pearson y
Neyman, los cuales para estos mismos estadsticos de la prim era hora siem pre fueron funda
mentalmente contradictorios, han sido m al interpretados y errneamente empleados al com bi
narlos, E l matrimonio se realiz enteramente por conveniencia, pensando muy poco en los efectos
a largo plazo. Gigerenzer y M urray consideran al hbrido como el resultado de que muchos de los
primeros textos de estadstica hayan sido escritos bajo la influencia del dgmatico y persuasivo
S ir Ronald Fisher (cabe recordar el cuadro 11-1). Pero luego, despus de la Segunda Guerra Mun
dial, se conoci la visin de Pearson-Neyman, y tuvo que ser integrada sin admitir que los textos
originales podan haber estado equivocados. (E l deseo era presentar la psicologa como una cien
cia, con base en un mtodo de toma de decisiones unificado, mecnico y sin defectos).
E l resultado de todo ese proceso, afirman Gigerenzer y M urray, es el abandono de la contro
versia y los mtodos alternativos, al igual que textos sobre estadstica repletos de confusin
conceptual, ambigedad y errores (p. 23). M s an, ellos sostienen que estos mtodos estads
ticos dominantes, que originalmente fueron slo herramientas, actualmente definen el modo en
que los psiclogos consideran la propia percepcin y cognicin humanas (cabe recordar los cua
dros 12-1 y 13-1).
En lneas ms generales, los actuales e intensos debates sobre pruebas de significacin que
tratamos en los captulos 6 a 8 son parte de esta tendencia m ayor de reapertura de controversias
por mucho tiempo olvidadas.
Por ltim o, nos resta decir que la m ayora de los psiclogos y estadsticos se sienten bastan
te cmodos con los mtodos transmitidos por los textos actuales. E l tiempo, y un cuidadoso ra
zonamiento, nos dirn si esa m ayora realmente debera sentirse tan satisfecha; pero nadie lo
har por nosotros sino que tendremos que hacerlo juntos. Por lo tanto, sinceramente deseamos
que', una vez que el alumno domine los mtodos contenidos en este libro, tenga la confianza su
ficiente para ir ms all y no se conforme con continuar aplicando dentro de veinte aos estos

mismos mtodos de forma insensata y mecnica. Aquellos psiclogos que leen o realizan inves
tigaciones, cualesquiera sean sus otros intereses, tambin deben ser buenos ciudadanos dentro'
de la disciplina en general. Deben acompaar, aunque sea un poco, los desarrollos en cuanto a
los mtodos de anlisis de datos, aceptando, e incluso exigiendo, cam bios cuando sean ju stifica
dos. Despus de todo, si nuestras herramientas se tornan anticuadas, qu esperanza queda para
nuestros descubrim ientos?

La asociacin forzada de Fisher yPearson.

Demos una ltima mirada a la historia del


de Pearson, con el n de acariciar las plu- L
mas del pjaro que se retiraba.
Q v L
desarrollo de mtodos estadsticos en el
rea de la psicologa. D e esta manera ser , - : Por ms firm eza que Pearson y su amiposible agregar algunos datos interesantes,.
> go Neyman hayan puesto para intentar eyi-'::.-?y=
.. tar la continuacin de la vieja enemistad
Y a dijim os en el cuadro 1.1-1,. que, S ir Roentre S ir Ronald y su colega de m ayor edad. ;
nald Fish er prcticamente invent l mto
Pearson, pronto, el. enfrentamiento se tom '
do experim ental tal. cmo se utiliza en la
ips punzante qpe nunca. E n realidad, Pearr .
actualidad; que el mtodo surgid de su tra
son y N eym aii estaban , mucho ms d C
baj en la agricultura (principalmente so- .
acuerdo en .muchos aspectos con las ideas ;
bre la fertilidad de suelo, el peso de los
de Fisher que con las de K a rl Pearson, pe- L :
cerdos y el efecto de abono en ls planta-,
ro sus extensiones y elaboraciones de los
clones de papas); que era un hombre con .
mtodos de Fisher, aunque pretendan' ser. .
quien resultaba d ifcil congeniar, y que F is-
cordiales, enfurecan al malhumorado Sir :
her y otro gran estadstico britnico, K arl
Ronald (despus de todo, el alumno no que- :
Pearson, eran enemigos, y. :;;) ':,
(y f,

' rr cam biar su especializcin por historia, .


Bien. Pearson tenia un hijo, Egon, quien , :
recordar correctamente estos nombres es
.
trabajaba en e! Laboratorio Galton, precedi. al menos tan. d ifcil com o;lo fue aprender'
do por su padre, en la Facultad de la Univerestadstica!).
''
.
.

(
sidad,:en Londres. E n 1925, el joven Egon -,
' : Qu se discuta? Para sim p lificar una
form una amistad, perdurable con Jerzy
serie de ideas m uy com plejas, diremos que
Neyman, un joven catedrtico de la Univer
' Fisher haba rechazado lo que se denomina
sidad de Varsovia que acababa de llegar al. ; la teora bayesiana, un enfoque global soLaboratorio Galton. En los aos siguientes,
, br la estadstica que hemos mencionado en
los dos trabajaran muy estrechamente; /
v;' -;/-;
' ^ el capitul 5, el cual sostiene que la inves- ''1
E n 1933, Karl-Pearson se retir..Irni
ligacin cientfica se realiza para adaptar
camente, Fisher recibi el antiguo puesto
opiniones preexistentes en vista de las nue- '
de Pearson como jefe del Departamento de
vas evidencias a medida que se recolectan,
Eugenesia, originalmente fundado por G al
' E n desacuerdo, Fisher sostena que la infe- ;
ton. Como resultado d la enemistad entre
renca inductiva se realiza principalm ente ,'
Fisher y su colega de mayor edad, Pearson, .
desaprobando objetivamente la hiptesis
se cre un nuevo Departamento de Estads- : nula, y no probando probabilidades previas
tica que estara al mando de Egon, el hijo
. a las que se haba arrivado subjetivamente.

de un plan quinquenal p a ra la nacin- y,


Fisher era excepcionalmente dogmtico con.
respecto a sus-'ideas, refirindose a su mto
adems, coment sarcsticamente despus',
do como absolutamente riguroso y per- .
de qu Neyman finalizara su discurso fren
fectamente riguroso; lo llamaba el nico
te a la Royal Statstica! Society (R eal So
caso de inferencia inequvoca ; tema, una
ciedad de Estadstica) en Londres, que
gran mente y escribi muchsimo, hacindo
Neym an1 debera haber elegido., un tma.-;:
se muy influyente en el mundo entero,
sobre el cual pudier hablar con autori
Pearson y Neyman tambin rechazaron
dad. Neyman, por su parte, declar que
la teora bayesiana, pero propusieron el
los mtodos de prueba de Fishr eran en
mtodo de prueba de dos hiptesis opues
un sentido matemticamente specificable,
tas en lugar de una sola hiptesis .nula. C o
peores que intiles, jA h, qu.raconal! ;
mo resultado de esa innovacin, habra dos ,
S i bien el debate actual acerca del rol
tipos de errores: los errores Tipp I seran
de la prueba de significacin en el rea de
aquellos en los que la hiptesis nula s re- .;
la psicologa {vase las; secciones de^Con-y
chaza aun cuando es verdadera (y la pro-:. : troversias de los' captulos 6r8) no es.ian ..
habilidad de ese error la denominarn alfa:
estridente,: s conserva algo de la rsoriaiio nivel de sigm ficcin, reslta fam ilir?)
eia de los viejos tiem pos; Por ejemplo, dos Lo s errores Tipo I I seran aquellos en los '.
de los principales contendientes (Schm idt
que la hiptesis de investigacin s rechaza
& Hunter, 1997) comentan que todas, tes
aun cuando es verdadera (y la probabilidad
objeciones a los argumentos a favor de ,
de ese error era beta. Esto.tam bin relta .
su posicin son lgicamente deficientes.
fam iliar? E l impacto de cada tipo de error, ,
. (p. 3 8) y ,que, 'aunque cada una d estas;
en el objetivo del investigador, indicara
o.bjeciones parec plausible.e inlus con
cul de ellos era preferible miniinizar, yaque
vincente para, muchos investigadores, en ,..
Neyman y Pearson pensaban con ffecnci
realidad son un fracaso lgica; e ntelcr .
en trminos de investigacin aplicada. Fisher
talmente (pp. 61-62). En un artculo puy::
nunca mencion ninguna hiptesis excpto
biicd casi ai mismo tiempo, dos de. lo s .
la nula y, por lo tanto, nunca tuvo en cuenta
. principales contendientes del lado opuesto
ios errores Tipo II.

(Cortina & Dunlap, 1997) describieron los . :


Ahora queda claro lo qu sucedi: la s - .
argumentos
del otro lado cmo construi
tadstica es un hbrido de las ideas de Fisher
dos sobre supuestos defectuosos, ejemplos'
con las de Pearson y Neyman, las. ltimas
agregadas cuando ya no pudieron i^riorars. . engaosos y errores en cuanto. a : cierto s;
: conceptos crticos (p ; 170)..Lo s comentar
E l concepto de probar la hiptesis nula pro
viene d Fisher; los conceptos algo mens . :rio s que hemos escuchado d ambos, lds; F
en ambientes menos forinales, han sido an.
influyentes de error Tipo II, bt, poteheia
menos contenidos: .. - v / :.; .
?
;; ):
y tamao del fcto/de sus enemigs ms
: Como- puede observarse,, a. travs de ,
j ven es.-.
v
las historias relatadas en los cuadros de es-
Fue una asociacin que probablem en
te libro, la estadstica es, pra bien o para
te ninguno de ellos hubiera prbadoV ya
m alj producto del intelecto y dq las pasi-
que, con el tiempo, ambos: lados conside
nes humanas funcionando en forma conraron sus propios mtodos fundamentalmen
' junta (idealmente, por el bien d la ciencia,
te opuestos a los del otro. Fisher comparaba
aunque la ltim a en menor grado). Lo s re
a Neyman y a Pearson con el estereotipo de
sultados no siempre han sido perfectos,
los soviticos de su tiempo, en cuanto a su
pero pueden resultar mucho ms interesan
determinacin de reducir la ciencia a la tec
tes de. lo. que pareceran primera vista. :
nologa 'en el amplio esfuerzo, organizado.

CMO LEER RESULTADOS EN PUBLICACIONES CIENTFICAS


QUE INCLUYEN TCNICAS ESTADSTICAS QUE NO NOS
RESULTAN FAMILIARES
Sobre la base de lo aprendido en este captulo y en todo el libro, el alumno debera estar bien pre
parado para leer y comprender, al menos en forma general, los resultados de la m ayora de las pu
blicaciones cientficas psicolgicas. Sin embargo, de cuando en cuando se encontrar con nuevas
tcnicas (y a veces nombres no fam iliares para viejas tcnicas). L e sucede incluso a investigado
res experimentados. Qu debemos hacer entonces cuando nos encontramos con elementos de los.
que nunca hemos escuchado hablar?
E l prim er paso es no desesperarse. En la m ayora de los casos puede deducirse la idea bsica.
C a si siempre se establecer el nivel p y debera indicarse claram ente el patrn de resultados que
se considera significativo o no. Adems, generalmente habr algn indicio acerca del tamao del
efecto, del grado de asociacin o de a magnitud de la diferencia. S i la tcnica estadstica se refie
re a la asociacin entre algunas variables, probablemente sea ms fuerte a medida que el resultado
se acerque a 1, y ms dbil a medida que el resultado se acerque a 0. E n una situacin de este tipo
no debemos esperar comprender cada palabra, sino intentar captar lo que sea posible con respec
to al significado del resultado.
Analicem os un ejemplo. Biem at y Wortman (1991) realizaron un estudio acerca de la vida
hogarea de mujeres profesionales. Cerca del comienzo de la seccin de resultados, los investiga
dores mencionan que, en algunos de sus anlisis, compararn m ujeres acadmicas con mujeres de
negocios. Por lo tanto, explican, controlaron si las variables a comparar aparentemente cumplan
el supuesto de iguales varianzas poblacionales. Con respecto a una variable, comentaron: L a va
riabilidad en la educacin era mayor en el caso de las m ujeres de negocios (SD = 1,26) que en el
de las mujeres acadmicas (SD ~0,12), C de Cochran (2 ,1 3 6 ) = 0,99, p <0,0001. (p. 848)
Probablemente, el alumno que se encuentre con el inform e anterior nunca haya escuchado
hablar de la C de Cochran . Sin embargo, por el contexto, puede im aginarse que se trata de
una prueba de significacin que compara la variabilidad de dos grupos. Probablemente no pue
da calcu lar lo que significan exactamente las cifras entre parntesis despes de C de Cochran, o
a que se refiere el 0,99, pero s puede comprender e l *p < 0,0001, que indica que la diferencia
de variabilidad entre los dos grupos es significativa. Podra llegar an ms lejos y observar di
rectamente los dos desvos estndar, que dan una idea bastante clara de lo muy diferentes que
son las variabilidades en los dos grupos,
Supongamos que el alumno realmente no pueda captar absolutamente nada de una tcnica es
tadstica utilizada en una publicacin cientfica. En ese caso, puede intentar buscar el procedi
miento en un libro de estadstica. Los libros de estadstica intermedia y avanzada a veces son una
buena opcin, aunque hay que ser conscientes de que intentar comprender un texto de nivel inter
medio, sin ayuda, puede resultar d ifcil. M uchos de esos textos tienen una orientacin fundamen
talmente matemtica, incluso los textos ms accesible utilizarn cada uno sus propios smbolos;
por lo tanto, puede resultar d ifcil comprender sus descripciones de un mtodo en particular sin
haber ledo todo el libro. Una mejor solucin, en este caso, tal vez sea pedir ayuda a un profesor o
alumno graduado en el campo en cuestin. S i el alumno conoce los principios bsicos aprendidos
a travs de este libro, estar preparado para comprender los principios fundamentales de las expli
caciones que reciba.
S i el alumno se encuentra a menudo con tcnicas estadsticas que no comprende, la mejor so
lucin es asistir a otros cursos de estadstica. E l siguiente curso, en la mayora de los programas,
en el rea de la psicologa, es un curso intermedio que se concentra principalmente en el anlisis
de varanza, y puede llegar a abarcar hasta cierto nivel de la regresin mltiple. Estos tipos de cur

sos sern particularmente tiles para ios alumnos que tengan intenciones de realizar un posgrado
en psicologa, en donde la estadstica ser una herramienta crucial en todas las investigaciones
que realicen. Cursos de ese tipo los ayudarn a prepararse para el posgrado. Adem s, un buen de
sempeo en ese tipo de cursos produce una im presin extremadamente bugna en aquellos que
evalan las solicitudes de ingreso a los mejores programas para graduados. (Tambin podemos
decir que, segn nuestra experiencia, lo ms probable es que el alumno disfrute con los otros estu
diantes que conozcan en esos cursos. Lo s alumnos que asisten a cursos intermedios de estadstica
aplicada a la psicologa no son todos fenmenos de las estadsticas, pero casi siem pre son alum
nos m uy motivados y brillantes que seguramente compartirn los objetivos del lector). D e hecho,
a algunas personas, la estadstica le resulta tan fascinante ;que deciden hacer de ella una carrera!
E n lneas ms generales, constantemente se estn inventando nuevos mtodos estadsticos.
Todos los psiclogos encuentran en las publicaciones cientficas que leen nmeros y smbolos
que no le son fam iliares; pero finalmente los resuelven del mismo modo que lo har el lector. Y
tenemos plena confianza en ello debido a que ha llegado ileso y bien preparado a las tlimas pgi
nas de este libro. Ha dominado la introduccin detallada de un tema com plejo; por ello, debera
confiar en que con un poco de tiempo y esmero ser capaz de comprender cualquier otro tema de
estadstica ms avanzado. Por eso queremos felicitar al lector por sus logros.

Resumen
En la regresin mltiple jerrquica, las variables de prediccin se incluyen en la regla de predic
cin en forma planificada y secuencial, permitiendo al investigador determinar la contribucin re
lativa de cada variable siguiente por encim a de aquellas ya incluidas. L a regresin m ltiple por
pasos es un procedimiento de exploracin en el que se examinan las potenciales variables de pre
diccin para encontrar la mejor variable de prediccin; luego se examinan las variables restantes
para encontrar la variable de prediccin que, en combinacin con la prim era, produce la m ejor
prediccin. E l proceso contina hasta que agregar la m ejor variable restante no aporta ninguna
mejora significativa.
L a correlacin parcial describe el grado de correlacin entre dos variables a la vez, que man
tiene constante otra u otras variables.
L o s coeficientes de confiabilidad indican en qu medida las puntuaciones de una prueba son
internamente coherentes (usualmente con el alfa de Cronbach) o coherentes a travs del tiempo
(confiabilidad por prueba y reprueba).
E l anlisis factorial identifica agrupaciones de variables que se correlacionan en el mximo
grado posible entre s, y en el mnimo grado posible con otras variables.
E l anlisis causal examina si las correlaciones entre diversas variables son coherentes con un
patrn sistem tico e hipottico de relaciones causales entre ellas. E l anlisis de senderos describe
esas relaciones con flechas que van desde la causa al efecto, con un coeficiente de senderos para
cada flecha que indica la influencia de la hipottica variable causal en la hipottica variable de
efecto. E l modelo de ecuacin estructural es una versin avanzada del anlisis de senderos, que
incluye variables latentes tericas que no son medidas (cada una de las cuales est formada por
los elementos comunes de diversas variables m edidas). E l modelo tambin ofrece medidas de la
concordancia general de los datos con el patrn causal hipottico.
E l an lisis de covarianza es un an lisis de varianza que controla una o ms variables. E l
an lisis de varianza m ultivariado es un an lisis de varianza con dos o ms variables depen
dientes. E l an lisis de covarianza m ultivariado es un an lisis de covarianza con dos o ms va
riables dependientes.

E n los ltimos aos, los psiclogos han comenzado a reexam inar ios principios bsicos de la esta
dstica que utilizam os creando la posibilidad de controversia acerca de aquello que, con frecuen
cia, haba sido considerado incontrovertible en el pasado.
E n general, es posible captar la idea principal de un procedimiento estadstico no fam iliar te
niendo presente que probablemente se refiere a asociaciones entre variables o diferencias entre
grupos, que el valor p indica la significacin de esa asociacin o diferencia, y que probablemente
el procedimiento incluya algunos nmeros a partir de los cuales podamos tener una idea del grado
de asociacin o diferencia,

Trminos clave
- ANCOVA..

- Controlar.
- Covariable.
- A lfa de Cronbach (a ).
~ Factor.
- A nlisis factorial.
- Carga factorial.
~ ndice de concordancia.
- Regresin mltiple
jerrquica.

- Mantener constante.
-V a riab le latente.
- L isre l.
- MANCOVA.
- MANOVA.

- Estadstica multivariada.
- Correlacin parcial.
- Coeficiente de
correlacin parcial.
- Exclu ir.

-A n lis is de senderos.
- Coeficiente de senderos.
- Confiabilidad.
- Confiabilidad por
divisin en mitades.
- Regresin m ltiple gradual.
- Modelo de ecuacin
estructural.
~ Confiabiidad por
prueba y reprueba.

Ejercicios
vida social de nios en edad preescolar. En el
estudio, cada nio o nia era observado inte
ractuando con su padre en una situacin es
tandarizada. L a s interacciones se clasificaban
de forma tal que producan m edidas sobre
quin in iciab a las actividades de juego ade
ms de la reciprocidad (equilibrio) en el cum
plim iento de la in iciativa de juego del otro.
Lo s investigadores tambin pidieron a los m aes
tros del nio que calificaran la capacidad de
cada nio para integrarse a la vida social con
los otros nios de la ecuela. Descubrieron co
rrelaciones entre la reciprocidad padre-hijo y
la capacidad del nio para integrarse a la vida
SERIE I
so cial. Sin embargo, es preocupaba saber
qu punto la medida de reciprocidad po
1.
Parte de un estudio realizado por Lin hasta
dzey et al, (1997) examinaba de qu modo la dra estar m ezclada con el grado en el que los
reciprocidad en la interaccin entre padre e nios y los padres tomaban la in iciativa indi
hijo predeca la capacidad de integrarse a la vidualmente.

E n los ejercicios 1 al 5 de la serie I, y en los


ejercicios 1 al 4 de la serie II, se espera que el
alumno explique slo el significado general
de los resultados en la forma en que los dife
rentes mtodos fueron descriptos a lo largo
del captulo. Por supuesto que no se espera
que el alumno describa la lgica de los proce
dimientos estadsticos tratados aqu del m is
mo modo en el que lo ha estado haciendo en
los captulos anteriores.
E n la ltim a parte del libro se indican las
respuestas a la serie I de ejercicios.

Por ende, realizamos una serie de anlisis


de regresin jerrquica para analizar si el cum
plimiento recproco de padre e hijo [...] aporta
ba contribuciones nicas a la prediccin de la
capacidad del nio para adaptarse a la vida so
cial despus de tener en cuenta el comporta
miento de cada individuo [...] Los ndices de
iniciativa del padre y del nio fueron ingresa
dos en primer lugar y justificaban el 3% de la
varianza (p = 0,57). El cumplimiento recproco
de padre e hijo fue ingresado en segundo lugar
y justificaba un significativo 18% adicional
(p = 0,01) de la vari.anza de la calificacin rea
lizada por ios maestros en cuanto a la capaci
dad de los nios para integrarse socialmente,
pp. 532-533).
Explique el mtodo y el resultado a una
persona que en general est familiarizada con
la regresin mltiple comn pero que nunca ha
escuchado hablar de la regresin mltiple je
rrquica.
2. Boyd y Gullone (1997) realizaron un es
tudio acerca de la angustia y la depresin con
una muestra de 783 adolescentes que asistan a
la escuela en Melboume y sus alrededores, en
Australia. Para medir la angustia utilizaron la
R C M A S (Revsed Children's Manifest Anxiety
Scale, Versin revisada de la escala de angustia
manifiesta en nios). Al tratar la medida en la
seccin Mtodos, los investigadores realizaron
la siguiente observacin; Las estimaciones de
confiabidad del coeficiente alfa, en cuanto a
la coherencia interna de la r o m a s , iban de 0,42
a 0,87 (p. 192). Explique los resultados a al
guien que est familiarizado con la correlacin
pero que nunca ha escuchado hablar de la con
fiabilidad o de los clculos estadsticos relacio
nados con ella.
3. Fawzi et al. (1997) realizaron un estudio
para evaluar si la manera usual de conceptuar
el p t s d , tal como lo describe la cuarta edicin
del Manual estadstico y de diagnstico de
trastornos mentales [Diagnostic and Statistical Manual o f Mental Disorders] ( d s m - i v ) , se
aplica a refugiados vietnamitas en los Estados
Unidos. Como parte del estudio, se entrevista
ron 74 refugiados (en su lengua nativa) con
respecto a varios sntomas p t s d y a los hechos

traumticos que haban experimentado (p. ej.


torturas). Como se esperaba, la cantidad de sn
tomas p t s d estaba correlacionada con la canti
dad de hechos traumticos. En un anlisis
ms amplio del patrn de sntomas (qu snto
mas se agrupan entre s), realizaron un anli
sis factorial a travs del cual obtuvieron cuatro
factores.
De acuerdo con el d s m - i v , los primeros
tres factores representaban dimensiones de an
siedad, evacin y repeticin de la experiencia
respectivamente {vase tabla [17-9]. Sin em
bargo, en contraposicin con las sub-categoras definidas en el d s m - i v , segn las cuales la
evacin representa una dimensin de sintomatologa, en esta muestra, la evacin pareca es
tar separada en dos factores. El segundo factor
reflejaba la evacin relacionada con el replie
gue general o el entorpecimiento de la sensibi
lidad, con altas cargas factoriales en los tems
incapacidad de sentir emociones y menor
inters en las actividades diarias. El cuarto
factor reflejaba evacin de estmulos relacio
nados con el o los hechos traumticos (p. 104).
Explique los resultados a una persona que
est familiarizada con la correlacin pero no
sabe nada acerca de anlisis factorial.
4.
Aron et al. (1998) realizaron un estudio
acerca de las experiencias del amor no corres
pondido, es decir, amar a alguien que no nos
ama. Una de las predicciones se concentr en
la intensidad.de la experiencia (cunto piensa
uno en ello, cunto altera nuestras vidas). Los
investigadores elaboraron la hiptesis de que la
intensidad podra predecirse a travs de la cali
dad de deseable de la relacin (en qu medida
la persona enamorada perciba que sera mara
villoso tener una relacin con la persona amada),
la probabilidad (en qu medida el enamorado
senta que el ser amado lo haba llevado a creer
que podra desarrollarse una relacin) y el
deseo del estado (en qu medida el enamora
do senta que era deseable estar enamorado,
aun cuando ese amor no fuera correspondi
do). Adems, los investigadores plantearon la
hiptesis de que el patrn de relacin de las
tres variables con la intensidad variara con
forme al estilo usual de vinculacin afectiva

del enamorado (seguro, evasivo o ansioso-am- amenazas, aceptacin de la situacin y arbitra


bivalente, segn lo tratado en el captulo 11). je (p. 41),
Aron et al. realizaron un anlisis de cada grupo
Explique los resultados a alguien que com
a travs del modelo de ecuacin estructural. La prende el anlisis factorial de varianza pero no
figura 17-4 indica los resultados.
el anlisis multivariado de varianza,
a)
Explique el patrn de resultados, b) Uti . Cul seria la tcnica estadstica ms
lizando este diagrama como ejemplo, explique apropiada para cada uno de los siguientes estu
los principios generales de la interpretacin de dios ficticios?
un diagrama de senderos (incluso las limitacio
a) Un estudio en el que el investigador sos
nes) a una persona que comprende la regresin tiene una compleja teora sobre el patrn de
mltiple en general pero no conoce los diagra causa y efecto entre diversas variables.
mas de senderos o los modelos de ecuacin es
b) Un estudio del grado de asociacin en
tructural.
tre dos variables.
5.
Gire (1997) analiz los mtodos preferi c) Un estudio para determinar si una medi
dos para la resolucin de conflictos, compa da es internamente coherente y consistente a lo
rando personas de culturas individualistas con largo del tiempo en cuanto a dar el mismo re
otras de culturas colectivistas. Los participan sultado.
tes eran 90 nigerianos (Nigeria fue considerada
d) Un diseo factorial de 3 x 2 con tres va
un ejemplo de sociedad relativamente colecti riables dependientes.
vista) y 95 canadienses (Canad fue consi
e) Un estudio en el que se han medido siete
derada un ejemplo de sociedad relativamente
variables que se consideran variables de pre
individualista). Todos los participantes contes
diccin de determinada variable dependiente y
taron preguntas acerca de sus preferencias en
el investigador desea determinar qu variables
cuanto a cada uno de cinco mtodos de reso
contribuyen significativamente a la prediccin
lucin de conflictos. La mitad de los partici
(pero no tiene ninguna teora acerca de cules
pantes de cada pas contest las preguntas
tienen mayores probabilidades de ser las ms
referidas a un conflicto interpersonal (un con
significativas).
flicto entre dos vecinos) y, la otra mitad, tas re
f) Un estudio en el que el investigador
lacionadas con un conflicto ntergrupal (entre
mide
16 variables en una gran cantidad de
dos grupos de vecinos). El resultado del proce
participantes
y desea averiguar si existen
dimiento fue un diseo factorial 2 (culturas) x 2
(conflicto interpersonal vs conflicto intergru- agrupaciones de variables implcitas ms
pal), con cinco medidas de preferencias para la simple,
g) Un estudio en el que se comparan un
resolucin de conflictos.
Los datos fueron analizados utilizando grupo experimental y un grupo de control se
gn una sola variable dependiente,
m a n o v a , El m a n o v a revel en dos sentidos un
h) Un estudio que compara cinco grupos
efecto esencial significativo de a cultura F(5,
173) = 6,37, p < 0,001. El estudio del anlisis de individuos conforme a una sola variable de
unvariado y de las medias sugiere que los ni pendiente.
i) Un estudio en el que el investigador es
gerianos preferan la negociacin mucho ms
que los canadienses, mientras que ocurra lo t analizando el efecto de diversas variables
contrario con el arbitraje, conforme a lo que se de prediccin en una sola variable dependien
haba predicho. Tambin hubo un resultado te, tiene una teora especfica acerca de la im
significativo de la cultura por tipo de interac portancia relativa de dichas variables, y desea
cin conflictiva, F(5 ,173) ~ 3,84, p < 0,002. El verificar si cada variable de prediccin agre
anlisis unvariado y las medias, que se indican gada sucesivamente aporta algn elemento a
en la tabla [17-10], revelan que existieron dife la prediccin lograda a travs de las variables
rencias significativas en tres procedimientos: anteriores.

Tabla 17-9.
Cargas factoriales del anlisis de los componentes principales de los sntomas de rao,
segn el d s m - i v , en 74 refugiados vietnamitas.
Carga
Dimensin sintomtica

-i
Factorial

Ansiedad
Pesadillas recurrentes

0,79

D ificultad para concentrarse

0,78

Irritabilidad/ataques de ira
Incapacidad a recordar partes de lo s h echos m s traumticos

0,77
0 ,7 4

Problem as de in som io

0,73

Evitar actividades que recuerdan e l h ech o traumtico

OJO

N erviosism o, facilidad para sobresaltarse

0,67

% de varianza explicada

44%

Evasin/abstinencia
Incapacidad a sentir em ociones

0,79

M enor inters en las actividades diarias

0 ,7 0

Sentim iento de indiferencia o abstinencia

0,65

N erviosism o, facilidad para sobresaltarse


Sensacin d e qu e uno no tiene futuro

% de varianza explicada

0,51
0,51

24%

R epeticin de la experiencia
Pensam ientos o recuerdos recurrentes de lo s hechos ms terribles

0,83

Sensacin de que e l hecho est suced ien do nuevam ente

0,83

R eaccin em ocional o fsica repentina cuando se e recuerdan


lo s hechos ms traumticos

% d e varianza explicada

Evitar estm ulos relacionados c o n e l (lo s) hech os traum ticos(s)


Evitar pensam ientos o sentim ientos relacionados co n lo s hechos traumticos

% de varianza justificada

0,57

22%

0,71

11%

Fuente: Fawzi, M . C. S., et al. (1997), tab. 1. Validez del estrs postraumtico entre refugiados vietnamitas. R ev ista
C ien tfica d e Estrs T raum tico [J o u rn a l o fT ra u m a tic Stress}, 10,105. Copyright, 1997, por la Sociedad Internacional
de Estudios del Estrs Traumtico. Reimpreso con autorizacin.

Figura 17-4.
[Figura 2 de Aron et al.
(en impresin),
M otivaciones para el
amor no correspondido
B o le tn d e P s ic o lo g a
s o c ia l y d e la p e r s o n a lid a d . [P e r s o n a lity a n d
S o c ia l P s y c h o lo g y B u l
letin. ]

ISlilllI

:lS:llIfilI

SERIE H

te r e s a d o s e n sa b e r s i la r e la c i n e n tr e la e s
c a la

pas

y d iv e r sa s s e n s ib ilid a d e s e s p e c f ic a s

1.
Aron & Aron (1997) realizaron un estu
p e r m a n e c e r a a u n d e s p u s d e c o n t r o la r la
dio concentrndose en las personas altamente
e m o c i o n a l i d a d e n g e n e r a l^ y a d e m s s i la r e
sensibles a la estimulacin. Los individuos l a c i n d e l a e m o c i o n a l i d a d c o n r e a c c i o n e s
mencionados tienden a descubrir sutilezas y e m o c i o n a l e s e s p e c f i c a s p e r m a n e c e r a d e s
notar cosas que otros pasan por alto, por lo p u s d e c o n t r o l a r l a s e n s i b i l i d a d .
cual puede encontrrselos en mayor medida
Como lo indica la tabla [17-11], la ma
entre los artistas y otros tipos de personas yora de las correlaciones entre las variables
talentosas. Por otro lado, esa misma sensibi relacionadas con la sensibilidad y la escala
lidad hace que estos individuos sufran, con p a s continuaron siendo significativas o casims facilidad, de exceso de ansiedad. Lo que significativas despus de excluir la medida
para las personas en general es un nivel nor de emocionalidad [,..] Adems [...] diver
mal de estimulacin, con frecuendia resulta sas variables pertinentes (p. ej. sentimien
estresante para los individuos altamente sen tos emergentes) presentaban asociaciones
sibles. Aparentemente, como resultado de lo nicas o exclusivas con la emocionalildad)
anterior, algunas p a s presentan niveles de (p. 354).
emocionalidad (angustia y depresin) ms
Explique el mtodo y el resultado desaltos que lo usual. Como parte del estudio en criptos anteriormente a una persona que est
cuestin, los investigadores deseaban inves familiarizada con la correlacin y, en forma
tigar si la sensibilidad era independiente de general, con la regresin mltiple comn,
la emocionalidad. Por lo tanto, hicieron que pero que nunca ha odo hablar de la correla
un gran grupo de participantes completara cin parcial.
cuestionarios acerca de sensibilidad y emo
2.
Shapiro et al. (1997) realizaron un estu
cionalidad, junto con una serie de preguntas dio para desarrollar una medida de las actitudes
sobre diversas sensibilidades especficas y de los nios hacia las armas y la violencia. La
reacciones emocionales tambin especficas. primera medida que desarrollaron tema 61
Los investigadores estaban especialmente in tems, e informaron que ios anlisis que realiTabla 17-10.

Preferencias en cuanto a mtodo como funcin de la cultura y el tipo de conflicto


Nigerianos
M to d o
A m enazas*
A ceptacin dla situacin*
N eg o cia ci n
M ediacin
Arbitraje*

IP
2 ,0 9
2 ,7 2
6,07
4 ,7 0
3,05

Canadienses

IG

IP

IG

1,50
3 ,1 6
6,11
4,77
4 ,9 0

1,35
3,43
5 ,5 6
4,87
5,20

1,61
2,71
5 ,6 4
5,13
5,42

N ota: Un asterisco {*) ndica que las medias de ta cultura por tipo de interaccin conflictiva en cuanto a determinado
mtodo fueron significativas al nivel p < 0,05. A mayor nmero, mayor la preferencia por el mtodo. p (Interpersonal
Conflict, Conflicto Interpersonal); IG ( Intergrupal Conflict, Conflicto intergrupal).
Fuente: Gire, J. T. (1997), tab. i. El efecto variante de! individualismo-colectivismo con respecto a los mtodos prefe
ridos para la resolucin de conflictos. Revista Cientfica Canadiense de la Ciencia del Comportamiento [Canadian
Journal ofBehavioural ScienceJ, 2 9 ,3 8 -4 3 . Copyright, 1997, por la Asociacin Canadiense de Psicologa. Reimpreso
con autorizacin.

zaron "indican un nivel altamente satisfacto


rio de coherencia intema del cuestionario...
(el a de Cronbach = 0,94) (p. 314). Con el
fin de crear una medida ms breve y prctica,
redujeron la escala a 23 tems, y luego expli
caron: "Realizamos diversos anlisis para de
terminar si la disminucin de la longitud se

obtena a costa de perder coherencia inter


na... el alfa de Cronbach de la medida reduci
da fue de 0,88 (vs 94) (p. 314). Explique los
resultados descriptos a alguien familiarizado
con la correlacin pero no con la confiabilidad o el alfa de Cronbach.

Tabla 17-11.
Correlaciones y correlaciones parciales de la sensibilidad y la emocionalidad con variables relacio
nadas con la sensibilidad. Estudios 2-4.
Correlaciones parciales

Escala pas
V ariab le

Emocionalidad

Escala pas Emocionalidad (emocionalidad) (escala pas)

E studio 2
L lora co n facilidad
Sensibilidad
a la luz del da
Sensibilidad al alcohol
Prefiere la m sica
country en v iv o
Las pelculas lo afectan
al da siguiente
Intensidad en el amor
Sentim entos em ergentes a
Recuerda los sueos*3
Su e os intensos*3
T iem po en soledad*3
Estudio 3
Llora con facilidad
Prefiere la m sica
country en vivo
Las p elculas lo afectan
a! da siguiente
Intensidad en e l amor
E studio 4
Prefiere la m sica
country en vivo
Su e os intensos

0,24**

0 ,36**

0 ,38**

0,21**

0,32**
0,39**

0 ,26**
0 ,1 8 **

0 ,25**
0,36**

0 ,1 1 *
-0 ,0 3

0,22**

0,08

0,22**

- 0 ,0 4

0 ,31**
0 ,26**
0,2 8 * *
0 ,19*
0,19*
0 ,22*

0 ,23**
0 ,3 0 **
0 ,3 0 * *
0,03
0,08
0,07

0 ,23**
0,14*
0,18**
0 ,2 0 f
0 ,l8 f
0 ,1 7 f

0 ,1 0 f
0 ,1 9 * *
0,17**
-v 0 8
- 0 ,0 3
-0 ,0 5

0,4 7 * *

0,4 6 **

0,27**

0 ,2 6 * *

0,15*

0 ,1 0 f

0 ,llf

0,3 0 * *
0,2 3 * *

0 ,1 7 * *
0 ,1 6 * *

0,1 l t
0,17**

0 ,0 8
0,03

0 ,09*
0,1 9 * *

0 ,0 7
0 ,0 5

0 ,0 7
0 ,1 8 * *

0,03
-0 ,0 3

- 0 ,0 0

N ota: e l estudio 2 incluy 313 alumnos de la Universidad de California, Santa Cruz; el estudio 3 incluy datos de 285
alumnos universitarios norteamericanos no graduados: el estudio 4 incluy datos tomados de 301 personas a travs de
una encuesta telefnica pblica de discado aleatorio, pas = Persona altamente sensible.
a El tem as sealado (Le surgen sentimientos muy intensos sin razn aparente?} fue contestado slo por 211 partici
pantes.
b Los tems as sealados fueron completados slo por 1Q7 participantes.
*p < 0,05; * * p < 0 ,0 1 ; t p < 0 ,1 0 .
Fuente: Aron, E. N ., & Aron, A. (1997), tab. 3. "Sensibilidad del proceso sensorial y su relacin con la introversin y la
emocionalidad. Revista Cientfica de Psicologa Social y de la Personalidad [Journal of Personality and Social Psychology), Ti, 34 5 -3 6 8 . Copyright, 1997, por la A sociacin Americana de Psicologa. Reimpreso con autorizacin.

tamente, pero la agresin a travs de relacio


3.
Crick et al. (1997) realizaron un estudio
para desarrollar una medida, por parte de nes daa a otros a travs del perjuicio a las re
maestros, de la agresin a travs de relacio laciones de stos con sus pares (p. ej. uti
nes" en nios de edad preescolar. Comnmen lizando la exclusin social o esparciendo ru
te, la agresin manifiesta daa a otros direc mores como una forma de represalia) (p. 579).

Tabla 17-12
Cargas factoriales de la medida de comportamiento social evaluado por maestros ( p s b s - t ) .
tem
L e inform a a un com paero
que no jugar con l
ni ser su am igo a m enos que haga
lo
que l le pide
Ordena a otros que no jueguen
con algn com paero o que no sean sus am igos
Cuando se enoja con un com paero,
e l nio hace que ese com paero no pueda
estar con el grupo de am igos de ju eg o s
A m enaza a un com paero o compaera
dicind ole que no ser invitado/a
a las fiestas de cum pleaos
a m enos que haga lo que l quiere
Intenta que otros sientan antipata
por un com paero
A m enza verbalm ente con dejar
a un com paero fuera del grupo
de am igos de ju eg o s si e se
com paero no hace lo que e l nio pide
Patea o g o lp ea a otros
A m enaza verbalm ente con pegar
o
golpear a otros nios
Arruina las co sa s d e su s com paeros
cuando est enojado o enojada
S u ele empujar a otros nios
D aa a otros nios pellizcndolos
A m enaza verbalm ente con causar dao fsic o
a un com paero para obtener lo que desea
Sabe compartir y turnarse
Es servicial con sus com paeros
Es amable con sus com paeros
D ice o hace cosas lindas a otros nios
N o se divierte m ucho
Parece triste
Sonre poco

Agresin
a travs de
relaciones

Agresin Comportamiento Alteracin


manifiesta
prosocial
depresiva

0,84
0,83
0,81

0,88

0,89

0,85

0,81
0,75
0,82
0,72
0,83
0,81
0,76
0,83
0,62
0,75

0,90
0,87
0,82

N ota: Todas las cargas cruzadas eran menores a 0,40. psbs- t (Preschoal Behavoir Scale -Teacherform, Escala de com
portamiento social preescolar, formulario para e l maestro).
Fuente: Crick, N. R., Casas, J. R , & Mosher, M. (1997), tab. 1. Agresin manifiesta a travs de relaciones en e l preescolar". Psicologapara el Desarrollo, Developmental Psychology, 33,579-588. Copyright, 1997, por la A sociacin Am e
ricana de Psicologa. Reimpreso con autorizacin.

Figura 17-5.
Diseo de proceso de apoyo con caractersticas de la madre, del confidente y de la relacin, controlando el
hecho de la formacin de una nueva pareja con un hombre y el cambio en la angustia materna. 03 ~ 3oopor
tunidad; Conf. Confidente. x2(67, N = 138) = 84,82, p = 0,07; ndice de concordancia comparativo =
0,963: *p < 0,05. [Fuente: DeGarmo, D. S., & Forgatch, M. S. (1997), fig. 1. "Determinantes del respaldo
observado en el confidente hacia las madres divorciadas". R evista Cientfica de P sicologa Social y de la
P erso n a lidad [Journal o f Personality an d Social P sych ology }, 72, 336-345. Copyright, 1997, por la Aso
ciacin Americana de Psicologa, Reimpreso con autorizacin]

Como parte del estudio, en primer lugar for


mularon una escala con 23 tems para la
valoracin por parte de los maestros del com
portamiento social de nios en edad prees
colar. Los investigadores describieron de la
siguiente manera el anlisis principal de la
medida mencionada:
En primer lugar, se realiz un anlisis
factorial de componentes principales
[...] para evaluar si [...] la agresin a tra-

vs de relaciones surgira como un factor


separado independiente de la agresin
manifiesta. El anlisis produjo los cuatro
factores predichos: agresin a travs de
relaciones, agresin manifiesta, compor
tamiento prosocial y alteracin depresi
va (p. 582).
La tabla 17-12 indica las cargas factoriales.
Explique los resultados a una persona que es
t familiarizada con la correlacin pero no
conoce el anlisis factorial.

4. DeGarmo y Forgatch (1997) realizaron


un estudio acerca del apoyo social recibido por
madres divorciadas de parte de sus confidentes
ms cercanos. Como parte del estudio, midie
ron una cantidad de variables y despus anali
zaron las relaciones predichas entre las
variables, utilizando el modelo de ecuacin es
tructural. La figura 17-5 representa grfica
mente los resultados.
a) Explique el patrn de resultados, b) Utili
zando como ejemplo el diagrama presentado,
explique los principios generales de la interpre
tacin de un diagrama de senderos (incluso las
limitaciones) a una persona que comprende la
regresin mltiple en lneas generales pero no
conoce los diagramas de senderos o el modelo
de ecuacin estructural.
5. En la biblioteca, busque en una publi
cacin reciente de alguna revista cientfica es
pecializada en un rea de la psicologa, algn
artculo que le interese especialmente y en e!

que se aplique uno de los procedimientos esta


dsticos descriptos en este captulo. Redacte un
breve resumen del estudio que encontr refi
rindose especficamente arios clculos esta
dsticos. Con su respuesta incluya una foto
copia de la publicacin, marcando claramente
las partes en las que se informan los procedi
mientos estadsticos por usted descriptos.
6.
En la biblioteca, busque en una publica
cin reciente de alguna revista cientfica especia
lizada en un rea de la psicologa, algn ar
tculo que le interese especialmente y en el que
se aplique un procedimiento estadstico que no
haya sido tratado en este libro. Redacte un breve
resumen del estudio que encontr refirindose
especficamente a los clculos estadsticos. Con
su respuesta incluya una fotocopia de la publica
cin, marcando claramente las partes en las que
se informan los procedimientos estadsticos por
usted descriptos.

Comprensin de los procedimientos estadsticos avanzados que aparecen en publicaciones cientficas

593

SjiliiiMMIIIl

Repaso de la lgica
y de la term inologa
relacionadas con
la investigacin psicolgica

os mtodos estadsticos son herramientas utilizadas en el proceso de investiga


cin. Los procedimientos estadsticos tratados en este libro resultarn ms fci
les de comprender si se tiene en cuenta el contexto ms amplio en-el cual se
insertan.
En la mayora de los casos, el propsito de un estudio de investigacin psicolgica
consiste en evaluar la validez de una teora o la efectividad de una aplicacin prctica1. El in
vestigador puede adoptar muchos mtodos. Los procedimientos de investigacin ms slidos
llevan a conclusiones inequvocas referidas a una amplia gama de situaciones y personas. Los
diseos de investigacin deficientes, aun cuando sus resultados sean coherentes con las predic
ciones del investigador, dejan abiertas muchas interpretaciones alternativas con respecto a los
motivos por los cuales se lleg a ese resultado, o bien se aplican slo a un reducido grupo de
personas y situaciones.
A veces, las circunstancias limitan el tipo de procedimiento de investigacin aplicable y, an
as, vale aparentemente la pena continuar con la investigacin, incluso de un modo menos riguro
so. De hecho, especialmente en el caso de las investigaciones aplicadas, muchos de los trabajos
ms importantes han sido realizados por psiclogos que utilizan (por necesidad) mtodos menos
que perfectos, pero muy creativos.
Sin embargo, la mayora de los psiclogos analizan la lgica de la investigacin en funcin de
un tipo de mtodo ideal. Por lo tanto, un estudio real se evala segn las diferentes formas en las
que se aproxima o deja de aproximarse a ese ideal. En este apndice trataremos primero ese ideal

1Algunas veces se realizan investigaciones con otros fines, tales como explorar relaciones entre varias medidas, deter
minar la incidencia de alguna caracterstica de la poblacin, o desarrollar una medida o tcnica para utilizar en otra
investigacin. Sin embargo, la lgica bsica de la forma usual de investigacin (tema central de este apndice) sirve de
apuntalamiento del modo en que ios psiclogos abordan la mayora de las investigaciones sistemticas.

(el verdadero experimento), la terminologa clave relacionada con l y, por ltimo, nos dedicaremos a cuatro reas clave en las que los estudios se aproximan o no a ese ideal: equivalencia de
participantes entre grupos experimentales, equivalencia de circunstancias entre grupos experi
mentales, legitimidad de la generalizacin y suficiencia de la medicin.

EL MTODO DE INVESTIGACIN TRADICIONALMENTE IDEAL

El experimento verdadero
El procedimiento de investigacin que usualmente conduce al menor nivel de ambigedad es el
experimento verdadero. Es el estndar con el que se comparan todos los otros mtodos. Par
tiendo de la hiptesis cambiar e nivel de X provoca un cambio en el valor de Y \ el experimen
to real vara sistemticamente el nivel de X t manteniendo igual todos los dems aspectos, y
observando el efecto en 7. Por ejemplo, supongamos que un investigador est interesado en ave
riguar si el hecho de que haya luces centelleantes en el aula afecta las calificaciones de las perso
nas en una prueba de matemtica, en donde X representa la existencia de luces centelleantes en
el aula e Y las calificaciones en la prueba de matemtica. En un experimento real, se tomara la
prueba a cada alumno de un determinado grupo en un aula con luces centelleantes. A otro grupo
de alumnos, inicialmente idntico, se le tomara la prueba bajo condiciones completamente
idnticas, pero sin la presencia de luces centelleantes en el aula. As, ia nica diferencia entre los
dos grupos sera el nivel de X, es decir, la presencia o ausencia de luces centelleantes en el aula.
Si los alumnos del aula con luces centelleantes obtienen calificaciones menores en la prueba de
matemtica (30- la causa tiene que ser la iluminacin. (Si obtienen mejores calificaciones, tam
bin sera a causa de la iluminacin).

Terminologa bsica del experimento


Gran parte de la terminologa de investigacin proviene del mtodo que describimos anterior
mente. Un grupo al que se manipula el nivel de X se lo denomina usualmente grupo experimen
tal.El grupo de comparacin en el que X se mantiene en niveles normales se lo denomina grupo
control.Los individuos analizados en la investigacin se llaman participantes2.La variable que
se modifica sistemticamente (X, por ejemplo, si las luces centellean o no) se denomina variable
independiente. El procedimiento de modificacin sistemtica de 1a variable independiente a ve
ces recibe el nombre de manipulacin experimental o manipulacin de lavariable indepen
diente.La variable que se supone que cambia como resultado del estudio (7, si X es la causa de 7,
por ejemplo la calificacin en la prueba de matemtica) se la llama variabledependiente.Los par
ticipantes a seleccionar, es decir, la poblacin,constituyen el grupo que incluye a todas las personas
que pertenecen al tipo bajo anlisis. Aquellos miembros seleccionados entre la poblacin confor
man la muestra a analizar.

Con frecuencia, los psiclogos utilizan el trmino sujeto. Sin embargo, nosotros utilizamos la palabra partici
pante, aqu y a lo largo de todo el libro.
2

Como ejemplo, imaginemos que un investigador tiene dos latas idnticas de gaseosa. La hi
ptesis que se plantea para este caso es: Al calentar una lata de gaseosa, sta explotar.
(No se debe probar el experimento en casa!). En otras palabras, el aumento de calor causa
r una explosin. El investigador podra poner un fsforo bajo una lata (la lata experimental) y
no ponerlo bajo la otra (la lata control). Si la lata experimental explota y la lata de control no, se
confirma la hiptesis. Cada lata es un participante; el calentamiento es la variable independien
te; la explosin de la lata es la variable dependiente, y las dos latas son las muestras, respectiva
mente, de las poblaciones de todas las latas de gaseosas calentadas y no calentadas (vase
figura A -1).

Cuatro caractersticas del diseo de investigacin ideal


Un diseo de investigacin ideal presenta cuatro caractersticas clave:
1. Los participantes de ios grupos experimental y de control son idnticos.
2. Los grupos experimentales y de control son expuestos a situaciones idnticas (excepto
por la manipulcin de la variable independiente).
3. La muestra analizada representa perfectamente la poblacin objeto del estudio.
4. La medicin de la variable dependiente es completamente precisa y adecuada para lo que
se supone que est midiendo.
El resto del presente apndice analiza las diversas formas en las que la investigacin real in
tenta aproximarse a cada una de las condiciones ideales mencionadas.

EQUIVALENCIA DE PARTICIPANTES EN
LOS GRUPOS CONTROL Y EXPERIMENTAL
Comnmente, lo primero que se tiene en cuenta al evaluar si los resultados de un estudio llevan a
conclusiones inequvocas es la equivalencia de participantes en los grupos control y experimen
tal. Por ejemplo, supongamos que no estuviramos seguros de que la capacidad en matemtica de
los miembros del grupo en el aula con las luces centelleantes fuera inicialmente la misma que la
de aquellos en el aula sin luces centelleantes. Por lo tanto, cualquier diferencia en las calificacio-

F ig u ra A -1 .
U n ex p erim en to ideal: se calien ta una de
d o s latas d e g a se o sa id n tica s, y e l in v esti
gad or ob serva si e x p lo ta m ientras que la
otra no lo hace.

nes matemticas entre los dos grupos, al finalizar el estudio, tendra un significado ambiguo. La
diferencia podra ser el resultado de a) la manipulacin de la variable independiente (tener o no
luces centelleante), o bien de b) las diferencias iniciales en cuanto a la capacidad. Para evitar tales
resultados ambiguos, ios investigadores buscan una equivalencia estricta entre los grupos control
y experimental Se emplean cinco estrategias principales; asignacin aleatoria a los grupos, dise
o de grupo control equivalente, diseo de medidas repetidas, diseo de investigacin correlacio
na!, e investigacin de sujeto nico.

Asignacin aleatoria a los grupos


El procedimiento cientfico que produce la aproximacin real ms cercana a dos grupos idnticos
se denomina asignacin aleatoria a los grupos. Por ejemplo, si haba 100 personas disponibles
para participar en un experimento, cada persona podra incluirse tanto en el grupo experimental
como en el control lanzando una moneda. Aunque los dos grupos de 50 personas creados del mo
do descripto no son idnticos, al menos no habr diferencia sistemtica entre ellos.
Es importante recalcar que aleatoria significa utilizar un procedimiento de seleccin estric
tamente de azar, y no simplemente elegir personas sin ningn plan u orden establecido para in
cluirlas en los dos grupos, ya que todo procedimiento sin planificacin ni orden alguno puede
producir diferencias sistemticas no intencionales. Por ejemplo, si el investigador hubiera elegido
un grupo entre los alumnos que asisten a una clase matutina y el otro.entre los que asisten a una
clase vespertina, los dos grupos podran diferir entre s, ya que los tipos de personas que asisten a cla
ses en esos distintos horarios podran ser diferentes. O bien, supongamos que un grupo est for
mado por voluntarios que se ofrecen para realizar un programa de mejora de la autoestima, y el
grupo de control est formado simplemente por quienquiera que est dispuesto a realizar una.
prueba de autoestima. Los tipos de personas que forman el grupo experimental y el de control po
dran ser bastante diferentes.
La asignacin aleatoria excluye las diferencias sistemticas inicales entre los grupos. Cual
quier diferencia efectiva que exista despus de la asignacin aleatoria ser causa enteramente de
los procesos aleatorios. En consecuencia, si despus del experimento se revelan diferenciasen la
variable dependiente, dichas diferencias slo pueden ser el resultado de la manipulacin de la va
riable independiente o bien de los procesos aleatorios. Los verdaderos procesos aleatorios cum
plen las leyes de la probabilidad, por eso los procedimientos de prueba de hiptesis tratados a
partir del captulo de este libro pueden verificar la probabilidad de que la diferencia encontrada
en un estudio pudiera haber sido el resultado de los procesos aleatorios. S el anlisis estadstico
indica que esa posibilidad es improbable, la nica explicacin razonable restante es que la dife
rencia haya sido el resultado de la manipulacin de la variable independiente. Lo que acabamos
de describir es la lgica bsica que est implcita en el anlisis de los resultados experimentales,
la cual explica por qu la asignacin aleatoria y los mtodos estadsticos son tan importantes en la
investigacin psicolgica.

Diseos de grupo de control equivalente


A veces, la asignacin aleatoria a los grupos no es prctica. Por ejemplo, la tica exigira que to
dos los alumnos de un distrito escolar, que necesiten determinado programa de lectura, lo reciban;
por lo tanto, no puede decidirse al azar que algunos pierdan esa oportunidad. Cmo podemos de
mostrar entonces que el programa es la causa de mejoras en el alumno? Un mtodo de investiga
cin alternativo ampliamente utilizado es el diseo de investigacin con grupo de control

equivalente. Por ejemplo, un investigador podra comparar un grupo experimental de alumnos


que han sido seleccionados para el programa en un distrito escolar, con un grupo de control for
mado por alumnos de otro distrito, que tambin necesitan el programa, pero para quienes el mis
mo no se encuentra disponible. Cada miembro de ese grupo de control podra s$r equiparado a un
miembro del grupo experimental en cuanto a edad, clase social, sexo, problemas de lectura, y as
sucesivamente.
Los diseos de grupo de control equivalente resultan ser mucho mejores que carecer de grupo
de control (de hecho, si se prueban ambos grupos antes y despus, el diseo de grupo de control
equivalente puede dar resultados relativamente inequvocos). La situacin descripta, denominada
diseocon grupo de controlequivalentey pruebaspreviay posterior,es un ejemplo de diseo
cuasiexperimentai.Un diseo cuasiexperimental es aquel mtodo que se aproxima razonablemen
te a un experimento verdadero, pero que no utiliza la asignacin aleatoria.
Sin embargo, no importa cun adecuada sea la equiparacin entre un par de grupos, ya que in
cluso utilizando pruebas previas y posteriores, un investigador nunca puede estar seguro de que
no existe diferencia inicial sistemtica entre los grupos. En efecto, en la mayora de los casos, si no
se ha utilizado asignacin aleatoria, se sabe que existeuna diferencia inicial sistemtica, cual
quiera sea el elemento que ubic a las personas en uno u otro grupo. (En el ejemplo relacionado
con el programa de lectura, la diferencia sistemtica podra ser que un grupo de alumnos viva en
un distrito escolar que no es progresista o que no cuente con los fondos suficientes para ofrecer el
programa de lectura).

Diseos de medidas repetidas


Otro mtodo de investigacin es crear dos grupos idnticos probando a las mismas personas dos
veces. Este procedimiento se conoce como diseode investigacinde medidas repetidas(tam
bin se lo denomina diseode investigacinintrasujeto).Los alumnos del ejemplo mencionado
podran ser puestos a prueba antes y despus del programa de lectura.
El diseo de medidas repetidas ms simple es el diseode grupo nicocon prueba previa y
posterior,en el cual, como su nombre lo ndica, se prueba dos veces un slo grupo de individuos,
una vez antes y otra vez despus de algn tratamiento experimental. No obstante, este tipo de di
seo de investigacin resulta muy dbil en cuanto a que, si se descubre un cambio, hay muchas
explicaciones alternativas posibles para el mismo. Simplemente el hecho de ser probado por pri
mera vez puede cambiar a un participante, de modo tal que cuando vuelve a ser puesto a prueba,
esa persona no es idntica sino diferente (es diferente a causa de la prueba inicial, no por trata
miento experimental). Incluso el tiempo mismo produce cambios. En lneas ms generales, en el
tipo de estudios mencionados cualquier cambio podra ser el resultado del programa de lectura o
de cualquier otra cosa que hubiera sucedido a los participantes durante ese perodo (adems del
tratamiento experimental). O bien podra haber tendencias preexistentes hacia la mejora, o bien el
cambio podra ser el resultado de un proceso general de maduracin y experiencia, o bien podra
ser que la persona hubiera comenzado en un nivel muy bajo de modo que mejorara naturalmente
sin el tratamiento, y as sucesivamente.
Debido a que se trata de un diseo de investigacin tan dbil, el diseo de grupo nico con
prueba previa y posterior se considera diseo preexperimental. Se trata de un tipo de investi
gacin que en general tiene suma importancia como primer paso en la exploracin de un campo
de investigacin, pero cualquier conclusin derivada de un estudio de este tipo sera muy tentati
va, para lo cual debera ser seguida por un diseo de investigacin ms slido (como por ejemplo,
un diseo cuasiexperimentai o un experimento real).

Sin embargo, dentro del entorno del laboratorio, se utiliza con frecuencia un diseo de medi
das repetidas, de forma tai que se lo transforma en un experimento reai. Supongamos que un
investigador est interesado en el efecto que causa la iluminacin en el rendimiento de una tarea
complicada. El investigador podra probar el rendimiento de las distintas personas bajo luces bri
llantes (condicin experimental), y luego probar nuevamente el rendimiento de esas personas ba
jo iluminacin normal (condicin de control). Sin embargo, un inconveniente que presenta erte
mtodo es que los participantes podran estar ms familiarizados con la prueba en la segunda
oportunidad en que la realicen, crendose as un efecto de prctica o traspaso; o bien, podran
estar cansados para el momento en el que Ies tocara hacer la segunda prueba, crendose un efecto
de fatiga. Para resolver ese tipo de problemas, los investigadores utilizan un procedimiento deno
minado compensacin, en el cual la mitad de los participantes se prueban primero segn una
condicin, y la otra mitad se prueba primero segn la otra condicin. De ese modo, cualquier
efecto de prctica, traspaso, fatiga o similar se compensa entre las dos condiciones. Lo ideal sera
que la compensacin se emplee de modo que se asigne en forma aleatoria la condicin que un
participante experimentar primero y, en ese caso, el estudio se transforma en un experimento
real. De hecho, debido a que logra un nivel de equivalencia tan importante entre los grupos, e di
seo de medidas repetidas con compensacin y asignacin aleatoria es uno de los mtodos de in
vestigacin ms poderosos que utilizan los psiclogos.

Diseo de investigacin correiacional


Un diseo de investigacin correiacional examina el grado de asociacin entre dos variables tal
como existen en un grupo de personas, sin ningn intento de manipulacin experimental. As, un
mtodo correiacional para analizar la autoestima y la satisfaccin laboral consistira simplemente
en sondear un grupo de gerentes de nivel medio en cuanto a su autoestima y a su satisfaccin la
boral. Luego, el investigador observara si aquellos con valores altos en cuanto a autoestima pre
sentaron, por lo general, valores altos en cuanto a la satisfaccin laboral. (El grado en el que
efectivamente existe una asociacin entre los dos valores se calcula utilizando una tcnica esta
dstica denominada coeficiente de correlacin, descripta en el captulo 3).
El mtodo correiacional es, con frecuencia, el ms adecuado para las circunstancias, por lo
cual es ampliamente utilizado. Pero resulta un diseo de investigacin bastante dbil en cuanto a
que sus resultados estn sujetos a muchas explicaciones alternativas, adems de que X fue la
causa de Y \ Por ejemplo, supongamos que a travs de un estudio correiacional se descubre que la
autoestima y la satisfaccin laboral estn relacionadas. El resultado podra reflejar que la alta au
toestima causa alta satisfaccin laboral. Sin embargo, tambin podra ser que un alto grado de sa
tisfaccin laboral cause un alto grado de autoestima. La relacin entre autoestima y satisfaccin
laboral podra incluso ser el resultado de otras diferencias entre los gerentes, tales como la edad
(tal vez el ser mayores hace que los gerentes de nivel medio tengan un alto nivel de autoestima
como de satisfaccin laboral), (En el captulo 3, tratamos con cierto grado de detalle las diversas
interpretaciones causales de los resultados de un estudio correiacional); As, una ventaja del expe
rimento verdadero (cuando es factible), con respecto al estudio correlaciona], es que el experi
mento verdadero manipula la variable independiente y luego observa el efecto en la variable
dependiente, indicando con bastante claridad cul es la causa y cul el efecto.
Los investigadores son muy conscientes dejos lmites de los diseos correlacinales. Cuando
es posible, intentan anular algunas explicaciones alternativas utilizando principalmente procedi
mientos estadsticos sofisticados, tales como la correlacin parcial (resumida en el captulo 17).
Aun as, el mtodo correlaciona! nunca produce resultados tan inequvocos como los de un expe
rimento verdadero y, en la mayora de los casos, ni siquiera tan bien definidos como los de un

cuasiexperimento. No obstante, es el mtodo de investigacin ms slido que puede resultar via


ble en una gran cantidad de situaciones. Por ejemplo, uno no puede realizar una asignacin alea
toria para que ciertas personas contraigan matrimonio con otro tipo de personas. Incluso cuando
es posible realizar experimentos pueden resultar muy costosos y, en esos trrqinos, ios investiga
dores pueden no querer o no poder investigar experimentalmente una idea nor probada. En casos
como los mencionados, los estudios correlacinales constituyen, con frecuencia, un importante
primer paso para dar a conocer una nueva rea de investigacin.

investigacin de sujeto nico


Por ltimo, algunos estudios de investigacin involucran en un intenso examen a un slo grupo,
organizacin o individuo, utilizando el mtodo de anlisis de un caso" u observacin partici
pante". Tal investigacin de sujeto nico no se considera experimental, ni siquiera correlacio
na!. No. obstante, en el rea de la psicologa clnica y en algunos otros campos de las ciencias
sociales como la sociologa y la antropologa (y dentro de stos, los enfoques sociolgicos y
antropolgicos del comportamiento corporativo, de la educacin, de la criminologa, de la co
municacin, etc.), este tipo de investigaciones son consideradas valiosas ya que permiten com
prender acabadamente toda la complejidad de lo que se analiza, en lugar de forzar la atencin
hacia unas pocas variables que pueden o no ser las ms crticas. En todos los campos de la psi
cologa, as como tambin de las otras ciencias sociales, la investigacin de sujeto nico se
considera valiosa como precursora de otros mtodos de investigacin ms rigurosos. (El cap
tulo 2 trata los temas mencionados).
Los investigadores tambin utilizan el mtodo de sujeto nico en forma sumamente siste
mtica en la tradicin conductista desarrollada por B. F. Skinner. Se analiza un slo sujeto a lo
largo del tiempo, ya sea un animal -como una rata o una paloma- o un paciente que sigue un
programa de terapia conductista, mientras el investigador sistemticamente manipuladas con
diciones que afectan al participante y observa los cambios resultantes. Generalmente no utili
zan la estadstica, el patrn de resultados debe ser lo sucientemante claro como para que la
estadstica sea innecesaria.

Resumen de los distintos diseos de investigacin


La tabla A-1 resume los distintos diseos de investigacin que hemos examinado, sealando sus
ventajas y desventajas en comparacin con el ideal de grupos experimental y de control idnticos.

EQUIVALENCIA DE CIRCUNSTANCIAS EN
LOS GRUPOS EXPERIMENTAL V DE CONTROL
El estudio ideal no slo requiere grupos idnticos sino tambin que las circunstancias de prueba
sean idnticas.
En la prctica, es bastante difcil probar dos grupos bajo circunstancias en las que la nica di
ferencia es la manipulacin de la variable independiente. En un laboratorio de fsica es posible lo
grar esa equivalencia, pero al realizar investigaciones con humanos las circunstancias nunca son
equivalentes. Una estrategia diseada para maximizar la equivalencia es utilizar un lugar aislado,
como por ejemplo un compartimiento de un edificio de estudios psicolgicos, minimizando las
influencias externas e interrupciones que podran hacer que una sesin del experimento fuera di-

Tabla A -l.

Principales diseos de investigacin, sus ventajas y desventajas.


Diseo

Ventajas

Desventajas

Experimento verdadero
(asignacin aleatoria
a las condiciones),

Asegura la ausencia de diferencias


sistemticas entre las condiciones.

Su implementacin puede no ser


viable o contraria a la tica.

Grupo control equivalente


(sin asignacin aleatoria).

Controla diferencias obvias entre


condiciones. Puede ser el ms
prctico con grupos intactos.

Los grupos pueden diferir


sistemticamente con respecto
a variables en las que no han sido
equiparados.

Grupo control equivalente


con prueba previa y posterior.

Controla con bastante fuerza


las diferencias iniciales entre
participantes. Con frecuencia
resulta prctico cuando
la asignacin aleatoria no lo es.

Las diferencias sistemticas


entre los grupos pueden influir
en el impacto.
El procedimiento de medicin
previo a la prueba puede confundir
los resultados.

Experimento verdadero
de medidas repetidas
(asignacin aleatoria).

Asegura la ausencia de diferencias


sistemticas. Minimiza las
diferencias aleatorias conviniendo
a los participantes en sus propios
controles,

Efectos de prctica o traspaso.


El procedimiento puede ser difcil
de implementar.

Grupo nico con prueba


previa y posterior.

Brinda cierto control.


Con frecuencia.es el nico
mtodo viable.

Correlaciona!.

Es relativamente fcil de
implementar con grupos intactos.

Dificultad para determinar


la direccin de causalidad.

Sujeto nico.

Permite un conocimiento
acabado de los procesos.

Dificultad para generalizar


los resultados.

Es imposible saber si el cambio


hubiera ocurrido sin el tratamiento
experimental.

ferente de otra. Un mtodo relacionado con el tema mencionado consiste en estandarizar la situa
cin al mximo; por ejemplo, las instrucciones para los participantes podran estar grabadas.
Sin embargo, con respecto a la equivalencia de circunstancias existen dos inconvenientes es
peciales que condicionan la mayora de las investigaciones de las ciencias sociales, particular
mente la investigacin aplicada: nos referimos a los efectos del experimentador y a los efectos
placebo o Hawthome.

Efectos del experimentador


Los efectos del experimentador, que incluyen el sesgo de! experimentador, son las influencias
no intencionales del investigador sobre el estudio. Por ejemplo, supongamos que en un estudio
acerca de los efectos de la terapia psicolgica, el investigador es un terapeuta que evala la salud

mental de los participantes. En ese caso, es muy probable que el deseo del terapeuta de que el ex
perimento funcione lo predisponga a observar que los participantes en el grupo experimental han
mejorado en mayor medida. Incluso, si un observador independiente clasificara los dos grupos
sabiendo quin forma parte de cada uno, el deseo de que el experimento resulte de determinada
manera podra influir no intencionalmente en las evaluaciones del observador.
La mejor solucin para el inconveniente de se opto se denomina mtodo de prueba a ciegas;
es decir, el experimentador, al momento de interactuar con el participante, no sabe si ste se en
cuentra en el grupo de control o en el experimental,

Efectos placebo y Hawthorne


Los efectos placebo influyen sobre la expectativa o motivacin de un participante con respecto a
desempearse adecuadamente. Los efectos Hawthorne influyen sobre la atencin que recibe el
participante y sobre la reaccin del mismo por su condicin de tal. Por ejemplo, si en una fbrica
se capacita al personal de un sector en un nuevo programa y al personal de otro, sector no, los dos
grupos presentan varias diferencias. Un sector utiliza la nueva forma de operacin resultante del
programa y el otro sector no; esa es la manipulacin de la variable independiente. Sin embargo,
tambin existe otra diferencia, y es que a un sector se lo ha inducido a esperar beneficios y al otro
sector no (crendose un efecto placebo). Otra diferencia es que un sector ha recibido atencin es
pecial y el otro sector no (crendose un efecto Hawthorne: el trmino proviene de un estudio rea
lizado en el ao 1927 en la Planta Industrial de Hawthorne de la Western Electric Company, en
Cicero, Illinois). Las diferencias adicionales entre los grupos confunden en gran medida la inter
pretacin del efecto causado por la manipulacin de la variable independiente.
Cmo pueden remediar los investigadores estas diferencias circunstanciales no deseadas?
La mejor solucin es realizar un estudio en el que ambos grupos reciban cierto tratamiento, y que
adems estn convencidos de que debera ser provechoso. Sin embargo, slo un grupo recibe
efectivamente un tratamiento que incluye algo ms que una mera atencin y mayores expectati
vas. Por ejemplo, en investigaciones mdicas, ambos grupos recibiran pldoras iguales y con el
mismo sabor, pero las pldoras de un grupo contienen el ingrediente activo, y las del otro grupo
no. Ninguno de los participantes del experimento sabe quin recibe la droga real. Entonces una
droga que se ve y que se sabe que es la droga verdadera, pero que en verdad es inactiva, se deno
mina un placebo (en latn complacer).
En psicologa, generalmente es imposible o contrario a la tica establecer un grupo de control
en el que una persona reciba un tratamiento que cree efectivo pero en realidad no lo es. Aquellas
situaciones en las que es factible utilizar un verdadero grupo de control placebo y en el que inclu
so el personal relacionado con la investigacin desconoce qu participantes pertenecen a cada
grupo, se denominan procedimientos doble ciego,
Los efectos placebo y Howthome son los inconvenientes ms comunes que se presentan al in
tentar sacar conclusiones inequvocas a partir de los resultados de investigaciones aplicadas en
reas tales como la psicologa clnica, educativa y empresarial.

REPRESENTAT!VIDAD DE LA MUESTRA
El tercer requisito para lograr un estudio ideal es que la muestra de participantes analizados repre
sente adecuadamente la poblacin a la que se supone que se aplica el estudio. Esa representatividad se denomina legitimidad de ia generalizacin o validez externa. (La validez interna se

refiere a las cuestiones relacionadas con la equivalencia de los grupos experimenta! y de control y
a la equivalencia de circunstancias).
La investigacin psicolgica se realiza con frecuencia en alumnos universitarios, y se supone
que lo que se descubre acerca de ellos se aplica a la poblacin ms amplia formada por las perso
nas en general. En un estudio sobre el efecto que producen las luces centelleantes en el desempe
o, el patrn general de resultados con alumnos universitarios probablemente se aplique a casi
todos los otros seres humanos. No obstante, en muchos otros tipos de investigaciones, es suma
mente importante la naturaleza del participante. Por ejemplo, los alumnos universitarios proba
blemente no seran los participantes adecuados en estudios acerca de las actitudes hacia los nios,
ya que la experiencia de los alumnos comnmente no incluye la paternidad o maternidad. En el
mismo sentido, no se puede analizar la capacidad de lectura en escuelas suburbanas y generalizar
los resultados a todos los alumnos en todas las escuelas, o bien examinar la satisfaccin laboral en
la industria informtica y generalizarla a todo tipo de industria.
Otro inconveniente es el modo en que se seleccionan los participantes de un estudio. Por
ejemplo, en una encuesta por correspondencia acerca del conocimiento de un tema, algunos indi
viduos devolvern el cuestionario y otros no. Presumiblemente existen diferencias sistemticas
entre aquellos que lo devuelven y aquellos que no, y es probable que aquellos que s devuelven el
cuestionario tengan ms conocimientos acerca del tema en estudio. Si el investigador utiliza slo
los cuestionarios que fueron devueltos, podra llegar a la conclusin de que las personas tienen
mayores conocimientos acerca de determinado tema que si hubiera podido analizar a toda la po
blacin. De modo similar, las personas que se ofrecen voluntariamente a participar en un experi
mento pueden diferir de aquellas que no lo hacen. Por ejemplo, los voluntarios pueden tener una
personalidad ms sensible a las necesidades ajenas.
El muesfreo aleatorio es considerado el mtodo ptimo para asegurar que una muestra sea
representativa de su poblacin. Muestreo aleatorio significa que los investigadores comienzan
con una lista de todos ios miembros de la poblacin sobre la cual desean generalizar sus resulta
dos (por ejemplo una lista de todos los psicoterapeutas de la nacin), y luego utilizan un procedi
miento al azar (tal como una tabla de nmeros aleatorios) para seleccionar una muestra de esa
poblacin. El resultado del proceso descripto se denomina muestra probabilstica, ya que cada
miembro de la poblacin estudiada tiene la misma probabilidad de ser incluido en la muestra del
estudio.
No se debe confundir el muestreo aleatorio con la asignacin aleatoria a los grupos que tratamos anteriormente. Ambos procesos utilizan verdaderos procedimientos al azar, pero el muestreo
aleatorio se refiere al mtodo de obtencin de una muestra, y la asignacin aleatoria se refiere al
procedimiento de decisin con respecto a qu miembros de la muestra participarn en el grupo
experimental y cules en el grupo de control.

MEDICIN________ __________ _____________________________


La cuarta condicin mencionada como requisito para un estudio ideal es que las medidas deben
ser precisas y adecuadas.
En la investigacin psicolgica existen tres tipos de medidas principales: medidas de infor
me propio, tales como cuestionarios o entrevistas; medidas por observacin o de com porta
miento, como por ejemplo las escalas de clasificacin del comportamiento de nios mientras
juegan, la cantidad de clientes que pasan por un molinete, la cantidad de milsimas de segundos
para responder en un experimento que analiza el tiempo de. reaccin o la cantidad de veces que

una rata presiona una barra, y, por ltimo, medidas fisiolgicas, como podran ser los niveles
hormonales o el ritmo cardaco. Los tres tipos de mediciones se evalan principalmente segn
su confiabilidad y validez.
Confiabilidad
La confiabilidad de una medida es su precisin o coherencia, es decir, en qu grado los resulta
dos son similares si se aplica la misma medida al mismo elemento, en circunstancias idnticas.
En psicologa, los resultados no necesariamente son similares. Por ejemplo, cuestionarios entre
gados a las mismas personas en diferentes das dan con frecuencia resultados dismiles. A veces
las preguntas son ambiguas y, por lo tanto, una persona puede responder de un modo en un m o-'
ment y luego de otro. O bien, las personas pueden simplemente marcar en forma incorrecta al
guna o todas las respuestas en una o .ms oportunidades. Las medidas de informe propio no son
las nicas que pueden no resultar confiables. Las medidas por observacin pueden no ser confia
bles debido a que los distintos observadores pueden estar en desacuerdo, y las medidas fisiolgi
cas con frecuencia son sumamente errticas entre un momento y otro,
Existen tres tipos de indicadores para medir el grado de confiabilidad: a) la confiabilidad
por prueba-reprueba, conforme a la cual el mismo grupo es puesto a prueba dos veces; b) la co
herencia interna, segn la cual, por ejemplo, los puntos obtenidos en la mitad de las preguntas se
comparan con los puntos obtenidos en la otra mitad (el alfa de Cronbach, descripta brevemente en
el captulo 17, es el mtodo ms comn para determinar la coherencia interna), y c) la confabilidad por intercambio de juicios utilizada para medidas de observacin, es el grado de acuerdo
entre los observadores. La tabla A-2 resume los tipos de confiabilidad descriptos.

Validez
La validez de una medida se refiere al hecho de que efectivamente pueda medir lo que pretende.
(El trmino validez se aplica, asimismo, a estudios completos, cuando se refiere a lo apropiado de
la conclusin que puede derivarse de los resultados).
Una medida que no es confiable no puede ser vlida; una medida no confiable no mide ria
da. Pero aun cuando una medida sea confiable (precisa y repetible), no necesariamente es vlida
para medir lo que pretende medir. Por ejemplo, un cuestionario sobre satisfaccin marital que
pregunte, cul es la probabilidad de que usted permanezca con su esposo durante los prxi
mos aos? puede resultar sumamente confiable (por ejemplo, las personas pueden contestar las
preguntas que incluye de forma bastante coherente), pero en lugar de medir satisfaccin mari
tal, podra estar midiendo el compromiso hacia el matrimonio; y los que responden el cuestio
nario podran estar comprometidos no porque estn satisfechos sino porque no tienen otra
alternativa que la vida conyugal, o bien porque sienten que son muy poco atractivos y su situa
cin slo podra empeorar si abandonaran a su pareja.
Tabla A-2.
Tipos de confiabilidad.
Confiabilidad por prueba-reprueba:
C oherencia intem a:
Confiabilidad por intercam bio de ju icios:

correlacin de pruebas aplicadas a las m ism as personas


en diferentes ocasion es.
correlacin entre los distintos tem s.
correlacin entre los valores de diferentes evaluadores
al calificar al m ism o grupo de personas y objetos.

Otra razn por la cual una prueba puede no ser vlida, aun siendo confiable, es que en lugar
de medir la variable que se pretende medir, en realidad est midiendo una tendencia para intentar
dar una buena impresin, o bien decir que s o cualquier otro sesgo de respuesta por parte de ios
que responden. Una manera de encarar el problema de la intencin de dar una buena impresin es
incluir una escala de deseo sociar, a veces llamada escala de la mentira. Cuando la puntua
cin de un participante en una escala como la mencionada es alta, el investigador puede simple
mente descartar la prueba realizada por el participante. Otra alternativa sera que los valores en
una escala de deseo social puedan utilizarse en un procedimiento estadstico (tal como una corre
lacin parcial o un anlisis de covarianza, ambos descriptos brevemente en el captulo 17) para
adaptar el valor de esa persona en cuanto a la parte regular de la medida.
La validez de una medida es ms difcil de evaluar que la confiabilxdad. Para lograrlo se utili
zan diversos medios. Existe validez de contenido cuando el contenido de la medida parece abar
car todos los distintos aspectos de aquello que se est midiendo. Usualmente, la validez de
contenido la determina el investigador u otros expertos segn el juicio de cada uno.
Asimismo, existen medios ms sistemticos para evaluar la validez de una medida. Determi
nar la validez o criterio implica realizar un estudio especial en el cual el investigador compara re
gistros de la medida en cuestin con algn otro indicador posible de la misma variable. Por
ejemplo, un investigador podra probar la validez de una medida de salud mental comparando va
lores de personas de un hospital psiquitrico con las de puntuaciones de la poblacin en general.
Un tipo de validez de criterio es la validez predictiva de una medida. Por ejemplo, el hecho de
que los registros de una prueba de capacidad laboral, tomada al presentarse la persona para solici
tar un trabajo, predigan el desempeo efectivo de la persona en el empleo. La validez predictiva
se utiliza especialmente cuando se disea una medida con fines predictivos, como por ejemplo
para la ubicacin laboral o educativa. Otro tipo de validez de criterio es la validez concurrente,
la cual se refiere al procedimiento de comparacin de valores de una medida, con los de otra que
mide directamente lo mismo; por ejemplo, una prueba de inteligencia nueva y breve comparada
con una prueba de inteligencia existente ms prolongada. La tabla A-3 resume los tres mtodos de
evaluacin de la validez.
Tambin puede aparecer el trmino validez de constructo, el cual se utiliza de varias formas
(con frecuencia ambiguamente). Incluso textos sobre medicin psicolgica difieren en cuanto a
este trmino. A veces incluyen la validez de criterio y, otras, la validez de contenido. Con frecuen-

T a b a A - 3 ,
T ip o s d e v a lid e z d e u n a m e d id a .
V alidez d e contenido:

conform e la opinin de los expertos, e l contenido d e la prueba parece abarcar todo


el espectro de lo que la prueba pretende medir.

V alidez de criterio:

las puntuaciones de la prueba s e correlacionan con algn otro indicador de lo que


se supone m ide la prueba.

V alidez predictiva:

la puntuacin de la prueba predice valores en otra variable que debera ser predicha
por la prueba, conform e a lo que pretende medir; es un tipo de va lid ez de criterio.

V alidez concurrente;

la puntuacin en la prueba se correlaciona con otra variable m edida a l m ism o


tiem po y que se sabe est relacionada con lo que la prueba pretende medir;
es un tipo d e validez de criterio.

cia, se utiliza para referirse a la medida que se utiliza en un estudio en el que exista un resultado
predicho que fue confirmado por el estudio. Dado que la medida utilizada logr producir el resul
tado predicho, se demuestra que la idea (o constructo) implcita en la medida queda comproba
da conforme a la teora.

Trminos clave
- Medidas de
comportamiento.
- Mtodo de prueba a ciegas.
- Validez concurrente.
- Validez de contenido.
- Grupo control.
- Diseo de investigacin
correlacional.
- Compensacin.
- Validez de criterio.
~ Variable dependiente.
- Procedimiento doble ciego.
- Grupo experimental.
- Manipulacin experimental.
- Sesgo del experimentador.
- Efectos del experimentador.
- Validez externa.
-- Legitimidad de la
generalizacin.
- Efectos Hawthorne.

- Variable independiente.
- Confiabilidad
por intercambio de juicios.
- Coherencia interna.
- Validez intema.
- Manipulacin de
la variable independiente.
~ Diseo de grupo de control
equivalente con prueba
previa y posterior.
- Diseo de investigacin de
grupo de control equivalente.
- Medidas por observacin.
- Participantes.
- Medidas fisiolgicas.
- Efectos placebo.
- Poblacin.

- Validez predictiva.
- Diseo preexperimental.
- Muestra probabilsima.

- Diseo cuasiexperimental.
- Asignacin aleatoria
a los grupos.
- Muestreo aleatorio.
- Conabilidad.
- Diseo de investigacin
de medidas repetidas.
~ Sesgo de respuesta.
~ Muestra.
- Medidas de informe propio.
- Diseo de grupo tnico con
prueba previa y posterior.
- Investigacin de sujeto
nico.
- Confiabiidad por
prueba-reprueba.
~ Experimento verdadero.
- Validez.
- Diseo de investigacin
intrasujeto.

Tabla B-l.
reas bajo a curva normal:
Porcentaje del rea bajo curva normal entre la media y las puntuaciones Z indicadas.
z
0 ,0 0
0,01
0 ,0 2
0,03
0 ,0 4
0,05
0,06
0,07
0,08
0,09
0 ,1 0
0,11
0 ,1 2
0,13
0 ,1 4
0,15
0,16
0,17
0,18
0,19
0,2 0
0,21
0,22
0,23

% desde la m edia hasta la Z

0 ,0 0
0 ,4 0
0 ,8 0
1,20
1,60
1,99
2 ,3 9
2,79
3,19
3,59
3,98
4,38
4,7 8
5,17
5,57
5,96
6,36
6,75
7,14
7,53
7,93
8,32
8,71
9,10

2
0,2 4
0,25
0,2 6
0,27
0,2 8
0,2 9
0,3 0
0,31
0,32
0,33
0 ,3 4
0,35
0 ,3 6
0,37
0 ,3 8
0,39
0,4 0
0,41
0,42
0,43
0,4 4
0,45
0,46
0 ,4 7

% desde la m edia hasta la Z

9,48
9,87
10,26
10,64
11,03

11,41
11,79
12,17
12,55
12,93
13,31
13,68
14,06
14,43
14,80
15,17
15,54
15,91
16,28
16,64
17,00
17,36
17,72
18,08

Z
0 ,4 8
0,49
0,50
0,51
0,52
0,53
0,54
0,55
0,56
0,57
0,58
0,59
0,60
0,61
0,62
0,63
0,64
0,65
0,66
0,67
0,68
0,69
0 ,7 0
0,71

% desde la m edia hasta la Z

18,44
18,79
19,15
19,50
19,85
2 0,19
2 0,54
2 0,88
2 1,23
21,57
2 1,90
2 2,24
22,57
22,91
. 2 3,24
2 3 ,5 7
2 3,89
2 4,22
2 4,54
2 4,86
25,17
25,49
2 5 ,8 0
1 26,11

% desde ia m edia hasta a Z

0,7 2
0,73
0 ,7 4
0,75
0 ,7 6
0,7 7
0 ,7 8
0 ,7 9
0,8 0
0,81
0 ,8 2
0,83
0,8 4
0,85
0 ,8 6
0,87
0 ,8 8
0,8 9
0 ,9 0
0,91
0,9 2
0,93
0,9 4
0 ,9 5
0,9 6
0,97
0,98
0 ,9 9
1,00
1,01
1,02
1,03
1,04
1,05
1,06
1,07
1,08
1,09
1,10
1,11
1,12
1,13
1,14
1,15
1,16
1,17
1,18
1,19
1,20
1,21
1,22
1,23
1,24
1,25

2 6 ,4 2
26,73
2 7 ,0 4
2 7 ,3 4
2 7 ,6 4
27,94
28,23
2 8 ,5 2
28,81
2 9 ,1 0
2 9 ,3 9
2 9 ,6 7
29,95
30,23
30,51
30,78
31,06
31,33
31,59
31,86
32,12
32,38
3 2 ,6 4
32,89
33,15
3 3 ,4 0
33,65
33,89
34,13
34,38
34,61
34,85
35,08
35,31
3 5 ,54
35,77
35,99
36,21
36,43
36,65
3 6 ,8 6
37,08
3 7 ,29
3 7 ,4 9
3 7 ,7 0
3 7 ,9 0
3 8 ,1 0
3 8 ,3 0
38 ,4 9
3 8 ,69
38,88
3 9 ,0 7
39,25
39,44

1,26
1,27
1,28
1,29
1,30
1,31
1,32
1,33
1,34
1,35
1,36
1,37
,38
1,39
1,40
1,41
1,42
1,43
1,44
1,45
1,46
1,47
1,48
1,49
1,50
1,51
1,52
1,53
1,54
1,55
1,56
1,57
1,58
1,59
1,60
1,61
1,62
1,63
1,64
1,65
1,66
1,67
1,68
1,69
1,70
1,71
1,72
1,73
1,74
1,75
1,76
1,77
1,78
1,79

% desde la m edia hasta la Z

39,62
39,80
39,97
4 0,15
4 0,32
40,49
4 0,66
4 0,82
4 0,99
4 1,15
41,31
41,47
41,62
4 1,77
4 1,92
4 2,07
4 2 ,2 2
4 2 ,3 6
42,51
42,65
4 2,79
4 2,92
4 3 ,0 6
4 3,19
4 3 ,3 2
43,45
4 3,57
4 3 ,7 0
4 3 ,8 2
43,94
4 4,06
44,18
44,29
44,41
4 4,52
4 4,63
44,74
4 4,84
4 4,95
4 5,05
45,15
45,25
45,35
4 5,45
4 5,54
4 5 ,6 4
4 5,73
4 5,82
45,91
* 45,99
4 6,08
4 6,16
46,25
46,33

Z
1,80
1,81
1,82
1,83
1,84
1,85
1,86
1,87
1,88
1,89
1,90
1,91
1,92
1,93
1,94
1,95
1,96
1,97
1,98
1,99
2 ,0 0
2,01
2 ,0 2
2,03
2,04
2,05
2,06
2,07
2 ,0 8
2,09
2,10
2,11
2,12
2,13
2 ,1 4
2,15
2,16
2,17
2,18
2,19
2,20
2,21
2 ,2 2
2,23
2,24
2,25
2,26
2,27
2,28
2,29
2 ,3 0
2,31
2,32
2,33

% desde la m edia hasta la Z

46,41
4 6 ,4 9
4 6 ,5 6
4 6,64
46,71
4 6 ,7 8
4 6,86
4 6,93
4 6 ,9 9
4 7 ,0 6
47,13
4 7,19
4 7 ,2 6
4 7 ,3 2
4 7,38
4 7,44
4 7 ,5 0
4 7,56
47,61
4 7,67
4 7 ,7 2
4 7,78
4 7,83
4 7,88
4 7,93
4 7 ,9 8
4 8,03
4 8,08
4 8,12
4 8 ,1 7
48,21
4 8 ,2 6
4 8 ,3 0
4 8 ,3 4
4 8,38
4 8,42
4 8 ,4 6
4 8 ,5 0
4 8 ,5 4
4 8,57
48,61
4 8 ,6 4
4 8,68
48,71
4 8,75
4 8,78
48,81
4 8 ,8 4
4 8,87
4 8 ,9 0
4 8,93
4 8 ,9 6
4 8,98
49,01

% desde a m edia hasta la Z

% desde a m edia hasta la Z

2 ,3 4
2,35
2 ,3 6
2 ,3 7
2,38
2 ,3 9
2 ,4 0
2,41
2 ,4 2
2,43
2 ,4 4
2,45
2,46
2,47
2,48
2,49
2,50
2,51
2,5 2
2,53
2 ,5 4
2,55
2,5 6
2,57

4 9 ,0 4
4 9 ,0 6
4 9 ,0 9
49,11
49,13
4 9 ,1 6
4 9 ,1 8
4 9 ,2 0
4 9 ,2 2
49,25
49,27
4 9 ,2 9
49,31
4 9 ,3 2
4 9 ,3 4
4 9 ,3 6
4 9 ,38
4 9 ,4 0
49,41
4 9 ,4 3
4 9 ,4 5
4 9 ,4 6
4 9 ,4 8
4 9 ,4 9

2 ,5 8
2 ,5 9
2 ,6 0
2,61
2 ,6 2
2,63
2 ,6 4
2,65
2 ,6 6
2,67
2,68
2 ,6 9
2,7 0
2,71
2,7 2
2,73
2,74
2,75
2,76
2,77
2,78
2,79
2 ,8 0
2,81

49,51
4 9,52
49,53
49,55
4 9,56
4 9,57
4 9,59
4 9 ,6 0
49,61
4 9 ,6 2
4 9,63
4 9,64
49,65
4 9 ,6 6
49,67
49,68
4 9 ,6 9
4 9,70
49,71
4 9,72
49,73
49,74
4 9,74
49,75

2 ,8 2
2,83
2 ,8 4
2,85
2,86
2,87
2,88
2,89
2 ,9 0
2,91
2 ,9 2
2 ,9 3
2 ,9 4
2,95
2 ,9 6
2,97
2,98
2,99
3,00
3,50
4,00
4,50

% desde la m edia hasta la Z

4 9,76
49,77
49,77
49,78
49,79
4 9,79
4 9,80
49,81
49,81
4 9,82
4 9,82
4 9,83
4 9,84
4 9 ,8 4
49,85
49,85
4 9 ,8 6
4 9,86
49,87
4 9,98
50,00
50,00

P ru eb a s de u n a c o la

P ru eb a s d e dos c olas

O JO

0 ,0 5

0 ,0 1

O JO

0 ,0 5

0 ,0 1

2
3
4
5

3,078
1,886
1,638
1,533
1,476

6,314
2 ,9 2 0
2,353
2 ,1 3 2
2,015

31,821
6,965
4,541
3,747
3,365

,314
2,920
2,353
2,132
2,015

12,706
4 ,303
3 ,182
2 ,776
2,571

6 3 ,657
9,925
5,841
4 ,6 0 4
4 ,0 3 2

6
7
8
9
10

1,440
1,415
1,397
1,383
1,372

1,943
1,895
1,860
1,833
1,813

3,143
2,998
2,897
2,8 2 2
2 ,7 6 4

1,943
1,895
1,860
1,833
1,813

2,447
2,365
2 ,306
2,262
2 ,228

3,708
3,500
3,356
3,250
3,170

11
12
13
14
15

1,364
1,356
1,350
1,345
1,341

1,796
1,783
1,771
1,762
1,753

2 ,7 1 8
2,681
2,651
2,625
2,603

1,796
1,783
1,771
1,762
1,753

2,201
2 ,179
2,161
2,145
2 ,132

3,106
3,055
3,013
2,977
2,947

16
17
18
19
20

1,337
1,334
1,331
1,328
1,326

1,746
1,740
1,734
1,729
1,725

2 ,5 8 4
2,567
2,553
2 ,5 4 0
2,528

1,746
1,740
1,734
1,729
1,725

2 ,120
2 ,110
2,101
2,093
2 ,086

2,921
2 ,898
2,879
2,861
2 ,846

21
22
23
24
25

1,323
1,321
1,320
1,318
1,317

1,721
1,717
1,714
1,711
1,708

2,518
2 ,5 0 9
2 ,5 0 0
2,492
2,485

1,721
1,717
1,714
1,711
1,708

2 ,080
2 ,0 7 4
2 ,069
2 ,064
2 ,060

2 ,8 3 2
2 ,8 1 9
2,808
2,797
2,788

26
27
28
29
30

1,315
1,314
1,313
1,312
1,311

1,706
1,704
1,701
1,699
1,698

2 ,4 7 9
2,473
2,467
2,462
2,458

1,706
1,704
1,701
1,699
1,698

2 ,056
2 ,052
2,049
2,045
2,043

2,779
2,771
2,764
2,757
2 ,7 5 0

35
40
45
50
55

1,306
1,303
1,301
1,299
1,297

1,690
1,684
1,680
1,676
1,673

2,438
2,424
2,412
2,404
2 ,3 9 6

1,690
1,684
1,680
1,676
1,673

2 ,030
2,021
2,014
2,009
2 ,004

2 ,7 2 4
2 ,705
2 ,6 9 0
2 ,678
2 ,6 6 8

60
65
70
75
80

1,296
1,295
1,294
1,293
1,292

1,671
1,669
1,667
1,666
1,664

2,390
2,385
2,381
2,377
2 ,3 7 4

1,671
1,669
1,667
1,666
1,664

2,001
1,997
1,995
1,992
1,990

2,661
2 ,6 5 4
2,648
2,643
2,639

85
90
95
100
oo

1,292
1,291
1,291
1,290
1,282

1,663
1,662
1,661
1,660
1,645

2,371
2,369
2 ,3 6 6
2,364
2,327

1,663
1,662
1,661
1,660
1,645

1,989
1,987
1,986
1,984
1,960

2,635
2 ,6 3 2
2,629
2 ,626
2 ,576

gl

D en o m in a d o r

N iv el de

sig n ifica ci n

0,01
0,05
0,1 0

0,01
0,05
0,1 0

9 8 ,5 0
18,51
8,53

9 9 ,0 0
19,00
9 ,0 0

99,17
19,17
9,16

99,25
19,25
9,24

9 9,30
19,30
9,29

9 9,33
19,33
9,33

0,01
0,05
0 ,1 0

34,12
10,13
5,54

30,82
9,55
5 ,4 6

2 9 ,4 6
9,28
5,39

28,71
9,12
5,34

2 8,24
9,01
5,31

27,91
8,94
5,28

0,01
0,05
0 ,1 0

2 1 ,2 0
7,71
4 ,5 5

18,00
6,95
4,33

16,70
6,59
4,19

15,98
6,39
4,11

15,52
6,26
4,05

15,21
6,16
4,01

0,01
0,05
0,10

16,26
6,61
4 ,0 6

13,27
5,7 9
3,78

12,06
5,41
3,62

11,39
5,19
3,52

10,97
5,05
3,45

10,67
4,95
3,41

0,01
0,05
0,10

13,75
5,99
3,78

10,93
5,1 4
3,46

9,78
4,76
3,29

9,15
4,53
3,18

8,75
4,39
3,1 i

8,47
4,28
3,06

0,01
0,05
0 ,1 0

12,25
5 ,5 9
3 ,5 9

9,55
4 ,7 4
3 ,2 6

8,45
4,35
3,08

7,85
4,12
2,96

7,46
3,97
2,88

7,19
3,87
2,83

0,01
0,05
0 ,1 0

11,26
5 ,3 2
3 ,4 6

8,65
4 ,4 6
3,11

7,59
4,07
2,92

7,01
3,84
2,81

6,63
3,69
2,73

6,37
3,58
2,67

0,01
0,05
0,1 0

10,56
5,12
3,3 6

8,02
4 ,2 6
3,01

6,99'
3,86
2,81

6,42
3,63
2,69

6,06
3,48
2,61

5,80
3 ,3 7
2,55

10

0,01
0,05
0,1 0

10,05
4,9 7
3,29

7 ,5 6
4 ,1 0
2,93

6,55
3,71
2,73

6,00
3,48
2,61

5,64
3,33
2,52

5,39
3,22
2,46

11

0,01
0,05
0 ,1 0

9,65
4 ,8 5
3,23

7,21
3,98
2 ,8 6

6,22
3,59
2,66

5,67
3,36
2,54

5,32
3 ,2 0
2,45

5,07
3 ,1 0
2,39

12

0,01
0,05
0 ,1 0

9,33
4,75
3 ,1 8

6,93
3,89
2,81

5,95
3,49
2,61

5,41
3,26
2,48

5,07
3,11
2,40

4,82
3,00
2,33

13

0,01
0,05
0,1 0

9 ,0 7
4 ,6 7
3,14

6 ,7 0
3,81
2 ,7 6

5,74
3,41
2,56

5,21
3,18
2,43

4,86
3,03
2,35

4,62
2,92
2,28

14

0,01
0,05
0,1 0

8,86
4 ,6 0
3,1 0

6,5 2
3,7 4
2,7 3

5,56
3,34
2,52

5,04
3,11
2,40

4,70
2,96
2,31

4,46
2,85
2,24

G ra d o s d e lib ertad d e l n u m e ra d o r "


1

4 .0 5 2
162
39 ,9

2
5 .0 0 0
200
49,5

5 .4 0 4
216
53,6

5.625
225
55,8

5.764
230
57,2

5.859
234
58,2

D en o m in a d o r
gl

N iv el d e
s ig n ifica c i n

O rad os d e lib ertad d el n u m e ra d o r

15

0 ,0
0,05
0 ,1 0

8,68
4 ,5 4
3,07

6,36
3,68
2,70

5,42
3,29
2,49

4,89
3^06
2,36

4,56
2.90
2,27

4,32
2,79
2,21

16

0,01
0,05
0,1 0

8,53
4,49
3,05

6,23
3,63
2,67

5,29
3,24
2,46

4,77
3,01
2,33

4,44
2,85
2,24

4 ,2 0
2 ,7 4
2,18

17

0,01
0,0 5
0,1 0

8,40
4,4 5
3,03

6,11
3,59
2,65

5,19
3,20
2 ,4 4

4,67
2,97
2,31

4 ,3 4
2,81
2 ,2 2

4 ,1 0
2 ,7 0
2,15

18

0,01
0,0 5
0,1 0

8,29
4,41
3,01

6,01
3,56
2,62

5,09
3,16
2,42

4,58
2,93
2,29

4,25
2,77
2,20

4 ,0 2
2,66
2,13

19

0,01
0,05
0 ,1 0

8,19
4,38
2,99

5,93
3,52
2,61

5,01
3,13
2,40

4,50
2,90
2,27

4,17
2,74
2,18

3,94
2,63
2,11

20

0,01
0,05
0,1 0

8,10
4,35 .
2 ,9 8 '

5,85
3,49
2 ,5 9 '

4,94
3 ,1 0
2,38

4,43
2,87
2,25

4 ,1 0
2,71
2,16

3,87
2 ,6 0
2,09

21

0,01
0 ,0 5
0,1 0

8,02
4,33
2,9 6

5,78
3,47
2,58

4,88
3,07
2,37

4,37
2,84
2,23

4,04
2 ,6 9
2,14

3,81
2,57
2,08

22

0,01
0,05
0 ,1 0

7,95
4 ,3 0
2,95

5,72
3,44
2,56

4,82
3,05
2,35

4,31
2,82
2,22

3,99
2,66
2,13

3,76
2,55
2,06

23

0,01
0,05
0 ,1 0

7 ,8 8
4,28
2,94

5,66
3,42
2,55

4,77
3,03
2 ,3 4

4 ,2 6
.2 ,8 0
2,21

3 ,9 4
2,64
. 2 ,1 2

3,71
2,53
2 ,0 5

24

0,01
0 ,0 5
0 ,1 0

7,8 2
4,26
2,93

5,61
3,40
2,54

4,72
3,01
2,33

4,22
2,78
2,20

3 ,9 0
2,62
2 ,1 0

3,67
2,51
2 ,0 4

25

0,01
0,05
0 ,1 0

7,77
4 ,2 4
2 ,9 2

5,57
3 ,3 9
2,53

4,68
2,99
2,32

4,18
2,76
2,19

3,86
2 ,6 0
2,09

3,63
2 ,4 9
2,03

26

0,01
0,05
0,1 0

7,72
4,23
2,91

5,53
3,37 '.
2,52

4,64
2 ,9 8
2,31

4 ,1 4
2,74
. 2,18

3 ,8 2
.2,59
2,08

3 ,5 9
2 ,4 8
2,01

27

0,01
0,05
0,10

7,68
4,21
2,90

5,49
3,36
2,51'

4 ,6 0
2,96
2,30

4,11
2,73
2,17

3,79
2,57
2,07

3,56
2,46
2,01

28,

0,01
0,0 5
0 ,1 0

7 ,6 4
4 ,2 0
2 ,8 9

5,45 .
3,34
2 ,5 0

4,57
2,95
2,29

4,08
2,72
2,16

3,75
2,56
2,07

3,53
2,45
2 ,0 0

Denominador
gl

95
100
00

Nivel de
significacin

0,01
0,05
0,10
0,01
0,05
0,10
0,01
0,05
0,10

Grados de libertad del numerador


i

6,91
3,94
2,76
6,90
3,94
2,76
6,64
3,84
2,71

4,84
3,09
2,36
4,82
309
2,36
4,61
3,00
2,30

4,00
2,70
2,14
3,98
2,70
2,14
3,78
2,61
2,08

3,52
2,47
2,01
3,51
2,46
2,00
3,32
2,37
1,95

3,22
2,31
1,91
3,21
2,31
1,91
3,02
2,22
1,85

3,00
2,20
1,84
2,99
2,19
1,83
2,80
2,10
1,78

Tabla B-4.
Puntos de corte para la distribucin chi-cuadrado.

gl

OJO

l
2
3
4
5
6
7
8
9
10

2,706
4,605
6,252
7,780
9,237
10,645
12,017
13,362
14,684
15,987

Nivel de significacin
0,05
3,841
5,992
7,815
9,488
11,071
12,592
14,067
15,507
16,919
18,307

0,01
6,635
9,211
11,345
13,277
15,087
16,812
18,475
20,090
21,666
23,209

Tabla B-5.
I n d ic e d e la s t a b la s d e p o t e n c ia y d e la s t a b la s c o n la c a n t id a d d e p a r t ic ip a n t e s n e c e s a r io s
p a r a o b t e n e r u n a p o t e n c ia d e l 8 0 % .

P r o c e d im ie n t o d e p r u e b a d e h ip te s is

C a p tu lo

T a b la d e p o te n c ia

3
9
10
11
13
14

99
278
308
34
410
450

T a b la c o n c a n tid a d
d e p a r tic ip a n te s

C o e fic ie n te de correlacin (r)


Prueba r para m ed ias d epend ien tes
Prueba t para m edias independientes
A n lisis de varianza de un criterio
A n lisis de varianza de dos criterios
Prueba d e chi-cuadrado d e ind ep en dencia

99
279

309
341
410

450

Apndice B

615

Respuestas a los
ejercicios de la serie I

Captulo 1
1.

2.

b)

a) N om inal (o categrico).
b) N um rico (o cuantitativo); m s precisam ente,
intervalar.
c ) N um rico (o cuantitativo); m s precisam ente,
ordinal.
a) Tabla d e frecuencias.
V alores
96
95
94
93
92
91
90
89
88
87
86
85
84
83
82
81
80
79
78
77
76
75
74
73

F recu en cia
1
0
0
0
1
1
0
0
0
1
0
.1
0
2
0
1
1
0
0
0
2
2

1
1

V alores
72
71
70
69
68
67
66
65
64
63
62
61
60
59
58
57
56
55
54
53
52
51
50

Tabla de frecuencias agrupadas (una d e varias


posibilidades).

In terv a lo

F r e c u e n c ia

9 5 -9 9

9 0 -9 4

8 5 -8 9

F r e c u e n c ia

8 0 -8 4

0
1
1
1
2
1
0
0
2
0
, 0
0
0
. 1
0
0
0
0
0
0
0
0
1

7 5 -7 9

4
.

7 0 -7 4

6 5 -6 9

6 0 -6 4

5 5 -5 9

5 0 -5 4

c ) Histogram a (segn tabla d el punto b).

Sensibilidad olfativa

d)

Forma general de la distribucin: unim odal,


aproximadamente sim trica (leve asim etra
negativa).

3.

a) ta b la de frecuencias
: varias posibilidades)^

agrupadas (una de

In terv a lo

F r e cu en cia

8 0 -8 9
7 0 -7 9
6 0 -6 9
5 0 -5 9
4 0 -4 9
3 0 -3 9
2 0 -2 9

10
0
5
0
5
7
7

c ) Polgono de frecuencias (segn tabla del punto b);

b) Histograma (segn tabla d el punto a).-

Horas de estudio
d)

Forma general d e la distribucin: unim odal,


asim trica hacia la derecha (positivam ente asi
mtrica).
a) B im odal; b ) aproxim adam ente normal (o uni
modal o sim trica); c ) m ultim odal.

Tiempo necesario para completar la tarea (rain.)

4.

a) Tabla de frecuencia.
C a n tid a d
d e h o ra s F recu en cia
18
17
16
15
14
13
12
11
10
9

1
0
0
1
0
2
1
3
5
4

C a n tid a d
d e h o ra s

F r ecu en cia

8
7
6
5
4
3
2
1
0

5
11
4
2
3
4
2
1
1

b) Tabla d e frecuencias agrupadas (una d e varias


posibilidades).
F r ecu en cia

In terv a lo
1 8 -2 0
1 5 -1 7
1 2 -1 4
9 -1 1
6 -8
3 -5
0 -2

1
I
3
12
20
9
4

__________
(b)

(c)
7.

a) U na distribucin e s la form a en que un grupo


de valores se organiza entre los diferentes va
lores posibles. U na manera d e describir tal
distribucin es a travs de un grfico, denom i
nado histograma. U n histogram a es un tipo de
grfico de barras con una barra para cada valor
posible, ordenadas d e izquierda a derecha. Las
barias tienen una altura igual a la cantidad de
v eces seg n e l valor que representan es obser
vado. En este tipo d e grficos, una distribu
cin sim trica tiene form a sim trica, e s decir
qu e la mitad derecha y la m itad izquierda s e
m ejan im genes especulares. En un sentido
am plio, sign ifica que existen prcticam ente la

m ism a cantidad de valores altos qu e bajos, y


que a m edida que nos m ovem os del valor m e
dio hacia e l valor ms alto o l ms bajo, la
cantidad 'de observaciones de cada valor dis
m inuye o aumenta del m ism o m odo).
U na distribucin e s unim odal si el histograma
tiene un punto alto. Es decir que ex iste un s lo
nivel en particular que presenta m s frecuen
cias que cualquier otro nivel. (A este nivel se
o denom ina m oda , y ser unim odal significa
tener s lo una m o d a ).
b) U na distribucin unim odal negativam ente asi
m trica no es sim trica, y su cola, e l lado bajo
y alargado de la m ism a, se extiende hacia la
izquierda (adonde se encuentran los valores
negativos del grfico).

Captulo 2
1. Serie

A. a) M

= % X JN = 2 6 1 /9 = 2 9 .
b) M ediana = 28,
c) S S = X (X ~ M )2 = (32 - 2 9 )2 + (28 - 2 9 )2
+ (24 - 2 9 )2 + (28 - 29)2 + (28 - 2 9 )2
+ (31 - 2 9 ) 2 + (35 - 29)3 + (29 - 2 9 )2
+ (26 - 2 9 )2 ,
S S = 32 + ( ~ ) 2 + (- 5 )2 + (~1)2 + ( - 1 ) 2
4- 22 + 62 + O2 + (~3)2
SS = 9 + 1 + 2 5 + 1 + 1 + 4 + 3 6 + 0 + 9 = 86.
d) S D 2 = S S /N = Z ( X - M ) 2/N = 86/9 = 9,56.

3.

e) SD = ' ^ = t ' l 9 6 = %Q9.


Serie B . a) M = -4 ; b) M ediana = .4; c ) S S - 26;
d ) 5>2 = 3 ,2 5 ; e ) SD = 1,80.
2. La temperatura promedio, entendiendo co m o tai la
suma de las 10 lecturas dividida por. 10, fue - 7 gra
dos C elsius. E ste resultado es la media. Sin embar
go, si ordenamos las temperaturas de menor a mayor,
los dos nmeros del m edio que determinan lo que
s e denom ina la temperatura mediana, serian igual
a - 5 grados. Otra forma de representar la tempera
tura tpica sera tomar la temperatura esp ecfica que
ocurri m s frecuentemente, a la que se llam a mo
da. En este caso, hubo dos modas, dos temperatu
ras que ocurrieron ms frecuentemente, - 1 y - 5 .
Las dos temperaturas ocurrieron d os veces. Pero la
m oda no es una informacin muy til en este caso.
Con respecto a l a variacin, se puede calcular
segn l a medida en que vari cada temperatura con
respecto al promedio: primero, se eleva al cuadrado
cada uno de esos desvos' (con este procedimiento
anulamos los signos positivos y negativos de m ane
ra que obtenem os la diferencia con respecto al pro
m edio sin importar el sentido de la mism a). L uego
calculam os el promedio de estos desvos cuadrticos. Por ejem plo, el desvo de la primera tempera

4.

5.

6.

tura e s 2 (e s decir, - 5 m enos - 7 ) que, elevado al


cuadrado, da 4. E levando cada d e sv o al cuadrado
y sum nd olos obten em os un resultado de 468. AI
dividir este resultado por 10 obtenem os un d esv o
cuadrtico m edio de 46,8. A-este resultado se lo d e
nom ina varianza. La varianza e s una form a de d es
cribir la dispersin de un grupo de nmeros. La
varianza es una parte muy importante de m uchos
clculos estadsticos. Sin embargo, lam entable
mente no transmite una idea m uy directa del grado
en que varan lo s nmeros,
P odem os obtener una idea m s directa del gra
do de variacin de un grupo de nmeros entre s
calculando la raz cuadrada de la varianza. En este
caso, la raz cuadrada de 46,8 es 6,84. La raz cua
drada de la varianza se denom ina d e s v o e s t n
d a r . Sin entrar en detalles, significa que, en un da
prom edio, la temperatura difiere en 6 ,8 4 grados
con respecto al prom edio de - 7 grados.
El resultado consta de dos partes. En primer lugar,
la m edia se refiere al prom edio aritmtico c o
mn: sumar la cantidad total de sueos y dividirlos
por la cantidad de personas. En este caso, a canti
dad prom edio de sueos narrados durante las dos
sem anas fue 6,84. En segundo lugar, el "S D se re
fiere al desvo estndar. El desvi estndares, en
un sentido amplio, el prom edio-de dispersin de la
cantidad d e sueos con respecto al promedio de d i
chos sueos; en este ca so la dispersin e s d 3,18
sueos. La dispersin es bastante amplia. Para ser
m s precisos, el desvo estndar s e calcula tom an
do a cantidad de sueos d e cada persona, restando
6,8 4 a esas cantidades y elevando la diferencia al
cuadrado; e l desvo estndar e s la raz cuadrada del
prom edio d e esas diferencias cuadrticas.
a) Z = ( X - M )!S D = (91 - 7 9 ) / 1 2 = 12/12 = 1,00.
b) Z = ( 6 8 - 7 9 ) / 1 2 = - 1 1 / 1 2 = - 0 , 9 2
c ) Z = (1 0 3 - 7 9 )/1 2 = 2 4 /1 2 = 2 ,0 0 .
a) Si el a = 107, Z = ( X - M )IS D = (107 - 100)/16
= 7/16 = 0 4 4 .
X = (Z)(SD) + M = (0,44X41) + 231 = 18,04 + 231
= 249.
(El resultado final est redondeado a un nm e
ro entero ya que e l valor real de la prueba se
refiere a la cantidad de puntuaciones correc
tas, lo cual no puede ser una fraccin)
b ) Z = -1 ,0 6 ; X 188.
c) Z = 0; X = 231,
Esposa: Z = (X - M )/S D - (63 - 60)/ = 3/6 = 0,5.
E sposo: Z = ( X - M )/S D = (5 9 - 55)/4 = 4 / 4 = 1.
El esp oso presenta una puntuacin Z ms e le
vada, de lo que se deduce que se ha adaptado m e
jor, con relacin a otros hom bres divorciados, de
lo que lo ha hecho su esp osa con relacin a otras
mujeres divorciadas.

1.

a)
5
4
3
2

-----------------------------------------------------------------------------

30

40

50

60

70

........

80

..........

90

Empatia
b) Correlacin lineal positiva. A medida que au
menta la empatia del terapeuta tambin aumen
ta la satisfaccin del paciente,

Empatia
terapeuta
O r ig in a l

1
2
3
4

70

94
36
48

Satisfaccin
paciente

zx

O r ig in a l

0,36
1,45
-1,17
-0,63

4
5

2
1

zr
0,63
1,26
-0,63
-1,26

zxzr
0,23
1,83
0,74
0,80
o
'O
cr

C a p tu lo 3

c)

11
1+1

E xplicacin a una persona que nunca ha asisti


do a un curso de estadstica: para e l caso de las es
posas, un valor observado de 63 es 3 puntos mejor
que e prom edio 60 para mujeres divorciadas en
general. (La m edia del problem a es un trmino
estadstico con e l que se denom ina e l prom edio or
dinario, la suma de los valores dividida por la canti
dad de valores). Pero existen por supuesto algunas
variaciones entre lo s valores observados de mujeres
divorciadas. La cantidad prom edio aproximada en
que los valores de las mujeres difieren del promedio
e s 6 puntos; es el S D al que se refiere el problema.
(En realidad, y sin entrar en detalles, el S D , que sig
nifica desvo estndar, no es ms que el promedio
de las desviaciones de lo s valores observados con
respecto ai prom edio. Para ser ms precisos, el S D
es la raz cuadrada del promedio de las diferencias
cuadrticas de cada valor con la media).
Por lo tanto, el valor de la esp osa supera la
m edia de las e sp o sa s, en general, en una cantidad
que e s s lo la mitad de lo que lo s valores de las
esp o sa s en general varan de la m eda correspon
diente. Esto le da lo que se denom ina una puntua
cin Z de + 0 ,5 , que la ubica en una esca la en la
que se compara su valor con el de las mujeres d i
vorciadas en g e n e ra l U tilizando la m ism a l gica
para analizar la adaptacin al divorcio por parte
del m arido, en com paracin co n otros hom bres
divorciados, l se encuentra por sobre e l prom edio
en una cantidad igual al prom edio segn e l cual
los hom bres varan de la m edia, es decir, presenta
una puntuacin Z de +1.
Por lo tanto, aunque los d os se han adaptado
m ejor que e l prom edio para su sex o , e l esp o so se
adapt mejor, en relacin con otros hom bres di
vorciados, de lo que la esp osa se adapt con rela
cin a otras m ujeres divorciadas.

d)

= 3,60/4 =
0,90

E l primer paso para resolver un ejercicio de


correlacin e s realizar un grfico, representar
una variable en cada eje y despus marcar un
punto en el lugar correspondiente a cada ob
servacin en ese grfico. A esto se lo denom ina
diagrama de dispersin, y s o s da una im agen
del patrn de relacin entre las dos variables.
En este caso, los valores altos parecen coinci
dir con lo s altos, y ios bajos con lo s bajos, de
terminando lo que se denom ina una correla
cin positiva. (B sicam ente, la correlacin
indica en qu m edida lo s valores altos coinci
den con lo s valores altos y los valores bajos
con lo s valores bajos). A dem s, dado que los
puntos s e ubican aproximadamente cerca de
una lnea recta, podem os decir que es un ejem
plo de correlacin lineal positiva.
E l siguiente paso es convertir todos los valo
res observados en puntuaciones Z para facilitar
e l clculo del grado en e l que los altos coinci
den con lo s altos y lo s bajos con los bajos. Las
puntuaciones Z facilitan este clculo porque
constituyen e l mejor indicador de cun bajo o
alto es un valor en relacin con los otros valores
de la distribucin.
E l c oeficien te de correlacin es un nmero
qu e indica e l grado de asociacin. S e calcula
m ultiplicando las d os puntuaciones Z d e cada
persona, sum ando estos productos y luego
prom ediando e l total por la cantidad de perso
nas involucradas en e l estudio. E l coeficien te
ser un nmero alto si lo s registros altos coin
ciden con los altos y los bajos con los bajos,
debido a que en el caso de las puntuaciones Z,
los altos son siem pre positivos (y cuanto ms
altos son , m s positivos) y al multiplicar posi
tivo por positivo el resultado e s positivo. Por
otro lado, con respecto a las puntuaciones Z,
los bajos son siem pre negativos (y cuanto m s
bajo el registro, m s negativa e s la puntuacin

Z ), y ai multiplicar negativo por negativo el

Calificacin en la prueba

2.

Calificaciones
en la prueba

O r ig in a l

O r ig in a l

0
10
8

- 1 ,7 9
1,19
0 ,0 0
0 ,6 0
0 ,0 0
S D = 3,35

52
95
83
71
64

Zy

-1 ,4 1
1,48
0,67
-0 ,1 3
- 0 ,6 0

A# = 73;

2,52
1,76
0 ,0 0
-0 ,0 8
0 ,0 0

14,90 == 4 ,2 0

r = 4 ,20/5 =i 0,84.

d) V a s e en la respuesta al ejercicio Id un ejem


p lo de c m o escribir un ensayo de este tipo.
e) E xisten tres direcciones de causalidad lgicas
posibles:
(i) Estudiar m s horas e s la cau sa d e m ejores
calificacion es; (ii) obtener m ejores califica
c io n e s es la causa de m s horas de estudio.
C abe destacar que, aunque en la teora e sto
sea p osib le, en la realidad e s im p osib le que
un h ech o futuro (la c alificacin en la prueba)
cause un even to anterior (horas de estu d io), o
(iii) un tercer factor, c o m o por ejem p lo e l in
ters por la m ateria, podra ser la causa de
que e l alum no estudie m s y de que le vaya
m ejor en la prueba.
3.

a)

9
8
7

0
'g 5
1 4

a)

100
90
80
70
60
50

3
2

1 *
o!---------

*>

10

15

20

25

30

Extraversin
1

10

Horas de estudio

b)

Horas de estudio
ZX Z Y

%
u
b

resultado tam bin es positivo.


L os estadsticos pueden probar que, sig u ien
do con este procedim iento, el nm ero m s alto
que se puede obtener, si lo s valores de las dos
variables estn perfectam ente correlaciona
dos, es +1. S i no existiera relacin lin eal entre
las variables, e l resultado de este procedi
m iento sera 0 (obtendram os 0 porque lo s va
lores altos seran m ultiplicados a v e ce s por
altos y a v eces por bajos, y lo s valores bajos a
v eces por altos y a v eces por bajos, dando una
m ezcla de nm eros positivos y negativos que
s e cancelaran entre s).
En e l ca so que estam os analizando aqu, el
total de los productos de las puntuaciones Z e s
3 ,6 , y al dividirlo por la cantidad de parejas te
rapeuta-paciente da 0,9 0 . A este resultado,
0 ,9 , se lo denom ina co eficien te r d e c o rr e la
c i n d e P e a r so n , e indica una fuerte correla
cin linea! positiva entre la satisfaccin y la
empatia.
e) E xisten tres posibilidades lgicas de la direc
cin de causalidad: (i) S i un terapeuta tiene
m s empatia, esto hace que e l paciente se
sienta m s satisfecho (la em patia causa satis
faccin); (i) s i un paciente s e sien te m as satis
fecho, esto puede hacer que e l terapeuta sienta
ms empatia hacia e l paciente (la satisfaccin
causa em patia), o (i) algn tercer factor, c o
m o una buena adaptacin entre e l problem a
del paciente y la habilidad del terapeuta, pu e
de hacer que lo s pacientes estn ms sa tisfe
chos y que los terapeutas sientan m s em patia
(un tercer factor causa tanto la satisfaccin c o
m o la empatia),

C orrelacin lin eal positiva. A m edida qu e au


mentan las horas de estudio tambin lo hacen
las ca lificaciones.

b)

C orrelacin curvilnea (form a de U inverti


da): hasta determ inado punto, a m edid a que
aum enta la extraversin, aum enta e l aprecio,
pero superado e se punto, a m edid a que la e x
traversin contina aum entando e l aprecio
d ism in uye.

C)

Aprecio por
ese integrante

Extraversin
de un integrante

V a lo r

observado

observado

18
17
20
8
13
24
11
12
18
21

0,37
0,17
0,80
-1,72
-0,67
1,63
-1,09
-0,88
0,38
1,00

8
9
6
1
7
1
3
5
7
3

1,10
1,47
0,37
-1,47
0,74
-1,47
-0,74
0,00
0,74
-0,74

ZX Zy

P u n tu a c i n

!!
O
vD
to
o
n
o
o

P u n tu a c i n

V a lo r

0,407
0,245
0,296
2,528
-0,496
-2,396
0,807
0,000
0,281
-0,740

b)

L= 0,932

4, a) La tabla muestra el grado de asociacin entre


los valores de varias medidas aplicadas a mu
jeres embarazadas y a sus compaeros. El
grado de asociacin entr valores d dos me
didas indica en qu grado los valores altos o
bajos en una medida coinciden con los valo
res altos o bajos en la otra medida. Los nme
ros que indican el grado de asociacin se
denominan coeficientes de correlacin. Un
coeficiente de correlacin 1 significara que
los valores de las dos medidas estaban perfec
tamente vinculados; conocer el valor de una
medida es todo lo que necesitaramos para
poder calcular el valor en la otra medida. (Es
tas asociaciones tan perfectas casi nunca ocu
rren en la vida real). Un coeficiente de
correlacin 0 significa que no existe asocia
cin entre las dos medidas, los valores de usa
medida no tienen ninguna relacin con los va
lores de la otra medida. Finalmente, un coefi
ciente de correlacin -1 significa que existe
una asociacin inversa perfecta, es decir, va
lores altos en una medida estn perfectamente
asociados con los bajos en la otra, y vicever
sa, La mayora de las correlaciones se en
cuentran entre Oy+l Oy- l . Cuanto ms
cerca de 0 se encuentra una correlacin, ms
dbil es el grado de asociacin.
Por ejemplo, la correlacin 0,17, e n t r e lo in
formado por las mujeres sobre su estrs y lo
informado por los hombres sobre el estrs de
las mujeres, indica que la asociacin entre es
tas dos medidas es bastante dbil. Por lo tanto,
el nivel de estrs que sufre una mujer no est

c)

5. a)
b)

muy relacionado con el nivel de estrs que su


compaero cre que ella est sufriendo. Por
otro lado, la correlacin de 0,50 (cerca del me
dio de la primera columna de correlaciones)
indica que existe una asociacin mucho ms
fuerte entre el nivel de estrs informado por
una mujer ysu estado depresivo al momento
de la segunda entrevista. Es decir, es probable
que las mujeres que informan estar bajo cierto
nivel de estrs tambin informen estar depri
midas; aquellas que no estn bajo mucho es
trs probablemente no informen estar muy
deprimidas.
Engeneral, de todas las correlaciones representa
das en esta tabla, las m s fuertes se danentre las
variables estrs, apoyo y estado emocional; las
correlaciones de estas variables con las demo
grficas (edad, origen tnico, etc.) eran bastan
te dbiles. El apoyo del compaero pareca
estar fuertemente correlacionado con el estrs
y el estado anmico, y el estado depresivo al
momento de la segunda prueba estaba particu
larmente relacionado con las otras variables.
Slo porque dos variables estn correlaciona
das, aun cuando estn fuertemente correlacio
nadas no significa que podamos conocer la
direccin de causalidad particular que crea di
cha asociacin. Por ejemplo, existe una fuerte
correlacin inversa entre el apoyo del compa
ero en la primerapruebay el estado depresivo
en la segunda. Existen tres direcciones de cau
salidad lgicamente posibles en este caso; el
apoyo por parte del compaero puede causar
una menor depresin; una menor depresin
puede causar un mayor apoyo; o algn tercer
factor puede causar ambos. Podemos anular la
segunda posibilidad, ya que un hecho futuro
(poca depresin) no puede causar unhecho pa
sado (apoyo inicial). Sin embargo, las otras
dos posibilidades permanecen. Es realmente
posible que el hechode tener el apoyo del
compaero ayude a reducir la depresin. Pero
tambin es posible que un tercer factor est
causando ambas cosas. Por ejemplo, conside
remos el nivel de ingresos. Tal vez cuando una
pareja logra tener mayores ingresos, el compa
ero tiene ms tiempo y energa para brindar
su apoyo, y a la vez una mayor calidad de vida
mantiene bajos los niveles de depresin.
Ambas medidas pueden presentar un bajo ni
vel de confiabildad, reduciendo (atenuando)
as la posible correlacin entre ellas.
Entre millonarios no puede haber un gran
rango de calidad de vida (probablemente to
dos ellos tienen una muy buena calidad de

vida), por lo tanto, la correlacin con cual


quier variable {incluso la variable felicidad)
es limitada.
. SERIE A:

5
4
3

*
*

2
*
1 *
0 ------- :-----------1 2

7. SERIEA:
Producto cruzado
Toma medicamento Se resfra de puntuaciones Z
O r ig in a l Z
O r ig in a l
Z
I
0
-1
1
1
1
0
1
I
1
1
0
-I
1
1
I
0
1
-1
1
1
1
~1
0 1
-I
1
1
0 I
-I
1
1
0 1
-I
0 -1
1
1
-8

r = ~8/S =-1,00.

O r ig in a l

Producto cruzado de
puntuaciones Z

r
O r ig in a l

l
.2
3
4
5

-1,41
~0,71
0,00
0,71
1,41

1
-1,41
2
0,71
3
0,00
4
0,71
5
1,41
M= 3; X>= 1,41

r =

2,0
0,5
0,0
0,5
2,0
5,0
5,0/5 = 1,00.

SERIE B :

~4

Captulo 4

1 2

X
1
2
3
4
5

Producto cruzado de
puntuaciones Z

Y
Z

-141
-0,71
0,00
0,71
1,41

-4/8 = 0,50,

4
3

r =

.1 *

O r ig in a l

Producto cruzado
Toma medicamento Se resfra de puntuaciones Z
O r ig in a l Z
O r ig in a l
Z
1
0
1
1
-1
1
0
1
1
-1
I
0
-i
1
1
0
-I
1
0 -1
1
1
i
1
1
I
1
1
0 -I
. -1
0 -1
1
l
i
1
l
0

>-<

SERIE B:

O r ig in a l

1 -1,41
2 -0,71
3 0,00
5 1,41
4 0,71

2,0
0,5
0,0
1,0
1,0
4,5
r= 4,5/5 = 0,90.

1. a) Variable Predctoia = puntuacin en la prueba


de conocimientos sobre fisiologa. Variable
dependiente = cantidad de lesiones durante el
ao subsiguiente. Beta = 0,4 (el coeficiente de
correlacin).
b) (^Lesiones ( O X X Z ^

. ).

c) (0,4){-2) =-0,8; (0,4)(~)


= -0,4; (0,4)(0) = 0; (0,4)(1)
= 0,4; (0,4X2) = 0,8.
2. a) b - = ((3)(SJ5y/SZ?x) = (0,4)(2/2) = 0,4;
a = M x - (>)(M
X)_= 10 ~ (0,4X10)
= 10 4 = 6; T= 6 + (0,4)(20b) y = 1 6 + (0.4X X ).

c)

Y=

2 + (0,4)(X).

d) y = 8 + (0,2X X ).

e)
f)

2 + (0,8XX).
r = 1 4 + (-0,4)(X).

F= 2 4- (0,8)(X).

d)

Empatia
e) R educcin proporcional de error

3,
N o ta en el
p a rcia l

M o d e lo de
p red icci n

N o ta p re d ic h a
en el fin a l

30
40
50
60
70
80
90
100

4 0 + (0 ,5)(30)
40 + (0 ,5)(40)
40 + (0,5X 50)
4 0 + (0 ,5)(60)
4 0 + (0 ,5)(70)
4 0 + (0,5){80)
4 0 + (0 ,5)(90)
4 0 + (0 ,5 X 1 0 0 )

55
60
65
70
75
80
85
'9 0

4.

a) b = (b ) (S D Y/S D x) == (0,9 X 1 ,5 8 /2 2 ,1 4 )
= 0 ,0 6 4 ;
a = M y -(>)(M *) = 3 - (0 f0 6 4 )(6 2 )
= -0 ,9 7 ;

S a tisfa cc i n p redicha == - 0 , 9 7 + (0 ,0 6 4 )
(em p atia)
: 6)

N m ero
d e p a reja

E m p a tia
te ra p eu ta

1
2
3
4

70
94
36
48

S a tisfa cci n
del clien te
R eal

P r e d ic h a

4
5
2
1

3,51
5,05
1,33
2 ,1 0

c)
E rr o r
0 ,49
-0 ,0 5
0,67
- 1 ,1 0

E rr o r 2
0,24
0,0 0
0,45
1,21

- (1 0 ~ 1 ,9 ) / 1 0 - 0,81.
f) -v /o sl = 0 , 9 ; r s 0,9.
g) Puede com probarse m atem ticam ente que el
m todo m s preciso para predecir la puntua
cin Z de una persona en una variable (llam
m osla Y ), sobre la base de la puntuacin Z de
esa persona en otra variable (llam m osla X ),
e s m ultiplicar la puntuacin Z en X por el c o e
ficien te de correlacin. E ste procedim iento
puede sim plificarse en una sola frm ula (que
s o requiere las conversiones a puntuaciones Z
y de puntuaciones Z), en la que las puntuacio
nes originales de Y pueden predecirse directa
m ente a partir d e las puntuaciones orignales
de X . En este ejem plo en particular, la frm ula
e s tal que, para predecir la puntuacin original
d e un paciente en cuanto a satisfaccin, se to
m a la constante de -0 ,9 7 y lu ego s e le sum a el
resultado de m ultiplicar 0 ,0 6 4 por e l valor c o
rrespondiente a la em patia del terapeuta.
Para evaluar la precisin d e la frm ula se de
ben seguir lo s siguientes pasos. Prim ero, de
terminar la prediccin que s e hubiera hecho
utilizando la frm ula para cada paciente de las
cuatro parejas utilizadas para e l clcu lo del
coeficien te de correlacin. Por ejem plo, apli
cando esta frm ula a la primera pareja, suma
m os a -0 ,9 7 el resultado de multiplicar 0,064
por la empatia del terapeuta (0,064 x 70 = 4,48);
el resultado s 3 ,5 1 . S e puede calcular el
error en e l que incurriram os utilizando este
m od elo para cada una de las predicciones,
restando el valor predicho al valor observa
do. Por ejem plo, en el caso de la primera pa
reja, 4 m en os 3,51 da un error de 0 ,4 9 . D ado
que lo s errores se cancelaran unos a otros al
sum arios (porque algunos son negativos y
otros p o sitiv o s), elev o los errores al cuadra
do, Para ilustrarlo grficam ente, se traz so
bre el diagram a de dispersin preparado para
.estos datos una recta (denom inada r ec ta d e

5.

r e g r e si n ) que muestra las predicciones lo


gradas utilizando la frmula. C o m o s e obser
va. los puntos correspondientes a los valores
observados estn bastante cerca de la recta de
regresin, la distancia entre cada punto y la
recta e s el error.
D espu s se com para el err o r en el que incu
rriramos, utilizando la frm ula de prediccin,
con e l error en e l que incurriramos predicien
do sin ella (predecir sin ella significa predecir
s lo con la inedia de los valores correspon
dientes a la satisfaccin del paciente). E l clcu
lo estadstico que en realidad se utiliza se
denom ina red u cci n p r o p o r c io n a l d e error.
E s la reduccin del error cuadrtico ai utilizar
la frm ula (es decir, e l eixor cuadrtico total al
predecir utilizando la m edia, que s e ca lcu l en
10, m enos la suma de errores cuadrticos utili
zando la frmula, que se calcul en 1,9), d iv i
dido por e l error cuadrtico total al utilizar la
m edia para predecir. E sto arroja un resultado
de 0,81, lo que significa que e l error cuadrti
c o se ha reducido en un 81% con respecto a
utilizar s lo la m edia para predecir. D a d o que
la reduccin proporcional de error es matem
ticamente equivalente al coeficiente de correla
cin cuadrtico, e l resultado se control calcu
lando la raz cuadrada de la reduccin propor
cional de error. La raz cuadrada de 0,81 e s 0,9,
que coincide exactamente con el coeficiente de
correlacin,
a) b = ($ ) (S D y IS D x )
~ (0 ,8 4 X 1 4 ,9 /3 ,3 5 ) = 3,74;
a = M x - (b)(W x ) = 73 - (3,7 4 )(6 ) = 50,56.
C alificacin predicha = 5 0 ,5 6 + (3 ,74)
(horas de estudio).
b)
H o r a s d
e stu d io

c)

C a lifica c io n e s (L )

(X )

O r ig in a l

P r e d ic c i n

0
10
6
8
6

52

5 0 ,5 6
87,96
7 3 ,0 0
80,48
7 3 ,0 0

95
83
71
64
E rror
1,44
7,07
10,00
-9 ,4 8
-9 ,0 0

E rr o r 2
2 ,0 7
4 9 ,5 6
100,00
89,87
8 1 ,0 0

d)

e ) R educcin proporcional de error


= (^ T o ia i ~ ^ E tro r^ ^ T o ta l

= (1.110 - 322,5 y i.110 *0,71,


f) V 0 7 = 0,84; r * 0,84.
g ) R espuesta sim ilar a la del ejercicio 4 g .
Para realizar e l estudio s e utiliz un procedim iento
. estadstico denom inado regresin m ltiple. Este
procedim iento produce una frm ula para predecir
e l valor de una persona en una variable dependien
te (en este caso, la aceptacin d e l nio por parte de
sus pares) a partir de los registros de esa persona
en una serie de variables de prediccin (en este ca
so , la enseanza no social y e l entrenam iento so
cial por parte de la madre d el nio). La frm ula o
ecu acin se forma m ultiplicando e l valor observa
do de esa persona, en cada una de las variables de
prediccin, por un nmero particular denom inado
co eficien te de regresin, y sum ando lu ego lo s pro
ductos. E ste procedim iento produce la regla de
prediccin m s precisa en su tipo.
Cuando e l coeficien te d e regresin e s e l que
s e utiliza co n puntuaciones Z, se denom ina c o efi
ciente d e regresin estandarizado y s e sim boliza
con la letra griega beta (3). En este ejem plo, esta
m os interesados en la ecu acin 1, relacionada con
la aceptacin por parte d e lo s pares. La tabla
m uestra lo s coeficien tes beta para esta ecuacin
(0 ,1 0 y 0,3 2 ). Por lo tanto, la puntuacin Z predi
cha para la aceptacin por parte de lo s pares de un
nio e s 0 ,1 0 por la puntuacin Z correspondiente a
la enseanza no social brindada por su madre, m s
0 ,3 2 por la puntuacin Z correspondiente al entre
nam iento social brindado por su madre.
L os coeficien tes de regresin sugieren que la acep
tacin d e un nio por parte de sus pares est m uy
fuertem ente relacionada con e l entrenam iento so
cial brindado por su madre, y m ucho m enos fuer
tem ente relacionada con la enseanza no social
brindada por ella. E s importante destacar, sin em
bargo, que lo s coeficien tes d e regresin para cada
una de estas variables de prediccin reflejan lo que

cada una contribuye a la prediccin, independien


temente de lo que contribuye la otra. Por lo tanto,
al considerar correlaciones comunes entre cada
una de las variables de prediccin y la variable de
pendiente, la importancia relativa de cada una de
las variables puede ser muy diferente. En este
ejemplo, se observa que las copelaciones comunes
muestran un patrn similar, aunque la diferencia
entre las dos variables no es tan importante como
cuando se consideran los coeficientes beta.
Otra informacin importante en la tabla es R 2. Este
nmero indica la proporcin de error cuadrtico de
las predicciones, que se reduce ai utilizar esta regla
de prediccin ptima, con respecto a utilizar slo el
promedio de aceptacin por parte de sus pares para
predecir cada registro. Es una forma estndar de
describir la calidad de la regla de prediccin pti
ma. En este caso, la reduccin proporcional de
error es del 14%. Adems, la reduccin proporcio
nal de error es exactamente el cuadrado de la conrelacin total. La raz cuadrada de 0,14 es 0,37. Por
lo tanto, la correlacin total {denominada correla
cin mltiple y simbolizada con la R mayscula)
de la aceptacin por parte de los pares con respecto
a la enseanza no social y al entrenamiento social
tomados en su conjunto es R = 0,37.

ai' 7 Aceptacin por parte de Sos pares

(0>10)(Zgnsc^nKi
+ (0,32)(z Entrenamiento social)
A (0,10)(-2) + (0,32)(0) = -0,20
B (0,10)(0) + (0,32)(0) = 0
C (0,10)(2) + (0,32)(0) = -0,20
D (0,10)(0) + (0,32}(-2) = - 0 , 6 4
E (0,10)(0) + (G,32)(2) =-0,64
F
(0,10}(-2) + (0,32)(2) = -0,20 + 0,64 = -0,84
G (0,10j(-l) + (0,32)(-2) = -0,10- 0,64 = -0,74

Captulos

1. a) 50%, b) 16%, c) 98%, d) 84%, e) 50%,


f) 84%, g) 2%, h) 16%; i) 50, j) 45, k) 40,
1) 35, m) 30,
Nota: Ser mucho ms fcil resolver problemas
como ste trazando un dibujo de la curva nor
mal y marcndola como muestran los dibujos a
continuacin.

(a)

<b)

'^'Aceptacin por parte de los pares

(0,27)(Zgstyo^trea(^n) + (0,29)(^nlrananl!CIltoSocjaj)
(0,27)(-2) + (Q,29)( 0) = -0,54
(0,27)( 0) + (0,29)( 0) = 0
(0,27)( 2) + (0,29)(0) = -0,54
D
(0,27)( 0) + (0.29X-2) = -0,58
E (0,27)( 0) + (0,29)( 2) = 0,58
F (0,27)( 2) + (0,29)( 2) = 0,54 + 0,58
= 1,12
G (0,27)(-l)+(0,29)(-2) = -0,27 - 0,58
= -0,85
A
B
C

2. a) De la tabla de reas bajo la curva normal en el


apndice B, el 43% (0,43) presentan puntua
ciones Z entre la media y 1,5. Por definicin,
el 50% presentan puntuaciones Z por debajo
de la media. Por lo tanto, el porcentaje total
por debajo de 1,5 es 50% + 43% = 93%.
b) El 43% presentan puntuaciones 2 entre 1,5 y
la media, y dado que hay un 50% total por en
cima de la media, 50% - 43% = 7% quedan
por encima de 1,5 (o puede restar el 93% obte
nido en el ejercicio 2a y calcular que slo quedael7%deltotalde 100%).
c) El 43% de ios valores se encuentran entre la
media y 1,5, y la curva normal es simtrica.
Por lo tanto, un 43% estn entre la media y
-1,5. Dado que un 50% se encuentra debajo de
la media, esto deja un 7% por debajo de -1,5.
d) -93%, e) 2%, f) 98%, g) 33%, h) 4%,
i) 5%.
(Una vez ms, todos estos problemas son ms
fciles de resolver trazando un dibujo de la
curva normal y marcando las reas).

3.

a) El 10% superior significa que un 90% est por


debajo de l. D e este 90% , el 50% est por d e
bajo de la media. Por lo tanto, el 10% superior
e s aquel punto entre el cual se ubica el 40% de
los valores y la m edia. Buscando 4 0 ,0 en la ta
bla de reas de la curva normal (el nmero
ms cercano es 39 ,9 7 ), descubrim os q u e ;ste
equivale a una puntuacin Z de +1,28.
b) 2 ,33.
4. Puntuacin Z necesaria = 1,64, que corresponde a
una puntuacin original de 5 0 + (1 0 )(1 ,6 4 )= 66,4.
Explicacin: los valores correspondientes a casi
todo lo que m idam os en la naturaleza y en la psi
co lo g a tienden a seguir aproxim adam ente e l pa
trn particular que mostram os debajo, denom ina
do m odelo normal. En un m od elo normal, la m a
yora de lo s valores estn cerca del m edio co n can
tidades m enores pero iguales de valores a cada
extrem o. D ado que la curva normal est m atem ti
cam ente definida, se puede calcular la proporcin
exacta de valores en cualquier intervalo determ i
nado, y esas proporciones han sido calculadas y
presentadas en tablas esp eciales.

Las tablas de reas bajo la curva normal se basan


en lo que se denom inan puntuaciones Z. L as pun
tuaciones Z, a su vez, se basan en la m eda y el
desv o estndar. La m edia es el prom edio com n,
la sum a de todos lo s valores dividida por la canti
dad de ellos. El desv o estndar e s una m edida de
la dispersin de un grupo d e valores. S in detener
nos en detalles, indica la cantidad prom edi en que
lo s valores difieren del prom edio. (Para ser ex a c
tos, e s la raz cuadrada del prom edio d e los cua
drados de las diferencias de cada valor c o n el
prom edio). La puntuacin Z es la cantidad de d es
vos estndar que separan a un valor de la media.
La tabla de reas bajo la curva normal indica el
porcentaje de ca so s que estn incluidos entre la
m edia y cualquier puntuacin Z en particular.
D ado que sabem os qu e los valores de la
prueba de coordinacin sig u en una distribucin
normal, podem os buscar en la tabla la puntuacin
Z, que corresponde al punto entre e l cual s e en
cuentra e l 45% de los registros, la m edia (debido a
qu e la curva normal e s com pletam en te sim trica,

e l 50% de los valores s e encuentran por sobre la


m edia, quedando un 5% superior al 45% ). Esto
resulta ser una puntuacin Z d e 1,64 (en realidad,
no e x iste un punto exacto en la tabla para el 45% ,
por lo cual podram os haber tom ado tanto e l 1,64
c o m o e 1,65).
S i el desvo estndar es igual a 10, una pun
tuacin Z d e 1,64 est a 16,4 puntos por encim a de
la media. Sum ando ese resultado a la m edia 5 0 o b
tenem os un valor m nim o necesario de 66,4 para
estar en e l 5% superior.
5, a) 10/50: p = 10/50 = 0,2; b) .4; (c) (1 0 + 2 0 )/5 0
= 0 ,6; d) 0,6; e) 1.
6. U na m uestra es un grupo de personas analizadas
que representan e l grupo com pleto al que se pre
tende aplicar los resultados obtenidos, y que se de
nom ina poblacin. (En este caso, la poblacin est
formada por todos los alum nos secundarios austra
lianos)! S e estudia una m uestra porque sera m uy
poco prctico o im p osib le estudiar la poblacin
com pleta.
U na form a de asegurarse que una muestra
no es sistem ticam ente no representativa, es s e
leccionar la. m uestra al azar. E sto no sig n ifica ha
cerlo d e form a casual. Por ejem plo, tom ar s lo a
los alum nos que estn m s disponibles para parti
cipar en la prueba sera un m uestreo casu al. Pero
este no sera un buen m todo porque cualesquiera
que sean lo s factores que hicieron que esas perso
nas estuvieran dispon ibles, c o m o por ejem p lo v i
vir en una ciudad cercana, podran hacer que no
fueran representativos de la poblacin en su totali
dad. U n ejem plo de una verdadera seleccin al azar
sera conseguir una lista de todos los alum nos se
cundarios d e Australia, numerar a cada alum no y
luego utilizar una tabla de nmeros aleatorios para
escoger la cantidad que s e necesiten para realizar el
estudio.

Captulo 6
X,

a) U na hiptesis de investigacin s e l enunciado


de la relacin predicha entre pob laciones (por
ejem plo, que tendrn diferentes m edas).
b) La hiptesis nula es e l enunciado d e una rela
cin entre poblaciones opuestas, a lo que se
predice a travs de la hiptesis de investiga
cin {por ejem plo, que las dos poblaciones tie
nen la m ism a media).
c) La prueba de hiptesis es e l procedim iento e s
tadstico l g ic o para analizar la verosim ilitud
de un patrn de resultados particular logrado a
travs de un determinado estudio bajo e l su
puesto de que la hip tesis nula es verdadera.

2.

d) La distribucin comparativa es la distribucin


correspondiente a la situacin en la que la hip
tesis nula es verdadera; es la distribucin con la
cual comparamos el valor de ia muestra.
e) El nivel d e significacin de 0,05" e s aquella
situacin qu e s e da en la prueba de hiptesis,
en la que d ecidim os rechazar la hiptesis nula
porque la probabilidad de obtener e so s resul
tados en particular, si la hip tesis nula fuera
verdadera, es m enor al 5%.
f) U na prueba de una cola es un procedim iento
de prueba de hip tesis ert e l que la hiptesis de
investigacin esp ecifica una direccin particu
lar de la diferencia (por ejem plo, qu e la m edia
d e una poblacin ser m ayor que la de la otra).
i) a)
Poblacin 1: nios canadienses hijos de bi
bliotecarios.
Poblacin 2: todos lo s nios canadienses.
b) H iptesis de investigacin: lo s nios de la
poblacin presentan un prom edio ms alto
de habilidad para la lectura que los nios de la
poblacin 2.
c) H ip tesis nula: e l prom edio de habilidad
para la lectura de la poblacin I no es mayor
que el de la poblacin 2.
d) U na cola, porque la cuestin es si lo hacen
mejor"; por lo tanto, nos interesa la diferencia
s lo en una direccin.
ii) a)
Poblacin 1: personas que viven en determ i
nada ciudad.
Poblacin 2: todas las personas que viven en
la regin.
b) H ip tesis de investigacin: las poblaciones
1 y 2 presentan diferentes m edias de ingresos.
c) H ip tesis nula: las pob laciones 1 y 2 pre
sentan la m ism a m edia de ingresos.
d) D o s colas, porque la cuestin es si lo s in
gresos de las personas de la ciudad son dife
rentes a los ingresos de los que viven en toda
la regin; por lo tanto, nos interesa una dife
rencia en cualquier direccin.
iii) a) Poblacin 1: personas que han sufrido la
experiencia de un terremoto.
Poblacin 2: personas en general.
b) H ip tesis de investigacin: las poblaciones
1 y 2 presentan diferentes m edias en cuanto a
n iveles de confian za en s m ism os.
c) H ip tesis nula: las poblaciones 1 y 2 pre
sentan la m ism a m edia en cuanto al nivel de
confianza en s m ism os.
d) D o s colas, porque podran tener m s com o
m enos confian za en s m ism os.

P u n tu a ci n Z en la
E stu d io C orte d istr ib u ci n D e cisi n

4.

+ 1,64

2 ,0

1 ,9 6

2 ,0

C
D
E
F

+2,33
2,57
+ 1,64
2,57

2 ,0
2 ,0
1,0
4 ,0

2,57

3 ,0

H
I

2 ,5 7
- 1 ,6 4

2,0
- 2 ,0

R echaza
la hip tesis nula
R echaza
la hip tesis nula
N o concluyente
N o concluyente
N o concluyente
R echaza
la hip tesis nula
R echaza
la hip tesis nula
N o concluyente
R echaza
la hiptesis nula

L os cinco pasos de la prueba de hiptesis son:


1. Replantear el problem a en funcin de hi
ptesis de investigacin e hiptesis nula de las po
blaciones. Las dos poblaciones de inters son:
P o b la ci n 1: alum nos que han evitado
utilizar su sentido d el olfato.
P o b la ci n 2: alum nos en general.
La hiptesis de investigacin supone que los
alumnos que evitaron utilizar su sentido del olfato
(poblacin l) tendrn un rendimiento m s bajo que
los alum nos en general (poblacin 2 ) en lar prueba
del sentido del gusto. La hiptesis nula supone que
los alum nos que evitaron utilizar sus sentidos del
olfato (poblacin i ) no tendrn un rendimiento ms
bajo en la prueba que lo s alum nos en general (po
blacin 2).
2. D eterm inar las caractersticas de la distri
bucin comparativa. La distribucin com parativa
ser igual a la poblacin 2 . Segn s e establece en
el enunciado dei problem a, p, = 14 y cr = 4. Supon
dremos que presenta una curva normal.
3. D eterm inar e l punto muestra! de corte en
la distribucin comparativa, e n e l que debera re
chazarse la hip tesis nula. Con un nivel de 0,05
para una prueba de una cola, e l corte s e ubica en
-1 ,6 4 .
4. D eterm inar e l valor muestral en la distri
bucin comparativa. E l valor muestral era 5.
Z = ( 5 - I 4 ) /- 4 = - 9 / 4 = -2 ,2 5 .
5. Comparar los valores de io s p asos 3 y 4
para decidir si se rechaza o no la hip tesis nula.
U na puntuacin Z d e - 2 ,2 5 s e encuentra por deba
jo del punto de corte establecido en -1 ,6 4 . Por lo
tanto, podem os rechazar la hip tesis nula. S e so s
tiene la h ip te sis d e in v e stig a c i n : no u tilizar e l

se n tid o d el o lfa to pro v o ca m en o s id e n tific a c io


n es correctas.
Explicacin: resum iendo, este problem a se
resuelve considerando la posibilidad de que ocurra
el escenario en el que no tener el sentido del olfato
no produce diferencia alguna. Si el sentido d el o l
fato no produjera ninguna diferencia, la probabili
dad de que el alum no analizado obtenga una
cantidad determinada de identificaciones correctas
e s sim plem ente igual a la probabilidad de que los
alum nos en general obtengan una cantidad deter
m inada de identificaciones correctas. Y dado que
co n o cem o s la distribucin de la cantidad de identi
ficaciones correctas de lo s alum nos en general, esa
probabilidad puede ser determinada, y sucede que
seria bastante im probable obtener s lo 5 identifi
caciones correctas; por lo tanto, el investigador
co n clu y e que la falta del sentido del olfato produce
una diferencia.
Para entrar un poco m s en detalles, el punto
clave es determinar las probabilidades. Su pone
m os que la cantidad de identificaciones correctas
de lo s alum nos en general se distribuye en forma
normal: se trata de un patrn m atem tico esp ecfi
co, la curva normal, a veces, denom inada forma
de cam pana, en la que en la m ayora de los casos
se ubican en el m edio y van dism inuyendo progre
sivam ente a m edida que lo s nmeros aumentan o
dism inuyen. E xisten tablas que muestran exacta
mente qu proporcin de casos se ubica entre el
m edio y cualquier punto en particular de la curva
normal. Estas tablas utilizan puntuaciones 2 ,
versiones transformadas de lo s valores originales,
que representan la cantidad de d esv o s estndar
por encim a de la m edia. La m edia e s el prom edio
ordinario (la sum a d e lo s v a lo res dividida por la
cantidad de v a lo res). El d e sv o estndar p u ed e
considerarse c o m o la cantidad prom edio en la
que lo s valores difieren de la m edia. (E stricta
m ente hablando, es a raz cuadrada d el p ro m e
dio de lo s cuadrados d e la d iferen cia de cada
valor co n resp ecto a la m edia).
A l evaluar el resultado de un experim ento,
m uchos investigadores utilizan la norma conven
cional que establece que si un resultado podra ha
ber ocurrido m enos de un 5 % de las veces bajo un
escenario determinado, e se escenario ser co n si
derado improbable. Las tablas de reas bajo la cur
va normal muestran que e l 5% superior de la curva
normal com ienza con una puntuacin Z de 1,64.
D ado que la curva normal es com pletam ente sim
trica, el 5 % inferior incluye a todos las pun
tuaciones Z debajo de -1 ,6 4 . Por io tanto, incluso
antes de realizar el experim ento, el investigador
probablemente, establezca la siguiente regla: el es-

cenario en el que la falta del sentido d el olfato no


produce diferencias ser rechazado com o im pro
bable si la cantidad de identificaciones correctas
(convertidas a puntuancin Z utilizando la m edia y
el desvo estndar correspondiente a lo s alum nos
en general) e s menor a -1 ,6 4 .
L a cantidad real de identificaciones correc
tas d el alum no que no pudo utilizar el sen tido del
olfato fu e 5, S e nos dice que la curva normal c o
rrespondiente a io s alum nos en general presenta
ba una m edia de 14 y un desvo estndar de 4.
C in co iden tificacion es1correctas im plican 9 por
debajo de la m edia de 14; en trm inos de d esv o s
estndar de 4 por unidades cada uno, im p lica 9/4
d e sv o s por debajo de la m edia, e s decir, una pun
tuacin Z de -2 ,2 5 .
D ado que - 2 ,2 5 es m enor que -1 ,6 4 , e l investiga
dor con clu ye que e l escenario en e i qu e la falta del
sentido del olfato no produce efectos es improba
ble. El grfico que sigue ilustra el problema:

5.

6.

E l punto de corte (con nivel 0,01 para una prueba


de una cola) e s igual a -2 ,3 2 6 ; la puntuacin Z en
la distribucin comparativa correspondiente al pa
ciente estudiado e s +1,2; el experim ento no e s
concluyente.
L os cin co pasos de a prueba d e hip tesis y
la explicacin son sim ilares a ios dei ejercicio 4,
excepto que a explicacin puede ser m s breve ya
que e l resultado e s contrario a la hip tesis, y n o e s
necesario explicar M , S D y Z.
Las dos M s (5,7 y 4,8) y la " p < 0,05 son crucia
les. M significa m ed ia, el promedio de los valores
de un determinado grupo. La cantidad prom edio de
veces por da que los participantes co n alto grado
de narcisism o se miraron ai esp ejo fu e de 5,7,
m ientras que el prom edio para lo s participantes
con bajo grado de narcisism o fu e d e s lo 4,8. La
p < 0 ,0 5 indica que esta diferencia es estadstica
m ente significativa al nivel 0,05, e s decir, si ei ni
vel de narcisism o de una persona no produjera
ninguna diferencia en cuanto a la frecuencia con
que esa persona se mira en el espejo, las p osib ili
dades de encontrar dos grupos de participantes que
presentaran esta diferencia en cuanto a mirarse en

el esp ejo s lo por casualidad, sera m enor a 0,05


(m en os del 5%). Por lo tanto, rechazam os esa po
sibilidad por im probable y concluim os que e l nivel
de narcisism o efectivam ente produce una diferen
cia en cuanto a la frecu en cia con que una persona
s e mira al espejo.

Captulo 7
1.

E l d e sv o estndar de la distribucin de m edias es


m enor al desvo estndar de la distribucin poblacional de individuos, porque ex iste m enos variacin entre m edias de muestras formadas por ms
de un valor que entre valores individuales. E xiste
m enos variacin porque la probabilidad de que dos
registros extrem os en la m ism a direccin sean e le
gid o s al azar para formar la m ism a muestra es m e
nor qu e la probabilidad d e que cada uno de estos
valores extrem os sea eleg id o individualm ente.

2. a)
a 2 = 102 * 100; ct2m = a 2 N = 100/2 = 50; a M
= V o \ , = V50 = 7,07 b) 5,77; c) 5; d) 4,47; )
3,16; f) 2,24; g) 1.
3. a) L m ite superior = M + (<xM) ( l,9 6 ) = 100 +
(7 .0 7 ) (1 ,9 6 ) = 113,86; Emite inferior = 100 +
(7 .0 7 ) (~ i,9 6 ) = 86,14. b) 111,31, 88,69; c)
1 0 9 ,8 ,9 0 ,2 ; d) 1 0 8 ,7 6 ,9 1 ,2 4 ; e ) 1 0 6 ,1 9 ,9 3 ,8 1 ; )
1 0 4 ,3 9 ,9 5 ,6 1 ; g ) 1 0 1 ,9 6 ,9 8 ,0 4 .
4. Dado que la distribucin de la poblacin de indivi
duos es normal, tambin lo ser la distribucin de
medias. Por lo tanto, basndonos en la tabla de reas
bajo la curva normal, se necesita una puntuacin Z de
a menos 1,64 para estar dentro del 5 % superior. Para
la muestra, a: crM= '/(36/T) = 1,90. Z (en la distribu
cin de medias) = (44 - 4 0 )/l ,90 = 4/1,90 = 2,11. Da
do que 2 , l es ms extremo que 1,64, la muestra
tiene m enos de un 5 % de probabilidades. La respues
ta final para e l punto b tiene ms de un 5% de proba
bilidades; para el punto c, menos probabilidades y

5.

para el punto d, ms del 5% de probabilidades. Las


distribuciones estn representadas en el grfico
que sigu e a continuacin,
a) L os c in c o pasos d e la prueba de h ip te sis:
1. R eplantear e l problem a en fu n ci n de
h ip te sis d e in v e stig a c i n e h ip te sis nula
sobre p o b la cio n e s. Las d o s p o b la cio n e s
son:
P o b la ci n 1: mujeres m ayores que reciben
el programa e sp e c ia l
P o b la c i n 2: mujeres m ayores en general
(que no reciben el programa esp ecial).
La hiptesis de investigacin establece que la
poblacin de mujeres m ayores que reciben el
programa esp ecial (poblacin 1) tendrn un
tiem po de reaccin ms rpido que las m uje
res m ayores en general (p oblacin 2). La hi
ptesis nula establece que io s valores de la
poblacin 1 no sern m enores que los de la p o
blacin 2 .
2. Determinar las caractersticas d e la distri
bucin comparativa. La distribucin com para
tiva es una distribucin de m edas d e muestras
form adas por 25 valores, tom ados d e la distri
bucin d e la poblacin 2. p, = 1,8; a 2^ ~ Q 2i N
= 0 ,5 2/2 5 = 0 ,2 5 /2 5 = 0,01;
= V0,01 = 0,1.
D ado que la poblacin e s normal, la distribu
ci n de m edias e s normal.
3. D eterm inar los valores mustrales de co r
te en la distribucin comparativa a partir de
lo s cuales debera rechazarse la hip tesis nula.
U tilizando una prueba de una cola (lo s investi
gadores predijeron un m enor tiem po de reac
cin) a nivel 0 ,0 1 , e l punto de corte e s - 2 ,3 3 .
4 . D eterm inar e l valor m uestral en la d is
tribucin com parativa Z = ( l , 5 - l , 8 ) / 0 , =
-0 ,3 /0 ,1 * - 3 .
5. Comparar lo s registros de lo s p asos 3 y 4
para decidir si s e rechaza o no la hip tesis nu
la. D ado que - 3 es m enor a - 2 ,3 3 , podem os
rechazar la hiptesis nula. S e so stien e la hip
tesis de investigacin; las m ujeres m ayores
que participaron del programa esp ecia l m ues
tran un m enor tiem po prom edio de reaccin.
b)
Intervalo del 99% de certeza: lm ite superior
= i l + ( 0 M)(2 ,5 7 ) = 1,5 + (0 ,l)(2 ,5 7 )
~ 1,5 + 0 ,2 5 7 = 1,76; lm ite inferior
= l,5 + ( 0 , ) ( - 2 ,5 7 ) = 1,24.
c) E xplicacin: s e trata de un problema estndar de
prueba de hiptesis, excepto por e l hecho de qu e no
podem os comparar directam ente e l tiem po de reac
cin del grupo de las 25 mujeres analizadas con la
distribucin d e los tiem pos de reaccin de mujeres
individuales en general. Esto ocurre porque la dis
tribucin de mujeres en general es una distribucin

de valores individuales, y nosotros tenem os el pro


m edio de un grupo de puntuaciones de 25 perso
nas. La probabilidad de que un grupo de valores
tenga una m edia extrem a, s lo por azar, e s m ucho
m enor a la probabilidad d e q u e cualquier individuo
tenga un valor extrem o s lo por azar, (E sto ocurre
porque al seleccionar valores a' azar cuando sele c
cionam os varios valores, cualquier valor extrem o
probablemente ser equilibrado por valores m enos
extrem os o extrem os en direccin opuesta). Por lo
tanto, la distribucin adecuada para comparar la
m edia de los tiempos de reaccin del grupo d e 25
personas e s la distribucin que resultara si sele c
cionam os al azar muchas series de 25 valores de
tiem pos de reaccin y calculramos la media de ca
da serie de 25 valores.
Tal distribucin, formada por diversas m e
dias m ustrales, tiene la m ism a m edia que la distri
bucin original de valores individuales (no existe
razn para que sea de otro m odo), pero es una cur
va ms estrecha ya que las posibilidades de que
existan extrem os es menor. D e hecho, se sabe m a
temticam ente que su varianza ser exactam ente la
varianza d e la distribucin original de observacio
nes individuales dividida por la cantidad de valores
de cada muestra. En este caso, tendremos una d is
tribucin de m edias c op una m edia de 1,8 y un des
vo estndar de 0,1 (V(52/25)), y ser, adem s, una
distribucin normal porque una distribucin de d i
versas m edias tom adas de una poblacin normal
m ente distribuida tambin es normal.
El punto de corte correspondiente al nivel de
significacin 0,01, y una prueba de una cola, es
-2 ,3 3 . La clasificacin m edia del grupo d e 25 mu
jeres que recibieron e l programa esp ecial, 1,5, esta
ba a 3 d esvos estndar por debajo de la m edia de la
distribucin de m edias, siendo claramente m s e x
trema que e l punto de corte. Por lo tanto, podem os
rechazar la hiptesis nula y concluir que la infor
m acin sostiene la hiptesis que establece que las
mujeres mayores que participan del programa e s
pecial demuestran tener menores tiem pos de reac
cin. E l intervalo de confianza es una estim acin
del conjunto de valores que probablem ente incluya
la verdadera m edia poblacional del grupo estudia
do (poblacin 1: en este problema, las mujeres que
reciben e l programa esp ecial para mejorar el tiem
po de reaccin). U n intervalo del 99% de confianza
es e l conjunto de valores que nos da un 99% d e
certeza de incluir la verdadera m edia poblacional.
Para calcular los lm ites superior e inferior del inter
valo, com enzam os por considerar que la m ejor esti
m acin puntual de la m edia de la poblacin 2 es la
m edia de la muestra tom ada de esa poblacin (en
este caso, 1,5). Tambin suponem os que e l desvo

estndar de la distribucin de m edias para esta po


blacin 2 es el m ism o que el de la poblacin con o
cida (que ya calculam os en 0,1). B asndonos en
esta inform acin, si la m edia real d e la poblacin
era 1,5, el 9 9 % de las veces las m edias mustrales
se ubicaran entre una puntuacin Z de +2,57 (el
punto en la curva normal que inclu ye 49,5% de los
registros por sobre la m eda) y 2,57. En nuestro
. ejem plo, estas puntuaciones Z corresponden a las
: puntuaciones originales 1,76 y 1,24.
L os valores que hem os calculado son los lim ites
del intervalo de confianza. Por qu? Supongam os
que la m edia real de la poblacin fuera 1,76. En
ese cas, existira un 0,5% de posibilidades de ob
tener una m edia.tan baja o ms baja que 1,5, (Es
decir, con una m edia de 1,76-y un desvo estndar
de 0 ,1 ,1 ,5 est exactam ente 2 ,5 7 desvos estndar
por debajo de a m edia, que es el punto que corres
ponde al corte del 0,5% inferior). D e m odo sim i
lar, si la m edia real de la poblacin fuera 1,24,
habra s lo un 0,5% de posibilidades de obtener
una m edia m ayor a 1,5.
6, a) L os c in co pasos de la prueba de hiptesis debe
ran realizarse de1manera sim ilar a los descriptor

2,

en el problem a 5 anterior. La inform acin clave


para este problem a es que la distribucin de m e
dias estar norm alm ente distribuida con una m edia
de' 5,5 y un desvo estndar de 0 ,2 (es decir,
16). U tilizando una prueba de una c ola a un
nivel de 0,05, el punto de corte necesario es 1,64.
L a puntuacin m edia muestra! d e 5 ,9 se ubica, en
esta distribucin, 2 desvos estndar por encim a de
la media: (5 ,9 - 5,5)/0,2. Por lo tanto, se rechaza la
hiptesis nula.
b) Intervalo del 95% de confianza: Emite superior =
M + (o'(W)( l,9 6 ) - 5,9 + (0,2)(1,96) = 5,9 + 0 ,392 =
6,29; lim ite inferior= 5 ,9 + (0 ,2 )(- l,9 6 ) = 5,51.
c) La descripcin para una persona qu e nunca ha
estudiado estadstica sera sim ilar a la descripcin
que aparece en la respuesta al problem a 4 del cap
tulo 6, m s e l material adicional de la respuesta al
problem a 5 de este captulo.

Captulo 8
1. A lfa es la probabilidad d e rechazar la hip tesis nu
la cuando es verdadera. B eta es la probabilidad de

C o n c lu si n
a r ro ja d a p o r la

p r u e b a d e h ip tesis
(a) Rechazar
la pula
No concluyente

(b) Rechazar
la nula

N o concluyente

(c) Rechazar
la nula

N o co n clu y en te.

C o n d ici n r ea l d e la h ip te sis d e in v e stig a c i n


V erd adera

F alsa

D ecid ir que un m ayor descanso mejora


el com portam iento es la d ecisin correc
ta; de hecho, lo hace.

D ecidir que m ayor descanso m ejora


e l comportam iento, d ecisin incorrecta;
de hecho, no lo hace,

D ecid ir que se descon oce la relacin entre


descanso y com portam iento, decisin
inadecuada; de hecho, un m ayor descanso
mejora e l com portam iento.

D ecidir que se descon oce la relacin entre


descanso y com portam iento, d ecisin
adecuada; de hecho, no estn,relacionados.

D ecid ir que, ios'daltnics distinguen


mejor, decisin correcta; de hecho lo ha
cen,

D ecidir que los daltnics distinguen mejor,


decisin incorrecta; de hecho no lo hacen.

D ecidir que se descon oce si lo s daltnics


distinguen mejor, decisin inadecuada;
de hech o lo hacen.- '

D ecidir que se d escon oce si los daltnics


distinguen mejor, decisin adecuada;
de hecho no lo hacen.

D e cid ir que los individuos que han


asistido a psicoterapia son ms tolerantes,
d ecisin correcta; lo son.

D ecidir que individuos que han asistido


a psicoterapia son m s tolerantes, decisin
incorrecta; no lo son.

D ecid ir que s e descon oce s son o n o ms


tolerantes, decisin inadecuada; lo son.

D ecid ir que s e d escon oce si son o no ms


tolerantes, decisin adecuada; n o lo son.

no rechazar la hiptesis nula cuando en realidad la


hiptesis nula es falsa,

Z necesario
para obtener
significacin

3. V a s e la tabla en la parte superior de la siguiente


colum na y la figura en la parte superior de la pr
(a )

xim a pgina,
4, Z necesario para significacin = 1,64; a M - 2 (es
decir,V[144/361 - 2); puntuacin original necesa

(b)
(c)
(d)

ria para significacin = 5 3 ,28 (es decir, 50 +

(e)

[1,64][2] = 53,28); puntuacin Z correspondiente

(0

en la distribucin predicha = - 0 ,8 6 (es decir,

=50,81 (es decir, 1 - 0 ,1 9 ) .

Explicacin: La potencia es la posibilidad de


rechazar la hip tesis nula si la hiptesis de investi
gacin es verdadera, Para calcular la potencia, e l
primer paso e s determinar las caractersticas de la
distribucin comparativa. En este experim ento, se
r una distribucin de m edias (de muestras d e 36

0,4 *
0,4
0,2
1,0
0,4
0,4

90,66
90,66
90,33
91,64
90,93
90,78

Z para significacin
Tan
en la poblacin
predicha
Beta Potencia del e

[53,28 - 553/2 = -0 ,8 6 ); segn la tabla Z, beta =


0,19; potencia

1,64
1,64
1,64
1,64
2,33
1,96

Valor
para obtener
significacin

(a)(90,66 - 91)/0,4 = -0,85 0,20 0,80


(b)(90,66 - 92)/0,4 = -3,35 <0,01 >0,99
(c)(90,33 - 91)/0,2 = -3,35 <0,01 >0,99
(d)(91,64-9i)/1 = 0,64 0,74 0,26
(e)(90,93 - 91)/0,4 = -0,18 0,43 0,57
(0 (90,78 - 91)10,4 = -0,55 0,29 0,71

artistas cada una) que est normalm ente distribui

1/4

1/2
1/2
1/4

1/4
1/4

El dibujo de las distribuciones superpuestas para


la versin a aparece en la parte superior d e la
pgina 6 3 4 .

da (ya que la poblacin lo est) con una m edia de


50 y un desv o estndar de 2 (segn lo s clculos
descriptos anteriormente). Para rechazar la hipte
sis nula, la puntuacin Z de la m edia muestra! debe
ser superior a 1,64 (se trata de una prueba de una
c ola a nivel 0 ,0 5 ), lo que corresponde a una m edia

5.

muestra! d e 5 3 ,2 8 puntos originales.


Ahora bien, ios clculos de la potencia son
los siguientes. El investigador elabor la hiptesis
de que la m edia pobacional de artistas es 55 (e,

6.

im plcitam ente, que esta poblacin tambin es


normal con la m ism a a de 12). La distribucin de
m edias de esta poblacin sera normal con una m e
dia ~ 5 5 y

Ya determ inam os que cualquier

m edia por sobre 5 3 ,28 ser significativa en trmi


nos de la distribucin comparativa. Pero un valor
de 53 ,2 8 se corresponde con una puntuacin Z de
s lo - 0 ,8 6 en la distribucin basada en la hipte
sis del investigador. U tilizando la tabla de reas
bajo la curva normal, el 81% del rea bajo la curva
se encuentra por encim a de este punto. Suponien
do que las predicciones del investigador sean co
rrectas, ex iste un 81% de posibilidades de que una
muestra de 36 artistas produzca un resultado lo su
ficientem ente alto com o para rechazar la hiptesis
nula. Es decir, la potencia es del 81%.
L as d o s d istrib u cio n es de m ed ias in v o lu
cradas y la s reas de sig n ific a c i n y p o ten cia
est n rep resen tadas g r fica m en te ai fin a l d e la
s ig u ie n te pgina.

7.

a) N o la afecta (eso es lo que prueba e l nivel de


significacin).
b) Probablemente de p oca im portancia (debido
al pequeo tamao del efecto).
a) A um enta la potencia; b) dism inuye la poten
cia; c) aumenta la potencia; d) dism inuye la
potencia; e) dism inuye la potencia.
a) A l planificar un experim ento, para permitir
cam bios de distinto tipo (o inclu so abandonar
el proyecto) si la potencia e s dem asiado baja.
(O posiblem ente hacer que el proyecto sea m e
nos costoso, por ejemplo, reduciendo la canti
dad de participantes si la potencia es ms alta de
lo razonablemente necesario),
b) D espu s de realizar un estudio que ha arrojado
resultados no concluyentes, para evaluar si la
falla del estudio debera atribuirse a que la hi
ptesis nula es falsa (en el caso de que la p o
tencia sea alta) o a una potencia inadecuada,
de form a tal que an es razonable pensar que
futuras investigaciones podran tener la p osi
bilidad de ser significativas, (A dem s, en el
caso de un resultado significativo con un gran
tam ao de muestra, si la potencia e s m uy alta,
esto sugiere que es posible un bajo tamao del
efecto indicando que, aunque el resultado es
significativo, puede no ser m uy importante).

Puntuaciones originales: 89,2


Puntuaciones Z:

89,6

90
-3

90,4
-2

90,66
-i
-0,85

-si

+2

1.

a)

necesario (g l = 63, p < 0,05, una cola) = ~ l,6 7 ,


5 <u = (

= c V 9 / 6 4 ) = V o T 4 ! = 0 ,3 8 .

t = ( M - W /5 m - { 1 i - 1 2 , 4 0 ) /0 f3 8
= - 1 , 4 0 7 0 ,3 8 = - 3 , 6 8 .

S e rechaza la hiptesis nula.


b)

t necesario = 2 ,690; S M = 2,55; t = 1,32;

no se rechaza la hiptesis nula,


c)

necesario = 2 ,364; S M = 0,13; t = 3,15;


se rechaza la hiptesis nula.

2.

a)

Pasos de la prueba d e hiptesis:


1. Replantear el problem a en fu ncin de
hiptesis de investigacin e hiptesis nula
de poblaciones.
P o b la ci n 1: tiem po d e respuesta con el
nuevo je fe de polica.
P o b la ci n 2: tiem po de respuesta co n el
antiguo je fe de polica.
La hiptesis nula esta b lece que las dos
poblaciones son iguales. La hiptesis de
investigacin establece que las dos poblacio
nes son diferentes.
2.

Determinar

las

caractersticas

de

la

distribucin comparativa..
Poblacin 2: form a = s e presum e normal;
(X = 30; a 2 = desconocida;

3.

& = Z ( X - M ) 2/( N - 1 ) = S S /g l

Sw= V(S2/W)= ^(8 29/20) = >415=0,64.


t = ( M - i )/S m = (1,7 - 0)70,64 = 2,66.

= 1 2 4 /( 1 0 - 1 ) = 13,78.
Distribucin d e medias: form a = t ( g l = 9);

S e rechaza la hiptesis nula.

11^=30;

d = M /S = 1,7/ v8^29 = 0,59.

SM = ' W f f j = V (l3 J 8 7 l ) = 1,17

3. Determ inar e l punto muestral d e corte en


la distribucin comparativa, a partir d el cual
debera rechazarse la hip tesis nula.
t necesario ( g l - 9 , p < 0 ,0 5 , una co la )

= -1 ,8 3 3 .
4. Determinar el valor muestral en la distri
bucin comparativa.
La m edia del nuevo je fe d e polica es
M = 1 ~ X /N = 2 8 0 /1 0 = 28.

f = ( U - jx)/5 a = (28 - 3 0 )/l,1 7 = -1 ,7 1


5. Comparar los registros de Jos pasos 3 y 4
para decidir si s e rechaza o no la hiptesis nula.
El registro en 4 (- 1 ,7 1 ) no es m s extrem o
que e l registro en 3 (- 1 ,8 3 3 ). Por lo tanto, no
s e rechaza la hiptesis nula.

c) E xplicacin: es la m ism a que la d el problema


4, serie 1, de este captulo, excepto que en lu
gar de diferencias, aqu s e utilizan lo s valores
reales, y la m edia poblaconal esperada son
los 3 0 m inutos (1/2 hora) que e l je fe de p olica
haba prom etido cuando era candidato.
a) t necesario ( g l = 19, p < 0 ,0 5 , una cola)
= 1,729.

4,

b) necesario = 1,980;
= V l 4 l 3 7 l 6 4 = 1,59; = (2,3 - 0)71,59 =
1,45; no s e rechaza la hip tesis nula; d = 0,11.
c ) t necesario = -2 ,6 2 4 ; S M = 0,52; / = -4 ,2 3 ;
s e rechaza la hiptesis nula; < 1,1.
a) Pasos de la prueba d e hiptesis:
1. Replantear el problem a en funcin de h i
ptesis de investigacin e hiptesis nula de
poblaciones.
P o b la c i n 1:
ciudades com o aquellas que
participaron en el programa
para reducir los residuos.
P o b la c i n 2:
ciudades que no cam bian en
cuanto a cantidad de residuos
durante un periodo de un ao.
La hiptesis de investigacin establece que la
poblacin presenta una m edia de disminucin
de residuos superior a la de la poblacin 2 . La

5.

hip tesis nula establece que la poblacin 1 no


tiene una m edia de dism inucin de residuos
m ayor qu e la d e la poblacin 2.
2 . Determ inar las caractersticas d e la distri
bucin comparativa.
Forma de a poblacin 2 = se presum e normal;
ja s 0; cr2 = desconocido; 2 = 50/3 = 16,67;
Forma de la distribucin de m edias = t (g l = 3);
~ 0; S M V S 2 / = V l^67/4= > / l 7 = 2,04
3- Determ inar lo s valores m ustrales de cor
te en la distribucin comparativa, a partir de
los cuales debera rechazarse la hiptesis nula.
t necesario ( g l - 3 , p < 0 , 0 l , una c o la )- 4 ,5 4 1 .
4. D eterm inar el valor muestra! en la distri
bucin comparativa.
Valores de cam bio = 7 ,6 , - 1 , 8 ;
M = 2 0 /4 * 5; t - (5 - )/2,04 = 2,45
Comparar lo s valores de los pasos 3 y 4 para decidir
si se rechaza o no la hiptesis nula.
f en 4 (2 ,4 5 ) no es m s extrem o que el l de
corte en 3 (4,541).
Por lo tanto, no se rechaza la hiptesis nula,
b)

Valores de cambio
(muestra real)

c) d a M /S = 5 / - M W = 5 /4 ,0 8 = 1,23

d)

Explicacin: lo primero que hice fue sim plifi


car la s c o sa s convirtiendo lo s nm eros en va
lores de cam bio para cada ciudad, cantidad
de residuos con posterioridad al programa
(19 9 8 ) m enos cantidad d e residuos con ante
rioridad al programa (1997). D esp u s calcul
la m edia de e so s valores de cam bio, que era 5,
y que indica una dism inucin de c in c o libras
de residuos por m anzana por da.
E l siguiente paso fue analizar si este resulta
do, correspondiente a estas cin co ciudades, in
dica alguna diferencia real en form a general
com o con secu en cia d el programa. La otra al
ternativa es la posibilidad de que este cam bio
podra haber ocurrido en cualquiera de las
otras cuatro ciudad es seleccion ad as al a 2 ar
s lo por casualidad, aun cuando e l programa
en general no tuviera ningn e fe c to real. Es
decir, im aginam os qu e e l cam bio prom edio en
ciudades en general que im piem entan este
programa e s realm ente 0, y tal v e z s lo ocu
rri que para este estudio se seleccionaron
cuatro ciudades que, de todos m od os, hubie
ran dism inuido su nivel de residuos.
E ntohces, determ in precisam ente cunto
tendra que cambiar un grupo de cuatro ciuda
des antes d e que y o pudiera concluir que han
cam biado dem asiado co m o para atriburselo a
la casualidad. Esto requiri el clcu lo d e las
caractersticas de esa poblacin hipottica de
ciudades en la que, en prom edio, no existe
ningn cam bio. Su m edia sera 0 cam bio (es
decir, una m edia de cam bio igual a 0 es exac
tam ente com o describiram os un prom edio de
ausencia de cam bio). D ado que n o conoca la
variasza de esa distribucin hipottica de ciu
dades en las que no s e produca ningn cambio,
la estim a partir de la inform acin provenien
te de la muestra de las cuatro ciudades. S i la
muestra era slo una eleccin casual de la po
blacin hipottica, su varianza debera ser re
presentativa de la poblacin hipottica.
Sin em bargo, la varianza calculada a partir
de la muestra en general ser levem ente m enor
que la verdadera varianza poblacionai, ya que
la varianza de la muestra s e basa en d esvos
cuadrticos de la m edia muestra!. La m edia de
la muestra es e l punto de equilibrio perfecto
de sus valores, de manera qu e la sum a de lo s
d esvos cuadrticos calculada a partir de ella
ser m enor q u e la sum a d e desvos cuadrticos
calculada a partir d e cualquier otro nmero
(tal com o la m edia poblacionai). Por lo tanto,
tuve que m odificar la frm ula de la varianza
para tener en cuenta esa diferencia: en lugar

de dividir la sum a de lo s desv o s cuadrticos


por la cantidad de valores, la divid por los
grados de libertad, que e s la cantidad d e va
lores m enos 1, en este caso 3, (El ajuste tiene
en cuenta precisam ente ia tendencia de la vadan za de una muestra a subestimar la verda
dera v a r ia b a poblacional). Tal com o lo
indican lo s clculos en los pasos de la prueba
de hiptesis, esto dio una varianza poblacional
estim ada (S 1) igual a 16,67.
C om o no estaba interesado en ciudades indi
viduales sino en un grupo de cuatro, lo que
realmente necesitaba saber eran las caracters
ticas de una distribucin de todas las m edias
posibles de muestras formadas por cuatro ciu
dades, tomadas d e esa poblacin hipottica de
valores de cam bio correspondientes a ciuda
des individuales, Tal distribucin de m edias
tendr la m ism a m edia (ya que no ex iste razn
para esperar que las medias de e so s grupos de
cuatro tom ados al azar sean sistem ticam ente
m ayores o m enores que 0). Pero esa distribu
cin tendr una varianza m ucho m enor (por
que es m ucho m enos probable que sea extrem o
el prom edio de un grupo de cuatro valores que
cualquier valor individual). Afortunadamente,
se sabe (y se puede probar m atem ticamente)
que ia varianza de una distribucin de m edias
es la varianza d e la distribucin de observacio
nes ind ividu ales dividida por la cantidad de
ind ividu os de cada muestra. En nuestro ejem
plo, esto e s igual a 16,67 dividido 4, lo que
da 4,1 7 , Por lo tanto, el desv o estndar de
esta distribucin e s la raz cuadrada de 4 ,1 7 ,
e s decir, 2 ,0 4 .
Tambin ocurre que si podem os suponer que
ia poblacin hipottica de valores de cam bio
de las ciudades individuales est norm alm ente
distribuida (y no tenem os razn para pensar
de otro m odo), podem os considerar que la dis
tribucin de m edias de muestras de esa distri
bucin tiene una forma precisa conocida, de
nom inada distribucin t (que tiene co la s le
vem ente m s altas que la curva normal). Si
buscam os en una tabla para distribucin t el
ca so en e l que hay 3 grados de libertad utiliza
dos para estimar la varianza poblacional, la ta
bla indica que ex iste m enos de un \ % de
probabilidad de obtener un valor que se en
cuentre a una distancia de 4,541 d esv o s e s
tndar o ms de la m edia de esa distribucin.
El valor de cam bio m edio de la presente
muestra de cuatro ciudades era 5, lo que dara
2,4 5 (es decir, 5 /2 ,0 4 ) desv o s estndar por en
cim a de la m edia de 0 cam bio, en la distribu

5.
6.

cin de m edias de registros de cam bio. Dado


que este resultado no es tan extrem o com o
4,541, existe ms de un 1 % de probabilidad de
que e sos resultados pudieran haber surgido de
una distribucin hipottica en la que no se pro
duca ningn cam bio. Por lo tanto, el investi
gador no puede descartar esa posibilidad, y se
dira que el experim ento no e s concluyente.
Finalm ente, es posible describir el nivel del
efecto en un formato estandarizado denom ina
do tamao del efecto (d ). El tamao del efecto
es precisam ente la m edia de los valores de
cam bio dividida por el desvo estndar pobla
cional estim ado, en este caso, 5 dividido 4,08,
lo que da 1,23. Esto significa que el cam bio
entre antes y despus del programa fue de
m s d e 1 d esvo estndar; en co n secu en cia,
se trata d e un cam bio bastante considerable.
S in em bargo, aun con ese im portante nivel de
cam b io, e l resultado no fu e sign ificativo (in
dudablem ente debido al tam ao tan pequeo
de la m uestra, que estaba form ada s lo por
cuatro ciudad es).
Segn tabla 9 -9 :
a) 0,22; b) ,71; c) 0,86; d) 0,77; e) 0,99.
La m edia es e l prom edio ordinario (la sum a de lo s
valores dividida por la cantidad de valores). Por lo
tanto, la primera parte de este resultado indica que
los valores promedio bajo luz brillante fueron ligera
m ente m ayores que bajo luz tenue. Pero lo impor
tante es la ltima parte. A l decir que la diferencia
no fu e significativa, el investigador est indicn
donos que este pequeo grado de diferencia podra
haber sido encontrado fcilm ente entre lo s 20 indi
viduos probados, aun si las personas en general no
difieren bajo condicion es de luz brillante o tenue.
La ltim a parte, 7(19) = 1,62, se refiere a los de
talles de c m o se determin que la diferencia no
era significativa .
La lg ica im plcita depende de imaginar primero
una distribucin hipottica de diferencias en c o n
diciones de lu z brillante y tenue en ia cual la d ife
rencia prom edio es 0. Esta distribucin tambin
tendr una cantidad esp ecfica de variacin que el
investigador debe estimar sobre la base d e la varia
cin de las diferencias de las 20 personas, obtenida
en e l experim ento. La frm ula para estim ar esta
variacin requiere tomar la diferencia d e cada per
sona m enos la m edia de todas las diferencias. L u e
g o, cada uno de estos desvos son elevados al
cuadrado y sum ados. D ividien do esta sum a por la
cantidad de participantes (2 0 en este c aso) obtene
m os la varianza. Sin embargo, para estim ar la
varianza del grupo hipottico mayor, deben reali
zarse ciertos ajustes. La suma de lo s desvos cua-

drticos no se d iv id e por ia cantidad de partici


pantes sin o por ia cantidad de ca so s m enos I (19
en este estudio). (E i ajuste e s necesario porque ia
variacin de las personas en general, estim ada a
partir d el grupo particular bajo estudio, ser de
m asiado pequea porque lo s d esv o s cuadrticos
so n d e sv o s del prom edio d el grupo estudiado en
particular, hecho que tiene el efecto de m inim izar
el total),
D e todos m odos, lo qu e realmente se n ecesi
ta es imaginar una distribucin hipottica formada
por lo s prom edios de las diferencias de grupos de
20 personas, las 2 0 diferencias que forman cada
prom edio surgen de la primera distribucin hipo
ttica de diferencias de individuos, m encionada
con anterioridad, y que pertenece a un mundo en el
que la diferencia prom edio general es 0. Esta nue
va distribucin hipottica formada por prom edios
d e 20 diferencias tam bin tendr un prom edio de
0, pero su varianza ser m ucho m enor porque es
m enos probable que tal distribucin de prom edios
tenga diferencias extrem as, Su varianza, de hecho,
resulta ser la varianza de ia primera distribucin
hipottica dividida por ia cantidad de participantes
de cada grupo (en este caso 20).
Esta distribucin de promedios de grupos de
20 diferencias tam bin tendr una forma conocida,
denom inada distribucin t . (En realidad, no ne
cesariam ente debe tener esa forma, pero dado que
el investigador utiliz la t en la descripcin, debe
haber supuesto que s e daban las condicion es ade
cuadas). E xisten diferentes distribuciones t d e
acuerdo c o n e l nmero que se utiliz para realizar
ia divisin para estim ar la varianza de la distribu
ci n hipottica d e diferencias individuales, que en
nuestro ca so fue 19. (D e aqu es de donde proviene
e l 19 e n e ! parntesis).
Finalm ente, pod em os buscar en una tabla cun al
to debera ser un prom edio de 2 0 diferencias para
ubicarse dentro del 5% m s alto de esa distribu
ci n t. E se nm ero es 1,729 d esvos estndar del
prom edio de esa distribucin de prom edios (un
d esv o estndar es la raz cuadrada de ia varianza,
e s una m edida estndar de variacin). En este estu
d io en particuiar, sin embargo, el investigador nos
ha indicado que la cantidad de desvos estndar,
por encim a d e la m edia d e la distribucin hipotti
ca en que se ubicar e i prom edio de los 20 diferen
cias reales, era s lo i , 62 (este es el punto t). D ado
qu e este nmero no s e ubica dentro del 5% supe
rior (e! intervalo que com ienza con 1,729), e l in
vestigador no puede descartar la posibilidad de
que este grupo d e 2 0 podra haber salido d e la dis
tribucin hipottica e n la que la diferencia prom e
dio e s, de hecho, 0.

E s norma convencional en p sicologa que un


resultado sea considerado significativo s lo si la
posibilidad de que surja de una situacin en la que
realm ente no existe diferencia e s . m enor al 5 % .
Cuando un resultado no es significativo, e l estudio
no es concluyente.
Angustia: S M = V O T = 1 ,8 5 2 /1 0 0 =
= 0,185; f = ' 1,50/0,185 = 8,11.
Depresin:
- V (4 ,2 3 )2 /!0 0 = 0,423;
f = 3,0 8 /0 ,4 2 3 = 7,28.
Introversin: SM = 0,222; r = 0 ,2 3 /0 ,2 2 2 = 1,04.
Neurotism o: 5 ^ = 0,421; t - 0,89/0,421 = 2 ,1 1 .
La explicacin de la prueba t es bsicam ente la
m ism a que la de ejercicio 6.

Captulo 10
1.

2.

a) U na prueba para m edias dependientes se uti


liza cuando cada participante es probado bajo
dos condicion es (tales c om o antes y despus
de algn tratamiento), de manera que hayan
dos valores observados por participante. Una
prueba t para m edas independientes se utiliza
cuando algunos participantes son probados
una vez bajo una de ias condicion es y otros
son probados una vez bajo otra con d icin di
ferente, de form a tal qne haya s lo un vaior
por participante.
i) t necesario { g l = 58, p < 0 ,0 5 , dos coias)

*2.0 ;

= IW | +

uy<sh * * K2,) = (29/58X2,4) +


(29/58X2.8) = 1,2+ 1,4;
==2.M = 0,08-7; !?m = 0,087; S * . =
A-Jfl + ^ M l ~ 0>74; Dfcreneja - '^ D i f erecia =
V 174 = 0,417; r = (W , = (1 2 - 1,11)/0,417 = 2 ,1 6 , C onclusin: se re
chaza la hip tesis nula. La diferencia es sign i
ficativa. Tamao del efecto:

4=(M-M,XS& m M = (1 2 -ll.l)/ -HjS


= 0 ,9 /1 ,6 = 0 ,5 6 (tamao del e fe cto aproxi
m adam ente m ed ian o)..P oten cia (de la tabla)
= 0,47.
ii) f necesario { g l = 58, p < 0,05, dos coias) =
2,004; S2Combngda W M
+
+
fe W ,
+ * y ]0 S V
* (1 9 /5 8 )(2 ,4 ) +
(3 9 /5 8 X 2 .8 ) = (0,328) (2,4) + (0 ,6 7 2 )(2 ,8 )
= 0 ,7 8 7 + 1,882
2 '^
~ ^CoiflW nada^
$
=
2 ,7/40
=
2 ,7 /2 0
=
0,135;
= 0,068;
^Diferencia = $ ,v* +---= 0,203; Dferancia = ^ Difcrcneia= - 2 0 3 =
0,451;
t
=
(Af,
M 2)/ Diferencia
= ( 1 2 - 1 1 , l) / 0 ,4 5 1 = 0 ,9/0,451 = 2 ,0 0 .
C onclusin: no se rechaza la hip tesis nula.
La diferencia no e s s ignificativa. Tam ao del
efecto: d = 0 ,9 / V2,7 = 0,55 (tamao del efec-

to aproxim adam ente m ediano). Potencia: N" =


t(2 )(2 0 )(4 0 )]/(2 0 + 4 0 ) = 26,7; potencia (de la
tabla) est entre 0,3 3 y 0,4 7 .
iii) t necesario ( g l = 58, p < 0 ,0 5 , dos co la s)
= -2 ,0 0 4 ; 0 " ^
- 2,6; S>m = 0,087;
= 0 ,0 8 7 ; S Dlfcr = 0 ,417; l = 2 ,1 6 . C oactosin: se rechaza la hiptesis nula. La diferen
c ia e s sig n ificativa. Tamao del efecto:
d = 0 ,9 / V2,6 = 0 ,5 6 (tam ao d el e fe cto apro
xim adam ente m ediano). P oten cia = 0,47.
a) Pasos de la prueba d e hiptesis:
1. Replantear e l problem a en funcin de hi
ptesis d e investigacin e hip tesis nula de
poblaciones.
P o b la c i n 1: personas qu e s e inform an
a travs de la TV.
P o b la c i n 2: personas que se inform an
a travs de la radio.
La hip tesis de in vestigacin establece que
las d os pob laciones tienen m edias diferentes.
La hip tesis nula establece que las dos pobla
cio n es tienen la m ism a m edia.
2. D eterm inar las caractersticas de la distri
bucin comparativa.
Varianza poblacional estim ada
~ ^Combinada = ( 0/80)(4) + (2 0 /8 0 )(6 )
= 3,0 + 1,5 = 4,5.
D istribucin comparativa (distribucin de
diferencias de m edas): M eda = 0; S Djfcrertcja =
0,54; Forma = (80).
C lculo de S K lt a d , : S>m - 4 ,3 /6 1 = 0,074;
.
4,5 /2 1
,
0 ,214;
SD i t o - ,
0 .0 7 4 + 0 ,2 1 4 = 0 ,288; S a M
= 0,54.
3, D eterm inar el punto de corte en la distribu
cin comparativa, en el que debera rechazarse
la hiptesis nula.
t necesario { g l - 80, p < 0,0 1 , dos colas)
= 2 ,6 3 9 .
4. D eterm inar el valor muestra! en la distribu
cin comparativa.
t ~ (24 - 2 6 )/0 ,5 4 = - 2 /0 ,5 4 = - 3 ,7 0 .
5. Comparar lo s valores de lo s pasos 3 y 4 pa
ra decidir s i se rechaza o no la hiptesis nula.
t d el paso 4 (- 3 ,7 0 ) es ms extrem o que el
punto t de corte del paso 3 ( 2 ,6 3 9 ). Por lo
tanto, se rechaza la hiptesis nula; se llega a la
conclusin de que la prediccin e s sustentada
por el experim ento.
b) d = (2 4 - 2 6 )/
= - 2 /2 ,1 2 = -0 ,9 4 ;
gran tamao d el efecto.
c ) V a s e figura en la parte superior de la prxim a
pgina.
d) Explicacin: la m edia (M ) es el prom edio arit
m tico (la sum a de los valores observados d i
vidida por la cantidad de ello s), En este caso,

e l grupo que s e inform aba por radio tena un


valor prom edio m s alto en la prueba que el
grupo qu e se inform aba por TV. 2 se refiere a
la estim acin de la varianza de los valores de la
poblacin general basada en la varianza de los
valores d el grupo d e personas bajo estudio
(denom inada muestra). La varianza (S2) es
una m edida del grado de variacin en un gru
po de valores. A l estim ar la varianza de la p o
blacin , a partir de la varianza d e la muestra,
la diferencia de cada valor con respecto a la
m edia s e eleva al cuadrado y la sum a de esas
diferencias cuadrticas se divide por lo s gra
dos de libertad, es decir, por la cantidad de
participantes de la muestra m enos 1. (L os gra
dos de libertad representan la cantidad d e in
form acin nica dispon ible en la muestra para
utilizar en la estim acin de la poblacin. U tili
zar la varianza de la muestra, que es la sum a
de las diferencias cuadrticas dividida por la
cantidad de casos, dara una estim acin dem a
siado pequea de la varianza poblacional). En
este caso, s e obtienen d os estim aciones, una
de cada muestra.
Ahora que y a hem os analizado los resulta
d os d el problem a, veam os d e qu m odo hem os
llegado a las conclusiones. La manera de for
m ular e l problem a es preguntarse cul es la
probabilidad d e obtener esta diferencia entre
los dos grupos con respecto a los valores sobre
conocim iento, si no hubiera diferencia entre la
radio y la TV. Es decir, si los grupos que se in
forman a travs de la T V y la radio realm ente
representaban dos pob laciones m ayores que
no eran diferentes entre s, cul es la probabi
lidad de que pudieran haber obtenido una
muestra de cada poblacin que fueran tan d i
ferentes entre s?
Para contestar esta pregunta es necesario c a l
cular c m o se veran tales pob laciones n o d i
ferentes entre s. A qu se aplican las estim a
cion es de la varianza de poblacin. D e hecho,
aun si los dos grupos representaran pob lacio
nes diferentes (slo las m edias seran diferen
tes), se presume que la varianza e s la m ism a.
Por lo tanto, se trata de dos estim aciones d e a
m ism a varianza de poblacin, y podem os pro
mediar ambas estim aciones para obtener una
estim acin an. mejor. Sin em bargo, al prom e
diar es necesario dar m ayor peso a la estim a
cin basada en m ayores grados de libertad.
E ntonces, se calcula un prom edio ponderado
m ultiplicando cada estim acin por su propor
cin en los grados totales de libertad y sum an
do los resultados. Esta estim acin com binada

de la varianza pobiacional es igual a 4,5. H asta


aqu se haba estim ado s lo la varianza de la
p ob lacin de valores sobre conocim ientos c o
rrespondientes a lo s individuos.
A hora bien, dado que lo que nos interesa no
eran lo s valores individuales sin o la diferencia
entre la m edia de un grupo de l y la m edia de
otro grupo de 2 1 , necesitbam os calcular cu
les serian las caractersticas de una distribu
cin de todas las posibles diferencias de
m edias de grupos de 6 0 y 21 tom ados al azar
de las dos pob laciones idnticas, cuyas varianzas acabam os de estimar. E ste clculo reque
ra de d os pasos:
Primero, necesitbam os calcular las caracte
rsticas de la distribucin interm edia de cada
muestra, es decir, de la distribucin de m edias
d e todas las m uestras po sib les de ese tam ao
tom adas de esa poblacin. Para e l grupo de la
T V esta sera una distribucin de medias m u s

trales de 61 valores cada una. Tal distribucin


tendr una varianza m ucho m enor que la va
rianza de la poblacin de observaciones indi
viduales de donde provienen las m uestras, ya
que cualquier inedia tiene m en os probabili
dades de ser extrem a qu e cualqu ier valor in
dividual (porque la m ed a de varios valores
probablem ente in clu ya algun os valores que
equilibran o reducen el efecto de cualquier e x
trem o). D e hecho, se puede demostrar m ate
m ticam ente que la varianza de una distribu
cin de m edias de todas las m uestras posibles
ser exactam ente la varianza de la poblacin
de observaciones individuales de origen d ivi
dida por la cantidad de observaciones en cada
muestra. Para e l grupo de TV, esta distribu
c i n sera 4 ,5 dividido 61, es decir, 0 ,0 7 4 . La
cifra correspondiente para e l grupo de la radio
, es 0 ,214.

E l segundo paso se refiere directam ente a la


distribucin de diferencias de medias. E s la dis
tribucin que surgira si tomram os una m edia
de a distribucin de m edias de todas las
muestras posibles dei grupo de TV, y tomra
m os otra m edia de la distribucin sem ejante
correspondiente al grupo de la radio y calcul
ramos la diferencia. D espu s de hacer esto
muchas veces, la distribucin de diferencias
obtenida del m od o descripto creara una nueva
distribucin d e diferencias d e m edas. Ya que
suponem os (si no haba diferencia entre radio
y T V ) que las dos pob laciones orignales te
nan las m ism as m edias, las dos distribuciones
de muchas m edias de muestras deberan tener
la m ism a m edia tambin. En prom edio, la di
ferencia entre una m edia tom ada del grupo de
la T V y una m edia tom ada del grupo de la ra
d io debera dar 0 (porque algunas v e ce s ser
m ayor una y otras v eces la otra, pero a la larga
estas fluctuaciones aleatorias deberan equili
brarse). La varianza de la distribucin de dife
rencias de m edias ser afectada p o r la va
riacin en ambas distribuciones de m edias; de
hecho, ser sim plem ente igual a la sum a de las
dos. Por lo tanto, la varianza ser 0 ,0 7 4 m s
0 ,2 1 4 , lo que da 0,2 8 8 . En realidad, la varia
cin en tales distribuciones se describe ms
frecuentem ente en trminos de lo que s e deno
mina desv o estndar (la raz cuadrada de la
varianza), que en este ca so es la raz cuadrada
de 0,2 8 8 , o lo que es lo m ism o, 0 ,54.
Tambin resulta que estas distribuciones de
diferencias d e m edias tienen una form a p reci
sa conocida, por lo tamo, e s p osible buscar en
una tabla la probabilidad de estar a una cierta
distancia ms all de su m edia. La distancia se
m ide en desv o s estndar. En este ca so , la ta
bla indica que en la distribucin (con un total
d e 8 0 grados de libertad) existe m enos d el 1%
de probabilidad de obtener un valor (una dife
rencia de m edias) que se ubique a 2 ,6 3 9 o ms
d esv o s estndar de la m ed ia en cualquier di
reccin. (T uvim os en cuenta ambas direccio
nes porque estbam os analizando si exista
una diferencia en cualquier direccin entre lo s
grupos de T V y de radio. El nivel 1% " s e re
fiere a la puntuacin convencional en la cual
los cien tficos sociales, que se preocupan mu
c h o por no correr el riesgo de concluir err
neam ente qu e on experim ento ha dado una
diferencia, deciden que e s dem asiado impro
bable que haya sucedido algo por casualidad).
H em os representado grficam ente las distin
tas distribuciones relacionadas con este ejerci

4.

c io (vase la figura de la pgina anterior).


V a s e dnde qued im presa la figura a la que
hace referencia.
La diferencia entre las dos medas en particu
lar fue - 2 (es decir, 2 4 * 26). L a diferencia se
ra igual a 3,70 (es decir, 2/0 ,5 4 ) d esvos
estndar por debajo de la m edia en la distribu
cin de todas la$ diferencias posibles de m e
dias de grupos de este tamao. D ado que e l
resultado es ms extrem o que -2 ,6 3 9 , se po
dra rechazar por improbable la posibilidad de
obtener una diferencia d este tamao, tom an
do a! azar dos grupos cualesquiera de partici
pantes independientem ente de si se haban
estado inform ando a travs de la T V o la radio.
Por lo tanto, e l investigador puede considerar
lo s resultados de este estudio com o soporte de
su prediccin.
M s an, e l investigador deseaba saber no
s lo que lo s resultados no eran casuales sino
tambin cul era e l tamao d el efecto produci
d o por informarse a travs de la radio o d e la
TV. La diferencia enrre las d os m edias era d e 2
puntos en la m edida de conocim iento. L a can
tidad tpica de variacin de valores en cual
quier escala se describe a travs del d esv o
estndar (la raz cuadrada de la varianza, sien
do la varianza e l prom edio de ios cuadrados de
la diferencia de cada valor con respecto a la
m edia). En este caso, el desvo estndar que
estim aram os utiliza inform acin de ambas
muestras; es una estim acin combinada. La
estim acin com binada de la varianza era 4,5,
su raz cuadrada es 2 ,1 2 . Por lo tanto, una di
ferencia d e 2 puntos en la escala e s una d ife
rencia de c asi 1 d esvo estndar (0,94 d esvos
estndar). En las investigaciones sociales en
general, un tamao d e l efecto de 0 ,8 0 se c o n
sidera grande, por lo qu e pod em os decir que
claramente se trata de un gran efecto. Por lo
tanto, adem s d e la conclusin de que no es
probable que e l resultado haya surgido s lo
por casualidad, e l investigador tam bin puede
concluir que la ventaja de la radio por sobre la
T V es bastante considerable.
a) L os cin co p asos de la prueba de hip tesis de
beran presentarse en form a paralela a lo s d e l
ejercicio 3a. La inform acin clave para este
problem a es la siguiente:
f necesario (g i - 9, d os colas, p < 0,0 5 )
2,262.
Norm ales: M = 3 6 /6 = 6; S2 = 28/5 = 5,6,
Propio nombre: M = 4 8 /5 = 9,6; S 2 = 7 7 ,2 /4
= 19,3.

5a.Combinada = (5 /9 X 5 ,6 ) + (4 /9X 19,3)


: 3 ,1 1 + 8 ,5 8 = 11,69.
52wl = 11,69/6 = 1,95; S 2m = 11,69/5
= 2 ,3 4 .
^ n c ia

^ 5
+ 2,34
= 4,29;

sultados son significativos y con ocem os los tama


os de! efecto, los clculos de la potencia n o son
6.

del efecto mediano. Cantidad necesaria de


participantes por grupo para un tam ao del
efecto m ediano, p < 0,05, una co la (de la tabla
Q -7) = 50; 100 participantes e n total.
b) d = (22,5 - 16,2)/31,5 = 0 ,2 0 . Tamao del
efecto pequeo. N necesaria: 393 por grupo,
7 8 6 en total.
c) d - (1 4 - 12)/2,5 = 0,80. Gran tamao del
efecto. N necesaria: 2 0 por grupo, 4 0 en total.
d) d = (4 8 0 - 5 2 0 )/5 0 = - 0 ,8 0 . Gran tam ao del
efecto. N necesaria: 2 6 por grupo, 5 2 en total.

^Diferencia ~

5.

t = (6 - 9,6X2,07 = -3,6/2,07 = -1,73.


N o s e rechaza la hiptesis nula; e l experi
m ento no es concluyente en cuanto a si e l he
cho de incluir e l nombre de nio produce
alguna diferencia.
Nota: el problema, en realidad, tiene un de
fecto en el sentido de que, aparentemente, no
cum p le c o n e l supuesto que requiere iguales
varianzas poblacionales. Sin em bargo, dado
que e l resultado no fue significativo aun utili
zando e l procedim iento ordinario, podem os
presumir que probablem ente no habra sido
significativo utilizando un procedim iento m o
dificado.
b) d = (6 - 9 , 6 ) / V T W -3 ,6 /3 ,4 2 = 1 ,0 5 .
c ) La ilustracin grfica sera sim ilar a la indica
da en la respuesta al ejercicio 3c.
d) La descripcin para una persona qu e n o ha e s
tudiado la prueba f para m edias independien
tes sera sim ilar a la de la respuesta al ejercicio
3d, excepto que no tendramos que explicar
todos los puntos que la persona ya co n o ce si
com prende la prueba t para m edas depen
dientes.
L a respuesta debera explicar lo siguiente, pero de
bera estar redactada de manera tal de explicar todos
lo s trminos y conceptos (com o en la respuesta al
ejercicio 3 , por ejem plo).
El estudio refleja que utilizando un nivel de
sig n ifica ci n convencional de 0 ,0 5 , lo s nios ale
m anes que recib en bajos niveles de apoyo - y a sea
de su madre, su padre o sus co m p a ero s-, m o s
traban m enores n iv e le s de auto-valoracin. M s
an, los tam ao del e fe cto eran bastante grandes
( d - 0,78- y d = 0 ,6 9 ) con respecto al apoyo de la
madre o del padre; no obstante, el tamao de e fe c
to era s lo entre pequeo y moderado ( d = 0 ,3 5 )
co n respecto al apoyo de los com paeros. Lo ante
rior parecera im plicar que el apoyo de los padres
es ms importante que el apoyo de los com paeros
en cuanto al sentim iento de autovaloracin del n i
o. La potencia del estudio para un gran tamao
del efecto e s 0,98. {Presum iendo que haba aproxi
m adam ente igual cantidad de nios en lo s dos gru
p os (el d e nivel de apoyo alto y el de nivel de
apoyo bajo), que la prueba e s d e dos co la s y qu e se
utiliza una cantidad de 50 observaciones en cada
grupo). La potencia para un tamao d e l efecto m e
diano es 0 ,7 0 . D eb id o a que ya sabem os que los re

m u y im p o rta n tes.
a) d - (107 - 149)/84 = -4 2 /8 4 = - 0 ,5 0 . Tamao

Captulo 11
1.

a) F necesario ( g l ~ 2, 27; p < 0,05) = 3,36; 5 ^


= ( S c /g l ) ( n ) = {[(7 ,4 - I f + (6 ,8 - 7 )2 +
(6 ,8 - 7 ) 2]/(3 ~ 1)K 10) = (0 ,2 4 /2 )(1 0 ) = 1,2;
^Deau-o * (>82 + 0 ,9 0 + 0 ,8 0 )/3 = 0,84;
F = 1 ,2/0,84 = 1,43; no s e rechaza la hiptesis
nula; los grupos no son significativam ente d i
ferentes^ al nivel 0,05. Tamao del efecto:
/ = 4 1 ,4 3 / 4 l 0 = 1,20/3,16 = 0 ,4 0 (gran tama
o del efecto). Potencia = 0,45.
b) F necesario ( g l = 3, 96; p < 0,0 5 ) = 2 ,7 0 (en
realidad utilizando g l = 3, 95); 5^enlre
= (1 6 4 ,6 7 )(2 5 ) = 4.116,75; S2^
= (2 4 2 +
282
+
312
+
2 5 2 )/4
=
736,5;
F = 4.11 6 ,7 5 /7 3 6 ,5 = 5,59; s e rechaza la hip
tesis nula, los grupos son significativam ente
diferentes al nivel 0,05. Tam ao d e l efecto:
/ = 4 5 ,5 9 / 4 2 5 = 0 ,4 7 (gran tam ao del e fe c
to). P otencia entre 0,85 y 0,96.
c) F n e c e s a r io ( g l = 4 , 120; p < 0 ,0 5 ) = 2 ,4 6
(en realidad utilizando g l = 4, 100);

2.

= (123,5X 25) = 3,087,5; ^


= (242 + 282 + 312 + 2 5 2 + 2 7 2 )/5 - 735;
F = 3 .0 87,5/735 = 420; se rechaza la hiptesis
nula; los grupos son significativam ente d ife
rentes al nivel 0,05. Tamao d el efecto:
/ = 44720/425"= 0,41 (gran tam ao de efecto).
Potencia entre 0 ,9 0 y 0,98.
a) F necesario ( g l = 2 ,9 ; p < 0 ,01) = 8,02.
Grupo 1: Af a 8, S2 * 0,67; Grupo 2: M = 6,
S 2 = 0,67; Grupo 3:
4, S 1 = 0,67.

- (W ) -

16; ^

= 0.67;

F = 16/0,67 = 23,88; se rechaza la hiptesis

nula; lo s grupos son significativam ente d ife


rentes al nivel 0,01.
b) F necesario ( g l = 2 , 9; p < 0 ,01) = 8,02.
Grupo 1: M = 8, S2 = 21,33; Grupo 2: M = 6,
S2 = 21,33; Grupo 3: M ~ 4 , S2 = 2 1 ,3 3 .

S \, = (4X4) = 16;

- 21,33;

F = 16/21,33 = 0,75; no s e rechaza la hip tesis

3.

nula; lo s grupos no so n significativam ente d i


ferentes al nivel 0,01.
a) Pasos de la prueba d e hiptesis:
1. R eplantear el problem a en funcin d e hi
ptesis de investigacin e hiptesis nula de las
poblaciones.
P o b la ci n 1: pacientes con trastornos
afectivos.
P o b la c i n 2: pacientes con trastornos
cognitivos.
P o b la ci n 3: pacientes con trastornos
relacionados con las drogas.
La hiptesis de investigacin establece que
las tres m edias pobaconales son diferentes.
L a hiptesis nula establece que las tres pobla
cio n es tienen la m ism a m edia.
2. D eterm inar las caractersticas de la distri
bucin comparativa.
D istribucin F con 2 y 9 grados de libertad.
3 . Determ inar e l punto de corte en la distri
bucin comparativa, a partir del cual se d eb e
ra rechazar la hip tesis nula.
N iv el 5%, F (2 ,9 ) necesario = 4,2 6 .
4. Determ inar e l valor m uestral en la distri
bucin comparativa.
Estimacin intragrapal de la varianza poblacional (52dentro) a (0,67 + 3,33 + 2,67) / 3 = 2,22
Estim acin intergrupal d e la varianza poblac i o n a K S ^ J * (5 ,3 3 X 4 )^ 2 1 ,3 2
R a z n f = 2 1 ,3 2 /2 ,2 2 = 9,60.
5. Comparar ios valores obtenidos en lo s pa
sos 3 y 4 para decidir si se rechaza o no la h i
ptesis nula.
F del paso 4 (9 ,6 0 ) e s m s extrem o que el cor
te F del paso 3 (4,26).
Por lo tanto, se rechaza la hiptesis nula; se
sostien e la hiptesis d e investigacin; existe
una diferencia significativa,
b) Explicacin: la hiptesis nula establece que
los tres grupos representan poblaciones for
madas por lo s tiem pos de internacin, en s e
manas, que tienen las m ism as medias (y, al
igual que con la prueba , debem os estar en
condiciones d e presumir que tienen iguales
varianzas). Si sta hip tesis nula es verdadera,
entonces pod em os estim ar la varianza de esas
poblaciones iguales de dos m odos:
1, P odem os estim arla a partir de la
variacin dentro de cada uno de los tres
grupos y luego prom ediarlos (es exacta
m ente lo que haramos en una prueba t para
m edias independientes, excepto que ahora
se estn prom ediando tres grupos en lugar

de promediar s lo dos; adem s, en una


prueba t ponderaramos estas varianzas s e
gn lo s grados de libertad c o n los que cada
una contribuye a la estim acin total. Sin
em bargo, dado qu e los tres grupos tienen la
m ism a cantidad de observaciones, pode
m os sim plem ente prom ediarlos; en efecto,
sera lo m ism o que ponderarlos de manera
pareja). En este ejem plo, las tres estim a
cion es de varianza eran 0,67, 3,33 y 2,67,
lo que dio una estim acin com binada de
2,22. A esto se denom ina estim acin intragrupal de la varianza poblacional,
2. Podem os estim ar la varianza uti
lizando las tres m edias. S i presum im os que
la hiptesis nula es verdadera, las m edias
de los tres grupos se basan en muestras to
m adas de pob laciones idnticas. Cada una
de estas pob laciones idnticas tendr una
distribucin d e m edias m aestrales idntica
a las dem s, tom ada d e e sa poblacin. Las
m edias de las tres m uestras provienen to
das de poblaciones idnticas, e s decir, que
es lo m ism o que si pertenecieran todas a la
m ism a poblacin. Por eso , la cantidad de
variacin entre las tres m edias debera ser
representativa d e la variacin en la distri
bucin de m edas de donde puede con sid e
rarse que provienen. Por consiguiente, p o
dem os utilizar estas tres m edias (6, 10 y
10) para estim ar la varianza de esa distri
bucin de m edias. U tilizando la frmula
usual para estimar una varianza pob lacio
nal, obtenem os 5,33.
Sin embargo, lo que necesitam os
es una distribucin d e observaciones indi
viduales. Por lo tanto, la cuestin es la s i
guiente: Cul sera la distribucin de
observaciones que producira una distribu
cin de m edias (de cuatro registros cada
una) con una varianza de 5,33? Para encon
trar la distribucin de m edias de una distri
bucin de observaciones individuales, di
vidim os la varianza d e la distribucin de
observaciones por e l tamao d e las m ues
tras, En este caso, querem os hacer lo c o n
trario. En consecuencia, m ultiplicam os la
varianza de la distribucin de m edas por el
tamao de las muestras para obtener la va
rianza de la distribucin de individuos. El
resultado es igual a 5,33 por 4, es decir,
2 1 ,3 2 , A esto se denom ina estim acin intergrupal de la varianza poblacional.

Si la hiptesis nula es verdadera, las dos esti


m aciones deberan ser aproximadamente
iguales porque estiman esencialm ente ia m is
ma poblacin. Por lo tanto, la razn resultante
de dividir la estim acin intergrupal por ia esti
m acin intragrupal debera ser aproximada
m ente 1,
Pero si la hiptesis nula e s falsa y las tres p o
blaciones que representan estos grupos tienen
diferentes medias, la estim acin basada en la
variacin entre las m edias de grupos ser ma
yor que la que se basa en al variacin dentro
de los grupos. La razn por la que ser mayor
es la siguiente: si la hiptesis nula e s verdade
ra, la nica razn para que las medias de los
grupos varen e s por la varianza dentro de ca
da una d e las tres distribuciones idnticas de
m edias. Pero si la hiptesis nula es falsa, cada
una de esas distribuciones de m edas tambin
tiene una media diferente. Por lo tanto, la va
riacin en las m edias se debe a ia variacin
dentro de cada una de esas distribuciones de
m edias, en este caso no idnticas, pero ta m
b i n a las diferencias entre las m edias de esas
distribuciones de medas, En sum a, ex iste una
fuente adicional de variacin en las m edias de
los grupos. Si estim am os la varianza p o b la d o nal utilizando esas tres m edias, la estim acin
ser m ayor de lo que debera si la hiptesis nu
la fuera verdadera. Por otro lado, la varianza
intragrupal no se ve afectada por el hecho de
que ios tres grupos tengan diferentes m edas,
porque s lo tiene en cuenta ia variacin dentro
de cada uno de lo s grupos. La varianza intra
grupal, por lo tanto, no aumenta para nada si ia
hiptesis nula es falsa. Por eso, cuando la hi
ptesis nula es falsa, la razn entre la varianza
intergrupal y la varianza intragrupal ser m a
yor que 1.
L a razn entre la estim acin intergrupal y la
estim acin intragrupal se denom ina razn F .
En este ejem plo, nuestra razn F e s 2 1 ,3 2 a
2 ,2 2 :2 1 ,3 2 /2 ,2 2 9,60.
L o s estadsticos han construido tablas que
indican lo que suced e cuando calculam os ra
zn i 7 habiendo seleccionado un grupo de cua
tro valores al azar de cada una d e tres po
blacion es idnticas. E sa es precisam ente la si
tuacin en la que nuestra hip tesis nula es ver
dadera. B uscando en esas tablas, descubrim os
que existe m enos de un 5 % de posibilidad de
obtener una razn F m ayor a 4 ,2 6 , y dado que
la razn F real e s m ayor a ese nmero, pode
m os rechazar la hiptesis nula.

4.

F necesario ( g l - 2 ,1 4 7 ; p < 0 ,0 5 ) 3 ,0 9 {en reali


dad, utilizando g l = 2 , 100); S 2^
= (0 ,0 9 )(5 0 )
4,5; S2^
= (5 ,2 + 5,8 + 4 ,8 )/3 = 5,27; F =
4 ,5 /5 ,2 7 = 0,85; no s e rechaza la hip tesis nula; los
grupos no son significativam ente diferentes al ni
vel 0,05. Tamao de e f e c t o : / V0~,85/50 * 0,13
(pequeo tamao del efecto). P oten cia 0 ,1 8 .
c-on respecto a lo s c in c o p asos de la prueba d e h i
ptesis y la e x p licacin , v a s e la respu esta al
ejercicio 3; tam bin se u tiliza m aterial d e las res
puestas a lo s ejercicios acerca de la prueba t del
captulo 10,
5, El resultado sostien e la hiptesis que establece que
los reclusos en los tres tipos de prisin tienen d ife
rentes grados de necesidad en cuanto al cuidado de
su salud mental. E l tamao del efecto e s 0,38. (La
explicacin com pleta incluira e i m aterial d e la
respuesta ai ejercicio 3, m s m aterial de las res
puestas a los ejercicios acerca de la prueba t del
captulo 10).

Captulo 12
1. ^Toil
Gento ~ g l [ +

g f i * . . . + gt-Mmo

( 4 - 1 ) + ( 4 - 1 ) + ( 4 - 1 ) = 3 + 3 + 3 = 9.

^emre " ^Grupos 1 - 3 - 1 ~ 2.


F necesario para g l = 2, 9 ai nivel 0 ,0 1 = 8,02.

Grupo 1
X

8
8
7
9

X -G M

X~M

D e sv D esv2

D e sv D esv2

2
2

1
3

X 32

4
4
1
9

0
0
-1
1

M -G M

0
0
1
1_

D esv D esv2
2

2
2
2

4
16

18

4
4
4

M - 3 2 /4 8 .

Grupo 2
X

6
6
5
7
24

X - M

X -G M
D esv D esv2

0
0
1
1

0
0
-1
1_
2

M - 2 4 /4 = 6.

M -G M

D e s s v D esv2

0
0
-1
1

0
0
1
_1_
2

D esv D esv2

0
0
0
0

0
o
o
0
2

F u e n te
Intergrupal
Intragrupal

G rupo 3
M - GM

X -G M

X~M

D esv D esv2

D esv D esv2

-st- 'S- co in

~2

-2
-3
-1

4
4
9
1_

16

0
0
-1
1

D esv

4
4
4
4

G M = (3 2 + 2 4 +

4.

16)/12 = 7 2 /1 2 = 6.

nfro= 2 + 2 + 2 = 0.

T abla d e a n lisis d e varianza:


CM

gl
2
9

32
6

16
0 ,6 7
11

38

C o n clu si n : se rech aza la h ip te sis nula,


Todos

lo s g l

igual

que

en

el

captulo

i f = i 2,..

11;

y f <to

ptulo 11.
2.

F necesario (g l = 3, 5 ; p < 0 ,0 1 ) = 12,06.

F u e n te
Intergrupal
Intragrupal

SC
2 9 8 ,8 9
12

gZ
3
5

CM
9 9 ,6 3
2 ,4

F
4 1 ,5 1

C o n clu si n : S e rech a za la h ip te sis nula.


3.

i)

a) Mj = 4; A2 = 1; M j = 2.
b) F necesario ( g l = 2 , 6; p < 0 ,0 5 ) = 5,14.
(Nota: G M = 2,3 3 ).

F u e n te
Intergrupal
Intragrupal

SC

14
6

gl
2
6

CM

7
1

C on clu sin : se rech aza la h ip te sis nula.

c ) R 2 = 14/20 = 0,70.
& )M l = 4 \ M 1 = l; M 3 = 2.
b) F necesario ( g l = 2 ,6 ; p < 0 ,0 5 )

= 5,1 4 .
(Nota: G M = 1,89).

SC

84
38

gl
2
9

122

CM

42
4 ,2 2
11

9 ,9 5

C o n clu sin : s e rech aza la h ip tesis nula. E x iste


una d iferen cia sig n ifica tiv a d e au toestim a entre
lo s d istin tos tip o s d e m aestros.

S C 0 = 1 6 + 0 + 1 6 = 32.

SC

4,85

c) R 2 = 12,89/20,89 = 0.62.
a) F necesario ( g l = 2 , 9 ; p < 0 ,0 5 ) = 4,26.
F u e n te
Intergrupal
Intragrupal
Total

2+18 = 38.

F u e n te
Intergrupal
Intragrupal
Total

6 ,4 5
0 ,6 7

C onclusin; no se rechaza a h ip te sis nula.

M = 1 6 /4 = 6.

^ ., = 1 8

CM

16

18

gl
2
6

D esv2

-2
-2
-2
-2

0
0
1

SC

12,89
8 ,0 0

7 ,0 0

b) Tamao del efecto (R 2) = 8 4 /1 2 2 = 0,69.


c) E xplicacin: la l gica general es analizar si la
variacin de la autoestim a entre las tres m ues
tras podran haber ocurrido m s d el 5 % de las
veces si, de hecho, las tres muestras hubieran
sido tomadas al azar de tres poblaciones de
maestros con la m ism a m edia de nivel de au
toestim a. En primer lugar, e l procedim iento
tiene en cuenta que si fueran precisam ente tres
muestras tom adas al azar d e pob laciones c o n
la m ism a m edia, la variacin en cuanto al ni
vel d e autoestim a de cada grupo de maestros
sera una base razonable para estim ar la varia
cin de la poblacin. D e m od o similar, bajo
estas condicion es, la variacin de las m edias
d e los grupos tam bin seria una base para esti
mar la varianza general de poblacin (esto se
debe a que cualquier variacin entre esas m e
dias slo puede ser e l resultado de la variacin
entre lo s valores dentro de las tres pob lacio
nes). S i ambas estim aciones son iguales, su
razn debera ser 1 : 1 , 1.
Pero supongam os que en realidad lo s grupos
pertenecen a pob laciones con diferentes m e
dias. En ese caso, la estim acin de la variacin
a partir de las m edias de los grupos debera ser
m ayor que aquella basada en la variacin in
terna de cada grupo de maestros. Por lo tanto,
la ra2n (si la variacin intergrupal se ubica
arriba) sera m ayor a 1.
D ado que la cantidad de casos en cada grupo
no es la m ism a, no es sen cillo com binar la in
form acin de las tres m uestras (o inclu so d e
terminar con precisin la variacin entre los
tres grupos) porque la inform acin proporcio
nada por los grupos tiene diferente pondera
cin. S in em bargo, existe un procedim iento

para sim plificar este proceso. El procedim ien


to utiliza e l principio que establece que, para
cada observacin, su desviacin con respecto
a la m edia general de todas las observaciones
es igual a su desviacin con respecto a la m e
dia de su propio grupo m s la desviacin de la
m edia de su propio grupo con respecto a la
m edia general. Tam bin resulta que (y puede
ser probado m atem ticam ente), si elevam os al
cuadrado cada una d e estas diferentes desvia
cio n es, la sum a de todas las desviaciones cua
drticas c o n respecto a la gran m edia e s igual a
la sum a de las d esviaciones cuadrticas de ca
da registro co n resp ecto a su m edia, m s la
su m a de las d e sv ia cio n e s cuadrticas de la
m ed ia d el grupo de cada observacin co n
resp ecto a la gran m edia. A l dividir las lti
m as dos sum as de cuadrados por lo s grados
d e libertad involucrados en cada c lcu lo , o b
tenem os las dos estim a cio n es de la varianza
pob lacional.
En el caso que estam os analizando, la sum a
de las desviaciones cuadrticas de la m edia
del grupo de cada desviacin, con respecto a
la m eda general (d e 6), era 84. Los grados de
libertad son 2 porque s lo estn involucradas
las m edias d e tres grupos, y la estim acin de
varianza poblacional es 84/2, 42. D e manera
similar, la sum a de las desviaciones cuadrti
cas de cada observacin con respecto a la m e
dia de su grupo era 38. Los grados de libertad
totales (la cantidad de registros de cada grupo
m enos 1, teniendo en cuenta todos los grupos)
eran 9, y la estim acin de varianza poblacio
nal utilizando las variaciones dentro de cada
grupo es de 4 ,2 2 (38/9),
La razn general entre la varianza poblacio
nal, estimada sobre la base de la variacin en
tre los grupos, y la varianza poblacional
estim ada sobre la base de la variacin dentro
de ios grupos es 9,95 (42/4,22). Esa razn g e
neral se denom ina razn F. Sucede que se c o
noce la distribucin de todas las razones F
posibles, aunque sta vana segn los grados de
libertad en lo s que se basan las estim aciones de
varianza intragrupa e intergupal. En este caso,
buscando el punto de corte en el que un F ocu
rrira el 5% de las veces o m enos, hayam os que
el m ism o es de 4 ,2 6 en una distribucin de ra
zones F basada en 2 y 9 grados de libertad. Ya
que 9,95 e s una razn F considerablem ente
m ayor que el m nim o necesario de 4,26, pode
m os concluir que existe m enos de un 5 % de
probabilidad de obtener esta variacin entre
nuestros grupos si los niveles de autoestima

5.

hubieran sid o realm ente tom ados al azar d e


tres poblaciones de maestros con la m ism a m e
dia. Finalm ente, se calcula una estim acin del
tam ao del efecto , una indicacin estandari
zada de la cantidad de variacin entre las m e
dias. E l procedim iento que s e utiliz fue tomar
las desviaciones cuadrticas totales de todos
los registros c o n respecto a la gran m edia (que
era 122) c o m o una esp ecie de lnea de base d e
la variacin a ser explicada. D espu s s e calcu
l el porcentaje de ese total, que estaba expli
cado por las desviaciones cuadrticas de las
m edias de los grupos de las desviaciones, con
respecto a la gran m edia (que era 84 y que es
una indicacin de la cantidad de variacin en
tre grupos); e l resultado fue 84/1 2 2 , 69% . Es
decir, e l 69% de la variacin de las desviacio
nes cuadrticas de las observaciones con res
pecto a la gran m edia est justificado por las
desviaciones cuadrticas de las m edias de sus
grupos con respecto a la gran m edia, un tama
o del efecto bastante importante.
F necesario ( g l = 2, 7; p < 0,0 5 ) = 4,74.
F u e n te
Intergrupal
ntragrupal

SC

gl

66
24

2
7

CM

33
3 ,4 3

9 ,6 2

C on clu sin : s e rechaza la h ip te sis nula.


E xplicacin: V a s e la respuesta al ejercicio 4 y las
respuestas a ejercicios d e captulos anteriores.
6. La primera oracin del resum en ofrece d os datos e s
tadsticos clave con respecto a cada grupo estudia
do, M y S D . M se refiere a la m e d ia , e l prom edio
com n de la cantidad de hermanos que tiene cada
grupo. S D s e refiere ai d e sv o e st n d a r d e cada
grupo, una indicacin de la cantidad d e variacin
am pliam ente utilizada. En un sentido am plio, e l
desvo estndar es la variacin prom edio de la can
tidad de hermanos con respecto al prom edio del
grupo. (En un sentido estricto,-es la raz cuadrada
del prom edio de las diferencias cuadrticas de la
cantidad d e hermanos d e cada persona con respec
to al prom edio d e su grupo).
La lnea citada ju sto antes del resum en (F (2 ,
55)...) describe los resultados de una comparacin
estadstica general entre m edias de los tres grupos
d ifer e n te s. Es decir, una cuestin de inters funda
mental para estos investigadores es saber si las d i
ferencias entre las m edias es mayor de lo que se
esperara por casualidad, lo que se denom ina sig
nificacin estadstica de la diferencia. (En este
punto, explicaram os la lgica del anlisis de va
rianza y d e la razn F siguiendo e l estilo de la res
puesta al ejercid o 3 del captulo 1 1).

El resum en tam bin s e refiere a com para


cio n es planificadas . S e trata de pruebas de sig n i
ficacin de pares particulares de m edias determ i
nadas de antem ano y basadas en la teora. En este
ejem plo, los investigadores planificaron una c o m
paracin entre los pro-sociales y los otros dos gru
pos ju m os, y otra com paracin entre los otro.- dos
grupos. La primera com paracin fue significativa
(lo cual quiere decir que e s altam ente im probable
qu e e l estudio hubiera descubierto esta gran d ife
rencia si, en efecto, las pob laciones involucaradas
no fueran diferentes; de hecho habra m eaos de 5
posibilidades en m il). Sin em bargo, la diferencia
entre los individualistas y los com petitivos no fue
significativa, es decir que no es tan im probable
que uno pudiera obtener una diferencia d e e se ta
m ao si, de hecho, las pob laciones involucradas
fueran idnticas).

Captulo 13
1. O a)

Observando las cantidades especficas de


hermanos involucrados, la conclusin es que el
estudio sugiere que, en general (entre las perso
nas com o las estudiadas), las personas con una
orientacin pro-social probablemente tengan ms
hermanos que la gente que no tiene una orienta
cin pro-social. Sin embargo, el estudio no es
concluyente en cuanto a si entre las personas en
general existe alguna diferencia entre la cantidad
de hermanos -d e los individualistas y de los
competitivos.

b)

E fectos principales de la clase y de la edad;


efecto interactivo.
c) El nivel de ingresos en general es m ayor en la
d a s e alta y en los individuos de m ayor edad,
pero la com binacin de m ayor edad y clase al
ta presenta un nivel de ingreso m ayor de lo
que se esperara s lo por e l efecto d e alguna
de las variables por separado.

CoRiunid ::. Artes liberales


Tipo de escuela

b) N o hay efecto s principales; efecto interactivo.


c) N i e l tipo d e facultad ni el tipo de especializad o n , por s so la s, predicen ed ifica cio n es, Pero
existe un patrn claro si uno analiza las com bina
ciones: las calificaciones correspondientes a alum
nos esp ecializad os en arte de las facultades de la
com unidad y a alum nos esp ecializados en ciencia
de las facultades de artes liberales, son ms altas.

b) A m bos efectos principales son significativos;


no hay interaccin,
c) Las mujeres pierden m enos das por m es que
los hombres; los pasantes pierden m enos das por
m es que los supervisores. Cada com binacin pier
de la cantidad de das que esperaram os c o n o c ie n
do el nivel en cada variable independiente por
separado.

* N. de la trad,: C om m u n ity College'. Colegio que comprende dos aos de universidad y es mantenido en parte por la
comunidad a la cual sirve,

. Calificacin de calidad del resiaurante

D ep orte
a)

B is b o l

f tb o l

B a lo n c e s to

a m e r ic a n o

;o
la
c
2

C on pro g ra m a
d e m o tiv a c i n
S in p r o g r a m a
d e m o tiv a c i n

72
10

7
6

10
5
6
L _ J ___________________ _
10

b)

7
5

___ __________________________ _
<,

B is b o l

F tb o l

B a lo n c e s to

a m e r ic a n o

' Calificacin de calidad itel restaurante

C on p ro g ra m a

10

"

-Ciudad

' ' '/

i iNuavyffc ,
OChicagb;

:Y7

/-i. .

d e m o tiv a c i n
'c S in p r o g r a m a
^ d e m o tiv a c i n

c)

10

10

10

B is b o l

F tb o l

B a lo n c e s to

a m e r ic a n o

,
la
'q
2

2
1
0
,

Can)

I;'

Moderador

;vv

B anco'

'

C on p ro g ra m a
d e m o tiv a c i n
S in p r o g r a m a
d e m o tiv a c i n

i. 7

Coito;;

b) E fecto principal de la ciudad y el n ivel de pre


cio, ms una interaccin.
c) La calidad de los restaurantes es diferente en
las distintas ciudades, siendo N ueva York la de
ms alta calidad y C hicago la de ms baja calidad.
La calidad de io s restaurantes es diferente segn
lo s diferentes n iveles de precio, siendo m ejores los
caros y peores ios baratos. Sin embargo, lo s dos
factores no se com binan sim plem ente, ya que el
precio crea una m ayor diferencia en N ueva York
que en otras ciudades.

d)

10

B is b o l

F tb o l

B a lo n c e s to

a m e r ic a n o

,.
.a
'
y

C on p ro g ra m a
d e m o tiv a c i n
S in p r o g r a m a
d e m o tiv a c i n

e)

10

B is b o l

F tb o l

B a lo n c e s to

a m e r ic a n o

'
2

C on p ro g ra m a
d e m o tiv a c i n
Sin p r o g r a m a
d e m o tiv a c i n

8,

10

7,5

3.

4.

a) E fecto dei deporte, 0 ,9 4 ; efecto de la con d i


cin , 0,9 7 ; efecto interactivo, 0,94.
b) D eporte, 66; condicin, 54; interaccin, 66.
Por lo tanto, al m enos 66 son necesarios,
a) A nlisis de varianza:
Punto de corte F para e l efecto principal del
diagn stico ( g l = l , 6 ; p < 0 ,0 5 ) = 5,99.
Punto de corte F para e l efecto principal d e la
terapia ( g l = 2 ,6 ; p < 0 ,0 5 ) = 5,14.
Panto de corte F para e l efecto interactivo
( g l = 2 , 6 ; p < 0 ,0 5 ) = 5,14.
T erap ia A

M f

<M
- W

-a y

/m 2

0
16

4
4

1
1

9
9

0
0

16

18

n
9

25
9

1
1

1
1

9
9

0
0

10

34

18

^Columna ^
T erapia B

I
M

II
M

ss,
sstcotranas
ss,fitas
ss.interaccin

= 2 + 2 + 0 + 2 + 2 + 0 = 8,
= 18 + 1 8 + 18 + 1 8 + 18 + 18 = 108.

= 0 + 0 + 0 + 0 + 0 + 0 = 0.

F u en te

SC

gt

CM

Terapia

108

108

36

18

D iagnstico
Interaccin

6
2
M

11

(X GM f

= 16 + 34 + 2 0 + 3 4 + 10 + 2 0 - 134.
= 8 + 2 + 2 + 2 + 2 + 2=18,

SS.total

1,33

N o se rechaza la
hiptesis nula
S e rechaza
la hiptesis nula
N o se rechaza
la hiptesis nula

b) Tabla de m edias de casilla y m arginales


M edias:
A

10

(M r .
~ G M f Int2

(X GM f

(X ~
M f

3
1

9
25

1
1

1
1

9
9

0
0

34

18

7
9

1
9

1
1

1
1

9
9

0
0

10

18

<M- W

Interior
de casillas

^Columna
T erapia C

(X M f

(- W

~ G af

M2

16
4

0
0

9
9

0
0

20

18

1
1

0
0

9
9

0
0

18

2
M

(X GM f

c) Tamaos de efecto:
8
10

II
M

^Columna ^

4
16
20

= (134 - 108 - 0) = 8/26 = 0.31


R m = 108/(134 - 8 - 0) = 108/126 = 0,86

^racrcctin = 0/(134 8 108) = 0/18 = 0


d) Explicacin; los resultados indican que existe
una diferencia significativa en la efectividad
entre las dos categoras de diagnstico; la tera
pia es m s efectiva para aquellos con diagn s
tico H. Sin embargo, no existe diferencia sig-

5.

SC

si

CM

Sim pata

N erviosism o

Interaccin

48

48

24

Dentro
de casillas

12

F u e n te

nificativa entre los tipos d e terapia, y io s tipos


de terapia no presentan una diferencia de e fe c
tividad significativa en los distintos tipos de
diagnstico. E l tamao del efecto significativo
es extrem adam ente grande.
a) A nlisis de varianza:
Punto F de corte necesario para el efecto prin
cipal de a sim pata ( g l = 1 , 8;p < 0,0 5 ) - 5,14.
Punto F de corte necesario para el efecto prin
cipal del nerviosism o ( g l = 1,8; p < 0,05)

= 5,14.

N o se rechaza
la hiptesis
nula.
N o s e rechaza
la hiptesis
nula.
S e rechaza la
hiptesis nula.

Punto F de corte necesario del efecto interacti


vo ( g l = l , 8 ; p < 0 ,0 5 ) = 5,14.
b)

Tabla de m edias de casilla y marginales, y grfico:

M edias:
S im p a ta
(X X G M f

N erv io sism o 7
8

4
9

(X -

(^Coirniqtx

M )2

-G M f

-G M p

0
1
1

0
0
0

0
0
0

4
4
4

In t?

14

12

A usen cia de 3
N erviosism o 3
3

4
4
4

0
0
0

0
0

0
0

4
4
4

12

12

M Columna

Sim pata
N ervioso
7
A usencia de N erviosism o 3
5

A usen cia de
sim pata
j
3
5
j
7 ........... 5
5

5
A u sen cia d e sim p a ta
( X - (X ~
^Columoe,
X G M )2 M )2 - G M f - G M f In t2

N erviosism o 3
4
2

4
1
9

0
1
1

0
0
0

0
0
0

14

A usen cia de 7
N erviosism o 5
9

4
0
16

0
4
4

0
0
0

0
0
0

20

4
4
4
12 5
c ) Tamao del efecto:

Columna

^^Toia!

5
= 60.

= 12.
^D entro
ucr*
^Columnas = 0.
= 0.
^FU a
5CInteraccin = 48.

4
4
4
12 5

^ W = / < 6 0 - 0 ~ 4 8 ) = 0/12 = 0
M, = 0 / ( 6 0 - 0 - 4 8 ) = 0 /1 2 = 0

" u r t , * * / ( 6 0 - o - 0 ) - 48/60 = 0,80


d) Explicacin: los resultados indican que existe
una interaccin significativa entre e l nervio
sism o y la simpata: cuando e l acusado es sim
ptico, tiene m s probabilidades de ser ca
lificado inocente si est nervioso; pero s i no es
sim p tic o , tiene m s probabilidades de ser ca
lificad o inocente si no est nervioso. (Tal vez
uno puede sentir em patia con el nerviosism o
de una persona sim ptica en el estrado, y si la
persona no estuviera nerviosa, uno podra sos-

pechar algo raro. En una persona que no es sim


ptica, el nerviosism o puede ser una adverten
cia de que es culpable, pero si no est nervioso,
sugiere que no tiene nada que ocultar). N o hubo
efecto significativo general en cuanto a la sim
pata o a la falta de ella, o en cuanto al nervio
sism o o la falta del m ism o, aunque debido al
pequeo tamao de las muestras utilizadas, el
no poder rechazar la hiptesis nula no debera
tomarse co m o prueba de que no existe tal
efecto.
El clculo de la significacin en este experi
m ento es m uy parecido al anlisis de varianza
de un criterio utilizando el m todo del m odelo
estructural, L os grados de libertad y la suma
de cuadrados intragm pales se calculan de la
forma acostumbrada, considerando a cada una
de las cuatro casillas com o su propio grupo.
Sin embargo, en este caso, el desvo intergru
pa! se divide en partes. Una parte tiene en
cuenta la variacin intergrupal de la sim pata y
la ausencia de la m isma. L os d esvos se calcu
lan para cada participante tomando la m edia
de todos lo s participantes en esa condicin de
simpata y ausencia de sim pata a la que perte
nece el participante, y restndole la gran m e
dia. Luego, los d esvos se elevan al cuadrado y
se sum an para obtener la sum a de cuadrados.
D esp u s se repite el proceso con la condicin
de nerviosism o y ausencia de nerviosism o.
L os grados de libertad para cada condicin
son la cantidad de niveles m enos uno. Por
ejem plo, dado que hay dos niveles de simpata
(sim pata y ausencia de sim pata), esta condi
cin tiene 1 grado de libertad.
An queda una parte correspondiente al
efecto intergrupal que tiene en cuenta las va
riaciones intergrupales de las m edias de cada
uno de los cuatro subgm pos, que no son sim
plem ente el resultado de sumar los efectos de
la simpata y el nerviosism o. Es decir, toda va
riacin entre los grupos de simpata, que difie
re segn el grupo de nerviosism o al que
pertenezcan. El desv o para este efecto inte
ractivo se encuentra tomando el desv o de ca
da registro con respecto a la gran media
general, y restndole los otros tres desvos (el
del registro m enos la meda de su grupo, y los
de la m edia de simpata m enos la gran media,
y la m edia de nerviosism o m enos la gran m e
dia). D espu s se elevan al cuadrado e so s des
vos restantes y se suman para convertirse en
la sum a de cuadrados de la interaccin. Los
grados de libertad son los que restan del total
de grados de libertad intergrupales. C om o hay

cuatro subgrupos, ios g l intergrupales - 3 , y


dado que hem os utilizado 1 para sim pata o
ausencia de sim pata y 1 para nerviosism o o
ausencia de nerviosism o, queda 1 g l para la in
teraccin,
. En este estudio hubo dos hallazgos importantes.
Primero, com o s e esperaba, los participantes con
estereotipos extrem os en cuanto a que lo s agentes
RRPP son extrovertidos, com parados con lo s parti
cipantes con estereotipos m oderados, describieron
a lo s agentes rrpp com o m s extrovertidos. Este
resultado fue estadsticam ente significativo; por
consiguiente, podem os confiar en que e l patrn d el
resultado se aplica no s lo a las personas estudia
das en particular sino a las personas en general que
sean sim ilares a las estudiadas. (M s precisam en
te, hem os calculado que si no existiera diferencia
prom edio en la poblacin en general, entre perso
nas con estereotipos extrem os y m oderados existi
ra m enos de un 0,0001 de probabilidad de que
este experim ento produjera un resultado tan fuerte
c o m o e l obtenido). M s an, con relacin ai tama
o d e e fe cto (proporcin de varianza explicada) t
picamente encontrado en ios estudios psicolgicos,
la diferencia obtenida fue considerable. (Utilizan
do la frmula basada en los F , R 2 = (38,94)(1) /
[(3 8 ,9 4 )(1 )+ 42) = 0,48).
En segundo lugar, y de sum a importancia, es
que sorprendentem ente la tendencia fu e m ucho
m s fuerte en los participantes a quienes se les dio
una descripcin de un agente rrpp en particular
que era altam ente introvertido. El resultado tam
bin fu e estadsticam ente significativo; (En este
caso, la posibilidad de obtener un resultado tan
fuerte, si en la poblacin en general no hubiera una
tendencia prom edio del tipo observado, era m enor
al 5%). E l patrn de este resultado tambin tena
un tam ao del efecto bastante grande con relacin
a lo que usualm ente s e ve en lo s estudios p sic o l
g ic o s (.R 2 = (5,69X 1) / E(5,69X) + 42) = 0,12).
En lneas generales, las personas expuestas
al extrem o introvertido tendieron a dar m ayores
calificacion es de extroversion. El resultado tuvo
significacin estadstica m argin ar, es decir que
se encontraba en e l lm ite de ser dem asiado im pro
bable que sucediera s no existiera verdadera d ife
rencia prom edio en la poblacin. M s an, el re
sultado no es m uy interesante, ya que, com o se
- puede observar en el grfico, se debe enteramente
a los participantes con estereotipos extrem os, y si
algn efecto se observa en los participantes de e s
tereotipos moderados es en realidad un patrn de
efecto contrario.

C aptulo 14
.

a) Punto de corte x 2 necesario


(g / = 5 - 1 = 4 ,5 % ) = 9 ,4 8 8 .

Categora

19
11
C
10
D
5
E
5
Total 50
Conclusin: se

b)

Esperado

A
B

(0 ,2 )(5 0 )
(0 ,2 X 5 0 )
(0 ,4 )(5 0 )
(0 ,1 X 5 0 )
(0 ,1 )(5 0 )
(0 ,1 )(5 0 )
rechaza la

O - E (O -E )*1 (O -E )1/ E

=10
9
81
8 ,1 0
= 10
1
1
0 ,1 0
= 20 - 1 0
100
5 ,0 0
= 5
0
0
0.00
= 5
0
0
0.00
= 50
0
X2 "0 3 ,2 0
hiptesis nula.

Punto de corte x 2 necesario


(S = 3 - 1 = 2 , 5 % ) = 5 ,9 9 2 .

Categora

Esperado

I
n

100
100
100
in
Total 300
Conclusin: se

O -E (O -E )1 (O - E f . E

(0 ,3X 3 0 0 ) = 90 10
100
1,11
(0 ,5X 3 0 0 ) = 150 -5 0 2 ,5 0 0 16,67
(0 ,2 X 3 0 0 )= 60 4 0 1,600 26,67
300
0
x 2 == 4 4 ,4 5
rechaza la hiptesis nula.

c) Punto de corte x 2 necesario


(g / = 4 - 1 = 3 , 5%) = 7,8 1 5 .
Categora O

Esperado -

0 - E { 0 - E ) 2( 0 - E ) 2E

1
38 (100 /5 0 0 )(2 0 0 )= 40 -2
4 0 ,1 0
2
124 (300/500X 200) = 120 4
16 0 ,1 3
3
22 (5 0 /5 0 0 )(2 0 0 )= 2 0
2
4 0 ,2 0
4
16 (5 0 /5 0 0 )(2 0 0 )= 2 0 -4
16 0 ,8 0
T otal200
200 0
x2= 1.23
C onclusin: no se rechaza la hip tesis nula.
d)

Punto de corte x 2 necesario


(g l = 3 - 1 = 2 , 5 % ) = 5,992.

Categora

Esperado

O - E (i0 - E f ( O - E f E

37
30
7
49
Artes
81
C iencias
21
30
-9
4
30
2
Humanidades 32
Total
900
X2 =
90
C onclusin: no s e rechaza la hip tesis nula.
2.

1,63
2 ,7 0
0 ,1 3
4 ,4 6

a) Pasos de la prueba de hiptesis:


1. Replantear e l problem a en funcin de hi
ptesis de investigacin e hip tesis nula de las
poblaciones.
P o b la ci n 1: pacientes c o m o lo s de la clni
ca de psicoterapia del ejem plo.
P o b la ci n 2: pacientes para quienes las dis
tintas temporadas no im plican ninguna diferen
cia con respecto al m om ento en que com ienzan
la psicoterapia.

La hiptesis de investigacin establece que


la distribucin entre las distintas temporadas,
con respecto al m om ento en que los pacientes
com ienzan la psicoterapia, es diferente entre
las d os poblaciones. L a'hiptesis nula estable
c e qu e la distribucin entre las distintas tem
poradas, cor- respecto al m om ento en que los
pacientes com ienzan la psicoterapia, no es d i
ferente entre las dos poblaciones.
2. Determ inar las caractersticas de la
distribucin comparativa.
D istribucin de chi-cuadrados con 3 grados de
libertad ( g l = 4 - 1 = 3).
3. Determinar el punto de corte en la distri
bucin comparativa, a partir del cual se d eb e
ra rechazar la hiptesis nula.
N ivel 0,05,
= 3: x 2 = 7,815.
4. Determinar el valor muestra! en la distri
bucin comparativa.

Temporada O
invierno
28
Primavera 33
Verano
16
Otoo
51
Total 128

Esperado
(1/4X 128)= 32
(1/4)(128) = 32
(1 /4)(128) = 32
(1 /4 )(1 2 8 ) = 32
128

0 ~ E (0 ~ E )2{0 ~ E )2f

-4
16 0 ,5 0
1
1 0,03
- 1 6 256
8 ,0 0
19 361 11,28
0
x 2 - 1 9 ,8 1

5.
Comparar los valores obtenidos en los pa
so s 3 y 4 para decidir si se rechaza o n o la h i
p tesis nula.
X2 en e l paso 4 (1 9 ,8 1) es mayor que e l punto
de corte del paso 3 (7,815). Por lo tanto, se re
chaza la hiptesis nula; s e sostien e la hip tesis
d e investigacin.
b) Explicacin: si las temporadas no marcaran una
diferencia esperaramos aproxim adam ente un
25% de nuevos pacientes cada temporada (ba
sndonos en e l ao anterior, e l 25% del total
de 128 e s igual a 32). Las cantidades reales
d e cada temporada del ao anterior son tan di
ferentes a estas expectativas que deberam os
concluir que, e n general, las cantidades de
nuevos pacientes no s e distribuyen en forma
pareja entre las temporadas?
E i chi-cuadrado es un indicador d el grado de
discrepancia entre resultados observados y e s
perados. Para cada categora (las cuatro esta
ciones en este caso), calculam os la diferencia,
la elevam os al cuadrado y la dividim os por la
cantidad esperada; despus sum am os los re
bultados. En el invierno, 28 m enos 32 e s ~4;

No se rechaza Ja hiptesis nula.

elevado ai cuadrado es 16; dividido 32 es 5, S i


hacemos lo mismo para las otras tres estacio
nes y sumamos los cuatro resultados obtene
mos un chi-cuadrado total de 19,8 i (E
chi-cuadrado utiliza diferencias cuadrticas
para que el resultado no se vea afectado por la
direccin de las diferencias. Se divide por la
cantidad esperada para reducir e impacto e n
el resultado de la cantidad ordinaria de casos).

3.

<>= 6W = V2.6/52 = V533 = 0,23.


f

Esperado

0~E {0~E?

206

7,38

103

10

(1 3 )

16

(1 3 )

26

(50% )

(1 3 )

10

(1 3 )

26

(50% )

26

v 2

( l o 1 3 )2+ ( I 6 -

is

13)?- (1 6 13

- - f. .

: 0 ,6 9 + 0 ,6 9 + 0 ,6 9 + 0 ,6 9 = 2,7 6 .

654

Estadstica para psicologa

4 = -#,36/412 = vb.0009 = 0,03.


J ) = i;
Punto de corte
( g t = l , 1% ) -

(100-30)2
130

necesa rio

6,635.
(160 130)*_ (1 Q 0 -1 3 0 )2

(1 6 0 - 1 3 0 )2

130

130

= 6,92 + 6,92 + 6,92 + 6 ,9 2

130

2 7 ,6 8 .

Se rechaza Ja hiptesis nula.

V27,68/520 = -0532 =0,23

4 -

S l - w cota - m b, - 1>-(3 - 2 - 1) = 2;
Punto de corte xz necesario
(gl = 2,1%) = 9,211.
10
16

(13) 16
(13)

(13)1 10 (10) 36(50%)


To.... (13) ..W ....(10)136 (50%)

26

(10 - 1 3 ) 2f

20

( 1 6 - 1 3 )2
13

(1 6

' 13

72
i3 ) 2+ ( 1 0 : 1 3 )
13

10)2+ (10- 10)3


10

10

= 0 , 6 9 + 0 , 6 9 + 0 , 6 9 + 0 , 6 9 + 0 + 0 = 2 ,7 6 .
N o s e rechaza la h ip te sis n u la .

13

e)

103

103

<P d e C ram er= t y / W X g l ^ ) = V2,7 6/(72X 1)'

13)2 ( 10 - J3)2

13

103

No se rechaza la hiptesis nula.

( 10 -

52

26

('100- 103)'

0,09 + 0,09 + 0,09 + 0 ,0 9 = 0,3 6 .

26
210,25 7,38
X2~ 14,76

b) Explicacin: similar a la respuesta al ejercicio 2b.


a) gl =(YCoIum - lXAfe, - 1M2 -1 )(2 - l ) - l ;
P u n to d e c o r t e x~ n e c e s a r io (gl= 1, 1%) = 6,63 5 .
16

412

(1 0 0 -1 0 3 )2 ( 0 6 -1 0 3 )2 (1 0 6 -1 0 3 f

13
4.

2<36

(O-E)2

210,25

1%)

106 (103) i 206 (50%)


100 (103) 1 206 (50%)

1 m (103)
1 106 (103)

(1/2) (57)
Cambio
Promedio 43
14,5
= 28,5
(1/2) (57)
Cambio
No Percibido 14
= 28,5 -14,5

= i,

= 6,635.

Los estadsticos han determinado matem


ticamente qu sucedera s tomamos una can
tidad infinita de muestras de la poblacin,
con ana proporcin fija de casos en cada ca
tegora, y calculamos el chi-cuadrado para
cada una de esas muestras. La distribucin de
esos chi-cuadrados depende slo de la canti
dad de categoras libres para incluir diferentes
valores esperados. (Ya que la cantidad total es
perada es la cantidad total de casos, si conoce
mos la cantidad esperada para tres categoras
cualesquiera, la cantidad esperada para la
cuarta es fcil de determinar. Una tabla de la
distribucin chi-cuadrado, con tres categoras
%2S
libres de variar, muestra que existe slo un 5 %
de posibilidades de obtener un chi-cuadrado
de 7,815 mayor. Como nuestro chi-cuadrado
es mayor que ese nmero, el resultado obser
vado difiere del esperado ms de lo que razo
nablemente esperaramos que lo hiciera por
casualidad; la cantidad de nuevos pacientes, a
la larga, probablemente no sea la misma du
rante las cuatro estaciones,
a) Clculo

Categora

! ) = ( 2 - J ) ( 2 - l ) = 1;

corte X2 necesario (gl

Punto de

= 0VCo^

= 70.0383 = 0 ,2 0 .
~ l)QVlss -I)-.

Punto d e c o r te x 2 n ecesario

(gl =

2 , 1 % ) = 9 ,2 1 1 .

(3- 1)(2- l) =2;

10
16

(13)
(13)

26

16 (13)
10 (13)

16
16

26

32

42 (50%)
42 (50%)

(16)
(16)

Distribucin chi-cuadrado con dos grados de


libertad.
m m i- 3)=(3 - 1 X 2-1)= 2
3. Determinar el punto de corte en la compa
racin

Nivel 0,05, gl = 2: = 5,992.


4. Determinar el registro rrmestral en la dis
tribucin comparativa.

84

1 0 - 1 3 ) J ----------
( 1 6 - 13)24,
( ------1 6 - 1 3 ) 2+ (
I0-1
3 )
2
"Yi (-----------q.
A
13
13
13
13
(16-16)2 (16-16)2

------------------- j ,

16

16
Q
s
i3
a
Su
O

Artefacto utilizado
en los hogares

fiT}-w

= 0,69 + 0,69 + 0,69 + 0,69 + 0 + 0 = 2,76.


No se rechaza la hiptesis.
6 de Cramer = ^2,76/(84)(l) = 90,0329 - 0,18.

i O

O 8'=(WCol,-lXW6te- t t = ( 3 - l ) a - l ) =2;
x2 necesario (g = 2,1 %) = 9,211.
10
16

(12)

16

<W)

10

26

(12)
(14)

10 (12) 36 (46%)
16 (14) 42 (54%)

26
(1 0 -1 2 )2
12

(1 6 -1 2 )2
+

78

26

( 1 0 - 1 2 )2 ; ( 1 6 - 14)2

12 "+

(1 0 -1 4 )2 (16

12

14

14)2

4-
---- -

14

14

- 0,33 +1,33 + 0,33 + 0,29 +

1,14 + 0,29 = 3,71

No se rechaza la hiptesis nula.


de Cramer = 93,71/(78)(1) = 90,0476 0,22.
5.

a) Pasos de ia prueba de hiptesis;


1. Replantear el problema en funcin de hi
ptesis de investigacin e hiptesis nula de las
poblaciones.
Poblacin 1: alumnos como los entrevistados.
Poblacin 2: alumnos para quienes el tipo
de artefacto utilizado en su hogar es indepen
diente de la utilizacin de lapicera o lpiz
cuando toman apuntes en clase.
La hiptesis de investigacin establece que
las dos poblaciones son diferentes (el tipo de
artefacto utilizado en los hogares no es inde
pendiente del hecho de utilizar lapicera o lpiz
al tomar apuntes en clase). La hiptesis nula
establece que las dos poblaciones son iguales
(el tipo de artefacto utilizado en los hogares es
independiente del hecho de utilizar lapicera o
lpiz al tomar apuntes en clase).
2. Determinar las caractersticas de la distri
bucin comparativa.

Mquina P ro cu ra d o r
de escribir de textos Ninguno

Lapicera 42 (39) 62 (65) 26 (26) 130 (65%)

Lpiz
3&

18 (21) 38 (35) 14 (14) 70 (35%)


60

100

40 200

2 _ (42-39)2 (62-65)2 (26-~26)2 (18-21)2


X~
39
+
65
+
26 + 21
+

(38-35)2 (14-14)2
35
+
14

= 0,23 + 0,14 + 0 + 0,43 + 0,26 = 1,06


5. Comparar los valores obtenidos en los pa
sos 3 y 4 para decidir si se rechaza o no la hi
ptesis nula.
X2 en el paso 4 (1,06) es menos extremo que
el punto de corte del paso 3 (5,992).
Por lo tanto, no se rechaza la hiptesis nula;
el estudio no es concluyente.
b) |> de Cramers
c) Explicacin: en este ejemplo, el 65% de todos
ios sujetos utilizan lapiceras para tomar apun
tes. Por o tanto, si el hecho de utilizar lapicera
o lpiz no est relacionado con el artefacto uti
lizado en los hogares, el 65% de las personas
que forman cada categora referida al artefacto
que se utiliza en el hogar utilizara lapiceras
para tomar apuntes. Por ejemplo, esperara
mos que 39 de los 60 alumnos que utilizan m
quina de escribir utilizarn lapicera al tomar
apuntes. Los resultados de la encuesta, son lo
suficientemente diferentes de estas expectati
vas como para que concluyramos que lo que
los alumnos utilizan para tomar apuntes est
relacionado con el artefacto que emplean para
escribir cuando estn en sus hogares?

Respuestas

655

El chi-caudrado es una m edida del grado de


discrepancia entre los resultados observados y
esperados. C alculam os la diferencia entre lo
observado y lo esperado en cada com binacin,
de la estructura 2 x 3 , elevam os esa diferencia
al cuadrado y la dividim os por la cantidad e s
perada; luego sa m am os los resultados. En la
com binacin lapicera-mquina de escribir, 42
m enos 39 es 3, elevado al cuadrado es 9, divi
dido 39 e s 0,23. A l realizar el m ism o proceso
para las otras cinco com binaciones y sumarlas
obtenem os 1,06. (L os chi-cuadrados utilizan
diferencias elevadas al cuadrado para qu el
resultado no se vea afectado por las direccio
nes d e las diferencias. A dem s, la diferencia
cuadrtica se divide por la cantidad esperada
para adaptar el im pacto de las cantidades rela
tivam ente diferentes esperadas para cada com
binacin).
L os estadsticos han determinado matem ti
cam ente lo que sucedera si tomramos una
cantidad infinita de muestras de una poblacin,
con una proporcin fija de personas en cada
una de las distintas agrupaciones, y calculra
m os el chi-cuadrado de cada una ele esas m u es
tras. L a distribucin de e so s chi-cuadrados
depende s lo de la cantidad de agrupaciones
libres para adoptar diferentes valores espera
dos. (Si de cada una de las categoras en las
que se divide la variable artefactos utilizados
en el hogar co n o cem o s la cantidad de alum
nos que toman apuntes con lapicera, es fcil
determinar la cantidad de alum nos que tom a
apuntes co n lpiz. Y si conocem os dos de las
tres categoras de la variable artefactos utili
zados en los hogares , correspondientes al
grupo que utiliza lapicera, la tercera categora
es f cil de determinar porque debe sumar el
total de alum nos que utilizan lapicera. Por lo
tanto, s lo dos com binaciones son libres de
variar).
U na tabla de la distribucin de chi-cuadra
d os, para el ca so en que dos agrupaciones son
libres de variar, muestra que ex iste s lo un
5 % de p osibilidades de obtener un chi-cua
drado de 5 ,9 9 2 mayor. D ebido a que nuestro
chi-cuadrado es m enor a ese nmero, las can
tidades observadas en cada categora difieren
d e las cantidades esperadas m enores a lo nece
sario para poder rechazar la idea de que el e le
m ento que las personas utilizan para tomar
apuntes no est relacionado con e l artefacto
que utilizan para escribir cuando estn en sus
hogares. La encuesta no es concluyente.

6.

a)

Sin em bargo, p od em os estim ar el grado real


de relacin, dentro de este grupo, entre el e le
m ento utilizado en clase y ei artefacto utiliza
do en lo s hogares. El procedim iento m encio
nado se denom ina phi de Cramer", y se cal
cula dividiendo el chi-cuadrado calculado por
la cantidad de personas que inclu ye el anli
sis, sacando luego la raz cuadrada del resul
tado, En el ejem plo que analizam os el resultado
es 0,07.
El estadstico que m encionam os en el prra
fo anterior se extiende del 0 (ausencia de rela
cin) al 1 (relacin perfecta, con ocer la si
tuacin de una persona en una de las dim en
siones, com o por ejem plo, saber qu utiliza
para escribir en clase permitira predecir per
fectam ente su situacin e n la otra dim ensin,
tal com o el elem ento que utiliza para escribir
en su hogar). Por lo tanto, 0 ,0 7 es un nmero
bastante bajo. (D e hecho, e l phi de Cramer es
com parable con lo que s e denom ina un c o efi
ciente de correlacin, y en p sic o lo g a 0 ,0 7 es
un valor m uy bajo con respecto a las correla
cion es encontradas en la m ayora de lo s estu
dios). V indolo de otro m odo, podem os pre
guntar, si realm ente existe una relacin m ode
rada, cules son las posibilidades de que todo
el proceso realizado diera co m o resultado una
conclusin positiva? L os estadsticos han de
sarrollado tablas que nos indican esa probabi
lidad y, en este caso, habra un 97% de pro
babilidad. Por lo tanto, dado ei resultado obte
nido, si existe alguna relacin, casi segura
m ente es bastante pequea.
L os cinco pasos de la prueba de hip tesis d e
beran realizarse de forma sim ilar a Eos indica
dos en la respuesta a! ejercicio 5 que aparece
anteriormente. L os clculos y resultados clave
se indican a continuacin: .

gt =(tfcbtom-1Wflta -1) (3- D(3 - 1M ;


Punto de corte y 2 necesario (g l ~ 4,5% ) = 9,488.

C om u n id ad
B
A
A favor
12 (9,8) 6 (4,2)
En contra 1 8 (1 6 ,8 ) 3 (7,2)

No emite
opinin
T otal

C
Total
3 ( 7 ) 21 (23,33% )
1 5 (1 2 ) 36 (40,00% )

1 2 (1 5 ,4 ) 9 (6,6) 1 2 ( H ) 33 (36,67% )
42

18

30

90

( 1 2 - 9,8 )2 . (6 - 4,2)2. (3 - 7)2 (18 ~ 16,8)


^ .............
............. "V
*------- + ......... .......
9,8

4,2

16,8

C ap tu lo 15

1.

(3 - 7 , 2 ) 2

(1 5 -1 2 )2

( 1 2 - 15,4 )2

( 9 - 6 , 6 )2

7,2

12

15,4

6,6

+ ...........+ ----- -------H + ....... r":


, (1 2 - ll) 2

....

11

= 0,49 + 0,77 + 2,29 + 0,09 + 2,45 + 0,75


+ 0,75 + 0,87 + 0,09
= 8,55.

(a)

N o se rechaza la h ip te sis nula.


b) / ci Craraer = 78,55/(90)(2) = 7 8 ,5 5 /1 8 0 =

0,05 = 0,22.
Potencia para un tamao d e efecto pequeo
= 0 , 1 1 ; m ediano = 0 ,6 6 ; grande = 0 , 9 9 . (Sobre

7.

la base de N - 1 0 0 ) .
c) Explicacin: V a se la respuesta al ejercicio 5c.
a) C lculo de x 2
Han
tratado

N o han
tratado .

Total

37 (5 2 ,9 )
51 (35,2)
7 0 (7 0 ,4 )
47 (4 6 ,8 )
4 0 - 4 9 hrs.
> 5 0 hrs. 2 2 8 (21 2 ,1 ) 1 2 5 (1 4 1 ,2 )
4 0 hrs.

88 (15,80% )
117 (21,00% )
353 (63,30% )

223

T o ta l 335

5 5 8 (1 0 0 ,1 0 % )

Ce)
( 3 7 - 5 2 ,9 f
52,9

(51 - 3 5 , 2 ) 2
+

( 4 7 - 4 6 , 8 )2
+

46,8

3 5 ,2

( 7 0 - 7 0 ,4 ) 2
*

70 ,4

(2 2 8 - 2 1 2 ,l ) 2
+

212,1

D atos sin
tra n sfo rm a r

R az c u a d r a d a

R angos

( 1 2 5 - 1 4 1 , 2 )2
+

141,2

= 4 ,7 8 + 7 ,0 9 + 0 ,0 0 + 0,00 + 1,19 + 1,86 = 14,92

b) cj> de Cramer
= ^ 4 , 9 2 / ( 5 5 8 ) 0 ) ] = V 2 7 = 0 ,1 6 ;
tamao del efecto pequeo.
c) 1 princip al halla zg o e s qu e las pro p o rcio
nes d e m d ico s que han tratado p a cien tes
co n hv /sid a e s m ucho m enor dentro del gru
po de m dicos que ejercen m enos d e 40 horas
por semana. D e todos m odos, se trata de un ta
mao del efecto pequeo. La explicacin para
una persona que nunca ha tom ado un curso de
estadstica sera sim ilar a la respuesta al ejer
cicio 5c anterior.

0 -4
5 -9
1 0 -1 4
1 5 -1 9
2 0 -2 4
2 5 -3 0

12
5
4
4
3
2

0 0,9
1 -1 ,9
2 -2 ,9
3 -3 ,9
4 -4 ,9
5 - 5 ,9

1
7
7
6
7
2

0 -4 ,9
5 -9 ,9
1 0 -1 4 ,9
1 5 -1 9 ,9
2 0 -2 4 ,9
2 5 -2 9 ,9
3 0 -3 4 ,9

4
4
6
5
5
5
1

O rigin a l /
0/
M!
2 Ul

3/
m

5/
6/
7/
8
9//
10//
11/
12/
13
14
15

R ango

1
3
3
1
4
1
1
1

1
3
6
8
10,5
13
14
15

0 ,0
1,0
1,4
1,7
2,0
2 ,2
2 ,4
2 ,6

2
2
1
1

16,5
18,5
20
21

3,0
3,2
3,3
3,5

O ri
gn a l /
14
15
16//
17/
18/
19
20/
21/
22
23/
24
25/
26
27
28/

R ango

- f

2
1
1

22,5
24
25

4 ,0
4,1
4,2

1
1

26
27

4,5
4,6

28

4,8

29

5,0

30

5,3

2.

Probablem ente no normal: a) asim trica hacia la


derecha, b) bim odal, c) asim trica hacia ia
derecha,
3. a) y b) Punto de corte r necesario (dos colas,
p < 0,0 5 , g l = B) = 2 ,3 0 6

4.

tanto, probablem ente sugiere que la distribucin


poblacional de races cuadradas de los tam aos de
las fam ilias est distribuida de form a prctica
mente normal. Som os con scien tes de que calcular
la raz cuadrada de cada tamao fam iliar distor
siona su significado directo. Pero el im pacto cau
sado a los individuos de la fam ilia per cada hijo
adicional probablem ente no sea igual. Es decir, no
tener ningn hijo y tener uno provoca un enorm e
im pacto. Pasar de tener 1 a tener 2 provoca un
im pacto menor, y pasar de tener 7 a tener 8 proba
blem ente provoca una diferencia m ucho menor
para ia fam ilia,
D e todos m odos, despus de haber calculado
la raz cuadrada de cada observacin, se realiz
una prueba t com n para m edias independientes.
El resultado no fue concluyente; no se pudo recha
zar la hiptesis nula. (Y dado que e l tam ao d e ia
muestra era tan pequeo, la potencia probable
mente tam bin era baja, haciendo difcil deducir
algn significado del hecho de no haber podido re
chazar la hiptesis nula).
a) y b)

Observacin:
201 523 614
Rango:
2 5 6

V alores a lo s que se le ap lic


la tra n sfo rm a ci n ra z c u a d ra d a

136 340 301


1

838 911 1.007


7 8

M:
G ru p o A

G ru po B

1,1
1,6
2,1
1,9
2 ,7
1,88
0,35
= 0 35

1,4
3 ,0
2,4
2,6
2 ,2
2,32
0,35

r=
*=
!

5a
&'Diferencia

0,07
= ,0 7 + 0.07 " 0 .1 * W * . 0,37
t - (1 ,8 8 - 2 ,3 2 )/0 ,3 7 = i , 19
conclusin: no se rechaza la hiptesis nula,
c) E xplicacin: no habra sido adecuado realizar una
prueba t con los nmeros tal com o estaban (sin
transformarlos). Las distribuciones de las m ues
tras eran tan asim tricas para am bos grupos
idiom ticos que pareca probable que la distribu
ci n poblacional tambin fuera considerablem ente
asimtrica. En e se caso, no s e cum plira el
supuesto para la prueba t que establece que las dis
tribuciones poblacionales im plcitas son normales.
Por lo tanto, s e calcul ia raz cuadrada de cada
observacin, A travs d e ese proceso s e obtuvo la
posibilidad de crear una distribucin muestra!
m ucho ms cercana a lo normal, y que, por lo

13/3 = 4,33

8/3 = 2,67

24/3 = 8 GM = 5

S2:
8,67/2 = 4,34
4,66/2 = 2,33
2 /2 = 1
Punto de corte F necesario ( g l = 2 , 6 ; p < 0 ,0 5 ) = 5 ,1 4
S2 * == ( S S / g m = (4 ,3 3 - 5)2 + (2,67 ~ 5 ) 2
+ (8 - 5)2]/(3 - 1) )(3 ) = (1 4 ,8 8 /2 )(3 ) = 2 2 ,3 2
= (4 ,3 4 + 2,33 + 1)/3=2,56; F = 2 2 ,3 2 /2 ,5 6 = 8,72
C onclusin: s e rechaza la hiptesis nula.
c ) E xplicacin: com nm ente, en estos casos en
ios que se prueba la significacin de la d ife
rencia entre tres m edias, se realizara un anli
sis estndar de varianza de un criterio. S in
em bargo, un supuesto del anlisis de varianza
establece que las poblaciones correspondien
tes a cada grupo estn distribuidas normal
m ente. Segn la muestra, las calificaciones
dadas por e l grupo que mir la pelcula que
causaba tristeza parecan m uy asim tricas ha
cia la izquierda y, posiblem ente, las califica
cion es del grupo que v io la p elcula que
causaba enojo tam bin lo fueran. (E s ms,
exista bastante diferencia entre las estim acio
nes de varianza poblacional d e l grupo d e la
pelcula triste y del grupo de la pelcula alegre,
hecho que cuestiona otro de los supuestos del

anova,

5.

que establece que las distribuciones


pobiaconales tienen la m ism a variarla).
Para resolver este problema, cam biam os
cada uno de los valores observados por su
rango, en todos los casos. El proceso arriba
m encionado produjo el efecto de convertir la
distribucin de calificaciones en una distribu
cin rectangular (aunque en realidad no ayud
m ucho en cuanto al grupo de la pelcula
triste). D e todas maneras, algunos estadsticos
recom iendan que si lo s supuestos de un anli
sis de varianza com n son cuestionables, uno
debera cambiar los valores primero a rangos
y luego realizar el proceso, y a s se obtendrn
resultados ms precisos. En realidad, existen
procedim ientos esp eciales que uno puede uti
lizar para realizar un anlisis de varianza por
rangos. Pero lo s clculos son m atem tica
mente equivalentes a los que se realizan en un
anlisis de varianza utilizando rangos. La
nica diferencia es que co n el procedim iento
de rango y orden existen tablas esp eciales que,
en estos casos, son ms precisas que la tabla F,
D e todos m odos, los estadsticos sugieren que
los resultados, al utilizar una tabla F com n en
estos casos, son una buena aproxim acin.
D ado que nuestro resultado era claramente
ms extrem o que el punto F d e corte, podem os
aceptar esta conclusin sin temor a equivo
cam os, y rechazar la hiptesis nula.
a) Procedim iento: con 2 0 diferencias de m edia,
la diferencia de m edia resultante debe ser la
m ayor para rechazar ia hiptesis nula al nivel
0,05.
Las diferencias de m edia, en el orden en que
se presentan lo s grupos en el ejercicio, son las
siguientes:

4,67

2,67

3,33

1,33

1,33

0,67 -0 ,6 7

-4 ,6 7 - 4 -2 ,6 7 - 2 -3 ,3 3 - 2 -1 ,3 3 -1 ,3 3 - 0 ,6 7 -0 ,6 7
Las diferencias de m edia, ordenadas de menor
(m s negativa) a mayor, son las siguientes:
-4 ,6 7 , - 4 , -3 ,3 3 , -2 ,6 7 , -2 , - 2 , - 2 , -1 ,3 3 , -1 ,3 3 , -0 ,6 7 ,
-0 ,6 7 , 0 ,6 7 ,0 ,6 7 , 1,33, 1,33, 2, 2, 2 ,6 7 , 3 ,3 3 ,4 , 4,67
b) Explicacin: supongam os que realizar la prue
ba so lo o frente a un am igo no im plicaba nin
guna diferencia. En ese caso, la razn por la
cual los valores observados de las personas
analizadas son m ayores cuando se encuentran
a solas debe de ser que la asignacin aleatoria
accidentalm ente ubic, dentro de ia condicin
en la que se encuentran a solas, ms personas

6.

que, de todos m odos, hubieran realizado bien


la tarea. Pero, cul es la probabilidad de que
lo antedicho ocurra? E xisten s lo 20 formas
de com binar a seis personas en dos grupos de
tres. E sas 20 com binaciones fueron presenta
das en el enunciado d el problema, y se calcul
la diferencia del prom edio de lo s valores c o
rrespondientes a las personas que realizaron la
tarea a solas, m enos el prom edio de los valo
res de aquellos que realizaron la tarea en pre
sen cia de un am igo. D e las 20 posibles com bi
naciones de asignacin aleatoria, slo una, la
que presenta los valores de los dos grupos rea
les, habra producido sem ejante diferencia en
tre los dos grupos. Si los resultados se dieran
de m odo casual, existe slo una probabilidad
del 5 % de obtener el m ayor de 20 resultados.
E se porcentaje es dem asiado bajo para con si
derarlo probable. Por lo tanto, se lleg a la
conclusin de que la gran diferencia entre los
prom edios de ios dos grupos no fu e un hecho
casual resultante de la asignacin aleatoria.
D ado que todos los dem s aspectos entre lo s
grupos eran iguales, la conclusin es que la si
tuacin de estar a solas o estar en presencia de
un am igo es lo que ocasion ia diferencia.
M iller deseaba exam inar la relacin entre las va
riables que estaba analizando, probablem ente in
cluyendo varias tcnicas paramtricas d e prueba
de hiptesis tales com o la prueba t o un anlisis de
varianza (o probando la significacin de los resul
tados de una correlacin o regresin m ltiple o bivariada). Todos e sos procedim ientos se basan en el
supuesto de que las distribuciones de las variables
en la poblacin siguen una distribucin normal.
Sin embargo, antes de realizar los procedim ientos
m encionados, M iller control las distribuciones de
varias de las variables que estaba organizando. A l
realizar ese control, descubri que las observacio
nes correspondientes a dos m edidas clave (el ndi
ce de atencin a alternativas y e l tiem po transcu
rrido observando las diapositivas) eran positiva
mente asim tricos (presentaban una distribucin
ladeada con una larga cola hacia la derecha). Por
ello resultaba poco probable que las distribuciones
poblacionales de esas variables cum plieran e l su
puesto de seguir una curva normal. Por lo tanto,
M ier decidi cam biar cada valor m atem tica
m ente, Este proceso se denom ina transformacin.
En este caso, calcul el logaritm o de cada registro.
El efecto del proceso m encionado es reducir todos
ios nmeros, pero los nmeros mayores en m ayor
grado, reduciendo de ese modo la asimetra positi
va y acercando la distribucin a la n orm al Parece
particularmente adecuado realizar e l tipo de trans-

formacin descripa con una medida de informe


propo, en la que no existe una escala absoluta.
Probablemente, e mismo proceso sea apropiado
tambin para ei tiempo transcurrido observando
las diapositivas, ya que cada segundo adicional de
observacin puede no representar una cantidad
igual de inters adicional. D e todos modos, es im
portante subrayar que una transformacin de este
tipo an conserva intacto el orden de las observa
ciones. D e todos modos, luego de realizar la trans
formacin, ios valores transformados probable
mente se utilizaron en las tcnicas estadsticas pa
ramtricas comunes.

Comparacin:

gl
70

70

Punto de corte
1 ,9 9 5

iii)

S l

3 ,9 8
( f

Varianza
intragrupal

t F
2 ,5 6

Mtx0 = 4 4
S l emr^ 4 4

6 ,5 5

= 1 ,9 9 5 )

( V = 2 ,5 6 )

Prueba z:
Punto de corte
( g l = 30 , p < 0,05, dos colas) = 2,043
S2Combinada 1500118 + (D5/30H 6)) =
S2m =7/16 = 0,44; S2M 2 = 7/16=0,44;

7;

SW =0.'W + 0,44 = 0,88;


S * = 0,94; t -> < 7 3 -7 5 y 0 ,9 4 =-2 ,1 3

Captulo 16

Se rechaza la hiptesis nula.

1.
anova:

2,571
6,61
6,61

F
2. i )

10
2,228
4,96
4,97

S :
t

15
2,132
4,55
4,54

20
2,086
4.35
4,35

Punto de corte F (g l = 1, 30; p < 0,05) = 4,17


^
- {[(73 - 74)2 + (75 - 74)2]/
(2 1 )} (1 6 )= = (2 /l)(1 6 ) = 32
^dentro $ + 6)/2 = 7; F = 32/7 = 4,57
Se rechaza la hiptesis nula.

anova:

Comparacin:
Punto de corte F ( g l - 1, 58; p < 0,05) = 4,02
S^etre = (S C /g l) (n ) = ({[(12 - 11,55)2 +
(11,1 - 11,55)2]/= (2 -1)}(3 0 )
- (0,405/l)(30) = 12,15
^dentro = (2 -4 + W 2 = 2 <^ F *= 12,15/2,6
= 4,67
Se rechaza la hiptesis nula.

gl

Punto d e corte

Varianza
intragrupal

t F

58
58

2,004
4,02

= 2.6
5 ^ = 2.6

2,16
4,67

(-T

Punto de corte

Varianza
intragrupal

30

2,043

S%
mf0 = 7

30

4,17
( f =2,042)

= 2 ,0 0 5 )

C T = 2 ,1 6 )

Clculos prueba t
Punto de corte
( g l = 18, p < 0,05,
dos colas): 2,101
Diferencia media
= 1 7 0 -1 5 0
=

i)

20

S L , = 7

2,13
4,57
0 T = 2 ,1 4 )

Clculos a n ova
Punto de corte F
(gl = 1,18; p <0,05): 4,41 (vr =2,1)
GM = (170 + 150)/2
= 320/2=160
2 ( M - G M ) 'l = ( 1 7 0 - 1 6 0 ) 2
+ (1 5 0 -1 6 0 )2

= 102+ (-10)2
= 100+100=200
'^emre^^entre

anova:

Punto de corte F (g l = 1 ,7 0 ; p < 0 ,0 5 ) = 3,98

t F

3.

Comparacin:

gl

= (SC/gl)(n)

E (M - G iV f) \n)

= ( { [ ( 1 0 0 - 1 0 2 ) 2 + (1 0 4 - 102)2]/

entre

= ( 200/ 1) ( 10)

= (2 -1 )} (36)
= (8 /l)(36) = 288
5^dentro = (40 + 48V2 = 44i F 288/44 = 6,55
Se rechaza la hiptesis nula,

Total =

= 9 + 9=18

dentro
= ^ l + S l2 + - + S l mmo

= 9 + 9=18

^Combinada ^ l ^ T o t a l ^ ^ P

2 (X - G M f SCTiJtll = 7 1 + 8 3 = 154

^ " d e n tr o ^ ^ '^ d e n t r o

+ teV^TbnJ&i) C52! +
+
(0,5X 48) + (0 ,5)(32)
+ ^ltino) ^^GntprJ

= 2 4 + 1 6 = 40

S ( X - M ) 2 5 C de(Ur0 = 26 + 8 = 34
(M - GM)2 S C m m = 45 + 7 5 = 20

= ( 4 8 + 3 2 ) / 2 = 40

Control (55To!a] = SCdent(0 + $ < ^ J : 154 = 34 + 120

C2

Diferencia

Gradas de libertad:

^M + ^M2

S/Totai = / V ^ l = 8 - l = 7

" ^ C o m b in a d a ^ l^ + ^ C o m b in a d a ^ )

S ^cnm = g l + g l 2 + - - - + U ltim o = 4 + 2 = 6

= (4 0 /1 0 ) + (4 0 /1 0 )

centre ~ ^Grupos 1 ~ 2

=4+4=8

E stim aciones de varianza pobacional:

Diferencia

=r

02

**, <SCJ# . - S C ^ J g l , ^ =34/6 = 5,67

J Diferencia

= aT 8 = 2 ,8 3 .
= (M t ~

1~1

Control (g L to a = g l eow + g l&nJ : 7 = 6 + 1

CM = $C fe -120/1-120
*=*> f: F =
6 d mJCM &m

F - <2entre/v2dentro

^Diferencia

= 2 0 /2 ,8 3

^ ^Ksntre^Htentro

= 7,0 7

= 2 .0 0 0 /4 0 = 5 0

= 120/5,67 = 21,16

(5 s = 7,0 7 )
Se rechaza
la hiptesis nula.

S e rechaza
la hiptesis nula.

Proporcin de varianza explicada;

^ = ^ ^ ^ = 120/154 = 0.78
C orrelacin (Grupo A = 1, Grupo B = 0):

4.

GM = (85 + 2 7 )/8 = 14
G r u p o (X )
X

G rupoA
X

X - GM
D esv

13
16
19
18
19
2

-1
2
5
4
5

D esv2 D esv D esv2

1
4
25
16
25

_4

16

-1
2
1
2

1
4
1
4

71

85

M - GM

X -M

D esv D esv 2
3
3
3
3
3

9
9
9
9
9
45

26

M = 17

G rupo B
X

X - GM
D esv

2
M -

X~M

D esv 2 D esv D e s v 2

M - GM
D esv

D esv 2

-3

-5

25

7
9

-7
-5

49
25

-2
0

4
0

-5
-5

25
25

83

O r -

O ri-

g in a l

g in a l

Z XZ y

13

- 0 ,2 2

- 0 ,1 7

17

-4

16

0,77
0,77

16

0 ,4 6

0,35

17

0,77

19

1,14

0,88

17

-1
2

0,77

18

0 ,9 2

0,71

17

0,77

19

0,88

17

1
2

1
4

0
0

--1,29
*-1,29

11

1,14
-0 ,6 8

2,06

-2

--1,29

-1 ,6 0
-1 ,1 4

1,47

2 :5

11

27

O b se rv a c i n (Y )

Nota: D esv = Desvo; D esv2 = D esvo cuadrtico

75

M = 0,625

112
14

S C = 1 ,8 7 4

154

S D ~ 0 ,4 8 4

4,387

0,88

7 ,0 6
r = 0 ,8 8 r 2 = 0,77

R educcin proporcional del error = r2


- reduccin del error/error total

= ( 1 5 4 - 3 4 ) /! 54
= 1 20/154 = 0,78

E rro r E rro r

34

G ru p o (AT)
O r ig in a l

1
1
1
0
0
0
2

2*
1
1
1
-1
-1
-1

O b se rv a c i n ( Y )
O r ig in a l

2 .
.y

0,7
0,9
0 ,8
0 ,6
0,4
0,2

0 ,4 2
1,26
0 ,8 4
0 ,0 0
- 0 ,8 4
-1 ,6 8

3,6
0,6
0 ,2 3 8

r = 0 ,8 4

3
M = 0,5
S D = 0 ,5

, 8

Z A
0 ,4 2
1,26
0 ,8 4
0.00
0,84
1,68
5,04

= OM-F/FIu

= (0,84)(2)/V 29 = 1 ,68/0,54 = 3,11


6.

Similitudes:

F
M edia de Y ~ 14

Gran m eda = 14

5CTo(al = 154

^Tbtal ~

Y predicha

para Grupo A = 17

M edia de grupo A = 17

Y predcha
para Grupo B - 9

M eda de grupo B = 9

5 ^ = 34

*W 34

i2 = 0,77

R2 - 0,78

5.

Prueba :

Punto de corte t { g l - 4 , p < 0,05, una cola) = 2 ,1 3 2


Grupo A: M = 0,8, S2 = 0,01; Grupo B: M = 0,4, S 2 = 0 ,0 4
b i n a d a = <2/4J[0,0I]) + (2/4][0,04]> - 0,025;
= 0 ,0 2 5 /3 = 0 ,0 0 8 3 ; S2^

= 0,0083;

^Diferencia = 0 ,0 0 8 3 + 0 ,0 0 8 3 = 0,017; 5 Diferenci8 = 0,13;


f = (0,8 - 0 ,4 )/0 ,1 3 = 3,08
Se rechaza la hip tesis nula.
Correlacin (Grupo A = I, Grupo B = 0):

E l anlisis de varianza se puede considerar com o el


estudio de la relacin entre la variable independien
te (la variable en la que difieren los grupos, tal c o
m o la condicin experimental") y una variable
dependiente. En este sentido, e s igual a la correla
cin y regresin, las cuales tambin estudian la re
lacin entre una variable dependiente y una
independiente. D e hecho, supongam os que en un
anlisis de varianza de dos grupos codificram os a
las personas en uno de los grupos con e l nmero 1 y
a las del otro grupo con e l 2 (o con dos nmeros
cualesquiera, los utilizados son slo ejem plos). Si
despus calculramos la correlacin entre ese n
mero de pertenencia al grupo y la variable depen
diente, la significacin de la correlacin ser igual a
la significacin del anlisis de varianza.
E xiste una variedad de con exion es entre lo s
dos tipos d e clculo. Primero, tanto en la regresin
com o en e l anlisis de varianza, se calculan los
desvos cuadrticos totales con respecto a la m edia
general. En am bos, e l proceso s e denm ina sum a
de cuadrados total. Otro vnculo m s profundo
surge debido a que la mejor prediccin para lo s in
tegrantes de un grupo es la m edia de ese grupo.
A s, la ecuacin de regresin predice la m edia para
los m iem bros de cada grupo. E l resultado e s que
lo s errores de las predicciones son desvos de las
observaciones con respecto a la m edia. S i io s e le
vam os al cuadrado y los sum am os, s e denom inan
sum a de cuadrados del error en la regresin, y su
ma de cuadrados intragrupal en un anlisis de va
rianza. En la regresin, com o paso preliminar para
calcular la reduccin proporcional de error, calcu
lam os la reduccin de error (SC Tma! - S C E m t). Es
la cantidad de error cuadrtico qu e la frm ula de
- regresin evita c o n respecto a predecir a partir de
la m edia de la variable dependiente. La cantidad
calculada del m odo descripto resulta ser la m ism a
que la suma de cuadrados intergrupales en un
anlisis de varianza. Lo anterior se debe a que

cuando hay s lo dos m edias grupales involucra


das, la regresin puede mejorar la prediccin s lo
en la m edida en que difieren las medias de los dos
grupos. Finalm ente, dado que CTota es igual en la
regresin y en el anlisis de vafianza, y la reduc
cin de error es igual a SCe , por consiguiente r2
en la regresin ser igual a R 2 calculado com o un
tamao de efecto en el anlisis de varianza.
Sin embargo, ex iste una com plicacin en
cuanto a este vnculo entre la regresin y el anli
sis de varianza. La regresin, incluso la regresin
m ltiple, utiliza s lo variables numricas ordina
rias. Cuando existen s lo dos grupos, codificn
dolos con dos nmeros cream os una variable
numrica que funciona adecuadamente. Pero cuan
do hay tres o ms grupos, la variable nom inal s e
gn la cual difieren e so s grupos no se puede
utilizar directamente en el anlisis de regresin. La
so lu ci n es crear ms de una de esas variables nu
mricas con dos valores para que cumplan e l papel
de la variable nom inal de prediccin. L uego, una
correlacin m ltiple realizada utilizando las valiab les especialm ente codificadas arroja el m ism o re
sultado que un anlisis de varianza (en trm inos de
significacin estadstica).

Captulo 17
1.

U na regresin m ltiple jerrquica es una variante


d e la regresin m ltiple com n, en la cual s e agre
gan, de a una por vez, cada una d e las variables d e
prediccin a la regla de prediccin (a v e ce s se
agrega una serie de variables c o m o grupo), y se
calcula e l aporte adicional d e esa variable (ade
m s de la variable agregada en e l paso anterior).
E l investigador determ ina de antem ano e l orden
en e l que s e ingresan las variables de prediccin.
En e l estudio de L indzey et al., la variable depen
diente era la capacidad de lo s nios par-a adaptarse
a la vida social. Las d os primeras variables de pre
d icci n que s e tuvieron en cuenta fueron los ndi
c e s d e iniciativa de padre e hijo, que justificaron
s lo e l 3% de la varianza en la variable depen
diente. Es decir, la R 2 fu e de 0 ,0 3 . (La R 2 no fu e
significativa, lo s investigadores observaron que el
n iv el de sig n ifica ci n estaba lejos de ser m enor a
0 ,0 5 , de hecho era un m uy alto 0 ,5 7 ). Hasta aqu,
e l procedim iento e s sim ilar a una regresin m lti
ple com n con dos variables de prediccin y una
variable dependiente.
Sin em bargo, lu eg o los investigadores agre
garon una variable de prediccin adicional, el
cum plim iento recproco entre padre e hijo. Lindzey e t al. informan que la varianza general explica
da aum ent un 18%, lo que significa que la R 2 tuvo

que haber crecido de 0,03 a 0,21 (es decir, 3% +


18% = 21% ). M s an, los investigadores obser
van que el aum ento del 18% era significativo (con
un n v e ip < 0 ,0 1 ) .
El proceso descripto'nos indica que los ndi
c e s d e iniciativa de padre e hijo no son m uy impor
tantes en la prediccin de la capacidad dei nio y,
lo que es ms importante, aun teniendo en cuenta
esas dos variables el cum plim iento recproco reali
za un gran aporte a la prediccin de la capacidad
del nio para adaptarse a la vida social,
2. B oyd y G ullone estn describiendo el grado de
confiabilidad de las m edidas que utilizan en su es
tudio. La confiabilidad es el grado de coherencia
con que la prueba m ide determinado aspecto, es
decir, en qu m edida se obtendran los m ism os re
sultados si las m ism as personas volvieran a reali
zar la prueba en idnticas circunstancias. U na
manera de evaluar la confiabilidad es observando
la correlacin entre una y otra mitad de la prueba
- l a idea es que la m ism a persona est realizando
dos pruebas (las dos m itades de la prueba) al m is
m o tiem po bajo las m ism as circunstancias. El alfa
d e Cronbach e s una m edida com n d e confiabili
dad, e s a lo que s e refieren los investigadores cuan
do m encionan e l coeficien te alfa al discutir la
confiabilidad. Para ser m s precisos, e l alfa de
Cronbach indica e l prom edio general de correla
cion es entre cada posible divisin de la prueba en
m itades, y lu ego adapta e l clculo de m od o tal de
tener en cuenta e l hecho d e que, con s lo la mitad
de lo s tem s, las correlaciones son un poco m eno
res que si la prueba com pleta s e correlacionara con
otra prueba com pleta similar. Por lo general, un al
fa de Cronbach de 0,60 0,70 s e considera un n i
vel m nim o adecuado de confiabilidad. E l hecho
de que algunas de las m edidas de B oyd y Gullone
fueran m enores a los valores indicados significa
qu e algunas de las variables estudiadas pueden no
estar proporcionando inform acin m uy precisa.
En realidad, las correlaciones entre m edidas con
bajas confiabilidades pueden subestim ar la verda
dera correlacin entre las variables medidas.
3. U n anlisis factorial ayuda al investigador que ha
m edido a lo s participantes con respecto a una gran
cantidad de variables, a descubrir el patrn im pl
cito (si existe) entre ellas, es decir, a descubrir qu
variables s e agrupan en e l sentido de correlacio
narse entre s, pero no con variables que no perte
necen al grupo. En e l estudio de Fawzi et al., los
investigadores contaban con puntuaciones en 16
sntom as de ftsd tomadas de entrevistas a 7 4 re
fugiados vietnam itas. Los resultados del anlisis
factorial sugieren que e l patrn im plcito m s ade
cuado presenta cuatro agrupaciones o factores

(que en la tabla de Faw zi et al. se denom inan


d im en sio n es). La tabla indica las correlacio
nes, llam adas cargas factoriales , de cada varia
ble individual con e l grupo.
C uando lo s investigadores disearon la
tabla, s lo inclu yeron la carga factorial de cada
sntom a en e l factor en e l cual presentaba la
m ayor carga. (C ada variable de un anlisis fa cto
rial presenta una carga en cada factor, pero
com n m ente presenta una carga alta s lo e n un
factor y, por lo tanto, se considera parte de e se
factor). L os investigadores observan que los
prim eros tres factores corresponden a los tres
aspectos cla v e del PTSD, en la form a en que este
se entiend e com nm ente. Sin em bargo, e l cuarto
factor (q u e in c lu y e s lo un tem ) sugera que
e x iste un aspecto de evacin adicional, y de
cierto m od o independiente, que no haba sido
considerad o c o m o tal en trabajos previos.
4. a) En e l contexto del diseo propuesto, e l resul
tado clave del sendero hipottico, desde cali
dad de d eseab le a intensidad, es que ese
s e n d e r o fu e significativo en los tres e s tilo s d e
vinculacin , aunque fue claramente m s fuer
te en e l c a so de aquellos con estilo de vincula
cin ansiosa-am bivalente. El sendero hipot
tico d e la probabilidad fue bajo para lo s tres
estilo s de vinculacin, aunque fue significati
vo para lo s evasivos. Finalmente, el sendero
hipottico desde el deseo de estar enamora
do fue positivo en el caso de los evasivos (es
decir, que a m ayor deseo de estar enamorado,
m ayor era la intensidad), pero el m ism o sen
dero result negativo en el caso de lo s ansiosos-am bivalentes (es decir, que a mayor deseo
de estar enam orados, m enor era la intensidad);
y en el caso de los seguros, el sendero presen
t m uy poca relacin,
b) El diseo de ecuacin estructural es una tcni
ca estadstica en la que ei investigador esp eci
fica un patrn de relaciones causales entre las
variables, diagramado con flechas que conec
tan cada causa co n su efecto. C om o parte del
proceso, los investigadores tambin pueden
esp ecificar que, en realidad, algunas variables
m edidas en el estudio son efectivam ente indi
cadores d e una variable latente im plcita no
m edida. En este ejem plo, para c a d a grupo, el
investigador ha especificado senderos desde
los tres factores de motivacin hacia la inten
sidad. A un m s, cada una de las tres variables
ms importantes (representadas en valos)
son, en efecto, variables latentes que se re
velan a travs de diversas variables m edidas
(representadas en este ca so por flechas que

parten d esde cada valo - s i no hubiera sido


por la falta de esp acio esas flechas se dirigi
ran cada una a un rectngulo que indicara
una variable m edida esp ecfica).
U n aspecto estadstico clave del diseo de
ecu acin estructural involucra la utilizacin
de correlaciones entre variables para calcular
un coeficien te d e senderos" para cada flecha.
El coeficien te de senderos indica e l grado en
el cual lo s cam bios de la variable ubicada en la
base de la flecha estn relacionados co n lo s
cam bios en la variable ubicada en la punta de
la flecha (bajo condicion es en las cuales todas
las otras causas de esa variable efecto s e man
tienen constantes). E s decir, el coeficien te de
senderos es un coeficien te de regresin estan
darizado (un beta) de la variable causal, en
una ecu acin en la que la variable efecto es la
variable dependiente y todas las variables cau
sales son variables de prediccin. Por ejem
plo, en e l ca so de los seguros, e l sendero de
0,42 desde calidad de deseable hacia inten
sidad significa que, m anteniendo constante la
probabilidad y ei d eseo del estado, por cada
d esvo estndar de cam bio en la calidad de de
seable s e producira un desvo estndar de
0,42 en e l cam bio de inten sid ad
5. E l anlisis de varianza multivariado , descripto
en esta publicacin, es igual a un anlisis de va
rianza 2 x 2 com n, excepto por e l hecho de que en
un anlisis m ultivariado se incluyen diversas va
riables dependientes al m ism o tiem po. En este
ejem plo, haba cin co medidas d e preferencia en
cuanto a la form a de resolucin de conflictos. El
resultado significativo d e l efecto principal de la
cultura" significa que las dos culturas presentaron
una diferencia significativa al tomarse en cuenta
d e una sola vez toda la serie de variables depen
dientes. En form a similar, el resultado significati
vo de cultura por tipo de interaccin conflictiva
significa que e l e f e c to d e la cu ltu ra en la s e r ie d e
variables dependientes vara segn el tipo de con
flicto. Para com prender cul de las diversas varia
bles d e resolucin de conflictos justificaba los
efectos generales, los investigadores realizaron
anlisis de varianzas com unes con una variable de
pendiente por vez (a esto se refieren cuando m en
cionan un "anlisis univariado). C om o con se
cuencia, los patrones de resultados fueron m uy d i
feren tes segn la variable dependiente esp ecfica
que se tom aba en cuenta.
6. a) D ise o causal (anlisis de senderos o diseo
de variable latente),
b) Correlacin y regresin bivariada.

c) C lculo estadstico de confiabiildad, tal com o


e l alfa de Cronbach y la confiabidad por
prueba y reprueba.
d ) A n lisis d e varianza rnultivariado 3 x 2 , pro
bablem ente seg u id o de anlisis de varianza
univariado 3 x 2 , e in clu so tam bin por c o m
paraciones m ltiples univariadas y /o m nltivariadas entre pares o grupos e sp e c fic o s de
medias.

e)
f)
g)
h)

i)

R egresin por pasos.


A nlisis factorial.
Prueba t para m edias independientes,
A nlisis de varianza d e un criterio, posible
mente seguido de com paraciones m ltiples
entre pares o grupos esp ecficos de m edias.
Regresin m ltiple jerrquica.

L o s n m e r o s en p a r n te s is se r efie re n a lo s c a p
tu lo s e n io s q u e el t r m in o fu e p r e se n ta d o o tr a
ta d o s u s t a n c ia lm e n t e .
A lfa (a ): probabilidad de com eter un error T ipo I; es
igual al nivel d e sig n ifica c i n (8), Tambin e s la for
m a corta de referirse ai a lfa de C ronbach, (17)
A lfa de C r o n b a c h s (a ): ndice de confiabilidad de
m edidas am pliam ente utilizado, que equivale al pro
m edio de las correlaciones por m itades de todas las po
sibles d ivision es en mitades de los tem s d e una
prueba. (17)
A n lisis causal: procedim iento, tal com o e l anlisis
de sendero o el m odelo de ecuacin estructural, que
analiza correlaciones entre un grupo de variables en
funcin de un patrn predicho de relaciones causales
entre ellas. (17)
A n lisis

de

co v a ria n za

( a n c o v a ): a n l i s i s d e v a r i a n z a

una vez, de forma tal que lo s niveles de la(s) varia


b le ^ } independiente(s) estn conform ados por las d i
ferentes ocasiones o los distintos tipos de prueba
aplicadas a las m ism as personas. (13)
A n lis is d e v a r ia n z a d e u n c r it e r io : a n lisis d e
varianza e n e l qu e e x is te s lo una variab le in d e
p e n d ien te . (1 1 , 12)
A n lisis fa c to r ia l d e varian za: anlisis de varianza
para un diseo factorial d e investigacin; anlisis de
varianza segn las diferencias entre las m edias de ios
niveles de cada variable independiente y segn la inte
raccin de las variables independientes. (13)
A n lisis facto ria l: procedim iento estadstico aplicado
en situaciones en las que s e m iden muchas variables,
que identifica agrupaciones d e variables que s e corre
lacionan al m xim o entre s y en forma mnim a con
otras variables. (17)

q u e s e r e a liz a d e s p u s d e a d a p ta r la s v a r ia b le s p a r a
c o n t r o la r e l e f e c t o d e u n a o m s v a r ia b le s a d ic io n a le s
n o d esead as.

(17)

A n lisis d e sen d ero s: m todo de anlisis de las corre


laciones entre un grupo de variables segn un patrn
predicho d e relaciones causales; usualm ente e l patrn
predicho s e diagram a en forma de un patrn d e flechas
que van d esde las causas hacia los efectos. (17)
A n lisis d e v a r ia n z a d e c u a d r a d o s m n im o s: m to
do recom endado para e l anlisis factorial de varianza
cuando en las distintas casillas hay cantidades d esi
guales de participantes. (13)
A n lisis d e v a r ia n z a d e dos criterios: anlisis de va
rianza para un dise o factorial eden dos creten os. (13)
A n lisis de v a ria n za d e m ed id a s rep etidas: anlisis
de varianza en el que se m ide a cada individuo ms de

(anova) A n lisis de varian za: procedim iento de


prueba de hiptesis para estudios que incluyen d os o
ms grupos. (1 1 -1 3 )
A sim e tr a : grado en e l cual una distribucin de fre
cuencias presenta m s casos de un lado d e su punto
m edio, com o contrapartida de la distribucin perfecta
m ente sim trica. (1)
B eta (j3): coeficien te de regresin estandarizado. (4)
Es tam bin la posibilidad de com eter un error Tipo II
en la prueba de hiptesis. (8)
C a silla : en un dise o factorial, e s la com bin acin
particular de n iveles de las variables independientes.
(1 3 ) En la prueba chi~cuadrado, e s la com binacin
particular d e categoras de dos variables en una tabla
de contin gen cia. (14)

C a so a isla d o : registro con un valor extrem o (muy alto


o m uy bajo) en relacin con el resto de ios registros de
la distribucin. (2)
C o d ifica c i n n o m in a l: conversin de una variable
de prediccin nom inal (categrica), de un anlisis de
varianza, en diversas variables num ricas de dos n i
v eles que pueden utilizarse en un anlisis de iegre~
sin m ltiple. (1 6 )
C oeficien te de co rrela ci n (r): prom edio de lo s pro
ductos cruzados de las puntuaciones Z de dos varia
bles; m edida del grado de correlacin lineal que va del
-1 (correlacin lineal negativa perfecta), pasando, por
el 0 (ausencia de correlacin) hasta el +1 (correlacin
lineal positiva perfecta); raz cuadrada de la reduccin
proporcional de error. (3 ,4 )
C oeficien te d e c o rr e la c i n m ltip le (/?): una m edida
de la asociacin general entre una variable dependien
te y la com binacin de dos o m s variables de predic
cin; la raz cuadrada positiva de la reduccin
proporcional de error (R 2) en un anlisis de regresin
mltiple. (4)
C oeficien te de co rrela ci n pa rcia l: correlacin entre
dos variables por encim a de la influencia de otra u
otras variables. (17)
C oeficien te d e reg resi n esta n d a riza d o O ): coefi
ciente de regresin en una norma de prediccin que
utiliza puntuaciones Z; tambin se lo denom ina valor
ponderado beta. (4)
C o e fic ie n te d e r e g r e si n p a r a p u n tu a c io n e s o r i
g in a le s ( ): e l c o e fic ie n te d e regresin en un m o d e
lo de p red icci n (e c u a c i n de regresin) que utiliza
pu ntuacion es o r ig in a le s. (4)
C o e fic ie n te d e r eg r e si n ( b , p): el nmero que se
m u ltiplica por el registro de una persona en la varia
ble ind ep en diente, c o m o parte de una frm ula (nor
m a de prediccin) para predecir registros en la
variable dependiente. (4)
C oeficien te d e sen d ero s: grado de asociacin relacio
nado con una flecha en un anlisis de senderos (que in
cluye un m od elo de ecuacin estructural); e s igual a un
coeficien te de regresin estandarizado de una norma
de prediccin de regresin m ltiple, en el cual la varia
ble, al final de la flecha, es la variable dependiente y la
variable al com ienzo de la flecha es la variable de pre
diccin (siendo tambin variables de prediccin todas
las dems variables que tienen flechas que van hacia la
variable dependiente). (17)

C om p a ra cio n es m ltip les: procedim ientos de prueba


de hiptesis para analizar las diferencias entre deter
minadas m edias en el contexto de un anlisis de va
rianza general, (12)
C o m p a r a c io n e s p la n ific a d a s: com paraciones m l
tip les en las que se designan de antem ano las m e
dias particulares a comparar; e s Igual a lo s
contrastes p lan ificad os.(1 2 )
C o m p a r a c io n e s p o s t h o c : c om p aracion es m lti
p les entre determ inadas m edias no d esign ad as de
antem ano; p ro ced im ien to realizad o c o m o parte de
un a n lisis d e e x p loracin d esp u s d e haber llevad o
a cab o e l estu d io, ( i 2 )
C on fiab ilid ad p o r d iv isi n e n m itad es: es un ndice
de la confiabilidad de las m edidas que se basa en la c o
rrelacin de los registros correspondientes a lo s tem s
de las dos m itades de la prueba. (17)
C on fiab ilid ad p o r p ru e b a y rep eticin : un ndice de
la confiabilidad de las medidas, obtenido a travs de
administrar la m edida dos veces a un grupo de perso
nas; es la correlacin entre los registros obtenidos en
las dos pruebas. (17)
C onfiabilid ad: grado de coherencia de una medida; in
dica hasta qu punto, si aplicramos la misma medida
nuevamente a la misma persona bajo las mismas cir
cunstancias, obtendramos e l m ism o resultado. (3, 17)
C o n sta n te d e regresin (a): un nmero fijo determ i
nado que se agrega a la prediccin en un m od elo de
prediccin (ecuacin de regresin) que utiliza puntua
cio n e s origin ales. (4)
C on traste lin eal: com paracin planificada en la que
cada uno de los diferentes niveles de la variable inde
pendiente tiene valores num ricos significativos; se
asem eja a una correlacin en la que por cada partici
pante, una variable es la influencia predcha del grupo
en el que se encuentra el participante y la otra variable
e s el registro con respecto a aquello con que se lo est
m idiendo. (12)
C on trastes plan ificad os: es igual a las c o m p a r a c io
n es p lan ificadas. (12)
C on trolar: es la anulacin de la influencia de una va
riable en la asociacin entre las otras variables en la
regresin m ltiple, la correlacin parcial o el anlisis
de covarianza; es lo m ism o que e x clu ir o m a n te n e r
con stan te, (17)
C orreccin p o r aten u acin : procedim iento estadsti
co que calcula la correlacin que se esperara entre dos
variables si ambas variables fueran medidas con una
confiabilidad perfecta. (3)

C oeficiente phi (4)): medida de la relacin entre dos va


riables nominales dicotmtcas, equivalente a una correla
cin de las dos variables si se les adjudicaran valores
C orrelacin cu rviln ea: una relacin entre dos varia
numricos (por ejemplo 1 y 0 para las dos categoras);
bles que se refleja en un diagrama de dispersin en for
medida del tamao de efecto para la prueba chi-cuadrado
de independencia con tabla de contingencia 2 x 2 . (14)
ma de puntos que siguen un patrn sistem tico distinto

de una lnea recta; toda asociacin entre dos variables


distinta de una correlacin lin eal.(3)
C orrela ci n lin ea l: una relacin entre dos variables
que se refleja en un diagrama de dispersin en forma
de puntos que siguen una lnea recta; correlacin en la
que r es distinta de 0. (3)
C orrelacin n egativa: una relacin entre dos varia
bles en la que los registros altos de una coinciden con
los bajos de la otra, los m edios con lo s m edios y los
bajos con los altos; en un diagrama de dispersin, los
puntos siguen aproximadamente una ln ea recta que se
inclina hacia abajo y hacia la derecha; una correlacin
en la que r es menor que 0. (3)
C orrelacin nula: ausencia de relacin sistem tica
entre dos variables. (3)
C orrela ci n p erfecta : una relacin entre dos vanabies que se refleja en un diagrama de dispersin en for
ma de puntos que siguen una ln ea recta en forma
exacta; una correlacin en la que r = 1 - l ; situacin
en la que la puntuacin Z de cada persona en una varia
ble es exactam ente igual a la puntuacin Z de esa m is
ma persona en la otra variable. (3)
C orrelacin positiva: una correlacin entre dos varia
bles en la que los registros altos de una coinciden con
los registros altos de la otra, los m edios con lo s m edios
y los bajos con los bajos; en un diagrama de disper
sin, los puntos siguen aproximadamente una lnea
recta que se inclina hacia arriba y hacia la derecha; una
correlacin en la que r e s mayor que 0 .(3 )
C ovariabie: variable controlada en un anlisis de co varianza. (17)
C u a d ra d o s m e d io s in terg ru p a ies (C M Entre): es igual
a la estim acin intergrupal de varianza poblacional
C u adrados m edios intragrup ales (C/V,/ Dentf0): es igual
a la estimacin intragrupl de varianza poblacional

C urtosis: grado en e l que una distribucin de frecuen


cias se desva de una curva normal, con c o la s que son
muy espesas o muy delgadas. (1)
C urva norm al: distribucin de frecuencias esp ecfica,
matem ticamente definida, con forma de campana, si
mtrica y unimodai; distribuciones observadas en la
naturaleza y a las cuales se aproximan las in vestigacio
nes psicolgicas. (1 ,5 )
D ato esta d stico c h i-cu a d ra d o ( x 2)- dato estadstico
que refleja la ausencia general de ajuste entre las fre
cuencias esperadas y observadas; es la suma, teniendo
en cuenta todas las categoras o casillas, de las diferen
cias cuadrticas entre frecuencias observadas y espera
das, dividida por la frecuencia esperada. (14)

D a to estad stico m u estra!: dato estadstico descripti


vo, co m o la media o el desvo estndar, calculado a
partir de los registros de un determinado grupo de per
sonas analizadas. Los datos estadsticos mustrales g e
neralmente se sim bolizan con letras com unes (en
contraposicin con las griegas). (5)
D esv o cu ad ra tico: El cuadrado de la diferencia entre
un registro y la m edia. (2)
D esv o est n d a r (S D , S , cr): raz cuadrada del prom e
dio de los d esvos cuadrticos de la media; e s e l ms
com n de los datos estadsticos descriptivos de la va
riacin; es aproximadamente (no exactam ente) la can
tidad prom edio de variacin de los registros de una
distribucin con respecto a la media. (2, 5, 9)
Desvo estndar de una distribucin de medias (cr^, SM):
raz cuadrada de la varianza de la distribucin de m e
dias; es igual al error estndar. (7 ,9 )
D e sv o estn d ar p o b la cio n a l (cr): desvo estndar de
la poblacin (usuam ente desconocido). (5)
D esvo: un registro m enos la media de todos los regis
tros de esa distribucin. (2)
Diagram a de dispersin: grfico que refleja la relacin
entre dos variables; los valores de la variable independien
te o de prediccin se encuentran en el eje horizontal; los
valores de ia variable dependiente se encuentran en el eje
vertical, y cada registro es representado grficamente por
un punto en este espacio bidimensiona. (3)
D im en sin : en un diseo factorial, una de las varia
bles independientes que se cruza con otra variable in
dependiente. (13)
D ise o de m ed id a s rep etid as: estrategia de investiga
cin en la que se prueba a cada persona m s de una
vez; es igual ai d ise o in tra -su jeto . (9 ,1 3 )
D ise o fa cto ria l d e investigacin: m odo de organizar
un estudio en e l que la influencia de dos variables o
ms se estudia de una sola v e z preparando ia situacin
de manera tai de probar a un grupo de personas segn
cada com binacin de los niveles de las variables; por
ejem plo, en un diseo factorial de investigacin 2 x 2
habra cuatro grupos: aquellos con registro alto en la
variable 1 y registro alto en la variable 2; aquellos con
registro alto en la variable 1 pero bajo en la variable 2;
aquellos con registro alto en la variable 2 pero bajo en
la variable 1; aquellos con registro bajo en la variable 1
y registro bajo en la variable 2 .( 1 3 )
D ise o factorial en d o s sen tid os: diseo factorial con
dos variables independientes. (13)
D is e o in tr a -su je to : e s igu al al d is e o d e m e d i
d a s r ep etid a s. (9)
D istrib u cin bim odal: distribucin de frecuencias
con dos frecuencias aproximadamente iguales, cada

una de las cuales es claramente mayor a cualquiera de


las dem s. (1)
D istrib u ci n ch i-cu a d ra d o : curva matem ticamente
definida que se utiliza com o distribucin comparativa
en las pruebas chi-cuadrado. Es la distribucin de ios
datos estadsticos chi-cuadrado. {14)
D istrib u ci n co m p a ra tiv a : distribucin que repre
senta la situacin de la poblacin si la hiptesis nula es
verdadera; la distribucin co n la cual se compara una
estadstica muestra! en la prueba de hiptesis, (6)
D istr ib u c i n de d ifer e n c ia s entre m ed ia s: distribu
cin de todas las diferencias posibles entre medias de
dos muestras, de forma tal que en cada par de m edias,
una pertenece a una poblacin y la otra a una segunda
poblacin; es ia distribucin comparativa en una prue
ba t para m edias independientes. (10)
D istr ib u c i n d e frecu en cia s: el patrn de frecuen
cias en ios distintos valores; es io que s e describe a tra
vs de una tabla de frecuencias, un histograma o un
polgono de frecuencias, (1)
D istrib u ci n d e m ed ia s: distribucin de todas as po
sibles m edias m ustrales de determinado tamao se
leccionadas de una poblacin en particular (tambin
denom inada distribucin de muestreo de la media); es
la distribucin comparativa en las pruebas de hiptesis
que involucran una muestra de ms de un registro. (7)
D istrib u ci n F \ curva m atem ticam ente definida que
describe la distribucin comparativa utilizada en un
anlisis de varianza; distribucin de las razones F
cuando a hip tesis nula e s verdadera. {11)
D istrib u ci n m u ltim o d a l: distribucin de frecuen
cias con d os o m s frecuencias altas separadas por una
frecuencia menor; una distribucin bim oda es e l caso
esp ecial en e l que existen dos frecuencias altas. (1)
D istrib u ci n n o rm a l: distribucin d e frecuencias que
sigue una curva normal. (5)
D istrib u ci n recta n g u la r: distribucin de frecuen
cias en la cual todos ios valores tienen aproximada
m ente a m ism a frecuencia, ( i )
D istr ib u c i n sim tr ic a : distribucin en la cual los pa
trones de frecuencias a la derecha y a la izquierda son
im genes especulares entre s. (1)
D istrib u ci n t: curva matemticamente definida que
describe la distribucin comparativa en una prueba t. (9)
D istrib u ci n u n im o d a l: distribucin de frecuencias
con un valor que claramente presenta una frecuencia
m ayor a la de cualquier otro. (1)
E fecto in tera ctiv o : situacin que se presenta en el
anlisis factorial de varianza, en la cual la com bina
cin de variables tiene un efecto esp ecial que no p o
dra predecirse a partir del conocim iento de los efectos
de las d os variables en forma individual. (13)

E fecto piso: situacin en la cual m uchos registros se


amontonan en el extremo ms bajo de ia escala, ya que
no es posible que exista un registro menor. (1)
E fecto principal: diferencia entre los grupos de una di
mensin de un diseo factorial; el resultado de una varia
ble. promediando las divisiones en la otra u otras
variables (a veces utilizada slo para diferencias signifi
cativas). (13)
E fecto techo: A quella situacin en la cual m uchos re
gistros se acumulan en el extrem o ms alto de la escala
creando asimetra, ya que no es posible que exista un
registro mayor. (1)
E rr o r estn d ar: es igual al d e sv o e st n d a r d e una
d istrib u cin de m edias. (7)
E rror T ip o I: rechazar la hiptesis nula cuando en
realidad es verdadera; obtener un resultado estadstica
m ente significativo cuando, d e hecho, la hiptesis de
investigacin no es verdadera, (8)
E rror T ip o II: no rechazar la hiptesis nula cuando en
realidad e s falsa; no obtener un resultado estadstica
m ente significativo cuando, de hecho, la hip tesis nula
es verdadera.
E rror: en la prediccin, es e l registro real m enos el re
gistro predicho. (4)
E sta d stic a descrip tiva: Procedim ientos para resumir
una serie de registros o hacerlos m s com prensibles de
algn otro m odo. (1)
E sta d stica in d u ctiva: procedim ientos utilizados para
sacar conclusiones sobre la base de los registros reco
lectados en una investigacin cientfica (registros
mustrales) pero que los exceden (creando c on clu sio
nes sobre poblaciones). ( ! )
E stadsticam ente significativo: conclusin que estable
ce que los resultados de un estudio seran improbables
si, en e fe cto , n o hubiera d iferen cia en las pob la
ciones representadas por las muestras analizadas; resul
tado de una prueba de hiptesis en la que se rechaza la
hiptesis nula, (3 ,6 )
E stim acin c o m b in a d a d e ia v arian za p o b lacion al:
^2Combinad): en una Prue^>a f para m edias independien
tes, es un prom edio ponderado de las estim aciones de
varianza poblacional calculadas a partir de las dos
muestras (cada estim acin ponderada segn la propor
cin de grados de libertad de su muestra, dividida por
los grados d e libertad totales de ambas m uestras). (10)
E stim acin in terg ru p a l de la v arian za p o b la cio n a l
(^Emre' CMgntre) : en un anlisis de varianza, es la esti
m acin de ia varianza de la distribucin poblacional de
individuos que se basa en la variacin entre las m edias
de ios grupos analizados; es igual a los C uadrados m e
d ios in terg ru p a les. (11)

Estim acin intercalar: rango de registros (es decir,


registros que se encuentran entre algn valor superior
e inferior especfico) que se estima incluye un parme
tro poblacional y se contrapone a la estim acin pun
tual; un intervalo de confianza es un ejemplo de
estimacin intervalar. (7)

Frecuencia esperada: en una prueba chi-cuadrado, es


la cantidad esperada de individuos en una categora o
casilla si la hiptesis nula fuera verdadera. (14)

Estim acin intragrupai de va fianza poblacional


(^Dentro1 t^Demro'f en un anlisis de varianza, es la es
timacin de la varianza de la distribucin poblacional
de individuos basada en la variacin entre los registros
dentro de cada uno de ios grupos analizados; tambin
se la llama cuadrados medios intragrupales; es igual a
la varianza dei error
y error de los cuadrados
medios ( C M Bm r). (11)

Frecuencia observada: en una prueba chi-cuadrado,


es la cantidad de individuos en una categora o casilla
efectivamente encontrados a travs de un estudio. (14)

E stim acin no sesgad a de la varianza p o b la d o n al (2): estim acin de la varianza poblacional ba


sada en registros maestrales, que ha sido corregida
(dividiendo la suma de desvos cuadrticos por el
tamao de la muestra menos 1, en lugar de utilizar
el procedimiento usual de dividir directamente por
el tamao de la muestra) de manera que resulte
igualmente probable sobrestimar o subestimar la
verdadera varianza poblacional. (2, 9)
Estimacin sesgada: estimacin de un parmetro po
blacional que probablemente sobrestime o subestime
sistemticamente el verdadero valor poblacional, Por
ejemplo, S D 2 sera una estimacin sesgada de la varian
za poblacional (la subestimara sistemticamente). (9)
Excluir: es el hecho de anular la influencia de una
variable en la asociacin entre las otras variables en
la regresin mltiple, la correlacin parcial o el an
lisis de covarianza; es igual a mantener constante o
controlar. (17)
Factor: en un anlisis factorial, es la sub-serie de va
riables correlacionadas entre s pero no con variables
fuera de la sub-serie, (17)
Forma de una distribucin de medias: contorno del
histograma de una distribucin de medias que puede
seguir una curva normal o ser asimtrica; eu general,
una distribucin de medias tendr tendencia a ser unimodal y simtrica, y usualmente es normal. (7)

Frecuencia m arginal: en una prueba chi-cuadrado, la


frecuencia (cantidad de casos) n una fila o columna
de una tabla de contingencia. (14)

Frecuencia relativa esperada: la cantidad de resulta


dos exitosos dividida por la cantidad de resultados to
tales que se esperara obtener si se repitiera un
experimento una gran cantidad de veces. (5)
G rado de correlacin: la medida en la cual existe un
patrn claro de alguna relacin en particular (general
mente lineal) entre dos variables, (3)
G rados de libertad ( g l) : cantidad de registros libres
para variar cuando se estima un parmetro poblacio
nal; comnmente parte de una ecuacin que se utiliza
para realizar esa estimacin. Por ejemplo, en la frmu
la para la estimacin de la varianza poblacional a partir
de una sola muestra, los grados de libertad son la canti
dad de registros menos 1. (9-14)
Grados de libertad del denom inado r (g/Dt;(rtC0): gra
dos de libertad utilizados en la estimacin intragrupai
de varianza en un anlisis de varianza; forman el deno
minador de la razn F ; la cantidad de registros libres
para variar (cantidad de registros de cada grupo menos
1, sumando los de todos los grupos) en el clculo de la
estimacin intragrupai de varianza; grados de libertad
intragrupales. (11)
G rados d e lib ertad del num erador (gEotre): gra
dos de libertad utilizados en la estim acin imergrupal de varianza en un anlisis de varianza (el
numerador de lai razn F ) \ cantidad de registros li
bres para variar (cantidad de grupos m enos I) en el
clculo de la estim acin intergrupal de varianza;
grados de libertad intergrupales. (11)
G rados d e libertad intergrupales (glEllt.e): es igual a
los grados de libertad del numerador. (11)
Grados de libertad intragrupales (gDeatr0): es igual
a los grados de libertad del denominador. ( 11)

Frmula de clculo: ecuacin matemticamente


equivalente a la frmula de definicin que es ms fcil
de utilizar para clculos manuales pero que no muestra
directamente el significado del procedimiento que
simboliza. (2)

H iptesis de investigacin: en la prueba de hiptesis,


afirmacin acerca de la relacin predicha entre pobla
ciones (comnmente es una prediccin de diferencias
entre medias poblacionales). (6)

Frmula de definicin: ecuacin que muestra direc


tamente el significado del procedimiento que simboli
za. (2)

H iptesis direccional: hiptesis de investigacin que


predice una determinada direccin de la diferencia en
tre poblaciones; por ejemplo, que una poblacin ten
dr una media mayor que la otra poblacin, (6)

Frm ula de prediccin con puntuaciones origina


les: norma de prediccin (ecuacin de regresin) que
utiliza puntuaciones originales. (4)

H iptesis no direccional: hiptesis de investigacin


que no pTedice ninguna direccin determinada de la
diferencia entre poblaciones. (6)

H ip te sis n u la : a firm a ci n sobre una relacin en


tre p o b la cio n es que representa la nocin crucial
opu esta a la h ip te sis d e in v estig a ci n ; afirm acin
que e sta b lece que en la p o b la ci n no e x iste d iferen
cia (o e x iste una d iferen cia op u esta a la predicha)
entre p o b la cio n es; una afirm acin artificial esta b le
cid a para analizar si puede ser rechazada c o m o par
te d e i p r o c eso d e prueba de h ip te sis. (6 )
H isto g ra m a : tipo de grfico de barras de una distribu
cin en el cual los valores se marcan en e l eje horizon
tal y la altura de cada barra e s la frecuencia de ese
valor; las barras se ubican una al lado d e la otra sin es
pacios interm edios, dando la apariencia del contom o
de una ciudad en e l horizonte. (1)
In d ep en d en cia : situacin en la que no existe relacin
sistem tica entre dos variables; trmino utilizado g e
neralmente en relacin con d os variables nom inales en
e l contexto de una prueba chi-cuadrado de indepen
dencia. (1 4 )
n d ic e d e c o n co rd a n cia : en el m odelo de ecuacin
estructural, es una m edida d e la calidad con que el pa
trn de correlaciones de una muestra coincide con las
correlaciones que se esperaran segn el patrn hipot
tico de causas y efecto s entre las variables; usualmente
presenta valores de 0 a 1, siendo I una concordancia
perfecta. (17)
In terp reta ci n d e la p ro b a b ilid a d com o la frecu en
cia rela tiv a a la rg o p la zo : com prensin de la probabi
lidad com o la proporcin de un determinado resultado
que se obtendra si se repitiera e l experim ento muchas
veces. (5)
Interpretacin su b jetiv a d e probabilidad: es un mo
do de entender la probabilidad com o el grado de certi
dumbre de que ocurrir determinado resultado. (5)
In terv a lo d e co n fia n za : rango de registros (es decir,
los registros que se encuentran entre determinados va
lores superior e inferior) que probablem ente incluye la
verdadera m edia poblaciona. (7)
In terv a lo d e lm ite a b ierto : en una tabla de frecuen
cias agrupadas, es e l m ayor (o menor) intervalo, que
incluye todos lo s valores por encim a (o por debajo) de
un determinado valor. (1)
In terv a lo d e un a tab la d e frecu en cia s a g ru p a d a s: la
serie de valores que s e agrupan (por ejem plo, si el ta
mao del intervalo fuera 10, uno de los intervalos p o
dra ser de 10,00 a 19,99). (1)
I n te r v a lo d e l 9 5 % de c o n fia n z a : intervalo de co n
fian za en e l cu al, e n trm in o s gen era les, e x iste un
95% d e p o sib ilid a d e s d e qu e se encuentre la m edia
p o b la cio n a . (7)
In terv a lo d el 99% d e c o n fia n za : intervalo de con
fianza en el cual, en trminos generales, existe un
9 9 % de posibilidades de que se encuentre la m eda
poblaciona. (7)

L m ites d e con fian za: valores superior e inferior del


intervalo de confianza. (7)
L n ea d e regresin: una ln ea en un grfico que
muestra el valor predicho de la variable dependiente
correspondiente a cada valor de la variable indepen
diente. (4)
L IS R E L : programa para computadoras del m odelo de
ecuacin estructural; a veces utilizado com o nombre
genrico del propio procedim iento. (17)
mancova (A n lisis d e cov a ria n za m u ltivariad o):
anlisis de covarianza en e l qu e existe m s d e una va
riable dependiente. (17)

MANOVA (A n lisis de v arian za m u ltiv a ria d o ): anli


sis de varianza en el que existe ms de una variable de
pendiente. (1 7 )
M a n te n e r c o n sta n te : es el hech o de anular la in
fluencia de una variable en la asociacin entre las
otras variables en la regresin m ltiple, la correla
cin parcial o el anlisis de covarianza; es igual a e x
c lu ir o con trolar. (17)
M atriz de co rrelacin : m odo com n de informar las
correlaciones entre diversas variables en publicaciones
cientficas; tabla con lo s nom bres de las variables en la
parte superior y lateral, y en la que se indican todas las
correlaciones entre las variables incluidas (por lo g e
neral slo la mitad del cuadrado resultante se com ple
ta, ya sea la parte superior o inferior d e la diagonal, y
la otra mitad resulta redundante). (3)
M ed ia (M , a): prom edio aritmtico de un grupo de re
gistros; la suma de lo s registros dividida por la canti
dad de registros. (2)
M ed ia arm n ica (IV): prom edio especial que es in
fluido en mayor m edida por io s nm eros m enores; en
una prueba t para m edias independientes, cuando las
cantidades de registros de los d os grupos son diferen
tes, se utiliza la m edia arm nica com o equivalente del
tamao muestral de cada grupo para la determ inacin
la potencia. (10)
M ed ia de casilla: m edia de una com binacin en parti
cular de niveles de las variables independientes en un
diseo factorial. (13)
M ed ia d e colum n a: registro m edio de todos lo s parti
cipantes de un nivel determinado de a variable inde
pendiente, cuyos niveles forman las colum nas en el
esquem a diagramado de un diseo factorial. (13)
M ed ia d e fila: en un diseo factorial es el registro m e
di de todos los participantes que forman un determ i
nado nivel de la variable independiente, cu yos niveles
corresponden a las filas de la d isposicin diagramada y
a niveles que corresponden a las filas en e i esquem a
diagramado. (13)

M ed ia m a rg in a l: en un diseo factorial, e l registro


m edio de todos los participantes de un determ inado ni
vel de una de las variables independientes. (13)

una persona en una variable dependiente sobre la base


del registro de esa persona en una o m s variables in
dependientes. (4)

M ed ia p o b la cio n a i ( ja): m edia de la poblacin (usualm ente desconocida). (5)

M o d e lo d e variab le laten te: es igual al m o d elo de


ecu a cin estru ctu ral. (17

M ed ia n a : e l registro m edio despus de ordenar de ma


yor a m enor todos los registros de una distribucin. (2)

M o d e lo estru ctu ral: forma de interpretacin del an


lisis de varianza com o una divisin del d esvo de cada
registro con respecto a la m edia general en distintas
partes que corresponden a la variacin intragrupal (el
desvo del registro con respecto a la m edia de su gru
po) e intergrupal (el desvo de la m edia del grupo al
que pertenece e l registro con respecto a la m edia gen e
ral); interpretacin alternativa (pero m atem ticam ente
equivalente) del anlisis de varianza. (1 2 ,1 3 )

M e d ic i n d e in te r v a lo s ig u a les: m e d ic i n en la .
qu e la d iferen cia entre cualqu ier par d e v a lo res re
p resen ta la m ism a d iferen cia d e l a sp ecto im p lc ito
bajo m ed ici n . (1 5 )
M ed ici n d e r a n g o y orden: m edicin en la que los
valores m ayores representan m s del aspecto im plcito
que s e est m idiendo, pero en la que la diferencia entre
dos registros cualesquiera no representa e l m ism o ni
vel de diferencia del aspecto im p lcito qu e se est m i
diendo; es igual a la v a ria b le o r d in a l. (1 ,1 5 )
M e d ic i n o r d in a l: es ig u a l a la m e d ic i n d e r a n g o
y o r d e n . (1 ,1 5 )
M eta -a n lisis: m todo estadstico para com binar los
resultados de estudios independientes, usualm ente en
focado en los tamaos de efecto. (8 )
M to d o s in ten siv o s p o r co m p u ta d o ra : m tod os e s
tadsticos que incluyen procedim ientos de prueba de
hiptesis, los cuales involucran grandes cantidades de
clculos repetidos. Estos m todos s lo se han hecho
posibles ltimamente gracias a la disponibilidad de
computadoras.
M o d a : el valor con m ayor frecu en cia en una distri
bucin. (2)
M o d e lo c a u s a l: en el m o d elo d e ecu a ci n estru ctu
ral, e s la serie de sen d ero s ca u sa les entre variables
latentes. (1 7 )
M o d e lo d e c u a d ra d o s m n im o s: m todo usual de de
terminacin de lo s valores ptim os de lo s coeficientes
de correlacin; e so s valores ptim os son los que pro
ducen el m enor error cuadrtico en lo s valores predi
chos. (16)
M o d e lo d e ecu a ci n estru ctu ra l: versin sofisticada
del anlisis de senderos, que incluye senderos que in
volucran variables tericas - n o m ed id a s-, latentes, y
que adem s permite realizar una esp ecie de prueba de
significacin y proporciona m edidas de la concordan
cia general de lo s datos con el patrn causal hipottico;
tambin se denom ina m o d elo d e v a r ia b le la ten te y
L S R E M 1 7 )
M o d elo d e m ed ici n : en el m odelo de ecuacin es
tructural, es la serie de senderos causales entre la va
riable latente y la variable manifiesta. (17)
M o d e lo d e p red icci n : frm ula para realizar predic
cion es; es decir, frmula para predecir e registro de

M o d e lo lin ea l general: frm ula general que es la base


de la mayora de lo s m todos estadsticos tratados en
este texto. La frm ula describe un registro c o m o la su
ma de una constante, la influencia ponderada de diver
sas variables y e l error; la frmula es sim ilar a una
ecuacin de regresin mltiple excepto por e l hecho de
que incluye el error y porque la suma de las influencias
es igual al registro real en la variable dependiente (y no
e l predicho). (16)
M u e str a : lo s registros de determ inado grupo de
person as analizad as; gen eralm en te consideradlo re
p resentativo de lo s registros de alguna p o b la ci n
m s am plia. (5 )
M ulticoJh iealidad: situacin que se produce en la re
gresin mltiple, cuando las variables de prediccin
estn correlacionadas entre s, (4)
N ivel de significacin (a): probabilidad de obtener
significacin estadstica si la hiptesis nula en efecto es
verdadera; probabilidad de cometer e error Tipo I. (6 -8 )
N iv e le s c o n v e n c io n a le s d e s ig n ific a c i n (p < 0 ,0 5 ,
p < 0,01): los niveles de significacin (niveles alfa) c o

mnmente utilizados en psicologa, (6)


N iv eles d e m ed ici n : distintos tipos de inform acin
num rica im plcita provista por una m edida, c om o por
ejem plo, de intervalos iguales, de rango y orden o no
minal (categrica). (1,15)
N o rm as: parmetros poblacionales conocidos de
pruebas estandarizadas (com o una prueba de persona
lidad o aptitud) que sirven com o patrones de com para
cin para cualquier individuo que realice la prueba. (7)
P a r m etro p o b lacion ai: valor real de la media, el
desv o estndar, etc., de la poblacin (com nm ente los
parmetros poblacionales se desconocen, aunque a v e
ces se estiman); los parmetros poblacionales por lo
general se sim bolizan con letras griegas, (5)
P en d ien te: la inclinacin del n g u lo de una ln ea en
un grfico de dos variables, tal com o la lnea de regre
sin en un grfico de la relacin entre una variable de

pendiente y otra independente; e s la cantidad de uni


dades que la lnea s e eleva por cada unidad que cruza
(en la regresin con p u n tu acion es o rig in a les, la pen
diente es igual a = b ). (4)
p h i d e C ra m er: m edida de relacin entre dos varia
bles nom inales; m edida del tamao de efecto para una
prueba tihi-cuadrado de independencia con una tabla
de contingencia mayor a 2 x 2; tambin s e lo co n o ce
com o V d e Cramer, y a v eces se representa en forma
escrita co m o 4>c Vc . (14)
P leg a r se so b r e fa cto res: procedim iento del anlisis
factorial de varianza en e l que se ignora una de las d i
m ensiones (variables independientes), reduciendo el
anlisis total en una dim ensin pero m anteniendo la
m ism a cantidad total de participantes. (13)
P o b la ci n : e l grupo com pleto de personas al cual un
investigador se propone aplicar los resultados de un
estudio; aquel grupo m s am plio sobre e l cual se reali
zan inferencias sobre la base de una determinada serie
de personas analizadas. (5)
P o lg o n o d e frecu en cia s: grfico de lneas de una dis
tribucin en e l que los valores se marcan sobre e l eje
horizontal y la altura de cada punto corresponde a la
frecuencia de ese valor, las lneas com ienzan y termi
nan en e l eje horizontal y e l grfico se asem eja al c o n
torno de montaas en e horizonte. (1)
P o ten cia esta d stica : probabilidad de que e l estudio
arroje un resultado significativo si la hiptesis de in
vestigacin es verdadera. (8)
Poten cia: es igual a la p o ten cia esta d stica . (8)
P red icci n b ivariad a: prediccin de registros en una
variable sobre la base de registros en otra variable. (4)

es lo m ism o que la red u ccin p rop o r c io n a l d e error


en la regresin m ltiple. ( 4 , 1 2 ,1 3 , 1 6 )
P ru eb a ch i-cu ad rad o de in d ep en d en cia: procedi
miento de prueba de hiptesis que examina si la distri
bucin de frecuencias de las categoras de una variable
nominal no est relacionada con la distribucin- de fre
cuencias de las categoras de otra variable nominal, (14)
P ru eb a c h i-c u a d ra d o de la b o n d a d d e aju ste: proce
dim iento de prueba de hiptesis que exam ina en qu
medida una distribucin de frecuencias observadas d e
una variable nom inal se ajusta a algn patrn esperado
de frecuencias. (14)
P rueba de aleatorizacin aproxim ada: alternativa de la
prueba de aleatorizacin para aquellos casos en los que la
muestra es demasiado grande com o para realizar una
prueba de aleatorizacin que tenga en cuenta cada posi
ble reorganizacin de los datos obtenidos de la muestra;
e mtodo de aleatorizacin aproximada, intensivo por
computadora, genera una gran cantidad de las posibles
reorganizaciones de datos; por ejem plo 1.000. (15)
P ru eb a d e ale a to r iz a ci n : procedim iento de prueba
de hiptesis (por lo general, se trata d e un m tod o in
tensivo por computadora) que tiene en cuenta cada
reorganizacin posible de los datos de la muestra para
determinar si la organizacin de los datos reales de la
muestra podra ocurrir por casualidad. (15)
P ru eb a de d os colas: e l procedim iento de prueba de
hiptesis para una hiptesis no direccional; situacin
en a cual el sector de la distribucin comparativa en el
que se rechazara a hiptesis nula est dividido entre
los dos lados (colas) de la distribucin. (6)

P ro b a b ilid a d (p ): la frecuencia relativa con que se e s


pera determinado resultado; la proporcin de resulta
dos exitosos en relacin con todos lo s resultados, (5)

P ru eb a d e h ip tesis: procedim iento utilizado para de


terminar si ios resultados de un experim ento (que ana
liza una muestra) sustentan determinada teora o
innovacin prctica (que se considera aplicable a una
poblacin). (6)

P r o ced im ien to B o n ferro n i: procedim iento de co m


paracin mltiple en e l cual e l porcentaje total de alfa
se divide entre la serie de com paraciones, de m odo tal
que cada una se prueba con un nivel ms exigente de
significacin. (12)

P r u e b a d e r a n g o y o r d e n : p r oced im ien to d e prue


ba de h ip te sis que u tiliza datos ord en ad os por
rangos. (1 5 )

P ro d u cto cru za d o d e p u n tu a cio n es Z : es e l resulta


do de m ultiplicar la puntuacin Z de determinada per
sona, en una variable, por la puntuacin Z de esa
m ism a persona en otra variable; con respecto a un gru
po de individuos, e l prom edio de los productos cruza
dos de puntuaciones Z entre dos variables e s el
coeficien te de correlacin de esas dos variables. (3)
P r o m e d io p o n d e r a d o : prom edio en el que lo s re
g istro s p rom ediad os no tienen ia m ism a in flu en cia
sobre el total. (1 0 )
P ro p o rci n d e v arian za ju stific a d a {r2, R 2): un indi
cador de! tamao del efecto en un anlisis de varianza;

P r u e b a de una cola: el procedim iento de prueba de


hiptesis para una hiptesis direccional; situacin en
la cual e l sector de la distribucin comparativa en el
que se rechazara a hiptesis nula s e encuentra entera
m ente en un lado (cola) de la distribucin. (6)
P ru eb a lib re de d istrib u ci n : procedim iento de prue
ba de hiptesis en la que no existen supuestos en cuan
to a la forma de las poblaciones implcitas; es sim ilar a
una prueba no paramtrica. (15)
P ru eb a no param trica: procedim iento de prueba de
hiptesis que no asum e supuestos con respecto a par
metros pobiaconales; es sim ilar a una p ru e b a lib re de
d istrib u cin . ( 5)

P ru eb a p a ra m trica : procedim iento de prueba de hi


ptesis ordinario, tal co m o una prueba r o un anlisis
de varianza, que asume supuestos acerca de la form a y
otros parmetros de las poblaciones. (15)
P ru eb a t para m ed ia s dep en d ien tes: procedim iento
d e prueba d e hiptesis en ei que cada participante tiene
dos registros (o los participantes forman parejas equi
paradas) y se descon oce ia varianza poblacional; el
procedim iento determina la significacin de una hip
tesis utilizando registros diferenciales de un s lo gru
po de participantes. (9)
P r u e b a t pa ra in ed ia s in d ep en d ien tes: procedim ien
to de prueba de hiptesis en e l que se prueban d os gru
pos distintos de personas y en el que se desco n o ce la
varianza poblacional, (10)
P r u e b a t p a ra un a so la m u estra : procedim iento de
prueba de hiptesis en el que se compara una m edia
muestral con una m edia poblacional conocida, y se
descon oce la varianza poblacional. (9)
P ru eb a t: procedim iento de prueba de hiptesis en ei
qu e s e desco n o ce la varianza poblacional; compara
puntuaciones t de una muestra con una distribucin
comparativa denom inada distribucin t. (9 ,1 0 )
P ru eb a Z: procedimiento de prueba de hiptesis en el
cual hay una so la muestra y se conoce la varianza pobla
cional. (7) P u n tu acin estndar: una puntuacin Z de
una distribucin que sigue una curva normal; a veces
utilizada para referirse a cualquier puntuacin Z. (2)

R ed u ccin p rop orcion al de error (r2, R 2)- es la m e


dida de asociacin entre variables que se utiliza cuan
do s e comparan asociaciones obtenidas en diferentes
estudios o con diferentes variables; e l coeficien te de
correlacin elevado al cuadrado; es el error cuadrcico
que se reduce utilizando una norma de prediccin para
regresin m ltiple o bivariada con respecto al error
cuadrtico; utilizando la media para predecir, expresa
do com o una proporcin del error cuadrtico a! utilizar
la m edia para predecir. Es igual a la p rop orcin de v a
ria n za ju stific a d a . ( 3 , 4 ,1 2 , 1 3 ,1 6 , 1 7 )
R e g is t r o d ife r e n c ia l: e s la d iferen cia entre e l re
g istro d e un p articip ante en una prueba y e l registro
d e ia m ism a p erson a en otra prueba. Por lo gen eral,
se trata de un registro posterior m enos un registro
anterior, en cu y o c a so tam bin se lo den om in a r e
g is tr o d e c a m b io . (9)
R e g istro m u e s tr a l d e co rte: punto en la distribu
ci n com parativa seg n e l cual, si es igualado o su
perado por e l registro muestral, se rechazar la
h ip te sis nula. (6)
R eg istro : valor correspondiente a un determinado par
ticipante con respecto a una variable. (1)
R eg la s del tam a o d e efecto: regias acerca de lo que
se debe considerar con respecto a un tamao de efecto
pequeo, mediano y grande, basadas en lo que resulta
tpico de la investigacin psicolgica; tam bin se c o
nocen c o m o reg la s d e C ohn. (8)
R eg resi n b ivariad a: dem prediccin bivariada. (4)

P u n to m ed io : la mitad de un intervalo en un histogratna o p olgono de frecuencias basados en una tabla de


frecuencias agrupadas; punto que se encuentra justo en
el m edio entre el com ienzo del intervalo y el com ienzo
del intervalo siguiente. (1)
P u n to : en una distribucin , es la cantidad de d es
vos estndar con respecto a ia media; es sim ilar a una
puntuacin Z . (9)
P u n tu a ci n orig in a l: U na m edicin ordinaria (o cual
quier otro nmero de una distribucin antes de ser c o n
vertido en una puntuacin Z o transformado de algn
otro m odo). (2)
P u n tu a cio n es Z: Cantidad de desv o s estndar por e n
cim a (o por debajo, si es negativo) de la m edia de su
distribucin a la que s e encuentra un registro; registro
ordinario transformado de form a tal qu e describe ms
adecuadam ente su ubicacin en una distribucin. (2)
R a z n F : en el anlisis de varianza, e s la razn entre
la estim acin ntergrupa de varianza poblacional y la
estim acin intragrupal de varianza poblacional; es un
registro en la distribucin comparativa (una distribu
cin F ) de un anlisis de varianza; tam bin s e lo llam a
sim plem ente F . ( 1 1 -1 3 )

R egresin m ltip le gradual: procedimiento explora


torio en el que se prueban todas las potenciales varia
bles de prediccin que han sido medidas para descubrir
la variable que produce la mejor prediccin; luego, ca
da una de las variables restantes se prueba para d escu
brir la variable que, en combinacin con la primera,
produce la mejor prediccin; el proceso contina hasta
el m om ento en que, agregar la mejor variable restante,
no produce una mejora significativa, (17)
R e g re si n m ltip le je r rq u ica : m todo de regresin
m ltiple en e l cual las variables de prediccin s e agre
gan, una o unas pocas por vez, de forma secuencial
planificada, permitiendo al investigador calcular la
contribucin de cada variable sucesiva a la prediccin
por encim a de aquellas ya incluidas. (17)
R e g re si n m ltip le: prediccin de registros en una
variable (la variable dependiente) sobre la base de re
gistros en otras dos o ms variables (variables de pre
d iccin o independientes). (4)
R e str ic c i n d e l ra n g o : situacin en la cual se calcu
la una correlacin inclu yen do en e l grupo estudiado
s lo una serie lim itada de los p osibles valores d e una
de las variables (3)

R esu lta d o ; trmino utilizado al discutir la probabilidad,


el cual se refiere a la consecuencia de un experimento (o
vnualm ente cualquier hecho, com o por ejemplo, que
una moneda caiga cara hacia arriba o que llueva maa
na). (5)
R o b u stez: la m edida en la cual determinado procedi
m iento de prueba de hiptesis e s razonablemente pre
c iso aun cuando no se cumplan los supuestos del
m ism o. (9)
S e le c c i n a le a to r ia : e s un m tod o de sele c c i n de
muestra qu e utiliza verdaderos procedim ientos de
azar (lo qu e g eneralm ente im p lica que cada persona
de la pob lacin tiene las m ism as p osibilidades de ser
seleccio n a d a ); uno de lo s m tod os e s que el investi
gador c o m ien ce co n una lista com p leta de todas las
personas que form an la p ob lacin y se le c c io n e un
grupo de ella s para ser analizad os, utilizando una ta
bla de nm eros aleatorios; no debe confundirse co n
la sele c c i n casual. (5)
S e le c c i n ca su a l: p roced im iento de s e le c c i n de
una m uestra de ind ivid u os para analizar tom ando a
aq u ello s que estn disp o n ib les o resultan ser lo s pri
m eros en una lista; no debe confu ndirse con la s e le c
ci n aleatoria. (5)
Sum a d e desvos cuadrtieos intergrupales (55Bflt[e):
sum a de los desv o s cuadrrteos d e la m edia del grupo
al que pertenece cada registro con respecto a la m edia
general; e s ig u a l a la su m a in t e r g r u p a l d e c u a d r a
dos. (1 2 )
Sum a de desvos cuadrtieos intragrupales (SSDeni):
sum a de lo s d esvos cuadrtieos de cada registro con
respecto a la m edia de su grupo; es igual a la sum a intragrupal de cuadrados. (12)
S u m a d e d e sv o s c u a d r tie o s to ta les (SSToia): en un
anlisis d e varianza, la sum a de desvos cuadrtieos de
cada registro con respecto a la media general de todos
los registros, ignorando por com pleto el grupo en el
que se encuentra el registro. (12) En la regresin, e s la
sum a de las diferencias cuadrticas entre cada registro
y el registro predicho cuando se predice utilizando la
media. (4)

S u p u esto: condicin necesaria para realizar un deter


m inado procedim iento de prueba de hiptesis, tal c o
m o el hecho de que una poblacin tenga distribucin
normal; parte del fundam ento m atem tico para la
exactitud de las tablas utilizadas en el proceso de de
terminacin de lo s valores de corte. (9 -1 5 )
T abla chi-cuad rad o: tabla que proporciona los regis
tros de corte en la distribucin chi-cuadrado segn dis
tintos grados de libertad y niveles de significacin. (14)
T abla de an lisis de varianza: cuadro que muestra ios
principales elem entos del clculo de un anlisis de va
rianza con el m todo dei m od elo estructural. (12, 13)
T abla d e reas de la cu rva n o rm a l: tabla que m u es
tra los porcentajes de registros de una distribucin nor
m alm ente distribuida, que se ubican entre la m edia y
diversas cantidades de d esvos estndar por encim a de
ella (puntuaciones 2 ). (5)
T ab la de con tin gen cia: cuadro bidim ensional que
muestra las frecuencias en cada com binacin de cate
goras de dos variables nom inales. (14)
T abla d e frecu en cia s ag ru p a d a s: tabla de frecuen
cias en la que se indica la cantidad de participantes pa
ra cada intervalo de valores. (1)
T ab la de frecu en cias: lista de la cantidad de indivi
duos que presentan cada uno de lo s diversos valores de
determinada variable. (1)
T abla d e p oten cia: tabla utilizada para e i procedi
m iento d e prueba de hiptesis, qu e indica la potencia
estadstica de un estudio segn lo s distintos tamaos
de efecto y lo s niveles d e significacin. (8 )
T abla F : tabla que proporciona lo s registros de corte
en la distribucin F segn distintos grados de libertad
y niveles de significacin. (11)
T abla t\ tabla que indica los registros de corte en la
distribucin / segn distintos grados de libertad y nive
les de significacin, y segn se trate de pruebas de una
o dos colas. (9)
Tamao de efecto de estudios que involucran una o
dos m edias (t): Cantidad de desvos estndar pobladonales en los que difieren las medas poblacionales. (3-10)

S u m a d e erro res cu a d r tie o s (S SError): suma de las


diferencias cuadrticas entre cada registro y el registro
predicho correspondiente. (4)

T am ao d e efecto en el anlisis d e varianza (/): el des


vo estndar de las m edas grupales dividido por e l
desvo estndar de ios valores individuales. ( H )

S u m a in tergru p al de cu a d ra d o s (5Elltra). E s igual a la


su m a d e d esvos cu ad rtieos intergrupales. (12)

T am ao de efecto: separacin (ausencia de superpo


sicin) entre poblaciones debido a la variable indepen
diente; a u m e n ta c o n el aum ento de la diferencia entre
las m edas y dism inuye con el aumento del desvo e s
tndar poblacional, pero no se ve afectado por el tama
o de la muestra. (8)

S u m a in tra g ru p a l d e c u a d r a d o s (S S 0emo): es igual a


la sum a de d esv o s cu a d r tieo s in tra g ru p a les. (12)
S u m a to ta l d e c u a d r a d o s C&Sroial): suma de las dife
rencias cuadrticas entre cada registro y la m edia g e
neral de todos ios registros; e s igual a la su m a d e los
d esv o s c u a d r tie o s d e la m e d ia ( S S ). ( 4 ,1 2 ,1 3 )

T am ao d e in tervalo: en una tabla de frecuencias


agrupadas, la diferencia entre e l com ien zo de un inter
valo y e l com ienzo del siguiente. (1)

T cnica estadstica m u ti variada: procedimiento esta


dstico que incluye ms de una variable dependiente. (17)
T en d en cia cen tral: el valor tpico o m s representati
vo de un grupo de registros. (2)
T eorem a dei lm ite centra!; principio matem tico
que establece que a distribucin de las sum as (o m e
dias) de registros lom ados al azar de cualquier distri
bucin de individuos tendr tendencia a formar una
curva normal. (5,7)
T ra n sfo rm a ci n a la ra z c u a d ra d a ; transformacin
de datos en la que el investigador utiliza la raz cuadra
da de cada registro. (15)
T ra n sfo rm a ci n d e d atos: aplicacin de uno de va
rios procedim ientos m atem ticos (tai com o calcular la
raz cuadrada) a cada uno de los registros de una m ues
tra; usualm ente se realiza para que la distribucin
muestral se acerque a la normal. (15)
T ra n sfo rm a ci n d e ra n g o y o rd en ; convertir una s e
rie de registros en rangos de m odo tal que e registro
ms alto es el rango 1, e l siguiente m s alto es e rango
2 , y a s sucesivam ente. (15)
T ra n sfo rm a ci n inversa: transformacin de datos en
Ja cual el investigador utiliza el nmero inverso de ca
da registro (1 dividido por e l registro). (15)
T ransform acin lo g : transformacin de datos en la cual
el investigador utiliza e i logaritmo de cada registro. (15)
V alor: nmero o categora p o s ib le q u e puede presen
tar un registro. (1)
Variable categrica; es igual a la variable nominal. (1,14)
V ariab le d e p red icci n (usualm ente X ): en la regre
sin mltiple, es la variable que se utiliza para predecir
los registros de individuos en otra variable; a veces se
la llam a v a r ia b le in d ep en d ien te. (4)
V ariable d ep e n d ien te (usualmente Y): variable con
siderada un efecto; tambin se utiliza en la regresin
para definir toda variable con respecto a la cual se reafiza la prediccin, (3 ,4 )

V ariable exgen a: variable en un anlisis de senderos


(que inclu ye un m odelo de ecuacin estructural) en la
cual com ienza una cadena causal y a la que no se diri
gen flechas dentro dei diagrama de senderos. (17)
V ariable ind ep en diente (usualbnente X): variable con
siderada una causa; adems, a veces, en la regresin
cualquier variable de prediccin sea o no considerada
una causa. (3 ,4 )
V ariab le laten te: en e! m odelo d e ecuacin estructu
ral, e s una variable terica no m edida que s e presume
causa im plcita de diversas variables efectivam ente
m edidas en e l estudio. (17)
V a riab le m an ifiesta: en e l m odelo de ecu acin e s
tructural, e s la variable ordinaria m edida (en contrapo
sicin con la variable latente). (17)
V a r ia b le n o m in a l: variable c u y o s valores son c a te
g o ras, sin rela ci n num rica (e s decir, so n n om
bres en lugar de nm eros); e s ig u a l a una v a r ia b le
c a te g r ic a . (1 ,1 4 )
V ariable; una caracterstica determinada que puede
presentar distintos valores. (1)
V ariables cru zad as: en un diseo factorial, es la situa
cin en la que cada nivel de una variable independiente
se m id e a cada nivel de la otra variable ind ep en dien
te. (13)
V a rian za (S jD1, S2, o 2, CA)'- m edida del grado de dis
persin d e una serie de registros; prom edio de los d es
v o s cuadrticos con respecto a la m edia. (2, 5, 9 , 1 1 )
V a rian za de un a d istrib u ci n d e d iferen cia s e n tre
m e d ia s ( 5 % ^ ^ ) : es uno de los clculos que forman
parte de la prueba t para m edias independientes; es
igual a la sum a de las varianzas de las distribuciones
de medias de cada una de dos muestras, (10)
V a rian za de u n a d istrib u cin d e m ed ias (S 2M, 2^):
varianza poblacional dividida por a cantidad de casos
en cada muestra. ( 7 ,9 )
V a rian za p ob lacion al (o-2): varianza de la poblacin
(usualm ente desconocida). (5)

V ariab le e n d g en a : variable en un anlisis de sen de


ros (que inclu ye un m od elo de ecuacin estructural) a
la cual se dirigen las flechas. (17)

Glosario

67 7

Glosario de Smbolos

a : nivel de significacin; probabilidad de error Tipo I. ( 8)


[3: coeficiente de regresin estandarizado (4); tambin
probabilidad de error Tipo II en la prueba de hiptesis. ( 8)
ji: m edia poblacional. (5)

^CoimnaS^ W ^lnielaccSa.: SradoS de ibertad de CO"


lum nas, filas e interacciones (en e l anlisis factorial de
varianza). (13)

g /Total ; grados de libertad totales de todos lo s grupos.


(1 0 -1 3 )

].M; m edia de una distribucin de medias. (7)


o : desvo estndar poblacional. (5)
c M: desvo estndar de una distribucin de medas. (7)

cr2: varianza poblacional, (5)


varianza de una distribucin de medas. (7)
I : sum a de sumar todos los registros que siguen. ( 2 )

9 : co eficien te phi; tamao de efecto en el anlisis


chi-cuadrado co n tabla de contingencia 2 x 2 . (14)

gDsnito: gritos de libertad del denom inador en el


anlisis de varianza, ( 1 1 )
/: m edida de! tamao de efecto en el anlisis de va
rianza, ( 1 1 )
R azn F\ razn entre la estim acin intergrupal de va
rianza poblacional y la estim acin intragrupal de va
rianza poblacional en el anlisis de varianza. ( 1 1 )
G M ; m edia d e tod os ios registros en el an lisis de
varianza. ( 1 1 - 1 3 )

X 2: dato estadstico chi-cuadrado. (14)

Ai: m edia. (2)


a\ constante de regresin. (4)
b\ coeficien te de regresin para puntuaciones origi

nales. (4)
d ; tamao de efecto en estudios que incluyen una o

dos medias. ( 8-

10)

gl: grados de libertad. (9 -1 4 )


g l v g i v etc.; grados de libertad del primer grupo, del

Aij, M 21 etc.: m edia del primer grupo, del segundo


grupo, etc. (1 0 -1 3 )
^Columna ^Fia: medta de los registros en determinada
colum na o determinada fila (en el anlisis factorial de
varianza). (13)
CA7Encre: cuadrados m edios intergrupales. (11)

segundo grupo, etc. (1 0 -1 3 )

C M CoiimnkS, CMFi]as, C M Mc[3CCa: cuadrados m edios


intergrupales d e colum nas, filas e interacciones, (13)

gIEntfe; grados de libertad del numerador en el anlisis


de varianza. ( 11 )

C M EmT\ error de los cuadrados m edios. (11)

CV/Demro: cuadrados m edios intragrupales. (11)


n: cantidad de registros en cada grupo del anlisis de

varianza. ( l )

iS2m1,

etc,: varianza de la distribucin de m edias


basada en una e s tim a c i n c o m b in a d a d e a varianza
pobiacional, correspondiente a la primera muestra, la
segunda muestra, etc. (1 0 ,1 1 )

N : cantidad total de registros. (2)

/V,, N 2 etc.: cantidad de ca so s en e l primer grupo, en


el segundo grupo, etc. (1 0 -1 3 )
N ': m edia armnica de d os tam aos de muestras
desiguales. (10)

^columnas
canfidad de colum nas, cantidad de
filas (en el anlisis factorial de varianza). (13)
catlddad de casillas en un diseo factorial, (13)
^Grupos* cantidad de grupos en el anlisis de varianza.
p \ probabilidad. (5)
r: coeficien te de correlacin. (3)
f2 : reduccin proporcional de error (proporcin de va
rianza justificada) en una regresin bivariada. (3)
R: coeficien te de correlacin mltiple. (4, 12)
R 7: reduccin proporcional de error (proporcin de

varianza justificada) en anlisis de varianza y regre


sin m ltiple. (4 ,1 2 , 13)
^Coiumnas ^ H i * ^ V rajn: proporcin de varianza
justificada (una medida del tamao dei efecto en el
anlisis factorial de varianza) por las colum nas, las
filas y la interaccin. (13)
S : estim a ci n no sesg a d a del d e sv o estndar po-

biacion al. (9)


S21 estimacin no sesgada de la varianza pobiacional (9)
S 2, S22, etc.: estim acin no sesgada de la varianza po-

blacional, basada en lo s registros de la primer muestra,


de la segunda muestra, etc. (1 0 -1 3 )
d-g
' estim acin imergrupal de la varianza poblacional. (11)
^ pu.varianza pobiacional esti
mada intergrupal de colum nas, filas, interaccin (en el
anlisis factorial de varianza). (13)
desv o estndar de la distribucin de diferen
cias entre medias. (10)
^Difetenca1 varianza de la distribucin de diferencias
entre medias. (10)

^combinada' estim acin com binada del d esvo estndar


pobiacional. (1 0 )
^combinada- estim acin com binada de la varianza pobacional. (10)
estim acin intragmpal de la varianza poblacional. (11)
S D : desvo estndar
S D 2: varianza. (2)

50: sum a de d esvos cuadrticos. (2)


5 5 Ertlre: sum a de desvos cuadrticos ntergrupales. (12)

ssC o ^ ssm-^ SSM ^in-suraa de desvos ctjadr-

ticos entre colum nas o filas o por efecto de la interac


cin (en el anlisis factorial de varianza). (13)
SSTota[: sum a total de d esvos cuadrticos con respecto
a la m edia (o con respecto a la gran m edia, en e l anli
sis de varianza). (4 ,1 2 ,1 3 )
d'1*Deturo' sum a de desvos cuadrticos intragrupales (o
dentro de las casillas). (12, 13)
Puntuacin t: cantidad de d esvos cuadrticos con res
pecto a la m edia en una distribucin t. (9)
X: registro en una variable determinada; en la regre
sin X , es e l nombre usual de la variable de prediccin

o independiente. (1 - 4 )
X , X T etc.: primera variable independiente o de pre

diccin, segunda variable independiente o de predic


cin, etc. (4)
X : m e d ia d e la variable denom inada X . (2)
Y: por lo g e n e ra l, la variable dependiente en una regre
sin. (3 ,4 )
Y: valor predicho de la variable denom inada Y. (4)

Z: cantidad de desvos estndar de la media. (2)


Zx : puntuacin Z de la variable denom inada X (3, 4)
ZX, Z x2, etc.: puntuacin Z de la primera variable in

dependiente o de prediccin; puntuacin Z de la se


gunda variable independiente o de prediccin, etc. (4)

S 2gtrof- varianza del error. (4, 11)

ZY: puntuacin Z de la variable denom inada Y. (3, 4 )


V desvo estndar de la distribucin de medias basa
do en una varianza pobiacional estimada, (9)
S 2m: varianza d e una distribu cin de m edias basada

en una varianza p o b ia cio n a l estim ada, en el c a so de


una prueba ; o estim ada a partir de la variacin e n
tre m ed ia s g rupales, en e l c a so de un a n lisis de v a
rianza. (9, 11)

Zy: valor predicho de la puntuacin Z en la variable


denom inada y . (4)
Otros sm bolos
valor predicho de la variable. (4)
meda de la variable, (2)

Referencias bibliogrficas

A selson, R. P. (1997), On the surprising longevity o f


flogged horses: Why there is a case for the significan
ce test. P s y c h o l o g ic a l S c ie n c e , 8 , 12-15.
R. I ., C h a n d
l e r , H. M., & Davies, J. L, (1989). Transcendental M e
ditation, mindfulness, and longevity: An experimental
study with the elderly, J o u rn a l o f P e r s o n a lity a n d S o
c i a l P s y c h o lo g y , 5 7 , 950-964,

A l e x a n d e r , C . N ., LANG Er, E . I , N

ew m an,

personal closeness; A procedure and some preliminary


findings. P e r s o n a lity a n d S o c ia l P s y c h o lo g y B u lle tin ,
2 3 , 363-377.

Aron, A Paris, M & Aron, E, N. (1995). Falling in love:


Prospective studies of self-concept change. Journal o f
P erson ality a n d S o cia l P sych ology, 6 9 , 1102-1112.

Aron, E. N. (1996). The high ly sen sitive person. New York:


Btrch/Lane,

Algina, J,, & Keselman, H. J. (1997). Detecting repea

A ron, E. N ., & A ron, A. (1997). Sensory processing sen

ted measures effects with univariate and multivariate


statistics. P s y c h o lo g ic a l M eth o d s, 2 , 2 0 8-218.

sitivity and its relation to introversion and emotiona


lity. J o u rn a l o f P erso n a lity a n d S o c ia t P sy ch o lo g y , 73,
345-368.

Altman, D. G., Levine, d . w ., Howard, G., & Hamilton,


H. (1997). Tobacco farming and public health: Attitudes
o f the general public and farmers. Jou rn al o f S o c ia l Is
su es, 53, 113-128.

A merican Psychological A sso ciat io n (1994). G radu ate


stu dy in psych o lo g y. Washington, DC: Author.

Aron, A., & A ron, E. N. (1989). The h ea rt o f s o c ia l p s y


ch ology.,L exin gton , MA: Heath.
Aron, A ., & Aron, E. N. (1997). Self-expansion motivation
and including other in the self. En W. Ickes (Section Ed.)
& S. Duck (Ed.), H an dbook o f p e rso n a l relationships
(2nd Edition, Voi. 1, pp. 251-270). London: Wiley.

Baker, D. P., & Jones, D. P. (1993). Creating gender equa


lity: Cross-national gender stratification and mathe
matical performance. S o c io lo g y o f E du ca tio n , 6 6 ,
91 -1 0 3 .

Bardslby. J. J., & Rhodes, S. R. (1996). Using the SteersRhodes (1984) framework to identify correlates of
em ployee lateness. J o u rn a l o f B u sin ess a n d P sy ch o
logy, 1 0 , 351-365.

Baumrind, D . (1983). Sp ecious causal attributions in

A ron, A ., Aron, E. N., & Allen, L (in press). Motivations

the social sciences: T he reformulated stepping-sto


ne theory o f heroin use as exemplar. J o u r n a l o f P e r
s o n a lity a n d S o c ia l P s y c h o lo g y , 4 5 , 12 8 9 -1 2 9 8 .

for unreciprocated love. P erson ality a n d S o c ia t P sych o

Bjernat, M ., & Wortman, C. B. (1991). Sharing o f ho

lo g y Bulletin.

Aron, A ., & Fraley, B. (in press). Relationship close


ness as including other in the self: Cognitive under
pinnings and measures. S o c ia l C ogn ition .

Aron, a ., Melinat, E , Aron, E. N., Vallone, R. D ., & B a


tor, R. J. (1997). The experimental generation o f inter

me responsibilities between professionally employed


women and their husbands. J o u rn a l o f P erso n a lity
a n d S o c ia l P sych o lo g y, 60, 844-860.

Blanchard, E A., L illy, X , & Vaughn, L. A. (1991). Re


ducing the expression of racial prejudice. P sych o lo g i
c a l Science, 2 , 101-105.

C. P , & G u i i o m , E. (1997). An investigation o f


negative afifectivity in Australian adolescents. Journal
o f C lin ical C h ild P sych ology, 2 6 , 190-197.

C H ong , Y , & D w e c k , C. S. (1997). Lay dispositionism and implicit theories o f personality. J o u rn a l o f


P erso n a lity a n d S o cia l P sych o lo g y, 7 3 , 19-30.

BOYD,

C h iu ,

B rewer, J. K. (1972). On the power o f statistical tests in


the A m e ric a n E du cation R esearch Journal. A m erican
E d u ca tio n a l R esea rch Journal, 9 ,3 9 1 -4 0 1 .

Chow, S. L. (1988). Significance test or effect size. Psyc h o lo g k a l B ulletin, 1 0 3 , 105-110.

(1978).
Lottery winners and accident victims: Is happiness re
lative? Jou rn al o f P erso n a lity a n d S o c ia l P sych ology,
3 6 , 917-927.

r ic k m a n ,

P , C o a t e s , D . , & Ja n o f f - B u l m

an

, R.

Buck, j . L. (1985), A failure to find gender differences


in statistics achievement. T eachin g o f P sych ology,

12, 100.
B uss, D. M., & S c h m i t t , D. P, (1993), Sexual strategies
theory: An evolutionary perspective on human mating.
P sych o lo g ica l Review, 100, 204-232.

C how, S. L. (1996). S ta tistic a l sig n ifica n ce: R ation ale,


validity, a n d utility. London: Sage.
C ia l d in i,

R. B .,

row n,

S. L.,

L ew

is ,

B. P ,

Luce,

C., &

S. L. (1997). Reinterpreting the empathyaltruism relationship: When one into one equals one
ness. J ou rn al o f P erso n a lity a n d S o c ia l P sych o lo g y,
73, 481-494.
N

eubero,

C lark, D. M S alkovskis, P. M., O st, L-G Breitholtz,


E., Koehler, K. A., W estung , B. E., Jeavons, A., &
Gblder, M. (1997). Misinterpretation o f body sensa
tions in panic disorder. Journal o f C onsultin g a n d Cli
n ical Psychology, 65, 203-213.

M .,.& P a t t e r s o n , G . R. (1991). Relation o f


parental transitions to boys adjustment problems: 1,A
linear hypothesis 2, Mothers at risk for transitions and
unskilled parenting. D evelo p m en ta l P sychology, 27,
489-504.

C ohen, J, (1988). S ta tistic a l p o w e r a n a ly sis f o r the b e h a

C arey, M. R, M aisto, S. A,, Kalichman, S. C F orsyth,


A .D ., W right, E. M & Johnson , B. T. (1997), En

C ohen, J. (1990). Things I have Seamed (so far). A m erica n

C a p a l d i, D .

hancing motivation to reduce the risk o f HIV infec


tion for econom ically disadvantaged urban women,
J o u rn a l o f C o n su ltin g a n d C lin ic a l P sy ch o lo g y , 6 5 ,

53 1 -5 4 1 .
C

a s p i,

A B

egg,

D ., D

ic k s o n ,

N . , H a r r i n g t o n , H ., L a n

J., M o m r r , T. E , & S il v a , P. A. (1997). Perso


nality differences predict health-risk behaviors in
young adulthood: Evidence from a longitudinal study.

Cohen, J, (1962). The statistical power o f abnormal-so


cial psychological research: A review. Jo u rn a l o f A b
n orm al a n d S o c ia l P sych o lo g y, 65, 145-153,
vio ra l scien ces. Hillsdale, NJ: Erlbaum,

P sych ologist, 45, 1304-1312.


C ohen,

J, (1992). A power primer. Psychological B u lle

tin, 1 1 2 , 155-159.

Cohen, J. (1994). The Earth is round (p < 0,05). Ameri


can Psychologist, 4 9 ,9 9 7 -1 0 0 3 .

gley,

Jou rn al o f P e rso n a lity a n d S o c ia l P sych ology, 73,

1052-1063.
C

A., & H e r b e n e r , E. S. (1990). Continuity and


change: Assortative marriage and the consistency o f
personality in adulthood. J o u rn a l o f P erso n a lity a n d

a s p i,

S o cia l P sych ology, 58, 2 5 0 -2 5 8 .


C

D., & T a y l o r , J. C. (1996). The scaling o f


dispersion and con-elation: A comparison o f leastsquares and absolute deviation statistics, B ritish J o u r

atanzaro,

nal o f M a th e m a tic a l a n d S ta tistic a l P sych o lo g y, 49,

171-188.
a n , H. A ., H o b f o l l , S. ., & R i t t e r , C. (1997).
Partners' stress underestimations lead to womens dis
tress: A study o f pregnant inner-city women. Journal
o f P erso n a lity a n d S o c ia l P sych ology, 73, 418-425,

Chapm

L. J., & C h a s e , R. B. (1976). A statistical power


analysis o f applied psychological research. Jou rn al o f
A p p lie d P sych ology, 6 1 , 2 3 4 -237.

Ch a se,

Cohen,

J., &

Cohen,

P. (1983). A p p lie d m u ltip le reg res

sio n /" c o rre la tio n a n a ly sis f o r the b e h a v io ra l s c ie n


ces. Hillsdale, NJ: Erlbaum.
C o m m is s io n

paym ents to tra vel a g e n t s.

(1978, August 8).

N ew York Tunes, p. D - i .

C onnors, G. J., C arroll, K. M., D iC lemente, C. C .,


L ongabaugh, R., & Donovan, D. M. (1997). The the
rapeutic alliance and its relationship to alcoholism
treatment participation and outcome. Jo u rn a l o f C on
su ltin g a n d C lin ica l P sych o lo g y, 6 5 ,5 8 8 -5 9 8 .

Conover, W., & Iman , R. L. (1981). Rank transforma


tions as a bridge between parametric and nonparametric statistics. A m erica n S ta tisticia n , 3 5 , 124-129.
C o o k , T.

D ., & C a m p b e l l , D . T. (1979). Q u asi-experim en

tation : D esig n a n d a n a lysis issu es f o r fie ld settings.

Skokie, IL: Rand McNally.

C ooper, S. E., & Robinson, D. A. G. (1989). The in


fluence o f gender and anxiety on mathematics perfor
mance. Journal o f C o lleg e S tu d en t D evelo p m en t, 30,
459-461.

J. M ., & D u n l o p , W . P. (1997). On the logic


and purpose o f significance testing. P sy ch o lo g ic a l
M eth ods. 2, 161-172.

C o r t in a ,

, N . R ., C a s a s , J . F ., & M o s h e r , M . (1 9 97). Re
lational and overt aggression in preschool. D e v e
lo p m e n ta l P s y c h o lo g y , 3 3 , 5 7 9 -5 8 8 .

r ic k

ah lstr o m

, W . G ., L

arbar

, D ., & D

ah lstr o m

, L, E.

(1 9 8 6 ). M M P I p a tte r n s o f A m e ric a n m in o ritie s. M in


neapolis: University o f M innesota Press.
D

F. C & W r i g h t s m a n , L. S. (1 9 82). E ffects o f


defendants and v ictim s characteristics on jurors
verdicts. In N . L. Kerr & R . M . Bray (E ds.), T h e
p s y c h o lo g y o f th e c o u r tro o m . Orlando, FL: A cade
m ic Press.

ane

DARLINGTON, R . B. (1 9 9 0 ). R e g r e s s io n a n d lin e a r m o
d e ls. N e w York: M cG raw -H ill.

D awes, R. M ., F a u s t , D ., & M e e h l , P. E. (1 9 9 3 ). Sta


tistical prediction versus clinical prediction: Impro
ving what works. In G. Keren & C. L ew is (E ds.), A

Evans, R. (1976). The m akin g o f p s ych o lo g y. New York:


Knopf.

Everett, S. A., Price, l H B edell, A. W., & T eluohann, S. K. (1997). The effect o f a monetary incentive
in increasing the return rate o f a survey to family phy
sicians. E va lu a tio n a n d th e H ea lth P ro fessio n s, 20,
207-214.

Eysenck, H. J. (1981). A m o d e l f o r p e rso n a lity. Berlin:


Springer-Verlag.

Fawzi, M. C. S., Pham , T , Lin, L., N guyen, T. V., N go,


D Murphy, E., & M ollica, R. F. (1997). The vali
dity o f posttraumatic stress disorder am ong Viet
nam ese refugees. J o u r n a l o f T ra u m a tic S tress, 10,
101-108.
F isher, B. (1978). F ish er D ivo rce A djustm ent Scale. Boul
der, CO: Family Relations Learning Center.

c e s : M e th o d o lo g ic a l is s u e s (pp. 3 5 1 -3 6 7 ). H illsda

Fisher, R. A. (1938). S ta tistica l m eth o d s f o r research w o r

D e Carlo, L. T. (1997). On the meaning and use of


kurtosis. P s y c h o lo g ic a l M e th o d s, 2, 292-307.
D bG armo , D . S., & F o r g a t c h , M . S . (1 9 9 7 ). D eterm i
nants o f observed confidant support for divorced
mothers, J o u r n a l o f P e r s o n a lity a n d S o c ia l P s y c h o
logy, 72, 3 3 6 -3 4 5 .
K, L. (1983). The use and m isuse o f chisquare: L ew is and Burke revisited. P s y c h o lo g ic a l
B u lletin , 94, 1 6 6 -1 7 6 .

e l u c c h i,

D esmaris, S., & Curtis, J. (1997). Gender and percei


ved pay entitlement: Testing for effects of experien
ce with income. J o u r n a l o f P e r s o n a lity a n d S o c ia l
P s y c h o lo g y , 72, 141-150.
D

terns o f relational control and nonverbal affect in clinic


and nonclinic couples. Journal o f S o cia l a n d Person al
R elationships, 14, 5-29.

h a n d b o o k f o r d a ta a n a ly s is in th e b e h a v io r a l s c ie n

le, NJ: Erlbaum.

Escudero, V Rogers, L. E., & Gutierrez, E. (1997). Pat

P , & M y e r s , L. (1997). Approximating po


wer for significance tests with one degree o f freedom.
P s y c h o lo g ic a l M eth ods, 2, 186-191.

unlap,

W.

P E., & H i g b e e , J. L. (1991). A ffective varia


bles related to mathematics achievement among highrisk college freshmen. P s y c h o lo g ic a l R ep o rts, 69,
399-403.

D w in e l l ,

N. S., & M a g n u s s o n , D. (1976). Toward an in


teractional psychology o f personality. P sy ch o lo g ic a l
B ulletin, 8 3 , 95 6 -9 7 4 .

E n d l ER,

E ppley,

K. R., Abrams, A. L, & S h e a r , L (1989). Differen

tial effects of relaxation techniques on trait anxiety:


A meta-analysis. Journal o f C lin ical Psych ology, 45,
957-974.

kers (7th ed.). London: Oliver & Boyd.

Foertsch, J., & Gernsbacher, M. A. (1997). In search o f


gender neutrality: Is singular they a cognitively effi
cient substitute for generic h e ! P s y c h o lo g ic a l Science,
8, 106-112.

F olwell, A. L., C hung, L. C.t N ussbaum, J. R, Bethea,


L.S., & G rant, J. A. (1997), Differential accounts of
closeness in older adult sibling relationships. J ou rn al
o f S o c ia l a n d P erso n a l R ela tio n sh ip s, 14, 843-849.
F ord , J. D ., Fisher, R, & L arson, L. (1997). Object rela
tions as a predictor o f treatment outcome with chronic
posttraumatic stress disorder. Jo u rn a l o f C on su ltin g
a n d C lin ica l P sych ology, 65, 547-559.

Frank, S . Poorman, M. 0 ., Van Egerbn, L. A., & Field,


D. T. (1997). Perceived relationships with parents among
adolescent inpatients with depressive preoccupations
and depressed mood. Journal o f C lin ical C h ild P sych o
logy, 2 6 , 205-215.

Franz, M. L.

von. (1979). The p r o b le m o f p u e r aetern u s.


N ew York: Springer-Verlag.

Frick, R. W. (1995). Accepting the null hypothesis. M e


m o r y a n d C ognition , 23, 132-138.
F r ic k , R. W. (1996). The appropriate use o f null hypothe

sis testing. P s y ch o lo g ic a l M eth o d s, 1, 379-390.


R. W. (in press). Interpreting statistical testing: Pro
cess and propensity, not population and random sam
pling. B e h a v io r R esea rch M eth ods, Instrum ents, a n d

F r ic k ,

C om puters.

F risch, A. S., S hamsuddin, K & K urtz, M. (1995). Fa

can Studies, 30, 6 8 -79.


G

D. G. H. (1972). The G a llu p p o ll: P u b lic o p i


nion, 9 3 5 -1 9 7 1 . N ew York: Random House.

a m il t o n ,

a r r is ,

arter

allup,

F. (1889). N atu ral inheritance. London: Macmillan.

G aufon,
G

P. A. (1988). Theory-free statistics and theorybased statistics: Their appropriate roles in the repor
ting o f scientific results. J o u rn a l o f E x p erim en ta l
E ducation, 57, 4 7 -5 8 .
S & G

r eenh o u se,

B o x s r e s u l t s o n t h e u s e o f
v a r ia t e a n a l y s i s .

(1958). An extension o f
t h e F distribution in m u l t i

G., &

ig e r e n z e r ,

urray,

D. J. (1987). C ognition a s in

G., S w u n k , Z., P orter, Y., D a s t o n , L.,


J., & K r u g e r , L. (1989). The e m p ire o f c h an
ce. Cambridge, England: Cambridge University Press.

ig e r e n z e r ,

P. S., & F i n l e y , H. C. (1996). D oing qualitative


analysis. En: N. F. T. L. Leong & J. T. Austin (Eds.),

The p s y c h o lo g y resea rch h a n d b o o k (pp, 177-192).

Thousand Oaks, CA: Sage,


H

W. S. (1 9 47). S tu d e n t's c o lle c te d p a p e r s .


London: U niversity C ollege.

&

HjEOLBRUN, a

E. R. (1987). P s y c h o lo g y in A m e r ic a : A h is to

novich.
in d l e y ,

C.,

F il h o z a t , a

., K l a c k e n b b r g , G., N icolet-

D ., & S a n d , E. (1966). D ifferences in age o f


walking in five European longitudinal samples. H u

. (1983). T h e A d je c tiv e C h eck

e is t e r ,

m an B iology, 3 8 , 364-379.
Holden,

S., W e i n e r , B ., & Z u c k e r , G. S. (1997). An


attributkmal analysis o f punishm ent goals and pu
blic reactions to O. J. Sim pson. P e r s o n a lity a n d S o
c ia l P s y c h o lo g y B u lle tin , 23, 3 3 1 -3 4 6 .

raham

il g a r d

r ic a l p e rs p e c tiv e . Orlando, FL: Harcourt Brace Jova-

L ist M a n u a l Palo Alto, CA: Consulting Psychologist

Press.

, C., & S h a v e r , P. (1987). Romantic love con


ceptualized as an attachment process. J o u r n a l o f
P e r s o n a lity a n d S o c ia l P s y c h o lo g y , 5 2 , 5 1 1 -5 2 4 ,

azan

H io h l e n ,

J. T. (1997). T he varying effect o f individualism collectivism on preference for m ethods o f conflict


resolution. C a n a d ia n J o u rn a l o f B e h a vio u ra l S c ie n
ce, 2 9 , 3 8 -4 3 ,

H .,

h it e s e l l ,

o f treatment outcome. Journal o f C onsultin g a n d C lini

ir e ,

ough,

c a l Psych ology, 65, 611-616.

eatty,

o sset,

L. M .,

C., B l a n c h a r d , E. B.f & F l o r , H. (1997). B io


feedback treatment for pediatric migraine: Prediction

tu itive sta tis tic s . Hillsdale, NJ: Erlbatun.


G

P e t t it t ,

Herm ann,

29, 8 8 5-891.
G

S ., W aters, P. L

R e la tio n s h ip s , 14, 1 47-164.


H

S.

A n n a ls o f M a th em a tica l Statistics,

R . j . (1997). Significance tests have their pla


ce. P s y c h o lo g ic a l S c ie n c e , 8 , 8 -1 1 .

N ., K ofkin , J., & Jordan , J. (1997). A uton om y and


connectedness as dim ensions o f relationship styles
in m en and w om en. J o u r n a l o f S o c ia l a n d P e r s o n a l

a m es,

e is s e r ,

D & G i f f o r d , R. (1976). Illusory correla


tion In interpersonal perception: A cognitive basis
o f stereotypic judgm ents. J o u r n a l o f E x p e r im e n ta l
S o c ia l P s y c h o lo g y , 1 2 , 3 9 2 -4 0 7 .

mily factors and knowledge: Attitudes and efforts con


cerning exposure to environmental tobacco among
Malaysian medical students. Journal o f A sian a n d A fri

G.

W ., T

h o m pso n ,

E.

am barano

R. J.,

&

L. A . (1997). Child effects as a source o f


change in maternal attitudes. J o u rn a l o f S o c ia l a n d

arsh a ll,

P erso n a l R ela tio n sh ip s, 14, 481-490.

R. 3. (1996). Policy capturing with ridge re


gression. O rg a n iza tio n a l B eh a vio r a n d H u m a n D e c i

Holzw orth,
G

(1 9 75). C onsequences o f prejudice


against the null hypothesis. P s y c h o lo g ic a l B u lletin ,
82, 1 -1 9 .

reenw ald

, A. G.

sio n P ro c esses, 6 8 ,1 7 1 - 1 7 9 .
H

C. M ., W a l k e r , M . L ., B e c k e r , D . F., E d e l l ,
W. S., & M c G l a s h a n , T. H. (1 9 9 7 ). Personality di
sorders m adolescents w ith major depression, subs
tance use disorders, and coexisting major depression
and substance use disorders. J o u rn a l o f C o n su ltin g
a n d C lin ic a l P sy ch o lo g y , 65, 3 2 8 -3 3 2 .

r il o ,

o p k in s ,

K. D ., &

G lass,

G. V. (1978). B a sic sta tistics f o r

the beh a vio ra l scien ces. Englewood Cliffs, NJ: Prentice

Hall.
H

unter,

J. E. (1997). Needed: A ban on the significance

test. P s y c h o lo g ic a l Science, 8 , 3 -7 .
H

u sse r l ,

E. (1970). The c risis o f E uropean scien ces a n d

B ., & K u l i k , J. A . (1 9 97). Stress, affiliation,


and em otional contagion. J o u r n a l o f P e r so n a lity
a n d S o c ia l P s y c h o lo g y , 7 2 , 3 0 5 -3 1 9 .

tran scen den tal phenom enology: A n introduction to p h e

H amilton , D . (1 9 8 1 ), C o g n itiv e p r o c e s s e s in s t e

H yde , J. S. (1993), Gender differences in mathematics


ability, anxiety, and attitudes: What do meta-analyses
tell us? En: L. A. Penner, G. M. Batsche, H: M. Knoff,

um p

, B.

r e o ty p in g a n d in te r g r o u p b e h a v io r. H illsdale, NJ:

Bribaum.

nom enological p h ilo so p h y (D. C. Carr, Trans.). Evans

ton, EL: Northwestern University Press.

D. L. N elson, The ch a lle n g e in m a th e m a tic s a n d


ed u c a tio n : P s y c h o lo g y 's r esp o n se (pp.

&

2 3 7 -2 4 9 ). Washington, DC: American P sychologi

K leinmuntz , B. (1990). W hy w e still use our heads ins


tead o f formulas: Toward an integrative approach.
P s y c h o lo g ic a l B u lletin , 1 0 7 , 2 9 6 -3 1 0 .

cal Association.

Kraem

s c ie n c e

H yde, J. S Fennema, E., & L a m o n , S. J. (1990). Gender


differences in mathematics performance: A metaanalysis, P sy ch o lo g ic a l B ulletin, 107, 139-155.
Inhgff, A., Lima, S., & Carroll, P. (1984). Contexturai
effects on metaphor comprehension in reading. M e
m ory a n d C ognition , 12, 558-567.
Jehn , K. A ., & Shah, P. P. (1997). Interpersonal relations
hips and task performance: An examination o f media
ting processes in friendship and acquaintance groups.

, H.

C., &

h ie m a n n

^ S.

(1987). H o w m a n y

Newbury Park, CA: Sage.


K u n d a , 2 ., & O lssqn , K. C. (1997). W hen exceptions
prove the rule: How extrem ity o f deviance determ i
nes the impact o f deviant exam ples on stereotypes.
J o u r n a l o f P e r so n a lity a n d S o c ia l P s y c h o lo g y , 72,

9 6 5 -9 7 9 .

Journal o f P erso n a lity a n d S o c ia t P sych ology, 72,

, V. S. Y ., B o n d , M. H & S i n g e l i s , T. M. (1997).
Pancultural explanations fo r life satisfaction: A d
d in g relationship harm ony to self-e stee m . J o u r

775-790.

n a l o f P e r s o n a lity a n d S o c ia l P s y c h o lo g y , 7 3 ,

rary perspective. n: R. lessor, A . Colby, & R. A . Shweder (Eds.), E th n ograph y a n d hum an d e velo p m en t:
C on text a n d m ea n in g in s o c ia t in q u iry (pp. 3 - 14).

Chicago: University o f Chicago Press.

Johnson, C ,

& Mullen, B. (1994), Evidence for the ac


cessibility o f paired distinctiveness in distinctivenessbased illusory correlaion in stereotyping. P erso n a lity
a n d S o c ia l P sy c h o lo g y Bulletin, 20, 6 5 -7 0 .

Judd, C. M M c C l e l l a n d , G. H., & Culhane, S. E. (1995).


Data analysis: Continuing issues in She everyday analy
sis of psychological data, A nnual R eview o f Psych ology,
46, 433-465.
agan

w an

1038-1051.

Jessor, R. (1996). Ethnographic methods in contempo

er

s u b je c ts ? S ta tis tic a l p o w e r 'a n a l y s is in rese a rc h .

A . J., K h a n , S. R., L i c k e l , B. A., & F r i c k e , K.


(1997). M ood and the correction o f p ositive versus
negative stereotypes. J o u r n a l o f P e r s o n a lity a n d
S o c ia l P s y c h o lo g y , 72, 10 0 2 -1 0 1 6 .

am bert,

L e v e n t h a l , L ., & H u y n , C -L . (1 9 9 6 ) . Directional d e

c ision s for two-tailed tests: Power, error rates, and


sam ple size . P s y c h o lo g ic a l M e th o d s, 1, 2 7 8 -2 9 2 .
L

D ., & B u r k e , C. J. (1949). T he u se and m isuse


o f the chi-square test. P s y c h o lo g ic a l B u lle tin , 4 6 ,
4 3 3 -4 8 9 .

e w is ,

L i n d z e y , E . W ., M i z e , L , & P

e t t it ,

G . S . (1 9 9 7 ). M u

tuality in parent-child play: C onsequences for ch il


drens peer competence. J o u r n a l o f S o c ia l a n d
P e r so n a l R e la tio n s h ip s , 14, 523-538,

J. (1994). G a le n s p ro p h e cy : T em peram en t in h u

m an nature. New York: Basic Books.

K arney , B. R., & B r a d b u r y , T. N. (1997), Neuroticism, marital interaction, and the trajectory of mari
tal satisfaction. J o u r n a l o f P e r s o n a lity a n d S o c ia l
P s y c h o lo g y , 72, 1075-1092.

Lydon, L, P i e r c e , X, & O'Regan, S. (1997). Coping with


moral commitment to long-distance dating relations
hips. J o u rn a l o f P e r so n a lity a n d S o c ia l P sy ch o lo g y ,
7 3 , 104-113.

Kelley, H. H. (1971). A ttr ib u tio n in s o c ia l in te r a c


tion . Morristown, NJ: General Learning Press.

M acD onald, C., C hamberlain, K,, & L ong, N. (1997).

K enney, D, A- (1995). Relationship science in the 21st


century. J o u rn a l o f S o c ia l a n d P e r s o n a l R e la tio n s
h ips, 12, 597-600.
KerlinOBR, F. N. (1973). F o u n d a tio n s o f b e h a v io r a l
research . New York: Hoit, Rinehart and Winston.
Keselman, J. C., Lix, L. M., & Keselman, H. J. (1996).
The analysis of repeated measurements: A quantitati
ve research synthesis. B ritish J o u r n a l o f M a th e m a ti
c a l a n d S ta tis tic a l P sych o lo g y, 4 9 , 275-298.
K

, W. C., v a n der R o e g , H. M ., & T o p m a n , R. M .


(1 9 9 4 ). C ognition, study habits, test anxiety, and
academ ic perform ance. P s y c h o lo g ic a l R e p o r ts , 75,
1 2 1 9 -1 2 2 6 .

Race, combat, and t o d in a community sample of


New Zealand Vietnam War veterans. Jo u rn a l o f Trau
m a tic S tress, 1 0 , 117-124.

MacKinnon-L ewis, C Starnes, R., Volung, B., & J o h n


son, S. (1997). Perceptions of parenting as predictors
o f boys sibling and peer relations. D e v e lo p m e n ta l
P sych o lo g y, 33, 1024-1031.
, H . J ., R e n i c k , M. J ., F l o y d , F. J ., S t a n l e y , S .
M & C l e m e n t s , M. (1993). Preventing marital dis
tress through communication and conflict manage
ment training: A 4- and 5-year follow-up. Jo u rn a l o f
C on su ltin g a n d C lin ic a l Psych o lo g y, 6 1 , 70 -7 7 .

arkm an

axw ell,

leun

S. E., & D e l a n e y , H. D. (1990). D esigning expe

rim ents a n d analyzing data. Belmont, C A : Wadsworth.

M axwell, S. E., & D elaney, H. D. (1993). Bivariate me


dian splits and spurious statistical significance. P s y c h o
lo g ic a l B u lle tin , 1 1 3 , 181-190.
McConnell, A. R., S herman, S. J., & Hamilton, D. L.
(1994). Illusory correlation in the perception o f groups:
An extension of the distinctiveness-based account.
J o u r n a l o f P e r s o n a lit y a n d S o c ia l P s y c h o lo g y , 6 7 ,

414-429.
McCracken, G. (1988). T h e lo n g

in te rv ie w .

London: Sage.

McLaughlin-Volpe, T., A ron, A, & Reis, H. T. (1998, Au


gust). Closeness during interethnic social interactions
and prejudice: A diary study. En: A. Aron (Chair), I n te r
g r o u p c o n ta c t a n d p e r s o n a l r e la tio n sh ip s . Symposium
conducted at the Annual Convention of the American
Psychological Association, San Francisco, CA.
McLeod, J. (1996). Qualitative research methods in coun
seling psychology. En: R. Wooife & W. Dryden (Eds.),
H a n d b o o k o f c o u n s e lin g p s y c h o lo g y (pp. 65-86). Lon
don: Sage.
M eehl, P. E. (1954).

C lin ic a l v e r s u s s ta tis tic a l p r e d ic tio n :

A th e o r e tic a l a n a ly s is a n d a r e v ie w o f th e e v id e n c e .

Min

neapolis: University of Minnesota Press.


MiCCERt, T. (1989). The unicorn, the normal curve, and
other improbable creatures. P s y c h o lo g ic a l B u lle tin , 105,
156-166.
Migkelson, ft. D., Kessler, R. C.( & S haver, P. R. (1997).
Adult attachment in a nationally representative sam
ple. J o u r n a l o f P e r s o n a lity a n d S o c i a l P s y c h o lo g y , 73,
1092-1106.
M ikulincer, M. (1998). Attachment working models and
the sense of trust: An exploration of interaction goals
and affect regulation. J o u r n a l o f P e r s o n a lity a n d S o
c i a l P s y c h o lo g y , 7 4 .

M iller, L, C & Pishkin, S. A, (1997). On the dynamics


of human bonding and reproductive success: Seeking
windows on the adapted-for human-environmental in
terface. En: J, Simpson & D. T. Kenrick (Eds,), E v o lu
ti o n a r y s o c i a l p s y c h o l o g y (pp. 197-235). Hillsdale,
NJ: Erlbaum.
M iller, R. S. (1997). inattentive and contented: Relations
hip commitment and attention to alternatives. J o u rn a l o f
P e rs o n a lity a n d S o c ia l P s y c h o lo g y , 73,758-766.
M illigan, G. W., Wong, D. S., & T hompson, P. A. (1987),
Robustness properties of nonorthogonal analysis of va
riance. P s y c h o l o g ic a l B u lle tin , 0 1 , 464-470.

peer competence: Is the medium the message?


312-332.

C h ild

D e v e lo p m e n t, 6 8 ,

MoriaRTY, S. E
.,& Everett, S-L. (1994). Commercial
breaks: A viewing behavior study. J o u r n a lis m Q u a r
te r ly , 7 1 , 346-355.
M ueller, J. H., Elser, M. J., & P ollack, D. N. (1993).
Test anxiety and implicit memory. B u lle tin o f th e P s y c h o n o m ic S o c ie ty , 3 1 , 531-533.
Myers, D. G. (1991). Union is strength: A consumers
view of meta-analysis. P e r s o n a lity a n d S o c ia l P s y c h o
lo g y B u lle tin , 1 7 , 265-266.
N ezlek, J. B., Kowalski, R. M., Leary, M. R., B levins,
T , & HolgaTE, S. (1997). Personality moderators of
reactions to interpersonal rejection: Depression and
trait self-esteem. P e r s o n a lit y a n d S o c i a l P s y c h o l o g y
B u lle tin , 2 3 , 1235-1244.
Norcross, J. C., Hanych, J. M., & Terranova, R. D. (1996).
Graduate study in psychology: 1992-1993. A m e ric a n
P s y c h o lo g is t, 5 1 , 631-643.
Norman, C., & A ron, A. (1997, June). Shared expansion
experiences and relationship satisfaction. En: C. Nor
man. (Chair), H o w to m a k e y o u r r e la tio n s h ip w o r k :
S p e c u la t io n s b a s e d o n h a r d r e s e a r c h . Symposium
conducted at the International Network on Personal
Relationships Conference, Oxford, OH.
Oakes, M. (1982). Intuiting strength of association from
a correlation coefficient. B r itis h J o u r n a l o f P s y c h o
lo g y , 7 3 , 51-56.
OltHOFF, R. K. (1989).

T h e e f f e c tiv e n e s s o f p r e m a r i t a l

Unpublished doctoral disser


tation, California Graduate School of Family Psycho
logy, San Francisco.

c o m m u n ic a tio n tr a in in g .

Onwuegbuzie, A. J. (1995). Statistics text anxiety and fe


male students. P s y c h o l o g y o f W o m en Q u a r te r ly , 1 9 ,
413-418.
Orbach, I., Mikulincer, M., King, R., Cohen, D., & Stein,
D. (1997), Thresholds and tolerance of physical pain in
suicidal and nonsuicidal adolescents. J o u r n a l o f C o n s u l
tin g a n d C lin ic a l P s y c h o lo g y , 6 5 , 646-652.
Pearson, K. (1978).

T h e h is to r y o f s ta t i s t i c s in th e 1 7 th

a n d 1 8 th c e n tu r ie s .
PETERS,

W, S. (1987).

London: Griffin.
C o u n tin g f o r s o m e th in g : S ta ti s t ic a l

p r in c ip le s a n d p e r s o n a litie s .

New York: Springer-

Verlag.

M ischel, W. (1968). Personality and assessment. New


York: Wiley,

Pezdek, K Finger, K., & Hodge, D. (1997). Planting


false childhood memories: The role of event plausibi
lity. P s y c h o l o g ic a l S c ie n c e , 8, 437-441.

M ize, J., & Pettit, G. S. (1997). Mothers social coa


ching, mother-child relationship style, and childrens

Phillips, L. D. (1973). B a y e s ia n
tists. London: Nelson.

s ta tis tic s f o r s o c ia l s c ie n

P rentice, D, A., & M iller, D. T. ( 1 9 9 2 ) , When small ef


fects are impressive. P s y c h o l o g ic a l B u lle tin , 1 1 2 ,
160-164.
Reber, P. J & Kotovsky, K. (1997). implicit learning in
problem solving: The role of working memory capa
city, J o u r n a l o f E x p e r im e n ta l P s y c h o l o g y : G e n e r a l,
1 2 6 , 178-203.
Regier, D,, M yers, l , Kramer, M Robins, L., B la
zer , D Hough, R., Eaton, W & L ocke, B, (1984).
The NiMH Epidemiologic Catchment Area Program.
A r c h iv e s o f G e n e r a l P s y c h i a tr y , 4 1 , 934-941.
Reis, H. T., & Stiller, J. (1992). Publication trends in
jp sp :

A th r e e - d e c a d e re v ie w . P e r s o n a lit y a n d S o c ia l

P s y c h o l o g y B u lle tin , IS ,

465-472.

Reiss man, C,, A ron, A & Bergen, M. R. (1993), Shared


activities and marital satisfaction: Causal direction and
self-expansion versus boredom. J o u r n a l o f S o c i a l
a n d P e r s o n a l R e la tio n s h ip s , 10, 253-254,
RiEHL, R. J. (1994). Academic preparation, aspirations,
and first-year perfomavmance of fost-generation stu
dents. C o lle g e a n d U n iv e r s ity , 7 0 , 14-19.
Rosnow, R. L & Rosenthal, R. (1989a). Definition and
interpretation of interaction effects. P s y c h o lo g ic a l B u
lle tin , 1 0 5 , 143-146.
R osnow , R. L., & Rosenthal, R. (1989b) Statistical
procedures and the justification o f knowledge in
psychological science. A m e r i c a n P s y c h o l o g i s t , 4 4 ,
1276-12.84.
Ross, D. C., & Klein , D. F. (1988). Group matching: Is
this a research technique to be avoided? E d u c a ti o n a l
a n d P s y c h o l o g ic a l M e a s u r e m e n t, 4 8 , 281-295.

S chmidt, F. L., & H unter, J, E. (1997), Eight common


but false objections to the discontinuation of signifi
cance testing in the analysis of research data. En; L. L.
Harlow, S, A. Mulaik, & J. H. Steiger (Eds.), W h a t i f
th e r e w e r e n o s ig n if ic a n c e te s t s ? (pp. 37-64), Mahwah, NJ: Eribaum.
S chneider, W. J & N evid, J. S, (1993). Overcoming
math anxiety: A comparison of stress inoculation trai
ning and systematic desensitization, J o u r n a l o f C o ll e
g e S tu d e n t D e v e lo p m e n t, 3 4 , 283-287,
S edlmeier, P & G igerenzer, G, (1989). Do studies of
statistical power have an effect on the power of stu
dies? P s y c h o l o g ic a l B u lle tin , 1 0 5 , 309-316.
Sellers, R. M., Rowley, S, A, J,, C havous, T. M., S hel
ton, J. N & SiVtmi, M. A. (1997). Multidimensional
Inventory of Black Identity: A preliminary investiga-.
don of reliability and construct validity. J o u r n a l o f
P e r s o n a lit y a n d S o c ia l P s y c h o lo g y , 7 3 , 805-815.
S hapiro, D. A., & S hapiro, D. (1983). Comparative the
rapy outcome research: Methodological implications
of meta-analysis. J o u r n a l o f C o n s u ltin g a n d C lin ic a l
P s y c h o lo g y , 5 1 , 42-53.
S hapiro , J. P., D orm an , R. L., B urkey , W. M ., W elker ,

C. J., & Clough, J. B. (1997). Development and fac


tor analysis o f a measure of youth attitudes toward
guns and violence. J o u r n a l o f C li n i c a l C h ild P s y c h o
lo g y , 2 6 , 311-320.
S hi, L., S amuels, M. E., Richter, D. L., Stoskopf, C.
H., Baker, S. L., & S y , F. (1997). Primary care physi
cians and barriers to providing care to persons with
hiv/ aids. E v a lu a tio n a n d th e H e a lth P r o f e s s io n s , 2 0 ,
164-187.

Russell, J. A, (1991). In defense of a prototype approach


to emotion concepts. J o u r n a l o f P e r s o n a lit y a n d S o
c i a l P s y c h o lo g y , 6 0 , 37-47.

ShjreidER, Y u, A. (1966). Preface to the English edition.

S anbonmatsu, D. M., Posavac, S. S., & Stasney, R.


(1997), The subjective beliefs underlying probability
overestimation. J o u r n a l o f E x p e r im e n ta l S o c i a l P s y
c h o lo g y , 3 3 , 276-295.

T h e M o n te C a r lo m e th o d : T h e m e th o d o f s t a t i s t i c a l

S awilowsky, S. S & Blair , R. C. (1992). A more realis


tic look at the robustness and Type II error properties
of the t test to departures from population normality.
P s y c h o l o g ic a l B u lle tin , 1 1 1 , 352-360.
Scarr , S, (1997), Rules of evidence: A larger context
for the statistical debate, P s y c h o l o g ic a l S c ie n c e , 8,
16-17.
F. L. (1996). Statistical significance testing and
cumulative knowledge in psychology: implications
for training of researchers. P s y c h o l o g ic a l M e th o d s , l ,
115-129.

S c h m id t ,

En: N.P. Bushlenko, D. I. Golenko, Yu. A. Shreider, L.


M. Sobol, & V, G. Sragovich (Yu. A. Shreider, Ed.),
tr ia l s (G.J. Tee, Trans.), (p. vii). Elmsford, NY: Perga*
mon Press.

S iegel, M., & B iener, L. (1997). Evaluating the impact


o f statewide anti-tobacco campaigns: The Massachu
setts and California Tobacco Control Programs. J o u r
n a l o f S o c ia l I s s u e s , 5 3 , 147-168.
S igall, H., & Ostrove, N. (1975). Beautiful but dange
rous: Effects of offender attractiveness and nature of
the crime on juridic judgments. J o u r n a l o f P e r s o n a lit y
a n d S o c i a l P s y c h o lo g y , 3 1 , 410
414.
Skinner, B. F. (1956). A case history in scientific met
hod. A m e r i c a n P s y c h o lo g is t, 11, 221-233.
S peed, A., & Gangstead, S. W. (1997). Romantic po
pularity and mate preferences: A peer-nomination

study. P e r s o n a l i t y
2 3 , 928-937.

a n d S o c i a l P s y c h o l o g y B u lle tin ,

S ucceed

w ith m a th : E v e r y s t u d e n t s g u i d e to c o n q u e r in g m a th

(pp. xvii-xviu), New York: College Entrance


Examination Board.

a n x ie ty

Steering C ommittee of the P hysicians H ealth


S tudy R esearch G roup. (I98S). Preliminary re
port: Findings from the aspirin component of the
ongoing Physicians Health Study. N e w E n g l a n d
J o u r n a l o f M e d i c i n e , 3 1 8 , 262-264.
Steil, J. M , & H ay, I. L, (1997). Social comparison in
the work place: A study of 60 dual-career couples.
P e r s o n a l i t y a n d S o c i a l P s y c h o l o g y B u lle tin ,

23,

427-438.
C o n s t r u c t v a l i d a t i o n o f a tr ia n

Unpublished manuscript, Ya
le University, Department of Psychology, New
Haven, CT.
g u la r th e o r y o f lo v e .

S tigler , S. M. (1986). T h e h i s t o r y
bridge, MA: Belknap Press.

o f s ta tis tic s .

Cam

Stipek , D. J., & Ryan , R. H. (1997). Economically


disadvantaged preschoolers; Ready to learn but
further to go, D e v e l o p m e n t a l P s y c h o l o g y , 3 3 ,
711-723.
Strahan , R. F. (1991). Remarks on the binomial effect
size display, A m e r i c a n P s y c h o l o g is t, 4 6 , 1083-1084.
S uh , E., D iener , E., & F ijita, F. (1996), Events and
subjective well-being: Only recent events matter,
J o u rn a l o f P e r s o n a lity a n d S o c ia l P s y c h o lo g y , 70,

1091-1102.
Tabachnick, B. G., & FtDELL, L. S. (1996). U s in g m u lti
v a r ia t e s t a t i s t i c s (3rd ed.). New York: Harper & Row.
T ankard , J,, Jr. (1984). T h e s t a t i s t i c a l p i o n e e r s . Cam
bridge, MA: Schenkman.
T erpstra , D, E., & R ozell , E, J. (1997), Sources of
human resource information and the link to organi
zational profitability, J o u r n a l o f A p p l i e d B e h a v i o
r a l S c ie n c e , 3 3 , 66-83.
T

, K . N., & S chumacher , R. E. (1997). An


evaluation o f Rosenthal and Rubins binomial ef
fect size display. J o u r n a l o f E d u c a t i o n a l a n d B e h a
v i o r a l S t a t i s t i c s , 2 2 , 109-117.

h o m p so n

T obias, S. (1987),

C ensus . (1990). S t a t i s t i c a l a b s
Washington, DC: U.S.
Government Printing Office.
of the

t r a c t s o f th e U n i t e d S ta te s .

S teen, L. A. (1987). Forward. En: S. Tobias,

S ternberg, R. J. (1988).

U.S. B ureau

S u c c e e d w i t h m a th : E v e r y s t u d e n t s

g u i d e t o c o n q u e r i n g m a t h a n x ie t y .

New York: Co

llege Entrance Examination Board.


T ufte, E, R. (1983). T h e v i s u a l d i s p l a y o f q u a n t i t a t i v e
in f o r m a ti o n . Cheshire, CT: Graphic Press.

U.S. D epartment of E ducation. (1990). T h e c o n d it io n


o f e d u c a tio n . Washington, DC: U.S. Government Prin
ting Office.
Valenzuela , M. (1997). Maternal sensitivity in a de
veloping society: The context o f urban poverty and
infant chronic undemutrition. D e v e l o p m e n t a l P s y
c h o lo g y , 3 3 , 845-855.
Van A ken , M. A. G., & Asendorpp, J. B. (1997). Sup
port by parents, classmates, friends, and siblings in
preadolescence: Covariation and compensation across
relationships. J o u r n a l o f S o c i a l a n d P e r s o n a l R e l a
ti o n s h ip s , 1 4 , 79~93,
Van L ange , P. M., O tten , W., D eB ruin , E. M. N., &
Joireman, J. A. (1997). Development o f prosocial,
individualistic, and competitive orientations: The
ory and preliminary evidence. J o u r n a l o f P e r s o n a
l i t y a n d S o c i a l P s y c h o l o g y , 7 3 , 733-746.
Vance, W. R., Jr & W atson, T. S . (1994). Comparing
anxiety management training and systematic ratio
nal restructuring for reducing mathematics anxiety
in college students. J o u r n a l o f C o l l e g e S t u d e n t D e
v e lo p m e n t , 3 5 , 261-266.
Walberg , H. J., S trykowski, B. F., R ovai, E., & H ung,
S. S. (1984). Exceptional performance. R e v i e w o f
E d u c a ti o n a l R e s e a r c h , 5 4 ,8 7 - 1 1 2 .

Wardle , J., Steptoe , A., B ellisle , E , D avou, B.,


R eschke, K., L appajlainen, R., & F redrikson , M.
(1997). Healthy dietary practices among European
students. H e a l t h P s y c h o l o g y , 1 6 , 443-450.
Watts, W., & W right, L. (1990). The relationship of
alcohol, tobacco, marijuana, and other illegal drug
use to delinquency among Mexican-American,
black, and white adolescent males. A d o l e s c e n c e ,
2 5 , 171-181.
W echsler , H .f D avenport, A., D owdall , G., M oey kens , B., & C astillo , S. (1994). Health and beha
vioral consequences of binge drinking in college:
A national survey of students at 140 campuses.
J o u r n a l o f th e A m e r ic a n M e d ic a l A s s o c ia tio n , 2 7 2 ,

1672-1677.
W eller , A., & W eller , L. (1997). Menstrual synch
rony under optimal conditions: Bedouin families.
J o u r n a l o f C o m p a r a t i v e P s y c h o l o g y , 1 1 1 , 143-151.
W htecotton , S, M. (1996). The effects o f experience
and a decision aid on the slope, scatter, and bias of
earnings forecasts. O r g a n i z a t i o n a l B e h a v i o r a n d
H u m a n D e c i s i o n P r o c e s s e s , 6 6 , 111-121,

W iseman , H. (1997). Interpersonal relatedness and


self-definition in the experience of loneliness du
ring the transition to university. P e r s o n a l R e l a t i o n s
h ip s , 4 , 285-299.
W ong , M. M , & CsncszENTMiHALYt, M. (1991). Affi
liation motivation and daily experience: Some is

sues on gender differences,


a n d S o c ia l P s y c h o lo g y , 6 0 ,

lo u m a l o f P e r s o n a lity

154-164.

Z ejodner, M. (1991). Statistics and mathematics anxiety


in social science students: Some interesting parallels.
B r iti s h J o u r n a l o f E d u c a tio n , '61, 319-329.

A
Abrams, R. A,, 264
Agresin a travs de relaciones, 591-93
Alfa de Cronbach, 565
Alfa, V a s e alfa de Cronbach; error Tipo I
Allport, Gordon, 59
Altman, D, G., 170-71
Anlisis de covarianza multivariado, 576-577
Anlisis de covarianza, 575-76
Anlisis de senderos, 570
Anlisis de sistemas, 60
Anlisis de un caso, 59,601
Anlisis de varianza de cuadrados mnimos, 444
Anlisis de varianza de dos criterios, 410
clculo de, 425-26
ejemplo de, 428-36
frmulas de clculo para, 455-57
grados de libertad de, 426-28
lgica de, 420-21,424-36
modelo estructural para, 424
razn F en, 420-21,424.
resumen del procedimiento, 436-37
supuestos de, 436
tabla para, 428
Anlisis de varianza de medidas repetidas, 443-44,
457-59
Anlisis de varianza de tres criterios, 443
Anlisis de varianza de un criterio, 346, 410
Anlisis de varianza multivariado, 444, 576-577
Anlisis de varianza, 345-71. V a s e tambin anlisis
factorial de varianza, modelo estructural
analoga, 353
como caso especial de coeficiente de correlacin
mltiple, 541-47,549
como forma de pensar, 381
controversias, 368,397

de cuadrados mnimos, 444


de dos criterios, 410,420-21,424-436
de tres criterios, 443
de un criterio, 346,405, 410
desarrollos recientes, 397-98
estimacin de la varianza poblacional a partir de,
346-47
factorial, 346, 407-449
grupos de tamaos desiguales y; 385-91, 394
hiptesis nula y, 347, 349-5!
la prueba ( como caso especial de, 531-36
limitaciones, 368-69,397-98
lgica de, 346-53
medidas repetidas, 443-44,457-59
modelo estructural, 377-400
multivariado, 444
paralelismos con la lgica de la prueba t, 532
plegado, 443
potencia de, 366
principio fundamental de, 351
prueba de hiptesis con, 346,361-63
realizacin de, 354
relacin de ia prueba t con, 539
segn se describe en publicaciones cientficas, 369-70
supuestos de, 363-364, 370
tablas, 384-85
tamao de efecto del, 364-66
tamao muestral, 366-67
Anlisis estadstico, 52
Anlisis factorial de varianza, 346, 407-449. V a s e
tambin anlisis de varianza; diseo factorial de
investigacin
cantidad desigual de participantes y , 444
casos especiales de, 443-44
controversias, 444-47
desarrollos recientes, 444-47
dicotomizacin de variables numricas en, 444-47

extensiones de, 443*44


limitaciones, 444*47
lgica de, 407*20
potencia de, 442
segn se describe en publicaciones cientficas, 447448
tamao del efecto de, 436-42
tamao muestra!, 442
Anlisis factorial, 568*70
aNCOVA. V a s e anlisis de covarianza
Angustia matemtica, 3
Angustia por los exmenes, 13-14
Angustia, 13-15
anova. V a s e anlisis de varianza
Ansiedad, 14
Apuesta de Pascal, 159
Aristteles, 552
Aron, A., 2 ,3 1 9 ,3 2 2 ,3 3 4 ,5 8 6 ,5 8 9
Aron, E. N., 2 ,5 8 9
Asendorpf, j. B ., 339
Asignacin aleatoria, 368-69,598
Asimetra, 23,463
Asociacin Americana de Matemtica, 28
Asociacin Americana de Psicologa ( apa), 195
Atenuacin, 95

B
Bardsley, J. 1 ,7 5
Barras de error estndar, 227
Baumrind, D., 552
Bayes, Thomas, 168
Behaviorismo, 58
Bell, Julia, 463
Beta. V a s e coeficiente de regresin estandarizado;
error Tipo I
Biener, L., 200
Biemat, M., 582
Biometria, SI, 533
Biomtrika, 464
Blanchard, R A 432,457
Boyd, C. P 585
Brickman, R, 187
Buck, J. L.,27
Buffon, 330
Burke, C. J,, 486
Bush, George, 164

C
C de Cochran, 582
Capaldi, D. M 575
Carey, M. R, 524
Carga factorial, 568
Carroll, R, 11
Casilla, 411

Caspi, A., 268,520


Categoras objetivo, 269
Causalidad
direccin de, 91
teora basada en la regularidad, 551
teora generativa de, 551-52
Chapman, H. A., 102
Chiu, C 227-28
Chow,S.L 267-68
Ciaidini, R. 8., 404
Clark, O .M ., 389,399
Clark, Margaret, 52
Coates, D., 187
Cochran, Wifiiam G 352
Codificacin nominal, 547,549
Coeficiente de correlacin de Pearson.
V a s e coeficiente de correlacin
Coeficiente de correlacin mltiple, 127-28,541-47,549
Coeficiente de correlacin parcial, 565
Coeficiente de correlacin, 79*100,121,459-60.
V a s e tambin beta abreviatura de, 82
controversias, 95-99
definicin de, 82
desatTollos recientes, 95-99
ejemplo de, 84
frmula de, 84
frmulas de clculo de, 105
frmulas de clculo versus frmulas de definicin
de, 84-85
intetpretacin, 91-95
pasos a seguir para el clculo de, 84,85
potencia de, 107
probando la significacin estadstica de, 90
prueba t como caso especial de, 536-541
pruebas de hiptesis de, 105-06
reglas de Cohn para, 107
segn se describen en publicaciones cientficas, 99-100
significacin de, 105-106
tamao del efecto de, 107
Coeficiente de regresin estandarizado, 111,126-27
Coeficiente de regresin para puntuaciones ordinarias, 113
Coeficiente de regresin, 111
Coeficiente de senderos, 570
Coeficiente phi, 483
Cohn, Jacob, 107,249-51,254-55,257,30Qn, 328,
333n, 365,396,440, 445, 483,485, 579
Cohn, R, 445
Comisin Juvenil de Texas, 129
Cmo tener xito con las matemticas?: gua para que
cada alumno pueda superar la angustia
matemtica, 13
Comparaciones a posteriori, 394
Comparaciones a priori, 393-94
Comparaciones mltiples, 391,393-94
efectos de, 394
mtodos, 393-94
segn se describen en publicaciones cientficas, 398400

Comparaciones planificadas, 393-94


Comparaciones p o s : h o c , 394
Compensacin, 600
Confiabildad por divisin en mitades, 567
Confiabilidad por intercambio de juicios, 604
Confiabildad por prueba y repeticin, 567
Confiabilidad, 566-68. V a s e tambin validez
consistencia interna, 604
definicin de, 566
divisin en mitades, 567
intercambio de juicios, 604
prueba-reprueba, 567,604
Confianza en s mismo, i 4
Conflicto de separacin-individuacin, 566
Connors, G. 1., 519
Conover, W., 510
Consistencia interna, 604
Constante de regresin, 113-14,115
Constructivismo, 60
Contingencia, 463
Contrastes lineales, 393-94
Contrastes planificados, 393-94
Control de manipulacin, 319
Controlar, 565
Correccin por atenuacin, 95
Correlacin curvilnea, 75
Correlacin espuria, 463
Correlacin ilusoria, 91
Correlacin lineal, 73,79-82
Correlacin negativa, 74-75
Correlacin nula, 75-76
Correlacin parcial, 564-566
Correlacin perfecta, 82,111
Correlacin positiva, 73
Correlacin semiparcial cuadrtica, 126n, 27n
Correlacin semiparcial, 565n
Correlacin, 69-70,49n, 531.
V a s e tambin coeficiente de correlacin
causalidad y, 91
curvilnea, 75
definicin de, 69
grado de, 79-80
gran, 95-99.
ilusoria, 91-92
lineal, 73
negativa, 74-75
nula, 75-76
pasos a seguir para la determinacin, 85-90
patrones de, 73-78
pequea, 97-98
perfecta, 82,111
positiva, 73
regresin mltiple y, 126-27
representacin grfica, 71-73
Correlaciones de orden cero, 82
Covariable, 575
Crick, N. R., 590
Csikszentmihalyi, M., 428,439

Curts, J., 454


Curtosis, 23-24, 502
Curva con forma de campana. V a s e curva normal
Curva normal, 23-24,147-56, 167-168
controversias, 168-69
;
frmula de, 148n
historia de, 149
limitaciones, 168-69
porcentajes de valores en, 150-156
probabilidad en, 159-60,167-68
puntuaciones Z y, 152-53
segn se describe
en publicaciones cientficas, 170-71
tabla de reas de, 152-56,609-U

D
d de Cohn, 247
Dae, F. C., 36 In
Darwin, Charles, 81
Dato estadstico phi de Cramer, 483-484
DeGarmo, D. S.. 576-77,593
Delaney, H. D .,445
Deaney, S. E., 446
Delucchi, K. L., 486
DeMoivre, Abraham, 148,150
Desempeo matemtico, 27-28
Desensibilizacin sistemtica, 14
Desmaris, S., 454
Desvo cuadxtico, 43,378-79
Desvo estndar de una distribucin de medias, 208,
225,280-81
Desvo estndar de una distribucin de diferencias entre
medias, 318
Desvo estndar, 45-51. V a s e tambin varianza
definicin de, 45
descripcin de, 45
ejemplo de, 45,47
frmulas de clculo, 50-51, 65-66
frmulas para, 46-47
segn se describe en publicaciones cientficas, 60-61
Desvo medio, 45n
Desvo promedio, 45n
Desvo, 43
Dewey, Thomas, 164
Diagramas de dispersin, 71-76, 85
cmo crear, 71
ejemplo de, 72-73
Dicotomizacin, 444-445
Diferenciacin relacionada, 91
Direccin de causalidad, 91
Diseo cuasiexperimental, 598
Diseo de investigacin con grupo de control
equivalente y pruebas previa y posterior, 598
Diseo de investigacin con grupo de control
equivalente, 598

Diseo de investigacin de grupo tnico con pruebas


previa y posterior, 600
Diseo de investigacin de medidas repetidas, 287-89,
30 , 600-01
Diseo de investigacin factorial de dos criterios, 410
Diseo de investigacin factorial de tres criterios, 411
Diseo de investigacin ntra-sujeto, 287-89,301, 600
Diseo de investigacin.
V a s e tambin experimento
anlisis de varianza y, 550
caractersticas de, 597
con grupo de control equivalente y pruebas previa y
posterior, 598
con grupo de control equivalente, 598
correlacional, 547-50,601
cuasiexperimental, 598
diseo de grupo nico con pruebas previa y
posterior, 600
equivalencia de las circunstancias en, 603
equivalencia de participantes en, 597-601
experimental, 547-50
intrasujetos, 600
medidas repetidas, 600-01
medidas utilizadas en, 604-07
papel que desempea la potencia en, 256-260
preexperimental, 600
problemas, 603
representatividad de la muestra, 603-04
resumen de, 601
Diseo factorial de investigacin, 409-20. V a s e
tambin anlisis fa c to r ia l de varianza
de dos criterios, 411
de tres criterios, 410
definicin de, 409
efectos interactivos,409-10
terminologa, 410-411
Diseo preexperimental, 600
Diseos de investigacin correlacinales, 91, 601
Distribucin arco-seno, 502
Distribucin asimtrica, 23
Distribucin bimodal, 20-2!
Distribucin chi-cuadrado, 466
Distribucin comparativa
caractersticas, 181
distribucin de inedias c o m o , 212
media muestra! y, 284
punto muestral de corte, 181-83
valor muestral de investigacin, 183
varianza poblacional estimada y, 281-82
Distribucin de diferencias de medias, 313-319
contenido de, 313-314
desvo estndar de, 318
forma de, 318
media de, 314
varianza de, 317-318
Distribucin de frecuencias, 20-25, 159
Distribucin de medias, 200-213.
V a s e tambin medias caractersticas de, 206-212

como distribuciones comparativas, 212


creacin de, 204-206
desvo estndar de, 208,225
ejemplo de, 210-212
forma de, 208-209
media de, 206-207
pruebas de hiptesis q u e involucran, 212-219
puntuacin 2 de ia media muestral en , 212-213
reglas para la determinacin de las caractersticas
de, 209
varianza de, 207-208,317
Distribucin de maestreo, 181
Distribucin F , 358-59
Distribucin Gaussiana, 148
Distribucin multimodai, 20-21
Distribucin normal. V a s e curva normal
Distribucin rectangular, 20-21
Distribucin simtrica, 23,148
Distribucin t, 276,281-82,318
forma de, 281-82
puntos de corte para, 282-84,612
Distribucin unimodal, 20-21,148
Dunlap, VV. P.( 05n, 333n, 4 8 5 a
Dweck, C .S., 227-28

Efecto de fatiga, 600


Efecto de prctica, 600
Efecto de tr a s p a s o , 6 0 0
Efecto interactivo, 409-20
definicin de, 410
efecto principal y, 418-20
ejemplo de, 422
interpretacin, 412-414
medas de casilla y, 412
razn F , 421,423
reconocimiento de, 412-14
representacin grfica, 415-18
Efecto principal, 411
efecto interactivo y, 418-20
medias marginales y, 411
razn F para, 421
Efecto piso, 23
Efecto techo, 23
Efectos del experimentador, 603
Efectos Hawthome, 603-04
Efectos placebo, 603
E l c o r a z n d e l a p s i c o l o g a s o c ia l , 5 2

Elser, M. J., 14
Encuesta Crossley, 164
Encuesta de Gallup, 164,218
Encuesta de Roper, 164
Encuestas telefnicas, 164,170-71,213
Encuestas, 164, 213
Entrevistas, 60
Eppley, K. R 264

Error cuadrtico total al predecir utilizando la media, 121


Error cuadrtico, 118,121
Error estndar de estimacin, 122n
Error estndar de la media, 208,225.
V a s e tambin media
Error estndar. V a s e error estndar de la media
error Tipo 1,2 36-37,238,444,445,517-19,579
error Tipo II, 237-39,444,445,517-19,579
error Tipo IH, 236n
Error, 117-122. V a s e tambin porcentaje de varianza
explicada
Quadrtico, 118
definicin de, 118
interpretacin grfica de, 118
tipo 1,236-37,444,445
tipo H, 237-39, 444,445
tipo III, 236n
Escala de idealizacin, 69
Escala de intimidad, 69
Escudero, V., 340
E s s a i d A r th m e tiq u e m o r a le , 330
Estadstica
Estadstica descriptiva, 2
Estadstica inductiva, 2,147-171, 179
Estadstica multivariada, 126n, 576
Estadsticas maestrales, 164
Estado de nimo estadstico, 60
Estimacin combinada de la varianza poblaconal,
315-17, 347
Estimacin insesgada de la varianza poblaconal, 280
Estimacin intergrupal de varianza poblaconal, 349-51,
V a s e tambin razn F
Estimacin mervalar, 219
Estimacin ntragrupal de la varianza poblaconal, 347,
350-51. V a s e tambin razn F
Estimacin puntual, 219
Estimacin sesgada, 279
Estimacin, 219
eta cuadrado, 396
Etna, 27-28
Etnografa, 60
Eugenesia 81, 353,463
Everett, S. A., 493
Everett, Shu-Ling, 487
Examen de Inscripcin de Graduados ( gre), 210
Excluir, 565
Experimento de Lanarkshire acerca del consumo de
lecbe, 302
Experimento verdadero, 596-97
Experimento. V a s e tambin diseo de investigacin
equivalencia de las circunstancias en, 603-604
equivalencia de participantes en, 597-601
medidas utilizadas en, 604-607
papel que desempea La potencia en, 256-60
representativdad de la muestra, 603-604
terminologa relacionada con, 596-597
verdadero, 596
Exposicin binomial del tamao dei efecto, 98

F
Factor agrupacin de medidas repetidas, 458
Factor, 568
Fawzi, M. C. S., 585
'
Punto de corte para, 360,613
tabla F y , 352-53
Fenomenologa, 58-60
Fermat, Pierre, 159
Fidell, Linda, 548
Finley, H. C., 60
Fisher, Ronad A., 352-53,463, 486, 5 S, 533, 578, 579
Foertsch, J., 225
Folwell, A, L., 490
Ford, I. D., 520
Forgatch, M, S., 576-77, 593
Forma de la distribucin de medias, 208-09
Frmula de prediccin con puntuaciones originales, 113
Frmulas de clculo, 50, 84
Frmulas de definicin, 50,84
Frank, S. J., 566
Frecuencia esperada, 465,474-476
Frecuencia observada, 465
Frecuencia relativa esperada, 157
Frecuencia relativa, 157
Frecuencia, 157
Frick, R, W,, 169a, 186,266-67
Frisch, A. S., 335

G
Cableo, 552
Galton, Francis, 81,8 2 ,1 6 8 ,4 6 3 ,5 3 3
Gangestad, S. W., 31,105
Gauss, Kart Friedrich, 148,149
Gnero, 26-28
. Gemsbacher, M. A 225
Gigerenzer, G., 254,579,580
Gire, I.T., 586
Glass, G. V., 167
Gosset, Wilfiam S., 81,276-77,301,302,
352,463,518,533
Grado de correlacin, 79-82.
V a s e tambin coeficiente de correlacin
Grados de libertad del denominador, 359-360
Grados de libertad del numerador, 359-60
Grados de libertad intergrupales, 359-60
Grados de libertad intragrupaes, 359-60
Grados de libertad, 280,315
anlisis de varianza de dos criterios y, 394-96
denominador, 359-360
intragrupaes, 359-360
numerador, 359-360
prueba chi-cuadrado de independencia y, 477-478
Grabara, S., 143
Gran correlacin, 95-99

Gran media, 356


Graziand, Biil, 52
Greenwald, A. G., 186
Grilo, C. M 369
Grupo contri, 596
Grupo experimental, 596
Gullone, E., 585
Gump, B. B,, 447-48
Gutierrez, E., 340
H

Hamilton, H., 170-71


Hanych, J. M.,29
Harter, S., 462,465,467,473,490,491
Hay, Jennifer, 479, 485,487
Hazan, Cindy, 345,349,352-53, 399, 541
Herbener, E. S., 520
Hermano, C, 562,563
Highen, P. S 60
Hiptesis alternativa, 180
Hiptesis de investigacin, 180-81
Hiptesis direccional, 188-189
Hiptesis no direccional, 189
Hiptesis nula, 180-81
aceptacin, 186
anlisis de varianza y, 347,349-51
criterio para, 186
pruebas de rango y orden y, 509-10
rechazo, 181-83,184-85,282-84
Histogramas, 12,16,463
cmo crear, 16
controversias, 24-25
ejemplos de, 16
exageracin de proporciones, 25
limitaciones, 24-25
polgonos de frecuencias y, 20
segn se describen en publicaciones cientficas, 2831
Hobfoll, S. ., 102
Holden, G. W 304
Homoscedasticidad, 551
Hong, Y, 227-28
Hopkins, K. D., 167
Howard, G 170-71
Hume, David, 552
Hunter, J. E., 194-95
Huyo, C-L., 190n
Hyde, J. S 27

I
Imn, R. L., 510
independencia, 473
ndice de Atencin aAlternativas, 523

ndice de concordancia, 571


Inhoff.A., 10
Instrumentos de ayuda, 132-133
Interaccionismo simblico, 60
Interacconismo, 60,422
Interpretacin de laprobabilidad como la frecuencia
relativa a largo plazo, 157
Interpretacin subjetiva de la probabilidad, 157
Interpretacin, 396
InterseccinY (ordenada al origen), 115
Intervalos de confianza, 219
controversias, 224-25
del 95%, 220
del 99%, 221
ejemplo de, 220-21
limitaciones, 223-224
lgica de, 221-222
pasos aseguir para el clculo, 220
potencia estadstica y, 263,266
potencia y, 263,266
prueba de hiptesis y, 204-5
segn se describen enpublicaciones cientficas, 227
tamao del efecto y, 263,266
ventajas de, 224-25
Intervalos, 8,9-10
lmites, 9-10
tamao, 9-10,24-25
Intuiciones capacitadas, 132
Inventario de Personalidad
Polifactico deMinnessota (mmpi), 192
Inventario Muitidimensonal
de Identidad de la Raza Negra (mdbi), 568
Investigacin cualitativa, 6 0
Investigacin de conductas, 60
Investigacin de sujeto nico, 601

J
anoff-Buman, R., 187
Jehn.K. A, 137
Jung, Cari, 60

K
fant, Immanuel, 552
Keley, H. H 381
Kenney, D. A., 422
Kiein, D. R, 369
Kleinmuntz, B,, 132
Kotovsky, K., 195
Kulik, I A., 447-448
Kunda, Z 451,452
Kurtz, M., 335
Kwan, V. S. Y., 573

L
La poca dorada de la estadstica, 533
Lamben, A . L, 2 9 9 -3 0 6 ,4 1 5 ,4 2 0 ,4 2 1 ,4 2 4 ,4 4 3 ,4 4 7

Laplace, Pierre, 149


Latane, Bibb, 52
Legitimidadde la generalizacin, 603
Levanthal, L 190n
Levine, D. W., 170-71
Lewis, D 486
Lilly, T., 434
Lima, S., 10
Lmites de confianza, 219-220
Lindquist, E. F., 353
Lindzey, E. W., 585
Linea de regresin, 114-17
cmo trazar, 115-17
pendiente de, 114-115
LISREL. V a s e modelo de ecuacin estructural
Lista de Control de Adjetivos, 211
Logaritmo, 502
Lydon, John, 487
M

MacDonald, C., 561


MacKinnon-Lewis, C., 570
M a n c o v a . V a s e anlisis de covarianza multivariado
Manipulacin de la variable independiente, 596
Manipulacin experimental, 596
m a n o v a . V a s e anlisis de varianza m
ultivariado
Mantenerconstante, 565
Manual de Diagnstico y Estadstico de Trastornos
Mentales (DSM-IV), 585
Matriz de correlacin, 99
Maxwell, S.E., 445,447
McLaughlin-Volpe, Tracy, 7
Media armnica, 332-33
Media de casilla, 411
Media de la distribucin de diferencias entremedias, 315
Media de la distribucin de medias, 206-07
Media de los cuadrados; 355
Media, 35-39. V a s e tambin tendencia central,
distribucin de medias, mediana, moda, error
estndar de la media
controversias, 58-60
descripcin de, 32
distribucin de, 200-219
ejemplos de clculo, 37-39
frmula para calcular, 37
limitaciones, 58-60
segn se describen en publicaciones cientficas, 6061
valor t paradiferencias entre, 318-19
Mediana, 40-43.
V a s e tambin tendencia central, media, moda

divisin por, 445


utilizacin de, 41-43
Medias marginales, 411
Medicin
confiabilidad de, 604
de comportamiento, 604
falta de confiabilidad de, 95
fisiolgicas, 604
informe propio, 604
niveles de, 5-6
por observacin, 604
validez de, 605-06
Medidas de comportamiento, 604
Medidas de informe propio, 604
Medidas fisiolgicas, 604
Medidas por observacin, 604
Meditacin trascendental (tm ), 243
Meehl, Paul, 132
Meta-anlisis, 248,263-66,267,269
Mtodo Bayesiano, 1 6 8
Mtodo de aproximacin, 149
Mtodo de Montecario, 330-31,486, 518
Mtodo de prueba a ciegas, 603
Mtodo ideogrfico, 59
Mtodo nomottico, 58
Mtodo probabilstieo, 164
Mtodos de prueba intensivos por computadora segn se
describen en, 520
anlisis factorial de varianza segn se describe en,
447-48
coeficiente de correlacin segn se describe en,
99-100
comparaciones mltiples segn se describen en,
398-400
curva normal segn se describe en, 170-71
desvo estndar segn se describe en, 60-61
htstogramas segn se describen en, 28-31
intervalos de confianza segn se describen en, 227
la media segn se describe en, 60-61
modelo estructural segn se describe en, 398-400
muestra segn se describe en, 170-71
poblacin segn se describe en, 170-71
poblaciones anormales segn se describen en,
519-20
polgonos de frecuencia segn se describen en, 2831
potencia estadsticasegn se describe en, 267-69 .
probabilidad segn se describe en, 170-71
pruebade hiptesis segn se describe en, 195-96,
225-28
pruebas de rangoy ordensegn se describen en, 520
pruebas t para medias dependientes segn se
describen en, 303-05
pruebas para medias independientes segn se
describen en, 334-37
pruebas rsegn se describen en, 303-05
regresin / correlacin mltiples segn se describen
en, 137

tablas de frecuencia segn se describen en, 28-31


tamaodel efecto segn se describe en, 267-69
transformaciones de datos segn se describen en,
519-20
M to d o s d e prueba intensivos por computadora, 510-16
controversias, 519
desventajas de, 517
pruebas de aleatorizacin, 510-16
pruebas de esfuerzo propio, 416 { b o o is tr a p te s ts )
pruebas de rango y ordeny, 516-19
segnse describenen publicaciones cientficas, 520
transformacinde datos y, 516-19
Micceri, T., 167-68
Mikulmcer, M., 361,365-66
Mili, JohnStuart, 552
Miller, D. T,, 99
Miller, R. S., 400,523
Mische, Walter, 422
Moda, 40-41. V a s e tambin tendenciacentral;
meda; mediana
Modelo causal, 570-75
anlisis de senderos, 570
limitaciones, 575
modelo de ecuacin estructural, 570-75
Modelo de cuadrados mnimos, 531,552
Modelo de ecuacin estructural, 570-75
diagramade senderos, 573
ejemplo de, 573-75
ndice de concordancia, 571
matemtica de, 573
ventajas de, 571-73
Modelo de variable latente, 570
Modelo estadstico, 181
Modelo estructural, 377-400. V a s e tambin anlisis de
varianza
anlisis de varianza utilizando, 383-84
comparaciones mltiples y, 391, 393-94
controversia, 397-98
divisin del desvo en, 378
ejemplo de, 386-91
estimaciones de varianzapobacional, 379-80
grupos de tamaos desiguales y, 385-391,. 394
mtodo del captulo 11y, 380,383
para el anlisis de varianzade dos criterios, 424
potencia de, 395-96
principios de, 378-80,383
proporcin de varianza explicada, 395-96
resumen del procedimiento, 391
segnsedescribeenpublicaciones cientficas, 398-400
sumade desvos cuadrticos, 378-79
tamao dei efecto en, 395-96
Modelo lineal general, 527-553
controversias, 551-552
correlacin/ regresin mltiples y, 531
definicin de, 530
introduccin a, 530-31
limitaciones, 551-52

modelo de los cuadrados mnimos, 552


supuestos y, 551
Modelo lineal, 530-31.
V a s e tambin modelo lineal general
Modelos de prediccin, 110-12,117-18,136-37
Moriarty, Sandra, 487
Mu, 37,162
Mueller, J. H., 14
Muestraprobabilsima, 604
Muestra, 160-65,596
controversia, 169-70
curva normal y, 165-66
media, 284
mtodos deseleccin, 162
poblacin versus, 165-66
probabilidady, 165-66
razones parautilizar, 160-62
representatividadde, 603-04
segn se describe
en publicaciones cientficas, 170-71
Muestreo aleatorio, 603-04
Muestreocon reemplazo, 230n
Muestreo de agrupacinde escenarios mltiples, 164
Muestreo por cuotas, 164
Muticolinearidad, 136
Murray, D. J,, 579
Myers, L., 106n, 333n, 485n
N

Narcisismo, 199
Newton, Isaac, 149
Neyman, Jerzy, 578-79
Nezlek, J. B., 136
Niveles de medicin, 5-6
Niveles de significacincondicionales, 183
Norcross, I. C., 28
Normal bivariada, 551
Norman, C., 318,322,334
Nmeros seudo aleatorios, 518

O
Oakes, Michael, 96
Oleson, K. C, 45, 452
Olthoff, R. K 290-93,304
Observacin del participante, 601
Operaciones formales, 381
Orbach, I., 60,397,398
P-

Paciol, Lea, 159


Pars, M., 2
Participantes, 596

Pascal, Blaise, 159


Patterson, G. R., 576
Pearson, Egon, 578*79, 579
Pearson, Karl, 81,82,149, 352,462,463, 518, 533,
578-79
Pendiente, 114-15
Personas altamente sensibles ( pas), 1 4 , 589-90
Pezdek, K., 304-306
Piaget, Jean, 381
Poblacin, 160-65,596
controversia, 169-70
curva normal y, 165
muestras versus, 165
parmetros, 162, 219
probabilidad y, 165
segn se describe
en publicaciones cientficas, 170-71
Pioneros de la estadstica, ios, 533
Polgonos de frecuencias, 17-20
cmo crear, 15
controversias, 24-25
ejemplo de, 18,19
exageracin de proporciones, 25
histogramas y, 20
limitaciones, 24-25
segn se describen en publicaciones cientficas,
28-30
Porcentaje de varanza explicada, 94,117-22,365n,
395-96,529
coeficiente de correlacin y, 121-22
definicin de, 121
representacin grfica, 122
Posavac, S. $,, 28
Positivismo lgico, 60
Pospositivismo, 60
P o s g r a d o d e p s ic o l o g a , 29
Potenciaestadstica. V a s e potencia
Potencia, 233-42
anlisis de varanzay, 366
clculo de, 239-42
pruebachi-cuadrado de independencia y, 485-86
intervalos de confianza y, 263,266
definicin de, 233-34
tamao del efecto y, 244-51,263,266
ejemplo de, 234-36,239,241-42
anlisis factorial de varianza y, 442
determinacinde factores, 242
clculo del tamao de muestrapara, 253,255
media armnica y, 332-33
importanciaen la evaluacin de los resultados de un
estudio, 261-62
aumento, 256-60
influencias en, 255-56,259
experimentos psicolgicos y, 254
segn se describe en publicaciones cientficas,
268-69
papel que desempea en el diseo experimental,
256-60

papel que desempea en ios resultados de estudios


no significativos, 262
papel que desempea en los resultados de estudios
significativos, 261-62
tamao de muestra y, 2 5 2 - 5 6 , 2 5 6
pasos aseguir para el clculo de, 241
modelo estructural y, 395-96
tablas, 242,299-300,615
de pruebas t paramedias dependientes, 299-300
de pruebas t paramedias independientes, 331-33
Prediccin bivariada, 109-14, 531
con puntuaciones originales, 112-14
con puntuaciones Z, 110-12
controversias, 135-36
definicinde, 109
ejemplo de, 122-25
limitaciones, 135-36
modelo, 110
revisin de, 528-29
segn se describen en publicaciones cientficas, 136
Prediccin clnica, 132-33
Prediccinestadstica versus prediccin clnica, 132
Prediccin estadstica, 132-33
Prejuicios, 91
Prentice, D, A,, 99
Probabilidad condicional, 174
Probabilidad, 156-60,165-166
regla de adicin, 173-74
clculo, 157-59
condicional, 174
controversia, 166-69
definicin de, 157
interpretaciones de, 157
significado de, 168
regiade multiplicacin, 174
curva normal y, 159-60,165-66
rango de, 159
segn se describe en publicaciones cientficas, 17071
reglas, 159,173-74
smbolos de, 159
Problema de los puntos, 159
Procedimiento a ciegas porpartidadoble, 603
Procedimiento Bonferroni, 393-94
Procedimiento de Scheff, 399
Procedimiento Neuman-Keuls, 399
Procedimientos avanzados segn se describen en
publicaciones cientficas, 559-583
angustia, 13-14
controversia acerca de, 58-60,578-79
eleccin de las pruebas, 549-51
historiade, 3
lecturade resultados de tcnicaque no nos resultan
familiares, 579-82
ramas de, 2
relacin entre los mtodos, 527-28
repaso general de las tcnicas, 577
trivialidades, 3

Procedimieto HSD deTukey, 399


Productocruzado de puntuaciones Z, 79-82
Promedio ponderado, 316-17
Proporciones, 159
Prueba chi-cuadrado de bondadde ajuste, 467-76
definicin de, 466-67
ejemplo de, 467
pasos a seguirpara realizar, 467-68
segn se describe en publicaciones cientficas, 487
Prueba chi-cuadrado de independencia, 472-82
clculo, 476
definicin de, 473
determinacin de frecuencias esperadas, 474-76
ejemplo de, 477-82
grados de libertady, 476-77
muestra, 474,485-87
pasos a seguir para realizar, 487-88
poblacin, 474
potencia de, 485-86
pruebade hiptesis y, 477-82
segn se describe en publicaciones cientficas,
487-88
tamao del efecto de, 482-86
utilizacin, 474
Prueba chi-cuadrado, 462-72
controversias, 486-87
ejemplo de, 467-71
inventor de, 464
limitaciones, 486-87
segn se describe en publicaciones cientficas
suposiciones de, 482
Pruebade Dunn, 393-94
Pruebade hiptesis, 177-98
alfa y, 239
anlisis de varianza de dos criterios y, 436-437
anlisis de varianza y, 361-363
anlisis factorial de varianza y, 430-434
beta y, 239
comparacin de mtodos, 516-19
con medias mustrales, 200-229
controversias, 194-95,224-25,266-67
definicin de, 177
distribucin de medias en, 212-219
ejemplo de, 178-79,185-88,214-219
estimacin versus, 225
intervalos de confianza y, 223-24
limitaciones, 194-95,224-25,266-67
lgica de, 179
modelo estructural y, 386-91
poblaciones anormales y, 496-521
potencia estadstica y, 239
proceso, 167,179-88, 284
pruebach-cuadrado de independencia y, 477-82
prueba chi-cuadrado de la bondadde ajuste y,
467-68
prueba para medias dependientes y, 290-96
prueba paramedias independientes y, 319-326
pruebas de dos colas, 189-193,255

pruebas de rango y orden, 506-15


pruebas de una cola, 188-89,189-90,255
pruebas libres de distribucin, 506
pruebas no paramtricas, 506
pruebas paramtricas, 506
resumen de pasos, 185
segn aparecenen publicaciones cientficas, 195-96,
225-28
supuestos estndar de, 495-96
varianza poblaciona desconocida y, 284
Prueba de rango mltiple de Duncan, 399,400
Prueba de signos, 508n
Prueba de suma de rangos de Wilcoxon, 509
Prueba exacta de Fisher, 486n
Prueba F . V a s e anlisis de varianza
Prueba t de pares, 289n
Prueba t de una muestra, 277-87
Prueba paramedias dependientes, 287-96
controversias, 303
ejemplos de, 290-96
frmulas de clculopara, 310
limitaciones, 303
pasos a seguir pararealizar, 290-75
planificacin del tamao de muestrapara, 301
poblaciones extremadamente asimtricas y, 296
potencia de estudios que emplean, 301,02
potencia de, 299-300
segn se describe en las publicaciones cientficas,
303-06
tamao del, 296-299
Prueba t para medias independientes, 313-337
clculodelavarianzade ladistribucinde medas, 317
controversias, 333-34
distribucin de diferencias entre medias, 313-318
ejemplos de, 318-325
estimacin de la varianza poblaciona, 315-17
estrategia bsica de, 313-18
frmulas de clculo para, 341-42
limitaciones, 333-34
lgica de, 314-319
pasos a seguir para realizar, 325-28
potencia de, 331-33
prueba de hiptesis con, 319-326
segnse describeenpublicaciones cientficas, 334-37
supuestos de, 326-7
tamao del efecto de, 328,331
tamaomaestral, 333
Prueba t parapares equiparados, 289n
Prueba r, 81,393
como caso especial de coeficiente de correlacin,
536-541
como caso especial del anlisis de varianza, 531-36
controversias, 302-03
de pares, 289n
ejemplos de, 277
limitaciones, 302-03
Paralelismos de ia lgica del anlisis de varianza
con, 532-33

pasos a seguir para realizar, 286-87


principio bsico de, 277-80
relacin del anlisis de varianza con, 532
robustezde, 296
segnse describe enpublicaciones cientficas, 303-06
supuestos de, 296
una solamuestra, 277-87
Prueba Ude Mann-Whitney, 509,520
Pruebas de aleatorizacin, 515-16
aproximada, 516
ejemplo de, 512-16
Pruebas de aleatorizacin, 516
Pruebas de dos colas
cundo utilizar, 190
ejemplo de, 190-193
direccionales, 190n
hiptesis no direccional y, 189
puntos de corte, 189
pruebas de unacola versus, 255
Pruebas de esfuerzo propio, 515, 516 ( b o o ts tm p te s t s )
Pruebas de rango y orden, 506-11
aproximaciones ala curva normal en, 510
definicin de, 506
ejemplo de, 509
hiptesis nulaen, 509-10
idea general de, 508
lgica de, 508-09
mtodos de pruebaintensivos por computadoray,
516-19
pruebas paramtricas correspondientes a, 508
segn se describen en publicaciones cientficas, 520
transformaciones de datos y, 516-19
ventajas de, 517n
Pruebas de significacin. V a s e prueba de hiptesis
Pruebas de una cola
cundo utilizar, 190
hiptesis direccional y, 188-89
pruebas de dos colas versus, 255
Pruebas libres de distribucin, 506
Pruebas no paramtricas, 506
Pruebas paramtricas, 506
controversias, 519
datos transformados en rangos en, 510
pruebas de rango y orden correspondientes a, 508
riesgo de error en, 517-19
transformaciones de datos y, 510
Psicoanlisis freudiano, 59
Psicologa clnica, 59
P s ic o lo g a h u m a n s tic a , 59
P s ic lo g o A m e r ic a n o , 2 5 5

Publicaciones cientficas
anlisis de varianza segn se describe en, 369-70
prediccin bivariadasegn se describe en, 136
procedimientos estadsticos avanzados segn se
describen en, 559-83
prueba ch-cuadrado segn se describe en, 487-88
Punto muestral de corte, 181-83
Puntuacin i, 284,318-19,532-534

Puntuaciones estndar, 57.


V a s e tambin puntuaciones Z
Puntuaciones ordinarias, 53.
V a s e tambin puntuaciones Z
convertiren puntuaciones Z, 55
regresin mltiple con, 127
tabla de reas bajo la curva normai y, 153-56
Puntuaciones Z, 51-57,79,111. V a se tambin
puntuaciones originales, puntuaciones estndar,
clculo a partir de una puntuacin original, 55-56
caractersticas de, 57
conversin a puntuacin original, 55
definicin de, 52-53
desvo estndar de una distribucin de, 57
ejemplos de, 53
en distribuciones de medias, 212-13
media de una distribucin de, 57
modelo de prediccin bivariadacon,. 111-12
modelo de prediccin, 125-26
producto cruzado de, 79-82
prueba Z, 225
tabia de reas bajo la curva normal y, 152-56
utilizados como escala, 53
Q

Q, 520 [Qs o r t]
R

Rango, 43q, 94
Razn F , 351,352,532-34
V a s e tambin estimacin intergrupal de varianza;
estimacin intragrupal de varianza
anlisis de varianza de dos criterios y, 420
del efecto interactivo, 421,422
determinacinde, 421,424
de los efectos principales, 421
frmulas del, 358
Reber, P. J 195
Reduccin proporcional del error. V a s e porcentaje de
varianza explicada
Reflejar, 502
Registros de rango y orden, 506
Registros, 4-5
Regla de la adicin, 173-74
Rega de la multiplicacin, 174
Regresin! correlacin mltiples, 125-26,128
coeficientes beta de, 126-127
controversias, 135-36
correlaciones y, 126-27
definiciones de, 125
ejemplo de, 128-29, 133-135
frmulas de, 130,133
jerrquica, 561-563,564
limitaciones, 135-36

modelo lineal general y, 53!


reduccin proporcional del erroren, 128
Regresin/ correlacin mltiples (cont.)
con puntuaciones ordinarias, 127
modelos de prediccin con puntuaciones Z para,
125-26
por pasos, 563-64
revisinde, 528-530, 560
segn se describen enpublicaciones cientficas, 137
Regresin bivariada. Vase prediccin bivariada
Regresin mltiplejerrquica
comparadacon laregresin mltiple gradual, 564
ejemplo de, 561-64
Regresin mltiple porpasos, 563-64
de avance, 563n
de retroceso, 563n
en comparacincon la regresin mltiplejerrquica,
564
Regresin, 82,112,496n. Vase tambin prediccin
bivariada; correlacin
Res, Harry, 52
Relacin, 536-37,575
Restriccin del rango, 94
Resultado independiente, 174
Resultado mutuamente excluyeme, 173-74
Resultado, 157
independiente, 174
mutuamenteexcluyeme, 173-74
Revista Cientficade PsicologaPatolgicay Social, 254

Revista Cientfica de Psicologa Social y de la


Personalidad, 52
Rhodes, S. R., 75
Riehl, R. J., 478,482, 483
Ritter, C., 102
Robustez, 296
Rogets, L. E,, 340
Rollack, D . R, 14
Rosenthal, R., 98,397,579
Rosnow, R. L, 98,397
Ross, D. C., 369
Rozeii, E. J,, 134
Ryan, R. H 195-96

s
Sanbonmatsu, D. M., 28
SantoToms deAquiso, 552
Sedlmeier, R, 254
Seleccin aleatoria, 60
Seleccincasual, 162
Seleccin sistemtica, 368-69
Sellis, R. M., 567,568
Sesgo de respuesta, 605
Sesgo del experimentador, 603
Shah, F. P., 137
Shamsuddin, K., 335
Shapiro, D. A., 269,591

Shapiro, D 269
Sharp, Maa, 463
Shaver, Philip, 345,349, 352-53, 399, 541
Shear,264
Shi, L., 491
Shreider.Yu. A,,331
Siege, M., 200
Sigma, 37,46,162
Significacin estadstica, 91,261-62,266-67
niveles convencionales de, 183
Significacin prctica, 261:62
Significacin.Vase significacin prctica; significacin
estadstica
Smbolos estadsticos, 37,46,111,162,165,280
Simpson, O. J., 143
Simpson, Thomas, 149
Sknner, B. R, 58,601
Snedecor, George, 353
Sociologa, 170
Sondeos de opinin, 164
Sondeos, 164
Speed,A.,31,105
Stasney, R., 28
Steil, Janice, 479,485,487
Stipek, D. J., 195-96
Sumade desvos cuadrticos, 43,-378-79
estimaciones de la varianza poblacional y, 379
frmulas de clculopara, 405
Sumade errores cuadrticos 121
Supresin, 135n
Supuestos, 296
T

t de Student. Vaseprueba t
Tabachnick, Brbara, 548
Tabla chi-cuadrado, 466
Tabla de nmeros aleatorios, 518
Tabla F, 352-53,359-60
Tablar, 282-84
Tablas de contingencia, 473
Tablas de frecuencias agrupadas, 7-1V
cmo crear, 9-10
definicin de, 8
ejemplo de, 10-11
Tablas de frecuencias, 2-11
agrupadas, 8-11
controversias, 24-25
definicin de, 2
ejemplode, 6
limitaciones, 24-25
procedimientos paracrear, 6-7
segn se describen en publicaciones cientficas,
28-30
tamaos de intervalos iguales en, 9,25-26
tipos de, 4

Tamao del efecto, 244-251


anlisis de varianza y, 364-66
anlisis factorial de varianza y, 436-42
clculo, 245-48
controversias, 266-68
de la prueba para medias dependientes, 296-97
de la prueba t para medias independientes, 328, 329
definicin de, 245
importancia de, 248
intervalos de confianza y, 263,244
limitaciones,266-68
modelo estructural y, 395-96
potencia y, 244-51,263,266
prueba chi-cuadrado de independencia, 482-85
regas de Cohn para, 249-250
segn se describen en publicaciones cientficas,
268-69
Tamao muesfral, 213,252-53
clculo del nivel de potencia, 253,255
planificacin de, 301,333,367-68,442-43
Tamizado de datos, 498n
Tankard, James, 533
Tendencia casi significativa, 195
Tendencia central, 35,40-43. V ase tambin media,
mediana, moda
forma de, 466
puntos de corte para, 466,615
Teorema de Bayes, 168
Teorema del lmite central, 150,206
Teora de la probabilidad, 159
Tericos de entes, 227-28
Terpstra, D, B., 134
Terranova, R. D., 28
Tippett, L. H. C,, 518
Tobas, Sheila, 13,27
Transformacin de datos (cont.)
lo s, 502
ogif, 503
probit, 503
pruebas de rango y orden y, 516-519
pruebas paramtricas y, 510
raz cuadrada, 498,500
rango y orden, 505
segn se describen en publicaciones cientficas,
519-520
Transformacin de rango y orden
definicin de, 506
utilizacin de pruebas paramtricas con, 510
Transformacin raz cuadrada, 498, 500
Transformacin, V ase transformacin de datos
Transformaciones cbicas, 502
Transformaciones de datos, 497-505
controversias, 519
cbica, 502
definicin de, 497
ejemplo de, 502-505
inversa, 502
legitimidad de, 498,500

mtodos de prueba intensivos por computadora j ,


516-519
tipos de, 498, 500-502
ventajas de, 498
Transformaciones inversas, 502 ;
Transformaciones lo g , 502
Transformaciones lo g it, 502
Transformaciones p ro b it, 502
Tringulo aritmtico, 149
Truman, Harry, 164
Tufte, E. R.,24

u
Unidad causativa, 463
Utilizacin de clculos estadsticos multvariados, 548

y
Valenzuela, 322,324,328,334,342
Validez concurrente, 605
Validez de constracto, 605-606
Validez de contenido, 605
Validez de criterio, 605
Validez extema, 603
Validez intema, 603
Validez predictiva, 605
Validez. V ase tambin conftabilidad
concurrente, 605
criterio, 605
de constructo, 605-06
de contenido, 605
predictiva, 605
sesgo de respuesta, 605
Valor crtico, 181
Valor estadstico chi-cuadrado, 462,465-72
clculo de, 466
controversias, 486-87
definicin de, 466
distribucin de, 466-67
limitaciones, 486-87
Valores atpicos, 496
Valores diferenciales
desvo estndar de, 301
media poblaconal de, 289-90
potencia de estudios que utilizan, 302
Valores, 3-5
Van Aken, M, A. G., 339
Van Lange, P, M., 402
Variable categrica, 462
Variable de criterio, 71,110
Variable dependiente, 70-71,110,596
Variable nominal, 5,462
Variables cuantitativas, 4
Variables de prediccin, 71,109
Variables de rango y orden, 5

Variables independientes, 70-7!, 109,596


Variables intervaares, 4
Variables latentes, 571-72
Variables numricas, 5,6
Variables ordinales, 5
Variables, 4-6
categricas, 462
cuantitativa, 3
de criterio, 71,111
de prediccin, 71,109
de rango y orden, 5
dependiente, 70-71,111,596
diferencias grupaies entre, 536
independiente, 70-71, i 09,596
intervalares, 5
latente, 571-73
nominal, 5,462
numrica, 5, 6
ordinal, 5
Varianza de Ja distribucin de diferencias de medias,
317-18
Varianza de una distribucin de medias, 207-08,356-57
Varianza del error, 355
Varianza poblaclonal, 275-76. V ase tambin varianza
comparacin de estimaciones intragrupales e
intergrupales de, 350-51
desvo estndar de la distribucin de medias de,
280-81
estimacin combinada de, 291-93,321
estimacin de, 277-80,315-17,346-50,355-57,
379-80
estimacin intergrupal de, 349-51
estimacin intragrupal de, 347,350-51
estimacin no sesgada de, 280
estimacin sesgada de, 279
forma de la distribucin comparativa, 281-82
Varianza, 43-45. V ase tambin anlisis de varianza;
varianza poblacional; desvo, estndar
como suma de desvos cuadrticos, 51-52
definicin de, 43

ejemplos de, 47-50


frmulas de clculo de, 50-51, 65-66
frmulas de, 46-47
pasos a seguir para e clculo de, 43-44
utilizacin de, 44-45
Vaughn, L. A., 434
Versin Revisada de la Escala
de Angustia Manifiesta en Nios (romas), 585
Visin crtica, 60
Visin postestructural, 60
Von Franz, Marie Louise, 60

W
Watts, W., 129
Wechsler, H 30-31
Weller, A., 303-04
Weller, L , 303-04
Windelband, Wilhelm, 58
Wiseman, H., 225
Wong, M. M 428,440
Wortman, C. B., 582
Wright, L 129
Wrightsmaa, L. S., 36 In
Wundt, Wilhelm, 58

X
X-barra, 37

Y
Yates, Frank, 518
Yerkes-Dodson law, 414

Argentina
Av. Regimiento de ios Patricios 1959
{C1266AAF) Buenos Aires
Argentina
Tel, (54-11} 4309-6100
Fax (54-11) 4309-6199
E-mail: mfo@pearsoned.com.ar
Amrica Central-Panam
Barrio La Guara, Moravia
75 metros norte,
Del Portn Norte del Club La Guara
San Jos, Costa Rica
Tel. (506) 235 72 76
Fax (506) 29728 52
E-mail: envwong@racsa.co.cr
Brasil
Ra Emilio Goeldi 747, Lapa
(05065-110) Sao Paulo -SP
Brasil
Tel. (5511) 36111-0201
Fax (5511)36111-0654
Caribe
Monte Mal!, 2do. piso, suite 21 -B
Av. Muoz Rivera
Hato Rey
Puerto Rico 00918-4261
TeL (787) 751-4830
Fax (787) 751-1677
E-mal: awicarib@caribe.net
yawlcarib@caribe.net
Chile
Av Manuel M onttl452
Providencia
Santiago, Chite
Tei. (562) 269 2089
Fax (562) 2746158
E-mail: nfopear@pearsoned.c!

Colombia
Carrera 68 22-55
Santa F de Bogot, D.C.
Colombia
Tel. (571) 405-9300
Fax (571) 405-9330
Espaa
Nuez de Baiboa120
(28006) Madrid
Espaa
Tel. (3491)590-3432
Fax (3491) 590-3448
Estados Unidos
One Lake Street
Upper Saddle River
NJ 07458
Tel. (201) 236-7000
Fax: (201) 238-3400
Mxico
Calle Cuatro No. 25 2do piso
Fracc. Industrial Alce Blanco
(53370), Naucalpan de Jurez
Estado de Mxico
Tei. (305) 3870700
Fax(525)3870811
Uruguay
Casa juana de Amrica
Av. 8 de Octubre 3061
(11600) Montevideo
Uruguay
Tel./Fax (5982) 486-1617

You might also like