Professional Documents
Culture Documents
Elaine N . A ron
ESTADISTICA
PARA PSICOLOGA
arson
Educacin
519.5.
ARO .
ISBN: 987-9460-66-9
: I. Aron, Elaine II. Ttulo - 1. Estadsticas '
ISBN: 987-9460-66-9
Primera Edicin: Diciembre 2001
Queda hecho el depsito que dispone la ley 11.723
Este libro no puede ser reproducido total ni parcialmente en ninguna forma, ni por ningn medio o procedimiento, sea reprogrfico, fotocopia, microfilmacin, mimeogrko o cualquier orco sistema mecnico, {bioqumico, electrnico, informtico,
magntico, electroptico, etctera. Cualquier reproduccin sin el permiso previo por escrito de la editorial viola derechos reser
vados, es ilegal y constituye un delito.
2
2
3
6
.8
13
17
-20
24
26
28
31
32
32
34
35
40
43
51
52
C orrelacin
58
61
63
63
63
65
68
70
71
82
91
91
73
79
85
P rediccin
108
109
110
112
114
117
122
126
132
135
136
138
139
139
146
147
149
Probabilidad........................................................................................................................
156
159
Muestra y poblacin...........................................................................................................
160
164
165
166
170
170
171
172
173
176
178
179
y j^
jgg
394
195
196
198
198
202
La distribucin de medias...................................................................................................
Creacin de una distribucin de m edias.............................................................................
Caractersticas de una distribucin de medias ..................................................................
Prueba de hiptesis con una distribucin de medias..........................................................
203
204
206
212
213
219
. 224
225
228
229
229
232
Qu es la potencia estadstica?................................................................
Alfa, beta y potencia ..........................................................................................................
Clculo de la potencia estadstica............................................................
Tablas de potencia ..............................................................................................................
Qu factores determinan la potencia de un estudio?.........................................................
Tamao de efecto ......................................................................................................... -......
Tamao de la m uestra.............................................................................*...................... .
234
236
239
242
243
244
252
..............................
254
256
256
261
263
263
264
266
268
270
271
271
P rueba
274
276
277
287
296
298
302
Controversias y limitaciones................................................................................................
La prueba t segn se describe en publicaciones cientficas ..............................................
Resumen.......... :...................................................................................................................
Trminos clave.............................................................................................
Ejercicios ............................................
Apndice del captulo: frmulas de clculo optativas
para la prueba t para medias dependientes.................................................................
10
P ru eb a
303
303
306
306
306
310
312
313
319
326
328
330
333
334
337
338
338
341
344
346
352
354
361
363
364
12
368
369
370
371
371
376
378
383
384
385
391
391
395
395
397
398
400
401
401
405
406
407
420
422
14 P ru eb as ch i-cu ad rad o
436
442
444
447
448
449
449
455
457
460
462
463
472
482
482
486
487
488
489
489
494
495
497
505
510
516
518
519
519
521
522
522
526
527
528
530
531
531
531
533
536
541
547
548
550
551
Resumen............................................................................. .................................................
Trminos clave....................................................................................................................
Ejercicios ............................................................:........................................................... .
552
554
554
560
561
564
566
568
570
575
580
582
583
584
584
595
576
578
579
596
597
601
603
604
607
Apndice B: ta b la s............................................................................................................
09
Tabla B-l
reas de la curva normal: porcentaje de la curva normal entre la media
y las puntuaciones Z indicadas .................................................................................
Tabla B-2; puntos de corte para la distribucin t .............................................................
Tabla B-3: puntos de corte para la distribucin F .............................................................
Tabla B-4: puntos de corte para la distribucin chi-cuadrados.........................................
609
612
613
615
615
617
667
679
Referencias bibliogrficas.............................................................................................
681
ndice analtico
691
........................................................... ..............................................
xv
comentarios realizados en la primera sobre la historia de ios textos de esta especialidad y sobre
aquellas cosas que hemos cambiado.
ejercicios utilizando esta frmula, el significado de la misma se fija en la mente del alumno. Por
el contrario, la versin de clculo habitual de la mencionada frmula slo oscurece el significado:
varianza - [ZX2- (ZX)2/N\/N. Lo nico que se logra al resolver ejercicios utilizando esta segun
da frmula es ensear al alumno la diferencia entre ZA2 y (Z/ 0 2!
Ensear frmulas de clculo en la actualidad es un anacronismo. Hoy en da, los investigado
res realizan sus estadsticas con computadoras. Al mismo tiempo, el empleo de software estadsti
co hace que la comprensin de los principios bsicos, tal como se expresan simblicamente en las
frmulas de definicin, sean ms importantes que nunca.
El motivo por el cual los libros de estadstica no han modificado sus mtodos, con el adveni
miento del software estadstico, es un misterio para nosotros, pero estamos convencidos de que el
cambio ya debera haberse realizado. Por supuesto, dado que las frmulas de clculo son intere
santes desde el punto de vista histrico y, ocasionalmente necesarias, y porque adems algunos
profesores pueden sentirse desprotegidos sin ellas, aun as las proporcionamos (con un ejemplo
resuelto) en un breve apndice de cada captulo en el que normalmente se presentara una frmu
la de clculo.
2. Cada procedimiento es explicado tanto numrica como verbamente y, en general,
tambin en forma visual, describiendo los mismos ejemplos en cada una de las formas men
cionadas. Los ejercicios prcticos y los tems de los paquetes de pruebas requieren, a su vez, que
los alumnos calculen resultados, creen grficos o ilustraciones, y redacten, adems, una breve ex
plicacin del significado de las estadsticas en lenguaje lego. El material de cada captulo, que in
cluye al menos dos ejemplos resueltos de las diversas formas mencionadas, prepara a los alumnos
para los ejercicios y las preguntas de las pruebas.
La experiencia nos demuestra que las diferentes formas mencionadas para expresar una idea
son de suma importancia para establecer un concepto de modo inalterable en la mente del alum
no. Muchos estudiantes de psicologa tienen mayor facilidad para manejarse con las palabras que
con los nmeros. En realidad, algunos tienen miedo de todo lo relacionado con la matemtica. Ai
redactar las explicaciones en lenguaje lego tienen la oportunidad de hacer lo que mejor hacen y, si
tienen dificultades, se ven forzados a enfrentarlas y a plantear los procedimientos en la forma ver
bal que mejor manejan.
3. Hacemos hincapi en el hecho de que la estadstica es un campo de investigacin vivo
y en crecimiento. Dedicamos el tiempo necesario para describir las controversias y los desarro
llos recientes en trminos sencillos. El objetivo es que los alumnos tomen conciencia de que los
mtodos estadsticos son esfuerzos humanos destinados a dar sentido a grandes cantidades de da
tos; que las estadsticas no surgen por naturaleza, no son infalibles, ni son una descripcin per
fecta de los hechos que intentan describir, sino que constituyen un lenguaje en constante
perfeccionamiento a travs del pensamiento esmerado de aquellos que lo utilizan. Esperamos que
esta orientacin ayude al alumno a mantener una actitud inquisitiva y alerta como tai, como tam
bin a estar a la altura de los nuevos desarrollos estadsticos como profesional.
4. El objetivo principal de todo curso introductorio de estadstica aplicada a la psicologa es
p reparar a los alumnos para la lectura de publicaciones cientficas. En realidad, el modo en
que una publicacin cientfica describe un procedimiento como la prueba t o el anlisis de varian
za con frecuencia es muy diferente de lo que el alumno espera encontrar, teniendo en cuenta las
exposiciones que normalmente aparecen en los textos. Es por eso que este libro, a la vez que ense
a un mtodo estadstico, brinda ejemplos sobre el modo en que dicho mtodo es presentado en
las revistas cientficas (extractos de publicaciones de actualidad). Los ejercicios prcticos y los
tems de los paquetes de pruebas tambin incluyen extractos de publicaciones para que los alum
nos expliquen.
5. El libro est extraordinariamente actualizado. Por alguna razn, en la mayora de los tex
tos de introduccin a la estadstica que hemos visto, parecera que los autores estuvieran escri
biendo en la dcada de 1950. Los principios bsicos siguen siendo tos mismos, pero las sutilezas
con las que los estadsticos e investigadores analizan esos principios bsicos han cambiado radi
calmente, En la actualidad, los principios bsicos estn apuntalados por una apreciacin diferen
te de temas, tales como la magnitud de efecto, la potencia y la acumulacin de resultados por
meta-anlisis; la incin primordial que desempean los diversos diseos; la coherencia implci
ta en las estadsticas por diferencia y por asociacin, y la creciente prominencia de la regresin y
los mtodos relacionados con ella, al igual que un sinnmero de nuevas orientaciones que surgen
del papel preponderante de la computadora en el anlisis. Estamos profundamente comprometidos
con los ltimos desarrollos con respecto a la teora y aplicacin de la estadstica, y confiamos en
que e libro refleja dicho compromiso. Por ejemplo, dedicamos todo un captulo al tamao de efec
to y la potencia y, al discutir el manejo de situaciones en las que los supuestos no se cumplen, cu
brimos el tema de las transformaciones de datos (se traa de un mtodo ampliamente utilizado y de
fcil comprensin para alumnos de nivel introductorio, pero que, sin embargo, la mayora de los
textos actuales de introduccin a la materia rara vez menciona). Por supuesto, las secciones que
tratan sobre controversias y desarrollos recientes son fundamentales para hacer de este libro un
texto actualizado con respecto a la utilizacin efectiva de la estadstica en la investigacin actual.
6. El captulo 16 es nico en cuanto integra las tcnicas ms importantes que han sido en
seadas, explicando que la prueba t es un caso especial del anlisis de varianza y que tanto la
prueba t como el anlisis de varianza son casos especiales de correlacin y regresin. (Resumien
do, presentamos el modelo lineal general). En el pasado, s este tema se trataba siquiera, slo ocu
rra en textos avanzados. Sin embargo, muchos alumnos lo consideran valioso para asimilar y
retener lo que han aprendido, as como tambin para sentir que han profundizado en los funda
mentos de los mtodos estadsticos.
7. El ltimo captulo analiza los procedimientos avanzados sin tratarlos en detalle. Expli
ca en trminos simples cmo interpretar esas estadsticas cuando aparecen en publicaciones cien
tficas. La mayora de las publicaciones cientficas de psicologa utilizan mtodos tales como el
anlisis de covarianza, el anlisis de covarianza multivariado, ia regresin jerrquica mltiple, l
anlisis factorial y ei modelo de ecuacin estructural Los alumnos que terminan un curso estn
dar de introduccin a la estadstica no cuentan con los elementos necesarios para comprender la
mayora de las publicaciones que deben leer para preparar sus trabajos o estudiar para determina
do curso. El captulo mencionado utiliza los principios bsicos que ios alumnos acaban de apren
der (adems de extractos extensivos de publicaciones cientficas actuales) para lograr una
interpretacin rudimentaria de los procedimientos avanzados. A la vez, el captulo sirve como
gua que los alumnos pueden guardar y utilizar en el futuro al leer el tipo de publicaciones men
cionadas.
8. El libro ha sido escrito con ia intencin de apelar a las motivaciones que llevan a un
alumno a especializarse en psicologa. Adems de intentar representar la diversidad de la psico
loga, nuestros ejemplos destacan aquellos temas y poblaciones de mayor inters para los alum
nos. El primer ejemplo fue extrado de un estudio real en el que 151 alumnos evalan el nivel de
estrs que sienten durante la primera semana de clases de un curso de introduccin a la estadsti
ca. Otros ejemplos hacen hincapi en la psicologa clnica, empresarial y educativa, y a la vez se
incluyen suficientes e interesantes ejemplos de las reas experimentales, sociales, de desarrollo y
otras, que estimulan a los alumnos con el valor de dichas reas. Adems, en nuestros ejemplos
destacamos continuamente la utilidad de los mtodos estadsticos como herramientas para el pro
ceso de investigacin, evitando siempre que ios alumnos sientan que lo que estn aprendiendo es
teora por la teora misma. El apndice A brinda una visin general de mtodos de investigacin,
mostrando el contexto en el cual funciona la estadstica, Y a medida que se ensea cada tcnica se
ilustra y recalca su funcin dentro del proceso de investigacin.
9. La Gua de estudio y libro de tareas de computacin para el alumno, que acompaa esta
obra, se concentra en el dominio de los conceptos, e incluye tambin instrucciones y ejemplos pa
ra resolver los ejercicios utilizando una computadora. La mayora de las guas de estudio se con
centran en la ubicacin de nmeros dentro de las frmulas y en la memorizacin de reglas
(coherentemente con el estilo de los textos que acompaan). Nuestra Gua de estudio y libro de
tareas de computacin establece, para cada captulo, objetivos de aprendizaje, un resumen deta
llado del captulo, las frmulas tratadas en el captulo correspondiente (con la definicin de cada
smbolo) y resmenes de los pasos a seguir para la realizacin de cada proceso tratado en el cap
tulo, ms una serie de exmenes para amo-calificarse que incluyen ejercicios de multple-choice,
ejercicios para completar y preguntas para contestar en forma de ejercicio o de ensayo. Adems,
para cada procedimiento tratado en el captulo, la gua de estudio brinda pautas completas para la
redaccin de un ensayo, explicando el procedimiento a una persona que nunca ha asistido a un
curso sobre estadstica. Como una ayuda extra para el estudio, incluye tarjetas recortables de con
sulta rpida con todos los trminos clave.
Es especialmente importante el hecho de que nuestra Gua de estudio y libro de tareas de
computacin brinda la ayuda necesaria para ensear a los alumnos a realizar anlisis estadsticos
en una computadora. En primer lugar, hay un apndice especial que presenta ia terminologa y los
procedimientos del spss para Windows. Luego, en concordancia con los captulos del libro, existe
una seccin que explica en forma detallada cmo realizar con una computadora los procesos tra
tados en cada captulo. (Esta seccin incluye instrucciones paso a paso, ejemplos e ilustraciones
que muestran cmo se ve en la pantalla de la computadora cada ingreso y devolucin de informa
cin). La gua cuenta tambin con actividades especiales para utilizar la computadora, con el fin
de profundizar la comprensin de los temas. Hasta donde nuestro conocimiento nos ha permitido
investigar, no existe otro paquete de textos sobre estadstica que brinde tal flexibilidad o profundi
dad en el tratamiento de los diversos temas.
10. Hemos escrito tambin un Manual para el Instructor que realmente ayuda a dictar el
curso. El manual comienza con un captulo que resunte lo que hemos percibido por nuestra pro
pia experiencia en la enseanza y el material producido por la investigacin acerca de la efectivi
dad en la enseanza universitaria. El siguiente captulo trata sobre organizaciones alternativas
para el curso, que incluye posibles monogramas y un programa a modo de ejemplo. Luego, cada
captulo, en concordancia con los captulos del libro, brinda un resumen completo de la clase y
ejemplos resueltos que no se encuentran en ei libro (en un formato adecuado para realizar
transparencias o para distribuir a los alumnos). Este material es particularmente til, ya que crear
ejemplos resueltos es una de las mayores dificultades al preparar clases sobre estadstica.
11. Nuestro Banco de pruebas y Respuestas a los ejercicios de la serie 0 facilita la
preparacin de buenos exmenes. Para cada captulo proporcionamos aproximadamente 40
ejercicios de multple-choice, 25 ejercicios para completar y 10 12 preguntas para contestar en
forma de ejercicio o de ensayo. Teniendo en cuenta que el nfasis del curso est puesto en lo
conceptual, los ejercicios de mltiple-choice sern particularmente tiles para aquellos que no
estn preparados para calificar ensayos. Este suplemento tambin incluye las respuestas a la se
rie II de ejercicios de cada captulo del libro, las cuales no aparecen en el mismo, (El libro inclu
ye las respuestas a todos los ejercicios de la serie I y, ai menos, un ensayo a modo de ejemplo,
por cada captulo).
La revisin para la segunda edicin la realizamos en Manhattan. Esperamos que este hecho no ha
ya provocado la prdida de cualquier encanto que pudiera haber ganado la primera edicin por
haber sido realizada en Pars. Por otro lado, la presente edicin est impregnada por el espritu del
teatro y del ballet.
Ms an, la presente revisin est enriquecida por la experiencia obtenida ai ensear con la
anterior, y por la experiencia y aliento recibidos de infinidad de profesores que nos han escrito so
bre sus propias experiencias al utilizar el libro.
La revisin tambin ha sido moldeada por nuestra propia aplicacin de mtodos estadsticos:
los ltimos cinco aos han sido un perodo muy productivo para nosotros en nuestros propios pro
gramas de investigacin, en el campo de la psicologa social y de la personalidad. (Para tener una
visin general de nuestros propios programas de investigacin, remitirse a A. Aron & E. Aron,
1997; E. Aron & A. Aron, 1997). Tal vez haya sido especialmente til que, durante los ltimos
tres aos, uno de nosotros (AA) se haya desempeado como editor asociado del jpsp (Journal o f
Personality and Social Psychology, Revista Cientfica de Psicologa Social y de la Personalidad),
hecho que nos permite estar en contacto con el modo en que los mejores investigadores utilizan
las estadsticas (como tambin con la forma en que los crticos califican el uso que sus colegas ha
cen de las mismas).
La revisin ha sido afectada tambin, y en gran medida, por los desarrollos ocurridos durante
estos ltimos cinco aos en el campo de la estadstica y en su aplicacin a la psicologa. Lo ms
importante en este sentido ha sido la controversia sobre el valor de las pruebas de significacin y
las correspondientes propuestas de reemplazarlas por las estimaciones puntuales del tamao de
efecto y los intervalos de confianza. Los temas que estn surgiendo determinarn, sin duda, el
modo en que los psiclogos utilicen la estadstica en las prximas dcadas. En el corto plazo, a
influencia ha sido sorprendentemente escasa. Durante estos tres aos como editor del psp, AA ha
manejado aproximadamente 150 manuscritos y, sin embargo, slo uno ha mostrado evidencia de
la controversia actual. Editores de otras revistas cientficas nos informan que sus experiencias son
similares. Por lo tanto, consideramos que en el futuro cercano los alumnos continuarn necesitan
do estar bien familiarizados con la prueba de significacin tradicional para estar en condiciones
de leer publicaciones tanto nuevas como antiguas.
De todos modos, en esta revisin hemos intentado tener en cuenta los aparentes vientos.de
cambio. En especial, hemos mejorado nuestro tratamiento de los intervalos de confianza, as co
mo tambin hemos cubierto ms extensamente los temas involucrados en el debate actual sobre
prueba de hiptesis (vanse las secciones de controversia de los captulos 5,7 y 8). Tal vez lo ms
importante sean los cambios sutiles de terminologa en todo el texto, sobre la base de nuestros co
nocimientos de las cuestiones actuales. Nuestro objetivo es preparar alumnos para quienes este li
bro resulte til ante cualquier cambio que se avecine, pero, al mismo tiempo, aseguramos de que
conocen los principios bsicos tal como existen en la actualidad. Por eso, mientras todos estn de
acuerdo con que las pruebas de significacin han sido mal utilizadas con demasiada frecuencia,nosotros recalcamos precisamente aquellos aspectos que permiten aseguramos de que los alum
nos no repetirn los errores ms comunes.
Las revisiones que hemos realizado se pueden dividir en cuatro clases principales:
L Redaccin: hemos revisado cuidadosamente cada oracin, simplificando las construccio
nes y la terminologa siempre que fuera posible. Ya es bastante difcil aprender estadstica como
para tener que lidiar, adems, con oraciones complicadas.
2. Actualizacin de ejemplos: hemos reemplazado ms de 100 ejemplos de la primera edi
cin con otros nuevos publicados durante los ltimos dos aos. Esta revisin es particularmente
importante en las secciones acerca de cmo interpretar y evaluar las publicaciones cientficas.
La nica finalidad de esas secciones es que los alumnos observen cmo se presentan las estads
ticas cuando se informan en investigaciones de actualidad. Al revisar los viejos ejemplos y en
contrar otros nuevos, nos sorprendi la existencia de no pocos cambios sutiles en el modo en que
se informan los resultados estadsticos. Por ejemplo, hace cinco aos, los efectos interactivos en
el anlisis de varanza se informaban, por lo general, con grficos de lneas. En la actualidad,
generalmente se utilizan grficos de barras (vase el captulo 13).
3. Actualizacin del contenido y las controversias: hemos actualizado el contenido tenien
do en cuenta nuevos desarrollos en el campo relevantes para el curso de estadstica bsica. Inclu
ye el material mencionado anteriormente sobre la controversia en cuanto a la prueba de hiptesis,
al igual que varios otros cambios, tales como la influencia del escrito de DeCarlo de 1997 sobre
curtos is o el de Frick de 1995 sobre prueba de la hiptesis nula. Las revisiones de contenido tam
bin tuvieron en cuenta cambios de terminologa bsicos, como puede ser a utilizacin del trmi
no participantes en lugar de sujetos, conforme al estilo actual de la Asociacin Americana de
Psicologa.
4. Correcciones p a ra m ejorar la pedagoga y cum plir en m ejor medida con las nece
sidades de los profesores que utilizan el libro: hemos agregado nuevas secciones sobre pro
babilidad y anlisis de varianza de medidas repetidas (vanse apndices de los captulo 5 y
13), una seccin en el captulo 1 sobre niveles de medicin y una seccin substancial sobre in
tervalos de confianza. Hemos escrito, letra por letra, la mayora de los subndices, e incluso
nos hemos esforzado an ms que en la primera edicin para utilizar ejemplos multiculturales
siempre que fuera posible.
Algunos aspectos que no hemos cambiado. Los once puntos mencionados anteriormente en
esta misma introduccin continan siendo las caractersticas centrales y distintivas del libro.
Siempre que pudimos, evitamos tambin cambiar los ejemplos que incluan grandes tablas de cl
culos para minimizar las posibilidades de error.
MANTENGMONOS EN CONTACTO
Es nuestro objetivo colaborar en todo lo que sea posible para que tenga xito con su curso.
Si usted tuviera alguna duda o sugerencia, por favor escrbanos o envenos un e-mail
(aron@psychl.psy.sunysb.edu es la direccin de ambos). Si, Dios no lo permita, usted encon
trara un error en algn lugar del libro, prometemos que a) lo corregiremos en la siguiente edicin,
b) enviaremos los detalles a todos aquellos en la red y c) incluiremos su nombre en nuestros agra
decimientos en el prefacio de la prxima edicin.
AGRADECIMIENTOS
Ante todo, queremos agradecer a nuestros alumnos de todos estos aos por haber dado forma a
nuestro mtodo de enseanza, premindonos con su valoracin por las cosas que hemos hecho
bien al igual que con sus diversas formas de anular lo que no hemos hecho tan bien.
Por habernos impulsado a iniciar este proyecto, queremos agradecer a nuestro amigo Bryan
Strong, quien en primer lugar nos alent para que lo emprendiramos, y a Brete Harrison, quien
gui el proyecto durante su desarrollo inicial. Agradecemos tambin la colaboracin y apoyo de
nuestro amigo John Touhey, quien ley varios de los primeros borradores de captulos. Los revi
sores del libro en diversas etapas han sido sumamente tiles identificando falencias en la lgica y
la pedagoga, y sus elogios generosos nos dieron mpetu cuando, ocasionalmente, nos sentamos
perdidos en la inmensidad del proyecto. Queremos agradecer a Paul C. Amrbein, Universidad de
Nueva Mxico; James V. Couch, Universidad James Madison; Livia M. DAndrea, Universidad
de Nevada, Reno; Susan E, Dutch, Universidad Estatal de Westfield; Peter C. HUI, Universidad de
Grove City; J. Robert Newman, Universidad del Estado de California, Long Beach; Michael L.
Frank, Universidad Estatal de. Stockton; Martin A. Johnson, Universidad del Estado Occidental
de Missouri; Carel Pandey, Universidad L. A. Pierce; Roger Bakeman, Universidad del Estado de
Georgia; Jeffrey S. Berman, Universidad del Estado de Memphis; y Michael J. Scozzaro, Univer
sidad suny en Buffalo.
RECONOCIMIENTOS
CO-1, PhotoDisc, Inc.; CO-2, David Young-Wolff/PhotoEdit; C-3, Leonard Lee Ru, IH/Photo
Researchers; CO-4, Secretara de Turismo de Nueva Mxico; CO-5, H., Fouque/Photo Resear
chers, Inc.; CO-6, Leu Rue, Jr./Photo Researchers; CO-7, Grant Heilman Photography; CO-8,
PhotoDisc, Inc.; CO-9, U.S. Secretara de Agricultura; CO-10, Chip Henderson Photography;
CO-11, Tom Hollyman/Photo Researchers, Inc.; CO-12, Bill Bachman/Photo Researchers, Inc.;
CO-13, Okoniewski/The Image Works; CO-14, Barry L. Runk/Grant Heilman Photography;
CO-15, Michael Newman/PhotoEdit; CO-16, Matura/Gamma-Liaison, Inc.; CO-17, Simon
Fraser/Science Photo Library.
Los datos de las pginas 99,278,279,308,309,340,341,410,449,450 y 496 se basan en las ta
blas de Cohen, J. (1988), Anlisis del poder estadstico para las ciencias del comportamiento
[Statistical Power Analysis fo r the Behavioral Sciences] (2a Ed,). Copyright 1988 por Law
rence Erlbaum Associates, Inc. Reimpreso con autorizacin.
al alumno una base slida de los conocimientos estadsticos necesarios para realizar investigacio
nes. Ms an, dominando la lgica bsica y el razonamiento estadstico, el alumno estar extraor
dinariamente bien preparado para cursos avanzados que se concentran en la parte ms concreta
del anlisis de investigaciones cientficas.
Muchos programas de psicologa ofrecen tambin oportunidades de realizar investi
gaciones cientficas a alumnos no graduados. La idea principal de este libro es que el alumno
comprenda la estadstica, no que la utilce. Aun as, el alumno aprender lo necesario para
realizar los anlisis ms bsicos de informacin utilizados en el tipo de investigaciones que
probablemente realice.
3.
Comprender la estadstica desarrolla el pensamiento analtico y crtico dei alum
no, Los especialistas en psicologa con frecuencia estn interesados principalmente en las perso
nas y en mejorar el mundo real. Lo dicho anteriormente no significa que los especialistas en
psicologa eviten las ideas abstractas, de hecho, a los alumnos que conocemos los estimulan los
niveles de abstraccin prcticamente filosficos en los que muchas veces parecen esconderse los
secretos de las experiencias humanas. Sin embargo, incluso este tipo de ideas abstractas, por lo
general, al principio slo se captan superficialmente como frases hechas en lugar de conocimien
tos tiles. De todas las materias que el alumno posiblemente estudie en la carrera de psicologa, es
probable que sta sea la que ms lo ayude a aprender a pensar en forma precisa, a evaluar infor
macin y a aplicar el anlisis lgico a alto nivel.
Si ha logrado dominar la primera mitad del curso- no slo aprender la idea general sino cono
cerla realmente-, la segunda mitad resultar ms sencilla. Si no ha logrado dominar la primera
parte, la segunda resultar casi imposible.
5.
Aydense entre ustedes. No existe mejor forma de afianzar y profundizar los conocimien
tos de estadstica que intentar explicarlos a alguien a quien le resulta ms complicado aprender
los. (Por supuesto, esto debe hacerse con paciencia y respeto). Para aquellos a los que la materia
les resulta ms difcil, no existe mejor forma de resolver las dificultades que aprender de otro
alumno que acaba de comprender a fondo esos temas.
Por eso, recomendamos firmemente que se formen grupos de estudio de dos a cuatro
alumnos. Lo ideal sera que los grupos incluyan alumnos que esperan entender e! material fcil
mente y otros que no. Aquellos que comprendan la estadstica con facilidad se beneficiarn ayu
dando a otros a los que les cueste ms; stos ltimos pondrn a prueba enormemente los
supuestos conocimientos de los primeros. Aquellos que crean que tendrn inconvenientes, necesi
tan trabajar con los que no los tienen; que un ciego gue a otro ciego no es una buena forma de
aprender. Tambin es conveniente escoger compaeros de estudio que vivan cerca para que sea
fcil reunirse, y tambin hacerlo frecuentemente, si es posible una vez entre clase y clase.
COMENTARIO FINAL
Aunque cueste creerlo, nos encanta ensear estadstica. Una y otra vez hemos vivido la mara
villosa experiencia de que se nos acerquen alumnos rebosantes de alegra a decimos: Profe
sor Aron, saqu un 90 en este examen, no lo puedo creer! Yo, un 90 en un examen de
estadstica! O el alumno que nos confiesa: Realmente es entretenido. No se lo diga a nadie,
pero en verdad me divierte la estadstica, nada menos! Esperamos que a usted le ocurra algo
parecido en este curso.
Arthur Aron
Eiaine N. Aron
>.
meras hiptesis: Qu harn los mamuts la prxima primavera?; qu suceder si como esta raz?
Es fcil ver cmo han sobrevivido aquellos que han acertado, y el propio lector es uno de ellos. La
estadstica es una forma de bsqueda de precisin y verdad.
Los psiclogos utilizan mtodos estadsticos para dar sentido a los nmeros que renen al in
vestigar. El problema de cmo disear una investigacin adecuada es todo un tema en s mismo,
el cual resumiremos en el apndice A. No obstante, en este libro nos limitamos a tratar los mto
dos estadsticos que dan sentido a los datos recolectados durante una investigacin.
TABLAS DE FRECUENCIAS
Comencemos con un ejemplo. Durante la primera semana del curso, Aron, Pars y Aron (1995),
como parte de un estudio ms amplio, repartieron un cuestionario a 151 alumnos en una clase de
introduccin a la estadstica. Una de las preguntas era la siguiente: Qu grado de estrs has ex---------------------------------- perimentado en las ltimas dos semanas y media, en una escala del
Tabla. 1-1,
_
Oal 10, enlaqueO indicaparanadaestresadof y lO tanestresado
eii* *cada valo^defa escala corao es posible? Las puntuaciones dadas por 151 estudiantes
de medicin de estrs.
fueron las siguientes.
P u n t u a c i n
F r e c u e n c ia
10
9
8
7
5
4
3
2
I
0
14
15
26
31
13
18
16
12
3
1
2
(1995).
4 . 7 . 7 . 7 , 8, 8, 7 , 8, 9 , 4, 7, 3, , 9, 10, 5, 7, 1 0 , 6, 8 , 7 , 8 , 7 , 8 , 7 , 4 , 5,
1 0 , 1 0 , 0 , 9, 8, 3, 7 , 9 , 7 , 9 , 5 , 8 , 5 , 0 , 4 , , 6, 7 , 5 , 3 , 2 , 8, 5 , 1 0 , 9 , 1 0 ,
6 , 4 , 8 , 8 , 8 , 4 , 8 , 7 , 3 , 8 , 8 , 8 , 8 , 7 , 9 , 7 , 5 , 6 , 3 , 4 , 8 , 7 , 5 , 7 , 3 , 3 , 6 , 5,
7 . 5 . 7 . 8 . 8 . 7 , 10, 5 , 4 , 3 , 7 , 6 , 3 , 9 , 7 , 8 , 5 , 7 , 9 , 9 , 3 , 1 , 8 , 6 , 6 , 4 , 8 , 5 ,
10, 4, 8, 1 0 , 5 , 5 , 4 , 9 , 4 , 7 , 7 , 7 , 6, , 4 , 4 , 4 , 9 , 7 , 1 0 , 4 , 7 , 5, 10, 7, 9,
2.7,
5,9,10, 3 , 7 , 2 , 5 , 9 , 8 , 1 0 , 1 0 , 6 , 8 , 3
ocurre cada puntuacin. Una tabla de frecuencias hace que el patrn numrico se comprenda
claramente y a simple vista. En este ejemplo, podemos ver que la mayora de los alumnos se atri
buyeron un nivel de estrs en alrededor de 7 u 8 puntos, y que muy pocos lo hicieron por debajo
de esos valores.
V C u a e tr d -i^ l.
;.
*.
A lo largo de todo el libro, y como sucede en la gran mayora de las situaciones reales
de investigacin psicolgica, trabajamos con variables numricas. Asimismo, trabajare
mos principalmente con variables intervalares (o variables que se consideran bastante
aproximadas a las mencionadas). En el captulo 14, veremos mtodos estadsticos que in
cluyen variables nominales, y en el captulo 15, mtodos relacionados con variables ordi
nales. No obstante, cabe destacar en este punte, que a menudo so hacen tablas de
frecuencias con variables nominales. En ese caso, la tabla muestra la frecuencia de cada
uno de los valores de la variable nominal. Por ejemplo, un psiclogo especializado en de
sarrollo, que analiza los estilos de disciplina utilizados por padres solteros, podra confec
cionar una tabla de frecuencias indicando la cantidad de padres que utilizan cada uno de
los siete estilos diferentes de disciplina. Sin embargo, en lneas generales, este libro se
concentra principalmente en tablas de frecuencias y en otros procedimientos con variables
numricas intervalares.
PUNTUACIONES
10
9
-'
,
6
75:7
4
3
FRECUENCIA
7,8,9, 4, 7, 3, 6, 9, TO', 5,
7, 10, 6, 8, 78, 7, 8, 7, 4, 5, ' 10,10.0,9,,
' 2
1
0
10, 4,7,5,10,7,9,2,7,5,9,10,3,7,2,
5,9,8,10,10,6,8,3,
3^ - z i .
; v(: l :
;:r;;4-;
Sigamos ahora los tres pasos indicados para la creacin de una tabla de frecuencias.
1. Preparar una lista de cada valor posible a lo largo del margen izquierdo de la pgina,, co
menzando con el mayor y finalizando con el menor. En este estudio en particular, la mayor canti
dad de interacciones podra ser cualquier numero. Sin embargo, el mayor nmero obtenido en ei
grupo analizado es 48, por lo tanto, podemos utilizarlo como el mayor valor posible. Y la menor
cantidad posible de interacciones es 0. Teniendo en cuenta lo anterior, el primer paso a seguir es
hacer una lista de esos valores. (Sera buena idea utilizar varias columnas para poder incluir todos
los registros en una sola pgina).
2. Revisar los registros uno por uno, haciendo una marca por cada uno junto al valor corres
pondiente en la lista. La figura 1-2 muestra el resultado de este paso.
3. Preparar una tabla prolija que indique cuntas veces ocurre cada uno de los valores de la
lista. La tabla 1-2 es la tabla de frecuencias definitiva.
T a b la d e fr e c u e n c i a s d e i n m e r o d e in t e r a c c io n e s s o c ia l e s m a n t e n id a s p o r 9 4 e s t u d ia n t e s u n iv e r s it a r io s
d u ra n te u n a se m a n a .
O b s e r v a c io n e s F r e c u e n c ia s
O b s e r v a c io n e s
F r e c u e n c ia s
O b s e r v a c io n e s
31
30
29
28
27
26
25
24
23
22
21
0
2
4
1
1
2
3
2
1
3
4
15
14
13
12
11
10
9
8
7
19
18
17
4
5
4
1
2
0
0
1
0
0
1
0
1
0
0
2
1
1
48
47
46
45
44
43
42
41
40
39
38
37
36
35
34
33
32'
20
6
5
4
3
2
1
0
F recue
1
3
2
1
4
6
3
6
2
2
3
4
5
1
." 2
0
34
15
3
T a b la d e f r e c u e n c i a s a g r u p a d a s d e l n m e r o d e i n t e r a c c i o n e s s o c i a l e s m a n t e n i d a s p o r 9 4 e s t u d i a n t e s
u n iv e r s ita r io s d u r a n te u n a s e m a n a .
In terv a lo s d e d a s e
F r e c u e n c ia
4 5 -4 9 ,9
4 0 -4 4 ,9
3 5 -3 9 ,9
3 0 -3 4 ,9
2 5 -2 9 ,9
2 0 -2 4 ,9
1 5 -1 9 ,9
1 0 -1 4 ,9
5 - 9,9
0 - 4,9
3
3
3
4
11
10
16
16
16
12
Con respecto al lmite superior de los intervalos, generalmente utilizamos el valor real ms
alto que pueda tener la variable, y que sea inmediatamente inferior al comienzo del siguiente in
tervalo. En otros casos, los investigadores pueden colocar como lmite superior de sus intervalos
un nmero decimal apenas menor al lmite inferior del siguiente intervalo. Es decir, si los nicos
valores posibles fueran nmeros enteros, los intervalos serian de 30 a 34,35 a 39, y as sucesiva
mente; aunque tambin podramos utilizar intervalos de 30 a 34,9; 35 a 39,9, y as sucesivamente.
(Si los nmeros a incluir fueran de dos decimales, deberamos utilizar intervalos de 30 a 34,99; 35
a 39,99, y as sucesivamente).
Al determinar los intervalos se debe tener en cuenta tanto la cantidad de intervalos (el princi
pio fundamental mencionado en primer lugar) como el tamao de los mismos (el segundo princi
pio fundamental). A veces es difcil cumplir con ambos principios, y entonces se deben hacer
concesiones. A menudo existe ms de un modo de preparar una tabla de frecuencias agrupadas
que cumpla con las reglas que mencionamos anteriormente (y algunas veces no es posible reali
zar una tabla de frecuencias agrupadas sin ajustar levemente alguna de dichas reglas.) En esos ca
sos, tendremos la oportunidad de utilizar la creatividad, recordando siempre que el objetivo es
realizar una tabla de frecuencias agrupadas que presente las observaciones de forma simple y di
recta.
A continuacin, describimos cuatro pasos a seguir para construir una tabla de frecuencias
agrupadas que cumpla con los principios que hemos estudiado:
1. Restar el valor menor al mayor para obtener la amplitud de la serie de valores. En la medi
cin de estrs, la amplitud es 10 valores (10 - 0 = 10). En el ejemplo sobre la cantidad de interac
ciones, la amplitud es 48 (48 - 0 = 48).
2. Dividir la amplitud por un tamao de intervalo razonable. (Siempre que sea posible, es
conveniente utilizar los tamaos 2,3 , 5,10, un mltiplo de 10). Probar distintos tamaos de in
tervalo hasta lograr, despus de redondear, una cantidad razonable de intervalos (en general, entre
5 y 15). En el ejemplo de medicin de estrs, al dividir la amplitud 10 por un tamao de intervalo
de 2, el resultado es 5, que es la menor cantidad aceptable de agrupaciones. En el ejemplo de la
cantidad de interacciones sociales, al dividir la amplitud de 48 por un tamao de intervalo de 5 y
luego redondear, el resultado es 10, que es una cantidad de intervalos adecuada.
3. Realizar una lista de los intervalos de mayor a menor, controlando que el lmite inferior de
cada intervalo sea mltiplo exacto del tamao del intervalo. En el caso de la medicin de estrs, el
primer intervalo es 10-11,9, el siguiente es 8-9,9, y as sucesivamente. Los lmites inferiores de
stos intervalos, 10 y 8, son mltiplos de 2 , es decir, el tamao de intervalo. (Si se utilizaran, por
ejemplo, intervalos de 9-10,9 y 7-8,9, los intervalos respetaran el tamao de 2 valores, pero los l
mites inferiores 9 y 7 no seran mltiplos de 2). En el caso de las interacciones sociales, cada in
tervalo comienza con un mltiplo de 5.
4. Proceder de igual modo que en el caso de una tabla de frecuencias no agrupadas comn: le
yendo una por una las observaciones, realizando una marca al iado de cada intervalo y as sucesi
vamente, para realizar luego una tabla prolija. (Si ya se ha realizado una tabla de frecuencias
comn con las observaciones, este paso resultar mucho ms simple: slo es necesario sumar las
frecuencias de los valores que forman cada intervalo).
Otro ejemplo de construccin de una tabla de frecuencias agrupadas
Las tablas de frecuencias agrupadas son especialmente tiles cuando los valores incluyen decima
les ya que, por lo general, cuando se trabaja con decimales, cada individuo presenta una observa
cin diferente. Analicemos el siguiente ejemplo ficticio, basado vagamente en el trabajo de Inhoff,
Lima y Carroll (1984). El objetivo de los estudios realizados consista en observar el efecto del
contexto en la velocidad de lectura de oraciones ambiguas. Las oraciones eran ambiguas, por lo
cual podan ser tomadas literal o metafricamente, como por ejemplo, las carteleras son verrugas
en el paisaje. En un captulo posterior analizaremos este estudio ms profundamente, pero por
ahora nos concentraremos en la parte de la investigacin que slo pretenda determinar el tiempo
de lectura de oraciones bsicas ambiguas (metafricas) dentro de un contexto no metafrico. El
tiempo de lectura se mide mediante un dispositivo electrnico que, a la vez que presenta el mate-:
nal de lectura, determina si los ojos se estn moviendo o estn fijos. A los efectos del ejemplo, su
pondremos que los participantes en la investigacin eran 100 alumnos secundarios y que cad uno
deba leer varias oraciones ambiguas. Ms abajo se detalla la lista (de observaciones ficticias) cn
el nmero promedio de segundos que demor cada participante en leer las oraciones ambiguas.
2 ,7 2 ; 2 ,8 4 ; 2 ,6 3 ; 2 ,5 1 ; 2 ,5 4 ; 2 ,9 8 ; 2 ,6 1 ; 2 ,9 3 ; 2 ,8 7 ; 2 ,7 6 ; 2 ,5 8 ; 2 ,6 6 ; 2 ,8 6 ; 2 ,8 6 ; 2 ,5 8 ; 2 ,6 0 ; 2 ,6 3 ; 2 ,6 2 ;
2 ,7 3 ; 2 ,8 0 ; 2 ,7 9 ; 2 ,9 6 ; 2 ,5 8 ; 2 ,5 0 ; 2 ,8 2 ; 2 ,8 3 ; 2 ,9 0 ; 2 ,9 1 ; 2 ,8 7 ; 2 ,8 7 ; 2 ,7 4 ; 2 ,7 0 ; 2 ,5 2 ; 2 ,7 5 ; 2 ,9 9 ; 2 ,6 6 ;
2 ,5 8 ; 2 ,7 1 ; 2 ,5 1 ; 2 ,8 7 ; 2 ,8 7 ; 2 ,7 5 ; 2 ,8 5 ; 2 ,6 1 ; 2 ,5 4 ; 2 ,7 3 ; 2 ,9 6 ; 2 ,9 0 ; 2 ,7 5 ; 2 ,7 6 ; 2 ,9 3 ; 2 ,6 4 ; 2 ,8 5 ; 2 ,7 0 ;
2 ,5 6 ; 2 ,5 1 ; 2 ,8 3 ; 2 ,7 9 ; 2 ,7 6 ; 2 ,7 5 ; 2 ,8 6 ; 2 ,5 8 ; 2 ,8 7 ; 2 ,8 9 ; 2 ,8 9 ; 2 ,5 2 ; 2 ,5 9 ; 2 ,5 4 ; 2 ,5 4 ; 2 ,8 5 ; 2 ,8 3 ; 2 ,9 6 ;
2 ,9 3 ; 2 ,8 9 ; 2 ,9 2 ; 2 ,9 8 ; 2 ,5 9 ; 2 ,8 1 ; 2 ,7 8 ; 2 ,9 5 ; 2 ,9 6 ; 2 ,9 5 ; 2 ,5 6 ; 2 ,5 9 ; 2 ,8 7 ; 2 ,8 4 ; 2 ,8 4 ; 2 ,8 0 ; 2 ,6 5 ; 2 ,7 0 ;
2 ,6 1 ; 2 ,8 9 ; 2 ,8 3 ; 2 ,8 5 ; 2 ,5 2 ; 2 ,6 6 ; 2 ,7 4 ; 2 ,7 3 ; 2 ,8 8 ; 2 ,8 5
A continuacin, se describen los pasos que se deben seguir para construir una tabla de fre
cuencias agrupadas utilizando los datos contenidos en la lista.
1. Restar el valor menor al mayor para saber cul es la amplitud de la serie de valores. El va
lor mayor (2,99) menos el menor (2,50) da 0,49.
2. Dividir la amplitud por varios tamaos de intervalo posibles hasta encontrar, despus de re
dondear, una cantidad razonable de intervalos. Cuando la amplitud es pequea, es necesario tener
en cuenta tamaos de intervalo representados por decimales. Sin embargo, aun utilizando deci
males, es conveniente utilizar slo tamaos de intervalos que sean nmeros comunes y regulares.
As, en este ejemplo, podramos tomar un tamao de intervalo de 0,1, lo cual dara como resulta
do 5 intervalos, pero sera an ms adecuado utilizar el tamao 0,05, para obtener 10 intervalos.
3. Realizar una lista de los intervalos ordenndolos de mayor a menor. En este caso, los inter
valos deberan comenzar con 2,95-2,99 y continuar hasta 2,50-2,54.
4. Proceder del mismo modo que con una tabla de frecuencias comn. La tabla 1-5 muestra el
resultado.
T a b la 1 -5 .
T a b la d e f r e c u e n c i a s a g r u p a d a s c o r r e s p o n d i e n t e a u n e s t u d i o r e a l i z a d o a 1 0 0 a l u m n o s s e c u n d a r i o s ,
p a r a m e d i r e i t i e m p o p r o m e d i o d e le c tu r a d e o r a c i o n e s a m b i g u a s ( e n s e g u n d o s ) .
T ie m p o d e le c tu r a
2 ,9 5 - 2 ,9 9
2 ,9 0 - 2 ,9 4
2 ,8 5 - 2 ,8 9
2 ,8 0 - 2 ,8 4
2 ,7 5 - 2 ,7 9
2 , 7 0 - 2 ,7 4
2 , 6 5 - 2 ,6 9
2 ,6 0 - 2 ,6 4
2 , 5 5 - 2 ,5 9
2 , 5 0 - 2 ,5 4
F r e c u e n c ia
9
7
20
n
10
0
4
8
10
11
HISTOGRAMAS
Los grficos constituyen otro medio adecuado para facilitar la comprensin de una cantidad im
portante de registros. Una imagen vale ms que mil palabras, y a veces ms que mil nmeros.
Una manera de graficar la informacin de una tabla de frecuencias es con un grfico de barras es
pecial denominado histograma. En un histograma, la altura de cada barra representa la frecuen
cia que le corresponde al intervalo de acuerdo con la tabla de frecuencias. Adems, las barras
estn ubicadas una al lado de la otra, sin espacios entre ellas. Los histogramas se parecen al con
torno de una ciudad en el horizonte. La figura 1-3 muestra dos histogramas basados en el ejemplo
de medicin del estrs (uno representa la tabla de frecuencias clsica y el otro la tabla de frecuen
cias agrupadas).
Figura 1-3. Histograma basado en (a)
tabla de frecuencias y (b) tabla de fre
cuencias agrupadas segn informa
cin de Aron, Paris, & Aron (995).
'.
..
ellos, la angustia debera disminuir.
;VJn (ruc muy til para reducir la ansie-..
El segundo mtodo para disminuir la
angustia provocada por los exmenes supo- ; dad. es crear, una. prctica' de xmen, tan ;
Intecvalo
45 -49,9
.40-44,9
35-39,9'::
30 - 34,9'
'.2 5 -2 9 ,9 .
" 20 -2 4 ,9
' '..li-.19,9 :
1 0 a 4 ,9
. 5-9,9 '
0 - 4 ,9 .
Figura 1-4. Histograma que representa el nmero de interacciones sociales vividas durante una semana por 94 estu
diantes universitarios, basado en frecuencias agrupadas. (Fuente: McLaughlin- Volpe et al., 1998).
Tiempo
de'lectura Frecuencia
2,95-2,99
9
2,90 - 2,94
. 7
2,8S~2,89
20 '
2,80 ~2,84
ii
2,75-2,79
10
2,70 -2,74 ,
: : 10
2,65 - 2 , 6 9
2,60 - 2 ,6 4
2 .5 5 - 2 ,5 9
2;50'-2;54,
.'
4
8
10
/'7l
^
'
-"Vi
POLIGONOS DE FRECUENCIAS
Existe otro mtodo utilizado comunmente para mostrar grficamente la informacin contenida
en una tabla de frecuencias. Este tipo de grfico, denominado polgono de frecuencias, es bsi
camente la versin del histograma representado con un grfico de Eneas. En lugar de barras, la
frecuencia de cada intervalo se indica a travs de la altura de una lnea que se desliza por la pgi
na, creando una especie de contorno de montaas. La figura 1-6 muestra los polgonos de fre
cuencias creados a partir de las tablas de frecuencias comunes y agrupadas correspondientes al
ejemplo de medicin del estrs.
Cmo confeccionar un polgono de frecuencias?
A continuacin describimos los cinco pasos que se deben seguir para la creacin de un polgono
de frecuencias:
1. Realizar una tabla de frecuencias (o una tabla de frecuencias agrupadas).
2. Ubicar la escala de intervalos al pie de la pgina. Incluir un intervalo extra al principio y
otro al final de a serie de intervalos que tienen observaciones realmente obtenidas. Los interva
los adicionales son necesarios para asegurar que la lnea comience y termine en la base del grfi
co, es decir, en la frecuencia cero, AI incluir los intervalos adicionales se crea una figura cerrada
o polgono. Ai igual que con los histogramas, la escala se construye marcando slo el punto
medio de cada intervalo.
3. Realizar una escala de frecuencias a lo largo del margen izquierdo de la pgina. La escala
debe partir de 0, en la parte inferior, hasta la mayor de las frecuencias de todos ios intervalos.
4. Marcar un punto sobre el centro de cada intervalo, a la altura correspondiente a la frecuen
cia de ese intervalo.
5. Unix los puntos por medio de lneas.
F igura 1-6. Polgonos de frecuencias basados en (a) una tabla de frecuencias y (b) una tabla de frecuencias agrupadas,
construidas con los datos de Aron, Pars & Aron (1995).
.v.;:;V
S-:;=/:-;g
.'-'.'-'A
-A :, A
A' ,
Paso 2
A
.
A
A .
-2,5 .2,5 7,5 12,5;'17,5 22,5 27,5 32,5 37,5 42,5 47,5 52,5.
Cantidad de interacciones sociales
A'
A -'-'-.A
' . ;
'A V ;
A '; '
:2,475 2,525 2,575 2,625 2,675 2.725 2,775 2.825 2,p?5 2,925 2,975 3,025' Tiem po de lectura <$eg.)
Figura 1-10. Ejemplos ficticios de distribuciones que no son unimodaies. (a) Distribucin bimodal que indicajas posibles frecuencias en diferentes niveles de calidad del trabajo realizado por empleados que llama
ron la atencin de gerentes de mayor nivel, (b) Distribucin rectangular que muestra las posibles
frecuencias de la cantidad de alumnos en los diferentes grados de la escuela primaria.
Figura 1-11. E jem p lo s d e p o lg o n o s d e frecu en cias de d istrib u cion es (a) prcticam ente sim trica s, (b ) a si
m tricas h a cia la derecha (p o sitiv a m en te asim tricas) y (c ) asim tricas hacia la izquierda (n egativam en te
asim tricas).
e e .u u
. p o r c a d a fa m ilia , e n 1 9 8 8 . ( F u e n t e : O f ic in a d e C e n s o s d e
. [U .S . B u r e a n o f th e C e n s u s ] , 1 9 9 0 ).
hacia la derecha (vase figura 1-12), porque no es posible tener menos de cero hijos. El efecto
piso es la acumulacin de observaciones en el extremo izquierdo del grfico, debido a que es
imposible que exista un registro menor. El ejemplo referido a la cantidad de interacciones so
ciales tambin presenta un efecto piso, porque nadie puede tener menos de 0 interacciones.
La figura 1-13 ilustra un caso de distribucin asimtrica causada por la existencia de un lmi
te superior. La distribucin, referida al resultado logrado por adultos en una prueba sobre las ta
blas de multiplicar, es drsticamente asimtrica hacia la izquierda. La mayora de los resultados
se acumularon a la derecha, en el extremo con los valores ms altos (resultado perfecto.) E ejem
plo descripto presenta un efecto techo. El ejemplo de medicin del estrs tambin presenta un le
ve efecto techo. Esto se debe a que muchos alumnos sufran de un alto nivel de estrs -la
puntuacin mxima era 10- pero, por lo general, a las personas no les gusta utilizar las mximas.
F ig u r a 1 -1 3 . D istrib u cin asim trica
h acia la izquierda: distribu cin ficticia
d e lo s resu ltad os o b ten id os por adultos
en un a prueba sobre la s tablas d e m u l
tiplicar.
F igura 1-1 4 . E je m p lo s d e distrib u cion es (a) norm al, (b ) de c o la s esp esa s y (c ) d e c o la s d elgad as. (A d ap ta
c i n , D e C a r lo 19 9 7 ).
El trmino curtosis se refiere al grado en el que la forma de una distribucin difiere de la curva nor
mal, principalmente con respecto ai hecho de que las colas sean ms espesas o delgadas que las de
la curva normal (DeCarlo, 1997). El trmino curtosis proviene de la palabra griega kyrtos, que sig
nifica curva. La lnea oscura de la figura l-14b indica una distribucin crtica con colas ms es
pesas que las de la curva normal. La figura l-14c presenta un ejemplo extremo de distribucin
curtica, una distribucin sin colas. (Una distribucin rectangular sera un caso an ms extremo).
Adems de la diferencia en el espesor de las colas con respecto a la curva normal, las distri
buciones con colas espesas por lo general son ms empinadas que la curva normal (vase figura
l-14b), y aqullas con colas ms delgadas o sin colas, por lo general son ms chatas que la-curva
normal (vase figura 3-14c).
Las distribuciones con colas espesas se ven como si a la curva normal se la pellizcara en la
mitad, y parte de ella se elevara formando un pico agudo y el resto se extendiera para formar espe
sas colas. Las distribuciones con colas delgadas (o sin colas), se ven como si se tirara hacia fuera
el centro de la distribucin y se absorbieran las colas y el pico. De todos modos, aun cuando
usualmente la elevacin o chatura de una distribucin est relacionada con a curtosis, lo ms im
portante es el espesor de las colas.
CONTROVERSIAS Y LIMITACIONES______________________
La controversia ms importante con respecto a ia utilizacin de tablas de frecuencias, histograma$ y polgonos de frecuencias no se genera entre los psiclogos, sino entre el pblico en general.
La utilizacin y el uso incorrecto de estos procedimientos descriptivos por parte de los medios pa
rece haber creado escepticismo con respecto a la confiabilidad de la estadstica en general y de las
tablas y cuadros estadsticos en particular Quin no ha escuchado decir que la estadstica mien
te ! En realidad, las personas pueden mentir a travs de la estadstica, y as lo hacen. Es tan senci
llo como mentir con palabras, pero las mentiras dichas con nmeros son seguramente ms
difciles de reconocer. En esta seccin destacamos dos maneras a travs de las cuales las tablas de
frecuencias y los grficos equivalentes pueden ser usados en forma errnea, y mostramos cmo
reconocer esos usos incorrectos. (Gran parte del material est basado en la excelente y entreteni
da exposicin de estos temas). (Tufte, 1983)
Por supuesto que cualquier forma particular es precisa en algn sentido. Pero se ha adoptado
la escala 1,5:1 para brindar un patrn de comparacin. Cambiar esta proporcin sera engaoso
para la vista.
; ' )
0.5-
-2J
; : Estris
8,5 10,5
(c) '
6^ . 8 J l O J . -
'
Esifa
. L a c a p a c id a d d e p e n s a r , m a t e m t ic a -
.j m e n te ^ e n u n s e n t id o a m p li ,:- es' a b s - :
lu t a m e n t e c r u c i a l p a r a el- 4esarroi.ro!'
. : /'.
. e n p r c t ic a m e n t e t o d a s l a s c a r r e r a s .i
'
L a c o n f ia n z a h e l r n a h e j o .d e n f o r -
'f ; ; .
m a c i n , e l e s c e p t i c i s m ; h e ; n a lisis:-
: d e a rg u m e n to s-, la p e r s e y r a h c i a : :
p e n etra r.' p r o b le m a s :-c o m p le j o s
.- cajjacidatd-.de; M m n f c a ^ n v s o b w ' ; ^ ^ .
;,
.
m a s t c n ic o s e n fo f m r jfo ^
':
s o n la s a r te s f a c u lt a t iv a s q u e . o f r e c e ii.
la s nuevas d e n < ^ m t i M ^ f ( S i i y
. 1987,;pfxviii>v :
N o d e b e m o s d e ja r d a p r e n d e r e s t a s ; a r te s
fa c u lta tiv a s s lo p o r q u e a lg u ie n - o s h iz o
c r e e r q e n o p o d r a m s o o q u m a f n s . .' ^
a p r e n d e r l a s . f
f.f.;
candidato evaluado, los participantes mostraron una frme tendencia a calificar a su propio candi
dato con mayores probabilidades que los dems. Una de las formas empleadas por Sanbonmatsu
(et al., 1997) para mostrar los resultados, consiste en indicar la cantidad de participantes que se
leccionaron cada uno, de ios nueve enunciados que se Ies propusieron relativos a la probabilidad
de que los candidatos fueran contratados. La tabla 1-6 reproduce la tabla de frecuencias de los
participantes. Como puede observarse, muchos ms participantes calificaron como mejor que
casuar' la probabilidad de que los candidatos que ellos mismos haban evaluado fueran contrata
dos (mayor que 5 en la serie de enunciados).
De todos modos, por lo general, cuando se publican tablas de frecuencias en los artculos, los
valores de la variable son categoras y no nmeros. Adems, es muy comn que en las tablas se
utilicen porcentajes de casos ms que de cantidades. Por ejemplo, Norcross, Hanych y Terranova
(1996) analizaron el Postgrado de Psicologa ( a p a -American Psychologycal Association, Aso
ciacin Americana de Psicologa-, 1994) e identificaron los cursos exigidos para ser aceptado en
la escuela para graduados. La tabla 1-7 fue extrada de esa publicacin. La tabla muestra el por
centaje de programas para graduados, la cual exige o prefiere que los aspirantes hayan tomado
distintos cursos de psicologa. A propsito, podemos observar que un mayor porcentaje (85,25)
exige o prefiere que los aspirantes hayan cursado estadstica!
En las publicaciones cientficas casi nunca se publican histogramas o polgonos de frecuen
cias (excepto en artculos sobre estadstica). En las raras ocasiones en que aparecen, por lo gene
ral se presentan en formatos bastante poco comunes. Por ejemplo, Wechsler y sus colegas (1994)
realizaron un estudio entre 17.592 estudiantes de 140 facultades de Estados Unidos con respecto
a hbitos en la bebida. Una de las preguntas ms importantes se refera al porcentaje de estudian
tes de las distintas facultades considerados bebedores por diversin. Los investigadores definan
Tabla 1-6.
F r e c u e n c ia s c o n q u e s e c o n fir m a r o n lo s e n u n c ia d o s s o b r e la p r o b a b ilid a d d e q u e e i c a n d id a to
a s ig n a d o fu e r a c o n tr a ta d o : e x p e r im e n to 1.
F r e c u e n c ia
(n = 31)
1. Es a b so lu ta m en te seg u ro que (el objetivo) n o sea contratado
0
2. Las probabilidades de (el objetivo) ser seleccion ad o para el puesto en e cuerpo docente
d e la universidad eran m u ch o m en o res que las de cualquiera de lo s otros tres candidatos
1 1
3 . Las probabilidades de (el objetivo) ser seleccion ad o para el puesto en el cuerpo docente
de la universidad eran m en o res que las de cualquiera de ios otros tres candidatos
3
4. Las probabilidades de (el objetivo) ser seleccio n a d o para el puesto en el cuerpo docente
de la universidad eran a p en a s m e n o r e s que las de cualquiera de los otros tres candidatos
, 3
5. Las probabilidades de (el objetivo) ser seleccion ad o para el puesto en el cuerpo docente de la
universidad eran a p r o x im a d a m e n te las m ism a s que las de cualquiera de lo s otros tres candidatos
6
6. Las probabilidades de (el objetivo) ser seleccion ad o para el puesto en el cuerpo docente
de la universidad eran a p en a s m e jo r e s que las de cualquiera de los otros tres candidatos
8
7. Las probabilidades de (el objetivo) ser seleccion ad o para el puesto en el cuerpo docente
de la universidad eran m e jo res que las de cualquiera de los otros tres candidatos
6
8. Las probabilidades de (el objetivo) ser seleccion ad o para el puesto en el cuerpo docente
de la universidad eran m u ch o m ejo res que las de cualquiera de lo s otros tres candidatos
2
9. Es a b so lu ta m e n te seg u ro que (ei objetivo) ser contratado
2
Fuente: Sanbonmatsu, D. M., Posavac, S.S., & Stasney, R. (1997), tab. 2. "Opiniones subjetivas implcitas en la sobrestimacin de probabilidades. R e v is ta C ientfica le P s ic o lo g a S o c ia l E x p erim en ta l [J o u rn a l q f E x p erim en ta l S o cia l
P s y c k o b g y ] 3 3 ,2 7 6 -2 9 6 . Copyright, 1997, por Academic Press, Reimpreso con autorizacin.
como bebedores por diversin a aqullos que informaban haber bebido al menos una vez durante
las dos semanas previas a la encuesta (cuatro copas de bebida alcohlica seguidas en el caso de las
mujeres y cinco en el caso de los hombres). La figura 1-17 reproduce la tabla que elaboraron. ni
camente una facultad present slo un 1-5% de bebedores por diversin. Sin embargo, bastantes
facultades presentaron un 30-50% de estos bebedores. Seis facultades presentaron un 66 -70% de
alumnos considerados bebedores por diversin!
Tabla 1-7.
C u r so s r e q u e r id o s c o m o c o n d ic i n p r e v ia p o r p r o g r a m a s p a r a g r a d u a d o s q u e e x ig e n c u r s o s
e s p e c fic o s d e p s ic o lo g a (n = 1 .5 5 4 ).
C u rso
E xig id o
A norm al / psicopatologia
N i ez / desarrollo
C ognoscitivo
H istoria y sistem as
Cursos de laboratorio
A prendizaje
F isio l g ic o / biop sico lo g a
Personalidad
M todos de investigacin i diseo experim ental
Sensacin y percepcin
Estadstica
Prueba / m edicin
Social
15,6%
11,2%
3,6%
4,9%
7,8%
8,7%
5,5%
12,0%
40,0%
3,1%
56,5%
9,5%
4,7%
P referid o
16,9%
24,2%
9,0%
12,3%
3,8%
19,6%
18,9%
15,7%
26,0%
7,8%
28,7%
8,0%
18,7%
E x ig id o o p r e fe rid o
32,5%
35,9%
12,6%
17,2%
11,6%
28,3%
24,4%
27,7%
66,0%
10,9%
85,2%
17,5%
23,4%
Fuente: Norcross, J. C., Hanych, J. M & Terranova, R. D. (1996), tab. 4 , Postgrado de Psicologa, 1992-1993. A m e ri
c a n P sy ch o lo g ist, 5 1, 631-643, Copyright, 1996, por la Asociacin Americana de Psicologa [American Psychological
Association]. Reimpreso con autorizacin.
Figura 1-17. D istrib u cin d e facu ltad es seg n porcen taje d e b eb ed ores por d iversin . (F u e n te : W ech sler,
H ., D avenport, A ., D o w d a ll, G ., M o ey k en s, B ., & C a stillo, S . (7 d e d iciem b re d e 1 9 9 4 ), tab. 1. C o n se
c u e n c ia s para la sa lu d y e l co m p o rta m ien to p rovocad as por e l h b ito d e beber p or d iversin durante la p o
c a universitaria: un e stu d io n a cio n a l d e alu m n o s d e 140 cam p u s u n iversitarios , J A M A , 2 7 2 ,1 6 7 4 ) .
Los histogramas y los polgonos de frecuencias slo en raras ocasiones se publican en artcu
los de investigacin. Es ms probable que se vean breves comentarios sobre la forma de la distri
bucin de los registros recolectados durante el estudio, especialmente si la distribucin se desva
de lo normal Speed y Gangestad (1997) aportan una tpica descripcin, como la mencionada en
sus comentarios, sobre un grupo de variables que analizaron; Estas variables no estaban distri
buidas en forma normal (eran positivamente asimtricas), (p. 930)
Resumen
Los psiclogos utilizan procedimientos de estadstica descriptiva para describir, es decir, pa
ra resumir y hacer fcilmente comprensibles un grupo de nmeros obtenidos a partir de una
investigacin.
Un valor es un nmero o categora; una variable es una caracterstica que puede tener diferen
tes valores; una observacin es el valor particular correspondiente a una persona en una variable.
Con una variable numrica, los valores nos transmiten el grado o cantidad de lo que se mide. Hay
dos clases principales de variables numricas: en el caso de las variables intervalares, los valores
representan cantidades iguales de lo que se mide; en el caso de las variables ordinales, los valores
slo representan posiciones relativas. En el caso de las variables nominales, los valores son cate
goras o nombres.
Una tabla de frecuencias organiza los nmeros en una tabla en la que cada uno de los valores
posibles aparecen en una lista a lo largo del margen izquierdo, ordenado de mayor a menor, junto
con la cantidad de observaciones que corresponden a cada valor.
Cuando hay una gran cantidad de valores diferentes es ms til construir una tabla de fre
cuencias agrupadas, que es igual a una tabla de frecuencias comn, slo que las frecuencias se
atribuyen a intervalos que incluyen una serie de valores. El tamao de los intervalos debe elegirse
de tal modo que (a) la cantidad total de intervalos sea de entre 5 y 15; (b) sea un nmero comn,
simple, y (c) el lmite inferior de cada intervalo sea mltiplo del tamao del intervalo.
El patrn de las frecuencias puede representarse con un histograma, es decir, una especie de
grfico en el que la altura de cada barra es la frecuencia para un valor o intervalo determinado, y
en el que no existen espacios entre las barras. Los polgonos de frecuencias son otra alternativa de
los histogramas; en ellos, una lnea conecta puntos, es decir, la altura de cada uno de los cuales re
presenta la frecuencia de un valor o intervalo determinado.
La forma general del histograma o polgono de frecuencias puede ser unimodal (con un solo
pico), bimodal, multimodal (que incluye al bimodal), o rectangular (sin picos); puede ser sim
trica o asimtrica (con una larga cola) hacia la derecha o hacia la izquierda; y con respecto a la
curva normal con forma de campana, puede presentar curtosis (con colas que son muy anchas o
muy angostas).
A veces se puede distorsionar la representacin grfica de informacin para el pblico en ge
neral, de tal manera que a simple vista resulte engaosa, como por ejemplo, utilizando intervalos
que no son iguales o exagerando las proporciones.
Las tablas de frecuencias, los histogramas y los polgonos de frecuencias rara vez aparecen
en publicaciones cientficas. Cuando aparecen, por lo general lo hacen en formatos no tradiciona
les o presentando frecuencias (o porcentajes) para varias categoras, ms que para los diferentes
valores numricos de una variable.
Trminos clave
- Bimoda.
- Efecto techo.
- Estadstica descriptiva.
- ntervalar.
- Efecto piso.
- Distribucin de frecuencias.
- Polgono de frecuencias.
- Tabla de frecuencias.
- Tabla de frecuencias agrupadas.
Histogramas.
Estadstica inferencial.
intervalo.
Curtosis.
Niveles de medicin.
Multimodal.
Variable nominal.
Curva normal.
Variable numrica.
- Variable ordinal.
- Rectangular.
- Valor observado
u observacin.
- Asimtrico.
- Simtrico.
- Unimodal.
- Valor.
-Variable.
Ejercicios
Los ejercicios implican la realizacin de clculos o tabulaciones. La mayora de los problemas
estadsticos reales se resuelven por computadora, pero aun as, es conveniente realizar estos ejer
cicios manualmente para incorporar el mtodo de trabajo.
Para adquirir prctica en la utilizacin de una computadora, para resolver problemas estads
ticos, se puede utilizar la seccin de computacin de cada captulo, publicada en la Gua de estu
dio y libro de tareas de computacin para el alumno / Students Study Guide and Computer
WorkbookJ que acompaa este libro.
Todos los datos de esta seccin son ficticios (a menos que se especifique lo contrario). Las
respuestas a los ejercicios de la serie I se encuentran al final del libro.
SERIE I
1. Indique el nivel de medicin de cada
una de las siguientes variables: a) grupo tnico
al que pertenece una persona, b) cantidad de
veces que un animal equivoca el camino en un
laberinto y c) posicin en la que uno finaliza
una carrera.
2. A continuacin, aparecen las observa
ciones de una medicin de sensibilidad olfati
va realizada a un grupo de chefs asistentes a un
congreso nacional:
96, 83, 59, 64, 73, 74, 80, 68, 87, 67, 64,
92, 76, 71, 68, 50, 85, 75, 81,70, 76, 91,
69,83,75
Confeccione a) una tabla de frecuencias,
b) una tabla de frecuencias agrupadas y c) u
histograma de las frecuencias agrupadas; y d)
describa la forma general de la distribucin.
3. Las observaciones que aparecen a conti
nuacin representan la cantidad de minutos
Media, varianza;
desvo estndar
_ v
Meda.
Medidas alternativas de la tendencia.
central.
Varianza y desvo estndar.
Puntuaciones Z. _
Controversias y limitaciones: la tirana
de la media.:V .V>
)VV(
la media y el desvo estndar segn se
describen en publicaciones cientficas.
Resumen,
Trminos clave.
^ Ejercicios.
Apndice del captulo: frmulas
optativas para el clculo de la
varianza y el desvo estndar.
V\ V.
.
V: -.:j. V:
C
MEDIA
3,1,6,9,3,8
sube y baja rudimentario. Imaginemos pilas de cubos distribuidos a lo largo de la tabla segn los valo
res que representan, es decir, un cubo para cada observacin de la distribucin. (La figura resultante es
similar a un histograma construido con cubos). La meda sera el punto de la tabla donde el peso de los
cubos se equilibra perfectamente. La figura 2-1 representa lo antedicho utilizando e! ejemplo de la
cantidad de sesiones a las que asistieron los 10 pacientes de nuestra terapeuta imaginaria.
La figura 2-2 muestra algunos otros ejemplos. Cabe destacar, que ni siquiera es necesario que
haya un cubo exactamente en el punto de equilibrio. Es decir, la media no necesariamente debe
corresponder a una observacin real en la distribucin. La media es simplemente el promedio de
las observaciones, el punto de equilibrio. La media incluso podra ser un nmero cuya aparicin
en la distribucin fuera imposible, como en el caso de una media representada por un nmero de
cimal cuando todos los nmeros en la distribucin deben ser nmeros enteros (2,3 nios, por
ejemplo), Otra caracterstica es que los cubos pueden estar muy separados o muy juntos y que no
necesiten estar distribuidos en forma pareja. En cualquiera de esos casos, aun es posible encontrar
un punto de equilibrio. (Cabe mencionar que esta analoga, que utiliza cubos en equilibrio encima
de una tabla apoyada sobre un tronco, funcionara en la realidad slo si la tabla no tuviera peso).
Frmula para o b te n c i n
de
La regla para el clculo de la media consiste en sumar todas las observaciones y dividirlas por la
cantidad de las mismas. Se expresa a travs de la siguiente frmula:
M=
JX
(2- 1)
Figura 2-2. Medias de varias distribuciones ficticias ilustradas utilizando la analoga de los cubos apoyados
encima de una tabla en equilibrio sobre un tronco.
M es un smbolo que representa la media. (Ms adelante aprenderemos otro smbolo para repre
sentar la media, la letra griega i, mu, que se utiliza en circunstancias particulares. Tambin es
bastante utilizado un tercer smbolo, X, a veces denominado X-raya).
X, la letra griega mayscula sigma, es el smbolo que representa la suma de; significa
suma de todas las cantidades siguientes. Es el smbolo aritmtico especial ms comnmente
utilizado en estadstica.
La X se refiere a las observaciones en la distribucin de la variable X. Podramos haber elegi
do cualquier otra letra. Sin embargo, cuando existe slo una distribucin, generalmente se la de
nomina X. En captulos posteriores veremos situaciones en las que se analizan dos distribuciones
al mismo tiempo. En ese caso, se utiliza una segunda letra, generalmente la Y. Otra alternativa es
utilizar subndices, como por ejemplo X l y X2. En el caso de un tratamiento matemtico ms for
mal de la estadstica, ios smbolos utilizados en varias frmulas son an ms complejos. Es preci
samente esa complejidad la que permite que las frmulas representen casos complicados sin
confusin. Sin embargo, los libros de estadstica para psiclogos, aun los textos ms avanzados,
utilizan smbolos simples. La forma ms simple rara vez crea ambigedad en las frmulas esta
dsticas que utilizan los psiclogos.
XX significa la suma de X. ndica que se deben sumar todos los valores observados de la dis
tribucin de la variable X. Supongamos que X se refiere a la cantidad de sesiones de terapia en la dis
tribucin de nuestro ejemplo. XX sera igual a 60, la suma de 7 + 8 + 8 + 7 + 3 4 -1 + 0 + 9 + 3 + 8.
N es un nmero. Se utiliza en estadstica para indicar la cantidad de observaciones de una dis
tribucin. En nuestro ejemplo existen 10 observaciones, por lo tanto, N es igual a 10.
Resumiendo, la frmula indica dividir la suma de todas las observaciones de la distribucin
de la variable X por la cantidad total de observaciones M En nuestro ejemplo, significa que debe
mos dividir 60 por 10. La frmula sera la siguiente;
M=
XX
N
60
10
=6
XX
M
975
= 6,46
151
La frmula nos indica que la puntuacin promedio de estrs en la escala de 10 puntos fue de 6,46
(redondeando). Esta cifra se encuentra claramente por encima del punto medio de la escala. El
ejemplo tambin puede representarse grficamente. Consideremos otra vez el histograma como
una pila de cubos encima de una tabla, y la media 6,46 como el punto en el que la tabla se equili
bra sobre el fulcro que tiene debajo, (vase figura 2-3). Este nico nmero simplifica enorme
mente la informacin dlas 151 puntuaciones de estrs.
De modo similar, analicemos el ejemplo de las interacciones sociales de los alumnos
(McLaughlin-Volpe et al., 1998). Las cantidades de interacciones de ios 94 alumnos durante una
semana fueron las siguientes:
48,15,33,3,21,19,17,16,44,25,30,3, 5,9,35,32,26,13,14,14,47,47,29,18,11, 5,19,24,17,
6,25,8,18,29,1,18,22,3,22,29,2,6,10,29,10,21,38, 41,16,17, 8,40,8,10,18, 7,4,4, 8, 11,
3,23,10,19,21,13,12,10,4,17,11,21, 9 , 8,7, 5, 3,22, 14,25,4,11,10, 18,1, 28,27, 19, 24, 35,
9,30,8,26
La tabla de frecuencias, la tabla de frecuencias agrupadas, el histograma y el polgono de frecuen
cias que construimos en el captulo 1 simplificaron considerablemente la visualizacin de los da
tos. Pero incluso, despus de todo ese proceso tambin sera til obtener un resumen de un slo
nmero. Por lo tanto, podemos calcular la media en la forma usual. En este caso:
1.635
= 17,40
94
Es decir, si sumamos las cantidades de interacciones de los 94 alumnos, la suma de X ' da 1.635.
Al dividir este nmero por la cantidad de observaciones, obtenemos una media de interacciones
de 17,40. La figura 2-4 grfica este caso.
.Nivel e Estrs
;/
5,40 \
Otro de los principales ejemplos analizados en el captulo 1 se refera al tiempo utilizado para leer
oraciones ambiguas. La media se calcula en la forma usual:
M =
N
100
755
Moda=8
g rfica d e la m o d a c o
m o pu nto m s a lto e n e l h istogram a d e una distri
bu cin , u tiliza n d o el e je m p lo fic tic io d e la cantidad
d e s e s io n e s d e terapia tom adas p o r 10 p a cien tes.
/ * Media 7 .
5
6 7. ; 8
3 ' 3 .
v.
10 -
,v
Mediana'
:
.
sa de que las mujeres prefieran tener slo una pareja estable, debido a que una mujer slo puede
tener una pequea cantidad de hijos durante su vida, y es ms probable que los genes de la mujer
sobrevivan si esos pocos hijos son bien cuidados. Los hombres, sin embargo, pueden tener una
gran cantidad de hijos durante su vida; por eso, segn la misma teora, para ellos lo mejor es una
postura semejante al disparo de escopeta. Si tienen muchas parejas es ms probable que sus genes
sobrevivan. Coherentemente con esta presuncin, los psiclogos evolucionistas descubrieron que
los hombres expresaban necesitar muchas ms parejas que las mujeres.
Otros tericos (p.ej., Milier & Fishkin, 1998), sin embargo, han cuestionado esta visin. Sos
tienen que hombres y mujeres preferiran aproximadamente la misma cantidad de parejas debido
a que los individuos que tienen una predisposicin bsica a buscar un lazo ntimo fuerte son los
que tienen las mayores probabilidades de sobrevivir a la niez, y que este deseo de lazos fuertes
perdura (y tiene otros beneficios) en la etapa adulta. Los mismos investigadores tambin pregun
taron a mujeres y hombres cuntas parejas necesitaban, y ios resultados mostraron la misma dife
rencia en cuanto a las medias; los hombres necesitaban un promedio de 64,32 y las mujeres un
promedio de 2,79. Sin embargo, la escena cambia drsticamente si observamos la mediana o la
moda (vase tabla 2-1). La figura 2-9, tomada directamente de la publicacin preparada por los
investigadores, nos explica la situacin. La mayora de las mujeres y los hombres desean slo una
pareja; unos pocos desean ms de una, y sganos desean muchas ms. La gran diferencia reside
en que hay muchos ms hombres dentro del pequeo grupo que desea muchas ms parejas. (Los
valores observados ms extremos estaban tan alejados -los hombres que deseaban ms de 100 pa
rejas-, que ios investigadores ni siquiera los incluyeron al calcular las medias).
Por lo tanto, cul de las dos teoras es la correcta? Tal vez uno podra sostener cualquiera de
las dos formas para analizar esta informacin. La verdad es que concentrarse slo en la media, en
este caso, desfigura drsticamente la realidad de la distribucin.
-r-h
Respuestas de 106 hombres y 160 mujeres a la pregunta: Cuntas parejas deseara tener en los
prximos 30 aos?
M ujeres
Hom bres
M ed ia
M ed ia n a
M od a
2,8
64,3
1
1
1
1
Sin embargo, a menos que existan valores extremos, los psiclogos casi siempre utilizan la media
como medida de la tendencia central. En realidad, la media cumple la funcin de piedra angular
para la mayora de las otras tcnicas estadsticas.
Varianza
La varianza de un grupo de observaciones indica la dispersin de esos valores alrededor de la
meda. Para ser ms precisos, la varianza es el promedio de los cuadrados de la diferencia entre
cada observacin y la media. A continuacin, detallamos los pasos para calcular la varianza;
1 Esta seccin est dedicada a la varianza y al desvo estndar com o indicadores de dispersin. Existe otra forma de des
cribir la dispersin de un grupo de observaciones, la am plitud, e l registro mayor menos el registro menor. Supongamos
que en una clase en particular el registro ms alto en un examen parcial es 98 y el menor es 60; la amplitud es 38 (es de
cir 98 - 6 0 = 38). La amplitud rara vez es utilizada por investigadores psicolgicos ya que se trata de un medio muy bur
do de describir la dispersin. Es burdo debido a que no tiene en cuenta la distancia entre las observaciones dentro de la
distribucin.
Figura 2 -1 0 .
E jem p lo s d e d istrib u cio n es c o n (a) la m ism a m ed ia con d iferen tes grados d e d isp e r si n y (b)
diferentes m ed ias co n e l m ism o grado d e d ispersin .
1. Restar la media a cada observacin para obtener el desvo de cada una de ellos. El desvo
indica la distancia entre la observacin en cuestin y la media.
2. Elevar cada uno de los desvos al cuadrado (multiplicar cada uno de ellos por s mismo). Se
obtiene as el desvo cuadrtico de cada registro.
3. Sumar los desvos cuadrticos. El total logrado con este clculo se denomina suma de los
cuadrados.
4. Dividir la suma de los cuadrados por la cantidad de desvos cuadrticos (es decir, por la
cantidad de observaciones), Se obtiene as el promedio o media de desvos cuadrticos, es decir,
la varianza.
Aunque este procedimiento pueda parecer un poco extrao o difcil de recordar al principio,
en verdad funciona muy bien. Supongamos que una distribucin es ms dispersa que otra. La dis
tribucin con mayor dispersin presenta una varianza mayor porque la misma dispersin hace
que los desvos sean mayores. Si los desvos son mayores, los desvos cuadrticos tambin lo son
y, por lo tanto, tambin la varianza.
En el ejemplo de la clase en la que todos tenan 38 aos de edad, la varianza sera exactamen
te 0. Es decir, no habra varianza. (En trminos numricos, el desvo de cada persona sera
38 *- 38 - 0; 0 al cuadrado es 0. El promedio de 0 es 0). Por el contrario, la clase con la mitad de
los alumnos de 18 aos de edad y la otra mitad de 58 aos de edad tendra una varianza bastante
alta, es decir, 400. (Los alumnos de 18 aos de edad tendran cada uno un desvo de 18 - 38 =-20,
Los alumnos de 58 aos de edad tendran desvos de 58 - 38 = 20. En ambos casos, los desvos
cuadrticos, tanto -20 al cuadrado como 20 al cuadrado, daran como resultado 400. Y, cuando to
dos ios nmeros son 400, el promedio es 400).
La varianza es importante en muchos otros procedimientos estadsticos (incluso en la mayora de
los temas tratados en la segunda mitad de este libro). Sin embargo, la varianza se utiliza slo ocasio
nalmente como estadstica descriptiva, debido a que est basada en desvos cuadrticos, y los desvos
cuadrticos no transmiten claramente la dispersin de las observaciones. Son verdaderos
desvos o son no cuadrticos. Por ejemplo, queda claro que una clase con una varianza de 400 pre
senta una distribucin mucho ms dispersa que otra cuya varianza es 200. Sin embargo, el nmero
400 no refleja con claridad la variacin real entre las edades, ninguna de las cuales se acerca a 400.2
Desvo estndar
La estadstica ms ampliamente utilizada para describir la dispersin de una distribucin es el
desvo estndar. El desvo estndar es la raz cuadrada positiva de la varianza: para encontrar
el desvo estndar, primero es necesario calcular la varianza y luego sacar su raz cuadrada. Si la
varianza de una distribucin es 400, el desvo estndar es 20; si la varianza es 9, el desvo estndar
es 3, y si la varianza es 100, el desvo estndar es 10.
La varianza se basa en los desvos de la meda, al cuadrado. Por lo tanto, su raz cuadrada, el
desvo estndar, se basa en la distancia simple, no elevada al cuadrado, de la media. Sin entrar en
detalles, el desvo estndar es e! promedio de las diferencias entre las observaciones y la media.
Por ejemplo, analicemos una clase donde las edades presentan un desvo estndar de 20 aos. Esto
nos indicara que las edades se dispersan, en promedio, aproximadamente 20 aos en cada direccin
a partir de la media. Conocer el desvo estndar ofrece una idea general del grado de dispersin.
Daremos otro ejemplo. La distribucin de la cantidad de hijos por familia en un pas en par
ticular podra tener una media de 4 y un desvo estndar de L Significara que, por cada familia
con exactamente cuatro hijos (desvo 0 de la media), bien podramos encontrar una con seis o dos
hijos (desvo de 2 hijos de la media). Sin embargo, podra no funcionar de esa forma. Podra ser
que la mitad de las familias tuvieran exactamente 5 y la otra mitad exactamente 3. O podra ser
que la mayora tuviera 4, pero unas pocas no tuvieran ninguno y otras pocas tuvieran 8 (vase fi
gura 2- 11). No obstante, conocer el desvo estndar brinda una nocin general del grado de dis
persin, aun cuando no indique la forma precisa de distribucin.
El desvo estndar no es exactamente el promedio de las diferencias entre las observaciones
y la media. Para ser precisos, el desvo estndar es la raz cuadrada del promedio de los desvos
cuadrticos de la media, Elevar los desvos al cuadrado, promediarlos, y luego calcular la raz
cuadrada, da un resultado ligeramente diferente al simple promedio de los desvos de los registros
con respecto a la media, Aun as, el resultado de este procedimiento tiene ventajas tcnicas que
superan la ligera desventaja de dar slo una descripcin aproximada de la variacin promedio con
respecto a la media (vase nota al pie N 2).
2 El alumno seguramente se estar preguntando por qu ios estadsticos no trabajan slo con los desvos, simplemente
haciendo que todos ios desvos sean positivos, y utilizando sus promedios. En realidad, en el pasado, ese era ei procedi
miento. El promedio de los desvos (tratando a todos los desvos com o positivos) se denomina desvo prom edio o des
vo m edio, En efecto, algunos psiclogos han hecho resurgir esta cuestin observando algunas ventajas sutiles del
desvo promedio (Catanzaro &TayIor, 1996), Sin embargo, a pesar de su simplicidad conceptual y de clculo, ei desvo
promedio no funciona muy bien como parte de procedimientos estadsticos ms complejos, debido a que resulta difcil
realizar manipulaciones algebraicas con una frmula que ignora los signos de algunos de sus nmeros.
(2-2)
SD2 es el smbolo de varianza. (Ms adelante aprenderemos sus otros smbolos, S1 y o 1, la letra
griega sigma minscula al cuadrado. Los diferentes smbolos corresponden a diferentes cir
cunstancias en las que se utiliza la varianza y, en algunos casos, incluso a clculos ligeramente di
ferentes).
SD es la abreviatura de desvo estndar; recalca que la varianza es el desvo estndar ele
vado al cuadrado. La parte superior de la frmula describe la suma de los desvos cuadrticos.
(2-3)
~ 4 si ?
(2"4)
La frmula del desvo estndar comenzando desde el principio es la raz cuadrada del clculo de
la varianza:
cn = fi(X -M )2
N
(2-5)
( 2- 6)
Tabla 2-2.
Clculo de varianza y desvo estndar del ejemplo referido a la cantidad de sesiones de terapia.
M ed ia
(ca n tid a d m ed ia
d e sesio n es)
6
6
6
6
6
6
6
6
6
O bservacin
(cantidad de
sesiones)
7
8
8
7
3
I
6
9
3
8
D e sv o
cu a d r tic
1
4
4
1
9
25
0
9
9
4
66
D esv o
2
2
1
-3
-5
0
3
-3
0
2: 0
Variari2a = SD 2 =
2 (X ~ M )2
SS
66
10
primeras y ltimas observaciones para ahorrar espacio). En trminos aproximados, el tiempo pro
medio que tarda un participante en leer una oracin ambigua vara 0,142 segundos de la media de
2,755 segundos. La figura 2-3 representa los datos mencionados.
T abla 2 -3.
m ed ia d e
in tera ccion es
D esv o
D e sv o
cu a d r tic o
S3
48
15
33
3
21
1 7 ,40
17,40
17,40
17,40
17,40
3 0 ,6 0
- 2 ,4 0
15,60
- 1 4 ,4 0
3,60
9 3 6 ,3 6
5,76
2 4 3 ,3 6
2 0 7 ,3 6
12,96
35
9
30
8
26
17,40
17,40
17,40
17,40
17,40
17,60
- 8 ,4 0
12,60
- 9 ,4 0
3 0 9 ,7 6
7 0 ,5 6
158,76
8 8,36
73,96.
0,00
12,406,44
2:
X (X -M )2
12.406,44
94
Varianza = S D 2 *
- 1 3 1 ,9 8
Figura 2-12. D esc r ip c i n grfica d e l d e s v o estndar c o m o la d istan cia a lo largo d e la b ase de un histogram a, u tiliza n d o e l e je m p lo referid o a la cantid ad d e in tera ccio n es s o c ia le s v iv id a s en una sem ana. (F u e n te :
M cL a u g h lin -V o lp e e t al., 1 9 98).
T a b la 2 -4 .
C lc u lo d e la v a r ia n z a y el d e s v o e s t n d a r e n u n e s t u d io fic tic io d e l tie m p o d e le c tu r a d e o r a c io n e s
a m b ig u a s .
V alor
(tiem p o de lectu ra )
M ed ia
(tiem p o d e lectu ra )
D esvo
D e sv o
c u a d r tic o
2 ,7 2
2 ,8 4
2 ,6 3
2 ,5 1
2 ,5 4
2 ,9 8
2 ,7 5 5
2 ,7 5 5
2 ,7 5 5
2 ,7 5 5
2 ,7 5 5
2 ,7 5 5
- 0 ,0 3 5
0 ,0 8 5
- 0 ,1 2 5
- 0 ,2 4 5
- 0 ,2 1 5
0 ,2 2 5
0 ,0 0 1 2
0 ,0 0 7 2
0 ,0 1 5 6
0 ,0 6 0 0
0 ,0 4 6 2
0 ,0 5 0 6
2 ,5 2
2 ,6 6
2 ,7 4
2 ,7 3
2 ,8 8
2 ,8 5
2 ,7 5 5
2 ,7 5 5
2 ,7 5 5
2 ,7 5 5
2 ,7 5 5
2 ,7 5 5
0 ,0 5 5 2
0 ,0 0 9 0
0 ,0 0 0 2
0 ,0 0 0 6
0 ,0 1 5 6
0 .0 0 9 0
2 ,0 3 3 0
Varianza - S D 2 -
2 ( X ~ M ) 2 _ SS
_
2 ,0 3 3
100
D e sv o estndar = S D =
= 0 ,0 2 0 3
= V O 0203 = 0 ,142
0 ,2 3 5
0 ,0 9 5
0 ,0 1 5
0 ,0 2 5
0 ,1 2 5
0 .0 9 5
X : 0 ,0 0 0
PUNTUACIONES Z
Hasta aqu hemos aprendido a describir una distribucin de observaciones en funcin de la media
y la varianza. En esta seccin, aprenderemos cmo describir una observacin en particular segn
el lugar que ocupe dentro del grupo de observaciones en conjunto. Es decir, aprenderemos a des
cribir una observacin segn la misma se encuentre sobre o debajo del promedio y segn a qu
distancia hacia abajo o por encima del mismo est ubicada.
Supongamos que nos informan que alguien llamado Alan tom 9 sesiones con la psicoterapeuta (la misma a la cual nos hemos referido en este captulo). Supongamos tambin que desco
nocamos la cantidad de sesiones tomadas por oros pacientes con la misma terapeuta. En ese
caso, seria difcil decir si Alan asisti a muchas o pocas sesiones en relacin con otros pacientes.
Sin embargo, supongamos que s sabemos que la media es y el desvo estndar es 2,57. Con
esos datos, queda claro que Alan asisti a una cantidad de sesiones superior al promedio. Tambin
podemos ver que la cantidad de sesiones en las que Alan se excedi del promedio (3 sesiones
ms) era un poco ms alta que la cantidad de sesiones en que los pacientes de la terapeuta general
mente varan con respecto al promedio. La figura 2-14 muestra el caso grficamente.
c u lta d e s ). E s a h ip te s is , n u e s tr a p r o p ia id e a
o r ig in a l, y l o s d a to s r e c o le c ta d o s p a r a p r o -
b a r ia s e r n m u y im p o r ta n te s p a r a n o s o tr o s ,
zarlos.
Incluso es posible que nuestro corazn lieBibb Latane, un eminente psiclogo cono-:
gu a latir emocionado al analizar las estacido, entre odas cosas, por su trabajo sobr-.
dsticas.
larkzn por la cuallas personas no Siempre
Veamos algunos comentarios de psL
intervienen para ayudar a otros qu s eri-\
clogos sociales que entrevistamos parantran en problemas, cuenta cnio espe:-.
nuestro libro l co raz n d e t'picogd:.
r^a.hsiisainentefr
social [The Heart o f Social Psycholgy] ' :
Los primeros resplandores de lo qu '. - ;
(Aron & Aron, 1989). Deborah Richardsurgi ...'[y] poder utilizarlos para forson, quien estudia relaciones interpers-.. .. 1 rur lo que^l^ta-srliipregnte
Qu es una puntuacin Z?
Una puntacin Z es la transformacin de una observacin que describe mejor el lugar que esa obser
vacin ocupa en la distribucin. Especficamente, una puntuacin Z indica a qu cantidad de desvos
estndar por encima de la media se encuentra dicha observacin (si es positivo), o bien por debajo de la
media (si es negativo). El desvo estndar se transforma as en una especie de patrn, una unidad de
medida propiamente dicha. En el ejemplo de la psicoterapia, .Adn, que asisti a 9 sesiones, tiene una
puntacin Z de +1,17. Es decir que Alan est 1,17 desvos estndar por encima de la media (un poco
ms de 1 desvo estndar de 2,57 sesiones por encima de la media). Otra paciente, Sarah, asisti a se
siones con la terapeuta, y presenta una puntuacin Z de 0, ya que el valor que le corresponde es coinci
dente con la media. Es decir, su valor observado es de 0 desvos estndar por encima o por debajo de la
media. Qu pasara con un paciente que asistiera slo a una sesin? Ese paciente habra asistido a 5
sesiones menos que el promedio, casi 2 desvos estndar por debajo de la media (una puntuacin Z de
-1,95). En funcin de la cantidad de sesiones, el paciente estara por debajo del promedio el doble de
veces de lo que varan tpicamente con respecto al promedio los pacientes de la terapeuta.
Puntaciones Z utilizadas como escaia
La figura 2-15 muestra, utilizando el ejemplo de las sesiones de terapia, una escala de puntuacio
nes Z dispuesta en comparacin con una escala de puntuacin bruta. (Una puntacin bruta es un
valor observado antes de ser convertido en una puntuacin Z). Las dos escalas se asemejan a una
regla con pulgadas de un lado y centmetros del otro, o a un termmetro con la escaia Fahrenheit
de un lado y la de Celsius del otro.
Otros ejemplos
En la prctica, las puntuaciones Z tienen muchos usos. Tambin son parte importante de muchos
de los procedimientos estadsticos que aprenderemos en lo que resta del libro. Es importante fa
miliarizarse con ellos.
Analicemos otro ejemplo. Supongamos que un psiclogo especializado en el desarrollo ob
serv a un nio de tres aos, llamado Peter, en una situacin estndar de laboratorio, mientras ju
gaba con otros nios de su edad. Durante la observacin, el psiclogo control la cantidad de
veces que Peter hablaba con los otros nios. El resultado, luego de varias observaciones, fue que
Peter habl con los otros nios aproximadamente 8 veces por hora de juego. Sin ningn patrn de
comparacin, sera difcil sacar alguna conclusin a partir de esta informacin. Supongamos, sin
embargo, que se saba, por investigaciones previas, que en similares condiciones la cantidad me
dia de veces que los nios hablan por hora de juego es 12, con un desvo estndar de 4. Con esa
informacin, ahora podemos ver que Peter habl con menos frecuencia que oros nios en gene
ral, pero no con una frecuencia extremadamente menor. Peter tendra una puntuacin Z de --1 (si
M = 12 y SD - 4, una observacin de 8 est 1 SD por debajo de la M). Supongamos que observa
mos conversar a Ian con otros nios 20 veces en una hora. Quedara claro que Tan es inusualmen
te locuaz, con una puntuacin Z de + 2 . Ian no slo hablara ms que el promedio, sino dos veces
ms de lo que los nios tienden a desviarse del promedio. (Vase figura 2-1 ).
F igura 2-15. E sc a la s de p u n tu a cio n es
Z y pu ntuacin bruta en e l c a so d e las
s e s io n e s d e psicoterap ia.
rjiuactotLj l'C'Lj?
'#f.i;
-2
:
i
' ~3
*I______
Cantidad de conversaciones por hora; 0
PuntuacinZ:.
: : -Vu
"i . .
;4-
.20
2-.
:24
Figura 2-16. C antidad da v e c e s por hora qu e d os n i os con versan , expresada e n p u n tu acion es brutas y pun
tu a cio n es Z (d atos fic ticio s).
. Peter
'
Cantidad de-.
conversaciones
porhora:
Puntuacin Z:
Capacidad
lingstica
U'Uv: ;ve'- Ci
8 ' 12
16
+2
-----j _ i
20 , 24
SIS
-:~2\
-i
^ - h ~ - :..
64
70 ,
-76
0
+1
----:r-~* j~_
88, 94
82
Peter r,
i
T
+3
1Q
que se encuentra la puntuacin bruta. Para calcular una puntuacin Z, se resta la media a la pun
tuacin bruta, obteniendo el desvo. Luego se divide el desvo por el desvo estndar. En smbo
los, la frmula es la siguiente:
Z ~
SD
(2-7)
Por ejemplo, si aplicamos la frmula al ejemplo del nio con un registro de 100 en la prueba de
capacidad lingstica,, la frmula sera la siguiente:
g __ X - M _ 100 - 82 _ 18 _ ^
SD
6
6
X = (ZXSD) + M
(2-8)
Por ejemplo, si un nio presenta una puntuacin Z de -1,5 en la prueba de capacidad lingsti
ca, quiere decir que se encuentra 1,5 desvos estndar por debajo de la media. Dado que el des
vo estndar en este caso es de puntos brutos, el nio est 9 puntos brutos por debajo de la
media. La media es 82. Por lo tanto, 9 puntos por debajo de ella es 73. Utilizando la frmula,
tendramos:
La figura 2-18 muestra la relacin entre las escalas de puntuaciones brutas y de puntuaciones
Z. Si la puntuacin bruta del estrs de un alumno era 9, ese alumno se encuentra claramente por
encima de la media. Especficamente, al utilizar la frmula obtendramos:
_ X ~ M = 9 -6 ,4 6 ^ 2,54 ^
(2-7)
SD
2,3
2,3
En comparacin, otro alumno presenta una puntuacin Z de -2,37, un nivel de estrs claramente
menor a la media. Utilizando la frmula, la puntuacin bruta exacta se calcula de la siguiente forma:
Analicemos algunos ejemplos tomados del estudio sobre la cantidad de interacciones sociales vi
vidas por estudiantes en una semana (McLaughlin-Volpe et al., 1998). Recordemos que la media
era 17,4 y el desvo estndar 11,49. Un alumno que tuvo 17 interacciones en una semana presenta
un desvo de - 0,4 (es decir 17 - 17,4 = - 0,4). Por lo tanto, la puntuacin Z es - 0,03 (es decir
-0,4/11,49 - -0,03). Esta cantidad de interacciones se encuentra apenas por debajo de la media.
De modo similar, un estudiante que vivi 36 interacciones sociales en una semana presenta un
desvo de 18,6 (es decir, 3 6 -1 7 ,4 = 18,6). La puntuacin Z es 1,62 (es decir 18,6/11,49= 1,62).
Este alumno se encuentra a 1,62 desvos estndar por sobre la media en lo que se refiere a interac
ciones sociales vividas en el plazo de una semana.
Para hacerlo del modo inverso, supongamos que supiramos que la puntuacin Z de un
alumno fue 0,57. La puntuacin bruta de ese alumno (referido a la cantidad de interacciones
sociales) sera igual a la puntuacin Z por el desvo estndar ms la media: (0,57 x 11,49) +
17,4 = 23,95 (redondeando, esta persona tuvo 24 interacciones sociales). La figura 2-19 muestra
estas relaciones.
Finalmente, analicemos el ejemplo referido al tiempo de lectura de oraciones. Recorde
mos que en ese estudio calculamos que la meda de tiempo de lectura de 100 estudiantes era
2,755 segundos y el desvo estndar de 0,143 segundos. Un alumno con un tiempo de lectura de
2,88 segundos presenta una puntuacin Z calculada de la siguiente forma;
X-M
SD
2,88-2,755
0,143
0,125
0,143
. 0_
(1,0).
Alumno 2
'
Puntuacin Z:
V
-2
'
...- J
J",
,44 . : 1,86
4 I-', . f .!
-j
! '
, l".
Puntuac i n: de estrs:
' L"
,-3 ,
:
. 'y .
(9.0) . .
Alumno l
4,16
.0
..... .. " ,
+1
+ 2
+3-------- 1
13,36
' /
; .'Puntuacin Z: - 3
-2
-l
. i
"0 1
- k - 1- 1
Regjstro de actitud:'.
''.(24,0)''
Alumno 3 (17,0).
, ' (36,0)
' 1.
(2,598):,
.A lu m no3--
;
: Puntuaciones1
'
-i
V L
+f
2,469
r.'.-----1------I
; . (2,88)
(3,041)
" .Alum no-1 A lum no2 ,
- ;
1.44
+3
2 8 ,8 9 , 40,3,8 -
.1
: ~ 3 ::- 2 : i - i . : L: o
'+ 2
i:
!..
; :+2 -v +3
4.
3,041 2,184
7
3
1
6
9
3
8
2:
2X
0,61
0,61
0,15
1,37
3,80
0,00
1,37
1,37
0.61
10,04a
0,39
-1,17
-1,95
0,00
1,17
-1,17
0
0
0
0
0,39
-1,17
-1,95
0,00
1,17
-1,17
0.78
0,00
0,78
SD2 ^
0,78
0,78
0
0
0
0,7 8
0 ,7 8
0 ~
2 (X -A )2
SS
10
10
S> = Vl= 1
8 Si no hubiera errores de redondeo, el resultado sera igual a 10.
CONTROVERSIAS Y LIMITACIONES:
LA TIRANA DE LA MEDIA
Aun cuando el uso de la estadstica en psicologa es tan generalizado que pareciera ser la nica
herramienta o el nico lenguaje de esta disciplina, siempre ha existido una corriente en desacuer
do con el mtodo puramente numrico. Es nuestra intencin informar al lector, a lo largo del li
bro, sobre las controversias que existen en el campo de a psicologa con respecto a la estadstica.
Consideramos que un buen tema para comenzar a hacerlo es precisamente el debate referido al
abuso de las estadsticas.
El padre de la psicologa, Wihelm Wundt, pensaba que los experimentos y las estadsticas
deban limitarse a temas tales como la percepcin y la memoria, una opinin que rara vez se men
ciona. El mtodo apropiado para las otras reas de la psicologa era el anlisis y 1a interpretacin
del significado, procedimientos que prescinden de los nmeros (McLeod, 1996).
El conductismo se describe con frecuencia como la escuela de psicologa histricamente ms
dedicada a mantener este campo dentro de un mbito estrictamente cientfico. El conductismo se
inici alrededor del ao 1913, con el rechazo por el estudio de los estados interiores del individuo
debido a la imposibilidad de observarlos objetivamente. Pero el ms ardiente portavoz del con
ductismo, B. F. Skinner, se opona rotundamente a la estadstica. Skinner lleg incluso a decir:
Preferira ver a un graduado en psicologa asistir a un curso de fsico-qumica que de estadstica.
E incluira (presumiblemente antes que la estadstica) otras ciencias, incluso poesa, msica y ar
te (Evans, 1976, p. 93),
Por qu Skinner se opona tan rotundamente a la estadstica? l sostena que observar el com
portamiento es la mejor forma de comprenderlo, y se refera a la observacin de casos individuales.
Haca notar constantemente los datos que se perdan por promediar los resultados de varios casos.
Por ejemplo, Skinner (1956) mencionaba el ejemplo de tres ratones que coman en exceso: uno na
turalmente obeso, otro envenenado con oro y otro cuyo hipotlamo haba sido alterado. Cada uno
presentaba una curva de aprendizaje diferente (patrn de velocidad de aprendizaje) en relacin con
la destreza necesaria para presionar una barra y alcanzar el alimento; esto revelaba muchos aspec
tos acerca de los hbitos alimenticios ocasionados por cada una de las distintas enfermedades. Si se
hubieran sumado o unificado estadsticamente las curvas de aprendizaje, el resultado no hubiera re
presentado los hbitos alimenticios reales de ningn ratn real. Segn el mismo Skinner, estas tres
curvas Individuales contienen ms informacin de la que podra haber sido generada por medidas
que requirieran un tratamiento estadstico; sin embargo, las mismas sern analizadas con descon
fianza por muchos psiclogos porque representan casos individuales, (p. 232)
Diferente fue el pedido de precaucin emitido por la psicologa humanstica, cuyos comien
zos datan de la dcada de 1950 como tercera fuerza en contraposicin al conductismo y a la
principal alternativa del momento, el psicoanlisis freudiano. El tema central de la psicologa hu
manstica estableca que la conciencia humana deba ser estudiada ntegramente, como un todo,
exactamente como es experimentada por el individuo. No es posible explicar-totalmente la expe
riencia humana reducindola a nmeros (as como tampoco es posible explicarla reducindola a
palabras). La experiencia de un individuo es compleja y nica.
En el rea de la psicologa clnica y del estudio de la personalidad, a menudo se han levanta
do voces para argumentar que puede aprenderse mucho ms sobre aquello que es realmente im
portante en psicologa a partir del anlisis profundo de una persona, que respecto de promedios
entre varias de ellas. Es decir, el mtodo ideogrfico contra el nomo t tico, para utilizar los trmi
nos que Gordon Allport tom de Wiihelm Windelband (vase Hilgard, 1987). Y la base filosfica
del anlisis profundo de los individuos puede encontrarse en la fenomenologa, que naci en Eu
ropa despus de la Primera Guerra Mundial (vase Husserl, 1970).
La fenomenologa es una posicin filosfica opuesta al positivismo lgico. El positivismo l
gico sostiene que existe una realidad objetiva a ser conocida. Es la posicin filosfica que susten
ta tradicionalmente los esfuerzos cientficos. Se considera que la ciencia puede descubrir esa
realidad objetiva o verdadera dado que utiliza experimentos que cualquiera puede observar o re
petir para obtener los mismos resultados. Los fenomenlogos sostienen, sin embargo, que inclu
so estas reiteradas observaciones son en realidad hechos particulares realizados en forma
consciente. Uno no puede saber si lo que entiende por verde o la rata presion la barra siete ve
ces es lo que cualquier otro entiende por esas mismas palabras. Segn los fenomenlogos, no
existe una realidad objetiva de la cual todos podamos estar seguros.
En la actualidad, el principal desafo para la estadstica proviene del fuerte renacimiento del
inters en los mtodos cualitativos de investigacin. Ha habido una creciente preocupacin en
tre algunos psiclogos con respecto a que, luego de cien aos de investigacin estadstica cuanti
tativa, la psicologa ha producido lo que ellos consideran conocimientos de muy poca utilidad
social (Jessor, 1996). Esperan que, analizando cuidadosamente como un todo a unos pocos seres
humanos en su contexto se puedan obtener mejores resultados
Highlen y Finley (1996) describen cinco posibles posiciones filosficas que acompaan la in
vestigacin cualitativa. La primera adopta el positivismo lgico y busca una realidad objetiva a
travs de mtodos cualitativos. Tambin existe el pospositivismo, que sostiene la existencia de
una realidad verdadera pero que nunca conoceremos completamente. No obstante, esforzndonos
podemos acercamos a ella. La visin dei constructivismo subraya la existencia de mltiples rea
lidades. Cada uno de nosotros construye un significado a partir de la experiencia, y la psicologa
debera intentar comprender algunos de esos significados. La visin crtica tambin niega cual
quier realidad objetiva. Sostiene que toda ciencia sirve al propsito de alguien, y el propsito co
rrecto es la liberacin de los ms dbiles a travs de, por ejemplo, el feminismo o el neomarxismo. Finalmente, la visin postestructural persigne el objetivo de desafiar toda realidad social
mente establecida, la cual es considerada el producto de quienquiera que detente el poder. Si el
alumno an no ha considerado este tema, aconsejamos averiguar y leer al respecto para comenzar
a formar una opinin propia.
Cualquiera sea ia posicin filosfica subyacente, los mtodos cualitativos incluyen anlisis
de casos, etnografa, fenomenologa, interaccionismo simblico, anlisis de sistemas e investi
gacin de la accin1 (Hghlen & Fniey, 1996). Estos mtodos se desarrollaron principalmente en
antropologa, en donde el conducdsmo y el positivismo lgico nunca tuvieron la influencia que
lograron en la psicologa. Los mtodos cualitativos usualmente implican largas entrevistas u ob
servaciones de unos pocos individuos; mientras se realizan las entrevistas, el investigador alta
mente capacitado decide qu aspectos merecen ser recordados, registrados y analizados por
medio de otras preguntas y observaciones. Segn esta postura, la mente del investigador es la he
rramienta principal, ya que slo esa mente puede localizar las relaciones importantes entre las
muchas categoras de hechos que surgen de las palabras de quien responde.
Algunos psiclogos (p. ej., Kenney, 1995; McCracken, 1988) sostienen que los mtodos
cuantitativos y cualitativos pueden y deben complementarse. Primero deberamos descubrir las
categoras importantes a travs de un enfoque cualitativo, y luego determinar su incidencia en una
poblacin mayor a travs de mtodos cuantitativos. Este grupo de psiclogos sostiene que, con
frecuencia, los investigadores cuantitativos deciden apresuradamente cules son las categoras
importantes sin explorar primero la experiencia humana con respecto a ellas, a travs de entrevis
tas de preguntas abiertas u observaciones.
Tambin resultan de inters las opiniones muy originales del psiquiatra Cari Jung sobre lo
que l llamaba el estado de nimo estadstico. Tal como lo expresara la analista jungiana Mane
Louise von Franz (1979), tenemos un estado de nimo estadstico cuando caminamos por una
calle y observamos los cientos de rostros inexpresivos y comenzamos a sentimos disminuidos.
Nos sentimos simplemente uno ms de la multitud, comunes. O bien, cuando estamos enamora
dos, sentimos que la otra persona es nica y maravillosa; no obstante, cuando nuestro estado de
nimo es estadstico, nos damos cuenta de que la otra persona es comn, igual a muchas otras.
Von Franz seala, sin embargo, que si sucediera una catstrofe, cada persona respondera de
forma nica. En la vida existe al menos tanta irregularidad como regularidad.
El hecho de que esta mesa no levite sino que permanezca donde est slo se debe a que los miles y
miles y miles de millones de electrones que la forman tienden a comportarse de ese modo estads
ticamente. Pero cada electrn por s mismo podra comportarse de modo diferente, (p, rv-17)
Segn Franz, el estado de nimo estadstico es daino para el amor y la vida. Para contrarres
tarlo, se necesita un acto de lealtad para con nuestros propios sentimientos (p. rv-18). Los senti
mientos hacen que la vida, al igual que las relaciones y los actos parezcan nicos y les dan un
valor definido (pp. iv-18-rv-19). En particular, sentir la importancia de nuestras acciones indivi
duales hace menos posibles las inmoralidades, como por ejemplo la guerra y el homicidio. No po
demos contar los muertos como si fueran nmeros sino que debemos tratarlos como personas,
con emociones y objetivos, como nosotros mismos,.
Para resumir, podemos decir que siempre han existido buenas razones para limitar nuestro
pensamiento estadstico a su propio territorio, y dejar que nuestro corazn gobierne libremente
los otros.
Tabla 2-6.
M edias y desvos estndar de medidas de dolor, tendencias suicidas, disociacin y medidas emocio
nales del grupo de estudio.
Suicidas
M ed ici n
Umbral de percepcin
Umbral de dolor
Tolerancia al dolor
M xim a tolerancia
E stim acin de magnitud
A traccin hacia la vida
A traccin hacia la muerte
R epulsin a la vida
R epulsin a la muerte
D isociacin afectiva
D iso cia ci n cognitiva
D iso cia ci n relacionada con e l control
D esesperanza
D epresin
A ngustia
Psiquitricos
SD
SD
3 8 ,09
4 5 ,37
4 8 ,2 9
2,55
0,54
2,88
3,62
3,02
1,85
2 ,3 6
2 ,1 0
2,07
10,06
2 ,8 6
2 ,3 6
5,31
4,81
2 ,6 0
2,43
0,12
0,98
1,04
0,92
0,82
0,67
0,72
0,73
5,99
1,21
0,90
3 5 ,9 3
4 2 ,2 8
4 6,68
0 ,6 6
0,57
3 ,4 8
2,62
2,41
2 ,8 0
2 ,1 2
1,76
1,93
5,55
2 ,3 0
2 ,0 4
3,14
3,68
3,04
1,29
0,08
0,91
0,87
0,76
1,04
0,49
0,37
0,57
4,23
0,90
0,88
Normales
M
SD
33,03
40,01
46,31
1,14
0,59
4,11
2 ,6 0
1,93
2 ,6 4
2,01
1,77
1,68
4,37
1,84
1,95
0 ,5 2
3,63
4 ,2 2
1,91
0,09
0 ,5 6
0 ,8 0
0 ,6 6
1,01
0 ,4 2
0 ,4 9
0,52
3 ,7 0
0,75
0,69
Nota: Altos ndices de atraccin hacia ia vida y repulsin a la muerte representan bajas tendencias suicidas; bajos ndi
ces de repulsin a la muerte y atraccin hacia la vida representan altas tendencias suicidas.
Fuente: Orbach, I. et al. (1997), tab. 1. Umbral y tolerancia al dolor fsico en adolescentes suicidas y no suicidas. R e
vista C ien tfica de P sic o lo g a d e A se so ra m ie n to y C ln ica {J o u rn a l o f C o n su ltin g a n d C lin ic a l P sych o lo g yj , 65,
6 4 6-652. Copyright, 1997, por la A sociacin Americana de Psicologa (American Psychological Association]. Reim
preso con autorizacin.
Como podemos observar en la tabla, coincdentemente con las predicciones de los investiga
dores, el grupo suicida presentaba un umbral ms alto de dolor que los otros dos grupos y difera
de stos tambin en varias otras medidas. (Cabe destacar especialmente la gran diferencia entre el
grupo suicida y los otros dos grupos en cuanto a la desesperanza')- Por supuesto, tal como lo in
dican los desvos estndar, hay mucha superposicin entre los grupos con respecto a estas medi
ciones. Es decir, aunque teniendo en cuenta el promedio, el grupo suicida presenta un mayor
umbral de dolor; existen muchos pacientes suicidas con umbrales de dolor menores a los de los
otros grupos, y muchos individuos no suicidas con mayor umbral de dolor.
La tabla 2-7 (tomada de Norcross et al., 1996) presenta un ejemplo particularmente interesan
te. No muestra desvos estndar pero s medias y medianas. Por ejemplo, en 1992, la media de as
pirantes a doctorados de asesoramiento psicolgico era 120,2, pero la mediana era slo 110. Esto
sugiere que existan ciertos programas con una gran cantidad de aspirantes que tomaban asimtri
ca la distribucin. De hecho, podemos ver en la tabla que en casi todos los casos, y tanto para so
licitudes como para inscripciones, las medias son usualmente mayores que las medianas. (Es
probable que resulte asombrosa la competitividad que presenta el ingreso a un doctorado en mu
chas de las reas de la psicologa. Segn nuestra experiencia, uno de los factores con bastante in
fluencia en este aspecto, es haber tenido xito en los cursos sobre estadstica).
Tabla 2-7.
Estadstica de solicitudes e inscripciones
N de programas
Programa
Clnica
Cognitiva
Comunitaria
Asesoramiento
Desarrollo
Educacional
Experimental y general
Salud
ndustriai/organizacional
Personalidad
Percepcion/psicofsica
Fisologa/biopsicologa
Escolar
Social
Otras
Total
Inscripciones
M dn
M dn
1973a
1979a
1992
1973a
1979a
1992
1973a
1992
1992
1992
105
i 30
314.4
252,6
234
2
43
72
28
127
90,5
133,4
54,1
67,8
56,2
60
120
41
34
42
168
22
23
90,9
38,9
39,7
33,2
84
30
26.
25
no
20
23
25
1S
39,9
42,5
54,7
24,7
37
33
48
17
12,0
2,6
3,2
7,3
2,8
6,0
4,4
4,4
4,9
1,0
40
30
58
47
43
39
72
37
645
33,2
78,5
46,7
61,6
106,1
29,3
54,0
30,9
74,1
85,2
191,1
24,6
24,4
120,2
27,6
20,0
31,3
40.7
66,2
12,3
8,3
20,0
31,3
47,1
26,6
69,4
290
4
29
56
23
118
225
47
5
62
97
30
78
7
49
10
15
76
56
29
53
40
27
24
34
24
25
8
2
2
6
2
4
3
5
4
1
1
2
5
3
2
4
566
59
273
1,089
1979s
24
12
26
30
70
6
6
20
32
37
15
31
1,4
3,9
5,4
3,3
3,3
5,6
N ota: L os aos acadmicos corresponden a las ediciones de postrado de psicologa de 1975-1976,1981-1982, y 1994
respectivamente.
Fuente: Stoup y Benjamn (1982).
Fuente: Norcross, J. C., Hanych, J. M-, &Terranova, R. D. (1996), tab. 7. Postgrado de Psicologa: 1992-1993. P s ic lo
g o A m e ric a n o [A m erica n P s y ch o lo g ist), 51, 631-643. Copyright 1996, por la A sociacin Americana de Psicologa
[American Psychological Association]. Reimpreso con autorizacin.
Resumen
La media es un promedio comn, es decir, la suma de las observaciones dividida por la cantidad
de ellas. Expresado en smbolos, M - I XIN.
Otras formas alternativas menos comunes de descripcin de la tendencia central de una distri
bucin son la moda (el valor ms comn) y la mediana (el valor del registro medio despus de or
denar todas las observaciones de menor a mayor).
La variacin de un grupo de observaciones puede ser descripta a travs de la varanza, es de
cir, el promedio de los desvos cuadrticos de cada observacin con respecto a la media. Expresa
do en smbolos; SD2 =Z(X - M)2/N. La suma de los desvos cuadrticos tambin se simboliza
como SS. Por lo tanto SD2 = SS/N,
El desvo estndar es la raz cuadrada de la varianza. Expresado en smbolos: SD = "VSD2.
Para explicarlo en forma ms clara, es aproximadamente el promedio de las diferencias entre las
observaciones y la media.
Una puntuacin Z indica a cuntos desvos estndar por encima o por debajo de la media se
encuentra una puntuacin bruta. Entre otras cosas, las puntuaciones Z sirven para comparar ob
servaciones de variables que tienen diferentes escalas.
Siempre ha habido psiclogos que advirtieron los riesgos que implica el uso de la metodolo
ga estadstica, ya que en el proceso.de resumir los datos en un promedio se pierde informacin
sobre cada caso individual.
Las publicaciones cientficas generalmente hacen referencia a la media y al desvo estndar,
tanto en el texto como en las tablas. En cambio, rara vez se refieren a la varianza y a las puntua
ciones Z.
Trminos clave
- Tendencia central.
- Frmulas de clculo.
- Frmulas de definicin.
- Desvo.
- Media (M).
- Mediana.
- Moda.
- N.
- Puntuaciones brutas.
- Desvo cuadrtico.
- Desvo estndar (SD).
- Puntuaciones estndar.
Ejercicios
Los ejercicios implican la realizacin de
clculos (con la ayuda de una calculadora). La
mayora de los problemas estadsticos reales
se resuelven por computadora, pero aunque
exista la posibilidad de utilizar una computa
dora, es conveniente realizar estos ejercicios
manualmente para incorporar el mtodo de
trabajo.
SERIE I
1. Para cada serie de observaciones deter
mine lo siguiente (muestre ios pasos a seguir):
a) media, b) mediana, c) SS (suma de cuadra
dos), d) varianza y e) desvo estndar.
Serie A: 32,28,24,28,28,31,35,29,26.
Serie B: 6 ,1 ,4 ,2 ,3 ,4 ,6 ,6 .
2. El 26 de diciembre, en Montreal, la
temperatura, medida en 10 oportunidades
elegidas al azar y en grados Celsius, fue de 5, -4, -1, -1,0, -8, -5, -9, -13, y -24. Describa
la temperatura tpica y la variacin de la tem
peratura a una persona que nunca ha asistido
a un curso de estadstica. Presente tres mane
ras diferentes de describir la temperatura t
pica y dos formas de describir a variacin,
explicando las diferencias entre ellas y cmo
fueron calculadas. (Aprender ms si intenta
escribir primero su propia respuesta, antes de
leer la nuestra. Su propia respuesta no nece
sariamente debe ser tan completa como la
respuesta modelo del libro), ;
3. Se realiza un estudio sobre la cantidad
de sueos narrados por 30 personas en psicote
rapia, durante un perodo de dos semanas. En
una publicacin que describe los resultados,
los autores informan: La cantidad media de
sueos fue 6,84 (SD ~ 3,18). Explique el sig
nificado del enunciado anterior a una persona
que nunca ha asistido a un curso de estadstica.
4. En una medicin de angustia, la media es
79 y el desvo estndar es 12. Cules son las
puntuaciones Z correspondientes a cada una de
las siguientes puntuaciones brutas? a) 81, b) 68,
c) 103.
5. En una prueba de inteligencia en par
ticular, la cantidad media de tems correctos es
231, y el desvo estndar 41. Cules son las
puntuaciones brutas en esta prueba para perso
nas con ci (Cociente intelectual) de a) 107, b) 83
y c) 100? (El a es igual a 100, ms 16 multipli
cado por la puntuacin Z. La medida de los ci
es 100 y el desvo estndar 16.) (Nota: para re
solver este problema, primero calcule la pun
tuacin Z correspondiente a cada ci; luego uti
II
2 _ Z (X -M )2
: SS
N
N
Es muy tedioso realizar este clculo a mano, ya que primero deberamos calcular el desvo de ca
da caso. Sin embargo, el numerador de esta ecuacin, la suma de cuadrados, puede manipularse
algebraicamente de modo tal que slo sea necesario utilizar la suma de todas las observaciones
(algo que ya habr sido calculado para encontrar la media) y la suma de los cuadrados de cada ob
servacin real (lo que resulta mucho ms rpido de calcular que tener que encontrar primero cada
desvo y luego elevarlo al cuadrado). Esta frmula alternativa es la siguiente;
S X 2 - ( J , X ) 2/ N
(29)
Observemos que EX2 implica que se eleva al cuadrado cada observacin y luego se suman esos
cuadrados. Por otro lado, (EX)2 implica que primero se suman todas las observaciones y luego se
eleva esa suma al cuadrado.
La frmula de clculo del desvo estndar es la raz cuadrada de la frmula de clculo de la
varianza;
SD =
EX2 ~(XX)2/1V
N
Cantidad de sesiones
al cuadrado
(X2)
49
8
8
7
64
64
49
9
1
6
36
9
3
8
81
9
64
426
2 :6 0
(2 X )W
426
6 0 7 1 0 _ 4 2 6 - 3.600/10 _
SDZ=
N
= V 6 j= 2 ,5 7
10
10
426 - 360 ^
10
66
=6,6
lores bajos en una variable en general coinciden con valores bajos en la otra variable, y los valores
altos con los altos. Si bien el patrn est lejos de reflejar una coincidencia uno a uno, puede obser
varse una clara tendencia general.
Este patrn de valores altos en una variable que coinciden con los valores altos en la
otra variable, y bajos que coinciden con bajos, y moderados con moderados, es un ejemplo de
correlacin.
Existen innumerables ejemplos de correlacin: en el caso de los nios, existe correlacin en
tre la edad y la capacidad de coordinacin; con respecto a los estudiantes, generalmente supone
mos que existe correlacin entre la cantidad de tiempo de estudio y la cantidad aprendida; en
cuanto al mercado, usualmente suponemos que existe correlacin entre precio y calidad, que los
precios elevados coinciden con la buena calidad y los precios bajos con la mala calidad.
Este captulo explora la naturaleza de la correlacin, la forma de describirla grficamente, los
diferentes tipos de correlacin, la forma de calcular el coeficiente de correlacin (una medida del
grado de correlacin) y otros temas relacionados con la interpretacin de un coeficiente de corre
lacin. En el captulo 4 tratamos el modo en que se utiliza la correlacin para predecir el valor de
una persona con respecto a una variable basndonos en e valor de esa persona en relacin con
otra variable (por ejemplo, predecir las calificaciones de una persona en la facultad sobre la base
de sus calificaciones en la escuela secundaria). Al abordar los temas de la correlacin y de la pre
diccin, pasamos de la estadstica que trata una sola variable (captulos 1 y 2) a la estadstica refe
rida a la relacin entre dos o ms variable.
dientes a la otra variable. Por ejemplo, segn los hallazgos realizados en el estudio sobre intimi
dad e idealizacin, es razonable llegar a la conclusin de que es probable que las personas que
sienten una relacin especialmente ntima con sus parejas tambin las idealicen de una forma es
pecial. En ese caso, estamos utilizando la intimidad para predecir la idealizacin. No importa
realmente cul es la causa o efecto subyacente, siempre que intimidad e idealizacin estn firme
mente relacionadas.
Por lo tanto, al analizar dos variables relacionadas, algunos investigadores prefieren llamar a
aquella a partir de la cual realizan la prediccin, variable predictora. Sin embargo, la otra varia
ble generalmente contina denominndose variable dependiente, (El trmino adecuado para la
variable predicha es variable de criterio, pero este trmino rara vez se utiliza en psicologa, ex
cepto en algunos textos sobre estadstica). Segn lo acostumbrado, en nuestro libro generalmente
nos referiremos a una de las dos variables correlacionadas como la variable predictora, y a la otra
como la variable dependiente.
Ms adelante, en este mismo captulo, profundizaremos el tema de la causalidad, y en el cap
tulo 4 veremos exclusivamente la prediccin. Presentamos estos temas ahora en forma concisa,
porque al estudiar la correlacin es til poder emplear los nombres de las dos variables que se co
rrelacionan, y los nombres que hemos dado son los nombres convencionales. De hecho, es fre
cuente que en el campo de la psicologa lo que nos interese sea slo el grado en el que dos
variables se relacionan. Probablemente no sea necesario dar a una variable ninguna condicin es
pecial como causa de la otra o como base para realizar predicciones sobre la otra. Sin embargo, a
menudo los psiclogos se ven forzados a realizar tales distinciones aunque tengan que hacerlo en
forma arbitraria, simplemente para cumplir los estndares establecidos para la creacin de grfi
cos (como veremos muy pronto), Lo mismo sucede con la correlacin mltiple, que es ms com
pleja y que trataremos en el captulo 4.
Figura
3 - 1 . D iagram a de dispersin que m uestra la co rrelacin entre intim idad e id e a liz a c i n d e 85 alum
n o s universitarios al describir sus actuales r ela cio n es am orosas. (Fuente: A ron & Fraley, 1998),
cho y para la altura respectivamente. Los diagramas de dispersin son cuadrados, con una rela
cin 1 a 1 para los ejes horizontales y verticales).
En la figura 3-1, el eje horizontal comienza con el valor 1 (el menor puntaje posible en la es
cala de intimidad, que es un promedio de varias preguntas contestadas cada una de ellas con refe
rencia a una escala del 1 al 9). El eje vertical comienza con 19, que es la menor puntuacin
posible de la escala de idealizacin (esta escala incluye 19 tems, clasificados del 1 al 9. El punta
je total de la escala es la suma de los 19 tems). El valor ms alto en el eje horizontal es 9,0, la m
xima puntuacin posible en la escala de intimidad. El valor ms alto en el eje vertical es 171, la
mayor puntuacin posible en la escala de idealizacin.
3,
Marcar un punto por el par de observaciones de cada persona. Ubicar el lugar en el eje ho
rizontal que corresponde al valor observado de la persona en la variable predictora, Luego mover
se haca arriba hasta llegar a la altura en el eje vertical que corresponde al valor observado de la
misma persona con respecto a esa variable, y marcar un punto bien claro.
Si en un mismo lugar coinciden dos casos, se puede escribir el nmero 2 en ese lugar o mar
car un segundo punto lo ms cerca posible del primero, si es posible tocndolo, pero dejando en
claro que en realidad hay 2 puntos en el mismo lugar.
Ejemplo
Supongamos que una empresa est pensando aumentar la cantidad de personal bajo el mando de
cada uno de sus gerentes de piso. Sin embargo, la empresa est preocupada por el estrs que sto
podra provocar a sus gerentes. La empresa supone que cuantas ms personas supervise un geren
te, mayor ser el estrs sufrido por l. Para analizar la situacin, un psiclogo laboral sugiere es
tudiar a cinco gerentes seleccionados al azar de entre todos los gerentes de piso de la empresa.
(En la prctica, debera utilizarse un grupo mucho mayor, pero aqu utilizaremos slo cinco casos
para simplificar el ejemplo). Se entrega a cada uno de los cinco gerentes un cuestionario de medi
cin de estrs en el cual los posibles registros van de 0 (estrs nulo) a 10 (estrs extremo). Los re
sultados podran ser como los que indica la tabla 3-1.
1. Dibujar los ejes y determinar qu variable representa cada uno de ellos. La empresa est in
teresada en el efecto causado en el nivel de estrs por la cantidad de empleados supervisados. Por
lo tanto, consideramos la cantidad de empleados supervisados como la variable predictora y ubi
camos esa informacin en el eje horizontal; el nivel de estrs es la variable dependiente y, por lo
tanto, debe ubicarse en el eje vertical. (Vase figura 3-2a).
2. Determinar la serie de valores que se van a utilizar para cada variable y marcarla en los
ejes. Para el eje horizontal, supongamos que en esta empresa no se permite a ningn gerente su
pervisar ms de 12 empleados. Por lo tanto, el eje horizontal va de 0 a 12. Eeje vertical va de 0 a
10, que son los lmites del cuestionario de medicin de estrs. (Vase figura 3-2b).
3. Marcar un punto por el par de observaciones de cada persona. En el caso del primer geren
te, la cantidad de empleados supervisados es . Localizamos el nmero en el eje horizontal.
Luego, subimos hasta alcanzar el nivel del nmero 7 en el eje vertical (el nivel de estrs del pri
mer gerente). Marcamos un punto en ese lugar (vase figura 3-2c). Seguimos el mismo procedi
miento con cada uno de ios cuatro gerentes restantes. El resultado debera ser el que muestra la
figura 3-2d.
PATRONES DE CORRELACIN
Hasta ahora hemos considerado aquellas situaciones en las que los valores altos coinciden con los
altos, los bajos con los bajos y los medianos con los medianos. A ese tipo de situacin se la deno
mina correlacin positiva. Debido a que el patrn que muestra el diagrama de dispersin se
aproxima a una lnea recta, es tambin un ejemplo de correlacin lineal.
Por ejemplo, en el diagrama de dispersin de la figura 3-1 se podra dibujar una recta que
muestre la tendencia general de los puntos, tal como lo hemos hecho en la figura 3-3. Del mismo
modo, se podra dibujar una recta en nuestro segundo ejemplo, como lo muestra la figura 3-4.
(Una de las razones por las que estos casos de correlaciones lineales se denominan positivas se
debe a que, en geometra, la pendiente de una recta es positiva cuando observarnos que la recta se
eleva a medida que desplazamos nuestra mirada desde la izquierda hacia la derecha del grfico.
En el captulo 4, aprenderemos reglas precisas para trazar tales rectas y determinar su pendiente).
T a b la 3 - 1 .
E m p l e a d o s s u p e r v i s a d o s y n iv e l d e e s t r s ( d a t o s f i c t i c io s ) .
E m p ic a d o s su p e r v isa d o s
6
8
8
i
10
. $
, (^tidadde em|Me^ipryi$d<. .
io' ' ;
\:>lM';7vS
4-
5 6 7
:M ';-''\.V:;VCJantdd<ie'empleados soperrados.:
/. 0
' / '
3 4 / 5," 6
Q & } ;^
F ig u r a 3 -2 , C m o hacer un diagram a de dispersin , (a) S e determ inan los e je s, la variable pred ictora (e m
p le a d o s su p erv isa d o s) se ub ica en e l e je horizontal y la variable d ep en d ien te (n iv el d e estrs) en. e l e je verti
cal. (b ) S e m arca la serie v a lo res so b re lo s ejes, (c ) S e m arca el pu nto determ inad o por e l par d e valores
o b serv a d o s co rresp o n d ien tes al prim er gerente, (d ) S e m arca un punto d on d e s e cruza p or cad a par d e v a lo
res o b serv a d o s d e lo s c in c o gerentes.
Correlaciones negativas
A veces, la relacin entre las variables no es positiva. Por el contrario, los valores altos coinciden
con ios bajos y los bajos con los altos. A esto se denomina correlacin negativa. Por ejemplo, en
un estudio de las relaciones amorosas entre estudiantes (Aron & Fraley, 1998), ios investigadores
descubrieron que cuanto ms lejos de su pareja vive una persona (en funcin de los minutos de
viaje), menos cantidad de actividades comparte con su pareja. El diagrama de dispersin de la fi
gura 3-5 representa grficamente este patrn de correlacin.
Incluimos una recta en la figura para remarcar la tendencia general de los puntos; as, podemos
observar que a medida que la recta avanza hacia la derecha, tambin se dirige hacia abajo. Es de
cir. cuantas ms son las horas de viaje, menos actividades se realizan en pareja.
F ig u r a 3 -3 . D iagram a d e d isp ersi n de la figura 3-1 c o n un a recta q u e in d ica la ten d en cia general. (F u e n te :
A ron & Fraley, 19 9 8 ).
F ig u r a 3 -4 . D iagram a d e d isp e r si n d e la
figura 3 -2 d c o n una recta qu e in d ica la tend en
c ia general.
Una investigacin realizada por Bardsley y Rhodes (1996), dos psiclogos especializados en
organizaciones empresariales, ilustra tambin una correlacin negativa. A travs de un estudio
realizado con 174 obreros, descubrieron que el hecho de llegar tarde a trabajar tena una corre
lacin lineal negativa con la satisfaccin laboral. Cuanto mayor era el grado de satisfaccin la-
F ig u r a 3 -5 . D ia g ra m a de d isp ersi n c o n una recta q u e in d ic a la ten d en cia gen eral d e una correlacin n e g a
tiva entre d o s variables: d ista n cia en m in u to s d e v ia je y cantid ad d e activid ad es d iferen tes q u e e l p artici
pante realiza co n su pareja. (F u e n te : A ron & F raley, 1 9 9 8 ).
boral de los obreros, menos frecuentemente llegaban tarde. En otras palabras, cuanto menor era
el nivel de satisfaccin de los obreros, con ms frecuencia llegaban tarde a trabajar.
Correlaciones curvilneas
En algunos casos, la relacin entre dos variables no sigue una lnea recta positiva o negativa, sino
un patrn ms complejo denominado correlacin curvilnea. Por ejemplo, se sabe que hasta de
terminado nivel, una mayor ansiedad fisiolgica hace que uno se desempee mejor en cualquier
tarea (como por ejemplo, una prueba de matemtica). A partir de ese nivel, una mayor ansiedad
fisiolgica hace que el rendimiento empeore. Es decir, desde estar casi dormido hasta un nivel
moderado de ansiedad, la efectividad aumenta. Al superar ese nivel moderado, el aumento de la
ansiedad puede acelerar demasiado a un individuo, impidindole tener un buen rendimiento.
Este patrn curvilneo en particular est representado en la figura 3-6, en donde se observa que
sera imposible dibujar una lnea recta para describirlo. La figura 3-7 muestra algunos otros ejem
plos de relaciones curvilneas.
A travs del mtodo usual de clculo de la correlacin (mtodo que aprenderemos en este ca
ptulo) obtenemos el grado de correlacin lineal. Si el verdadero patrn de asociacin es curvil
neo, calcular la correlacin con el mtodo usual podra dar como resultado muy poca correlacin
o una correlacin nula. Por eso es muy importante observar los diagramas de dispersin para des
cubrir estas relaciones ms interesantes, antes de realizar correlaciones automticamente con el
mtodo usual, suponiendo que la tnica relacin posible sea una lnea recta.
F ig u r a 3 -6 . E jem p lo d e relacin
curvilnea: d e sem p e a en una tarea
y ansiedad.
Correlacin nula
Tambin es posible que no exista ningn tipo de relacin entre dos variables. Por ejemplo, si hi
ciramos un anlisis entre la creatividad y el numero de calzado, los resultados podran ser simi
lares a los que muestra la figura 3-8. Los puntos se dispersan en todas las direcciones, y no existe
lnea recta ni de ningn otro tipo que pueda considerarse indicio razonable de una tendencia. Esto
simplemente es una correlacin nula.
En investigaciones reales, algunas veces existe una relacin entre dos variables, pero al no ser
muy fuerte, es difcil notarla en un diagrama de dispersin. Esto suele suceder especialmente en
anlisis en los que se estudia a una gran cantidad de personas y la relacin entre las dos variables
es muy leve o subliminal. En esos casos, uno podra estar seguro de que la relacin es ms que
una coincidencia, justamente debido a su leve pero consistente presencia en un grupo tan grande
de personas. La figura 3-9 muestra un diagrama de dispersin con una leve correlacin lineal po
sitiva entre dos variables. Es posible observarla?
F ig u r a 3 -8 . D o s variab les sin a so c ia c i n entre s, cre
atividad y n m ero d e ca lza d o (d a to s fic ticio s).
F ig u r a 3 -9 . D iagram a de
dispersin en e l que se en
contr un a le v e co rrela
c i n lin e a l p o sitiv a entre
las d o s variab les.
Grado de correlacin
El grado de correlacin indica en qu medida existe un patrn claro de alguna relacin en par
ticular entre dos variables. Por ejemplo, vimos que existe una correlacin lineal positiva cuan
do los valores altos coinciden con los valores altos, los medios con los medios y los bajos con
los bajos. Por lo tanto, el grado de una correlacin de este tipo determina cuntos valores altos
coinciden con otros tambin altos, y as sucesivamente. Del mismo modo, el grado de correla
cin lineal negativa indica cuntos valores altos de una variable coinciden con valores bajos de
la otra, y as sucesivamente. En cuanto a los diagramas de dispersin, un alto grado de correla
cin lineal significa que todos los puntos se encuentran muy cerca de una lnea recta (la recta
que se inclina hacia arriba o hacia abajo segn la correlacin lineal sea positiva o negativa).
Una correlacin lineal perfecta es aquella en la que todos los puntos estn ubicados exactamen
te sobre la lnea recta.
una puntuacin Z baja por otra puntuacin Z baja, tambin se obtiene siempre un producto cruza
do positivo debido a que, ms all de qu escala se utilice, los valores que se encuentran por deba
jo de la media (valores bajos) se convierten en puntuaciones Z negativas, y un nmero negativo
multiplicado por un nmero negativo siempre produce un nmero positivo.
Cuando los valores altos de una variable coinciden con los altos de la otra, y los bajos de una
con los bajos de la otra, el producto cruzado de puntuaciones Z siempre ser positivo. Suponga
mos que tomamos toda una distribucin de valores observados y multiplicamos la puntuacin Z
de cada persona en una variable por la puntuacin Z de esa persona en la otra variable. El resulta
do de esta operacin, cuando ios valores altos coinciden con ios altos y los bajos con los bajos, es
que todos los productos resultarn positivos. Si luego sumamos esos productos cruzados de pun
tuaciones Z de todas las personas incluidas en el estudio, que son todos positivos, obtendremos un
gran nmero positivo.
Por otro lado, consideremos lo que sucedera con una correlacin lineal negativa, en la que
los valores altos coinciden con los bajos y los bajos con los altos. En cuanto a las puntuaciones Z,
esto significara multiplicar positivos con negativos y negativos con positivos, y obtendramos to
dos productos cruzados negativos que, sumados, daran como resultado un gran nmero negativo.
Finalmente, supongamos que no existe una correlacin lineal. En esa situacin, en algunos
casos los valores altos de una variable coincidiran con valores altos de la otra variable (y algunos
valores bajos coincidiran con valores bajos), dando como resultado productos cruzados positi
vos. En otros casos, los valores altos de una variable coincidiran con valores bajos de la otra (y
algunos valores bajos coincidiran con valores altos), dando productos cruzados negativos. Al su
mar los productos cruzados de todas las personas incluidas en el estudio, los productos cruzados
positivos y negativos se cancelaran unos a otros, dando un total cercano a 0 .
En cada una de las situaciones arriba mencionadas convertimos todos los valores en puntua
ciones Z, multiplicamos las dos puntuaciones Z de cada persona y sumamos los productos cruza
dos. El resultado es un gran nmero positivo, si existe una correlacin lineal positiva; un gran
nmero negativo, si existe una correlacin lineal negativa, y un nmero cercano a 0, si no existe
correlacin lineal.
Sin embargo, todava no hemos resuelto el problema de determinar el grado de una correla
cin positiva o negativa. Aparentemente, cuanto mayor sea el nmero, mayor ser la correlacin.
Pero a partir de qu nivel se considera que un nmero grande es tal, y qu nmeros grandes no lo
son tanto? No podemos definirlo simplemente por la suma de los productos cruzados, que aumen
ta slo por el hecho de incluir ms participantes en el estudio. (Es decir, un estudio con 100 parti
cipantes presentara una suma mayor de productos cruzados que el mismo estudio con slo 25
participantes).
La solucin a este problema es dividir la suma de productos cruzados de puntuaciones Z por
la cantidad de casos. Es decir, calculamos el promedio de los productos cruzados de puntua
ciones Z, que nunca podr ser mayor a + 1, y que en el caso de ser igual a +1, indicara una corre
lacin perfecta lineal positiva. Por otro lado, el valor mnimo de este promedio es -1, e indicara
una correlacin perfecta lineal negativa. En el caso de que no exista correlacin lineal, el prome
dio de los productos cruzados de puntuaciones Z ser 0.
Generalmente, las correlaciones no son perfectas. En el caso de una correlacin lineal positi
va que no es perfecta, el promedio de los productos cruzados de puntuaciones Z estar entre 0 y
+1. Para decirlo de otro modo, si la tendencia general de las puntuaciones es ascendente y hacia la
derecha, pero no coinciden exactamente con la lnea recta, este nmero estar entre 0 y +1. La
misma regla se aplica para las correlaciones negativas: el nmero estar entre 0 y - 1.
El coeficiente de correlacin
El promedio de los productos cruzados de puntuaciones Z es, entonces, un excelente modo
de calcular el grado de correlacin lineal. Se lo denomina coeficiente de correlacin. Tam
bin se lo llama coeficiente de correlacin de Pearson (o, para ser muy tradicionales, coefi
ciente de correlacin producto-m om ento de Pearson), Lleva el nombre de Karl Pearson (a
quien presentaremos en el cuadro 4-1). Pearson, junto con Francis Galton (vase cuadro 3-1),
desempe un papel fundamental en el desarrollo del coeficiente de correlacin. El coefi
ciente de correlacin se representa con la letra r, que es la forma abreviada de regresin, un
concepto muy relacionado con la correlacin (que veremos en el captulo 4). Tambin es im
portante saber que en algunas publicaciones cientficas se hace referencia a los coeficientes
de correlacin como correlaciones de orden cero (veremos las razones para este nombre en
el captulo 17).
La figura 3-10 muestra diagramas de dispersin e indica el coeficiente de correlacin de va
rios ejemplos.
F igura 3-10. D iagram as d e d isp ersi n y c o e fic ie n te s d e correlacin d e d iversos e je m p lo s c o n d iferen tes gra
d o s d e co rrela ci n lin eal.
La exposicin precedente puede resumirse en unos pocos smbolos, ia frmala del coeficiente de
correlacin:
r = ,ggx.gx,
(3-1)
N
r es el coeficiente de correlacin, Zx es la puntuacin Z de cada persona en la variable X, Zy es la
puntuacin Z de cada persona en la variable Y. ZxZy es igual al producto Zx por Zy (el producto
cruzado de puntuaciones 2 ) de cada persona, y 2 ZxZy es la suma de los productos cruzados de to
das las personas incluidas en el estudio. N es la cantidad de personas que participan en el estudio.
Uniendo todos los datos, 2ZxZy dividida por V, es el promedio de los productos cruzados de pun
tuaciones 2 .
Intentemos aplicar los pasos enumerados ai ejemplo del nivel de estrs de los gerentes.
1.
Convertir todas las observaciones en puntuaciones Z. Comenzando con la cantidad de em
pleados supervisados, la media es 7 (la suma, que es igual a 35, dividida por 5 gerentes) y el des
vo estndar es 2,37 (la suma de los desvos cuadrticos, 28, dividida por 5 gerentes, es igual a
una varianza de 5,6, cuya raz cuadrada es 2,37). En el caso del primer gerente, entonces, un valor
observado de 6 es una unidad por debajo de la media 7, y 1 dividido 2,37 es 0,42. Por lo tanto, la
puntuacin Z del primer gerente referido a la cantidad de empleados supervisados se ubica a 0,42
desvos estndares por debajo de la media o, lo que es igual, presenta una puntuacin Z de - 0,42.
Calculamos el resto de las puntuaciones Z del mismo modo y las ordenamos en las columnas co
rrespondientes de la tabla 3-2.
2 . Calcular el producto cruzado de las puntuaciones Z de cada persona. En el caso del primer
gerente, multiplicamos - 0,42 por 0,38: el resultado es -0,16. La ultima columna de la tabla 3-2
muestra los productos cruzados de iodos los gerentes.
3. Sumarlos productos cruzados de puntuaciones Z. Como lo indica la tabla 3-2, el total es 4,38.
4. Dividir el resultado del paso anterior por la cantidad de personas incluidas en el estudio, es
decir, 4,38 dividido 5 (la cantidad de gerentes incluidos en el estudio). El resultado es 0,876. Este
es el coeficiente de correlacin que, redondeado, es igual a 0,88. Aplicando la frmula del coefi
ciente de correlacin,
5 2 ^ 4 3 8
N
5
Dado que el coeficiente de correlacin calculado es positivo y cercano a 1, es decir, el mayor va
lor posible, podemos afirmar que estamos frente a una correlacin lineal fuertemente positiva.
T a b la 3 - 2 .
C lc u lo d e l c o e fic ie n te d e c o r r e la c i n p a r a e l e je m p lo d e l n iv e l d e e s t r s d e lo s g e r e n te s
( d a t o s fic tic io s ).
C a n tid a d d e E m p le a d o s S u p e rv isa d o s (X )
X
X -M
-1
3
.10
-4
(X - M f
1
zx
- 0 ,4 2
a 35
SS
=7
SD3 =
5 ,6 0
SD
2 ,3 7
=
*
28
Y -M
1,27
.8 " :
0 ,4 2
'2-
Prod. C ruzados
T -M )2
Zy
0,38
25
S o I B
- 1 ,9 2
: 8 l ; . r .-2 (
1
-5
I--.V-M.; 0 ,4 2 A
16
-1 ,6 9
N ivel d e E str s (Y )
ZxZy
- 0 ,1 6
0 ,3 2
3 ,2 4
.. - 4 7 r i ;
2 = 30
SS - 3 4
M = 6
S D * = 6 ,8 0
SD = 2,61
0 ,0 0
0 ,0 0
2 Z x Z r = 4 ,3 8
r
0,88
'
Combinando los distintos procedimientos tratados en este captulo, los pasos a seguir son los siguientes:
1. Construir un diagrama de dispersin.
a ) D ib u ja r l o s e j e s y d e te r m in a r q u v a r ia b le v a e n c a d a u n o d e e llo s .
b) Determinar ia serie de valores que se van a utilizar para cada variable y marcarla en
los ejes.
c) Marcar un punto por el par de observaciones de cada persona.
2. Determinar si el patrn es claramente curvilneo. Si lo es, no se calcula el coeficiente de co
rrelacin (o si se lo calcula, debe tenerse en cuenta que slo se est describiendo el grado
de relacin lineal).
3. Estimar la direccin y el grado de correlacin lineal.
4. Calcular el coeficiente de correlacin.
a) Convertir todas las observaciones en puntuaciones Z.
c) Calcular el producto cruzado de las puntuaciones Z de cada persona.
d) Sumar los productos cruzados de puntuaciones Z.
e) Dividir el resultado por la cantidad de personas incluidas en el estudio.
5. Controlar el signo y el tamao del coeficiente de correlacin calculado, comparndolo con
la estimacin visual realizada a partir del diagrama de dispersin.
Como observamos anteriormente, en una investigacin real el coeficiente de correlacin se
calculara en cuestin de segundos utilizando una computadora. La mayora de ios paquetes de
computacin pueden realizar tambin un diagrama de dispersin (y algunos hasta explican cmo
se establecen sus ejes y escalas). Sin embargo, la finalidad de incluir los ejemplos (y resolver los
ejercicios al final del captulo) y aplicar todos estos pasos bastante tediosos es comprender la l
gica implcita en los resultados que, con tanta facilidad, surgen de la computadora.
Ejemplo
Supongamos que una persona que investiga el funcionamiento de la memoria realiza un experi
mento para comprobar la teora de que la cantidad de exposiciones a una palabra aumenta las pro
babilidades de que sea recordada. Dos individuos son elegidos al azar para observar una lista de
10 palabras una sola vez, otros dos individuos observan la lista dos veces, y as sucesivamente,
hasta llegar a ocho exposiciones de cada palabra, y 16 participantes en total. La tabla 3-3 indica
los resultados de este experimento ficticio. (Un estudio real de este tipo probablemente dara un
resultado ms curvilneo debido a que, en esta clase de investigaciones, cuanto mayor sea la can
tidad de exposiciones, menor ser el aumento relativo de palabras recordadas).
1. Construir un diagrama de dispersin.
a) Trazar los ejes y determinar qu variable deber marcarse en cada uno de ellos. Segn el
diseo del experimento, la cantidad de exposiciones es la variable independiente, por lo
que estar ubicada en el eje horizontal. La cantidad de palabras recordadas es la variable
dependiente, por lo que estar ubicada en el eje vertical (vase figura 3-1 la).
b) Determinar la serie de valores que se van a utilizar para cada variable, y luego marcarla
en los ejes. En el estudio que estamos analizando, la-cantidad de exposiciones vara de 1
a 8, pero comenzaremos con 0 para cumplir con las reglas convencionales. La cantidad
de palabras recordadas no puede ser menor que 0 ni mayor que 10, cantidad total de pa
labras en la lista (vase figura 3-1 Ib).
T a b la 3 - 3 .
Cantidad de exposiciones
c) Marcar los puntos determinados por el par de observaciones de cada persona. El primer
punto se ubica con coordenada 1 segn el eje horizontal, y 4 segn el eje vertical. Mar
cando cada uno de los punios, de este mismo modo, completamos el diagrama de disper
sin (vase figura 3- i 1c).
2. Determinar s el diagrama es claramente curvilneo. Parece existir una fuerte tendencia lineal.
3. Estimar la direccin y el grado de correlacin lineal. Los puntos van hacia arriba y hacia la
derecha, y la mayora de ellos estn ubicados muy cerca de una lnea recta imaginaria. Por
lo tanto, aparentemente se trata de una correlacin lineal positiva bastante fuerte.
4. Calcular el coeficiente de correlacin.
a) Convertir todas las observaciones en puntuaciones Z. La media de la cantidad de exposi
ciones es 4,50, con un desvo estndar de 2,29. Por lo tanto, la primera observacin, que
es igual a I, se ubica 3,5 unidades por debajo de la media, lo que implica 1,53 desvos
estndares debajo de la media, o sea Z = -1,53. Utilizando el mismo procedimiento para
todas las otras observaciones se obtienen las puntuaciones Z que aparecen en las colum
nas correspondientes de la tabla 3-4. (La tabla no indica los pasos para el cmputo del
desvo y del desvo cuadrtico utilizados para calcular el desvo estndar).
b) Calcular el producto cruzado de las puntuaciones Z de cada persona. Por ejemplo, el pri
mer producto cruzado es -1,53 por -0,74, lo que da un resultado de +1,13. Todos los
productos cruzados aparecen en la columna ubicada a la derecha en la tabla 3-4.
c) Sumar los productos cruzados de las puntuaciones Z. El total es 10,80.
d) Dividir el resultado por la cantidad de personas. El resultado de dividir la suma de los
productos cruzados de puntuaciones Z, 10,80, por la cantidad de personas, 16, es 0,68,
que es el coeficiente de correlacin. Es decir, r = 0,68.
5. Controlar el signo y el tamao del coeficiente de correlacin calculado comparndolo con
, la estimacin realizada a partir del diagrama de dispersin. El resultado calculado de +0,68
es, como esperbamos, una correlacin lineal positiva bastante marcada.
C orreteeoa
87
10 '
9
8
7
6
5
*.
.3
2
i-
..... ......................................... ; :
Exposiciones
Exposiciones
(a) '
(b)
.10
.- 9
8'
S B illli!
. " v. . . .'^.::'i
i. - - :
' .-Vivvii
'0 1 2 -3 4-5 6 7 8
.
. Exposiciones. \ \r
"
(c)
y-?'
-S
"vi;"
Figura 3-11. Pasos que se deben seguir para confeccionar un diagrama de dispersin segn ios datos de la
tabla 3-3. (a) Establecer los ejes, la variable independiente (cantidad de exposiciones) en el eje horizontal,
la variable dependiente (cantidad de palabras recordadas) en el eje vertical; (b) determinar la serie de valo
res, y marcarlos en los ejes; (c) ubicar un punto por cada par de observaciones de cada uno de los 16 parti
cipantes (datos ficticios).
Otro Ejemplo
Supongamos que una psicloga educacional averigu la cantidad promedio de alumnos por clase
y los promedios de calificaciones en las pruebas de nivel de cinco escuelas primarias de determi
nado distrito escolar. La tabla 3-5 muestra los datos. La pregunta formulada por la psicloga es:
Cul es la relacin entre estas dos variables?
1. Construir un diagrama de dispersin.
a) Dibujar los ejes y determinar en cul se ubica cada variable. Dado que resulta razonable
pensar que la cantidad de alumnos por clase afecta las calificaciones en las pruebas de
nivel, y no al revs, podemos trazar en la parte inferior el eje correspondiente a la canti
dad de alumnos por clase.
Tabla 3-4.
Clculo d d coeficiente de correlacin del efecto producido por el nmero de exposiciones en la
cantidad de palabras recordadas (datos ficticios).
Id en tifica ci n
d el p a rticip a n te
-,
.
1
2 :
3
4
5
7
8 ;
9
10 V
11
12
13
14
15
16
;
:
1
2
2
3
3
4
4 '
5
5 r .,
6
7
7
8
. .8
Zx
C a n tid a d de p a la b ra s record ad as
(v ariab le d ep en d ien te)
'
-1 ,5 3
-1 ,5 3
- 2 ,0 9
-1 ,0 9
-0 ,6 5
- 0 ,6 5
- 0 ,2 2
- 0 ,2 2
0 ,2 2
0 ,2 2
0,65
0,65
1,09
1,09
1,53'
1,53
72
M:
4,5 0
S D ~ i % m 6 = 2,29
Zy
- 0 ,7 4
-1 ,2 1
-1 ,2 1
.5
- 0 ,2 6
6
0,21
4
- 0 ,7 4
- 0 ,7 4
4
0,21
... 6
-0 ,2 6
5
0,68
.. ..
7 --,
2
1,68
1,62 ^
. v V - L , 9
0,21
V
- i,i5
. .;..c -L
1,62
9
1,15
.
'.v, . v
. 8;.
4
3.
3
^ 7 2 /1 6
P ro d u cto cru za d o
d e p u n tu a c io n es Z
2xZ y
1,13
1,85
1,32
0 ,2 8
-0 ,1 4
0,48
0 ,1 6
-0 ,0 5
- 0 ,0 6
- ' 0,15 ...-V:
- 1 ,0 9
i ,5
0,23
1,25
2,48
1,76
10,80
89
5.56
2,12
r = 0,68
Determinar la serie de valores que se van a utilizar para cada variable y marcarla en los
ejes. Presumiremos que las calificaciones en las pruebas de nivel van de 0 a 100. La can
tidad de alumnos por clase debe ser por lo menos de 1 (y seguramente la poltica de la
junta escolar exige que sean ms). No conocamos el mximo, as que supusimos que
poda ser 50.
c) Marcar un punto por cada par de observaciones obtenidas de las personas (en este caso,
de las escuelas). La figura 3-12 muestra el diagrama de dispersin completo.
2. Determinar si el diagrama muestra claramente una correlacin curvilnea. En trminos ge
nerales, la correlacin parece mantener un patrn lineal (aunque con tan pocos puntos es
difcil de decir).
b)
Tabla 3-5.
Promedios de cantidad de alumnos por clase y de calificaciones en las pruebas de nivel en cinco
escuelas primarias (datos ficticios).
E scu ela
p rim a ria
T am ao
de la cla se
C alificacin en la p ru eb a
d e ren d im ien to
M ain Street
Casat
Hara ad
Shady Grove
Jefferson
25
14
33
28
20
80
98
50
82
90
:'15
SS;--4$43|5ap
3. Estimar la direccin y el grado de correlacin lineal. Los pumos tienen una direccin mar
cada haca abajo y hacia la derecha, indicando una fuerte correlacin lineal negativa.
4. Calcular el coeficiente de correlacin.
a) Convertir todas las observaciones en puntuaciones Z. La media de la cantidad de alum-
nos por case es 24 y el desvo estndar es 6,54. La puntuacin Z de la cantidad de alum
nos de la primera ciase, 25, es igual a (25 - 24)/6,54 - 0,15. Todas las puntuaciones Z
aparecen en la columna correspondiente de la tabla 3-6.
b) Calcular los productos cruzados de las puntuaciones Z de cada persona (en este caso,
de cada escuela). El primer producto cruzado es 0,15 x 0, que es igual a 0. El segundo
es -1,53 x 1,10, que es igual a -1,68. Todos los productos cruzados de las puntuaciones
Z aparecen en a columna de la derecha de la tabla 3-6.
c) Sumar los productos cruzados de las puntuaciones Z. El total es -4,52.
d) Dividir el total por la cantidad de personas (en este caso, escuelas). La suma (-4,52) divi
dida por 5 es igual a -0,90. Es decir, r - -0,90.
5. Controlar el signo y el tamao de coeficiente de correlacin calculado, comparndolo con
la estimacin realizada a partir del diagrama de dispersin. Un coeficiente de 4),90 con
cuerda perfectamente con la estimacin original que indicaba una fuerte correlacin lineal
negativa.
Tabla 3-6.
Clculo del coeficiente de correlacin entre las cantidades promedio de alum nos por case y de
calificaciones en ias pruebas de rendimiento en cinco escuelas prim arias (datos ficticios).
E s c u e la
T a m a o d e la d a s e
M ain Street
Casat
Harland
Shady Grove
Jefferson
2:
M:
Zx
25
0,15
4 ,5 3
1,38
0,61
-0 ,6 1
14
33
28
20
120
24
S D - ^24/5 = 6,5 4
C a lific a c i n e n la p r u e b a
d e r e n d im ie n to
Y
80
98
50
82
90 400
80
T l 328/5 - 16,30
p r o d u cto C ru za d o
Zy
Z*Zr
0,00
u o
-1 ,8 4
0,12
0,61
0 ,0 0
1,68
2,53
0,08
0,38
- 4 0 ,5 2
r = - 0 ,9 0
1J-'
4 4 Cuadro 3 -2 .
e m u u u , U U 9 U 1 y a . ; x nu a i i u u : i e > i a i H u a t u m u i c L d i i i c m c s t
Sin embargo, existen excepciones. En este mismo captulo utilizamos un ejemplo en el que
los participantes eran asignados al azar en determinada cantidad de exposiciones y luego se me
da la cantidad de palabras recordadas. A partir de los datos obtenidos, calculamos un coeficiente
de correlacin. No obstante, en el estudio no se utiliz un diseo de investigacin correlaciona];
fue un verdadero experimento, ya que los participantes eran asignados al azar a diferentes valores
de la variable independiente. Por s mismo, el coeficiente de correlacin que calculamos no nos
indic nada acerca de la causalidad. Aun as, qued claro, por el diseo de investigacin, que la
nica direccin causal posible es que la cantidad de exposiciones haya causado la diferencia en la
cantidad recordada.
El coeficiente de correlacin y la reduccin proporcional de error
Un coeficiente de correlacin indica la fuerza o el grado de una relacin lineal; mayores valores
de r (valores alejados de 0) indican un mayor grado de correlacin. Es decir, una r de 0,4 signifi
ca que existe una correlacin lineal ms fuerte que una r de 0,2. Sin embargo, la mayora de los
investigadores sostendran que una r de 0,4 no es el doble de fuerte que una r de 0,2; Para compa
rar correlaciones ntre s, la medida utilizada por la mayora de los investigadores es r2, A esto se
lo denomina, por razones que veremos en el captulo 4, reduccin proporcional dei error (y
tambin proporcin de varianza explicada).
Una correlacin de 0,2 es equivalente a una r2 de 0,04, y una correlacin de 0,4 es equivalen
te a una r2 de 0,16. Por lo tanto, una correlacin de 0,4 implica en realidad una relacin cuatro
veces ms fuerte que una de 0,2 !
Restriccin del rango
Supongamos que un psicolgo especializado en educacin est interesado en la relacin entre el
grado que cursa un nio y los conocimientos sobre geografa. S el investigador estudiara el rango
completo de grados escolares, los resultados podran ser como los que aparecen en el diagrama de
dispersin de la figura 3- 13a. Es decir, el investigador podra encontrar una fuerte correlacin po
sitiva. Pero supongamos que el investigador hubiera estudiado slo los tres primeros grados (en
Figura 3-13. E jem p lo d e restriccin d el ra n g o com parand o d os d iagram as d e d isp ersin : (a) c u an d o s e
m uestra la serie d e va lo res c o m p le ta (grado e sc o la r y c o n o c im ie n to s sob re g eo g ra fa ) y (b ) cu a n d o se
restringe la s er ie d e v a lo res (a lo s prim eros tres grados).
los que se ensea poca geografa). El diagrama de dispersin (vase figura 3-13b) reflejara muy
poca, o casi ninguna correlacin (la correlacin calculada sera cercana a 0) y, sin embargo, el in
vestigador estara incurriendo en error si llegara a la conclusin de que el grado no est relaciona
do con los conocimientos sobre geografa en ninguno de los grados escolares.
El problema en este caso es que la-correlacin.est basada en una serie de observaciones que
incluyen slo un rango limitado de los valores posibles de una de las variables. (En este ejemplo
existe un rango limitado de grados escolares). Es errneo pensar en la correlacin como si se apli
cara a todo el rango de valores que podra tener la variable. Esta situacin se denomina restric
cin del rango.
Es fcil cometer estos errores al interpretar correlaciones, las cuales incluso aparecen oca
sionalmente en publicaciones cientficas y se oyen con frecuencia an mayor en discusiones in
formales sobre resultados de investigaciones. Por ejemplo, en el rea de los negocios, a veces se
intenta determinar si las pruebas de aptitud laboral reflejan lo exitosas que resultan ser en sus
funciones las personas contratadas. Por lo general, la relacin es baja, porque no se tiene en
cuenta que se contratan slo a las personas que tuvieron buenos resultados en las pruebas. Los
estudios que miden ei xito en el empleo incluyen slo e subgrupo que presenta los registros al
tos. La figura 3-14 grfica este ejemplo.
Falta de confiabilidad de la medicin
Como hemos sealado, puede considerarse que el coeficiente de correlacin describe la proximi
dad entre los puntos y una lnea recta en el diagrama de dispersin. Sin embargo, una de las razo
nes por las que los puntos pueden no estar ubicados cerca de la lnea es el error casual en la
medicin; por ejemplo, un cuestionario que incluye algunos tems ambiguos. Con frecuencia, en
psicologa, las mediciones no son perfectamente precisas o confiables (veremos este concepto
en el captulo 17 y en el apndice A). El resultado es que una correlacin calculada entre dos va
riables, tales como intimidad e idealizacin (para utilizar nuestro ejemplo anterior) resulta menor
de lo que sera si tuviramos medidas perfectas de estas variables.
La reduccin en una correlacin, debido a la falta de confiabilidad de las medidas, se denomi
na atenuacin. Los libros de estadstica ms avanzada y los textos sobre medicin psicolgica
describen frmulas para la correccin por atenuacin, que suponen que puede determinarse el
grado de confiabilidad de las medidas, cuestin que no siempre es posible. En algunas publica-
'
'( ^
Personas postulabas \
(bj Persbris.pdstua4s^;!;i v-
:.;;vgS;y:y:; y ,y 5 0 ;
Puntuacin en ia prueba
.'
Puntuacin en la prueba
:r y
'
m:
clones cientficas podremos ieer que ia correlacin ha sido "desatenuada o que la atenuacin ha
sido corregida. Significa que el investigador realiz ciertos clculos para aumentar las correla
ciones al nivel que se estim que tendran si se hubieran aplicado mediciones perfectas de las va
riables que se correlacionan.
Los procedimientos para corregir la atenuacin superan el alcance de este libro. Aun as, es
conveniente recordar la regla general que se aplica cuando las medidas son poco confiables, como
ocurre en el caso de algunos cuestionarios, procedimientos observacionales, o en las observa
ciones psicolgicas en general. Las correlaciones que aparecen en publicaciones que emplean
medidas poco confiables pueden subestimar sustancialmente la verdadera correlacin entre las
variables que estas medidas imperfectas pretenden revelar.
2
3
4
5
6
7
8
9
10
11
12
1
10
2
9
5
4
6
3
11
8
7
12
jU
v
opina el lector? La intuicin de los investigadores britnicos (que como grupo estn, al menos,
tan bien capacitados en estadstica como los psiclogos de cualquier lugar del mundo) indicaba
desde -0,20 a +0,60, con una media de 0,24. Si el lector lo desea puede calcular la verdadera co
rrelacin. Es de 0,50! Es decir, que en forma abstracta los psiclogos dan a una correlacin de
0,50 un grado mucho ms alto de correlacin del que le otorgan cuando observan los datos reales
(datos que, aun con una r - 0,50, slo se vean como de 0,24).
Oakes dio a otro grupo de treinta investigadores slo la columna de X, y les pidi que comple
taran la columna de Y con nmeros tales que reflejaran una correlacin de 0,50 (nuevamente, s
lo utilizando su intuicin y sin realizar ningn clculo). Cuando Oakes calcul las correlaciones
i que representaban ios nmeros indicados por los investigadores, el promedio result ser de
En otras palabras, incluso los investigadores experimentados consideran que un coeficiente
relacin representa un grado de asociacin mayor de lo que en realidad implica.
Por el contrario, otros psiclogos sostienen que las pequeas correlaciones pueden ser muy
importantes tericamente, las cuales tienen mayor inferencia prctica por el hecho de que los pe
queos efectos pueden acumularse a lo largo del tiempo (Prentice & Miller, 1992).
Para demostrar la importancia prctica de pequeas correlaciones, Rosnow y Rosenthal
(1989b) ofrecen un ejemplo de un estudio actualmente famoso relacionado con el hecho de que
algunos mdicos tomaran o no aspirinas a diario, y la relacin de esa ingesta con los ataques
cardacos (Comisin Directiva del Grupo Mdico de Investigacin sobre Estudios Sanitarios
[Steering Committee of the Physicians Health Study Research Group], 1988). Los resultados de
mostraron que el hecho de ingerir aspirina estaba correlacionado en un -0,034 con los ataques
cardacos.1Es decir, produce aproximadamente un 0,1% de reduccin proporcional de error. Sin
embargo, consideremos la parte superior de la tabla 3-8 (en la que se describen los ataques carda
cos con im (Infarto demiocaxdio). La correlacin de slo 3,4 significaba que entre los ms de
20.000 mdicos que estaban incluidos en el estudio, existan 72 ataques cardacos ms en el gru
po que no tomaba aspirina. (De hecho, la parte inferior de la tabla indica que tambin existan 13
muertes ms por ataques cardacos en el grupo que no tomaba aspirina).
La parte central de la tabla 3-8 es especialmente interesante desde el punto de vista de la estadsti
ca. En esa parte de la tabla, los porcentajes correspondientes a cada grupo referido a los ataques
cardacos (ausencia d e a t y presencia de im ) estn divididos entre el porcentaje que tomaba y el
que no tomaba aspirinas (el grupo placebo). Observemos que la diferencia en porcentajes en cual
quiera de los grupos es de exactamente +3,4% -3,4%. (Por ejemplo, dentro del grupo que haba
sufrido ataques cardacos, el 48,3% que tomaba aspirinas menos el 51,7% del grupo placebo
equivale a -3,4%). Lo importante aqu es que 3,4% es exactamente igual al coeficiente de correla
cin (0,034).
No es una coincidencia. En este tipo de tablas, que se denominan del tamao del efecto a
una exposicin dicotomica, la diferencia de los porcentajes siempre resultar exactamente igual
al coeficiente de correlacin. Esto facilita sorprendentemente la comprensin de las correlaciones
en cualquier situacin en la que una de las variables representa el xito y el fracaso (como no su
frir un ataque cardaco o sufrirlo), y la otra variable representa la ciase de tratamiento recibido
(como aspirina o placebo). En este tipo de situaciones, la correlacin marca la diferencia en por
centajes entre el xito y el fracaso en relacin con el tratamiento recibido,
* Para calcular la correlacin entre tener un ataque cardaco y tomar aspirinas, tendramos que convertir las dos varia
bles en nmeros. Por ejemplo, podramos representar el hecho de tener un ataque cardaco con l , y no tenerlo con 0; de
forma similar, podramos considerar que estar en el grupo que consume aspirinas es igual a 1, y estar en ei grupo place
bo guai a 0. N o tiene importancia cul de los dos nmeros utilicemos para cada uno de los dos valores de cada variable.
Cualesquiera sean los dos nmeros utilizados, ei resultado ser el mismo despus de convertirlos en puntuaciones Z. La
nica diferencia que puede surgir en relacin con ios nmeros utilizados es que, segn a q u valor se aplique el nmero
mayor, esto determinar que la correlacin sea positiva o negativa.
T a b la 3 -8 .
E fe c to s d e la a s p ir in a en lo s a ta q u e s c a r d a c o s .
C o n d ici n
A u se n c ia de
im
P r e se n c ia de
10.933
10.845
Aspirina
Placebo
im
104
189
Aspirina
Placebo
Total
im
Aspirina
Placebo
no fa ta l
99
171
48,3
51,7
100,0
im
fatal
5
18
N ota: m = infarto de miocardio. Fuente: Com isin Directiva del Grupo M dico de investigacin Sobre Estudios
Sanitarios [Steering Committee o f the Physicians Health Study Research Group] (1988).
ejemplo, $0-0,05). El resultado del estudio con el que comenzamos el captulo se describira en
el texto de la siguiente manera: Exista una fuerte correlacin positiva entre la idealizacin y la
intimidad, r ~ 0,74.
Las tablas de correlaciones son muy comunes cuando se trabaja con varias variables. Usualmente, se disea la tabla de modo que cada variable aparezca tanto en la parte superior como en el
margen izquierdo, y la correlacin entre cada par de variables se indica dentro de la tabla, a la que
se denomina m atriz de correlacin.
La tabla 3-9 proviene de una publicacin que describe los resultados de un gran estudio euro
peo sobre dietas alimenticias saludables (Wardle et al 1997). En este caso en particular, los auto
res incluyen las matrices de correlacin separadas una para mujeres y otra para hombres. El
ejemplo que presentamos aqu ilustra varias caractersticas tpicas del modo en que se disean las
matrices de correlacin. En primer lugar, podemos observar que no se indica la correlacin de
una variable consigo misma. En este ejemplo, el espacio se completa con un guin; con frecuen
cia slo se deja el espacio libre. Podemos observar tambin que slo la mitad superior de cada
matriz est completa. Esto ocurre porque completar la otra mitad sera repetitivo; por ejemplo, la
correlacin entre evitar las grasas con consumir fibras es la misma que la correlacin entre consu
mir fibras y evitar las grasas (en algunos casos se completa la mitad inferior y se deja en blanco la
mitad superior). Existe otra forma de resumir la informacin ahorrando espacio en la pgina: los
nombres de las variables aparecen slo en el costado de la tabla; en la parte superior slo se escri
ben los nmeros correspondientes a cada una de ellas. Finalmente, observamos que los coeficien
tes significativos estn indicados con un asterisco, y se incluye una nota al pie que explica el nivel
de probabilidad que representa el asterisco.
Observando el ejemplo, podemos ver, entre otras cosas, que las correlaciones entre evitar
grasas y consumir fibras son bastante altas (0,42 en el caso de las mujeres y 0,41 en el caso
de los hombres). Tambin es interesante el hecho de que exista muy poca o ninguna correla
cin entre consumir frutas diariamente y limitar las carnes rojas (0,00 para las mujeres y 0,01
para los hombres).
Tabla 3-9.
Correlaciones de Pearson entre las costumbres alimenticias de hombres y de mujeres.
S u b -e sc a la
1,
2,
3.
4.
5.
Consum ir fibras
C om er fru tas diariamente
Limitar las carnes roj as
Limitar la sai
1.
2.
3.
4.
5,
C om er fibras
C om er frutas diariamente
Limitar las carnes rojas
Limitar la sal
M ujeres (n = 9 ,182)
0 ,42*
0,16*
0,15*
0,41*
H om bres ( = 7 .3 0 4 )
0,13*
0,13*
0,14*
0,12*
0,05*
0,11*
0,09*
0.00
0,12*
0,12*
0,11*
0,02*
0,10*
0,08*
0,01*
0,07*
--
*p< 0,001.
Fuente: Wardie, J et ai. (1997), tab, 2. Prcticas alimenticias saludables de alumnos europeos. " P sico lo g a sa n ita r ia ,
16, 443-450, Copyright, 1997, por la Asociacin Americana de Psicologa (American Psychological Association].
Reimpreso con autorizacin.
RESUMEN
Un diagrama de dispersin muestra la relacin entre dos variables. En ei eje horizontal se ubican
los valores de ia variable independiente o predictora, ordenados de menor a mayor. En el eje ver
tical se ubican los valores de la variable dependiente, ordenados de menor a mayor. Cada par de
valores correspondientes a un individuo se marca con un punto.
Cuando en trminos generales los puntos del diagrama de dispersin siguen una lnea recta,
hablamos de una correlacin lineal. En una correlacin lineal positiva, la recta va hacia arriba y
hacia la derecha (es decir, los valores bajos coinciden con los bajos y los altos con los altos). En
una correlacin lineal negativa, la recta va hacia abajo y hacia la derecha (es decir, los valores ba
jos coinciden con los altos y los altos con los bajos). En una correlacin curvilnea, los puntos si
guen un patrn distinto de una simple lnea recta. Existe correlacin nula cuando los puntos no
siguen ningn tipo de patrn sistemtico.
El coeficiente de correlacin (r) indica el grado de correlacin lineal. Es el promedio de los
productos cruzados de puntuaciones Z Cuando existe una fuerte correlacin lineal positiva, el
coeficiente de correlacin es altamente positivo debido a que las puntuaciones Z positivas se mul
tiplican por positivas y las puntuaciones Z negativas por negativas. Cuando existe una fuerte co
rrelacin lineal negativa, el coeficiente de correlacin es altamente negativo debido a que las
puntuaciones Z positivas se multiplican por negativas y las puntuaciones Z negativas por positi
vas. Cuando no existe correlacin lineal, el coeficiente de correlacin es 0, debido a que las pun
tuaciones Z positivas son multiplicadas a veces por puntuaciones Z positivas, y otras por
puntuaciones Z negativas, mientras que las puntuaciones Z negativas son multiplicadas a veces
por puntuaciones Z negativas, y otras por puntuaciones Z positivas. Por lo tanto, los productos
cruzados positivos y negativos se cancelan entre s.
El mximo valor positivo posible d e r e s + l , r = +l , y ocurre cuando existe una correlacin li
neal positiva perfecta. El mximo valor negativo posible de r es -1, r = -1, y ocurre cuando existe
una correlacin lineal negativa perfecta.
Una correlacin generalmente est basada en valores observados de determinado grupo que
pretende representar a un grupo ms amplio. Cuando ios resultados de los procedimientos esta
dsticos (que aprenderemos ms adelante) no son coherentes con la idea de que la correlacin en
ese grupo ms amplio es 0 , decimos que la correlacin es estadsticamente significativa.
Las comparaciones del grado de correlacin lineal se consideran ms precisas si se realizan
con el cuadrado del coeficiente de correlacin (r1), llamado reduccin proporcional del error.
La correlacin no muestra la direccin de causalidad. Si dos variables, X e y, estn correla
cionadas, esto podra ser porque X est causando Y, Y est causando X, o un tercer factor est cau
sando X e Y.
Un coeficiente de correlacin puede representar la verdadera correlacin por debajo de su ni
vel verdadero si se basa en las observaciones de un grupo de estudio cuyo rango de valores es res
tringido, o cuyos valores se basan en medidas poco confiables.
Muchos psiclogos sostienen que el coeficiente de correlacin es una sobrestimacin de la
importancia de la asociacin entre dos variables. En efecto, los estudios realizados sugieren que
los psiclogos tienden a considerar cualquier coeficiente de correlacin en particular como repre
sentante de un mayor grado de asociacin del que realmente existe. Sin embargo, las pequeas
correlaciones pueden tener importancia prctica (que puede ser demostrada a travs del tamao
del efecto a una exposicin dicotmica, el cual describe la relacin entre dos variables con dos
valores cada una, y examinando la tabla 2 x 2 resultante). Las pequeas correlaciones tambin
pueden ser muy efectivas para demostrar ia importancia de una relacin cuando un estudio de
muestra que la correlacin se mantiene aun bajo lo que pareceran condiciones poco probables.
Trminos clave
- Correccin por atenuacin.
- Correlacin.
- Coeficiente de correlacin (r).
- Matriz de correlacin.
- Producto cruzado de puntuaciones Z.
- Correlacin curvilnea.
- Grado de correlacin.
- Variable dependiente.
- Direccin de causalidad.
- Variable independiente.
- Correlacin lineal.
- Correlacin negativa.
- Correlacin nula.
- Correlacin perfecta.
Ejercicios
Los ejercicios implican la realizacin de
clculos (con la ayuda de una calculadora).
La mayora de los problemas estadsti
cos reales se resuelven por computadora,
pero aunque exista la posibilidad de utilizar
la, es conveniente realizar estos ejercicios
manualmente para incorporar el mtodo de
trabajo.
Para adquirir prctica en la utilizacin de
una computadora, para resolver problemas
estadsticos, se puede utilizar la seccin de
computacin de cada captulo, publicada en
la Guia de estudio y libro de tareas de compu
tacin para el alumno [Students Study Guide and Computer Workbook] que acompaa
este libro.
Todos los datos de esta seccin son ficti
cios (a menos que se especifique lo contrario).
Las respuestas a los ejercicios de la serie I
se encuentran al final del libro.
SERIE 1
Realice las siguientes tareas para los ejer
cicios 1 y 2; a) Confeccione un diagrama de
dispersin con las puntuaciones originales; b)
describa con palabras el patrn general de co
- Correlacin positiva.
- Variable predictora.
- Reduccin proporcional
del error (r2).
- Restriccin de rango.
- Diagrama de dispersin.
- Significacin estadstica.
E m p a tia d el
tera p eu ta
S a tisfa cci n
del p a cien te
1
2
3
4
70
94
36
48
4
5
2
1
2,
Un instructor pregunt a cinco alumnos
cuntas horas haban estudiado para un exa
men. A continuacin se detalla la cantidad de
horas de estudio y sus calificaciones.
H o r a s d e estu d io
C a lifica ci n en la p ru eb a
0
10
8
6
52
95
83
71
64
3,
En un estudio realizado a personas
recin se conocan, se midi el nivel de extra
versin de uno de los integrantes de la pareja y
el aprecio del otro integrante de la pareja por el
primero. Estos son los resultados:
E x tr a v er si n d e u n o
de los in teg r a n tes
A p recio p o r
ese in teg ra n te
P u n tu a c i n P u n tu a c i n
P u n tu a c i n P u n tu a c i n
o r ig in a l
Z
o r ig in a l
18
17
20
8
13
24
11
12
18
21
0,37
0,17
0 ,8 0
- 1 ,7 2
- 0 ,6 7
1,63
- 1 ,0 9
-0 ,8 8
0,38
1,00
8
9
6
1
7
1
3
5
7
3
1,10
1,47
0,37
-1 ,4 7
0 ,74
-1 ,4 7
-0 ,7 4
0 ,0 0
0 ,74
-0 ,7 4
S e r ie B
Y
1
X
1
Y
l
3
4
2
3
4
2
3
4
2
3
5
4
X
i
2
S e r ie C
S e r ie D
1
2
3
4
5
2
3
4
1
1
2
3
4
1
4
3
2
5
7.
Un investigador est interesado en ave
riguar si un nuevo medicamento produce algn
efecto en caso de resfro. Ocho personas son
analizadas: cuatro toman el medicamento y
cuatro no (las que lo toman son calificadas con
P o s ib ilid a d
B
P o s ib ilid a d P o s ib ilid a d
C
D
Toma Se
Toma Se
Toma S e
Toma S e
M ed. resfra M ed. resfra M e d , resfra M ed. resfra
0
0
0
0
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
3
1
1
1
1
i
1
0
1
0
0
0
0
0
0
0
1
1
1
1
1
0
0
1
1
0
0
1
1
1
0
0
0
0
0
0
0
0
0
1
1
1
1
P erso n a
H a b ilid a d
A n s ie d a d
1
2
3
1
1
2
4
10
8
4
SERIE II
Realice lo siguiente en los ejercicios 1 y 2 : a)
construya un diagrama de dispersin de las
puntuaciones originales; b) describa con pala
bras el patrn general de correlacin, si existe;
c) calcule el coeficiente de correlacin; d) ex
plique la lgica de lo que ha hecho, escribien
do como si estuviera hacindolo para alguien
~2
2.
Se controla de cerca a cuatro nios pe
queos durante un periodo de varias semanas
para medir qu cantidad de programas de tele
visin violenta miran y la medida de su com
portamiento violento hacia sus compaeros de
juego. Los resultados fueron los siguientes:
T a b la 3 - 1 0 .
C o r r e l a c i o n e s d e o r d e n c e r o d e l a s v a r i a b l e s d e l e s t u d io .
Variable
I. Estrs informado por mujeres
2. Estrs de mujeres informado
por hombres
3. Apoyo de pareja 1
4, Apoyo de pareja 2
5. Estado depresivo
6. Estado depresivo 2
7. Edad de las mujeres
8. Origen tnico de las mujeres
9, Estado civil de las mujeres
10. Paridad
0,17
-0,28*
-0,18
-0,27*
-0,18
0,23*
OJO
0,50*** 0,14
0,06
0,16
-0,19
-0,09
0,01
-0,18
0,19
0,13
044***
-0,34**
-0,42***
0,04
-0,16
0,12
- 0,11
-0,17
-0,41** * 0 55***
-0,24* -0*35*
0,14
0,11
0,24* -0,04
-0,17
OJO
-0,09
0,13 - 0,02
Fuente: Chapman, H, A., Hobfoll, S. B., & Ritter, C. (1997), tab. 2. El hecho de que el compaero subestime el estrs
sufrido por ellas provoca angustia en las mujeres: estudio sobre mujeres embarazadas de zonas cntricas y superpobla
das de la ciudad. P e r i d ic o s o b r e P s ic o lo g a S o c ia l y d e P e r s o n a lid a d { J o u r n a l o f P e r s o n a l i t y a n d S o c ia l P s y c h o l o g y ] ,
73, 418-425. Copyright, 1997, por la Asociacin Americana de Psicologa [American Psychoogical Association],
Reimpreso con autorizacin.
C a n tid a d d e
C a n tid a d sem a n a l
a ccio n es
N m ero
(h o ra s) de T V v io len ta s o agresivas
d e c d ig o
vio len ta s
d e lo s n i o s
h a c ia c o m p a ero s
G 3368
R 8 904
C 9890
L 87 2 2
C alificacin
p o r p rolijid ad
X
Janet
Gareth
Grove
Kevin
Joshua
14
8
6
12
N i o
N ic o le
18
24
14
19
20
23
20
22
15
21
R e g istro s en
p r u e b a d e n v
zx
Zy
0 ,5 2
1,43
1,82
0 ,2 0
0,13
1,11
0,13
0,78
1,50
0 ,4 6
60
58
70
58
66
68
65
68
56
62
- 0 ,6 6
-1 ,0 9
1,47
- 1 ,0 9
0,62
1,04
0 ,4 0
1,04
-1 ,5 1
- 0 ,2 3
T tu lo
d e la p in tu r a
C an tid ad
A n tig ed a d
d e p erso n a s
a p ro x im a d a q u e se detien en
(a o s)
a o b serv a rla
X
El Entierro
M ys Mar Ste Catherine
Las Baistas
E l T oilette
Retrato de Castiglione
Carlos I de Inglaterra
Crispin y Scapiti
D esnudo al Sol
E l B alcn
E l Circo
465
515
240
107
376
355
140
115
122
99
z*
1.39
1,71
- 0 ,0 9
0,96
0,80
0,67
-0 ,7 5
0,91
-0 ,8 6
-1 ,0 1
Zy
68 -0 ,6 9
71 0,59
123
1,19
0 ,8 2
112
48 -1 ,3 8
84 0 ,1 4
66 - 0 ,7 6
2,05
148
71 0,59
91
0 ,1 0
jv s x r-(x x )(x r)
(3-2)
Cuando se utiliza este procedimiento resulta til organizar los datos en un cuadro de cinco colum
nas, formado por las columnas X, X2, 7, Y2, y los productos cruzados de XY. Cabe destacar que no
se mencionan las puntuaciones Z, y que los productos cruzados se calculan directamente sobre la
base de puntuaciones originales. Adems, tal como lo recordamos en el apndice del captulo 2,
IX 2 se logra tomando cada valor X y elevndolo al cuadrado, y luego sumando estos cuadrados;
por el contrario, (YX)2 se logra sumando todos los valores X (sin elevar al cuadrado ninguno de
ellos), y luego elevando el total al cuadrado.
La tabla 3-11 muestra el clculo correspondiente al ejemplo del estrs de los gerentes utili
zando esta frmula. Comprela con la tabla 3-2.
Tabla 3-11.
C m p u to s d e l c o e fic ie n te d e c o r r e la c i n d e l e s tu d io s o b r e e l e str s d e lo s g e r e n te s , r e a liz a d o s c o n la
f r m u la d e c lc u lo (d a to s fic tic io s ).
N ivel d e estrs
X:
X!
36
8
3
10
8
64
9
100
64
35
273
y*
w xxr-
49
64
1
P r o d u c io s cru za d o s
XY
1
8
6
64
36
42
64
3
80
48
30
214
237
( 2 X )(X y)
U Z X * - (XXX ]
[V iv x r - ( X f ) 1 ]
(5X 237)
- (35X 30)
[V(5X 273)
[V (5X 214) - ( 3 0 X 3
- (3 5 )* ]
1.185 - 1.050
r ~ ------------------------------------------------------------------------------
(V 1.365 - 1 .2 2 5 }
135
135
135
(7 W )C f 0 )
( 11,83 ) ( 1 3 3 )4 )
154,26
Adems, queremos destacar que las pruebas de significacin de una correlacin, como por ejem
plo una prueba t, pueden ser de una o dos colas. Una prueba de una cola significa que el investiga
dor ha predicho el signo (positivo o negativo) de la correlacin2.
Los supuestos de las pruebas de significacin de un coeficiente de correlacin son algo com
plejos. Comnmente, ambas variables deberan estar normalmente distribuidas. Adems, la dis
tribucin de cada variable, condicionada por cada valor de la otra variable, debera tener
aproximadamente la misma varianza. Sin embargo, como ocurre con la prueba t y el anlisis de
varianza, los incumplimientos moderados de estos supuestos no son fatales.
A continuacin presentamos un ejemplo utilizando el estudio del estrs de los gerentes. Su
pondremos que los investigadores predijeron una correlacin positiva entre la cantidad de em
pleados supervisados y el estrs, la que ser probada a nivel 0,05.
1. Reformule el problema en forma de hiptesis de investigacin e hiptesis nula acerca de
las poblaciones. Las poblaciones de inters son las siguientes:
Poblacin 1; gerentes como los analizados en este estudio.
Poblacin 2: gerentes para los cuales no existe correlacin entre cantidad de empleados su
pervisados y estrs.
2 Dunlap y Myers (1997) encuentran un modo ms corto de descubrir la significacin de un coeficiente de correlacin.
Sucede que e l r necesario para una significacin de nivel 0,05 (dos colas) es muy aproximado a 2 fyN . Por ejemplo, pa
ra N ~ 5, necesitaramos una correlacin de 0,89 (2/^/5= 2/2,24 = 0,89). Dunlop y Myers tambin nos brindan una ma
nera ms corta para lograr una aproximacin a la cantidad de participantes necesarios para un poder de entre un 80% y
90%. El tamao de muestra necesario es simplemente 8 dividido r2. Por ejemplo, utilizando esta frmula, para r - 0,10,
la cantidad de participantes necesaria es 8 /0 ,102, es decir, 800.
La hiptesis nula establece que las dos poblaciones tienen la misma correlacin. La hiptesis de
investigacin establece que la poblacin 1 tiene una correlacin mayor que la poblacin 2. (Es de
cir, la prediccin es que la correlacin de la poblacin es mayor a 0).
2. Determine las caractersticas de la distribucin comparativa. Suponiendo que se cumplen
los supuestos (en la prctica, con slo cinco casos sera difcil de determinar), la distribucin
comparativa es una distribucin t con gl = 3. (Es decir, gl = N - 2 = 5 - 2 = 3).
3. Determine el punto crtico en la distribucin comparativa, en el cual la hiptesis nula debe
ra ser rechazada. La tabla (tabla B-2 del apndice B) muestra que para una prueba de una cola a
nivel 0,05, con 3 grados de libertad, necesitamos una t de al menos 2,353.
4. Determine el valor del estadstico de prueba. Calculamos una correlacin de r ~ 0,88 y
iV= 5. Aplicando la frmula para encontrar el t equivalente, obtenemos:
Tabla 3-12.
P o te n c ia a p r o x im a d a d e e st u d io s q u e u t iliz a n e l
c o e f i c i e n t e d e c o r r e l a c i n (r ) p a r a p r u e b a s d e h i p
t e s is c o n n iv e l d e s i g n i f i c a c i n d e 0 ,0 5 .
T a b la 3 - 1 3 .
C a n tid a d a p r o x im a d a d e p a r tic ip a n te s n e c e
s a r i o s p a r a lo g r a r u n 8 0 % d e p o t e n c i a e n u n
e s t u d io q u e u t iliz a e l c o e f ic ie n te d e c o r r e la
c i n (r ) p a r a p r o b a r u n a h i p t e s i s c o n n i v e l
d e s i g n i f i c a c i n d e 0 ,0 5 .
T a m a o d el efecto
D o s colas
Total N:
U na cola
Total N ;
aCasi 1,00.
T a m a o d e l e fe c to
Pequeo
(r ~ 0 ,1 0 )
M e d ia n o
(r = 0 ,3 0 )
G ran de
( r ss 0 ,5 0 )
10
20
30
40
50
100
0 ,0 6
0,07
0,08
0,09
0,11
0,17
0,13
0,25
0,37
0 ,4 8
0 ,5 7
0,86
0,33
0 ,6 4
0,83
0 ,9 2
0,97
10
20
30
40
50
100
0,08
0,11
0,13
0,15
0,1 7
0,26
0 ,2 2
0 ,3 7
0,50
0,6 0
0,69
0,9 2
0,4 6
0,75
0,9 0
0,9 6
0,98
D o s colas
U na cola
P equeo
( r := 0 ,1 0 )
M e d ia n o
(r -0 ,3 0 )
G ra n d e
( r = 0 ,5 0
783
617
85
68
28
22
'
,>: La recta de regresin.
>: Error y reduccin proporcional dei
error.
: ".(A.v
Otro ejemplo de prediccin bivariada.
Tabla 4-1.
D e n o m i n a c i n d e l a s d o s v a r i a b l e s e n l a p r e d i c c i n b iv a r i a d a .
V a r ia b le a p a r t ir d e la
c u a l s e p r e d ic e
V a r ia b le q u e
s e p r e d ic e
Variable predictora
Variable independiente
Variable dependiente
Variable criterio
N om bre
N om bre alternativo
Sm bolo
Ejemplo
calificaciones sat
gpa
universitario
puntuacin 2 de +2). La puntuacin Z predicha para el g p a de esa persona sera 0,3 por 2, io que
da 0,6. Es decir, la puntuacin Z predicha de esa persona para el g p a de su facultad es 0,6 desvos
estndares sobre la media. En smbolos es:
Zy = O)(Zx) = (0,3)(2) = 0,6
Por el contrario, supongamos que el nuevo gerente supervisar slo a 3 empleados. En ese caso,
el modelo predecira una puntuacin Z del nivel de estrs igual a 0,88 x (1,69) (la puntuacin Z
correspondiente si la cantidad supervisada fuera 3), lo que da un resultado de - 1,49. Es decir:
Zy = {)(%) = (0,88)(-l,69) = -1,49
T a b la 4 -2 .
Resumen de los pasos que se deben seguir para realizar predicciones con puntuaciones originales, a
travs de las conversiones de original a Z y de Z a original, utilizando frmulas y tomando un
ejemplo como base.
Ejemplo
P a so
F rm u la
Zx -(X ~M x)!SDx
Zr* m Z x )
2
3
Y - ( S D y) ( Z y) + M y
Z x ~ ( 3 - 7 ) 1 2 ,3 7 * - 1 , 6 9
Z y ~ (0,8S)(X,69) = - - l,4
>'= (2 ,6 1 )( -1 ,4 9 ) + 6 = 2,11
A] realizar los tres pasos indicados anteriormente, se debe poner especial atencin en utilizar la
media y el desvo estndar de la variable correspondiente al pasar de puntuaciones originales a
puntuaciones Z y de puntuaciones Z a puntuaciones originales. En el paso 1, se trabaja slo con el
valor, la media y el desvo estndar de la variable predictora (A). En el paso 3, se trabaja slo con
el valor, la media y el desvo estndar de la variable dependiente (E).
(4-2)
Esta frmula hace hincapi en dos trminos que an no hemos analizado, b y a. b es el coeficien
te de regresin para puntuaciones originales, es similar a J5, el coeficiente de regresin estan
darizado, excepto que b se utiliza slo con puntuaciones originales y no es igual al coeficiente de
correlacin, a es la constante de regresin, se agrega al valor predicho en la variable dependien
te de puntuaciones originales, para tomar en cuenta las medias de las distribuciones de puntuacio
nes originales. (Trabajando con puntuaciones Z, no es necesario utilizar la constante de regresin
debido a que las medias de las puntuaciones Z de las variables siempre son iguales a 0).
El coeficiente de regresin para puntuaciones originales (b) y la constante de regresin (a)
pueden calcularse directamente conociendo las medias y los desvos estndares de las dos varia
bles, y beta (que en el caso de las predicciones bivariadas es r):
SDy
SDX
V
(4-3)
a = M Y -{b)(M x )
(4-4)
=0)
Segn nuestro ejemplo del estrs sufrido por los gerentes, r = Mx = l> SDX = 2,37, My - 6, y SDy=2,61.
Entonces,
(0,88)(1
=0,97
LA RECTA DE REGRESIN
Un modelo de prediccin puede visualizarse como una recta en un grfico, en el que el eje hori
zontal representa los valores de la variable predictora y e eje vertical representa los valores prdichos de la variable dependiente. (El grfico se dibuja del mismo modo que los diagramas de
dispersin aprendidos en el captulo 3). La recta a la que nos referamos se llama recta de regre
sin, y representa la relacin entre los valores de la variable predictora y los valores predchos en
la variable dependiente. La figura 4-1 grfica la recta de regresin correspondiente al ejemplo de
los empleados supervisados (variable predictora) y el nivel de estrs de los gerentes (variable de
pendiente). Siguiendo la recta de regresin se puede encontrar el nivel de estrs predicho a partir
de cualquiera de las cantidades de empleados supervisados. Las lneas punteadas indican las pre
dicciones calculadas para los gerentes que supervisaban 3 y 10 personas.
Pendiente de la recta de regresin
Es particularmente interesante la inclinacin de la recta de,regresin, a la cual se denomina pen
diente. La pendiente indica cunto se eleva la recta por cada unidad de incremento de la variable
predictora, En el ejemplo de la figura 4-1, la lnea se eleva 0,97 puntos de estrs por cada perso-
te diferente del primero). Segn el ejemplo que estamos utilizando, si se selecciona un valor
de la variable predictora igual a 8, la puntuacin Y predicha de la variable dependiente ser
-0,79 + (0,97 x 8) = 6,97. En la figura 4-2c se ha marcado este punto (X=s & ,Y- 6,97).
(Cabe recordar entonces que, para trazar una recta de regresin, se seleccionan arbitrariamen
te dos valores cualesquiera de X y se calcula el valor predicho de Y correspondiente a cada uno de
ellus; por lo tanto, se puede trazar una recta de regresin sin necesidad de contar con ningn valor
de X en particular).
Figura 4-2. Pasos que se debes seguir para trazar una recta de regresin utilizando el ejemplo del nivel de
estrs de los gerentes, a) Se dibujan y rotulan los ejes; b) se marca el punto cuyas coordenadas son un valor
de la variable predictora (2) y el correspondiente valor predicho calculado para la variable dependiente
(1,15); c) se marca un punto cuyas coordenadas son otro valor de la variable de prediccin (8) y su corres
pondiente valor predicho calculado para la variable dependiente (6,97), y d) se dibuja una recta que pase
por los dos puntos marcados. El grfico tambin indica que por cada unidad de incremento de X, la recta se
eleva 0,97 unidades.
4. Dibujar la recta que pasa por los dos puntos marcados. La figura 4-2d muestra la recta.
Se puede controlar la precisin de la lnea trazada calculando cualquier otro tercer punto. Un
punto fcil de localizar es el punto donde X ~ 0. Cuando X ~ 0, el valor predicho de Y es la cons
tante de regresin (a). (Cuando X - 0, (b)(X) = 0; por lo tanto, lo nico que queda de la frmula de
regresin es a). Frecuentemente, el diagrama de dispersin se realiza de forma tal que el eje verti
cal est ubicado donde X = 0. En ese caso, el punto en el que la lnea de regresin corta el eje ver
tical es el punto donde el valor predicho en Y es igual a a. Por esta razn, la constante de regresin
a veces tambin se denomina ordenada al origen (la ordenada del punto donde la recta de regre
sin intersecta o corta al eje Y).
Para mayor control, en cuanto a la precisin de la recta trazada, es posible verificar si la pen
diente coincide con b, es decir, cunto se eleva la recta por cada unidad de incremento de la varia
ble predictora. La figura 4-2d muestra con lneas punteadas que la pendiente es 0,97: por cada
unidad de incremento de X, la recta se eleva 0,97 unidades.
observados de estrs. (Ahora que hemos explicado el tema, dejaremos de poner comillas a las pa
labras "prediccin y "pre dicho al referimos a la utilizacin del modelo de prediccin para calcu
lar Y con respecto a cada persona del grupo original de individuos analizados. Tampoco hemos
utilizado comillas en la tabla 4-3, pero cabe recordar que stas predicciones se estn realizando
con individuos cuyos valores Y observados ya conocemos. El propsito de desarrollar este proce
so no es conocer ms acerca de los individuos originalmente analizados, sino ms bien controlar
ia precisin de nuestra norma de prediccin).
Error y error cuadrtico
El siguiente paso es utilizar las predicciones referidas a las personas originalmente analizadas pa
ra determinar la precisin de la norma de prediccin. Para ello, primero se calcula cun alejadas
estn las predicciones realizadas, utilizando la norma de prediccin, de los valores observados de
los individuos analizados originalmente. Esta distancia es lo que denominamos error, es decir,
para cada individuo, el error es el valor observado menos el valor predicho.
El procedimiento siguiente es elevar cada error al cuadrado, obteniendo errores cuadra ticos.
Es decir:
Error2
(4-5)
Utilizar errores cuadrticos soluciona el problema de que algunos errores sean nmeros positivos
(la prediccin fue menos que la observacin) y otros sean nmeros negativos (la prediccin supe
r a la observacin). Si no se elevan los errores al cuadrado, cuando finalmente se sumen, los
errores positivos y negativos se cancelarn entre s. (La misma situacin se plante en el captulo
2 cuando trabajamos con desvos con respecto a la media).
Los errores y errores cuadrticos correspondientes a los gerentes dei ejemplo aparecen en las
ltimas dos columnas de la tabla 4-3
Tabia 4-3.
Clculo del error y del error cuadrtico utilizando puntuaciones originales del ejemplo del nivel de
estrs sufrido por los gerentes (datos ficticios).
E m p le a d o s
S u p e r v is a d o s
N iv e l d e E s t r s
X
6
O b serva d o
Y
7
8
3
10
8
8
1
8
6
P r e d ic h o
Y
5,03
6,97
2 ,1 2
8,91
6,97
E rror
E rr o r *
Y -Y
(Y - Y
1,97
1,03
- 1 ,1 2
-0 ,9 1
- 0 ,9 7
3,88
1,06
1,25
0,83
0 .9 4
Sum a = 7 ,9 6
Sfibrai
(4-6)
Es decir, utilizar la media para predecir no es un mtodo muy preciso porque produce mucho
error. Mediante el clculo descripto se comprueba cunto mejor se puede realizar la prediccin.
La proporcin de error cuadrtico en el que se incurrira utilizando la media se reduce utilizando
la norma de prediccin.
Analicemos una situacin en la que el modelo de prediccin no produce ninguna mejora en
comparacin con la prediccin que se realiza utilizando la media. En este caso, SSEaos es igual a
^Tciai (^Error nunca puede ser menor que SSTm). El modelo de prediccin no ha reducido el
error (S5Tok - SSEr0t ~ 0) y ha reducido un 0% el error total (Q/55 ^ = 0).
Ahora analicemos una situacin en la que el modelo de prediccin realiza predicciones per
fectas, sin ningn error. El modelo de prediccin ha reducido el error en un 100%. (Expresado
con la ecuacin, si i$'Error = 0, entonces el numerador ser SSTt - 0, SSTotal; dividir SSTo{al por
STo;ai da 1, o sea un 100%).
En la mayora de los casos reales, a reduccin proporcional del error se encuentra entre el
0% y el 100%.
Ejemplo
La tabla 4-4 indica las predicciones con puntuaciones originales, errores, errores cuadrticos, su
mas de errores cuadrticos y reducciones proporcionales del error en l estudio del nivel de estrs
de los gerentes. De la tabla se desprende que a travs del modelo de prediccin se reduce en un
77% el error en el que se incurrira utilizando la media como predictor.
Tabla 4-4.
Clculo de la reduccin proporcional del error en el ejemplo del nivel de estrs de los gerentes
(datos ficticios).
Observacin
M e d ia
7
8
1
8
6
6
6
6
6
6
E rror
E rro r1
1
2
4
-5
25
2
4
0
0
^To< a 34
S S ' ~ S S Pfrne
^*Totaf
E rro r
5,03
, 97
2 ,1 2
8,91
6,97
1,97
1,03
-1 ,1 2
- 0,91
- 0,97
3 4 - 7 ,9
= ------
34
E rro r1
3,88
1,06
1,25
0,83
0,94
^ Etr* 7,96
26,04
=
= 0,77
j4______
1 Existe otra forma menos co m n de medir la precisin del modelo de prediccin, denominada error estndar de esti
macin. ndica, aproximadamente, la distancia promedio entre los puntos y la lnea de regresin. Expresado con pala
bras, es la raz cuadrada de promedio de los errores cuadrticos, en smbolos ^ I S S ^ Z J ). (El error estndar de
estimacin, com o indicador de la variacin de ios valores con respecto a lo que se esperara aplicando la norma de pre
diccin, es un mtodo paralelo a utilizar el desvo estndar com o indicador del desvo tpico de los valores con respec
to a la media). Sin embargo, el error estndar de estimacin rara vez se menciona en los artculos de investigacin
psicolgica. Por lo tanto, en este libro no nos concentramos en ese concepto. N o se debe confundir el error estndar de
estimacin con lo que a menudo se denomina simplemente error estndar (tcnicamente este ltimo es el error es
tndar del coeficiente de correlacin o el error estndar del coeficiente de regresin"), que est relacionado con la
significacin estadstica, y que trataremos en el captulo 7.
Supongamos que una persona sea expuesta siete veces a cada palabra. Siete es igual a una puntua
cin Z de 1,09. Entonces se podra predecir que la puntuacin Z de esa persona en la variable "pa
labras recordadas sera de 0,68 por 1,09. El resultado es una puntuacin Z predicha de 0,74 para
las palabras recordadas, Supongamos que otra persona observar cada palabra slo cuatro veces
(una puntuacin Z de -0,22 para las 4 exposiciones). En este caso, se predecira una puntuacin Z
de -0,15 para las palabras recordadas. Es decir, 0,68 x -0,22 = -0,15. Los dos ejemplos se repre
sentan por medio de las siguientes frmulas:
Para Z* = 1,09: ZK= (0) (Z*) = (0,68) (1,09) = 0,74
Para Z* = -0,22: Zy = (0) (Zx) - (0,68) (-0,22) = 0,15
Sin embargo, cabe recordar que existen dos mtodos. Primero, se puede proceder como acabamos
de hacerlo. Se puede convertir la puntuacin original de la variable de prediccin en puntuacin
Z, realizar la prediccin y luego convertir la puntuacin Z predicha de la variable dependiente en
una puntuacin original. En cuanto al resultado del primer ejemplo, una puntuacin Z predicha de
0,74 para las palabras recordadas es equivalente a una puntuacin original de 7,2 palabras recor
dadas. (La media de 5,6 ms el producto de Z de 0,74 por el desvo estndar de 2,1). Similarmen
te, una puntuacin Z predicha de -0,15 es equivalente a una puntuacin original de 5,3 palabras,
Es decir, 5,6 + (2,1 x [-0,15]) = 5,3.
Otra alternativa sera utilizar el modelo de prediccin con puntuaciones originales para aho
rrar algunos pasos. En ese caso, el clculo sera el siguiente:
Tabla 4-5.
Medas y desvos estndares del experimento acerca del efecto de la cantidad de exposiciones sobre
la cantidad de palabras recordadas (datos ficticios).
M ean
Standard deviation
Correlation
Cantidad de exposiciones
(variable predictora)
Cantidad recordada
(variable dependiente)
4,5
2,29
2,1
5,6
r=0,68
Esta cifra tambin coincide (teniendo en cuenta los redondeos) con el cuadrado del coeficiente de
correlacin.
Reduccin proporcional de error = r2 = 0,682 = 0,46
Finalmente, la figura 4-6 muestra el diagrama de dispersin con la correspondiente recta de regresin.
Tabla 4-6.
Valores observados y predlchos y errores en el experimento que indagan el efecto de la cantidad de
exposiciones sobre la cantidad de palabras recordadas (datos ficticios).
Sujeto
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Cantidad de
exposiciones
Cantidad de
palabras recordadas
1
1
2
2
3
3
4
4
5
5
6
6
7
7
8
8
4
3
3
5
6
4
4
6
5
7
2
9
6
8
9
8
3,4
3,4
4,0
4,0
4,6
4,6
5,3
5,3
5,9
5,9
6,5
6,5
7,1
7,1
7,8
7,8
Error
Error3
0,6
-0,4
1,0
1,0
1,4
-0,6
-1,3
0,7
-0,9
1,1
-4,5
2,5
-1,1
0,9
-1,3
0,2
0,36
0,16
1,00
1,00
1,96
0,36
1,69
0,49
0,81
1,21
20,25
6,25
1,21
0,81
1,69
0,40
^Brror = 39,65
){ZX, ) + (3)(Zy3.)
(4-8)
2 Tambin existen procedimientos que permiten utilizar ms de una variable dependiente. Por ejemplo, podra ser
necesario averiguar' en qu medida la variable predietora cantidad de empleados" supervisados es adecuada, tanto
para d nivel de estrs com o para la cantidad de ausentismo, Los procedimientos que involucran ms de una variable
dependiente se denominan de "estadstica multivariada y son bastante avanzados. En el captulo 17 se presentan
algunos ejemplos.
- (0.51XZ*,) +(0,UXZ*2)+(0,33)(Z*,)
Supongamos que se intenta predecir el nivel de estrs de un nuevo gerente que tena una puntua
cin Z de 1,27 correspondiente a la cantidad de empleados para supervisar (una cantidad bastante,
alta), una puntuacin Z de -1,81 con respecto al ruido en las condiciones de trabajo (un bajo nivel
de ruido) y una puntuacin Z de 0,94 en relacin con la cantidad de plazos que se deben cumplir
por mes (una cantidad un poco alta de vencimientos). Para encontrar la puntuacin Z predicha del
nivel de estrs, se debe multiplicar 0,51 por la puntuacin Z de empleados supervisados, 0,11 por
la puntuacin Z de nivel de ruido y 0,33 por la puntuacin Z de los vencimientos. Luego, se deben
sumar los resultados.
Zy = (0,51 }(i,27) + (0,n)(l,81) + (0,33}( 0,94) = 0,65 +-0,20+0,31= 0,76
Por lo tanto, para un gerente que trabaja en esas condiciones se predecira una puntuacin Z de ni
vel de estrs de 0,76. Es decir, un nivel de estrs de aproximadamente tres cuartas partes de un
desvo estndar por sobre ia media.
Relacin entre los coeficientes beta de la regresin mltiple y las correlaciones comunes
Existe una diferencia particularmente importante entre la regresin mltiple y la prediccin cuan
do se utiliza slo una variable de prediccin. En la regresin bivariada, (3= r. En la regresin ml
tiple, en general [3 no es igual a r. Es decir, el beta de una variable predictora en particular no es
igual a la correlacin comn de esa variable predictora con la variable dependiente.' En la mayora
de los casos, beta ser menor (ms cercana a 0) que r.
La razn de esta discrepancia es que las variables predictoras generalmente estn correlacio
nadas entre s. Por lo tanto, parte de aquello que hace de una variable predictora un exitoso medio
de prediccin de la variable dependiente se superpone con lo que hace a las otras variables pre
dictoras exitosas para predecir la variable dependiente. Por lo tanto, las correlaciones de cada va
riable predictora con la variable dependiente son, en cierta medida, redundantes, ya que lo que
contiene cada variable de prediccin se superpone con lo que contienen las otras variables predic
toras. Sin embargo, et;o no sucede con los beta. En Ja regresin mltiple, beta se calcula de modo
que pueda ser la contribucin nica y distintiva de la variable predictora a la prediccin de la va
riable dependiente; Los coeficientes beta excluyen cualquier superposicin con otras variables de
prediccin.3
Analicemos el ejemplo del nivel de estrs de los gerentes. Cuando realizamos la prediccin
utilizando slo la cantidad de empleados supervisados, beta era igual al coeficiente de correlacin
3 Tcnicamente, la contribucin nica a la reduccin proporcional del error de una variable predictora, en e l contexto de
las otras variables de prediccin, es un clculo estadstico denominado correlacin s e m ip a r m l cuadrtica (ir 1), un
nmero que ocasionalmente aparece en artculos de investigacin. Sin embargo, es ms comn que ios investigadores
de aspectos psicolgicos informen slo las betas y luego hablen de ellas com o indicadores aproximados de la contribu
cin nica de una variable. Siempre que se tenga en cuenta que son "aproximados, esto resulta razonable, ya que beta
y sr2 estn estrechamente relacionadas. Una beta alta generalmente corresponde a una sr2 alta, el signo (positivo o ne
gativo) de una beta es siempre el mismo que el de una sr3, y la significacin de una beta es siempre la misma que la de
.sr2. En todo caso, debido a este uso comn (y adems porque tratar adecuadamente el tema de sr2 excede el alcance de
un texto introductorio), nuestra exposicin adopta esta interpretacin amplia de beta com o indicador de la contribucin
nica de una variable a la prediccin.
de 0,88. Ahora bien, en el ejemplo con regresin mltiple, el beta de empleados supervisados es de
slo 0,51. Beta es menor debido a que parte de lo que hace que la cantidad de empleados supervi
sados pueda predecir el nivel de estrs se superpone con aquello que hace que el ruido y ia canti
dad de vencimientos predigan el estrs. (Por ejemplo, parte de lo que hace que la cantidad de
personas supervisadas prediga el estrs es que esa cantidad de personas supervisadas aumenta el
nivel de ruido).
(4.9)
Supongamos que en el ejemplo del nivel de estrs de los gerentes contramos con la informacin
necesaria con respecto a los cuatro gerentes, y calculramos los datos utilizando un procedimien
to similar al que utilizamos para la regresin bivariada con puntuaciones originales. El modelo de
prediccin con puntuaciones originales podra ser el siguiente;
Y = -4,70+(0,56 )(X)+(0,06 )(X2)+(0,86)(X3)
Supongamos que un posible gerente iba a supervisar a 8 personas, con un muy alto nivel de ruido
de 85 decbeles y con 4 vencimientos por mes (ei cual es mayor que el promedio de 3). El nivel de
estrs esperado sera bastante alto:
Y = -4,70+ (0,56 )(8) + (0,06)(85) + (0,86)(4)
* -4,70 + 4,48 4- 5, + 3,44 = 8,32
Es decir, la prediccin del nivel de estrs de este gerente sera de 8,32.
Cada coeficiente de regresin de puntuaciones originales (b) es ia razn de cambio de las
puntuaciones originales de la variable predctora correspondiente, en el contexto de las otras va
riables de prediccin. As, a determinado nivel de cantidad de empleados supervisados y ruido,
cada vencimiento adicional aumenta el valor de estrs predicho en 0,86 puntos. De modo similar,
a cualquier nivel de empleados supervisados y cantidad de vencimientos, cada decibel de ruido
aumenta el valor de estrs predicho en 0,06 puntos; a cualquier nivel de ruido y cantidad de venci
mientos, cada persona adicional supervisada aumenta el valor de estrs predicho en 0,56 puntos.
cin mltiple es menor que la suma de las correlaciones de cada variable predictora con la varia
ble dependiente.
En el ejemplo del nivel de estrs de los gerentes, si suponemos que las tres r con respecto a la
variable dependiente son de 0,88 (empleados supervisados con respecto al nivel de estrs), 0,38
(nivel de ruido con respecto al nivel de estrs) y 0,63 (vencimientos con respecto a nivel del es
trs), la correlacin mltiple de la variable de estrs con las tres predctoras tomadas en conjunto
deber ser al menos de 0,88 (la mayor de las tres correlaciones). Es decir, la correlacin con las
tres variables en su conjunto no podra ser menor que la correlacin con cualquiera de ellas por
separado. Por otro lado, R no podra ser mayor que la suma de los valores r, que en este caso es
igual a 1,89 (0,88 + 0,38 + 0,63). De hecho, R, al igual que r, nunca podr ser mayor a 1. No im
porta cuntas variables de prediccin se utilicen. En el ejemplo, R - 0,96 (R tiene un rango de 0 a
1. A diferencia de r, R no puede ser negativa, por razones por las que no nos preocuparemos aho
ra. Cabe recordar, sin embargo, que beta o b, ya sea en la regresin bivariada o mltiple, pueden
ser negativas y mayores que 1).
Prediccin
129
T a b la 4 - 7 .
0,415
0 ,415
0,513
0,7 1 2
-0 ,0 0 7
0 ,1 8 3
-0 ,0 4 6
0 ,6 7 7
R = 0 ,729 \ R l = 0,531
Fuente: Watts, W,, & Wright, L. (1990). "La relacin entre el consumo de alcohol, tabaco, marihuana y otras drogas ile
gales con la delincuencia entre adolescentes americanos-mexicanos, negros y blancos de sexo masculino. A d o lescen cia ,
2 5 ,1 7 1 -1 8 1 , Reimpreso con autorizacin.
D elincuencia (
(0,677)(~2)
Supongamos que otro joven tena exactamente el mismo patrn, pero no con respecto a dro
gas ilegales, donde presentaba un alto nivel de consumo, digamos, una puntuacin Z de + 2.
^Delincuencia ~ ( ~ 0 ,0 0 7 ) ( - l ) + ( 0 ,1 8 3 ) ( 0 ) + ( - 0 , 0 4 6 ) ( l ) + ( 0 ,6 7 7 ) (2 )
^ D elincuencia
{~0,007 ) ( ~ 4 ) + { 0,183)(2) + { - 0 , 0 4 6 ) ( l )
+ ( 0 , 6 7 7 ) ( 2)
= 0 ,0 0 7 + 0 ,3 6 6 + - 0 , 0 4 6 + - 1 , 3 5 4 = - 1 , 0 2 7
Aunque parezca sorprendente, para este joven tambin se esperara un nivel bajo de delincuencia
violenta, ya que uno podra asociar con la delincuencia el hecho de fumar mucho. En la mayora
de los casos, los ndices altos con respecto a fumar se asocian con la delincuencia, como lo indica
el r de 0,415. Sin embargo, la gente joven que fuma generalmente tambin consume otras drogas
ilegales (al menos as lo indica la informacin correspondiente a este grupo en este entorno par
ticular), y esa parecera ser la razn por la cual, cuando se consider separadamente el hecho de
fumar, sta estaba ms fuertemente asociado con la delincuencia.
Es el momento de hacer un parntesis. Esperamos que el ejemplo referido a predicciones so
bre el potencial criminal de una persona, y su posible encarcelamiento, haya cambiado la percep
cin del lector. Cuando utilizamos grandes estudios para realizar predicciones sobre una sola
persona, inmediatamente percibimos el estereotipo intrnseco y las posibles injusticias. No es de
extraarse que a menudo la gente desconfe de la estadstica. Pero ella es slo una herramienta pa
ra analizar el futuro, como lo son la intuicin o la experiencia clnica, y es tan compasiva como la
persona que la utiliza para tomar una decisin. Si una persona insensible cita nmeros fros pa
ra justificar una decisin prejuiciosa, no son los nmeros los que son fros. (En el cuadro 4-1 ofre
cemos un breve debate sobre el tema).
Antes de abandonar este estudio utilizado como muestra, ser ilustrativo examinar el R co
rrespondiente a esta informacin. El R de 0,729 es mayor que el r comn ms alto (que era
0,712). Sin embargo, R es en realidad considerablemente menor que la suma de los valores r indi
viduales, (De hecho, la suma dara como resultado ms de 1, lo cual, como mencionamos ante
riormente es, como valor de R, imposible). Finalmente, R2 es 0,531, Esto indica que si se
realizaran predicciones utilizando este modelo de regresin mltiple para cada joven del grupo
estudiado, el error cuadrico promedio en la prediccin de los valores observados de delincuen
cia sera un 53,1% menor que si se utilizara la media de los valores de delincuencia como predic
tor de los valores individuales. En trminos de proporcin de varianza explicada, el 53,1% de la
variacin en la delincuencia de este grupo es explicada por las variables de consumo de drogas.
Otro ejemplo
Analicemos otro ejemplo. Terpstra y Rozell (1997) realizaron un estudio sobre la manera en que
ios directores de personal de empresas obtienen informacin sobre nuevos desarrollos en su cam
po. Los investigadores enviaron cuestionarios a una muestra de grandes empresas norteamerica
nas elegidas al azar. Los cuestionarios solicitaban a los gerentes de personal que indicaran en qu
medida utilizaban distintas fuentes de informacin, incluidas fuentes acadmicas (tales como ar-
4 Este es un ejemplo de lo que tcnicamente se denomina supresin. En el ejemplo que estamos analizando, puede con
siderarse que la asociacin positiva general con la rentabilidad presenta dos aspectos: una asociacin positiva y una
asociacin negativa. En este caso, el aspecto positivo se superpone con las otras variables de prediccin. Por lo tanto,
cuando se incluyen las otras variables de prediccin eti la regresin, se suprime la superposicin. (Es decir, su influ
encia es eliminada de la asociacin nica entre la consultora y la rentabilidad, representada por beta). El resultado es
que slo e l aspecto restante, la asociacin negativa, forma parte de beta. En trminos ms generales, la supresin ocurre
siempre que el coeficiente de regresin de detemiinada variable de prediccin es de signo opuesto a su correlacin
bivariada con la variable dependiente, (Existe otro tipo de situacin que tambin presenta supresin: cuando beta es
mayor que la correlacin bivariada).
(febla 4-8.
Resaltados del anlisis de regresin y correlacin de ia relacin entre utilizacin de fuentes de
informacin y rentabilidad en distintos tipos de empresas.
P ro d u cci n
F u en te d e
in fo rm a ci n
A cadm ico
Profesional
Consultara
R2
F
S e r v id o s
- 0 ,0 9
- 0 ,0 5
0 ,2 9
0 ,0 6
1,17
0 ,0 4
0 ,0 9
0,22*
0,7 2 * *
0 ,4 5 * *
- 0 ,3 6
0 ,6 0
6 ,6 i* *
0,6 4 * *
0 ,4 9 * *
0,23
V enta p or m a y o r /m e n o r
b
-0 ,0 8
0,08
-0 ,1 2
0 ,0 2
0,11
-0 ,0 7
-0 ,0 1
-0 ,1 1
F in a n ciera s
b
0,17
0 ,1 0
0 ,1 2
0 ,1 0
0,37
0 ,2 6
0,23
0,06
Nota: L os tamaos de las maestras, en el caso de empresas de produccin, servidos, venta por mayor o menor y
financieras eran de 63 a 6 5 , 1 6 a 1 8 ,2 0 a 2 2 y 1 3 a l5 , respectivamente. N o se realizaron anlisis en el rea de transporte
o comunicacin, com o tampoco en las reas de agricultura, minera o construccin, debido a restricciones con respecto
al tamao de las muestras.
*p < 0,10. * * p < 0 ,05.
Fuente: Teipstra, D. E., & Rozell, E. J. (1997), tab 6. Fuentes de informacin para recursos humanos y su relacin con
la rentabilidad institucional. P e r i d ic o so b re C ien cia d e l C o m p o rta m ien to A p lic a d a [J o u rn a l o f A p p lie d B eh a vio ra l
Scien ce), 3 3 ,6 6 -8 3 , Copyright, 1997, por el NTL nstitute, Inc. Reimpreso con autorizacin de Sage Publcations. Inc,
CONTROVERSIAS Y LIMITACIONES
Todas las limitaciones que se plantearon al tratar el tema de la correlacin (captulo 3) se aplican
en igual o mayor medida a la regresin bivariada y mltiple. Los clculos de regresin subesti
man el grado de posibilidad de prediccin si la relacin implcita es curvilnea, si el grupo estu
diado tiene un rango restringido o si las medidas no son perfectamente confiables. Es decir, en
cada uno de estos casos, R Y R%(y generalmente b y p) son menores de lo que deberan ser para
reflejar el verdadero grado de asociacin de las variables de prediccin con la variable dependien
te, La regresin por s sola tampoco indica la direccin de causalidad implcita. La direccin de
causalidad depende del .diseo experimental (vase apndice A). Es importante ser muy cuidado
so al leer artculos de investigacin ya que, incluso en las publicaciones, a veces los investigado
res pasan por alto estas limitaciones cuando analizan los resultados de regresiones complejas.
Existe actualmente una controversia con respecto a la regresin mltiple que cuestiona cmo
juzgar la importancia relativa de las diferentes variables de prediccin al predecir la variable de
pendiente. En cuanto a los fines de prediccin exclusivamente, los coeficientes de regresin (tanto
estandarizados como de puntuaciones originales) cumplen bien esa funcin, pero no necesaria
mente son ideales para comprender la importancia de los diferentes elementos de prediccin desde
el punto de vista terico. Como observamos anteriormente, un coeficiente de regresin indica la
contribucin particular de la variable predictora a la prediccin, independientemente de los otros
predictores. Una variable puede tener aparentemente una importancia bastante diferente en rela
cin con los otros predictores, cuando se predice slo a partir de ella, sin tener en cuenta esos otros
elementos (es decir, utilizando la correlacin ordinaria entre esa variable y la variable dependien
te). Por ejemplo, en el estudio de la delincuencia y el consumo de drogas, los coeficientes beta su
geran que el consumo de tabaco era ms importante en la prediccin de la delincuencia que el
consumo de marihuana, pero las correlaciones ordinarias sugeran exactamente lo contrario. iVfs
an, si se agregaran otras variables de prediccin, como el consumo de otras drogas ilegales, todo
Como observamos anteriormente, los resultados de la regresin mltiple son comunes en los
artculos de investigacin, y a menudo se hace referencia a ellos en las tablas. Ya hemos visto
algunos ejemplos (tablas 4-7 y 4-8). Frecuentemente, las tablas incluirn algunos otros clcu
los estadsticos, adems de aquellos que hemos tratado. Algunos estn relacionados con la
significacin estadstica (vase en el captulo 3 una breve exposicin sobre la significacin
del coeficiente de correlacin); otros sern tratados en el captulo 17. De todos modos, es po
sible comprender casi toda la informacin importante incluida en esas tablas slo con lo
aprendido aqu.
Analicemos los resultados de un estudio realizado por Jehn y Shah (1997) sobre el desempe
o de grupos formados por tres personas que deban realizar en forma conjunta tareas fsicas y de
toma de decisiones en una situacin de laboratorio. Los investigadores grabaron las interacciones
en video y analizaron las cintas para estudiar varios aspectos de la interaccin grupal. La tabla
4-9 muestra el coeficiente de regresin para la prediccin del desempeo a partir de varias cuali
dades de interaccin. Se puede observar que la comunicacin positiva y la planificacin presentan
coeficientes beta relativamente bajos (y negativos), mientras que el compromiso, el control y la
T a b la 4 -9 .
R e s u m e n d e l a n lis is de r e g r e si n c o n v a r ia b le s d e p r e d ic c i n d e l d e s e m p e o .
V ariable
C om unicacin positiva
Planificacin
C om prom iso
Control
C ooperacin
SEB
0 ,288
0 ,062
1,340
1,210
0 ,7 8 0
0 ,228
0 ,055
0,134
0 ,049
0 ,1 5 4
-0 ,1 2 7
- 0 ,1 9 0
0 ,4 3 2 *
0,449*
0,376*
*p<0,01.
Fuente: Jehn, K. A ., & Shah, P. P. {1997), tab. 4. Relaciones interpersonales y desempeo en las tareas: anlisis de los
procesos en grupos de amigos y conocidos. P e ri d ic o d e P s ic o lo g a S o c ia l y P erso n a lid a d , [J o u rn a l o f P erso n a lity
a n d S o c ia l P sych ology, ] 7 2 ,7 7 5 -7 9 0 - Copyright, 1997, por la A sociacin Americana de Psicologa [American Psycho
logical Association] Reimpreso con autorizacin.
cooperacin fueron predictores del desempeo mucho ms importantes. Adems, se observa (en
la parte inferior de la tabla) que la correlacin total de los cinco predictores con el desempeo
presentaba un R de 0,55, lo que constituye un dato sustancial.
Por otro lado, significa que a partir de estas cinco variables se explic menos de un tercio de
la varianza total del desempeo (es decir, Rz - 0,30). La tabla tambin incluye, adems de R y de
coeficientes de regresin estandarizados y no estandarizados (rotulados aqu con B mayscula),
otros clculos estadsticos: el error estndar (SE B) de cada B, El error estndar est relacionado
con la precisin en la estimacin de los coeficientes con respecto a la poblacin en general. Este
concepto ser ms fcil de comprender despus de haber ledo el captulo 7.
RESUMEN
La prediccin (o regresin) bivariada se utiliza para predecir valores de una variable dependiente
sobre la base de valores de una variable predictora. La mejor norma o modelo para predecir la
puntuacin Z de una persona en una variable dependiente es multiplicar un nmero denominado
coeficiente de regresin estandarizado (beta) por la puntuacin Z de esa persona en la variable
predictora. El mejor nmero para utilizar como coeficiente de regresin estandarizado en la pre
diccin bivariada es el coeficiente de correlacin.
Tambin se pueden realizar predicciones con puntuaciones originales convirtiendo el valor
observado de una persona en la variable predictora en la puntuacin Z correspondiente, multipli
cndolo por beta, y luego convirtiendo la resultante puntuacin Z predicha de la variable depen
diente nuevamente en una puntuacin bruta. Los tres pasos anteriores pueden combinarse en una
sola frmula que permite predecir la puntuacin original de una persona en la variable dependien
te, a partir, directamente, de la puntuacin original de esa persona en la variable predictora. Esta
frmula presenta dos partes principales: un coeficiente de regresin (denominado b) que se multi
plica por la puntuacin original de la persona en la variable dependiente y una constante de regre
sin (denominada d) que se suma al resultado. Si en un grfico con las dos variables se dibujan los
valores predichos, a travs de esta frmula para la variable dependiente se trazar la recta de re
gresin. La pendiente de la recta de regresin es igual al coeficiente de regresin para las puntua
ciones originales; la constante de regresin indica dnde esta recta cruza el eje vertical (es la
ordenada del punto de la recta con abscisa 0).
La exactitud de la prediccin puede estimarse aplicando el modelo de prediccin a los valores
en los que se bas la correlacin original. La diferencia entre cada valor observado y lo que hubie
ra sido predicho para ese individuo, utilizando el modelo de prediccin, se denomina error. Ele
vando estos errores al cuadrado y sumndolos obtenemos la suma de errores cuadrticos (55Error).
Luego, se compara SS-g^ con la suma de errores cuadrticos obtenida utilizando slo la media de
la variable dependiente como valor predicho (SSTotal). La reduccin del error cuadrtico lograda
utilizando el modelo (SSTotal - SSErT0[L dividida por el error cuadrtico al predecir utilizando la
media de la variable dependiente (&5To{aJ), se denomina reduccin proporcional de error o propor
cin de la varianza explicada, que es igual al cuadrado del coeficiente de correlacin.
En la regresin mltiple, se predice una variable dependiente utilizando dos o ms variables
predictoras. Cada variable predictora se multiplica por su propio coeficiente de regresin, y los
resultados se suman para realizar la prediccin. (Cuando se utilizan puntuaciones originales, tam
bin se suma una constante de regresin). Cada coeficiente de regresin indica la relacin del predictor con la variable dependiente en el contexto de las otras variables de prediccin. El
coeficiente de correlacin mltiple describe el grado general de asociacin entre la variable de
pendiente y las variables de prediccin tomadas en su conjunto.
Las regresiones bivariada y mltiple tienen las mismas limitaciones que la correlacin ordi
naria. Adems, en la regresin mltiple generalmente existe una ambigedad considerable al in
terpretar la importancia relativa de las variables predictoras.
Trminos clave
- Prediccin bivariada.
- Regresin bivariada.
- Error.
- Correlacin mltiple.
- Coeficiente de correlacin
mltiple (/?).
- Regresin mltiple.
- Modelo de prediccin.
- Proporcin de varianza
explicada (r2, R2).
- Reduccin proporcional
del erro^r2, R2).
- Frmula de prediccin con
puntuaciones originales.
- Coeficiente de regresin para
puntuaciones originales (b).
- Coeficiente de regresin.
- Constante de regresin (a).
- Recta de regresin.
- Pendiente.
Ejercicios
Los ejercicios implican la realizacin de clcu
los (con la ayuda de una calculadora). La ma
yora de los problemas estadsticos reales se
resuelve por computadora. Pero aunque exista
la posibilidad de utilizar una computadora, es
conveniente realizar estos ejercicios a mano
para incorporar el mtodo de trabajo.
Para adquirir prctica en la utilizacin de
una computadora, para resolver problemas es
tadsticos, se puede utilizar la seccin de compu
tacin de cada captulo, publicada en la G u a d e
e s tu d io y lib r o d e ta r e a s d e c o m p u ta c i n p a r a e l
a lu m n o [ S tu d e n ts S tu d y G u id e a n d C o m p u te r
W o r k b o o k ] que acompaa este texto.
Todos los datos de esta seccin son ficticios (a
menos que se especifique lo contrario).
Las respuestas a los ejercicios de la serie I se
encuentran al final del libro.
- Coeficiente de regresin
estandarizado (b).
- Suma de los errores
cuadrticos (S S Bnor).
- Error cuadrtico total al
predecir utilizando la media
SERIE 1
1. Un psiclogo especializado en deportes, que
trabaja con atletas de un deporte en particular,
ha descubierto que los valores observados en
una prueba de conocimientos sobre fisiologa
presentan una relacin de 0,4 con la cantidad
de lesiones sufridas durante el ao subsiguien
te. Ahora el psiclogo planea probar atletas
nuevos y utilizar esta informacin para prede
cir la cantidad de lesiones que pueden llegar a
sufrir, a) Indique la variable predictora, la va
riable dependiente y beta; b) escrba el modelo
de prediccin con puntuaciones Z, y c) indique
puntuaciones Z predichas para la cantidad de
lesiones que sufrirn los atletas cuyas puntua
ciones Z en la prueba sobre fisiologa son -2,
-1, 0, +1 y +2.
2.
Determine el modelo de prediccin con
puntuaciones orignales para los puntos (a) a
(g) que aparecen a continuacin. Construya
despus un slo grfico que muestre todas las
rectas de regresin, rotulando cada una con su
letra correspondiente, (Construya un grfico lo
(a)
(b)
20
10
10
10
10
10
(c )
(d)
(e)
(f)
(g)
SD
2 ,0
2 ,0
2 ,0
2 ,0
4 ,0
2 ,0
2 ,0
SD
10
10
20
10
10
10
10
2 ,0
2,0
2 ,0
4,0
2,0
2,0
2,0
r
0 ,4
0,4
0,4
0,4
0 ,4
- 0 ,4
0,8
E m p a tia
te ra p eu ta (X)
7 0 ,5 8
9 4 ,58
3 6 ,58
4 8 ,58
62
2 2 ,1 4
S a tisfa cci n
p a c ie n te ( 3 )
4,58
5 ,5 8
2 ,5 8
1,58
3
1,58
a)
Determine la frmula de prediccin con
puntuaciones originales para predecir la satis
faccin a partir de la empatia; b) utilice esta fr
mula para encontrar los valores de satisfaccin
predichos para cada una de las cuatro parejas pa
H o r a s de estu d io (X )
0
10
6
8
6
6
3,35
6.
Interesados en la influencia que podra
ple en el que se incluyen la enseanza no social
ejercer el estilo con que una madre ayuda a su y el entrenamiento social como predictores de la
hijo a comprender las interacciones sociales aceptacin por parte de pares. La ecuacin 2
sobre la vida social real del nio, Mize y Pettt se refiere al modelo de regresin mltiple en el
(1997) realizaron los arreglos necesarios para que el estilo de reaccin y el entrenamiento so
filmar en video a 43 madres voluntarias y a sus cial se incluyen predictores de la aceptacin por
hijos de 3 a 5 aos de edad, en tres sesiones in parte de los pares. Explique el significado de los
dependientes. En la sesin principal, se mos resultados de aceptacin por los pares como si
traban a las madres y a los nios cintas de video
se estuviera escribiendo para una persona que
de otros nios que se comportaban de modo
comprende qu es una correlacin pero que nun
hostil o se rechazaban unos a otros; despus,
ca
ha odo hablar de anlisis de regresin o re
las madres discutan con los nios lo observado
en los videos. Luego, los psiclogos clasifica gresin mltiple. (Se puede ignorar la columna
ban a cada madre segn el entrenamiento so srj, correlacin semiparcial, vase nota al pie
cial, como por ejemplo, el modo en el que las nmero 3. Todos los datos necesarios para inter
madres haban ayudado a sus hijos a compren pretar esta tabla se encuentran en las columnas
der lo que haban visto y les haban sugerido r, R2 y beta).
7.
a) Sobre la base de la tabla 4-10, seccin
formas ms positivas de manejar la situacin.
Se clasificaron los videos de las madres y los aceptacin por los pares, escriba la ecuacin
nios jugando segn el estilo de reaccin de l (una ecuacin de regresin con puntuaciones
las madres, es decir, la calidez y la capacidad Z). Luego calcule la puntuacin Z predicha pa
de crear armona con los nios. Finalmente, en ra la aceptacin por los pares, correspondiente
la ltima sesin, se clasificaron los videos de a nios cuyas madres presentan las siguientes
los nios armando crucigramas en cuanto a la puntuaciones Z.
enseanza no social por parte de las madres,
E n tr e n a m ie n to
E n se an za
es decir, el modo en que las madres ayudaban a M a d r e
no socia l
so c ia l
sus hijos a desarrollar su capacidad de resolu
A
-2
0
cin de problemas. En otra etapa del estudio,
B
0
0
los investigadores realizaron preguntas a los
2
C
0
nios sobre cunto les gustaban los otros nios,
D
-2
0
Utilizando esta informacin, pudieron obtener
E
0
2
una medida general de cunta apreciacin goza
F
2
2
G
-1
2
ba cada nio, a lo que denominaron aceptacin
por parte de sus pares.
Los investigadores desarrollaron la hipte
b) Escriba la ecuacin 2 y calcule la pun
sis de que se podra predecir la aceptacin de
un nio por parte de sus pares a partir de lo tuacin Z predicha para la aceptacin por los
adecuada o inadecuada que fuera la madre co pares, correspondiente a nios cuyas madres
mo entrenadora social. Tambin desarrollaron presentan los siguientes puntuaciones Z:
la hiptesis de que la relacin entre el nivel de
M adre
E n tr e n a m ie n to
E stilo
entrenadora social de la madre y la aceptacin
social
de reaccin
por parte de los pares se sostendra aun en una
A
-2
0
ecuacin de regresin mltiple que incluyera
B
0
0
entrenamiento no social, y en una ecuacin de
C
2
0
-2
D
0
regresin que incluyera estilo de reaccin.
2
E
0
La seccin aceptacin por sus pares de
2
F
2
la tabla 4-10 muestra ios resultados. La ecua
1
-2
G
cin 1" se refiere al modelo de regresin mlti
T ab la 4-10.
Ecuacin 1:
Enseanza no social 0,21
Entrenamiento social 0,36*
Ecuacin 2:
0,34*
Estilo de recreacin
Entrenamiento social 0,36*
Habilidad social
Agresin
ri
Beta
R2
sri
0,10
0,30
0,10
0,14
0,32
0,15
0,31*
0,10
0,05
0,28
0,06 -0,35*
0,29 -0,41*** 0,22**
-0,23 -0,24
-0,32 -0,33*
0,19*
0,25
0,3 F
0,13
0,18
0,25
0,18 -0,26
0,26 -0,41*** 0,20*
-0,16 -0,17
-0,36 -0,37*
R*
Beta
R2
*r i
Beta
SERIE 11
1. Elija algo que resulte interesante pre
decir y busque la informacin necesaria para
poder predecirlo. (Ambas deberan ser cosas
que puedan medirse en una escala numri
ca). Luego escriba el modelo de prediccin,
anotando el nombre de la variable predictora
y el nombre de la variable dependiente. Ade
ms, estime un nmero para beta que tenga
sentido, teniendo en cuenta lo aprendido so
bre los valores que se estn prediciendo. Fi
nalmente, explique por qu se eligi ese
tamao de beta.
2. Determine el modelo de prediccin con
puntuaciones Z y el modelo de prediccin
con puntuaciones originales para cada uno de
los siguientes casos. Adems, prepare un solo
grfico que muestre todas las rectas de regre
sin ( puntuaciones originales) y rotule cada
una de ellas con la letra correspondiente desde
la (a) hasta la (e), y que sea lo suficientemente
grande como para que las rectas estn clara
mente separadas.
Variable
Variable
dependiente (F) de prediccin ( X )
(a)
(b)
(c)
(d)
(e)
SD
SD
0
5
0
0
0
1,0
1,0
5,0
1,0
1,0
0
5
0
5
0
1,0
1,0
5,0
5 ,0
1 ,0
r
0 ,3
0,3
0,3
0,3
0,0
3.
En el captulo 3, serie II, ejercicio 1,
cuatro individuos recibieron una prueba de
destreza manual (valores altos significan ma
yor destreza) y una prueba de ansiedad (valores
altos significan mayor ansiedad). A continua
cin indicamos los valores observados, medias
y desvos estndares. Calcule primero la corre
lacin entre destreza y ansiedad (o refirase a
la respuesta en el captulo 3). La SSTota[ corres
pondiente a ansiedad era 84.
a)
Determine la frmula de prediccin con
puntuaciones originales para predecir la ansie
dad a partir de la destreza; b) utilice la frmula
para calcular los valores de ansiedad predi
chos para cada uno de los cuatro individuos es
D estreza
A n sied a d
1
2
3
4
1
i
2
4
10
8
4
-2
5
4 ,5 8
2
1,22
M
SD
P e r so n a
Control
Responsabilidad
Ira
Com pasin
Estabilidad
Expectativa
1
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
i
1
0
0
1
0
0
0
0
0
0
0
0
0
0
l
1
1
1
1
-l
-1
-1
1
1
1
E
0
0
0
0
fu e
Tabla 4-11.
Regresiones mltiples que predicen el castigo deseado a partir de variables de imputabilidad
(estudio 1).
C astig o d esea d o ________________________________________________ ______ _ _ _
Retribucin
P red icto res
Control
Responsabilidad
Ira
C om pasin
Estabilidad
Expectativa
-0 ,0 5
-0 ,1 7
- 0 ,3 0
-0 ,3 0
-0 ,0 1
- 0 ,1 0
R1
< 1,07***
-2 ,0 7 * * *
-4 ^ 4 * * *
-3 ,6 8 * * *
< 1 ,0 7 * * *
-1 ,3 3 * * *
-0 ,2 7 * * *
Rehabilitacin
-0 ,0 5
- 0 ,0 0
-0 ,1 1
- 0 ,3 9
- 0 ,3 4
-0 ,0 6
< 1,07***
< 1,07***
_ 4 * * *
-5 ,1 8 * * *
-4 ,8 5 * * *
< 1,07***
-0 ,3 7 * * *
Proteccin
-0 ,0 3
-0 ,0 4
-0 ,0 3
-0 ,0 7
- 0 ,1 9
-0 ,2 7
< 1,07***
< 1,07***
<1,07***
<1,07***
2 ,3 3 * * *
3,36***
0,17***
Disuasin
P
-0 ,1 5
- 0 ,1 9
- 0 ,0 4
- 0 ,1 3
- 0 ,0 4
- 0 ,0 8
1,90*
-2 ,1 5 *
<i;oo*
- 1 ,5 4 *
< 1 ,00*
- 1 ,0 4 *
- 0 ,1 8 *
Algunos
componentes clave
de la estadstica
inductiva:
Curva normal, probabilidad
y poblacin versus muestra
DISTRIBUCIN NORMAL
En el captulo 1 observamos que los grficos de muchas distribuciones de variables estudiadas
por los psiclogos (al igual que muchas otras distribuciones naturales) presentan forma de cam
pana, aproximadamente simtrica y unimodal. Estos histogramas o polgonos de frecuencias con
forma de campana se aproximan a una distribucin matemtica precisa e importante denominada
distribucin norm al o, simplemente, curva norm al.1 (Con frecuencia tambin se la denomi
na distribucin de Gauss, en honor ai astrnomo Karl Friedrich Gauss. Sin embargo, si su des
cubrimiento puede atribuirse a alguien, realmente debera atribursele a Abraham De Moivre,
vase cuadro 5-1). La figura 5-1 muestra un ejemplo de curva normal.
Figura S-l.
Una curva normal.
; ~
. /y ' .
~
Cuadro 5-1.
,De Mivr, el excntrico desconocido que invent la curva normal.
y simtrica no garantiza que sea cercana a una curva normal; sus colas podran ser demasiado altas
o demasiado bajas. Sin embargo, puede demostrarse matemticamente que, a la larga, si las cir
cunstancias ocurren realmente al azar, el resultado ser una perfecta curva normal. (La prueba pue
de encontrarse en algn texto de estadstica matemtica). Los estadsticos matemticos llaman a
este principio el teorema del lmite central. Veremos ms sobre este principio en el captulo 7.
desvo estndar por sobre la media nos permite saber que aproximadamente el 34% de las perso
nas tienen registros C entre 100 (la media de los C) y 116 (el c a 1 desvo estndar por encima de
la media). Dado que la curva normal es simtrica, aproximadamente un 34% de las personas tienen
un c entre 100 y 84 (el valor ubicado a 1 desvo estndar por debajo de la media), y un 68% (34%
+ 34%) tiene un c entre 84 y 116.
Observando la curva normal podemos observar algo ms: existen muchos menos valores en
tre 1 y 2 desvos estndar de la media que entre la media y 1 desvo estndar con respecto a ella.
Aproximadamente el 14% de los valores se ubican entre 1 y 2 desvos estndar por sobre la media
(vase figura 5-2). De modo similar, siendo la curva normal simtrica, aproximadamente un 14%
de los valores se encuentra entre 1 y 2 desvos estndar debajo de la media. Por lo tanto, aproxi
madamente un 14% de personas tienen c entre 116 (1 desvo estndar sobre la media) y 132 (dos
desvos estndar sobre la media).
Ser muy til recordar estos nmeros: 34% y 14%. Las figuras indican el porcentaje de perso
nas por encima y por debajo de cualquier valor en particular slo con saber la cantidad de desvos
estndar por encima o por debajo de la media en que se encuentra dicho valor.
Tambin es posible, a partir de un porcentaje, invertir el mtodo y calcular la cantidad de des
vos estndar de la media a los que se encuentra determinada persona. Supongamos que nos infor
man que en determinada prueba una persona present un valor dentro del 2% ms elevado.
Suponiendo que los valores de la prueba tienen una distribucin aproximadamente normal, la per
sona debe tener un valor al menos de dos desvos estndar por encima de la media. Esto se debe a
que del 50% de los valores ubicados por encima de la media, el 34% se encuentra entre la media y
1 desvo estndar por encima de ella; y otro 14% se encuentra entre 1 y 2 desvos estndar sobre
la media. Eso deja un 2% (es decir, 50% - 34% -1 4 % = 2%).
De manera similar, supongamos que estamos seleccionando animales para un estudio y nece
sitamos examinar su agudeza visual. Supongamos tambin que la agudeza visual est normal-
Puntuaciones Z ,*~3
- 2 ',, -
.0 ,
+2
+ 3 .-
68
84-
100
116
Valeres c ' .
132
mente distribuida, y que quisiramos utilizar animales con un nivel de agudeza visual ubicada en
los dos tercios centrales (un nmero cercano al 68%). En ese caso, seleccionaramos animales
que presentaron valores entre 1 desvo estndar por encima y 1 desvo estndar por debajo de la
media. Si conociramos la media y el desvo estndar de la prueba de agudeza visual, podramos
luego determinar las puntuaciones originales ms bajas y ms altas en cuanto a niveles de agude
za visual.
Ejemplos
Analicemos algunos ejemplos utilizando valores de c i Supongamos que una persona tiene un a
de 125. Qu porcentaje de personas tiene mayores valores de ci? Antes de continuar necesitamos
convertir la puntuacin original en una puntuacin Z, Suponiendo que la media es de 100 y el des
vo estndar de 16, un valor ct de 125 es igual a una puntuacin Z de +1,56. Ahora que tenemos la
puntuacin Z, el primer paso es realizar el diagrama. En la figura 5-4 hemos sombreado el rea
por encima de la puntuacin Z de 1,56. Ahora queremos aproximar el porcentaje utilizando la re
gla 50%-34%-I4%. Una puntuacin Z de 1 tiene un 16% de valores por encima de ella (esto se
debe a que hay un 34% de valores entre ella y la media, y existe un 50% de valores en total por en
cima de la media; es decir, que queda un 16% de valores por encima de 1 desvo estndar). Como
vimos en uno de los ejemplos anteriores, por encima de una puntuacin Z de 2 se ubica el 2%
de los valores; por lo tanto, por encima de una puntuacin Z de 1,56 habr entre el 16% y el 2% de
los valores.
Despus de realizar el diagrama y estimar el porcentaje, estamos listos para calcularlo exacta
mente. En la tabla de reas de la curva normal, 1,56 en la columna Z coincide con 44,06 en la
columna % entre la media y Z. Por lo tanto, el 44,06 % de las personas tiene valores de ci entre
el a medio y un a de 125 (una puntuacin Z de +1,56). En una curva normal, el 50% de las per
sonas se encuentra por encima de la media. Dado que el 44,06% de las personas que se ubican por
encima de la media encuentran a su vez por debajo del a de la persona analizada, queda un res
to del 5,94% (50%-44,06%) de personas por encima del valor de la persona en cuestin. Esa es la
respuesta a nuestro problema (representado por la figura 5-4). Cabe destacar que el porcentaje
calculado se encuentra dentro del rango estimado utilizando la regla de aproximacin del
50%~34%~14%.
Analicemos ahora a una persona con un ci de 95. Qu porcentaje de personas presentan
mayores valores de ex que la persona analizada? Siguiendo el procedimiento acostumbrado para
convertir una puntuacin original en una puntuacin Z, un Cl de 95 es igual a una puntuacin Z
de -0,31. La figura 5-5 muestra el diagrama para esta situacin. Hemos sombreado el rea de la
curva superior a una puntuacin Z de -0,31. La puntuacin Z que analizamos se encuentra entre
0 y -1. Una puntuacin Z igual a 0 tiene un 50% de los valores por encima de s, y una puntua
cin Z de -1 tiene un 84% de los valores por encima de s (esto se debe a que un 34% de los va
lores se ubican entre -1 y 0 y otro 50% se ubica por encima de 0, lo que sumado da un total de
84%). Por lo tanto, entre un 50% y un 84% de los valores se ubicarn por encima de la puntua
cin Z d e -0,31.
Realicemos ahora el clculo exacto. La tabla de reas de la curva normal muestra que el
12,17% de los valores se encuentran entre la media y una puntuacin Z de 0,31. Debido a que la
curva normal es simtrica, sta es tambin el rea entre una puntuacin Z de -0,31 y la media. Por
lo tanto, el rea total sobre -0,31 es 12,17% ms el 50% que se ubica por encima de la media, lo
que da un total de 62,17%. (El resultado se encuentra dentro de nuestro rango de aproximacin
del 50% al 84%).
Por otro lado, podemos observar tambin que el porcentaje de valores por debajo de una pun
tuacin Z de -0,31 sera igual al 50% que se ubica por debajo de la media menos el 12,17% que
se ubica entre la media y -0,31, dejando un total del 37,81% de los valores por debajo de la pun
tuacin Z de -0,31.
Procedimientos para calcular puntuaciones originales y puntuaciones Z
a partir de porcentajes de registros, utilizando la tabla de reas bajo la curva normal
Obtener una puntuacin Z a partir de un porcentaje es similar a la obtencin de un porcentaje a
partir de una puntuacin Z. En ambos casos comenzamos realizando un diagrama del problema,
sombreamos el porcentaje aproximado, y realizamos una estimacin tambin aproximada de la
puntuacin Z utilizando los porcentajes del 50%-34%-14%. El resto del proceso es casi exacta
mente opuesto a ir de una puntuacin Z a un porcentaje. Mirando'el diagrama, calculamos el por
centaje entre la meda y el lugar en el que comienza o termina el sombreado. Por ejemplo, si
nuestro porcentaje es el 8% superior, entonces el porcentaje desde la media hasta donde comien
za ese sombreado es igual al 42%. S nuestro porcentaje es el 35% inferior, entonces el porcenta
je desde la media hasta donde comienza el sombreado es del 15%. Si nuestro porcentaje es el 83%
superior, entonces el porcentaje desde la media hasta donde termina el sombreado es del 33%.
Una vez que conocemos el porcentaje desde la media hasta donde comienza o termina el
sombreado, buscamos el nmero ms cercano que podamos encontrar en la columna de % entre
la media y Z en la tabla de reas bajo la curva normal. La puntuacin Z en la columna Z al la
do del porcentaje ser nuestra respuesta, a menos que la puntuacin Z que buscamos sea negativa.
La mejor forma de saber si es positiva o negativa es a partir de la aproximacin y del diagrama.
Si fuera necesario una respuesta final en puntuaciones originales, convertimos las puntuacin
Z en puntuaciones originales utilizando los mtodos aprendidos en el captulo 2.
Ejemplos
Una vez ms, utilizaremos en nuestros ejemplos los valores de ci. Qu a necesitara una persona
para estar dentro del 5% superior? La figura 5-6 muestra nuestro diagrama, donde se observa que
hemos sombreado ei rea que representa el 5% superior. Utilizando la regla del 50%-34%~14%,
podemos adelantar que la puntuacin Z correspondiente al 5% superior est entre +1 y +2. El cl
culo que realizamos fue el siguiente: del 50% que se encuentra por encima de la media, el 34% se
ubica entre la media y 1 desvo estndar, con lo cual queda un 16% superior a 1 desvo estndar.
Sin embargo, dado que hay un 14% entre 1 y 2 desvos estndar, queda slo un 2% superior a 2
desvos estndar.
Con respecto a la puntuacin Z exacta, primero averiguamos el porcentaje entre la media y el
lugar en el que empieza nuestra rea sombreada. En este caso, si ei 50% de las personas tienen va
lores de C superiores a la media, al menos un 45% de las personas presentan valores de ci ubica
dos entre la persona en cuestin y la media (50% - 5% = 45%). Buscando en la columna % entre
la media y Z en la tabla de reas bajo la curva normal, el valor ms cercano al 45% es 44,95%
(tambin podramos utilizar el 45,05%). Este porcentaje coincide con una puntuacin Z de 1,64
en la columna Z, Tal como lo esperbamos segn nuestra aproximacin inicial, la respuesta se
ubica entre +1 y +2.
PROBABILIDAD*lo
El objetivo de la mayor parte de las investigaciones psicolgicas es probar la veracidad de una
teora o la efectividad de un procedimiento. Pero la investigacin cientfica de cualquier tipo s
lo puede llegar a la conclusin de que la veracidad o efectividad resultan ms o menos proba
bles; no puede proporcionamos el lujo de la certeza. La probabilidad es muy importante para las
ciencias. En particular, es muy importante para la estadstica inferencial, es decir, para los mto
dos utilizados por ios psiclogos para sacar conclusiones sobre teoras o procedimientos aplica
dos a partir de los resultados obtenidos en investigaciones.
La probabilidad ha sido estudiada durante siglos por matemticos y filsofos y, sin embargo,
an en nuestros das el tema despierta todo tipo-de controversias. Afortunadamente, slo necesita-
mos conocer unas pocas ideas clave para comprender y realizar los procedimientos de inferencia
estadstica que aprenderemos en este libro. Esos pocos puntos clave no son muy complejos; de
hecho, algunos alumnos los consideran intuitivamente obvios.
Interpretaciones de la probabilidad
En estadstica, generalmente definimos probabilidad como la frecuencia relativa con que espe
ramos que suceda un determinado resultado. Un resultado es la consecuencia de un experimen
to (o de casi cualquier situacin en la que la consecuencia no se conoce de antemano, como puede
ser que una moneda caiga cara arriba o que Hueva maana). La frecuencia indica cuntas veces
sucede determinado hecho. La frecuencia relativa es la cantidad de veces que determinado he
cho sucede en relacin con la cantidad de veces que podra haber sucedido, es decir, la razn en
tre la cantidad de veces en que algo sucede y la cantidad de veces que podra haber sucedido.
(Una moneda podra caer cara arriba 8 veces en 12 tiros, con una frecuencia relativa de 8/12
2/3). La frecuencia relativa esperada indica lo que esperaramos que suceda a largo plazo si re
pitiramos el experimento muchas veces. (En el caso de una moneda, esperaramos que en e lar
go plazo la moneda caiga cara hacia arriba una de cada dos veces). A esto se lo denomina
interpretacin de la probabilidad como la frecuencia relativa a largo plazo.
Tambin utilizamos la probabilidad para transmitir en qu medida estamos seguros de que su
ceder un hecho en particular. A esto se lo denomina interpretacin subjetiva de probabilidad.
Supongamos que decimos que existe un 95% de probabilidad de que nuestro restaurante favorito
est abierto esta noche. Podramos estar aplicando una especie de interpretacin de frecuencia re
lativa, lo cual implicara que si verificramos si ese restaurante estuvo abierto muchas veces en
das como hoy, descubriramos que en un 95% de esos das efectivamente estuvo abierto. Sin em
bargo, lo que en realidad queremos decir es probablemente ms subjetivo: en una escala del 0% ai
100%, calificaramos nuestra confianza en que el restaurante estar abierto con un 95%. Para de
cirlo de otro modo, sentiramos que una apuesta sera justa si se basara en que las chances de que
el restaurante va a estar abierto son del 95%,
La interpretacin que uno adopte no afecta la forma de calcular las probabilidades. Presenta
mos estos conceptos aqu por dos razones. Primero, queramos dar una idea un poco ms profun
da del significado del trmino probabilidad, el cual ocupar un lugar destacado durante el resto
del aprendizaje de estadstica, aun cuando, como sucede a menudo, este conocimiento ms pro
fundo no se convierta en un dogma. En segundo lugar, es de crucial importancia familiarizarse
con ambas interpretaciones para comprender algunas de las controversias ms encendidas dentro
de la estadstica, una de las cuales presentaremos al final de este captulo.
Clculo de probabilidades
En las aplicaciones estadsticas, las probabilidades se calculan con una proporcin de resul
tados exitosos, es decir, la cantidad de resultados favorables dividida por la cantidad de re
sultados posibles.
Analicemos la probabilidad de que al lanzar una moneda sta caiga cara hacia arriba. De los
dos resultados posibles (obtener cara o cruz), existe un resultado favorable (obtener cara), es decir,
una probabilidad de 1/2 0,5. Si tiramos un slo dado, la probabilidad de sacar un 2 (o cualquier
otra cara del dado) es de 1/6 0,17. Es decir, de los seis resultados posibles hay slo un resultado
favorable en particular. La probabilidad de tirar un dado y obtener un nmero 3 o menor es de 3/6,
0,5. De seis resultados posibles existen tres resultados favorables (un 1, un 2 o un 3).
V:. Analicemos un ejemplo un poco ms complicado. Supongamos que en una case hay 200 per
sonas, y que 30 son estudiantes avanzados. Si eligiramos alguien de la clase ai azar, la probabili
dad de escoger un estudiante avanzado sera 30/200, 0,15. Es decir, de 200 resultados posibles
existen 30 resultados favorables (elegir un estudiante avanzado).
Rango de probabilidades
Las probabilidades son razones (la cantidad de resultados favorables sobre el total de resultados
posibles). Esta razn no puede ser menor que 0 ni mayor que 1. Expresada en porcentajes, va del
0% al 100%. Algo que no tiene chances de ocurrir tiene probabilidad 0 y algo que ocurrir con
certeza tiene probabilidad 1. Cuando un hecho no puede ocurrir o es imposible, tiene probabili
dad 0, pero cuando a probabilidad de un hecho es baja, digamos un 5% o incluso un 1%, el hecho
es improbable o poco probable, pero no imposible.
s
. . ..
Cuadro 5-2.
Pascal coirnriza a desarrollar la teora de la probabilidad
en las mesas de juego y ms tarde aprende apostar a Dios.
cionando al azar personas, cada una con un nmero de estos asignados, habra 10 posibilidades
(resultados favorables) de 50 (todos los resultados posibles) de seleccionar una que tuviera asig
nado un nmero igual a 7 mayor. Por lo tanto, p - 10/50 = 0,2
La distribucin normal tambin puede considerarse como una distribucin de probabilidades.
La curva normal representa a una distribucin de frecuencias en la que se conoce la proporcin de
valores entre dos puntuaciones Z cualesquiera. Como hemos visto, la proporcin de valores entre
dos puntuaciones Z cualesquiera es la mismo que la probabilidad de seleccionar un valor entre
esas dos puntuaciones Z. Por ejemplo, la probabilidad de que un valor se encuentre entre la media
y una puntuacin de +1 (1 desvo estndar por encima de la media) es de aproximadamente un
34%, es decir, p - 0,34.
l 2
3 4, 5
6{ 7
10
Es probable que lo que estamos diciendo haya sido obvio desde el principio. En algn sentido, el
hecho de que la curva normal pueda representar tanto a una distribucin de frecuencias como a
una distribucin de probabilidades, es meramente un tema tcnico. Slo lo mencionamos para
que no haya confusiones ms adelante, cuando hagamos referencia a la probabilidad de que un
valor est en un intervalo, como el rea sobre l bajo la curva normal.
MUESTRA Y POBLACIN
Presentaremos algunas ideas importantes utilizando el ejemplo de las habas. Supongamos que es
tamos cocinando una olla con habas y probamos una cucharada para ver si estn listas. En este
ejemplo, la olla con habas es la poblacin, la cantidad completa de elementos que nos interesan.
La cucharada es la muestra, la parte de la poblacin sobre la cual realmente tenemos informa
cin. La figura 5-9 grfica el ejemplo.
En la investigacin psicolgica, generalmente estudiamos muestras, no de habas sino de indi
viduos. Una muestra podra consistir en 50 mujeres canadienses que participan en determinado
experimento; la poblacin que uno podra tener el propsito de reflejar seran todas las mujeres
canadienses. En un sondeo de opinin, podramos seleccionar 1.000 personas de toda la pobla
cin con edad para votar de un determinado pas y preguntarles por quin votaran. Las opiniones
de esas L000 personas conforman la muestra. Las opiniones del todo el publico votante en ese
pas, respecto de quienes los encuestadores van a generalizar sus resultados, son la poblacin
(vase figura 5-10)2.
Por qu se analizan muestras y no poblaciones?
Como hemos visto, los investigadores realizan estudios para averiguar algo sobre una determina
da poblacin. Por lo tanto, sus resultados seran mucho ms precisos si pudieran estudiar la po
blacin completa, en lugar de un subgrupo de esa poblacin. Sin embargo, en la mayora de las
2 Estrictamente hablando, los trminos poblacin y m uestra se refieren a una serie de valores (nmeros o mediciones),
no a los participantes de la investigacin que fueron medidos. Por lo tanto, en el primer ejemplo, la muestra est forma;
da en realidad por ios valores observados de las 50 mujeres canadienses, y no por las 50 mujeres, mientras que la pobla
cin est conformada por los valores que se obtendran s se midieran todas las mujeres canadienses.
F igura 5-9. P o b la c io n e s y m uestras: e n (a), toda la o lla con hab as e s la p ob lacin , y la cucharada e s la m u e s
tra. E n (b), to d o e l crcu lo m a y o r e s la p o b la ci n y el crcu lo qu e se encuentra dentro de ste es la m uestra.
En (c ), e l h isto g r a m a s e refie re a la p o b la c i n , y lo s v a lo r e s so m b r e a d o s to m a d o s e n co n ju n to fo rm a n
la m u estra .
Mtodos de muestreo
Dado que existen tantas formas de seleccionar una muestra para un proyecto de investigacin en
particular, en el apndice A presentamos una exposicin sobre varios de estos mtodos {vase
tambin cuadro 5-3). Brevemente, podemos decir que en la mayora de los casos el mtodo ideal
para seleccionar una muestra de estudio se denomina seleccin aleatoria. El investigador consi
gue una lista completa de los miembros de la poblacin y selecciona al azar una cantidad para
analizar. Un ejemplo del mtodo de seleccin aleatoria sera escribir cada nombre en una pelotita
de ping pong, colocar las pelotitas en un gran recipiente, sacudirlo y vendarle ios ojos a una per
sona para que seleccione la cantidad necesaria. (En la prctica, la mayora de los investigadores
utilizan una lista de nmeros aleatorios generada por computadora. La manera en que las compu
tadoras o las personas pueden crear una lista de nmeros realmente aleatorios es una cuestin in
teresante en s misma que analizaremos en el cuadro 15-1).
Es importante distinguir la seleccin verdaderamente aleatoria de lo que podramos denomi
nar seleccin casual, como por ejemplo, elegir a quien est disponible o primero en la lista. Utili
zando el mtodo de seleccin casual, es sorprendentemente fcil elegir accidentalmente un grupo
de personas para estudiar que sean en realidad muy diferentes a la poblacin en su conjunto. Ana
licemos el caso de un estudio de actitud para con un profesor de estadstica. Supongamos que re
colectamos la informacin para anlisis de entre aquellos que en clase se sientan cerca de
determinado alumno. Ese anlisis estara afectado por todos los factores que influyen en la elec
cin del asiento, algunos de los cuales tienen que ver precisamente con el tema que estamos ana
lizando, como por ejemplo, en qu medida los alumnos estn conformes con el profesor o con la
clase. (De modo similar, pedirle informacin a las personas que se sientan cerca de determinado
alumno, dara como resultado obtener opiniones ms similares a las de ese alumno, de lo que re
sultaran las opiniones obtenidas por medio de una verdadera muestra aleatoria).
Desafortunadamente, en la investigacin psicolgica slo es posible estudiar muestras ver
daderamente aleatorias en algunas ocasiones. La mayor parte del tiempo, de hecho, se realizan
anlisis con aquellos que quieren o pueden participar de una investigacin. En el mejor de los
casos, como ya observamos, el investigador intenta analizar una muestra de individuos de quie
nes no se conozca ningn dato que pueda hacerlos sistemticamente no representativos de la po
blacin que se intenta analizar. Por ejemplo, supongamos que se realiza un estudio acerca de un
proceso que puede dar diferentes resultados segn las distintas edades de las personas. En ese
caso, el investigador puede intentar incluir en el anlisis personas de todas las edades. Otra alter
nativa es que el investigador sea cuidadoso al sacar las conclusiones, para que estas se refieran
slo al grupo correspondiente a la edad estudiada.
B ase:
Sm bolos:
M edia
D esv o estndar
Varianza
Parmetro poblaconal
Estadstico muestral
Valores s lo de la muestra
Pcr
o*
M
SD
SD 2
:una sola vez. Es decir, esta muestra representa a una poblacin hipottica de alumnos a los que se
es asigna el estudio de un tema todo de una sola vez. El grupo que estudi durante un periodo de
tiempo es otra muestra. Esta muestra pretende representar el desempeo de los alumnos en gene
ral a quienes se les asign estudiar a lo largo de un periodo de tiempo. Por lo tanto, esta muestra
representa una poblacin hipottica de alumnos a quienes se les asigna estudiar un tema a lo largo
de un periodo de tiempo. La media de cada uno de los grupos estudiados es un estadstico muestral calculado a partir de los resultados del experimento.
Las poblaciones representadas por estas muestras ni siquiera existen realmente. Lo que s
existe es una poblacin general de alumnos, por supuesto, pero no una poblacin de alumnos a
quienes se Ies hayan asignado las condiciones mencionadas (excepto en trminos del experimen
to). Estamos interesados en analizar alumnos a los que en el futuro se les podran dar tales instruc
ciones; se trata de una poblacin desconocida. Generalmente, suponemos que estas poblaciones
desconocidas estn representadas por una curva normal, y lo hacemos simplemente porque la ma
yora de las distribuciones en psicologa lo estn. Sin embargo, no tenemos ningn fundamento
para realizar ninguna presuncin sobre la media y la varanza de esas poblaciones; son parme
tros poblacionales desconocidos. Cualquier conclusin que saquemos con respecto a los mismos
debe basarse en la informacin proveniente de los estadsticos maestrales.
Finalmente, el tema que nos interesa es un tema relacionado con la probabilidad. El razona
miento es un poco complicado, por lo cual le dedicamos la mayor parte del captulo 6. Sin embar
go, para tener una nocin previa del tema, analicemos la siguiente lgica: supongamos que las
verdaderas medias de las dos poblaciones (parmetros poblacionales) fueran de hecho las mis
mas. Conforme a esta suposicin, la forma en que los alumnos estudien no afecta el nivel de
aprendizaje. No obstante, cuando realizamos el experimento, las calificaciones medias de los dos
grupos en la prueba fueron diferentes, Entonces, dado nuestro supuesto de que no existe diferen
cia entre las poblaciones, cul es la probabilidad de que las medias de nuestras dos muestras pu
dieran ser tan diferentes como lo son en realidad? Si la probabilidad es baja, resulta poco
verosmil que nuestro supuesto de que no existe diferencia entre las poblaciones sea correcto y,
por lo tanto, lo rechazamos (el supuesto implica medias poblacionales iguales). Si rechazamos
ese supuesto acerca de la inexistencia de diferencias entre las poblaciones, nos queda la conclu
sin de que existe diferencia entre las poblaciones. Es decir, este resultado sostiene la conclusin
de que el modo de estudio de los estudiantes realmente afecta el nivel de aprendizaje.
La lgica que acabamos de describir puede parecer bastante intrincada, y de hecho lo es. Sin
embargo, es justamente ese tipo de razonamiento sobre probabilidades, muestras y poblaciones
el que fundamenta la mayor parte de la estadstica inductiva en psicologa. Es, en pocas palabras,
la lgica de lo que se denomina "prueba de hiptesis, concepto que estudiaremos paso a paso en
el captulo 6. No necesitamos analizar ese tema ahora, slo hemos introducido las ideas generales
para dar una nocin de la manera en que varios de los elementos tratados en este captulo se com
binan en los distintos tipos de problemas estadsticos que surgen de las investigaciones psicolgi
cas reales.
CONTROVERSIAS Y LIMITACIONES
Aun siendo temas bsicos, ios tres conceptos presentados en este captulo, la curva normal, la
probabilidad y las muestras y poblaciones, son temas que generan bastante controversia. Analiza
remos una importante controversia en relacin con cada uno de ellos.
divinizado. Reina con serenidad y completa humildad en medio de la salvaje confusin (1889,
p. 66). Irnicamente, tal vez sea cierto que, al menos en psicologa, realmente reina en un aislamiento puro y austero, sin imitaciones reales siquiera cercanas a lo perfecto,
Qu significa realmente la probabilidad?
Ya hemos presentado la mayor controversia con respecto a la teora de la probabilidad, segn se
aplica a la estadstica en psicologa: el debate entre la interpretacin como frecuencia relativa a
largo plazo y la interpretacin subjetiva segn el grado de convencimiento. Sin embargo, en la
mayora de los casos, realmente no importa demasiado qu interpretacin se utiliza, pues los
clculos estadsticos son los mismos; Pero entre la minora de tericos que favorecen la interpre
tacin subjetiva, algunos sostienen una opinin bastante crtica de la rama principal del pensa
miento estadstico. En particular, han defendido lo que ha devenido en llamarse el mtodo
Bayesiano (por ejemplo, vase Phillips, 1973). El mtodo lleva el nombre de Thomas Bayes,
un disidente clrigo ingls de principios del siglo xvm, que desarroll un teorema de la probabi
lidad adecuadamente denominado Teorema de Bayes.
El teorema de Bayes puede ser probado matemticamente, y no es controvertido. Sin embar
go, sus aplicaciones en estadstica son fuertemente discutidas. Los detalles del mtodo exceden
el alcance de un texto introductorio, pero s podemos explicar claramente el principal tema en
disputa: ios bayesianos sostienen que la ciencia implica realizar investigaciones para adaptar
nuestras creencias preexistentes a la luz de las pruebas recopiladas. Por lo tanto, las conclusio
nes derivadas de un experimento siempre se encuentran dentro del contexto de lo que creamos
sobre el mundo antes de realizar el experimento. La comente principal, por el contrario, sostie
ne que es mejor no realizar ninguna presuncin sobre creencias preexistentes. Deberamos ana
lizar las pruebas tal como son, juzgando si el experimento ha mostrado algn efecto confiable (o
ningn tipo de efecto). Algunos estadsticos de la corriente principal reconocen que la descrip
cin bayesiana de la ciencia puede ser ms exacta. Sin embargo, no se sienten cmodos con la
utilizacin de los mtodos bayesianos en los clculos estadsticos de las investigaciones prcti
cas, porque adoptarlos significara que la conclusin obtenida a partir de cada estudio depende
ra demasiado de la creencia subjetiva del cientfico que est realizando el estudio. Y as, los
mismos resultados experimentales podran llevar a diferentes conclusiones si son analizados por
diferentes cientficos.
El mtodo bayesiano represent un enrgico (aunque nunca mayoritario) movimiento en la
estadstica aplicada a la psicologa durante las dcadas de 1960 y 1970. Desde entonces se ha
vuelto mucho menos prominente como movimiento, al menos bajo este estandarte. No obstante,
muchas de las cuestiones que surgieron de esta disputa continan siendo importantes bajo formas
diferentes. (Games, 1988; Gigerenzer & Murray, 1987; Leventhal & Huyn, 1996; Prentice & Mi11er, 1992).
M uestra y poblacin
La mayora de los procedimientos estadsticos que aprenderemos en el resto de este libro se basan
en el supuesto de que la muestra estudiada es una muestra aleatoria de la poblacin. Como ya se
alamos, sin embargo, esto rara vez sucede en la investigacin psicolgica. Lo ms frecuente es
que nuestras muestras incluyan a aquellos individuos que estn disponibles para participar en un
experimento, lo cual implica que la mayora de los estudios se realicen con alumnos universita
rios, voluntarios y animales de laboratorio que resulten convenientes y similares.
Algunos psiclogos se preocupan por este tema y han sugerido que ios investigadores necesi
tan utilizar diferentes mtodos estadsticos que realicen generalizaciones referidas slo a los tipos
de personas que en realidad estn siendo utilizadas en el estudio.3 Por ejemplo, estos psiclogos
sostendran que si nuestra muestra presenta una determinada distribucin anormal, deberamos
suponer que se pueden generalizar los resultados slo con respecto a una poblacin con la misma
distribucin anormal. En el captulo 1^ seguiremos analizando estas sugerencias.
Los socilogos, en comparacin con los psiclogos, estn mucho ms preocupados por la representatividad del grupo que estudian. Es mucho ms probable que se utilicen mtodos formales
de seleccin aleatoria y de grandes muestras en los estudios presentados en revistas especializa
das en sociologa (o en revistas cientficas de psicologa social orientadas a la sociologa), o al
menos que se trate el tema en sus publicaciones.
Por qu los psiclogos se sienten ms cmodos utilizando muestras que no son claramente
aleatorias? La razn ms importante es que estn interesados principalmente en las relaciones
entre variables. Si en determinada poblacin un aumento en X est relacionado con un aumento
en F, esa relacin debera sostenerse probablemente en otras poblaciones, y debera hacerlo inclu
so si los niveles reales de X e Y son diferentes entre las poblaciones. Supongamos que un investi
gador realiza el experimento que utilizamos como ejemplo en el captulo 3 y 4, probando la relacin
entre la cantidad de veces que se expone una lista de palabras con la cantidad de palabras recorda
das. Supongamos, adems, que el estudio se realiza con alumnos universitarios, y que el resultado
es que, a mayor cantidad de exposiciones, mayor cantidad de palabras recordadas. La cantidad
real de palabras recordadas de la lista bien podra ser diferente, en el caso de personas pertene
cientes a grupos sociales distintos, al de los alumnos universitarios. Por ejemplo, es probable que
expertos en ajedrez (quienes probablemente tengan la memoria altamente desarrollada) puedan
recordar ms palabras; personas que acaban d sufrir algn trastorno probablemente recuerden
menos palabras. Sin embargo, incluso en esos grupos, esperaramos que, a mayor cantidad de ex
posiciones de la lista, ms palabras fueran recordadas. Por lo tanto, es probable que la relacin
entre cantidad de exposiciones y cantidad de palabras recordadas sea aproximadamente la
misma en cada poblacin.
En sociologa, la representatividad de las muestras es mucho ms importante debido a que los
socilogos estn ms preocupados por la media y la varianza real de una variable en determinada
sociedad. As, un socilogo podra estar interesado en la actitud promedio hacia las personas ma
yores en la poblacin de un determinado pas. En ese caso, es extremadamente importante la ma
nera en que se realice el muestreo.
3 Frick (en prensa) sostiene que en la mayora de Jos casos tos investigadores psicolgicos no deberan pensar siquiera
en funcin de muestras y poblaciones, sino que ms bien deberan considerarse investigadores estudiando procesos. Un
experimento anatiza algn proceso en un grupo de individuos. Luego, el investigador evala la probabilidad de que el
patrn de resultados pudiera haber sido causado por factores casuales. Por ejemplo, el investigador analiza si una dife
rencia de medias entre un grupo experimental y uno de control podra haber sido causada por otros factores adems de
la manipulacin experimenta!. Frick sostiene que este modo de pensar es mucho ms parecido a la forma real en que los
investigadores trabajan, y afirma que presenta varias ventajas en cuanto a la sutil lgica de tos procedimientos de esta
dstica inductiva. Ser interesante ver la reaccin a la propuesta de Frick. En todo caso, seguir e l mtodo ms estndar
(tal com o se ensea en este libro) arroja exactamente los mismos resultados, lo cual es coherente con la manera en la
que la mayora de los psiclogos comprenden el razonamiento estadstico.
RESUMEN________________________________________
En muchas de las variables analizadas en la investigacin psicolgica, la distribucin de los valo
res presenta aproximadamente una forma de campana, simtrica y unimodal, a la que llamamos
curva normal. Dado que la forma de esta curva responde a una frmula matemtica exacta, existe
un porcentaje especfico de valores entre cualesquiera dos puntos de ella.
Las cifras importantes que conviene recordar con respecto a una curva normal son: un 34%
de los valores se encuentran entre la media y 1 desvo estndar por encima de la media, y un 14%
entre 1 y 2 desvos estndar por encima de ella.
Una tabla de reas de la curva normal indica el porcentaje de valores entre la meda y cual
quier puntuacin Z positiva en particular. Utilizando esa tabla, y sabiendo que la curva es simtri
ca y que el 50% de los valores se encuentran por encima de la media, podemos determinar el
porcentaje de valores por encima o por debajo de cualquier puntuacin Z en particular. Tambin
podemos utilizar la tabla para determinar la puntuacin Z correspondiente al punto en el que co
mienza un determinado porcentaje de valores.
La mayora de los investigadores psicolgicos considera que la probabilidad de un hecho es
su frecuencia relativa esperada. Sin embargo, algunos consideran a la probabilidad como el grado
subjetivo de convencimiento de que el hecho suceder. La probabilidad generalmente se calcula
como la razn entre la cantidad de resultados favorables y la cantidad total de resultados posibles.
Se simboliza con unap y tiene un rango de 0 (hecho imposible) a 1 (hecho cierto). El rea bajo la
curva normal indica la probabilidad de que los valores se ubiquen dentro de determinado interva
lo de valores.
Una muestra es un individuo o grupo analizado, por lo general en representacin de un grupo
mayor o poblacin que no puede ser analizado en su totalidad. Lo ideal es que la muestra sea se
leccionada de la poblacin utilizando un procedimiento estrictamente aleatorio. La media, la varanza y dems clculos de una muestra se denominan estadsticos mustrales. Cuando se refieren
a una poblacin, se denominan parmetros poblacionales y se simbolizan con letras griegas( p.,
para la media, o2 para la varianza y cr para el desvo estndar).
La mayora de las tcnicas que aprenderemos en el resto del libro utilizan inferencias probabilsticas para sacar conclusiones acerca de poblaciones, sobre la base de informacin obtenida a
partir de muestras. En este proceso, generalmente se presume que las poblaciones estn normal
mente distribuidas.
Existen controversias con respecto a cada uno de los temas principales. Una de las cuestiones
se refiere a si las distribuciones normales son realmente tpicas de las poblaciones de valores co
rrespondientes a las variables que estudiamos en psicologa. Otro debate, planteado por defenso
res del enfoque bayesiano de la estadstica, es si deberamos construir explcitamente los
procedimientos estadsticos de forma tal de tener en cuenta las expectativas subjetivas iniciales
del investigador. Finalmente, se ha discutido la representatividad de las muestras utilizadas por
los psiclogos, que en lneas generales no se obtienen a travs de una seleccin estrictamente
aleatoria, aunque existen tambin motivos para pensar que con respecto a los temas que estudian
la mayora de los psiclogos, este punto no tiene gran relevancia.
Las publicaciones cientficas rara vez exponen las curvas normales (excepto brevemente
cuando la distribucin que se est analizando parece no ser normal) o la probabilidad (excepto en
el contexto de las pruebas de significacin, descriptas al comienzo del captulo 6). Sin embargo,
en lneas generales s se describen los procedimientos de muestreo, especialmente cuando el estu
dio es un sondeo de datos; y se puede discutir la representatividad de una muestra cuando no hu
biera sido posible realizar un muestreo al azar.
Trminos clave
- Frecuencia relativa esperada.
- Seleccin casual.
- Interpretacin de la probabilidad
como la frecuencia relativa
a largo plazo.
- Curva normal,
- Tabla de reas de la curva normal.
Distribucin normal.
Resultado.
Poblacin.
Parmetros poblacionales.
Probabilidad (p).
Seleccin aleatoria.
Muestra.
- Estadsticos mustrales.
- Interpretacin subjetiva
de probabilidad.
-ji.
- a.
Ejercicios
Los ejercicios implican la realizacin de clcu
los (con la ayuda de una calculadora). La ma
yora de los problemas estadsticos reales se
resuelven por computadora, pero aunque exista
la posibilidad de utilizar una computadora, es
conveniente realizar estos ejercicios manual
mente para incorporar el mtodo de trabajo.
Para adquirir prctica en la utilizacin de
una computadora, para resolver problemas es
tadsticos, se puede utilizar la seccin de com
putacin de cada captulo, publicada en la Gua
de estudio y libro de tareas de computacin pa
ra el alumno [Students Study Guide and Com
puter Workbook] que acompaa este libro.
Todos los datos de esta seccin son ficti
cios (a menos que se especifique lo contrario).
Las respuestas a los ejercicios de la serie I
se encuentran al final del libro.
SERIE I
1. Supongamos que las personas que vi
ven en determinada ciudad tuvieran una me
dia de 40 y un desvo estndar de 5 con respecto
a la preocupacin sobre el medio ambiente.
Suponiendo que estos valores referidos a la
preocupacin estn normalmente distribui
dos: Qu porcentaje aproximado de personas
presenta un registro a) mayor a 40, b) mayor a
45, c) mayor a 30, d) mayor a 35, e) menor a
40, f) menor a 45, g) menor a 30 y h) menor a
35? Cul es el valor mnimo que una persona
debe tener para estar en el i) 2%, j) 16%, k)
50%, 1) 84%, y m) 98% superior? (Utilice los
nmeros 50%-34%-I4% para resolver este
problema).
2. Una psicioga estudi la fatiga ocular
utilizando una medida particular que aplica a
los alumnos despus de 1 hora de trabajo escri
biendo en una computadora. Con esta medida,
la psicioga ha descubierto que la distribucin
presenta una curva normal. Qu porcentaje de
alumnos presenta una puntuacin Z a) menor a
1,5, b) mayor a 1,5, c) menor a -1,5, d) mayor
10
20
20
50
Si de los expedientes del ao pasado tuviera que seleccionar a alguien al azar, cul
es la probabilidad de que la persona sea del
grupo a) drogas / alcohol, b) familia, c) dro
gas / alcohol o familia, d) cualquier categora
excepto Varios, e) cualquiera de las tres
categoras?
6.
Una publicacin cientfica trata el tema
del nivel de autoestima de los alumnos secun
darios australianos. En la seccin en la que se
describen los mtodos aplicados se remarca
que se estudi una .muestra aleatoria- de
alumnos secundarios. Explique a una persona
que nunca ha realizado un curso de estadstica
o mtodos de investigacin qu significa esto y
por qu es importante.
SERIE li
1.
Se descubre que la cantidad de tiempo
que toma recuperarse fisiolgicamente de deter
minado estmulo est distribuida normalmen
te con una media de 80 segundos y un desvo
estndar de 10 segundos. Aproximadamente
qu porcentaje de registros (en tiempo de recu-
Rega de ia a d ic i n
La regla de la adicin se aplica a situaciones que involucran la probabilidad de obtener cualquiera
de dos o ms resultados mutuamente excluyentes. Resultados mutuamente excluyentes son
aquellos en los que la ocurrencia de un resultado hace que el otro resultado no suceda, como pue
den ser los resultados cara o ceca en un slo tiro de monedas o los resultados de uno o seis en un
slo tiro de un dado. En el caso de los resultados mutuamente excluyentes, la probabilidad de ob
tener algunos de ellos es la suma de las probabilidades individuales, Por lo tanto, en un slo tiro
de moneda, las posibilidades de obtener cara (que es de 0,5) o ceca (tambin de 0,5) es de 1,0 (0,5
ms 0,5). En un slo tiro de un dado, las posibilidades de obtener un 3 (1/6) un 5 (1/6) son
de 1/3 ( 1/6 +1/6). Si usted elige a un alumno de su universidad al azar, y en su universidad un 30% de
los alumnos son avanzados y un 25% son principiantes, la posibilidad de elegir a alguien que sea
avanzado o principiante es del 55%.
La regla formalmente se expresa:
p(A B) = p(A) + p(B)
(5-1)
(5-2)
Probabilidades condicionales
Existen otras reglas de la probabilidad (algunas de las cuales son combinaciones de las menciona
das anteriormente). La mayora involucra lo que se denomina probabilidades condicionales.
Una probabilidad condicional es la probabilidad de un resultado suponiendo que otro resulta
do ha ocurrido. Es decir, la probabilidad de un resultado est condicionada por la ocurrencia del
otro resultado. Por lo tanto, supongamos que la facultad A tiene un 50%. de mujeres y la facultad
B tiene un 60% de mujeres. Si seleccionamos una persona al azar, cul es la posibilidad de que
resulte seleccionada una mujer? Si sabemos que la persona es de la facultad A, la probabilidad es
del 50%. Es decir, la probabilidad de que resulte seleccionada una mujer, a condicin de que pro
venga de la facultad A, es del 50%. Diramos que, p(mujer ( facultad A) =0,5. De modo similar,
p(mujer / facultad B) = 60%.
>
>
';
Ejercicios.
Este es el primer ejemplo ficticio y, necesariamente, extrao. Durante varios aos se ha desarro
llado un gran proyecto de investigacin. En el contexto del proyecto, se ha administrado a bebs
recin nacidos una vitamina especial, y luego se ha controlado su desarrollo durante los primeros
dos aos de vida. Hasta ahora, la vitamina no ha acelerado el desarrollo de los bebs. La distribu
cin de la edad en la que stos y todos los bebs comienzan a caminar est representada por la fi
gura 6-1. En ella observamos que la media es 14 meses, el desvo estndar es de 3 meses, y las
edades siguen una curva normal. Mirando la curva podemos observar que menos del 2% de los
bebs comienzan a caminar antes de los 8 meses de edad (estos bebs se encuentran 2 desvos es
tndar por debajo de la media de edad para comenzar a caminar). (La distribucin qu analiza
mos, si bien es ficticia, en realidad es bastante similar a la distribucin que los psiclogos han
probado en el caso de bebs europeos, aunque esa distribucin real es levemente asimtrica hacia
la derecha; Bindley, Filliozat, Kackenberg, Nicolet-Mesteri & Sand, 1966).
Uno de los investigadores del proyecto ha tenido una idea. Sobre la base de algunas nuevas
teoras, razona que si la vitamina que toman los bebs estuviera ms refinada, su efecto podra
ser notablemente mayor, y que los bebs que tomaran la versin con alto grado de refinamiento
deberan comenzar a caminar mucho antes que los otros bebs. (Supondremos que el proceso de
purificacin no poda de ningn modo hacer que la vitamina fuera daina para los bebs). Sin
embargo, refinar la vitamina de este modo eleva en gran medida el costo'de cada dosis; por lo
tanto, el equipo de investigacin decide probar el procedimiento con dosis suficientes para un
slo beb. Entonces, se selecciona al azar un beb del proyecto para suministrarle la versin al
tamente refinada de la vitamina, y se realiza un seguimiento de su progreso junto con el de todos
los otros bebs de mismo proyecto. Qu tipo de resultado llevara a los investigadores a sacar
la conclusin de que la vitamina altamente purificada hace que los bebs caminen a ms tempra
na edad?
Lo que acabamos de describir es el ejemplo de un problema que se resuelve a travs de la
prueba de hiptesis. Los investigadores pretenden sacar una conclusin acerca de si la vitamina
purificada hace que los bebs en general caminen antes de lo esperado. La conclusin referida a
los bebs en general, sin embargo, se basar en los resultados obtenidos, estudiando slo una
muestra. (En este extrao ejemplo, la muestra es un slo beb).
Figura 6-1. Distribucin de edades en que los bebs comienzan a caminar (datos ficticios).
Existe un mtodo estndar para encarar un problema de prueba de hiptesis. El investigador utili
zar el siguiente razonamiento: comnmente, las chances de que un beb comience a caminar a
los 8 meses de edad o antes seran menores al 2%. Por lo tanto, caminar a ios 8 meses es altamen
te inverosmil Pero qu sucede si el beb que estamos estudiando comienza a caminar a los 8
meses? S esto sucede, podremos rechazar la idea de que la vitamina especialmente purificada
no produce ningn efecto. Si rechazamos la idea de que la vitamina especialmente purificada no
produce ningn efecto, debemos aceptar la idea de que s produce un efecto. (La lgica de este
ejemplo es crucial para todos los siguientes temas del libro. Tal vez sea conveniente volver a leer
este prrafo).
En primer lugar, los investigadores han comprendido qu tendra que suceder para poder sa
car la conclusin de que el procedimiento de purificacin especial marca una diferencia. Habien
do comprendido esto previamente, los investigadores pueden entonces continuar con la
realizacin de su estudio. En este caso, realizar el estudio significa suministrar la vitamina espe
cialmente purificada a un determinado beb y observar a qu edad ese beb comienza a caminar.
Si el resultado del estudio muestra que el beb comienza a caminar antes de los 8 meses, entonces
concluirn que es inverosmil que la vitamina especialmente purificada no provoque una diferen
cia. Si es inverosmil que la vitamina especialmente purificada no provoque una diferencia, en
tonces la conclusin es que probablemente s la provoque.
Este tipo de razonamiento al revs, contrario a lo que uno predice, es el corazn de la estads
tica inferencial en psicologa. Es algo as como una doble negacin. Uno de los fundamentos de
este mtodo es que podemos determinar directamente la probabilidad de obtener un resultado ex
perimental determinado s la situacin de que no se produzca diferencia es verdadera. En el ejem
plo de la vitamina purificada, los investigadores saben cules son las probabilidades de que los
bebs caminen a diferentes edades si la vitamina especialmente purificada no produce ningn
efecto. Es la probabilidad de que un beb camine a distintas edades lo que ya conocemos por ana
lizar bebs en general, es decir, bebs que no han recibido vitamina especialmente purificada.
(Supongamos que la vitamina especialmente purificada no produce ningn efecto. En ese caso,-la
edad en la que los bebs comienzan a caminar es la misma, reciban o no la vitamina especialmen
te purificada. Por lo tanto, la distribucin es la que aparece en la figura 6-1, basada en las edades
en las que los bebs en general comienzan a caminar).
Sin esta reconocidamente tortuosa manera de enfocar el problema, en la mayora de los casos
no habra modo de probar una hiptesis. En casi todas las investigaciones psicolgicas, ya sea con
experimentos, encuestas u otro mtodo, sacamos conclusiones evaluando la probabilidad de obte
ner nuestros resultados de investigacin si fuera verdad lo contrario a lo que estamos prediciendo.
Es decir, generalmente predecimos algn tipo de efecto pero evaluamos si existe tal efecto obser
vando si es inverosmil la hiptesis de que ese efecto no exista.
Primero, tengamos en cuenta que los investigadores estn interesados en los efectos provocados
en los bebs en general (no slo en el beb en particular que ellos estudian). Por lo tanto, ser til
volver a plantear el problema en funcin de poblaciones. Con el propsito de analizar esta situa
cin, podemos decir que los bebs se dividen en dos grupos:
Poblacin 1: bebs que toman la vitamina especialmente purificada.
Poblacin 2: bebs que no toman la vitamina especialmente purificada.
La poblacin 1 se refiere a aquellos que reciben el tratamiento experimental. En nuestro
ejemplo, existe slo un caso real de poblacin 1. Sin embargo, ese nico beb representa un futu
ro grupo de muchos bebs que an no han nacido, y a quienes los investigadores pretenden apli
car sus resultados. La poblacin 2 representa una especie de lnea de base de lo conocido.
La prediccin del investigador est basada en una teora acerca de cmo funcionan las vitami
nas de este tipo. La prediccin es que los bebs de la poblacin 1 (aquellos que toman la vita
mina especialmente purificada) en general caminarn antes que los de la poblacin 2 (aquellos
que no toman la vitamina especialmente purificada). Una afirmacin de este tipo, acerca de la
diferencia entre poblaciones predichas sobre la base de una teora (o basada en la experiencia
prctica), se denomina hiptesis de investigacin. Para decirlo de modo ms concreto, decimos
que la prediccin establece que la media de la poblacin 1 es menor (los bebs que reciben la vi
tamina especial caminan antes) que la media de la poblacin 2. En smbolos, la hiptesis de in
vestigacin es p l< tu2.
Qu sucede si la prediccin es incorrecta? En ese caso, se mantiene la situacin contraria:
los bebs de la poblacin 1 (aquellos que toman la vitamina especialmente purificada) en general
no caminarn antes que los bebs de la poblacin 2 (aquellos que no toman la vitamina especial
mente purificada). Esta prediccin opuesta implica que no existe diferencia en cuanto al momen
to en que los bebs de la poblacin 1 y la poblacin 2 comienzan a caminar, es decir, comienzan
al mismo tiempo. Una afirmacin de este tipo, acerca de la ausencia de diferencia entre poblacio
nes, es el punto crtico opuesto a la hiptesis de investigacin. Se denomina hiptesis nuia por
que se utiliza generalmente para indicar una situacin en la que no existe diferencia entre dos
poblaciones (la diferencia es nula). En smbolos, la hiptesis nula es jtl = p2.1
La hiptesis de investigacin y la hiptesis nula son completamente opuestas. Si una es ver
dadera, la otra no puede serlo. Esta oposicin, y la concentracin directa en la hiptesis nula, es
un punto central de la lgica de la prueba de hiptesis. Por ese motivo, la hiptesis de investiga
cin, que finalmente es lo que realmente nos interesa, con frecuencia se denomina hiptesis al
ternativa. En realidad, la situacin es un poco irnica. Desde el punto de vista de nuestro inters
en el asunto, lo que ms nos importa es la hiptesis de investigacin. Sin embargo, desde el punto
de vsta de la prueba de hiptesis, el papel principal de la hiptesis de investigacin es su condi
cin de alternativa de la hiptesis nula.
* En este caso hemos simplificado ei tema. La hiptesis de investigacin implica que una poblacin caminar antes que
ia otra,
Por lo tanto, lo contrario implica que e l otro grupo caminar o bien al mismo tiempo o despus. A s, lo
contrario a la hiptesis de investigacin, en este caso incluye tanto la falta de diferencia com o una diferencia en direc
cin contraria a la predicha. En trminos de smbolos, si nuestra hiptesis de investigacin es jq c p j, entonces su
opuesto es p,j > Xj (el smbolo 5 significa mayor o igual a). Presentamos este tema con mayor detalle ms adelante
en este captulo. Por ahora, para simplificar el aprendizaje, algunas veces consideraremos que la hiptesis nula implica
que las dos poblaciones son esencialmente iguales, y otras veces consideraremos que implica que una poblacin es
igual u opuesta a la hiptesis de investigacin.
Una vez que hemos planteado la situacin en trminos de eleccin entre una hiptesis de investi
gacin y una hiptesis nula, el siguiente paso es analizar cmo podramos utilizar la informacin
que obtenemos sobre una muestra para realizar esta eleccin. La pregunta que planteamos es la
siguiente: dado un determinado resultado muestra! (en este caso, una observacin), qu probabi
lidad tenamos de obtener ese resultado si la hiptesis nula fuera verdadera?
Para responder esta pregunta, debemos saber cmo sera la situacin si la hiptesis nula fuera
verdadera. Es decir, necesitamos conocer los detalles de la distribucin de la poblacin de la cual
proviene la muestra si la hiptesis nula fuera verdadera. Si conocemos la distribucin de la pobla
cin de la que proviene nuestra muestra, y sabemos que se trata de una distribucin normal, nos
encontramos en una buena posicin: podemos determinar directamente la probabilidad de obte
ner cualquier valor determinado de esa distribucin utilizando una tabla de reas bajo la curva
normal.
Cmo podemos conocer los detalles de la poblacin de la cual proviene nuestra muestra si
la hiptesis nula es verdadera? Esto es posible porque, si la hiptesis nula es verdadera, ambas
poblaciones son iguales. Generalmente conocemos una de las poblaciones (poblacin 2); por lo
tanto, si la hiptesis nula es verdadera y las dos poblaciones son iguales, tambin conocemos la
otra poblacin (poblacin 1). En nuestro ejemplo, si la hiptesis nula es verdadera, ambas pobla
ciones siguen la curva normal, y presentan una media de 14 meses y un desvo estndar de 3 me
ses (vase figura 6-1).
En este libro llamaremos a la distribucin correspondiente a la situacin en la que la hiptesis
nula es verdadera, es decir, la distribucin con la que comparamos la muestra, distribucin com
parativa. (La distribucin comparativa a veces es denominada "modelo estadstico, y en la ma
yora de los casos tambin coincide con lo que se denomina una distribucin muestra, una. idea
que expondremos en el captulo 7). Es decir, en el proceso de la prueba de hiptesis, comparamos
los valores observados en la muestra con esta distribucin. Realizamos la comparacin calculan
do la probabilidad de obtener un valor tan extremo como el de nuestra muestra en esa distribucin
comparativa. En el ejemplo que estamos tratando, la distribucin comparativa es igual a la distri
bucin de valores de la poblacin 2, la poblacin a la que no se le ha aplicado el procedimiento
experimental.
3o paso: determinar el valor muestra! de corte en la distribucin comparativa,
en e! que debera rechazarse la hiptesis nula
Lo ideal sera que antes de realizar un estudio, los investigadores establezcan un objetivo con el
cual comparar su resultado, es decir, qu valor extremo necesitara tener la muestra para poder sa
car una conclusin confiable. Especficamente, determinar el valor que necesitara arrojar la
muestra para decidir rechazar la hiptesis nula, cun extremo debera ser ese valor para que resul
te demasiado improbable que pudiera obtenerse tal valor extremo si la hiptesis nula fuera verda
dera. A esto se lo denomina punto muestra] de corte (tambin se conoce con el nombre de
punto crtico).
Analicemos nuestro ejemplo de la vitamina purificada, en el que la hiptesis nula implica que
no importa si un beb recibe la vitamina especialmente purificada o no. Los investigadores po
dran decidir que si la hiptesis nula fuera verdadera, sera muy improbable que un beb camine a
los 8 meses o antes. Tratndose de dos desvos estndar por debajo de la media (caminar a ios 8
meses), slo podra ocurrir menos de un 2% de las veces. Por lo tanto, basndose en la distribu
cin comparativa, los investigadores establecen su punto muestral de corte incluso antes de reali
zar el estudio. Lo que estn haciendo es decidir por adelantado que, si el resultado de su estudio
es un beb que camina antes de los 8 meses, rechazarn la hiptesis nula.
Si el beb comienza a caminar antes de los 8 meses, los investigadores podrn rechazar la hi
ptesis nula, y si lo hacen, les quedar la hiptesis de investigacin. Entonces podrn decir que
se sostiene la hiptesis de investigacin.
Por otro lado, si el beb no comienza a caminar sino hasta despus de ios 8 meses, no podrn
rechazar la hiptesis nula. Cabe notar, sin embargo, que en este caso no podrn decir se sostiene
la hiptesis nula", ya que no rechazar la hiptesis nula crea una situacin ambigua. No pueden sa
carse conclusiones, excepto, concluir que se necesita realizar una mayor investigacin. Ms ade
lante continuaremos tratando este tema.
Al establecer por adelantado cun extremo deber ser. un valor para rechazar la hiptesis nu
la, los investigadores no utilizan por lo general un nmero real de unidades de la escala directa
de medicin (en este caso, meses). En cambio, establecen cun extremo debera ser un valor en
trminos de una probabilidad y de la puntuacin Z que corresponde a dicha probabilidad. En
nuestro ejemplo de la vitamina purificada, ios investigadores podran decidir que s la verosimi
litud de un resultado fuera menor del 2% (la probabilidad), rechazaran la hiptesis nula. Estar
dentro del 2% inferior de una curva normal significa tener una puntuacin Z de aproximadamen
te -2 menor. Por lo tanto, los investigadores estableceran -2 como la puntuacin Z de corte en
la distribucin comparativa para decidir que un resultado es Jo suficientemente extremo como
para rechazar la hiptesis nula.
Supongamos que los investigadores son todava ms cautelosos en cuanto al rechazo de la hi
ptesis nula. En ese caso, podran decidir que rechazarn la hiptesis nula slo si obtienen un re
sultado cuyas chances de ocurrir son del 1% menos. Entonces podran calcular la puntuacin Z
de corte correspondiente al 1%. Conforme a la tabla de reas bajo la curva normal, para tener un
valor dentro del 1% inferior de una curva normal, se necesita una puntuacin Z de -2,33 menor.
(En nuestro ejemplo, ana puntuacin Z de -2,33 corresponde a 7 meses). En la figura 6-2 hemos
sombreado el 1% de la distribucin comparativa, en el que una muestra sera considerada tan ex
trema que se rechazara la posibilidad de que surgiera de una distribucin como esa.
En general, los investigadores psicolgicos utilizan un corte en la distribucin comparativa
que coincide con una probabilidad del 5% de que un valor sea al menos tan extremo. Es decir, los
Figura 6-2. Distribucin de la edad en la que los bebs comienzan a caminar (datos ficticios).
vestigadores concluirn que no existe suficiente evidencia para rechazar la hiptesis nula y ios re
sultados del experimento seran, entonces, no concluyentes.
Ahora analicemos el procedimiento de prueba de hiptesis ms detalladamente segn este
ejemplo, siguiendo los pasos resumidos anteriormente.
1. Replantear el problema en fundn de hiptesis de investigacin e hiptesis nula de las
poblaciones. Las poblaciones de inters son h s siguientes:
Poblacin 1: personas que hace 6 meses recibieron 1 milln de dlares.
Poblacin 2: personas que hace 6 meses no recibieron 1 milln de dlares.
La prediccin de los psiclogos especializados en personalidad, basndose en esta teora de
la felicidad, es que las personas que forman la poblacin 1 se sentirn en general ms felices que
las personas que forman la poblacin 2 (en smbolos, M l>M2). La hiptesis nula implica que las
personas que forman la poblacin 1 (los que recibieron 1 milln de dlares) no se sentirn ms fe
lices que las personas que forman la poblacin 2 (aquellos que no recibieron 1 milln de dlares).
2. Determ inar las caractersticas de la distribucin comparativa. Llegado el momento
querremos comparar nuestra observacin con la situacin que se presentara si la hiptesis nula
fuera verdadera (para comprobar si podemos rechazar ese escenario). Si la hiptesis nula es ver
dadera, la distribucin de las poblaciones 1 y 2 sern iguales. Sabemos cul es la distribucin de
la poblacin 2, as que puede servimos como distribucin comparativa.
3. Determinar el punto muestral de corte en la distribucin comparativa, a partir del
cual debera rechazarse la hiptesis nula. Qu tipo de observacin sera suficientemente con
vincente como para rechazar la hiptesis nula? En este caso, supongamos que ios investigadores
decidieron por adelantado rechazar la hiptesis nula, por ser demasiado improbable, si los resul
tados pudieran ocurrir menos de un 5% de las veces si esa hiptesis nula fuera verdadera. Debi
do a que sabemos qu la distribucin comparativa es normal, podemos determinar a partir de la
tabla de reas bajo la curva normal que el 5% superior de los valores comienzan en una puntua
cin Z de aproximadamente 1,64. (Siendo la media de la distribucin comparativa igual a 70 y el
desvo estndar igual a 10, la hiptesis nula sera rechazada si el resultado de la muestra fuera
igual o mayor a 86,4. Es decir, siguiendo el mtodo usual para convertir una puntuacin Z en una
puntuacin original, 1,64 x 10 - 16,4, lo que sumado a la media de 70 da 86,4).
4. Determ inar el valor muestral en la distribucin comparativa. Observemos ahora los
resultados: seis.meses despus de entregar 1 milln de dlares a la persona elegida al azar, los in
vestigadores entregan a su ahora adinerado participante la prueba de nivel de felicidad. La pun
tuacin de la persona es 80. Como puede verse en la figura 6-4, una puntuacin de 80 corresponde
a una puntuacin Z de +1 en la distribucin comparativa.
5. Com parar los registros de los pasos 3 y 4 p ara decidir si se rechaza o no la hiptesis
nula. La puntuacin Z mnima, necesaria para rechazar la hiptesis nula, ha sido establecida en
+1,64 (la puntuacin Z que corresponde al 5% del nivel de significacin), y la puntuacin Z co
rrespondiente al individuo de la muestra es slo +1. Por lo tanto, la muestra no es lo suficiente
mente extrema como para damos fundamentos para rechazar la hiptesis nula. La hiptesis nula
no puede rechazarse, y los resultados del experimento no son concluyentes. Los investigadores
describen tal resultado como no significativo estadsticamente. La figura 6-5 muestra la distri
bucin comparativa con el 5% superior sombreado y la ubicacin del millonario que conforma
la muestra.
Un dato interesante es que Brickman, Coates y Janoff-Bulman (1978) realizaron un estudio
ms elaborado basndose en la misma cuestin, analizando a ganadores de la lotera como ejem
plos de personas a las que les ocurran hechos repentinos muy positivos. Sus resultados fueron si
milares a ios de nuestro ejemplo ficticio: 6 meses despus, el grupo ganador de dinero no era mu
cho ms feliz que las personas que no haban ganado ese dinero. Adems, descubrieron que otro
grupo estudiado por ellos, personas que haban quedado parapjicas a causa de accidentes, 6 me
ses despus no eran mucho menos felices que otras personas. Estos investigadores analizaron can
tidades bastante grandes de individuos e investigaron el tema de diversas maneras. Su conclusin
fue que si un hecho-importante en verdad provoca algn efecto duradero relacionado con la felici
dad, el efecto probablemente no es muy grande, Aparentemente, ganarse la lotera no es la res
puesta. (En otros estudios, p. ej. Suh, Dener & Fijita, 1996, se ha encontrado el mismo patrn).
Los estudios acerca de la vitamina purificada y la felicidad son ejemplos que involucran hiptesis
direccionales. En cada caso, los investigadores estaban interesados en una direccin especfica del
efecto. Es importante observar que cuando un investigador propone una hiptesis direccional, la
hiptesis nula correspondiente es, tambin, en cierto sentido direccional. Si la hiptesis de investi
gacin establece que obtener 1 milln de dlares har ms feliz a una persona, la hiptesis nula es-
F ig u r a 6-S . D is tr ib u c i n d e v a lo r e s d e l n iv e l d e f e lic id a d c o n e l 5 % s u p e r io r s o m b r e a d o y la u b ic a c i n d e l
m illo n a r io q u e c o n fo r m a la m u e s tr a (d a to s f ic t i c io s ) .
tablece que el dinero no producir ningn efecto o har menos feliz a esa persona, (Expresado en
smbolos, si la hiptesis de investigacin es x3 > jx2, entonces la hiptesis nula ser
< ji2). Por
lo tanto, como ya hemos observado, en la figura 6-5, por ejemplo, para rechazar la hiptesis nula la
muestra deba arrojar un valor que se ubicara dentro del 5% superior, el extremo o cola superior de
la distribucin comparativa. (A los fines de rechazar la hiptesis nula, un valor ubicado en la otra
cola sera considerado del mismo modo que un valor ubicado en el medio d la distribucin). Por
esta razn, la prueba de una hiptesis direccional se denomina prueba de una cola.
Hiptesis no direccio nal y pruebas de dos colas
Sin embargo, a veces una hiptesis de investigacin implica simplemente que una poblacin ser
diferente de la otra, sin especificar si la diferencia la marcarn valores ms altos o ms bajos. Por
ejemplo, un psiclogo especializado en organizaciones empresariales puede estar interesado en el
impacto provocado en la productividad por un programa de capacitacin en relaciones sociales.
Es posible que el programa mejore la productividad al hacer ms placentero el ambiente de traba
jo. Pero tambin es posible que perjudique la productividad por incentivar a las personas a que
practiquen relaciones sociales en lugar de trabajar. En este caso, la hiptesis de investigacin im
plicara que el programa de relaciones sociales cambie el nivel de productividad. La hiptesis nu
la implicara que el programa no afecte la productividad en ningn sentido. Es decir, expresado en
smbolos, la hiptesis de investigacin sera jj, j ^ p,2, y la hiptesis nula sera p.t - jx2.
Siempre que una hiptesis de .investigacin establezca una diferencia, sin indicar la direccin
de esa diferencia, se la denomina hiptesis no direccional. Para probar la significacin de una hi
ptesis no direccional, uno debe analizar si un valor es extremo en cualquiera de las dos colas de
la distribucin comparativa. Por lo tanto, a esta prueba se la denomina prueba de dos colas.
Determ inacin de puntos de corte en pruebas de dos colas
Las pruebas de dos colas presentan una complicacin especial. Supongamos que el investigador
selecciona un nivel de significacin del 5%. En una prueba de una cola, el investigador rechaza la
hiptesis nula si la oservacin muestral se ubica dentro de uno de los extremos que contiene el 5%
de la distribucin comparativa. En una prueba de dos colas, podra suponerse que el investigador
utilizara el 5% superior cuando el valor es extremo en direccin hacia arriba, y el 5% inferior
cuando el valor es extremo en direccin hacia abajo. Sin embargo, si el investigador hiciera esto,
existira un total del 10% de la distribucin comparativa dentro del cual la hiptesis nula podra
ser rechazada. El nivel de significacin en realidad sera del 10%, porcentaje que la mayora de
los investigadores considerara muy peligroso. (Es decir, con un 10% de nivel de significacin,
uno podra rechazar la hiptesis nula con mucha facilidad aun cuando sta fuera verdadera).
Existe una solucin para este problema. Al realizar una prueba de dos colas, se divide el por
centaje de significacin entre las dos colas. Con un nivel de significacin del 5%, se rechazara la
hiptesis nula slo si la muestra fuera tan extrema que se ubicara dentro del 2 1/2 % superior o
dentro del 2 1/2 % inferior. De este modo, la posibilidad total de que la hiptesis nula sea verda
dera, determinada con anterioridad a la realizacin del estudio, se mantiene en un total del 5%.
Es importante sealar que al utilizar una prueba de dos colas; las puntuaciones Z de corte pa
ra un nivel del 5% son +1,96 y -1,96. En el caso de una prueba de una cola, el corte no era tan ex
tremo, +1,64 y -1,64, pero slo se tem'a en cuenta un lado de la distribucin. La figura 6-6a
representa esas situaciones. Utilizando un nivel de significacin del 1%, una prueba de dos colas.
(0,5% en cada cola) presenta cortes de +2,58 y -2,58, mientras que los cortes en una prueba de
una cola seran de +2,33 -2,33 (vase figura 6~6b).
Resulta ms fcil rechazar la hiptesis nula con una prueba de una cola que con una prueba de dos
colas, ya que el valor de la muestra no necesita ser tan extremo para que el resultado experimental
sea significativo. Sin embargo, esto tiene su costo, ya que con las pruebas de una cola, si el resul
tado es extremo en la direccin opuesta a la esperada, no puede considerarse significativo y no
importa cun extremo haya sido ese resultado.
En principio, se planifica una prueba de una cola cuando se trabaja con una hiptesis clara
mente direccional, y de dos colas cuando se trabaja con una hiptesis claramente no direccional.
En la prctica, la decisin no resulta tan simple. Incluso cuando una teora predice claramente un
resultado determinado, a veces descubrimos que el resultado es justamente el opuesto de lo que
esperbamos, y en ocasiones ese resultado opuesto puede ser realmente ms interesante. (Qu
hubiera sucedido si, como ocurre en todos los cuentos de hadas sobre genios y peces que conce
den deseos, recibir 1 milln de dlares y cumplir casi todos sus deseos hubiera hecho de ese indi
viduo una persona infeliz? El resultado hubiera sido realmente muy interesante). Utilizando las
pruebas de una cola corremos el riesgo de tener que ignorar resultados posiblemente importantes.
Debido a estas consideraciones, la utilizacin de las pruebas de una cola es discutida, aun
cuando la hiptesis sea claramente direccional. Para mayor seguridad, muchos investigadores uti
lizan pruebas de dos colas tanto para hiptesis direccionales como no direccionales. Si el resulta
do de la prueba de dos colas es significativo, entonces el investigador analiza el patrn de los
datos hallados-para determinar la direccin del resultado, considerando ai estudio significativo en
esa direccin.2 Cabe mencionar que, en la prctica, este es un procedimiento conservador, por el
hecho de que siendo los puntos de corte ms extremos para una prueba de dos colas, es menos ve
rosmil que una prueba de dos colas d un resultado significativo. Por lo tanto, si se obtiene un re
sultado significativo con una prueba de dos colas, uno puede estar ms seguro de sus
conclusiones. De hecho, en la mayora de las publicaciones cientfcas psicolgicas, a menos que
el investigador indique especficamente que utiliz una prueba de una cola, en lneas generales se
supone que utiliz una prueba de dos colas.
No obstante, cabe recordar que, por lo general, la conclusin final no es afectada realmente
por el hecho de que el investigador utilice una prueba de una o dos colas. Segn nuestra experien
cia, usualmente los resultados de las investigaciones o son tan extremos que seran considerados
significativos a travs de cualquier estndar razonable, o estn tan lejos de serlo que no seran
considerados significativos a travs de ningn procedimiento.
Qu sucede cuando un resultado arroja conclusiones menos precisas? La decisin del inves
tigador en cuanto a las pruebas de una o dos colas adquiere mayor importancia. En ese caso, el in
vestigador intentar utilizar el mtodo que arroje la conclusin ms exacta y menos controvertida,
ya que la idea es dejar que hasta donde sea posible, la naturaleza, y no la decisin del investiga
dor, determine la conclusin. Ms an, cuando un resultado no es completamente claro en uno u
otro sentido, la mayora de los investigadores se sentiran incmodos al sacar conclusiones defini
tivas sin realizar otros estudios.
2 Leventhal
y Huynh (1996) sostienen que este procedimiento en realidad es incorrecto. S uno est probando una
hiptesis no direccional, slo debera sacar conclusiones no direccionales. Sugieren que un mejor procedimiento sera
utilizar una prueba direccional de dos colas", que en realidad son dos pruebas simultneas de una cola (una en cada
direccin), As, si un investigador quisiera establecer un nivel de significacin total de 0,05, utilizara una prueba direc
cional de dos colas, en la que cada una de las dos subdivisiones de una cola utilizara el nivel 0,025. En cuanto a decidir
si un resultado es significativo o no, el mtodo de Leventhal y Huynh produce un resultado idntico al de la prueba de
uso ms-comn, no direccional de dos colas. El razonamiento de Leventhal y Huynh sobre las pruebas de dos colas
parece ms lgico (adems de tener otras ventajas tcnicas). Sin embargo, debido a que los investigadores an no han
adoptado ese mtodo (y dado que el resultado es el mismo), en este libro utilizamos el mtodo m is tradicional.
Aqu presentamos otro ejemplo ficticio, pero esta vez utilizando una prueba de dos colas. Un gru
po de psiclogos clnicos de un centro residencial de tratamiento psiquitrico creen haber desa
rrollado un nuevo tipo de terapia que aliviar, en mayor grado que la terapia que se est utilizando
en ese momento, la depresin de los pacientes. Sin embargo, como sucede con cualquier trata
miento, no se puede descartar la posibilidad de que provoque peores resultados en algn paciente.
Por lo tanto, los investigadores probarn una hiptesis no direccional.
Los psiclogos procedern de la siguiente manera: seleccionarn al azar un paciente que re
cin ingrese para suministrarle la nueva terapia en lugar de la usual. (Por supuesto que en un estu-
Fgura 6 - 6 . Comparacin de puntos de corte segn el nivel d e Significacin p a r a pruebas de una y dos colas:
(a) nivel de significacin 0,05; (b) nivel de significacin 0,01, (Las pruebas de una cola en estos ejem plos
suponen que se predeca un valor alto).
dio real se seleccionara ms de un paciente, pero supongamos que una sola persona ha sido capa
citada para realizar la nueva terapia y que tiene tiempo para tratar slo a un paciente). La depre
sin del paciente se medir con una escala de depresin estndar que se aplica automticamente a
todos los pacientes despus de 4 semanas. Esa escala ha sido aplicada a los pacientes durante un
largo tiempo en este centro de tratamiento. Por lo tanto, es posible determinar por adelantado en
aquellos pacientes que recibieron la terapia usual la distribucin de los valores del nivel de de
presin a las 4 semanas. En nuestro ejemplo ficticio, esa distribucin sigue una curva normal con
una meda de 69,5 y un desva estndar de 14,1. (Las cifras mencionadas se aproximan a los valo
res de depresin obtenidos en una encuesta nacional de 75,000 pacientes psiquitricos a los que
se Ies suministr el m m p i , una prueba estndar ampliamente utilizada; Dahlstrom, Larbar, &
Dahlstrom, 1986). La figura 6-7 muestra esta distribucin.
El procedimiento de prueba de hiptesis se realiza, entonces, de la siguiente manera:
1.
Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de la
poblaciones. Las dos poblaciones de inters son:
Poblacin X: pacientes con diagnstico de depresin que recibieron la nueva terapia.
Poblacin 2: pacientes con diagnstico de depresin que recibieron la terapia estndar.
La hiptesis de investigacin supone que, al medir la depresin 4 semanas despus dei ingre
so, los pacientes que reciben la nueva terapia (poblacin 1) tendrn un valor diferente al de los pa
cientes que reciben la terapia actual (poblacin 2). En smbolos, ia hiptesis de investigacin es
M x ; M2. L o contraro a la hiptesis de investigacin, la hiptesis nula, supone que los pacientes
que reciben la nueva terapia tendrn el mismo nivel de depresin que los pacientes que reciben la
terapia usual. (Es decir, el nivel de depresin medido despus de 4 semanas ser el mismo para la
poblacin 1 y 2). En smbolos, la hiptesis nula es: jl^ = |i.
F ig u r a 6 -7 . D is tr ib u c i n d e io s v a lo r e s d e la e s c a la d e d e p r e s i n m m p i a 4 s e m a n a s d e l in g r e s o , c o r r e s p o n
d ie n t e s a p a c ie n t e s p s iq u i tr ic o s a lo s q u e s e l e s d ia g n o s t ic d e p r e s i n y q u e r e c ib e n la ter a p ia e s t n d a r (d a
to s f ic t i c io s ) .
Nivel de depresin:
Pimiiadn Z:
..
4! ,3-'
-2
55,4
*~l
69,5
.:o
83,6
+ 1-'
97,7 <
-VI ,
Figura 6-8. Distribucin de los valores de la escala de depresin m m h con el 2 1 /2 % superior e inferior
sombreado, el cual indica la ubicacin del paciente que conforma la muestra y que recibi la nueva terapia,
(datos ficticios).
CONTROVERSIAS Y L IM IT A C IO N E S _________________________________
En los ltimos aos ha surgido una controversia importante acerca de la propia prueba de signifi
cacin, con un movimiento organizado por parte de un pequeo pero resonante grupo de psiclo
gos que pretendan prohibirlas. La sugerencia es radical, y sus consecuencias tendran un enorme
alcance (durante al menos medio siglo casi todas las investigaciones psicolgicas han utilizado
las pruebas de significacin). Probablemente, en las ms importantes revistas cientficas especia
lizadas en psicologa se haya escrito recientemente mucho ms acerca de esta controversia. El co
mienzo de una publicacin reciente ilustra la fuerza que ha adquirido el debate:
N o e s v e r d a d q u e u n g r u p o d e a c t iv is t a s r a d ic a le s to m a r a n a 1 0 e s t a d s t i c o s y 6 e d it o r e s c o m o
r e h e n e s e n la C o n v e n c i n d e la S o c i e d a d A m e r ic a n a d e P s i c o l o g a d e 1 9 9 6 y c o r e a r a n a p o y e n
la p r o h ib ic i n to t a l d e la s p r u e b a s y a n u le n la ( h i p t e s i s ) n u la , ( A b e s o n , 1 9 9 7 , p. 1 2 ),
Dado que se trata, hasta ahora, de la ms enrgica e importante controversia surgida en aos con res
pecto a la estadstica aplicada a la psicologa, trataremos los distintos temas relacionados con ella al
menos en tres diferentes oportunidades. En este captulo, nos concentraremos en algunos desafos
bsicos para la prueba de hiptesis. En los captulos 7 y 8 tocaremos otros temas relacionados con
aspectos de la prueba de hiptesis que ensearemos en esos captulos.
Antes de exponer esta controversia, queremos asegurar al alumno que no est aprendiendo la
prueba de hiptesis intilmente. No importa lo que suceda en el futuro, ya que es absolutamente
necesario comprender la prueba de hiptesis para poder encontrar el sentido de todas las publica
ciones cientficas publicadas en el pasado. Ms an, a pesar de la vehemente controversia que ha
surgido en los ltimos aos, es sumamente extrao ver nuevas publicaciones que no utilicen la
prueba de significacin, por lo que resulta dudoso que ocurra algn cambio importante en un futu
ro cercano. Finalmente, aun si se abandonara por completo la prueba de hiptesis, las alternativas
(que involcucran procedimientos que ensearemos en los captulos 7 y 8) requieren la compren
sin de prcticamente toda la lgica y de todos los procedimientos que tratamos aqu.
Cul es entonces la gran controversia? Algunos puntos del debate estn relacionados con su
tiles temas de lgica. Por ejemplo, una postura plantea si tiene sentido preocuparse por rechazar
la hiptesis nula cuando es extremadamente improbable que resulte verdadera una hiptesis que
supone que no se produce ningn tipo de efecto. Tratamos este tema brevemente en el cuadro 6-1.
Otro de los temas est relacionado con los fundamentos de la prueba de hiptesis en relacin
con las poblaciones y las muestras, debido a que en la mayora de los experimentos las muestras
que utilizamos de la poblacin definible no son seleccionadas de manera aleatoria. En el captulo
5 tratamos algunos puntos relacionados con este tema. Finalmente, algunos han cuestionado lo
adecuado de llegar a la conclusin de que si la informacin es inconsistente con la hiptesis nula,
esto debe ser considerado como evidencia de la hiptesis de investigacin. Esta controversia es
bastante tcnica, pero nuestra propia opinin es que lo que estamos haciendo es razonable, con
forme a recientes consideraciones sobre estos temas, (vase, p. ej. Cortina & Dunlop, 1997).
De todos modos, la queja ms considerada contraas pruebas de significacin, y que ha obte
nido el acuerdo prcticamente universal, es que las pruebas estn mal utilizadas. De hecho, los
opositores de las pruebas de significacin sostienen que aun si no existieran otros inconvenientes
con respecto a las pruebas, stas deberan ser prohibidas, simplemente por ser utilizadas con tan
ta frecuencia de un modo tan inadecuado. Son dos los casos de pruebas que se utilizan inadecua
damente, Una podemos analizarla ahora, la otra deber esperar hasta que hayamos tratado un
tema que ensearemos en el captulo 8.
Uno de los principales usos inapropiados de las pruebas es la tendencia de los investigadores
a decidir que, si un resultado no es significativo, queda demostrado que la hiptesis nula es verda
dera, Repetidamente hemos subrayado que cuando no se rechaza la hiptesis nula, los resultados
no son concluyentes. El error de llegar a la conclusin de que la hiptesis nula es verdadera, debi
do a la imposibilidad de rechazarla, es extremadamente serio, ya que pueden considerarse falsos
importantes mtodos y teoras slo porque determinado estudio no logr resultados lo suficiente
mente fuertes. (Como veremos en el captulo 8, es bastante fcil que una hiptesis de investiga
cin verdadera no resulte signicativa slo porque el estudio se realiz con pocas personas o
porque las medidas no eran muy precisas. De hecho, Hunter (1997) sostiene que en aproximada
mente el 60% de los estudios psicolgicos es probable que obtengamos resultados no significati
vos aun cuando la hiptesis de investigacin sea realmente verdadera).
Cul es entonces la solucin? El consenso general parece determinar que deberamos man
tener las pruebas de significacin, pero preparando mejor a nuestros alumnos para que no las uti
licen de manera inadecuada (a esto se debe que se haya hecho tanto hincapi en esos temas a lo
largo del libro), es decir que deberamos cuidamos de no perder una herramienta valiosa slo por
que no se a utilice en manera adecuada. Con el fin de tratar esta controversia, la a p a estableci un
comit formado por eminentes psiclogos renombrados por su experiencia en estadstica. En el
informe provisorio del Cuerpo de trabajo sobre inferencia estadstica [Task Force on Statistical
Inference] de la a p a (1996), llegaron a la siguiente conclusin:
Respaldamos una poltica de inclusin que admita en el arsenal del cientfico de investigacin
cualquier procedimiento que apropiadamente arroje algo de luz sobre el fenmeno de inters. En
este sentido, el Cuerpo de Trabajo no respalda ninguna accin que pueda ser interpretada como
prohibicin del uso de la prueba de significacin de la hiptesis nula o de los valores p en investi
gaciones y publicaciones psicolgicas, (p. 2)
real (por ejemplo, > = 0,27), o se puede utilizar la abreviatura N$, (por no significativo). Ade
ms, por lo general tambin se indicar si se utiliz una prueba de una cola. Como dijimos ante
riormente, salvo que se indique lo contrario, al leer publicaciones cientficas se supone que se
utiliz una prueba de dos colas.
Aun cuando el investigador haya elegido previamente el nivel de significacin, como por
ejemplo 0,05, pueden indicarse los casos en los que los resultados cumplen con estndares ms ri
gurosos. (Se supone que esto debe impresionar al lector). Por eso, en la misma publicacin pode
mos encontrarnos, por ejemplo, con resultados en ios cuales se indica p<0,05, y en otros
pcO.Oi, e incluso en otros p < 0 ,0 0 r\
Finalmente, en muchos casos los resultados de la prueba de hiptesis se muestran slo como
asteriscos en una tabla de resultados. En esas tablas, un resultado con un asterisco es significativo,
mientras que un resultado sin asterisco no lo es. Por ejemplo, la tabla 6-1 presenta los resultados
de una parte de un estudio realizado por Stipek y Ryan (1997), el cual compara alumnos de jardn de
infantes de condicin socioeconmica baja con otros econmicamente privilegiados. La tabla nos
proporciona las cifras correspondientes a variables medidas a travs de la observacin de nios en
el aula, e incluye las medias, los desvos estndar y el estadstico F (una indicacin del procedi
miento utilizado en este estudio para probar la significacin, procedimiento que trataremos en los
captulos 11 al 13). Lo que resulta importante observar en la tabla, para los fines que estamos tra
tando, son los asteriscos (y las notas correspondientes en la parte inferior de la tabla) que indican
los niveles de significacin de las distintas medidas. Podemos ver, por ejemplo, con respecto al de
seo de demostrar los logros, que los nios de bajo nivel socioeconmico (M ~ 0,20) marcaron re
gistros significativamente mayores a los de los nios econmicamente privilegiados (M = 0,04).
En el caso de sonre despus de terminar la tarea el patrn fue lo contrario.
No obstante, podemos observar que en cuanto a hacer comparaciones sociales positivas no
hubo diferencias significativas entre ios grupos (ias medias fueron 0,71 y 0,61, pero no fueron lo
suficientemente diferentes como para resultar significativas en este estudio). Por eso, no pode
mos concluir que en alumnos de jardn de infantes una mala condicin econmica tenga alguna
relacin con haber realizado comparaciones sociales positivas. Tambin sera equivocado llegar
a la conclusin de que una mala situacin econmica no tiene ninguna relacin con realizar
comparaciones sociales positivas. Como dijimos anteriormente, cuando un resultado no es lo su
ficientemente fuerte como para que se rechace la hiptesis nula, normalmente la mejor conclu
sin es que los resultados no son concluyentes.
Cabe mencionar que en todos estos ejemplos, los investigadores por lo general no hacen expl
cita la hiptesis de investigacin o a hiptesis nula, ni tampoco describen ninguno de los otros pa
sos del proceso en detalle. Se supone que el lector comprende perfectamente todo el proceso.
RESUMEN
La idea bsica de una prueba de hiptesis es analizar la probabilidad de que el resultado de un es
tudio pudiera haber sucedido aun si a situacin real implicase que el procedimiento experimental
no produjo ninguna diferencia. Si la probabilidad es baja, se rechaza el escenario de la no diferen
cia, y se sostiene la teora a partir de a cual surgi el procedimiento experimental La expectativa
de una diferencia es la hiptesis de investigacin, y la situacin imaginaria en la que no existe
ninguna diferencia se denomina hiptesis nula. Cuando un resultado fuera muy inverosmil, si la
hiptesis nula fuera verdadera; entonces se rechaza la hiptesis nula y se sostiene la hiptesis de
Tabla 6-1.
Valores medios de variables observadas en clase, relacionadas con la motivacin segn la situacin
socioeconmica.
C o n d ic i n
P riv ile g ia d o s
so cio e c o n m ica b a ja
V ariable d e m o tiv a ci n
D esea demostrar sus logros
Sonre despus de terminar la tarea
C om paracin social positiva
C om paracin social negativa
C om entarios sobre com petencia
B u sca ayuda
Incum plim iento
D iscip lina
Tristeza
Aburrimiento
Frustracin
N iv el d e esfuerzo
SD
SD
0 ,2 0
0 ,1 4
0,71
0,12
4 ,1 4
0,01
0,12
0 ,1 0
1,03
1,05
1,03
1,34
0,51
0,42
0,45
0,34
1,83
0 ,1 0
0,35
0,30
0,17
0,21
0 ,1 7
0,93
0,04
0,05
0,64
0 ,3 6
5,74
0,09
0,13
0 ,1 6
1,02
1,29
1,03
1,36
0 ,2 0
0 ,2 2
0,48
0 ,4 8
1,78
0,33
0 ,5 3
0 ,4 7
0 ,1 4
0 ,4 6
0,17
0,95
F ( l, 195)
9,94**
4,49*
0,01
2 1 ,24****
2 5 ,39****
5,14*
0,07
2 ,2 6
0,15
2 5 2 9 ***
0,02
0,28
investigacin. Si los resultados obtenidos no son muy extremos, se dice que el estudio no fue con
cluyente.
Los psiclogos usuaimente consideran un resultado como muy extremo si presenta menos de
un 5% de posibilidades, aunque algunas veces se utiliza un corte ms riguroso, del 1%. Estos por
centajes pueden aplicarse a la probabilidad de que un resultado sea extremo en una direccin pre
dicha (prueba direccional o de una cola), o a la probabilidad de que sea extremo en cualquiera de
las dos direcciones posibles (prueba no direccional o de dos colas). Para aplicar una poltica ms
conservadora, los psiclogos utilizan con frecuencia las pruebas de dos colas aun cuando ya ten
gan una prediccin especfica.
El proceso de prueba de hiptesis involucra cinco pasos:
1. Replantear el problema en funcin de la hiptesis de investigacin e hiptesis nula de las
poblaciones.
2. Determinar las caractersticas de la distribucin comparativa.
3. Determinar el punto muestra! de corte en la distribucin comparativa, a partir del cual de
bera rechazarse la hiptesis nula.
4. Determinar el valor muestral en la distribucin comparativa.
5. Comparar los valores de los pasos 3 y 4 para decidir si se rechaza o no la hiptesis nula.
Una gran controversia ha surgido recientemente con respecto a las pruebas de significacin.
Los crticos han planteado cuestiones sobre la lgica bsica de estas pruebas. Sin embargo, la
principal crtica plantea que, con mucha frecuencia, las pruebas son mal utilizadas. Una manera
que tienen ios investigadores para utilizar inadecuadamente las pruebas es interpretando que el no
rechazo de la hiptesis nula implica sostenerla.
En general, las publicaciones cientficas informan los resultados de la prueba de hiptesis in
dicando si fueron o no significativas y mostrando el nivel de corte de la probabilidad (general
mente del 5% 1%) segn el cual fue tomada la decisin.
Trminos Clave
Distribucin comparativa.
Niveles convencionales de
significacin (p<O,O5,.p<O,01).
Punto muestral de corte .
- Hiptesis direccional.
- Prueba de hiptesis.
- Hiptesis no direccional.
- hiptesis nula.
Ejercicios
Registro
Colas
Estudio Poblacin muestra! p de la prueba
A
B
C
D
E
F
G
H
I
M'
10
10
10
10
10
10
10
12
12
CF
2
2
2
2
4
1
2
2
2
14
14
14
14
14
14
16
16
8
0,05
0,05
0,01
0,01
0,05
0,01
0,01
0,01
0,05
1 (prediccin alta)
2
1 ( prediccin alta)
2
1 ( prediccin alta)
2
2
2
1 { prediccin baja)
SERIE II
L Enumere los pasos del proceso de prue
ba de hiptesis y explique el procedimiento y
los.fundamentos de cada uno.
Tabla 6-2.
Algunos indicadores dei cambio en ei consumo de tabaco, exposicin ai e t s 3 , y actitudes del pblico
hacia las polticas de control de tabaco, Massachussetts, 1993-1995.
C o m p o r ta m ie n to d e fu m a d o res a d u lto s
Porcentaje que fuma > 25 cigarrillos diarios
Porcentaje que fum a < 1 5 cigarrillos diarios
Porcentaje que fuma antes de tra n scu rrid o s 3 0 m inutos de despertarse
E x p o sici n a l h u m o d e ta b a co en el a m b ien te
Porcentaje de trabajadores que inform an sobre
un lugar de trabajo en e l que no se fuma
M edia de horas de exposicin al ets en el trabajo
durante la sem ana anterior
Porcentaje de hogares en los que est prohibido fumar
A c titu d e s h a c ia las p o ltic a s de co n tro l del ta b a co
Porcentaje que apoya un m ayor aum ento de im puestos al tabaco
asignando lo s fondos al control del tabaco
Porcentaje que cree que la exposicin al ets es perjudicial
Porcentaje que apoya la prohibicin
de las mquinas expendedoras
Porcentaje que apoya la prohibicin del patrocinio de deportes
y eventos culturales por parte de las com paas d e tabaco
1993
1995
24
31
54
10*
49*
41
53
65*
4,2
2,3'
41
51*
78
81
90
54
84
64*
59
53*
Fuente; Siegei, M,, & Biener, L. (1997), tab. 4. Evaluacin del impacto de las campaas estatales contra el tabaco:
programas de control dei tabaco de Massachusetts y California. R evista C ien tfica d e A su n to s S o c ia le s { J o u rn a l o f S o
c ia l ssites ], 5 3 ,1 4 7 -1 6 8 . Copyright 1997 por la Sociedad para el Estudio Psicolgico de Asuntos Sociales [Society
for the Psychoiogical Stucly o f Social Issues], Reimpreso con Autorizacin.
Pruebas
de hipnosis
con medias
maestrales
en publicaciones cientficas.
' Prueba de hiptesis sobre la distribucin > Resumen.''
demedias...
Trminos clave.
Estimacin e intervalos de confianza.
Ejercicios.
Controversias y limitaciones: Intervalos
de confianza o pruebas de significacin?
LA DISTRIBUCIN DE MEDIAS
La prueba de hiptesis en condiciones normales de investigacin, cuando se analiza una muestra
formada por muchos individuos, es exactamente igual a lo que hemos aprendido en el captulo 6,
con una importante excepcin. Cuando hay ms de una persona en la muestra surge un problema
especfico en e paso 2, al determinar las caractersticas de la distribucin comparativa. l proble
ma es que el valor muestral que nos interesa es la media del grupo de valores. Las distribuciones
comparativas que hemos estado analizando hasta ahora han sido distribuciones poblacionales de
valores individuales (por ejemplo, las edades en que cada beb en particular comienza a caminar
o la poblacin de valores individuales a partir de un cuestionario para medir el nivel de felicidad).
Comparar la media de una muestra de, digamos, 50 individuos con una distribucin de valores in
dividuales constituye una comparacin desigual, como comparar manzanas y naranjas. En cam
bio, cuando lo que nos interesa es la media de una muestra de 50, necesitamos una distribucin
comparativa formada por medias de muestras de 50 valores. A esta distribucin comparativa la
denominaremos distribucin de medias.
Para expresarlo ms formalmente, una distribucin de medias es una distribucin formada
por las medias de cada una de las numerosas muestras del mismo tamao seleccionadas al azar
entre la misma poblacin de individuos. (Los estadsticos tambin llaman a esta distribucin de
medias una distribucin en el muestreo de la media; sin embargo, en este libro utilizamos el
trmino distribucin de medias para que quede claro que estamos hablando de poblaciones y no
de muestras o distribuciones de frecuencias de una muestra).
CREACION DE
Podremos comprender mejor la idea de una distribucin de medias analizando cmo construir tal
distribucin a partir de una distribucin ordinaria de individuos. Supongamos que nuestra pobla
cin estaba compuesta por alumnos de grados elementales e inferiores -de determinada regincuya poblacin total es de 90.000 nios. Supongamos, adems (para que el ejemplo sea simple),
que hay exactamente 10.000 nios en cada grado, desde el primero hasta el noveno. La distribu
cin de poblacin sera rectangular, con una media de 5, una varianza de 6,67 y un desvo estn
dar de 2,58 (vase figura 7-1).
Supongamos que luego escribiramos el grado al que pertenece cada nio en una pelotita de
ping pong y que pusiramos las 90.000 pelottas plsticas en un recipiente gigante. El recipiente
contendra 10.000 pelottas con un nmero 1 escrito en ellas, 10.000 con un nmero 2, y as suce
sivamente. Mezclamos las pelottas en el recipiente, y luego extraemos dos, es decir, se extrae una
muestra aleatoria de dos pelottas. Supongamos que una pelotita tiene un nmero 2 y la otra tiene
un nmero 9. En ese caso, el grado medio de la muestra formada por el grado al que pertenecen
dos de los nios es 5,5, es decir, el promedio de 2 y 9. Entonces, volvemos a poner las pelottas en
el recipiente, mezclamos todas las pelottas, y seleccionamos otra vez dos peiotitas. Puede ser que
esta vez extraigamos dos cuatros, siendo 4 la media de la segunda muestra. Despus volvemos a
realizar el procedimiento, y en esa oportunidad extraemos un 2 y un 7, siendo a media 4,5. Hasta
aqu tenemos tres medias: 5,5,4 y 4,5.
Los tres nmeros mencionados en el prrafo anterior (cada uno de ellos es la media de una
muestra formada por los grados a los que pertenecen dos nios de escuela) pueden considerarse
una pequea distribucin en s misma. La media de esta pequea distribucin de tres nmeros es
4,67 (la suma de 5,5,4 y 4,5, dividida por 3); la varianza de esa distribucin es 0,39 (la varianza
de 5,5,4 y 4,5) y el desvo estndar es 0,62 (la raz cuadrada de 0,39). La figura 7-2 representa un
histograma de esta distribucin de tres medias.
Si continuramos con el proceso, el histograma de medias continuara creciendo. La figura
7~3a representa un ejemplo despus de seleccionar 10 muestras aleatorias de dos peiotitas cada
= 4 ,6 Z .
SD2. - 0,39.
' -M
5 0 = 0,62.
..5 /
'
0
L
2 '3
'
.4,
.5
Grado'.
Gr do'
ri-.'': t 7
; ': '
.9
F ig u r a 7 -2 . D istrib u cin de m ed ia s d e tres
m uestras aleatorias de lo s grados a lo s qu e
perten ecen dos e sc o la r e s, extradas de una
p o b la ci n conform ad a por lo s grados a los qu e
concurren 9 0 .0 0 0 e sc o la r e s (d atos fic ticio s).
Figura 7-3. Distribuciones de medias de muestras aleatorias de dos pelotitas cada una, extradas de una
poblacin de 90.000 pelotitas, de las cuales, cada 10.000, llevaban uno de los nmeros del 1 al 9. Las casti
dades de medias mustrales que incluye cada distribucin son (a) 10 medias mustrales, (b) 20 medias
mustrales, (c) 100 medias mustrales y (d) 1.000 medias mustrales. (El muestreo real fue simulado por
computadora).
ca del 5.-Se puede probar matemticamente que si tomramos una cantidad infinita de muestras,
la media de la distribucin de medias de estas muestras resultara ser exactamente igual a la me
dia de la distribucin de individuos.
or =
400
= 16
25
7f
(7-2)
(7-3)
medias es ms posible que se den los valores centrales, y menos posible que se den las medias
extremas. La distribucin tiende a ser simtrica porque la falta de simetra (asimetra) es causada
principalmente por extremos, y al haber menos extremos hay menos asimetra. En nuestro ejem
plo de los grados escolares, la distribucin de medias que creamos result tan claramente simtri
ca debido a que la distribucin poblacional de los grados individuales era simtrica. Si la
distribucin de valores de l'a poblacin de individuos hubiera sido asimtrica hacia un lado, la dis
tribucin de medias hubiera sido asimtrica tambin, pero no tanto.
Cuantos ms valores haya en cada muestra, ms semejante ser la distribucin de medias a la
distribucin normal. Por lo tanto, la tercera regla establece que con muestras de 30 ms valores,
aun con una poblacin de individuos no normal, la distribucin de medias se aproximar mucho a
una distribucin norma! y los porcentajes en la tabla de reas bajo la curva normal sern extrema
damente precisos.1,2 Adems, siempre que la distribucin de valores de la poblacin de indivi
duos sea normal, la distribucin de medias ser normal, sin importar la cantidad de valores que
incluya cada muestra.
R e s u m e n d e la s r e g a s p a r a la d e t e r m in a c i n
d e la s c a r a c t e r s t ic a s d e u n a d is t r ib u c i n d e m e d i a s
Hemos ignorado el hecho de que una curva normal es una distribucin terica ininterrumpida. En la mayora de los
ejemplos de la vida real, los registros se ubican en intervalos especficos, Por lo tanto, una diferencia entre una curva
normal y la distribucin de medias de pelotitas de ping pong de nuestro ejemplo es que la curva normal es ininterrum
pida, Sin embargo, en la investigacin psicolgica, usualmente suponemos que, aun cuando nuestras mediciones se
realicen a travs de intervalos especficos, el objeto implcito que estamos midiendo es continuo,
3Ya hemos analizado en el captulo 5 el principio que establece la tendencia de la distribucin de medias hacia una cur
va normal. Aunque an no habamos estudiado la distribucin de medias, aun as utilizamos ese principio para explicar
por qu ia distribucin de tantos elementos en la naturaleza siguen una curva normal, En ese captulo lo explicamos co
mo consecuencia de las distintas influencias que se equiparan unas a otras para hacer surgir una influencia promedio
con la mayoria de ios registros cerca del centro y, unos pocos, a cada extremo. Ahora hemos explicado el mismo tema
utilizando la terminologa de una distribucin de medias, Pensemos en cualquier distribucin de registros individuales
en la naturaleza como representativa de una situacin en la que cada registro es efectivamente un promedio de una serie
aleatoria de influencias que actan sobre ese registro individual. Analicemos la distribucin del peso del canto rodado.
El peso de cada piedra representa una especie de promedio de todas las diferentes fuerzas que actuaron para que ese
canto rodado tenga un peso determinado.
Figura 7-4. Ilustracin de los principios de la relacin entre la distribucin de medias (curvas en la parte in
E je m p lo d e d e t e r m in a c i n d e la s c a r a c t e r s t ic a s d e u n a d is t r ib u c i n d e m e d ia s
10.000
200
N
50
El desvo estndar de la distribucin de medias es la raz cuadrada de la varianza de la distribu
cin de medias: ^200= 14,14.
3.
La forma de la distribucin de medias ser normal. Se cumplen nuestros dos requerimien
tos: la distribucin de valores de la poblacin de individuos es normal y la cantidad de individuos
en cada muestra es igual a 30 mayor. (Habra sido suficiente si se hubiera cumplido slo uno de
los requerimientos).
O t r o e j e m p lo d e d e t e r m in a c i n d e la s c a r a c t e r s t ic a s d e u n a d is t r ib u c i n d e m e d ia s
La Lista de Control de Adjetivos [Adjective Check List] (Gough & Heilbrun, 1983) es una prueba
de personalidad ampliamente utilizada. La prueba est formada por una lista de adjetivos tales co
mo capaz, activo, atltico, y as sucesivamente, y aquellos que realizan la prueba controlan la lis
ta para determinar si cada adjetivo puede aplicarse a s mismo. Una de las sub-pruebas de la Lista
de Control de Adjetivos se focaliza en la agresin (adjetivos tales como agresivo, peleador, dog
mtico). La prueba ha sido aplicada a gran cantidad de personas en el pasado, y se sabe que los va
lores en la escala de agresin presentan una distribucin asimtrica con una media de 51 y una
varianza de 93 (redondeando). Cules sern las caractersticas de una distribucin de medias
maestrales de esta poblacin de individuos si cada muestra contiene 10 individuos?
1. La media de la distribucin- de medias ser 51,1a misma que la media poblacional.
2. La varianza de la distribucin de medias ser 93, la varianza poblacional, dividida por 10
(tamao de cada muestra). El resultado es 9,3. Se representa bajo la frmula:
_ O - 93 - 9 j 3
cr;,2
M"
N
10
El desvo estndar de la distribucin de medias es la raz cuadrada de 9,3, lo que es lo mis
mo, 3,05.
3.
La distribucin de medias no ser normal porque la distribucin de la poblacin de indivi
duos no es normal, y la cantidad de individuos por muestra es slo 10. Sin embargo, como toda,
distribucin de medias, tendr tendencia a ser unimodal y ms simtrica que la distribucin de la
poblacin de valores individuales.
Revisin de tres clases de distribuciones
Hemos estudiado tres diferentes tipos de distribuciones: a) la distribucin de valores de una po
blacin de individuos, b) la distribucin de observaciones de una determinada muestra tomada de
esa poblacin y c) la distribucin de medias. La figura 7-5 ilustra estas tres distribuciones, y la ta
bla 7-1 las compara.
Figura 7-5. Tres tipos de distribuciones: (a) distribucin de valores de una poblacin de individuos, (b) dis
tribucin de observaciones de una determinada muestra tomada de esa poblacin y (c) distribucin de me
dias de todas las muestras posibles de un determinado tamao, tomadas de esa distribucin.
Tabla 7-1.
Comparacin de tres tipos de distribuciones.
Distribucin
poblaciona!
Distribucin
de una muestra
determinada
Forma
Valores de
todos los individuos
de la poblacin.
Podra ser
cualquier forma,
a menudo normal.
Valores de
los individuos de
unasola muestra.
Podra ser
cualquier
fonna.
Media
P-
Varianza
tr2
Desvo
estndar
cr
Contenido
Distribucin
de medias
Medias de muestras
tomadas al azar de la poblacin.
Normal, si la poblacin
es normal. Aproximadamente
normal, si las muestras
contienen >: 30 observaciones
cada una.
M ~ 1X 1N,
Calculado de las
observaciones tomadas
de la muestra
S D ^ K X -M f/N ,
or^-o-VjV
Calculado de las
observaciones tomadas
de la muestra
s d =Vsd?
\
:
. Cuadro 7.-1. _
Algo ms sobre las encuestas: errores de muestreo
y errores l cnsiderar las muestras.
Volviendo ai cuadro 5-3, que trata acerca. ; muestra, El tamao de la propia poblacin: ":"
de sondeos y de la encuesta de Gallup, r^(de individuos), o la relacin del. tipa. '
cordarems que dejamos sin responder una
d la muestra con el de- Ja poblacin, :no! ,,
influye en sta frmula,
V
importante cuestin sobre la letra chica que
aparece cerca de los resultados de una en
Aun as, nuestra intuicin podra conti?;
cuesta,y que dice algo, as como: Informa- - : nuar dicndonos que.la antdad/nces'ari . :
cin proveniente de un sondeo telefnico 4 ' . para representar a todo el irimso pblico: ;
1.000 adultos estadounidenses, realizado e l de.los Estados Unidos dbela sr mayf W :;
slol-OOindividuos.Sinmb.argo,silopem" ;
4 y 5 de junio. Error de muestreo 3%. ;
Dijimos que tina .duda comn es pregum
samos.bien, cuando la muestra es sol una j
pequea parte de una poblacin muy grande^ . ,
tarse cmo se puede utilizar una cntidatj;tan pequea, como 1.000 individuos (an- . el tamao absoluto de l muestra es el nico: ;'
que rara vez se utiliza una cantidad; mucho
determinante de exactitud. se tamao abso-? i.
menor) para predecir la opinin de todq el . luto determina el impacto d los errores aleaA
pblico de los Estados Unidos..
torios de medicin y seleccin. /
Comencemos con el tema del tamao .
' Algunas veces: s influye el tamao t--...
de la muestra. De acuerdo a lo aprendido '
atyp de una muestra con respect a la po-', r
en este captulo, sabemos que cuando las
blacin; sto ocurre si. la poblacin es tari;
muestras son de gran tamao, como lo es
pequea que,: eliminr mtrrogaf:: l-:,-;.
una. muestra de 1.000 valores, se reduce',
gures,, aumenta- las chances de quedos res
mucho el desvo estndar de la distribu
tantes seari :entrevistados.' Pero- cuando la
cin de medias. Es decir,, la distribucin' ' .poblacin est formada por millones, eli-
minar a mil dos mil tendr un efecto prc- :;
de. medias mustrales se vuelve muy alta
y estrecha,, dispersa alrededor de la media ticamente nulo en las probabilidades de '
poblacionl. ' Por lo tanto, la media de
qu sean otros. Iqs entrevistados. Una en-,
cualquier muestra de ese tamao est muy
cuesta realizada a i.000 de entre un^'xniflni.'^i:1
cerca de la media poblacional. Para expre
.de votantes, o de entre 10 100 millones d
sarlo de otro modo, la varianza de la dis
votantes tendr esencialmente el .misino
tribucin de medias, que refleja cunto error casual. Lo importante es reducir des
: tiende a diferir cualquier media muestral
vos o : errores sistemticos, lo cual slo .
de la media poblacional, es la varianza de . puede ^lograrse a travs de una- planifica-/ .
cin muy cuidadosa.
. y .d d
la poblacin dividida por el tamao de la
no es diferente ai modo usual de convertir una puntuacin original en puntuacin Z. Sin embargo,
debemos ser cuidadosos para no confundimos, ya que el proceso involucra a ms de una media.
Es importante recordar que estamos manejando la media muestral como si fuera una simple ob
servacin individual. En otras palabras, la frmula ordinaria (del captulo 2) para convertir un va
(7-4)
vM
Por ejemplo, supongamos que la media muestral es 18 y que la distribucin de medias tiene una
media de 10 y un desvo estndar de 4, La puntuacin Z correspondiente a esta media muestral es
+2. Utilizando la frmula:
Z=
(jkf-jxjtf) _ 1 8 -1 0 _ 8
<*A
Figura 7-7. Con respecto ai experimento ficticio del captulo i acerca de la lectura de oraciones ambi
guas, (a) distribucin poblacional de valores individuales, (b) distribucin de medias y (c)-distribucin
de la muestra.
que hace que sus significados sean un poco ms claros. El objetivo es establecer si el tiempo de
lectura ser ms rpido en estas condiciones. Por supuesto, tambin es posible que al proporcio
nar un contexto se demore la lectura por el hecho de hacer ms complicada la situacin.
Tambin supondremos que los investigadores han realizado muchos estudios previos con es
tas oraciones ambiguas presentadas sin contexto. A partir de esa investigacin supondremos que
los investigadores confan en que los tiempos de lectura de oraciones ambiguas, sin ningn con
texto de la poblacin en general, estn distribuidos de forma aproximadamente normal, con una
media de 2,75 segundos y una varanza de 0,02 segundos (cr = 0,14 segundos). La figura 7-7a
muestra la distribucin poblacional a la que nos referimos.
En el estudio que acabamos de describir se prueba a 40 individuos utilizando oraciones ambi
guas en contexto. El tiempo medio de lectura es de 2,71 segundos, (En el ejemplo que estamos
analizando conocemos la varanza poblacional antes de realizar el estudio. En este tipo de situa
ciones, la varanza muestral no se utiliza para nada en el proceso de prueba de hiptesis). La figu
ra 7-7c muestra la distribucin muestral.3
3En realidad, este estudio sera mucho mejor si los investigadores tuvieran tambin otro grupo de participantes a ios
que se les asignara al azar la realizacin de una prueba de velocidad de lectura de oraciones ambiguas sin contexto.
Confiar en informacin proveniente de estudios previos es unpoco arriesgado, porque las circunstancias en las que se
realizaron las pruebas durante uno y otro estudio pueden no ser idnticas. Sin embargo, nos hemos tomado algunas li
bertades con este ejemplo para ayudamos a introducirel proceso de prueba de hiptesis de aun paso por vez. En este
ejemplo, y en los otros del captulo, utilizamos situaciones en las que se contrasta unasola muestracon una poblacin
conocida. Apartirdel captulo 9, ampliamos el procedimiento depruebade hiptesis para adaptarlo a situaciones de
investigacin ms realistas, es decir, aquellas que involucranms de ungrupo de participantes yque incluyen poblacio
nes cuyas caractersticas se desconocen.
-0,04
0,022
5. Comparar los valores de los pasos 3 y 4 para decidir si se rechaza o no la hiptesis nula.
La puntuacin Z necsara para rechazar la hiptesis nula es 1,96. La puntuacin Z que obtuvi
mos es de slo -1,82. Por lo tanto, no podemos rechazar la hiptesis nula: el experimento no es
concluyente. Podemos observar el resultado grficamente en la figura 7-7b, la cual muestra que la
ubicacin de la media de nuestra muestra en la distribucin de medias no es tan extrema como pa
ra que sea claramente inverosmil que pueda ser seleccionada de esa distribucin.
No obstante, el resultado es casi lo suficientemente extremo como para rechazar la hiptesis
nula. Por lo tanto, los investigadores podran indicar que el resultado fue casi significativo o
cercano a la significacin, agregando tal vez que p<0,l0. (El punto de corte para la significa
cin a un nivel de 0,10, en una prueba de dos colas, es de 1,64). Pero con un resultado lmite co
mo este, el mejor consejo es repetir el experimento, tal vez con ms participantes. (El captulo 8
incluye una exposicin acerca de los efectos de aumentar la cantidad de participantes con respec
to a la probabilidad de que el experimento produzca un resultado significativo).
Figura 7-8. C o n resp e c to al estu d io fic tic io b a sa d o e n e l d e sem p e o en una prueba estndar d e n iv el a c a d
m ic o , (a ) distrib u cin p o b ia cio n a l d e va lo res in d ivid u ales, (b ) distribu cin d e m e d ia s (d istrib u cin c o m p a
rativa) y (c ) distrib u cin d e la m uestra.
2.304/64, es decir, 36. El desvo estndar de la distribucin de medias es la raz cuadrada de 36, o
sea, 6. Finalmente, dado que en la muestra hay ms de 30 individuos, la forma de la distribucin
de inedias ser aproximadamente normal. La figura 7-8b muestra la distribucin de medias que
acabamos de describir.
3.
Determinar el punto muestral de corte en ia distribucin comparativa, a partir del
cual debera rechazarse la hiptesis nula. Una vez ms, supongamos que los investigadores
adoptan el nivel de significacin usual del 5%. Los investigadores que realizan este estudio tienen
cluye la verdadera media poblacional de alumnos de quinto grado que reciben instrucciones espe
ciales.4 A esto se lo denomina estimacin por intervalos.
P rin c ip io
Cuanto ms amplia sea la estimacin por intervalos, mayor ser la certeza de que incluya la ver
dadera media poblacional. En el ejemplo de los alumnos de quinto grado podramos estar bastan
te seguros de que el intervalo de 100 a 340 incluye la verdadera media poblacional. Pero
estaramos arriesgndonos al fracaso si estimramos que la verdadera media poblacional est in
cluida en el intervalo de 219 a 221.
En general, necesitamos un intervalo lo suficientemente amplio como para aseguramos que in
cluya la media poblacional. A esto se lo denomina intervalo de confianza (a veces se abrevia ic).
Si queremos estar 95% seguros, necesitamos un intervalo del 95% de confianza. Un intervalo del
95% de confianza, en el ejemplo de los alumnos de quinto grado, abarca desde 208,24 hasta 231,76.
Es decir, sobre la base de la muestra analizada, podemos estar un 95% seguros de que un intervalo
de 208,24 a 231,76 incluye la verdadera media poblacional. (Pronto aprenderemos a calcular los in
tervalos). Los lmites superiores e inferiores de ios intervalos de confianza se denominan lmites de
confianza. En el ejemplo que estamos analizando, los lmites de confianza son 208,24 y 231,76.
Si queremos tener una seguridad an mayor al 95%, necesitamos un intervalo ms amplio. En
nuestro ejemplo, los lmites de confianza de un intervalo del 99% de confianza son 204,58 y 235,42.
Determinacin de los lmites de confianza
Los lmites de confianza se basan en la distribucin de medias. Lo que necesitamos saber es dn
de comienza y termina el 95% central de las medias en esa distribucin. Por lo tanto, necesitamos
encontrar los puntos de corte correspondientes al 2,5% inferior y al 2,5% superior, lo que deja un
total del 95% en el centro. (Para los intervalos del 99% de confianza necesitaramos calcular los
puntos ;que marcan el 0,5% superior e inferior, con lo cual dejaramos un 99% en el centro).
Comencemos con el lmite inferior. Como siempre, lo ms sencillo es pensar en funcin de
las puntuaciones Z. La puntuacin Z que marca el 2,5% inferior en una curva normal es -1,96.
(Este dato lo encontraremos en la tabla de reas bajo la curva normal). El ejemplo tiene una meda
de 220 y un desvo estndar de la distribucin de medias igual a 6. Por lo tanto, en esta distribu
cin de medias, una puntuacin Z de -1,96 corresponde a 208,24. (Es decir, utilizando el procedi
miento usual para convertir una puntuacin Z en una puntuacin original, convertimos la
puntuacin Z -1,96 en la puntuacin original 208,24).
El clculo del lmite superior funciona de la misma manera. La puntuacin Z que marca el
2,5% superior es +1,96 que, en la distribucin de medias, equivale a 231,76.
Pasos a seguir para el clculo de los intervalos de confianza
A continuacin presentamos los tres pasos para calcular intervalos de confianza. Al seguir estos
pasos se supone que la distribucin de medias es una distribucin aproximadamente normal.
1.
Determinar las caractersticas de la distribucin de medias utilizando el clculo acos
tumbrado. No obstante, cabe destacar que estamos interesados en la distribucin de medias co4 Segn }a lgica matemtica de la estadstica inferencia!, debemos considerar la media poblacional com o algo fijo. Los
intervalos de confianza pueden variar, pero la media poblacional es fija. Por lo tanto, podem os decir que estamos 95%
seguros de que nuestro intervalo de confianza incluye la media poblacional. N o deberamos decir que las chances de
que la media poblacional se encuentre dentro de intervalo de confianza son del 95%.
^respondiente a la poblacin que representa la muestra que estamos analizando (lo que hemos
llamado poblacin 1), y o en la distribucin de medias correspondiente a la poblacin con la
cual la estamos comparando (poblacin 2). Se estima entonces que la media de la distribucin
de medias es la media muestral. En cuanto a la varianza, afortunadamente, por lo general supo
nemos que la varianza de las dos poblaciones es la misma. Consecuentemente, podemos utili
zar la varianza conocida de la poblacin dada (poblacin 2) como base para calcular la varianza
de la distribucin de medias de la poblacin en la que estamos interesados (poblacin 1). (La
varianza de la distribucin de medias se basa slo en la varianza de la poblacin y en el tamao
de la muestra. Por lo tanto, la varianza de la distribucin de medias ser igual para ambas po
blaciones).
2. Utilizar la tabla de reas bajo la curva normal para encontrar las puntuaciones Z que coin
ciden con los porcentajes superiores e inferiores que nos interesan. Para un intervalo del 95% de
confianza, debemos buscar la puntuacin Z que coincide con el 2,5% inferior y el 2,5% superior
. Para un intervalo del 99% de confianza, debemos buscar la puntuacin Z que coincide con el
0,5% inferior y el 0,5% superior.
3. Convertir las puntuaciones Z en puntuaciones originales de la distribucin de medias. Esos
son los lmites de confianza superior e inferior.
Otro ejemplo de clculo del intervalo de confianza
Analicemos otro ejemplo. Calculemos el intervalo de confianza para el estudio basado en las ora
ciones ambiguas en el caso de los participantes que las lean en contexto. En ese caso, los 40 indi
viduos analizados de la manera mencionada tenan un tiempo medio de lectura de 2,71 segundos,
y sabamos por investigaciones anteriores que la poblacin de individuos que lea oraciones am
biguas sin ningn contexto tena una varianza de 0,02 segundos. Con esta informacin estamos
preparados para calcular el intervalo de confianza.
1. Determinar las caractersticas de la distribucin de medias. La media ser de 2,71 segun
dos. Suponemos que la poblacin de individuos puestos a prueba leyendo oraciones ambiguas en
contexto tendr la misma forma y varianza que la poblacin que lee sin contexto (o*2 = 0,02). Por
lo tanto, la distribucin de medias ser normal y tendr una varianza igual a 0,02/40 0,0005. El
desvo estndar es la raz cuadrada de este resultado, es decir, 0,022. (Cabe mencionar que obtu
vimos el mismo desvo estndar de la distribucin de medias que calculamos anteriormente al
realizar la prueba de hiptesis y concentramos en la distribucin de medias para la poblacin que
lee las oraciones sin contexto).
2. Utilizar la tabla de reas bajo la curva normal para encontrar las puntuaciones Z que co
rresponden al porcentaje superior e inferior que hayamos elegido. Suponiendo que queremos es
tablecer el intervalo usual del 95% de confianza, entonces buscaremos las puntuaciones Z que
corresponden al 2,5% superior e inferior. Como vimos anteriormente, el resultado es 1,96.
3. Convertir esas puntuaciones Z en puntuaciones originales de la distribucin de medias.
Con una media de 2,71 y un desvo estndar de 0,022, una puntuacin Z de -1,96 es igual a
una puntuacin original de 2,71 - (0,022 x 1,96), que da como resultado 2,667. De modo simi
lar, una puntuacin Z de +1,96 es igual a una puntuacin original de 2,71 + (0,022 x 1,96), que da
como resultado 2,753, Por lo tanto, los lmites del 95% de confianza son 2,667 a 2,753. Es decir,
sobre la base de los resultados del estudio, tenemos un 95% de confianza de que la verdadera me
dia del tiempo de lectura de oraciones ambiguas presentadas en contexto se encuentra entre 2,667
y 2,753 segundos.
En otras palabras. El 95% de las veces que calculemos un intervalo de confianza, ste inclui
r la verdadera media; y el 5% de las veces, no. Por eso decimos que estamos un 95% seguros de
que el intervalo incluye la verdadera media. Sin embargo, nunca sabremos con certeza si nos en
contramos en la situacin del 95% del 5%. Siempre existe un 5% de chances de que la verdade
ra media no est incluida para nada dentro de la seccin calculada.
Intervalos de confianza y prueba de hiptesis
Adems de su valor en cuanto a la estimacin de la media poblacional, tambin podemos utilizar
los intervalos de confianza para realizar pruebas de hiptesis. Si un intervalo de confianza no in
cluye la media de la distribucin de la hiptesis nula, entonces el resultado es significativo. Esto
se debe a que estamos un 95% seguros de que el intervalo incluye la verdadera media poblacio
nal, y si ese intervalo del 95% no incluye la media de la poblacin 2, entonces existe menos de un
5% de chances de que la muestra hubiera podido surgir de la poblacin 2. En el ejemplo de las
instrucciones especiales para rendir el examen de nivel, el intervalo del 95% de confianza que
abarcaba desde 208,24 hasta 231,76 no incluye la media de 200 correspondiente a la poblacin de
alumnos de quinto grado que rinden el examen sin las instrucciones especiales. El resultado que
acabamos de mencionar es coherente con la conclusin que sacamos con anterioridad en este
mismo captulo, segn la cual el resultado era significativo utilizando el nivel 0,05. En el ejemplo
de las oraciones ambiguas, el intervalo del 95% de confianza con respecto a aquellos que lean las
oraciones en contexto, abarcaba desde 2,667 a 2,753 segundos. Ese intervalo en efecto, incluye la
media de tiempo de lectura (2,75) de la poblacin que lea las oraciones sin contexto. Por lo tanto,
tal como concluimos cuando utilizamos el procedimiento de prueba de hiptesis, el resultado no
es significativo aplicando el nivel 0,05.
F ig u r a 7 - 9 . E j e m p lo s d e in t e r v a lo s d e l
9 5 % d e c o n f ia n z a c o m p a r a d o s c o n d i s
tr ib u c io n e s d e m e d ia s b a s a d a s e n (a ) u n a
m e d ia p o b la c i o n a l c o n o c id a , ig u a l a
2 1 0 ; (b ) u n a m e d ia m u e s tr a ! ig u a l a 2 2 0 ,
y ( c ) u n a m e d ia m u e s tr a l d e 1 9 0 .
CONTROVERSIAS Y LIMITACIONES:
INTERVALOS DE CONFIANZA O PRUEBAS DE SIGNIFICACION?
E l a lu m n o r e c o r d a r q u e e n e l c a p t u lo 6 m e n c io n a m o s q u e , e n la a c tu a lid a d , e x i s t e u n e n r g i c o
d e b a te e n tr e lo s p s ic lo g o s a c e r c a d e la p r u e b a d e s ig n if ic a c i n . E n tr e lo s p r in c ip a le s te m a s
d e d e b a t e s e h a p r o p u e s t o q u e l o s p s i c l o g o s u t i l i c e n i o s i n t e r v a l o s d e c o n f i a n z a e n l u g a r d e la s
p r u e b a s d e s ig n ific a c i n .
Aquellos que estn a favor de reemplazar las pruebas de significacin con los intervalos de
confianza (p. ej. Cohn, 1994; Hunter, 1997; Schmidt, 1996) citan varias ventajas importantes.
Primero, como observamos anteriormente, ios intervalos de confianza contienen toda la informa
cin clave de una prueba de significacin,5 pero adems proporcionan informacin adicional; la
estimacin del intervalo de valores dentro del cual podemos estar bastante seguros de que se en
cuentra la verdadera media poblacional. Una segunda ventaja es que concentran la atencin en la
estimacin y no en la prueba de hiptesis. Algunos investigadores argumentan que el objetivo de
la ciencia es proporcionar estimaciones numricas de efectos, no slo decisiones en cuanto a si un
efecto es diferente de cero. Es decir, con las estimaciones (puntuales y por intervalos), tenemos
una idea clara del grado de importancia del efecto y del nivel de precisin de la estimacin. Con
las pruebas de hiptesis, sabemos si el efecto puede suceder en la direccin predicha, pero no el
grado de importancia del efecto en esa direccin.
Los intervalos de confianza son particularmente valiosos cuando los resultados no son signi
ficativos (Frick, 1995), porque conocer el intervalo de confianza otorga una idea de cun lejos de
la ausencia de efecto es probable encontrar la verdadera media. Si todo el intervalo de confianza
se encuentra cerca de la ausencia de efecto, podemos tener la certeza de que si an existe algn
efecto verdadero, ste probablemente sea pequeo. Por ejemplo, supongamos que se estudia un
grupo de personas despus de que son expuestas a un procedimiento que pretende afectar el IC.
La meda del grupo es 102, y el intervalo de confianza abarca desde 99 hasta 105. Esto dara un
resultado no significativo porque el intervalo incluye el valor 100, que es el IC medio.de la pobla
cin que no recibe el procedimiento especial Al mismo tiempo, dado que el intervalo de confian
za incluye otros nmeros diferentes de 100, en realidad es posible que exista un efecto real, Sin
embargo, el punto clave es que si de hecho existiera un efecto real, es probable que sea muy pe
queo, ya que estamos un 95% seguros de que ese efecto no implicara ms que una disminucin
de un punto o un aumento de 5 puntos. Por otro lado, supongamos que el intervalo de confianza
para este mismo estudio era de 89 a 115. Este resultado tambin sera no significativo (porque in
cluye el valor 100). Sin embargo, nos indicara que el estudio es realmente no concluyente: es po
sible que haya muy poco o ningn efecto (que la media poblacional de aquellos que reciben el
procedimiento sea cercana a 100), pero tambin es posible que exista un-efecto substancial (que
la verdadera media poblacional de aquellos que reciben el procedimiento implique una disminu
cin de hasta 11 puntos de IC, o un aumento de hasta 15 puntos de IC).
Una tercera ventaja, sostenida por aquellos que proponen los intervalos de confianza para
reemplazar las pruebas de significacin, es que existe menos probabilidad de que los investigado
res los utilicen errneamente. Como observamos en el captulo 6, un error generalizado en la uti
lizacin de las pruebas de significacin es concluir que un resultado no significativo implica que
5 A lgunos de los que proponen los Intervalos de confianza para reemplazar la prueba de significacin sostienen que de
beramos ignorar el vnculo con la prueba de hiptesis. Esta es la posicin ms radical en contra de la prueba de signifi
cacin. Es decir, estos psiclogos argumentan que todo el enfoque debera concentrarse en la estimacin, y que la
prueba de significacin de cualquier tipo debera ser relevante. En el captulo 8, veremos los fundamentos de esta po
sicin, junto con los argumentos contrarios.
no existe ningn efecto. Con ios intervalos de confianza es ms difcil caer en este tipo de error. Si
bien el intervalo de confianza que arroja un resultado no significativo incluir la media esperada
correspondiente a la ausencia de efecto, tambin incluir otros valores posibles. As, nos recuerda
que la verdadera meda poblacional podra muy bien ser diferente de la media correspondiente a
la ausencia de efecto.
A pesar de estas aparentes ventajas, es extremadamente raro encontrar intervalos de confian
za en la mayora de los diferentes tipos de publicaciones cientficas psicolgicas. En parte, esto
probablemente se debe a la tradicin y a que la mayora de los psiclogos han sido capacitados
para utilizar las pruebas de significacin, por lo que estn mucho ms acostumbrados a ellas. En
una publicacin cientfica, los intervalos de confianza tambin requieren una mayor descripcin.
Por ejemplo, qu sucedera en el caso de que tuviramos una tabla de resultados ms amplia. Se
ra sencillo agregar un asterisco en cada nmero para mostrar su significacin, por lo cual una ta
bla diseada de ese modo es fcil de leer. Con los intervalos de confianza, en lugar de un
asterisco, necesitaramos dos nmeros extra para cada resultado (los lmites de confianza superior
e inferior).
Otros psiclogos (p. ej. Abelson, 1997; Harris, 1997) indican dos razones para no abandonar
por completo las pruebas de significacin a favor de los intervalos de confianza. Primero, en algu
nos procedimientos estadsticos avanzados es posible realizar pruebas de significacin, pero no es
posible calcular intervalos de confianza. Segundo, del mismo modo que es posible cometer erro
res con las pruebas de significacin, tambin es posible cometer otros tipos de errores con los in
tervalos de confianza, especialmente debido a que la mayora de los psiclogos que realizan
investigaciones tienen menos experiencia en la utilizacin de estos ltimos.
Finalmente, la cuestin de los intervalos de confianza, en contraposicin con la significa
cin, tiene sus races en una mayor controversia entre estimacin y prueba de hiptesis, contro
versia que trataremos en el captulo 8. Sin embargo, para anticipar esa exposicin, podemos
sealar aqu que los intervalos de confianza, por lo general, tienen mucho ms sentido en situa
ciones de investigacin aplicada, mientras que las pruebas de significacin, con frecuencia, tie
nen mucho ms sentido n investigaciones con una orientacin ms terica.
Cualquiera sea el resultado de esta controversia sobre intervalos de confianza, es importante
comprenderlos, ya que podremos encontrarlos ocasionalmente al leer material relacionado con la
investigacin, y es posible que en el futuro aparezcan con ms asiduidad. No obstante, en la ac
tualidad no aparecen con frecuencia. Por eso, y para que la cantidad de material a aprender sea
manejable, decidimos no hacer hincapi en el tema de los intervalos de confianza en los prximos
captulos de este libro que tratan principalmente sobre pruebas de significacin en distintos tipos
de investigaciones..
Analicemos un ejemplo. Como parte de un estudio ms amplio, Wiseman (1997) tom una
prueba que mide el nivel de soledad entre un grupo de alumnos universitarios de Israel. Como
primer paso para analizar los resultados, Wiseman control que la media de la prueba del nivel
de soledad no fuera diferente a la de una distribucin de poblacin conocida a travs de un gran
estudio norteamericano de alumnos universitarios, realizado con anterioridad por Russell et al.
(1980). As, Wiseman inform:
El valor medio de soledad de la muestra israel actual era similar a los de la muestra universita
ria realizada por Russell et al. (1980), tanto para hombres (Israel: M - 38,74, SD = 9,30;
Russell; M= 37,06, SD ~ 10,91; z = 1,09, NS) como para mujeres (Israel: M =36,39, SD = 8,87; Rus
sell; M= 36,06, SD * 10,11; z = 0,25, NS) (p. 291).
En este ejemplo, el investigador os da el desvo estndar tanto de la muestra que est analizando
(el grupo israel) como de la poblacin (la informacin tomada del estudio de Russell). Sin em
bargo, al seguir los pasos para calcular cada Z (el valor muestral en la distribucin de medias), s
lo habra utilizado el desvo estndar poblacional. Observemos tambin que el investigador
consider la falta de significacin de la diferencia como sustento para determinar que las medias
mustrales eran similares a las medias poblacionales. De todos modos, el investigador fue muy
cuidadoso en no pretender que estos resultados mostraban que no exista diferencia alguna.
De todos los temas que hemos tratado en ste captulo, el que ms frecuentemente se mencio
na en una publicacin cientfica es el desvo estndar de la distribucin de medias, utilizado para
indicar la cantidad de variacin que podra esperarse entre las medias de muestras de determinado
tamao tomadas de la poblacin. En ese contexto, se lo denomina comnmente error estndar,
abreviado SE. Por ejemplo, Foertsch y Gemsbacher (1997) realizaron un estudio para analizar el
efecto de la utilizacin de pronombre ellos para evitar determinar el sexo de la persona a la cual
se hace referencia, aunque tradicionalmente este uso se considera gramaticalmente incorrecto.
Foertsch y Gemsbacher elaboraron la hiptesis de que utilizar ellos del modo mencionado no ten
dra un efecto importante en el tiempo de lectura. Analicemos la siguiente oracin: Un conduc
tor de camiones nunca debera conducir cansado, aun cuando ella est intentando realizar una
entrega a tiempo, porque muchos accidentes son causados por conductores que se duermen sobre
el volante. Como parte del estudio, los investigadores midieron el tiempo de lectura de esta ver
sin de la oracin y del de otras dos versiones, una reemplazando ella por l y otra remplazando
ella por ellos. En esta oracin, el antecedente (la primera clusula) se refiere a un conductor de
camiones, una profesin tpicamente masculina. En otras oraciones utilizadas por los investiga-'
dores, los antecedentes eran tpicamente femeninos (una enfermera) o neutrales (un corredor).
Estos son algunos de los resultados:
Tratndose de antecedentes masculinos, las clusulas con el pronombre ella {M59,5, SE =2,05) se
leyeron significativamente ms despacio que las clusulas con el pronombre l (M - 54,8, SE = 1,77)
o las clusulas con el pronombre ellos (M = 55,3, SE = 1,77) [...] Tratndose de antecedentes femeni
nos, las clusulas con el pronombre l (M = 58,7, SE = 1,66) se leyeron significativamente ms despa
cio que las clusulas con el pronombre ella (M - 52,9, SE = 1,64) o las clusulas con el pronombre
ellos (M = 52,7, SE = 1,67)". (p. 108)
El informe anterior nos proporciona el patrn de medias y una idea clara de la exactitud de
esas medias como estimaciones de las medias poblacionales. Analicemos las consecuencias
del primer error estndar (2,05). Conoce'r este dato nos indica que la media del tiempo de lec
tura de oraciones con antecedentes masculinos y clusulas con el pronombre ella, es de ms
de 2 errores estndar por encima del tiempo de lectura de oraciones con clusulas con los pro
nombres l o ellos.
1 i;;;;
;j
f-Feme nino
Mascu!m
A
'
-:'
Neutra!
Antecedente
indefinido
::A/iA;-
Figura 7-10. E fe c to s d el tip o d e an teced en te (m a scu lin o , fe m e n in o , neutro o in d efin id o) y d el pronom bre
(l, e lla o e llo s ) en TL (T ie m p o de lectura por carcter), cu a n d o las ora cio n es se utilizaron sin referencia,
(E xp erim en to 1). {F u en te; F oertsch , J., & G em sb a ch er, M . A . (1 9 9 7 ), fig. 1, E n busca d e la neutralidad
d el gnero; E s e l e llo s sin g u la r un sustituto co g n iiv a m en te e fic ie n te d el l gen rico?" , C ie n c ia P s i
c o l g i c a [ P s y c h o l o g i c a l S c ie n c e ], 8, 108. C opyright, 1 9 9 7 , por la S o c ie d a d A m erican a de P sic o lo g a
[A m erican P s y c h o lo g ic a l S o c ie ty ]. R eim p reso c o n a u torizacin .]
en la que una persona se comportaba de forma ms amistosa que otra, y luego les preguntaron qu
persona sera ms propensa a ser amistosa en el futuro.
As informaron Chiu et al. uno de sus descubrimientos acerca de los tericos de entidades:
"Para ellos, si una persona result ser ms amistosa que otra en una determinada situacin, es ms
probable que la misma relacin se generalice a otras situaciones totalmente diferentes" (p. 23). El
sustento estadstico de esta conclusin fue descripto de la siguiente manera: La prediccin glo
bal de los tericos de entidades [acerca de la probabilidad de que la persona fuera amistosa] fue
significativamente mayor a 0,50 (95% IC - 0,5583 0,0348) (p. 23). Es decir que podemos te
ner un 95% de confianza de que, en la poblacin, la probabilidad real estara entre 0,5235 y
0,5931, todos nmeros superiores al 0,50 que esperaramos si los tericos de entidades hubieran
elegido al azar. Por el contrario, Chiu et al. descubrieron que los individuos que no eran tericos
de entidades tuvieron un nivel de prediccin significativamente menor al 0,50, con un intervalo
de confianza de 0,3648 a 0,4902.
RESUMEN*6
Al estudiar una muestra de ms de un individuo, la distribucin comparativa en el proceso de
prueba de hiptesis es una distribucin de medias de todas las muestras posibles de tamao igual
a la cantidad de casos que se estn estudiando. Podemos considerar que esa distribucin descri
be cul sera el resultado de a) tomar una gran cantidad de muestras, cada una con la misma can
tidad de unidades seleccionadas al azar de la poblacin de individuos y, luego b) crear una
distribucin de las medias de esas muestras.
La distribucin de medias tiene la misma media que la poblacin de observaciones. Sin em
bargo, tiene una varianza menor porque las medias mustrales tienen menos probabilidad de ser
extremas que las observaciones individuales. (Los extremos de cualquier muestra tienden a
equiparse con los valores centrales o los valores extremos en direccin opuesta). Especficamen
te, la varianza de ia distribucin de medias es la varianza de la poblacin de observaciones indi
viduales dividida por la cantidad de individuos que forma cada muestra (el desvo estndar es la
raz cuadrada de la varianza). La forma de la distribucin de medias se aproxima a la curva nor
mal si a) la poblacin de individuos sigue una curva normal o b) las muestras tienen 30 registros
cada una, o ms.
Las pruebas de hiptesis que involucran una sola muestra de ms de un individuo y una pobla
cin conocida se realizan de la misma forma que las pruebas de hiptesis presentadas en el captulo
6 (donde los estudios se realizaban con un slo individuo comparado con una poblacin de indivi
duos). La excepcin principal es que la distribucin comparativa es una distribucin de medias.
La mejor estimacin puntual de la media poblacional es la media maestral. Podemos deter
minar una estimacin por intervalo de la media poblacional basndonos en la distribucin de me
dias. Cuando la distribucin de medias sigue una curva normal, el intervalo del 95% de confianza
incluye todos los nmeros, desde 1,96 desvos estndar por debajo de la media maestral (lmite
de confianza inferior) hasta 1,96 desvos estndar por encima de la media maestral (lmite supe
rior de confianza). El intervalo del 95% de confianza es un intervalo de valores acerca del cual te
nemos un 95% de seguridad de que incluye la verdadera media poblacional.
Uno de ios aspectos del debate actual acerca de las pruebas de significacin plantea si los in
vestigadores deberan reemplazarlas por los intervalos de confianza. Aquellos que proponen los
intervalos de confianza sostienen que stos brindan informacin adicional, se concentran en la es
timacin y reducen la utilizacin incorrecta propia de las pruebas de significacin. Sin embargo,
los intervalos de c'rifianza rara vez se utilizan en las publicaciones cientficas psicolgicas, en
parte, debido a la costumbre y a la falta de familiaridad coa ellos, as como tambin a la incomo
didad que presenta su descripcin. Adems, aquellos que se oponen a basarse exclusivamente en
los intervalos de confianza sostienen que ios intervalos no pueden utilizarse en algunos procedi
mientos avanzados, que la estimacin no siempre es el objetivo deseado y que tambin los inter
valos pueden utilizarse de formas incorrectas propias de ellos.
El tipo de prueba de hiptesis descripfa en este captulo rara vez se utiliza en la investigacin
prctica (la hemos aprendido como escaln hacia otros temas). El desvo estndar de la distribu
cin de medias, con frecuencia denominado error estndar (SE), en ocasiones se utiliza para
describir la variabilidad esperada de las medias, particularmente en grficos de barra en los que el
error estndar puede representarse por la longitud de un segmento ubicado sobre o debajo de la
parte superior de cada barra.
Trminos clave
-
Ejercicios
SERIE El
P
P
P
P
P
P
P
P
P
P
Qu es la potencia estadstica?
P Potencia, tamao del efecto e intervalos
de confianza.
Alfa, beta y potencia.
M
eta-ansis.
. .
Clculo de la potencia estadstica.
P
Controversias
y
lim
itaciones:
continuacin
Tablas de potencia.
de la controversia acerca de la
Qu factores determinan la potencia de
significacin estadstica: tamao del efecto/
un estudio?
versus significacin estadstica.
Tamao del efecto.
P Potencia y tamao del efecto segn se
Tamao de la muestra.
describen en publicaciones cientficas.
Otros factores que influyen en la potencia, . P Resumen.
...v
Papel que desempea la potencia al disear P Trminos clave.
un experimento.
P Ejercicios.
La importancia de a potencia en a
evaluacin de los resultados de un estudio.
otencia es ia capacidad para cumplir objetivos. Por eso, una medida razonable de
potencia en cualquier situacfddi es la probabilidad de cumplir con los objetivos
en esa determinada situacin. El objetivo de un investigador que realiza un experi
mento es la obtencin de un resultado significativo, siempre que la hiptesis de in
vestigacin realmente sea verdadera. La potencia estadstica de un estudio es la
probabilidad de que ese estudio tenga un resultado significativo si la hiptesis de investigacin
es verdadera.
.... '
....
Calcular la potencia al planificar un estudio ayuda a definir la cantidad de participantes que
se van a utilizar. Adems, comprender el concepto de potencia es sumamente importante para
cualquiera que lea publicaciones de investigacin psicolgica; por ejemplo, para comprender los
resultados experimentales que no son significativos o resultados que son significativos estadsti
camente pero no en la prctica.
En este captulo, examinamos sistemticamente el concepto de potencia estadstica. Qu es,
cmo se calcula, qu tactores influyen en ella, y por qu es importante. Es nuestra obligacin ad
vertir que, a veces, este material acerca de la potencia puede resultar particularmente difcil de
captar. Pero vale la pena aprenderlo. Por eso, recomendamos ai lector ser paciente consigo mismo
y tomarse todo el tiempo que sea necesario. Estamos seguros de que lo lograr.
Como parte del proceso de aprendizaje de la potencia, el captulo tambin presenta la nocin
de tamao del efecto. Como veremos, el tamao del efecto es un punto crucial para comprender la
potencia, y un tema de considerable importancia en s mismo para comprender las investigacio
nes psicolgicas.
QU ES LA POTENCIA ESTADSTICA?__________________________________
Dijimos que ia potencia estadstica de un experimento es la probabilidad de que el estudio arroje
un resultado significativo si la hiptesis de investigacin es verdadera. Es importante tener en
cuenta que la potencia de un experimento implica determinada situacinNsi la hiptesis de investi
gacin es verdadera. No nos interesa lograr un resultado significativo si la hiptesis de investiga
cin es falsa.
Ahora bien, podramos preguntamos lo siguiente:Si la hiptesis de investigacin es verda
dera, no dar el experimento automticamente un resultado significativo? La respuesta es no;
puede ocurrir que la muestra particular que fue seleccionada de la poblacin no resulte lo sufi
cientemente extrema como para rechazar la hiptesis nula._
Ejemplo
Analicemos nuevamente el ejemplo del captulo 7 acerca de las instrucciones especiales a alum
nos de quinto grado que estn dando un examen estndar de nivel. En el proceso de prueba de hi
ptesis de este ejemplo comparamos dos poblaciones:
Poblacin 1:
Poblacin 2:
Supongamos ahora que los psiclogos expertos en educacin realizan el experimento. stos
dan as instrucciones especiales a un grupo de 64 alumnos de quinto grado y calculan la puntua
cin media en el examep. Supongamos que la hiptesis de investigacin es verdadera. Recorde
mos que si la hiptesis de investigacin es verdadera, la media del grupo de 64 alumnos de quinto
grado pertenece a una distribucin semejante a la curva superior en la figura 8-1.
En este ejemplo, sin embargo, la distribucin superior de medias (tomada de la prediccin del
investigador sobre la poblacin 1) se encuentra slo levemente volcada hacia la derecha de la dis
tribucin comparativa. Es decir, los psiclogos predicen slo un pequeo aumento de los registros
(ocho puntos) a causa de las instrucciones especiales; por lo tanto, la distribucin superior se en
cuentra desplazada slo una pequea distancia hacia la derecha en comparacin con la distribu
cin inferior, que es la distribucin comparativa. Lo que la figura nos indica es que cualquier
' Analicemos nuevamente el ejemplo sobre los alumnos de quinto grado. Supongamos que, en
verdad, dar las instrucciones especiales s hace que los alumnos de quinto grado se desempeen
mejor en el examen. Sin embargo, al realizar el estudio, los resultados no muestran ese patrn. Tal
vez, la muestra que seleccionamos al azar para probar las nuevas instrucciones incluan principal
mente alumnos de quinto grado con un nivel particularmente bajo para este tipo de examen. Co
mo hemos visto, aun cuando el procedimiento pueda haberlos ayudado a lograr un mejor
desempeo, de todos modos sus puntuaciones pueden no ser mucho ms altas que el promedio de
los alumnos de quinto grado que no recibieron instrucciones especiales. Los resultados no seran
significativos. Por lo tanto, haber decidido no rechazar la hiptesis nula, y rehusarse a sacar una
conclusin, sera un error Tipo II. Los errores Tipo II preocupan especialmente a los psiclogos
interesados en aplicaciones prcticas, ya que un error de este tipo podra provocar que no se implemente un procedimiento prctico til.
Al igual que con los errores Tipo I, no podemos saber cundo hemos cometido un error Tipo II.
Pero podemos intentar realizar nuestros estudios de forma tal de reducir la probabilidad de come
ter un error Tipo II. Una forma de contratar un seguro contra un error Tipo II es establecer un ni
vel de significacin muy indulgente, como por ejemplo p<0,10 incluso p<0,20. De ese modo,
aun cuando un estudio arroje una diferencia muy pequea, hay muchas chances de que los resul
tados sean significativos. No obstante, tambin hay que pagar un costo por esta pliza de seguros.
El costo es correr demasiado riesgo de cometer un error Tipo I.
Un error Tipo II ocurre cuando decidimos que el experimento no es concluyente (no rechaza
mos la hiptesis nula) y en realidad nuestra hiptesis de investigacin era verdadera. En ese caso,
el experimento no sustent la hiptesis de investigacin cuando debera haberlo hecho. Esta es la
situacin ilustrada en la figura 8-1. En ese ejemplo, se cometi un error Tipo II.
En la figura 8-1, beta es el rea no sombreada de la distribucin superior (distribucin que se
basa en la prediccin de la hiptesis de investigacin con respecto a l poblacin 1). Es el rea
donde, aun cuando la hiptesis de investigacin sea verdadera, una media no sera lo suficiente^mente extrema como para que podamos rechazar la hiptesis nula; es el rea de la distribucin su
perior que se encuentra a la izquierda del punto en el que comienza el rea alfa en la distribucin
inferior (comparativa).
La potencia de un experimento es la probabilidad de que si la hiptesis de investigacin es
verdadera, el experimento la sustente (rechace la hiptesis nula). Es decir, potencia es la probabi
lidad de no cometer un error Tipo II. Numricamente, potencia es 1 menos beta. En la figura 8-1,
la potencia es la porcin sombreada de la distribucin superior. En este ejemplo (el 50% del rea
bajo la curva), es menor a 0,5.
Al momento de establecer los niveles de significacin, protegerse contra un tipo de error aumenta
las chances de cometer el otro tipo de error. El costo de la pliza de seguros contra el error Tipo I
(establecer un nivel de significacin de, digamos, 0,001) es aumentar beta, la probabilidad de co
meter el error Tipo II. (Esto ocurre porque con un nivel de significacin extremo como 0,001, aun
si la hiptesis de investigacin es verdadera, los resultados deben ser demasiado contundentes pa
ra ser lo suficientemente importantes como para rechazar la hiptesis nula). El costo de la pliza
de seguros contra el error Tipo H (establecer un nivel de significacin de, digamos, 0,20) es au
mentar las posibilidades de cometer el error Tipo I. (Esto ocurre porque con un nivel de significa
cin como 0,20, aun si la hiptesis nula fuera verdadera, es bastante fcil obtener un resultado
significativo slo por haber seleccionado accidentalmente una muestra que, aun antes de realizar
el estudio, tema un nivel mayor o menor que la poblacin general).
La negociacin entre estos dos temas conflictivos se resuelve usualmente por convencin; a
eso se deben los niveles de significacin estndar del 5% y el 1%,
Tabla 8-1.
P o s i b l e s d e c i s i o n e s c o r r e c t a s y e r r n e a s e n la p r u e b a d e h i p t e s i s .
C o n d ici n real de la
h ip tesis de in vestigacin
(en la p r c tic a , d esco n o cid o )
V e r d a d e ra
, E nor.
, tipo u; :.
p = beta
Ctf . j
D ecisi n
.correcta;
. tipo s;
p = potencia
S e s o s tie n e la h ip te s is d e in v e s tig a c i n
(s e r e c h a z a la h ip te s is n u la )
E l e s tu d io n o e s c o n c lu y e n te
(n o s e p u e d e r e c h a z a r la h ip te s is n u la )
F a lsa
D ecisi n : '
conecta;.'
p .=.l - alfa. L v
Ejem plo
Volvamos a analizar Ja figura 8-1 que representa grficamente las distribuciones de medias del
ejemplo de los alumnos de quinto grado. La poblacin de individuos que no recibe instrucciones
especiales tena una media de 200 y un desvo estndar de 48 (una varianza de 2.304). Los inves
tigadores analizaron una muestra de 64 alumnos de quinto grado. De ese modo, en el captulo 7
calculamos que el desvo estndar de ia distribucin de medias es 6 (es decir, V2VS04/64 - 6).
Anteriormente, en este mismo captulo, dijimos que los investigadores predijeron que las instruc
ciones especiales aumentaran la meda a 208. La figura 8-2 muestra las puntuaciones Z corres
pondientes a ambas distribuciones, basndose en estos nmeros.2
2 Normalmente suponemos
que, independientemente de que la hiptesis nula sea verdadera (es decir, si las medias
d las dos poblaciones son iguales), las varianzas de ambas poblaciones sern iguales. Las distribuciones de medias de
ambas poblaciones tambin se basan en la misma cantidad de observaciones en cada muestra (en este ejemplo 64). Por
lo tanto, los desvos estndar de estas dos distribuciones d medias tambin sern iguales.
En el captulo 7 determinamos que, utilizando un nivel de significacin del 5%, con una prue
ba de una cola, para rechazar ia hiptesis nula necesitamos que la puntuacin Z correspondiente a
la media muestra1sea de, al menos, 1,64. Utilizando la frmula para convertir puntuaciones Z en
puntuaciones originales, la puntuacin Z determinada corresponde a una puntuacin original de
209,84, es decir, 200 + (1,64 x 6) = 209,84.
Como ya dijimos, ios investigadores predijeron una media de 208 para los alumnos de quinto
grado que reciben instrucciones especiales (poblacin 1). El punto de corte de 209,84 est 1,84
puntos de prueba por encima de la media general de 208 de esa distribucin, dando una puntua
cin Z de 0,31 (es decir, 1,84/6-0,31).
La tabla de reas bajo la curva normal muestra que un 12% del rea se encuentra entre la me
dia y una Z de 0,31. Por lo tanto, un 38% supera a la Z de 0,31. En otras palabras, un 38% de la
distribucin de medias predicha para la poblacin 1 se encuentra por encima de una puntuacin Z
de 0,31 (y por lo tanto el 38% de las medias se encuentran por encima de la puntuacin original
209,84),
La conclusin es la siguiente; suponiendo que la prediccin de los investigadores sea correc
ta, tienen slo un 38% de chances de que la muestra de 64 alumnos que analizaron arroje una me
dia lo suficientemente alta como para que el resultado sea significativo. Es decir, existe slo un
38% de chances d obtener una media mayor a 209,84, aun suponiendo que l hiptesis de inves
tigacin sea verdadera. Por lo tanto, decimos que la potencia de este experimento es del 38%, Be
ta, la probabilidad de cometer un error Tipo II, es del 62% (es decir, 100% ~ 38% = 62%).
Es importante observar que la forma en la que calculamos la potencia no tiene nada que ver
con el resultado real del estudio. De hecho, los investigadores por lo general calculan la potencia
antes de realizar el estudio.
Resum en
En las condiciones del ejemplo que estamos analizando (la media de una sola muestra comparada
con una poblacin conocida), calcular la potencia incluye cuatro pasos;
( L;Reunir la informacin necesaria: a) la media y el desvo estndar de la poblacin 2 (distri
bucin comparativa)' y b)7a media predicha de i poblacin i (poblacin que recibi el procedi
miento experimental). Tambin resultar muy til crear un diagrama de las dos distribuciones de
modo similar a la figura 8-2.
jfXiDe terminar, en la distribucin comparativa, el punto de corte para rechazar la hiptesisTtrta.
j y Determinar la puntuacin Z del punto de corte anterior, pero en la distribucin de medias
de la poblacin que recibe la manipulacin experimental.
4.
Utilizando la tabla de reas bajo la curva normal, determinar la probabilidad de obtener un
registro ms extremo que esa puntuacin Z,3
O tro Ejemplo
Analicemos otro ejemplo ficticio. Una gran empresa est intentando decidir si adopta una nueva
poltica de promocin sanitaria. Conforme a esta nueva poltica, se evala a los empleados indivi
dualmente y se les brinda la capacitacin y el asesoramiento necesarios con respecto a distintos
3El mtodo descripto de clculo de la potencia (que es el nico mtodo de clculo de la potencia tratado en este libro)
supone que las distribuciones de medias estn normalmente distribuidas.
comportamientos relacionados conia salud (ejercicio, dieta, cigarrillo, etc.). Para probar la efecti
vidad de la poltica, los psiclogos de la empresa planifican el siguiente estudio: se seleccionarn
ochenta empleados al azar para participar del mismo, y al finalizar el ao se medir su estado ge
neral de salud conforme a una prueba estndar. La misma empresa ha realizado pruebas extensi
vas a sus empleados, por lo que los investigadores saben que en toda la empresa (la poblacin de
este estudio) la media en las pruebas estndar de salud es 58, el desvo estndar es 14, y los valo
res se distribuyen normalmente. Para que se justifique la realizacin del programa, debe producir
se una mejora de al menos 5 puntos (es decir, la media predicha es 63), Los psiclogos de la
empresa planifican utilizar un nivel de significacin de 0,05.
La figura 8-3 representa grficamente las distribuciones de medias correspondientes a las dos
poblaciones involucradas en este estudio. Cul es la potencia de este experimento?
1.
Reunir la informacin necesaria. En este ejemplo, la media de la distribucin comparativ
--f-. es 50'. La media predicha de la poblacin que recibe el procedimiento experimental es 63. La varianza de la poblacin es 196 (es decir, 142 ~ 196), por lo tanto, la varianza de la distribucin
de medias (distribucin comparativa) es 2,45 (196/80 = 2,45), lo que nos da un desvo estndar de
1,57 { V 45 = 1,57).
/(X> Determinar, en la distribucin comparativa, el punto de corte para rechazar la hiptesis
nula. Con un nivel de significacin del 5%, en una prueba de una cola, la puntuacin Z de corte es
+1,64. Una puntuacin Z de +1,64 es igual a una puntuacin original de 60,57 (es decir, 58 +
[1,64 x 1,57] = 60,57). Por io tanto, en la curva inferior (distribucin comparativa) de la figura
8-3,fiemos sombreado el rea a la derecha del punto 60,57. Es la regin alfa.
f 3 J Determinar la puntuacin Z del punto de corte anterior, pero en la distribucin de medias
correspondiente a la poblacin que recibe la manipulacin experimental. En esa distribucin (ba
sndonos en los valores predichos para la poblacin 1), una puntuacin original de 60,57 es igual
a una puntuacin.Z d e -1,55 (es decir, [60,57 - 63]/l,57 = -1,55), Por lo tanto, en la curva supe
rior de la figura 8-3, hemos sombreado el rea a la derecha del punto -1,55. Esa rea sombreada
indica la potencia del estudio, es el rea sobre la zona en la que la media de una muestra real sera
significativa con respecto a la distribucin comparativa.
4.
Utilizando la tabla de reas bajo la curva normal, determinar la probabilidad de obtener un
valor ms extremo que esa puntuacin Z. La tabla de reas bajo la curva normal indica aproxima
damente un 44% entre la media y una Z de 1,55. Estamos interesados en toda el rea a la derecha
de -L 5 5 , por lo tanto, existe un total del 44% entre -1,55 y la media, ms el.5.0% por encima de la
media, lo que da un total de 94%, La potencia de este experimento es del 94% (beta es del 6%).
TABLAS DE POTENCIA
L o s procedim ientos que hem os descripto para e l clcu lo de la potencia se aplican cuando estam os
frente a una poblacin conocida y frente a una sola m uestra. E n situaciones de investigacin m s
com plejas (que analizarem os en varios de lo s captulos siguientes), ca lcu la r la potencia es bastan
te m s trabajoso. P o r eso, generalm ente lo s investigadores buscan la potencia de un estudio u tili
zando cuadros esp eciales, denom inados ta b la s de p o ten cia. (E sta s tablas han sido preparadas
por Cohn, 1988, y K raem er & Thiem ann, 1987, entre otros). E n io s captulos sig u ien tes, con ca
da mtodo tratado darem os las tablas de potencia b sicas y verem os cm o u tiliza rla s. E n el apn
d ice B ofrecem os un n d ice de estas tablas bajo el nom bre de tabla B -5 .
La
liz a r la s tablas requiere exactam ente la m ism a inform acin que e l clcu lo d irecto de la potencia,
D e todos m odos, e l objetivo de este cap tulo es ayudar a com prender el concepto de potencia, y
o
4
ve afectada por a) ei nivel de significacin elegido, b) si se utiliza una prueba de una o dos colas,
y c) e tipo de procedimiento de prueba de hiptesis utilizado.
4 Tai v ez haya resultado evidente para ei alumno que aumentamos la potencia a exactamente ei 85%, tanto al duplicar el
aumento predicho de las medias (como en la figura 8*4) o al reducir e desvo estndar de la distribucin de medas a la
mitad (com o en la figura 8-5). Pronto veremos las razones por las cuales cualquiera de estos dos cambios produce el
mismo resultado.
Al determinar la potencia antes de realizar el estudio, el tamao del efecto se calcula sobre la ba
se de dos nmeros. El primer nmero es ia prediccin del investigador en cuanto a la diferencia
entre las medias de las dos poblaciones. La prediccin se realiza sobre la base de determinada
(teora, de experiencia previa en investigaciones de este tipo, o de lo que sera la menor diferencia
S&jLEfsegundo nmero es el desvo estndar poblacional. En los casos que hemos analizado has
ta ahora, el desvo estndar (o la varanza) se conoce con anterioridad. (En captulos posteriores
analizaremos modos de estimar este dato cuando no se lo conoce).
F igura 8-6. L as d istrib u cio n es d e m ed ia s p redichas y com parativas podran tener p o c a su p e r p o sici n (y en
e s e c a so e e sta d io tendra una p o ten cia alta) d e b id o a q u e (a) las d o s m e d ia s so n m u y d iferen tes o (b ) la
v a a n za e s pequ e a.
....
- . ,
. ......................
La regla para el clculo del tamao del efecto es la siguiente: dividir la diferencia predicha entre
las medas por el desvo estndar poblacional. La frmula sera la siguiente:
/
d - Hd ~t 2
a
(8-D
sJ5n estaJErmula? d es el smbolo del tamao del efecto (tambin conocido como d de Cohn.
(n captulos posteriores veremos otras medidas del tamao de efecto apropiadas para diferentes
situaciones, que se representan con otros smbolos). jXj es la media de la poblacin 1 (la media
predicha para la poblacin que recibe la manipulacin experimental); p,2 es la media de la poblar
cin 2 (distribucin comparativa), y cr es el desvo estndar de la poblacin 2. Es importante tener
en cuenta que al calcular el tamao del efecto, no utilizamos el desvo estndar de la distribucin
de medias (aM). En cambio, utilizamos el desvo estndar de la poblacin de observaciones origi
nales (cr). (Cabe mencionar tambin que slo nos interesa el cr de una poblacin, ya que en la
prueba de hiptesis generalmente suponemos que ambas poblaciones tienen el mismo desvo es
tndar. Ms adelante volveremos a tratar este tema).
En el primer ejemplo do este captulo (figuras 8-1 y 8-2), la diferencia entre las medias era 8 y
el desvo estndar de la poblacin original de individuos, alumnos de quinto grado, era 48. Por lo
tanto, el tamao del efecto era 8/48, es decir, 0,17. La frmula sera la siguiente:
M.i -p.2 _ 208 - 200 __ 8
cr
48
48
Analicemos ahora el ejemplo en el que la diferencia de medias era de 16 puntos de examen y el des
vo estndar poblacional tambin era 48 (figura 8-4). En ese caso, el tamao del efecto es 0,33
(16/48 = 0,33), es decir, el doble del anterior. De modo similar, analicemos el ejemplo en el que la
diferencia de medias era 8 pero con una poblacin con un desvo estndar de 24 (figura 8-5). En ese
ejemplo, el tamao de efecto tambin es de 0,33 (es decir, 8/24 ~ 0,33). (La potencia en los dos ca
sos tambin era la misma -85%-, debido a que todos los otros aspectos del estudio eran los mismos.
Por lo tanto, si tienen el mismo tamao del efecto, tendrn la misma potencia),
El tamao del efecto, como hemos visto, es la diferencia de medias dividida por el desvo estn
dar poblacional. Esta divisin estandariza la diferencia entre las medias y ubica la diferencia en
una escala adaptada al desvo estndar de la medida utilizada. Este proceso tiene el mismo tipo de
efecto que convertir una puntuacin original en una puntuacin Z, En ambos casos, el resultado
es una base estndar de comparacin con otros valores, incluso valores de diferentes escalas. Su
pongamos que dos estudios utilizan diferentes medidas. (Por ejemplo, un grupo de investigadores
expertos en educacin estudia el efecto de instrucciones especiales utilizando la Prueba de nive
les acadmicos de Jones con un ct = 48, y otro grupo de investigadores utiliza la Prueba de lo
gros acadmicos de Smith con un a = 17). Incluso en esta situacin, dado que las diferencias de
medias estn divididas por el desvo estndar, se puede comparar directamente el tamao del
efecto de los dos casos.
La estandarizacin que proporciona el tamao del efecto (d) es especialmente til porque
se basa en el desvo estndar de la poblacin de observaciones individuales (en lugar del des
vo estndar de la distribucin de medias). Esto significa que podemos utilizar d para compa
rar resultados de estudios muy diferentes, incluso de aquellos que utilizan diferentes tamaos
de muestras.
En resumen, supongamos que un estudio tiene un tamao de efecto (d) de 0,25. Esto siempre
significa que existe un cuarto de desvo estndar de diferencia entre las dos medias, independientemente del tamao de lalnestrayde Ja .i^edWa utilizada. Si un estudio tiene una d de 0,25, y otro
unarfde 2,0(di'ferencia de 2 desvos estndar entre las medias), sabramos que el efecto fue mucho
mayor en el segundo estudio, aun si las medidas utilizadas y la cantidad de participantes en los dos
estudios fueran completamente diferentes. (Ms. adelante en el captulo veremos que una aplica
cin importante del tamao del efecto se utiliza en el procedimiento denominado meta-anlisis,
el cual proporciona a los investigadores una herramienta precisa y objetiva para utilizar el tamao
del efecto, ton el fin de combinar y comparar ios resultados de distintos estudios acumulados
acerca de un tema determinado, como por ejemplo, la utilidad de determinado tipo de psicotera
pia o ia diferencia ente dos grupos de edades con respecto a una capacidad).
Es difcil saber, antes de realizar un estudio, cules el tamao del. efecto que. debemos esperar;
si lo supiramos, no necestHftamos realzar la investigacin. Jacob Cohn (1988, 1992), un
psiclogo que ha trabajado mucho en lo que se refiere al desarrollo de los clculos estadsticos
relacionados con la potencia, ha colaborado en la solucin de este problema. Cohn ha estable
cido algunas reglas del tam ao del efecto basadas en los efectos descubiertos a travs de las
investigaciones psicolgicas en general. Estas reglas, al menos, indican al investigador cundo
considerar que un efecto es pequeo, mediano o grande. As, si el investigador cree que deter
minado estudio debera tener un efecto mediano, ahora cuenta con un nmero especfico que,
segn ha descubierto Cohn, es tpico de los efectos medianos, y que puede entonces utilizar
para calcular la potencia.
249
Recordemos que hemos calculado el tamao del efecto como la diferencia predicha entre las
medias de las dos poblaciones dividida por ei desvo estndar poblacional. Cohn recomienda
que-para el tipo de situacin que estamos analizando en este captulo, deberamos pensar en un
pequeo tamao del efecto, aproximadamente 0,20, Con una d de 0,20, las poblaciones de ob
servaciones individuales tienen una superposicin de aproximadamente un 85%. sta es el tama
o del efecto de, por ejemplo, la diferencia de altura entre nias de 15 y l anos de edad (vase
figura 8-7a), que es de aproximadamente 1/2 pulgada de diferencia, con un desvo estndar de
aproximadamente 2,1 pulgadas. (Cuando en estos ejemplos hablamos de porcentaje de superposi
cin, nos referimos a la superposicin de las poblaciones de observaciones individuales. La canti
dad de superposicin de las distribuciones de medias ser menor segn ei tamao de la muestra),
Cohn considera que un tamao d efecto mediano es de 0,5, el cual implica una superposi
cin de aproximadamente el 67%, que es aproximadamente la diferencia de altura entre nias de
14 y 18 aos de edad (vase figura 8-7b). Finalmente, Cohn define un gran tamao del efecto en
0,80. Esto implica una superposicin de slo un 53%, que es aproximadamente la diferencia de
altura entre nias de 13 y 18 aos de edad (vase figura 8~7c). Las tres reglas del tamao del efec
to que acabamos de mencionar estn resumidas en la tabla 8-2,
Analicemos otro ejemplo. Como observamos anteriormente en este libro, muchas pruebas de
ci tienen un desvo estndar de 16 puntos. Un procedimiento experimental diseado para aumen
tar el ci, que tuviera un pequeo tamao del efecto, implicara un aumento del ci de 3,2 puntos ci.
(Una diferencia de 3,2 puntos a , entre la media de la poblacin que recibi el procedimiento experi
mental y la media de la poblacin que no lo recibi, dividida por el desvo estndar de la poblacin,
que es de 16, arroja un tamao del efecto de 0,20, es decir, d = 3,2/16 = 0,20). Un procedimiento ex
perimental con un tamao del efecto mediano aumentara el ci en 8 puntos. Un procedimiento expe
rimental con un gran tamao del efecto aumentara el ci en 12,8 puntos. Para dar otro ejemplo,
analicemos los registros del s a t ( o es aproximadamente 100). En una poblacin con una puntua
cin media de s a t igual a 500, los individuos que participaran de un procedimiento experimental
para aumentar los valores del s a t con un pequeo tamao del efecto lograran un valor medio de
520; aquellos que participaran de un procedimiento con un tamao del efecto mediano lograran
un valor medio de 550, y aquellos que participaran de un procedimiento con un gran tamao del
efecto lograran un valor medio de 580. Finalmente, la figura 8-8 representa grficamente tama
os del efecto pequeos y medianos aplicados a las distribuciones de medias del ejemplo de los
alumnos de quinto grado. Podemos observar que cuanto mayor es el tamao del efecto, mayor es
la potencia.
Las reglas del tamao del efecto establecidas por Cohn son importantes para los cientficos,
porque en la mayora de las investigaciones es difcil saber de antemano qu tamao del efecto
predecir. (Si uno no puede predecir el tamao del efecto, no
puede siquiera buscar la potencia en la tabla). Algunas ve
Tabla 8-2.
ces, los investigadores pueden basar sus predicciones en
Resumen de las reglas d Cohn
del tam ao del efecto para las
cuanto al tamao del efecto en investigaciones o teoras pre
diferencias de medias.
vias. Asimismo, tambin existe un mnimo tamao del efec
to que sera importante para algn objetivo prctico. Pero en
Tamao
Descripcin
la mayora de los casos, los investigadores estn analizando
v erb a l
del efecto (d)
un tema por primera vez, y slo tienen una idea vaga del ta
Pequeo
0 ,2 0
mao del efecto a esperar. Las reglas de Cohn ayudan a los
M ediano
0 ,5 0
investigadores a convertir esa vaga idea en un nmero.
Grande
0 ,8 0
Figura 8-8. D istrib u cio n es d e p o b la cio n e s d e m ed ia s pred ch as (a, b ) y c o n o c id a s (c ) en un estu d io fic ticio
de alu m n o s d e quinto grado qu e recib en in stru ccio n es e sp e c ia le s antes d e rendir un ex a m en estndar para la
e v a lu a c i n d e n iv el. E n la s d istrib u cio n es a, b y c s e in d ica n la s p u n tu acion es o rigin ales corresp on d ien tes a
la p u ntuacin Z d e corte que se m uestra en la distribu cin c . (E l punto d e corte est calcu la d o sobre la base
d e un n iv e l d e sig n ific a c i n p < 0 ,0 5 , prueba d e una c o la ). E n este e je m p lo (a) e s la distribu cin predicha
c o n un tam ao m e d ia n o d el e fe c to ( d = 0 ,5 , p o ten cia = 9 9 % ) , y (b ) e s la distribu cin predicha c o n un
tam ao p eq u e o d el e fe c to ( d ~ 0 ,2 , p o ten cia = 48% ).
Las reglas de Cohn para el tamao del efecto tambin son tiles para interpretar resultados de estu
dios. Nos proporcionan un parmetro para decidir acerca de la importancia del efecto de un estudio
con relacin a lo que es tpico en psicologa.
TAMAO DE LA MUESTRA
El otro factor de influencia importante en la potencia, adems del tamao del efecto, es la canti
dad de personas que integran la muestra estudiada. Bsicamente, a mayor cantidad de personas,
mayor potencia.
El tamao de la muestra influye en la potencia porque, a mayor tamao de muestra, menor es
el desvo estndar de la distribucin de medias. Si las distribuciones tienen un desvo estndar me
nor, son ms estrechas y, por ende, estn menos superpuestas. La figura 8-9 representa grfica
mente la situacin que se planteara en el ejemplo de alumnos de quinto grado s el estudio
incluyera 100 alumnos en lugar de los 64 del ejemplo original (figuras 8-1 y 8-2), La potencia en
este caso es del 51% (con 64 alumnos era del 38%). Con un estudio de 500 participantes, la po
tencia es del 98% (vase figura 8-10).
Figura 8-9. D istrib u cio n es d e m edias de 1 0 0 resultados de ex m e n e s (en lugar d e 6 4 , c o m o en las figuras 8-1
y 8 -2 ) basadas en distribu ciones predichas (superior) y con o cid a s (in ferior) d e un estu d io fic tic io rea liza d o a
a lum nos d e quinto grado qu e reciben instru ccion es e sp ec ia le s antes d e rendir un exam en estndar para la
ev a lu a ci n d e nivel. E n la s dos distribuciones se ind ican lo s pu ntos d e corte seg n la distribu cin inferior.
(E l pu n to d e corte corresponde a un nivel d e sig n ifica c i n d e p < 0 ,0 5 , prueba d e una co la ). P o ten cia 51% .
Situcffirfe
v _._.
de irivestigacin;
^,
b^sd'^nl poblacin
,"""'""'"',K!'','--'iW-v
"W ^*: '^-VViv'
m v > : :v '--^ .>y;^;:;^ v . > > : ? ^ A
Puntuaciones originales: 188
-viXI-:'1.1;,>
i Fbiitueioh^^
;^ ^ ; _ ^ J I r v ^ :r ^. ^
\ '!-'-l
V"
SSW#8M
i Situacin de hiptesis nula ;'
:- (distribucin comparativa),
', basada en la poblacin 2
n i e n c M :fevV^v o ; '; i
:.U &r t
ri>
-.S
1PhSi l^
iill P
'.;*
!v y lIP i 5S*1^$? * 0 #
S S fliS lililislill
111
111
:-; ' -;:.v":"
m
{(::* viy'|.!-i:';; '' ;:;
S
8 B SeSfgiaS?
f lilila
SI
si
:'; y Puiituacioaeg. ori nafey ;18^S
? : -V Pptuaeiphe*^
Figura 8*10. D istrib u cio n es d e m ed ia s d e 5 0 0 resu lta d o s d e e x m e n e s, b asadas en d istrib u cion es predichas
(superior) y c o n o c id a s (in ferio r) d e un e stu d io fic tic io r ealizad o a alu m n os de q u in to grado q u e recib en
in stru ccio n es e sp e c ia le s antes d e rendir un ex a m e n estn d ar d e eva lu a c i n de n ivel. E n las d o s distribu
c io n e s s e in d ican lo s pu n tos de co rte seg n la d istrib u ci n inferior. (E l p u n to d e corte co rresp on d e a un
n iv e l d e sig n ifica c i n p < 0 ,0 5 , prueba d e una co la ). P o te n c ia 99% .
No debemos confundimos. Las distribuciones de medias pueden ser estrechas (y por lo tanto estar
menos superpuestas y tener ms potencia) por dos razones muy diferentes. Una razn es que las
poblaciones de individuos pueden tener desvos estndar pequeos. Este motivo est relacionado
con el tamao de efecto. La otra razn por la que las dos distribuciones de medias pueden ser es
trechas es que el tamao de la muestra sea grande. Este motivo es completamente independiente
del primero. El tamao de la muestra no tiene nada que ver con el tamao del efecto, y tanto el
primero como el segundo influyen en la potencia. Pero como veremos pronto, estas dos influen
cias distintas sobre la potencia llevan a pasos prcticos completamente diferentes para aumentar
la potencia al planificar un estudio.
C lcu lo del tam ao de m uestra n ecesario para determ inado nivel de potencia
La razn principal por la que los investigadores calculan la potencia al planificar un estudio es pa
ra decidir cuntos participantes incluir en el mismo. Dado que el tamao de la muestra es un fac
tor de influencia importante en la potencia, los investigadores necesitan estar seguros de tener su
ficientes participantes como para que sus estudios tengan un nivel de potencia bastante alto.
Un investigador puede calcular la cantidad necesaria de participantes revirtiendo los pasos
para el clculo de la potencia. Comenzamos con el nivel de potencia deseado, digamos, un 80%, y
luego calculamos cuntos participantes necesitaramos para obtener ese nivel de potencia. Supon
gamos que los psiclogos especializados en educacin, quienes realizaron el ejemplo de los
alumnos de quinto grado, estuvieran planificando ese'estudio y quisieran calcular cuntos alum
nos de quinto grado necesitan analizar. Siendo la diferencia de media predicha igual a 8, y el des
vo estndar de la poblacin conocida igual a 48, necesitaran 222 alumnos de quinto grado para
tener una potencia del 80%. En este momento no entraremos en detalles de clculo. (Sin embar
go, el alumno tal vez quiera intentar calcular este dato por s mismo. Sera interesante ver si pue
de llegar a la misma respuesta que nosotros utilizando los procedimientos que ha aprendido, pero
comenzando con una potencia del 80% y continuando con los pasos desde atrs hacia adelante
para obtener la cantidad necesaria de participantes). En la prctica, los investigadores utilizan ta
blas especiales que especifican cuntos participantes son necesarios en un estudio para tener un
alto nivel de potencia, segn un determinado tamao del efecto. Nosotros proporcionaremos ver
siones simplificadas de esas tablas para cada uno de los principales procedimientos de prueba de
hiptesis que veremos en los captulos siguientes.
Hace; ms .de tres dcadas, Jacob Cohn - considerados inexistentes). En estos estu
dios la potencia ni siquiera se discuta.,
(1962), un psiclogo, especialista en mto" Cohn calcul la potencia de los resul: dos estadsticos, public un anlisis) muy
conocido actualmente de la potencia, esta :' Vtados'de esas pubhcaciones. Al rio estar fadstica de estudios publicados en el vol- < ; miliarizado con muchos de los contenidos
men de 1960 de'la Revista Cientfica de ; de las distintas reas, analiz la potencia s e -.":;
Psicologa Patolgica y Social [Journal of ; gn tres supuestos del tamao .def efecto:
Abnormal and Social PsyckologyJ. Cohn : pequeo, mediano y grande. Descubri que
: observ que se prestaba gran importancia a . . si era pequea, los ^estudios; publicados
, nan slo una chance contra seis de detectar
la significacin, o tambin a si se haba co~
algn efecto. Ninguno, tena mayores chan-
. metido un error Tipo I (es decir, si se haba
cs que un 50%: Si supona un efecto me- rechazado equivocadamente la hiptesis .
. dian en:jalpqblcn, losestudios/tenan...
nula y a partir de los resultados se haba su chances apenas mayores a uh 8% d detec- ;
puesto cierto efecto que en realidad no . tar ese efecto, incluso un cuarto de ellos A:exista), Pero esencialmente no se prestaba ; ' tena menos de una chance contra tres! .Slo :
atencin a la posibilidad de un error .Tipo II
el supuesto de grandes efectos daba a los
(es decir,; si por error no s hubiera rechaza
. estudios, tal como estaban diseados, una
do la hiptesis nula y se hubiera ignorado
buena posibilidad de rechazar la hiptesis :
un efecto real debido a resultados no con . nula. Como el mismo Cohn lo expresara .,
cluyentes,.que de hecho algunas veces eran 1 toda una generacin de investigadores p-
gvf:
antss< i e t r r ^ ^ z r P ti- V:
m erG u erra M und ial, y e s p r u b a no
.; ./ form p a ite d e lo s lib ros d e esta d stica
- a p licad '.la p s ic lo g s m o h a sta .d es- -.
pufes d e la S e g u n d a G urra M undial!
. E sta s c o sa s lle v a n tie m p o . P o r lo tarri
tiempo y dinero que implican realizar el estudio. Por lo tanto, cuando se descubre que la potencia
de un estudio es baja, los investigadores intentan encontrar formas prcticas de aumentarlo hasta
un nivel aceptable.
Qu significa un nivel aceptable de potencia? Cohn (1988) sugiere que, por lo general, un
estudio debera tener aproximadamente un 80% de potencia para que valga la pena realizarlo. Ob
viamente, cuanto ms potencia, mejor. Sin embargo, los costos que implica obtener ms potencia
(como por ejemplo analizar una mayor cantidad de personas) hacen, con frecuencia, que hasta
una potencia del 80% est fuera de nuestro alcance.
Cmo podemos aumentar la potencia de una investigacin? En principio, la potencia de una
investigacin puede aumentarse cambiando cualquiera de los factores resumidos en la tabla 8-3.
Analicemos cada uno de ellos.
Figura 8-11. D istrib u cio n es de m ed ia s d e 6 4 resu ltad os d e e x m e n e s basadas en d istrib u cion es predichas
(superior) y c o n o cid a s (in ferior) de un e stu d io fic tic io rea liza d o c o n alu m n os de quinto grado q u e recib en
in stru ccio n es e sp ec ia le s antes d e rendir un e x a m en estndar para la eva lu a ci n d e n ivel. E n la s d o s distribu
c io n e s se ind ican las^puntuaciones Z y o r ig in a le s d e corte d e la distribu cin inferior. E l p u nto d e corte c o
rrespond ien te a un n iv el d e s ig n ific a c i n d e p < 0 ,0 1 , prueba d e una c o la (e n com p aracin c o n e l p < 0 ,0 5
d e l e je m p lo o rig in a l rep resen tado por la s fig u ra s 8-1 y 8 -2 ), P o ten cia 16%.
Figura 8-12. D istrib u cio n es d e m ed ia s d e 6 4 resultados d e e x m e n e s b asad as en d istrib u cio n es pred ich as
(cu rv a superior) y c o n o c id a s (curva inferior) d e un e stu d io fic tic io r ealizad o a alu m n o s d e q u in to grado que
recib en in stru ccio n es e sp e c ia le s antes d e rendir un e x a m e n estndar para la eva lu a c i n d e n iv e l. E n las d o s
d istrib u cio n es s e in d ican las pu ntuacion es Z y o r ig n a le s d e corte d e la distrib u cin inferior. L o s p u ntos d e
co rte co rresp o n d en a un n iv el d e sig n ifica c i n d e p < 0 ,0 5 , prueba d e d o s c o la s (e n com p a r a c i n c o n la
prueba d e u n a c o la d e l e je m p lo o rig in a l representado por la s figuras 8-1 y 8 -2 ). P o te n c ia = 26% .
I,
Aumentar la diferencia predicha entre medias poblacionaes. Un investigador no pued
simplemente aumentar en forma arbitraria su prediccin en cuanto a esta diferencia, Si lo hiciera,
aumentara la potencia calculada, pero en realidad no lograra que el estudio tuviera ms probabi
lidades de arrojar un resultado significativo. A veces, sin embargo, es posible cambiar el modo en
el que se realiza el estudio para que el investigador tenga motivos para esperar una mayor diferen
cia de medias. Analicemos nuevamente el ejemplo basado en el experimento acerca del impacto
producido por instrucciones especiales en los resultados de los exmenes realizados por alumnos
de quinto grado. Una manera de aumentar la diferencia de medias esperada podra ser trabajar
con instrucciones ms elaboradas, explicarlas con ms detenimiento, tal vez dar tiempo para que
T a b la 8 - 3 .
F a c to r e s q u e in f lu y e n e n la p o te n c ia .
C a r a c t e r s tic a s d e l e s t u d io
A u m e n t a la p o t e n c ia
D is m in u y e l a p o t e n c ia
d Grande
d Pequea
Grandes diferencias
Pequeas diferencias
a pequeo
a grande
Tamao de m uestra (N )
/V grande
N pequeo
N iv el d e sign ificacin (a )
a indulgente, alto
(tal co m o 0 ,0 5 0 ,1 0 )
a riguroso, bajo
(tal com o 0,01 0,001)
U na co la
D os colas
Vara
( d [p.j - M^j/cr)
E l tam ao del efecto com bina
las d os caractersticas siguientes:
D iferencia hipottica entre
m edias poblacionals
P-i - m-2)
D e sv o estndar
poblacional (o )
. Vara
las practiquen, y otros cambios por el estilo. Una desventaja de este mtodo es que puede ser dif
cil o costoso; o bien, puede requerir la utilizacin de un procedimiento experimental que no es
igual al procedimiento al cual deseamos que se apliquen los resultados del estudio.
2. D ism in u ir el desvo estnd ar poblacional. Existen al menos dos modos de disminuir el
desvo estndar poblacional de un estudio. Un mtodo es realizar el estudio utilizando una pobla
cin menos diversa que la poblacin que se plane utilizar originalmente. En el ejemplo basado
en el examen 'de evaluacin de nivel realizado por alumnos de quinto grado, podramos utilizar
slo alumnos de quinto grado de determinado sistema escolar suburbano. La desventaja es que
los resultados se aplican slo a esa poblacin ms especfica.
Otro mtodo para disminuir el desvo estndar poblacional es utilizando condiciones y medi
das de prueba ms precisas. Por ejemplo, realizar la prueba en una situacin estandarizada o en un
ambiente de laboratorio controlado produce generalmente una variacin general menor entre las
observaciones (lo cual tiene como resultado un menor desvo estndar). De manera similar, utili
zar pruebas con instrucciones claras y procedimientos precisos, en cuanto al modo de realizar las
respuestas, tambin reduce la variacin. Si estos cambios resultan prcticos, son mtodos exce
lentes para aumentar la potencia, aunque por lo general el estudio ya es de por s lo ms riguroso
posible.
3. Aumentar el tamao de la muestra. El mtodo ms directo para aumentar la potencia de
un experimento es mediante el anlisis de una mayor cantidad de personas. Naturalmente, si esta
mos analizando astronautas que caminaron por la luna, existe un lmite para esa cantidad. Sin em
bargo, en las situaciones reales de investigacin el tamao de ia muestra es el principal mtodo
para modificar un estudio con el fin de obtener suficiente potencia.
Tabla 8-4.
Resumen de mtodos prcticos para aumentar la potencia de un experimento planificado.
C a ra cterstica s de! e stu d io
D e sv e n ta ja s
Puede no ser
prctico o
puede distorsionar
el significad o d e l estudio .
D e sv o estndar (cr)
Puede no
haber disponible:
dism in uye la posibilidad
de generalizar.
U tilizar circunstancias de
prueba estandarizadas o
controladas, o bien, m edicion es
m s precisas.
N o siem pre
resulta prctico,
N iv el de sig n ifica ci n ( a )
A um enta
alfa, la posibilidad
d e error T ipo .
Puede no ser
apropiado para la l gica
d el estudio.
Sin embargo, el nivel de significacin efectivamente nos indica algo. Esto es, cunta seguri
dad podemos tener en cuanto a poder rechazar la hiptesis nula, es decir, que existe un efecto dis
tinto de cero. Cuanto menor es el nivel p, mayor es la evidencia de un efecto distinto de cero
(Frick, 1997). Sin embargo, definitivamente no ocurre que, a menor nivel/?, mayor es el efecto. Si
dos estudios fueran idnticos en todos los dems factores, un nivel p menor significara un mayor
efecto. Pero si los estudios son diferentes, especialmente si son diferentes en cuanto a tamao de
muestra, la relacin del nivel p con el tamao del efecto es ambigua. Un nivel p pequeo podra
ser el resultado de un gran tamao del efecto, pero bien podra ser tambin la consecuencia de
un gran tamao de muestra. Por lo tanto, el nivel p indica la fuerza de la evidencia en favor de un
efecto distinto de cero. El nivel p no indica el tamao de ese efecto distinto de cero. (Debido a la
importancia de este tema, volveremos a retomarlo ms adelante en este mismo captulo).
Qu papel cumple la potencia cuando un resultado no es significativo?
En el captulo 6 vimos que un resultado no significativo es un resultado no concluyente. Sin em
bargo, a menudo nos gustara poder llegar a la conclusin de que existe muy poca o ninguna dife
rencia entre las poblaciones. Puede ocurrir esto?
Analicemos la relacin de la potencia con un resultado no significativo. Supongamos que no
obtuvimos un resultado significativo y la potencia del estudio era baja. En ese caso, el estudio es
no concluyente. No obtener un resultado significativo puede haber sido la consecuencia de que la
hiptesis de investigacin fuera falsa, pero tambin puede haber sido el resultado de que el estu
dio tuviera una potencia demasiado baja (por ejemplo, por tener muy pocos participantes).
Por el otro lado, supongamos que no obtuvimos un resultado significativo pero la potencia
del estudio era alta. En ese caso, parece improbable que la hiptesis de investigacin sea verda
dera. En estos casos (en los que existe una alta potencia) un resultado no significativo es un ar
gumento bastante fuerte contra la hiptesis de investigacin. Esto no significa que todas las
versiones de la hiptesis de investigacin sean falsas. Por ejemplo, es posible que las poblacio
nes sean slo levemente diferentes (y que la potencia haya sido calculada suponiendo una gran
diferencia).
En sntesis, el resultado no significativo de un estudio con baja potencia es verdaderamente
no concluyente. Sin embargo, el resultado no significativo de un estudio con una potencia alta su
giere que, o bien la hiptesis de investigacin es falsa o bien existe un efecto menor del que se
predijo al calcular la potencia. Tambin volveremos a tratar este tema ms adelante.
La tabla 8-5 resume el papel de la significacin y el tamao de la muestra en la interpretacin
de resultados experimentales:
T a b la 8 - 5 .
P a p e l d e la s i g n if i c a c i n y d e l t a m a o d e la m u e s t r a e n la in t e r p r e t a c i n d e r e s u lt a d o s e x p e r i m e n t a le s .
T am ao
d e m u estra
Si
Pequeo
Si
Grande
No
Pequeo
No
Grande
C o n c lu si n
R esultado importante
Podra o no tener
im portancia en la prctica
N o concluyente
H iptesis de investigacin
probablem ente falsa
META-ANLISIS_______________________________________________________
El meta-anlisis es un desarrollo importante de los ltimos aos en la estadstica, que ha tenido un
profundo efecto en la psicologa. El meta-anlisis es un procedimiento que combina resultados de
diferentes estudios, incluso resultados para los cuales se utilizan diferentes mtodos de medicin,
con el fin de sacar conclusiones generales. Al combinar resultados, el tema crucial es la combina
cin de tamaos del efecto. A modo de ejemplo, un psiclogo especializado en temas sociales po
dra estar interesado en los efectos causados en los prejuicios por las amistades entre personas de
distintas razas, tema sobre el cual se han realizado una gran cantidad de encuestas. El estudio pro
porcionara un tamao del efecto general. Tambin indicara cmo difieren los tamaos del efec
to en los estudios realizados en diferentes pases o en cuanto a los prejuicios hacia diferentes
grupos tnicos. (Para encontrar un ejemplo de este tipo de meta-anlisis vase Pettigrew, 1997.
Para encontrar otro ejemplo de meta-anlisis vase el cuadro 8-2).
.
Cuadro 8-2.
M agnitudes d e e fe c to d e (a relajacin y la m ed ilacin :
;
:,
i.
j . . a m e n o s ' a l g u n o s p r o c e d i m i e n t o s de: t r a t i s
. n a d o s : p r / c a d a l n m o ; p o r e l in s t r u c t o r ; . . .
m ie n t o a c tu a le s , p e d e n e fe c t iv a m e n te r e d u - :
/ E x i s t e n ^ i n v e s t i g a c i o n e s q u e .m t f ic r i- q u e 1 < . . c i r . l a a n g u s t i a c r n i c a , ( p . 9 7 3 j P o r l o t a n t o j
. d i f e r e n t e s . s o n i d o s s'' p r o d u c e n d i f e r e n t s v ...
::
e f e c t o s ; . Y t o n s t e m e t a La n l i s i s , l o s i m t p -
;.
(to s d e m e d it a c i n q u e e m p le a n s o n id o s , d e l ;
s i e i le c to r e s p r o p e n s o a p r e o c u p a r se p o r p e -
; . v .q u e s : 'C o s s /b o r a ^ u n e x a i m ^ d e ; e s t a d s
a ,:. p u e d e t e n e r n c u e n t a e s t o s r e ^ lt d s . i :
Sub-disdplina
Educacin
Terapiapsicolgica
Psicologa industriai/empresarial
Psicologa social
Diferencias sexuales
Psicologa aplicada a la salud
Salud mental
Personalidad
Psicologa experimental
Psicologa del desarrollo
Frecuencia
115
100
44
43
28
27
26
16
13
8
Fuente: Cooper, H. M. & Lemks, K. M. (1991), tab. i. Sobre el papel del meta-anlisis en la psicologa social y de la
personalidad. Boletn de Psicologa Social y de la Personalidad {Personality and. Social Psychology Bulletin}, 17,
2 4 5 -2 5 1 . Copyright, 1991, por la Society for Personality and Social Psychology, [Sociedad de Psicologa Social y de la
Personalidad] Inc. Reimpreso con autorizacin de Sage Publications Inc.
Sin embargo, este no es ei fin del problema. Muchos de aquellos que se oponen a las pruebas
de significacin sostienen que, aun cuando son utilizadas apropiadamente, las pruebas de signifi
cacin no reflejan el verdadero sentido de las investigaciones. Aseguran que la psicologa se re
fiere fundamentalmente al tamao del efecto, y no se trata de saber si un resultado es distinto de
cero. Ya hemos visto una versin de esta discusin en el captulo 7, con la sugerencia de que ios
investigadores utilicen ios intervalos de confianza en lugar de las pruebas de significacin. La
versin completa de esa propuesta (que no analizamos en ese momento) es que en realidad debe
ramos informar sobre el tamao del efecto, con un intervalo de confianza apropiado para ese ta
mao del efecto.
Adems de los argumentos arriba mencionados, aquellos que proponen el uso del tamao del
efecto sostienen que ste suministra informacin que puede ser comparada con otros estudios, y
utilizada para acumular informacin de estudios independientes como modo de investigacin
acerca del progreso en determinado campo. Los tamaos del efecto son componentes cruciales
del meta-anlisis, y muchos de aquellos que proponen el tamao del efecto, de hecho, no slo
proponen el meta-anlisis sino que lo ven como la tendencia del futuro en la psicologa.
Existen, sin embargo, argumentos contrarios a favor de las pruebas de significacin (y en
contra del uso exclusivo del tamao del efecto). Uno de esos argumentos establece que cuando el
tamao de la muestra es pequeo, an es posible obtener un gran tamao del efecto por casuali
dad. Por lo tanto, si estamos interesados en el resultado de un determinado estudio, que utiliz una
muestra pequea, las pruebas de significacin nos protegen de tomar los resultados de ese estudio
demasiado en serio. De manera similar, existen casos en los que un tamao del efecto muy peque
o es, de todos modos, importante (vase el tratamiento de este tema en el captulo 3)'. En una si
tuacin de ese tipo, es crucial saber si se puede confiar en que el resultado no es casual. Aun as,
muchos de aquellos que sostienen estos argumentos estn de acuerdo con qe se ha exagerado la
importancia de la significacin. La mayora sostiene que la significacin debera ser calculada e
informada siempre, pero que el tamao del efecto tambin debera ser calculado y debera drsele
ms importancia en la discusin de los resultados.
Existe, adems, otra posicin que sostiene que en algunas circunstancias los tamaos del
efecto son engaosos, por lo cual slo deberamos confiar en las pruebas de significacin. Chow
(1988, 1996), por ejemplo, realiza una diferenciacin entre las investigaciones orientadas a la
aplicacin y aquellas orientadas a la teora. En la investigacin aplicada, los psiclogos estn in
teresados en saber el tamao real del efecto de un programa determinado o ei tamao de la dife
rencia real entre dos grupos determinados. En esas circunstancias, Chow est de acuerdo con que
el tamao del efecto es una buena idea. Sin embargo, al realizar investigaciones tericas, Chow
sostiene que la situacin es bastante diferente. Es en esas situaciones en las que el tamao del
efecto es irrelevante y hasta engaoso.
Analicemos un experimento acerca del efecto de la familiaridad en el reconocimiento de in
formacin. El objetivo de este estudio es analizar la forma bsica en que la familiaridad afecta el
procesamiento de informacin. Un estudio podra exponer a diferentes personas a palabras cono
cidas y no conocidas, y observar cuntas milsimas de segundos es lleva reconoceras. El tamao
del efecto de tal estudio nos dira muy poco con respecto a la interpretacin de los resultados del
estudio. La interpretacin depende de toda clase de detalles sobre cmo se realiz el estudio, co
mo por ejemplo, qu grado de familiaridad o falta de familiaridad teman las palabras utilizadas,
de qu forma especfica fueron presentadas las palabras, y aspectos semejantes. Lo que importa
en un estudio de este tipo, segn Chow, es que a) la prediccin de una diferencia en el reconoci
miento de palabras conocidas y no conocidas fuera generada a partir de la teora, b) que los resul
tados fueran coherentes con lo predicho (segn lo demuestre la significacin estadstica) y que
c) as se sustente la teora.
Cada vez es ms comn (aunque sigue siendo una excepcin) que las publicaciones mencionen el
tamao del efecto. Por ejemplo, Caspi et al. (1997) analizaron informacin de un estudio longitu
dinal a gran escala de una muestra de nios nacidos alrededor de 1972 en Dunedin, Nueva Zelan
da. En una de las partes del estudio, Caspi et. al. compararon a los 94 individuos de su muestra
que, a los 21 aos, eran dependientes del alcohol (claramente alcohlicos), contra los 863 que no
lo eran. Los investigadores compararon estos dos grupos en cuanto a las puntuaciones obtenidas
en pruebas de personalidad a los 18 aos de edad. Sin embargo, dado que el tamao de la muestra
era tan grande, los investigadores saban que incluso pequeas diferencias podran resultar esta
dsticamente significativas. Por lo tanto, al describir la planificacin de su anlisis, observaron:
Adems de probar la hiptesis de que las diferencias entre los grupos son estadsticamente significativas, calcu
lamos los tamaos del efecto (d ) de las diferencias obtenidas donde, definindolas operativamente, 4 = 0 ,2 es un
tamao del efecto pequeo, d =~05 es un tamacTdei efecto mediano y d = 0,8 es una gran tamao del efecto
(Cohn, 1 9 8 8 ^ ^ X 0 5 5 ? ----------------------
...................................... .........
...............................
Es ms habitual que se informe sobre el tamao del efecto en los meta-anlisis, en los que se com
binan y comparan resultados de diferentesj^ETm ae^
estos
es tudiosmeta-anafticos7 me luyendo H defc adro
modo de ejemplo de la forma en que es
tos estudios realmente describen los resultados en funcin del tamao del efecto, analicemos un
famoso meta-anlisis realizado por Shapiro y Shapiro (1983). Ellos revisaron 143 estudios sobre
los efectos de psicoterapias que utilizaban razonablemente mtodos de sonido. Entre sus resulta
dos exista una comparacin de la efectividad de las terapias en general en diferentes tipos de pa
cientes (a los que denominaban la categora objetivo). La tabla 8-7 ilustra la cantidad de
estudios (N), el porcentaje que representa esa cantidad en relacin con todos los estudios revisa
dos, el tamao del efecto promedio y el desvo estndar de los tamaos del efecto. A partir de es
ta tabla podemos observar que los mayores beneficios de la psicoterapia se encontraron en los
estudios que se concentraban en personas con fobias, y los menores beneficios en estudios que se
concentraban en personas con angustia y depresin. Sin embargo, sobre la base de las medidas de
Cohn, an el efecto menor era grande.
Tabla 8-7.
Categoras objetivo y tamao de efecto.
Categoras objetivo
A ngustia y depresin
Fobias
Tamao de efecto
SO
30
76
0,67
0 ,6 2
18
1,28
1,10
0,95
0,85
0,75
0,80
0,71
106
76
126
26
18
30
0 ,8 8
Fuente: Shapiro, D. A. & Shapiro, D. (1983), tab. 5." Investigacin comparativa de resultados de terapias: implicancias
metodolgicas del meta-anlisis. R e v is ta C ie n tf ic a d e P s i c o lo g a d e A s e s o m m i e n t o y C ln ic a [ J o u r n a l o f C o n s u ltin g
a n d C lin ic a l P s y c h o l o g y I 5 1 ,4 2 -5 3 . Copyright, 1983, por la Asociacin Americana de Psicologa [American Psycho
logical Association]. Reimpreso con autorizacin del autor.
RESUMEN
La potencia estadstica de un estudio es la probabilidad de que se obtenga un resultado significa
tivo si la hiptesis de investigacin es verdadera.
En la prueba de hiptesis, se dice que se cometi un error Tipo I si el investigador rechaza la
hiptesis nula cuando en realidad la hiptesis de investigacin es falsa. La probabilidad de un
error Tipo I se denomina alfa, siendo alfa igual al nivel de significacin. Un error Tipo II ocurre
cuando el investigador no rechaza la hiptesis nula, pero en realidad la hiptesis de investigacin
es verdadera. La probabilidad de un error de Tipo II se denomina beta. La probabilidad de no co
meter un error Tipo II (1 beta) es la potencia de un experimento.
Para calcular la potencia (en el caso de una poblacin conocida y de una sola muestra), pri
mero determinamos el punto de corte acorde con el nivel de significacin en puntuaciones origi
nales, sobre la distribucin comparativa. La potencia es la probabilidad de obtener una media de
al menos esa magnitud en la distribucin de la poblacin 1 (la poblacin expuesta al tratamiento
experimental). Sobre la base de una media hipottica especfica de la poblacin 1 (y si se supone
una curva normal con la misma varianza conocida que la poblacin 2), se puede determinar la
puntuacin Z de ese punto de corte en la distribucin comparativa. La probabilidad de exceder
esa puntuacin Z, la potencia del estudio, puede encontrarse en la tabla de reas bajo la curva
normal,
Existen dos factores principales que afectan la potencia: el tamao del efecto y el tamao de
la muestra. El tamao del efecto (d) toma en cuenta la diferencia predicha entre medias (cuanto
mayor es la diferencia, mayor es la magnitud de efecto) y la varianza de la poblacin (cuanto me
nor es la varianza poblacional, mayor es la magnitud de efecto). El tamao del efecto es la dife
rencia entre las medias poblacionales dividida por el desvo estndar de la poblacin. El tamao
del efecto influye en la potencia, ya que a mayor tamao del efecto, menor es la superposicin en
tre las distribucionevS de medias de la poblacin predicha y el rea de rechazo de la distribucin de
medias correspondiente a la poblacin comparativa. Las reglas del tamao del efecto de Cohn
establecen que un efecto de 0,2 es pequeo, de 0,5 es mediano y de 0,8 es grande. El tamao del
efecto es importante en s mismo, ya que es un medio estandarizado para evaluar y comparar estu
dios, el cual no est afectado por el tamao de la muestra o la escala de medicin.
A mayor tamao de muestra, mayor ser la potencia; porque a mayor muestra, menor es la
varianza de la distribucin de medias, de forma tal que para una determinado tamao del efecto
existe menor superposicin entre las distribuciones.
La potencia tambin es afectada por el nivel de significacin (cuanto ms extremo, tal como
0,01, menor es la potencia) debido a la utilizacin de una prueba de una o dos colas (con menor
potencia en el caso de utilizarse una prueba de dos colas), y por el tipo de procedimiento de prue
ba de hiptesis utilizado (en el caso ocasional que pueda elegirse el procedimiento).
Las principales aplicaciones prcticas para aumentar la potencia de un experimento planifica
do consisten en aumentar el tamao del efecto y el tamao de la muestra.
Los resultados significativos de un estudio con alta potencia (como puede ser un estudio con
una muestra de gran tamao) pueden no tener importancia prctica. Los resultados no significati
vos de un estudio con baja potencia (como puede ser un estudio con una muestra de tamao pe
queo) dejan abierta la posibilidad de que aparezcan resultados significativos si se aumenta la
potencia.
Con un determinado tamao del efecto, los estudios con ms potencia (es decir, con muestras
mayores) tienen intervalos de confianza ms cortos. A veces los tamaos del efecto son informa
dos junto con los intervalos de confianza.
Trminos clave
-A lfa (a).
-B eta (p).
- Tamao del efecto (<).
Ejercicios
Los ejercicios implican la realizacin de clcu
los (con la ayuda de una calculadora). La ma
yora de los problemas estadsticos reales se
resuelven por computadora, pero aunque exis
ta la posibilidad de utilizarla, es conveniente
realizar estos ejercicios manualmente para in
corporar el mtodo de trabajo.
Para adquirir prctica en la utilizacin de
una computadora, para resolver problemas es
tadsticos, se puede utilizar la seccin de Com
putacin de cada captulo, publicada en la
Gua de estudio y libro de tareas de computa
cin para el alumno {Students Study Guide
and Computer Workbook] que acompaa este
libro.
Todos los datos de esta seccin son ficti
cios (a menos que se especifique lo contrario).
Las respuestas a los ejercicios de la serie I
se encuentran al final del libro.
SERIE I
1. Defina alfa y beta.
2. Para cada uno de los siguientes estu
dios, realice un cuadro de las cuatro posibles
- Potencia estadstica.
~ Error Tipo L
- Error Tipo H.
(a)
(b)
(c)
(d)
(e)
(i)
90
90
90
90
90
90
X
4
4
2
4
4
4
91
92
91
91
91
91
N ivel
de
N sig n ifica c i n
100
100
100
16
100
0 0
0,05
0,05
0,05
0,05
0,01
0,05
U na
odos
c o la s
1
1
1
1
1
2
SERIE 11
1. Qu significa la potencia estadstica de
un experimento?
2. Para cada uno de los siguientes estudios
realice un cuadro de las cuatro posibles decisio
nes correctas e incorrectas, y explique qu sig
nificara cada una. (Cada cuadro debera estar
diseado de manera semejante a la tabla 8-1,
pero dentro de los cuadros debe incluir el re
sultado real utilizando los nombres de las va
riables involucradas en el estudio).
a) Estadio sobre si las criaturas que nacen
prematuramente comienzan a reconocer los
rostros despus de lo que lo hacen los dems
nios en general.
b) Estudio sobre si los alumnos secunda
rios que reciben programas de prevencin del
Hiv en sus colegios tienen mayor probabilidad
de practicar sexo seguro que otros alumnos se
cundarios.
c) Estudio sobre si la memoria para ideas
abstractas se reduce si la informacin se pre
senta en colores que distraen la atencin.
3. Aqu le presentamos informacin sobre
diferentes posibles versiones de un experi
mento planificado, cada una referida a una so
la muestra. (Se supone que el investigador
puede tener cierto control sobre el desvo es
tndar y la media predicha de la poblacin
cambiando los procedimientos). Determine la
potencia y el tamao del efecto de cada una.
Despus realice un diagrama de las distribu
ciones que se superponen mostrando las reas
que representan alfa, beta y la potencia. (Su
ponga que todas las poblaciones tienen una
distribucin normal).
N ivel
de
N sig n ifica c i n
U na
ods
c o la s
esta altura, el alumno debe creer que lo sabe todo acerca de la prueba de hiptesis.
Sin embargo, se sorprender: lo que ha aprendido hasta ahora no le resultar muy
til como psiclogo. Por qu? Los procedimientos para prueba de hiptesis descriptos hasta ahora fueron, por supuesto, requisitos previos absolutamente necesa
rios para lo que estamos por aprender, Sin embargo, estos procedimientos
involucraban la comparacin de un grupo de valores observados con una poblacin conocida, y
cuando se realizan investigaciones reales, con frecuencia se comparan dos o ms grupos de valo
res observados entre s, sin ninguna informacin directa acerca de las poblaciones. Por ejemplo,
podran utilizarse dos valores correspondientes a cada una de las diferentes personas, tales como
las puntuaciones en una prueba de angustia antes y despus de la psicoterapia; o la cantidad de
palabras familiares recordadas, en comparacin con las no familiares, en un experimento acerca
de la memoria. O tambin se podra utilizar un valor por cada una de las personas que forman dos
grupos, tales como un grupo experimental y un grupo control, en un estudio acerca del efecto de
la prdida del sueo en la resolucin de problemas.
Estos tipos de situaciones de investigacin se encuentran entre las ms comunes en psicolo
ga, donde la nica informacin disponible proviene de las muestras. Nada se sabe acerca de las
poblaciones de donde provienen esas muestras. Particularmente, el investigador desconoce la va
ri anza de las poblaciones involucradas, la cual es un componente crucial en el paso 2 del proceso
de prueba de hiptesis (determinar las caractersticas de la distribucin comparativa).
En este captulo, analizamos primero la solucin al problema de no conocer la varianza poblacional. Comenzamos con una situacin de prueba de hiptesis especial, comparando la me
dia de una sola muestra con una poblacin de a cual conocemos la media pero no a varianza.
Luego, despus de haber aprendido cmo se maneja este inconveniente de no conocer la va
rianza poblaciona, proseguimos con la situacin en la cual directamente no hay poblacin co
nocida, una situacin en la que todo lo que tenemos son dos observaciones por cada una de las
personas de un grupo.
Los procedimientos de prueba de hiptesis que aprenderemos en este captulo, en los que no
se conoce la varianza poblacional, son ejemplos de lo que se denominan pruebas t. Las pruebas
a veces se denominan t de Studenf, porque sus principios fundamentales fueron desarrollados
originalmente por William S. Gosset, quien public sus artculos bajo el seudnimo de Student
(vase cuadro 9-1).
Cuadro 9 -1 .
W illiam S. G osset, alias Student:
n o era un m atem tico sino..un "hom bre prctico".
^Wtani'S. Gosset se gradu en Oxford en tro tiempo, n tena-idea de la yari'anza de.. .'
:v;.
vv.v y ; V;;;;v :
199 y obtuvo su diploma n matemtica y vsU poblacin.
. Gosset estaba a la altura de las circns- ;
qumica; En el mismo ao sucedi que los
fabricantes de cerveza de Guinness, en Du- / ancis, aunque en ese momento slo l le ,
saba. Para sus colegas de la.fbrica de cr- . ;
bln, Irlanda, estaban buscando cientficos
veza, era un profesor de matemtica'y no. .'
jvenes para que, por primera vez en la his
un dign fabricante de cerveza. .Para sus ;
toria, analizaran la fabricacin d la cervecolegas estadsticos, principalmente lo del
. za de manera cientfica. Gosset obtuvo uno '
Laboratorio de Estadstica de Datos B ioi-.
de esos, puestos, y no fard en sumergirse en
la cebada, los lpulos y cubas para la ela- . . gicos de la Universidad de Londres;, era un
simple, fabricante de cerveza y no un rater .
boracin de la cerveza.
El problema consista en hallar l for- ; . mticq propiamente dicho.. En., resumen, ;.:
Gosset era esa clase de cientfico qu n
ma de que la calidad de la cerveza fuera.
tiene inconveniente en aplicar sus talentos ,
"; menos variable, y especialmente descubrir.
:
la causa de las malas tandas. Un cientfico ; a vida prctica.;-;
De hecho; pareca disfrutar de'esa vida;/.;
que se preciar de serlo recomendara, sin
real: cultivando peras, pescando, jugando
duda, la realizacin, de experimentos; Pero
golf; construyendo botes, esquiando, n- .
un negocio como el de l elaboracin de ::
cerveza no poda darse el lujo de gastar di- : dando bnbicicleta (y jugando las bochas . '
sobre cspd, despus d. que se quebr, la .
ero en experimentos qu incluan grandes
pierna al estrellar su auto-un Ford modelo
cantidades d cubs algunas de las cuales
T de dos plazas al que llamaba Uacama vo- .,;
iban perderse, omo lo sabra cualquier
ladora, ~ contra n:poste d luz); Disfrutafabricante de cerveza. Por lo tanto, Gosset
fia especialmente de las .heriamientas sim{. .
se vio forzado a analizar la probabilidad de
; qu cierta especi d cebada produjera una pies que podan aplicarse a cualquier csa;..
cerveza de psima calidad, dado que el exv ; frmulas simples; que poda calcular meh- ; ;
talmente. (^n amigo lo describa como un ,
. periment poda consistir slo en has po;
cas tandas .de cada especie. A est prbleina - experto carpintero* aunque afirmaba que
se sumaba el hecho de que l no tena la '. . Gosset realizaba casi toda su carpintera fi-;
na slo cohun cortaplumas);
menor idea de. la yriabilidd de las espe
. De sa. manera, Gosset; descubri- l
cies de cebada; tal vez algunos campos ;
distribucin t e invent la prueba (la sihK .;
dieran mejor cebada al ser plantadas con la
misma especie (suena famili.ar?):. Pobre. . ptez misma, comparada coa la mayora d
los clculos estadsticos), para, aquellas si- .'
Gosset, al igual quedos psiclogos de nues-i
.
tuaciones en las. que las muestras soh pe, se lo pidieron. Hasta el da de. hoy, la mayo
: : quenas y se desconoce la variabilidad de. la ra de los estadsticos llaman a la. distribu-,
cin t la de Student, ' porque Gosset
poblacin que se supone de un.tamao muescriba
baj o el seudnimo de Studenf,
INTRODUCCIN A LA PRUEBA T:
PRUEBA TPARA UNA SOLA MUESTRA
Comenzaremos con la siguiente situacin: tenemos los registros de una sola muestra y queremos
comparar esos datos con una poblacin de la cual conocemos la media pero no la varianza. La
prueba de hiptesis, en este caso, se denomina prueba t para una sola muestra. (Tambin la lla
man prueba f de una muestra). La prueba t para una sola muestra funciona bsicamente de la
misma forma que lo aprendido en el captulo 7. Hay slo dos importantes cuestiones nuevas: pri
mero, ya que no conocemos la varianza poblacional, debemos estimarla. Segundo, cuando se de
be estimar la varianza de la poblacin, la forma de la distribucin comparativa es levemente
diferente a una curva normal.
Ejemplo
Supongamos que el peridico de cierta facultad informa acerca de una encuesta informal que
muestra que los estudiantes de la facultad estudian un promedio de 2,5 horas por da. Sin embar
go, uno de los alumnos considera que los estudiantes que viven en el mismo alojamiento estu
diantil que l estudian mucho ms que esa cantidad de horas. Elige al azar 16 alumnos del edificio
y les pregunta cunto estudian cada da. (Supondremos que son todos honestos y precisos). El re
sultado que obtiene es que estos 16 alumnos estudian un promedio de 3,2 horas por da. En ese
caso, el alumno debera concluir que los estudiantes de su alojamiento estudian ms que el pro
medio de horas que lo hacen los de la facultad? O debera concluir que sus resultados son tan
cercanos a ese promedio de la facultad que la pequea diferencia de 0,7 horas podra bien deberse
a que accidentalmente ha seleccionado 16 de los residentes ms estudiosos del alojamiento estu
diantil?
El primer paso del proceso de prueba de hiptesis es replantear el problema en funcin de hi
ptesis sobre poblaciones. Existen dos poblaciones:
P o b la ci n 1:
P o b la ci n 2:
el tipo de estudiantes que viven en el edificio del alumno que realiza el estudio.
el tipo de estudiantes de la facultad en general.
Sin embargo, existe un pequeo obstculo. La varianza de una muestra generalmente ser le
vemente menor que la varianza de la poblacin de donde proviene la muestra. Por est razn, la
varianza de la muestra es una estimacin sesgada de la varianza pobacional.
Por qu la varianza de la muestra es levemente menor que la de la poblacin? La varianza se
basa en desvos con respecto a la media. La varianza de una poblacin se basa en desvos con res
pecto a la media de esa poblacin. Por otro lado, la varianza de una muestra se basa en desvos
con respecto a la media de esa muestra. La media de una muestra es el punto de equilibrio ptimo
para sus registros, Por lo tanto, los desvos de los registros de una muestra con respecto a su me
dia sern menores que los desvos con respecto a cualquier otro nmero. La media de la muestra
generalmente no es exactamente igual a la media de la poblacin de donde proviene. Consecuen
temente, los desvos de los registros de una muestra con respecto a la media de la muestra gene
ralmente sern menores que los desvos de los registros de esa muestra con respecto a la media de
la poblacin.
Supongamos que conociramos la media poblacional de la que proviene la muestra y utiliz
ramos esta media para comparar el desvo de cada registro de la muestra. La varianza calculada
de este modo sera una estimacin no sesgada de la varianza poblacional.
Lamentablemente, no conocemos la media de la poblacin de la cual proviene la muestra. La
muestra proviene de la poblacin 1. En este caso, slo conocemos la media de la poblacin 2. Pe
ro las medias de las dos poblaciones son iguales slo si la hiptesis nula es verdadera, y eso es
precisamente lo que estamos probando. (Independientemente de si la hiptesis nula es verdadera
o no, nosotros s suponemos que ambas poblaciones tienen la misma varianza).
Afortunadamente, podemos calcular una estimacin no sesgada de la varianza poblacional.
Lo que hacemos es realizar una correccin al calcular la varianza, basadas en los valores mustra
les que refleja con exactitud la medida en que la media de una muestra tiende a variar con respec
to a la verdadera media de la poblacin. Esta estimacin no sesgada se calcula cambiando
ligeramente la frmula ordinaria de varianza. La manera comn de calcular la varianza es tomar
la suma de los desvos cuadrticos y dividirla por la cantidad de valores observados. Segn el pro
cedimiento modificado, tomamos la suma de los desvos cuadrticos pero la dividimos por la can
tidad de valores menos 1. Dividir por una cantidad ligeramente menor hace que el resultado de la
divisin (la varianza) sea ligeramente mayor.
Sucede que dividir por la cantidad de valores menos 1 aumenta la varianza resultante slo lo
suficiente como para que sea una estimacin no sesgada de la varianza poblacional. A propsito,
no sesgada no significa que la estimacin ser exactamente la verdadera varianza de la pobla
cin; slo significa que el mtodo produce estimaciones cuyo promedio coincide con esa verda
dera varianza. (La estimacin sesgada, la varianza muestral calculada en la forma usual, ser
sistemticamente demasiado baja).
El smbolo de la estimacin no sesgada de la varianza poblacional es S2. La frmula es la
usual, pero con la divisin por N - 1 en lugar de N:
_ %(XM) __ SC
N- 1 ~N - 1
(9-1)
s=dF
(9-2)
Volvamos al ejemplo de las horas de estudio y calculemos la varianza poblacional estimada utili
zando los 16 valores mustrales. Primero, calculamos la suma de los desvos cuadrticos. (Resta
mos la media muestral a cada uno de los valores, elevamos al cuadrado esos desvos, y los
sumamos). Supongamos que realizamos este clculo y el resultado es 9,6 (SC = 9,6). Para obtener
la varianza poblacionai estimada, dividimos esta suma de desvos cuadrticos por la cantidad de
valores mustrales menos 1, En la muestra hay 16 valores, entonces el tamao de la muestra me
nos 1 es 15. El resultado es 0,64. Es decir, 9,6/15 es igual a 0,64. La frmula es la siguiente:
tf-1
- 1 16-1
15
Grados de libertad
El mnimo por el cual dividimos (la cantidad de valores menos 1) para calcular la varianza pobla
cionai estimada tiene un nombre especial. Se lo denomina grados de libertad, porque es la canti
dad de valores mustrales libres para variar. Se trata de un concepto un poco complicado. La
idea bsica es que, al calcular la varianza, primero debemos conocer la media; si conocemos la
media y todos los valores de la muestra excepto uno, con un poco de aritmtica podemos calcular
aqul valor que desconocemos. (Si al alumno le agradan las aventuras matemticas, puede inten
tarlo con algunos ejemplos para comprobar como funciona). Por lo tanto, una vez que conocemos
la media, uno de los valores de la muestra no tiene libertad de tomar cualquier valor posible. En
tonces, los grados de libertad son la cantidad de valores menos 1. Se expresa por la frmula,
g l-N - 1
(9-3)
donde gl representa los grados de libertad. En nuestro ejemplo, gl =* 16 - 1 ~ 15. (En algunos ca
sos, que aprenderemos en captulos posteriores, los grados de libertad se calculan de forma lige
ramente diferente, debido a que en esos casos es diferente la cantidad de valores libres para variar.
En todos los casos planteados en este captulo, g l ~ N - 1).
La frmula para calcular la varianza poblacionai estimada, con frecuencia, se escribe utili
zando gl en lugar de N - 1:
^
o X(X-M )2 SC
s = ~ i r ~ = gi
Una vez que hemos estimado la varianza de la poblacin, calcular el desvo estndar de la distri
bucin comparativa implica los mismos procedimientos aprendidos en el captulo 7. Es decir,
consideramos la distribucin comparativa como una distribucin de medias. Al igual que antes,
podemos calcular su varianza como la varianza de la poblacin de individuos dividida por el ta
mao de la muestra. La nica diferencia es que en lugar de conocer la varianza de la poblacin de
observaciones individuales hemos tenido que estimarla. Como siempre, el desvo estndar de la
distribucin de medias es la raz cuadrada de su varianza. La frmula es la siguiente,
(9-5)
(9-6)
Es importante tener en cuenta que cuando estamos utilizando una varianza poblacional estima
da, los smbolos para la varianza y el desvo estndar de la distribucin de medias utilizan S en
lugar de o-.
En el ejemplo que estamos analizando, el tamao de la muestra era l, y la varianza poblacio
nal estimada que acabamos de calcular era 0,64. La varianza de la distribucin de medias, sobre la
base de esa estimacin, ser 0,04. Es decir, 64 dividido 16 es igual a 0,04. El desvo estndar es
0,2, la raz cuadrada de 0,04. La frmula es la siguiente,
Cabe advertir que para encontrar la varianza de una distribucin de medias siempre se divide la
varianza poblacional por el tamao de la muestra, y esto ocurre ya sea porque conocemos la va
rianza de la poblacin o slo porque la estimemos. En el ejemplo que estamos analizando, dividi
mos la varianza poblacional, que habamos estimado, por 16. Slo cuando realizamos la
estimacin de la varianza poblacional dividimos por el tamao de la muestra menos 1. Es decir,
los grados de libertad se utilizan slo cuando estimamos la varianza de la poblacin de observa
ciones individuales.
Forma de la distribucin comparativa al utilizar una varianza poblacional estimada.*
ia distribucin t
En el captulo 7 dijimos que mientras sea razonable suponer que la distribucin poblacional si
gue una curva normal, la forma de la distribucin de medias tambin seguir una curva normal.
Esto cambia cuando estamos realizando una prueba de hiptesis utilizando una varianza pobla
cional estimada. Cuando eso ocurre, contamos con menos informacin cierta y existe ms posi
bilidad de error. El efecto matemtico es que las medias extremas son ligeramente ms
probables que en una curva normal. Ms an, cuanto menor sea el tamao de la muestra, mayor
ser esa tendencia, ya que estamos estimando la varianza de la poblacin basndonos en menos
informacin.
Cul es el resultado de todo lo anterior cuando realizamos una prueba de hiptesis con una
varianza estimada? El resultado es que la distribucin de medias (la distribucin comparativa) no
seguir exactamente una curva normal. Por el contrario, la distribucin comparativa sigue una
curva matemticamente definida que se denomina distribucin t.
En realidad, existen muchas distribuciones t. Su forma vara segn los grados de libertad de la
muestra utilizada al estimar la varianza poblacional. (Sin embargo, para un determinado grado de
libertad, existe slo una distribucin t). En general, todas las distribuciones t parecen a la vsta
una curva normal, con forma de campana, completamente simtricas y unimodales. La distribu
cin f se diferencia ligeramente porque sus colas son ms gruesas (es decir, existen algunos valo
res ms en los extremos). La figura 9-2 ilustra la forma de una distribucin t en comparacin con
una curva normal
Esta sutil diferencia de la forma afecta los valores extremos necesarios para rechazar la hiptesis nu
la. Para rechazar la hiptesis nula necesitamos estar en una zona extrema bajo la curva normal, co
mo por ejemplo el 5% superior. Sin embargo, si hay ms valores extremos, el punto en el que
comienza el 5% superior est ms alejado, hacia afuera de la curva. Por eso, es necesaria una media
muesral ms extrema para obtener significacin al utilizar una distribucin t que al utilizar una cur
va normal.
La medida en que la distribucin t difiere de la curva normal depende precisamente de los
grados de libertad en la estimacin de la varianza pobacional. La distribucin t difiere ms de la cur
va normal cuando la estimacin de la varianza pobacional se basa en una muestra muy pequea, de
modo que los grados de libertad son bajos. Por ejemplo, utilizando la curva normal, el punto de corte
para una prueba de una cola a nivel 0,05 es 1,64. En una distribucin t con 7 grados de libertad (es de
cir, con un tamao de muestra de 8), el punto de corte correspondiente al 5% en una prueba de una co
la es 1,895. Si la varianza pobacional estimada se basa en una muestra mayor, digamos una muestra
de 25 (de modo que gl - 24), el punto de corte es 1,711. Si el tamao de la muestra es infinito, la dis
tribucin es igual a la curva normal. (Por su puesto, si el tamao de tu muestra fuera infinito, inclui
ra toda la poblacin0- Pero incluso con tamaos de muestra de 30 ms, la distribucin te s casi
idntica a la curva normal.
Antes de aprender cmo encontrar realmente el punto de corte utilizando una distribucin t,
volvamos primero brevemente al ejemplo de la cantidad de horas que estudian cada noche los
alumnos del edificio de dormitorios . Finalmente tenemos todo lo que necesitamos para comple
tar el segundo paso, que se refiere a las caractersticas de la distribucin comparativa. Ya hemos
visto que la distribucin de medias tendr una media de 2,5 horas y un desvo estndar de 0,2. So
bre la base de lo que acabamos de analizar, ahora podemos agregar que la forma de la distribucin
comparativa ser una distribucin i con 15 grados de libertad.1
1 Los estadsticos hacen una sutil distincin en este caso entre la distribucin comparativa y la distribucin de m e
dias. H em os evitado presentar esta distincin aqu y en captulos posteriores para simplificar e l tratamiento de un te
ma que-ya es de por s bastante complicado. Pero para aquellos que estn interesados en e l tema diremos que la
distincin puede entenderse de la siguiente manera: el procedimiento general de prueba de hiptesis, tal com o lo
presentamos en e l captulo 7, puede describirse com o la comparacin de una puntuacin 2 con la m edia de 3a m ues
tra, donde Z = ( M ~ (i)/
y donde o u = w VN, y luego a comparacin de esta puntuacin Z c o n un punto Z de cor
te de la tabla de reas de la curva normal. Describim os este proceso utilizando la distribucin de inedias com o
distribucin comparativa.
L o s estadsticos diran que en realidad e s ta m o s comparando la puntuacin Z, calculada con una distribucin de la pun
tuacin Z (que e$ simplemente una curva normal estndar). D e modo similar, en el caso de una prueba t, ios estadsticos
consideran que el procedimiento es como calcular una puntuacin r (similar a una puntuacin Z pero calculada utilizan
do un desvo estndar estimado), donde t = ( M - iL)IS ,, donde
y luego comparar la puntuacin t calcula
da con un punto de corte t tomado de una tabla de distribucin i. Por lo tanto, de acuerdo con la lgica estadstica
formal, a distribucin comparativa es una distribucin de la puntuacin , y no de medias.
OJO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,364
1,356
1,350
1,345
1,341
1,337
1,334
0 ,0 5
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,813
1,796
1,783
1,771
1,762
1,753
1,746
1,740
0,01
OJO
31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,897
2,822
2,764
2,718
2,681
2,651
2,625
2,603
2,584
2,567
6,314
2,920
2,353
2,132
2,015
i,943
1,895
1,860
1,833
1,813
1,796
1,783
1,771
1,762
1,753
1,746
1,740
0 ,0 5
12,706
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,201
2,179
2,161
2,145
2,132
2,120
2,110
0,01
63,657
9,925
5,841
4,604
4,032
3,708
3,500
3,356
3,250
3,170
3,106
3,055
3,013
2,977
2,947
2,921
2,898
t==tJ
(9- 7)
En el ejemplo que estamos analizando, la media muestral de 3,2 est a 0,7 horas de la media de la dis
tribucin de medias. Es decir, a un total de 3,5 desvos estndar de la media (es decir, 0,7 horas dividi
do por el desvo estndar de 0,2 horas es igual a 3,5). En otras palabras, la puntuacin t en el ejemplo
es 3,5. Aplicando la frmula se obtiene:
0,2
0,2
'
T a b la 9 -2 .
P r u e b a d e h ip te s is c o n u n a s o ia m e d ia m u e s tr a l, y e n la q u e s e d e s c o n o c e la v a r ia n z a d e ia
p o b la c i n {p r u e b a t) e n c o m p a r a c i n c o n io s c a so s e n lo s q u e s e c o n o c e la v a r ia n z a p o b la c k m a l.
P aso s de ia p ru e b a d e h ip te sis
1. Replantear e l problem a en funcin de
hiptesis de investigacin e hiptesis
nula sobre las poblaciones.
2. Determ inar las caractersticas de la
distribucin comparativa :
M edia poblacional
D ife r en cia c o n lo s c a so s en lo s q u e s e c o n o ce
ia v a r ia n z a p o b la cio n a l
N o hay diferencia en e l m todo.
Varianza poblacional
D e sv o estndar de la
distribucin de m edias m aestrales
g/=N~ 1.
3. Determ inar e l punto d e corte correspondiente
al nivel de significacin elegido.
S e utiliza la tabla t .
T a b la 9 -3 .
D a to s y a n lis is d e u n a p r u e b a t p a r a u n a s o la m u e s tr a r e f e r e n te a u n e s t u d io d e la c la s ific a c i n
d e l n iv e l d e e s p e r a n z a d e 1 0 in d iv id u o s d e s p u s d e h a b e r s u f r id o u n a in u n d a c i n d e v a s ta d o r a
(d a to s fic tic io s ).
D ife r en cia c o n r esp e c to
a la m ed ia
a ia m ed ia
C la sifica ci n
ix-m
X~M)2
(X)
(
5
0,3
0 ,0 9
3
- 1 ,7
2,89
6
1,3
1,69
2
- 2 ,7
7,29
7
2,3
5,29
1,3
1,69
7
2,3
5,29
4
-0,7
0,49
2
-2,7
7,29
5
0,3
0,09
X:
47
0
32,10
M = I X / N = 4 7 /1 0 = 4,7.
g l = N - = 0 - l = 9.
p = 4 ,0 .
S 2 = S C / g h 3 2 ,1 0 /(1 0 - 1) = 32 ,1 0 /9 = 3,57.
S h - S 2 /N = 3^57/10 = 0,3 6 .
.
^ 3 6 = 0,60.
t necesaria para un nivel de significacin del 1%, con g l = 9, en una prueba de dos colas = 3,250.
real de ia muestra, t = ( M ~ p )/S M= (4,7 - 4 )/0 ,6 = 0 ,7 /0 ,6 = 1 , 1 7 .
D ecisin: no se rechaza la hiptesis nula.
Resumen de ios pasos a seguir para realizar una prueba t para una sola muestra
La tabla 9-4 resume los pasos de la prueba de hiptesis cuando se trabaja con observaciones de
una sola muestra y con una poblacin de la cual se conoce la media pero no la varianza.
Tabla 9-4.
P a s o s a s e g u ir p a r a
1. Replantear el problem a en funcin de hiptesis de investigacin e hip tesis nula sobre poblaciones.
2 . Determ inar las caractersticas de la distribucin comparativa.
a) La m edia es igual a la m edia poblacional conocida.
b) E l desv o estndar se calcula de la siguiente forma:
. i)
= SV N .
En uno de ios diseos de medidas repetidas ampliamente utilizado se mide al mismo individuo
antes y despus de alguna intervencin psicolgica o social. Por ejemplo, un psiclogo empresarial
podra medir los das de ausencia laboral de 80 trabajadores antes y despus de la presentacin de un
nuevo programa de promocin sanitaria.
En esta situacin comn de diseo de medidas repetidas, en la que cada persona es medida
dos veces, el procedimiento de prueba de hiptesis utilizado se denomina prueba t para medias
dependientes. Se denominan medias dependientes porque las medias de cada grupo de valores
(p. ej. valores anteriores y valores posteriores) dependen entre s en cuanto pertenecen a la misma
persona. (En el captulo' 10 analizamos el caso en el que un investigador compara valores de dos
grupos diferentes de personas, es decir, un diseo de investigacin analizado a travs de una
prueba t para medias independientes).
La prueba t para medias dependientes es exactamente igual a la prueba t para una sola mues
tra, excepto que a) utilizamos algo llamado diferencias y b) suponemos que la media poblacional
es 0. Veamos ahora cada uno de estos nuevos aspectos.
Diferencias
En un diseo de medidas repetidas, la muestra incluye dos valores por cada persona en lugar de
uno slo. Esto se maneja convirtiendo los dos valores por persona en uno slo. El truco es crear
diferencias; tomamos los valores de cada persona y restamos uno al otro.
Analicemos el ejemplo acerca del eeg.El psiclogo especializado en fisiologa realizar una
resta por cada persona: la medida del eeg de la persona durante la tarea abstracta menos la medi
da del eeg de la misma persona durante la tarea concreta. As, se obtiene una sola diferencia abs
tracto-menos-concreto para cada persona. Similarmente, si tomamos el ejemplo de las ausencias
laborales, el psiclogo empresarial realizar la siguiente resta por cada persona: la cantidad de
das perdidos despus del programa menos la cantidad de das perdidos antes del programa. El re
sultado sera una diferencia posterior-menos-anterior para cada empleado.
Cuando se trata de un valor anterior y de un valor posterior, generalmente tomamos el valor
posterior y le restamos el anterior, para obtener una medida del cambio. En otros casos, tal como
el ejemplo del Eeg,realmente no importa culse resta a cul, siempre que lo hagamos de la mis
ma manera con todas las personas de la muestra.
Una vez que tenemos la diferencia de cada persona del estudio, realizamos el resto del pro
cedimiento de prueba de hiptesis utilizando las diferencias. Es decir, procedemos como si se
tratara de un estudio de una sola muestra de valores, los cuales, en este caso, resultan ser las di
ferencias.2
2 Tambin podemos utilizar una prueba t para medias dependientes en una situacin en la que tenemos valores de pares
de participantes en ia investigacin. Analizamos cada par com o si fuera una persona y calculamos una diferencia por
cada pr. Por ejemplo, supongamos que tenemos 30 parejas de matrimonios y estamos comparando edades de esposos
y esposas para ver si los esposos son sostenidamente mayores que las esposas, Podramos calcular para cada pareja una
diferencia de la edad del esposo menos la de la esposa. Luego realizaramos el resto de la prueba de hiptesis del m is
mo modo que cualquier otra prueba t para medias dependientes. Cuando la prueba r para medias dependientes se utiliza
de este modo, a veces se la llama prueba t para diseos apareados o prueba l de com paraciones pareadas.
tad era, en general, 2,5 horas. Sin embargo, ahora estamos utilizando diferencias, y por lo general
no conocemos la media poblacional de las mismas.
La solucin es la siguiente; comnmente, la hiptesis nula en un diseo de medidas repetidas es
tablece que no hay diferencia entre los dos grupos de valores. Por ejemplo, la hiptesis nula del estu
dio realizado por el psiclogo especializado en fisiologa es que la actividad e e g ser la misma al
hacer tareas abstractas o concretas. Similarmente, la hiptesis nula del estudio acerca de la promo
cin sanitaria establece que las inasistencias laborales sern iguales antes y despus de presentar el
programa de promocin sanitaria. Por lo tanto, al utilizar diferencias usualmente comparamos una
hiptesis de investigacin que establece una diferencia predicha, con una hiptesis nula que esta
blece una diferencia nula.
El punto clave es el siguiente: Qu significa diferencia nula? Es decir, qu significa decir
que en la poblacin, en lneas generales, la diferencia entre los dos valores de una persona es nu
la? Es lo mismo que decir que la media de la poblacin de diferencias es 0. En otras palabras, de
cir que la diferencia entre los dos valores es nula es equivalente a decir que el promedio de las
diferencias es cero.
Por lo tanto, al trabajar con diferencias suponemos una poblacin comparativa artificial de di
ferencias que tiene una media poblacional igual a 0.
Ejemplo de prueba para medias dependientes
Olthoff (1989) analiz la calidad de l comunicacin entre parejas comprometidas tres meses an
tes y tres meses despus del matrimonio. Uno de los grupos estudiados estaba formado por 19 pa
rejas que haban recibido el acostumbrado curso prematrimonial por parte de los ministros que
iban a celebrar su matrimonio. (Para que el ejemplo no se complique, nos concentraremos slo en
este grupo, y nicamente en los esposos que forman el grupo. Los valores de las esposas eran si
milares, aunque un poco ms variados, hacindolos algo ms complicados como ejemplo para
aprender el procedimiento de la prueba ).
Los valores de los 19 esposos estn enumerados en las columnas Antes y Despus de la
tabla 9-5, seguidas del anlisis completo de la prueba t, (Las distribuciones involucradas apare
cen en la figura 9-5). La media de los valores anteriores fue 116,316 y la media de los valores
posteriores fue 104,263. Lo ms importante, sin embargo, son las diferencias, que tambin he
mos calculado. La media de los registros diferenciales es -12,05. En promedio, la calidad de co
municacin de estos maridos disminuy aproximadamente 12 puntos.
Es significativa esta disminucin? En otras palabras, cun probable es que esta muestra de va
lores de cambio sea una muestra aleatoria de una poblacin de valores de cambio cuya media es 0?
Realicemos el procedimiento de la prueba de hiptesis.
I. Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de las po
blaciones, Las dos poblaciones son:
Poblacin 1: maridos que asisten al curso prematrimonial acostumbrado.
Poblacin 2: maridos cuya calidad de comunicacin anterior al matrimonio no cambia des
pus de casados.
La hiptesis de investigacin establece que la poblacin 1 es diferente de la poblacin 2, es
decir, los maridos que asisten al acostumbrado curso prematrimonial (tal como los maridos que
analiz Olthoff) s cambian en cuanto a calidad de comunicacin antes y despus del matrimonio.
La hiptesis nula establece que las poblaciones son iguales, que los maridos que asisten al acos
tumbrado curso prematrimonial no cambian en cuanto a la calidad de su comunicacin antes y
despus del matrimonio.
Es importante destacar que no tenemos informacin real acerca de los maridos de la poblacin 2.
Los maridos del estudio son una muestra de la poblacin 1 de maridos. Si la hiptesis de investi
gacin es correcta, es probable que los maridos de la poblacin 2 ni siquiera existan. Slo con el
propsito de realizar la prueba de hiptesis, establecimos la poblacin 2 como una especie de gru
po comparativo de hombres en pareja. Es decir, establecimos un grupo comparativo con el prop
sito de analizar maridos que, si se miden antes y despus del matrimonio, no mostraran ningn
cambio.
2. Determinar las caractersticas de la distribucin comparativa. Si la hiptesis nula es
verdadera, la media pobiaconai de las diferencias es 0. La varianza poblacional de las diferencias
puede estimarse a partir de la muestra de las diferencias. Tal como lo indica la tabla 9-5, la suma
de los desvos cuadrticos de las diferencias con respecto a la media de diferencias es 2.772,9. Al
haber 19 maridos en el estudio, existen 18 grados de libertad. Dividiendo la suma de los desvos
cuadrticos por los grados de libertad, obtenemos una varianza poblacional estimada de 154,05.
La distribucin de medias (de esta poblacin de diferencias) tendr una media de 0, al igual
que la media poblacional; su varianza ser la varianza poblacional estimada (154,05) dividida por
el tamao de la muestra (19), lo que da 8,11. El desvo estndar es la raz cuadrada de 8,11, que es
2,85. Dado que Olthoff estaba utilizando una varianza poblacional estimada, la distribucin com
parativa es una distribucin t. La estimacin de la varianza poblacional se realiz sobre la base de
18 grados de libertad, por lo tanto, esta distribucin comparativa es una distribucin t para 18 gra
dos de libertad.
3. Determ inar el punto de corte en !a distribucin comparativa, apartir del cual debera
rechazarse la hiptesis nula. Olthoff utiliz una prueba de dos colas porque no exista razn evi-
Tabia 9-5.
Anlisis de la prueba t referida a los registros de calidad de comunicacin antes y despus del ma
trimonio, realizado a 19 esposos que no recibieron ninguna capacitacin especial en cuanto a comu
nicacin.
Desvo de las diferencias
E sp o so
C a lid a d d e
c o m u n ic a c i n
Antes
A
B
C
D
D ife r e n c ia
(d e s p u s a n tes)
Q
R
S
115
125
96
115
119
82
93
109
72
104
107
118
102
115
83
87
121
100
118
-1 1
-8
-3 0
0
11
-2 7
-3 1
11
-2 3
-1 6
-1 1
-8
-1 9
-1
-1 1
-1 8
-2
-2 5
-1 0
S;
2 .2 1 0
1.981
-2 2 9
F
G
H
I
J
K
L
M
N
O
P
D e s v o
c u a d r t ic o
Despus
126
133
126
115
108
109
124
98
95
120
118
126
121
116
94
105
123
125
128
con r e sp e c to a
la m e d ia
d if e r e n c ia !
1,05
4,05
-1 7 ,9 5
12,05
23,05
-1 4 ,9 5
-1 8 ,9 5
2 3,05
-1 0 ,9 5
- 3 ,9 5
1,05
4,05
- 6 ,9 5
11,05
1,05
- 5 ,9 5
10,05
- 1 2 ,9 5
2,05
1,1
16,4
3 2 2 ,2
145,2
5 31,3
233,5
359,1
531,3
119,9
15,6
1,1
16,4
48,3
122,1
1,1
35,4
101,0
167,7
4 ,2
2.772,9
= -229/19 = -12,05.
dente para predecir un aumento o una disminucin en la calidad de la comunicacin. La tabla B-2
indica que utilizando un nivel de significacin de 0,05 y 18 grados de libertad para rechazar la hi
ptesis nula, se necesita un punto t de +2,101 mayor, o bien de -2,101 menor.
4.
D eterm inar el valor muestral en la distribucin comparativa. La muestra de Olthoff te
na una media de diferencias de -12,05. Es decir, la media estaba 12,05 puntos por debajo de la
media de distribucin de medias, que es igual a 0. El desvo estndar de la distribucin de medias
que calculamos era de 2,85. Por lo tanto, la media de las diferencias -12,05 se encuentra 4,23 des
vos estndar por debajo de la media de la distribucin de medias, es decir, la muestra de diferen
cias de Olthoff corresponde a un punto t de - 4,23
5. C om p arar los valores de los pasos 3 y 4 p ara d ecid ir si se rechaza o no la hiptesis n ula.
1.
Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de la
poblaciones. Las dos poblaciones son:
Poblacin 1: nios como los analizados en este estudio.
Poblacin 2: nios cuya sensibilidad hacia extraos es la misma a los 3 meses que a los 4
meses de edad.
La hiptesis de investigacin establece que la media de las diferencias de la poblacin 1 (sen
sibilidad hacia extraos a los 4 meses menos sensibilidad a ios 3 meses) es mayor que la de la po
blacin 2. La hiptesis nula establece que la media de las diferencias de la poblacin 1 no es
mayor que la de la poblacin 2.
T abla 9-6.
P ru eb a t de un estu d io acerca de la coord in acin entre el p u lso y la vista, en el q u e se m id e a nu eve
ciru ja n o s en con d icion es de silen cio y ruido (d atos ficticios).
Cirujano
i
2
3
4
5
6
7
8
9
S:
Condiciones
Silencio
18
21
19
21
17
20
18
16
20
170
Ruido
12
21
16
16
19
19
16
17
16
152
D iferencia
Desvo
6
0
3
5
-2
1
2
-1
4
18
6 -2 = 4
. -2
1
3
_4
-1
0
-3
2
0
Desvo
Cuadrtico
16
4
1
9
16
1
0
9
4
60
El t muestral, que es igual a 0,70, es menos extremo que el t necesario de 1,833. Por lo tanto, no se
puede rechazar la hiptesis nula. El estudio no es concluyente.
SUPUESTOS DE LA PRUEBA
T*lo
Como ya hemos visto, al utilizar una varianza poblacional estimada, la distribucin comparativa es
una distribucin t. Sin embargo, la distribucin comparativa ser exactamente una distribucin t s
lo si la distribucin de observaciones individuales sigue una distribucin normal. De lo contrario, la
distribucin comparativa tendr alguna otra forma (generalmente desconocida),
Por lo tanto, hablando estrictamente, una poblacin normal es condicin necesaria dentro de la
lgica y de la matemtica de una prueba t. Una condicin de este tipo en un procedimiento de prue
ba de hiptesis se denomina supuesto. Se dice que.una distribucin poblacional normal es un su
puesto de la prueba t. El efecto de este supuesto es que si la distribucin poblacional no es normal,
es tcnicamente incorrecto utilizar la prueba t.
Lamentablemente, por lo general no sabemos si la poblacin es normal, ya que cuando realiza
mos una prueba t, usualmente todo lo que tenemos para trabajar son ios valores mustrales, Afortu
nadamente, como vimos en el captulo 5, las distribuciones en las investigaciones psicolgicas con
mucha frecuencia se aproximan a la curva normal. (Esto tambin se aplica a ias distribuciones de
diferencias). Adems, los estadsticos han descubierto que, en la prctica, aun cuando la poblacin
se encuentre bastante lejos de lo normal, con la prueba se obtienen resultados razonablemente pre
cisos. En otras palabras, se dice que la prueba t es robusta ms all de incumplimientos moderados
del supuesto de una distribucin poblacional normal. Es interesante la forma en que los estadsticos
calculan la robustez de una prueba, tema que describiremos en el cuadro 10-1 del captulo 10.
Existe una situacin razonablemente comn en la que utilizar una prueba f para medias depen
dientes puede dar resultados seriamente distorsionados. Es el caso en el que realizamos una prueba
de una cola y la poblacin es muy asimtrica (con una de las colas mucho ms larga que la otra).
T a b la 9 -7 .
P r u e b a t d e u n e s tu d io a c e r c a d e la s e n s ib ilid a d d e 1 0 n i o s h a c ia lo s e x tr a o s , m e d id a a lo s 3 y a
lo s 4 m e s e s d e e d a d (d a to s fic tic io s ).
N i o
1
2
3
4
5
6
7
8
9
10
S:
E dad
3 m eses
10,4
12,6
11,2
10,9
14,3
13,2
9,7
11,5
10,8
13,1
117,70
4 m eses
10,8
12,1
12,1
11,4
13,9
13,5
10,9
11,5
10,4
12,5
1 19,10
D ife r en cia
0 ,4
- 0 ,5
0 ,9
0,5
0 ,4
0 ,3
1,2
0 ,0
- 0 ,4
- 0 ,6
1,4
D esvo
0,26
-0 ,6 4
0,76
0,36
-0 ,5 4
0,16
1,06
-0 ,1 4
-0 ,5 4
-0 ,7 4
0
D esv o
C u ad rtico
0,07
0,41
0,58
0,13
0,29
0,03
1,12
0 ,0 2
0,29
0,55
3,49
li = .
= S C /g l = 3 ,4 9 /(1 0 - 1 ) - 3 ,4 9 /9 = 0,39.
S i = SYiV = 0 ,3 9 /1 0 = 0,039..
0 0 3 9 = 0,20.
necesario para el nivel de sign ificacin 5%, g l = 9 y prueba de una cola = 1,833.
t ~ (M -
= (0 ,1 4 - 0 )/0 ,2 0 = 0,70.
Tabla 9-8.
Pasos para la realizacin de una prueba t para medias dependientes.
=SVN.
Cmo sabemos que la poblacin es muy asimtrica? Un caso puede ser aquel en el que la mues
tra de diferencias es muy asimtrica. Si la muestra es muy asimtrica, es probable que la pobla
cin de donde proviene la muestra sea muy asimtrica tambin. Otro caso es aquel en el que
existen razones para pensar que se produce un efecto techo o piso que hace que la distribucin sea
asimtrica porque los valores de un lado no pueden ser mayores o menores a determinado punto.
Existen varias alternativas para reemplazar la prueba t, cuando hay razones para creer que reali
zarla violara seriamente el supuesto de normalidad y dara resultados distorsionados. En el cap
tulo 15 veremos esas alternativas.
Tamao de efecto
El tamao del efecto, en un estudio en el que se utiliza una prueba t para medias dependientes, se
calcula del mismo modo que en el captulo 8. Es la diferencia entre las medias poblacionales divi
dida por el desvo estndar de la poblacin: (jXj - jx2)/ cr. Sin embargo, al utilizar diferencias, la
media de la poblacin 2 usualmente es 0 (es decir, cuando se trabaja con diferencias, r,2s = 0). Es
to simplifica la situacin:
(9-8)
O"
Es importante recordar que cuando se utiliza esta frmula, \xl es la media predicha de la poblacin
de diferencias y cr es el desvo estndar de las poblaciones de diferencias.
Las reglas del tamao del efecto de una prueba t para medias dependientes son las mismas
que aprendimos para el caso analizado en el captulo 8: un tamao del efecto pequeo es igual a
0,20, uno mediano es igual a 0,50, y uno grande es igual a 0,80.
Analicemos un ejemplo. Un psiclogo especializado en deportes planifica un estudio acerca
de las actitudes hacia compaeros de equipo antes y despus del juego. Realizar un cuestiona
rio sobre actitudes dos veces, una antes y otra despus del juego. Supongamos que la diferencia
mnima entre antes y despus, que puede tener cierta importancia, es de 4 puntos del cuestiona
rio. Supongamos adems que sobre la base de investigaciones relacionadas con el tema, el inves
tigador calcula que el desvo estndar de las diferencias del cuestionario de actitud es
aproximadamente de 8 puntos. As, (ij = 4 y a ~ 8. Aplicando la frmula para calcular el tamao
del efecto, d - p/(7 - 4/8 = 0,50, Conforme a las reglas del tamao del efecto, el estudio planifi
cado tiene un tamao del efecto mediano.
Si deseramos estimar el tamao del efecto despus de haber realizado el estudio, dividira
mos la media real de las diferencias de la muestra por el desvo estndar estimado de la poblacin
de diferencias.
Es importante recordar que, en sta frmula, tanto M como S se refieren a diferencias. Adems, S
es el desvo estndar de la poblacin de observaciones individuales (es decir, en este caso, de las
diferencias de los individuos). No es lo mismo que SM, el desvo estndar de la distribucin de
medias (de diferencias).
Analicemos nuestro primer ejemplo de prueba t para medias dependientes, el estudio acerca
del cambio de los maridos en cuanto a la calidad de la comunicacin. En ese estudio, la media de
las diferencias era -12,05, y el desvo estndar poblacional estimado de diferencias seria 12,41.
Es decir, calculam os la varianza estim ada de registros diferenciales (S2) y nos da
154,05; 'Vs2 = 12,41. Por lo tanto, el tamao de efecto se calcula como d = M/S - -12,05/12,41
= -0,97. Se trata de un tamao del efecto muy grande. (El signo negativo de tamao del efecto
significa que el gran efecto era una disminucin).
Potencia
La tabla 9-9 indica la potencia aproximada a un nivel de significacin de 0,05 para los tamaos
del efecto pequeos, medianos y grandes, correspondientes a pruebas de na o dos colas. En el
ejemplo del psiclogo especializado en deportes, el investigador esperaba un tamao del efecto
mediano (d - 0,50). Si planificara realizar un estudio utilizando el nivel 0,05, con una prueba de
dos colas y con 20 participantes, el estudio tendra una potencia de 0,59. Lo cual significa que si
la hiptesis de investigacin es realmente verdadera y tiene un tamao del efecto mediano, existe
un 59% de chances de que el estudio resulte significativo.
La tabla de potencia (tabla 9-9) tambin es til cuando leemos el resultado no significativo de
algn estudio publicado. Supongamos que un estudio que utiliza una prueba t para medias depen
dientes tuviera un resultado no significativo. El estudio prob la significacin al nivel 0,05, con
T a b la 9 -9 .
P o te n c ia a p r o x im a d a d e e s tu d io s e n lo s q u e s e u tiliz a la p r u e b a t p a r a m e d ia s d e p e n d ie n te s e n p r u e
b a s d e h ip te s is c o n n iv e l d e s ig n ific a c i n d e 0 ,0 5 .
R eg istro s de
d iferen cia s
d e la m u estr a ( N )
T am a o de efecto
P equeo
( d = 0,20}
M e d ia n o
( d = 0 ,5 0 }
G ran de
(d ^ 0 ,8 0 )
0 ,0 9
0 ,1 4
0 ,1 9
0,2 4
0,2 9
0,2 5
0,32
0,59
0,77
0,88
0,94
$
0 ,6 6
0,93
0 ,9 9
*
0,15
0 ,2 2
0 ,2 9
0,35
0,4 0
0,63
0,46
0,71
0,86
0,93
0,97
0,78
0,96
*
*
*
*
una prueba de dos colas, y contaba con 10 participantes. Deberamos concluir que, en efecto, no
existe ninguna diferencia entre las poblaciones? Probablemente no. Aun suponiendo un tamao
de efecto mediano, la tabla 9-9 indica que existe slo un 32% de chances de obtener un resultado
significativo en este estudio. Analicemos ahora otro estudio que result no significativo, en el que
tambin se utiliz el nivel de significacin 0,05 y una prueba de dos colas, pero que contaba con
100 participantes. La tabla 9-9 indica que existira un 63% de chances de que el estudio resultara
significativo si existiera incluso un tamao del efecto real pequeo en la poblacin. Si en la pobla
cin hubiera un tamao del efecto mediano, la tabla indica que existira casi un 100% de chances
de que el estudio resultase significativo. Por lo tanto, en este estudio con 100 participantes podra
mos concluir, a partir de los resultados, que en la poblacin probablemente no existe ninguna di
ferencia o que, en el mejor de los casos, existe una muy pequea.
Para que la tabla 9-9 resultara simple, hemos incluido slo la potencia correspondiente a unas
pocas cantidades diferentes de participantes (10,20, 30, 40, 50 y 100). Estos datos deberan ser
suficientes para el tipo de evaluaciones aproximadas que se realizan al analizar resultados de pu
blicaciones cientficas.*3.
3 Cohn (1988, pp. 28-39) proporciona tablas ms detalladas en cuanto a cantidades de participantes, niveles de tamao
del efecto y niveles de significacin. S i se utilizan sus tablas, debe tenerse en cuenta que la d a la que se hace referencia
est basada en realidad en una prueba / para medias independientes (que es la situacin que trataremos en el captulo
10). Para utilizar esas tablas para una prueba t para Medias dependientes, primero se debe multiplicar el tamao del
efecto deseado por 1,4. Por ejemplo, si el tamao del efecto es 0,30, para utilizar las tablas de Cohn consideraramos
que es de 0,42 (es decir, 0,30 x 1,4 - 0,42). La tnica otra diferencia con respecto a nuestra tabla es que Cohn descrihe
el nivel de significacin con la letra a (por nivel alfa), con un subndice de 1 2, haciendo referencia a una prueba de
una o dos colas. Por ejemplo, una tabla que en la parte superior indica al = 0,05 significa que es una tabla para p < 0,05,
con una cola,
Tabla 9-9.
C a n tid a d a p r o x im a d a d e p a r tic ip a n te s n e c e s a r io s p a r a lo g r a r u n 80 % d e p o t e n c ia e n la p r u e b a t
p a r a m e d ia s d e p e n d ie n te s , e n p r u e b a s d e h ip te s is c o n u n n iv e l d e s ig n ific a c i n d e l 0 ,0 5 ,
T am a o d e l efecto
D o s colas
U na cola
Pequeo
M ediano
Grande
( d = 0 ,2 0 )
( d - 0,5 0 )
( d = 0 ,8 0 )
196
156
33
26
14
12
4 Cohn (1988, pp. 54-55) proporciona tablas ms detalladas que indican la cantidad necesaria de participantes para
otros niveles de potencia adems del de 80% (y tambin para otros tamaos del efecto adems de las de 0 ,2 0 ,0 ,5 0 y
0,80, as como tambin para otros niveles de significacin). D e todos modos, para la utilizacin de esas tablas se deben
tener en cuenta ias mismas indicaciones que en la nota al pie N 3).
CONTROVERSIAS Y LIMITACIONES
Las principales controversias con respecto a la prueba t estn relacionadas con sus ventajas y des
ventajas relativas en comparacin con varias alternativas, las cuales se discutirn en mayor detalle
en le captulo 15. (Los mismos temas surgen tambin con respecto a los procedimientos que trata
remos en los captulos 10 al 13). Existe, sin embargo, una consideracin que queremos comentar
aqu. Esta se relaciona con todos los diseos de investigacin en los cuales los mismos participan
tes se prueban antes y despus de alguna intervencin experimental. (Es el tipo de situacin para
la evaluacin en la que con frecuencia se utiliza la prueba t para medias dependientes).
Medir simplemente a un grupo de personas antes y despus de algn procedimiento experi
mental, sin ningn tipo de grupo control que no experimente el procedimiento, puede tener una
potencia alta, pero es un diseo de investigacin dbil en cuanto a la claridad de las conclusiones
que puede producir (Cook & Campbell, 1979). Como se describe detalladamente en el apndice
A, aun cuando tal estudio produzca una diferencia significativa, quedan muchas explicaciones al
ternativas posibles en cuanto a la razn por la cual ocurri tal diferencia. Por ejemplo, los partici
pantes podran haber madurado o mejorado de todos modos durante ese perodo, o tal vez otros
hechos ocurrieron en el transcurso del tiempo entre una prueba y otra, o los participantes que no
recibieron beneficios pueden haber abandonado el experimento. Incluso es posible que la propia
prueba inicial causara cambios que, de otro modo, no podran haber ocurrido.
No obstante, es importante observar que las dificultades que presentan las investigaciones en
las que se prueba a las personas antes y despus de alguna intervencin, se comparten slo leve
mente con el tipo de estudio en el que los participantes son probados en dos condiciones diferen
tes, como por ejemplo de ruido y silencio, probando primero a una mitad en unas condiciones y a
la otra mitad, tambin primero, en las otras condiciones.
llegar a informar acerca de una prueba r para una sola muestra. Por ejemplo, Weller y Weller
(1997) realizaron un estudio acerca de la tendencia de las mujeres que viven juntas a sincronizar
sus ciclos menstruales. Para realizar el anlisis estadstico, compararon los valores obtenidos por
las mujeres que participaron dei estudio, de una medida de sincronizacin de pares de mujeres
que viven juntas (poblacin 1), con el grado de sincronizacin de esos pares de mujeres, esperado
en forma casual (poblacin 2). Es decir, crearon una especie de poblacin artificial con una media
de lo que se esperara si no hubiera sincronizacin, y analizaron los resultados con pruebas pa
ra una muestra (p. 147). La tabla 9-11 indica esos resultados. Cada lnea de la tabla es una prue
ba t independiente para una sola muestra. La primera lnea es una prueba que compara los
registros de sincronizacin de 6,32 de los 30 pares de hermanas compaeras de cuarto (la muestra
de lo que llamaramos poblacin 1) con'un registro de sincronizacin esperado de 7,76 (lo que de
nominaramos la media de la poblacin 2). La lnea muestra esos datos ms la diferencia de 1,44,
el desvo estndar de esta diferencia -que es igual a 3,40-, el punto de 2,27 y el nivel p de 0,011.
Un detalle importante es que la columna t en realidad est escrita como 7(1). Esto no es lo estn
dar y realmente no significa que su distribucin t tena un grado de libertad. Suponemos que sig
nifica que se trata de una prueba para una sola muestra.
Como mencionamos anteriormente, la prueba t para medias dependientes es mucho ms co
mn. Olthoff (1989) podra haber informado del siguiente modo su resultado en el ejemplo que
utilizamos anteriormente: Exista una disminucin significativa de la calidad de comunicacin,
decreciendo de 116,32 antes del matrimonio a 104,26 despus del matrimonio, (18)=2,76,/? <0,05,
dos colas. El investigador que realiz el estudio ficticio acerca de los cirujanos podra haber re
dactado lo siguiente: La media de desempeo dei grupo que trabaj en condicin silenciosa fue
18,89, mientras que el rendimiento del grupo que trabaj en condicin ruidosa fue 16,89. La dife
rencia no result estadsticamente significativa a nivel 0,01, incluso con una prueba de una cola,
(8) - 2,20. Para dar otro ejemplo, Holden et. al. (1997) compararon las actitudes informadas por
madres con respecto al castigo corporal de sus hijos desde antes hasta despus de 3 aos de tener
a su primer hijo. El cambio promedio en las actitudes anteriores y actuales de las mujeres fue
significativo, (107) = 10,32,/? < 0,001... (p, 485). (El cambio implic que despus de tener a su
primer hijo tenan sentimientos ms negativos con respecto al castigo corporal).
Los investigadores tambin presentan con frecuencia las medias de ios grupos en una tabla.
Por ejemplo, Pezdek y sus colegas (1997) recordaron a cada uno de los integrantes de un grupo de
alumnos universitarios varios hechos que supuestamente les haban sucedido cuando tenan ocho
aos de edad, Se les pidi a los alumnos que describieran el hecho con algn grado de detalle. Es
tas descripciones fueron clasificadas por cantidad de palabras recordadas y cantidad de unidades
de ideas recordadas. Tambin se pidi a los alumnos que clasificaran cada hecho en cuanto a la
claridad con la que lo recordaban y en cuanto al nivel de seguridad que tenan con respecto a que
el hecho efectivamente haba ocurrido. Algunos de los hechos realmente haban ocurrido y algu
nos podran haber ocurrido pero no ocurrieron. (Los investigadores se haban comunicado con las
madres de los alumnos con anterioridad, con el permiso de los estudiantes). Como es tpico en ta
les investigaciones, muchos de los alumnos equivocadamente recordaron haber experimentado
los hechos falsos. Estos son ios resultados:
Para in v e stig a r la s d ifer e n c ia s p o te n c ia le s entre r ecu erd o s de h e c h o s r ea les y r ecu erd o s d e h e
c h o s fa ls o s , c o m p a r a m o s varias ca ra c te r stic a s d e lo s r ecu erd o s d e 13 su je to s qu e recordaron
al m e n o s un h e c h o fa lso . S e r ea liza ro n pruebas de s ig n ific a c i n d e d o s c o la s c o n e sta in fo rm a
c i n , y e l resu lta d o a p a rece en la [tabla 9 -1 2 ], E n c o m p a r a c i n c o n lo s r ec u e r d o s d e h e c h o s
fa ls o s , al recordar h e c h o s verd ad eros se e m p le a n s ig n ific a tiv a m e n te m s p alab ras, (12) ~
4 ,5 4 , p < 0 ,0 0 1 , y m s u n id a d es d e id e a s, (12) = 3 ,4 3 , p < 0 ,0 1 . Por lo tanto, e l resu lta d o de lo s
recuerdos de hechos verdaderos, en comparacin con los de hechos falsos, podra ser diferen
ciado en cuanto a la cantidad de nuevos detalles dados con respecto a cada uno; se dieron casi
el doble de detalles con respecto a los hechos verdaderos que a los falsos. En comparacin con
ios recuerdos de hechos falsos, el recuerdo de los hechos verdaderos tambin estaba relaciona
do con clasificaciones significativamente superiores de claridad, f(i2) = 3,99, p < 0,01; y de
certeza, (12) * 2,73, p < 0,02 (p. 438).
Es importante observar que en este ejemplo nunca hicieron referencia al nombre de la prueba de
significacin. Sin embargo, sabemos que se trata de una prueba t porque utilizan la t al describir
los resultados, Adems, podemos damos cuenta de que es una pmeba t para medias dependientes
porque estn comparando los valores de cada participante en cuanto al recuerdo de hechos verda
deros y al recuerdo de hechos falsos, cada uno con su propio valor.
Tabla 9-11.
Sincronizacin menstrual y valores esperados (por das).
G ru p o /m es
Compaeras - hermanas
M es 1
M es 2
M es 3
A m igas ntim as - com paeras
M esi
M es 2
M es 3
Fam ilias
M es 1
M es 2
M es 3
V alor de
sin c ro n iz a ci n
V alor
e sp era d o
30 .
30
29
6,32
6 ,2 4
7 ,4 0
7 ,7 6
7 ,7 6
7 ,7 6
39
39
31
5,73
6,01
7 ,4 4
7,75
7,7 5
7 ,7 5
18
18
17
5,80
6,09
7 ,1 9
7 ,7 0
7 ,7 0
7 ,7 0
D iferen cia
SD
1,44
1,52
0,36
3,40
3,08
3,08
2,27
2,66
0,57
0,011
0 ,0 0 4
2,02
1,74
0,31
3,84
4,25
4,61
3,25
2 ,5 2
0 ,8 8
< 0 ,0 0 0
0,006
0,19
1,90
1,61
0,51
2,74
1,89
2,71
2 ,8 6
3,52
0,75
< 0 ,0 0 0
< 0 ,000
0,23
0 ,2 8 0
Fuente: Weller, A. & Weller, L. (1997), tab. 1. Sincronizacin menstrual en condiciones ptimas: Familias nmades.
R evista C ien tfica d e P s ic o lo g a C o m p a ra tiva [J o u rn a l o f C o m p a ra tiv e P s y ch o lo g y ], H i , 143-151. Copyright, 1997,
por la Asociacin Americana de Psicologa [American Psychological Association]., Reimpreso con autorizacin.
Tabla 9-12.
Medias (y desvos estndar) de medidas que comparan el recuerdo de hechos verdaderos y falsos
del experimento 1.
Hecho recordado
M ed ida
Cantidad d e palabras recordadas * * *
Cantidad de unidades d e ideas recordadas**
Puntuacin en claridad***
Puntuacin en certeza**
Verdadero
2 7 ,7 9 (8 ,8 1 )
6,33 (2 ,5 3 )
6 ,9 0 (0 ,1 7 )
6,88 (0 ,2 1 )
Falso
15,42 (7,69)
3,23 (1,55)
4 ,0 0 (0 ,1 8 )
5 ,0 0 (0,21)
RESUMEN
Cuando no se conoce la varianza poblacional se utilizan los cinco pasos estndar de la prueba de
hiptesis. No obstante, en este caso debemos estimar la varianza poblacional a partir de los valo
res mustrales, utilizando una frmula que divide la suma de los desvos cuadrticos por los gra
dos de libertad ( g l ~ N - 1). Adems, cuando no se conoce la varianza, la distribucin comparativa
de medias es una distribucin t (cuyos puntos de corte se indican en una tabla t). Una distribucin
t posee colas ligeramente ms pesadas que las de una curva normal (exactamente en qu medida
son ms pesadas depende de cun pocos sean los grados de libertad). Finalmente, en este caso, se
denomina punto t a la cantidad de desvos estndar con respecto a la media a la que se encuentra
la media muestral en la distribucin t.
La prueba para medias dependientes se utiliza en estudios en los que cada participante pre
senta dos valores, como por ejemplo un valor anterior y uno posterior. En esta prueba t, primero
se calcula una diferencia para cada participante; luego se realizan los usuales cinco pasos de la
prueba de hiptesis con las modificaciones descriptas en el prrafo anterior y se convierte a la po
blacin 2 en una poblacin de diferencias con una media de 0 (ausencia de diferencia).
Un supuesto de la prueba t es que la distribucin poblacional es una curva normal.. Sin embar
go, aun cuando no lo sea, la prueba t usuamente es bastante exacta. La principal excepcin en el
caso de la prueba t para medas dependientes es cuando la poblacin de diferencias es altamente
asimtrica y trabajamos con una prueba de una cola.
El tamao del efecto de un estudio en el que se utiliza una prueba t para medias dependientes
es la meda de las diferencias dividida por el desvo estndar de esas diferencias. Existen tablas
especiales en las que se pueden encontrar la potencia y el tamao de muestra necesarios para ob
tener una potencia del 80%. La potencia de estudios en los que se utilizan diferencias es usual
mente mucho mayor que el de aquellos estudios en los que se utilizan otros diseos con la misma
cantidad de participantes.
Investigadores expertos en metodologa sealan que las investigaciones que involucran a un
slo grupo probado antes y despus de algn hecho interpuesto, sin un grupo control, deja abier
tas muchas explicaciones alternativas de cualquier cambio observado.
En las publicaciones cientficas, las pruebas t se informan utilizando un formato estndar, por
ejemplo, (24) = 2,80, p < 0,05.
Trminos clave
- Supuesto.
- Estimacin sesgada.
- Grados de libertad (gl).
~ Diferencias.
- Diseo de medidas repetidas.
- Robustez.
- Distribucin t.
- Punto t.
~ Tablar.
- Pruebas t
Ejercicios
Los ejercicios implican la realizacin de clcu
los (con la ayuda de una calculadora). La ma
yora de los problemas estadsticos reales se
resuelven por computadora, pero aunque exis
(a)
(N)
(fri
(S*2)
64
12,40
9 ,0 0
(a )
1 1 ,00
0,05
(prediccin
baja)
(b)
(c)
49
400
1.006,35
52,00
317,91
7 ,0 2
1.009,72 2
0,01
52,41 ' 1
0,01
(prediccin
____________________________________ alta)________
(b)
(c)
164
15
2,3
-2,2
4 1 4,53
4 ,0 0
2
0,05
0,01
1
(prediccin
__________________________ N a)_______ _
4.
En cuatro ciudades del Valle Central de
California se implemento, en agosto de 1997,
un programa para reducir la cantidad de des
perdicios. La cantidad de basura en las calles
(cantidad promedio en libras de basura reco
lectada por manzana, por da) se midi durante
seel mes de julio anterior al comienzo del progra
ma y, luego, el siguiente julio, despus de que
el programa hubiera estado en efecto durante
un ao. Los resultados fueron los siguientes:
2.
Supongamos que un candidato que
postula como jefe de polica afirma que reducir
el tiempo promedio de respuesta a emergencias a
menos de 30 minutos, que es considerado el
tiempo de respuesta promedio para emergen
Ju lio 1997
Ju lio 1998
cias bajo el mandato del jefe de polica actual. C iud ad
No existen registros anteriores, por lo tanto, Fresno
2
19
no podemos determinar el desvo estndar real M erced
4
10
de esos tiempos de respuesta. Gracias a esta Bakersfield
18
9
campaa, l es elegido jefe de polica, y aho Stockton
1
19
ra se guardan ios registros cuidadosamente.
Los tiempos de respuesta durante el primer
Utilizando un nivel de significacin del
1%, hubo una disminucin significativa de la
mes son 26, 30,28,29,25, 28, 32,35,24 y 23
cantidad de desperdicios? a) Realice los cinco
minutos.
Utilizando un nivel de significacin del pasos de la prueba de hiptesis; b) ilustre su
5%, cumpli l su promesa? a) Realice los respuesta con un histograma de la distribucin
cinco pasos de la prueba de hiptesis; b) ilustre muestra! y con grficos de la distribucin po-
C olas
(a)
Pequeo
20
(b)
M ediano
20
30
(c)
M ediano
(d)
M ediano
30
1
1
1
2
(e)
Grande
30
1.
En cada uno de los siguientes estudios
se compara a la media de una sola muestra con
una poblacin de la cual se conoce la media
pero no la varanza. Decida, en cada caso, si el
resultado es o no significativo. (Si los gl no
aparecen en la tabla, utilice el t correspondien
te al valor gl menor ms cercano). Asegrese
de indicar todos sus clculos.
Tamao
Media
muestra! poblaciona!
Desvo
estndar
estimado
CAO
( )
(5)
(a)
16
100,31
2 ,0 0
(b)
(c)
16
16
0 ,4 7
6 8 ,9 0
4 ,0 0
9 ,0 0
Media
maestral
m
Nivel
de
Colas signifie.
(a )
100,98
1
0,05
(prediccin
alta)
0 ,0 0
2
0 ,0 5
3 4 ,0 0
1
0,01
(prediccin
baja)
2.
Existen teoras biolgicas que sostienen
que los humanos se han adaptado a su ambien
te fsico. Una de estas teoras sostiene la hip
ca
tesis de que las personas seguiran espont
neamente un ciclo de 24 horas de sueo y vigi
lia, aun cuando no fueran expuestas al patrn
usual de la luz solar. Para probar esta nocin,
ocho voluntarios contratados fueron ubicados
E sca la de
(individualmente) en una habitacin en la que
p e r s o n a lid a d
O to o
P r im a v e r a D ife r e n c ia
no haba luz del exterior, ni relojes, ni ninguna
M
SD
M
SD
M
SD
otra indicacin del transcurso del tiempo. Po
Angustia
16,82 4,21 15,32 3,84 1,50** 1,85
dan encender o apagar las luces cuando qui
Depresin
89,32 8,39 86,24 8,91 3,08** 4,23
sieran. Despus de un mes en la habitacin,
Introversin
59,89 6,87 60,12 7,11 0,23
2,22
cada individuo mostr una tendencia a desa
Neurosis
38,11 5,39 37,32 6,02 0,89* 2 4,21
rrollar un ciclo estable. Sus ciclos al finalizar
el estudio fueron los siguientes; 25,27,25,23,
*p < 0,05; **p < 0,01.
24,25,26 y 25.
a)
Concentrndose en las diferencias, cal Utilizando un nivel de significacin del
cule los valores t para cada escala de personali 5%, qu conclusin sacaramos con respect
A n te s
D esp u s
J.K .
287
255
L.M .M
A .K .
305
243
269
245
R.O .S.
309
247
P a r tic ip a n te
L .B .
J.K .
R .C .
R .T .
J.M.
A n te s
D esp u s
65
62
60
70
68
58
65
56
66
60
H is t o r ia
M s ic a
1
2
3
4
5
6
6 ,1 2
7 ,2 5
5 ,7 0
6 ,4 0
5 ,8 2
6 ,2 4
5 ,3 9
6 ,7 2
5 ,4 2
6 ,1 6
5 ,9 6
6 ,0 8
significacin seleccionado, c) Calcule el tama significacin del 5%. a) Realic los cinco pa
o del efecto, d) Explique su respuesta a al sos de la prueba de hiptesis, b) ilustre su
guien que comprende el concepto de media, respuesta con un histograma de la distribu
desvo estndar y varianza pero que no sabe cin de muestras y con grficos de la distri
nada ms sobre estadstica.
bucin poblaconal y de la distribucin de
6,
A cinco alumnos de segundo ao se les to
medias, e indique el punto t y los puntos de
m un examen de evaluacin del nivel de in corte de significacin, c) Calcule la magnitud
gls antes y despus de recibir instrucciones so de efecto, d) Explique su respuesta a alguien
bre gramtica bsica. Sus registros fueron los si que comprende el concepto de media, desvo
guientes:
estndar y varianza pero que no sabe nada
ms sobre estadstica.
E s t u d ia n te
D esp u s
A n te s
7.
Se realiz un estudio comparando la ac
A
20
18
tividad
sindical
de empleados de 10 plantas du
B
18
22
rante dos dcadas diferentes. El investigador
C
17
15
D
17
16
inform un aumento significativo de la activi
12
E
9
dad sindical, t (9) - 3,28, p < 0,01. Explique
este resultado a una persona que nunca ha to
Es razonable concluir que futuros alum mado un curso de estadstica. Asegrese de uti
nos lograran registros ms altos despus de lizar grficos de las distribuciones en su
recibir las instrucciones? Utilice un nivel de respuesta.
wY2
(9- 10)
N~ l
(9- 11)
1
2
3
4
5
6
7
8
9
S:
SAT- - (ZX )V N
N~
%XIN
SI'f
C o n d ic io n e s
S ile n c io
18
21
19
21
17
20
18
16
20
170
1 8 / 9 _____ 2
2 .7 4 /V 9
D if e r e n c ia c u a d r t ic a
(X )
(X2)
36
0
9
25
4
1
4
1
16
96
R u id o
12
21
16
16
19
19
16
17
16
152
9 6 - 1879
V 9 -1
D ife r e n c ia
6
0
3
5
-2
1
2
-1
4
18
96 - 3 2 4 /9 _
V
m _2_
~ 2 ,7 4 /3 ~ 0 ,9 1
9 6 -3 6 _ JO _ f f ?
~ X8 ~
ste captulo analiza la prueba de hiptesis para los casos en los que se comparan dos
muestras, tales como un grupo experimental y un grupo de control. Son situaciones
en las que se realiza una prueba t debido a que las varianzas poblacionales no se co
nocen y, por lo tanto, deben estimarse. Bn este caso, la prueba se denomina prueba
t para medias independientes, porque se comparan medias de dos grupos de per
sonas completamente separados, cuyos valores son independientes el uno del otro. La prueba
para medias independientes se contrapone con la prueba t para medias dependientes analizada en
el captulo anterior, n la que haba dos grupos de valores, pero ambos provenan del mismo gru
po de personas (como es el caso de las mismas personas medidas antes y despus de un programa
de asesoramiento).
rene ias entre pares de medias (cada una de las cuales proviene de una de esas dos distribuciones
de medias). Pensemos que ia distribucin de diferencias entre medias se construye de la siguiente
forma: a) se selecciona al azar una media de la distribucin de medias de la poblacin 1, b) se se
lecciona al azar una media de la distribucin de medias de la poblacin 2 y c) se resta (es decir to
mamos la media de la distribucin de medias de la poblacin 1 y le restamos la media de la distri
bucin de medias de la poblacin 2). El resultado es una diferencia entre las dos medias
seleccionadas. Luego se repite el proceso creando una segunda diferencia, es decir, la diferencia
entre las nuevas medias seleccionadas. Repitiendo este proceso una gran cantidad de veces se
crea una distribucin de diferencias entre medias.
Ilustracin de la lgica general d la prueba t para medias independientes
La figura 10-1 representa grficamente la creacin lgica completa que implica una distribucin
de diferencias entre medias. En la parte superior estn las dos distribuciones poblacionales cuyas
caractersticas desconocemos. No obstante, s sabemos que si la hiptesis nula es verdadera, las
dos medias poblacionales son iguales, es decir, la hiptesis nula establece que jr, =
Tambin
podemos estimar las varianzas poblacionales sobre la base de la informacin obtenida a travs de
la muestra (las varianzas estimadas sern S \ y 5 |).
Debajo de cada distribucin poblaciona se encuentra la distribucin de medias correspon
diente a esa poblacin. Utilizando la varianza poblaciona estimada y sabiendo el tamao de cada
muestra, podemos calcular la varianza de cada distribucin de medias utilizando el mtodo acos
tumbrado (es decir, la varianza poblaciona de origen dividida por el tamao de la muestra).
Debajo de las dos distribuciones de medias, y creada a partir de ellas, se encuentra la crucial
distribucin de diferencias entre medias. Dado que la varianza de esta distribucin se estima fi
nalmente sobre la base de las varianzas poblacionales estimadas, podemos considerarla una dis
tribucin t. El objetivo de una prueba t para medias independientes es decidir si la diferencia entre
las medias de las dos muestras reales es ms extrema que la diferencia de corte en la distribucin
de diferencias. Las dos muestras reales aparecen (como histogramas) en la parte inferior.
No debemos olvidar que todo el procedimiento es, en realidad, una especie de complicado
castillo en el aire. Existe slo en nuestras mentes para ayudamos a tomar una decisin basada en
los resultados de un experimento real. La nica realidad concreta en todo este procedimiento son
F i g u r a 1 0 - 1 . P a s o s p ara la c r e a c i n
b u c i n d e d if e r e n c ia s d e m e d ia s .
las dos muestras de valores realmente observadas. Las varianzas poblacionales se estiman sobre la
base de esos valores muestra.les. Las varianzas de las dos distribuciones de medias se basan comple
tamente en las varianzas poblacionales estimadas (y en los tamaos de las muestras). Y, como vere
mos pronto, las caractersticas de la distribucin de diferencias entre medias se basan en las dos dis
tribuciones de medias que mencionamos anteriormente.
Aun as, el procedimiento es poderoso. Tiene el poder de la matemtica y una lgica implci
ta: ayuda a desarrollar un conocimiento general basado en los datos especficos de un estudio en
particular.
Teniendo una visin general de la lgica bsica, ahora nos dedicaremos a cinco detalles cla
ve: a) la media de la distribucin de diferencias entre medias, b) la varianza poblaciona estimada,
c) la varianza y el desvo estndar de la distribucin de diferencias entre medias, d) la forma de la
distribucin de diferencias entre medias y e) el punto t correspondiente a la diferencia entre las
dos medias particulares que estn siendo comparadas.
Media de !a distribucin de diferencias de medias
En una prueba t para medias independientes se tienen en cuenta dos poblaciones; por ejemplo,
una poblacin de la cual se extrae el grupo experimental y otra poblacin de la cual se extrae el
grupo de control. En la prctica, el investigador no conoce la media de ninguna de las poblacio
nes, pero efectivamente sabe que si la hiptesis nula es verdadera, esas dos poblaciones tienen la
misma media. Si las dos poblaciones tienen la misma media, la distribucin de medias de cada
una de ellas tendr tambin a misma media. Si se seleccionan ai azar dos muestras de dos distri
buciones con la misma media, las diferencias de las medias de estas muestras aleatorias, a la lar
ga, deberan compensarse en 0. El resultado de toda esta lgica es que cualesquiera sean los datos
especficos del estudio, el investigador sabe que si la hiptesis nula es verdadera, la distribucin
de diferencias de medias tiene una media de 0.
que proporciona cada muestra. Para ser precisos, lo que importa no es la cantidad de valores de
cada muestra sino la cantidad de grados de libertad (la cantidad de valores menos 1).
Por lo tanto, cuando creamos un promedio ponderado ste tiene que basarse en los grados de
libertad. El procedimiento consiste en calcular en qu proporcin contribuye cada muestra con
los grados de libertad totales; despus multiplicamos esa proporcin por la estimacin provenien
te de cada muestra y, finalmente, sumamos los dos resultados y obtenemos la estimacin ponde
rada. La frmula que expresa el principio que acabamos de describir es la siguiente;
<1(W)
En la frmula precedente, $'2Combirta(iaes estimacin combinada de la varianza poblacional,
g l{ son los grados de libertad correspondientes a la poblacin 1, y gl2 son los grados de liber
tad correspondientes a la poblacin 2, (No debemos olvidar que cada gl es la cantidad de valo
res mustrales menos 1). glTotal son los grados de libertad totales (g/To{at = g l{ + gt2). ] es la
estimacin de la varianza poblacional sobre la base de los valores de a muestra que proviene de
la poblacin 1; S \ es la estimacin sobre la base de los valores de la muestra que proviene de la
poblacin 2.
Analicemos un estudio en el que la estimacin de la varianza poblacional, sobre la base de un
grupo experimental de 11 participantes, es 60, y la estimacin de la varianza poblacional sobre la
base de un grupo de control de 31 participantes es 80. La estimacin del grupo experimental
se basa en 10 grados de libertad (11 participantes menos 1); la estimacin del grupo de control se
basa en 30 grados de libertad (31 participantes menos 1). La informacin total sobre la que se ba
sa la estimacin son los grados totales de libertad, en este caso, 40. Por lo tanto, el grupo experi
mental proporciona un cuarto de la informacin (10/40 = 1/4), y el grupo control proporciona tres
cuartos de la informacin (30/40 = 3/4).
Despus multiplicamos la estimacin del grupo experimental por 1/4 y obtenemos 15 (es
decir, 60 x 1/4 = 15), y la estimacin del grupo de control por 1/4 y obtenemos 60 (es decir, 80
x 3/4 = 60). Sumando los dos resultados obtenemos una estimacin de 15 ms 60, es decir de
75. Aplicando la frmula:
^Combinada:
M sfW
g Total '
'
) = ~ ( 6 0 ) + ~ (80)
40
40V
Total \ 2 /
= 1 ( 6 0 ) + | ( 8 0 } = 15 + 6 0 = 7 5
Cabe mencionar que este procedimiento no da el mismo resultado que un promedio simple (sin
ponderar). Un promedio simple dara una estimacin de 70 (es decir, [60+80J/2 = 70). Nuestra es
timacin combinada ponderada, igual a 75, est ms cerca de la estimacin realizada slo sobre la
base del grupo de control que de la estimacin realizada tnicamente sobre la base del grupo expe
rimental. As es como debe ser, porque la estimacin del grupo de control se bas en mayor infor
macin. Por otro lado, an sigue siendo un tipo de promedio. Ser evidente que hemos cometido
un error en los clculos si este nmero no se encuentra entre las dos estimaciones. (Tambin re
sultar evidente el error de clculo si no obtenemos un nmero ms cercano a la estimacin que
proviene de la muestra mayor).
^Combinada
( 10 - 2 )
..^Combinada
(10-3)
Su * - ~ ;
Analicemos nuevamente el ejemplo del estudio en el que haba 11 individuos en el grupo experi
mental y 31 en el grupo de control. En ese ejemplo, descubrimos que la estimacin combinada de
la varianza poblacional era 75. Por lo tanto, para el grupo experimental, la varianza de la distribu
cin de medias sera 75/11, es decir 6,82; y en el grupo de control, la varianza sera 75/31, es de
cir, 2,42. (Es importante recordar que al calcular varianzas estimadas dividimos por los grados de
libertad, pero cuando calculamos la varianza de una distribucin de medias, que no involucra nin
guna estimacin adicional, dividimos por la cantidad real de observaciones en la muestra). Apli
cando las frmulas,
<2 _ ^Combinada 75
<,0
-------- I T 6'82
= ^C^binada = 2 42
31
Varianza y desvo estndar de la distribucin de diferencias de medias
La varianza de la distribucin de diferencias de medias (^Diferenciad es la suma de la varianza
de la distribucin de medias proveniente de la poblacin 1 y la varianza de la distribucin de me
dias proveniente de la poblacin 2, Esto se debe a que, al calcular una diferencia entre dos nme
ros, la variacin de cada uno contribuye a la variacin total de la diferencia. Es como restar un n
mero en movimiento de un objetivo en movimiento. Se representa porla frmula:
2
^Diferencia
2
+ Sm2
(10-4)
^Diferencia
(10-5)
3,04
dos medias se encuentra 2,63 desvos estndar por encima de ia inedia de la distribucin de dife
rencias de medias. Se expresa bajo ia frmula,
M
~ M 2
^ D ife r e n c ia
1 9 8 -3 8 0 _
3 ,0 4
3 ,0 4
_ 2>63
Figura 10-2. Distribuciones relacionadas con el ejemplo de control de manipulacin en una prueba t para
medias independientes. (Fuente: Norman & Aron, 1997).
1 En este ejemplo, ias varianzas estimadas de las dos poblaciones son sustancialmente diferentes. Esto genera objecio
nes en cuanto al supuesto de que ambas poblaciones tienen la misma varianza. Al final del captulo, veremos el tema
del supuesto de iguales varianzas poblacionales. en. forma general. N o obstante, en este ejemplo, utilizar mtodos alter
nativos que no requieran del supuesto produce resultados similares.
Tabla 10-1.
Prueba t para medias independientes correspondiente al control de manipulacin de la excitacin
experimentada, comparando las condiciones de excitacin con las de control.
Parejas en la condicin de excitacin
R e g is tr o
D e s v o
d e la m e d ia
D e s v o
c u a d r tic o
d e la m e d ia
8,75
8,92
9 ,5 0
8 ,5 0
8,17
8,67
8,17
8,83
9,17
9 ,0 8
8,75
7,0 8
8,42
9,1 7
8,33
0,12
0,29
0,87
- 0 ,1 3
- 0 ,4 6
0 ,0 4
- 0 ,4 6
0 ,2 0
0,5 4
0,4 5
0,1 2
-1 ,5 5
-0 ,2 1
0,54
-0 ,3 0
0,01
0,08
0 ,7 6
0 ,0 2
0,21
0 ,0 0
0,21
0,0 4
0 ,2 9
0 ,2 0
0,01
2 ,4 0
0,04
0,29
0,09
9 ,5 0
5,00
4,83
8,42
9 ,0 0
5,25
6,75
5,67
6,17
4 ,0 0
6,5 0
6,5 0
5,67
4,65
8 3 ,2 6
129,51
R e g istr o
D e s v o
d e la m e d ia
3 ,1 0
- 1 ,4 0
- 1 ,5 7
2,02
2 ,6 0
-1 ,1 5
0,35
- 0 ,7 3
-0 ,2 3
- 2 ,4 0
0,10
0,10
- 0 ,7 3
D e s v o
c u a d r t" 0
d e la m e d ia
9,61
1,96
2,46
4,08
6,76
1,32
0,12
0,53
0,05
5,76
0,01
0,01
0,53
33,20
= 3 3 ,2 0 /1 2 = 2,77
iV( - l = 14;iV2 = 13 ; g l2 = N 2 ~ 1 = 12
^Toiaf " <^1 +
1 4 + 1 2 = 26
^ b i ^ = 7 ^ ( f ) + - p ( s I)=X0.33)+|(2,77)=0,54(033)+0,4<i(2,77)=0,I8tl37=l,45
Total
Sg, =
Total
= 1145/15 = 0,097
= 0,097 + 0 ,1 1 2 = 0,209
* = ' 5 ^ = * 3 * = M 57
- M 2)/S m t ^
= (8 ,6 3 - 6 ,4 0 )/0 ,4 5 7 = 2 ,2 3 /0 ,4 5 7 = 4,88
vadores al establecer el nivel de significacin. Para una prueba de una cola con un nivel de 0,01,
con 26 grados de libertad, la tabla del apndice B (tabla B-2) indica que necesitamos un t de al
menos 2,479 para rechazar la hiptesis nula.
4. Determinar el valor muestral en la distribucin comparativa. El punto t es la diferencia
entre las dos medias mustrales de 2,23 (8,63 - 6,40 = 2,23) dividida por 0,457, el desvo estndar
de la distribucin de diferencias de medias. El resultado es una puntuacin t de 4,88 (es decir,
= 2,23/0,457 = 4,88).
5. Com parar os registros de los pasos 3 y 4 para decidir si se rechaza o no la hiptesis
nula. El valor t de 4,88, correspondiente a la diferencia entre las medias de las dos condiciones, es
mayor que el t necesario de 2,479. Por lo tanto, los investigadores podran rechazar la hiptesis
nula con confianza. La hiptesis de investigacin se sostiene: las parejas que participan de las
condiciones de excitacin informan que la actividad Ies resulta ms excitante de lo que informan
las parejas que participan en las condiciones de control. Por lo tanto, los investigadores podan
confiar en que su manipulacin experimental estaba funcionando en la forma deseada. (Por su
puesto, el siguiente paso era ver si la manipulacin experimental produca el aumento predicho de
satisfaccin marital y amor romntico).
Un dato interesante es que el anlisis de los resultados completos de este estudio indicaron
que las parejas en condiciones excitantes mostraron un aumento significativamente mayor de la
satisfaccin marital y del amor romntico entre antes y despus de la actividad, (Es fcil interpre
tar estos resultados sabiendo que la manipulacin experimental s produce la sensacin esperada).
Otros resultados de los estudios de Norman & Aron descartaron algunas explicaciones alter
nativas del efecto encontrado, y un estudio anterior (Reissman et al., 1993) descubri el mismo
efecto fuera del laboratorio en condiciones ms realistas. Tomados en conjunto, estos estudios
brindan una evidencia preliminar de que realizar actividades excitantes juntos puede ser una for
ma de aumentar la calidad marital de las parejas casadas.
Un segundo ejemplo de prueba t para medias independientes
Valenzuela (1997) compar el cuidado maternal recibido por chicos pobres que estaban o no des
nutridos. Una de sus medidas fueron ndices acerca de la forma en que la madre ayudaba a su hijo
en una tarea estndar de armado de rompecabezas (la observacin se realiz durante visitas a las
madres en sus casas, como parte de la investigacin).
Los resultados obtenidos indicaron que las madres de los 43 nios adecuadamente alimenta
dos tenan una media, en cuanto a la calidad de ayuda, de 33,1, y una varianza poblaciona estima
da de 201,64. Las madres de los 42 nios crnicamente desnutridos tenan una meda de 27,0 en
esta medida, con una varianza poblaciona estimada de 134,56.
La figura 10-3 representa grficamente la prueba t que compara la calidad de ayuda en las dos
condiciones; la tabla 10-2 indica los valores y clculos correspondientes. A continuacin realiza
mos los cinco pasos de la prueba de hiptesis.
1.
Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula d
poblaciones. Las dos poblaciones son las siguientes:
Poblacin X: madres de nios pobres adecuadamente alimentados.
Poblacin 2: madres de nios pobres crnicamente desnutridos.
La hiptesis de investigacin estableca que las madres de la poblacin 1 tendran diferentes
ndices que las madres de la poblacin 2 en cuanto a la calidad de ayuda brindada a sus hijos. Va
lenzuela predijo que la poblacin 1 tendra ndices ms altos que los de la poblacin 2. Sin embar
go, siguiendo la prctica convencional en cuanto a estudios de este tipo, se utiliz una prueba de
significacin no direccional. (La ventaja de este tipo de prueba es que brinda la posibilidad de en
contrar resultados significativos en la direccin opuesta a la prediccin). Por lo tanto, la hiptesis
de investigacin realmente probada fue que las madres de la poblacin 1 tendran ndices diferen
tes a los de las madres de la poblacin 2; en smbolos, |X1-t- p2. La hiptesis nula estableca que las
madres de la poblacin 1 tendran ndices iguales a los de las madres de la poblacin 2;
jx,.
2.
D eterm inar las caractersticas de la distribucin comparativa. Como es habitual, la
media de la distribucin de diferencias de medias ser 0, La estimacin combinada de la varian
za poblacional es el promedio ponderado de las estimaciones de varianza poblacional realizados
sobre la base de cada una de las dos muestras: 42/83 por 201,64 y 41/83 por 134,56. El resultado
es 168,77. La varianza de cada distribucin de medias, es decir, la estimacin combinada dividi
da por el tamao de cada muestra (168,77/43 y 168,77/42), es 3,92 y 4,02. Sumando los dos re
sultados anteriores obtenemos la varianza de la distribucin de diferencias de medias, 7,94. La
raz cuadrada de esa varianza, es decir, el desvo estndar de la distribucin de diferencias de
medias, es 2,82. La forma de la distribucin comparativa es una distribucin t con un total de 83
grados de libertad.
F igura 10-3. D istribuciones relacionadas co n el ejem plo acerca de madres de ni os pobres adecuadam ente a li
m entados en com paracin con m adres de ni os pobres crnicam ente desnutridos. (F u en te: V alenzuela, 1997).
= 2 0 1,64
gl,
W l
gL
Tw.l
42
41
83
83
t necesario con nivel 5%, g l - 83 (utilizando un gf= 80 d e la tabla) y prueba de dos c olas = 1,990
t = ( M x ~ A /2)/y Difc(eflCia = <33,l - 2 7 , 0 )/2 ,8 2 = 6 ,1/2 ,8 2 = 2,16
personas que no han sido capaces de mantener un empleo. Catorce personas acuerdan participar en
el estudio, y el investigador escoge al azar siete de esos voluntarios para formar el grupo expe
rimental que realizar el programa de capacitacin especial. Los otros siete voluntarios forma
rn el grupo de control que realizar un programa de capacitacin laboral ordinario. Despus
de finalizar los programas de capacitacin (de ambos tipos), los 14 son ubicados en empleos si
milares.
Un mes despus, se le pide al empleador de cada voluntario que califique el desempeo del
participante utilizando una escala de 9 puntos. La tabla 10-3 indica los resultados ficticios y el
anlisis completo de la prueba t La figura 10-4 representa grficamente el anlisis. Realicemos
tambin el anfisis paso a paso, siguiendo el procedimiento de prueba de hiptesis.
1. Replantear e problema en funcin de hiptesis de investigacin e hiptesis nula de
poblaciones. Las dos poblaciones son las siguientes:
Poblacin 1: individuos que no podan mantener un empleo y que, po lo tanto, participan en el
programa de capacitacin laboral especial.
Poblacin 2: individuos que no podan mantener un empleo y que, por lo tanto, participan
en un programa de capacitacin laboral ordinario.
Es posible que el programa especial tenga efectos positivos o negativos en comparacin con
el programa ordinario, por lo cual ambos resultados son de inters. Por lo tanto, la hiptesis de in
vestigacin establece que las medias de las dos poblaciones son diferentes: p,E p,2. Se trata de
una hiptesis no direccional. La hiptesis nula establece que las medias de las dos poblaciones
son iguales: jXj = jx2.
2. D eterm inar las caractersticas de la distribucin comparativa. La distribucin de
diferencias entre medias tendr una media de 0, como es habitual. Determinamos su desvo es
tndar de la siguiente manera; a) calculando la varianza poblacional estimada sobre la base de
cada muestra; b) calculando la estimacin combinada; c) en el caso de cada poblacin, divi
diendo la estimacin combinada por el tamao de cada muestra para obtener la varianza de ca
da distribucin de medias; d) sumando las varianzas de las dos distribuciones de medias para
obtener la varianza d la distribucin de diferencias de medias, y e) calculando la raz cuadrada
de esa varianza. Como lo indica la tabla 10-3, todo este proceso da como resultado un desvo
estndar de 1,10. La forma de la distribucin comparativa es una distribucin t con un total de
12 grados de libertad.
3. Determinar el punto de corte en la distribucin comparativa, a p artir del cual debera
rechazarse la hiptesis nula. Los investigadores utilizan e nivel de significacin usual de 0,05 y
una prueba de dos colas (ya que la hiptesis no es direccional). Buscando estos datos en la tabla ,
en la lnea correspondiente a 12 grados de libertad, descubrimos que necesitamos un punto f de al
menos 2,179.
4. D eterm inar el valor m uestral en la distribucin comparativa. La diferencia de me
dias dividida por el desvo estndar de la distribucin de diferencias entre medias es una pun
tuacin t de 2,73.
5. Comparar los valores de los pasos 3 y 4 para decidir si se rechaza o no ia hiptesis nula,
La puntuacin de 2,73 es ms extrema que el 2,179 necesario. Por lo tanto, los investigadores re
chazaran la hiptesis nula y concluiran que se sostiene la hiptesis de investigacin: el nuevo
programa de capacitacin laboral es efectivo.
La tabla 10-4 resume los pasos a seguir para realizar una prueba t para medias independientes. En
el apndice del captulo se encuentran las frmulas de clculo, las cuales sern de gran utilidad si
alguna vez es necesario calcular manualmente una prueba de medias-independientes (sin una
computadora) para un estudio real con una gran cantidad de participantes. Sin embargo, para un
mejor aprendizaje, recomendamos insistentemente que los ejercicios se resuelvan utilizando las
frmulas de definicin y los procedimientos que se indican en la tabla 10-4.
Tabla 10-3,
Clcalos de una prueba f para medias independientes correspondientes a un experimento de
evaluacin de la efectividad de un nuevo programa de capacitacin laboral (utilizando la calificacin
de los empleadores) para personas que anteriormente no haban podido mantener sus empleos.
G r u p o e x p e r im e n ta l
(r e c ib e e l p r o g r a m a e s p e c ia l)
1:
R e g istr o
D e s v o d e
la m e d ia
D e s v o
c u a d r tic o
d e la m e d ia
6
4
9
7
7
3
6
0
-2
3
1
1
-3
0
0
4
9
1
1
9
0
42
24
G r u p o d e c o n tr o l
(R e c ib e e l p r o g r a m a e s t n d a r )
R e g is tr o
6
D e s v o
d e la m e d ia
D e s v o
c u a d r tic o
d e la m e d ia
3
-2
2
0
-2
-2
1
9
4
4
0
4
4
1
21
26
l
5
3
l
i
M v = 6; S ] = 2 4 /6 = 4 ;M 2 = 3; S f = 2 6 /6 = 4 ,3 3
N ^ l - . g l , JV, - 1 ==6;AT2 = 7 ; g l 2 = N 2 - l ~ 6
S^Ibtal = 8 1 + ^ 12 = 6 + 6 = 12
(Sf) + - ' 7 T 1(4)4 i f <433) '34>4 5<4-33>= 2 m 4 2-17' 417
8hot*i
Shtmi
12
12
^ - ^ ^ , = 4 , 1 7 / 7 = 0,60
=
= 0 ,6 0 + 0 ,6 0 = 1 , 2 0
^Diferencia = ^D iferencia = ^ 2 0 M 0
5%, g l =
t = ( M l ~ M 2) /S Dferenck = (6 ,0 0 ~ 3 , 0 0 ) / U 0 = 3 ,0 0 /1 ,1 0 = 2,73
En una prueba t para medias independientes existe una segundo supuesto muy importante, que ya
hemos mencionado: se supone que las dos poblaciones tienen la misma varianza. (Aprovechamos
este supuesto cuando promediamos las estimaciones de cada una de las muestras). Sin embargo,
una vez ms sucede que en la prctica la prueba t da resultados bastante precisos aun cuando exis
ten diferencias considerablemente grandes entre las varianzas poblacionales, particularmente
cuando existe la misma cantidad ~o prcticamente la misma cantidad- de observaciones en las
dos muestras, (Cmo sabemos que la prueba t se aplica adecuadamente a pesar de incumpli
mientos moderados de las presunciones? Vase en el cuadro 10-1 la descripcin de lo que se de
nomina Mtodo de Montecarlo).
Sin embargo, la prueba t puede dar resultados bastante engaosos si a) los valores mustrales
sugieren que las poblaciones son muy diferentes de lo normal, b) las varianzas son muy diferentes
o c) coexisten ambos problemas. En esos casos, existen alternativas al procedimiento ordinario de
prueba t, algunas de las cuales trataremos en el captulo 15.
Tabla 10-4.
Pasos a seguir para la realizacin de una prueba t para medias independientes.
1. Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de las poblaciones.
2. Determinar las caractersticas de la distribucin comparativa.
a) La media ser 0.
b) Calcuiar el desvo estndar.
i) Calcular las varianzas poblacionaies estimadas sobre la base de cada muestra (es decir, calcular dos
estimaciones),
ii) Calcular una estimacin combinada de a varianza poblacionai.
S2
Combinada
__ A
(s i )+ J ! l s >)
brocal
( g t { a N l - 1 and g t 2 = N t ~ U g ^ =
gl} + gty
= ^combinada/Wi and S
= ^Combinada /N2
c)
^Difere ncia
D eterm inar la forma; ser una distribucin t con g / Toia( grados de libertad.
3) Determinar el punto de corte en la distribucin comparativa, a partir del cual debera rechazarse la hiptesis nula
a) Determinar los grados de libertad (g/TwaJ), el nivel de significacin deseado, y las colas de la prueba (una o dos).
b) B uscar el punto de corte apropiado en la tabla f. Si no aparece el g l exacto, se utiliza el g l inm ediatam ente
inferior al buscado.
4) D eterm inar el valor m uestral en la distribucin comparativa: t = ( M l - M ,)/S p ift(f neia
5) Comparar io s valores de los pasos 3 y 4 para decidir si se rechaza o no la hip tesis nula.
(10-8)
cr
Las reglas de Cohn (1988) de la prueba t para medias independientes son las mismas que en to
das las situaciones que hemos tratado hasta ahora: 0,20 para un tamao del efecto pequeo, 0,50
para un tamao del efecto mediano y 0,80 para una gran tamao del efecto.
Analicemos un ejemplo de clculo de este tipo de tamao del efecto. Supongamos que un
psiclogo especializado en temas ambientales est trabajando en una ciudad con altos niveles
de contaminacin en el aire. El psiclogo planifica un estudio acerca de la cantidad de ejerci
cios resueltos en una prueba de creatividad durante un periodo de una hora. El estudio compara
el desempeo en dos condiciones: en la condicin experimental, cada participante realiza la
prueba en una habitacin con un puricador de aire especial; en la situacin de control, cada par
ticipante realiza la prueba en una habitacin sin el puricador de are, El investigador espera
que el grupo de control obtenga probablemente valores similares a otros que han realizado esta
prueba en el pasado, es decir, con una media de 21, pero que el grupo experimental se desempe
e mejor y que tenga una media aproximadamente de 29. Se sabe por investigaciones anterio
res que la prueba en cuestin tiene un desvo estndar de aproximadamente 10. Por lo tanto.
p,j = 29, p-2 = 21, y o-= 10. Dadas estas cifras, d = ( jjlj ~ jx2)/or = (29 - 21)/10 = 0,80, es decir, una
gran tamao del efecto.
Cuando se utiliza informacin de un estudio ya realizado, el tamao del efecto se estima co
mo la diferencia entre las medias mustrales dividida por la estimacin combinada del desvo es
tndar poblaconal (la raz cuadrada de la estimacin combinada de la varianza poblacional). Se
expresa bajo la frmula,
, .M i-M i
Combinada
(10-9)
Analicemos el estudio de Valenzuela (1997) acerca de la calidad de la asistencia brindada por las
madres a sus hijos. La media muestral de madres de nios adecuadamente alimentados era 33,1;
la media muestral de madres de nios crnicamente desnutridos era 27,0. Calculamos que la esti
macin combinada de la varianza poblacional era 168,77; el desvo estndar era, por lo tanto,
12,99. La diferencia de medias era 6,1 y, al dividirla por 12,99, obtenamos un tamao del efecto
igual a 0,47, es decir, un tamao del efecto mediano. La frmula es la siguiente,
_ 33,1-27,0 . 6,1 _ Q1?
Combinada
12,99
12,99
Potencia
La tabla 10-5 indica la potencia aproximada correspondiente a un nivel de significacin de 0,05,
para tamaos del efecto pequeos, medianos y grandes, y para pruebas de una y dos colas. Anali
cemos nuevamente el ejemplo acerca de la psicologa ambiental, en el que los investigadores e s -.
peraban un gran tamao del efecto (d = 0,80). Supongamos que el investigador planifica realizar
un estudio utilizando un nivel de 0,05, con una prueba de una cola y 10 participantes. Utilizando
la tabla, el estudio tendra una potencia de 0,53, lo que implica que, aun si la hiptesis de investi
gacin es realmente verdadera y tiene un gran tamao del efecto, existe slo un 53% de posibili
dades de que el estudio resulte significativo.
Analicemos otro tipo de ejemplo. Supongamos que hemos ledo un estudio que utiliza una
prueba t para medias independientes, el cual tuvo un resultado no significativo utilizando un nivel
de significacin de 0,05 en una prueba de dos colas con 50 participantes en cada grupo. Debera
mos concluir que, en realidad, no existe ninguna diferencia entre las poblaciones? La conclusin
parece bastante injustificada, ya que la tabla 10-5 indica que el estudio tendra una potencia de s
lo 0,17 para un tamao del efecto pequeo. Lo anterior sugiere que si ese pequeo efecto de he
cho s existe en las poblaciones, el estudio no lo reflejara. Por otro lado, tambin podemos con
cluir que si existe una verdadera diferencia entre las poblaciones, probablemente no es una gran
diferencia, ya que la tabla 10-5 indica una potencia de 0,98 para un gran tamao del efecto, lo que
implica que si existiera un gran efecto, casi con seguridad sera reflejado por el estudio.
,,
'.Cuadro'! 0-1.
Los mtodos de Mostrearlo, >bien, cuando la matemtica
s convierte slo en un experimento y la estadstica
_ depende de un ju g o Je.azar.
las computadoras tienen lmites, los estu 1de nmeros aleatorios. Podemos'encontrar
una explicacin acerca de estos nmeros
dios Montecarlo son probados slo en una V
serie representativa de esas variaciones. Otro |
ms adelante en el cuadro 154.
Volvamos ahora a lo que nos interesa,
inconveniente ms especfico es que exis- i
es decir, la utilizacin de ios estudios Monten buenas razones para pensar que algunas |
tecario para probar cul ser el resultado de
de las variaciones que no se analizan son
los incumplimientos de ciertos supuestos
mucho ms semejantes a la vida real que ;
en las pruebas estadsticas. Por ejemplo, la
aquellas que se han estudiado (vase en el
computadora puede crear dos poblaciones
captulo 5 la controversia acerca d cun
con medias idnticas, mientras que los otros
comn es realmente la curva normal). Fi
parmetros son establecidos por el investi
nalmente, cuando intentamos decidir la uti
gador estadstico de maneta que violen al
lizacin de un clculo o prueba estadstica .
gn supuesto importante. Las pobla- ciones
en particular, en cualquier situacin: espec
podran ser asimtricas hacia cierto lado, o
fica, n tenemos idea de la poblacin de la .
bien, las dos poblaciones podran tener vacual proviene la muestra: E una pobla- :
rianzas diferentes.
cin semejante a alguna de aquellas sobre \ :
Despus se toman muestras aleatorias
las cuales se ha realizado un estudio Monde cada una de estas dos extraas poblacio
tecaro o no? Saber simplemente que los es
nes (recordemos, fueron inventadas por
tudios Montecarlo han demostrado que aluna computadora), se comparan las medias
gunos clculos y pruebas; estadsticas son
mustrales utilizando el procedimiento usual
robustos a pesar de incumplimientos a dis
de prueba t, con las usuales tablas i, con to
tintos tipos de supuestos, no prueba que lo :
dos los supuestos. Se selecciona una gran
sean en cualquier situacin determinada. S-: .
cantidad de tales pares de muestras, gene
lo nos da cierta esperanza en cuanto a que
ralmente alrededor de 1.000, y se calcula : ekistn ms posibilidades de que utilizar
una prueba t para cada par. La cuestin es:
: :ese clculo o. prueba estadstica sea seguro
Cuntas de esas 1.000 pruebas f sern sig-.
y justificable.
nificativas al nivel de significacin del 5%?
En todo caso, los estudios Montecarlo
Lo ideal sera que el resultado sea aproxi; son un ejemplo' perfecto del modo en que
madamente d15%, 50 de las 1.000. Pero
las computadoras han cambiado la ciencia.
qu sucedera si el 10% (100) de esas
Shzeidr (1966) lo expres de la siguiente .
pruebas, supuestamente a nivel 5%, resul
manera:
tara significativo? Qu sucedera si fuera
L as com pu tadoras han produ cid o u n a ' v
slo el 1%? Si se dieran este tipo de resul
;
' rev o lu ci n n ica en, la ;m a te m tic a .1 ;
tados, entonces ese incumplimiento en par
M ientras q u e anteriorm ente una in ves- ; :
ticular de. presunciones en la prueba t no
: tig a c i n d e un p r o c eso aleatorio se
podra ser tolerado. Pero de hecho, la ma
c o n sid e ra b a : c o m p le ta tan pronto c o
yora de los incumplimientos (excepto los
m o fu era red ucida a una d e scr ip c i n
muy extremos), controlados con el mtodo. ;
: ' analtica, actu alm en te, en. m u ch os c a
descripto, no crean grandes cambios enlos
s o s e s c o n v e n ie n te rsoiver u n proble- ::
vlores p .
m a a n a ltico red u cin d o lo ai p roceso
Los mtodos Montecarlo son todo un
aleatorio corresp on d ien te y lu e g o si.
suceso para la estadstica, pero como todo,
m u lan d o e s e p ro ceso (p. v ii).
.
tambin tienen sus desventajas, y por lo tanto
En otras palabras, en lugar de que la mate
sus crticos. Uno de los inconvenientes es
mtica nos ayude a analizar experimentos, :que el modo en que las poblaciones pueden
son los experimentos los que pos estn ayu
violar las presunciones es casi ilimitado en
dando a analizar la matemtica. .
cuanto a sus variaciones, y dado que incluso
Tabla 10-5.
Potencia aproximada de estudios en los que se utiliza la prueba t para medias independientes, pro
bando la hiptesis a un nivel de significacin de 0,05.
Cantidad de participantes en cada grupo
M ediano
(0,50)
Grande
(0,80)
0,11
0,15
0,19
0,22
0,26
0,41
0,29
0,46
0,61
0,72
0,80
0,97
0,53
0,80
0,92
0,97
0,99
*
0,07
0,09
0,12
0,14
0,17
0,29
0,18
0,33
0,47
0,60
0,70
0,94
0 ,3 9
0,69
0,86
0,94
0,98
*
Casi 1.
Nota: basado en Cohen (1988), pp. 28 -3 9 .
(10-10)
N1+ N2
0(6X34)
6 + 34
408
40
Por lo tanto, aunque tenemos un total de 40 participantes, el estudio tiene la potencia de un estu
dio con muestras ijguales, de un tamao de slo 10 personas en cada grupo. (Es decir, un estudio
con un total de 20 participantes habra tenido exactamente la misma potencia). Supongamos que
el investigador est utilizando el nivel 0,05, una prueba de dos colas, y espera un gran tamao del
Tabla 10-6.
Cantidad aproximada de participantes necesarios en cada grupo (suponiendo que las muestras son
de igual tamao) para obtener una potencia dei 80% en una prueba t para medias independientes,
probando la hiptesis a un nivel de significacin de 0,05.
Tamao del efecto
U na coa
D o s colas
Pequeo
(o a o )
M e d ia n o
(0,50)
G ran de
(0,80)
310
393
50
64
20
26
efecto. La tabla 10-5 indica que el estudio tendra una potencia de aproximadamente 0,39 (el n
mero correspondiente a 10 participantes en cada grupo). Sin embargo, supongamos que el inves
tigador hubiera podido organizar el estudio dividiendo los 40 participantes en dos grupos de 20,
En ese caso, el estudio habra tenido una potencia de 0,69.
CONTROVERSIAS Y LIMITACIONES
Una vieja controversia se refiere a lo que usualmente llamamos el problema del exceso de prue
bas f \ Las cuestiones bsicas se presentan en todo tipo de prueba de hiptesis, no slo en la
prueba f. Sin embargo, analizamos el problema ahora porque tradicionalmente se ha tratado en
este contexto.
Supongamos que se realizan una gran cantidad de pruebas t como parte del mismo estudio.
Por ejemplo, podemos estar comparando dos grupos con cada una de. 17 medidas diferentes, co
mo pueden ser diferentes indicadores de memoria en una tarea en la que se emplea la capacidad
de recordar varias sub-escalas de pruebas de inteligencia o diferentes aspectos de interacciones
observados entre nios. Cuando se han realizado varias pruebas t en el mismo estudio, la posibili
dad de que cualquiera de ellas resulte significativa a un nivel, digamos, del 5%, es realmente ma
yor al 5%. S se realizan 100 comparaciones independientes, a un nivel del 5%, en promedio 5 de
2 Cohn (1988, pp. 54-55) proporciona otras tablas que indican las cantidades necesarias de participantes para otros ni
veles de potencia adems dei 80%, para tamaos del efecto distintos de 0 ,2 0 ,0 ,5 0 y 0,80, y para otros niveles de signi
ficacin. Si es suficiente saber cul es la cantidad aproximada, Dunlap y Myers (1997) han desairoitado una forma ms
corta de encontrar la cantidad aproximada de participantes necesarios para estudios que utilizan a prueba t para medias
independientes. Para un 50% de potencia, la cantidad de participantes necesarios por grupo es aproximadamente
8/d2 + I. Para un 80%-90% de potencia, 16/d2 + 2.
ellas sern significativas slo por azar. Es decir, aproximadamente 5 sern significativas aun si no
existiera ninguna diferencia real entre las poblaciones que las pruebas t estn comparando.
La cuestin fundamental no es controvertida. Todo el mundo est de acuerdo con que existen
inconvenientes en un estudio que incluye una gran cantidad de comparaciones. Todo el mundo es
t de acuerdo que en un estudio de ese tipo, si slo unos pocos resultados son significativos, las
diferencias reflejadas deberan ser revisadas muy cuidadosamente. La :ontroversa surge en
cuanto a cun cuidadoso se debe ser y en cuanto a qu cantidad implica slo unos pocos. Una
de las razones que da lugar a la controversia es que, en la mayora de los casos, las muchas com
paraciones que se realizan no son independientes, y la posibilidad de que una resulte significativa
est relacionada con la posibilidad de que otra resulte significativa.
Veamos el siguiente ejemplo. Un estudio compara una muestra de abogados con una muestra
de doctores con respecto a 100 rasgos de personalidad. Supongamos ahora que el investigador
simplemente realiza 100 pruebas t. Si las 100 pruebas t fueran realmente independientes, espera
ramos que, en promedio, 5 resultaran significativas slo por azar. De hecho, existen tablas para
calcular con bastante precisin las chances de que cualquier cantidad determinada de pruebas t
resulte significativa. De todos modos, el problema es que, en la prctica, estas 100 pruebas no
son independientes. Muchos de los distintos rasgos de personalidad probablemente estn correla
cionados, como es el caso de las escalas que miden el dogmatismo y la confianza en s mismos. Si
los doctores y los abogados difieren en cuanto a dogmatismo, probablemente tambin tendrn di
ferencias en cuanto a confianza en s mismos. Por lo tanto, ciertas seres de comparaciones pue
den tener ms o menos probabilidades de resultar significativas por azar, de tal forma que 5 en
100 puede no ser un indicador preciso de cuntos resultados significativos esperar por azar.
Existe adems otra complicacin: en la mayora de los casos, las diferencias en algunas de las
variables son ms importantes que en otras. Algunas comparaciones pueden probar directamente
una teora o la efectividad de algn procedimiento prctico, y otras pueden ser ms explorato
rias. Esta complicacin, junto con el problema de la falta de independencia, ha llevado a una va
riedad de soluciones conflictivas. En el captulo 12 presentaremos algunas de esas soluciones
cuando analicemos una situacin relacionada con este tema, situacin que surge en estudios que
comparan ms de dos grupos.
Tabla 10-7.
Comparacin de grupos adecuadamente alimentados y crnicamente desnutridos segn medidas
demogrficas y de relacin entre madre e hijo.*
Grupo
adecuadamente
alimentado
M edida
Materna y familiar
(n =43)
M
SD
45,30
Ingresos totales
5,7
Tamao familiar
Cantidad de hermanos
2,6
31,4
Edad del padre
7,2
Educacin del padre
Edad de la madre
28,6
7,0
Educacin de la madre
59,2
Peso de la madre (kg.)
153,6
Estatura de la madre (cm.)
Sensibilidad materna
5,63
Cuestionario sobre salud
10,8
(registro total)
Escala de adaptacin marital
84,7
(registro total)
Nio
18,5
Edad (meses)
103,72
Peso
98,3
Estatura
Funcionamiento madre-hijo
Sensibilidad materna
7,7
3,4
Control materno
2,8
Insensibilidad materna
7,9
Cooperacin del nio
1,2
Sumisin compulsiva del nio
Dificultad del nio
2,5
2,2
Pasividad del nio
Resolucin de problemas
37,9
Apoyo materno
Calidad de asistencia materna
33,1
Competencia social del nio
19,9
Demostracin de poder del nio 15,6
7,4
Sentimientos negativos del nio
Grupo
crnicamente
desnutrido
( = 42)
SD
valor /
9,0
2,2
0,8
5,6
2,8
4,7
2,6
10,0
5,6
2,4
44,7
5,2
2,8
29,6
6,8
27,6
6,1
53,3
150,5
2,1
10,0
1,4
0,8
6,9
2,9
5,7
2,9
10,0
6,4
1,5
0,30
1,18
0,85
1,29
0,64
0,84
1,39
2,5
2,31
8,14
0,77
0,24
0,39
0,20
0,52
0,40
0,17
0,01
0,02
0,0001
3,9
10,7
5,3
0,08
0,93
26,6
73,8
32,9
1,59
0,11
1,4
7,3
2,8
18,4
81,6
92,9
1,5
3,9
3,3
0,33
17,40
7,93
3,8
4,1
2,9
4,5
3,2
2,8
2,7
7,3
4,2
2,4
6,8
2,1
3,5
2,4
3,6
3,7
3,1
4,1
3,8
3,4
2,6
0,58
0,98
0,67
0,12
0,12
0,39
0,36
0,59
0,36
0,53
0,24
0,26
0,71
0,72
10,6
14,2
4,1
5,3
4,2
30,54
27,0
15,7
12,5
9,4
7,9
11,6
3,8
4,5
4,8
3,62
2,16
4,78
2,85
2,00
0,001
0,03
0,0001
0,006
0,050
0,74
0,0001
0,0001
*Las medidas de peso y estatura de los nios estn indicadas en forma de porcentajes del peso y medidas segn la edad,
conforme a las normas del Centro Nacional de Estadsticas Sanitarias.
Fuente: Valenzuela, M. (1997), tab. 1. Sensibilidad materna en una sociedad en desarrollo: el contexto de la pobreza
urbana y la desnutricin infantil crnica". Psicologa de Desarrollo (Developmental PsychologyJr 33, 845-5)55.
Copyright, 1997, por la Asociacin Americana de Psicologa [American Psychological Association], Reimpreso con
autorizacin.
La tabla 10-8 es otro ejemplo, tomado de un estudio realizado por Frisch, Shamsuddn y Kurtz
(1995), en el que 293 mujeres estudiantes de medicina en Malasia fueron entrevistadas acerca de
sus opiniones en cuanto a fumar, y en cuanto a si fumaban o no los miembros de sus familias y sus
amigos. La tabla compara aquellas estudiantes que tienen hermanos fumadores con aqullas cu
yos hermanos no fuman. (La publicacin no explica cmo se resolva el problema de que la per-
sona tuviera dos hermanos, uno fumador y otro no fumador), Las medidas fueron: conocimiento
(de los riesgos para la salud ocasionados por estar rodeado de fumadores), actitud (hacia estar ro
deado de fumadores), esfuerzos (para evitar estar rodeado de fumadores) y responsabilidad como
mdico (de informar a los pacientes sobre los riesgos para la salud ocasionados por estar rodeado
de fumadores). En todas las escalas, el puntaje estaba establecido de tal forma que el ms alto es
tuviera a favor de fumar. Los valores ms bajos significaban mayor preocupacin acerca de los
riesgos para la salud.
La primera lnea de la tabla indica que aquellas que tenan un hemano fumador presentaban
valores ms altos en la escala de conocimiento, lo que significa que esas estudiantes tenan menos
conocimiento acerca de los riesgos de estar con fumadores. La segunda lnea indica que aquellas
que tenan un hermano fumador tenan una actitud ms positiva hacia estar con fumadores (es de
cir, no consideraban que era una causa de riesgo para la salud).
Es importante notar que algunos de estos resultados no fueron significativos. Cul debera
ser la conclusin? Analicemos lo que piensan las estudiantes acerca de la responsabilidad como
mdico. En esta comparacin, haba 41 estudiantes con hermanos fumadores y 73 con hermanos
no fumadores. Aplicando la frmula de la meda armnica observamos que, en lo que respecta al
clculo de la potencia, hay 52,5 participantes por grupo. Es decir,
M ed ia a rm n ica =
(2)(jV iX M >) _ (2 X 4 1 X 7 3 ) _ 5 .9 8 6
41+73
N{ + N2
52,5
114
Una vez que sabemos qu tamao de muestra utilizar, podemos buscar la potencia en la tabla 10-5
buscando la hilera de 50 participantes (el nmero ms cercano a 52,5 en la tabla) para una prueba
Tabla 10-8.
Prueba t para medias, acerca del conocim iento, las actitudes y el esfuerzo relacionados con el hecho
de ser fum ador pasivo, segn la condicin de fum ador y con respecto al grupo total y a hombres y
mujeres separadam ente.
Herm ano
fum ador
G rupo total
H erm ano
no fum ador
Valor t
Sig.
N*
Actitud
Esfuerzos
Resp. M dico*
2,03 (96)
1,95 (94)
2,36 (92)
1,78(95)
1,88(140)
1,70(137)
2,23(133)
1,61 (142)
2,61
3,29
1,88
2,02
0,01
0,001
0,061
0,04
H om bres
Conocimiento
Actitud
Esfuerzos
Resp. Mdico*
2,15(54)
2,08(54)
2,50(52)
1,81 (54)
1,92(69)
1,83 (67)
2 3 1 (66)
1,65 (69)
2,97
2,12
1,87
1,27
0,004
0,036
0,064
0,207
M ujeres
Conocimiento
Actitud
Esfuerzos
Resp. Mdico*
1,87 (42)
1,77 (40)
2,17(40)
1,76(41)
1,85(71)
1,57(70)
2,15(67)
1,58(73)
0,30
2,43
0,26
1,51
0,767
0,0 i 8
0,797
0,136
Conocimiento
'
Responsabilidad com o mdicos
Fuente: Frisch, Shamsuddn Se Kurtz (1995),
de dos colas. Descubrimos que la potencia del estudio, para resultar significativa con un pequeo
tamao del efecto, es slo de 0,17. Por otro lado, la potencia del estudio en el caso de un tamao
del efecto mediano es 0,70, y en el de un tamao del efecto grande es 0,98. As, si en realidad te
ner un hermano fumador produce un pequeo efecto, dicho efecto probablemente no habra sido
reflejado por el estudio. Por otro lado, supongamos que en realidad haba un efecto mediano de
ese tipo; en ese caso, el resultado del estudio probablemente habra sido significativo; y si el efec
to fuera grande, casi con seguridad el estudio habra resultado significativo. Por l tanto, con bas
tante confianza podemos inferir de este estudio que el hecho de tener un hermano fumador proba
blemente no produce una gran diferencia en las opiniones de las mujeres estudiantes de medicina
de Malasia, en cuanto a la responsabilidad del mdico de informar a sus pacientes acerca de los
riesgos de estar con fumadores. Pero no podemos concluir que no podra haber un pequeo efec
to en ese sentido.
RESUMEN
Una prueba t para medias independientes se utiliza para realizar pruebas de hiptesis con dos
muestras de observaciones. La diferencia principal con una prueba para una sola muestra, o una
prueba t para medias dependientes, es que la distribucin comparativa es una distribucin de dife
rencias entre medas mustrales. Esta distribucin puede considerarse construida en dos pasos:
cada poblacin de individuos produce una distribucin de medias y luego se crea una nueva dis
tribucin de diferencias entre pares de medias tomadas de esas dos distribuciones de medias.
La distribucin de diferencias de medias tiene una media de 0, y es una distribucin t con el
total de los grados de libertad de las dos muestras. El desvo estndar se calcula en varios pasos:
a) se utiliza cada muestra para estimar la varianza poblacional; b) se supone que ambas poblacio
nes tienen la misma varianza, y se realiza una estimacin combinada sacando un promedio pon
derado de las dos estimaciones (multiplicando cada estimacin por la proporcin con que contri
buye su muestra a los grados totales de libertad y sumando los resultados); c) se divide la
estimacin combinada por la cantidad de observaciones de cada muestra para obtener la varianza
de la distribucin de medias de cada poblacin; d) se suman esas dos varianzas para obtener la va
rianza de la distribucin de diferencias de medias, y e) se calcula la raz cuadrada.
Los supuestos en la prueba t para medias independientes son las siguientes: las dos poblacio
nes estn normalmente distribuidas y tienen la misma varianza. Sin embargo, .la prueba t otorga
resultados bastante precisos aun cuando la situacin real sea moderadamente diferente de lo que
indican los supuestos.
El tamao del efecto de una prueba t para medias independientes es la diferencia entre las
medias dividida por el desvo estndar. La potencia es mayor cuando los tamaos de las muestras
de los dos grupos son iguales. Cuando no lo son, se utiliza la media armnica de los dos tamaos
mustrales para buscar la potencia en las tablas.
Cuando se realizan demasiadas pruebas de significacin en el mismo estudio, como en el ca
so de una serie de pruebas t que comparan dos grupos con respecto a varias medidas, la posibili
dad de que cualquiera de las comparaciones resulte significativa por azar al nivel del 0,05 es ma
yor a 0,05. La forma de adaptacin de los clculos para resolver este problema es controvertida,
aunque la mayora est de acuerdo con que en una situacin de ese tipo los resultados deberan ser
interpretados con mucho cuidado.
Cuando las publicaciones cientficas informan acerca de pruebas t para medias independien
tes, el investigador usualmente incluye los grados de libertad, el punto t y el nivel de significa
cin. Tambin pueden informarse los resultados de estas pruebas a travs de una tabla.
Trminos clave
- Distribucin d diferencias
- Desvo estndar de la
de medias.
distribucin de diferencias
- Media armnica.
demedias (Difercncia).
~ Estimacin combinada de la varianza - Prueba t para medias
poblaconai 0$^ombinala).
independientes.
Ejercicios
Los ejercicios implican la realizacin de clcu
los (con la ayuda de una calculadora). La ma
yora de los problemas estadsticos reales se
resuelven por computadora, pero aunque exis
ta la posibilidad de utilizarla, es conveniente
realizar estos ejercicios manualmente para in
corporar el mtodo de trabajo.
Para adquirir prctica en.la utilizacin de
una computadora, para resolver problemas
estadsticos, se puede utilizar la seccin de
computacin de cada captulo, publicada en
la Gua de estudio y libro de tareas de compu
tacin para el alumno [Studems Study Guide
and Computer Workbook] que acompaa es
te libro.
Todos los datos de esta seccin son ficti
cios (a menos que se especifique lo contrario)
Las respuestas a los ejercicios de a serie I
se encuentran al final del libro.
-Varianza de la
distribucin de
diferencias entre
medias (5^iferencii).
- Promedio ponderado.
Grupo experimental
i)
ii) iii)
30
20
30
12,0
12,0
12,0
S2
2,4
2,4
2,2
Grupo de control
30
40
30
11,1
113
1U
S2
2,8
2,8
3,0
Cuento normal
Alumno
Tiempo
de lectura
Alumno
A
B
C
D
2
5
7
9
6
7
H
I
Tiempo
de lectura
4
16
11
9
8
Esperado
Estudio
a
b
c
d
107
22.5
14
480
cr
84
31,5
2,5
50
149
16,2
12
520
Colas
1
2
1
2
SERIE H
i)
ii)
iii)
10
40
10
604
604
604
S2 N
60
60
20
10
40
40
M
607
607
607
S2
50
50
16
3.
Un psiclogo desarrolla la teora de que
las personas pueden escuchar mejor despus de
comer una comida abundante. Se dividieron al
Tabla 10-9.
Diferencias de razones bsicas para parejas clnicas y no clnicas acerca del control en la relacin y
el sentim iento no verbal expresado en proporciones ( S D en parntesis).
Situacin de pareja
Media clnica
Diferencias
ntergrupales
Media no-clnica
Dominacin (? )
Nivelacin (>)
Sumisin ( i )
Cdigos dobles
0,452 (107)
0,305(0,061)
0,183 (0,097)
0,050(0,028)
0,307 (0,152)
0,438 (0,065)
0,226(0,111)
0,024(0,017)
3,06*
5,77**
1,12
2,92*
0,127 (0,090)
0,509(0,192)
0,344 (0,110*)
0,019(0,028)
0,280(0,173)
0,127 (0,133)
0,582(0,089)
0,008 (0,017)
3,22*
5,38**
6,44**
2,96*
Nota: las proporciones de cada cdigo de control y de cada sentimiento fueron convertidas utilizando la transformacin
arco-seno para utilizaras en comparaciones ntergrupales *p <0,01; **p <0,001; (gl = 28).
Fuente: Escudero, V., Rogers, L. R &Gutirrez, E, (1997), tab. 3. Patrones de control en la relacin y de sentimiento
no verbal en parejas clnicas y no clnicas". Revista Cientfica de Relaciones Sociales y Personales {Journal of Social
andPersonal Relationships}, 14,5-29. Copyright 1997 por Sage Publications, nc. Reimpreso con autorizacin de
Sage Publications.
grupos de cada comparacin tenan aproxima 16 nombres masculinos. (Tendr que excluir
damente el mismo tamao muestra!).
aquellos nombres cuyo gnero no est seguro).
7.
Quines tienen primeros nombres msCalcule una prueba t para medias independien
largos, los hombres o las mujeres? Tome un tes utilizando esas dos muestras. (Asegrese de
directorio telefnico y utilice los nmeros alea destacar a qu ciudad pertenece el directorio te
torios que le proporcionamos a continuacin lefnico que utiliz).
para seleccionar una pgina. En la primera p
1 2 ,7 9 , 1 0 , 9 7 , 5 3 , 7 4 , 1 5 , 5 5 ,4 1 , 1 2 8 ,5 7 , 9 3 ,
gina (pgina 12), busque el primer nombre clara
9 4 ,3 1 ,6 8 ,5 1 6 ,6 0 ,5 6 ,7 ,9 3 ,4 3 ,9 1 ,5 7 ,5 8 ,3 8 ,
mente femenino y anote la cantidad de letras de
120, 14, 38, 57, 743, 98, 471, 38, 66, 20, 32,
ese nombre. Haga lo mismo 16 veces (busque la
6 0 , 4 3 ,7 8 ,2 9 , 3 9 , 1 7 ,3 1 , 1 2 , 6 1 ,1 0 0 , 80, 35,
pgina correspondiente al nmero indicado,
3 1 ,9 9 ,2 2
etc.). Despus busque la cantidad de letras de
Los primeros dos pasos (calcular M y S2 para cada muestra) pueden calcularse utilizando las
frmulas de clculo de los captulos 2 y 9; estos clculos estadsticos por lo general estn disponi
bles directamente en las calculadoras. Existe, sin embargo, una frmula especial de clculo que
combina los pasos c) a e) para obtener el desvo estndar de la distribucin de diferencias entre
m edias (^Diferenciad'
( 10-11)
Ml = 33,1; S \ =201,64
83
---------- (0,047)
83
= V(168,50X0,047) =
fH = 2,81
necesario para nivel 5%, gl =83 (utilizando gl ~ 80 de la tabla), y prueba de dos colas = 1,990
r - ( M t - M 2)/S d m , = (33, i - 27.OV2.81 =
6,1/2,81
2,17.
Introduccin
al anlisis
de la varianza
indy Hazan y Philip Shaver (1987) realizaron los arreglos necesarios para que el
Rocky Mountain News, un importante peridico de la zona de Denver, imprimiera
una encuesta que se distribuira con el diario. La encuesta inclua la pregunta que
aparece en la tabla 11-1, cuya finalidad es realizar una medicin de estilos de
vinculacin. Aquellos que eligieron la primera opcin son individuos seguros;
los que eligieron la segunda, evasivos, y los que eligieron la tercera, ansiosos-ambivalentes. Lo
estilos de vinculacin mencionados se consideran formas diferentes de actuar y pensar en lo que
respecta a las relaciones personales estrechas, formas que se desarrollan a partir de la experiencia
de cada persona con quienes se hicieron cargo de cuidarlos desde temprana edad (p. ej. Mckelson
et al., 1997). Los lectores tambin respondieron preguntas acerca de una cantidad de aspectos.relacionados con el amor, entre los que se inclua el nivel de celos que experimentaran. Posterior
mente, Hazan y Shaver compararon el nivel de celos registrado para personas con diferentes
estilos de vinculacin.
Con una prueba t, Hazan y Shaver podran haber comparado las medias de los valores del ni
vel de celos entre dos de los estilos de vinculacin. Pero, en realidad, estaban interesados en las
diferencias entre los tres, estilos de vinculacin. El procedimiento estadstico para probar diferen
cias entre medias de varios grupos se denomina a n o v a (Analysis o f Varianee, Anlisis de varanza), (El anlisis de varianza se podra utilizar para un estudio con slo dos grupos, pero la prueba
t, que en ese caso da los mismos resultados, es ms simple).
En este captulo, presentamos el anlisis de varianza concentrndonos en la situacin en la
que los diferentes grupos comparados tienen la misma cantidad de valores observados. La situa
cin ms complicada, en la que la cantidad de personas en cada grupo no es la misma, ser trata
da en el captulo 12. En el captulo 13, completamos el estudio del anlisis de varianza analizando
situaciones en las que los distintos grupos se organizan a partir de ms de una dimensin. Por
ejemplo, en el mismo anlisis podramos tener en cuenta tanto el sexo como el estilo de vincula
cin, con lo cual se crearan seis grupos en total (femenino seguro, masculino seguro, femenino
Tabla 11-1.
Pregunta utilizada en la encuesta realizada por Hazan y Shaver (1987) a travs de un peridico.
Cul de las siguientes posibilidades describe mejor sus sentimientos? [Marque una],
(] Me resulta relativamente fcil acercarme a los dems y me siento cmodo si confo en ellos y s que con
fan en ra. En lneas generales no me preocupo por la posibilidad de ser abandonado o de que alguien se
acerque demasiado a m.
[ ] Estar cerca de otros me hace sentir un poco incmodo; me resulta difcil confiar completamente en los
dems y permitirme depender de ellos. Me pone nervioso que alguien se acerque demasiado a m, y mis
parejas a menudo me piden una relacin ms ntima de la que puedo mantener sintindome cmodo.
[ j Me parece que los dems no quieren acercarse a m tanto como yo quisiera. Con frecuencia me preocupo
porque pienso que mi pareja realmente no me ama o no va a querer permanecer a mi lado. Quiero unirme
completamente con otra persona, y este deseo a veces las ahuyenta.
Fuente: Hazan & Shaver (1987), p. 515.
ansioso, etc.), formados conforme a las dos dimensiones: sexo y estilo de vinculacin. El caso
que acabamos de describir se conoce como anlisis factorial de varianza. Para acentuar la dife
rencia con el anlisis factorial de varianza, lo que aprenderemos en este captulo y el siguiente se
denomina con frecuencia anlisis de varianza de un criterio. (No debemos preocupamos ahora
si el concepto de dimensiones resulta confuso. Ya lo trataremos pausada y sistemticamente en el
captulo 13; slo lo mencionamos ahora para que el alumno no se sorprenda si llegara a encon
trarse con esos trminos).
dones tienen la misma varianza, las estimaciones realizadas a partir de los valores de cada mues
tra pueden combinarse o promediarse para formar una sola y mejor estimacin. La estimacin
combinada resultante se denomina estimacin intragrupal de la varianza poblacionai. Lleva
este nombre porque es un promedio de las estimaciones calculadas completamente a partir de los
valores dentro de cada muestra.
Lo ms importante que debemos recordar acerca de esta estimacin intragrupal es que no se
ve afectada por el hecho de que la hiptesis nula sea verdadera. Es decir, la estimacin ser la
misma ya sea porque las medias poblacionales son todas iguales (como lo seran si la hiptesis
nula fuera verdadera) o porque las medias poblacionales son diferentes (como lo seran si la hip
tesis nula no fuera verdadera). La estimacin ser la misma porque slo se concentra en la varia
cin dentro de cada poblacin, y no importa cun alejadas estn las medias de las distintas
poblaciones.
mayor variacin en cada poblacin, mayor variacin entre las medias de las muestras tomadas de
esas poblaciones.
Analicemos el ejemplo de las poblaciones de estilos de vinculacin seguro, ansioso y evasivo
estudiado por Hazan y Shaver. Por supuesto que habr alguna varanza en el nivel de celos de las
diferentes personas dentro de cada una de esas poblaciones. Pero supongamos por ahora que
las tres poblaciones tienen todas la misma media en cuanto al nivel de celos (como sucedera si la
Figura 13.-1. Las medias de muestras provenientes de poblaciones idnticas no sern idnticas. Las medias
mustrales que provienen de poblaciones con menos variacin, variarn menos (a). Las medias mustrales
que provienen de poblaciones con ms variacin, variarn ms (b). Las medias pobiacionales se indican
con un tringulo; las medias mustrales con una X.
;
hiptesis nula fuera verdadera). Aun en el caso en que todas tuvieran la misma media, es probable
que la muestra de una poblacin no tenga exactamente la misma media que la muestra de una se
gunda poblacin. Del mismo modo,es probable que la muestra de una tercera poblacin sea leve
mente diferente de las de las otras dos. Y as sucesivamente. Ms an, cunto ms vare cada una
de esas poblaciones internamente, ms variarn las medias de muestras tomadas de esas pobla
ciones. Variaran incluso si, de hecho, las medias poblacionales fueran idnticas.
La figura 11-1 representa grficamente el principio que hemos estado analizando. Las tres
poblaciones idnticas de la izquierda tienen poca varanza, y las tres poblaciones idnticas de la
derecha registran una gran varanza. En cada serie de tres poblaciones idnticas, aun cuando las
medias de las tres poblaciones sean iguales, las medias de las muestras provenientes de esas po
blaciones no son iguales! Es muy importante destacar que las medias de las poblaciones con me
nos varanza son ms cercanas (tienen menos varanza entre s) y que las medias de poblaciones
con ms varanza estn ms dispersas (tienen ms varanza entre s).
Ya hemos visto que la variacin entre las medias de muestras tomadas de poblaciones idnti
cas est directamente relacionada con la variacin de los valores dentro de cada una de esas po
blaciones. Esto tiene una implicancia muy importante: sera posible estimar la varanza dentro de
cada poblacin a partir de la variacin entre las medias de las muestras. Es decir, podramos utili
zar la variacin de las medias mustrales para calcular el grado de variacin en la poblacin de
donde provienen esas muestras.
Tal estimacin se denomina estimacin m tergrupal de la varanza poblacional. (Lleva es
te nombre porque se basa en la variacin entre las medias de las muestras, es decir, de los gru
pos). Ms adelante, en ste captulo, veremos cmo se calcula realmente esta estimacin.
Hasta aqu, la lgica que hemos analizado supone que la hiptesis nula es verdadera, en cuyo
caso no existe variacin entre las medias poblacionales. Veamos ahora qu sucede cuando la hi
ptesis nula no es verdadera y s lo es la hiptesis de investigacin.
Cuando la hiptesis nula no es verdadera. Si la hiptesis nula no es verdadera y la hipte
sis de investigacin s lo es, las propias poblaciones tendrn diferentes medias. En ese caso, la va
riacin entre las medias de muestras tomadas de esas poblaciones sigue siendo el resultado de la
variacin dentro de las poblaciones. La diferencia radica en que, en este caso, en el que la hipte
sis de investigacin es verdadera, la variacin entre medias mustrales es causada adems por la
variacin entre las medias poblacionales. Es decir, en este caso las medias mustrales se disper
san por dos razones diferentes: a) por la variacin dentro de cada una de las poblaciones y b) por
la variacin entre las poblaciones. La figura 11-2a representa grficamente tres poblaciones con
las mismas medias y las medias mustrales provenientes de ellas (es decir, la misma situacin que
en la figura 11-1, a y b). La figura 11-2b representa grficamente tres poblaciones con diferentes
medias y las medias de las muestras tomadas de ellas (es decir, la situacin que acabamos de expli
car). Vale la pena observar que las medias de las muestras estn ms dispersas en la figura 1l-2b
que en la figura 11-2a, aun cuando las variaciones dentro de las poblaciones sean las mismas en
11-2b y en 11-2a. Esta dispersin adicional (varanza) que representa la figura 11-2b se debe a
que las poblaciones tienen diferentes medas.
En resumen, la estimacin intergrupal de la varanza poblacional se calcula sobre la base de
la variacin entre las medias mustrales. Si la hiptesis nula es verdadera, esa estimacin es una
indicacin precisa de la variacin dentro de las poblaciones. Pero si la hiptesis nula es falsa, este
mtodo de estimacin de la varanza'poblacional se ve influenciado tanto por la variacin dentro
de las poblaciones como por la variacin entre ellas. Por lo tanto, no proporcionar una estima
cin precisa de la variacin dentro de las poblaciones porque tambin estar afectada por la va
riacin entre las poblaciones. La diferencia que acabamos de mencionar tiene implicancias
importantes: es lo que hace del anlisis de varanza un mtodo de prueba de hiptesis basado en la
existencia o no de diferencias entre las medas de diferentes grupos.
Figura 11-2. Las medias mustrales que provienen de poblaciones cuyas medias son diferentes (b) variarn
ms que las medias mustrales que provienen de poblaciones cuyas medias son iguales (a). Las medias
poblacionales se indican con un tringulo; las medias mustrales con una X.
Tabla 11-2.
Fuentes de variacin de las estimaciones intragrupal e intergrupa! de la varianza.
V a r ia c i n
d e n t r o d e la s
p o b la c io n e s
V a r ia c i n
e n tr e la s
p o b la c io n e s
X
X
X
X
estimacin intergrupal y la estimacin intragrupal debera ser mayor que 1. Por ejemplo, la esti
macin intergrupal podra ser 638,9 y la estimacin intragrupal 107,5, dando una razn de
638,9/107,5, lo que es igual, de 5,94. Es decir, si dividimos la estimacin mayor, la intergrupal,
por la menor, la intragrupal, no obtenemos 1, sino un nmero mayor.
Lo que acabamos de describir es el principio fundamental del anlisis de varianza. Cuando la
hiptesis nula es verdadera, la razn entre la estimacin de varianza intergrupal y la estimacin de
varianza intragrupal debera ser aproximadamente 1, pero cuando la hiptesis de investigacin es
verdadera, la razn debera ser mayor a 1. Por lo tanto, si calculamos la razn y sta resulta mucho
mayor a 1, podemos rechazar la hiptesis nula. Es decir, no es verosmil que la hiptesis nula pue
da ser verdadera ya que la estimacin intergrupal es mucho mayor que la estimacin intragrupal.
La razn F
Esta razn fundamental entre las estimaciones intergrupal e intragrupal de la varianza se denomi
na razn F. (La F se debe a Sr Ronald Fisher, un destacado estadstico que desarroll el anlisis
de varianza; vase cuadro 11-1).
La distribucin F y la tabla F
Ya hemos mencionado que cuando la razn fundamental entre la estimacin intergrupal y la esti
macin intragrupal (la razn F) es mucho mayor a 1, podemos rechazar la hiptesis nula. La si
guiente pregunta es: Cunto mayor a 1 necesita ser la razn para que podamos rechazar la
hiptesis nula con confianza?
Conforme a lo que el alumno seguramente ya debe haber imaginado, los estadsticos han de
sarrollado los clculos matemticos de una distribucin F y han preparado tablas de razones F.
Para cualquier situacin determinada, simplemente buscamos en una tabla F cun extremo debe
ser una razn F para rechazar la hiptesis nula a, digamos, un nivel 0,05. (Ms adelante, en este
captulo, aprenderemos a utilizar la tabla F).
Para dar un ejemplo de la razn F, volvamos al estudio acerca del estilo de vinculacin reali
zado por Hazan y Shaver (1987). Los resultados de ese estudio, en cuanto al nivel de celos, fueron
los siguientes: la estimacin de varianza poblacional intergrupal era de 23,19. (Este nmero se
calcula sobre la base de las medias de las tres muestras de estilo de vinculacin, que eran 2,17,
2,88 y 2,57; pronto aprenderemos a realizar estos clculos). La estimacin intragrupal de varian
za poblacional era 0,53. (Este nmero se calcul combinando las estimaciones de la varianza de
cada poblacin sobre la base de los valores de cada muestra). La razn entre las estimaciones de
varianza intergrupal e intragrupai (23,19/0,53) resulta ser 43,91; es decir F = 43,91. La razn F
calculada es considerablemente mayor a 1. De hecho, la razn F necesaria para rechazar la hip
tesis nula al nivel 0,05 es slo 3,01. Kazan y Shaver rechazaron con confianza la hiptesis nula, y
concluyeron que el nivel de celos vara segn el estilo de vinculacin.
Una analoga
Para algunos estudiantes, la siguiente analoga les resulta de gran ayuda para comprender el anli
sis de varianza, La analoga se realiza con lo que los ingenieros llaman razn seal-ruido. Por
ejemplo, la capacidad de comprender las palabras en una conversacin por telfono celular con in
terferencia depende de la potencia de la seal, en contraposicin con la cantidad de ruido aleatorio.
En el caso de la razn F en e! anlisis de varianza, la diferencia entre las medias de las muestras se
equipara con la seal, es la informacin de inters, y la variacin dentro de las muestras se equipa
ra con el ruido. Cuando la variacin entre las muestras es lo suficientemente grande en compara
cin con la variacin dentro de las muestras, la conclusin es que existe un efecto significativo.
D e s v o
D e s v o d e
c u a d r tic a
la m e d ia
C a lific a c i n
10
X:
D e s v o d e
Q u a d r tic o
D e s v o
d e la m e d a
C a lif ic a c i n
la m e d ia
d e la m e d ia
C a lif ic a c i n
2
~1
4
1
l '
-3
4
6
-3
-1
3
7
_4
18
20
5
10
JS
J>
40
M = 4 0 /5 = 8.
5*= 18/4 = 4,5
2 0 /5 = 4
= 5 ,0
S2 - 2 0 /4
D e s v o d e
c u a d r tic a
la m e d ia
d e la m e d ia
-1
1.
9
3
_3
4
-2
-2
1
16
4
4
20
25
26
U ~
2 5 /5 = 5
^ = 2 6 / 4 = 6 ,5
La varianza poblacional puede estimarse a partir de cualquiera de los grupos (es decir, a partir de
cualquier muestra) utilizando el mtodo usual para estimar la varianza poblacional a partir de una
muestra. Primero, calculamos la suma de los desvos cuadrticos, es decir, tomamos el desvo de
cada registro con respecto a la media de su grupo, elevamos el desvo al cuadrado y sumamos to
dos los desvos cuadrticos. Segundo, dividimos esa suma de desvos cuadrticos por los grados
de libertad del grupo (los grados de libertad de un grupo constituyen la cantidad de valores obser
vados en el grupo menos 1). En el ejemplo, como lo indica la tabla 11-3, esto da una varianza po
blacional estimada de 4,5 sobre la base del grupo del informe delictivo, una estimacin de 5,0
sobre la base del grupo del informe en blanco, y una estimacin de 6,5 sobre la base del grupo sin
informacin.
No debemos olvidar que en el anlisis de varianza, al igual que en la prueba t, se supone
que las poblaciones tienen la misma varianza. Dado que estas estimaciones pertenecen a po
blaciones que se supone tienen la misma varianza, las estimaciones basadas en los valores de
cada muestra estn estimando todas el mismo nmero (la verdadera varianza poblacional).
Adems, dado que los tamaos de muestra en este ejemplo son iguales, cada grupo representa
una estimacin basada en la misma cantidad de informacin; por lo tanto, podemos combinar
estas estimaciones de varianza realizando un promedio ordinario. El resultado es una estima
cin general de la varianza poblacional sobre la base de la variacin dentro de los grupos, que
es igual a la suma de 4,5, 5,0 y 6,5 (o sea 16) dividida por la cantidad de grupos (o sea 3). El
resultado es 5,33.
La varianza estimada sobre la base de la variacin de los valores dentro de cada uno de los gru
pos es la estimacin ntragrupal de la varianza. Se simboliza como S2DmtI0 CMDentr(). CMDen{roes
la abreviatura de eudrado medio dentro. El trmino cuadrado medio de los cuadrados es otro
nombre de la varianza, ya que la varianza es la media de los desvos cuadrticos. (La 52Dej3ro
CMDenlt0 tambin se denomina a veces varianza del error", y se simboliza como S2Efror CMError.)
La frmula para la estimacin ntragrupal de varianza, cuando los tamaos de las muestras
son iguales, es:
(U -l)
En la frmula, S 2 es la varianza poblacional estimada sobre la base de los valores del primer gru
po (el que proviene de la poblacin 1); S \ es la varianza poblacional estimada sobre la base de los
valores del segundo grupo; S
es la varianza poblacional estimada sobre la base d los valores
del ultimo grupo, (Los puntos, o elipsis, en la frmula indican que debemos completarla con la
varianza poblacional estimada correspondiente a todos los otros grupos que hay en el anlisis).
^Gruposes la candad grupos.
Utilizando esta frmula para realizar los clculos, obtenemos:
<?2
0 Dentro ~
2 _ X(M~GM)2
M
Skntre
(U-2)
(11"3)
En el ejemplo referido a los antecedentes delictivos, las tres medias son 8,4 y 5. Los clculos apa
recen en la tabla 11-4.
De la varianza estimada de la distribucin de medias a na varianza estimada de la po
blacin de valores observados. Lo que acabamos de calcular a partir de una muestra de unas po
cas medias es la varianza estimada de una distribucin de medias. A partir de ese dato queremos
estimar la varianza de la poblacin (la distribucin de valores individuales) en la que se basa esa
distribucin de medias. En el captulo 7 vimos que la varianza de una distribucin de medias es
menor que la varianza de la poblacin en la que se basa (la distribucin de valores individuales).
Esto ocunre porque las medias tienen menos posibilidades de ser extremas que los valores indivi
duales (ya que es poco probable que varios valores extremos en la misma direccin puedan que
dar incluidos en una misma muestra). Especficamente, en el captulo 7 aprendimos que la
varianza de una distribucin de medias es la varianza de la distribucin de valores individuales di
vidida por la cantidad de valores de cada muestra.
Tabla 11-4.
Varianza de la distribucin de medias, estimada sobre la base de las medias de los tres grupos
experimentales del estudio referido a los antecedentes delictivos (datos ficticios).
Medias
mustrales
Desvos de la
gran media
Desvo cuadrtco
de ia gran media
m
4
8
5
(M-GM)
-1,67
2,33
-0,67
(M~~GMf
2,79
5,43
0,45
-0,01
8,67
X;
8,67/2 - 4,34.
Ahora, sin embargo, vamos a revertir lo que hicimos en el captulo 7, en el que calculamos la va
rianza de la distribucin de medias dividiendo la varianza de la distribucin de observaciones in
dividuales por el tamao de la muestra. Ahora vamos a calcular la varianza de la distribucin de
valores individuales multiplicando la varianza de la distribucin de medias por el tamao de la
muestra. {Vase tabla 11-5). Es decir, para obtener la varianza poblacional de observaciones indi
viduales, multiplicamos la estimacin de la varianza de la distribucin de medias por el tamao
de la muestra. El resultado de este proceso es la estimacin intergrupal de la varianza. Lo anterior
se expresa bajo la frmula (en los casos en que los tamaos de muestra son iguales),
sL
< 5 C ^ k = 0S)(")
d i-* )
C M ^ = (S X iO = (4,34)(5) =21,7
= S 2!N
= S 2 - ( S ^ ) (/V)
Figura 11-3,
U n a d istrib u ci n i l
Clculo de la razn F
La razn F es el cociente entre la estimacin intergrapal de la varianza poblaconal y la estima
cin intragrupal de la varianza poblaconal, Se representa bajo la frmula,
(11-5)
^Dentro
CM)emro
En el ejemplo que analizamos, el ratio entre intergrupal e intragrupal es el cociente entre 21,7 y
5,33. Realizando la divisin obtenemos una razn F de 4,07. Se expresa,bajo la frmula,
p ^Entre
^ CMgniJe
^Denteo
La distribucin
^^Deiitro
^ 21,7 __^
^ ,3 3
El siguiente paso es determinar .el punto de corte a partir del cual se considera que F es lo sufi
cientemente grande como para rechazar la hiptesis nula. Esto requiere una distribucin de razo
nes F que podamos utilizar para establecer qu es una razn F extrema.
En la prctica, simplemente buscamos el punto de corte necesario en una tabla. Pero para en
tender de dnde proviene el nmero de la tabla, necesitamos comprender la distribucin F. La
manera ms fcil de comprender esta distribucin es analizar cmo haramos para elaborar una.
1 Es posible, por casualidad, que F s e a mayor o menor a 1 en cualquier situacin en particular. Tanto la intergrupal co
mo la ntragrupai son slo estimaciones, y ambas pueden variar un poco aun cuando la hiptesis nula sea verdadera. Si
F es considerablemente mayor a 1, rechazamos la hiptesis nula que establece que en realidad todas las poblaciones
tienen la misma media, Pero qu sucede si F es considerablemente menor, a 1? Esto rara vez sucede. Cuando ocurre,
podra indicar que existe menos variacin entre los grupos de la que se esperara por casualidad; por lo tanto, algo est
restringiendo la variacin entre los grupos. Una causa podra ser que, al organizar el experimento, se equiparen los su
jetos entre los grupos en cuanto a determinadas variables (tales com o edad o inteligencia) que resulten estar relaciona
das con la variable bajo estudio. Una implicancia de esta posibilidad es que equiparar grupos de este modo, antes de
realizar el estudio, podra realmente evitar un resultado significativo. Aun si existen diferencias reales entre las medias
de la poblacin, la influencia de estas diferencias en la estimacin intergrupal puede ser compensada por el efecto de la
equiparacin. Este tema es tratado ms adelante en el captulo.
Los grados de libertad entre son la cantidad de grupos menos 1 (porque ese es el grado de liber
tad utilizado para calcular la estimacin intergrupal de la varianza). Se expresan bajo la frmula,
k = * W .~ 1
("->
Los grados de libertad dentro son la suma de los grados de libertad de todos los grupos (ya que
todas sus estimaciones estn incluidas en ia combinacin). Se expresan bajo la frmula,
8 l Dentro 8 l t + S l2 + - + 8 ltimo
C1 1
En el ejemplo referido a los antecedentes delictivos, los grados de libertad entre son 2 (3 medias
menos 1). Aplicando la frmula,
^Entre ~ ^Grupos~ 1 = 3 - 1 = 2.
Los grados de libertad dentro son 12, ya que cada grupo tiene 4 grados de libertad en los que se
basa la estimacin (5 registros menos ) y hay 3 grupos en total que, sumados, dan como resulta
do 12 grados de libertad. Aplicando la frmula,
8lmo = ( 5 l) +
8Encca ~= 8\ + 82
(5 l) + (5~ 1) 4 + 4
+ 4=
12.
Tabla 11-6.
Puntos de corte en la distribucin F. (Informacin parcial).
G rados de
lib er ta d d el
d e n o m in a d o r
N iv e l de
sig n ifica ci n
i
10
11
12
13
0,01
0,05
0 ,1 0
0,01
0,05
0,1 0
0,01
0,05
0 ,1 0
0,01
0,05
0,10
10,05
4,97
3,29
9,65
4,85
3,23
9,33
4,75
3,18
9,07
4,67
3,14
G ra d o s de lib er ta d d el n u m era d o r
5
2
3
4
7,56
5,64
6,00
6,55
4 ,1 0
3,33
3,71
3,48
2,93
2,52
2,61
2,73
7,21
5,32
6,22
5,67
3,98
3,20
3,36
3,59
2 ,5 4 . 2,45
2,86
2 ,6 6
6,93
5,07
5,41
5,95
3,11
3,89
3,26
3,49
2,81
2,40
2,61
2,48
6 ,7 0
4 ,8 6
5 ,7 4
5,21
3,41
3,03
3,81
3 ,1 8
2 ,7 6
2 ,4 3
2,35
2 ,5 6
5,39
3 ,2 2
2 ,4 6
5,07
3,10
2,39
4 ,8 2
3,00
2,33
4 ,6 2
2 ,9 2
2,28
Otro ejemplo
Mikulincer (1998) realiz una serie de estudios en Israel utilizando la misma medida de clasifica
cin de estilo de vinculacin que vimos anteriormente en este captulo (vase tabla 11-1). Uno de
sus estudios inclua a 30 alumnos universitarios (10 para cada estilo de vinculacin), todos los
cuales tenan relaciones amorosas serias. Como parte del estudio, cada noche cada alumno anota
ba si durante el da su pareja haba hecho algo que traicionara su confianza. Los participantes ano
taban hechos tales como que su pareja llegaba muy tarde a un encuentro acordado o que
olvidaba comentar al participante algn plan de importancia. Los resultados, junto con los
clculos del anlisis de varianza, se indican en la tabla 11-7. A continuacin, se detallan los pasos
de la prueba de hiptesis.
2 Varios estudios reales han investigado sobre el hecho de si conocer ios antecedentes delictivos del acusado afecta la
probabilidad de que sea condenado. En trminos generales, la conclusin parece ser razonablemente coherente con la
del estudio ficticio aqu descripto. Para una revisin de tales estudios, vase Dae y Wrightsman (1982).
Tabla 11-7.
Cantidad de hechos que traicionan la confianza de individuos cometidos por sus parejas durante
tres semanas con tres estilos distintos de vinculacin.
E s t ilo d e v in c u la c i n
n
M
5
2
D istribucin F:
A nsoso-am bivalente
Evasivo
10
3 ,7 0
1,89
3,57
Seguro
10
2 ,1 0
1,66
2,7 6
10
4 ,2 0
1,93
3,72
%^Entr ~ ^Grupos - l = 3 - I = 2
S W r o " S h + g l 2 + . . . + g l )limo = (1 0 - l ) + ( 1 0 - 1) + ( 1 0 - - 1 ) = 9 + 9 + 9 = 27
F necesaria c o n un nivel de significacin de 0,05 tom ado de la tabla F , g l ~ 2 , T I : 3,36.
E stim acin intergrupal de varianza poblacional:
Tabla e n donde se encuentra la S 2 para las tres m edias
Seguro
Evasivo
A nsoso-am bvalente
SL,
-1 ,2 3
0,37
0,87
2,1 0
3,70
4,2 0
2 : 1 0 ,0 0
G M : 3,33
S i = X (M - GM) 2fglBnc = 2 ,4 1 /2 -
D e sv o cu a d r tic o
D esvo
1,51
0 ,1 4
0,76
2,41
% (M ~ -G M )2
1,205
( ,
Dentro u
Razn F;
^Dentro
=S
-------------------- --------
^ J S 2^
N,Grupos
C M EnJ C M
------------ - --------------
l 0 '0 5
= 3,35
3
D^ Q = 12,05/3,35
= 3,60'
Fuente: MIkulmcer{1998).
Tabla 11-8.
Pasos a seguir para realizar un anlisis de varianza (cuando los tamaos de muestra son iguales).
1. Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de las poblaciones.
2. D eterm inar las caractersticas de la distribucin comparativa.
a) La distribucin comparativa es una distribucin F
b) L os grados de libertad dei numerador son la cantidad de grupos m enos 1:
^Grupos ^'
c) L os grados de libertad del denom inador so n la sum a de lo s grados d e libertad de cada grupo (la cantidad
en el grupo m enos 1): g /Dewro * g l } + g l 2 + . . . + g /ltim0.
3,
Determinar el punto de corte en la distribucin comparativa, a partir del cual debera rechazarse la hiptesis nula.
a) D eterm inar el nivel de significacin deseado,
b) B uscar en una tabla F el punto de corte indicado, utilizando los grados d e libertad calculados en e l paso 2.
S* =2W-GM)Vgtn
iii) Convertir la estim acin d e ia varianza de una distribucin de m edias en una estim acin d e la varianza
de una poblacin de individuos, m ultiplicndola por la cantidad de observaciones de cada grupo:
b) Calcular ia estim acin intragrupal de varianza poblaciona f^ e(ltro CM'Da((0).
i) C alcular estim aciones de ia varianza poblaciona sobre la base d e los valores observados de cada grupo:
para cada grupo, S 2 = X (X - M ) V (n - 1) = S C I g l.
ii) Promediar las estim aciones de varianza:
^Datura ^ ^ D e n tro = (5^ + 5 2 + . + 5 2) kima)VGr])pos
c) C alcular la razn F: F = S ^ J S ^ w F = C M tJ C M D^ m
5. Comparar los valores de lo s pasos 3 y 4 para decidir si se rechaza o no la hip tesis nula.
renda entre medias, es decir, el numerador en el clculo del tamao del efecto. Cohn (1988) su
giere que en el anlisis de varianza deberamos considerar el tamao del efecto como la variacin
entre medias. Especficamente, Cohn recomienda utilizar el desvo estndar de la distribucin de
medias. As, define el tamao del efecto del anlisis de varianza (f) como el desvo estndar de
la distribucin de medias dividido por el desvo estndar de las observaciones individuales.3 Para
valores de poblacin verdaderos conocidos (o predichos) la frmula es la siguiente:
( 11- 8)
Dentro
Am,
(U-9)
^Dentro
Las medidas de Cohn para el tamao del efecto del anlisis de varianza son: 0,10 para un efecto
pequeo, 0,25 para un efecto mediano y 0,40 para un gran tamao de efecto.
Analicemos nuestro experimento ficticio acerca de los antecedentes delictivos. En el estudio
calculamos que S^, la varianza estimada de la distribucin de medias basada en las medias de las
tres muestras, era igual a 4,34. SM, la raz cuadrada de S ^, es 2,08. Calculamos que 5^ei0, la esti
macin de la varianza de cada poblacin de individuos, basada en las estimaciones de varianza
utilizando los valores de cada grupo, era igual a 5,33.5Dentr0, la raz cuadrada de S$entxo, es 2,3 i .
Aplicando la frmula para el tamao del efecto estimado a partir de un estudio completo,
f =* Sm- = ^ = 0,90
^Dentro
2,31
Se trata de un tamao del efecto muy grande (gracias a nuestros datos, ficticios).
En el estudio referido a los estilos de vinculacin realizado porMikulmcer (1998),
, _
^Dentro
... I, * = 0,60
L 830
En este caso, tambin tenemos un gran tamao del efecto. Tanto en el estudio acerca de los ante
cedentes delictivos como en el estudio realizado por Mikulincer, esperaramos un tamao del
efecto importante slo por saber que F fue significativa en un estudio con tamaos de muestra pe
queos (vase captulo 8).
Tambin sucede que, con un poco de manipulacin algebraica, podemos estimar el tamao
del efecto slo conociendo F y la cantidad de observaciones en cada grupo. La frmula es,
( 11- 10)
3 En ei captulo 12, despus de que hayamos presentado el mtodo del modelo estructural para el anlisis de varianza,
aprenderemos cmo calcular otro tipo de tamao del efecto, la proporcin de varianza justificada. Este indicador del
tamao del efecto est relacionado con el mismo concepto en el anlisis de regresin (captulo 4), por eso tiene un sig
nificado ms directo para muchos investigadores, y lo veremos con frecuencia. En el captulo 12 trataremos la relacin
de / con este indicador del tamao del efecto.
Por ejemplo, en el estudio acerca de los antecedentes delictivos habamos calculado que F era
4,07, y haba cinco personas en cada grupo. Utilizando la frmula,
7=
( p _ -f,07 _ 2,02 ^
'vr
TZ
S
~ 2,24
Para el estudio acerca del estilo de vinculacin realizado por Mikulincer (1998),
f - =
-0,60
f 4n
V0 3,16
(Los resultados son iguales a los que calculamos utilizando las estimaciones de varianza). La fr
mula que acabamos de ver es muy til cuando se evala el tamao del efecto de un estudio en una
publicacin cientfica, en las que con frecuencia no se proporcionan detalles sobre las varianzas.
Potencia
La tabla 11-9 indica la potencia aproximada para un nivel de 0,05 de significacin, con tamaos
del efecto pequeos, medianos y grandes; tamaos de muestra de 10,20,30,40,50 y 100 por gru
po, y para tres, cuatro o cinco grupos. Los anteriores son los valores ms comunes de los distintos
parmetros que influyen sobre la potencia.4
Analicemos un estudio planificado que compara cinco grupos delO participantes cada uno,
con expectativa de un gran tamao del efecto (0,40), y que utiliza el nivel 0,05 de significacin.
Basndonos en la tabla 11-9, el estudio tendra una potencia de 0,56, lo que implica que aun si la
hiptesis de investigacin es en efecto verdadera y tiene un gran tamao del efecto, existe slo un
poco ms del 50 % de posibilidades (56%) de que el estudio resulte significativo.
Como observamos en captulos anteriores, determinar la potencia es especialmente til cuan
do se interpretan las implicancias prcticas de un resultado no significativo. Por ejemplo, supon
gamos que hemos ledo un estudio que utiliza un anlisis de varianza para cuatro grupos de 30
participantes cada uno, en el que el investigador informa un resultado no significativo al nivel
0,05 de significacin. La tabla 11-9 indica una potencia de slo 0,13 para un tamao del efecto
pequeo. Esto sugiere que aun si dicho efecto leve existe en la poblacin, hubiera sido muy im
probable que este estudio resultara significativo. Pero la tabla indica una potencia de 0,96 para un
gran tamao del efecto, lo que sugiere que si existiera un gran efecto en la poblacin, casi segura
mente se habra reflejado en el estudio.
P lan ificaci n del tam ao m uestral
La tabla 11-10 nos indica la cantidad aproximada de participantes necesarios en cada grupo para
tener un 80% de potencia al nivel 0,05 de significacin, con tamaos estimados del efecto peque
os, medanos y grandes y en estudios con tres, cuatro y cinco grupos.5 Por ejemplo, supongamos
4 Cohen (1988, pp. 289-354) proporciona tablas ms detalladas. Al utilizar estas tablas, se debe observar que el valor u
en ia parte superior de cada una de las tablas se refiere a gEntre, el cual en el caso de un anlisis de varianza de un crite
rio es la cantidad de grupos menos 1, y no la cantidad de grupos, como sucede en la tabla I i -9.
5 Cohen (1988, pp. 381-389) nos proporciona tablas ms detalladas. Sise utilizan, se debe tener en cuenta la nota a pie
nmero 4 de ste captulo.
Tabla li-9.
P o ten cia a p ro x im ad a p a ra estu d ios q u e u tiliza n el an lisis de varian za p rob an d o la h ip tesis a nivel
0,05 de sign ificacin .
Tamao del efecto
Participantes por grupo (n )
Tres grupos (g L ntr- 2)
10
20
30
40
50
100
Cuatro grupos (gfFntre * 3)
10
20
30
40
50
100
Cinco grupos ( g L nlI = 4 )
10
20
30
40
50
100
Pequeo
(0,10)
Mediano
(0,25)
Grande
(0,40)
0,07
0,09
0,12
0,15
0,18
0,32
0,20
0,38
0,55
0,68
0,79
0,98
0,45
0,78
0,93
0,98
0,99
*
0,07
0,10
0,13
0,16
0,19
0,36
0,21
0,43
0,61
0,76
0,85
0,99
0,51
0,85
0,96
0,99
*
*
0,07
0,10
0,13
0,17
0,21
0,40
0,23
0,47
0,67
0,81
0,90
*
0,56
0,90
0,98
*
*
*
*Casi 1,
que estamos planificando un estudio que involucra cuatro grupos, del cual esperamos un tamao
del efecto pequeo (y utilizramos el nivel 0,05 de significacin). Para obtener una potencia del
80% necesitaramos 274 participantes en cada grupo, un total de 1.096. Sin embargo, suponga
mos que pudiramos adaptar el plan de investigacin de tal forma que fuera razonable predecir un
gran tamao del efecto (tal vez utilizando medidas ms precisas y una manipulacin experimental
ms poderosa). En ese caso, necesitaramos slo 18 participantes para cada uno de los cuatro gru
pos, un total de 72.
T abla 11-10.
C an tid ad ap ro x im ad a de p articip an tes n ecesarios en ca d a gru p o (su p on ien d o qu e las m u estras
ten g a n el m ism o tam ao) para lo grar u n 80% d e p o ten cia en u n anfisis de varian za de un criterio
qu e p ru eb a la h ip tesis al nivel 0,05 d e sign ificacin .
Tam ao del efecto
Pequeo
(7= 0,10)
322
274
240
Mediano
(7= 0,25)
52
45
39
Grande
(7= 0,40)
2
18
16
6 Una forma de realizar esta seleccin sera comenzar con un grupo de todos los participantes disponibles. Primero se
leccionaramos al azar tantos com o fueran necesarios para el primer grupo. Luego seleccionaramos ai azar alumnos
adicionales para cada uno de los otros grupos, unos pocos por vez, adaptando las inclusiones coherentemente hasta que
los tres grupos tuvieran los mismos promedios de ci y capacidad matemtica. En este tipo de equiparacin de grupos, la
estructura resultante sigue siendo un verdadero experimento: el experimentador determina en qu grupo se incluye un
participante utilizando procedimientos aleatorios; cualquier nio tiene las mismas posibilidades de pertenecer a cual
quiera de los tres grupos. N o se debe confundir esta clase de equiparacin de grupos (la equiparacin que vem os en es
ta seccin) con otros dos tipos de equiparacin. Uno de estos otros tipos de equiparacin se realiza cuando la
asignacin aleatoria no e s posible. Se intenta seleccionar personas de diferentes poblaciones preexistentes, de forma tal
que las muestras sean lo ms similares posibles. Un ejemplo sera un estudio en el que se comparen hombres y mujeres
o personas de tres nacionalidades diferentes. En tal estudio, no podramos asignar a las personas al azar a los grupos de
los diferentes sexos o nacionalidades, pero podramos intentar que los grupos que estudiamos sean similares en cuanto
a la edad, preparacin educativa, y as sucesivamente. Es un mtodo mucho menos riguroso que la verdadera asigna
cin aleatoria a los grupos.
Existe un segundo tipo de equiparacin que no estamos tratando aqu, que es una especie de equiparacin uno-a-uno.
Por ejemplo, un investigador podra seleccionar series de tres estudiantes, en las que los tres estudiantes son muy sim i
lares y, luego, a partir de cada serie, los tres son asignados al azar a cualquiera de las tres condiciones experimentales.
Este tipo de equiparacin individual, que no es controvertida, es casi siempre ventajosa, pero rara ve 2 prctica.
confusin que contribuye a la estimacin intragrupai de varianza permanece igual). Por lo tanto,
la recomendacin tradicional en la mayora de los libros de diseo experimental es que no se uti
lice este tipo de equiparacin de grupos al programar los experimentos.
Sin embargo, Ross y Klein (1988) han cuestionado esta recomendacin tradicional. Ellos re
conocen que con la equiparacin de grupos, el numerador de la razn F (y por lo tanto la razn F
en su totalidad), en lneas generales se reduce. Pero tambin sealan que esto sucede en lneas ge
neraies, y que es bastante posible que, en determinadas situaciones que pueden especificarse, la
razn F en realidad aumente por causa de ese procedimiento.
Ross y Klein realizaron una serie de estudios de Montecario (vase cuadro 10-1) para deter
minar el efecto real de la equiparacin de grupos en distintas condiciones. El resultado de sus es
tudios fue que utilizar la equiparacin de grupos, en comparacin con la asignacin aleatoria
ordinaria, a) es conveniente si la hiptesis nula es verdadera, en cuanto a que se reduce la posibi
lidad de cometer un error Tipo I (rechazar equivocadamente la hiptesis nula); b) no es conve
niente cuando la hiptesis de investigacin es verdadera, pero las diferencias reales entre las
medias grupales son pequeas debido a que, en este caso, la potencia se reduce, y c) es convenien
te cuando la hiptesis de investigacin es verdadera y las diferencias reales entre las medas gru
pales son grandes porque, en este caso, la potencia aumenta. De todos modos, en todos tos casos
la mejor opcin es utilizar la equiparacin de gmpos, pero analizando los resultados con un pro
cedimiento estadstico ms sofisticado denominado anlisis de covarianza (brevemente descripto en el captulo 17). El anlisis de covarianza tiene en cuenta sistemticamente ios valores
observados en cada participante en las variables en las que se realiza a equiparacin. Lamenta
blemente, este procedimiento no puede ser utilizado en muchos casos, ya sea porque no pueden
cumplirse los exigentes supuestos o porque la informacin necesaria no est disponible. Por lo
tanto, cuando en un estudio es factible la equiparacin de grupos, sta parece recomendable en las
situaciones a) y c) establecidas por Ross y Klein, aun s el procedimiento especial de anfisis de
covarianza no puede utilizarse, y el querido y viejo anfisis de varianza estndar s.
M = 1,0; abuso de substancias M ~ 0,7; ambas condiciones M - 1,9. Los investigadores informa
ron: Los tres grupos de estudio diferan en el promedio de trastornos de personalidad diagnosti
cados. F(2tll2 ) =10,18, p < 0,0001. En este estudio, como en la mayora de los casos que
involucran anlisis de varianza, es comn que los investigadores posteriormente realicen algn
anlisis sistemtico para averiguar qu medias difieren significativamente de qu otras medias.
Ese tema ser tratado en el captulo 12.
Resumen
El a n o v a prueba la hiptesis de que hay diferencias entre las medias de varias poblaciones. El
procedimiento compara dos estimaciones de la varianza poblacional. Una, denominada estima
cin intragrupal, que se determina por el promedio de las estimaciones de la varianza realizadas
a partir de cada una de las muestras. La otra, denominada estimacin ntergrupaT, se basa en la
variacin entre las medias mustrales.
La razn F es igual a la estimacin intergrupal dividida por la estimacin intragrupal. La hi
ptesis nula establece que todas las muestras provienen de poblaciones con la misma media. Si la
hiptesis nula es verdadera, la razn F debera ser aproximadamente 1, ya que las dos estimacio
nes de la varianza poblacional se basan en lo mismo, la variacin dentro de cada poblacin. Pero
si la hiptesis de investigacin es verdadera, y las muestras provienen de poblaciones con diferen
tes medias, la razn F debera ser mayor a 1, ya que la estimacin intergrupal se ve, en ese caso,
influenciada tanto por la variacin dentro de las poblaciones como por la variacin entre las po
blaciones, mientras que la estimacin intragrupal contina afectada slo por la variacin dentro
de cada una de las poblaciones.
Cuando las muestras tienen el mismo tamao, la estimacin intragrupal de la varianza poblacional es el promedio de las estimaciones de la varianza poblacional calculadas a partir de cada
muestra. La estimacin intergrupal de la varianza poblacional se realiza en dos pasos: primero, se
estima la varianza de la distribucin de medias sobre la base de las medias de las muestras reales
(para realizar este clculo se utiliza la frmula usual de estimacin de la varianza poblacional a
partir de valores mustrales). En segundo lugar, se multiplica la estimacin anterior por el tamao
de la muestra de cada grupo. A travs de este segundo paso obtenemos la varianza de la distribu
cin de valores individuales a partir de la varianza de la distribucin de medias.
Los supuestos del anlisis de varianza son los mismas que los de la prueba t; las poblaciones
deben estar normalmente distribuidas y tener las mismas varianzas. Se ha descubierto que el an
lisis de varianza, al igual que la prueba t, otorga resultados razonablemente precisos aun cuando
se violen moderadamente los supuestos.
El tamao del efecto en el anlisis de varianza puede calcularse como el desvo estndar de la
distribucin de medias dividido por el desvo estndar de la distribucin de observaciones indivi
duales. En el caso de un estudio ya realizado, tambin se puede calcular como la raz cuadrada de
F dividida por la raz cuadrada de la cantidad de participantes en cada grupo. La potencia depen
de del tamao del efecto, de la cantidad de personas que participan en el estudio, del nivel de sig
nificacin y de la cantidad de grupos.
Asignar participantes sistemticamente a los grupos experimentales, para asegurar prome
dios similares en cuanto a variables de fondo, generalmente reduce la potencia. Esto ocurre por
que el procedimiento reduce la contribucin de varianza aleatoria a la estimacin intergrupal,
pero no a la estimacin intragrupal. Sin embargo, en ciertas condiciones el procedimiento puede
aumentar la potencia.
Trminos clave
- ANOVA.
- Distribucin F.
- Razn F.
~ Tabla F.
- Gran media iGM).
- Grados de libertad
del numerador (gEntre).
- Grados de libertad
intragrupales (g/DenlX0).
- Estimacin intragrupal
de la varianza poblacional
^Dentro ^ ^^Dentro^'
^Denro^*
- Tamao del efecto del anlisis
de varianza (j).
Ejercicios
n
M
n
M
S
SERIE I
(a) Grupo 1
Grupo 2
Grupo3
8
1.
Para cada uno de los siguientes estudios,
8
decida si se puede rechazar la hiptesis nula que
7
establece que los grupos provienen de poblacio
9
nes idnticas. Utilice el nivel 0,05. Adems, calcu (b) Grupo 1
le el tamao del efecto y la potencia aproximada
12
de cada uno. (Asegrese de mostrar todos sus
04
clculos. Observe tambin que con respecto a los
12
04
estudios b y c indicamos S, y no S2).
6
6
5
7
Grupo 2
4
4
3
5
Grupo 3
10
02
10
02
8
0
8
0
25
25
25
25
94
124
101
105
24
25
31
28
(c) Grupo 1 Grupo 2 Grupo 3 Grupo 4 Grupo 5
n
M
S
25
94
24
25
101
28
25
124
31
25
105
25
25
106
27
2.
Para cada uno de los siguientes estu
dios, decida si se puede rechazar la hiptesis
nula que establece que los grupos provienen de
poblaciones idnticas. Utilice el nivel 0,01.
Adems, calcule el tamao del efecto y la po
tencia aproximada de cada uno. (Asegrese de
mostrar todos sus clculos).
3,
Se le pidi a un psiclogo de un hospital
mental entre los prisioneros difiere segn el ti
mental privado que determine si exista alguna po de instalaciones de la prisin. El investiga
diferencia clara en la duracin del perodo de dor selecciona al azar 40 prisioneros de cada
internacin de pacientes con diferentes catego uno de los tres tipos principales de prisin de
ras de diagnstico. Analizando a los ltimos un Estado determinado de los e e . u u . y realiza
cuatro pacientes en cada una de las tres catego exmenes para determinar la necesidad de cui
ras ms importantes, los resultados (en trmi dado de la salud mental de los prisioneros. En
nos de semanas de internacin) fueron los la publicacin que describe los resultados, el
siguientes;
investigador informa las medias de cada grupo
en cuanto a necesidad de cuidado de la salud
Categora de diagnstico
mental, y luego agrega; La necesidad de cui
dado de la salud mental entre prisioneros de
T r a s to rn o s
T r a s to r n o s
T r a s to r n o s r e la c io n a d o s co n
los tres tipos de sistemas penitenciarios pare
a f e c tiv o s
c o g n itiv o s
la s d r o g a s
ce ser claramente diferente, F(2, 1 1 7 )- 5,62,
7
12
08
p < 0,01. Explique el significado de lo ante
6
08
10
rior a una persona que nunca ha asistido a un
5
09
12
6
i!
10*45
curso sobre estadstica.
. Qu clase de palabras son ms largas,
Utilizando un nivel 0,05, existe alguna dife los sustantivos, los verbos o los adjetivos? To
rencia significativa en la duracin del perodo me un diccionario, busque hojas al azar (utili
de internacin entre las distintas categoras de zando los nmeros aleatorios que aparecen
diagnstico? a) Realice los cinco pasos de la debajo) y descienda por la columna hasta que
prueba de hiptesis, b) Explique su respuesta a encuentre un sustantivo. Anote su longitud (en
alguien que comprende todo lo relacionado cantidad de letras). Haga lo mismo con 10 sus
con la realizacin de una prueba t para medias tantivos diferentes. Repita el proceso con 10
independientes pero que nunca ha escuchado verbos y luego con 10 adjetivos. Despus reali
hablar del anlisis de varianza.
ce un anfisis de varianza comparando los tres
4. Un estudio comparaba la intensidad del
tipos de palabras. Adems, suponiendo que
amor no correspondido entre tres grupos: i) 50
existe una gran tamao del efecto, cul es la
individuos que estaban experimentando un amor
potencia de este estudio (a un nivel de 0,05), y
no correspondido, que tenan una media de in
cuntas palabras de cada tipo seran necesarias
tensidad experimentada = 3,5, S2 = 5,2; ii) 50
para
tener una potencia del 80%?.
individuos que haban experimentado anterior
mente un amor no correspondido y describan su
experiencia retrospectivamente, M = 3,2,S2- 5,8
y iii) 50 individuos que nunca haban experi
mentado un amor no correspondido pero des
criban cmo pensaban que se sentiran si les
ocurriera, M - 3,8, 2 = 4,8. Determine la sig
nificacin de la diferencia entre los grupos uti
lizando el nivel del 5%. a) Realice los cinco
pasos de la prueba de hiptesis, b) Calcule el
tamao del efecto y la potencia, c) Explque-su
respuesta a alguien que nunca ha asistido a un
curso de estadstica.
5. Un investigador est preocupado porque
considera que la necesidad cuidado de la salud
SERIE Ii
1.
Para cada uno de ios siguientes estu
dios, decida si se puede rechazar la hiptesis
nula que establece que los grupos provienen de
poblaciones idnticas. Utilice el nivel de 0,05.
Adems, calcule el tamao del efecto y la po
tencia aproximada de cada uno. (Asegrese de
mostrar todos sus clculos).
n
M
G rupo
5
12
6
G rupo
5
14
5
G ru p o
10
14
5
G ru p o
5
18
5
G rupo
5
14
2 ,5
Tabla 11-11.
Medias de las escalas principales de medicin de la personalidad correspondientes a cada condicin
experimental (datos ficticios).
E sc a la
Conform idad
E xtroversion
M adurez
C onfianza
en s m ism o
*p <0,05;
< 0,01.
M a d re
P a d re
A m igo
P r o fe so r
24
14
15
38
21
13
15
42
12
15
22
27
16
13
19
32
F (3 ,5 6 )
4 ,2 1 * *
2,05
3,11*
3 ,58*
El modelo
estructural
en el anlisis
I de varianza
D e sc r ip c i n d ei capitulo
Principios del modelo estructural.
Controversias, limitaciones y desarrollos
recientes.
''
Utilizacin del modelo estructural para
realizar un anlisis de varianza.
El anlisis de varianza con modelo
estructural y las comparaciones
.X.
Tablas del anlisis de varianza.
mltiples segn se describen en
Anlisis de varianza con grupos de
publicaciones cientficas^
tamaos desiguales.' .
Resumen. .
..:
:
Resumen de ios procedimientos de
Trminos
clave.
clculo del anlisis de varianza
utilizando el modelo estructural.
;. ' Ejercicios.
Apndice I del captulo: frmulas de
^ Comparaciones mltiples/
clculo Optativas para la suniade
Supuestos del anlisis de varianza con
cuadrados n un anlisis de varianza d
muestras d taanos desiguales.
:;/
U
critrio. L L
'i--/'i:;^ - r f
Tamao del efecto y potencia.
dad de individuos de cada grupo no es la misma, situacin especial que analizamos en este captu
lo. Adems, al comprender el modelo estructural podremos entender con mayor profundidad la
lgica implcita del anlisis de varianza. Finalmente, la comprensin del mtodo del modelo es
tructural ayudar a entender la forma en que las computadoras presentan los resultados del anli
sis de varianza.
Particin de la desviacin
La idea central del modelo estructural requiere pensar en trminos de desviacin. En primer lu
gar, existe la desviacin de una observacin con respecto a la gran media. La gran media es la me
dia de todas las observaciones, independientemente del grupo en el que se encuentran. En el
ejemplo del estudio acerca de los antecedentes delictivos, analizado en el captulo 11, la gran me
dia de los 15 valores observados era 85/15 - 5,67. En el ejemplo del estudio referido a estilos de
vinculacin, estudiado en el mismo captulo, la gran media de las 30 observaciones con respecto
a la traicin de la confianza era 3,33.
Despus debemos pensar que la desviacin con respecto a la gran media tiene dos partes:
a) la desviacin de la observacin con respecto a la media de su grupo y b) la desviacin de la me
dia de su grupo con respecto a la gran media. Analicemos a un participante en el estudio acerca de
los antecedentes delictivos que calific la culpabilidad del acusado con 10. La gran media de las
calificaciones de culpabilidad de todos los participantes era 5,67. La calificacin de la persona en
cuestin presenta una desviacin total de 4,33 (10 - 5,67 - 4,33). La media, nicamente del gru
po de antecedentes delictivos, era 8. Por lo tanto, la desviacin de la calificacin de esta persona
con respecto a la media de su grupo es 2 (es decir, 10 - 8 = 2), y la desviacin de la media grupal con
respecto a la gran media es 2,33 (es decir, 8 - 5,67 = 2,33). Es importante observar que esas dos
desviaciones (2 y 2,33) suman la desviacin total de 4,33. La figura 12-1 grfica lo anterior. Es
conveniente estudiar este concepto hasta comprenderlo bien.
i /lorbse'rvadq
'Mediadel grupo
Figura 12-1. E jem p lo tom ado d e un e stu d io fic ticio acerca d e an teced en tes d e lic tiv o s, e n e l q u e se repre
sen ta la d e sv ia c i n d e la o b serv a ci n d e un ind ividu o c o n resp ecto a la gran m ed ia c o m o la su m a d e la
d e sv ia c i n d e la o b serv a ci n ind ividu al c o n respecto a la m ed ia d e su grupo, m s la d e s v ia c i n d e la m ed ia
d e su grupo c o n resp ecto a la gran m edia.
Entre
( 12- 2)
%ntre
S(X-M )*
SCD M
j
^^Dentro" ,
Dentro
^Dentro
(12-3)
Valorobservado,
c -V;;L
\ 'i .Desviacin dei valor observado. '.;;-; ^piylaplSn; d la-iedia..'- ri l con ;rsp ectrlan jfed faj'.v^
- L':L
r?1j a g r a n m d i a \ - "LL;
;<
. (bse d la cstimcrjL L fff;
^
: i? '-.Lintragrupal:d.vadanka^; fl:
- I . jY'' ' ''' -):; Desvial^lcLs% lores:obsm^^cS^^:::.L -L y y v ^ ^ ^ :;
" v j / : : .
: \ o n r e s p e t o - a l a ^
12-2. La desviacin de las observaciones con respecto a la media de su grupo es la base para la esti
macin intragrupal de la varianza poblacional. La desviacin de la media del grupo con respecto a la gran
media es la base de la estimacin intergrupal de la varianza poblacional.
Figura
cen los valores observados individuales con respecto a la gran media, con una varianza basada en
los desvos de los valores observados individuales con respecto a la media de su grupo. El mtodo
del captulo 11 se concentra directamente en los aspectos que contribuyen a la estimacin general
de la varianza poblacional; el modelo estructural se concentra directamente en los aspectos que
contribuyen a las partes en que se descomponen las desviaciones de las observaciones con respec
to a la gran media.
Las diferencias lgicas mencionadas anteriormente son bastante sutiles y, finalmente, se re
ducen a lo mismo. Entonces, s tanto los clculos como la lgica se refieren a lo mismo, por qu
debemos aprender dos formas diferentes de razonar ese tema? Hemos analizado el mtodo del ca
ptulo 11 principalmente porque es ms intuitivo. Es especialmente til para ayudar a comprender
de qu se tratan las estimaciones de la varianza poblacional, y por qu deberan ser iguales cuan
do la hiptesis nula es verdadera y diferentes cuando no lo es. Adems, con el mtodo del captu
lo 11 podemos calcular un anlisis de varianza en forma directa a partir de medias y varianzas de
grupos, sin necesidad de trabajar directamente con las observaciones.
Sin embargo, como dijimos al comienzo del captulo, es importante presentar el modelo es
tructural porque a) ha sido el ms utilizado (en parte porque es ms cercano a las frmulas de
clculo que durante tanto tiempo dominaron el razonamiento de todos), b) es ms flexible, y por
lo tanto ms fcil de utilizar cuando se trabaja con grupos de tamaos desiguales y con el anlisis
factorial de varianza (presentado en el captulo 13) y c) est relacionado con un mtodo matem
tico fundamental que queramos estar seguros de exponer a aquellos alumnos que podran llegar a
asistir a cursos ms avanzados de estadstica.
Tabla 12-1.
Anlisis de varianza del estudio acerca de los antecedentes delictivos (datos ficticios)
utilizando el mtodo del modelo estructural (comparar con tablas 11-3 y 11-4).
G r u p o co n a n tec e d e n te s d elictivos
10
7
5
10
8
X - GM
Desviacin
Desviacin cuadrtica
4 ,3 3
1 ,3 3
0 ,6 7
4 ,3 3
2 ,3 3
1 8 ,7 4
1 ,7 7
0 ,4 5
1 8 ,7 4
5 ,4 3
X-M
Desviacin
Desviacin cuadrtica
2
1
3
2
0
45J3
40
4
1
9
4
0
M - GM
Desviacin
Desviacin cuadrtica
2 ,3 3
2 ,3 3
2 ,3 3
2 ,3 3
2 ,3 3
5 ,4 3
5 ,4 3
5 ,4 3
5 ,4 3
5 ,4 3
2 7 ,1 4
18
M ss 4 0 /5 = 8
G ru p o sin an teced en tes delictivos
X
5
I
3
7
4
X ~ GM
Desviacin
Desviacin cuadrtica
0 ,6 7
-4 ,6 7
-2 ,6 7
1 ,3 3
-1 ,6 7
20
0 ,4 5
2 1 ,8 1
7 ,1 3
1 ,7 7
2 ,7 9
33^95
2 0 /5 = 4
X -M
Desviacin
Desviacin cuadrtica
1
-3
-1
3
0
1
9
1
9
0
20
M - GM
Desviacin
Desviacin cuadrtica
-1 ,6 7
-1 ,6 7
-1 ,6 7
-1 ,6 7
-1 ,6 7
2 ,7 9
2 ,7 9
2 ,7 9
2 ,7 9
2 ,7 9
1 3 ,9 5
- 1 ,6 7
0 ,3 3
3,33
-2 ,6 7
-2 ,6 7
4
6
9
3
3
X~M
D e s v ia c i n
D e s v ia c i n c u a d r tic a
2 ,7 9
0,11
11,09
7 ,1 3
7,13
-1
1
4
-2
-2
1
1
16
4
4
285
25
M - GA
D e s v ia c i n
D e s v ia c i n c u a d r tic a
-0 ,6 7
- 0 ,6 7
- 0 ,6 7
0 ,6 7
-0 ,6 7
26
0,45
0,45
0,45
0,45
0 ,4 5
2,25
M = 2 5 /5 = 5
C oatrol ( g i ^ =
^33
* S C ^ J g l Enw = 4 3 ,3 4 /2 21 ,67
R azn F: F = S U ^ U . 6 C M *
- 21 >6 7 /5 >3 3 = 4 07
Los grados de libertad, el siguiente paso que aparece en la tabla, se calculan de la misma forma
que en el captulo 11. Ms abajo, la tabla indica los clculos de las dos estimaciones cruciales de
varianza poblacional. Las calculamos dividiendo cada suma de desviaciones cuadrticas por los
grados de libertad correspondientes. Finalmente, la tabla muestra el clculo de la razn F, realiza-
do de forma usual, dividiendo la estimacin intergrupal de la varianza por la estimacin intragrupal de varianza. Todos esos nmeros, grados de libertad, estimaciones de varianza y F son iguales
(con diferencias de redondeo) a las cifras calculadas en el captulo 11.
ra de los programas de anlisis de varianza para computadoras. Una tabla estndar de anlisis de
varianza tiene cinco columnas. La primera columna est encabezada, por lo general, con el ttulo
"Fuente, y contiene el tipo de estimacin de varianza o desvo involucrado (intergrupal, inragrupai y total). La siguiente columna se titula habtualmente S C \ y contiene los diferentes ti
pos de sumas de desviaciones cuadrticas. La tercera columna es gl, y contiene los distintos
tipos de grados de libertad. La cuarta columna es CM, que se refiere a los cuadrados medios. Es
decir, CM es SC dividido por gl, la estimacin de la varianza. CM es, como siempre, lo mismo que
S2. Sin embargo, en una tabla de anlisis de varianza, la varianza casi siempre es representada co
mo CM. La ltima columna es F, la razn F. Cada fila de la tabla se refiere a una de las estima
ciones de varianza. La primera fila corresponde a la estimacin intergrupal de varianza.
Generalmente aparece debajo de la columna Fuente como intergrupal o grupal, aunque al
gunas veces se la denomina modelo o tratamiento. La segunda fila corresponde a la estimacin
intragrupal de varianza, aunque algunas veces se la denomina error. La ltima fila es la suma de
los cuadrados sobre la base de la desviacin total de cada observacin con respecto a la gran media,
La tabla 12-2 es una tabla de anlisis de varianza completa con los datos tomados del ejemplo
referido al estudio de los antecedentes delictivos. Los diseos realizados por computadora algu
nas veces utilizan un orden diferente para las columnas y omiten SC CM, pero nunca los dos.
T a b la 1 2 -2 .
SC
4 3 ,3 4
64
107,33
gl
2
12
14
CM
21,67
5,33
4,07
1 Una ventaja del mtodo que aprendimos en ei capitulo 1 , adems de su utilidad para clarificar la lgica implcita, es
que permite calcular un anlisis de varianza utilizando slo las medias y las varianzas poblacionales estimadas. Esto
puede resultar rito cuando la informacin ordinaria no est disponible; por ejemplo, ai calcular un anlisis de varianza
basndonos en medias y desvos estndar informados en una publicacin cien tfica . Por io :tanto, si los tamaos de las
muestras no fueran iguales, la siguiente es la forma de determinar las estimaciones de varianza poblacional utilizando
el mtodo del captulo 11.
El clculo de |,entol con d istin to s tamaos de muestra es una extensin directa del mtodo que aprendimos en el ca
ptulo 10 para ?c0(a,!l,(i4>Ia estimacin combinada de la varianza poblacional. Es decir,
es Ia suma de la ^ponIndos por los g totales de
la ponderacin
racin ios
derada de cada grupo, siendo
3 g / del grupo en cuestin (su Vmenos 1) am an
todos los grupos. Es decir,
Ejemplo
Analicemos un ejemplo ficticio. Un investigador de un centro de tratamiento del alcoholismo rea
liza un estudio acerca de la satisfaccin del paciente con tres mtodos diferentes de tratamiento,
utilizados en el centro. Los llamaremos tratamiento A, tratamiento B y tratamiento C. El investi
gador asigna al azar a cada uno de los 10 pacientes disponibles para que reciban uno de estos tra
tamientos; a 4 pacientes Ies toca el tratamiento A, a 3 pacientes el tratamiento B y a 3 pacientes el
tratamiento C. Dos semanas ms tarde, el investigador mide la satisfaccin de los pacientes con
respecto a los tres tratamientos en una escala del 1 (bajo nivel de satisfaccin) al 20 (alto nivel de
satisfaccin). La tabla 12-3 muestra los resultados, los clculos y la tabla del anlisis de varianza.
La figura 12-3 representa grficamente las distintas distribuciones involucradas. Seguiremos el
procedimiento habitual de prueba d hiptesis paso a paso.
1. Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de las
poblaciones. Existen tres poblaciones.
Poblacin 1: alcohlicos que reciben el tratamiento A.
Poblacin 2: alcohlicos que reciben el tratamiento B.
Poblacin 3: alcohlicos que reciben el tratamiento C.
La hiptesis nula establece que las tres poblaciones tienen la misma media. La hiptesis de inves
tigacin establece que no todas tienen la misma media.
2. Determinar las caractersticas de la distribucin comparativa. La distribucin compa
rativa en un anlisis de varianza es siempre una distribucin F. Calculamos sus grados de libertad
del mismo modo que lo hemos venido haciendo hasta ahora. La estimacin ntergrupal de la
varianza es la cantidad de grupos menos 1. Existen tres grupos, por lo tanto glntre es 2. El
gl D
es la cantidad de observaciones de cada grupo menos uno. Hay 3 grados de libertad en el
primer grupo (4 observaciones menos 1) y dos grados de libertad en cada uno de los otros grupos;
por lo tanto, g/Dentro es 7. Es decir, se trata de una distribucin F para 2 y 7 grados de libertad.
^Dentro ;
i
+
-H)1
2 + -- + ltimos '
j .______ ltimos
2
ih +i k +1'1* ltimos'
.
Calcular la
es un poco ms complejo. Primero, calculamos la gran media general (que no es slo la media de
las medias). Para calcular la gran media, primero multiplicamos la media de cada grupo por la cantidad de observacio
nes de ese grupo, sumamos los resultados de todos los grupos y dividimos la suma por la cantidad total de observacio
nes. Se expresa bajo la frmala,
CM -
+ ( ^ ) 2 ) + ~ + (^ltimos) (rcltimos )
n { +rt2
+ ltimos
D espus calculamos 5 | tfe: calculamos la desviacin de la media de cada grupo con respecto a la gran media; elevamos
la desviacin al cuadraoq; multiplicamos las desviaciones cuadrticos de cada grupo por la cantidad de observaciones
del grupo; sumamos los resultados de todos los grupos y dividimos esa suma por los grados de libertad intergrupales
{Eiit* = e n tid a d de grupos menos 1). Se expresa bajo la frmula,
c2
(/V/j- G M f { n x) + { M 2
, Entre ~
Tabla 12-3.
Anlisis de varianza del estudio acerca de tratamientos de alcoholismo (datos ficticios).
Tratamiento A
X
- GM
X ~ M
Tratamiento B
M - GM
D esv' D e s v 1 D e sv D e s v ' D e sv
8
13
10
9
40
1
6
3
2
1
36
9
4
50
~2
3
0
-1
4
9
0
1
14
3
3
3
3
X - GM
D esv' D e s v 1
D esv1
7
3
8
9
9
9
36
0
-4
1
17
18
A = 40/4 = 10
0
16
1
Tratamiento C
M - GM
X ~ M
1
-3
2
1
9
4
-I
-1
-1
14
: 18/3 := 6
+^2 + + ^umo U -
D + (3 -- 1) + (3 - 1) = 3 + 2 + 2 = 7
^Grupos 1 = 3 - 1 =*2
F necesario para g l ~ 2 , l al nivel 0,05 4,74
S C r m = 50 + 17 + 35 * 102
S^Bnac ~
^-Dentro = 14 + 14 + 8= 36
* ^ , 3 6 +3+27*66
SC
GL
66
36
7
9
102
CM
33
5,14
6,42
D e s v D e s v 1'D e s v D e s v 1
1
1
I
3
X -G M
M ~ GM
X - M
D e sv D e s v 1 D esv D e sv 1D esv D e sv
6
4
2
-I
-3
-5
12
Ai* 1 2 /3 = 4
1
9
25
35
0
-2
4
0
4
8
-3
-3
-3
9
9
9
27
5.
C o m p arar ios valores obtenidos en los pasos 3 y 4 p a ra d ecid ir s i se rechaza o no la h i
ptesis nula. La razn F de 6,42 es ms extrema que el punto de corte F de 4,74 correspondiente al
nivel 0,05 de significacin. Por lo tanto, el investigador puede rechazar la hiptesis nula. Si esta
F ig u r a 1 2-3.
Distribuciones relacionadas con el estadio ficticio acerca del tratamiento del alcoholismo.
fuera informacin real, el investigador podra concluir que los tres tratamientos tienen diferentes
efectos en cuanto a la satisfaccin de pacientes, como los suyos con respecto a sus tratamientos.
Otro Ejemplo
Ahora examinaremos informacin ficticia basada en resultados de un estudio real realizado por
Clark et al. (1997). Los investigadores estudiaron tres grupos de pacientes: pacientes con pnico,
pacientes con angustia generalizada y pacientes con fobia social. Tambin incluyeron un grupo
comparativo de personas que no eran pacientes. Como parte inicial del estudio, compararon ios
cuatro grupos sobre la base de varias medidas estndar. La tabla 12-4 se basa en los descubrimien
tos reales de los investigadores a travs de las pruebas de ansiedad. (El patrn de los resultados es
el mismo. Sin embargo, para que el ejemplo fuera simple, hemos utilizado muchos menos partici
pantes y hemos transformado ios valores individuales en nmeros agradables, enteros y pequeos.
Los resultados del estudio real se indican en la tabla 12-8, ms adelante en este captulo). La tabla
12-4 tambin presenta los clculos principales y la tabla del anlisis de varianza. La figura 12-4 re
presenta grficamente las distintas distribuciones relacionadas con el estudio. A continuacin,
analizamos el ejemplo siguiendo e procedimiento normal de prueba de hiptesis paso a paso.
Tabla 12-4,
Anlisis de varianza de valores de ansiedad basado aproximadamente en Clark et al. (1997).
(Datos ficticios).
Pacientes
con pnico
No pacientes
D e s v ia c io n e s c u a d r tic a s
X -G M X -M M -G M
8
10
4
0
9
22
32
1
0
4
4
4
1
4
4
16
D e s v ia c io n e s c u a d r tic a s
X -G M X - M M -GM
11
10
2
0
4
0
1
1
33
M-- =32/4 = 8
GM
itf = 3 3 /3 = 11
= (32 + 33 + 22 + 33)/12 = 10
1
1
1
D e s v ia c io n e s c u a d r tic a s
X -G M X -M M -G M
10
12
22
= 22 + 5 + 4 + 3 = 34
ANALISIS DE VARIANZA:
Fuente
SC
gl
rttergrupa!
Irtragrupal
Total
24
10
34
8
11
CM
8
1,25
F
6 .4
X - G M X - M M - GM
11
11
11
1
1
1
0
0
0
~4
"2
33
~3
* #2 + + ^ltirao = ^ ~ 1) + (3 ~ 1) + (2 - 1} + (3 - 1) = 3 + 2 + 1 + 2 = 8
^emro *6 + 2 + 2 + 0=10
D e s v ia c io n e s c u a d r tic a s
1
1
M = 22 /2 a 11
Paciente con
fobia social
1
1
= * -1 = 12-1*11
^Dentro
5 ^
M ~ *3 3 /3 = 11
1
1
1
: Se supone qu ias distribuciones de poblacin son normales y tienen la misma varianz. Tienen la misma media
O (si la hiptesis nula es verdadera), o tienen diferentes medias (si la hiptesis de iqvestigci.es verdadera): . . .
Pn n
8
10
12
Personas.que no
son pacientes
i ......i
8
10 12
Pacientes que sufren
de pnico
8
10 12
Pacientes que sufren
de angustia generalizada
11 _
8
10
12
Pacientes que sufren
de foba social
Distribuciones de muestras
Figura 12-4.
D istr ib u c io n e s r ela cio n a d a s con e l an lisis d e varianza d e la in form acin fic ticia basado aproxim ad am ente
en C lark e t al.
COMPARACIONES MLTIPLES
Rechazar la hiptesis nula en un anlisis de varianza implica que las medias poblacionales no son
todas iguales. Lo que no queda claro, sin embargo, es cules son las medias poblacionales que di
fieren entre s. Por ejemplo, en el estudio acerca de los antecedentes delictivos, los miembros del
jurado que formaban el grupo al que se le inform la existencia de antecedentes delictivos fueron
los que asignaron el mayor nivel de culpabilidad (M - 8); los miembros del jurado que no recibie
ron informacin al respecto fueron los segundos en cuanto al nivel de culpabilidad asignado
(M - 5), y los miembros del jurado a los que se inform que el acusado no tena antecedentes de
lictivos fueron los que asignaron el nivel ms bajo de culpabilidad (M = 4). A partir de los resulta
dos del anlisis de varianza, concluimos que las verdaderas medias de las tres poblaciones que
representaban estos grupos no eran todas iguales. Sin embargo, no sabemos qu medias de qu
poblaciones en particular son significativamente diferentes entre s. Ni siquiera existe garanta de
T a b la 1 2 -5 .
P a s o s , s m b o lo s y f r m u la s p a r a c a lc u la r u n a n lisis de v a r ia n z a u t iliz a n d o el m to d o d e l m o d e lo
e s t r u c tu r a l (g r u p o s d e ta m a o s ig u a le s o d e s ig u a le s ).
Pasos d e la
p r u e b a d e h ip te s is
1. Replantear e i problem a en funcin de hip tesis de investigacin e hip tesis nula de las poblaciones.
2. Determ inar las caractersticas de la distribucin comparativa.
a) L a distribucin comparativa ser una distribucin F.
b) Los grados de libertad del numerador son la cantidad de grupos m enos 1; g /Entre = /VGfupos - 1 .
c) L os grados de libertad del denom inador son la sum a de io s grados de libertad de cada grupo
(la cantidad de observaciones de cada grupo m enos 1): g l MttQ - g l { + g lj + . . . + g l$ ]mo.
d) Controlar la exactitud de los c lc u lo s a s e g u r n d o s e de q u e gDintto m s g IEnu< sum an g !rm
(que es la cantidad total de casos m enos 1).
3. D eterm inar e l punto muestral de corte en la distribucin comparativa, a partir del c u a l debera rechazarse la
hip tesis nula.
a) Determinar e l nivel de significacin deseado.
b) B uscar e l punto de corte correspondiente a la tabla F.
4.
e)
f)
C M EnilJ C M DeriV0.
5. Comparar los resultados obtenidos en los pasos 3 y 4 para decidir si se rechaza o no la hip tesis nula.
S m b o lo s c o r r e s p o n d ie n t e s a c a d a p a r t e
d e u n a n lis is d e v a r ia n z a
SC
gt
CM
Intergrupai
^ E n tre
^Emte
Intragrupal
W o
^Dentro
^^Deiitro ( ^Dentro)
Total
^"Total
^Total
F u en te
SC
Intergrupai
X (M -G M )2
Intragrupal
M X - VI)2
Total
M X-CM )2
gl
N
Grupos
CM
^E irt/^E iitre
C M i'J C M
Demw
^ D m ro
que los dos grupos ms extremadamente diferentes (el grupo que recibi informacin de antece
dentes delictivos y el grupo al que se le inform que no existan antecedentes delictivos) represen
ten poblaciones con medias diferentes y, ciertamente, no queda claro si la media de la poblacin
correspondiente al grupo que no recibi informacin al respecto es diferente de cualquiera de las
medias de las poblaciones representadas por los otros dos grupos.
Cuando se determina cules son las medias que difieren entre s se dice que se realizan com
paraciones mltiples, porque frecuentemente se comparan varios pares de medias. Las compa
raciones mltiples son un tema complejo muy tratado en cursos de estadstica en psicologa de
nivel intermedio. Adems, es un tema controvertido.
Existe un punto en el que casi todo el mundo est de acuerdo. Por lo general no es suficiente
calcular simplemente una serie de pruebas r, una para cada posible par de medias, ya que si no se
aplican modificaciones, es muy probable que este tipo de procedimiento arroje lo que aparente
mente es un resultado significativo. Por ejemplo, con tres grupos existiran tres pruebas t posibles
(el grupo 1 comparado con el 2, el 2 con el 3 y el 1 con el 3). Supongamos que utilizamos el nivel
0,05, de forma tal que cada una de las tres pruebas t posibles tengan una probabilidad 0,05 de re
sultar significativas equivocadamente. La probabilidad de que al menos una de las pruebas de la
serie de tres pruebas t resulte significativa por equivocacin, es aproximadamente del 15%. Con
cuatro grupos, podra haber seis comparaciones. Lo cual significa que si usramos el nivel 0,05
para cada prueba, tendramos un riesgo total de casi el 30% de que, al menos, una resulte signifi
cativa slo por casualidad.2 Ms an, un investigador puede necesitar hacer comparaciones adi
cionales que no comparan simplemente a un grupo con otro; por ejemplo, se puede comparar, el
promedio de tres grupos con un cuarto grupo (tal vez los primeros tres son diferentes tipos de gru
pos experimentales y el cuarto es el grupo de control). La cantidad de comparaciones, aun con
una cantidad bastante pequea de grupos, puede ser considerablemente grande.
La controversia surge cuando los estadsticos intentan ponerse de acuerdo acerca de la mejor
alternativa para no realizar simplemente un puado de pruebas t. Las soluciones disponibles de
penden, en parte, de la situacin.
Comparaciones planificadas
Existe un tipo de situacin que se presenta cuando el investigador ha decidido previamente obser
var unas pocas comparaciones en particular que estn directamente relacionadas con la teora o
con alguna aplicacin prctica. A esto se lo denomina comparaciones planificadas (o, a veces,
comparaciones a priori o contrastes planificados), porque han sido planificadas previamente a
la realizacin del estudio. (Estas comparaciones tambin son lo que habitualmente se denominan
contrastes lineales). Analicemos nuevamente el ejemplo del estudio acerca de los antecedentes
delictivos. El investigador podra decidir previamente que las nicas comparaciones de inters
son a) el grupo que recibi los antecedentes delictivos con el grupo al que se inform que no exis
tan antecedentes delictivos y b) el grupo que recibi los antecedentes delictivos con el grupo que
no recibi informacin i respecto.
2 En realidad, la probabilidad de obtener al menos un resultado significativo por casualidad, de tres, al nivel 0,05, es
0 ,43; y de obtener al menos uno de seis, es de 0,265. La frmula para tres pruebas e s ! - (1 - ot)(l - ot){l - a ), en don
de a representa el nivel de significacin. Adems, es evidente que toda esta cuestin est muy relacionada con e l tema
de demasiadas pruebas r que analizamos en el captulo 10. La cuestin planteada en ese captulo se refera a dos gru
pos con diferencias en varias variables. En este caso, estamos hablando de diferencias entre varios grupos en cuanto a
una variable. Por supuesto, algunas veces se presentan a la vez varios grupos y varias variables.
Comparaciones p o s t
hoc
Una situacin muy diferente a la de las comparaciones planificadas es aquella en la que, des
pus de haberse realizado el estudio, el investigador simplemente busca entre los resultados
tratando de descubrir cules son los grupos que difieren entre s. A estas comparaciones se las
denomina comparaciones post hoc (o comparaciones a posteriori), porque no se planifican
previamente,
Cuando se realizan comparaciones post hoc, se deben tener en cuenta todas las posibles com
paraciones para calcular la probabilidad total de que cualquiera de ellas resulte significativa. Por
ese motivo, utilizar el procedimiento Bonferroni para las comparaciones post hoc es seguro, pero
cualquiera de las comparaciones presenta muy baja potencia. El nivel 0,05 se divide en tantas par
tes que, obtener alguna comparacin significativa, sera extremadamente raro. Por lo tanto, los es
tadsticos han desarrollado una variedad de procedimientos para utilizar en estas bsquedas
exploratorias. Los procedimientos mencionados intentan mantener el alfa general a un nivel cer
cano al 0,05, sin reducir de manera demasiado drstica la potencia. Algunos de estos procedi
mientos aparecen en las publicaciones descriptos por los nombres de aquellos que los desarro
llaron; los mtodos Scheff, Tukey, Heuman-Keuls y Duncan son ios ms utilizados. An se dis
cute qu procedimiento es ms conveniente en distintas condiciones. Las distintas posibilidades y
controversias acerca de este tema son tratadas en cursos de estadstica de nivel medio.
(12-4)
Analicemos una vez ms el estudio referido a los antecedentes delictivos. En ese ejemplo, la
suma de las desviaciones cuadrticas de las observaciones con respecto a la gran media era
107,33, y la suma de las desviaciones cuadrticas de las medias de los grupos de las observacio
nes con respecto a la gran media era 43,44. Por lo tanto, la proporcin de la variacin total expli
cada por la variacin entre los grupos es 43,44/107,33 40%. Se expresa bajo la frmula,
r 2 = _jEbS-. SCxotai
..yI 4 ~ o 40
1 0 7 ,3 3
Qu sucede si, como ocurre con frecuencia en los estudios publicados, las sumas de los cuadrados
no estn disponibles. Tambin es posible calcular R2 directamente a partir de F y de los grados de
libertad. La frmula es la siguiente:
*2 =
-----(J7)(^Emre}+^Dentro
(i 2-5)
t o W
e ntre)________
8 ,1 4
8 ,1 4
8 ,1 4 + 1 2
2 0 ,1 4
(4 ,0 7 ){2 )
( 4 ,0 7 ) ( 2 ) + 1 2
4 La relacin exacta entre R2 y f e$ R2 = / 2/( 1 + f 1) y f = '!R2/( i- R2). Sin embargo, si intentamos calcular una a partir
de la otra utilizando informacin tomada de un estudio real, tos resultados no coincidirn exactamente con lo que obte
nemos cuando calculamos cada una directamente. Esto ocurre porque / se basa en desvos estndar de poblacin esti
mados, y R 1 es una descripcin directa de informacin de la muestra.
'
T a b la 1 2 -6 .
R e g la s d e C o h e n p a r a ta m a o s d e l e fe c t o e n u n a n lis is d e v a r ia n z a d e u n c r ite r io .
T a m a o d e l e fe cto
P equeo
M e d ia n o
G ra n d e
0 ,1 0
R
R2
O JO
0 ,0 1
0,2 5
0 ,2 4
0 ,0 6
0,40
0,37
0 ,1 4
Tambin debemos saber que otro nombre comn para esta medida dei tamao del efecto (ade
ms de J?2) es T|2, la letra griega eta al cuadrado; rj2 tambin se conoce como razn de corre
lacin.
T a b la 1 2 -7 .
Medias de subescalas de amor correspondientes a los tres estilos de vinculacin (muestra tomada
de un peridico).
N o m b r e esca la
Felicidad
Amistad
Confianza
Tem or al acercam iento
A ceptacin
Extrem os em ocionales
C elos
Preocupacin obsesiva
Atraccin sexual
D eseo de unin
D eseo de reciprocidad
Amor a primera vista
E v a siv o
3.1 9
3 .1 8 ,
3,1
2 ,3 0
2 ,8 6 a
2 ,7 5 ,
2 ,5 7 ,
3 .0 1 ,
3 ,2 7 a
2 ,8 1 a
3 ,2 4 a
2 ,9 1 a
A n sio so a m b iv a len te
3 .3 1 ,
3,19
3 .1 3 ,
2,15
3 ,0 3 b
3,Q5b
2 ,8 8 h
3 ,2 9 b
3 ,4 3 b
3.25
3 ,5 5 b
3 ,l 7 b
Seguro
3,5 l b
3 ,5 0 b
3,43
1,88
3 ,0 1 ,
2,36
2 ,1 7 ,
3 .0 1 ,
3,27
2 .6 9 ,
3 ,2 2 a
2 ,9 7 a
F (2 ,5 7 1 )
14,21***
2 2,96***
16,21***
22,6 5 * * *
4 ,66**
27,54***
43,9 1 * * *
9,47***
4S*
22,6 7 * * *
14,90***
6,00**
Nota: Dentro (le cada fila, las medias con diferentes subndices difieren segn el nivel 0,05 de significacin, de acuerdo
con la prueba de Scheff,
*p < 0,05; * * p < 0,01; ***p < 0,001.
Fuente: Hazan, C, & Shaver, P. (1987), tab, 3. "Amor romntico conceptuado como un proceso de vinculacin. R e v is
ta d e P s ic o lo g a S o c i a l y d e la P e r s o n a lid a d ( J o u r n a l o f P e r s o n a lity a n d S o c i a l P s y c k o lo g y ] , 52,5 1-524. Copyright,
1987, por la Asociacin Americana de Psicologa. Reimpreso con autorizacin.
Tabla 12-8.
Estudio 2: medias y desviaciones estndar correspondientes a las caractersticas de los participantes.
M (y S D ) p o r G r u p o
Pnico
Angustia
Generalizada
Fobia
Social
(n ==33)
40, l b (9,6)
49,5b (9,5)
(n ==73)
STA
(n = 45)
33,0a (7,1)
48,8b (12,1)
34,9a (8,9)
46,4b (10,0)
( ==45)
33,0a (6,9)
29,2a (5,4)
Inventario de depresin
de Beck
VAS-Ansiedad
VAS-Depresin
VAS-Felicidad
15,3b (: m
23,0b OS,6)
21,8b (21,1)
53,1b (16,3)
18,3c (10,2)
28,8b (22,1)
' 29,4b (21,1)
55,7b (17,0)
(7,8)
12,8b
25,0b (18,2)
24,7b (18,5)
53,0b (17,1)
2, l a (2,2)
5,6a (9,4)
8,2a (11,3)
74,5a (15,1)
Variable
Edad
No pacientes
Nota: Las medias con diferentes subndices difieren significativamente ( p < 0,01): STai { S ta te - T r a it A n x ie t y In v e n o ry ,
S ta te S u b s c a t e , Inventado de ansiedad o estado, subescala de estado); vas ( V is u a l a n a l o g m s c a l e , Escala anloga v i
sual).
Fuente: Clark, D. M,, et al. (1997), tab, 3, Malas interpretaciones de sensaciones corporales en enfermos con pnico.
R e v is ta d e p s i c o l o g a c ln ic a y c o n s u ltiv a ( J o u r n a l o f C o n s u ltin g a n d C li n i c a l P s y c h o lo g y ] , 6 5 ,2 0 3 -2 1 3 . Copyright,
1997, por la Asociacin Americana de Psicologa. Reimpreso con autorizacin.
Tabla 12-9.
Efectos del tipo de relaciones.
T ip o d e rela ci n
N in g u n a
M e d id a d e p e n d ien te
P otencia conductora de la piel
D e se o de con ocer al objetivo
A tractivo fs ic o percibido del objetivo
14,6 b
154,
Casual
Exclusiva
1 9 ,l b
15,3 b
1 7 ,l b
15,8,
11.2,
13,8a
N o ta ; L o s nmeros m s altos reflejan m ayor excitacin, deseo d e conocer ai objetivo y atractivo percibido; para
io s d os ltim os te m s , el rango posible era 1 -1 9 . D entro de cada fila, las m edias con diferentes subn dices difie
ren significativam ente (p < 0 ,0 5 ), prueba de rango m ltiple d e Duncan.
F u en te: M iller, R . S. (1 9 9 7 ), tab. 4. "D esatento y satisfecho; com prom iso en la relacin y atencin a alternati
vas . Revista sobre Psicologa Social y de Personalidad [Journal of Personality and Social Psychology] , 7 3 ,
7 5 8 -7 6 6 . C opyright, 1997, por la A so cia ci n Am ericana d e P sicologa. R eim preso con autorizacin.
Existe un enfoque alternativo del anlisis de vaxianza, qtie se denomina modelo estructural. En el
enfoque del modelo estructural, la desviacin de cada observacin con respecto a la gran media
se divide en dos partes: a) la diferencia entre el valor observado y la media de su grupo y b) la di
ferencia entre la media de su grupo y la gran media. Estas desviaciones, al elevarse al cuadrado y
sumarse y dividirse por los grados de libertad adecuados, dan las mismas estimaciones de las varianzas intragrupaies e intergrupales que las obtenidas utilizando el mtodo del captulo 11. Sin
embargo, el modelo estructural es ms flexible y puede aplicarse a estudios con muestras de ta
maos desiguales.
Los clculos realizados a travs del modelo estructural usualmente estn resumidos en una
tabla del anlisis de varianza, con una columna para la fuente de variacin (intergrupal, inragrupal y total), las sumas de desviaciones cuadrticos (SC), los grados de libertad (gl)> las estimacio
nes de la varianza poblacional (CM, que es igual a SClgl) y F (que es igual a CMEn(J CMDentt0).
Los supuestos son los mismos que los de cualquier anlisis de varianza, aunque el anli
sis con grupos de tamaos desiguales es un poco ms sensible a los Incumplimientos de los
supuestos.
Un anlisis de varianza es seguido generalmente de comparaciones mltiples, planificadas o
post hoc, las cuales analizan las diferencias entre pares o subgrupos especficos de medias. Dichas
comparaciones tienen que protegerse contra la posibilidad de obtener algunos resultados significa
tivos slo por casualidad, debido a que pueden realizarse una gran cantidad de comparaciones.
La proporcin de varianza explicada (i?2), tambin denominada eta cuadrado (rj2), es una me
dida del tamao del efecto del anlisis de varianza. Es 5CE[ltre dividida por
Algunos expertos recomiendan que en lugar de utilizar un anlisis de varianza para realizar
comparaciones difusas y generales entre varias medias, los investigadores deberan planificar
previamente la realizacin de comparaciones planificadas especficas, apuntadas directamente a
las cuestiones tericas.
Trminos clave
-
Ejercicios
Los ejercicios implican la realizacin de clcu
los (con la ayuda de una calculadora). La ma
yora de los problemas estadsticos reales se
resuelven por computadora, pero aunque exista
la posibilidad de utilizarla, es conveniente reali
zar estos ejercicios manualmente para incorpo
rar el mtodo de trabajo.
Para adquirir prctica en la utilizacin de
una computadora, para resolver problemas esta
dsticos, se puede utilizar la seccin de compu
tacin de cada captulo, publicada en la Gua de
estudio y libro de tareas de computacin para el
alumno {Studenfs Study Guide and Computer
Workbook] que acompaa este libro.
Todos los datos de esta seccin son ficti
cios (a menos que se especifique lo contrario).
Las respuestas a los ejercicios de la serie I
se encuentran al final del libro.
SERIE 1
1.
Los datos mostrados a continuacin son
los mismos que aparecen en el ejercicio 2 de la
serie I del captulol 1. Resuelva el mismo pro
blema utilizando el mtodo del modelo estruc
tural y compare su respuesta con la respuesta
lograda en el captulo 11 (utilice el nivel 0,01).
Asegrese de mostrar sus clculos y de incluir
una tabla del anlisis de varianza.
Grupo 1
8
8
7
9
Grupo 2
6
6
5
7
Grupo 3
4
4
3
5
2,
Calcule un anlisis de varianza para
siguientes datos (al nivel de significacin del
1%). Asegrese de mostrar sus clculos y de
incluir una tabla del anlisis de varianza.
los
puntuaciones atribuidas generales son 13,8,10
y 9; tres programas que utilizan el mtodo B,
en el cual sus puntuaciones atribuidas son 5, 7
y 6, y otros tres programas que utilizan el m
todo C, en el cual sus puntuaciones atribuidas
Grupo 1 Grupo 2 Grupo 3 Grupo 4
son 4, o y 2. Sobre la base de esas muestras,
71
82
68
78
deberamos concluir que los programas que
67
82
70
76
utilizan diferentes mtodos tienen diferentes
82
grados de efectividad? Utilice el nivel 0,05.
3.
Para cada una de ios siguientes conjun
Escriba un informe a una comisin del gobier
tos de datos, calcule a) las medias de cada gru no explicando sus conclusiones. El informe
po, b) un anlisis de varianza utilizando el debera escribirse de forma tal que lo compren
mtodo del modelo estructural (al nivel de sig dan funcionarios que tal vez nunca hayan asis
nificacin del 5%) y c) R2. (Al realizar el paso tido a un curso sobre estadstica.
b, asegrese de mostrar todos sus clculos y de
6.
Van Lange et al. (1997) realizaron un e
incluir una tabla del anlisis de varianza).
tudio en el que los participantes tomaban parte
en una tarea de juegos estndar. En la tarea de
Grupo 2
Grupo 1
Grupo 3
juegos, el participante realiza una serie de deci
0
1
(0
3
siones en cuanto a otorgarse puntos a s mismo o
4
1
2
a otra persona. Utilizando los resultados de esta
2
5
3
tarea, se puede clasificar a cada participante se
Grupo 3
Grupo 1
Grupo 2
gn su orientacin en cuanto a valores socia
0
1
( )
3
les' como pro-social (tiende a ser cooperativo
5
0
3
2
y favorecer resultados igualitarios para s mismo
1
2
4. Un investigador est interesado en los y para otros), "individualista (busca obtener la
niveles de autoestima de profesores de tres ma mayor cantidad posible para l mismo sin preo
terias diferentes. Los niveles de autoestima de cuparse por el resultado logrado por otros) o
los cuatro profesores de lengua analizados fue competitivo (se preocupa porque su resultado
ron 2, 2, 3 y 5. Los niveles de autoestima de los sea mejor al de los dems). Una de las hiptesis
tres profesores de matemtica analizados fue de Van Lange et al. estableca que las personas
ron , 4 y 5. Los niveles de autoestima de los pro-sociales tendran ms hermanos que los
cinco profesores de ciencias sociales analiza integrantes de los otros dos grupos. Sus resulta
dos fueron 9, 6, 7,10 y 13. Sostienen los re dos mostraron un efecto significativo general,
sultados una diferencia en los niveles medios F(2,535) = 4,82, p < 0,01. (p. 739) Luego, lo
de autoestima de los tres distintos tipos de pro informan de la siguiente forma:
fesores (al nivel 0,05)?
Coherentemente con la hiptesis que relaciona
a)
Realice el anlisis de varianza. b) Calcu hermanos y carcter pro-social de la persona
le R2. c) Explique su respuesta a alguien que
la cantidad de hermanos es mayor en el caso de
comprende los conceptos de media, varianza y
las personas pro-sociales (M = 2,03, SD ~ 1,56)
varianza poblacional estimada (incluyendo las
que en caso de ios individualistas (M ~ 1,63,
nociones de muestra, poblacin y grados de li
SD = 1,00) y los competitivos (M= 1,71, SD = 1,35).
bertad), pero que no sabe nada ms sobre esta
Comparaciones planificadas realizadas poste
dstica.
riormente revelaron un contraste significativo
5. Un estudio comparaba la efectividad de
entre pro-sociales versus individualistas y com
los programas de prevencin del abuso de dro
petitivos, F(l, 535) = 9,14,p < 0,005. Las dife
gas. En toda Norteamrica existen cuatro pro
rencias entre individualistas y competitivos no
gramas que utilizan el mtodo A, en el cual sus
fueron significativas, (pp. 739-740)
SERIE II
(ii)
Grupo 1
0
2
Grupo 2
0
2
Grupo 3
4
6
Tabla 12-10.
Medias de registros en cuanto a la ayuda, la preocupacin emptica y la entereza como una funcin
del nivel de cercana de la relacin y de la situacin de necesidad.
Situacin de necesidad
Estudio 1: Desalojo
Ayuda
Preocupacin emptica
Entereza
n
Entereza
n
Estudio 3: Llamada telefnica
Ayuda
Preocupacin emptica
Entereza
n
Casi
extrao
1,20
3,04*
1,52*
*
22
4,13
4,42*
1,90*
15
E n te r e z a
n
N i os hurfanos
Ayuda
Preocupacin emptica
Entereza
n
Eamiliar
cercano
4,13h
4,36*
3,16*
22
b
6,63
4,21?
4,52*
20
6,89
4,50?
4,57b
22 e
6.11,
7,96b
5,85b
5,24*
17 c
l,54b
4,55*
4,43*
20 b
9,0lb
5,82b
4,66*
19 b
5,52?
3 ,i r
17 b
1,55.
4,66b
4,66b
19 b
0,80,
2,87*
2,17*
33 *
18
1,77.
3,56
2,16*
27
3,63h
4,34b
3 5*b
19
5,88
4.90L
5,00
20
6,95,
5,66
5,66<3
16
4,15
4,53*
2,40*
20 '
5,36
4,51*
3,02*
23 *
8,23b
5,41*
4,48*bb
19 b
8,83.
6,21b
4,80*
20 *
D esalojo
Ayuda
Preocupacin emptica
0,98 ,b
3,49*,b
3,16*
N ota: Dentro de cada fila, las medias que tienen el mismo subndice no son significativamente diferentes segn la prue
ba de Tukey.
Fuente: Cialdini, R. B., Brown, S. L., Lewis, B, P., Luce, C ,, & Neuberg, S. L, (1997), tab, 1, Reinterpretacin de la
relacin empatia-altruismo: cuando uno en uno es igual a entereza". Revista de Psicologa Social y de Personalidad
{Journal of Personality and Social Psyckologyj.'IX 4 8 1 -4 9 4 . Copyright, 1997, por la Asociacin Americana de Psico
loga. Reimpreso con autorizacin.
jx f
N
( 12- 6)
(S X ,f t (SX;)2 ,
SC Entre"
r m in o ) 2 -------m 2
.^A--------------
ltim o
(12-7)
(12-8)
X v X2... -Xtjnimo son ls va^ores observados en cada grupo, y N v V2,..., nuimo son la cantidad de
observaciones de cada grupo.
La tabla 12-11 muestra los clculos del ltimo ejemplo completo del captulo, con la aplica
cin de estas frmulas. Compare estos clculos con los indicados en la tabla 12-4, en la que se
aplican frmulas de definicin.
Tabla 12-11.
Anlisis de varianza de valores de ansiedad basado aproximadamente en Clark et al. (1997), en el
que se aplican frmulas de clculo para las sumas de las desviaciones cuadrticas. (Datos ficticios).
Mo pacientes
7
8
10
7
49
64
100
49
Pacientes
con pnico
n
10
12
Pacientes
con angustia
generalizada
X
10
12
X1
121
100
144
Pacientes con
fobia social
X
11
11
11
X2
100
144
X3
21
121
121
33
22
244
363
X: 32
262
33
365
XX 32+ 33+22 + 33 = 120
IT- = 262 + 365 + 244 + 363 = 1,234
202
v,
(xxy
14.400 ......
s e T ^ x r - y -1.234-------- = 1.234 ~ - 1.234 - -1.200 = 34
12
12
sce W + W + ..
Elltt0
rt,
n2
IV
n
ltima
1.024 1,089 484 1.089 14,440
12
4 3 2 T 3
=256 + 363 + 242 + 363 -1,200 = 24
^Dentro "T
ro,.i
ral~ 5
24 =10
Entre' 34
33a 120a
3 12
Anlisis de
Varianza
Factorial
; ResumenL; ;
L
1Trnii os clav. Ai- >:- ;'
Ejercicios.
^ Apndice I del.capulp: formulas de
, clculo optativas para el anlisis de
^^^yarj^
Apndice II del capitul: anlisis d
varianza de un criterio con medidas
L V rjK tijdi^
T a b la 1 3 - 1 .
D i s e o f a c t o r i a l u t iliz a d o p o r L a m b e r t e t a l. ( 1 9 9 7 ) .
E sta d o de nim o
oa.
T r is te
N e u tro
Apropiado
a , y . v ;c
Inapropiado
'- y i r f ; r i d
Tabla 13-2.
Posibilidad media de contratacin en el estudio de Lambert et ai. (1997),
Estado de nimo
T r is te
Apropiado
Inapropiado
N e u tro
5,80
5,83 .
6,75 '
atractivo fsico es adecuado. Existen tambin otras posibilidades (sera interesante que el alumno
pensara algunas y razonara su significado en relacin con los temas que estamos estudiando).
Todas aquellas situaciones en las cuales la combinacin de variables tiene un efecto especial
son ejemplos de lo que se denomina efecto interactivo. Un efecto interactivo ocurre cuando el
efecto de una variable depende del nivel de la otra variable. En el estudio de Lambert et a l, exis
ta un efecto interactivo. Si observamos la tabla 13-2 veremos que el resultado fue que los partici
pantes del grupo apropiado-triste presentaban las mayores posibilidades de contratar al solicitante;
el grupo inapropiado-neutro le segua en orden de posibilidad, y los otros dos grupos eran los que
tenan menos posibilidades (estando casi al mismo nivel). Analicemos la parte del resultado en el
que el grupo triste-inapropiado presenta menos posibilidades de contratar que el grupo neutroinapropiado. Esta parte del resultado sostiene la teora del investigador que establece que, cuando
uno se siente triste, puede contrarrestar sus estereotipos. (Qu sucede con el hecho de que el gru
po apropiado-triste sea el que presenta ms posibilidades de contratar? Los investigadores reco
nocieron que este resultado era inesperado y difcil de explicar (p. 1011).
Supongamos que los investigadores haban analizado la calidad del estereotipo y el estado
de nimo en dos estudios separados. Habran llegado a la conclusin de que cada factor tena s
lo un leve efecto. El promedio de posibilidad de contratacin, siendo el estereotipo apropiado, es
6,77 (es decir, el promedio de 5,80 y 7,73 es igual a 6,77), y en los casos en los que el estereoti
po es inapropiado, el promedio es 6,29. La posibilidad promedio de contratacin, en el caso de
los que se sienten tristes, es de 6,78, contra 6,28 de aquellos en la condicin neutra. Por lo tanto,
siguiendo el mtodo de los dos estudios independientes, los resultados importantes se hubieran
pasado totalmente por alto. Los resultados ms importantes estaban relacionados con la combi
nacin de los dos factores. Ya se empieza a percibir la importancia de descubrir los efectos de
la interaccin?
Terminologa
El estudio de Lambert et al. se analizara con lo que se denomina un anlisis de varianza de dos
criterios de clasificacin (el que se aplica a un diseo factorial de investigacin de dos facto
res). Por el contrario, las situaciones que analizamos anteriormente en los captulos 11 y 12 (co
mo el estudio acerca del estilo de vinculacin o el experimento con antecedentes delictivos) eran
ejemplos de estudios analizados utilizando un anlisis de varianza de un criterio. Se dice que
estos estudios tienen un criterio nico de clasificacin porque analizan el efecto de una sola varia
ble (como por ejemplo, el efecto del estilo de vinculacin de una persona o de la informacin
acerca de los antecedentes delictivos del acusado).
Algunos estudios investigan el efecto de tres o ms variables juntas. Por ejemplo, Lambert et
al. tambin queran estar seguros de que sus resultados no estaban afectados por el sexo. Por lo
Figura 13-1.
D is e o factorial d e tres factores u tilizad o en el
e stu d io d e L am bert e t al. (1 9 9 7 ).
tanto, en otro anlisis dividieron cada uno de sus cuatro grupos en dos subgrupos: mujeres y hom
bres. A travs de esa divisin se crearon ocho combinaciones: mujeres tristes con el estereotipo
apropiado, hombres tristes con el estereotipo apropiado, mujeres tristes con el estereotipo inapro
piado, y as sucesivamente. La figura 13-1 representa grficamente la serie completa de agrupa
ciones. El anlisis que describimos estudiaba la influencia de tres variables al mismo tiempo. Se
requieren tres dimensiones para diagramar este tipo de estudios, por eso se lo denomina diseo
factorial de tres factores, (El resultado indic que no se producan efectos significativos relacio
nados con el sexo, ni generales ni en interaccin con el estado de nimo, ni con la calidad del es
tereotipo o la combinacin de los dos). Es posible realizar diseos factoriales de cuatro factores o
ms, aunque no son sencillos de diagramar. Sin embargo, la mayora de las investigaciones psico
lgicas se limitan a diseos factoriales de dos factores y, ocasionalmente, de tres.
En un anlisis de dos criterios, cada variable o criterio de clasificacin (cada dimensin en
el diagrama) es un posible efecto principal. S el resultado de una variable, haciendo un promedio
a travs de las categoras de la otra u otras variables, es significativo, se trata de un efecto princi
pal. Lo anterior es completamente diferente de un efecto interactivo, que se basa en la combina
cin de variables. En el estudio bsico de Lambert et al. en dos sentidos, exista la posibilidad de
dos efectos principales y de un efecto interactivo. Los dos efectos principales posibles son la cali
dad del estereotipo y el estado de nimo, y el efecto interactivo posible es el de la combinacin de
la calidad del estereotipo con el estado de nimo. En un anlisis de varianza de dos criterios,
siempre se prueban dos posibles efectos principales y una posible interaccin.
Cada combinacin de grupos en un diseo factorial se denomina casilla. La meda de ios va
lores observados de cada agrupacin se denomina media de a casilla. Por ejemplo, en el estu
dio de Lambert et al. existen cuatro casillas, por ende, existen cuatro medias de casillas, una para
cada combinacin de los niveles de calidad del estereotipo y del estado de nimo. Es decir,
una casilla se refiere al estereotipo apropiado y al estado de nimo triste (como lo muestra la
tabla 13-2, su media es 7,73); otra casilla se refiere al estereotipo inapropiado y al estado de
nimo triste (5, 83); otra casilla se refiere al estereotipo apropiado y el estado de nimo neutro
(5,80), y otra casilla se refiere al estereotipo inapropiado y el estado de nimo neutro (6, 75).
Las medias segn una sola variable se denominan medias marginales. Por ejemplo, en el es
tudio de Lambert et al. hay cuatro medias marginales, una media correspondiente a todos los parti
cipantes que trabajan con el estereotipo apropiado (como vimos anteriormente, 6,77), una para
todos los participantes que trabajan con el estereotipo inapropiado (6,29), una para todos ios par
ticipantes que se sienten tristes (6,78) y una para todos los participantes con estado de nimo neu
tro (6,28). (Las inedias que acabamos de mencionar no aparecen en las tablas porque estbamos
interesados principalmente en la interaccin).
Para observar el efecto principal debemos concentramos en las inedias marginales. Para
observar el efecto interactivo, debemos concentramos en el patrn de medias de las casillas
individuales.
Reconocimiento e interpretacin de los efectos interactivos
Es muy importante comprender los efectos interactivos, ya que en muchos experimentos constitu
yen el punto principal de la investigacin.
Como ya hemos visto, un efecto interactivo ocurre cuando el efecto de una variable depende
del nivel de otra variable. Los resultados del estudio de Lambert et al. (tabla 13-2) muestran un
efecto interactivo, ya que el efecto de la calidad del estereotipo es diferente con un estado de ni
mo triste que con un estado de nimo neutro.
Un efecto interactivo puede explicarse de tres modos; con palabras, con nmeros o con un
grfico. Podemos describir un efecto interactivo con palabras diciendo que ocurre cuando el efec
to de una variable depende del nivel de otra variable. En nuestro ejemplo de Lambert et al. pode
mos decir que el efecto de la calidad del estereotipo depende del nivel del estado de nimo
(tambin podemos decir que el efecto del estado de nimo depende del nivel de la calidad del es
tereotipo. Los efectos interactivos son completamente simtricos, es decir que podemos descri
birlos desde el punto de vsta de cualquiera de las variables).
Podemos observar un efecto interactivo numricamente analizando el patrn de las medias de
las casillas. Si existe un efecto interactivo, las diferencias de las medias de las casillas de una fila
no sern iguales a las diferencias de las medias de las casillas de la otra fila. Analicemos el ejemplo
de Lambert et al. En la fila del estereotipo apropiado hay una diferencia positiva entre las medias de
las casillas; los participantes que se sentan tristes clasificaron las posibilidades de contratacin
(7,33) mucho ms altas que los participantes con estado de nimo neutro (5,80). En consecuencia,
hay una diferencia positiva de 1,93 (es decir, 7,73 - 5,80 = 1,93). Sin embargo, si observamos la fi
la del estereotipo inapropiado, aquellos que se sentan tristes calificaron la posibilidad de su proba
bilidad de contratacin (5,83) a menor nivel que aquellos con estado de nimo neutro (6,75). La
diferencia entre estado de nimo triste y neutro, para los participantes con el estereotipo inapropia
do, es de -0,92.
La tabla 13-3 indica las medias marginales y de casilla correspondientes a seis posibles resul
tados de un estudio factorial ficticio de dos criterios, que buscaba la relacin de la edad y la edu
cacin con el ingreso. La edad se divide en dos niveles (menores, entre 25 y 29; en contraposicin
con mayores, aquellos que tienen entre 30 y 34) y la educacin en otros dos niveles (secundaria
en contraposicin con universitaria). Los resultados ficticios que presentamos en este caso estn
exagerados con el fin de dejar en claro cundo hay efectos interactivos y cundo efectos principa
les. En la realidad, con frecuencia se encuentran pequeas diferencias de medias en la direccin
de un efecto interactivo o uno principal, que no son lo suficientemente grandes como para ser es
tadsticamente significativas.
Tabla 13-3.
Posibles inedias de resoltados de un estudio acerca de la relacin de la edad y la educacin con el in
greso. (Datos ficticios, miles de dlares).
Educacin
secundaria
Educacin
universitaria
20
20
20
Mayores
Total
20
25
Menores
i
Total
'
Menores
i w
Total
35
Educacin
universitaria
20
3 _
25
Educacin
Educacin
secundaria universitaria
Total
Educacin
secundaria
20 .
: 20
25
15
20
30
Total
. 25
' '40 . . 30
35'
35
Resultado F
Educacin
universitaria
Total
r~---10. OOA: 20
20
40/:A 30
Resultado
10
10
6 \ 60
35
Tota!
30
Resultado D
Mayores
Educacin
secundaria
30
Educacin Educacin
secundaria universitaria
Resultado C
Resultado 8
Resultado A
Educacin
Secundaria
20
Total
3oy.
'' 3" ,
25
Educacin
universitaria
V:
S-V-
40
En el resultado A, existe una interaccin. Observamos que en la fila Menores no existe diferen
cia de ingresos por educacin; pero en la fila Mayores, la media de la casilla correspondiente a
la educacin universitaria es mucho mayor que la media de la casilla correspondiente a educacin
secundaria. Una manera de expresar verbalmente lo anterior sera la siguiente: La educacin no
est relacionada con el ingreso en el caso del grupo Menores5, pero en el caso del grupo M ayo
res', las personas con educacin universitaria ganan mucho ms que aquellas con menor nivel de
educacin".
El resultado ficticio B tambin refleja una interaccin. En la fila Menores", la media de in
greso correspondiente a la educacin secundaria es mayor a la media de ingreso correspondiente
a la educacin universitaria; sin embargo, en la fila Mayores la media de ingreso correspon
diente a la educacin secundaria es menor. Expresado verbaimente, este patrn indica que entre
las personas de menor edad, aquellos con slo una educacin secundaria ganan ms dinero (tal
vez porque ingresaron al empleo con anterioridad o porque las ciases de empleos que desempe
an comienzan con un nivel superior); sin embargo, entre las personas de mayor edad, aquellos
con una educacin universitaria ganan ms dinero.
El resultado ficticio C no refleja un efecto interactivo. En la fila Menores, la media de edu
cacin secundaria es 20 puntos menor que la media de educacin universitaria. Lo mismo ocurre
en la fila Mayores . Expresado en palabras, lo anterior significa que, ya sean menores o mayo
res, las personas con educacin universitaria ganan $20.000 ms.
El resultado ficticio D tampoco refleja interaccin, ya que en ninguna de las filas existe dife
rencia alguna. Independientemente de la educacin, las personas mayores ganan $50.000 ms.
El resultado ficticio E refleja una interaccin. En la fila Menores, la media correspondiente
a la educacin universitaria es 10 puntos mayor; pero en la fila Mayores, la media correspon
diente a la educacin universitaria es 20 puntos mayor. Por lo tanto, si bien entre las personas me
nores, los que tienen educacin universitaria ganan un poco ms, entre las personas mayores, los
que tienen educacin universitaria ganan mucho ms.
Finalmente, el resultado F tambin refleja un efecto interactivo. Existe una diferencia menor
en la fila Menores que en la fila Mayores . Al igual que el resultado E, este patrn indica que,
en el caso de las personas menores, aquellas que tienen educacin universitaria ganan un poco
ms; pero entre las personas mayores, aquellas con educacin universitaria ganan mucho ms.1
La tabla 13-4 indica los posibles resultados de otro estudio ficticio. En este experimento fac
torial, las dos variables manipuladas experimentalmente son el grado de dificultad de la tarea (f
cil en contraposicin con difcil) y el nivel de excitacin psicolgica (baja, moderada o alta). La
excitacin, en este estudio, se refiere al nivel de ansiedad del participante con respecto a la impor
tancia de realizar bien la tarea. La variable que se est midiendo es el nivel de desempeo del par
ticipante en una serie de tareas aritmticas. La interpretacin de las posibles interacciones es la
siguiente:
Resultado A: no hay interaccin. Las medias de las casillas en la fila Fcil no difieren en
tre s, y las medias de las casillas en la fila Difcil" tampoco. S existe un efecto principal: la difi
cultad de la tarea afecta el desempeo; la excitacin no.
Resultado B: no hay interaccin. Las medias de las casillas en la fila Fcil aumentan de a
10, de bajo a moderado y de moderado a alto. Lo mismo ocurre con las medias de las casillas en la
fila Difcil. Nuevamente existe slo un efecto principal: la excitacin afecta el desempeo; la
dificultad de la tarea, no.
Resultado C: no hay interaccin. Las medias de las casillas en la fila Fcil aumentan de a
10, de bajo a moderado y de moderado a alto; lo mismo sucede con las medias de las casillas en la
fila Difcil. En este ejemplo, existen dos efectos principales: la excitacin afecta el desempeo
y la dificultad de la tarea tambin.
Resultado D: existe interaccin. El patrn de las medias de las casillas en la fila Fcil"
muestra un aumento de a 10, de bajo a moderado, y otro aumento de a 10, de moderado a alto. El
patrn que describimos anteriormente no es el mismo que el de las medias de las casillas en la fi
la Difcil", donde nuevamente el aumento es de a 10 de bajo a moderado, pero de 40 de modera
do a alto. Por lo tanto, en todos los casos, el desempeo con tamas fciles o difciles tiende a
mejorar con el aumento de la excitacin. Sin embargo, el impacto entre excitacin alta y modera
da es mucho mayor para tareas difciles que para tareas fciles.
Resultado : existe interaccin. El patrn de las medias de las casillas en la fila Fcil"
muestra un aumento de a 10 y luego una disminucin de a 10. Este patrn es bastante diferente al
de la fila Difcil", donde observamos una disminucin de a 10 y luego un aumento de a 10. En el
caso de las tareas fciles, el mejor desempeo se produce en la condicin de excitacin modera
da; en cambio, para las tareas difciles, el peor desempeo se produce en la condicin de excita
cin moderada.
Resultado P: existe interaccin. En la fila Fcil, las medias de las casillas aumentan a me
dida que avanzamos, mientras que en la fila Difcil disminuyen. En el caso de las tareas fciles,
a mayor excitacin, mejor es el desempeo; en el caso de las tareas difciles, la excitacin inter
fiere con el desempeo. (El resultado F es el ms cercano a un descubrimiento psicolgico bien
fundamentado, el cual se conoce como la Ley de Yerkes-Dodson).
! Sobre la base de las estadsticas realizadas en 1990 p o r la Secretara de Educacin de ios Estados Unidos, 3a situacin
actual en ese pas es muy cercana al resultado F, aunque no tan extrema. En ambas franjas de edad, las personas con
educacin universitaria ganan ms que aquellas que tienen slo educacin secundaria, pero la diferencia e s un poco
mayor en la franja de personas mayores. Sin embargo, es importante recordar que el hecho de que una persona reciba o
no educacin universitaria tambin est relacionado con la ciase social de sus padres y con otros factores que pueden
afectar el ingreso ms de o que lo hace la educacin.
Tabla 13-4.
Algunos resultados posibles de un experimento acerca del efecto del grado de dificultad y la excita
cin sobre el desempeo. (Datos ficticios).
Fcil
R esu ltad o B
Excitacin
Baja Moderada Alta
Total
Excitacin
Baja Moderada Alta
10
Difcil
Total
15
Fcil
v v #
Total
10
'
Total
Excitacin
Baja Moderada Alta
10
10A
10
TiV;
:2a y.
30 y.
20
10
20 :
. (:20 \:U
20 '
20
; 10
20
3 " 20
20 'ri
30
40 ^
10
20
30
15
25
35
15
15
Resultado D
Difcil
R esu ltad o C
20
Resultado E
30-
20
10
'20
:20 '6 0 -
30
20
' 10
15
15
20
45
'
Total
soy
Resultado F
Tarea
R esu lta d o A
13,3
10
'20A;:
1 20 ' 16,7
30
:V-20^
15
20
20
30
10'
20
2 La utilizacin de grficos de barras para representar las medias de las casillas de un anlisis de varianza, cuando exis
te un efecto interactivo, se ha convertido en e l mtodo estndar en los ltimos aos. Anterioimente, era ms comn uti
lizar grficos de lneas. Veremos este tema y ejem plos referidos al mism o en la seccin donde tratamos la descripcin
del anlisis factorial de varianza en las publicaciones cientficas.
rras que representan al grupo Mayores indican un aumento. En los resultados B, las barras que re
presentan al grupo Menores muestran una disminucin, en el caso de la educacin universitaria,
con respecto a la secundaria, mientras que las barras que representan el grupo Mayores muestran
un aumento en el caso de la educacin universitaria con respecto a la secundaria. En los resultados E
y F, tanto las barras que representan al grupo Menores como ai Mayores muestran un aumento,
pero las barras que representan al grupo Menores muestran un aumento menor que las barras que
representan al grupo Mayores.
Analicemos la figura 13-4. Los resultados A, B y C muestran la ausencia de interaccin den
tro de cada resultado, y los patrones de las barras que representan la excitacin baja, moderada y
alta son iguales. En el resultado D existe interaccin, que se refleja en la figura de la siguiente ma
nera: las barras dentro del nivel bajo son parejas al igual que dentro del nivel moderado; pero en
tre las barras que representan el nivel de excitacin alto, hay un aumento en la condicin de tarea
difcil con respecto a la tarea fcil. La interaccin del resultado E se ve en tos aumentos en ios ni
veles bajo y alto de excitacin y, por otro lado, en la disminucin en el nivel moderado de excita
cin. La interaccin del resultado F se refleja en el hecho de que existe un aumento entre las
barras del nivel bajo, mientras que las barras del nivel moderado son parejas, y una disminucin
en la barra que representa la condicin difcil.
La figura 13-5 muestra una alternativa diferente a la de la figura 13-4 en cuanto a la forma de
representar grficamente los resultados de la tabla 13-4. En este caso, hemos agrupado las barras
correspondientes a las condiciones difcil y fcil . Las barras que representan la tarea fcil con
excitacin baja, moderada y alta estn ubicadas una al lado de la otra, y las barras que representan
la tarea difcil, con excitacin baja, moderada y alta, se encuentran tambin una al lado de la otra.
Esta alternativa de agrupacin es completamente equivalente en significado y produce exacta
mente las mismas conclusiones. Por ejemplo, en el resultado A las tres barras de tarea difcil son
parejas, al igual que las tres barras de tarea fcil. En el resultado C, donde tampoco hay interac
cin, las tres barras de tarea fcil aumentan con el mismo patrn que las tres barras de tarea dif
cil. Sin embargo, analicemos el resultado D, donde s existe una interaccin. El patrn de las
Figura 13-2.
Estado d is m o t r ^
Iripropad<5:
n^Cbnce^jiSb'del!
'.- -.
Api^id) :
Resultado A'
6050-;.v
60. '
''
50-
. Resultado C
Resultado B
. '
50-
40-
i Mayores
.'..Metires,;
Mayores-."-..
Nivel educativo
O Eciucacidn secundaria
fH Educacin UnWetsitiiria
Mayores. :
. -\ Menores ..
VA:' ; '
Mayores.
Resiitd F ;
........
Menores.".
"
.... "'.............
/Mayores':'-
Figura 13-3.
barras que representan la tarea fcil es diferente del patrn de las barras que representan la tarea
difcil. Existe un escaln mayor entre la excitacin moderada a alta en las barras de la tarea difcil
que en las de tarea fcil.
Tambin podemos identificar efectos principales a partir de estos grficos. En la figura 13-3,
se mostrara un efecto principal de la edad si las barras que representan al grupo de menor edad
fueran todas ms altas o ms bajas que las barras que representan al grupo de mayor edad. Por
ejemplo, en el resultado C, las barras que representan al grupo de mayor edad son claramente ms
altas que las barras del grupo de menor edad. Qu sucede con el efecto principal de las barras
que no estn agrupadas, como son, en este caso, la educacin universitaria en contraposicin con
la secundaria? En el caso de las barras no agrupadas, debemos observar si el patrn general au
menta o disminuye. Por ejemplo, en el resultado C tambin existe un efecto principal de la educa
cin, porque el patrn general de las barras aumenta en cuanto a la educacin universitaria con
respecto a la educacin secundaria, y lo hace tanto para el grupo de menor edad como para el de
mayor edad. El resultado D muestra un efecto principal de la edad (las barras del grupo de mayor
edad son ms altas que las barras del grupo de menor edad). Sin embargo, el resultado D no mues-
Resultado A
Tarea
Fcil.
Difcil
V.';;
;:; .;v"
Exciiack5ri:v\!:
! Ail
F igura 13-4.
tra un efecto principal de la educacin; el patrn es parejo tanto para las barras que representan al
grupo de mayor edad como para las que representan al grupo de menor edad. El resultado A en la
figura 13-4 muestra un efecto principal del grado de dificultad de la tarea, pero no del nivel de ex
citacin, ya que las alturas promedio de las barras son las mismas para la excitacin baja, modera
da y alta; mientras que dentro de cada nivel de excitacin, las barras aumentan de fcil a difcil.
Relacin entre efectos interactivos y principales
Es posible que cualquier combinacin de efectos principales e interactivos sea significativa. Por
ejemplo, puede ocurrir que todas sean significativas, como lo muestra el patrn del resultado F
en la tabla 13-3, segn el cual observamos que los alumnos mayores ganan ms (efecto principal
de edad), los alumnos universitarios ganan ms (efecto principal del nivel de educacin), y el ni
vel hasta el cual los alumnos universitarios ganan ms depende de la edad (efecto interactivo).
De modo similar, en el resultado D de la tabla 13-4, vemos que, en lneas generales, las per
sonas se desempean mejor en tareas difciles (efecto principal relacionado con la dificultad de
la tarea) y con mayores niveles de excitacin (efecto principal relacionado con el nivel de excita
cin), pero el efecto producido por la dificultad de la tarea slo se observa en relacin con altos
niveles de excitacin (interaccin). (Cabe destacar, de todos modos, que el efecto principal pro
ducido por la dificultad de la tarea, es decir, el mayor promedio logrado al realizar tareas ms di-
Resultado A
viV'
'
' 40
Resultado B
30
20
V'iO
'
Excitacin
:r Excitacin
...
Figura 13-5.
Grficos alternativos (en relacin con la figura 13-4) de los resultados ficticios que aparecen en la tabla 13-4.
fciles, se debe en su totalidad al alto nivel de excitacin. Ms adelante seguiremos tratando este
tipo de situaciones).
Tambin puede existir un efecto interactivo sin efectos principales. El resultado B de la tabla
13~3 es un ejemplo de lo anterior. El nivel promedio de ingreso es el mismo para Menores y
Mayores (no existe efecto principal de la edad), y es el mismo para personas con educacin uni
versitaria o secundaria (no existe efecto principal del nivel de educacin). De manera similar, en
el resultado F de la tabla 13-4, el desempeo promedio es el mismo pralos niveles bajo, modera
do y alto de excitacin (no existe efecto principal del nivel de excitacin), y es el mismo para ta
reas fciles y difciles (no existe efecto principal del nivel de dificultad de la tarea). Sin embargo,
en ambos ejemplos existen claras interacciones.
El ejemplo de Lambed; et al. (1997) que analizamos anteriormente es, en realidad, un ejemplo
de interaccin sin efectos principales (vase tabla 13-2 figura 13-2). Es verdad, que en lneas ge
nerales, los participantes que se sentan tristes calificaron sus posibilidades de contratar de forma
ms alta que los participantes con estado de nimo neutro. Sin embargo, la diferencia no fue lo su
ficientemente importante como para resultar significativa desde el punto de vista estadstico. De
modo similar, la diferencia entre las condiciones en las que el estereotipo era apropiado o inapro
piado no fue lo suficientemente importante como para ser significativa. Es decir, que en ese estu
dio slo el efecto interactivo era significativo. (En la prxima seccin principal veremos cmo se
calcula realmente si un efecto es lo suficientemente importante como para ser significativo).
Tambin puede ocurrir que exista un efecto principal significativo junto con una interaccin,
o slo un efecto principal significativo, o bien que no existan ni efectos principales ni interactivos
que sean significativos. Sera interesante observar cuntas de esas posibilidades se pueden identi
ficar en las dos series de resultados ficticios de las tablas 13-3 y 13-4.
Cuando no existe interaccin, el efecto principal tiene un significado directo. Sin embargo,
cuanto existe una interaccin junto con un efecto principal, debemos ser cuidadosos al sacar con
clusiones acerca del efecto principal. Analicemos el resultado D del ejemplo relacionado con la
excitacin y la dificultad de la tarea (tabla 13-4). Suponiendo que las diferencias son lo suficien
temente importantes como para ser significativas, existen dos efectos principales y una interac
cin. Pero como observamos anteriormente, el efecto principal de la dificultad de la tarea se debe
completamente a la casilla en la que se combinan el alto nivel de excitacin y la tarea difcil. Se
ra engaoso realizar cualquier afirmacin acerca de la comparacin de tareas difciles con tareas
fciles en general, sin tener en cuenta que el efecto realmente depende del nivel de excitacin.
A veces, el efecto principal se mantiene claramente por encima de cualquier interaccin.
Analicemos nuevamente el resultado D del ejemplo acerca de excitacin y dificultad de la tarea.
En ese resultado, el efecto principal de la excitacin se mantiene por encima de la interaccin.
Tanto en el caso de las tareas fciles como de las difciles ocurre que el bajo nivel de excitacin
produce el menor nivel de desempeo, la excitacin moderada produce el segundo desempeo en
la escala, y el nivel alto de excitacin produce el mejor desempeo. (Aun as, existe una interac
cin porque el grado en el cual un alto nivel de excitacin produce mejor desempeo que la exci
tacin moderada es mayor para las tareas difciles que para las tareas fciles).
Figura 13-6.
Diagrama de ayuda para comprender un anlisis de varianza factorial 2x2: (a) estimacin intergrupai co
lumna de a varianza basada en la diferencia entre la media de los participantes en la primera (sombreada) y
la segunda (no sombreada) columna; (b) estimacin intergrupai fila, basada en la diferencia entre la media
de los participantes de la fila superior (sombreada) e inferior (no sombreada), y (c) estimacin intragrupal de
varianza basada en la variacin entre las observaciones de cada casilla.
422
lumnas, pero tambin es posible agrupar las casillas de un modo diferente. La figura 13-7, basada
en el estudio de Lambert et a l, muestra una posible organizacin restante de las cuatro casillas en
dos agrupaciones mayores: a) una agrupacin de dos casillas formada por la casilla superior iz
quierda (estereotipo apropiado y estado de nimo triste) junto con la casilla inferior derecha (este
reotipo inapropiado y estado de nimo neutro), y b) otra agrupacin de dos casillas formada por la
casilla inferior izquierda (estereotipo inapropiado y estado de nimo triste) y la casilla superior
derecha (estereotipo apropiado y estado de nimo neutro). La estimacin intergrupal de la varian
za, segn el efecto interactivo, puede entonces ser determinada a partir de la variacin entre las
medias de estas dos agrupaciones.
Con un diseo 2 x 2 , existe slo una combinacin de pares de casillas que y no fueron teni
das en cuenta por las organizaciones en columnas y en filas, el patrn de agrupacin representado
por el ejemplo en la figura 13-7. Pero con diseos mayores de dos criterios, como por ejemplo un
diseo 2 x 3 , existe ms de una forma de combinar las agrupaciones, y todas deben tenerse en
cuenta. Por eso, calcular la estimacin intergrupal de la varianza a partir de un efecto interactivo,
cuando tratamos con situaciones distintas del diseo 2 x 2 , puede ser bastante complicado. Afor
tunadamente, sucede que calcular la estimacin intergrupal de la varianza, segn el efecto de la
interaccin, es mucho ms directo desde el punto de vista del modelo estructural que aprendimos
en el captulo 12.
F igura 13-7.
F igu ra 3-8.
SCFlte = S(MF,to-GM}2
(13-1)
C 3' 2)
Interaccin =
% ,
,,9
(13-3)
SCDe[,tr0=X(X~A)2
03-4)
SCToa =S.(X~GM)
(13-5)
En las frmulas anteriores. SCFltos, 5CColumn, S C aata6a y S C D am son las sumas de los cuadrados de las filas, de las columnas, de las interacciones y de las intragrupales de las casillas.
El signo suma (X) indica que se deben sumar todas las observaciones que corresponden (no
slo todas las filas o columnas o casillas). GM es la gran media; X es la observacin; AfPia y
^Columnason *as meclias de la fila o la columna de una observacin, y M es la media de la casi
lla de una observacin.
Como es usual, las diferentes sumas individuales de cuadrados forman la suma total de cua
drados. (Este dato se puede utilizar para controlar los clculos aritmticos). La frmula es la si
guiente,
^Total ~ apilas + ^Coiumnas + ^Interaccin ^Dentro
(13-6)
Las frmulas de las estimaciones de la varianza poblacional son, por lo general, las sumas de los
cuadrados divididas por los grados de libertad;
<SC*fFas
(13-7)
Filas
<?2
A ruA
^ Columnas
-'Columnas0
Coluroas ~~
Sl Columnas
(13-8)
SL *6 6 C M lnKtacc6 =
(13-9)
sL w o 6
^nieraccion
= i rs
(I3. 10)
%^Dentro
r2
0 fulas
Columnas ~
$Dentro
interaccin
C^Filas
L^Dentro
-Columnas a
c2
u
S Dentro
(13-11)
^Columnas
interaccin a
2
-'Dentro
(13-12)
Dentro
Interaccin
(13-13)
"^Dentro
En Las frmulas anteriores, FPias es la razn F del efecto principal de las filas; FColuranas es la ra
zn F del efecto principal de las columna, y FMeraccin es la razn F del efecto interactivo.
Antes de seguir avanzando, es necesario que veamos cmo se calculan los distintos grados de
libertad y cmo se disea la tabla del anlisis de varianza.
Grados de libertad en el anlisis de varianza de dos criterios
Grados de libertad de las estimaciones intergrupales de varianza a p artir de los efectos
principales. Los grados de libertad de cada efecto principal (cada estimacin intergrupal de va
rianza) son iguales a la cantidad de niveles de la variable menos 1. Por ejemplo, si existen dos ni
veles, como sucede en cada efecto principal en el estudio de Lambert et al, hay 1 grado de
libertad. En los ejemplos que analizamos anteriormente, relacionados con los niveles de excita
cin y de dificultad de la tarea, el efecto principal de las columnas (nivel de excitacin) tena tres
niveles y, por lo tanto, ese efecto principal tena 2 grados de libertad.
Lo anterior se expresa bajo las siguientes frmulas,
o Columnas = ^Columans *
(1 3 -1 4 )
y
^Filas ~ ^Filas
(1 3 -1 5 )
^Columnas ~~ ^Fiias ~ ^
(1 3 -1 6 )
~1
4 1
1 1
1
- 1 2
(13-18)
^Total ~ N ~ 1
Tambin podemos calcular los grados totales de libertad sumando todos los grados individuales
de libertad (los de las columnas, de las filas, de la interaccin y de las intragmpales). Teniendo en
cuenta lo anterior, podemos controlar los clculos aritmticos realizados al calcular los grados de
libertad. La frmula es la siguiente,
(13-19)
Tabla para un anlisis de varianza de dos criterios
La tabla del anlisis de varianza de un anlisis de dos criterios es similar a la que hemos visto en
el captulo 12 (donde estbamos realizando anlisis de varianza de un criterio). Sin embargo, con
un. anlisis de varianza de dos criterios se incluye una lnea para cada efecto intergrupal. La tabla
13-5 muestra el diseo.
Tabla 13-5.
Diseo de una tabla de anlisis de varianza para un anlisis de varianza de dos criterios^
F u en te
Intergrupa;
Colum nas
Filas
Interaccin
Interacciones
Totai
SC
gl
CM
Fitos
se
".interaccin
^ D e a ito
^Columnas
g Fta
^interaccin
^Dentro
^^Coiumnas
C M ^
^ T o ta l
S^Totai
ir "1
" interaccin
^ D e n tro
V
Columnas
MFilas
^Interaccin
Tabla 13-6.
Medias de casillas y marginales de la cantidad de veces que se encontr a los participantes en
actividades sociales.
D eseo d e r elacin
B a jo
| M u c h a c h o s j-10,30
M u c h a c h a s [ '15,75
13,03
A ito
9,22
9,76
18,51;
17,13
13,87
13,45
Tabla 13-7.
Observaciones, desvos cuadrticos y sumas de desvos cuadrticos de los datos ficticios basados en el
estudio de Wong y Csikszentmihatyi (1991).
Bajo nivel de deseo de relacionarse
(^ColuimuI
X
(X -G M f
(X -M f
-G M )-
JNT-
~ GM f
Muchachos
12,1
8,8
1.82
4,20
5,06
6,50
9,92
13,32
14,06
15,60
17,22
21,62
103,0
109,32
11,4
11,2
10,9
10,3
9,8
9,7
9,5
9,3
Muchachas
17,4
15,60
13,32
17,1
11,22
16,8
10,56
16,7
4,20
15,5
3,42
15,3
2,40
15,0
3,80
15,4
0,72
14,3
14,0
0,30
65,54
157,5
0,56
0,12
2,10
3,06
12,64
9,20
0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,92
0,92
0,92
0,92
1,80
9,20
0,92
0,92
0,92
0,92
0,92
0,92
0,92
0,92
0,92
0,92
22,0
20,5
19,9
19,1
18,5
17,4
17,0
17,1
17,1
16,5
73,10
49,70
41,60
31,92
25,50
15,60
12,60
13,32
13,32
9,30
2,72
3,96
1,93
0,35
1,23
2,28
1,99
1,99
4,04
13,54
13,54
13,54
13,54
13,54
13,54
13,54
13.54
13,54
13,54
1,80
9,20
185,1
285,96
29,95
135,40
135,40
0,20
1,80
0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18
13.54
13,54
13,54
13,54
13,54
13,54
13,54
13,54
13,54
13,54
1,10
0,92
0,92
0,92
0,92
0,92
0,92
0,92
0,92
0,92
0,92
14,50
2,74
1,82
0,90
0,06
0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18
193,42
1,80
1,00
13,62
13,62
13,62
13,62
13,62
13,62
13,62
13,62
13,62
13.62
136,20
92,2
136,20
0,25
0,36
0,64
INT*
9,20
2,25
10,12
0,00
-G M )'
8,2
6,6
0,92
0,92
0,92
0,92
0,92
0,92
0,92
0,92
0,92
0,92
0,81
0,36
11,1
10,2
(^Columna
3,53
1,39
0,96
0,34
0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18
0,18
1,21
^fi'a
-G M f
5,52
9,30
10,56
13,32
18,06
18,92
20,70
22,56
27,56
46,92
13,62
13,62
13,62
13,62
13,62
13,62
13,62
13,62
13,62
13,62
3,24
(X -G M )1 ( X -M f
10,4
9,8
9,2
9,1
8,9
8,7
0,00
0,01
0,10
0,27
1,04
6,86
0,00
0 ,9 2
0,92
0,92
0,92
0,92
0,92
M h
Ejemplo de los clculos de desvos utilizando la primera observacin en la casilla correspondiente a los muchachos
con bajo nivel:
(X -G M f *
GMf
GMf~
T a b la 1 3 - 8 .
C lc u lo d e u n a n lis is d e v a r ia n z a u t iliz a n d o s u m a s d e c u a d r a d o s , s o b r e la b a s e d e l e s t u d io d e
W o n g y C s i k z e n t m i h a l y i ( 1 9 9 1 ) . ( D a t o s F i c t i c i o s ) . *1
F punto d e corte para el efecto principal del sex o ( g l = 1 ,3 6 ; p < 0 ,05) ~ 4 ,1 2 ( g l = 1, 35 de la tabla)
F punto de corte para el efecto principal de deseo de relacionarse para (g = 1, 36; p < 0 ,0 5 ) = 4 ,1 2
F punto de corte para e l efecto Interactive ( g l = 1 , 36; p < 0 ,0 5 ) = 4 ,1 2
F u en te
SC
S exo
54 3 ,2 0
D e se o de relacionarse
7 ,2 0
S ex o por d eseo de relacionarse 3 6 ,8 0
67,21
Dentro de las casillas
si
1
1
1
36
CM
543,20
7,20
36,80
. 1,87
2 9 0 ,4 8
3,85
19,68
La tabla 13-8 muestra los valores correspondientes al punto de corte F y a la tabla del anlisis de
varianza. La figura 13-9 representa los resultados grficamente. Analizaremos el ejemplo si
guiendo el procedimiento habitual de prueba de hiptesis paso a paso.
1.
Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de las
poblaciones para cada efecto principal y efecto interactivo. Existen cuatro poblaciones:
Poblacin 1,1: muchachas que tienen un nivel bajo de deseo de relacionarse.
Poblacin 1,2: muchachas que tienen un nivel alto de deseo de relacionarse.
Poblacin 2,1: muchachos que tienen un nivel bajo de deseo de relacionarse.
Poblacin 2,2: muchachos que tienen un nivel alto de deseo de relacionarse.
La primer hiptesis nula establece que las poblaciones combinadas de muchachas (poblacio
nes 1,1 y 1,2) tienen la misma media que las poblaciones combinadas de muchachos (2,1 y 2,2),
en cuanto a la cantidad de veces que se involucraron en actividades sociales. Esta es la hiptesis
nula que prueba el efecto principal del sexo (muchachas en contraposicin con muchachos). La
hiptesis de investigacin establece que las poblaciones de muchachas y de muchachos tienen di
ferentes medias.
Figura 13-9.
G rfico de lo s datos fic tic io s (sim p li
fic a d o s) b asados e n lo s resultados d el
e stu d io d e W o n g y C sikszentm dhalyi
(1 9 9 1 ).
La segunda hiptesis nula establece que las poblaciones combinadas de aquellos con bajo de
seo de relacionarse (poblaciones 1,1 y 2,1) tienen la misma media que las poblaciones combina
das de aquellos con alto deseo de asociacin (poblaciones 1,2 y 2,2), con respecto a la cantidad de
veces que se involucraron en actividades sociales. Esta es la hiptesis nula que prueba el efecto
principal del deseo de relacionarse (bajo en contraposicin con alto). La hiptesis de investiga
cin establece que las poblaciones con alto y bajo nivel de deseo de relacionarse tienen diferentes
medias.
La tercer hiptesis nula establece que la diferencia entre la cantidad media de actividades so
ciales de las dos poblaciones de muchachas (poblacin 1,1 menos poblacin 1,2) ser la misma
que la diferencia entre las medias de las dos poblaciones de muchachos (poblacin 2,1 menos po
blacin 2,2). Esta es la hiptesis que prueba el efecto interactivo. (Tambin podra haberse plan
teado, sin cambiar el significado, como la diferencia entre las dos poblaciones con bajo nivel de
deseo, igualando la diferencia entre las dos poblaciones con alto nivel de deseo). La hiptesis de
investigacin establece que estas diferencias no sern iguales.
2. Determ inar las caractersticas de las distribuciones comparativas. Las tres distribucio
nes comparativas sern distribuciones F. Los grados de libertad de ios denominadores sern la su
ma de los grados de libertad de cada una de las casillas (la cantidad de observaciones de la casilla
menos 1). En este caso, hay 10 participantes en cada una de las cuatro casillas, es decir, 9 grados
de libertad por casilla; queda un total de 36. El numerador de la distribucin comparativa del
efecto principal del sexo tiene 1 grado de libertad (2 filas menos 1); el numerador del efecto prin
cipal del deseo de relacionarse tambin tiene 1 grado de libertad, y el grado de libertad del nume
rador del efecto interactivo es, nuevamente, 1 (es la cantidad de casillas, 4, menos los grados de
libertad de las columnas, menos los grados de libertad de las filas, menos 1). Como control de la
precisin del clculo de los grados de libertad, los tres numeradores ms los grados de libertad del
denominador son igual a 1 + 1+ 1+ 36 = 39; lo que es igual al total de grados de libertad calcula
dos como la cantidad de participantes menos 1 (es decir, 40 - 1 = 39).
3. Determinar los puntos de corte en las distribuciones comparativas, a p artir de los
cuales debera rechazarse cada hiptesis nula. Utilizando el nivel 0,05 de significacin, la ta
bla B-3 indica un punto de corte para 1 y 35 grados de libertad de 4,12 (el ms cercano disponible
en la tabla debajo de 1 y 36). Los grados de libertad y el nivel de significacin son los mismos, en
este caso, para ambos efectos principales y para el efecto de interaccin; por lo tanto, el punto de
corte tambin es el mismo para los tres efectos.
4. Determ inar los valores m ustrales en cada distribucin comparativa. Este paso re
quiere el clculo de tres razones F, que, como hemos visto, requiere calcular primero varios des
vos, elevarlos al cuadrado y sumarlos. La tabla 13-7 indica los desvos cuadrticos de cada
participante.
Para ahorrar espacio, la tabla indica slo los desvos cuadrticos. Sin embargo, debajo de la
tabla de desvos cuadrticos mostramos un ejemplo de la forma de clculo de los desvos cuadr
ticos de la primera observacin. Dos consejos son especialmente tiles para el clculo del desvo
en el efecto interactivo: a) se debe prestar mucha atencin a los signos de los cuadrados que se es
tn restando y b) no se debe olvidar que el desvo interactivo, antes de elevarse al cuadrado, se
calcula a partir de los desvos originales no elevados al cuadrado, y no de los desvos cuadrticos.
Despus los desvos cuadrticos individuales se suman para obtener 5CTotai, y as sucesiva
mente, como lo indica la siguiente parte de la tabla 13-7. Es importante recordar que las sumas de
los distintos desvos cuadrticos (CDemro SCFiias, SCColumoas, SCImeracdJ conforman el desvo
cuadrtico total. Sin embargo, si tomamos a un slo participante, los distintos desvos cuadrticos
no dan el desvo cuadrtico general a la observacin con respecto a la gran media. La tabla 13-7
tambin indica el control de la exactitud de los clculos: la suma de ios desvos cuadrticos con
respecto a la gran media es igual al total de las sumas de las otras cuatro clases de desvos cuadrticos (teniendo en cuenta las diferencias de redondeo),
Existe otro detalle importante con respecto a los clculos, que se indican en la tabla 13-7. Co
mnmente, en un anlisis 2 x 2 todos los desvos cuadrticos de las filas son iguales (como lo son
todos los desvos cuadrticos de las columnas y todos los desvos cuadrticos de la interaccin).
La pequea diferencia (136,20 contra 135,40) entro los desvos cuadrticos de las filas de la parte
inferior y las de la parte superior se debe simplemente a diferencias de redondeo al calcular las
medias de las filas.
Los siguientes pasos se indican en la tabla 13-8 del anlisis de varianza. Primero, ingresamos
la suma de los desvos cuadrticos de la tabla anterior para cada estimacin de la varianza, y ade
ms los grados de libertad del paso 2. Despus utilizamos esos datos para calcular el resto de la
tabla (los cuadrados medios y los valores F). Las conclusiones se indican en el extremo derecho
de la tabla y se detallan en el punto 5.
5.
n u las.
La razn F calculada para el efecto principal del sexo, de 290,48, es mucho mayor que el
punto de corte de 4,12. Por lo tanto, podemos rechazar la hiptesis nula que establece que las poblciones de muchachas y muchachos tienen la misma cantidad media de actividad social. Es de
cir, el efecto principal del sexo es significativo. El F de 3,85, correspondiente al efecto principal
de la necesidad de relacionarse, no lleg ai 4,12, punto de corte necesario. Se puede decir que es
te efecto se ha acercado a la significacin pero no la ha alcanzado. Finalmente, el efecto interacti
vo F de 19,68 excede el punto de corte de 4,12; por lo tanto, el efecto interactivo tambin es
significativo. (En el estudio real se encontr el mismo patrn bsico, el efecto principal del sexo y
el efecto interactivo eran significativos, mientras que el efecto principal del deseo de relacionarse
se acerc pero no lleg a la significacin). Antes de continuar, seria una buena idea que el alumno
intentara explicar con palabras el significado de esta interaccin.
La figura 13-9 representa grficamente el patrn de medias. Como podemos observar en el
grfico (y por las medias de casillas de la tabla 13-6), el efecto principal del sexo se debe a que las
muchachas participan en ms actividades sociales que los muchachos. El efecto interactivo se de
be a que el deseo de relacionarse est asociado con la mayor cantidad de actividad social de las
muchachas, pero bsicamente no relacionado con la cantidad de actividades sociales de los mu
chachos. Es decir, exista una diferencia entre la cantidad de actividades de muchachas con alto
nivel y aquellas con bajo nivel de deseo de relacionarse. Pero entre muchachos, la diferencia casi
no exista (incluso se daba levemente en la direccin contraria). Esta es la razn por la cual, en ge
neral, combinando muchachos y muchachas, ei deseo de relacionarse pareca tener poca o ningu
na influencia en las actividades. Una vez ms podemos observar cmo se descubre una relacin
interesante entre las variables a travs de la aplicacin del anlisis de varianza para analizar efec
tos interactivos.
simplemente completaban una encuesta sin nadie presente, excepto e! experimentador. Este era
un nivel del factor. En el caso de los otros dos tercios de las almonas, antes de que pudieran co
menzar a contestar se invitaba a otra alumna a participar. La otra alumna en realidad era una alia
da del experimentador, y se arregl que ella siempre contestara primero. Sus opiniones o eran
muy antirracistas o no eran antirracistas en absoluto, creando as los otros dos niveles del factor,
influencia antirracista e influencia no antirracista,
Para favorecer la claridad de la explicacin, una vez ms hemos construido datos que concuerdan con el patrn bsico de los descubrimientos reales del estudio, pero que incluye muchos
menos participantes. Tambin hemos utilizado valores con nmeros enteros. Los resultados, utili
zando estos valores, estn representados grficamente en la figura 13-10* La tabla 3-9 indica las
observaciones, los desvos cuadrticos, los clculos intermedios y la tabla del anlisis de varianza. Seguiremos este ejemplo paso a paso.
L R ep lan tear el problem a en fu n d n de hiptesis de investigadn e hiptesis n u la de las
pobladones p ara cada efecto p rin cip a l e interactivo . Existen seis poblaciones:
Poblacin 1,1:
Poblacin 1,2:
Poblacin 2,1:
Poblacin 2,2:
Poblacin 3,1:
La primera hiptesis nula establece que las poblaciones combinadas de alumnas que respon
den pblicamente (poblaciones 1,1,2,1 y 3,1) tienen la misma media que las poblaciones combi
nadas de alumnas que responden en forma privada (poblaciones 1,2, 2,2 y 3,2), en cuanto a ia
expresin de actitudes antirracistas. Esta es la hiptesis nula para probar el efecto principal de la
modalidad de la respuesta (pblica contra privada). La hiptesis de investigacin establece que
Figura 13-10.
G rfico d e io s d atos fic tic io s (s im p li
fic a d o s) basad os en lo s resu ltad os d el
e stu d io d e B lanchard, L illy y V aughn.
Influencia
las poblaciones de alumnas que responden pblica y privadamente tienen diferentes medias en
cuanto a la expresin de actitudes antirracistas.
La segunda hiptesis nula establece que no existe diferencia entre las medias de las poblacio
nes combinadas expuestas a influencia antirracista (poblaciones 1,1 y 1,2), las poblaciones com
binadas no expuestas a ninguna influencia (poblaciones 2,1 y 2,2) y las poblaciones combinadas
expuestas a influencia no antirracista (poblaciones 3,1 y 3,2). Esta es la hiptesis nula que prueba
el efecto principal de la direccin de la influencia. La hiptesis de investigacin establece que
esas tres poblaciones combinadas tienen diferentes medias.
La tercera hiptesis nula establece que el patrn de las medias de las tres poblaciones que res
ponden en pblico (poblaciones 1,1,2,1 y 3,1) ser igual al patrn de las medias de las tres poblacio
nes que responden en privado (poblaciones 1,2, 2,2 y 3,2). Esta es la hiptesis nula que prueba el
efecto interactivo. (Tambin podra plantearse del siguiente modo sin cambiar el significado: la dife
rencia entre las poblaciones que responden en pblico y en privado ser la misma al comparar las
dos poblaciones con influencia antirracista, las dos poblaciones que no reciben influencia, y las dos
poblaciones con influencia no antirracista). La hiptesis de investigacin establece que el patrn de
las medias de las tres poblaciones que responden pblicamente difiere del patrn de las mechas de las
tres poblaciones que responden en forma privada.
2. D eterm in ar la s caractersticas de la s d istrib uciones com parativas. Las tres distribucio
nes comparativas sern distribuciones F con grados de libertad del denominador, iguales a la su
ma de los grados de libertad de cada una de las casillas (la cantidad de observaciones de la casilla
menos 1). En este caso, hay 4 observaciones en cada una de las seis casillas, lo que da 3 grados de
libertad en cada uno, y un total de 18. El numerador de la distribucin comparativa del efecto
principal de la modalidad de respuesta tendr 1 grado de libertad (2 columnas menos 1); el nume
rador del efecto principal de la direccin de la influencia tendr 2 grados de libertad (3 filas me
nos 1), y los grados de libertad del numerador correspondiente al efecto interactivo tambin ser 2
(la cantidad de casillas, 6, menos los grados de libertad de las columnas, 1, menos los grados de
libertad de las filas, 2, menos 1). Como control de la exactitud, los grados de libertad de los tres
numeradores ms los grados de libertad del denominador son igual a 1+2+2+18-23, cantidad que
coincide con los grados de libertad totales calculados como la cantidad de participantes menos 1
(24-1=23).
3. D eterm in ar los puntos de corte en la s distrib uciones co m p arativas, a p a rtir de ios
cuales se debera rech a za r cada hiptesis nula. Utilizando el nivel 0,05 de significacin, la ta
bla B-3 indica los puntos de corte que aparecen justo debajo de las casillas y las medias margina
les en la parte superior de la tabla 13-9.
4. D eterm in ar los valores m ustrales en cada d istrib ucin com parativa. Este paso re
quiere de tres razones F; se calculan todos los desvos, se los eleva al cuadrado, se los suma y se
los divide por los grados de libertad para obtener los cuadrados medios. Finalmente, se calculan
las razones de los distintos cuadrados medios intergrupales y cuadrados medios ntragrupales. La
tabla 13-9 ndica todos los clculos anteriores.
5. C o m p arar los valores de los pasos 3 y 4 para decidir si se rechazan o no la s hiptesis
n u las. La razn F, que result ser 0, para el efecto principal de la modalidad de respuesta, cierta
mente no es significativa. (Si bien se basan en resultados reales, los nmeros especficos son in
ventados. Utilizando informacin real, seria muy improbable obtener un F exactamente igual a
0). El F calculado en 11,7, para el efecto principal de la direccin de la influencia, es claramente
significativo. Excede en mucho el punto de corte de 3,56. Finalmente, la razn F del efecto inte
ractivo igual a 1,7 no alcanz el punto de corte 3,56 necesario. Por lo tanto, los resultados no son
concluyentes para esta hiptesis. La figura 13-10 representa grficamente el patrn de las medias.
Para observar en el grfico el efecto principal de la direccin de la influencia, debemos comparar
Tablal3-9.
Clculos del anlisis de varianza de la informacin ficticia basada en los resultados del estudio de
Banchard, Lilly y Vaughn (3991),
Modalidad de respuesta
P b lic a P r iv a d a
c a In flu e n c ia a n ir r a c is ta W : 21:
o S5 A u se n c ia d e in flu en cia 21'') :;2iv-;
S .a In flu e n c ia n o a n ir r a c is ta -fil ; 18'
20
22
21
17
20
20
Punto de corte F necesario para el efecto principal de la modalidad de respuesta ( g l =1 ,18; p < 0,05) - 4,41,
Punto de corte F necesario para el efecto principal de la direccin de la influencia ( g l = 2,18; p < 0,05} 3,56.
Punto de corte F necesario para el efecto interactivo ( g l - 2,18; p < 0,05) = 3,56.
Modalidad privada de respuesta
{ X - G M )7 (X - M f l
(^c'olunuia
- g m y-
IN T
(X -G M fl
'(X -W )1
19
24
4
9
I
J.
4
21
20
I
16
0
_1
4
4
4
_4
18
14
16
0
0
0
24
18
16
4
4
_0
9
9
l
1
1
1
__1
24
20
9
9
9
_9
36
0
0
0
influencia anirracista
4
25
25
20
0
9
23
9
0
24
J 6
.1
50
14
Ausencia de influencia
4
1
22
4
19
1
22
1
4
J)
21 _ i
16
i
i
i
0
0
0
_0
0
9
9
9
0
0
0
1
1
1
_G
J.
4
10
^Co/Mmna
- G M )1 JTVr
-G M )1
Influencia no anirracista
16
0
16
9
1
19
13
9
49
16
16
_0
82
18
0
0
_0
4
4
22
20
J)
36
_0
18
21
16
17
9
4
_ i
14
16
_9
30
g m
1
1
1
0
0
0
J.
4
0
0
0
J)
0
0
0
1
0
1
l
J.
4
Ejemplo de clculo de los desvos, utilizando la primera observacin en la casilla pblica anirracista:
( X - G M y * ( 2 5 -2 0 )'=
( X - M ) 1 - (25-23)' =
5'= 25,
3? = 4.
INT2 { ( X - G M ) - (X- M) -
- GM) -
( M CfAmm
QM)f
= (5 - 2 - 2 -O )2= 14 1
Fuente
Direccin de la influencia (filas)
Interaccin (columnas x filas)
Dentro de las casillas
i ^Dentro +
SC
;)
0
112
16
86
+ ^Columna
gl
1
2
2
18
CM
56
4,8
86+ 0 + 1 1 2 + 16 = 214
1
0
No se rechaza la hiptesis nula.
11,7
1,7
las alturas promedio de los pares de barras. La comparacin sugiere que este efecto principal se
debe a que el grupo que recibi influencia antirracista expres las actitudes ms antirracistas; el
grupo que recibi influencia sin direccin expres un grado intermedio de actitud antirracista, y
el grupo que recibi influencia no antirracista expres actitudes antirracistas mucho menores.
Tambin podemos observar que el patrn de las barras es diferente dentro de cada par, sugiriendo
un posible efecto interactivo. Sin embargo, la interaccin no fue lo suficientemente fuerte en este
estudio como para ser considerada significativa. (Es raro encontrar patrones de barras completa
mente idnticos en estos grficos, del mismo modo que es raro obtener medias exactamente igua
les). Si analizamos el patrn de medias en la parte superior de la tabla 13-9 notaremos el mismo
patrn de resultados.
1.
Replantear e l problem a en funcin de hiptesis de investigacin e hip tesis nula de las poblaciones para
cada efecto principal y efecto interactivo.
2.
^Dentro "
e)
3.
S e controla la exactitud de lo s clculos asegurndose d e que todos los grados de libertad sum en
los grados de libertad totales: g lT m 1 = JV- 1 * gDemo + $Ccumi3 + g Fias + M nteracc,r
D eterm inar los cortes m ustrales en las distribuciones com parativas, a partir d e lo s cuales se debera
rechazar cada hiptesis nula,
a) Determ inar los niveles de significacin deseados.
b) B uscar lo s puntos de corte adecuados en una tabla F (tabla f-3).
D eterm inar los valores m ustrales en cada distribucin comparativa (sern razones F ).
a) Calcular la m edia de cada casilla, fila y colum na m s la gran m edia de todas las observaciones.
b) Calcular lo s siguientes desvos de cada observacin.
1)
^Interaccin)'
f)
Calcular la estim acin intergrupal de varianza para cada efecto principal e interactivo (CM Co|umoas
Filas
^Columnas = ^ C oColumnas
lu m n as^' 5CColumna
o lu m n a f1i
l a s ^Filas ^ F i i a s a p i l a s * ^ In teracc i n
OSj.Interaccin ~ SCn(eraCt5ntgl^
Dentro
^C o lu rru tas^p ^ D en tio ^ F iia = ^ F ita ^ D e n tto ^ ^ P i i a ^ ^ D e n t r o 1
_na <j2
/C2
F
JC M r,
M,
Interaccin
Interaccin'^
^ Dentro.
u C
^ "interaccin'D
entro*
r interaccin
5. Comparar lo s valores obtenidos en los pasos 3 y 4 para decidir si se rechazan o no las hip tesis nulas.
SC
ntergrapa:
Columnas
Filas
interaccin
Dentro
Total
CM
gi
^"Columnas
Columnas
^ R ta
interaccin
^EtCfaccdn
^D entro
^Dentro
^Columnas^
^'^Interaccin ^ ^ Interaccin)
[i
Columnas
^Flas
F interaccin
d^Toral ( Sratajl
SC
Intergrupal:
Columnas
Filas
Interaccin
S C M o ^ -G M *
i(M n h ~G M ?
S((X - GM)
CM
gl
_ 1
^ C o lu m n a /^ C o lu m n a s
C o ta m a s
"*
^ C a silla s ^Columnas ^Fite ~ ^
S C ftlJ
g l i + gl~i
N- 1
fila s
f i l a s
g l\ ntcrceciti
^ ^ C o lu m n a /^ iD c n fro
^ F ils ^ D c m ro
^ '^ i n t c a c c i n ^ ^ D e n t r o
-(x -m
- ( M Fth~ G M )
Dentro
Total
K x -m 1
K X -G M )1
^ ltim o
M1MColumna:
GM =
Casillas"
Aci0
n Casillas '
x=
necesitamos contar con suficientes participantes como para que el efecto con el menor tamao del
efecto esperado tenga una potencia adecuada. Del mismo modo, al evaluar los resultados de un
experimento factorial, debemos tener en cuenta el tamao del efecto de cada efecto principal e in
teractivo separadamente.
Tamao de! efecto
El tamao del efecto de cada efecto principal e interactivo se puede calcular como f (tal como lo
hicimos en el captulo 11) o como R2, la proporcin de varianza explicada (tal como lo hicimos en
el captulo 12). (No debemos olvidar que R2 tambin se denomina frecuentemente eta2). Sin em
bargo, en el anlisis de varianza factorial, y especialmente cuando se utiliza el mtodo del mode
lo estructural como lo hemos hecho en este captulo, es ms sencillo trabajar con la proporcin de
varianza explicada adaptando levemente el procedimiento aprendido en el captulo 12.
^Columnas ~
_______ ^Columnas
^Total ~ ^'las ~
(13-20)
Interaccin
Simplemente,
%i)as
^Fiias
^-'Total ^Columnas ^interaccin
^interaccin
(13-21)
^-'interaccin________
^-Total
-^-Columnas
(13-22)
a p ila s
Tcnicamente, cada uno de los clculos anteriores es una R2 parcial, porque describen la pro
porcin de varianza explicada por un efecto despus de excluir los otros efectos. (Volveremos a
tratar el tema de correlaciones parciales en el captulo 17).
En el ejemplo basado en el estudio realizado con los equipos de radio llamadas por Wong y
Csikszentrnihalyi, R2 se hubiera calculado de la siguiente forma:
/Columnas (D eseo
e realacion arse):
______ ^-Coiiimnas______
SCpjas ^^interaccin
^Flas (S e x o ) j
7 ,2 0
7 ,2 0
6 5 4 ,2 4 - 5 4 3 2 0 -3 6 ,8 0
7 4 ,2 4
__________ -^-Filas______
SCrotai ~ *5Q:ointnnas ~ *->Qnte
5 4 3 ,2 0
__ 5 4 3 ,2 0
6 5 4 , 2 4 - 7 , 2 0 - 3 6 , 8 0 ~ 6 1 0 ,2 4 ~
0,10
____^^interaccin ________
^interaccin (In tera cci n );
3 6 ,8 0
= 0 ,3 5
Sobre la base de las reglas de Cohn para R2 en el anlisis de varianza, segn las presentamos en
el captulo 12, existe un enorme tamao del efecto, es decir, una R2 alta para el sexo y adems un
buen tamao del efecto para la interaccin. El efecto no significativo del deseo de relacionarse te
na un tamao del efecto entre mediano y grande. (En el estudio real, los tamaos del efecto eran
mucho ms pequeos. En el ejemplo, los tamaos del efecto son tan grandes porque invenamos
datos con mucha menos varianza que en el estudio real, con el fin de que se pudieran observar los
patrones con claridad).
Si un estudio slo proporciona los valores F y los grados de libertad, se aplica la frmula que
vimos en el captulo 12, R2 = (F)(glnatc&)l[(F)(glBnttc)+glVtmol sustituyendo los F y los grados de
libertad del efecto correspondiente.
nZ
^Columnas
r2
Fll3S
f e i urnnasX^Columnas)
( ^Columas)
(1 3 -2 3 )
^Columnas) ^ ^Dentro
f e a s )(gPiias )
(1 3 -2 4 )
(13-25)
Por ejemplo, en el estudio realizado con los equipos de radio llamada, el deseo de relacionarse era el
efecto principal de las columnas. Calculamos FColumnas en 3,85, los grados de libertad para este efect0 (^Columnas) en 1, y los grados de libertad intragrupales de las casillas (g/DenEf0) en 36. Por lo tanto,
^Columnas
( Columnas X-^Coiumnas)
(^Columnas )(^Coiumnas) ^
(3 ,8 5 )(1 )
g a m ito
3 ,8 5
~ ( 3 , 8 5 ) ( l ) + 3 6 ~ 3 9 ,8 5
Potencia
En un anlisis factorial de varianza, la potencia de cada efecto est influenciada por el diseo ge
neral. Por ejemplo, un efecto de columnas de tres niveles, tendr distinta potencia si se cruza con
un efecto de filas de dos niveles o si se craza con un efecto de filas de tres niveles. Por lo tanto, el
anlisis de la potencia es diferente segn la cantidad de niveles de un efecto y, teniendo en cuenta
cada cantidad de niveles, segn la cantidad de niveles con que se cruce.
Para simplificar las cosas, veremos las cifras relacionadas con la potencia slo para las tres si
tuaciones ms comunes del anlisis de varianza de dos criterios; todos los efectos en un diseo
2 x 2, un efecto principal de dos niveles (dos filas o dos columnas) en un diseo 2 x 3 y un efecto
principal de tres niveles (tres filas o tres columnas) en un diseo 2 x 3 . (La potencia de la interac
cin en un diseo 2 x 3 es la misma que la del efecto principal de tres niveles). La tabla 13-12 in
dica la potencia aproximada al nivel 0,05 de significacin para cada una de las situaciones
mencionadas, con tamaos del efecto pequeos, medianos y grandes, y con tamaos de casillas
de 10,20,30,40,50 y lOO.*3
Analicemos un estudio planificado 2 x 2 con 30 participantes por casilla y con un tamao me
diano del efecto esperado (R2 ~ 0,06), a realizarse con el nivel 0,05. El estudio que mencionamos
arriba tendra una potencia de 0,78, es decir, que si la hiptesis de investigacin en efecto es ver
dadera y tiene un tamao del efecto mediano, las posibilidades de que el estudio resulte significa
tivo es de aproximadamente el 78%. O veamos un ejemplo tomado de una publicacin, en el que
se encontr un resultado no significativo para un efecto interactivo en un anlisis de varianza
2 x 3 con 20 participantes por casilla. Basndonos en la tabla, para un tamao del efecto pequeo
el poder del estudio es de slo 0,14. Es decir, que aun si ese efecto pequeo existe en la poblacin,
sera muy improbable que el estudio resultara significativo. Por el contraro, la tabla muestra una
potencia de 0,98 para un gran tamao del efecto; por lo tanto, si existiera un gran efecto en la po
blacin, casi con seguridad hubiera resultado significativo en el estudio.
Tabla 13-12.
Potencia aproximada de estudios realizados con un anlisis de varianza 2 x 2 2 x 3 con respecto a
hiptesis probadas a un nivel 0,05 de significacin.
Tamao del efecto
N p o r C a silla
P equeo
(f=0J0)
(R = 0,10)
(? = 0,01)
M e d ia n o
( f = 0 ,2 5 )
(R = 0 ,2 4 )
(R 2 = 0 ,0 6 )
G ra n d e
( f = 0 ,4 0 )
( R - 0 ,3 7 )
(R 2 = 0 ,1 4 )
10
20
30
40
50
200
0,09
0,13
0 ,1 9
0,24
0,29
0,52
0,33
0 ,6 0
0,78
0,89
0,94
*
0,68
0,46
0,77
0,92
0,97
0,99
#
0,84
0,99
*
*
*
$
0,94
0,99
*
*
*
10
20
30
40
50
100
0,11
0,1 8
0,2 6
0,3 4
0,41
0,7 0
0,76
0,98
&
*
*Casi 1.
3 Cohn (2988, p.389-354) proporciona tablas ms detalladas. Sin embargo, utilizar esas tablas con el diseo factorial
requiere algunos clculos preliminares, tai como lo explica Cohe en las pginas 364-379.
Tabla 13-13.
Cantidad aproximada de participantes necesarios en cada casilla (suponiendo igual tamao de
muestras) para obtener una potencia del 80% en estudios que utilizan el anlisis de varianza 2 x 2
2 x 3 , probando las hiptesis a un nivel 0,05 de significacin.
Tamao del efecto
P equeo
(f * 0 ,1 0 )
(R ^ O J O )
(R l = 0 ,0 1 )
2 x 2 : todos lo s efectos
2 x 3: e fe cto principal en dos niveles
efecto principal en tres niveles y efecto interactivo
197
132
162
M e d ia n o
Cf * 0,2 5 )
(R = 0 ,2 4 )
(R 1 = 0 ,0 6 )
33
G ra n d e
( f = 0 ,4 0 )
(R = 0 ,3 7 )
(R* ~ 0 ,1 4 )
22
14
9
27
11
4 Cohn (1988, pp. 381-389) proporciona tablas ms detalladas. Para utilizaras es indispensable leer primero las pgi
nas 396-403 de Cohn.
44 3
A veces, una variable de medidas repetidas se cruza en el mismo estudio con una variable co
mn entre participantes. Por ejemplo, en el estudio acerca de la terapia podra haber un grupo de
control que no hiciera terapia pero que fuera probado en las mismas tres ocasiones que los dems.
En ese caso se estara realizando un diseo 2 (grupo de terapia contra grupo de control) x 3 (antes,
despus, 3 meses despus), en el que la primera variable es del tipo usual entre participantes, co
mo las que hemos estado utilizando hasta ahora, y la segunda es una variable del tipo de medidas
repetidas. Incluso es posible tener dos factores de medidas repetidas o combinaciones an ms
complejas,
Los diseos experimentales que incluyen una o ms variables de medidas repetidas son bas
tante comunes, pero son controvertidos en cuanto a la forma en que deberan analizarse. Una de
esas formas involucra una extensin bastante directa de los procedimientos que hemos aprendido.
El apndice II de este captulo describe esos procedimientos para un anlisis de varianza de medi
das repetidas de un criterio. Sin embargo, los supuestos que deben cumplirse para que este mto
do d resultados precisos son bastante exigentes y, a menudo, no se cumplen en la prctica. Por
eso, algunos investigadores han sostenido enrgicamente que los diseos de medidas repetidas
usualmente deberan analizarse utilizando un procedimiento mucho ms complejo denominado
anlisis de varianza multivariable. Otros investigadores defienden el procedimiento normal
modificado, pero realizan una adaptacin a los grados de libertad utilizados para determinar el
punto F de corte.
El mejor mtodo, en trminos tanto del error Tipo I como del error Tipo II, sigue siendo con
trovertido y complejo (el tema ha sido tratado recientemente por Keselman, Lx & Keselman,
1996; Algna & Keselman, 1997). Al igual que con otros temas controvertidos que hemos tratado,
en la mayora de las situaciones reales de investigacin los resultados no difieren demasiado con
los distintos mtodo utilizados; sin embargo, si los resultados son muy ajustados, es aconsejable
no considerarlos tan concluyentes sin realizar una mayor investigacin.
dos mnimos es el mtodo ptimo, y la mayora de ios programas para computadora que calculan
el anlisis de varianza disponen de esta opcin; algunos incluso ia utilizan automticamente, a
menos que se les indique lo contrario. (El mtodo, mencionado se basa en el anlisis de regresio
nes mltiples, del cual hemos aprendido algo en el captulo 4). Cuando los tamaos de las casillas
son iguales, este mtodo da el mismo resultado que el mtodo ordinario.
El resultado de utilizar el mtodo de cuadrados mnimos es que se empareja la influencia de
cada casilla sobre los efectos principales e interactivos, que es en realidad lo que se busca. Sin
embargo, un documento influyente (Mlligan, Wong & Thompson, 1987) sugiri que este mtodo
es especialmente susceptible al incumplimiento de los supuestos de normalidad poblacional o de
igualdad de las varianzas poblacionales. (Lamentablemente, otros mtodos tradicionales del an
lisis factorial de varianza con tamaos desiguales de casillas son exactamente tan susceptibles co
mo el anterior). Por lo tanto, la mejor recomendacin para los investigadores es disear estudios
que utilicen casillas del mismo tamao. Adems, al igual que suceda con la prueba t, para una de
terminada cantidad de participantes a potencia es mayor cuando se conforman con ellos grupos
de igual tamao para asignarlos a las diferentes casillas.
F igura 13-11.
ctn de similitud es continuo de bajo a alto nivel de amenaza. Supongamos que los investigadores
hubieran incluido una condicin intermedia de amenaza. Es posible que el resultado para esa condi
cin no estuviera en absoluto en el lugar en el que la lnea del grfico en cuestin indica que debera
estar. Los grficos de barra, por el contrario, no reflejan nada en cuanto a ios niveles intermedios,
simplemente muestran los resultados de cada nivel de la variable probada.
Resumen
En un diseo de investigacin factorial los participantes son divididos en grupos segn las combi
naciones de las variables cuyos efectos estn siendo analizados. A travs de los diseos factoria
les podemos analizar los efectos de dos (o ms) variables sin necesidad de convocar el doble de
participantes. Adems, estos diseos hacen posible el anlisis de efectos interactivos, es decir, los
efectos de las combinaciones de las dos variables. Especficamente, un efecto interactivo ocurre
cuando el efecto de una variable depende del nivel de la otra variable. Un efecto principal es el
efecto promedio general de una variable, ignorando el efecto de la otra variable. Los efectos prin
cipales e interactivos pueden describirse verbal, numrica y grficamente.
Los clculos de un anlisis de varianza de dos criterios siguen el mtodo del modelo estructu
ral. La estimacin intragrapal de varianza pobacional es, en realidad, una estimacin de varianza
poblacional a partir del interior de las casillas. Se basa en los desvos de cada registro con respec
to a la media de su casilla. Existen tres diferentes estimaciones intergrupales de varianza: una pa
ra las diferencias de la dispersin de la variable a travs de las filas, otra para las diferencias de la
dispersin de la variable a travs de las columnas y una para la interaccin de las variables de fila
y de columna. El efecto de las filas se basa en los desvos entre las medias de las filas y la gran
media, y el efecto principal de las columnas se basa en los desvos entre las medias de las colum
nas y la gran media. El efecto interactivo se basa en el desvo restante entre las observaciones y la
gran media despus de restar todos los otros desvos con respecto a la gran media (desvos de las
medias de las casillas, las medias de filas y las medias de columnas). Para obtener las estimacio
nes reales de varianza poblacional, esos distintos desvos (interno, filas, columnas' e interactivo)
se elevan al cuadrado, se suman y se dividen por sus grados de libertad. Las razones F para los
efectos de fila, columna e interactivo se calculan dividiendo las estimaciones de varanza poblacional, correspondientes a cada uno de ellos, por la estimacin inragrupal de casilla de la varianza poblaciona.
..
En un anlisis factorial de varianza se calcula el tamao del efecto y la potencia separada
mente para cada efecto principal e interactivo. El indicador ms til del tamao del efecto es la
proporcin de varianza explicada, R2 (tambin denominada eta2), En un anlisis de varianza de
dos criterios, se calcula R2 para cualquier efecto principal o interactivo en particular de la siguien
te forma: se divide la suma de los cuadrados correspondientes a ese efecto en particular por la par
te de la suma total de cuadrados que queda despus de restarle la suma de los cuadrados
correspondientes a los otros dos efectos.
El anlisis factorial de varianza puede extenderse a diseos de ms de dos criterios e incluso
puede utilizarse para manejar estudios de medidas repetidas.
Existen dos antiguas controversias con respecto al anlisis factorial de varianza. Una se basa
en la forma de manejar situaciones con tamaos desiguales de casilla. El mtodo de cuadrados
mnimos se considera usualmente el mejor, pero la solucin ptima es trabajar con casillas del
mismo tamao. La otra controversia se basa en la conveniencia de realizar una dicotomizacin de
variables continuas para realizar un anlisis de varianza. El procedimiento de dicotomizacin ca
da vez est siendo menos comn; generalmente se considera mejor utilizar procedimientos ms
avanzados que conservan todos los valores de cada variable.
Los resultados del anlisis factorial de varianza incluyen con frecuencia descripciones grfi
cas de Jos resultados, particularmente cuando el efecto interactivo es significativo. Por lo general
se utilizan grficos de barra, pero, a veces, se incluyen grficos de lneas.
Trminos clave
- Casilla.
- Media de casilla.
- Dicotomizacin.
-Anlisis factorial de varianza.
- Diseo factorial de investigacin.
- Efecto interactivo.
- Anlisis de varianza de
cuadrados mnimos.
Efecto principal.
Medias marginales.
Divisin por la mediana.
Anlisis de varianza
de un criterio.
- Anlisis de varianza
de medidas repetidas.
Ejercicios
Los ejercicios implican la realizacin de clcu
los (con la ayuda de una calculadora). La ma
yora de los problemas estadsticos reales se
resuelven por computadora, pero aunque exis
ta la posibilidad de utilizarla, es conveniente
realizar estos ejercicios manualmente para in
corporar el mtodo de trabajo.
- Diseo factorial
de tres criterios.
- Anlisis de varianza
de dos criterios.
- Diseo de investigacin
factorial de dos criterios.
20
I n fe r io r
S u p e r io r
D eporte
- 35
25
B a s e b a ll
100
vi
2
fj
C ie n c ia
C o m u n id a d
f* A r te s L ib e r a le s
2,1
. 2,8
A r te
2,8
: 2,1
a
P a s a n te s
2,0
. 2 ,5
O S u p e r v is o r e s
3,1
3 ,6
O
o
'S
C a ro
M o d era d o
B arato
7
'
6
5
C on p ro g ra m a
de m o t i v a c i n
Sin p r o g r a m a d e
m o tiv a c i n
F tb o l
B asket
'
________________________
------------------------------------- -
T era p ia B
T era p ia C
F igura 13-12.
:V ; v ;/-S
VVf ?,4i;
tfic a d e P s ic o lo g a S o c ia l y d e P e r so
n a li d a d [J o u r n a l o f P e r s o n a lity a n d S o
c i a l P s y c h o lo g y ] , 72,965-979. Copyright,
SERIE 1
1. Cada una de las siguientes es una tabla
de medias que muestra los resultados de un estudio con diseo factorial. Suponiendo que
cualquier diferencia es estadsticamente significativa, para cada tabla a) realice dos grficos
de barra mostrando los resultados (en un grfi-
P ro g ra m a
_
ca sca n u eces
R e g u la r
M oderno
20
. .'.'"i 15
io
- '5.V-:
V .i5
A veces
N e fito
ii)
Variable medida: nivel de aprobacin
del presidente de EEUU.
---------------- ____________
O e s te
M e d ia
B a ja
. 70.
50
E s te
Sur
45- : F\55. : 50
V25'--. :v 35
: 30
Id iom a
Sexo
S
W
O
Q
F e m m in a
M a s c u lin o
<g
H o la n d s
R um ano
S u eco
P rrafo
o .2?
O ra c i n
N in g u n o
3.
En determinado colegio secundario, se
probaron tres tipos de programas de enseanza
1 ao
. 4
. . 4 , ...
de ingls, historia y matemtica a travs de vi
n o.
Sanos
... 9 - 9
deos, Despus, los investigadores midieron el
nivel de aprendizaje. Haba dos alumnos por
casilla. Sobre la base de los resultados que apa
iv) Variable medida: nivel de envidia del
recen abajo, a) realice una tabla de medias de
xito de otra persona.
casilla y marginales y trace un grfico de ba
rras de las mismas; b) realice los cinco pasos
N iv e l d e x ito
de la prueba de hiptesis (utilice el nivel 0,05 de
significacin); c) calcule los tres tamaos del
G ra n d e Pequeo
efecto, y d) describa los resultados con pala
I
A m ig o
,8
5
bras (indique qu efectos son significativos y,
4
:l "
^ 8 E x tra o
sobre la base de ellos, cmo interpreta el pa
trn de medias de casillas).
2.
En este estudio se instruy a participan
In gls
H is t o r ia M a t e m t ic a
tes de habla inglesa para que intentaran leer
durante media hora un prrafo escrito en uno Programa Tipo A
3
2
15
14
3
3
de tres idiomas que desconocan. Leyeron el p
6
6
18
rrafo despus de que se les dijera la idea princi Programa Tipo B
10
5
8
pal de todo el prrafo o slo la idea principal de Programa T ipo C
1
13
2
la primera oracin, o bien despus de que no se
3
4
0
les dijera nada sobre e significado del prrafo.
4.
Para cada una de las siguientes series de
Se les dio la traduccin de algunas palabras.
informacin realice un anlisis de varianza, in
Despus los investigadores midieron cuntas
cluyendo una tabla de medias de casilla y margina
de las otras palabras pudieron traducir correc
les y un grfico de barras de las medias de casilla.
tamente. El cuadro que sigue a continuacin
muestra el diseo. Para cada uno de los siguien (i)
C o n d ic i n E x p e r i m e n t a l
tes posibles patrones de resultado, cree una
A
B
serie de medias de casilla, calcule las medias
Grupo I
0
3
marginales y realice un grfico de barras de los
I
2
1
3
resultados: a) efecto principal del idioma y nin
Grupo 2
3
0
gn otro efecto principal o interactivo; b) efecto
2
1
3
1
principal del conocimiento del significado y
(ii)
C on d icin E x p e rim e n ta l
ningn otro efecto principal o interactivo; c) am
A
B
bos efectos principales pero sin interaccin;
Grupo 1
0
0
d) efecto principal del idioma y una interaccin,
1
1
1
1
pero sin efecto principal del conocimiento del
Grupo 2
3
3.
significado; e) ambos efectos principales y una
2
2
3
3
interaccin.
1 m es
(jjj)
C o n d ic i n E x p e r im e n ta l
A
Grupo
Tabla 13-14.
Media de pago auto-asignado por una tarea experimental, dividido por categoras segn el sexo y el
ingreso percibido el verano anterior.
I n g r e s o d e l v e r a n o e n te r io r
B a jo
Sexo
Hom bres
M ujeres
5,03
3,13
SD
1,71
1,68
M e d ia n o
SD
M
3,17
2,65
3 ,0 0
1,89
A lto
M
3,77
2 ,4 4
SD
2 ,7 7
1,65
Nota: Los estudiantes de ia categora de bajos ingresos ganaron menos de $6,00/hr; los estudiantes de la categora de
medianos ingresos ganaron entre $7,50 y $8,50/hr; los alumnos de la categora de altos ingresos ganaron ms de $10,00
la hora. Para cada casilla, n = 12. Slo fue significativo el efecto principal del sexo, p < 0,02.
Fuente: Desmarais, S. & Curts, J. (1997), tab. 1. Sexo y percepcin del ingreso merecido: prueba de los efectos del in
greso percibido. R e v is ta c ie n tfic a d e P s ic o lo g a S o c ia l y d e la P e r so n a lid a d [ J o u rn a l o f P e r so n a lity a n d S o c ia l
P sy ck o lo g y], 72, 141-150. Copyright, 1997, por la A sociacin Americana de Psicologa. Reimpreso con autorizacin.
(13-26)
En la frmula anterior, XX2 es la suma de los cuadrados de todas las observaciones; (XX)2 es el
cuadrado de la suma de todas las observaciones, y N es la cantidad total de observaciones.
La frmula para el efecto intergrupal general tambin es igual a la anterior (frmula 12-7),
excepto que los subndices ahora se refieren a casillas en lugar de grupos.
f e + f e + ... ,(SJC0ln.of ( S * f
n
n'
n
N
Entre
(13-27)
( *^-28)
La frmula para la suma de los cuadrados de filas es una versin modificada de la frmula gene
ral de los intergrupales (13-27):
( XXFl]as 1 ) ( XXFijaSl
SC Filas
Fila
Fila
Fila
(13-29)
En la frmula anterior: (XXFilai)2, (XFUa2)2 .... (^ F iialttna)2 son ls cuadrados de las sumas de to
das las observaciones de cada fila; nRla es la cantidad de participantes en cada fila.
La frmula general intergrupal para columnas sigue el mismo principio:
(XXoiumnai) ^ (^Columna?)
S C C olu m n as
Columna
(sx0lolumna ltima
Columna
Columna
(xxy
V
(13-30)
Tabla 13-15.
Clculo de sumas de cuadrados para un anlisis de varianza de dos criterios basado en Blanchard
et al. (1991), utilizando frmulas de clculo. (Datos ficticios).
X*
19
24
36!
576
441
400
1.778
In flu en cia a n t i r r a c i s t a
XX
XX*
176
3.908
576
324
484
400
1.784
16
17
72
324
441
256
289
1,310
240
4.872
X*
X
Influencia antirracista
25
625
20
400
23
529
576
24
C asilla X: 92
2 .1 3 0
21
20
84
24
18
22
20
84
18
21
4.942
C olum na X:24Q
Filas
M o d a lid a d d e
resp u esta p rivad a
M o d a lid a d d e
r esp u esta p b lica
Total XX = 4 8 0
Total XX* = 9 .8 1 4
^Total
s e *Entre
2 3 0 .4 0 0
A>iji
XXV
480*
----------= 9 . 8 1 4 - ' -------------- -- 9 .8 1 4 - 9 .6 0 0 =
S X X * - - 7 T ==9.814
24
24
92*
= __4, ,
4
84*
4
7 .0 5 6
8 .464
4
84*
84*
+ - . 4-.....
4
4
-- :4
-- +
480*
~4
7 .056
+ --------- :
72*
64*
4. 1...... 7 .0 5 6
-------- :
_
4 .0 9 6
' + ---------:-------+
5.184
2 3 0 .4 0 0
24
S C * ,
- s c ^ - s c , Entre =
' 214-128 =
.
RFas
3 0 .9 7 6
( 'FM'
W + . . . + (Mm J - C W
N
n,Pilas
Filas
28 .2 2 4
.... 8 .....+ T
seColumnas
18.496
+
a x (Columna 1^ (^"^Coimnna 2y
12
240*
+
136a
24~
. ^ C o lu m n a
5 7 ,600
12
480*
24
. ( ^ C o lu m n a llintt'y
+ , . . i...............
480*
.800 + 4 .8 0 0 - 9 ,6 0 0 = 0
230 .4 0 0
176*
' 24
Columna
240*
86
(220*
5 7 .600
230.4 0 0
12
24
Tabla 13-16.
Anlisis de varianza de medidas repetidas de un criterio sobre un estudio de errores de
reconocimiento por parte de cuatro participantes al ser expuestos cada uno a slabas objetivo
insertas en palabras familiares, no familiares y sonidos que no forman palabras. (Batos ficticios).
I
M e d id a : c a n t id a d d e e r r o r e s
T ip o d e p a la b r a
P a la b r a
f a m i lia r
Participante
A
9
6
B
C
D
X
M
11
10
2
6
5
36
9
16
4
F ila
S o n id o
n o p a la b r a
P a la b r a
n o f a m i lia r
0
1
4
12
9
21
18
3
7
6
8
2
GM = 5
D e s v o s c u a d r r te o s c o n r e s p e c to a la g r a n m e d ia
P a r tic ip a n te
P a la b r a f a m ilia r
X
C ol
16
fil
A
B
C
D
1
36
25
16
16
16
16
1
4
4
1
78
64
10
SCm
P a la b r a n o f a m ilia r
In t
C ol
1
0
0
4
9
1
0
1
1
1
.1 ,
14
S o n id o n o p a la b r a
In t
Col
0
0
0
0
25
16
1
4
9
9
9
9
1
4
4
1
1
1
0
0
10
46
36
10
fil
1
4
4
= 78 + 14 + 4 6 = 138
^Columnas" 6 4 + 4 + 3 6 ~ 104
SCm s
= 1 0 + 1 0 + 1 0 = 30
^Interaccin^ 2 +
0+
2=
Control: S C ^ = 5C CoIomnas +
8^tcu
= 104 + 3 0 + 4 = 138
12- 1 = 11
^Columnas
3 ~ 1 *
b .
4~ = 3
^Interaccin" H 2 3 = 6
Control:
Punto de corte F para el efecto de medidas repetidas (colum nas) (gl 2 ,6 ; p < 0 ,0 5 ): 5 , 4
T abla d el a n lisis d e v a ria n za
Fuente
SC
gl
CM
2
3
6
11
52
0,67
F
77,6
f il
In t
Pruebas
chi-cuadado
'
Ejemplo
Analicem os un ejemplo. Harter et al. (1997) estaban interesados en tres estilos de relaciones amo
rosas: un estilo autnomo concentrado en s m ism o, un estilo de relacin en el que la atencin es
t puesto en el otro, y un estilo de mutua reciprocidad. Para reunir inform acin acerca de los
estilos mencionados, realizaron una encuesta por medio de peridicos con tems que evaluaban
tanto los estilos de aquellos que respondan como la percepcin de aquellos que respondan con
respecto al estilo de sus parejas. Una de las predicciones del investigador estableca que los hom
bres que se describan a s mism os como autnomos y concentrados en s mismos casi segura
mente describiran a sus parejas como personas que ponan su atencin en el otro.
Harter y sus colegas descubrieron lo siguiente. D e los 101 hombres en su estudio que se des
cribieron como autnomos concentrados en s m ism os, el 49,5% (50 hombres) informaron el ti
po de pareja predicha, comparado con el 25,5% (26 hombres) que informaron tener parejas
autnomas concentradas en s mismas y el 24,5% (25 hombres) que informaron tener parejas con
el estilo de reciprocidad.: (p. 156)
Supongamos que las parejas de estos hombres hubieran tenido las mismas probabilidades de
tener cada uno de los tres estilos de relacin. S i ese fuera el caso, entonces aproximadamente
33,66 (1/3 de los 101) de las parejas de estos hombres deberan haber pertenecido a cada uno de
los tres estilos diferentes. L a inform acin que estamos manejando aparece en la segunda y terce
ra columna de la tabla 14-1. L a segunda columna (frecuencia observada) indica el detalle de los
estilos de relacin de pareja realmente observados, y la tercera columna (frecuencia esperada)
indica el detalle que se esperara si los diferentes estilos de pareja hubieran tenido exactamente la
misma probabilidad de ocurrir.
T a b la 1 4 -1 .
Frecuencias observadas y esperadas de los estilos de relacin de las parejas de hombres autnomos
concentrados en s mismos.
Estilo
de pareja
Frecuencia Frecuencia
observada1 esperada Diferencia
(O )
(E)
iO-B)
50
26
25
33,67
33,67
33,67
16,33
-7,67
-8,67
Diferencia
cuadrtica
(O -E f
Diferencia
cuadrtica
ponderada segn la
frecuencia esperada
( 0 - E)2E
266,67
58,83
75,17
7,92
1,75
2,23
Queda claro que existe una diferencia entre lo que realmente se observ y el detalle de lo que se
hubiera esperado si los estilos fueran igualmente probables. L a cuestin es la siguiente: Debera
mos suponer que la discrepancia observada no es ms que la que esperaramos slo por casuali
dad en una muestra de este tamao? Supongamos que las m ujeres de los tres estilos tienen las
mismas probabilidades de ser parejas de los hombres concentrados en s mism os en general (la
poblacin). Aun as, en cualquier muestra en particular tomada de esa poblacin no esperaramos
que las com posiciones de los estilos de parejas fueran perfectamente iguales. Pero si la composi
cin de la muestra est muy lejos de ser pareja, dudaramos de que las com posiciones de los esti
los de pareja en la poblacin fueran realmente iguales. E n otras palabras, tenemos una situacin
de prueba de hiptesis muy parecida a la que hemos estado considerando hasta ahora, aunque con
una diferencia importante.
E n las situaciones descriptas en captulos anteriores, los valores observados siem pre han sido
valores numricos referidos a alguna dimensin, como por ejemplo, una puntuacin en una prue
ba estndar de evaluacin de nivel, de la duracin de una relacin, la calificacin de la efectividad
de un empleado por parte del empleador en una escala de 9 puntos, la cantidad de errores en la
identificacin de palabras, y as sucesivamente. Por el contrario, ei estilo de relacin de pareja de
un hombre es un ejemplo de lo que en el captulo 1 denominamos v ariab le nom inal (o variable
categrica). Una variable nominal es aquella en la que la inform acin es la cantidad de personas
en cada categora. (Se denominan variables nominales porque las diferentes categoras o niveles
de la variable se identifican con nombres en lugar de nmeros).
L a prueba de hiptesis con variables nominales es una de las denominadas pruebas chi-cua
drado.1 L a s pruebas chi-cuadrado fueron desarrolladas originalmente por K arl Pearson (vase
cuadro 14-1).
EL ESTADSTICO CHI-CUADRADO
Y LA PRUEBA CHI-CUAPRAPO DE BONDAD DE AJUSTE_________ _
L a idea bsica de cualquier prueba chi-cuadrado es que se compara la forma con que el esquema
de reparticin observado de personas en varias categoras se ajusta a un esquema esperado (como
y ' yy .
-,
^ ^
'5 't ^
t t
-I
n>f
'
'
-n
t,
por ejem plo, un esquema de reparticin uniforme). Con respecto al ejemplo acerca del estilo de
relacin, estamos comparando el esquema observado de 50, 26 y 25 con el esquema de reparticin
esperado de aproximadamente 34 (33,67) para cada estilo. Un esquema de reparticin de la canti
dad de personas esperadas en cada categora es, en realidad, una distribucin de frecuencias como
las que aprendimos en el captulo 1. Por lo tanto, una prueba chi-cuadrado se describe ms for
malmente como la comparacin de una distribucin de frecuencias observadas con una distribu
cin de frecuencias esperadas. E n general, la prueba de hiptesis im plica, primero, calcular las
discrepancias entre las frecuencias observadas y las frecuencias esperadas y, despus, observar
si esas discrepancias son mayores de lo que se esperara por casualidad.
Em pecem os analizando de qu modo encontramos esa discrepancia entre las frecuencias ob
servadas y esperadas. L a discrepancia entre lo observado y lo esperado en cualquier categora es
simplemente la frecuencia observada menos la frecuencia esperada. Por ejem plo, veamos nueva
mente el estudio de Harter et al. Con respecto a los hombres con parejas concentradas en el otro,
la frecuencia observada de 50 es 16,33 puntos mayor de la frecuencia esperada de 33,67 (no debe
mos olvidar que la frecuencia esperada es 1/3 de 101). E n la segunda categora, la diferencia es
-7 ,6 7 , y en la tercera -8,67. L a s diferencias mencionadas aparecen en la cuarta columna (D ife
rencia) de la tabla 14-1.
L a s diferencias no se utilizan directamente ya que algunas son positivas y otras negativas y,
por lo tanto, se cancelaran entre s. Este problema se resuelve elevando cada diferencia al cuadra
do. (Se trata de la misma estrategia que vim os en el captulo 2 cuando trabajamos con las diferen
cias de valores observados al calcular la varianza). E n el ejemplo acerca del estilo de relacin, la
En la frmula anterior, x2es estadstico chi-cuadrado. S es el signo de suma, que ndica que de
bemos sumar todas las categoras distintas. O es la frecuencia observada de una categora (la can
tidad de personas realmente encontradas en esa categora a travs del estudio). E es la frecuencia
esperada de una categora (en el ejemplo que analizam os, se basa en lo que esperaramos si hubie
ra la m ism a cantidad en todas las categoras).
La distribucin chi-cuadrado
E l siguiente paso es averiguar si el estadstico chi-cuadrado que hemos calculado representa una
discrepancia mayor a la que podra ocurrir por casualidad. Para responder esta pregunta necesita
mos saber cules son las probabilidades de que el chi-cuadrado tome valores de distintos interva
los por casualidad. E s decir, necesitamos la distribucin del estadstico chi-cuadrado que
ocurrira por casualidad. Sucede que siempre que el estudio tenga una cantidad razonable de per
sonas, la distribucin del estadstico chi-cuadrado es bastante prxim a a una distribucin mate
mtica conocida que se denomina, por supuesto, distribucincbi-cuadrado.
L a manera exacta de la distribucin chi-cuadrado depende de los grados de libertad. En una
prueba chi-cuadrado, los grados de libertad son la cantidad de categoras que son libres de variar
en cuanto a sus frecuencias, dndose como conocido el total de participantes. E n el ejemplo acer
ca del estilo de relacin hay tres categoras. S i conocemos la cantidad total de personas y tambin
sabemos la cantidad que corresponde a dos de las categoras, automticamente podemos calcular
la cantidad de participantes en la tercera categora. E n un estudio como el del ejemplo que esta
mos analizando, si hay tres categoras, hay dos grados de libertad.
L a figura 14-1 indica las distribuciones chi-cuadrado para varios grados de libertad. Segn se
observa en la figura, las distribuciones son todas asim tricas hacia la derecha. Esto se debe a que
el ch-cuadrado no puede ser menor a 0, pero puede tener valores muy altos. (E l chi-cuadrado de
be ser positivo porque se calcula sumando un grupo de fracciones en las que el numerador y el de
nominador deben ser todos positivos. E l numerador necesariamente es positivo porque est
elevado al cuadrado, y el denominador necesariamente es positivo porque la cantidad de personas
esperadas en determinada categora no puede ser negativa, no se puede esperar que haya menos
que ninguna persona!).
La tabla chi-cuadrado
Lo ms importante acerca de la distribucin chi-cuadrado para una prueba de hiptesis es el pun
to de corte que indica que un chi-cuadrado es lo suficientemente grande como para rechazar la hi
ptesis nula. Por ejemplo, supongamos que queremos utilizar el nivel de significacin de 0,05. En
ese caso, necesitamos saber qu punto de la distribucin chi-cuadrado tiene el 5% de los chi-cuadrados por encima de s mismo. Una tablachi-cuadradoproporciona los puntos de corte para los dis
tintos niveles de significacin y para varios grados de libertad. L a tabla 14-2 muestra una parte de
una tabla chi-cuadrado como la que aparece en el apndice B (tabla B -4). Analicem os el ejemplo
referido al estilo de relacin, en el que haba dos grados de libertad. L a tabla muestra que el pun
to de corte ch-cuadrado para un nivel de 0,05, utilizando una distribucin chi-cuadrado con 2
grados de libertad, es 5,992.
La prueba chi-cuad rad o de bondad de ajuste
Ahora contamos con toda la inform acin necesaria para probar la hiptesis en el ejemplo de H ar
ter et al. Cabe recordar que el chi-cuadrado que calculam os para el ejemplo era de 11,90. Adem s,
acabamos de encontrar el punto de corte correspondiente al ejemplo (utilizando el nivel 0,05 de
significacin), que es de 5,992. Comparando los dos nmeros mencionados anteriormente, el
chi-cuadrado del estudio es claramente superior al punto de corte. Por lo tanto, los investigadores
que realizaron el estudio rechazaron la hiptesis nula, es decir, la rechazaron por considerar de
masiado improbable que la discrepancia que observaron pudiera haber ocurrido si, de hecho, la
poblacin de hombres concentrados en s mism os tuviera una cantidad igual de parejas de cada
estilo de relacin. Pareca, ms razonable sostener que los estilos de relacin de las parejas de ese
tipo de hombres eran realmente diferentes.
Acabamos de realizar un procedimiento de prueba de hiptesis completo del ejemplo de H ar
ter et al. E l ejemplo inclua diferentes cantidades de personas en tres niveles de una determinada
variable nominal (el estilo de relacin de las parejas de hombres concentrados en s m ism os). E s
te tipo de pruebas chi-cuadrado, que incluye niveles de una sola variable nominal, se denomina
prueba chi-cuadrado de bondad de ajuste. (M s adelante, en el captulo, analizaremos situa
ciones que incluyen ms de una variable nominal a la vez).
Figura 14-1.
Ejemplos d e d istrib u cio n es chi-cuad rad o para diferen tes grados de libertad.
Tabla 14-2.
P a rte de una tabla chi-cu ad rad o.
N iv el d e sign ificacin
Si
i
2
3
4
5
0 ,1 0
2 ,7 0 6
4,6 0 5
6 ,2 5 2
7 ,7 8 0
9 ,2 3 7
0,05
3,841
5,992
7,815
9,488
11,071
0,01
6,635
9,211
11,345
13,277
15,087
L a hiptesis de investigacin establece que la distribucin de las personas en las categoras de las
dos poblaciones es diferente; la hiptesis nula establece que es igual.
2. D eterm in ar la s caractersticas de !a d istrib ucin com parativa. L a distribucin compa
rativa en este caso es una distribucin chi-cuadrado con dos grados de libertad. (U na vez que co
nocemos el total, slo las cantidades en dos categoras pueden variar libremente).
E s importante no confundimos con la terminologa. L a distribucin comparativa es la distri
bucin con la que comparamos el nmero que resume todo el patrn del resultado. Con una prue
ba t, este nmero es el punto , y utilizam os una distribucin t. Con un anlisis de varianza, es la
razn F, y utilizam os una distribucin F. D el mismo modo, con una prueba chi-cuadrado, la dis
tribucin es una distribucin chi-cuadrado.
Decim os que puede surgir cierta confusin, ya que al preparamos para utilizar la distribucin
chi-cuadrado comparamos una distribucin de frecuencias observadas con una distribucin de
frecuencias esperadas. Pero la distribucin de frecuencias esperadas no es una distribucin com
parativa en el sentido en el que utilizam os ese trmino en el paso 2 de la prueba de hiptesis.
3. D eterm in ar el punto de corte en la distrib ucin co m p arativa, a p a rtir del cu al debera
rechazarse la hiptesis n u la. Buscamos el punto de corte en la tabla chi-cuadrado segn el nivel
de significacin y los grados de libertad del estudio. E n este caso, utilizam os el nivel 0,05 de sig
nificacin y determinamos, en el paso 2, que haba 2 grados de libertad. Basndonos en la tabla,
el chi-cuadrado de corte es igual a 5,992.
4, D eterm in ar el valo r m uestral en la distrib ucin com parativa. E l valor muestral es el
chi-cuadrado calculado a partir de la muestra. En otras palabras, este es el paso en el que se reali
zan todos los clculos; es decir, para cada categora necesitam os calcular las frecuencias espera
das, las diferencias entre las frecuencias esperadas y observadas elevadas al cuadrado, y dividir
ese resultado por la frecuencia esperada. Sumando los resultados de todos estos clculos para ca
da categora obtenemos el chi-cuadrado del estudio. E n el ejemplo que estamos utilizando el re
sultado es 11,90.
5, Com parar los valores obtenidos en los pasos 3 y 4 para decidir s se rechaza o no la hipte
sis nula. Dado que el punto de corte para rechazar la hiptesis nula es 5,992 y el chi-cuadrado de
nuestra muestra es 11,90, podemos rechazar la hiptesis nula. Se sostiene la hiptesis de investi
gacin que establece que las dos poblaciones son diferentes. E s decir, los investigadores conclu
yen que las parejas de hombres concentrados en s mismos no tienen las mismas probabilidades
de presentar los tres estilos de relacin.
'
Otro ejemplo
Analicem os otro ejemplo. Un equipo de investigacin ficticio formado por psiclogos clnicos
desea probar una teora que establece que la salud mental se ve afectada por el nivel de cierto m i
neral incluido en la dieta alim enticia. A l m ineral lo llamaremos Q. E l equip4de investigacin ha
localizado una regin de los Estados Unidos cuyo suelo presenta una alta concentracin del mine
ral Q y, debido a ello, ese mineral se encuentra en el agua que las personas consumen y en los ali
mentos que se siembran en el lugar. L o s investigadores realizan una encuesta a personas mayores
que han vivido toda su vida en esa rea, concentrndose en los trastornos de la salud mental. De
las 1.000 personas entrevistadas, 134 haban experimentado en algn momento de su vida un tras
torno relacionado con la angustia, 160 haban sufrido alcoholism o o drogadiccin, 97 trastornos
de estados anm icos (tales como depresin crnica) y 12 haban sufrido esquizofrenia; 597 nunca
haban experimentado ninguno de los problemas anteriores. (E n este ejemplo, ignoraremos lo que
ocurre cuando una persona ha sufrido ms de uno de los trastornos).
Los psiclogos compararon los resultados con lo que se esperara sobre la base de una gran
encuesta realizada al pblico en general de los Estados Unidos. En esa encuesta, el 14,6% de los
adultos en algn momento de sus vidas sufre de trastornos relacionados con la angustia, e 16,4%
padece alcoholism o y drogadiccin, el 8,3% sufre trastornos del estado anm ico y el 1,5% padece
esquizofrenia, mientras que el 59,2% no experimenta ninguno de esos trastornos (Regier et a i,
1984), S i la muestra de 1.000 no es diferente de la poblacin general de Estados Unidos, el 14,6%
de ellos (146) deberan haber sufrido trastornos relacionados con la angustia, el 16,4% (164) de
beran haber padecido alcoholism o y drogadiccin, y as sucesivamente. L a cuestin planteada
por los psiclogos clnicos es la siguiente: sobre la base de la muestra que hemos estudiado, po
demos concluir que los porcentajes de los diferentes problemas mentales sufridos por las perso
nas de esta regin son diferentes a los de la poblacin de los e e . u u . en general?
L a tabla 14-3 indica las frecuencias observadas y esperadas y los clculos de la prueba ehicuadrado.
d e la r e g i n d e
de
e e .u u
e e .u u
. c o n a lto n iv e l d e l m in e r a l
Q.
'Babia 14-3,
Frecuencias observadas y esperadas y prueba chi-cuadrado de la bondad de ajuste de distintos tipos
de trastornos de la salud mental en una regin de EEUU con alto nivel d el m ineral Q, comparada con
la poblacin de e e . u u . en general. (Datos ficticios).
C o n d ici n
O b se rv a d a
A ngustia
A lcoh olism o y drogadiccin
Trastornos del estado anm ico
Esquizofrenia
N inguna de las anteriores
E sp e r a d a
134
160
97
12
597
146 (14,6%
16 4 (1 6 ,4 %
83 ( 8,3%
15 ( 1,5%
592 (59,2%
X
X
X
X
X
1.000)
1.000)
1.000)
1.000)
1.000)
{O -E f
(1 3 4 - 1 4 6 ) *
146
164
.. -12* t -4*
~ 146
(1 6 0 - 1 6 4 ) *
164
(9 7 - 83)*
(1 2 -1 5 )*
(5 9 7 -5 9 2 )*
83
15
592
14* ; -3* t
5* _
144
16
196
25
83
592 ~
146
164
83
15
592
15
5.
C o m p a rar los valores de los pasos 3 y 4 p ara d ecid ir si se rechaza o no la hiptesis nu
la . E l chi-cuadrado de 4,09 es mucho menos extremo que el punto de corte de 9,488 {vase figura
14-2). Lo s investigadores no pueden rechazar la hiptesis nula; el estudio no es concluyente. (No
habiendo podido rechazar la hiptesis nula con una muestra tan grande, es razonable suponer que
s i existe alguna diferencia entre las poblaciones, esa diferencia es bastante pequea).
Un tercer ejemplo
Supongamos que una profesora de una gran universidad est dando un curso de introduccin a la
estadstica a 200 alumnos. L a clase ya ha terminado de rendir su p arcial Anteriormente, la profe
sora siempre ha calificado con una curva aproximada a la distribucin normal, es decir, el 2,5%
superior de los alumnos obtuvo A , el siguiente 14% recibi B , el siguiente 67% recibi C , el si
guiente 14% recibi D y el 2,5% ms bajo recibi F.
Figura 14-2.
Este ao, sin embargo,- la profesora ha decidido asignar las calificaciones segn el porcentaje
del examen realizado correctamente; un 90% ms es una A , entre un 80% y 89% una B , y as su
cesivamente. L a pregunta que la profesora se plantea entonces es la siguiente: sobre la base de la
muestra de este semestre formada por 200 calificaciones de parciales a travos del nuevo sistem a,
existe alguna razn para creer que el nuevo sistem a produce una distribucin diferente de ca lifi
caciones?
L a tabla 14-4 ndica las frecuencias observadas y esperadas y los clculos de la prueba
chi-cuadrado.
1. R ep lan tear el problem a en funcin de hiptesis de investigacin e hiptesis nula de las
poblaciones. La s dos poblaciones son:
Poblacin 1: alumnos calificados segn el nuevo sistema (que tiene en cuenta sus calificacio
nes sin importar el nivel de los otros alumnos de la clase).
Poblacin 2: alumnos calificados con una curva de distribucin normal.
L a hiptesis de investigacin establece que las poblaciones son diferentes; la hiptesis nula esta
blece que las poblaciones son iguales.
2. D eterm in ar las caractersticas de la d istrib uci n com parativa. L a distribucin compa
rativa es una distribucin chi-cuadrado con 4 grados de libertad (5 categoras ~ = 4).
3. D eterm in ar el punto de corte en la d istrib u ci n co m p arativa, a p a rtir del cu al se de
b era re ch a za r la hiptesis n ula. L a profesora es conservadora en cuanto a sus decisiones es
tadsticas y, por lo tanto, elige el nivel 0,01. U tilizando la tabla 14-2 (o la tabla B -4) para 4
grados de libertad, el profesor necesita un chi-cuadrado de al menos 13,277 para rechazar la h i
ptesis nula.
Tabla 14-4.
Frecuencias observadas y esperadas y prueba chi-cuadrado de bondad de ajuste del ejemplo de ca
lificaciones parciales. (Datos ficticios).
C a lifica ci n
O b se rv a d a
A
B
C
D
F
10
34
140
10
6
E sp er a d a
5
28
134
28
5
( 2,5%
(14,0%
(67,0%
(14,0%
( 2,5%
X
X
X
X
X
200)
200)
200)
200)
200)
O -E f
(1 0 5
(3 4 -2 8 )*
( 1 4 0 - 134)z
(1 0 -2 8 )*
28
134
28
28
134
~18J ,
ll
----- T* ---28
5
= 5 + 1 ,2 9 + 0 ,2 7 + 1 1 ,5 7 + 0,20*= 18,33
C onclusin: S e rechaza 3a hiptesis nula.
25
(6 5
324
* - + - * + . ----- 1
28
134
28
4. D eterm in ar el valo r m aestral en la d istrib ucin com parativa. Para calcular el chi-cuadrado, primero calculam os las frecuencias esperadas m ultiplicando los porcentajes esperados por
la cantidad en la muestra. Para el prim er grupo (calificacin A ), la profesora esperaba un 2,5% se
gn el sistema de curva normal que haba utilizado previamente; 2,5% x 200 = 5. Por lo tanto, pa
ra las calificaciones A , ella esperaba una frecuencia de 5. Segn el antiguo sistema, el 14% habra
obtenido una B , lo que da una frecuencia esperada de 28 alumnos de su clase de 200. L a tabla 14-4
indica el resto de las frecuencias esperadas ms los clculos del chi-cuadrado. Como se observa
en la tabla, el resultado es un chi-cuadrado de 18,33.
5. C o m p a rar los valores obtenidos en los pasos 3 y 4 p ara d eterm in ar si se rechaza o no
a hiptesis n u la. E l chi-cuadrado necesario para rechazar la hiptesis nula era 13,277. E l chicuadrado de la muestra es 18,33. Por lo tanto, la profesora puede rechazar la hiptesis nula y con
cluir que las poblaciones son diferentes (vase figura 14-3). E l nuevo mtodo de calificacin no
produjo una distribucin normal de las calificaciones de la clase. S i bien no se predijo la direccin
de la diferencia, un anlisis de los valores de las categoras muestra que, en este ejem plo, utilizar
el mtodo de calificacin por puntos dio como resultado que ms alumnos obtuvieran A , B C , y
menos alumnos obtuvieran D y F.
Figura 14-3.
D istrib u ci n chi-cuad rad o ( g i ~ 4 ) d el eje m p lo acerca d el
siste m a d e c a lific a c io n e s, que m u estra e l pu nto de corte
para e l r ech a zo d e la h ip tesis nula al n iv el 0 ,0 1 .
del personal se les pregunta acerca del tipo de transporte que utilizan, y si prefieren acostarse tem
prano y levantarse temprano (personas diurnas) o acostarse tarde y levantarse tarde (personas
nocturnas). Lo s resultados se reflejan en la tabla. 14-5. Observemos las dos variables nominales;
a) tipo de transporte, con tres niveles y b) tendencia de descanso, con dos niveles.
Tabias de contingencia
L a tabla 14-5 es un ejemplo de una tab la de contingencia, aquella en la que se establecen las dis
tribuciones de dos variables nominales de modo que refleje las frecuencias de sus combinaciones
y tambin los totales. Una tabla de contingencia es sim ilar a las tablas utilizadas en los diseos
factoriales de investigacin que se analizan con un anlisis de varianza de dos criterios (vase ca
ptulo 13). Sin embargo, en una tabla de contingencia, los nmeros son frecuencias y no medias.
E l nmero en cada categora o combinacin de categoras es una cantidad de individuos, no un
promedio de registros de determinada clase. Por lo tanto, en la tabla 14-5, el 60 en la combinacin
autobs-diurna expresa cuntas personas diurnas toman autobs. No es un promedio ni nada que
se le parezca.
L a tabla 14-5 es un ejemplo de tabla de contingencia 3 x 2 porque tiene tres niveles de una va
riable cruzados con dos niveles de otra variable (no importa qu dimensin se nombre primero). Tam
bin es posible crear tabias de contingencia mayores, como por ejemplo d e 4 x 7 6 x !8 . Las tablas
ms pequeas, las tablas de contingencia 2 x 2 , son las ms comunes.
Independencia
E ! objetivo en el ejemplo que estamos analizando es saber si existe alguna relacin entre el tipo de
transporte que utilizan las personas y el hecho de que sean personas diurnas o nocturnas. S i no
existe relacin, la proporcin de personas diurnas y nocturnas ser la misma entre los que viajan
en autobs, los que comparten los autos y los que van con sus propios autos. O para decirlo de
otro modo, si no existe relacin, la proporcin de personas que viajan en autobs -com parten los
autos y conducen sus propios autos-, es la m ism a en el caso que se trate de personas diurnas o
nocturnas. No importa cmo se describa. L a situacin de ausencia de relacin entre las variables
en una tabla de contingencia se denomina independencia.2
Tabla 14-5.
Tabla de contingencia de frecuencias observadas de personas diurnas y nocturnas que utilizan dife
rentes medios de transporte. (Datos ficticios).
M edio de transporte
A u to b s
A u to m v il c o m p a r tid o
.60 /
e i |
D iu r n a
N o c tu r n a
''2 0 7
T otal
80
Total
A u to m v il p r o p io
120 ( 60% )
3 o
80 ( 40% )
50
70
2 0 0 (1 0 0 % )
2 El trmino independencia se utiliza usualmente para referirse a la ausencia de relacin entre dos variables nominales.
Sin embargo, si el alumno ya ha estudiado e l captulo 3, puede resultarle til pensar en la independencia com o algo si
milar a la situacin de falta de correlacin o coeficiente de correlacin 0 (r = 0).
Muestra y poblacin
Segn los resultados de la encuesta observados en el estudio, las proporciones de personas noc
turnas y diurnas de la muestra varan de acuerdo con los diferentes medios de transporte. Por
ejemplo, los que viajan en autobs se dividen en 60-20, es decir, tres cuartas partes de los que via
jan en autobs son personas diurnas. Entre las personas que viajan en su propio auto, la divisin
es 30-40, es decir, una leve mayora son personas nocturnas. Aun as, debemos tener en cuenta
que la muestra es de slo 200 personas, y es posible que en la poblacin mayor, el tipo de trans
porte que utiliza una persona sea independiente del hecho de que esa persona sea diurna o noctur
na. L a gran pregunta es si la falta de independencia en la muestra es lo suficientemente grande
como pararechazar la hiptesis nula de independencia en la poblacin.
T a b la 14*6.
T a b la d e c o n tin g e n c ia d e fr e c u e n c ia s o b s e r v a d a s (y e sp e r a d a s ) d e p e r so n a s d iu r n a s y n o c tu r n a s q u e
u tiliz a n d ife r e n te s tip o s d e tr a n s p o r te . (D a to s fic tic io s ).
M edio d transporte
A u to b s
.2
32
na
<
&
O
-a g
g *
D iu r n a
! , 60 (4 8 )a
N o c tu r n a
T o ta l
A u to m v il c o m p a r tid o
A ;
3 0 (3 0 )
A vA
Total
A u to m v il p r o p io
3 0 (4 2 ) ;
120 (60% )
2 0 (3 2 )
2 0 (2 0 )
4 0 (2 8 ),
8 0 (40% )
80
50
70
2 0 0 (100% )
el patrn proporcional de personas diurnas y nocturnas en cada columna debera ser igual que al de
toda la distribucin. Lo anterior significara que el medio de transporte no afecta la proporcin de per
sonas diurnas y nocturnas, y que el medio de transporte es independiente de la proporcin de perso
nas diurnas y nocturnas.
Analicem os ahora los nmeros reales de la encuesta del ejemplo. En total existe un 60% de per
sonas diurnas y un 40% de personas nocturnas. Por lo tanto, si el medio de transporte es indepen
diente del hecho de ser una persona diurna o nocturna, este 60% -40% debera mantenerse en cada
columna (cada tipo de transporte). En primer lugar, el 60% -40% total debera mantenerse en el
grupo de personas que viajan en autobs, es decir, que en la casilla de la personas diurnas que to
man el autobs esperaramos una frecuencia del 60% sobre 80, es decir, 48 personas. L a frecuen
cia esperada para las personas nocturnas que toman autobs es 32 (es decir, el 40% de 80 es 32).
Del mismo modo, analicemos las frecuencias esperadas para la columna de aquellos que comparten
el automvil. L a columna debera dividirse en 60% -40% ; por lo tanto, se espera que su total de 50
personas se divida en un 60% - 40% , dando como resultado una frecuencia esperada de 30 personas
diurnas que viajan en automviles compartidos (es decir, el 60% de 50 es 30) y 20 personas noctur
nas que viajan en automviles compartidos (es decir, el 40% de 50 es 20). La s frecuencias esperadas
para la columna de personas que viajan en sus propios automviles se calculan del mismo modo, y
dan 42 y 28, tal como lo muestra la tabla 14-6.
Lo anterior se expresa bajo la frm ula,
=( 0 C )
(14-2)
En la frm ula, E es la frecuencia esperada para una casilla en particular (la combinacin de cate
goras); R es la cantidad de personas observadas en la fila de esa casilla; N es la cantidad total de
personas, y C es la cantidad de personas observadas en la columna de esa casilla. (Aun si se con
funden las casillas y las columnas, la frecuencia esperada resulta la mism a).
Aplicando la frmula a las personas diurnas que viajan en autobs,
E=
= ( ^ ) ( 8 0 ) = ( 0.60)(80) = 48
Observando la tabla 14-6 en su totalidad, vemos que las frecuencias esperadas suman los mismos
totales de columnas y filas que las frecuencias observadas. Por ejemplo, en la primera columna
(autobs), las frecuencias esperadas de 32 y 48 suman 80, al igual que las frecuencias observadas
de 60 y 20 de la misma columna. D e modo sim ilar, en la fila superior (diurna), las frecuencias es
peradas de 48, 30 y 42 suman 120, el mismo total de las frecuencias observadas de 60, 30 y 30.
Para controlar los clculos aritmticos, es siempre una buena idea asegurarse de que las frecuen
cias esperadas y observadas sumen los mismos totales tanto de fila como de columna.
E
es
48
........ 4* *
30
4"
42
, (4 0 -2 8 )2
"4*'--------------- 4*..............
32
20
28
Grados de libertad
Como siempre, antes de que podamos probar la significacin debemos saber cules son los gra
dos de libertad. Lo s grados de libertad para el chi-cuadrado de una tabla de contingencia son la
cantidad de columnas menos 1 por la cantidad de filas menos 1. Se expresa bajo la frm ula,
( 1 )
E n la frmula anterior, ^Coumas es la cantidad de columnas y Nmas es la cantidad de filas. S i apli
camos esta frmula a la encuesta del ejemplo,
8
Una tabla de contingencia con muchas casillas puede tener relativamente pocos grados de liber
tad, ya que en una prueba chi-cuadrado los grados de libertad son la cantidad de categoras libres
de variar una vez que se conocen los totales. Con una prueba chi-cuadrado de independencia, la
cantidad de categoras se convierte en la cantidad de casillas; los totales ahora incluyen totales de
fila y columna al igual que el total general. Si conocemos los totales de fila y de columna, conta
mos con mucha inform acin.
Analicem os el ejemplo acerca de la tendencia de descanso y los medios de transporte. S i co
nocemos las frecuencias de las primeras dos casillas superiores, por ejemplo, y todos los totales
de fila y columna, podramos calcular todas jas otras frecuencias. L a tabla 14 -7 muestra la tabla de
contingencia correspondiente al ejemplo que analizamos, con slo los totales de fila y columna (y
el total general) y las frecuencias de esas dos casillas. Podemos completar el resto de la fila supe
rior calculando que, si hay un total de 120 (el total de esa fila) y las otras dos casillas dan 90 entre
las dos (60 + 30), entonces slo quedan 30 que se ubican en la casilla de autom vil propio. S i co-
Tabla 14-7.
Tabia de contingencia que incluye las frecuencias observadas marginales y de dos casillas, con el fin
de ilustrar el clculo de los grados de libertad.
A u to b s
3 <n
0 a
E* a
D iu r n a
-8 i
N o c tu r n a
S '*
60
A u to m v il c o m p a r tid o
30
A u to m v il p r o p io
"
"
- y**-..
i 2 0 (60% )
80 (40% )
80
T o ta l
50
70
2 0 0 (100% )
nocemos las frecuencias de todas las casillas de personas diurnas y los totales de columnas para
cada tipo de transporte, entonces la frecuencia de cada casilla correspondiente a las personas noc
turnas es igual al total de su columna menos las personas diurnas de esa columna. Por ejemplo,
hay SO personas que viajan en autobs y 60 son personas diurnas, entonces los 20 restantes deben
ser personas nocturnas. Por lo tanto, en este ejem plo, aunque hay seis celdas, hay slo 2 grados de
libertad; entonces, hay slo dos casillas cuyas frecuencias son realmente libres de variar una vez
que tenemos todos los totales de fila y columna.
Prueba de hiptesis
Con 2 grados de libertad, la tabla 14-2 (o tabla B -4) muestra que el punto de corte chi-cuadrado
necesario para tener significacin a un nivel de 0,01 es 9,211. E l chi-cuadrado de 16,07 del ejem
plo es mayor que ese punto de corte. Por lo tanto, podemos rechazar la hiptesis nula que estable
ce que en la poblacin las dos variables son independientes.
Para decirlo de otro modo, la hiptesis nula establece que las dos variables son independien
tes (no estn relacionadas entre s). L a hiptesis de investigacin establece que no son indepen
dientes (que estn relacionadas entre s).
2. D eterm in ar las caractersticas de la d istrib ucin com parativa. L a distribucin compa
rativa es una distribucin chi-cuadrado con 2 grados de libertad. S i conocemos la cantidad de par
ticipantes de dos casillas y los totales de fila y columna, todas las dems cantidades pueden
determinarse. O bien, utilizando la regla para tablas de contingencia, la cantidad de casillas libres
de variar es la cantidad de columnas menos 1 por la cantidad de filas menos 1.
3. D eterm in ar el punto de corte en la distrib ucin co m p arativa, a p a rtir del cu al debera
rechazarse la hiptesis nula. Utilizam os la m isma tabla que para cualquier prueba chi-cuadrado.
E n el ejemplo, estableciendo un nivel de 0,01 de significacin con 2 grados de libertad, necesita
mos un chi-cuadrado de 9,211.
4. D eterm in ar el valo r m aestral en la distrib ucin com parativa. En el ejemplo, encontra
mos un chi-cuadrado de 16,07.
5. C o m p a rar los valo res obtenidos en los pasos 3 y 4 p a ra determ inar si se rechaza o no
la hiptesis n ula. E l chi-cuadrado necesario para rechazar la hiptesis nula es de 9,211, y el chicuadrado del ejemplo es de 16,07 (vase figura 14-4). Por lo tanto, podemos rechazar la hiptesis
nula. Se sostiene la hiptesis de investigacin que establece que, en la poblacin, las dos variables
no son independientes. E n consecuencia, las proporciones del tipo de transporte utilizado para ir a
trabajar difiere segn se trate de personas diurnas o nocturnas.
Figura 14-4.
D istrib u ci n ch i-cu a d ra d o (gl = 2 ) d e l e je m p lo a cerca d e la
te n d en cia d e d e s c a n so y m e d io d e transporte, q u e m u estra e l
p u n to d e co rte para rechazar la h ip tesis nula al n ivel 0 ,0 1 .
Un tercer ejemplo
Janice Steil y Jennifer H ay (1997) realizaron una encuesta a profesionales (abogados, doctores,
banqueros, etc.) acerca de cules eran las personas con las que se comparaban cuando pensaban
en su situacin laboral (salario, beneficios, responsabilidades, nivel social, etc.). U na de las cues
tiones de mayor inters era averiguar cuntos profesionales se comparaban a s mism os con per
sonas de su propio sexo, del sexo opuesto, o ambos.
L a tabla 14-9 muestra los resultados junto con el porcentaje correspondiente a cada tipo de
comparacin, ms las frecuencias esperadas (que aparecen entre parntesis) sobre la base de esos
porcentajes. Debajo de la tabla de contingencia estn los clculos de la prueba chi-cuadrado de
independencia.
T a b la 1 4 -8 .
R e su lta d o s y c lc u lo s d e la p r u e b a ch i-c u a d ra d o d e in d ep en d e n c ia q u e p r u e b a si la p r im e r a gen eracin
d e a lu m n o s u n iv er sita r io s d ifiere d e o tra s en cu an to a a b a n d o n o de e stu d io s d u ra n te el p r im e r sem estre.
G en e r a ci n q u e asiste a la u n iversid ad
P r im e r a
73
Abandono
C o n tin u id a d
Z=
T otal
O tr a s
(57.7)
89
(103,9)
162 (7,9% )
6 5 7 (6 7 2 ,3 )
1 ,2 2 6 (1 .2 1 1 ,1 )
1,583 (92,1% )
730
1,315
2,045
( O - ) *1
( 7 3 - 5 7 ,7 )*
5 7 ,7
*
15,3s
-1 4 ,9 s
(8 9 - 1 0 3 ,9 ) '
+
-1 5 ,3 '
103,9
(6 5 7 - 6 7 2 ,3 ) '
+
672,3
( 1 ,2 2 6 -1 .2 1 1 ,1 )'
+
1.211,1
14,9'
222
234,1
222
= 57 ,7 * 103,9 * 67 2 ,3 + 1.211,1
= 4 ,0 6 + 2 ,1 4 + 0,35 + 0,1 8
= 6,73
C onclusin: se rechaza la hiptesis nula.
N ota: 1. Con un anlisis 2 x 2 , las diferencias y las diferencias cuadrticas (numeradores) de las casillas son idnticas.
Bn el e je m p lo q u e analizamos, las diferencias se deben al redondeo. 2. Fuente: Riehl (1994). E l chi-cuadrado exacto
1.
Tabla 14-9.
Resultados y clculos de la prueba chi-cuadrado de independencia que prueba si hombres y muje
res difieren en cuanto al sexo de las personas con las que comparan su situacin laboral.
T o ta l
R esp u esta
M u je r e s
H om bres
M is m o s e x o
[ .
S e x o o p u e s to
A m bos sexos
j- . 2 6 (2 7 )
4 6 (39,0% )
2 9 ;( 2 3 ) U L
18 (15,3% )
4 '(9 :;f t i nu : i ;# ( 9 | ;
5 4 (4 5 ,8 % )
59
118
59
_ (O-Ef
K
( 2 9 - 2 3 ) 2( 1 7 - 2 3 ) 1 ( 4 ~ 9 ) s
23
E
e
-6 *
36
36
23
9^
25
25
+ 9
(1 4 - 9 ) 5
_ -l*
l2
23 + 23 * 9
(2 6 - 27)a
(2 8 -2 7 )1
27
27
+ 27 + 27
5.
Comparar los valores obtenidos en los pasos 3 y 4 p
determinar si se rechaza o no la hiptesis nula. E l chi-cuadra
do de 8,78 es mayor que el punto de corte de 5,992 (vase figura ::
Figura 14-6.
Distribucin chi-cuadrado
482
(14-4)
Las reglas de Cohn (1988) para el coeficiente phi establecen que 0,10 es un tamao del efecto
pequeo, 0,30 es un tamao del efecto mediano y 0,50 es un gran tamao del efecto.
Por ejemplo, en el estudio de R iehl acerca de la prim era generacin de estudiantes universita
rios, el chi-cuadrado que calculam os era de 6,7, y haba 2.045 personas en el estudio. Aplicando
la frmula para el coeficiente phi,
Se trata de un tamao del efecto muy pequeo. Lo s resultados con respecto a la significacin nos
indican que la mayor probabilidad de que los alumnos de primera generacin abandonen los estu
dios, probablemente no es casual. Pero el coeficiente phi nos indica que, en la prctica, esa dife
rencia no casual no puede ser un factor muy importante. (En el captulo 8 tratamos aquellas
situaciones en la que un resultado es estadsticamente significativo pero cuyo tamao de efecto es
muy pequeo).
E l estadstico phi slo se aplica cuando existe una situacin 2 x 2 . Podemos decir que el esta
dstico p h i de C ra m e r es una extensin del coeficiente phi ordinario, que puede aplicarse a ta
blas de contingencia mayores de 2 x 2. (E l phi de Cram er tambin se conoce como la V de
Cram er, y a veces se escribe <j)c Vc). Se calcula del mismo modo que el coeficiente phi ordina-
3 S e alumno ya ha estudiado el captulo 3, puede resultarle til considerar un tamao de efecto chi-cuadrado estima
da com o un coeficiente de correlacin. D e hecho, en ei caso de una tabla de contingencia 2 x 2, la estimacin es real
mente idntica al coeficiente de correlacin. Supongamos que tomramos las dos variables de una tabla de
contingencia 2 x 2 y arbitrariamente hiciramos que uno de ios valores de cada uno fuera 1 y el otro fuera igual a 0, Si
despus calculramos un coeficiente de correlacin entre las dos variables, el resultado seria exactamente el mismo que
el coeficiente phi descripto en el siguiente prrafo {no obstante, segn qu categoras de cada variable hayamos trans
formado en 1 en 0, la correlacin ser negativa o positiva). Las regas de Cohn de tamaos del efecto pequeos, m e
dianos y grandes para el coeficiente phi, que se describen a continuacin, tambin son exactamente las mismas que las
de un coeficiente de correlacin.
rio, excepto que en lugar de dividir por N, se divide por el resultado de la m ultiplicacin de N por
los grados de libertad del lado menor de la tabla (g/Menoc). Se expresa bajo la frmula,
(14-5)
de Cramer =
^O(^Menor)
fm f
x2
<\> d e C ram er =:
W
) { g t U cn
or)
V 8 = 0 ,2 8
(200)(l)
En el estudio de Steil y H ay acerca del sexo con el que hombres y mujeres profesionales se com
paraban a s mismos, calculam os un chi-cuadrado de 8,78, y se entrevist a 118 profesionales.
Lo s grados de libertad del lado ms pequeo de la tabla (en este caso las columnas) era 1. E l phi
de Cram er es 0,27 (la raz cuadrada de 8,78 dividido 118 es 0,27). Lo anterior se expresa bajo la
frmula:
8 ,7 8
d e C ram er=
(ri)(gjvfenor )
= V 0 ^ 0 7 = 0 ,2 6
(H 8 )()
L a s reglas de Cohn para el tamao del efecto del phi de Cram er dependen de los grados de liber
tad del lado menor de la tabla. L a tabla 14-10 muestra las reglas de Cohn para el tamao del
efecto del phi de Cram er (1988), correspondientes a tablas cuyo lado menor es 2 ,3 y 4. Cabe des
tacar que cuando el lado menor de la tabla es 2, el grado de libertad es 1 y, por lo tanto, los tama
os del efecto que indica la tabla para esa situacin son los mism os que para el coeficiente phi
ordinario. (Dado que m ultiplicar por 1 no produce ningn cambio, el clculo tambin arroja el
mismo resultado, tal como sucede en los dos ejemplos que analizam os anteriormente).
Basndonos en la tabla, en el ejemplo del transporte existe un tamao del efecto aproximada
mente mediano (0,28), es decir, una relacin mediana entre el tipo de transporte utilizado y el he
cho de que se trate de una persona diurna o nocturna.
Tabla 14-10.
Reglas de Cohen para el phi de Cramer.
M en o r d im en si n de
la ta b la de c o n tin g en cia
2 Q>Lfcttor ~ ^)
2 lo^Veaor ~ 2 )
^ 0>(vfcnor - 3)
T am a o d el e fe cto
P equeo
M e d ia n o
G ra n d e
OJO
0,07
0 ,0 6
0 ,3 0
0,21
0J7
0 ,5 0
0,35
0 ,2 9
Tabla 14-11.
P o t e n c i a a p r o x im a d a p a r a u n a p r u e b a c h i- c u a d r a d o d e in d e p e n d e n c ia e n la q u e s e p r u e b a la
h ip te s is a n iv e l 0 ,0 5 d e s ig n ific a c i n .
g T otal
T a m a o d e l efecto
N T otal
P equeo
($*0,10)
M e d ia n o
G ra n d e
Hy * 0 , 3 0 )
(4) = 0 ,5 0 )
25
50
100
200
0,08
0,11
0,17
0 ,2 9
0 ,3 2
0 ,5 6
0,85
0,9 9
0 ,7 0
0 ,9 4
25
50
100
200
0,07
0,0 9
0,13
0,23
0,25
0 ,4 6
0 ,7 7
0,97
0,60
0,90
25
50
100
200
0,07
0 ,0 8
0 ,1 2
0 ,1 9
0,21
0 ,4 0
0,71
0 ,9 6
0 ,5 4
0 ,8 6
0 ,9 9
*
25
50
100
200
0,0 6
0,08
0,11
0,17
0,19
0 ,3 6
0 ,6 6
0 ,9 4
0 ,5 0
0 ,8 2
0 ,9 9
*
*Casi i.
4 Cohen (1988, pp. 228-248) proporciona tablas ms detalladas. Las tablas de Cohen se basan en un tamao del efecto
denominado w, que es equivalente al phi pero no al phi de Cramer. En la pgina 222, Cohen ofrece tambin una til ta
bla de conversin de phi de Cramer a w.
5 Cohen (1988, pp, 253-267) proporciona tablas ms detalladas. Para utilizar esas tablas, debe tenerse en cuenta lo indi
cado en la nota al pie na 4. Adems, Duniap y Myers (1997) han demostrado que, con una tabla 2 x 2, la cantidad apro
ximada de participantes necesarios para una potencia de 80 - 90% es 8/<f>2.
Tabla 14-12.
Cantidad total aproximada de participantes necesarios para una potencia del 80% en una prueba
chi-cuadrado de independencia, en la que se prueba la hiptesis al nivel 0,05 de significacin.
T am ao d el efecto
g l T otal
P equeo
(<$> = O J O)
1
2
3
4
783
964
1.090
1.194
M e d ia n o
G ra n d e
f<|> = 0 ,3 0 )
87
107
121
133
f<t> = 0 ,5 0 )
26
39
44
48
ejemplo, supongamos que planificamos un estudio con una tabla de contingencia 3 x 3 (gl~ 4),
que esperamos un gran tamao del efecto y que utilizam os el nivel 0,05 de significacin. De
acuerdo con la tabla, slo necesitaramos 48 participantes (aproximadamente 5 6 por casilla).
CONTROVERSIAS Y LIMITACIONES____________________________________
H ace m edio sig lo , Lew is y Burke (1949) publicaron un trabajo memorable acerca de la u tili
zacin inadecuada del chi-cuadrado. Enum eraron nueve errores comunes aparecidos en publi
caciones y dieron numerosos ejem plos de cada uno de ello s. Con una sola excepcin, su obra
sigue vigente a travs de los aos. Lo s errores siguen com etindose, y an siguen considern
doselos errores.
L a nica excepcin de esa descripcin crtica es el error que L ew is y B urke consideraban la
debilidad ms comn en la utilizacin del chi-cuadrado: frecuencias esperadas demasiado ba
ja s. E n la actualidad, aparentemente esperar cantidades pequeas para las casillas puede no ser
un problema tan grave. Lew is y Burke, como la m ayora de los autores de textos sobre estads
tica de su tiempo, sostenan que cada casilla de una tabla de contingencia (y cada categora de
una prueba de bondad de ajuste) debera tener una frecuencia esperada de tamao razonable.
Recomendaban un m nim o de 10, siendo 5 la cantidad lm ite inferior. Otros recomendaban ci
fras que iban del 1 al 20. Incluso S ir Ronald Fish er (1938) tom partido, recomendando 10 co
mo mnim o. A sim ism o, otros recomendaban que el m nim o deba ser una proporcin del total,
o que dependa del hecho de que las frecuencias esperadas fueran iguales o no. (A propsito,
cabe m encionar que lo que se estaba debatiendo eran frecuencias m nim as esp erad as, no fre
cuencias observadas)
Desde el ao 1949, cuando Lew is y Burke publicaron su trabajo, han habido algunas investi
gaciones sistem ticas acerca de cules eran exactamente los efectos de pequeas frecuencias es
peradas. (En esos estudios se aplican los mtodos de M ontecario; vase cuadro 10-1). C u l es la
conclusin? A l igual que en la m ayora de las reas, la controversia an no est totalmente defini
da. Sin embargo, una importante revisin de las investigaciones realizadas sobre el tema (Deiucchi, 1983) plantea dos conclusiones principales:
1.
"Como norma general, el chi-cuadrado puede usarse apropiadamente en casos en que lo
valores esperados son m ucho m enores a lo s que anteriorm ente se consideraban p erm isi
bles" (p. 168). Incluso frecuencias esperadas tan bajas como 1 por casilla pueden ser aceptables
en trminos del error Tipo I, siempre que en total exista una cantidad razonable de individuos.
zapping (cambiar de canal muy rpidamente), la categora dominada por el tipo de comportamiento
ms activo, ocurri con ms frecuencia en el 33% de las sesiones (n - 18). La categora pastoreo (cu
riosear los canales durante algunos perodos) domin el 24% de las sesiones ( n - 13), y un 22% corres
ponda a cada una de las categoras de visin continua y prolongada (n = 12). Las diferencias no fueron
estadsticamente significativas (x2 = 1,79, gl~3,p> 0,05),
El
6 Supongamos que tenemos una tabla mayor a 2 x 2, con una categora o casilla que tiene una frecuencia esperada ex
tremadamente pequea (o incluso una frecuencia esperada moderadamente pequea si la cantidad de participantes
tambin es pequea). Una solucin es combinar categoras relacionadas para aumentar la frecuencia esperada y redu
cir la cantidad total de casillas. S in embargo, la anterior es una solucin de ltimo recurso si la adaptacin se realiza
basndose en los resultados del experimento. El problema es que se estara capitalizando el hecho de conocer e l resul
tado. La mejor solucin es agregar personas al estudio, pero si esto no fuera factible, a veces se puede aplicar un pro
cedim iento alternativo, denominado prueba exacta de Fisher, que se describe ea algunos textos sobre estadstica de
nivel intermedio. .
mestre en la Universidad Me G il (tiempo 1). Algunos de estos alumnos teman parejas que vivan
en el rea de M cG ill, otros teman parejas que vivan lejos de M e G il. Lo s investigadores se pusie
ron en contacto con los participantes nuevamente durante el semestre de otoo, preguntndoles por
el estado actual de sus relaciones de pareja (tiempo 2). E l siguiente es el informe de sus resultados:
De ios 69 participantes
55 estaban involucrados en relaciones a larga distancia y 14 en relaciones
locales (parejas que vivan dentro de los 200 km de donde vivan ellos). Coherentemente con nuestras
predicciones, 12 de las 14 relaciones locales estaban intactas al tiempo 2 (86%), mientras que slo 28
de las 55 relaciones a distancia permanecan intactas (51%). x2( L =69) = 5,55, p < 0,02. (p. 108)
Aunque Lydon et a l no indicaron el tamao del efecto de resultado significativo, podemos calcu
larlo a partir de la inform acin proporcionada. E l clculo estadstico apropiado para el tamao del
efecto es el coeficiente phi, ya que se trata de una tabla chi-cu adrado 2 x 2 (local contra larga dis
tancia x intacto contra terminada). S i aplicam os la frmula:
Resumen
La s pruebas chi-cuadrado son pruebas de hiptesis para variables nominales. E l chi-cuadrado m i
de el grado de discrepancia entre frecuencias esperadas y observadas de varios niveles o catego
ras. Se calcula encontrando la diferencia entre la frecuencia observada y la frecuencia esperada
de cada categora o combinacin de categoras, elevando esa diferencia al cuadrado (para elim i
nar signos positivos y negativos) y dividindola por la frecuencia esperada (para que las diferen
cias cuadrticas sean ms proporcionales a las cantidades involucradas). Luego se suman los
resultados de todas las categoras o combinaciones de categoras. L a distribucin chi-cuadrado es
una distribucin conocida, y los puntos de cortes pueden encontrarse en una tabla estndar.
L a prueba chi-cuadrado de bondad de ajuste se utiliza para probar la hiptesis de que una dis
tribucin de frecuencias de dos o m s categoras de una variable nominal coincide con una distri
bucin esperada. (Las frecuencias esperadas se basan, por ejemplo, en una teora o en una
distribucin de otro estudio o circunstancia). E n este tipo de pruebas, las frecuencias esperadas se
indican de antemano o se basan en algunos porcentajes esperados (como-por ejemplo, el mismo
porcentaje para todos los grupos). Lo s grados de libertad son la cantidad de categoras menos 1.
L a prueba chi-cuadrado de independencia se u tiliza para probar la hiptesis sobre la relacin
entre dos variables nominales, es decir, si el esquema de repeticin de los participantes en la cate
gora de una variable tiene el mismo patrn proporcional dentro de cada una de las categoras de
la otra variable. Lo s datos se exponen en una tabla de contingencia, en la que las dos variables se
cruzan y las cantidades de participantes de cada combinacin se ubican dentro de cada una de las
casillas resultantes. L a frecuencia esperada para una casilla, si las dos variables son independien
tes, es el porcentaje de todas las personas en ja fila de la casilla m ultiplicado por la cantidad total
de personas en la columna de esa casilla. Lo s grados de libertad para la prueba de independencia
son la cantidad de columnas menos 1, m ultiplicada por la cantidad de filas menos 1.
E l tamao del efecto estimado para una prueba chi-cuadrado de independencia (ei grado de
asociacin), con una tabla de contingencia 2 x 2, es el coeficiente phi; y con tablas mayores, es el
phi de Cramer. Ptii es la raz cuadrada del resultado de la divisin del chi-cuadrado calculado por
la cantidad de participantes. E l phi de Cram er es la raz cuadrada del resultado de la divisin del
chi-cuadrado, calculado por el producto de la cantidad de participantes por los grados de libertad
de la dimensin ms pequea de la tabla de contingencia. Estos coeficientes v^n de 0 a 1; 0 indica
una independencia perfecta y 1 una relacin perfecta. U n phi de 0,10 se considera un tamao del
efecto pequeo, de 0,30 un tamao del efecto mediano y de 0,50 un gran tamao del efecto.
Las pruebas chi-cuadrado no tienen supuestos relacionados con las distribuciones normales
de sus variables, pero s requieren que la categora o casilla en la que se incluye a un participante
sea independiente de la categora o casilla de cualquier otro participante.
L a frecuencia nnnima aceptable para una categora o casilla ha sido tema de controversias.
Actualmente, el mejor consejo es tener en cuenta que, incluso pequeas frecuencias esperadas, no
aumentan seriamente las posibilidades de un error Tipo X, siempre que haya al menos una canti
dad de individuos igual a cinco veces la cantidad de categoras (casillas).
No obstante, las pequeas frecuencias esperadas reducen seriamente la potencia y deben evi
tarse siempre que sea posible.
Trminos clave
-
Variable categrica.
Distribucin chi-cuadrado.
Chi-cuadrado (x 2).
Tabla chi-cuadrado.
Prueba chi-cuadrado de
bondad de ajuste.
- Prueba chi-cuadrado
de independencia.
- Tabla de contingencia.
- Phi de Cramer.
- Frecuencia esperada.
Ejercicios
Lo s ejercicios im plican la realizacin de clcu
los (con la ayuda de una calculadora). L a ma
yora de los problemas estadsticos reales se
resuelven por computadora, pero aunque exis
ta la posibilidad de utilizarla, es conveniente
realizar estos ejercicios manualmente para in
corporar el mtodo de trabajo.
Para adquirir prctica en la utilizacin de
una computadora, para resolver problemas es
tadsticos, se puede utilizar la seccin de com
putacin de cada captulo, publicada en la
Independencia.
Variable nominal.
Frecuencia observada.
Coeficiente phi (<f>).
SERIE I
1.
Calcule una prueba chi-cuadrado de
bondad de ajuste para cada uno de los siguien
tes casos (utilice el nivel 0,05 para cada uno):
C a teg o ra
E sp era d o
O b se rv a d o
A
B
C
D
E
20%
20%
40%
10%
10%
19
11
10
15
15
C a teg o ra
E sp er a d o
O b servad o
I
n
30%
50%
20%
100
100
ni
100
1
2
C antidad
en el p a sa d o
100
3
4
300
50
50
C a teg o ra
O bservado*
Artes
C iencias
Hum anidades
37
O b serv a d o
38
124
22
16
21
32
10
16
16
10
10
16
16
10
10 10
100 106
106 100
100 160
160
10
10
16
oi
C a teg o ra
16 16
10 16
16
16
10
10
16
5.
Un psiclogo especializado en educa
cin est interesado en saber si los alumnos
que utilizan mquinas de escribir o procesado
res de texto (o ninguno de ellos) para escribir,
cuando realizan tareas en sus hogares, tienden
a utilizar lapicera o lpiz cuando toman apun
tes en clase. El investigador entrevista a 200
alumnos. Los resultados aparecen en la tabla
que sigue a continuacin. Existe una relacin
significativa entre estas dos variables? (Utilice
el nivel 0,05). a) Realice los cinco pasos de la
prueba de hiptesis, b) Calcule el phi de Cra
mer. c) Explique su respuesta a una persona
que nunca ha tomado un curso de estadstica.
Artefacto utilizado
en sus hogares
1 e
M q u in a d e P r o c e s a d o r
V
s
t
S
mr
V* T
g o*
S
L a p ic e r a
P p iz
e s c r ib ir
d e te x to s
.; 42 . ;
' 62.
38
18
N in g u n o
26
14
6.
Un analista poltico est interesado e
saber si existe relacin entre la comunidad en
la que vive una persona y la opinin de esa per
sona con respecto a una futura iniciativa de vo-
A fa vo r
E n c o n tr a
N o e m ite o p in i n
12
.18.
12
' 3
:
SERIEN
1. Calcule una prueba chi-cuadrado de
bondad de ajuste para cada uno de los siguien
tes casos (utilice el nivel 0,01 para cada uno de
ellos):23
C a tegora
E sp er a d o
2%
14%
34%
34%
14%
2%
1
2
3
4
5
'
15 '
C ategora
P rop orcin
e sp era d a
O b servad o
5
15
90
120
50
20
O b servad o
12 ; '
A
B
C
1/3
1/6
1/2
10
10
10
7.
Shi et al. (1997) entrevistaron a 558 m
2. Calcule una prueba chi-cuadrado para
dicos que realizan atencin primaria en Caroli
cada
uno de los siguientes casos utilizando el
na del Sur, concentrndose en las diferencias
nivel 0,05. En cada ejercicio, la distribucin
entre aquellos que han tratado o no a pacientes
esperada es que las frecuencias sean iguales en
con hv/ seda. Algunos de los resultados apare todas las categoras. (Se trata de ejercicios si
cen en la tabla 14-13. (La tabla indica porcen milares al ejemplo de Harter et al. en los que
tajes, no nmeros reales). Concntrese en el realizamos un chi-cuadrado para una sola va
resultado que aparece cerca del final y que riable nominal. No son pruebas chi-cuadrado
muestra la relacin entre la cantidad de horas de independencia y no incluyen tablas de con
que el mdico generalmente ejerce por semana tingencia).
y el hecho de que el mdico hubiera tratado o
a ) 5 1 0 5 b) 10 15 10 c) 1 0 2 0 10 d ) S 1 5 5
no a pacientes con hv/ sida ; el resultado tiene
3. Una investigadora necesita estar segu
un chi-cuadrado de 15,1. a) Calcule usted mis
ra de que la muestra para su estudio no deje
mo el chi-cuadrado (muestre su trabajo); sus de ser representativa de la distribucin de
resultados deberan ser iguales a los indicados, grupos tnicos de su comunidad. La muestra
teniendo en cuenta las diferencias de redon incluye 300 blancos, 80 africanos america
deo. (Para resolver el ejercicio deber convertir nos, 100 latinos, 40 asiticos y 80 personas
los porcentajes en nmeros reales. Observe de otros grupos tnicos. En la comunidad, se
que los porcentajes dados son los porcentajes gn registros de censos, hay un 48% de blan
de las personas en la columna. Por lo tanto, en cos, un 12% de africanos americanos, un
el caso de los mdicos que ejercen 40 horas por 18% de latinos, un 9% de asiticos y un 13%
de otros grupos tnicos. Es la muestra repre
semana o menos y han tratado a pacientes con
sentativa o no de la poblacin de la comuni
hiv/ seda, el 11% es igual a 37 mdicos. (Es de
dad? (Utilice el nivel 0,05). a) Realice los
cir, 11% x 335 = 37, redondeando para obtener cinco pasos de la prueba de hiptesis, b) Ex
la cantidad entera de mdicos ms cercana), b) plique su respuesta a una persona que nunca
Calcule el phi de Cramer. c) Explique su resul ha tomado un curso de estadstica. (Nota: el
tado a una persona que nunca ha tomado un ejercicio es similar al ejemplo de Harter et
al., en el que realizamos un chi-cuadrado pacurso en estadstica.
T a b la 1 4 - 1 3 .
C a r a c t e r s tic a s d e m o g r fic a s d e lo s m d ic o s e n tr e v is ta d o s (e n p o r c e n ta je s ).
T o ta l
C a r a cter stic a s
f /V - 5 5 8 )
N o han
H a n tr a ta d o
t r a ta d o
p a c ie n te s c o n p a c ie n t e s c o n
HTV/SWA
HTV/SIDA
(n - 3 3 5 )
(n = 2 2 3 )
X2
36
31
14
53,8***
21
.
0
11
22
23
17
5
7
20
10
44
37
21
12
3
88
12
9
91
11
21
68
3,4
E stadstico t
3 4 ,1 * * *
21
18
14
0,7
89
11
8
0,1
'
92
15,1***
23
21
56
5
2,7
3 ***
Nota: E s p o sib le que los porcentajes no sumen 100 debido a redondeo. La mayora de lo s entrevistados (51%)
brindaron servicios a menos de 10 pacientes con hv / sida , un 4% a 10-19 pacientes, un 1% a 20-29 pacientes, un 1% a
30-39 pacientes y un 3% a 4 0 ms pacientes.
aLa variable se midi en una escala de 5 puntos que iba del 1 = nunca a 5 = siempre.
***<0,01.
Puente: Sbi, L., et a. (1997), tab. 1. M dicos de atencin primaria y barreras contra la atencin a personas con
HTV/sTDA . E va lu a ci n & P ro fe sio n e s rela c io n a d a s c o n la s a lu d (E va lu a o n & The H e a lth P ro fessio n s], 20, 164-187.
Copyright 1997, por Sage Publcatons, Inc. Reimpreso con autorizacin de Sage Publications.
V8
S 16
8 . 8;' 8
8 s 8
8, a 16
-832
; 8 "8-' .8
1 $ 8 i-
8 8 32
8 8 8
8 '8 8
8 8 48
Asistencia
R egu lar
P latea
3? - G alera prin cipal
os
d e p a lc o s
O -3
G alera
20
20
40
O casion al
80 .
20 .:.
; 80
6.
Everett et al. (1997) realizaron una
cuesta por correo a una muestra de mdicos
elegidos al azar. A la mitad se les ofreci $1 si
enviaban el cuestionario (este era el grupo ex
perimental); a la otra mitad se la utiliz como
grupo control. El objetivo del'estudio era com
probar si aun un pequeo incentivo aumentara
el porcentaje de devoluciones de encuestas en
viadas a mdicos. Everett et al, informan sus
resultados de la siguiente forma:
De las 300 encuestas enviadas por correo al
grupo experimental, 39 no fueron entregadas; 2
fueron devueltas sin completar, y 164 fueron
p <0tG01j.
a) Calcule usted mismo el chi-cuadrado y
en
muestre su trabajo. Sus resultados deberan
ser iguales a los indicados en el prrafo ante
rior, teniendo en cuenta las diferencias de re
dondeo. (Cuando resuelva este ejercicio no
olvide que se basa slo en las respuestas que
no fueron devueltas sin entregar. Por lo tanto,
en el caso del grupo experimental hubo un to
tal de 261 respuestas, de las cuales 164 fue
ron devueltas completas y las restantes 96
no), b) Calcule phi. c) Explique el resultado a
una persona que nunca ha tomado un curso
de estadstica.
Estrategias a
aplicar cuando las
distribuciones
poblacionales
no son normales:
Transformaciones de datos, pruebas
de rango y orden y mtodos intensivos
por computadora
;;.-^^Pra^e)dimiiitols/qejSe/utnizam cuando
las poblaciones parecen no normales,
segn se describen en las publicaciones
.piei^flcas^^ ^
r
:'-';^\
/'jResiincieri/ V' i'LyoV
>: Xrminos clave.
:y Ejercicios.
vienen de poblaciones distribuidas normalmente. Adems, se puede calcular una prueba de signi
ficacin del coeficiente de correlacin (vase apndice II dei captulo 3) y, tambin en ese caso, es
muy importante el supuesto de normalidad.1
En captulos anteriores tambin aprendimos que se obtienen resultados exactos incluso cuan
do un estudio sugiere que las poblaciones cumplen con los supuestos de curva normal y de igual
varianza en forma muy imprecisa. Sin embargo, el tema que nos preocupa en este caso son las si
tuaciones en las que queda claro que las poblaciones no son ni siquiera cercanas a lo normal, o que
ni siquiera estn cerca de tener iguales varianzas. S en esas situaciones se utiliza la prueba r o el
anlisis de varianza ordinarios, se pueden obtener resultados muy incorrectos. Por ejemplo, po
dramos realizar todos los clculos correctamente y decidir rechazar la hiptesis nula conforme a
esos resultados. Sin embargo, si las poblaciones no cumplen con los supuestos estndar, el resul
tado podra-ser incorrecto (incorrecto en cuanto a que en lugar de existir realmente un 5% de pro
babilidad de obtener los resultados si la hiptesis nula es verdadera, en realidad podra haber un
15% 20% de probabilidad!).
No debemos olvidar que los supuestos se refieren a las poblaciones y no a las muestras. Es
bastante probable que una muestra no siga una curva normal aunque provenga de una poblacin
que s lo hace. La figura 15-1 representa grficamente histogramas de varias muestras, cada una
tomada al azar de una poblacin que sigue una distribucin normal. (En la figura se observa que
cuanto menor es la muestra, ms difcil es notar que proviene de una poblacin normal). Por su
puesto, es bastante probable que poblaciones no normales produzcan cualquiera de esas muestras
tambin, Lamentablemente, la muestra es todo o que tenemos cuando realizamos un estudio. Lo
que los investigadores hacen es trazar un histograma que represente la muestra y, si el grfico no
es significativamente diferente de lo normal, los investigadores suponen que la poblacin de don
de proviene es normal. Cuando se trata de normalidad, la mayora de los investigadores psicolgi
cos considera que una distribucin es inocente hasta que se demuestre lo contrario.
Una situacin comn en la que un investigador podra dudar del supuesto en cuanto a que
la poblacin sigue una distribucin normal, es cuando existe un efecto techo o piso (vase cap
tulo 1). Otra situacin comn que origina las mismas dudas es aquella en la que la muestra tie
ne valores atpicos, casos extremos a uno o a ambos lados de la distribucin muestral. La figura
15-2 representa grficamente algunos ejemplos de distribuciones con casos atpicos. Los casos
atpicos son un gran problema para ios mtodos estadsticos que utilizamos comnmente, ya
que estos se basan, en ltima instancia, en desvos cuadrticos de la media. Al encontrarse tan
lejos de la meda, un caso atpico tiene una gran influencia cuando elevamos al cuadrado su
desvo con respecto a la media. El resultado es que un slo caso atpico, si es lo suficientemen
te extremo, puede hacer que una prueba estadstica resulte significativa aun cuando todos ios
otros valores no io haran. Un caso atpico tambin puede hacer que un resultado que sin l se
ra significativo, no lo sea.
1A l calcular la significacin de la regresin (captulo 4) suponemos que en la poblacin, para cada nivel de la variable de
prediccin, la variable dependiente es normal. Tambin suponemos que la varianza de la variable dependiente es la
misma para cada nivel de la variable de prediccin. En la correlacin (captulo 3), el requisito es an ms estricto, siendo
necesario que cada variable y las combinaciones de variables tengan distribuciones normales. Textos ms avanzados pre
sentan mtodos sofisticados para identificar si se cumplen los supuestos mencionados. Sin embargo, al menos podemos
considerar que los supuestos no han sido cumplidos si los datos de la muestra sugieren que en la poblacin la distribu
cn general con respecto a la variable dependiente (en la regresin), o a ambas (en la correlacin), no es normal.
.
0 , 0,5
1,0
1,5 2,0';
S- '
.MI
4
i
= M. '
^ '&
IlMS
"A: f e s c ; '
-2,0 -{,5 -1,0 -0,5
0,5
SlllliS
fri:
{,0
v ":
,5; :2,0;.:--y
o -
-2,0' - i.5 ~:l-.0 -0,5; 0jV~
Figura 15-2.
Distribuciones coa casos atpicos en uno o arabos lados.
Figura 15-1.
Histogramas de varias muestras elegidas al azar,
tomadas cada una de una poblacin normal con
|X = 0 y a = I.
TRANSFORMACIONES DE DATOS
Un procedimiento ampliamente utilizado cuando los valores de la muestra no parecen provenir de
una poblacin normal es cambiar los valores! Por supuesto que no se inventan, aunque eso puede
parecer antes de que expliquemos el procedimiento. El mtodo consiste en que el investigador
aplique algn procedimiento matemtico a cada valor, como calcular la raz cuadrada, para hacer
que una distribucin no normal se acerque ms a lo normal. (Algunas veces este procedimiento
tambin logra que las varianzas de dos o ms grupos se asemejen ms). El proceso que describi
mos en el prrafo anterior se denomina transformacin de datos. Una vez que hemos realizado
una transformacin de datos, si se cumplen los otros supuestos podemos entonces calcular una
prueba t, un anlisis de varianza o una correlacin ordinaria y, as, obtener resultados precisos.
La transformacin de datos tiene una ventaja importante con respecto a otros procedimientos
que aprenderemos para trabajar con poblaciones no normales; una vez que hemos realizado una
transformacin de datos, podemos utilizar procedimientos familiares y sofisticados de prueba de
hiptesis.
Analicemos un ejemplo. Las medidas de tiempo de reaccin usualmente son muy asimtricas
hacia la derecha. Hay muchas respuestas cortas (rpidas) y unas pocas, pero a veces muy extre
mas, largas (lentas). Es improbable que los tiempos de reaccin que aparecen en la figura 15-3
provengan de una poblacin que sigue una curva normal; en realidad es probable que la propia
poblacin de tiempos de reaccin sea asimtrica.
Sin embargo, supongamos que sacamos la raz cuadrada de cada tiempo de reaccin. La ma
yora de los tiempos de reaccin sern apenas afectados. Un tiempo de reaccin de 1 segundo
contina siendo 1; un tiempo de reaccin de 1,5 segundos se reduce a 1,22. Pero los tiempos de
reaccin muy lentos, los que crean la larga cola hacia la derecha, son reducidos sustancalmente;
Por ejemplo, un tiempo de reaccin de 9 segundos se reduce a 3, y un tiempo de reaccin de 16
segundos (la persona realmente estaba distrada y se olvid de la tarea que estaba realizando) se
reduce a 4. La figura 15-4 muestra el resultado despus de sacar la raz cuadrada de cada tiempo
de la distribucin asimtrica representada en la figura 15-3. Despus de una transformacin raz
cuadrada, parece mucho ms probable que la distribucin de ios tiempos de reaccin provenga
de una poblacin con una distribucin normal (de valores transformados).
Legitimidad de la transformacin de datos
Es un engao el proceso que describimos? Lo sera si se realizara slo con algunos valores o de
algn otro modo que hiciera el resultado ms favorable a la prediccin del investigador. Sin em
bargo, en las investigaciones reales, el primer paso despus de recopilar y registrar los datos (y
controlar su precisin) es observar si sugieren que las poblaciones cumplen con los supuestos. Si
los datos sugieren que las poblaciones no cumplen con los supuestos, entonces el investigador
realiza transformaciones de datos. La prueba de hiptesis se realiza slo despus del control men
cionado y cualquier transformacin necesaria.2
No debemos olvidar que cualquier transformacin de valores debe realizarse con todos los
valores de esa variable, no slo con los de un subgrupo determinado. Lo ms importante es que,
cualquiera sea el procedimiento de transformacin que utilicemos, el orden de los valores siem
pre es el mismo. Un valor original, que es el segundo ms alto de un grupo de valores, continuar
siendo el segundo ms alto en el grupo de valores transformados.
Puede parecer que el procedimiento distorsiona de algn modo la realidad para adecuarla a la
estadstica. En algunos casos, esta es una preocupacin legtima. Supongamos que se analiza
la diferencia de ingresos entre dos grupos. Probablemente no nos interese cunto difieren los
7 U n a v e z q u e s e com pleta un estu d io, y antes de realizar cualquier c lcu lo estad stico descriptivo o prueba d e signifi
ca ci n , lo s investigadores prim ero controlan cu id ad osam en te q u e toda !a inform acin haya sid o registrada correcta
m en te e ingresad a c o n precisin e n la com putadora. D esp u s controlan cada variable en cu an to a la form a de su d is
tribucin, para ver s i su p ob lacin difiere seriam ente d e lo norm al, p roceso qu e se denom ina exp lo ra ci n d e datos. La
exp loracin d e datos es un trabajo ted ioso, y lo s investigadores estn naturalm ente a n sio so s d e encontrar lo antes posi
b le la form a en la que fu nciona el estudio. S in em bargo, io s investigadores experim entados han aprendido que vale la
pena p osponer la prueba d e h ip tesis para realizar n bu en anfisis exploratorio d e datos. E s m u y frustrante realizar
tod o tipo d e anlisis y lu eg o descubrir qu e e l trabajo ha sid o un a prdida d e tiem p o porque hab a u n error en el ingreso
d e la in form acin o porque una d e las variables n ecesitab a ser transform ada. (D e h ech o , es peor q u e una prdida de
tiem p o. E l investigador pu ed e entu siasm arse o desanim arse m u ch o co n su s supuestos resultados y lu e g o descubrir que
las c o n clu sio n es no tenan s en tid o y q u e d eb e co m en za r to d o e l p roceso nu evam ente).
F ig u r a 1 5 -3 .
F ig u r a 1 5 -4 .
dos grupos con respecto a la raz cuadrada de sus ingresos, sino que lo importante es la diferen
cia en dlares reales.
Por otro lado, analicemos el cuestionario sobre autoestima. Las puntuaciones del cuestionan
rio no tienen ningn significado directo. Las puntuaciones ms altas indican mayor autoestima; .
las puntuaciones ms bajas, menor autoestima. Sin embargo, cada unidad de aumento en la prue
ba no necesariamente est relacionada con una cantidad igual de aumento en la autoestima de un .
individuo. Es verosmil que la raz cuadrada de cada incremento de una unidad est directamente:
relacionada con la autoestima de una persona. De modo similar, si analizamos el ejemplo utiliza
do anteriormente acerca del tiempo de reaccin, medido en segundos, la medicin parecera tener
un significado directo. Sin embargo, incluso en ese caso, la variable implcita, eficiencia del pro
cesamiento del sistema nervioso, puede no estar directamente relacionada con la cantidad de se
gundos. Probablemente es una operacin compleja que sigue alguna regla matemtica desconocida
(aunque siempre esperaramos que los tiempos ms cortos indicaran un procesamiento ms efi
ciente, y tiempos ms largos un procesamiento menos eficiente).
En los ejemplos anteriores, el patrn implcito de la variable es desconocido. Por lo tanto,'
no existe razn para pensar que la versin transformada sea un reflejo menos preciso de la reali
dad que la versin original. Y la versin transformada puede cumplir el supuesto de normalidad.
Tipos de transformaciones de datos
Existen distintos tipos de transformaciones de datos. Ya hemos ilustrado una transformacin raz
cuadrada: en lugar de utilizar cada valor, se utiliza su raz cuadrada. Las figuras 15-3 y 15-4 ilus
tran un ejemplo, y la figura 15-5 representa grficamente el efecto general; una distribucin asi
mtrica hacia la derecha se transforma en una distribucin menos asimtrica hacia la derecha des
pus de. la transformacin raz cuadrada. Para expresarlo numricamente, los nmeros moderados
se convierten en nmeros levemente menores y los nmeros altos se convierten en nmeros mu
cho menores. El resultado es que el lado derecho es empujado hacia el centro.
Figura 15-5.
Analicemos un estudio ficticio en el que cuatro nios con valores altos en una prueba sobre alta
sensibilidad son comparados, en cuanto a la cantidad de libros ledos durante ei ao anterior, con
cuatro nios que tuvieron valores bajos en la misma prueba. (La nocin general de persona altar
mente sensible se describe en Aron, 1996 y Aron & Aron, 1997). Basndonos en la teora, el in
vestigador predice que los nios altamente sensibles habrn ledo ms libros. La tabla 15-1 refle
ja los resultados.
Comnmente, en un estudio de este tipo, que incluye una comparacin de dos grupos inde
pendientes, deberamos utilizar una prueba t para medas independientes. Pero la prueba f para
medias independientes es igual a iodos los procedimientos de prueba de hiptesis aprendidos (ex-
cepto el chi-cuadrado); requiere que la poblacin madre de observaciones de cada grupo est or-.
malmente distribuida. En este estudio, sin embargo, la distribucin de la muestra es muy asimtri
ca hacia la derecha, y los valores tienden a acumularse a la izquierda formndose una larga cola
hacia la derecha. Por eso parece probable que la poblacin de observaciones de cantidad de libros ;
ledos (tanto para nios sensibles como para los no sensibles) tambin sea asimtrica hacia la de
recha. Adems, a la luz de lo que se est midiendo, la forma descripta de la distribucin poblacional parece razonable: un nio no puede leer menos que ningn libro; pero una vez que un nio co
mienza a leer, es fcil que lea muchos libros en un ao.
Tabla 15-1.
Resultados de un estudio que compara nios altam ente y no altam ente sensibles con relacin a a
cantidad de libros ledos durante el ao anterior (datos ficticios).
Altamente sensible
No
0
3
10
22
35
8 ,7 5
9 5 ,5 8
Si
17
36
45
75
173
4 3 ,2 5
5 8 4 ,0 0
Tambin podemos observar que las varianzas poblacionales estimadas sobre la base de las
dos muestras son significativamente diferentes, 95,58 contra 584, otra razn par no querer pro
seguir con una prueba t ordinaria.
Sin embargo, supongamos que realizamos una transformacin raz cuadrada de las observa
ciones (tabla 15-2). El resultado es que ambas muestras son mucho ms adaptables a una curva
normal, y la transformacin tambin parece razonable en cuanto al significado de los nmeros.
La cantidad de libros ledos pretende ser una medida del inters literario; por lo tanto, la diferen
cia entre 0 y 1 libro es una diferencia mucho mayor que la que existe entre 20 y 21 libros.
La tabla 15-3 muestra la prueba utilizando los valores transformados. Como lo indica la ta
bla, la diferencia entre los grupos es significativa.3
Otro ejemplo de transformacin de datos
Esta vez analizaremos un ejemplo ficticio que incluye una correlacin. Si el alumno an no ha es
tudiado el captulo 3, debera pasar por alto esta seccin.
Un psiclogo especializado en educacin realiza un estudio acerca de la relacin entre la pun
tuacin en una prueba de lgebra y la nota de nivel escolar, probando a cuatro alumnos de la es
cuela. La figura 15-6 muestra el diagrama de dispersin; la tabla 15-4 mustralas observaciones y
los clculos del coeficiente de correlacin.
Como se desprende de la figura y de la tabla, existe cierto grado de correlacin. Sin embar
go, si observamos nuevamente la lista de valores observados y el diagrama de dispersin, el nio
con 95 puntos en la prueba de lgebra sobresale entre los dems. El valor 95 es un caso atpico.
Para decirlo de otro modo, las puntuaciones de la prueba de lgebra son asimtricos hacia la de
recha; se agrupan cerca del lmite inferior de las puntuaciones de la prueba y tienen una larga co
la que llega al valor 95, que se ubica lejos a la derecha. Las notas de nivel escolar no son muy di
ferentes de lo que se hubiera esperado si provinieran de una poblacin normal. Las notas se
agrupan cerca de la mitad (el 6 y el 7) y luego se dispersan un poco ms, en forma pareja, para
ambos lados (el 4 y el 9).
Tabla 15-2,
Transformacin raz cuadrada de los registros de la tabla 15-1.
A lta m en te sen sib les
______ SL
N o ______
X
'FX
<X
0
3
10
22
0,0 0
1,73
3,16
4 ,6 9
17
36
45
75
4 ,1 2
6,00
6,71
8,66
3 Si hubiramos realizado el anlisis utilizando los valores originales sin transformar, r sena igual a (43,25'- 8,75)/13,04
2,65, un t levemente menor pero an significativo. Por supuesto, no hubiera sido correcto realizar e l anlisis de ese
modo. Si el anlisis realizado con valores no transformados hubiera producido un resultado diferente, el resultado co
rrecto hubiera sido el logrado sobre la base de los valores transformados.
Tabla 15-3.
Clculos de una prueba t para medias independientes aplicando la transformacin raz cuadrada a
los valores observados del estudio acerca de los libros ledos por nios altamente sensibles contra los
no altamente sensibles (datos ficticios).
Punto de corte f para nivel 0,05 de significacin, g l = (4 - 1) + (4 - 1) = 6, una cola = -1 ,9 4 3 .
Altamente sensible
No
0,0 0
1,73
3,1 6
4,69
2:
M=
4,12
6,00
6,71
8,66
9,58
9 ,5 8 /4 = 2 ,4 0
12,03/3 = 4,01
S> =
2 5 ,4 9
2 5 ,4 9 /4 = 6,37
1 0,56/3 = 3,52
combinado"
3 ,7 7 /4 = 0,94
^ ^
=0^
3 ,7 7 /4 = 0 ,9 4
0^4 = 1,88
W nica = ^ 8 8 = 1.37
= ( 6 ,3 7 - 2 , 4 0 ) / ! ,37 = 2 ,9 0
C onclusin: se rechaza la hiptesis nula.
F igura 15-6.
D iagram a de d isp ersin d e un e stu d io acerca
d e la nota d e n iv e l e sc o la r y la pu n tu acin en
una prueba de lgebra, (D a to s fic tic io s ).
Tabla 15-4.
Registros y clculos de un estudio que correlaciona las notas de nivel escolar y las puntuaciones en
una prueba de lgebra (datos ficticios).
P u n tu a ci n e n la p ru eb a
O r ig in a l
1
4
10
95
no
27,5
39,1
N o ta d e n iv el esc o la r
O r ig in a l
- 0 ,6 8
-0 ,6 0
- 0 ,4 5
10,73
4
6
9
7
26
6,5
P r o d u cto cru za d o
zr
-1 0 ,4 7
-0 ,2 9
1,47
0 ,2 9
1,00
0,17
-0 ,6 6
0 ,5 0
r =
1,01
0,25
1.7
ios. La correlacin calculada con ios valores transformados a logaritmos es de 0,65. La correlacin
calculada utilizando valores no transformados, como lo muestra la tabla 15-4, es de slo 0,25.
La tabla 15-5 tambin indica los clculos de la significacin del coeficiente de correlacin (el
procedimiento est tomado del apndice n del captulo 3). Incluso con una correlacin tan alta,
como de 0,65, con slo cuatro participantes existe insuficiente potencia para rechazar la hiptesis
nula. (Cuando se trabaja con una correlacin, la hiptesis nula establece que la correlacin en la
poblacin es 0). Sin embargo, al menos fue correcto calcular esta prueba t, en el sentido de que
habamos cumplido el supuesto de distribuciones normales. (Supongamos que hubiramos calcu
lado incorrectamente t para la correlacin de 0,25 a partir de los valores sin transformar. El t hu
biera sido de slo 0,37, contra 1,21 con los valores transformados).
F ig u r a 15-7.
Tabla 15-5.
Observaciones y clculos de un estudio que correlaciona la nota de nivel escolar y las puntuaciones
en una prueba de lgebra transformadas a logaritmos (datos ficticios).
Puntuacin en la prueba . Nota de nivel escolar
O r ig in a l
0 ,0 0
0 ,6 0
1,00
1,98
3,5 8
0,9 0
0 ,7 2
Zx
-1 ,2 5
- 0 ,4 2
0 ,1 4
1,50
O rig in a l
4
6
9
7
Producto cruzado
zY
1,84
0,12
0,21
0 ,4 4
-1 ,4 7
-0 ,2 9
1,47
0,29
26
6,5
1.7
r =
2,61
0,65
Prueba de significacin:
Punto de corte f necesario (n ivel 0 ,0 5 , g l = 2, una cola) = 2 ,9 2 0
res a 1,2,3 y 4; el 1 para el nmero ms bajo del grupo, el 2 para el siguiente ms bajo, y as su
cesivamente.
La nica complicacin de la transformacin de rango y orden surge cuando existen dos o ms
valores iguales. La solucin usual.para Ios-casos en los que existen valores iguales es darle a cada
uno el promedio de los rangos correspondientes. Por ejemplo, a los valores 12, 81, 81,107 y 154
les corresponderan los rangos 1,2,5,2,5,4 y 5,
Convertir los valores en rangos es una especie de transformacin de datos, pero a diferencia
de las transformaciones que hemos analizado hasta ahora, una transformacin de rango y orden
no se utiliza para producir una distribucin normal, aunque, en efecto, produce una distribucin
particular. La distribucin que se obtiene a partir de una transformacin de rango y orden es rec
tangular, con la misma cantidad de valores (uno) para cada valor (la nica excepcin son los valo
res iguales). Los rangos producen el efecto de dispersar los valores en forma pareja.
Existen diversos procedimientos especiales de prueba de hiptesis que utilizan datos trans
formados en rangos. Se los denomina pruebas de rango y orden. Tambin tienen otros dos nom
bres comunes: dado que los datos de una poblacin con cualquier tipo de distribucin pueden
transformarse en rangos, estas pruebas a veces se denominan pruebas libres de distribucin; y
dado que la distribucin de valores convertidos en rangos no es estimada sin que se conoce con
exactitud, las pruebas de rango y orden no requieren la estimacin de ningn parmetro (valores
de la poblacin). (Por ejemplo, no hace falta estimar ia varianza de una poblacin porque pode
mos determinarla exactamente si sabemos cuntos valores la forman y que esos valores han sido
transformados en rangos). Por eso, los procedimientos de prueba de hiptesis basados en rangos
tambin se denominan pruebas no paramtricas.
Los procedimientos ordinarios de prueba de hiptesis que hemos aprendido (prueba t y anli
sis de varianza) son ejemplos de pruebas paramtricas. El chi-cuadrado, al igual que las pruebas
de rango y orden, se considera una prueba no paramtrica; sin embargo, es libre de distribucin s
lo en el sentido de que no existen supuestos sobre la forma de las distribuciones poblacionales. No
obstante, los trminos Ubre de distribucin y no paramtrico generalmente se utilizan en forma
indistinta; las sutilezas con respecto a la diferencia entre esos trminos son materia de debate entre
los estadsticos.
Las pruebas de rango y orden tienen la ventaja adicional de poder utilizarse cuando los valores
reales del estudio son rangos; por ejemplo, un estudio que compara el nivel social de dos clases de
graduados. Adems, algunas veces son cuestionables los valores numricos exactos de los nmeros
de una medida utilizada en determinado estudio. Por ejemplo, un investigador tiene la intencin de
aplicar una medida numrica en el sentido usual, siendo 7 tan superior a 5 como 12 lo es de 10 (el in
vestigador pretende que sta sea una medicin intervalar; vase captulo 1). Sin embargo, en reali
dad slo est seguro de que los nmeros estn ordenados correctamente: 7 es mayor que 5,10 es ma
yor que 7, y as sucesivamente. En ese caso, el investigador podra utilizar una medicin de rango y
orden para no sobrestimar la calidad del instrumento o procedimiento de medicin.
En realidad, el tema es algo controvertido. Analicemos, por ejemplo, una escala en la que
1 = en desacuerdo; 2 = medianamente en desacuerdo; 3 = medianamente de acuerdo, y 4 = de
acuerdo. Los significados implcitos en los nmeros, estn dispersos en forma pareja en la esca
la numrica? Queda claro que los resultados tienen sentido como datos de rango y orden -cierta
mente, 2 muestra ms aprobacin que 1, 3 ms que 2 y 4 ms que 3. Por eso, algunos psiclogos
sostienen que, en la mayora de los casos, no deberamos suponer que tenemos mediciones inter
valares, y deberamos convertir nuestros datos en rangos y utilizar una prueba de significacin de
rango y orden. Otros investigadores sostienen que las pruebas estadsticas paramtricas resultan
razonablemente precisas incluso con mediciones de rango y orden reales, y que al cambiar todos
los datos a rangos se puede perder informacin valiosa. La cuestin sigue sin resolverse.
Idea general acerca de las pruebas de rango y orden
La tabla 15-6 muestra el nombre de las pruebas de rango y orden con las que se sustituira cada
procedimiento paramtrico ordinario de prueba de hiptesis que hemos aprendido. Cuando se in
dica ms de una prueba posible, los procedimientos son aproximadamente equivalentes.4
A continuacin describimos en forma general el modo en que se realizan estas pruebas, inclu
yendo un ejemplo. Sin embargo, no daremos toda la informacin necesaria para realizar una de
esas pruebas en la prctica; slo presentamos estas tcnicas porque seguramente aparecern en
4 E xiste una prueba no pararatrica ampliamente utilizada, adems de las pruebas chi-cuadrado, que no se basa en
registros de rango y orden. S e ia denom ina p ru eb a de sig n os. Una prueba de signos se utiliza en lugar de una prue
ba r para medias dependientes. Se crea la serie de valores diferenciales y luego se suman slo los nmeros positivos.
Tabla 15-6.
Principales pruebas de rango y orden equivalentes a las principales pruebas paramtricas.
P r u e b a s p a r a m tr ic a s o r d in a r ia s
P r u e b a s d e r a n g o y or d e n e q u iv a len te s
Si no existe diferencia promedio, aproximadamente la mitad de ios valores diferenciales debera ser positiva y la mi
tad negativa. Si la cantidad de positivos es considerablemente mayor o considerablemente menor a la mitad, e resul
tado estara en contra de una hiptesis nula que establece que la verdadera poblacin de valores diferenciales tiene
una diferencia promedio igual a cero. Los textos estadsticos de nivel intermedio usualmente incluyen una tabla don
de buscar los puntos de corte de significacin de una prueba de signos.
Tabla 15-7.
Clculos de una prueba de suma de rangos de Wcoxon basados en el estudio acerca de los libros
ledos por nios altamente sensibles en comparacin con los ledos por nios no altamente sensibles
(datos ficticios).
Punto de corte: sum a m xim a de rangos en e l grupo no altam ente sen sib le para un nivel 0 ,0 5 de significacin,
una cola (de una tabla estndar) = 1 1 .
A lt a m e n t e s e n s ib le
No
Si
R ango
Rango
0
3
10
22
1
2
3
17
36
45
75
4
6
7
8
2:
5
11
C om paracin con e l punto de corte: la sum a de rangos del grupo que s e predijo tendra lo s registros m s bajos;
11, iguala pero no e x ced e al punto d e corte de significacin.
C onclasin: se rechaza la hip tesis aula.
desiguales. Y el problema se torna realmente inmanejable con diseos ms complicados. Por eso /
se han desarrollado varias aproximaciones que utilizan las sumas de rangos en una frmula q u :
produce una puntuacin Z, Si la puntuacin Z se encuentra en la regin superior sobre la cual es-:\
t el 5% del rea, bajo la curva normal (2,5% para una prueba de dos colas), el resultado se cn- -"
sidera significativo. Con frecuencia, cuando las publicaciones cientficas informan las pruebas de
rango y orden indican la puntuacin Z que mencionamos.
Conover e Imn (1981) demostraron que no es necesario realizar los procedimientos de clculo ;/
especiales de las pruebas de rango y orden. Se pueden obtener aproximadamente los mismos resultados si transformamos los valores observados en rangos y luego aplicamos la aritmtica ;
usual para calcular una prueba paramtrica ordinaria, como por ejemplo una prueba t. (El proce- :
dmiento descripto funciona en el caso de una prueba , un anlisis de varianza de un criterio, y;.:
en la significacin del coeficiente de correlacin. No funciona tan bien con el anlisis de variam /
za de dos criterios).
El resultado de utilizar una prueba paramtrica con valores transformados en rangos no ser tan/
preciso como los de la prueba paramtrica ordinaria o la prueba de orden y rango. No sern tan pr- '
cisos como los de la prueba paramtrica ordinaria porque no se cumple el supuesto de distribuciones:;
normales, ya que, en realidad, cuando se trabaja con rangos la distribucin es rectangular. Tampoco ;;
sern tan precisos como los de las pruebas de orden y rango porque la prueba paramtrica utiliza la
distribucin t F en lugar de las tablas especiales que utilizan las pruebas de orden y rango, las cua
les se basan en probabilidades exactas de obtencin de ciertas divisiones de rangos. Sin embargo, la
aproximacin parece ser bastante buena.5
Ejemplo de prueba paramtrica ordinaria
despus de una transformacin de rango y orden
La tabla 15-8 muestra los clculos de una prueba t ordinaria para medias independientes realizada
con los datos ficticios acerca de nios sensibles, utilizando el rango de cada nio en lugar del n
mero real de libros ledos por ellos. Nuevamente, obtenemos un resultado significativo.
__________________ _
5 Un investigador particularmente preocupado por la precisin podra calcular F utilizando los valores transforma
dos a rangos, y despus convertir el resultado en el resultado exacto de una prueba de rango y orden, utilizando una fr
mula de conversin establecida por Conover e Imn (1981), Luego buscara ese nmero en la tabla apropiada de prue
bas de rango y orden.
Tabla 15-8.
Clcalos de ana prueba t para medias independientes utilizando rangos en lugar de los valores
originales del estudio acerca de libros ledos por nios altamente sensibles en comparacin con los
ledos por nios no altamente sensibles (datos ficticios).
Punto de corte t para el nivel 0,05 de significacin, gl = (4 - 1) + (4 - 1) = 6, una cola = -1,943
2
M=
S =
Altamente sensible
No
Si
4
l
6
2
7
3
_
25
11
11/4 = 2,75
25/4 = 6,25
8,75/3=2,92
8,75/3=2,92
C2
oM~
2,92/4 = 0,73
Combinada ~
2,92/4 = 0,73
U1
= (2 ,7 5 ~ 6 , 2 5 ) / l , 2 I = - 2 ,8 9
C onclusin: se rechaza la hip tesis nula.
utilizada para descubrirlas probabilidades en las pruebas de rango y orden, pero, en este caso, ls
observaciones no fueron convertidas primero en rangos).
Tabla 15-9.
Clculos de una prueba de aleatorizacin basada en el estudio que compara nios altamente sensibles y
no altamente sensibles en cuanto a la cantidad de libros ledos durante el ao anterior (datos ccios).
R esultados reales:
Altamente sensibles
Na
0
3
10
22
35
8,75
17
36
45
75
173
43,25
Todas las divisiones posibles (70) de las ocho observaciones en dos grupos de cuatro cada uno:
Real
No
^S-^No
No
Si
22
0
3
10
36
45
75
No
Si
No
22
0
3
17
10
45
36
11
2 7 ,5
0
3
10
45
10
22 V-iZS.;:
;K- 34,5 .
No
Si
No
Si
No
Si
0
3
22
45
10
17
36
75
0
3
22
75
10
17
36
45
0
3
17
36
10
22
45
75
24
37
17
No
No
Si
No
0
3
45
75
10
22
17
36
~ 9 ,5
0
10
22
No
Si
0
10
17
75
3
22
36
45
No
Si
22
17
36
0
3
10
11
25
23
5/
10
36
45
No
17
36
0
3
22
17
25
31
Si
No
10
0
17
3
45
22
3 5 25
21,5
Si
No
Si
No
Si
No
Si
0
10
3
22
17
36
45
75
19,5
0
3
17
75
10
22
36
45
4 ,5....
0
3
36
45
10
22
17
75
0
3
36
75
10
22
17
45
Si
No
No
Si
3
36
45
12 75
2 7 ,5
0
10
22
36
3
17
45
75
18
0
3
10
17
22
36
45
75
13 ,5
No
No
Si
Si
0
10
36
45
3
22
17
75
6 ,5
No
No
Si
No
0
10
22
75
1
No
3
17
36
45
,5
10
Si
No
Si
0
3
10
22
17
45
36
75
20,5
0
10
17
45
3
22
36
75
16
Si
No
Si
No
Si
0
3
10
22
36
17
75
45
- 3,5
0
3
10
22
45
17
7 5 . 36
-1 3 " '
0
3
22
10
17 45
36
75
14,5
0
22
17
45
3
10
36
75
0
22
17
75
3
10
36
45
-5
Si
No
No
Si
No
3
17
10
36
22
4 5 . 75
C
0
17
36
75
0
3
17
10
45
22
36
75
-1 6 ,5
Si
3
No
Si
No
Si
No
Si
No
0
22
36
45
3
10
17
75
3
0
10
22
17
36
45
75
- 1 4 ,5 .
0
22
45
75
3
10
17
36
- 19
0,5
No
Si
22
Si
*Sl
^St ^No
V Si
.7.177
; 36
Si
3
10
22
45
12"""'
10
10
36
22
45
17
75
-2 6 :
No
Si
No
Si
17
3
10
22
0
3
10
22
-34,5
22
36
45
Z5
0
3
10
17
-37
No
Si
No
Si
No
Si
10
17
36
75
0
3
22'
45
10
17
36
45
0
3
22
75
10
22
45
75
0
3
17
36
-24
Ms r MN
-1 7
Msi
Si
0
17
3
45
10
75
36
-2 7 ,5
-2
No
22
Si
0
3
10
45
17
36
75
Si
10
36
45
75
0
3
22
17
31
No
Si
10
0
17
3:
45 22
75 36
-2 1 ,5
Si
No
Si
No
Si
0
10
3
22
17
36
75
45
- 4 ,5
10
22
17
75
0
3
36
45
10
10
22
17
45
0
3
36
75
No
3
Si
No
3
S
0
10
17
22
36
75
45
1,5
No
3
22
Si
No
Si
0
10
45
17
75
36
- 2 0 ,5
3
22
36
75
0
10
17
45
16
Si
Si
No
Si
No
Si
0
3
45
75
3
0
36
10
45
22
17
75
- 2 7 ,5
3
17
45
75
0
10
22
36
-18
No
Si
No
Si
No
Si
No
Si
3
22
36
45
0
10
17
75
-1
3
22
17
75
0
10
36
45
6 ,r
3
22
17
45
0
10
36
75
8,5
3
22
17
36
0
10
45
75
S
0
22
36
45
-0 ,5
No
Si
No
Si
3
10
17
45
0
22
36
75
14,5
3
10
17
36
0
22
45
75
19
No
3
3
10
17
75
No
0
3
10
75
0
22
3
36
17
75
45
-1 9 ,5
No
10
Si
No
17
36
Si
-8
10
22
17
36
9 ,5
No
22
23
No
M s - M No
M S ~ ^N o
No
22
0
17
10
36
22
. 75
45
-1 3 ,5
13
Si
0
17
36
45
10
22
75
-3
No
Si
No
Si
No
0
3
10 2 2
17
45
36
75
- 1 4 ,5
3
10
36
75
0
22
17
45
-10
3
10
36
45
0
22
17
75
5
Si
No
3
Si
No
3
Si
No
No
3
0
17
36
75
10
22
45
12
0
17
10
22
45
36
75
16,5
0
36
45
75
10
22
17
26
6,
Comparar el punto de corte con el lugar en donde se ubica la diferencia real dentro de la lis
ta ordenada, para determinar si se rechaza o no la hiptesis nula. En el ejemplo que analizamos, la
diferencia real de +34,5 es la segunda superior, ubicndose en un lugar entre las tres superiores,
tal como se requera. Podemos rechazar la hiptesis nula.
Otro ejemplo de prueba de aleatorizacin
Esta vez analizaremos el ejemplo de la prueba de lgebra y del nivel escolar del captulo anterior, que
incluye una correlacin. Si el alumno an no ha estudiado el captulo 3, debera saltear esta seccin.
Tabla 15-10.
Clculos de una prueba de aleaorizacin basada en el estudio que correlaciona la nota de nivel
escolar y la puntuacin en una prueba de lgebra (datos ficticios).
Para rechazar la hiptesis nula: la correlacin real debe ser la m ayor de las 24 correlaciones .posibles para poder
rechazar a hiptesis nula al nivel d el 5%, con prueba de una cola.
Correlaciones de todas las posibles combinaciones ene las opa (Observaciones de pruebas de lgebra) y
os NE (Niveles escolares).
Real
OPA
1
4
10
95
NE
6
9
7
4
r - -0,79
OPA
NE
1
9
4
7
4
10
95
6
r = -0,24
OPA NE
1
7
4
4
10
6
25____ 2
r = 0,79
OPA
1
4
10
25.
OPA NE
1
7
4
6
0
9
25____ 4
r = -0,76
OPA NE
1
9
4
4
10
6
7
95
r = 0,12
OPA
NE
1
7
4
6
10
4
15 ___ 2
r - 0,75
OPA NE
1
4
4
7
10
6
25____ 2
r = 0,82
OPA NE
I
4
4
9
7
10
21
<5
r =0,52
OPA
1
4
.10
95
NE
7
4
9
6
OPA NE
4
1
4
9
10
95 ___1
r 0,18
OPA
1
4
10
21.
OPA
1
4
10
95
OPA NE
1
6
4
4
10
7
2 1 ___ 2
r ==0,82
NE
6
9
4
7
OPA NE
1
6
4
7
4
10
95 ___2
r = 0,76
OPA
NE
1
9
4
4
10
7
6
21.
- 0,18
OPA NE
1
9
4
7
10
6
95
4
r = -0,84
OPA
1
4
10
21_
OPA
1
4
10
95
OPA NE
1
7
4
9
10
4
95
6
r = -0,22
95-' 7
-, r = 0,25.
O1
u
OPA
1
4
10
95
K
O
IE
OPA NE
1
4
4
6
10
7
95
9
r s=0,84
NE
6
9
4
7
r ~ 0,11
NE
4
7
9
6
-0,08
r=
NE
9
7
6
4
-0,84
NE
6
4
9
7
-t
il
o
V
Ka)
OPA .NE
1 4
NE
9
6
7
4
r ~ -0,82
OPA
1
4
10
21
NE
7
9
6
4
r ==0,82
Una de las formas de realizar una prueba de aleatorizacin de una correlacin implica calcular
una correlacin entre cada posible combinacin de observaciones de las dos variables (sin combinar
nunca dos observaciones de la misma variable). Con cuatro participantes, existen 24 combinaciones
posibles de este tipo. Para que una correlacin sea significativa al 5%, la correlacin de la combina
cin real de observaciones de la muestra real debe ser la mayor de las 24 correlaciones posibles. La
tabla 15-10 muestra los clculos de la prueba de aleatorizacin. Utilizando este procedimiento, la
correlacin no result significativa. (Es el mismo resultado que obtuvimos anteriormente en el cap
tulo para el mismo ejemplo, utilizando una transformacin log).
COMPARACIN DE MTODOS
Hemos analizado tres mtodos para realizar pruebas de hiptesis cuando las muestras parecen
provenir de poblaciones no normales: transformacin de datos, pruebas de rango y orden y mto
dos intensivos por computadora, tales como las pruebas de aleatorizacin. Cmo decide un in
vestigador el mtodo a utilizar?
Las transformaciones de datos tienen la ventaja de permitir aplicar las tcnicas paramtrics
familiares a los valores transformados. Pero las transformaciones no siempre funcionan. Es decir,
puede no existir ninguna transformacin razonable que produzca valores normales en todos los
grupos. Adems, las transformaciones pueden distorsionar las observaciones de modo que se
pierda el significado original.
Los mtodos de rango y orden pueden aplicarse independientemente de las distribuciones.
Son especialmente adecuados cuando las observaciones originales son rangos, y tambin son ti
les cuando las observaciones no siguen claramente un patrn numrico simple (medicin interva
lar), situacin que algunos psiclogos consideran bastante comn. Ms an, la lgica de los m
todos de rango y orden es simple y directa, y no requiere construcciones elaboradas de distribu
ciones hipotticas o parmetros estimados.
Sin embargo, los mtodos de rango y orden no son tan familiares para aquellos que leen pu
blicaciones cientficas, y tampoco han sido desarrollados para muchas situaciones complejas.
Otro problema es que la lgica simple de las pruebas de rango y orden se pierde si existen mu
chos rangos iguales. Finalmente, al igual que los mtodos de transformacin de datos, los mto
dos de rango y orden distorsionan los datos originales, perdindose informacin. Por ejemplo,
en la misma muestra, una diferencia entre 6,1 y 6,2 podra ser un rango, pero la diferencia entre
3,4 y 5,8 tambin podra ser un rango.6
Los mtodos intensivos por computadoras, tales como las pruebas de aleatorizacin aproxi
mada, no requieren ninguno de los dos supuestos principales de las pruebas paramtricas ordina
rias. Ms an, al igual que las pruebas de rango y orden, tienen una lgica directa propia que es
muy atractiva, evitando todo el proceso de construccin de distribuciones estimadas de pobla
cin, distribuciones de medias, etc. Los mtodos intensivos por computadora son tambin extre
madamente flexibles. Se los puede utilizar en casi cualquier situacin imaginable en la que pudie
ra aplicarse una prueba de hiptesis. Por lo tanto, frecuentemente pueden utilizarse cuando no
existen otros tipos de pruebas disponibles, paramtricas o de cualquier otro tipo.
La principal desventaja de los mtodos intensivos por computadora es que son bastante nue
vos; por lo tanto, los detalles y ventajas relativas de varios de los mtodos no han sido bien apro
vechados. Ms an, por ser nuevos, en la mayora de los casos los paquetes estadsticos estndar
para computadoras no los incluyen. Los mtodos intensivos por computadora recin estn em
pezando a aparecer en las publicaciones cientficas, pero es probable que su aplicacin aumente
con rapidez.
Riesgo relativo de cometer errores Tipo I y Tipo il
Cul es la precisin de los distintos mtodos en cuanto a que el nivel del 5% realmente implica
que existe un 5% de probabilidad de rechazar incorrectamente la hiptesis nula? y cmo afectan
la potencia los distintos mtodos?
Cuando se cumplen los supuestos de las pruebas paramtricas, estas pruebas son tan buenas o
mejores que cualquiera de las alternativas. Lo expresado en el prrafo anterior es cierto en cuanto
a la proteccin contra los errores Tipo I y Tipo II, situacin que era de esperarse, ya que se dan las
condiciones para las cuales fueron diseadas las pruebas paramtricas.
Sin embargo, cuando no se cumplen los supuestos de las pruebas paramtricas, las venta
jas relativas de los tres posibles procedimientos alternativos que hemos analizado no son del
todo claras. De hecho, los mritos relativos de los distintos procedimientos son temas de acti
va controversia, sobre los cuales se publican muchos artculos cada ao en las revistas espe
cializadas en estadstica.
La razn de la controversia es que el procedimiento ms adecuado depende de los tipos de
distribuciones involucradas. Una distribucin no normal puede serlo de muchas maneras (vase
captulo 5). Sucede que los efectos de los diferentes mtodos sobre los errores Tipo I y Tipo II va-
6 Otra ventaja tradicional de las pruebas de rango y orden ha sido su facilidad de clculo, Excepto por el trabajo de con
vertir las observaciones en rangos, los clculos reales de la mayora de estos procedimientos son muy sim ples, compa
rados con los de las pruebas paramtrcas. Actualmente, con la utilizacin de las computadoras, es igualmente fcil cal
cular cualquier tipo de procedimiento. Con algunos paquetes estadsticos estndar para computadoras, es realmente
mucho menos problemtico calcular las pruebas paramtricas. Adems, a veces ia prueba de rango y orden apropiada
puede no estar disponible.
ran segn el tipo de distribucin de que se trate. Incluso, para determinado tipo de distribucin,
una tcnica podra resultar mejor cuando los grupos tienen las mismas cantidades y otra cuando
las cantidades en cada grupo son distintas; o bien, un mtodo podra ser mejor con un gran tama
o de muestra y otro con una muestra pequea. Ms an, al comparar grupos, las distribuciones
de los grupos pueden incluir diferentes tipos de distribuciones no normales.
Aunque se han realizado muchos estudios comparando los distintos mtodos (vase cuadro
10-1 acerca de los estudios Montecarlo), an sabemos muy poco sobre la efectividad relativa de
estos mtodos en la mayora de los casos. An peor, en muchas situaciones, un investigador pue
de tener la nocin de que una muestra no proviene de una poblacin normal, pero no de qu tipo
particular de poblacin no normal se trata. Por lo tanto, incluso los estudios que se han realizado
comparando los distintos procedimientos con determinadas formas de poblacin no normal, pue
den no ser demasiado tiles al momento de enfrentar los resultados de un estudio real.
Es posible que algn da se realice la suficiente investigacin que abarque las suficientes can
tidades de situaciones como para que surjan patrones que nos den pautas prcticas adecuadas. Por
el momento, segn nuestra opinin, los investigadores deben confiar en otros criterios (como los
presentados en este captulo) para seleccionar entre las distintas alternativas, cuando los supues
tos no se han cumplido. Sin embargo, desde el punto de vista de la lectura de investigaciones (un
tema que trataremos a continuacin), lo que necesitamos es poder comprender la lgica del pro
cedimiento en particular que ha elegido el investigador. Decidir si fue elegido correctamente, tal
vez sea una tarea que exceda los conocimientos del alumno en esta instancia, razn por la que
puede relajarse hasta los prximos cursos y futuros avances en el rea.
CONTROVERSIAS
Todos los temas tratados en este captulo son controvertidos, especialmente, la conveniencia de
las transformaciones de datos, los riesgos de utilizar procedimientos paramtricos cuando se
desconocen las distribuciones poblacionales, hasta qu punto es apropiado tratar a las medidas
tpicas en psicologa como si produjeran mediciones de intervalares y las ventajas y desventa
jas de los mtodos intensivos por computadora. (Judd et al. 1995 nos ofrecen una revisin re
ciente de las controversias).
Las variables tales como el porcentaje de das de abstinencia y tragos por da, con frecuencia se alejan :;de la normalidad debido a la asimetra y a ios efectos techo y piso. En respuesta a esto, la variable del.
porcentaje de das de abstinencia fue sometida a una transformacin arco-seno, y la variable de los tra- '
gos por da fue sometida a una transformacin raz cuadrada; en cada caso, el procedimiento se realizV
para mejorar la distribucin (p. 592).
A continuacin, presentamos un ejemplo de una prueba de rango y orden en un estudio de inves
tigacin realizado por Ford et al. (1997), que se concentr en la relacin de ciertos factores d la
personalidad con el tratamiento de trastornos de estrs postraumatico (una condicin psicolgica
que resulta de un hecho traumtico como el que podra ser experimentado durante una guerra o
como resultado de un ataque violento). El factor de personalidad de inters para los investigado
res se basaba en una versin moderna de la teora psicoanaltica freudiana denominada relacio
nes objeto, que se refiere al impacto psicolgico de nuestras primeras relaciones, principal
mente con nuestros padres (los objetos de estas relaciones tempranas). Los investigadores basa
ron sus medidas sobre las relaciones objeto en una entrevista clnica concentrada en temas tales
como la capacidad de dedicarse a una relacin estrecha y la capacidad de tener una imagen com
pleja de los otros (p. ej. no ver a una persona como completamente buena o completamente mala),
Al informar sus resultados, abreviaron la medida de entrevista clnica como ro-c (Relaciones ob
jeto). La distribucin de registros de las RO-c no era normal (era bimoda).
Uno de sus anlisis se concentraba en la asociacin de las relaciones objeto con el hecho de
que una persona contine con el tratamiento hasta completarlo o lo interrumpa prematuramente,
informaron sus resultados de la siguiente manera;
Seis de los 74 participantes interrumpieron prematuramente el tratamiento [...] Los seis pacientes que
interrumpieron prematuramente no difieren del resto de la muestra en cuanto a ninguna variable de
mogrfica o de prueba preliminar [...] S difieren en forma estadsticamente significativa de aquellos
q u e completaron el tratamiento en cuanto a las r o - c , con valores menores segn la prueba U de
Mann-Whitney no paramtrica (Z=-3,43, p < 0,001) (p. 554).
Se puede observar que informa un valor Z, lo que sugiere que en lugar de utilizar la prueba U de
Mann-Whitney directa utilizaron el procedimiento de aproximacin normal.
Finalmente, un estudio realizado por Caspi y Herbener (1990) nos ofrece un ejemplo del m
todo intensivo por computadora informado en una publicacin cientfica. Como parte del estudio,
los investigadores analizaron la estabilidad a largo plazo de la personalidad de 252 individuos que
fueron probados primero en el ao 1970 y luego nuevamente en el ao 1981. En cada prueba, los
participantes completaron la prueba de personalidad denominada ilQ sorf \ Se trata de un tipo es
pecial de procedimiento de prueba en el que el participante recibe cierta cantidad de cartas, cada
una con un rasgo de personalidad. El participante luego pone estas cartas en pilones, clasificndo
las desde para nada descriptiva hasta altamente descriptiva . Lo particular del mtodo, sin
embargo, es que el participante debe ubicar las cartas en pilones de determinados tamaos, tama
os que corresponden a una curva normal, con ms cartas en el medio y menos en los extremos.
Para estudiar la estabilidad, Caspi y Herbener tuvieron que correlacionar los Q sort de los dos
periodos. Sin embargo, los autores observaron que las correlaciones entre ios Q sort (correlacio
nes 2), del modo en que se utilizaban en su estudio, tenan algunas propiedades estadsticas inu
suales. Los autores explicaron:
Realizamos lo que esencialmente sera una prueba de aleatorizacin. Especficamente, el perfil <2sort
de cada sujeto en el ao 1970 fue correlacionado con su perfil del Q sort en 1981 para todos los sujetos
del mismo sexo
Para cada sexo [...] generamos 100 muestras aleatorias para comparar con las co
rrelaciones Q reales indicadoras de la estabilidad de la personalidad
En el caso de las [...] mujeres,
las 100 pruebas no arrojaron valores que excedieran la media muestral [de correlaciones de los perfiles
de cada sujeto en 1970 y 1981] (0,49) (p. 253).
En cuanto a los hombres, los resultados fueron similares.
Resumen
La prueba , el anlisis de varianza y la prueba de. significacin del coeficiente de correlacin su
ponen que las poblaciones siguen una distribucin normal. Cuando las muestras sugieren que las
poblaciones estn muy lejos de lo normal (por ejemplo, debido a casos atpicos), utilizar los pro
cedimientos ordinarios arroja resultados incorrectos.
Un mtodo a utilizar, cuando la poblacin parece no ser normal, es transformar los valores,
como por ejemplo sacando la raz cuadrada de cada valor para que la distribucin de los valores
transformados aparente representar una poblacin normalmente distribuida. Otras transformacio
nes comunes para distribuciones asimtricas se realizan calculando el logaritmo de cada valor o
su inverso. Despus de realizadas las transformaciones pueden aplicarse los procedimientos ordi
narios de prueba de hiptesis.
Otro mtodo para resolver el problema es ordenar todas las observaciones del estudio por
rango. Las pruebas especiales de rango y orden (a veces denominadas no paramtricas o libres de
distribucin) utilizan principios bsicos de probabilidad para determinar la posibilidad de que los
rangos estn irregularmente distribuidos en el grupo experimental.
Una prueba de aleatorizacin es un ejemplo del mtodo intensivo por computadora, que
analiza cada posible disposicin de las observaciones de un estudio para determinar la probabili
dad de que la disposicin obtenida (en trminos, por ejemplo, de la diferencia de medias entre
los grupos) surja por casualidad. Sin embargo, dado que incluso con computadoras las pruebas
de aleatorizacin no son prcticas con muestras de tamaos razonables, se utilizan otros mto
dos intensivos por computadora. Por ejemplo, 1.000 de las posibles disposiciones son seleccio
nados al azar y la distribucin de sus diferencias de medias se compara con la obtenida en la
.muestra real.
Las transformaciones de datos permiten utilizar tcnicas paramtricas que resultan familia
res, pero no siempre pueden ser aplicadas y pueden distorsionar el significado de los datos. Los
mtodos de rango y orden pueden aplicarse a muchas series de datos; son especialmente ade
cuados con rangos o datos similares, y tienen una base conceptual directa. Pero las tcnicas de
rango y orden no son ampliamente conocidas y no han sido desarrolladas para muchas situacio
nes complejas de anlisis de informacin. Al igual que con otras transformaciones de datos, la
informacin puede perderse o el significado distorsionarse. Los mtodos intensivos por computa
dora son ampliamente aplicables, a veces incluso en situaciones para las cuales no existe otro
mtodo disponible. Adems, tienen una atrayente lgica bsica. Pero a los investigadores no les
resultan muy familiares; al ser nuevos, sus posibles limitaciones no estn bien resueltas; y pue
den ser difciles de emprender ya que no se incluyen en programas estndar para computado
ras. Cuando se supone que la poblacin no es normal, no existe demasiado acuerdo acerca de
cul de las tcnicas es ms conveniente en cuanto al riesgo relativo de cometer los errores Tipo I
y Tipo L
Las publicaciones cientficas generalmente describen las transformaciones de datos justo an
tes del anlisis que las utiliza. Los mtodos de rango y orden se describen, mayormente, como
cualquier otro tipo de prueba de hiptesis. Los mtodos intensivos para computadoras, por ser
menos conocidos, por lo general se describen con bastante detalle.
Trminos clave
- Pruebas de aieatorizacin aproximada.
- Transformacin de datos.
- Pruebas libres de distribucin.
-Transformacin inversa.
- Transformacin log.
Ejercicios
2. Cules de las siguientes distribuciones
mustrales sugieren que la distribucin poblacional probablemente no es normal? Explique
por qu.
a) 41,52,74,107,617
b) 221,228,241,503,511,521
c) 0,2,0,3,0,5,0,6,0,7,0,9,0,11
d) -6, -5 ,-3 ,1 0
e) 11,20, 32,41,49,62
3. Un Investigador compara el tamao t
pico de familia en 10 culturas, 5 del grupo
idiomtico A y 5 del grupo idiomtico B. Los
nmeros correspondientes a las culturas del
grupo A son 1,2,2,5,4,3,3,8 y 7,2. Los nme
ros correspondientes a las culturas del grupo B
son 2,1,9,2,5,7,6,7 y 4,8. Sobre la base de es
tas 10 culturas, difiere el tamao tpico de la
familia en las culturas de diferentes grupos
idiomtcos? Utilice el nivel 0,05. a) Realice
una transformacin raz cuadrada (para sim
plificar las cosas, redondee los valores trans
SERIE I
formados para que tengan un slo decimal),
1.
Para la distribucin de los 30 valores
b) Realice una prueba f para medias indepen
que aparecen abajo, a) trace un histograma (ba
dientes utilizando los valores transformados
sado en frecuencias agrupadas) de los valores
(muestre su trabajo), c) Explique lo que ha he
tal como aparecen; b) realice una transforma
cho y por qu a una persona que est familiari
cin raz cuadrada y un histograma (de fre
zada con la prueba t pero no con la transfor
cuencias agrupadas) de los valores transfor
macin de datos.
mados, y c) convierta los valores originales en
4. Un investigador asigna participantes al
rangos y trace un histograma (agrupado) de-los
azar para que observen uno de tres tipos de pe
mismos,
lculas: una tiende a entristecer a las personas,
9,28, 4,16,0,7,25,1,4,10,4, 2,1,9,16,11, otra tiende a alegrar a las personas y una terce
12, 1, 18,2, 5,10,3,17,6,4,2,23,21,20
ra tiende a poner furiosas a las personas. Des-
9 5 9 3
4 3 3 4
P 1 JLp
95
34
CU.
9 5
14
0_3
3 9 4 9 49 4 9 5 9 5 9
1 5 15 3 5 3 5 14 3 4
0 4 0 3 0 1 10 0 3 0 1
59 5 9
34 4 3
i 0 01
39
43
5 9
4 1
10 3 0
SERIE II
L Con la distribucin de 20 valores que
aqu presentamos a) realice un histograma
de
(basado en frecuencias agrupadas) de los valo
res tal cual los presentamos; b) realice una
transformacin log y un histograma (de fre
cuencias agrupadas) de los valores transfor
mados, y c) transforme los valores originales
en rangos y realice un histograma (agrupado)
de los mismos. (Nota; para realizar la trans
formacin log utilice una calculadora con la
funcin log para calcular logaritmos o una
computadora).
2, 2 0 7 , 8 9 4 , 107, 11, 7 9 , 1 1 2 , 9 3 8 , 7 9 1 , 3 , 1 3 ,
8 9 ,1 .0 0 4 ,9 2 ,1 .0 1 6 ,1 0 7 ,8 7 ,9 1 ,8 7 0 ,9 2 1
c) 7,104,104, 104,1.245,1.247,1.248,
1.251
d) 68,74,76,1,938
e) 407,2,407,5,407,6,407,9
3. Un psiclogo realiza un estudio a seis
electricistas desempleados, correlacionando la
cantidad de semanas sin empleo con la satis
faccin marital. Los resultados aparecen abajo,
a) Realice un diagrama de dispersin y calcule
la correlacin entre los valores dados, b) Reali
ce una transformacin a la raz cuadrada de los
valores correspondientes a las semanas sin em
9 4
14
14
14
04 0 4
0 4
04
0 4
0 4=.
3 0
30
9 0 9 0
31 91
91
19
19
1 3
9j
.:
Integracin
de contenidos:
el modelo
lineal general
Figura 16-1.
Relacin entre las cuatro priricfe:
pales tcnicas estadsticas.
Por lo tanto, vamos a concentramos en los cuatro grandes, todos ellos casos especiales del modelo
lineal general y, por ello, sistemticamente relacionados. Es posible que en el proceso emerjan mu
chas de las intuiciones que habamos percibido parcialmente con respecto a lo aprendido.
Para expresarlo en forma breve (y luego profundizar sobre el tema), la tcnica ms general es la
regresin/correlacin mltiples (captulo 4), siendo la correlacin bivariada (captulo 3) un caso es
pecial de la misma. Finalmente, la prueba t (captulos 9 y 10) deriva directamente de la correlacin
bivariada o del anlisis de varianza. La figura 16-1 representa grficamente las vinculaciones men
cionadas.
Cuando decimos que un procedimiento es un caso especial de otro, queremos decir que el pri
mero puede deducirse de la frmula del segundo. Por eso, cuando utilizamos los procedimientos
ms especializados obtenemos el mismo resultado que hubiramos obtenido con el procedimien
to ms general. Para ser ms concretos, si viajramos a una isla desierta a realizar una investiga
cin psicolgica y slo pudiramos llevar un programa de computacin para realizar las pruebas
estadsticas, nos convendra elegir uno que realizara correlacn/regresin mltiples. Con ese
programa podramos lograr todo lo que se obtiene con programas ms especializados de correla
cin bivariada, pruebas f y anlisis de varianza.
En este captulo investigamos tales vnculos. Primero, revemos brevemente la idea de regresin/correlacin mltiples que presentamos en el captulo 4, y en ese contexto analizamos una de
finicin formal del modelo lineal general. Despus, examinamos cada uno de los vnculos: la
regresin / correlacin mltiples con la correlacin bivariada; el anlisis de varianza con la prue
ba , y la regresin / correlacin mltiples con el anlisis de varianza.
(16-1)
As, si un presunto gerente fuera a supervisar slo a cuatro personas en un rea con 50 decibeles
de mido, y tuviera slo un plazo a cumplir por mes, el nivel de estrs predicho sera calculado de
la siguiente manera:
La prediccin del nivel de estrs del gerente sera muy baja (1,40).
Tambin es posible describir el grado general de relacin entre la variable dependiente y la
combinacin de variables de prediccin. Este dato se denomina coeficiente de correlacin ml
tiple y se simboliza con una R. R debe ser al menos tan grande como la correlacin bivariable
ms pequea entre cualquiera de las variables de prediccin y la variable dependiente. R2 es la
reduccin proporciona! del error cuadrtico lograda utilizando la regla de prediccin para re
gresin mltiple, en contraposicin con la simple prediccin de la variable dependiente a partir
de su propia media.
(16-2)
1 Existen mtodos ingeniosos de introducir furtivamente trminos elevados al cuadrado o a mayores potencias en los
procedimientos del modelo lineal. Por ejemplo, podramos crear una variable nueva, transformada, en la que cada valor
estuviera elevado al cuadrado. Luego se podra utilizar esa variable transformada en una ecuacin de modelo lineal co
mo una variable original. As, en la ecuacin no aparecera en realidad ningn trmino elevado al cuadrado. Este peque
o truco resulta extraordinariamente valioso. Por ejemplo, ciertos textos sobre regresin mltiple (p. ej, Cohen &
Cohen, 1983; Darlington, 1990) muestran la forma de utilizar ese tipo de procedimientos para trabajar con relaciones
curvilneas a travs de mtodos estadsticos diseados para relaciones lineales.
Tanto la prueba t como el anlisis de varianza son procedimientos para probar a diferencia ;
entre medias de grupos. La prueba t se utiliza cuando existen slo dos grupos.2 El anlisis de va- ..
danza con razn F, se utiliza generalmente slo cuando existen ms de dos grupos. Sin embargo,
no existe motivo para no utilizar un anlisis de varianza slo con dos grupos. Cuando existen slo
dos grupos, la prueba t y el anlisis de varianza producen conclusiones idnticas.
r y F son estrictamente idnticos slo cuando se trabaja con dos grupos. Cuando existen ms
de dos grupos, no podemos realizar una prueba t ordinaria. Por eso decimos que la prueba t es un 7
caso especial del anlisis de varianza. La prueba-es matemticamente idntica al anlisis de va
rianza en el caso particular en el que existen slo dos grupos (pronto analizaremos un ejemplo). :
Comprensin intuitiva de ia reiacin entre los dos procedimientos
Un modo de percibir el vnculo entre los dos procedimientos es a travs de la analoga con el co
eficiente seal-ruido que presentamos en el captulo 11 para explicar el anlisis de varianza. La
idea es que la razn F del anlisis de varianza es una medida del grado en el cual la seal (anlo
ga a la diferencia entre las medias de grupo) excede el ruido (anlogo a la variacin interna de ca
da uno de los grupos). La misma idea se aplica a la prueba , que en realidad tambin determina el
grado en el cual la seal (la diferencia entre las medias de los dos grupos) excede el ruido (el des
vo estndar de la distribucin de diferencias de medias, que tambin se basa en la variacin inter
na de los grupos).
Paralelismos entre la lgica bsica de los dos procedimientos
El anlisis de varianza se basa en el clculo de una razn F (que despus se compara con el punto
de corte tomado de una tabla basada en una distribucin F). La razn F es la estimacin de la va
rianza pobiacional que se basa en la variacin entre las medias de dos o ms grupos, dividida por
la estimacin de la varianza pobiacional basada en la variacin dentro de cada uno de esos gru
pos. Es decir, la razn Fes una fraccin en la cual el numerador se basa en las diferencias entre
los grupos comparando sus medias, y el denominador se basa en la variacin dentro de cada uno
de los grupos.
La prueba t se basa en el clculo de un valor f (que despus se compara con un punto de corte
previamente definido, tomado de una tabla basada en una distribucin i). El valor es la diferen
cia entre las medas de los dos grupos dividida por el desvo estndar de la distribucin de dife
rencias de medias. El desvo estndar de la distribucin de diferencias de medias se calcula
utilizando una estimacin combinada de la varianza que se basa en el promedio de la varianza
dentro de cada uno de los dos grupos. El valor t es una fraccin en la que el numerador es la dife
rencia entre los grupos comparando sus medias, y el denominador se basa en la variacin dentro
de cada uno de los grupos.
En otras palabras, como lo indica la seccin superior de la tabla 16-1, tanto una razn F como
un valor t son fracciones en las cuales el numerador se basa en las diferencias entre las medias de
los grupos y el denominador se basa en las varianzas dentro de los grupos.1
En este captulo, nos concentramos en la prueba de hiptesis para medias independientes (y tambin en el anlisis de
varianza para diseos intersujetos). Sin embargo, las conclusiones finales son las mismas que con respecto a la prue
ba t para medias dependientes. Se trata de un caso especial de anlisis de varianza de medidas repetidas. Adems, tan
to la prueba r para medias dependientes c o m o el anlisis de varianza de medidas repetidas, son casos especiales de
regresin i correlacin mltiples. De todos modos, el vnculo entre estos mtodos y la correlacin mltiple involucra al
gunos niveles extra de lgica que no analizamos aqu, para concentramos en las ideas principales del captulo.
Cuadro 16-1.
~La poca dorada de la estadstica: cuatro muchachos en Londres.
Anlisis de varianza
E l numerador de t es la diferencia
entre las m edidas de dos grupos.
g/ = (At ~ i) + (A ,-l)
t = FF
1) +
(fl2-
i ) + +(^ltimo
3 Otras diferencias aparentes (tal como la supuesta diferencia entre el numerador de la razn F, que se basa en una esti
macin de varianza, y el numerador dei punto t, que es una simple diferencia entre medias) presentan una unidad sub
yacente similar. Pero aqu no trataremos esos temas.
T a b la 1 6 -2 ,
C lc u lo s d e la p r u e b a t y el a n lis is d e v a r ia n z a c o r r e s p o n d ie n te s a u n e x p e r im e n to a c e r c a d e la e fe c
tiv id a d d e u n n u e v o p r o g r a m a d e c a p a c ita c i n la b o r a l (d a to s fic tic io s ).
G r u p o ex p e rim e n ta l
(P ro g r a m a e sp ec ia l)
4
9
1
7
3
6
X
( W
0
-2
3
1
1
-3
4
9
1
1
9
1
5
3
1
1
4
24
21
42
M = 6
^ =7
*2
X,
6
G ru p o d e con trol
(P rogram a e st n d a r)
S ] = 2 4 /6
=4
1=6
(X2-A /
3
-2
2
9
4
4
-2
-2
1
4
4
1
0-
2= 3
2= 7
C lcu lo s d e la p r u e b a t
2-
26
$|-= 2 6 /6 = 4 ,3 3
. ^ 2= N 2 - l = 6
^Entre ^Grupos ~ ^ ~ 2
1 -1
X (M - G M ? = (6 - 4,5)2 + (3 - 4 ,5 )3
'
= 1 ,5 * + -1 ,5
= 2 ,2 5 + 2 ,2 5 = 4 ,5 -
D e n o m in a d o r
C2
combinada
12
<4) + ( - ~ - |( 4 ,3 3 )
g
^diferencia "
dentro
sf+s l + +
CM,
4 + 4,33
Grupos
= (4 ,1 7 /7 )+ (4 ,1 7 /7 )
8,33
= 0 ,6 0 + 0 ,6 0 = 1 ,2 0
= 4 ,1 7
W i a =^
^ = U 0
G r a d o s d e L ib e r ta d
8 ^ i =8h +8l2= 6 ^ 6 = ^
C o rte
t necesario con g l = 12 a nivel 5%,
dos c o la s= 2 ,1 7 9
= 4,75
R eg istro en la d istr ib u ci n c o m p a ra tiv a
t = ( M l - M 2) / SD m . = (6 ,0 0 - 3 .0 0 V U 0 = 3 ,0 0 /1 , 10 = 2,73
55
Conclusiones
Se rechaza a hiptesis nula.
Se sostiene la hiptesis de investigacin.
Cerrando l brecha entre las variables numricas y las variables nominales dicotmicas
Cmo podramos cerrar esa brecha? Supongamos que otorgamos arbitrariamente dos nmeros a
la variable nominal con dos categoras. Por ejemplo, llamemos 1 al grupo experimental y 2 al gru
po de control. (Utilizar otros dos nmeros cualesquiera, finalmente produce exactamente el mis
mo resultado al convertir todo en puntuaciones Z para calcular el coeficiente de correlacin. Los
dos nmeros que utilicemos y, especficamente, a qu categora apliquemos el nmeio ms alto,
determinar simplemente el signo positivo o negativo del resultado final).
Una vez que hemos convertido de este modo una variable de prediccin nominal, con dos ca
tegoras para una prueba f de medias independientes, en una variable numrica (con slo dos va
lores, debemos admitir); podemos proceder a calcular el coeficiente de correlacin y, finalmente,
determinar su significacin.
Ejemplo de la equivalencia d clculo entre la prueba t
y la prueba de significacin del coeficiente de correlacin
La tabla 16-3 indica los clculos) del coeficiente de correlacin y su significacin, con los valores
del mismo ejemplo de prueba t que utilizamos anteriormente.' (Para que la tabla fuera razonable-
Tabla 16-3.
Clculo del coeficiente de correlacin y de una prueba de hiptesis sobre el coeficiente de correlacin
con los datos de la tabla 10-3 (y tabla 16-2), en el que se convierte la variable de prediccin (indepen
diente) en una variable numrica con los valores 1 (para el grupo experimental) 2 (para el grupo de
control).
Variacin de prediccin
(experimental versus control)
Ordinario Zx
Ordinario-
1
1
1
1
1
1
2
2
2
2
2
2
2
2 21
6
4
9
, 7.
7
3
6
6
5
3
1
1 .
J
63
4,5 .
= 2,41)
A =1 , 5
= 0,5)
(SD
gl = N - 2 =
Variable dependiente
(calificacin del empleador)
-1
-I
-1
-1
-1
-1 .
1
1
1
" 1
1
1
1
0
0
'
(SD
ty
0,62
-0,21
1,87
1,04
1,04 '
-0,62
0,62
0,62
-1,45
0,21
0,62
-1,45
-1,45
-0,21
0
0
Producto
cruzado
' r
-0,62
0,21
-1,87
-1,04
1,04
0,62
0,62
0,62
1,45
0,21
-0,62
-1,45
-1,45
-0,21
-8,71
r = -0,62
14-2= 12.
mente simple, hemos excluido los clculos del desvo estndar de cada variable, que se utilizan para
calcular las puntuaciones Z), Es importante sealar que, en esta estructura de correlacin, a cada in
dividuo le corresponden dos observaciones: a) un 1. un 2, segn la persona se encuentre en el gru
po experimental (el grupo que recibe el nuevo programa de capacitacin laboral) o en el grupo de
control (el grupo que recibe el programa estndar), y b) un valoren la variable dependiente, que es la
calificacin de desempeo laboral determinada por el empleador un mes ms tarde. La correlacin
resultante es -0,62. Aplicando la frmula para convertir una correlacin en una puntuacin i, obte
nemos un t de -2,72. Es el mismo t que habamos calculado anteriormente (2,73) utilizando los pro
cedimientos de la prueba t (tablas 10-3 y 16-2). La pequea diferencia se debe al redondeo. La
diferencia de signos est relacionada con el hecho de que a un grupo se le adjudica arbitrariamente
el nmero 1 y al otro el nmero 2. Los grados de libertad, y por ende el punto de corte t necesario pa
ra alcanzar la significacin y llegar a una conclusin, tambin son iguales a los utilizados cuando
calculamos con los mismos datos una prueba t para medias independientes.
Tal como lo ilustra el presente ejemplo, la prueba de significacin del coeficiente de correla
cin da el mismo resultado que la prueba t comn. Sin embargo, decimos que la prueba t es un
caso especial del coeficiente de correlacin, porque la prueba t es slo una instancia particular
del coeficiente de correlacin, es decir, es la situacin en la que la variable de prediccin tiene
slo dos valores.
interpretacin grfica de a relacin de la prueba f con el coeficiente de correlacin
Analizando la situacin grficamente, podemos ver con mayor agudeza la relacin entre t y r. Es
posible realizar un grfico con los datos de una prueba t para medias independientes a travs de
un diagrama de dispersin, como lo haramos para un coeficiente de correlacin con una variable
de prediccin de slo dos valores. De hecho, los grficos realizados con ia misma informacin
son iguales. Analicemos uno. La figura 16-2 muestra el diagrama de dispersin con la correspon
diente recta de regresin que representa los datos del estudio acerca de la capacitacin laboral. La
variable de prediccin tiene slo dos valores; por lo tanto, en el diagrama de dispersin todos los
puntos se alinean sobre esos dos valores. Es importante resaltar que la recta de regresin pasa a
Figura 16-2.
Diagrama de dispersin y recta de regre
sin del ejemplo acerca de la capacidad
laboral, originalmente analizado con una
prueba t para medias independientes, con
un valor de 1 para el grupo experimental
y 2 para el grupo control
travs de! medio de cada serie de puntos. En realidad, si a! realizar un diagrama de dispersin con
los resultados de una prueba t, calculramos la recta de regresin, esa recta siempre caera exacta
mente en la media de cada serie de puntos. Es decir, la recta de regresin pasa por la ubicacin
que representa la media de cada grupo, ya que en cada serie de observaciones, el mejor nmero de
prediccin es siempre la media (en el sentido de producir el mnimo error cuadrtico).
Ahora analicemos algunos patrones posibles en este tipo de diagrama de dispersin. La figu
ra 16-3a representa un caso en el que las dos medias son casi iguales. En ese caso, la pendiente de
la recta de regresin es prcticamente 0; la correlacin es baja y no es significativa. De hecho, con
los datos del ejemplo, la correlacin es 0,10. Utilizando la frmula de la prueba t para el coefi
ciente de correlacin, con 20 participantes, el resultado es un t de 0,43;
t = r ^ - 2 / C 7 = 0 ,lV 2 0 ~ 2 /v 'l-Q ,12 - 0,43.
Figura 16-3.
Tres posibles diagramas de dispersin de datos analizados con una prueba t para medias independientes, en
los que las medias de los dos grupos son (a) casi iguales; (b) diferentes pero con datos que estn muy disper
sos (gran varianza combinada o gran desvo estndar de la distribucin de la diferencia de medias maestra
les), y (c) muy diferentes, con datos que no estn ampliamente dispersos.
Del mismo modo, pensando en trminos de una prueba t para medias independientes, habien
do tan poca diferencia entre las medias de los dos grupos, la prueba t tampoco ser significativa.
Los datos del ejemplo presentan una diferencia de media de 7,39 -1 ,6 0 = 0,21. Con un desvo es
tndar de la distribucin de diferencias entre medias de 0,48, el t es de -0,44: =,(Ml -.M2)/SDifcrejlcia
= (7,39 - 7,60)/0,48 = -0,44. Con diferencia de redondeo (e ignorando el signo), es el mismo re
sultado que obtenemos utilizando el mtodo de la correlacin.
La figura l-3b representa un caso en el que las medias de los dos grupos son algo diferentes
pero en donde los puntos de cada grupo estn an ms dispersos. En ese caso, nuevamente la rec
ta de regresin es un elemento de prediccin muy pobre. Una vez ms, el coeficiente de correla
cin, aunque no es igual a 0, de todos modos sera bastante bajo y no significativo. De hecho, con
los datos del ejemplo, r - 0,10, el cul no es estadsticamente significativo. En la prueba t para
medias independientes realizada con estos mismos datos, el efecto de la dispersin de los puntos
es una mayor varianza poblacional estimada para cada grupo. A la vez, lo anterior causa una esti
macin de varianza combinada considerable y un gran desvo estndar de la distribucin de dife
rencias entre medias. Dado que en una prueba t se divide la diferencia de medias por el desvo
estndar de la distribucin de diferencias entre medias, cuanto ms grande es el desvo estndar,
menor ser el t que resulte. Los datos del ejemplo arrojan una diferencia de medias de 0,52 y un
desvo estndar de la distribucin de diferencia de medias de 1,21. El resultado es un t de 0,43
que, claramente, no es significativo.
Por el contrario, la figura 16-3c representa un caso en el que existe una gran diferencia entre
las medias con una variacin relativamente pequea entre los puntos que rodean a cada media.
Como resultado, la lnea de regresin es muy til como elemento de prediccin, dando un alto
coeficiente de correlacin. (Aplicando los datos del ejemplo, r = 0,65 y t = 3,63, segn se calcula
a partir de r para probar su significacin). Asimismo, la gran diferencia de media y la pequea va
rianza dentro de cada grupo contribuyen a un gran t cuando se calcula utilizando una prueba t pa
ra medias independientes. En este ejemplo, la diferencia media es -2,17 y el desvo estndar de la
distribucin de diferencias entre medias es 0,59; por lo tanto, t es -3,68 (la diferencia con el t cal
culado utilizando r se debe al redondeo).
El principio representado grficamente por las figuras que acabamos de analizar es que la
prueba t para medias independientes y la prueba de significacin del coeficiente de correlacin
dan los mismos resultados, porque ambas son mayores cuando la diferencia entre las dos medias
es grande yla variacin entre las observaciones de cada grupo es pequea.
Tabla 1 6 - 4.
Clculo de la reduccin proporcional de! error con observaciones originales y anlisis de varianza,
mtodo de! modelo estructural, con los datos de la tabla 10-3.
REDUCCIN PROPORCIONAL DEL ERROR
Variable dependiente
(calificacin del empleador)
Variable de prediccin
(experimental versus control)
C d ig o
C a lific a c i n
P r e d ic h o
D ife r e n c ia
D ife r e n c ia
c u a d r tic a
1
1
l
1
1
1
2
2
2
2
2
2
2
6
4
9
7
7
3
6
6
1
5
3
1
1
4
6
6
6
6
6
6
6
3
3
3
3
3
3
3
0
-2
3
1
1
-3
0
3
-2
2
0
-2
-2
1
0
4
9
1
1
9
0
9
4
4
0
4
4
1
2 - S S * or = 50
SS.Totai ~
^E n ro f _
SS.Total
81,5-50
31,5
81,5
8L5
= 0,39
'039 = 0,62.
4,5
Grupo experimental
(programa especia!)
*i
6
4
9
7
7
3
6
X:
x-
GM
D esv
D esv7
1,5
-0,5
4,5
2,5
2,5
"1,5
1,5
2,25
0,25
20,25
6,25
6,25
2,25
2,25
39,75
X - A
Dcv
D esv7
0
0
4
-2
3
9
1
1
1
1
-3
9
0
0
24
Grupo de control
(programa estndar)
M-
GM
D esv
D esv1
1,5
1,5
1,5
1,5
1,5
1,5
1,5
2,25
2,25
2,25
2,25
2,25
2,25
2,25
15,75
6
1
5
3
1
1
4
X:
X - GM
D esv
D esv2
1,5
-3,5
0,5
-1,5
-3,5
-3,5
-0,5
2,25
12,25
0,25
2,25
12,25
12,25
,25
41,75
D e s v
3
-2
2
0
-2
-2
1
M - GM
D e sv 1 D esv
9
4
4
0
4
4
1
26
-1,5
-1,5
-1,5
-1,5
-1,5
-1,5
-1,5
D esv1
2,25
2,25
2,25
2,25
2,25
2,25
2,25
15,75
^dentro = Sl i +
+ - *- + ^ltimo = 6 + 6 = 1 2
Centre ^grupos 1 2 - 1 - 1
SL
= S C d^ J g l im 0 = 5 0/12 = 4,17
^
C M ^ = S C ^ J g l ^ m 31,5/1 = 3 1 , 5
a z n F: F =
6 C M ^ J C M ^ = 31,5/4,17 - 7,55
cativa entre los tres estilos de relacin (la variable independiente o de prediccin) con respecto a
los celos (la variable dependiente). Por el contrario, un enfoque correlacional describira este re
sultado como una asociacin significativa entre la variable del estilo de relacin y la variable de
los celos.
Anlisis de varianza para dos grupos como caso especial de significacin
de una correlacin bivariada
El vnculo entre el anlisis de varianza y la correlacin es ms fcil de captar si interpretamos ai
coeficiente de correlacin como la raz cuadrada de la reduccin proporcional del error con ob
servaciones orignales ( v a s e captulo 4), y al anlisis de varianza utilizando el mtodo del mode
lo estructural (captulo 12). La parte superior de la tabla 16-4 indica los datos de la correlacin del
ejemplo acerca del experimento realizado con la capacitacin laboral. Sin embargo, esta vez apa
recen cdigos asignados a los grupos experimental y control, a las observaciones originales, a los
valores predichos y a los errores cuadrticos, al igual que a los clculos para la reduccin propor
cional del error. La parte inferior de la tabla 16-4 indica los clculos del anlisis de varianza con
los mismos datos, utilizando el mtodo del modelo estructural.
Existen varios vnculos claros. Primero, la suma de los errores cuadrticos, calculada en la co
rrelacin cuando se utiliza la regla de prediccin bivariable (SCError = 50), es igual a la suma de des
vos cuadrticos intragrupaes (5Cdenao) correspondientes al anlisis de varianza. Por qu son
iguales? El anlisis de correlacin est calculando el error como la diferencia con respecto al valor
predicho, y el valor predicho es la media de cada grupo. Es decir, en el anlisis de correlacin la su
ma de los errores cuadrticos es el resultado de elevar al cuadrado y sumar la diferencia entre cada
valor y la media de su grupo (que es la prediccin para cada registro en su grupo). El anlisis de va
rianza est calculando la suma de los errores cuadrticos intragrupaes exactamente del mismo mo
do, la suma de los desvos cuadrticos de cada observacin con respecto a la media de su grupo.
Segundo, la suma de los errores cuadrticos en el anlisis de correlacin, cuando para prede
cir se utiliza la media general de la variable dependiente (5CTota = 81,5), es igual a SCXotal en el
anlisis de varianza (tambin 81,5). Son iguales porque el anlisis de correlacin est calculando
este error como el desvo cuadrtico de cada observacin con respecto a la media general de todas
las observaciones de la variable dependiente, y el anlisis de varianza est calculando la suma de
los desvos cuadrticos de cada observacin con respecto a la gran media, que es la media general
de todas las observaciones de la variable dependiente.
Tercero, la reduccin del error cuadrtico -la suma de cuadrados utilizando la media para
predecir (81,5) menos la suma de cuadrados del error utilizando la regla de prediccin bivariada
(50)~ es igual a 31,5. Este resultado coincide con la suma de cuadrados intergrupales (SCentre,
que es igual a 31,5) en el anlisis de vaanza. La reduccin de error en el anlisis correlaciona! es
equivalente a lo que agrega la regla de prediccin con respecto a conocer slo la media. En este
caso, la recta de prediccin estima la media de cada grupo; por lo tanto, la reduccin del error
cuadrtico de cada observacin es la diferencia cuadrtica entre la media del grupo de esa obser
vacin y la media general. SCmtgt, en el anlisis de varianza, se calcula sumando, por cada partici
pante, las diferencias cuadrticas entre la media del grupo del participante y la gran media.
Finalmente, la reduccin proporcional del error (r2, tambin denominada proporcin de va
rianza explicada), en el anlisis de correlacin, es exactamente igual a la proporcin de varianz
explicada (.R2 o eta2), una de las medidas del tamao del efecto que estudiamos en el anlisis de
varianza (ambas son igual a 0,39).
Tambin, ambas nos indican la proporcin de la variacin total en la variable dependiente,
que se explica a travs de su relacin con la variable independiente. A esta altura no debera sor
prendemos que estos nmeros sean iguales; ya hemos visto que los trminos que forman tanto el
numerador como el denominador, son los mismos en las frmulas de t2-y R2.
Segn lo observado, los vnculos entre correlacin y anlisis de varianza son bastantes profun
dos. De hecho, algunos investigadores calculan la significacin de un coeficiente de correlacin in
sertando las distintas sumas de cuadrados que ste produce en una tabla de anlisis de varianza y
calculando F. El resultado es idntico al producido por cualquier otro mtodo de clculo de la signi
ficacin del coeficiente de correlacin. Si calculamos e t correspondiente a la correlacin, el resul
tado es la raz cuadrada del F que obtendramos utilizando ese procedimiento.
.
Anlisis de varianza para ms de dos grupos
como caso especial de correlacin mltiple
Recordemos la tctica que empleamos al analizar la prueba t para medias independientes, como ca
so especial de prueba de significacin del coeficiente de correlacin. En ese caso pudimos calcular
un coeficiente de correlacin con los datos de la prueba t, convirtiendo arbitrariamente las dos cate
goras de la variable nominal de prediccin en dos nmeros distintos cualesquiera (en el ejemplo,
utilizamos 1 para el grupo experimental y 2 para el grupo de control). El problema es ms complejo
cuando la variable de prediccin incluye ms de dos categoras, como sucede en un anlisis de va
rianza para ms de dos grupos.
*
Tuvimos xito al asignar arbitrariamente dos nmeros cualesquiera a las dos categoras,
porque, en ese caso, no tienen importancia los nmeros en particular -slo deben ser diferen
tes. Cuando calculamos una correlacin convertimos las observaciones de cada variable en pun
tuaciones Z, y el proceso tiene en cuenta el grado de diferencia entre los dos nmeros. Pero
asignar cualquier nmero arbitrariamente, cuando existen tres o ms grupos, no funciona. Cua
lesquiera sean los tres nmeros que elijamos, implican alguna relacin particular entre los gru
pos, y no todas las relaciones sern iguales.
En el captulo 11, analizamos un ejemplo en el que el investigador comparaba los distintos
grados de culpabilidad de un acusado indicados por participantes, bajo tres condiciones: los que
crean que el acusado tena antecedentes delictivos; los que crean .que no tema antecedentes, y
aquellos a los que no se es haba hecho mencin de los antecedentes. Supongamos que asignra
mos arbitrariamente un 1 al primer grupo, un 2 al segundo y un 3 al tercero. Esto implicara que
544
consideramos que esos tres niveles son valores igualmente distanciados de una variable numrica
que representa el conocimiento de los antecedentes delictivos. Convertir los valores 1, 2 y 3 en
puntuaciones Z no sera una solucin, ya que, de todos modos, continuaran dispersos en forma
pareja y en el mismo orden. En este ejemplo en particular podramos pretende^ considerar que los
tres grupos estn ordenados, comenzando por el de antecedentes delictivos yfinalizando con el
que fue informado de la ausencia de antecedentes, quedando el grupo que no recibi informacin
en medio de los otros dos. Sin embargo, aun as no quedara claro que en esta dimensin los gru
pos estn separados en forma pareja.
Generalizando, cuando trabajamos con tres grupos, no tenemos una base preestablecida para
ubicar a los grupos en un orden determinado, mucho menos para decidir cmo deberan disper
sarse. Por ejemplo, en un estudio que compara actitudes de cuatro nacionalidades centroamerica
nas diferentes, la nacionalidad es la variable de prediccin; sin embargo, las cuatro nacionali
dades no pueden convertirse en cuatro valores de una sola variable numrica.
De todos modos, existe una solucin inteligente para este problema. En lugar de intentar
transformar una variable nominal, con ms de dos categoras, en una sola variable numrica, po
demos convertirla en varias variables numricas con dos niveles cada una.
El procedimiento es el siguiente: supongamos que la variable de prediccin tiene cuatro catego
ras, por ejemplo, cuatro nacionalidades centroamericanas: costarricense, guatemalteca, nicaragen
se y salvadorea. Una variable de prediccin podra ser el hecho de que el participante fuera
costarricense: 1 si lo es y 0 si no lo es. Una segunda variable de prediccin sera el hecho de que el
participante fuera guatemalteco: 1 0. Una tercera variable de prediccin sera el hecho de que el par
ticipante fuera nicaragense: 1 0. Podramos tener incluso una cuarta variable que establezca que el
participante es salvadoreo; sin embargo, sucede que, en este ejemplo, si un participante tiene valor 0
en las primeras tres variables, por eliminacin debe ser salvadoreo (porque existen slo cuatro posi
bilidades). En general, identificar todos los niveles de una variable nominal requiere una variable me
nos que la cantidad de niveles de la variable nominal.
Volviendo al ejemplo, el resultado del procedimiento descripto es que la nacionalidad de cual
quier participante se describe a travs de los valores en tres variables numricas, cada una con las
posibilidades de ser 1 0. Por ejemplo, un participante costarricense tendra un 1 en la opcin cos
tarricense y ceros en las opciones guatemalteco y nicaragense. Cada participante guatemalteco
tendra un 1 en la opcin guatemalteca y ceros en las opciones costarricense y nicaragense. Cada
Tabla 16-5.
E jem p lo de codificacin n om in al para la n acion alid ad d e d iez p articip an tes en u n e stu d io ficticio de
p articip an tes de cuatro n a cio n alid ad es cen troam erican as.
P a r ticip a n te
1
2
3
4
5
6
7
8
9
10
N a cio n a lid a d
G uatem alteca
N icaragense
Salvadorea
N icaragense
C ostarricense
C ostarricense
Salvadorea
N icaragense
C ostaricense
Guatem alteca
V ariable 1
C o sta rice n se o n o
V ariab le 2
G u a tem a lte c a o n o
V ariab le 3
N ic a ra g en se o no
0
0
0
0
1
1
0
0
1
0
1
0
0
0
0
0
0
0
0
1'
0
1
0
1
0
0
0
1
0
0
Tabla 16-6.
E je m p lo d e c o d ific a c i n n o m in a l p a r a la c o n d ic i n e x p e r im e n ta l d e q u in c e p a r t ic ip a n t e s d e l eje m p lo
d e a n te c e d e n te s d e lic tiv o s (d a to s fic tic io s ).
V ariab le d e p red icci n o in d ep en d e n te
Participante
1
2
3
4
5
7
8
9
10
11
12
13
14
15
Condicin
experimental
A ntecedente delictivo
A ntecedente delictivo
A ntecedente delictivo
A ntecedente delictivo
A ntecedente delictivo
S in antecedentes
Sin antecedentes
Sin antecedentes
Sin antecedentes
S in antecedentes
S in inform acin
S in inform acin
S in inform acin
S in inform acin
S in inform acin
Variable 1;
antecedentes
delictivos o no
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
V ariab le d e p e n d ie n te
0
0
0
0
7
5
10
8
5
1
3
7
4
4
6
9
3
3
participante nicaragense tendra ceros en las opciones costarricense y guatemalteca. Cada partici
pante salvadoreo tendra ceros en las tres variables. (A propsito, puede utilizarse cualquier par de
nmeros para cada variable nominal de dos valores; utilizamos 1 y 0 slo por conveniencia). La ta
bla 16-5 muestra el funcionamiento de esta codificacin aplicada a 10 participantes ficticios.
Todo el procedimiento descrpto se denomina codificacin nominal. (Convertir en 1 y 2 a los
niveles del ejemplo de la prueba t, para calcular un coeficiente de correlacin, tambin fue un ca
so de codificacin nominal para una variable nominal de dos categoras). En el ejemplo que esta
mos analizando ahora, el resultado de la codificacin nominal es que la variable de prediccin, en
lugar de ser una variable nominal con cuatro categoras, ahora se ha convirtido en tres variables
numricas pero, con slo dos valores cada una. Crear una serie de variables numricas con dos va
lores, tal como acabamos de describir, evita e! inconveniente de crear una jerarquizacin falsa de
los cuatro niveles.
La tabla 16-6 muestra otro ejemplo de codificacin nominal, esta vez aplicado a los participan
tes del ejemplo relacionado con los antecedentes delictivos. El resultado es que la variable de pre
diccin, en lugar de ser una variable nominal con tres categoras, ahora se transform en dos
variables numricas (con slo dos valores cada una, 0 1). Generalizando, en un anlisis de varianza se puede codificar toda variable independiente nominal para convertirla en una serie de variables
numricas de dos valores. La serie estar formada exactamente por una variable menos que la canti
dad de niveles que tena la variable nominal. (No es coincidencia que resulte el mismo nmero que
los grados de libertad de la estimacin ntergrupal de varianza poblacional).
Esa capacidad para codificar una variable nominal independiente, y convertirla en una serie
de variables numricas de dos valores en el anlisis de varianza, es una transicin importante que
hace posible la realizacin de un anlisis de correlacin mltiple. Tomemos nuevamente el ejem-
.V
\
Cuadro 16-2.
Dos mujeres establecen una posicin con respecto ai sexo y la estadstica.
resultado signieativo, sustenta la existencia de una asociacin entre las dos variables, pero no
indica cul de las variables es causal de la otra (o si alguna tercera variable en comn podra estar
causando ambas).
Generalmente, los verdaderos diseos experimentales de investigacin involucran la asigna
cin, a dos o ms niveles de la variable de prediccin. Tradicionalmente, estos experimentos han
sido analizados utilizando una prueba t o un anlisis de varianza. De hecho, hasta hace poco tiem
po atrs, en muchos casos no se enseaba la regresin / correlacin mltiples a los psiclogos ex
perimentales como parte de su capacitacin profesional. Eran experimentalisfas y no deban
condescender a la correlacin.
Los diseos correlacinales de investigacin se utilizan comnmente cuando no es posible
realizar experimentos. Con frecuencia miden la respuesta de determinadas personas con respecto
a dos o ms variables numricas, sin tener la posibilidad de que esas personas experimenten com
pletamente una de las variables. (La edad, el nivel de ingresos, el nivel de educacin, etc., son
ejemplos de variables con las que no es posible poner en prctica la asignacin aleatoria). Asimis
mo, a los socilogos, economistas y otros cientficos sociales no se les ensea la prueba t ni el
anlisis de varianza como parte de su capacitacin, debido a que la regresin / correlacin es el
mtodo apropiado de anlisis del cual dependen por completo.
Los diseos experimentales son claramente ventajosos. Por asociacin, tanto los diseos co
mo la estadstica correlacinales provocan una menor impresin y, fcilmente, se los confunde.
Sin embargo, no existe razn para que un verdadero experimento no pueda asignar personas al
azar a varios niveles numricamente diferentes de una variable numrica de prediccin. (Utiliza
mos un ejemplo de este tipo en el captulo 3, en el que las personas eran asignadas a diferentes
cantidades de exposicin de una palabra). Un experimento real de ese tipo se analiza adecuada
mente slo con un coeficiente de correlacin (y la correspondiente prueba de significacin). Si se
intentara reducir esos niveles de exposicin a dos grupos, por ejemplo la comparacin de aquellos
con gran cantidad de exposiciones de las palabras con aquellos con poca cantidad de exposicio
nes, se perdera informacin y sera un mtodo estadstico ms deficiente (entre otros aspectos, el
anlisis tendra menos potencia).
Asimismo, existen estudios que utilizan diseos correlacinales de investigacin en los que, sin
embargo, una de las variables tiene slo dos niveles, como por ejemplo, el gnero. O podramos
realizar un estudio con una variable con categoras, con ms de dos niveles, como por ejemplo la
nacionalidad. En esos casos, seguramente podramos analizar los resultados utilizando una prueba
o un anlisis de varianza, pero eso no cambiara el hecho de que los estudios hayan utilizado dise
os de investigacin correlacinales, en los que resulta difcil discernir la causa y el efecto.
Cabe recalcar que cuando los investigadores seleccionan un mtodo estadstico en lugar
de otro, es posible que la decisin est ms relacionada con la costumbre, lo que se ve
bien, e incluso con una confusin, que con cualquier diferencia matemtica o lgica entre
los procedimientos.
Existe una gran ventaja en utilizar la correlacin (o la regresin / correlacin mltiples s es
necesario) en lugar de la prueba t o el anlisis de varianza. El mtodo correlaciona! proporciona
informacin directa acerca del grado de relacin entre la(s) variable(s) de prediccin y la variable
dependiente, a la vez que permite realizar una prueba de significacin. La prueba t y el anlisis d
varianza slo brindan la significacin estadstica. (S bien con cualquiera de los procedimientos
recin mencionados podemos calcular el tamao del efecto, con un coeficiente de correlacin o
un coeficiente de correlacin mltiple se obtiene automticamente una indicacin del tamao del
efecto con el coeficiente de correlacin o regresin en s mismo).
Otra ventaja de la correlacin (y la regresin / correlacin mltiples) es que maneja automti
camente el tema de las distintas cantidades de participantes en los grupos que se comparan. Con
un anlisis de varianza de un criterio, cuando las cantidades de participantes en ios grupos son de
siguales necesitamos utilizar procedimientos ms complicados. Pero, al menos en estos casos, el
anlisis de varianza de un criterio proporciona resultados precisos.
Por el contrario, al realizar un anlisis de varianza de dos o ms criterios, si en las casillas hay
distintas cantidades de participantes, los procedimientos estndar del anlisis de varianza realr
mente fallan, en el sentido de que su aplicacin distorsiona los resultados. En la mayora de los
casos, la mejor solucin es replantear el problema a modo de regresin / correlacin mltiples.*4
4 La mayora de los programas para computadoras realizan el proceso mencionado automticamente cuando se Ies indi
ca ejecutar un anlisis de varianza factorial en el que las cantidades de registros en las casillas no son iguales. Sin em
bargo, en algunos programas debe darse especialmente la orden para que realicen e l proceso mencionado o, de lo
contrario, utilizan las frmulas del anlisis de varianza ordinario y arrojan resultados engaosos.
debera ser igual en cada punto a lo largo de la recta. Por ejemplo, supongamos que las observa
ciones de los niveles inferiores de una variable de prediccin tuvieran mucha variacin en la va
riable dependiente, pero que las observaciones en los niveles altos de la variable de prediccin
tuvieran muy poca variacin en la variable dependiente. Esto violara el principio de igualdad de
las varianzas poblacionales. El principio general de igualdad de las varianzas poblacionales, a to
dos ios niveles de una de las variables, se denomina homoscedasticidad,
En el caso de la correlacin y la regresin, el supuesto que se refiere a las distribuciones nor
males de poblacin se convierte en el requerimiento de que, cada variable, y todas en conjunto,
estn normalmente distribuidas (lo que se denomina distribucin normal bivariad a).
Como hemos visto, todas las tcnicas del modelo lineal general arrojan resultados bastante
precisos en una amplia gama de situaciones, excepto cuando la cantidad de participantes es muy
pequea o cuando se violan significativamente los supuestos. En verdad, estos distintos mtodos
constituyen las principales herramientas de la investigacin psicolgica.
CONTROVERSIAS Y LIMITACIONES
El modelo lineal general, en s mismo, no es muy controvertido; es simplemente una enuncia
cin matemtica de una relacin entre variables. De hecho, su papel como base de las tcnicas
estadsticas ms importantes an no ha sido ampliamente comprendido por los investigadores
en ejercicio.
Sin embargo, el mtodo de los cuadrados mnimos dentro del modelo lineal general es un po
co ms controvertido. Una alternativa es minimizar el error absoluto en lugar del error cuadrtico.
(Una ventaja del mtodo mencionado es que, en lugar de utilizar la raz cuadrada dei promedio de
los desvos cuadrticos como la medida ms comn de variacin, usaramos simplemente el pro
medio de los valores absolutos de los desvos, dando as mucha menos influencia de distorsin a
los valores atpleos).
De todos modos, las principales crticas relacionadas con el modelo lineal general son las que
involucran la prueba de hiptesis. Son las criticas que hemos estado tratando a lo largo del libro,
incluso su carcter robusto por el incumplimiento de los supuestos y la importancia del tamao
del efecto o la prueba de significacin.
Existen tambin crticas en otro sentido, que valen la pena mencionarlas aqu. Se trata de cr
ticas que estn relacionadas con el papel que juega la estadstica en la ciencia en general, pero
que, en la prctica, se formulan ms frecuentemente en el contexto de los procedimientos ms im
portantes basados en el modelo lineal general. Se trata de la causalidad. Hemos tratado el tema
hasta cierto punto en el captulo 3 y nuevamente en este captulo, cuando analizamos el problema
de deducir una direccin de causalidad a partir de un estudio que no utiliza asignaciones aleato
rias a los distintos grupos. Pero existe una cuestin an ms profunda con respecto a este tema;
Cul es el significado de causalidad?
Baumrind (1983) ha delineado dos interpretaciones de la causalidad que se utilizan en la
ciencia. Una, a la que denomina teora de la causalidad basada en la regularidad, encuentra sus
races en filsofos tales como David Hume y John Stuart Mili (al igual que en antiguos cientfi
cos, incluyendo a Galileo). Esta perspectiva sostiene que consideramos a X causa de Y si a) X e Y
estn relacionadas regularmente, b) X precede a Y y c) no existen otras causas anteriores a X que
pudieran causar a X y a Y. En psicologa, abordamos el punto a buscando una correlacin signifi
cativa entre X e Y; abordamos el punto b, si es posible, a travs de nuestro conocimiento de la si
tuacin (en una correlacin entre ser el primognito de una familia y sufrir luego de angustia,
podemos excluir la posibilidad de que la angustia sufrida ms tarde durante la vida de una perso
na sea la cansa de que esa persona sea primognita) o diseando un experimento para averiguarlo
(manipulando X antes de medir y). El punto c) est relacionado con el tema de la correlacin en
tre X e Y, debido a una tercera variable que es causa de las dos primeras. Lo ideal sera abordar el
tema a travs de la designacin aleatoria a los grupos, pero si no es posible solucionar el tema de
este modo, se utilizan como estrategia substitua varios mtodos estadsticos para igualar a los
grupos con respecto a terceros factores propuestos. (En el captulo 1? analizamos algunas de esas
estrategias).
Como psiclogos, slo a veces nos encontramos en posicin de realizar el tipo de investiga
cin experimental rigurosa que nos proporciona una fuerte base para sacar conclusiones con res
pecto a la causa y el efecto. As, gran parte de la crtica y de la controversia relacionada con la
investigacin de aplicacin prctica, 'en la que generalmente es ms difcil aplicar mtodos rigu
rosos, frecuentemente gira alrededor de esos temas. Por ejemplo, si el matrimonio y la felicidad
estn correlacionados, el matrimonio hace ms felices a las personas, o las personas felices se
casan y permanecen casadas?
Existe otra visin de la causalidad, una visin an ms exigente que considera las condicio
nes de la teora de la regularidad como requisitos previos para determinar una causa, pero esas
condiciones no son suficientes por s mismas. Esta segunda visin, a la que Baumrind llama teo
ra generativa de la causalidad, encuentra sus races en Aristteles, Toms de Aquino e Immanuei Kant. La visin generativa se enfoca en la dinmica con que X afecta Y, el proceso intrnseco
por el cual una est conectada con la otra. Es el modo en que interpretan la causalidad la mayora
de las personas no relacionadas con la ciencia (o la filosofa). La idea misma de causalidad puede
haber surgido como metfora de experiencias tales como desear que mi brazo se mueva (evento X),
y se mueve (evento Y). Los cientficos tambin toman muy seriamente esta visin de causalidad,
aun si ofrece desafos mucho ms complejos. Se aborda principalmente a travs de la teora y del
anlisis cuidadoso de procesos intermedios. Pero incluso aquellos que recalcan la importancia de
esta segunda visin reconoceran que demostrar una conexin confiable entre X e Y (a travs de l
significacin estadstica, por ejemplo) es importante, al menos, para identificar los vnculos que re
quieren investigacin para determinar la verdadera conexin causal.
Finalmente, tambin existen aquellos que sostienen, con algunos buenos argumentos, que de
mostrar la causalidad no debera ser un objetivo de la psicologa cientfica. Pero ya hemos tenido
suficiente controversia para un captulo.
Resumen
El modelo lineal general equipara el valor de una variable para cualquier individuo con la suma
de una constante, ms la influencia parcial y ponderada de cada una de otras variables, ms el
error. El coeficiente de correlacin y la regresin / correlacin mltiples (y las correspondien
tes pruebas de significacin), a prueba t y el anlisis de varianza, son todos casos especiales
del modelo lineal general.
La regresin / correlacin mltiples es prcticamente idntica al modelo lineal general, y la
regresin y correlacin bvariadas son casos especiales de regresin / correlacin mltiples, en
los que existe slo una variable de prediccin.
La prueba t para medias independientes se puede deducir matemticamente del anlisis
de varianza. Es un caso especial del anlisis de varianza en el que hay slo dos grupos. La
puntuacin t es la. raz cuadrada de la razn F, calculados con los mismos datos. Existen
muchas similitudes en las formas de realizar los dos procedimientos: los numeradores de t y
F se construyen sobre las diferencias entre las medias de los grupos; los denominadores de
ambos se construyen sobre la varanza interna de los grupos; el denominador de t incluye la
divisin por la cantidad de participantes y el numerador de F incluye la multiplicacin por
la cantidad de participantes; y los grados de libertad de t son iguales a los-grados de libertad
del denominador de F.
La prueba t para medias independientes tambin es un caso especial de la prueba de signifi
cacin del coeficiente de correlacin. Una correlacin mide el grado de relacin de una varia
ble de prediccin o independiente con una variable dependiente. Del mismo modo, al indicar la
diferencia entre las medias de los grupos, la prueba t identifica una relacin entre la variable cu
yos grupos estn divididos, es decir, la variable independiente o de prediccin con la variable
dependiente. Si asignamos el valor 1 a cada participante en uno de los dos grupos y el 2 a cada
participante en el otro grupo (o dos nmeros diferentes cualesquiera), y despus calculamos
una correlacin de esos valores con la variable dependiente, la significacin de la correlacin
ser igual que la producida por la prueba t. Si dibujamos un diagrama de dispersin con los da
tos mencionados obtendramos una columna de valores observados para cada grupo, y la lnea
de regresin pasara por las medias de cada uno de ellos. Cuanto ms diferentes sean las me
dias, mayor ser la reduccin proporcional del error con respecto a utilizar la gran media, y ma
yor ser la puntuacin basada en una comparacin de las medias de los dos grupos.
El anlisis de varanza y la correlacin / regresin tambin presentan muchas similitudes.
5CTot3, en la regresin y en el anlisis de varanza, se refiere a ios desvos de cada observacin
con respecto a la media de todas las observaciones de la variable dependiente. Las medias grpales en un anlisis de varanza son los valores predichos para cada individuo en la regresin;
as, SCno( y SCD(ntc0 son iguales. La reduccin de error cuadrtico (SCTojal - SCEm[) en la re
gresin es igual a la suma de los desvos cuadrticos de las medias de los grupos de observacio
nes con respecto a la gran media
j) en el anlisis de varanza. Finalmente, la
reduccin proporcional del error de la regresin (r2 o R2), en la regresin, es igual a la propor
cin de varanza explicada (R2 o eta2) por el tamao del efecto en el anlisis de varanza.
Todo anlisis de varanza puede plantearse como una regresin mltiple, transformando las
categoras que representan los diferentes grupos en una o ms variables numricas dicotrnicas. En sentido estricto, el anlisis de varanza es un caso especial de regresin mltiple, en el
que las variables de prediccin se establecen del modo descripto precedentemente.
Todos ios mtodos mencionados comparten los mismos supuestos en cuanto a que las dis
tribuciones de la poblacin son normales y tienen igual varanza en todos los niveles de la va
riable de prediccin.
La prueba , ei anlisis de varanza y ia correlacin pueden plantearse como regresin / co
rrelacin mltiples; sin embargo, la prctica convencional hace que estos procedimientos conceptualmente idnticos se utilicen en diferentes contextos de investigacin, como si en realidad
fueran diferentes.
Con respecto a la causalidad, la teora de la regularidad identifica a X como causa de Y, si X
e Y estn relacionadas, X precede a Y, y no existe un tercer factor que preceda a X y pudiera
causar ambas. La teora generativa sostiene que, adems, debe comprenderse claramente el me
canismo por el cual X afecta Y. Los procedimientos estadsticos pueden demostrar una relacin
entre X e Y, e incluso a veces pueden contribuir con evidencia contra una tercera variable pro
puesta como causa de X e Y, Toda otra prueba de que X sea causa de Y depende del conocimien
to de ia situacin, del diseo experimental y del anlisis terico.
Trminos clave
- M odelo lineal general.
- Modelo de cuadrados
mnimos.
- Codificacin nominal.
Ejercicios
de corte t al cuadrado y antelo al lado del t, c)
Busque y anote, al lado de los cuadrticos, los
puntos de cortes para distribuciones F con 1
grado de libertad en el numerador y 5 ,1 0 ,1 5 y
^Dentro ?
vaior y la raz cuadrada de la
razn F . t y F corresponden al nivel 0,05; las
1.
a) Busque y anote el punto de corte t ai
pruebas t son de dos colas.
nivel 0,05 (dos colas), correspondiente a 5 ,1 0 ,
15 y 20 grados de libertad, b) Eleve cada punto
SERIE 1
Grupo
experimental
N
(0
(ii)
(i)
30
36
16
12,0
100
73
Grupo
control
S2
2,4
40
30
36
16
n ,i
104
75
Prueba t
2,8
48
t n e c e s a r io
S2
v combinada
58
70
2,004
1,995
2,6
44
2,16
2,56
G rupo A
G rupo B
13
16
19
18
19
11
7
9
6.
Explique los vnculos principales entre
la regresin mltiple y el anlisis de varianza.
SERIE li
1. a) Busque y anote el punto de corte F al
nivel 0,01 para distribuciones con 1 grado de li
bertad en el numerador y 1 0 ,2 0 ,3 0 y 60 grados
de libertad en el denominador, b) Calcule la
raz cuadrada de cada uno y antela al lado del
corte, c) Busque los puntos de corte de la distri
bucin t al nivel 0,01 (dos colas), utilizando,
1 0 ,2 0 ,3 0 y 60 grados de libertad, y antelos al
lado de las correspondientes races cuadradas
de F. (Lo s resultados deberan ser idnticos, te
niendo en cuenta las diferencias de redondeo).
2. A continuacin enumeramos tres series
de datos, todos ellos tomados del ejercicio 2,
serie II, del captulo 10. S i no calcul antes las
pruebas t para estos datos, hgalo ahora, pero
esta vez utilizando el nivel 0,01 de dos colas.
Luego, en cada caso, calcule adems un anli
sis de varianza de un criterio (tambin al nivel
0,01). Observe las sim ilitudes entre a) e lg de t
y el gl del denominador de F , b) el punto de
corte t y la raz cuadrada del punto de corte F ,
c > ^Combinada y CM Demro y d > e l v a lo r f y la raz
cuadrada de la razn F .
G ru p o
ex p e rim e n ta l
N
5 . C o n lo s v a lo r e s q u e s e e n u m e r a n a c o n t i
n u a c i n , c a lc u le u n a p r u e b a
d e p e n d ie n te s
(u tiliz a n d o
t para
el
10
m e d ia s in
(i)
0 ,0 5 ,
GO
40
(i )
10
n iv e l
c o la ), e l c o e f ic ie n t e d e c o r r e la c i n
una
(e n tr e e l
G ru p o
con trol
S2
S2
604
60
10
607
50
604
60
40
607
50
604
20
10
607
16
g r u p o e n e l q u e s e e n c u e n tr a n lo s p a r tic ip a n te s
y s u s v a lo r e s o b s e r v a d o s ) y e l
tpara
la s i g n i f i
c a c i n d e l c o e f ic ie n t e d e c o r r e la c i n (u tiliz a n d o la f r m u la
t ~W
t f - 2 / V l - r 2).
G ru p o A
G ru p o B
0 ,7
0 ,9
0 ,8
0 ,6
0 ,4
0 ,2
3.
Realice una prueba t para medias inde
pendientes (dos colas) y un anlisis de varianza
con los valores que aparecen a continuacin.
R ealice los clculos en las mitades de una m is
ma pgina y coloque los clculos paralelamen
te, uno al lado del otro, (E s decir, cree una tabla
sim ilar, en cuanto al diseo, en la parte inferior
de la tabla 16-2). U tilice el nivel 0,01.
Grupo A
GrupoB
o
1
o
4
5
6
---------------. . .
.
4. Con los d~t?s del eJerc1~10 3.(anterior),
c~lcule un anl.lSis d~. regresin, mcluya un
d~agrama de disix:rs10n y calcule el coeficiente de correlactn (en?"~ el grupo en el
que se encuentran los participantes y sus valores observados), determinando la reduccin
proporcional del error a travs del mtodo
extenso en el que se calculan los valores predichos y luego se determina el error cuadrtico medio utilizando esos valores; despus
calcule la significacin de la correlacin (utilizando la frmula t = dN - 21 rt=r2' y elevando luego t al cuadrado). Finalmente,
realice un cuadro que muestre las coincidencias de los resultados.
5. Con los valores enumerados a continuacin, calcule a) una prueba t para medias
independientes (nivel 0,05, dos colas); b) el
coeficiente de correlacin (entre el grupo en el
que se encuentran los participantes y sus valo-
5 56
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
1
l
l
1
1
1
1
l
1
l
1
Comprensin
de los procedimientos
estadsticos avanzados
que aparecen en
publicaciones cientficas
ancova
(A n ly sis o C o v a ria n ce ,
Anlisis
de covarianza).
MANOVA (M u ltiv a ria te A h a ly sis o
V a riance,
Anlisis de varianza
covarianza muitivariado).
Repaso genera! de tcnicas estadsticas.
Controversia: Debera ser controvertida
la estadstica?
Cmo leer resultados en publicaciones
cientficas que incluyentcnicas
estadsticas que ho nos son familiares?
Resumen.
Trminos clave.
Ejercicios.
r -M ^ J +MzxJ+M zx,)
E n el ejemplo del estrs sufrido por ios gerentes, la regla de prediccin de regresin m ltiple con
puntuaciones Z era la siguiente:
E n el ejemplo del estrs de los gerentes, la regla de prediccin de regresin m ltiple con puntua
ciones originales era la siguiente:
Y = - 4 , 7 0 + ( ,5 6 ) ( E m p le a d o s ) + ( 0 ,6 ) ( R u id o ) + ( 0 , 8 6 ) ( D e c is io n e s )
P aso 1
P aso 2
P aso 3
0,2 6 6 * * *
0 ,3 0 0 * *
0,297**
-0 ,0 3 5
-0 ,3 1 6 * *
0 ,153*
0,015
0,044
-0 ,0 3 6
-0 ,3 1 4 * *
0,154*
0 ,017
0,044
0 ,171**
0 ,100*
-0 ,0 2 4
0,171**
0,001
Raza6
R2
C a m b io en R 2
0,0 7 0 * * *
Finalm ente, en el paso 3 se agreg a raza (m aor o no). L a inclusin de la variable raza no aumen
t mucho el R2.
Lo s resultados son especialmente interesantes debido a que la correlacin bivarada directa
entre la raza y los p t s d era significativa. Aun as, l a regresin jerrquica muestra que a raza no
predice el estrs postraumtico si ya se ha tenido en cuenta l a experiencia en combate y la sita-
cin m ilitar. E n otras palabras, el efecto aparente de la raza probablemente se deba a que la expo
sicin al combate y la experiencia m ilitar de los maories eran diferentes.
Analicem os otro ejemplo. Hermann y sus colegas (1997) realizaron un estudio de nios bajo
tratamiento de bionretroalimentacin de la migraa. E l objetivo del estudio era identificar varia
bles que predijeran el xito de ese tipo de tratamiento y, para eso, los investigadores midieron la
aj (Actividad de las jaquecas) al finalizar un programa de 8 semanas de tratamiento. L a a i era una
variable que resuma factores tales como la frecuencia y la intensidad de los dolores de cabeza.
Lo s investigadores tambin midieron una cantidad de variables de prediccin, que incluan la AJ
preexistente (antes de que comenzara el tratamiento), los problemas de conducta segn la c b c l
(Child Behavior Checklist, Lista de verificacin del comportamiento infantil), incluyendo la inte
riorizacin y exteriorizacin del comportamiento, las aflicciones psicosom ticas, la edad y las va
riables fam iliares segn la f e s (Family Environment Scale, E scala de ambiente fam iliar), incluso
el ndice de relaciones fam iliares, la organizacin y el control
Lo s investigadores utilizaron la regresin jerrquica para observar si las dems variables de
prediccin agregaban algo a la prediccin de la efectividad por encim a de la aj preexistente. En
realidad, realizaron dos regresiones jerrquicas diferentes. Una, a la que llam aron modelo 1, exa
minaba si las variables referidas al nio (comportamiento y edad) aportaban alguna contribucin
por encim a de la a j preexistente. L a otra, e l modelo 2, examinaba si las variables fam iliares apor
taban alguna contribucin por encima de la aj previa a la lnea de base. Lo s investigadores infor
maron sus resultados de la siguiente forma:
Tabla 17-2
Prediccin del efecto de determinado tratamiento a travs de la regresin m ltiple jerrquica.
M o d e lo y p a so
R 2 T otal
M odelo 1
0,39
Paso 1. AJ previa a la lnea de base
Paso 2. CBCL: interiorizacin del comportam iento
CBCL: exteriorizacin .del comportam iento
A fliccio n es psicosom ticas
Edad
M odelo 2
0,03
P a s o l, aj previa a la ln ea de base
Paso 2. FES: ndice de relaciones fam iliares
FES: organizacin
fes : control
Nota,- a j actividad de las jaquecas;
te familiar.
cbcl
gl
5 ,2 6
3,3*
P
- 0 ,0 4
R 2A
0,02
- 0 ,2 7
0,57*
0,7
0,37
0,02
0,01
0,7
0 ,0 6
3,9*
0,37*
-0 ,4 3 *
4 ,2 7
0 ,2
-0 ,1 8
-0 ,0 4
- 0 ,0 6
- 0 ,0 5
*p < 0,05.
Fuente: Hermann, C., Blanchard, E. B., & Flor, H. (1997), tab. 5. 'Tratamiento de biorretroalimentacia para la migra
a: prediccin del efecto del tratamiento. R e v ista cien tfica d e p s ic o lo g a d e a seso ra m ien to y c ln ic a (J o u rn a l o f C on
su ltin g a n d C lin ical P sy ch o lo g y ] 65, 611-616. Copyright, 1997, por la Asociacin Americana de Psicologa, Reimpreso
con autorizacin.
U tiliza n d o la reg resi n m ltip le jerrq uica, s e evalu aron in d ep en d ien tem en te las caractersticas
d e l n i o (m o d e lo i ) y e l a m b ien te fa m ilia r (m o d e lo 2 ) c o m o fa cto res d e p red iccin d el e fe c to del
tratam iento. Para controlar la s d iferen cia s d e la ln ea d e b a se, se in g r e s prim ero la a j previa a la
ln e a d e b a se. L as variables qu e reflejan la s caractersticas d el n i o y lo s a sp ectos d el fu n c io n a
m ien to fa m ilia r resp ectiv a m en te, fu eron in g resa d o s c o m o ser ie s en e l p a so 2 . . . (pp. 6 1 3 -6 1 4 )
Lo que los autores quieren decir es que, de las diversas variables de prediccin (que eran siete), la
proporcin de varianza justificada por dos de ellas (edad y aflicciones psicosom ticas) no era au
mentada significativam ente al in cluir tambin cualquiera de las variables restantes.
1 Tcnicamente, lo descripto es una regresin por pasos hacia adelante". Algunos investigadores prefieren comenzar
con una regla de prediccin que incluya todas las variables de prediccin para observar luego cunta capacidad de pre
diccin se pierde al eliminar el factor de prediccin menos til. S i no se pierde mucha capacidad de prediccin, se eli
mina la siguiente variable menos til, y as sucesivamente. El proceso contina hasta que queda una pequea serie de
variables cuyo poder de prediccin se reduce significativamente al eliminar e l factor de prediccin menos til. Este
procedimiento alternativo se denomina regresin por pasos hacia atrs". En la mayora de los casos, las regresiones
por pasos hacia adelante o hacia atrs producen aproximadamente ios m ism os resultados; realmente, la utilizacin de
uno y otro proceso no denota gran diferencia sino que se trata ms bien de una cuestin de preferencia del investigador.
Tabla 17-3.
Proceso de regresin mltiple gradual.
Paso 1:
Paso 2:
Paso 3:
E s preciso hacer ana advertencia en cuanto a la regresin gradual: la frm ula de prediccin re
sultante es el grupo de variables que m ejor predice la variable dependiente, basndose en la
m u estra a n a liza d a . Sin embargo, sucede con frecuencia que cuando se analizan las mismas
variables con una nueva muestra, la m ejor com binacin de variables resulta ser, en cierto mo
do, diferente.
CORRELACIN PARCIAL
L a co rrelaci n p a rcia l es otra tcnica ampliamente utilizada en a psicologa de la personalidad
y del desarrollo, en la psicologa cln ica y social y en varias otras reas aplicadas a la psicologa.
L a correlacin parcial es el grado de asociacin entre dos variables, por encim a de la influencia
de otra u otras variables. Supongamos que un investigador necesita saber hasta qu punto el estrs
sufrido por una persona en la vida marital est relacionado con el tiempo que esa persona ha esta
do casada. Sin embargo, el investigador es consciente de que parte de lo que podra relacionar al
estrs marital con el tiempo de casado, es que las personas que llevan ms tiempo casadas proba
blemente tengan hijos, y ese hecho podra causar estrs m arital. Por lo tanto, calcular simplemen
te la correlacin entre el estrs m arital y el tiempo de m atrim oni sera engaoso; lo que el
investigador necesita saber es la relacin que existira entre el estrs y el tiempo de matrimonio si
todas las parejas tuvieran la misma cantidad de hijos. O , para decirlo de otra manera, el investiga
dor necesita que, de algn modo, la inform acin derivada del estrs y el tiempo de matrimonio no
incluya lo aportado por la cantidad de hijos de ese matrimonio. Lo anterior se logra mediante la
correlacin parcial.
En el caso mencionado anteriormente, el investigador calculara una correlacin parcial entre
el estrs m arital y el tiempo de matrimonio m anteniendo constante la cantidad de hijos. E l pro
cedimiento tambin se describe como exclusin o control de la cantidad de hijos (los trminos
mantener constante , excluir y controlar tienen el mismo significado y pueden utilizarse in
distintamente). E l clculo estadstico real de la correlacin parcial se denomina coeficiente de
co rrelaci n p a rcia l. Este presenta valores desde el -1 al +1 y se considera igual a una corre
lacin comn entre dos variables, excepto por el hecho de que existe una tercera variable que es
t siendo controlada.
E l siguiente es otro modo de ver la correlacin parcial: en el ejemplo que hemos estado men
cionando, el investigador podra calcular la correlacin entre el estrs y el tiempo de matrimonio
utilizando slo personas que no tuvieran hijos; luego podra calcular la misma correlacin slo con
aquellos que tienen un slo hijo, y as sucesivamente. Cada una de esas correlaciones analizadas
independientemente no se ven afectadas por las diferentes cantidades de hijos, ya que entre las
personas estudiadas en cada una de las correlaciones no existe esa diferencia. Despus, el investi
gador podra calcular algn tipo de promedio entre las diferentes correlaciones, ninguna de las
cuales ha sido afectada por la cantidad de hijos. E l promedio entre esas correlaciones es la correla
cin parcial. Se trata literalmente de una correlacin que mantiene una cantidad constante de hijos.
En realidad, los clculos de una correlacin parcial son bastante directos, y no es necesario
realizar todas esas correlaciones individuales ni el promedio de ellas. Sin.em bargo, el resultado
del proceso es el mismo que si se realizaran esos clcu lo s.2
L a correlacin parcial, en lneas generales, se utiliza para seleccionar una de varias explica
ciones tericas alternativas de las relaciones entre variables. Supongamos que un investigador
descubre una correlacin comn entre el estrs marital y el tiempo de matrimonio, y est interesa
do en utilizar ese resultado para sustentar la teora de que el paso del tiempo hace que las personas
se sientan ms estresadas con respecto al matrimonio, ya que cada miembro de la pareja da por
sentado al otro. Sin embargo, el investigador tambin es consciente de que otra explicacin posi
ble sera que cuando las personas llevan ms tiempo de casadas, probablemente tienen ms hijos,
y el hecho de tener hijos podra crear estrs en el matrimonio. S i se descubre una correlacin en
tre el estrs y el tiempo de matrimonio, aun despus de controlar la cantidad de hijos, la ltim a ex
plicacin alternativa referida a la cantidad de hijos se toma improbable.
2 La correlacin parcial est muy relacionada con la regresin mltiple. Por ejemplo, un coeficiente de regresin indica
en qu medida una variable en particular es adecuada para predecir la variable dependiente, dado cualquier nivel de to
das las otras variables de ia ecuacin. Adems, en la regresin mltiple jerrquica, la contribucin que surge ai agregar
una variable a aquellas ya incluidas en la ecuacin, indica, en efecto, lo que esa variable aporta independientemente de
todas las dems. (El nombre formal de lo que una variable aporta en una regresin- mltiple jerrquica es ia correlacin
semiparciar*), Para comprender de manera general una publicacin cientfica, digamos que la correlacin parcial, ei
coeficiente de regresin y ia cantidad aportada por una variable en la regresin jerrquica, indican algo similar: la rela
cin entre dos variables independientemente de otra u otras variables.
T a b la 1 7 -4 .
C o r r e la c i n b iv a r ia d a y p a r c ia l q u e in d ic a n la s r e la c io n e s e n tr e la s e s c a la s d e r e p r e s i n e in s e g u r i
d a d y la s p r e o c u p a c io n e s a u to c r tic a s e in t e r p e r s o n a le s .
r B iv a ria d a
E sc a la
R epresin
Padres
M adres
inseguridad
Padres
M adres
I n te r p e r s o n a l
A u to c r tic a
0 ,1 2
0,08
0 ,2 3 * * *
0 2 3 * **
0,2 4 * * *
0 ,3 3 * * *
0,13
0,12*
r P a r c ia l
I n te r p e r s o n a l
0 ,0 0
-0 ,1 2 *
0,20**
0,29***
A u to c r tic a
0,18**
0,14*
0 ,0 2
- 0 ,0 7
N ota; Anlisis de correlaciones parciales que evalan las relaciones entre la represin {o inseguridad) y las inquietudes :
depresivas con control de la inseguridad (o represin) y de la depresin adolescente.
*p < 0,05; * * p < 0 ,0 1 ; ***/? < 0,001.
Fuente: Frank, S. J., Poorman, M. O., & Van Egeren, L. A. (1997), tab. 5. Percepcin con respecto a las relaciones con
sus propios padres por parte de adolescentes internados con preocupaciones depresivas y estado de depresin". Revista'-,
cien tfica d e p s ic o lo g a cln ic a infantil [J o u rn a l o f C lin ic a l C h ild P sy c h o lo g y ], 26, 2 05-215. Copyright 1997 por
Lawrence Erlbaum A ssociates, Inc. Reimpreso con autorizacin.
E l siguiente ejemplo fue tomado de una investigacin real: Frank y sus colegas (1997) realizaron
un estudio de las inquietudes depresivas de adolescentes y su relaciones con sus propios padres.
Los investigadores se concentraron en dos aspectos de las inquietudes depresivas: la preocu
pacin autocrtica y la preocupacin interpersonal. Tambin se concentraron en dos aspectos de
lo que denominaron conflicto de separacin-individuacin con los padres, es decir, en qu me- :
dida los adolescentes perciban represin por parte de sus padres (ejerciendo un fuerte control so
bre sus comportamientos) y hasta qu punto los adolescentes se sentan inseguros con respecto a
sus padres. Frank et al. informaron el resultado de los anlisis de la siguiente forma:
D e sp u s c o rrela cio n a m o s las esca la s d e p ercep cin -in seguridad y rep resin, referid as a lo s pa. dres y las m adres, co n lo s valores d e in q u ietu d es autocrticas e in terp erson ales. L a tabla [1 7 -4 ] re
su m e lo s a n lisis d e correlacin bivariada y parcial, E n lo s an lisis p arciales s e co n tro l un
a sp ecto d e l c o n flic to d e sep aracin rn d ivid u acn [....] y c a d a tip o d e inq uietud d epresiva.
A u n q u e la m a g n itu d d e las co rrela cio n es no e s tan am p lia, e l patrn gen eral d e io s resu ltad os que
m u estra [la] tabla e s sig n ifica tiv o . L o s a d o le sce n tes q u e percib an q u e lo s padres reprim an su s in
ten tos d e sep aracin presentaban m s prob ab ilid ad es d e tener in q u ietu d es au tocrticas, m ientras
q u e lo s a d o le sce n tes que reco n o ca n qu e e llo s m ism o s estaban ex p erim en tan d o tem o res y an sie
dades c o n resp ecto a la sep aracin presentaban m s probab ilidad es d e preocu pares por inq uietu
d es interperson ales (p. 2 1 1 ).
CONF1ABIUPAP_________
E s poco comn que, en psicologa, las medidas sean perfectamente precisas. (Tratamos breve
mente el tema en el captulo 3 y lo analizamos con ms detalle en el apndice A ). E l grado de co
herencia o estabilidad de una m edicin se denomina conabUidadL En lneas generales,- la
confiab ilid ad im plica hasta qu punto se obtendra el mismo resultado si se hiciera la misma me
dicin nuevamente a la misma persona bajo las mismas circunstancias. Calcular la confiabiiidad
de un procedimiento de medicin es un tema clave en casi todas las reas de investigacin psico
lgica, sin importar si los procedimientos son cuestionarios, entrevistas, observaciones de com
portamientos, reacciones fisiolgicas u otros. Lo s clculos estadsticos de la confiabiiidad aparecen
con frecuencia en las publicaciones cientficas.
Una forma de evaluar la co nfiab iiidad de una m edicin es hacerla dos veces con el mismo
grupo de personas, y la correlacin entre esas dos pruebas se denomina confiabiiidad por p ru e
ba-reprueba, Sin embargo, este mtodo comnmente no resulta prctico o apropiado. Por ejem
plo, el mtodo no sena aplicable si, al realizar la pnieba una vez, influye en la realizacin de la
prueba por segunda vez (como sera el caso de una prueba de inteligencia).
Con muchas m ediciones, tales como la m ayora de los cuestionarios, tambin se puede
evaluar la co n fiab iiid ad , correlacionando el valor promedio de una m itad de los tem s con el
valor promedio de la otra mitad, Por ejem plo, se podra correlacionar el valor de todos los
tem s im pares con el valor de todos los tem s pares. S i la persona est respondiendo coheren
temente, deberamos obtener una correlacin alta. Este procedim iento se denomina co nfiab i. iid a d p o r d ivisi n en m itades
E l problem a que surge al u tilizar e l mtodo de m itades es el modo en que se las divide.
E n m uchos casos tiene sentido d ivid ir los tem s en pares e im pares, pero podra ocurrir que
por casualidad esta divisin diera una correlacin dem asiado baja o demasiado alta. A fortu
nadamente, existe una solucin ms general; se puede d ivid ir la prueba en m itades, de todas
las form as posibles, y calcu lar la correlacin utilizando cada una de las d ivisiones. E l prome
dio de esas correlaciones se denomina alfa de C ro n b a ch (a ). (E x iste una frm ula no dema
siado com pleja para realizar ese procedimiento, que produce el mismo resultado que prom ediar
todas las posibles correlaciones entre m itades. Por supuesto, en la actualidad, alfa ca si siem
pre se calcu la con una computadora).
E l alfa de Cronbach es la medida de co n fiab iiid ad ms ampliamente utilizada, y tambin
se la puede considerar como la descripcin del grado en que cada tem est asociado con cada
uno de los otros tem s. D escribe la coherencia general de la prueba, es decir, en qu m edi
da las respuestas altas coinciden con las altas y las bajas con las bajas en todos los tem s de la
prueba.
Generalm ente, en psicologa una prueba debera presentar una co n fiab iiid ad (m edida a
travs del alfa de Cronbach) de al menos 0 ,7 , y preferentem ente cercana a 0,9, para que la
prueba sea til. Sin embargo, algunas veces se consideran adecuadas alfas de 0,6 m enores.
U n contexto en el cual la co n fiab iiid ad es casi siem pre discutida es en e l de las publica
ciones cien tficas, cuyo objetivo es, principalm ente, la creacin de una nueva m edida. Por
ejem plo, Sellers y sus colegas (1997) desarrollaron un cuestionario para evaluar la identidad
de la raza negra entre am ericanos africanos. A l desarrollar la escala identificaron una canti
dad de aspectos de la identidad de la raza negra, creando un M I8I (Multidimensional Inven
tory of Black Identity, Inventario m ultidim ensional de identidad de la raza negra) que incluye
diversas sub-escalas. Uno de lo s distintos mtodos que utilizaron para evaluar la solid ez de la
escala como medida fue determ inar la co n fia b iiid a d de cada sub-escala y, tam bin, hacerlo
con alum nos africanos am ericanos tanto en una universidad para alumnos de raza negra co
mo en otra universidad en la que predom inaban los alum nos de raza blanca. L a tabla 17-5 in
dica los resultados de ese aspecto del estudio. (L a ln ea correspondiente al inters por lo
pblico est en blanco en la tabla, porque era una sub-escala que incluyeron originalm ente
pero luego descartaron durante el proceso de desarrollo de la m edida). Sellers et al. resum en
del siguiente modo los descubrim ientos que presenta la tabla; L a s versiones revisadas de las
escalas y sub-escalas del m i b i mostraron una adecuada coherencia interna [...] L o s alfas de
Cronbach de las sub-escalas iban desde un 0,60 bajo (aspecto privado) a un 0,79 (nacionalis
m o). L o s alfas eran sim ilares en cada una de las facultades (p. 810).
T a b la 1 7 -5 .
E s t a d s tic a d e s c r ip tiv a p a r a el m ibi p o r fa c u lta d y p a r a la m u e s tr a c o m p le ta .
U n iv e r sid a d con
p red om in io d e raza b la n ca
M u e stra co m p le ta
E sc a la
P osicin central
Inters priv.
Inters pb.
Integracin cultural
Hum anista
M inora
N acionalism o
a d e C ro n b a ch
0,77
0,6 0
5,23
6,2 5 a
1,08
0,7 0
0,73
0 ,7 0
0,76
0,79
SD
4,9 2 a
5 ,1 5 a
4 ,7 8 a
4 ,2 7 a
0,91
0,84
0 ,8 2
0,99
a d e C ro n b a c h
0,78
0,55
0,66
0,68
0,75
0,78
5,20
6,38
5,165,33
4,82
4,02
SD
1,14
0,59
0 ,8 0
0 ,8 0
0,80
0,96
U n iv ersid a d
a fro -a m erica n a
(X d e C ro n b a ch
0,75
0,61
0,74
0,69
0,77
0,74
SD
5,28
6,05
0,98
0,81
4,55
4,87
4,70
4,67
0,94
0,81
0,86
0,90
ANALISIS FACTORIAL
E l a n lisis fa cto ria l se u tiliza cuando el investigador ha m edido a los participantes con res
pecto a una gran cantidad de variables. E l an lisis factorial ndica ai investigador qu varia
bles tienden a agruparse, es decir, qu variables tienden a correlacionarse entre s y no con
otras. Cada agrupacin de ese tipo (grupo de variables) se denom ina facto r. L a conexin rela
tiva de cada una de las variables originales con un factor es la carg a fa c to ria l de esa variable
en ese factor. (L a s variables presentan cargas en todos los factores, pero generalm ente tendrn
cargas altas slo en uno). L a s cargas factoriales pueden considerarse co'mo la correlacin de la
variable con el factor y, al igual que las correlaciones, van desde - 1 , asociacin negativa per
fecta con el factor, pasando por 0, ausencia de relacin con e l factor, hasta +1, correlacin
positiva perfecta con el factor. Normalmente, se considera que una variable contribuye sig n ifi
cativam ente en un factor slo si presenta aproximadamente una carga de 0,3 m ayor ( de
-0 ,3 menor). Algunos investigadores utilizan lo s niveles 0 ,3 5 ,0 ,4 0 , e incluso niveles ms al
tos, como norma para decidir si una carga factorial es lo suficientem ente importante como pa
ra considerar que la variable forma parte del factor.
E l anlisis factorial en s mismo incluye una serie de frmulas relativamente com plejas que
comienzan con las correlaciones entre todas las variables y terminan con una serie de cargas fac
toriales, as como tambin otros datos, tales como la cantidad de varianza, del total de variacin
entre las variables, que son explicadas por cada factor. En realidad existen varios mtodos, de al
gn modo diferentes, para realizar un anlisis factorial; as, el investigador cuenta con cierta li-
Tabia 17-6,
C argas fa ctoriales de tem s de la s cu atro su b -esca ia s ideolgicas*
te m
Integracin cultural 5
Integracin cultural 4
Integracin cultural 6
Integracin cultural 7
Integracin cultural 2
Integracin cultural 3
Integracin cultural 1
Integracin cultural 9
Integracin cultural 8
Hum anista 7
Hum anista 1
Hum anista
Hum anista 2
Hum anista 8
H um anista 4
Hum anista 5
Hum anista 3
Hum anista 9
M inora 8
M inora 3
M inora 9
M inora 5
M inora 1
M inora 4
M inora 7
M inora 2
M inora 6
N acionalista 7
N acionalista
N acionalista 1
N acionalista 3
N acionalista 4
N acionalista 5
N acionalista 2
N acionalista 9
N acionalista 8
F a cto r 1
F a c to r 2
0,74
0,7 2
0,5 7
0,42
0,37
0,36
0,33
0,32
0,30
0,41
0,31
0,3 6
0,43
0,35
0,41
0,63
F a c to r 3
F a cto r 4
- 0 ,3 0
0,48
0,41
0 ,6 5
0,6 2
0,5 7
0,5 0
0 ,4 2
0 ,3 8
0,3 7
0,31
0 ,2 2
0 ,3 4
0,31
0,35
- 0 ,4 0
-0 ,3 3
- 0 ,5 4
-0 ,5 1
-0 ,5 0
-0 ,5 1
0,50
-0 ,3 2
-0 ,5 3
- 0 ,4 0
-0 ,5 2
0,72
0,60
0,58
0,50
0,42
0,42
0 ,4 0
0,38
0,33
0 ,3 0
0,70
0,63
0,62
0,54
0 ,5 0
0,45
0 ,4 0
0 ,3 2
0 ,2 8
N ota: slo se enumeran las cargas mayores a 0,30, con excepcin de los tems Humanista 9 y Nacionalista 8. Los valo
res en negrita son los predichos por e l mcbi.
Fuente: Sellers, R. M ., et al. (1997), tab. 1. Inventario mutdimensional de identidad de la raza negra, investigacin
preliminar de confiabilidad y validez de constructos. R e v ista cien tfica d e p s ic o lo g a so c ia l y d e la p e r s o n a lid a d [ J o u r
n a l o f P erso n a lity a n d S o c ia l P s y c h o lo g y ], 7 3 ,8 0 5 -8 1 5 . Copyright, 1997, por la Asociacin Americana de Psicologa.
Reimpreso con autorizacin.
bertad para seleccionar entre una variedad de mtodos, cada uno de los cuales puede dar resulta
dos levemente diferentes.
Sin embargo, la parte ms subjetiva del anlisis factorial reside en el nombre que se le da al
factor. A l leer una publicacin cientfica que inform a acerca de un anlisis factorial, primero de
bera analizarse si el nombre que el investigador da a un factor describe adecuadamente las varia
bles que lo conforman.
...
E n el caso del estudio que acabamos de analizar, Sellers et al. tambin realizaron varios an
lisis factoriales como parte del desarrollo de su medida de identidad de la raza negra. L a tabla
17-6 indica resultados de un anlisis factorial de los tems de sus cuatro escalas ideolgicas. Los
investigadores describen el anlisis de la siguiente forma:
La tabla [17-6] presenta la solucin con cuatro factores del anlisis factorial de las sub-escalas
ideolgicas. Debido al modo en el que se realizaron las operaciones con la escala ideolgica,
planteamos la hiptesis de que cada sub-escala ideolgica se agrupara como un factor nico, pero
que podra haber cierta superposicin en la solucin final y las cargas seran moderadas [...] Para
ser coherentes, y como mtodo para reducir los tems, se conservaron las nueve cargas superiores
de cada sub-escala. Todas las cargas resultantes, excepto dos, fueron superiores a 0,30, ubicndo
se la mayora en un rango moderado (de 0,40 a 0,65). En muchos casos, los tems presentaban car
gas en dos factores, pero la serie de factores de la solucin final tena cargas adecuadas para cada
uno de los tems de la sub-escala. Los cuatro factores explicaban aproximadamente el 56% de la .
varianza. En unos pocos casos, tems que tenan cargas adecuadas en los factores de forma cohe
rente con nuestro modelo presentaban, en efecto, una carga ms alta en otro factor (p. ej. integra
cin cultural 7, integracin cultural 8). E l anlisis de los contenidos del tem sugiere que esos
tems representan actitudes polticas coherentes con nuestra teora acerca de las dos ideologas y,
probablemente, presenten cargas altas en ambos factores en estudios subsiguientes (pp. 809-810).
MODELO CAUSAL
>
_________________________ ________________
En el caso de las tcnicas de modelo causal, al igual que en el anlisis factorial, el investigador ha
probado a una cantidad de personas segn una cantidad de variables, pero a diferencia del anlisis
factorial, el objetivo de las tcnicas de modelo causal es analizar si el patrn de correlaciones en
tre las variables se ajusta a la teora previa del investigador con respecto a qu variables son la
causa de cules otras.
Las tcnicas de modelo causal son ampliamente utilizadas en psicologa. Primero presentare
mos el mtodo antiguo del anlisis de senderos y, despus, pasaremos al mtodo ms moderno y
ms elaborado de modelo de ecuacin estructural. 7
Anlisis de senderos
En el an lisis de senderos, el investigador crea un diagrama con flechas que conectan las varia
bles. La s flechas o senderos indican las conexiones causa-efecto entre las'variables segn la teo
ra del investigador. Despus, el investigador calcula coeficientes de senderos para cada uno de
los senderos. E l coeficiente de senderos es sim ilar a beta en la regresin m ltiple: ndica en qu
medida un cambio en la variable al comienzo de la flecha se relaciona con un cambio en la varia
ble al final de la flecha. (E l coeficiente se calcula de forma tal que excluye la influencia de cual
quier otra variable que tenga flechas hacia la variable ubicada al final de la misma flecha).
Analicem os el siguiente ejemplo: M acKinnon-Lew is y sus colegas (1997) realizaron un estu
dio examinando las variables de prediccin de la aceptacin social, por parte de sus pares, de ni
os de 8 a 10 aos de edad. La s principales variables de prediccin que utilizaron fueron las
calificaciones de los nios en cuanto a la aceptacin o al rechazo de sus padres, las calificaciones
de los pares en cuanto a aceptacin y agresin, y los conflictos con hermanos segn se observaron
en una interaccin experimental. Probaron varios modelos causales diferentes y llegaron a la con
clusin de que el ms apropiado era el que llamaron modelo 1 .
Figura 17-1.
Modelo de senderos de asociaciones entre variables de paternidad y maternidad, agresin entre hermanos,
agresin entre pares y aceptacin social. Se indican los coeficientes de senderos estandarizados.
* * p < 0 ,0 1 ; * * * p < 0 ,0 0 1 .
[Fuente: MacKinnon-Lewis, C Starnes, R., Volling, B., & Johnson, S. (1997), ftg. 1. "Percepciones de la paternidad y
maternidad com o variables de prediccin de las relaciones entre los nios y sus hermanos o pares. P s ic o lo g a d e D e sa
rro llo [D e v elo p m en ta l P sych ology] 3 3,1024-1031. Copyright, 1997, por la Asociacin Americana de Psicologa. Reim
preso con autorizacin].
slo lo que tienen en comn entre s. L a idea es que lo que tienen en comn es el verdadero valor con
respecto a aqullo de lo cual todas reflejan una parte. (Una variable latente es, en realidad, sim ilar a
un factor en el anlisis factorial, en el sentido de que el factor no se mide directamente sino que repre
senta una combinacin ponderada de las diferentes variables que lo componen).
Tal como lo indica el ejemplo de la figura 17-2, en el diagrama de senderos de un modelo de
ecuacin estructural las variables que realmente se miden por lo general se representan en cuadra
dos o rectngulos, y las variables latentes en crculos u valos. Cabe destacar que en la figura las
flechas van desde las variables latentes (las que se encuentran dentro de los crculos) hacia las va
riables medidas (aquellas dentro de los recuadros), para reflejar ia idea de que la variable latente
es la causa im plcita de las variables medidas, siendo estas ltim as la m ejor forma posible de me
dir la verdadera variable latente.
Tambin es importante observar que todas las otras flechas conectan variables latentes. En la
m ayora de los casos, el modelo de ecuacin estructural funciona de la siguiente manera: las va
riables medidas se utilizan para suplir las variables latentes, y el anlisis se concentra en las rela
ciones causales (los senderos) entre estas ltimas. (Finalmente, con respecto a las pequeas flechas,
que parecen no provenir de ningn lado, diremos que reflejan la existencia de cierto error (otras
causas que no foeron medidas) que tambin afecta a variable. Son flechas de error71o alteracin
que generalmente se omiten en las publicaciones cientficas para que la figura resulte ms simple,
pero que de todos modos estn im plcitas).
Figura 17-2.
Diagrama de senderos de
un modelo de ecuacin estructural
F ig u r a 1 7 -3 .
M o d e lo fin al d e la e sc a la d e a u to co n cep to .
194, en e l c a s o d e la m u estra d e H o n g K on g y N = 184, en e l
d e la m uestra de E stados U n id o s, L as e lip se s representan con stru ctos latentes; lo s r ectan gu litos representan
in d icad ores; las fle c h a s qu e van d esd e lo s constructos latentes h a c ia lo s in d icad ores d e scrib en cargas fa cto
riales, y las fle c h a s qu e relacion an co n stru cto s latentes entre s representan c o e fic ie n te s d e sen d eros. S e in
d ica n lo s c o e fic ie n te s d e sen d ero s estandarizados y s e om itieron las cargas factoriales y lo s errores de
m e d ic i n para qu e e l diagram a resulte m s claro. L os n m eros entre parn tesis so n lo s c o e fic ie n te s corres
p o n d ien tes a la m uestra d e e e .u u ., y lo s nm eros que no estn entre p arntesis son lo s c o e fic ie n te s d e la
m uestra d e H o n g K on g. T odos e sto s c o e fic ie n te s resultaron sig n ifica tiv o s a p < 0 ,0 5 m enor. [F u en te:
K w an, V. S ., B o n d , M . H ., & S in g e lis ,T . M . (1 9 9 7 ), fig. 1. E x p lic a c io n e s pan cu lturales d e sa tisfa c c i n con
resp ecto a la v id a en general: agregan d o la arm ona en las rela cio n es a la au to estim a , R e v is ta C ien tfica d e
P s ic o lo g a S o c ia l y d e la P erso n a lid a d (Jou rn al o f P erso n a lity a n d S o c ia l P sych o lo g y), 7 3 , 1 0 3 8 -1 0 5 1 . C opyright,
1 9 97, por la A so c ia c i n A m erican a d e P sic o lo g a . R eim p reso c o n autorizacin.]
Otras alternativas podran disponer las flechas en las direcciones contrarias o realizando co
nexiones diferentes, o bien, el patrn podra in cluir variables adicionales que no aparecen en el
diagrama original. Por lo tanto, todo tipo de modelo causal indica, en el mejor de los casos, que
los datos son coherentes con la teora, pero los m ism os datos podran tambin ser coherentes con
teoras bastante diferentes. Lo ideal sera que el investigador pruebe diseos alternativos y pueda
demostrar que los datos no concuerdan adecuadamente con ellos, pero que. al mismo tiempo,
siempre pueden existir alternativas que el investigador ni siquiera haya pensado.
Adem s, el modelo causal, y todas aquellas tcnicas que hemos estudiado hasta ahora y que
dependen bsicamente de las correlaciones, estn sujetas a las precauciones que sealamos en los
captulos 3 y 4. L a ms importante de esas precauciones es la que acabamos de recalcar: la asocia
cin no demuestra direccin de causalidad; es ms, estas tcnicas slo tienen en cuenta en forma
directa las relaciones lineales. Finalm ente, si existe alguna restriccin del recorrido, los resulta
dos se distorsionan (generalmente tienden a arrojar menores coeficientes de senderos).
Por lo tanto, no debemos dejarnos arrollar por la sofisticacin matemtica de una tcnica tal
como el modelo de variable latente. E s verdad que la tcnica resulta til, a veces hasta m aravi
llosam ente til, pero tambin es cierto que, si no se ha realizado una asignacin aleatoria a los
grupos, la direccin causa y efecto contina siendo ambigua. S i las relaciones im plcitas son
curvilneas o existen otras lim itaciones, tales como la restriccin del recorrido, por lo general es
incluso ms probable obtener resultados engaosos con los procedimientos ms sofisticados que
con las sim ples correlaciones bvariadas.
ANLISIS DE COVARIANZA
Hasta este punto del captulo hemos analizado procedimientos estadsticos que hacen hincapi en
las asociaciones entre variables, los cuales son bsicamente elaboraciones sofisticadas de la co
rrelacin y la regresin. Ahora nos dedicaremos a los procedimientos que se basan en las diferen
cias entre las medias grupales, y que son esencialm ente elaboraciones del anlisis de varanza.
Entre los anlisis mencionados anteriormente, una de las elaboraciones ms ampliamente uti
lizadas es el a n c o va . En este anlisis, el investigador realiza un anlisis de varanza comn, pero
antes ajusta las variables de modo de librarse del efecto de algunas variables adicionales no de
seadas. E s decir, el a n c o v a es al anlisis de varanza lo que la correlacin parcial es a la correla
cin ordinaria. L a variable controlada o excluida se denomina covariable. E l resto de los
resultados se interpretan como cualquier otro anlisis de varanza.
Analicem os un ejemplo. Capaldi y Patterson (1991) realizaron un estudio acerca de la adap
tacin de nios al colegio primario, comparando la adaptacin de nios que, desde su nacimiento,
haban experimentado diferentes niveles de transiciones paternas. Lo s diferentes niveles de
transicin paterna eran los siguientes: ausencia de transicin, prdida del padre, nuevo padrastro
y dos o ms padrastros nuevos. Los autores informan, un a n o v a mostr que existan diferencias
significativas entre los grupos de transicin, F(3 ,1 7 0 ) = 7,53, p < 0,001. (E l patrn formado por
las medias de los cuatro niveles coincida con lo predicho en cuanto a que, a mayores transiciones
paternas, ms insatisfactoria era la adaptacin del nio).
Sin embargo, los investigadores eran conscientes de que las fam ilias de los nios que forma
ban los cuatro niveles de transicin pertenecan a diferentes s s e (situaciones socio-econm icas) y
tenan diferentes niveles de ingreso. Podran estas .diferencias, y no las diferencias en cuanto a
niveles de transicin, ser la causa im plcita de las diferencias de adaptacin?
D e sp u s, prob am os la h ip te sis d e que la s d iferen cias entre lo s grupos d e transicin eran funda
m en ta lm en te una fu n c i n d e las diferencias d e sse e in g r e so s. Para probar e sa p resu n cin s e reali
z un anova c o n la s covariab les de sse e in g reso per cpita. La d ifer e n c ia en tre lo s grupos d e
transicin co n tin u sien d o sig n ifica tiv a ,
F(5 ,1 6 7 ) = 4 ,0 , p <0 ,0 1
(p p. 4 9 2 -4 9 3 ).
(E l patrn de medias fue el mismo en este anlisis que en el original). Aunque ellos no utilizaroh
el trmino especfico, un a n o v a con covariables es un anfisis de covarianza.
y d e in tim id a d c o n
y u n ivariado
T a b la 1 7 -7 .
Medias y desvos estndar de los indicadores de constructo segn el tipo de relacin con el confidente.
Amigo (1)
In d ica d o res d e co n stru cto
R espaldo observado en el confidente
Interpersonal
Afabilidad
E m ocional
A sp ecto s negativos d el confidente
Irritabilidad segn
el propio inform e
Irritabilidad segn
el inform e de intimidad
D epresin
Intimidad de a relacin
Intim idad segn
ei inform e de la madre
Intim idad segn
e l inform e del confidente
Com plejidad segn
inform e de la madre
Com plejidad segn
inform e del confidente
Familiar (2)
SD
3,3 4
3,39
1,04
0,67
0 ,8 6
0 ,3 6
3 ,3 5
3 ,2 4
0 ,9 6
1,91
0 ,8 4
1,36
1,06
SD
Pareja (3)
C o n tr a s te s
s ig n ifica tiv o s
SD
0,63
0,94
0,37
2 ,9 2
2,68
0 ,6 9
1,21
5,93**
6,58**
0,35
12,17***
1,70
0,70
2,25
0,65
5,27**
0 ,5 0
0 ,3 2
1,33
0,93
0,35
0,36
1,48
0,95
0 ,4 0
0,34
1,65
2,02
3,18
0,73
3,1 9
0,75
3,65
0,58
5,94**
3 >1,2
3,05
0 ,7 8
3,29
0,69
3,48
0,64
4,62**
3 > 1
1,91
0,8 4
2,2 9
0,74
2,87
0,33
22,5 2 * * *
3 > 1 ,2
2,01
0,74
2,19
0,75
2,73
0,55.
13,36***
3 > 1 ,2
0,65
F ( 2 ,135)
1,2 > 3
, 2 > 3
1,2>3
3 >2
N ota: rts = 6 5 ,3 3 y 40 para cada tipo de relacin, es decir, amigos, familiares y parejas respectivamente.
DeGarm o y Forgatch debatieron despus los resultados del anlisis de varianza univariado y los
contrastes subsiguientes. Por ejem plo, observaron que el anlisis de varianza mostr un patrn
segn ei cual se observaba que las parejas proporcionaban menor respaldo (p. 340).
Tabla 17-8,
Principales tcnicas estadsticas.
A so c ia c i n
0
d iferen cia
C a n tid a d de
V ariables
in d ep en d ien tes
C a n tid ad de
V ariables
d ep en d ien tes
S e co n tr o la
a lgu n a
variab le?
A sociacin
No
Correlacin/regresin
bivaribles
A sociacin
Cualquiera
No
R egresin m ltiple
(in cluso la regresin
jerrquica y gradual)
A sociacin
Si
C orrelacin parcial
A so cia ci n
M uchas, no diferenciadas
A so cia ci n
No
N om bre de
la t c n ic a
C o eficien te de coafiabilidad
A nlisis factorial
A nlisis de senderos
D iseo de ecuacin
A n lisis d e covarianza
en sentido nico; prueba t
D iferencia
No
D iferencia
Cualquiera
No
D iferen cia
Cualquiera
Si
A nlisis de covarianza
D iferen cia
Cualquiera
Cualquiera
No
A nlisis de covarianza
m ultivariable
D iferencia
Cualquiera
Cualquiera
Si
A nlisis de covarianza
A nlisis d e covarianza
CONTROVERSIA:
DEBERA SER CONTROVERTIDA LA ESTADSTICA?____________________
L a m ayora de los libros de estadstica, incluso ste, ensean mtodos estadsticos de un modo
bastante estereotipado, casi como impartiendo una verdad absoluta. Sin embargo, a medida que
avanzamos, tambin hemos intentado m ezclat esa prolija imagen con nuestras exposiciones
acerca de las distintas controversias. Usualm ente, se considera que esto resulta confuso para los
alumnos, (Aunque cuando esos alumnos aprendieron otras reas de la psicologa, la compren
sin de las mismas se construy, eso esperamos, a partir de la presentacin de controversias: la
investigacin de tal persona demostr tal cosa, pero el estudio realizado por esta otra persona
mostr una im perfeccin en la investigacin anterior, mientras que el estudiante de la primera
demostr que era una excepcin, y as sucesivam ente). Por lo tanto, en esta ltim a seccin de
controversias intentaremos crear an ms confusin.
En el cuadro 17-1 describimos el desarrollo histrico de la estadstica actual, a partir de un h
brido de dos visiones diferentes conocidas como los mtodos de Fisher y de Neyman-Pearson. Se
supona que ese matrimonio pondra fin a la lucha con respecto a cul es el mtodo ms adecuado,
pero de hecho, aunque la mayora de los psiclogos se sienten conformes con el hbrido, otros, ta
les como Gigerenzer y sus socios (Gigerenzer & Murray, 1987; Gigerenzer et al. 1989; Sedlm eier
& Gigerenzer, 1989), no estn para nada satisfechos. Tampoco lo estn Jacob Cohn (1990) ni
Robert Rosenthal (p. e j. Rosnow & Rosenthal, 1989b), dos psiclogos muy conocidos por sus con
tribuciones a las tcnicas estadsticas y cuyos trabajos sobre temas tales como potencia, tamao de
efecto, hiptesis nula, meta-anlisis y otros hemos mencionado a lo largo de todo el libro.
Gigerenzer y M urray (1987) sostienen que los puntos de vista de Fisher y de Pearson y
Neyman, los cuales para estos mismos estadsticos de la prim era hora siem pre fueron funda
mentalmente contradictorios, han sido m al interpretados y errneamente empleados al com bi
narlos, E l matrimonio se realiz enteramente por conveniencia, pensando muy poco en los efectos
a largo plazo. Gigerenzer y M urray consideran al hbrido como el resultado de que muchos de los
primeros textos de estadstica hayan sido escritos bajo la influencia del dgmatico y persuasivo
S ir Ronald Fisher (cabe recordar el cuadro 11-1). Pero luego, despus de la Segunda Guerra Mun
dial, se conoci la visin de Pearson-Neyman, y tuvo que ser integrada sin admitir que los textos
originales podan haber estado equivocados. (E l deseo era presentar la psicologa como una cien
cia, con base en un mtodo de toma de decisiones unificado, mecnico y sin defectos).
E l resultado de todo ese proceso, afirman Gigerenzer y M urray, es el abandono de la contro
versia y los mtodos alternativos, al igual que textos sobre estadstica repletos de confusin
conceptual, ambigedad y errores (p. 23). M s an, ellos sostienen que estos mtodos estads
ticos dominantes, que originalmente fueron slo herramientas, actualmente definen el modo en
que los psiclogos consideran la propia percepcin y cognicin humanas (cabe recordar los cua
dros 12-1 y 13-1).
En lneas ms generales, los actuales e intensos debates sobre pruebas de significacin que
tratamos en los captulos 6 a 8 son parte de esta tendencia m ayor de reapertura de controversias
por mucho tiempo olvidadas.
Por ltim o, nos resta decir que la m ayora de los psiclogos y estadsticos se sienten bastan
te cmodos con los mtodos transmitidos por los textos actuales. E l tiempo, y un cuidadoso ra
zonamiento, nos dirn si esa m ayora realmente debera sentirse tan satisfecha; pero nadie lo
har por nosotros sino que tendremos que hacerlo juntos. Por lo tanto, sinceramente deseamos
que', una vez que el alumno domine los mtodos contenidos en este libro, tenga la confianza su
ficiente para ir ms all y no se conforme con continuar aplicando dentro de veinte aos estos
mismos mtodos de forma insensata y mecnica. Aquellos psiclogos que leen o realizan inves
tigaciones, cualesquiera sean sus otros intereses, tambin deben ser buenos ciudadanos dentro'
de la disciplina en general. Deben acompaar, aunque sea un poco, los desarrollos en cuanto a
los mtodos de anlisis de datos, aceptando, e incluso exigiendo, cam bios cuando sean ju stifica
dos. Despus de todo, si nuestras herramientas se tornan anticuadas, qu esperanza queda para
nuestros descubrim ientos?
(
sidad,:en Londres. E n 1925, el joven Egon -,
' : Qu se discuta? Para sim p lificar una
form una amistad, perdurable con Jerzy
serie de ideas m uy com plejas, diremos que
Neyman, un joven catedrtico de la Univer
' Fisher haba rechazado lo que se denomina
sidad de Varsovia que acababa de llegar al. ; la teora bayesiana, un enfoque global soLaboratorio Galton. En los aos siguientes,
, br la estadstica que hemos mencionado en
los dos trabajaran muy estrechamente; /
v;' -;/-;
' ^ el capitul 5, el cual sostiene que la inves- ''1
E n 1933, Karl-Pearson se retir..Irni
ligacin cientfica se realiza para adaptar
camente, Fisher recibi el antiguo puesto
opiniones preexistentes en vista de las nue- '
de Pearson como jefe del Departamento de
vas evidencias a medida que se recolectan,
Eugenesia, originalmente fundado por G al
' E n desacuerdo, Fisher sostena que la infe- ;
ton. Como resultado d la enemistad entre
renca inductiva se realiza principalm ente ,'
Fisher y su colega de mayor edad, Pearson, .
desaprobando objetivamente la hiptesis
se cre un nuevo Departamento de Estads- : nula, y no probando probabilidades previas
tica que estara al mando de Egon, el hijo
. a las que se haba arrivado subjetivamente.
sos sern particularmente tiles para ios alumnos que tengan intenciones de realizar un posgrado
en psicologa, en donde la estadstica ser una herramienta crucial en todas las investigaciones
que realicen. Cursos de ese tipo los ayudarn a prepararse para el posgrado. Adem s, un buen de
sempeo en ese tipo de cursos produce una im presin extremadamente bugna en aquellos que
evalan las solicitudes de ingreso a los mejores programas para graduados. (Tambin podemos
decir que, segn nuestra experiencia, lo ms probable es que el alumno disfrute con los otros estu
diantes que conozcan en esos cursos. Lo s alumnos que asisten a cursos intermedios de estadstica
aplicada a la psicologa no son todos fenmenos de las estadsticas, pero casi siem pre son alum
nos m uy motivados y brillantes que seguramente compartirn los objetivos del lector). D e hecho,
a algunas personas, la estadstica le resulta tan fascinante ;que deciden hacer de ella una carrera!
E n lneas ms generales, constantemente se estn inventando nuevos mtodos estadsticos.
Todos los psiclogos encuentran en las publicaciones cientficas que leen nmeros y smbolos
que no le son fam iliares; pero finalmente los resuelven del mismo modo que lo har el lector. Y
tenemos plena confianza en ello debido a que ha llegado ileso y bien preparado a las tlimas pgi
nas de este libro. Ha dominado la introduccin detallada de un tema com plejo; por ello, debera
confiar en que con un poco de tiempo y esmero ser capaz de comprender cualquier otro tema de
estadstica ms avanzado. Por eso queremos felicitar al lector por sus logros.
Resumen
En la regresin mltiple jerrquica, las variables de prediccin se incluyen en la regla de predic
cin en forma planificada y secuencial, permitiendo al investigador determinar la contribucin re
lativa de cada variable siguiente por encim a de aquellas ya incluidas. L a regresin m ltiple por
pasos es un procedimiento de exploracin en el que se examinan las potenciales variables de pre
diccin para encontrar la mejor variable de prediccin; luego se examinan las variables restantes
para encontrar la variable de prediccin que, en combinacin con la prim era, produce la m ejor
prediccin. E l proceso contina hasta que agregar la m ejor variable restante no aporta ninguna
mejora significativa.
L a correlacin parcial describe el grado de correlacin entre dos variables a la vez, que man
tiene constante otra u otras variables.
L o s coeficientes de confiabilidad indican en qu medida las puntuaciones de una prueba son
internamente coherentes (usualmente con el alfa de Cronbach) o coherentes a travs del tiempo
(confiabilidad por prueba y reprueba).
E l anlisis factorial identifica agrupaciones de variables que se correlacionan en el mximo
grado posible entre s, y en el mnimo grado posible con otras variables.
E l anlisis causal examina si las correlaciones entre diversas variables son coherentes con un
patrn sistem tico e hipottico de relaciones causales entre ellas. E l anlisis de senderos describe
esas relaciones con flechas que van desde la causa al efecto, con un coeficiente de senderos para
cada flecha que indica la influencia de la hipottica variable causal en la hipottica variable de
efecto. E l modelo de ecuacin estructural es una versin avanzada del anlisis de senderos, que
incluye variables latentes tericas que no son medidas (cada una de las cuales est formada por
los elementos comunes de diversas variables m edidas). E l modelo tambin ofrece medidas de la
concordancia general de los datos con el patrn causal hipottico.
E l an lisis de covarianza es un an lisis de varianza que controla una o ms variables. E l
an lisis de varianza m ultivariado es un an lisis de varianza con dos o ms variables depen
dientes. E l an lisis de covarianza m ultivariado es un an lisis de covarianza con dos o ms va
riables dependientes.
E n los ltimos aos, los psiclogos han comenzado a reexam inar ios principios bsicos de la esta
dstica que utilizam os creando la posibilidad de controversia acerca de aquello que, con frecuen
cia, haba sido considerado incontrovertible en el pasado.
E n general, es posible captar la idea principal de un procedimiento estadstico no fam iliar te
niendo presente que probablemente se refiere a asociaciones entre variables o diferencias entre
grupos, que el valor p indica la significacin de esa asociacin o diferencia, y que probablemente
el procedimiento incluya algunos nmeros a partir de los cuales podamos tener una idea del grado
de asociacin o diferencia,
Trminos clave
- ANCOVA..
- Controlar.
- Covariable.
- A lfa de Cronbach (a ).
~ Factor.
- A nlisis factorial.
- Carga factorial.
~ ndice de concordancia.
- Regresin mltiple
jerrquica.
- Mantener constante.
-V a riab le latente.
- L isre l.
- MANCOVA.
- MANOVA.
- Estadstica multivariada.
- Correlacin parcial.
- Coeficiente de
correlacin parcial.
- Exclu ir.
-A n lis is de senderos.
- Coeficiente de senderos.
- Confiabilidad.
- Confiabilidad por
divisin en mitades.
- Regresin m ltiple gradual.
- Modelo de ecuacin
estructural.
~ Confiabiidad por
prueba y reprueba.
Ejercicios
vida social de nios en edad preescolar. En el
estudio, cada nio o nia era observado inte
ractuando con su padre en una situacin es
tandarizada. L a s interacciones se clasificaban
de forma tal que producan m edidas sobre
quin in iciab a las actividades de juego ade
ms de la reciprocidad (equilibrio) en el cum
plim iento de la in iciativa de juego del otro.
Lo s investigadores tambin pidieron a los m aes
tros del nio que calificaran la capacidad de
cada nio para integrarse a la vida social con
los otros nios de la ecuela. Descubrieron co
rrelaciones entre la reciprocidad padre-hijo y
la capacidad del nio para integrarse a la vida
SERIE I
so cial. Sin embargo, es preocupaba saber
qu punto la medida de reciprocidad po
1.
Parte de un estudio realizado por Lin hasta
dzey et al, (1997) examinaba de qu modo la dra estar m ezclada con el grado en el que los
reciprocidad en la interaccin entre padre e nios y los padres tomaban la in iciativa indi
hijo predeca la capacidad de integrarse a la vidualmente.
Tabla 17-9.
Cargas factoriales del anlisis de los componentes principales de los sntomas de rao,
segn el d s m - i v , en 74 refugiados vietnamitas.
Carga
Dimensin sintomtica
-i
Factorial
Ansiedad
Pesadillas recurrentes
0,79
0,78
Irritabilidad/ataques de ira
Incapacidad a recordar partes de lo s h echos m s traumticos
0,77
0 ,7 4
Problem as de in som io
0,73
OJO
0,67
% de varianza explicada
44%
Evasin/abstinencia
Incapacidad a sentir em ociones
0,79
0 ,7 0
0,65
% de varianza explicada
0,51
0,51
24%
R epeticin de la experiencia
Pensam ientos o recuerdos recurrentes de lo s hechos ms terribles
0,83
0,83
% d e varianza explicada
% de varianza justificada
0,57
22%
0,71
11%
Fuente: Fawzi, M . C. S., et al. (1997), tab. 1. Validez del estrs postraumtico entre refugiados vietnamitas. R ev ista
C ien tfica d e Estrs T raum tico [J o u rn a l o fT ra u m a tic Stress}, 10,105. Copyright, 1997, por la Sociedad Internacional
de Estudios del Estrs Traumtico. Reimpreso con autorizacin.
Figura 17-4.
[Figura 2 de Aron et al.
(en impresin),
M otivaciones para el
amor no correspondido
B o le tn d e P s ic o lo g a
s o c ia l y d e la p e r s o n a lid a d . [P e r s o n a lity a n d
S o c ia l P s y c h o lo g y B u l
letin. ]
ISlilllI
:lS:llIfilI
SERIE H
te r e s a d o s e n sa b e r s i la r e la c i n e n tr e la e s
c a la
pas
y d iv e r sa s s e n s ib ilid a d e s e s p e c f ic a s
1.
Aron & Aron (1997) realizaron un estu
p e r m a n e c e r a a u n d e s p u s d e c o n t r o la r la
dio concentrndose en las personas altamente
e m o c i o n a l i d a d e n g e n e r a l^ y a d e m s s i la r e
sensibles a la estimulacin. Los individuos l a c i n d e l a e m o c i o n a l i d a d c o n r e a c c i o n e s
mencionados tienden a descubrir sutilezas y e m o c i o n a l e s e s p e c f i c a s p e r m a n e c e r a d e s
notar cosas que otros pasan por alto, por lo p u s d e c o n t r o l a r l a s e n s i b i l i d a d .
cual puede encontrrselos en mayor medida
Como lo indica la tabla [17-11], la ma
entre los artistas y otros tipos de personas yora de las correlaciones entre las variables
talentosas. Por otro lado, esa misma sensibi relacionadas con la sensibilidad y la escala
lidad hace que estos individuos sufran, con p a s continuaron siendo significativas o casims facilidad, de exceso de ansiedad. Lo que significativas despus de excluir la medida
para las personas en general es un nivel nor de emocionalidad [,..] Adems [...] diver
mal de estimulacin, con frecuendia resulta sas variables pertinentes (p. ej. sentimien
estresante para los individuos altamente sen tos emergentes) presentaban asociaciones
sibles. Aparentemente, como resultado de lo nicas o exclusivas con la emocionalildad)
anterior, algunas p a s presentan niveles de (p. 354).
emocionalidad (angustia y depresin) ms
Explique el mtodo y el resultado desaltos que lo usual. Como parte del estudio en criptos anteriormente a una persona que est
cuestin, los investigadores deseaban inves familiarizada con la correlacin y, en forma
tigar si la sensibilidad era independiente de general, con la regresin mltiple comn,
la emocionalidad. Por lo tanto, hicieron que pero que nunca ha odo hablar de la correla
un gran grupo de participantes completara cin parcial.
cuestionarios acerca de sensibilidad y emo
2.
Shapiro et al. (1997) realizaron un estu
cionalidad, junto con una serie de preguntas dio para desarrollar una medida de las actitudes
sobre diversas sensibilidades especficas y de los nios hacia las armas y la violencia. La
reacciones emocionales tambin especficas. primera medida que desarrollaron tema 61
Los investigadores estaban especialmente in tems, e informaron que ios anlisis que realiTabla 17-10.
IP
2 ,0 9
2 ,7 2
6,07
4 ,7 0
3,05
Canadienses
IG
IP
IG
1,50
3 ,1 6
6,11
4,77
4 ,9 0
1,35
3,43
5 ,5 6
4,87
5,20
1,61
2,71
5 ,6 4
5,13
5,42
N ota: Un asterisco {*) ndica que las medias de ta cultura por tipo de interaccin conflictiva en cuanto a determinado
mtodo fueron significativas al nivel p < 0,05. A mayor nmero, mayor la preferencia por el mtodo. p (Interpersonal
Conflict, Conflicto Interpersonal); IG ( Intergrupal Conflict, Conflicto intergrupal).
Fuente: Gire, J. T. (1997), tab. i. El efecto variante de! individualismo-colectivismo con respecto a los mtodos prefe
ridos para la resolucin de conflictos. Revista Cientfica Canadiense de la Ciencia del Comportamiento [Canadian
Journal ofBehavioural ScienceJ, 2 9 ,3 8 -4 3 . Copyright, 1997, por la Asociacin Canadiense de Psicologa. Reimpreso
con autorizacin.
Tabla 17-11.
Correlaciones y correlaciones parciales de la sensibilidad y la emocionalidad con variables relacio
nadas con la sensibilidad. Estudios 2-4.
Correlaciones parciales
Escala pas
V ariab le
Emocionalidad
E studio 2
L lora co n facilidad
Sensibilidad
a la luz del da
Sensibilidad al alcohol
Prefiere la m sica
country en v iv o
Las pelculas lo afectan
al da siguiente
Intensidad en el amor
Sentim entos em ergentes a
Recuerda los sueos*3
Su e os intensos*3
T iem po en soledad*3
Estudio 3
Llora con facilidad
Prefiere la m sica
country en vivo
Las p elculas lo afectan
a! da siguiente
Intensidad en e l amor
E studio 4
Prefiere la m sica
country en vivo
Su e os intensos
0,24**
0 ,36**
0 ,38**
0,21**
0,32**
0,39**
0 ,26**
0 ,1 8 **
0 ,25**
0,36**
0 ,1 1 *
-0 ,0 3
0,22**
0,08
0,22**
- 0 ,0 4
0 ,31**
0 ,26**
0,2 8 * *
0 ,19*
0,19*
0 ,22*
0 ,23**
0 ,3 0 **
0 ,3 0 * *
0,03
0,08
0,07
0 ,23**
0,14*
0,18**
0 ,2 0 f
0 ,l8 f
0 ,1 7 f
0 ,1 0 f
0 ,1 9 * *
0,17**
-v 0 8
- 0 ,0 3
-0 ,0 5
0,4 7 * *
0,4 6 **
0,27**
0 ,2 6 * *
0,15*
0 ,1 0 f
0 ,llf
0,3 0 * *
0,2 3 * *
0 ,1 7 * *
0 ,1 6 * *
0,1 l t
0,17**
0 ,0 8
0,03
0 ,09*
0,1 9 * *
0 ,0 7
0 ,0 5
0 ,0 7
0 ,1 8 * *
0,03
-0 ,0 3
- 0 ,0 0
N ota: e l estudio 2 incluy 313 alumnos de la Universidad de California, Santa Cruz; el estudio 3 incluy datos de 285
alumnos universitarios norteamericanos no graduados: el estudio 4 incluy datos tomados de 301 personas a travs de
una encuesta telefnica pblica de discado aleatorio, pas = Persona altamente sensible.
a El tem as sealado (Le surgen sentimientos muy intensos sin razn aparente?} fue contestado slo por 211 partici
pantes.
b Los tems as sealados fueron completados slo por 1Q7 participantes.
*p < 0,05; * * p < 0 ,0 1 ; t p < 0 ,1 0 .
Fuente: Aron, E. N ., & Aron, A. (1997), tab. 3. "Sensibilidad del proceso sensorial y su relacin con la introversin y la
emocionalidad. Revista Cientfica de Psicologa Social y de la Personalidad [Journal of Personality and Social Psychology), Ti, 34 5 -3 6 8 . Copyright, 1997, por la A sociacin Americana de Psicologa. Reimpreso con autorizacin.
Tabla 17-12
Cargas factoriales de la medida de comportamiento social evaluado por maestros ( p s b s - t ) .
tem
L e inform a a un com paero
que no jugar con l
ni ser su am igo a m enos que haga
lo
que l le pide
Ordena a otros que no jueguen
con algn com paero o que no sean sus am igos
Cuando se enoja con un com paero,
e l nio hace que ese com paero no pueda
estar con el grupo de am igos de ju eg o s
A m enaza a un com paero o compaera
dicind ole que no ser invitado/a
a las fiestas de cum pleaos
a m enos que haga lo que l quiere
Intenta que otros sientan antipata
por un com paero
A m enza verbalm ente con dejar
a un com paero fuera del grupo
de am igos de ju eg o s si e se
com paero no hace lo que e l nio pide
Patea o g o lp ea a otros
A m enaza verbalm ente con pegar
o
golpear a otros nios
Arruina las co sa s d e su s com paeros
cuando est enojado o enojada
S u ele empujar a otros nios
D aa a otros nios pellizcndolos
A m enaza verbalm ente con causar dao fsic o
a un com paero para obtener lo que desea
Sabe compartir y turnarse
Es servicial con sus com paeros
Es amable con sus com paeros
D ice o hace cosas lindas a otros nios
N o se divierte m ucho
Parece triste
Sonre poco
Agresin
a travs de
relaciones
0,84
0,83
0,81
0,88
0,89
0,85
0,81
0,75
0,82
0,72
0,83
0,81
0,76
0,83
0,62
0,75
0,90
0,87
0,82
N ota: Todas las cargas cruzadas eran menores a 0,40. psbs- t (Preschoal Behavoir Scale -Teacherform, Escala de com
portamiento social preescolar, formulario para e l maestro).
Fuente: Crick, N. R., Casas, J. R , & Mosher, M. (1997), tab. 1. Agresin manifiesta a travs de relaciones en e l preescolar". Psicologapara el Desarrollo, Developmental Psychology, 33,579-588. Copyright, 1997, por la A sociacin Am e
ricana de Psicologa. Reimpreso con autorizacin.
Figura 17-5.
Diseo de proceso de apoyo con caractersticas de la madre, del confidente y de la relacin, controlando el
hecho de la formacin de una nueva pareja con un hombre y el cambio en la angustia materna. 03 ~ 3oopor
tunidad; Conf. Confidente. x2(67, N = 138) = 84,82, p = 0,07; ndice de concordancia comparativo =
0,963: *p < 0,05. [Fuente: DeGarmo, D. S., & Forgatch, M. S. (1997), fig. 1. "Determinantes del respaldo
observado en el confidente hacia las madres divorciadas". R evista Cientfica de P sicologa Social y de la
P erso n a lidad [Journal o f Personality an d Social P sych ology }, 72, 336-345. Copyright, 1997, por la Aso
ciacin Americana de Psicologa, Reimpreso con autorizacin]
593
SjiliiiMMIIIl
Repaso de la lgica
y de la term inologa
relacionadas con
la investigacin psicolgica
1Algunas veces se realizan investigaciones con otros fines, tales como explorar relaciones entre varias medidas, deter
minar la incidencia de alguna caracterstica de la poblacin, o desarrollar una medida o tcnica para utilizar en otra
investigacin. Sin embargo, la lgica bsica de la forma usual de investigacin (tema central de este apndice) sirve de
apuntalamiento del modo en que ios psiclogos abordan la mayora de las investigaciones sistemticas.
(el verdadero experimento), la terminologa clave relacionada con l y, por ltimo, nos dedicaremos a cuatro reas clave en las que los estudios se aproximan o no a ese ideal: equivalencia de
participantes entre grupos experimentales, equivalencia de circunstancias entre grupos experi
mentales, legitimidad de la generalizacin y suficiencia de la medicin.
El experimento verdadero
El procedimiento de investigacin que usualmente conduce al menor nivel de ambigedad es el
experimento verdadero. Es el estndar con el que se comparan todos los otros mtodos. Par
tiendo de la hiptesis cambiar e nivel de X provoca un cambio en el valor de Y \ el experimen
to real vara sistemticamente el nivel de X t manteniendo igual todos los dems aspectos, y
observando el efecto en 7. Por ejemplo, supongamos que un investigador est interesado en ave
riguar si el hecho de que haya luces centelleantes en el aula afecta las calificaciones de las perso
nas en una prueba de matemtica, en donde X representa la existencia de luces centelleantes en
el aula e Y las calificaciones en la prueba de matemtica. En un experimento real, se tomara la
prueba a cada alumno de un determinado grupo en un aula con luces centelleantes. A otro grupo
de alumnos, inicialmente idntico, se le tomara la prueba bajo condiciones completamente
idnticas, pero sin la presencia de luces centelleantes en el aula. As, ia nica diferencia entre los
dos grupos sera el nivel de X, es decir, la presencia o ausencia de luces centelleantes en el aula.
Si los alumnos del aula con luces centelleantes obtienen calificaciones menores en la prueba de
matemtica (30- la causa tiene que ser la iluminacin. (Si obtienen mejores calificaciones, tam
bin sera a causa de la iluminacin).
Con frecuencia, los psiclogos utilizan el trmino sujeto. Sin embargo, nosotros utilizamos la palabra partici
pante, aqu y a lo largo de todo el libro.
2
Como ejemplo, imaginemos que un investigador tiene dos latas idnticas de gaseosa. La hi
ptesis que se plantea para este caso es: Al calentar una lata de gaseosa, sta explotar.
(No se debe probar el experimento en casa!). En otras palabras, el aumento de calor causa
r una explosin. El investigador podra poner un fsforo bajo una lata (la lata experimental) y
no ponerlo bajo la otra (la lata control). Si la lata experimental explota y la lata de control no, se
confirma la hiptesis. Cada lata es un participante; el calentamiento es la variable independien
te; la explosin de la lata es la variable dependiente, y las dos latas son las muestras, respectiva
mente, de las poblaciones de todas las latas de gaseosas calentadas y no calentadas (vase
figura A -1).
EQUIVALENCIA DE PARTICIPANTES EN
LOS GRUPOS CONTROL Y EXPERIMENTAL
Comnmente, lo primero que se tiene en cuenta al evaluar si los resultados de un estudio llevan a
conclusiones inequvocas es la equivalencia de participantes en los grupos control y experimen
tal. Por ejemplo, supongamos que no estuviramos seguros de que la capacidad en matemtica de
los miembros del grupo en el aula con las luces centelleantes fuera inicialmente la misma que la
de aquellos en el aula sin luces centelleantes. Por lo tanto, cualquier diferencia en las calificacio-
F ig u ra A -1 .
U n ex p erim en to ideal: se calien ta una de
d o s latas d e g a se o sa id n tica s, y e l in v esti
gad or ob serva si e x p lo ta m ientras que la
otra no lo hace.
nes matemticas entre los dos grupos, al finalizar el estudio, tendra un significado ambiguo. La
diferencia podra ser el resultado de a) la manipulacin de la variable independiente (tener o no
luces centelleante), o bien de b) las diferencias iniciales en cuanto a la capacidad. Para evitar tales
resultados ambiguos, ios investigadores buscan una equivalencia estricta entre los grupos control
y experimental Se emplean cinco estrategias principales; asignacin aleatoria a los grupos, dise
o de grupo control equivalente, diseo de medidas repetidas, diseo de investigacin correlacio
na!, e investigacin de sujeto nico.
Sin embargo, dentro del entorno del laboratorio, se utiliza con frecuencia un diseo de medi
das repetidas, de forma tai que se lo transforma en un experimento reai. Supongamos que un
investigador est interesado en el efecto que causa la iluminacin en el rendimiento de una tarea
complicada. El investigador podra probar el rendimiento de las distintas personas bajo luces bri
llantes (condicin experimental), y luego probar nuevamente el rendimiento de esas personas ba
jo iluminacin normal (condicin de control). Sin embargo, un inconveniente que presenta erte
mtodo es que los participantes podran estar ms familiarizados con la prueba en la segunda
oportunidad en que la realicen, crendose as un efecto de prctica o traspaso; o bien, podran
estar cansados para el momento en el que Ies tocara hacer la segunda prueba, crendose un efecto
de fatiga. Para resolver ese tipo de problemas, los investigadores utilizan un procedimiento deno
minado compensacin, en el cual la mitad de los participantes se prueban primero segn una
condicin, y la otra mitad se prueba primero segn la otra condicin. De ese modo, cualquier
efecto de prctica, traspaso, fatiga o similar se compensa entre las dos condiciones. Lo ideal sera
que la compensacin se emplee de modo que se asigne en forma aleatoria la condicin que un
participante experimentar primero y, en ese caso, el estudio se transforma en un experimento
real. De hecho, debido a que logra un nivel de equivalencia tan importante entre los grupos, e di
seo de medidas repetidas con compensacin y asignacin aleatoria es uno de los mtodos de in
vestigacin ms poderosos que utilizan los psiclogos.
EQUIVALENCIA DE CIRCUNSTANCIAS EN
LOS GRUPOS EXPERIMENTAL V DE CONTROL
El estudio ideal no slo requiere grupos idnticos sino tambin que las circunstancias de prueba
sean idnticas.
En la prctica, es bastante difcil probar dos grupos bajo circunstancias en las que la nica di
ferencia es la manipulacin de la variable independiente. En un laboratorio de fsica es posible lo
grar esa equivalencia, pero al realizar investigaciones con humanos las circunstancias nunca son
equivalentes. Una estrategia diseada para maximizar la equivalencia es utilizar un lugar aislado,
como por ejemplo un compartimiento de un edificio de estudios psicolgicos, minimizando las
influencias externas e interrupciones que podran hacer que una sesin del experimento fuera di-
Tabla A -l.
Ventajas
Desventajas
Experimento verdadero
(asignacin aleatoria
a las condiciones),
Experimento verdadero
de medidas repetidas
(asignacin aleatoria).
Correlaciona!.
Es relativamente fcil de
implementar con grupos intactos.
Sujeto nico.
Permite un conocimiento
acabado de los procesos.
ferente de otra. Un mtodo relacionado con el tema mencionado consiste en estandarizar la situa
cin al mximo; por ejemplo, las instrucciones para los participantes podran estar grabadas.
Sin embargo, con respecto a la equivalencia de circunstancias existen dos inconvenientes es
peciales que condicionan la mayora de las investigaciones de las ciencias sociales, particular
mente la investigacin aplicada: nos referimos a los efectos del experimentador y a los efectos
placebo o Hawthome.
mental de los participantes. En ese caso, es muy probable que el deseo del terapeuta de que el ex
perimento funcione lo predisponga a observar que los participantes en el grupo experimental han
mejorado en mayor medida. Incluso, si un observador independiente clasificara los dos grupos
sabiendo quin forma parte de cada uno, el deseo de que el experimento resulte de determinada
manera podra influir no intencionalmente en las evaluaciones del observador.
La mejor solucin para el inconveniente de se opto se denomina mtodo de prueba a ciegas;
es decir, el experimentador, al momento de interactuar con el participante, no sabe si ste se en
cuentra en el grupo de control o en el experimental,
REPRESENTAT!VIDAD DE LA MUESTRA
El tercer requisito para lograr un estudio ideal es que la muestra de participantes analizados repre
sente adecuadamente la poblacin a la que se supone que se aplica el estudio. Esa representatividad se denomina legitimidad de ia generalizacin o validez externa. (La validez interna se
refiere a las cuestiones relacionadas con la equivalencia de los grupos experimenta! y de control y
a la equivalencia de circunstancias).
La investigacin psicolgica se realiza con frecuencia en alumnos universitarios, y se supone
que lo que se descubre acerca de ellos se aplica a la poblacin ms amplia formada por las perso
nas en general. En un estudio sobre el efecto que producen las luces centelleantes en el desempe
o, el patrn general de resultados con alumnos universitarios probablemente se aplique a casi
todos los otros seres humanos. No obstante, en muchos otros tipos de investigaciones, es suma
mente importante la naturaleza del participante. Por ejemplo, los alumnos universitarios proba
blemente no seran los participantes adecuados en estudios acerca de las actitudes hacia los nios,
ya que la experiencia de los alumnos comnmente no incluye la paternidad o maternidad. En el
mismo sentido, no se puede analizar la capacidad de lectura en escuelas suburbanas y generalizar
los resultados a todos los alumnos en todas las escuelas, o bien examinar la satisfaccin laboral en
la industria informtica y generalizarla a todo tipo de industria.
Otro inconveniente es el modo en que se seleccionan los participantes de un estudio. Por
ejemplo, en una encuesta por correspondencia acerca del conocimiento de un tema, algunos indi
viduos devolvern el cuestionario y otros no. Presumiblemente existen diferencias sistemticas
entre aquellos que lo devuelven y aquellos que no, y es probable que aquellos que s devuelven el
cuestionario tengan ms conocimientos acerca del tema en estudio. Si el investigador utiliza slo
los cuestionarios que fueron devueltos, podra llegar a la conclusin de que las personas tienen
mayores conocimientos acerca de determinado tema que si hubiera podido analizar a toda la po
blacin. De modo similar, las personas que se ofrecen voluntariamente a participar en un experi
mento pueden diferir de aquellas que no lo hacen. Por ejemplo, los voluntarios pueden tener una
personalidad ms sensible a las necesidades ajenas.
El muesfreo aleatorio es considerado el mtodo ptimo para asegurar que una muestra sea
representativa de su poblacin. Muestreo aleatorio significa que los investigadores comienzan
con una lista de todos ios miembros de la poblacin sobre la cual desean generalizar sus resulta
dos (por ejemplo una lista de todos los psicoterapeutas de la nacin), y luego utilizan un procedi
miento al azar (tal como una tabla de nmeros aleatorios) para seleccionar una muestra de esa
poblacin. El resultado del proceso descripto se denomina muestra probabilstica, ya que cada
miembro de la poblacin estudiada tiene la misma probabilidad de ser incluido en la muestra del
estudio.
No se debe confundir el muestreo aleatorio con la asignacin aleatoria a los grupos que tratamos anteriormente. Ambos procesos utilizan verdaderos procedimientos al azar, pero el muestreo
aleatorio se refiere al mtodo de obtencin de una muestra, y la asignacin aleatoria se refiere al
procedimiento de decisin con respecto a qu miembros de la muestra participarn en el grupo
experimental y cules en el grupo de control.
una rata presiona una barra, y, por ltimo, medidas fisiolgicas, como podran ser los niveles
hormonales o el ritmo cardaco. Los tres tipos de mediciones se evalan principalmente segn
su confiabilidad y validez.
Confiabilidad
La confiabilidad de una medida es su precisin o coherencia, es decir, en qu grado los resulta
dos son similares si se aplica la misma medida al mismo elemento, en circunstancias idnticas.
En psicologa, los resultados no necesariamente son similares. Por ejemplo, cuestionarios entre
gados a las mismas personas en diferentes das dan con frecuencia resultados dismiles. A veces
las preguntas son ambiguas y, por lo tanto, una persona puede responder de un modo en un m o-'
ment y luego de otro. O bien, las personas pueden simplemente marcar en forma incorrecta al
guna o todas las respuestas en una o .ms oportunidades. Las medidas de informe propio no son
las nicas que pueden no resultar confiables. Las medidas por observacin pueden no ser confia
bles debido a que los distintos observadores pueden estar en desacuerdo, y las medidas fisiolgi
cas con frecuencia son sumamente errticas entre un momento y otro,
Existen tres tipos de indicadores para medir el grado de confiabilidad: a) la confiabilidad
por prueba-reprueba, conforme a la cual el mismo grupo es puesto a prueba dos veces; b) la co
herencia interna, segn la cual, por ejemplo, los puntos obtenidos en la mitad de las preguntas se
comparan con los puntos obtenidos en la otra mitad (el alfa de Cronbach, descripta brevemente en
el captulo 17, es el mtodo ms comn para determinar la coherencia interna), y c) la confabilidad por intercambio de juicios utilizada para medidas de observacin, es el grado de acuerdo
entre los observadores. La tabla A-2 resume los tipos de confiabilidad descriptos.
Validez
La validez de una medida se refiere al hecho de que efectivamente pueda medir lo que pretende.
(El trmino validez se aplica, asimismo, a estudios completos, cuando se refiere a lo apropiado de
la conclusin que puede derivarse de los resultados).
Una medida que no es confiable no puede ser vlida; una medida no confiable no mide ria
da. Pero aun cuando una medida sea confiable (precisa y repetible), no necesariamente es vlida
para medir lo que pretende medir. Por ejemplo, un cuestionario sobre satisfaccin marital que
pregunte, cul es la probabilidad de que usted permanezca con su esposo durante los prxi
mos aos? puede resultar sumamente confiable (por ejemplo, las personas pueden contestar las
preguntas que incluye de forma bastante coherente), pero en lugar de medir satisfaccin mari
tal, podra estar midiendo el compromiso hacia el matrimonio; y los que responden el cuestio
nario podran estar comprometidos no porque estn satisfechos sino porque no tienen otra
alternativa que la vida conyugal, o bien porque sienten que son muy poco atractivos y su situa
cin slo podra empeorar si abandonaran a su pareja.
Tabla A-2.
Tipos de confiabilidad.
Confiabilidad por prueba-reprueba:
C oherencia intem a:
Confiabilidad por intercam bio de ju icios:
Otra razn por la cual una prueba puede no ser vlida, aun siendo confiable, es que en lugar
de medir la variable que se pretende medir, en realidad est midiendo una tendencia para intentar
dar una buena impresin, o bien decir que s o cualquier otro sesgo de respuesta por parte de ios
que responden. Una manera de encarar el problema de la intencin de dar una buena impresin es
incluir una escala de deseo sociar, a veces llamada escala de la mentira. Cuando la puntua
cin de un participante en una escala como la mencionada es alta, el investigador puede simple
mente descartar la prueba realizada por el participante. Otra alternativa sera que los valores en
una escala de deseo social puedan utilizarse en un procedimiento estadstico (tal como una corre
lacin parcial o un anlisis de covarianza, ambos descriptos brevemente en el captulo 17) para
adaptar el valor de esa persona en cuanto a la parte regular de la medida.
La validez de una medida es ms difcil de evaluar que la confiabilxdad. Para lograrlo se utili
zan diversos medios. Existe validez de contenido cuando el contenido de la medida parece abar
car todos los distintos aspectos de aquello que se est midiendo. Usualmente, la validez de
contenido la determina el investigador u otros expertos segn el juicio de cada uno.
Asimismo, existen medios ms sistemticos para evaluar la validez de una medida. Determi
nar la validez o criterio implica realizar un estudio especial en el cual el investigador compara re
gistros de la medida en cuestin con algn otro indicador posible de la misma variable. Por
ejemplo, un investigador podra probar la validez de una medida de salud mental comparando va
lores de personas de un hospital psiquitrico con las de puntuaciones de la poblacin en general.
Un tipo de validez de criterio es la validez predictiva de una medida. Por ejemplo, el hecho de
que los registros de una prueba de capacidad laboral, tomada al presentarse la persona para solici
tar un trabajo, predigan el desempeo efectivo de la persona en el empleo. La validez predictiva
se utiliza especialmente cuando se disea una medida con fines predictivos, como por ejemplo
para la ubicacin laboral o educativa. Otro tipo de validez de criterio es la validez concurrente,
la cual se refiere al procedimiento de comparacin de valores de una medida, con los de otra que
mide directamente lo mismo; por ejemplo, una prueba de inteligencia nueva y breve comparada
con una prueba de inteligencia existente ms prolongada. La tabla A-3 resume los tres mtodos de
evaluacin de la validez.
Tambin puede aparecer el trmino validez de constructo, el cual se utiliza de varias formas
(con frecuencia ambiguamente). Incluso textos sobre medicin psicolgica difieren en cuanto a
este trmino. A veces incluyen la validez de criterio y, otras, la validez de contenido. Con frecuen-
T a b a A - 3 ,
T ip o s d e v a lid e z d e u n a m e d id a .
V alidez d e contenido:
V alidez de criterio:
V alidez predictiva:
la puntuacin de la prueba predice valores en otra variable que debera ser predicha
por la prueba, conform e a lo que pretende medir; es un tipo de va lid ez de criterio.
V alidez concurrente;
cia, se utiliza para referirse a la medida que se utiliza en un estudio en el que exista un resultado
predicho que fue confirmado por el estudio. Dado que la medida utilizada logr producir el resul
tado predicho, se demuestra que la idea (o constructo) implcita en la medida queda comproba
da conforme a la teora.
Trminos clave
- Medidas de
comportamiento.
- Mtodo de prueba a ciegas.
- Validez concurrente.
- Validez de contenido.
- Grupo control.
- Diseo de investigacin
correlacional.
- Compensacin.
- Validez de criterio.
~ Variable dependiente.
- Procedimiento doble ciego.
- Grupo experimental.
- Manipulacin experimental.
- Sesgo del experimentador.
- Efectos del experimentador.
- Validez externa.
-- Legitimidad de la
generalizacin.
- Efectos Hawthorne.
- Variable independiente.
- Confiabilidad
por intercambio de juicios.
- Coherencia interna.
- Validez intema.
- Manipulacin de
la variable independiente.
~ Diseo de grupo de control
equivalente con prueba
previa y posterior.
- Diseo de investigacin de
grupo de control equivalente.
- Medidas por observacin.
- Participantes.
- Medidas fisiolgicas.
- Efectos placebo.
- Poblacin.
- Validez predictiva.
- Diseo preexperimental.
- Muestra probabilsima.
- Diseo cuasiexperimental.
- Asignacin aleatoria
a los grupos.
- Muestreo aleatorio.
- Conabilidad.
- Diseo de investigacin
de medidas repetidas.
~ Sesgo de respuesta.
~ Muestra.
- Medidas de informe propio.
- Diseo de grupo tnico con
prueba previa y posterior.
- Investigacin de sujeto
nico.
- Confiabiidad por
prueba-reprueba.
~ Experimento verdadero.
- Validez.
- Diseo de investigacin
intrasujeto.
Tabla B-l.
reas bajo a curva normal:
Porcentaje del rea bajo curva normal entre la media y las puntuaciones Z indicadas.
z
0 ,0 0
0,01
0 ,0 2
0,03
0 ,0 4
0,05
0,06
0,07
0,08
0,09
0 ,1 0
0,11
0 ,1 2
0,13
0 ,1 4
0,15
0,16
0,17
0,18
0,19
0,2 0
0,21
0,22
0,23
0 ,0 0
0 ,4 0
0 ,8 0
1,20
1,60
1,99
2 ,3 9
2,79
3,19
3,59
3,98
4,38
4,7 8
5,17
5,57
5,96
6,36
6,75
7,14
7,53
7,93
8,32
8,71
9,10
2
0,2 4
0,25
0,2 6
0,27
0,2 8
0,2 9
0,3 0
0,31
0,32
0,33
0 ,3 4
0,35
0 ,3 6
0,37
0 ,3 8
0,39
0,4 0
0,41
0,42
0,43
0,4 4
0,45
0,46
0 ,4 7
9,48
9,87
10,26
10,64
11,03
11,41
11,79
12,17
12,55
12,93
13,31
13,68
14,06
14,43
14,80
15,17
15,54
15,91
16,28
16,64
17,00
17,36
17,72
18,08
Z
0 ,4 8
0,49
0,50
0,51
0,52
0,53
0,54
0,55
0,56
0,57
0,58
0,59
0,60
0,61
0,62
0,63
0,64
0,65
0,66
0,67
0,68
0,69
0 ,7 0
0,71
18,44
18,79
19,15
19,50
19,85
2 0,19
2 0,54
2 0,88
2 1,23
21,57
2 1,90
2 2,24
22,57
22,91
. 2 3,24
2 3 ,5 7
2 3,89
2 4,22
2 4,54
2 4,86
25,17
25,49
2 5 ,8 0
1 26,11
0,7 2
0,73
0 ,7 4
0,75
0 ,7 6
0,7 7
0 ,7 8
0 ,7 9
0,8 0
0,81
0 ,8 2
0,83
0,8 4
0,85
0 ,8 6
0,87
0 ,8 8
0,8 9
0 ,9 0
0,91
0,9 2
0,93
0,9 4
0 ,9 5
0,9 6
0,97
0,98
0 ,9 9
1,00
1,01
1,02
1,03
1,04
1,05
1,06
1,07
1,08
1,09
1,10
1,11
1,12
1,13
1,14
1,15
1,16
1,17
1,18
1,19
1,20
1,21
1,22
1,23
1,24
1,25
2 6 ,4 2
26,73
2 7 ,0 4
2 7 ,3 4
2 7 ,6 4
27,94
28,23
2 8 ,5 2
28,81
2 9 ,1 0
2 9 ,3 9
2 9 ,6 7
29,95
30,23
30,51
30,78
31,06
31,33
31,59
31,86
32,12
32,38
3 2 ,6 4
32,89
33,15
3 3 ,4 0
33,65
33,89
34,13
34,38
34,61
34,85
35,08
35,31
3 5 ,54
35,77
35,99
36,21
36,43
36,65
3 6 ,8 6
37,08
3 7 ,29
3 7 ,4 9
3 7 ,7 0
3 7 ,9 0
3 8 ,1 0
3 8 ,3 0
38 ,4 9
3 8 ,69
38,88
3 9 ,0 7
39,25
39,44
1,26
1,27
1,28
1,29
1,30
1,31
1,32
1,33
1,34
1,35
1,36
1,37
,38
1,39
1,40
1,41
1,42
1,43
1,44
1,45
1,46
1,47
1,48
1,49
1,50
1,51
1,52
1,53
1,54
1,55
1,56
1,57
1,58
1,59
1,60
1,61
1,62
1,63
1,64
1,65
1,66
1,67
1,68
1,69
1,70
1,71
1,72
1,73
1,74
1,75
1,76
1,77
1,78
1,79
39,62
39,80
39,97
4 0,15
4 0,32
40,49
4 0,66
4 0,82
4 0,99
4 1,15
41,31
41,47
41,62
4 1,77
4 1,92
4 2,07
4 2 ,2 2
4 2 ,3 6
42,51
42,65
4 2,79
4 2,92
4 3 ,0 6
4 3,19
4 3 ,3 2
43,45
4 3,57
4 3 ,7 0
4 3 ,8 2
43,94
4 4,06
44,18
44,29
44,41
4 4,52
4 4,63
44,74
4 4,84
4 4,95
4 5,05
45,15
45,25
45,35
4 5,45
4 5,54
4 5 ,6 4
4 5,73
4 5,82
45,91
* 45,99
4 6,08
4 6,16
46,25
46,33
Z
1,80
1,81
1,82
1,83
1,84
1,85
1,86
1,87
1,88
1,89
1,90
1,91
1,92
1,93
1,94
1,95
1,96
1,97
1,98
1,99
2 ,0 0
2,01
2 ,0 2
2,03
2,04
2,05
2,06
2,07
2 ,0 8
2,09
2,10
2,11
2,12
2,13
2 ,1 4
2,15
2,16
2,17
2,18
2,19
2,20
2,21
2 ,2 2
2,23
2,24
2,25
2,26
2,27
2,28
2,29
2 ,3 0
2,31
2,32
2,33
46,41
4 6 ,4 9
4 6 ,5 6
4 6,64
46,71
4 6 ,7 8
4 6,86
4 6,93
4 6 ,9 9
4 7 ,0 6
47,13
4 7,19
4 7 ,2 6
4 7 ,3 2
4 7,38
4 7,44
4 7 ,5 0
4 7,56
47,61
4 7,67
4 7 ,7 2
4 7,78
4 7,83
4 7,88
4 7,93
4 7 ,9 8
4 8,03
4 8,08
4 8,12
4 8 ,1 7
48,21
4 8 ,2 6
4 8 ,3 0
4 8 ,3 4
4 8,38
4 8,42
4 8 ,4 6
4 8 ,5 0
4 8 ,5 4
4 8,57
48,61
4 8 ,6 4
4 8,68
48,71
4 8,75
4 8,78
48,81
4 8 ,8 4
4 8,87
4 8 ,9 0
4 8,93
4 8 ,9 6
4 8,98
49,01
2 ,3 4
2,35
2 ,3 6
2 ,3 7
2,38
2 ,3 9
2 ,4 0
2,41
2 ,4 2
2,43
2 ,4 4
2,45
2,46
2,47
2,48
2,49
2,50
2,51
2,5 2
2,53
2 ,5 4
2,55
2,5 6
2,57
4 9 ,0 4
4 9 ,0 6
4 9 ,0 9
49,11
49,13
4 9 ,1 6
4 9 ,1 8
4 9 ,2 0
4 9 ,2 2
49,25
49,27
4 9 ,2 9
49,31
4 9 ,3 2
4 9 ,3 4
4 9 ,3 6
4 9 ,38
4 9 ,4 0
49,41
4 9 ,4 3
4 9 ,4 5
4 9 ,4 6
4 9 ,4 8
4 9 ,4 9
2 ,5 8
2 ,5 9
2 ,6 0
2,61
2 ,6 2
2,63
2 ,6 4
2,65
2 ,6 6
2,67
2,68
2 ,6 9
2,7 0
2,71
2,7 2
2,73
2,74
2,75
2,76
2,77
2,78
2,79
2 ,8 0
2,81
49,51
4 9,52
49,53
49,55
4 9,56
4 9,57
4 9,59
4 9 ,6 0
49,61
4 9 ,6 2
4 9,63
4 9,64
49,65
4 9 ,6 6
49,67
49,68
4 9 ,6 9
4 9,70
49,71
4 9,72
49,73
49,74
4 9,74
49,75
2 ,8 2
2,83
2 ,8 4
2,85
2,86
2,87
2,88
2,89
2 ,9 0
2,91
2 ,9 2
2 ,9 3
2 ,9 4
2,95
2 ,9 6
2,97
2,98
2,99
3,00
3,50
4,00
4,50
4 9,76
49,77
49,77
49,78
49,79
4 9,79
4 9,80
49,81
49,81
4 9,82
4 9,82
4 9,83
4 9,84
4 9 ,8 4
49,85
49,85
4 9 ,8 6
4 9,86
49,87
4 9,98
50,00
50,00
P ru eb a s de u n a c o la
P ru eb a s d e dos c olas
O JO
0 ,0 5
0 ,0 1
O JO
0 ,0 5
0 ,0 1
2
3
4
5
3,078
1,886
1,638
1,533
1,476
6,314
2 ,9 2 0
2,353
2 ,1 3 2
2,015
31,821
6,965
4,541
3,747
3,365
,314
2,920
2,353
2,132
2,015
12,706
4 ,303
3 ,182
2 ,776
2,571
6 3 ,657
9,925
5,841
4 ,6 0 4
4 ,0 3 2
6
7
8
9
10
1,440
1,415
1,397
1,383
1,372
1,943
1,895
1,860
1,833
1,813
3,143
2,998
2,897
2,8 2 2
2 ,7 6 4
1,943
1,895
1,860
1,833
1,813
2,447
2,365
2 ,306
2,262
2 ,228
3,708
3,500
3,356
3,250
3,170
11
12
13
14
15
1,364
1,356
1,350
1,345
1,341
1,796
1,783
1,771
1,762
1,753
2 ,7 1 8
2,681
2,651
2,625
2,603
1,796
1,783
1,771
1,762
1,753
2,201
2 ,179
2,161
2,145
2 ,132
3,106
3,055
3,013
2,977
2,947
16
17
18
19
20
1,337
1,334
1,331
1,328
1,326
1,746
1,740
1,734
1,729
1,725
2 ,5 8 4
2,567
2,553
2 ,5 4 0
2,528
1,746
1,740
1,734
1,729
1,725
2 ,120
2 ,110
2,101
2,093
2 ,086
2,921
2 ,898
2,879
2,861
2 ,846
21
22
23
24
25
1,323
1,321
1,320
1,318
1,317
1,721
1,717
1,714
1,711
1,708
2,518
2 ,5 0 9
2 ,5 0 0
2,492
2,485
1,721
1,717
1,714
1,711
1,708
2 ,080
2 ,0 7 4
2 ,069
2 ,064
2 ,060
2 ,8 3 2
2 ,8 1 9
2,808
2,797
2,788
26
27
28
29
30
1,315
1,314
1,313
1,312
1,311
1,706
1,704
1,701
1,699
1,698
2 ,4 7 9
2,473
2,467
2,462
2,458
1,706
1,704
1,701
1,699
1,698
2 ,056
2 ,052
2,049
2,045
2,043
2,779
2,771
2,764
2,757
2 ,7 5 0
35
40
45
50
55
1,306
1,303
1,301
1,299
1,297
1,690
1,684
1,680
1,676
1,673
2,438
2,424
2,412
2,404
2 ,3 9 6
1,690
1,684
1,680
1,676
1,673
2 ,030
2,021
2,014
2,009
2 ,004
2 ,7 2 4
2 ,705
2 ,6 9 0
2 ,678
2 ,6 6 8
60
65
70
75
80
1,296
1,295
1,294
1,293
1,292
1,671
1,669
1,667
1,666
1,664
2,390
2,385
2,381
2,377
2 ,3 7 4
1,671
1,669
1,667
1,666
1,664
2,001
1,997
1,995
1,992
1,990
2,661
2 ,6 5 4
2,648
2,643
2,639
85
90
95
100
oo
1,292
1,291
1,291
1,290
1,282
1,663
1,662
1,661
1,660
1,645
2,371
2,369
2 ,3 6 6
2,364
2,327
1,663
1,662
1,661
1,660
1,645
1,989
1,987
1,986
1,984
1,960
2,635
2 ,6 3 2
2,629
2 ,626
2 ,576
gl
D en o m in a d o r
N iv el de
sig n ifica ci n
0,01
0,05
0,1 0
0,01
0,05
0,1 0
9 8 ,5 0
18,51
8,53
9 9 ,0 0
19,00
9 ,0 0
99,17
19,17
9,16
99,25
19,25
9,24
9 9,30
19,30
9,29
9 9,33
19,33
9,33
0,01
0,05
0 ,1 0
34,12
10,13
5,54
30,82
9,55
5 ,4 6
2 9 ,4 6
9,28
5,39
28,71
9,12
5,34
2 8,24
9,01
5,31
27,91
8,94
5,28
0,01
0,05
0 ,1 0
2 1 ,2 0
7,71
4 ,5 5
18,00
6,95
4,33
16,70
6,59
4,19
15,98
6,39
4,11
15,52
6,26
4,05
15,21
6,16
4,01
0,01
0,05
0,10
16,26
6,61
4 ,0 6
13,27
5,7 9
3,78
12,06
5,41
3,62
11,39
5,19
3,52
10,97
5,05
3,45
10,67
4,95
3,41
0,01
0,05
0,10
13,75
5,99
3,78
10,93
5,1 4
3,46
9,78
4,76
3,29
9,15
4,53
3,18
8,75
4,39
3,1 i
8,47
4,28
3,06
0,01
0,05
0 ,1 0
12,25
5 ,5 9
3 ,5 9
9,55
4 ,7 4
3 ,2 6
8,45
4,35
3,08
7,85
4,12
2,96
7,46
3,97
2,88
7,19
3,87
2,83
0,01
0,05
0 ,1 0
11,26
5 ,3 2
3 ,4 6
8,65
4 ,4 6
3,11
7,59
4,07
2,92
7,01
3,84
2,81
6,63
3,69
2,73
6,37
3,58
2,67
0,01
0,05
0,1 0
10,56
5,12
3,3 6
8,02
4 ,2 6
3,01
6,99'
3,86
2,81
6,42
3,63
2,69
6,06
3,48
2,61
5,80
3 ,3 7
2,55
10
0,01
0,05
0,1 0
10,05
4,9 7
3,29
7 ,5 6
4 ,1 0
2,93
6,55
3,71
2,73
6,00
3,48
2,61
5,64
3,33
2,52
5,39
3,22
2,46
11
0,01
0,05
0 ,1 0
9,65
4 ,8 5
3,23
7,21
3,98
2 ,8 6
6,22
3,59
2,66
5,67
3,36
2,54
5,32
3 ,2 0
2,45
5,07
3 ,1 0
2,39
12
0,01
0,05
0 ,1 0
9,33
4,75
3 ,1 8
6,93
3,89
2,81
5,95
3,49
2,61
5,41
3,26
2,48
5,07
3,11
2,40
4,82
3,00
2,33
13
0,01
0,05
0,1 0
9 ,0 7
4 ,6 7
3,14
6 ,7 0
3,81
2 ,7 6
5,74
3,41
2,56
5,21
3,18
2,43
4,86
3,03
2,35
4,62
2,92
2,28
14
0,01
0,05
0,1 0
8,86
4 ,6 0
3,1 0
6,5 2
3,7 4
2,7 3
5,56
3,34
2,52
5,04
3,11
2,40
4,70
2,96
2,31
4,46
2,85
2,24
4 .0 5 2
162
39 ,9
2
5 .0 0 0
200
49,5
5 .4 0 4
216
53,6
5.625
225
55,8
5.764
230
57,2
5.859
234
58,2
D en o m in a d o r
gl
N iv el d e
s ig n ifica c i n
15
0 ,0
0,05
0 ,1 0
8,68
4 ,5 4
3,07
6,36
3,68
2,70
5,42
3,29
2,49
4,89
3^06
2,36
4,56
2.90
2,27
4,32
2,79
2,21
16
0,01
0,05
0,1 0
8,53
4,49
3,05
6,23
3,63
2,67
5,29
3,24
2,46
4,77
3,01
2,33
4,44
2,85
2,24
4 ,2 0
2 ,7 4
2,18
17
0,01
0,0 5
0,1 0
8,40
4,4 5
3,03
6,11
3,59
2,65
5,19
3,20
2 ,4 4
4,67
2,97
2,31
4 ,3 4
2,81
2 ,2 2
4 ,1 0
2 ,7 0
2,15
18
0,01
0,0 5
0,1 0
8,29
4,41
3,01
6,01
3,56
2,62
5,09
3,16
2,42
4,58
2,93
2,29
4,25
2,77
2,20
4 ,0 2
2,66
2,13
19
0,01
0,05
0 ,1 0
8,19
4,38
2,99
5,93
3,52
2,61
5,01
3,13
2,40
4,50
2,90
2,27
4,17
2,74
2,18
3,94
2,63
2,11
20
0,01
0,05
0,1 0
8,10
4,35 .
2 ,9 8 '
5,85
3,49
2 ,5 9 '
4,94
3 ,1 0
2,38
4,43
2,87
2,25
4 ,1 0
2,71
2,16
3,87
2 ,6 0
2,09
21
0,01
0 ,0 5
0,1 0
8,02
4,33
2,9 6
5,78
3,47
2,58
4,88
3,07
2,37
4,37
2,84
2,23
4,04
2 ,6 9
2,14
3,81
2,57
2,08
22
0,01
0,05
0 ,1 0
7,95
4 ,3 0
2,95
5,72
3,44
2,56
4,82
3,05
2,35
4,31
2,82
2,22
3,99
2,66
2,13
3,76
2,55
2,06
23
0,01
0,05
0 ,1 0
7 ,8 8
4,28
2,94
5,66
3,42
2,55
4,77
3,03
2 ,3 4
4 ,2 6
.2 ,8 0
2,21
3 ,9 4
2,64
. 2 ,1 2
3,71
2,53
2 ,0 5
24
0,01
0 ,0 5
0 ,1 0
7,8 2
4,26
2,93
5,61
3,40
2,54
4,72
3,01
2,33
4,22
2,78
2,20
3 ,9 0
2,62
2 ,1 0
3,67
2,51
2 ,0 4
25
0,01
0,05
0 ,1 0
7,77
4 ,2 4
2 ,9 2
5,57
3 ,3 9
2,53
4,68
2,99
2,32
4,18
2,76
2,19
3,86
2 ,6 0
2,09
3,63
2 ,4 9
2,03
26
0,01
0,05
0,1 0
7,72
4,23
2,91
5,53
3,37 '.
2,52
4,64
2 ,9 8
2,31
4 ,1 4
2,74
. 2,18
3 ,8 2
.2,59
2,08
3 ,5 9
2 ,4 8
2,01
27
0,01
0,05
0,10
7,68
4,21
2,90
5,49
3,36
2,51'
4 ,6 0
2,96
2,30
4,11
2,73
2,17
3,79
2,57
2,07
3,56
2,46
2,01
28,
0,01
0,0 5
0 ,1 0
7 ,6 4
4 ,2 0
2 ,8 9
5,45 .
3,34
2 ,5 0
4,57
2,95
2,29
4,08
2,72
2,16
3,75
2,56
2,07
3,53
2,45
2 ,0 0
Denominador
gl
95
100
00
Nivel de
significacin
0,01
0,05
0,10
0,01
0,05
0,10
0,01
0,05
0,10
6,91
3,94
2,76
6,90
3,94
2,76
6,64
3,84
2,71
4,84
3,09
2,36
4,82
309
2,36
4,61
3,00
2,30
4,00
2,70
2,14
3,98
2,70
2,14
3,78
2,61
2,08
3,52
2,47
2,01
3,51
2,46
2,00
3,32
2,37
1,95
3,22
2,31
1,91
3,21
2,31
1,91
3,02
2,22
1,85
3,00
2,20
1,84
2,99
2,19
1,83
2,80
2,10
1,78
Tabla B-4.
Puntos de corte para la distribucin chi-cuadrado.
gl
OJO
l
2
3
4
5
6
7
8
9
10
2,706
4,605
6,252
7,780
9,237
10,645
12,017
13,362
14,684
15,987
Nivel de significacin
0,05
3,841
5,992
7,815
9,488
11,071
12,592
14,067
15,507
16,919
18,307
0,01
6,635
9,211
11,345
13,277
15,087
16,812
18,475
20,090
21,666
23,209
Tabla B-5.
I n d ic e d e la s t a b la s d e p o t e n c ia y d e la s t a b la s c o n la c a n t id a d d e p a r t ic ip a n t e s n e c e s a r io s
p a r a o b t e n e r u n a p o t e n c ia d e l 8 0 % .
P r o c e d im ie n t o d e p r u e b a d e h ip te s is
C a p tu lo
T a b la d e p o te n c ia
3
9
10
11
13
14
99
278
308
34
410
450
T a b la c o n c a n tid a d
d e p a r tic ip a n te s
99
279
309
341
410
450
Apndice B
615
Respuestas a los
ejercicios de la serie I
Captulo 1
1.
2.
b)
a) N om inal (o categrico).
b) N um rico (o cuantitativo); m s precisam ente,
intervalar.
c ) N um rico (o cuantitativo); m s precisam ente,
ordinal.
a) Tabla d e frecuencias.
V alores
96
95
94
93
92
91
90
89
88
87
86
85
84
83
82
81
80
79
78
77
76
75
74
73
F recu en cia
1
0
0
0
1
1
0
0
0
1
0
.1
0
2
0
1
1
0
0
0
2
2
1
1
V alores
72
71
70
69
68
67
66
65
64
63
62
61
60
59
58
57
56
55
54
53
52
51
50
In terv a lo
F r e c u e n c ia
9 5 -9 9
9 0 -9 4
8 5 -8 9
F r e c u e n c ia
8 0 -8 4
0
1
1
1
2
1
0
0
2
0
, 0
0
0
. 1
0
0
0
0
0
0
0
0
1
7 5 -7 9
4
.
7 0 -7 4
6 5 -6 9
6 0 -6 4
5 5 -5 9
5 0 -5 4
Sensibilidad olfativa
d)
3.
a) ta b la de frecuencias
: varias posibilidades)^
agrupadas (una de
In terv a lo
F r e cu en cia
8 0 -8 9
7 0 -7 9
6 0 -6 9
5 0 -5 9
4 0 -4 9
3 0 -3 9
2 0 -2 9
10
0
5
0
5
7
7
Horas de estudio
d)
4.
a) Tabla de frecuencia.
C a n tid a d
d e h o ra s F recu en cia
18
17
16
15
14
13
12
11
10
9
1
0
0
1
0
2
1
3
5
4
C a n tid a d
d e h o ra s
F r ecu en cia
8
7
6
5
4
3
2
1
0
5
11
4
2
3
4
2
1
1
In terv a lo
1 8 -2 0
1 5 -1 7
1 2 -1 4
9 -1 1
6 -8
3 -5
0 -2
1
I
3
12
20
9
4
__________
(b)
(c)
7.
Captulo 2
1. Serie
A. a) M
= % X JN = 2 6 1 /9 = 2 9 .
b) M ediana = 28,
c) S S = X (X ~ M )2 = (32 - 2 9 )2 + (28 - 2 9 )2
+ (24 - 2 9 )2 + (28 - 29)2 + (28 - 2 9 )2
+ (31 - 2 9 ) 2 + (35 - 29)3 + (29 - 2 9 )2
+ (26 - 2 9 )2 ,
S S = 32 + ( ~ ) 2 + (- 5 )2 + (~1)2 + ( - 1 ) 2
4- 22 + 62 + O2 + (~3)2
SS = 9 + 1 + 2 5 + 1 + 1 + 4 + 3 6 + 0 + 9 = 86.
d) S D 2 = S S /N = Z ( X - M ) 2/N = 86/9 = 9,56.
3.
4.
5.
6.
1.
a)
5
4
3
2
-----------------------------------------------------------------------------
30
40
50
60
70
........
80
..........
90
Empatia
b) Correlacin lineal positiva. A medida que au
menta la empatia del terapeuta tambin aumen
ta la satisfaccin del paciente,
Empatia
terapeuta
O r ig in a l
1
2
3
4
70
94
36
48
Satisfaccin
paciente
zx
O r ig in a l
0,36
1,45
-1,17
-0,63
4
5
2
1
zr
0,63
1,26
-0,63
-1,26
zxzr
0,23
1,83
0,74
0,80
o
'O
cr
C a p tu lo 3
c)
11
1+1
d)
= 3,60/4 =
0,90
Calificacin en la prueba
2.
Calificaciones
en la prueba
O r ig in a l
O r ig in a l
0
10
8
- 1 ,7 9
1,19
0 ,0 0
0 ,6 0
0 ,0 0
S D = 3,35
52
95
83
71
64
Zy
-1 ,4 1
1,48
0,67
-0 ,1 3
- 0 ,6 0
A# = 73;
2,52
1,76
0 ,0 0
-0 ,0 8
0 ,0 0
14,90 == 4 ,2 0
r = 4 ,20/5 =i 0,84.
a)
9
8
7
0
'g 5
1 4
a)
100
90
80
70
60
50
3
2
1 *
o!---------
*>
10
15
20
25
30
Extraversin
1
10
Horas de estudio
b)
Horas de estudio
ZX Z Y
%
u
b
b)
C)
Aprecio por
ese integrante
Extraversin
de un integrante
V a lo r
observado
observado
18
17
20
8
13
24
11
12
18
21
0,37
0,17
0,80
-1,72
-0,67
1,63
-1,09
-0,88
0,38
1,00
8
9
6
1
7
1
3
5
7
3
1,10
1,47
0,37
-1,47
0,74
-1,47
-0,74
0,00
0,74
-0,74
ZX Zy
P u n tu a c i n
!!
O
vD
to
o
n
o
o
P u n tu a c i n
V a lo r
0,407
0,245
0,296
2,528
-0,496
-2,396
0,807
0,000
0,281
-0,740
b)
L= 0,932
c)
5. a)
b)
5
4
3
*
*
2
*
1 *
0 ------- :-----------1 2
7. SERIEA:
Producto cruzado
Toma medicamento Se resfra de puntuaciones Z
O r ig in a l Z
O r ig in a l
Z
I
0
-1
1
1
1
0
1
I
1
1
0
-I
1
1
I
0
1
-1
1
1
1
~1
0 1
-I
1
1
0 I
-I
1
1
0 1
-I
0 -1
1
1
-8
r = ~8/S =-1,00.
O r ig in a l
Producto cruzado de
puntuaciones Z
r
O r ig in a l
l
.2
3
4
5
-1,41
~0,71
0,00
0,71
1,41
1
-1,41
2
0,71
3
0,00
4
0,71
5
1,41
M= 3; X>= 1,41
r =
2,0
0,5
0,0
0,5
2,0
5,0
5,0/5 = 1,00.
SERIE B :
~4
Captulo 4
1 2
X
1
2
3
4
5
Producto cruzado de
puntuaciones Z
Y
Z
-141
-0,71
0,00
0,71
1,41
-4/8 = 0,50,
4
3
r =
.1 *
O r ig in a l
Producto cruzado
Toma medicamento Se resfra de puntuaciones Z
O r ig in a l Z
O r ig in a l
Z
1
0
1
1
-1
1
0
1
1
-1
I
0
-i
1
1
0
-I
1
0 -1
1
1
i
1
1
I
1
1
0 -I
. -1
0 -1
1
l
i
1
l
0
>-<
SERIE B:
O r ig in a l
1 -1,41
2 -0,71
3 0,00
5 1,41
4 0,71
2,0
0,5
0,0
1,0
1,0
4,5
r= 4,5/5 = 0,90.
. ).
c)
Y=
2 + (0,4)(X).
d) y = 8 + (0,2X X ).
e)
f)
2 + (0,8XX).
r = 1 4 + (-0,4)(X).
F= 2 4- (0,8)(X).
d)
Empatia
e) R educcin proporcional de error
3,
N o ta en el
p a rcia l
M o d e lo de
p red icci n
N o ta p re d ic h a
en el fin a l
30
40
50
60
70
80
90
100
4 0 + (0 ,5)(30)
40 + (0 ,5)(40)
40 + (0,5X 50)
4 0 + (0 ,5)(60)
4 0 + (0 ,5)(70)
4 0 + (0,5){80)
4 0 + (0 ,5)(90)
4 0 + (0 ,5 X 1 0 0 )
55
60
65
70
75
80
85
'9 0
4.
a) b = (b ) (S D Y/S D x) == (0,9 X 1 ,5 8 /2 2 ,1 4 )
= 0 ,0 6 4 ;
a = M y -(>)(M *) = 3 - (0 f0 6 4 )(6 2 )
= -0 ,9 7 ;
S a tisfa cc i n p redicha == - 0 , 9 7 + (0 ,0 6 4 )
(em p atia)
: 6)
N m ero
d e p a reja
E m p a tia
te ra p eu ta
1
2
3
4
70
94
36
48
S a tisfa cci n
del clien te
R eal
P r e d ic h a
4
5
2
1
3,51
5,05
1,33
2 ,1 0
c)
E rr o r
0 ,49
-0 ,0 5
0,67
- 1 ,1 0
E rr o r 2
0,24
0,0 0
0,45
1,21
- (1 0 ~ 1 ,9 ) / 1 0 - 0,81.
f) -v /o sl = 0 , 9 ; r s 0,9.
g) Puede com probarse m atem ticam ente que el
m todo m s preciso para predecir la puntua
cin Z de una persona en una variable (llam
m osla Y ), sobre la base de la puntuacin Z de
esa persona en otra variable (llam m osla X ),
e s m ultiplicar la puntuacin Z en X por el c o e
ficien te de correlacin. E ste procedim iento
puede sim plificarse en una sola frm ula (que
s o requiere las conversiones a puntuaciones Z
y de puntuaciones Z), en la que las puntuacio
nes originales de Y pueden predecirse directa
m ente a partir d e las puntuaciones orignales
de X . En este ejem plo en particular, la frm ula
e s tal que, para predecir la puntuacin original
d e un paciente en cuanto a satisfaccin, se to
m a la constante de -0 ,9 7 y lu ego s e le sum a el
resultado de m ultiplicar 0 ,0 6 4 por e l valor c o
rrespondiente a la em patia del terapeuta.
Para evaluar la precisin d e la frm ula se de
ben seguir lo s siguientes pasos. Prim ero, de
terminar la prediccin que s e hubiera hecho
utilizando la frm ula para cada paciente de las
cuatro parejas utilizadas para e l clcu lo del
coeficien te de correlacin. Por ejem plo, apli
cando esta frm ula a la primera pareja, suma
m os a -0 ,9 7 el resultado de multiplicar 0,064
por la empatia del terapeuta (0,064 x 70 = 4,48);
el resultado s 3 ,5 1 . S e puede calcular el
error en e l que incurriram os utilizando este
m od elo para cada una de las predicciones,
restando el valor predicho al valor observa
do. Por ejem plo, en el caso de la primera pa
reja, 4 m en os 3,51 da un error de 0 ,4 9 . D ado
que lo s errores se cancelaran unos a otros al
sum arios (porque algunos son negativos y
otros p o sitiv o s), elev o los errores al cuadra
do, Para ilustrarlo grficam ente, se traz so
bre el diagram a de dispersin preparado para
.estos datos una recta (denom inada r ec ta d e
5.
c)
C a lifica c io n e s (L )
(X )
O r ig in a l
P r e d ic c i n
0
10
6
8
6
52
5 0 ,5 6
87,96
7 3 ,0 0
80,48
7 3 ,0 0
95
83
71
64
E rror
1,44
7,07
10,00
-9 ,4 8
-9 ,0 0
E rr o r 2
2 ,0 7
4 9 ,5 6
100,00
89,87
8 1 ,0 0
d)
(0>10)(Zgnsc^nKi
+ (0,32)(z Entrenamiento social)
A (0,10)(-2) + (0,32)(0) = -0,20
B (0,10)(0) + (0,32)(0) = 0
C (0,10)(2) + (0,32)(0) = -0,20
D (0,10)(0) + (0,32}(-2) = - 0 , 6 4
E (0,10)(0) + (G,32)(2) =-0,64
F
(0,10}(-2) + (0,32)(2) = -0,20 + 0,64 = -0,84
G (0,10j(-l) + (0,32)(-2) = -0,10- 0,64 = -0,74
Captulos
(a)
<b)
(0,27)(Zgstyo^trea(^n) + (0,29)(^nlrananl!CIltoSocjaj)
(0,27)(-2) + (Q,29)( 0) = -0,54
(0,27)( 0) + (0,29)( 0) = 0
(0,27)( 2) + (0,29)(0) = -0,54
D
(0,27)( 0) + (0.29X-2) = -0,58
E (0,27)( 0) + (0,29)( 2) = 0,58
F (0,27)( 2) + (0,29)( 2) = 0,54 + 0,58
= 1,12
G (0,27)(-l)+(0,29)(-2) = -0,27 - 0,58
= -0,85
A
B
C
3.
Captulo 6
X,
2.
P u n tu a ci n Z en la
E stu d io C orte d istr ib u ci n D e cisi n
4.
+ 1,64
2 ,0
1 ,9 6
2 ,0
C
D
E
F
+2,33
2,57
+ 1,64
2,57
2 ,0
2 ,0
1,0
4 ,0
2,57
3 ,0
H
I
2 ,5 7
- 1 ,6 4
2,0
- 2 ,0
R echaza
la hip tesis nula
R echaza
la hip tesis nula
N o concluyente
N o concluyente
N o concluyente
R echaza
la hip tesis nula
R echaza
la hip tesis nula
N o concluyente
R echaza
la hiptesis nula
5.
6.
Captulo 7
1.
2. a)
a 2 = 102 * 100; ct2m = a 2 N = 100/2 = 50; a M
= V o \ , = V50 = 7,07 b) 5,77; c) 5; d) 4,47; )
3,16; f) 2,24; g) 1.
3. a) L m ite superior = M + (<xM) ( l,9 6 ) = 100 +
(7 .0 7 ) (1 ,9 6 ) = 113,86; Emite inferior = 100 +
(7 .0 7 ) (~ i,9 6 ) = 86,14. b) 111,31, 88,69; c)
1 0 9 ,8 ,9 0 ,2 ; d) 1 0 8 ,7 6 ,9 1 ,2 4 ; e ) 1 0 6 ,1 9 ,9 3 ,8 1 ; )
1 0 4 ,3 9 ,9 5 ,6 1 ; g ) 1 0 1 ,9 6 ,9 8 ,0 4 .
4. Dado que la distribucin de la poblacin de indivi
duos es normal, tambin lo ser la distribucin de
medias. Por lo tanto, basndonos en la tabla de reas
bajo la curva normal, se necesita una puntuacin Z de
a menos 1,64 para estar dentro del 5 % superior. Para
la muestra, a: crM= '/(36/T) = 1,90. Z (en la distribu
cin de medias) = (44 - 4 0 )/l ,90 = 4/1,90 = 2,11. Da
do que 2 , l es ms extremo que 1,64, la muestra
tiene m enos de un 5 % de probabilidades. La respues
ta final para e l punto b tiene ms de un 5% de proba
bilidades; para el punto c, menos probabilidades y
5.
2,
Captulo 8
1. A lfa es la probabilidad d e rechazar la hip tesis nu
la cuando es verdadera. B eta es la probabilidad de
C o n c lu si n
a r ro ja d a p o r la
p r u e b a d e h ip tesis
(a) Rechazar
la pula
No concluyente
(b) Rechazar
la nula
N o concluyente
(c) Rechazar
la nula
N o co n clu y en te.
F alsa
Z necesario
para obtener
significacin
xim a pgina,
4, Z necesario para significacin = 1,64; a M - 2 (es
decir,V[144/361 - 2); puntuacin original necesa
(b)
(c)
(d)
(e)
(0
0,4 *
0,4
0,2
1,0
0,4
0,4
90,66
90,66
90,33
91,64
90,93
90,78
Z para significacin
Tan
en la poblacin
predicha
Beta Potencia del e
1,64
1,64
1,64
1,64
2,33
1,96
Valor
para obtener
significacin
1/4
1/2
1/2
1/4
1/4
1/4
5.
6.
7.
89,6
90
-3
90,4
-2
90,66
-i
-0,85
-si
+2
1.
a)
= c V 9 / 6 4 ) = V o T 4 ! = 0 ,3 8 .
t = ( M - W /5 m - { 1 i - 1 2 , 4 0 ) /0 f3 8
= - 1 , 4 0 7 0 ,3 8 = - 3 , 6 8 .
2.
a)
Determinar
las
caractersticas
de
la
distribucin comparativa..
Poblacin 2: form a = s e presum e normal;
(X = 30; a 2 = desconocida;
3.
& = Z ( X - M ) 2/( N - 1 ) = S S /g l
= 1 2 4 /( 1 0 - 1 ) = 13,78.
Distribucin d e medias: form a = t ( g l = 9);
11^=30;
= -1 ,8 3 3 .
4. Determinar el valor muestral en la distri
bucin comparativa.
La m edia del nuevo je fe d e polica es
M = 1 ~ X /N = 2 8 0 /1 0 = 28.
4,
b) necesario = 1,980;
= V l 4 l 3 7 l 6 4 = 1,59; = (2,3 - 0)71,59 =
1,45; no s e rechaza la hip tesis nula; d = 0,11.
c ) t necesario = -2 ,6 2 4 ; S M = 0,52; / = -4 ,2 3 ;
s e rechaza la hiptesis nula; < 1,1.
a) Pasos de la prueba d e hiptesis:
1. Replantear el problem a en funcin de h i
ptesis de investigacin e hiptesis nula de
poblaciones.
P o b la c i n 1:
ciudades com o aquellas que
participaron en el programa
para reducir los residuos.
P o b la c i n 2:
ciudades que no cam bian en
cuanto a cantidad de residuos
durante un periodo de un ao.
La hiptesis de investigacin establece que la
poblacin presenta una m edia de disminucin
de residuos superior a la de la poblacin 2 . La
5.
Valores de cambio
(muestra real)
c) d a M /S = 5 / - M W = 5 /4 ,0 8 = 1,23
d)
5.
6.
Captulo 10
1.
2.
*2.0 ;
= IW | +
4.
^ 5
+ 2,34
= 4,29;
^Diferencia ~
5.
m u y im p o rta n tes.
a) d - (107 - 149)/84 = -4 2 /8 4 = - 0 ,5 0 . Tamao
Captulo 11
1.
2.
- (W ) -
16; ^
= 0.67;
S \, = (4X4) = 16;
- 21,33;
3.
4.
Captulo 12
1. ^Toil
Gento ~ g l [ +
g f i * . . . + gt-Mmo
( 4 - 1 ) + ( 4 - 1 ) + ( 4 - 1 ) = 3 + 3 + 3 = 9.
Grupo 1
X
8
8
7
9
X -G M
X~M
D e sv D esv2
D e sv D esv2
2
2
1
3
X 32
4
4
1
9
0
0
-1
1
M -G M
0
0
1
1_
D esv D esv2
2
2
2
2
4
16
18
4
4
4
M - 3 2 /4 8 .
Grupo 2
X
6
6
5
7
24
X - M
X -G M
D esv D esv2
0
0
1
1
0
0
-1
1_
2
M - 2 4 /4 = 6.
M -G M
D e s s v D esv2
0
0
-1
1
0
0
1
_1_
2
D esv D esv2
0
0
0
0
0
o
o
0
2
F u e n te
Intergrupal
Intragrupal
G rupo 3
M - GM
X -G M
X~M
D esv D esv2
D esv D esv2
-st- 'S- co in
~2
-2
-3
-1
4
4
9
1_
16
0
0
-1
1
D esv
4
4
4
4
G M = (3 2 + 2 4 +
4.
16)/12 = 7 2 /1 2 = 6.
nfro= 2 + 2 + 2 = 0.
gl
2
9
32
6
16
0 ,6 7
11
38
lo s g l
igual
que
en
el
captulo
i f = i 2,..
11;
y f <to
ptulo 11.
2.
F u e n te
Intergrupal
Intragrupal
SC
2 9 8 ,8 9
12
gZ
3
5
CM
9 9 ,6 3
2 ,4
F
4 1 ,5 1
i)
a) Mj = 4; A2 = 1; M j = 2.
b) F necesario ( g l = 2 , 6; p < 0 ,0 5 ) = 5,14.
(Nota: G M = 2,3 3 ).
F u e n te
Intergrupal
Intragrupal
SC
14
6
gl
2
6
CM
7
1
c ) R 2 = 14/20 = 0,70.
& )M l = 4 \ M 1 = l; M 3 = 2.
b) F necesario ( g l = 2 ,6 ; p < 0 ,0 5 )
= 5,1 4 .
(Nota: G M = 1,89).
SC
84
38
gl
2
9
122
CM
42
4 ,2 2
11
9 ,9 5
S C 0 = 1 6 + 0 + 1 6 = 32.
SC
4,85
c) R 2 = 12,89/20,89 = 0.62.
a) F necesario ( g l = 2 , 9 ; p < 0 ,0 5 ) = 4,26.
F u e n te
Intergrupal
Intragrupal
Total
2+18 = 38.
F u e n te
Intergrupal
Intragrupal
Total
6 ,4 5
0 ,6 7
M = 1 6 /4 = 6.
^ ., = 1 8
CM
16
18
gl
2
6
D esv2
-2
-2
-2
-2
0
0
1
SC
12,89
8 ,0 0
7 ,0 0
5.
SC
gl
66
24
2
7
CM
33
3 ,4 3
9 ,6 2
Captulo 13
1. O a)
b)
* N. de la trad,: C om m u n ity College'. Colegio que comprende dos aos de universidad y es mantenido en parte por la
comunidad a la cual sirve,
D ep orte
a)
B is b o l
f tb o l
B a lo n c e s to
a m e r ic a n o
;o
la
c
2
C on pro g ra m a
d e m o tiv a c i n
S in p r o g r a m a
d e m o tiv a c i n
72
10
7
6
10
5
6
L _ J ___________________ _
10
b)
7
5
___ __________________________ _
<,
B is b o l
F tb o l
B a lo n c e s to
a m e r ic a n o
C on p ro g ra m a
10
"
-Ciudad
i iNuavyffc ,
OChicagb;
:Y7
/-i. .
d e m o tiv a c i n
'c S in p r o g r a m a
^ d e m o tiv a c i n
c)
10
10
10
B is b o l
F tb o l
B a lo n c e s to
a m e r ic a n o
,
la
'q
2
2
1
0
,
Can)
I;'
Moderador
;vv
B anco'
'
C on p ro g ra m a
d e m o tiv a c i n
S in p r o g r a m a
d e m o tiv a c i n
i. 7
Coito;;
d)
10
B is b o l
F tb o l
B a lo n c e s to
a m e r ic a n o
,.
.a
'
y
C on p ro g ra m a
d e m o tiv a c i n
S in p r o g r a m a
d e m o tiv a c i n
e)
10
B is b o l
F tb o l
B a lo n c e s to
a m e r ic a n o
'
2
C on p ro g ra m a
d e m o tiv a c i n
Sin p r o g r a m a
d e m o tiv a c i n
8,
10
7,5
3.
4.
M f
<M
- W
-a y
/m 2
0
16
4
4
1
1
9
9
0
0
16
18
n
9
25
9
1
1
1
1
9
9
0
0
10
34
18
^Columna ^
T erapia B
I
M
II
M
ss,
sstcotranas
ss,fitas
ss.interaccin
= 2 + 2 + 0 + 2 + 2 + 0 = 8,
= 18 + 1 8 + 18 + 1 8 + 18 + 18 = 108.
= 0 + 0 + 0 + 0 + 0 + 0 = 0.
F u en te
SC
gt
CM
Terapia
108
108
36
18
D iagnstico
Interaccin
6
2
M
11
(X GM f
= 16 + 34 + 2 0 + 3 4 + 10 + 2 0 - 134.
= 8 + 2 + 2 + 2 + 2 + 2=18,
SS.total
1,33
N o se rechaza la
hiptesis nula
S e rechaza
la hiptesis nula
N o se rechaza
la hiptesis nula
10
(M r .
~ G M f Int2
(X GM f
(X ~
M f
3
1
9
25
1
1
1
1
9
9
0
0
34
18
7
9
1
9
1
1
1
1
9
9
0
0
10
18
<M- W
Interior
de casillas
^Columna
T erapia C
(X M f
(- W
~ G af
M2
16
4
0
0
9
9
0
0
20
18
1
1
0
0
9
9
0
0
18
2
M
(X GM f
c) Tamaos de efecto:
8
10
II
M
^Columna ^
4
16
20
5.
SC
si
CM
Sim pata
N erviosism o
Interaccin
48
48
24
Dentro
de casillas
12
F u e n te
= 5,14.
N o se rechaza
la hiptesis
nula.
N o s e rechaza
la hiptesis
nula.
S e rechaza la
hiptesis nula.
M edias:
S im p a ta
(X X G M f
N erv io sism o 7
8
4
9
(X -
(^Coirniqtx
M )2
-G M f
-G M p
0
1
1
0
0
0
0
0
0
4
4
4
In t?
14
12
A usen cia de 3
N erviosism o 3
3
4
4
4
0
0
0
0
0
0
0
4
4
4
12
12
M Columna
Sim pata
N ervioso
7
A usencia de N erviosism o 3
5
A usen cia de
sim pata
j
3
5
j
7 ........... 5
5
5
A u sen cia d e sim p a ta
( X - (X ~
^Columoe,
X G M )2 M )2 - G M f - G M f In t2
N erviosism o 3
4
2
4
1
9
0
1
1
0
0
0
0
0
0
14
A usen cia de 7
N erviosism o 5
9
4
0
16
0
4
4
0
0
0
0
0
0
20
4
4
4
12 5
c ) Tamao del efecto:
Columna
^^Toia!
5
= 60.
= 12.
^D entro
ucr*
^Columnas = 0.
= 0.
^FU a
5CInteraccin = 48.
4
4
4
12 5
^ W = / < 6 0 - 0 ~ 4 8 ) = 0/12 = 0
M, = 0 / ( 6 0 - 0 - 4 8 ) = 0 /1 2 = 0
C aptulo 14
.
Categora
19
11
C
10
D
5
E
5
Total 50
Conclusin: se
b)
Esperado
A
B
(0 ,2 )(5 0 )
(0 ,2 X 5 0 )
(0 ,4 )(5 0 )
(0 ,1 X 5 0 )
(0 ,1 )(5 0 )
(0 ,1 )(5 0 )
rechaza la
O - E (O -E )*1 (O -E )1/ E
=10
9
81
8 ,1 0
= 10
1
1
0 ,1 0
= 20 - 1 0
100
5 ,0 0
= 5
0
0
0.00
= 5
0
0
0.00
= 50
0
X2 "0 3 ,2 0
hiptesis nula.
Categora
Esperado
I
n
100
100
100
in
Total 300
Conclusin: se
O -E (O -E )1 (O - E f . E
(0 ,3X 3 0 0 ) = 90 10
100
1,11
(0 ,5X 3 0 0 ) = 150 -5 0 2 ,5 0 0 16,67
(0 ,2 X 3 0 0 )= 60 4 0 1,600 26,67
300
0
x 2 == 4 4 ,4 5
rechaza la hiptesis nula.
Esperado -
0 - E { 0 - E ) 2( 0 - E ) 2E
1
38 (100 /5 0 0 )(2 0 0 )= 40 -2
4 0 ,1 0
2
124 (300/500X 200) = 120 4
16 0 ,1 3
3
22 (5 0 /5 0 0 )(2 0 0 )= 2 0
2
4 0 ,2 0
4
16 (5 0 /5 0 0 )(2 0 0 )= 2 0 -4
16 0 ,8 0
T otal200
200 0
x2= 1.23
C onclusin: no se rechaza la hip tesis nula.
d)
Categora
Esperado
O - E (i0 - E f ( O - E f E
37
30
7
49
Artes
81
C iencias
21
30
-9
4
30
2
Humanidades 32
Total
900
X2 =
90
C onclusin: no s e rechaza la hip tesis nula.
2.
1,63
2 ,7 0
0 ,1 3
4 ,4 6
Temporada O
invierno
28
Primavera 33
Verano
16
Otoo
51
Total 128
Esperado
(1/4X 128)= 32
(1/4)(128) = 32
(1 /4)(128) = 32
(1 /4 )(1 2 8 ) = 32
128
0 ~ E (0 ~ E )2{0 ~ E )2f
-4
16 0 ,5 0
1
1 0,03
- 1 6 256
8 ,0 0
19 361 11,28
0
x 2 - 1 9 ,8 1
5.
Comparar los valores obtenidos en los pa
so s 3 y 4 para decidir si se rechaza o n o la h i
p tesis nula.
X2 en e l paso 4 (1 9 ,8 1) es mayor que e l punto
de corte del paso 3 (7,815). Por lo tanto, se re
chaza la hiptesis nula; s e sostien e la hip tesis
d e investigacin.
b) Explicacin: si las temporadas no marcaran una
diferencia esperaramos aproxim adam ente un
25% de nuevos pacientes cada temporada (ba
sndonos en e l ao anterior, e l 25% del total
de 128 e s igual a 32). Las cantidades reales
d e cada temporada del ao anterior son tan di
ferentes a estas expectativas que deberam os
concluir que, e n general, las cantidades de
nuevos pacientes no s e distribuyen en forma
pareja entre las temporadas?
E i chi-cuadrado es un indicador d el grado de
discrepancia entre resultados observados y e s
perados. Para cada categora (las cuatro esta
ciones en este caso), calculam os la diferencia,
la elevam os al cuadrado y la dividim os por la
cantidad esperada; despus sum am os los re
bultados. En el invierno, 28 m enos 32 e s ~4;
3.
Esperado
0~E {0~E?
206
7,38
103
10
(1 3 )
16
(1 3 )
26
(50% )
(1 3 )
10
(1 3 )
26
(50% )
26
v 2
( l o 1 3 )2+ ( I 6 -
is
13)?- (1 6 13
- - f. .
: 0 ,6 9 + 0 ,6 9 + 0 ,6 9 + 0 ,6 9 = 2,7 6 .
654
(100-30)2
130
necesa rio
6,635.
(160 130)*_ (1 Q 0 -1 3 0 )2
(1 6 0 - 1 3 0 )2
130
130
130
2 7 ,6 8 .
4 -
S l - w cota - m b, - 1>-(3 - 2 - 1) = 2;
Punto de corte xz necesario
(gl = 2,1%) = 9,211.
10
16
(13) 16
(13)
26
(10 - 1 3 ) 2f
20
( 1 6 - 1 3 )2
13
(1 6
' 13
72
i3 ) 2+ ( 1 0 : 1 3 )
13
10
= 0 , 6 9 + 0 , 6 9 + 0 , 6 9 + 0 , 6 9 + 0 + 0 = 2 ,7 6 .
N o s e rechaza la h ip te sis n u la .
13
e)
103
103
13)2 ( 10 - J3)2
13
103
( 10 -
52
26
('100- 103)'
26
210,25 7,38
X2~ 14,76
412
(1 0 0 -1 0 3 )2 ( 0 6 -1 0 3 )2 (1 0 6 -1 0 3 f
13
4.
2<36
(O-E)2
210,25
1%)
1 m (103)
1 106 (103)
(1/2) (57)
Cambio
Promedio 43
14,5
= 28,5
(1/2) (57)
Cambio
No Percibido 14
= 28,5 -14,5
= i,
= 6,635.
Categora
! ) = ( 2 - J ) ( 2 - l ) = 1;
Punto de
= 0VCo^
= 70.0383 = 0 ,2 0 .
~ l)QVlss -I)-.
Punto d e c o r te x 2 n ecesario
(gl =
2 , 1 % ) = 9 ,2 1 1 .
10
16
(13)
(13)
26
16 (13)
10 (13)
16
16
26
32
42 (50%)
42 (50%)
(16)
(16)
84
1 0 - 1 3 ) J ----------
( 1 6 - 13)24,
( ------1 6 - 1 3 ) 2+ (
I0-1
3 )
2
"Yi (-----------q.
A
13
13
13
13
(16-16)2 (16-16)2
------------------- j ,
16
16
Q
s
i3
a
Su
O
Artefacto utilizado
en los hogares
fiT}-w
i O
O 8'=(WCol,-lXW6te- t t = ( 3 - l ) a - l ) =2;
x2 necesario (g = 2,1 %) = 9,211.
10
16
(12)
16
<W)
10
26
(12)
(14)
10 (12) 36 (46%)
16 (14) 42 (54%)
26
(1 0 -1 2 )2
12
(1 6 -1 2 )2
+
78
26
( 1 0 - 1 2 )2 ; ( 1 6 - 14)2
12 "+
(1 0 -1 4 )2 (16
12
14
14)2
4-
---- -
14
14
Mquina P ro cu ra d o r
de escribir de textos Ninguno
Lpiz
3&
100
40 200
(38-35)2 (14-14)2
35
+
14
Respuestas
655
6.
a)
C om u n id ad
B
A
A favor
12 (9,8) 6 (4,2)
En contra 1 8 (1 6 ,8 ) 3 (7,2)
No emite
opinin
T otal
C
Total
3 ( 7 ) 21 (23,33% )
1 5 (1 2 ) 36 (40,00% )
1 2 (1 5 ,4 ) 9 (6,6) 1 2 ( H ) 33 (36,67% )
42
18
30
90
4,2
16,8
C ap tu lo 15
1.
(3 - 7 , 2 ) 2
(1 5 -1 2 )2
( 1 2 - 15,4 )2
( 9 - 6 , 6 )2
7,2
12
15,4
6,6
....
11
(a)
0,05 = 0,22.
Potencia para un tamao d e efecto pequeo
= 0 , 1 1 ; m ediano = 0 ,6 6 ; grande = 0 , 9 9 . (Sobre
7.
la base de N - 1 0 0 ) .
c) Explicacin: V a se la respuesta al ejercicio 5c.
a) C lculo de x 2
Han
tratado
N o han
tratado .
Total
37 (5 2 ,9 )
51 (35,2)
7 0 (7 0 ,4 )
47 (4 6 ,8 )
4 0 - 4 9 hrs.
> 5 0 hrs. 2 2 8 (21 2 ,1 ) 1 2 5 (1 4 1 ,2 )
4 0 hrs.
88 (15,80% )
117 (21,00% )
353 (63,30% )
223
T o ta l 335
5 5 8 (1 0 0 ,1 0 % )
Ce)
( 3 7 - 5 2 ,9 f
52,9
(51 - 3 5 , 2 ) 2
+
( 4 7 - 4 6 , 8 )2
+
46,8
3 5 ,2
( 7 0 - 7 0 ,4 ) 2
*
70 ,4
(2 2 8 - 2 1 2 ,l ) 2
+
212,1
D atos sin
tra n sfo rm a r
R az c u a d r a d a
R angos
( 1 2 5 - 1 4 1 , 2 )2
+
141,2
b) cj> de Cramer
= ^ 4 , 9 2 / ( 5 5 8 ) 0 ) ] = V 2 7 = 0 ,1 6 ;
tamao del efecto pequeo.
c) 1 princip al halla zg o e s qu e las pro p o rcio
nes d e m d ico s que han tratado p a cien tes
co n hv /sid a e s m ucho m enor dentro del gru
po de m dicos que ejercen m enos d e 40 horas
por semana. D e todos m odos, se trata de un ta
mao del efecto pequeo. La explicacin para
una persona que nunca ha tom ado un curso de
estadstica sera sim ilar a la respuesta al ejer
cicio 5c anterior.
0 -4
5 -9
1 0 -1 4
1 5 -1 9
2 0 -2 4
2 5 -3 0
12
5
4
4
3
2
0 0,9
1 -1 ,9
2 -2 ,9
3 -3 ,9
4 -4 ,9
5 - 5 ,9
1
7
7
6
7
2
0 -4 ,9
5 -9 ,9
1 0 -1 4 ,9
1 5 -1 9 ,9
2 0 -2 4 ,9
2 5 -2 9 ,9
3 0 -3 4 ,9
4
4
6
5
5
5
1
O rigin a l /
0/
M!
2 Ul
3/
m
5/
6/
7/
8
9//
10//
11/
12/
13
14
15
R ango
1
3
3
1
4
1
1
1
1
3
6
8
10,5
13
14
15
0 ,0
1,0
1,4
1,7
2,0
2 ,2
2 ,4
2 ,6
2
2
1
1
16,5
18,5
20
21
3,0
3,2
3,3
3,5
O ri
gn a l /
14
15
16//
17/
18/
19
20/
21/
22
23/
24
25/
26
27
28/
R ango
- f
2
1
1
22,5
24
25
4 ,0
4,1
4,2
1
1
26
27
4,5
4,6
28
4,8
29
5,0
30
5,3
2.
4.
Observacin:
201 523 614
Rango:
2 5 6
M:
G ru p o A
G ru po B
1,1
1,6
2,1
1,9
2 ,7
1,88
0,35
= 0 35
1,4
3 ,0
2,4
2,6
2 ,2
2,32
0,35
r=
*=
!
5a
&'Diferencia
0,07
= ,0 7 + 0.07 " 0 .1 * W * . 0,37
t - (1 ,8 8 - 2 ,3 2 )/0 ,3 7 = i , 19
conclusin: no se rechaza la hiptesis nula,
c) E xplicacin: no habra sido adecuado realizar una
prueba t con los nmeros tal com o estaban (sin
transformarlos). Las distribuciones de las m ues
tras eran tan asim tricas para am bos grupos
idiom ticos que pareca probable que la distribu
ci n poblacional tambin fuera considerablem ente
asimtrica. En e se caso, no s e cum plira el
supuesto para la prueba t que establece que las dis
tribuciones poblacionales im plcitas son normales.
Por lo tanto, s e calcul ia raz cuadrada de cada
observacin, A travs d e ese proceso s e obtuvo la
posibilidad de crear una distribucin muestra!
m ucho ms cercana a lo normal, y que, por lo
13/3 = 4,33
8/3 = 2,67
24/3 = 8 GM = 5
S2:
8,67/2 = 4,34
4,66/2 = 2,33
2 /2 = 1
Punto de corte F necesario ( g l = 2 , 6 ; p < 0 ,0 5 ) = 5 ,1 4
S2 * == ( S S / g m = (4 ,3 3 - 5)2 + (2,67 ~ 5 ) 2
+ (8 - 5)2]/(3 - 1) )(3 ) = (1 4 ,8 8 /2 )(3 ) = 2 2 ,3 2
= (4 ,3 4 + 2,33 + 1)/3=2,56; F = 2 2 ,3 2 /2 ,5 6 = 8,72
C onclusin: s e rechaza la hiptesis nula.
c ) E xplicacin: com nm ente, en estos casos en
ios que se prueba la significacin de la d ife
rencia entre tres m edias, se realizara un anli
sis estndar de varianza de un criterio. S in
em bargo, un supuesto del anlisis de varianza
establece que las poblaciones correspondien
tes a cada grupo estn distribuidas normal
m ente. Segn la muestra, las calificaciones
dadas por e l grupo que mir la pelcula que
causaba tristeza parecan m uy asim tricas ha
cia la izquierda y, posiblem ente, las califica
cion es del grupo que v io la p elcula que
causaba enojo tam bin lo fueran. (E s ms,
exista bastante diferencia entre las estim acio
nes de varianza poblacional d e l grupo d e la
pelcula triste y del grupo de la pelcula alegre,
hecho que cuestiona otro de los supuestos del
anova,
5.
4,67
2,67
3,33
1,33
1,33
0,67 -0 ,6 7
-4 ,6 7 - 4 -2 ,6 7 - 2 -3 ,3 3 - 2 -1 ,3 3 -1 ,3 3 - 0 ,6 7 -0 ,6 7
Las diferencias de m edia, ordenadas de menor
(m s negativa) a mayor, son las siguientes:
-4 ,6 7 , - 4 , -3 ,3 3 , -2 ,6 7 , -2 , - 2 , - 2 , -1 ,3 3 , -1 ,3 3 , -0 ,6 7 ,
-0 ,6 7 , 0 ,6 7 ,0 ,6 7 , 1,33, 1,33, 2, 2, 2 ,6 7 , 3 ,3 3 ,4 , 4,67
b) Explicacin: supongam os que realizar la prue
ba so lo o frente a un am igo no im plicaba nin
guna diferencia. En ese caso, la razn por la
cual los valores observados de las personas
analizadas son m ayores cuando se encuentran
a solas debe de ser que la asignacin aleatoria
accidentalm ente ubic, dentro de ia condicin
en la que se encuentran a solas, ms personas
6.
Comparacin:
gl
70
70
Punto de corte
1 ,9 9 5
iii)
S l
3 ,9 8
( f
Varianza
intragrupal
t F
2 ,5 6
Mtx0 = 4 4
S l emr^ 4 4
6 ,5 5
= 1 ,9 9 5 )
( V = 2 ,5 6 )
Prueba z:
Punto de corte
( g l = 30 , p < 0,05, dos colas) = 2,043
S2Combinada 1500118 + (D5/30H 6)) =
S2m =7/16 = 0,44; S2M 2 = 7/16=0,44;
7;
Captulo 16
1.
anova:
2,571
6,61
6,61
F
2. i )
10
2,228
4,96
4,97
S :
t
15
2,132
4,55
4,54
20
2,086
4.35
4,35
anova:
Comparacin:
Punto de corte F ( g l - 1, 58; p < 0,05) = 4,02
S^etre = (S C /g l) (n ) = ({[(12 - 11,55)2 +
(11,1 - 11,55)2]/= (2 -1)}(3 0 )
- (0,405/l)(30) = 12,15
^dentro = (2 -4 + W 2 = 2 <^ F *= 12,15/2,6
= 4,67
Se rechaza la hiptesis nula.
gl
Punto d e corte
Varianza
intragrupal
t F
58
58
2,004
4,02
= 2.6
5 ^ = 2.6
2,16
4,67
(-T
Punto de corte
Varianza
intragrupal
30
2,043
S%
mf0 = 7
30
4,17
( f =2,042)
= 2 ,0 0 5 )
C T = 2 ,1 6 )
Clculos prueba t
Punto de corte
( g l = 18, p < 0,05,
dos colas): 2,101
Diferencia media
= 1 7 0 -1 5 0
=
i)
20
S L , = 7
2,13
4,57
0 T = 2 ,1 4 )
Clculos a n ova
Punto de corte F
(gl = 1,18; p <0,05): 4,41 (vr =2,1)
GM = (170 + 150)/2
= 320/2=160
2 ( M - G M ) 'l = ( 1 7 0 - 1 6 0 ) 2
+ (1 5 0 -1 6 0 )2
= 102+ (-10)2
= 100+100=200
'^emre^^entre
anova:
t F
3.
Comparacin:
gl
= (SC/gl)(n)
E (M - G iV f) \n)
= ( { [ ( 1 0 0 - 1 0 2 ) 2 + (1 0 4 - 102)2]/
entre
= ( 200/ 1) ( 10)
= (2 -1 )} (36)
= (8 /l)(36) = 288
5^dentro = (40 + 48V2 = 44i F 288/44 = 6,55
Se rechaza la hiptesis nula,
Total =
= 9 + 9=18
dentro
= ^ l + S l2 + - + S l mmo
= 9 + 9=18
^Combinada ^ l ^ T o t a l ^ ^ P
2 (X - G M f SCTiJtll = 7 1 + 8 3 = 154
^ " d e n tr o ^ ^ '^ d e n t r o
+ teV^TbnJ&i) C52! +
+
(0,5X 48) + (0 ,5)(32)
+ ^ltino) ^^GntprJ
= 2 4 + 1 6 = 40
S ( X - M ) 2 5 C de(Ur0 = 26 + 8 = 34
(M - GM)2 S C m m = 45 + 7 5 = 20
= ( 4 8 + 3 2 ) / 2 = 40
C2
Diferencia
Gradas de libertad:
^M + ^M2
S/Totai = / V ^ l = 8 - l = 7
" ^ C o m b in a d a ^ l^ + ^ C o m b in a d a ^ )
S ^cnm = g l + g l 2 + - - - + U ltim o = 4 + 2 = 6
= (4 0 /1 0 ) + (4 0 /1 0 )
centre ~ ^Grupos 1 ~ 2
=4+4=8
Diferencia
=r
02
J Diferencia
= aT 8 = 2 ,8 3 .
= (M t ~
1~1
CM = $C fe -120/1-120
*=*> f: F =
6 d mJCM &m
F - <2entre/v2dentro
^Diferencia
= 2 0 /2 ,8 3
^ ^Ksntre^Htentro
= 7,0 7
= 2 .0 0 0 /4 0 = 5 0
= 120/5,67 = 21,16
(5 s = 7,0 7 )
Se rechaza
la hiptesis nula.
S e rechaza
la hiptesis nula.
^ = ^ ^ ^ = 120/154 = 0.78
C orrelacin (Grupo A = 1, Grupo B = 0):
4.
GM = (85 + 2 7 )/8 = 14
G r u p o (X )
X
G rupoA
X
X - GM
D esv
13
16
19
18
19
2
-1
2
5
4
5
1
4
25
16
25
_4
16
-1
2
1
2
1
4
1
4
71
85
M - GM
X -M
D esv D esv 2
3
3
3
3
3
9
9
9
9
9
45
26
M = 17
G rupo B
X
X - GM
D esv
2
M -
X~M
D esv 2 D esv D e s v 2
M - GM
D esv
D esv 2
-3
-5
25
7
9
-7
-5
49
25
-2
0
4
0
-5
-5
25
25
83
O r -
O ri-
g in a l
g in a l
Z XZ y
13
- 0 ,2 2
- 0 ,1 7
17
-4
16
0,77
0,77
16
0 ,4 6
0,35
17
0,77
19
1,14
0,88
17
-1
2
0,77
18
0 ,9 2
0,71
17
0,77
19
0,88
17
1
2
1
4
0
0
--1,29
*-1,29
11
1,14
-0 ,6 8
2,06
-2
--1,29
-1 ,6 0
-1 ,1 4
1,47
2 :5
11
27
O b se rv a c i n (Y )
75
M = 0,625
112
14
S C = 1 ,8 7 4
154
S D ~ 0 ,4 8 4
4,387
0,88
7 ,0 6
r = 0 ,8 8 r 2 = 0,77
= ( 1 5 4 - 3 4 ) /! 54
= 1 20/154 = 0,78
E rro r E rro r
34
G ru p o (AT)
O r ig in a l
1
1
1
0
0
0
2
2*
1
1
1
-1
-1
-1
O b se rv a c i n ( Y )
O r ig in a l
2 .
.y
0,7
0,9
0 ,8
0 ,6
0,4
0,2
0 ,4 2
1,26
0 ,8 4
0 ,0 0
- 0 ,8 4
-1 ,6 8
3,6
0,6
0 ,2 3 8
r = 0 ,8 4
3
M = 0,5
S D = 0 ,5
, 8
Z A
0 ,4 2
1,26
0 ,8 4
0.00
0,84
1,68
5,04
= OM-F/FIu
Similitudes:
F
M edia de Y ~ 14
Gran m eda = 14
5CTo(al = 154
^Tbtal ~
Y predicha
para Grupo A = 17
M edia de grupo A = 17
Y predcha
para Grupo B - 9
M eda de grupo B = 9
5 ^ = 34
*W 34
i2 = 0,77
R2 - 0,78
5.
Prueba :
= 0,0083;
Captulo 17
1.
e)
f)
g)
h)
i)
L o s n m e r o s en p a r n te s is se r efie re n a lo s c a p
tu lo s e n io s q u e el t r m in o fu e p r e se n ta d o o tr a
ta d o s u s t a n c ia lm e n t e .
A lfa (a ): probabilidad de com eter un error T ipo I; es
igual al nivel d e sig n ifica c i n (8), Tambin e s la for
m a corta de referirse ai a lfa de C ronbach, (17)
A lfa de C r o n b a c h s (a ): ndice de confiabilidad de
m edidas am pliam ente utilizado, que equivale al pro
m edio de las correlaciones por m itades de todas las po
sibles d ivision es en mitades de los tem s d e una
prueba. (17)
A n lisis causal: procedim iento, tal com o e l anlisis
de sendero o el m odelo de ecuacin estructural, que
analiza correlaciones entre un grupo de variables en
funcin de un patrn predicho de relaciones causales
entre ellas. (17)
A n lisis
de
co v a ria n za
( a n c o v a ): a n l i s i s d e v a r i a n z a
q u e s e r e a liz a d e s p u s d e a d a p ta r la s v a r ia b le s p a r a
c o n t r o la r e l e f e c t o d e u n a o m s v a r ia b le s a d ic io n a le s
n o d esead as.
(17)
M e d ic i n d e in te r v a lo s ig u a les: m e d ic i n en la .
qu e la d iferen cia entre cualqu ier par d e v a lo res re
p resen ta la m ism a d iferen cia d e l a sp ecto im p lc ito
bajo m ed ici n . (1 5 )
M ed ici n d e r a n g o y orden: m edicin en la que los
valores m ayores representan m s del aspecto im plcito
que s e est m idiendo, pero en la que la diferencia entre
dos registros cualesquiera no representa e l m ism o ni
vel de diferencia del aspecto im p lcito qu e se est m i
diendo; es igual a la v a ria b le o r d in a l. (1 ,1 5 )
M e d ic i n o r d in a l: es ig u a l a la m e d ic i n d e r a n g o
y o r d e n . (1 ,1 5 )
M eta -a n lisis: m todo estadstico para com binar los
resultados de estudios independientes, usualm ente en
focado en los tamaos de efecto. (8 )
M to d o s in ten siv o s p o r co m p u ta d o ra : m tod os e s
tadsticos que incluyen procedim ientos de prueba de
hiptesis, los cuales involucran grandes cantidades de
clculos repetidos. Estos m todos s lo se han hecho
posibles ltimamente gracias a la disponibilidad de
computadoras.
M o d a : el valor con m ayor frecu en cia en una distri
bucin. (2)
M o d e lo c a u s a l: en el m o d elo d e ecu a ci n estru ctu
ral, e s la serie de sen d ero s ca u sa les entre variables
latentes. (1 7 )
M o d e lo d e c u a d ra d o s m n im o s: m todo usual de de
terminacin de lo s valores ptim os de lo s coeficientes
de correlacin; e so s valores ptim os son los que pro
ducen el m enor error cuadrtico en lo s valores predi
chos. (16)
M o d e lo d e ecu a ci n estru ctu ra l: versin sofisticada
del anlisis de senderos, que incluye senderos que in
volucran variables tericas - n o m ed id a s-, latentes, y
que adem s permite realizar una esp ecie de prueba de
significacin y proporciona m edidas de la concordan
cia general de lo s datos con el patrn causal hipottico;
tambin se denom ina m o d elo d e v a r ia b le la ten te y
L S R E M 1 7 )
M o d elo d e m ed ici n : en el m odelo de ecuacin es
tructural, es la serie de senderos causales entre la va
riable latente y la variable manifiesta. (17)
M o d e lo d e p red icci n : frm ula para realizar predic
cion es; es decir, frmula para predecir e registro de
Glosario
67 7
Glosario de Smbolos
nales. (4)
d ; tamao de efecto en estudios que incluyen una o
dos medias. ( 8-
10)
varianza. ( l )
iS2m1,
^columnas
canfidad de colum nas, cantidad de
filas (en el anlisis factorial de varianza). (13)
catlddad de casillas en un diseo factorial, (13)
^Grupos* cantidad de grupos en el anlisis de varianza.
p \ probabilidad. (5)
r: coeficien te de correlacin. (3)
f2 : reduccin proporcional de error (proporcin de va
rianza justificada) en una regresin bivariada. (3)
R: coeficien te de correlacin mltiple. (4, 12)
R 7: reduccin proporcional de error (proporcin de
o independiente. (1 - 4 )
X , X T etc.: primera variable independiente o de pre
Referencias bibliogrficas
A l e x a n d e r , C . N ., LANG Er, E . I , N
ew m an,
Bardslby. J. J., & Rhodes, S. R. (1996). Using the SteersRhodes (1984) framework to identify correlates of
em ployee lateness. J o u rn a l o f B u sin ess a n d P sy ch o
logy, 1 0 , 351-365.
lo g y Bulletin.
BOYD,
C h iu ,
(1978).
Lottery winners and accident victims: Is happiness re
lative? Jou rn al o f P erso n a lity a n d S o c ia l P sych ology,
3 6 , 917-927.
r ic k m a n ,
P , C o a t e s , D . , & Ja n o f f - B u l m
an
, R.
12, 100.
B uss, D. M., & S c h m i t t , D. P, (1993), Sexual strategies
theory: An evolutionary perspective on human mating.
P sych o lo g ica l Review, 100, 204-232.
R. B .,
row n,
S. L.,
L ew
is ,
B. P ,
Luce,
C., &
S. L. (1997). Reinterpreting the empathyaltruism relationship: When one into one equals one
ness. J ou rn al o f P erso n a lity a n d S o c ia l P sych o lo g y,
73, 481-494.
N
eubero,
C a p a l d i, D .
53 1 -5 4 1 .
C
a s p i,
A B
egg,
D ., D
ic k s o n ,
N . , H a r r i n g t o n , H ., L a n
tin, 1 1 2 , 155-159.
gley,
1052-1063.
C
a s p i,
atanzaro,
171-188.
a n , H. A ., H o b f o l l , S. ., & R i t t e r , C. (1997).
Partners' stress underestimations lead to womens dis
tress: A study o f pregnant inner-city women. Journal
o f P erso n a lity a n d S o c ia l P sych ology, 73, 418-425,
Chapm
Ch a se,
Cohen,
J., &
Cohen,
N ew York Tunes, p. D - i .
C o r t in a ,
, N . R ., C a s a s , J . F ., & M o s h e r , M . (1 9 97). Re
lational and overt aggression in preschool. D e v e
lo p m e n ta l P s y c h o lo g y , 3 3 , 5 7 9 -5 8 8 .
r ic k
ah lstr o m
, W . G ., L
arbar
, D ., & D
ah lstr o m
, L, E.
ane
DARLINGTON, R . B. (1 9 9 0 ). R e g r e s s io n a n d lin e a r m o
d e ls. N e w York: M cG raw -H ill.
Everett, S. A., Price, l H B edell, A. W., & T eluohann, S. K. (1997). The effect o f a monetary incentive
in increasing the return rate o f a survey to family phy
sicians. E va lu a tio n a n d th e H ea lth P ro fessio n s, 20,
207-214.
c e s : M e th o d o lo g ic a l is s u e s (pp. 3 5 1 -3 6 7 ). H illsda
e l u c c h i,
h a n d b o o k f o r d a ta a n a ly s is in th e b e h a v io r a l s c ie n
unlap,
W.
D w in e l l ,
E n d l ER,
E ppley,
Franz, M. L.
F r ic k ,
C om puters.
a m il t o n ,
a r r is ,
arter
allup,
G aufon,
G
P. A. (1988). Theory-free statistics and theorybased statistics: Their appropriate roles in the repor
ting o f scientific results. J o u rn a l o f E x p erim en ta l
E ducation, 57, 4 7 -5 8 .
S & G
r eenh o u se,
B o x s r e s u l t s o n t h e u s e o f
v a r ia t e a n a l y s i s .
(1958). An extension o f
t h e F distribution in m u l t i
G., &
ig e r e n z e r ,
urray,
D. J. (1987). C ognition a s in
ig e r e n z e r ,
&
HjEOLBRUN, a
E. R. (1987). P s y c h o lo g y in A m e r ic a : A h is to
novich.
in d l e y ,
C.,
F il h o z a t , a
., K l a c k e n b b r g , G., N icolet-
e is t e r ,
m an B iology, 3 8 , 364-379.
Holden,
raham
il g a r d
Press.
azan
H io h l e n ,
H .,
h it e s e l l ,
ir e ,
ough,
eatty,
o sset,
L. M .,
P e t t it t ,
Herm ann,
29, 8 8 5-891.
G
S ., W aters, P. L
S.
A n n a ls o f M a th em a tica l Statistics,
a m es,
e is s e r ,
G.
W ., T
h o m pso n ,
E.
am barano
R. J.,
&
arsh a ll,
Holzw orth,
G
reenw ald
, A. G.
sio n P ro c esses, 6 8 ,1 7 1 - 1 7 9 .
H
C. M ., W a l k e r , M . L ., B e c k e r , D . F., E d e l l ,
W. S., & M c G l a s h a n , T. H. (1 9 9 7 ). Personality di
sorders m adolescents w ith major depression, subs
tance use disorders, and coexisting major depression
and substance use disorders. J o u rn a l o f C o n su ltin g
a n d C lin ic a l P sy ch o lo g y , 65, 3 2 8 -3 3 2 .
r il o ,
o p k in s ,
K. D ., &
G lass,
Hall.
H
unter,
test. P s y c h o lo g ic a l Science, 8 , 3 -7 .
H
u sse r l ,
H amilton , D . (1 9 8 1 ), C o g n itiv e p r o c e s s e s in s t e
um p
, B.
r e o ty p in g a n d in te r g r o u p b e h a v io r. H illsdale, NJ:
Bribaum.
&
cal Association.
Kraem
s c ie n c e
, H.
C., &
h ie m a n n
^ S.
(1987). H o w m a n y
9 6 5 -9 7 9 .
, V. S. Y ., B o n d , M. H & S i n g e l i s , T. M. (1997).
Pancultural explanations fo r life satisfaction: A d
d in g relationship harm ony to self-e stee m . J o u r
775-790.
n a l o f P e r s o n a lity a n d S o c ia l P s y c h o lo g y , 7 3 ,
rary perspective. n: R. lessor, A . Colby, & R. A . Shweder (Eds.), E th n ograph y a n d hum an d e velo p m en t:
C on text a n d m ea n in g in s o c ia t in q u iry (pp. 3 - 14).
Johnson, C ,
w an
1038-1051.
er
am bert,
L e v e n t h a l , L ., & H u y n , C -L . (1 9 9 6 ) . Directional d e
e w is ,
L i n d z e y , E . W ., M i z e , L , & P
e t t it ,
G . S . (1 9 9 7 ). M u
J. (1994). G a le n s p ro p h e cy : T em peram en t in h u
K arney , B. R., & B r a d b u r y , T. N. (1997), Neuroticism, marital interaction, and the trajectory of mari
tal satisfaction. J o u r n a l o f P e r s o n a lity a n d S o c ia l
P s y c h o lo g y , 72, 1075-1092.
arkm an
axw ell,
leun
414-429.
McCracken, G. (1988). T h e lo n g
in te rv ie w .
London: Sage.
A th e o r e tic a l a n a ly s is a n d a r e v ie w o f th e e v id e n c e .
Min
C h ild
D e v e lo p m e n t, 6 8 ,
MoriaRTY, S. E
.,& Everett, S-L. (1994). Commercial
breaks: A viewing behavior study. J o u r n a lis m Q u a r
te r ly , 7 1 , 346-355.
M ueller, J. H., Elser, M. J., & P ollack, D. N. (1993).
Test anxiety and implicit memory. B u lle tin o f th e P s y c h o n o m ic S o c ie ty , 3 1 , 531-533.
Myers, D. G. (1991). Union is strength: A consumers
view of meta-analysis. P e r s o n a lity a n d S o c ia l P s y c h o
lo g y B u lle tin , 1 7 , 265-266.
N ezlek, J. B., Kowalski, R. M., Leary, M. R., B levins,
T , & HolgaTE, S. (1997). Personality moderators of
reactions to interpersonal rejection: Depression and
trait self-esteem. P e r s o n a lit y a n d S o c i a l P s y c h o l o g y
B u lle tin , 2 3 , 1235-1244.
Norcross, J. C., Hanych, J. M., & Terranova, R. D. (1996).
Graduate study in psychology: 1992-1993. A m e ric a n
P s y c h o lo g is t, 5 1 , 631-643.
Norman, C., & A ron, A. (1997, June). Shared expansion
experiences and relationship satisfaction. En: C. Nor
man. (Chair), H o w to m a k e y o u r r e la tio n s h ip w o r k :
S p e c u la t io n s b a s e d o n h a r d r e s e a r c h . Symposium
conducted at the International Network on Personal
Relationships Conference, Oxford, OH.
Oakes, M. (1982). Intuiting strength of association from
a correlation coefficient. B r itis h J o u r n a l o f P s y c h o
lo g y , 7 3 , 51-56.
OltHOFF, R. K. (1989).
T h e e f f e c tiv e n e s s o f p r e m a r i t a l
c o m m u n ic a tio n tr a in in g .
T h e h is to r y o f s ta t i s t i c s in th e 1 7 th
a n d 1 8 th c e n tu r ie s .
PETERS,
W, S. (1987).
London: Griffin.
C o u n tin g f o r s o m e th in g : S ta ti s t ic a l
p r in c ip le s a n d p e r s o n a litie s .
Verlag.
Phillips, L. D. (1973). B a y e s ia n
tists. London: Nelson.
s ta tis tic s f o r s o c ia l s c ie n
A th r e e - d e c a d e re v ie w . P e r s o n a lit y a n d S o c ia l
P s y c h o l o g y B u lle tin , IS ,
465-472.
T h e M o n te C a r lo m e th o d : T h e m e th o d o f s t a t i s t i c a l
S c h m id t ,
study. P e r s o n a l i t y
2 3 , 928-937.
a n d S o c i a l P s y c h o l o g y B u lle tin ,
S ucceed
w ith m a th : E v e r y s t u d e n t s g u i d e to c o n q u e r in g m a th
a n x ie ty
23,
427-438.
C o n s t r u c t v a l i d a t i o n o f a tr ia n
Unpublished manuscript, Ya
le University, Department of Psychology, New
Haven, CT.
g u la r th e o r y o f lo v e .
S tigler , S. M. (1986). T h e h i s t o r y
bridge, MA: Belknap Press.
o f s ta tis tic s .
Cam
1091-1102.
Tabachnick, B. G., & FtDELL, L. S. (1996). U s in g m u lti
v a r ia t e s t a t i s t i c s (3rd ed.). New York: Harper & Row.
T ankard , J,, Jr. (1984). T h e s t a t i s t i c a l p i o n e e r s . Cam
bridge, MA: Schenkman.
T erpstra , D, E., & R ozell , E, J. (1997), Sources of
human resource information and the link to organi
zational profitability, J o u r n a l o f A p p l i e d B e h a v i o
r a l S c ie n c e , 3 3 , 66-83.
T
h o m p so n
T obias, S. (1987),
C ensus . (1990). S t a t i s t i c a l a b s
Washington, DC: U.S.
Government Printing Office.
of the
t r a c t s o f th e U n i t e d S ta te s .
S ternberg, R. J. (1988).
U.S. B ureau
S u c c e e d w i t h m a th : E v e r y s t u d e n t s
g u i d e t o c o n q u e r i n g m a t h a n x ie t y .
New York: Co
1672-1677.
W eller , A., & W eller , L. (1997). Menstrual synch
rony under optimal conditions: Bedouin families.
J o u r n a l o f C o m p a r a t i v e P s y c h o l o g y , 1 1 1 , 143-151.
W htecotton , S, M. (1996). The effects o f experience
and a decision aid on the slope, scatter, and bias of
earnings forecasts. O r g a n i z a t i o n a l B e h a v i o r a n d
H u m a n D e c i s i o n P r o c e s s e s , 6 6 , 111-121,
lo u m a l o f P e r s o n a lity
154-164.
A
Abrams, R. A,, 264
Agresin a travs de relaciones, 591-93
Alfa de Cronbach, 565
Alfa, V a s e alfa de Cronbach; error Tipo I
Allport, Gordon, 59
Altman, D, G., 170-71
Anlisis de covarianza multivariado, 576-577
Anlisis de covarianza, 575-76
Anlisis de senderos, 570
Anlisis de sistemas, 60
Anlisis de un caso, 59,601
Anlisis de varianza de cuadrados mnimos, 444
Anlisis de varianza de dos criterios, 410
clculo de, 425-26
ejemplo de, 428-36
frmulas de clculo para, 455-57
grados de libertad de, 426-28
lgica de, 420-21,424-36
modelo estructural para, 424
razn F en, 420-21,424.
resumen del procedimiento, 436-37
supuestos de, 436
tabla para, 428
Anlisis de varianza de medidas repetidas, 443-44,
457-59
Anlisis de varianza de tres criterios, 443
Anlisis de varianza de un criterio, 346, 410
Anlisis de varianza multivariado, 444, 576-577
Anlisis de varianza, 345-71. V a s e tambin anlisis
factorial de varianza, modelo estructural
analoga, 353
como caso especial de coeficiente de correlacin
mltiple, 541-47,549
como forma de pensar, 381
controversias, 368,397
B
Bardsley, J. 1 ,7 5
Barras de error estndar, 227
Baumrind, D., 552
Bayes, Thomas, 168
Behaviorismo, 58
Bell, Julia, 463
Beta. V a s e coeficiente de regresin estandarizado;
error Tipo I
Biener, L., 200
Biemat, M., 582
Biometria, SI, 533
Biomtrika, 464
Blanchard, R A 432,457
Boyd, C. P 585
Brickman, R, 187
Buck, J. L.,27
Buffon, 330
Burke, C. J,, 486
Bush, George, 164
C
C de Cochran, 582
Capaldi, D. M 575
Carey, M. R, 524
Carga factorial, 568
Carroll, R, 11
Casilla, 411
D
d de Cohn, 247
Dae, F. C., 36 In
Darwin, Charles, 81
Dato estadstico phi de Cramer, 483-484
DeGarmo, D. S.. 576-77,593
Delaney, H. D .,445
Deaney, S. E., 446
Delucchi, K. L., 486
DeMoivre, Abraham, 148,150
Desempeo matemtico, 27-28
Desensibilizacin sistemtica, 14
Desmaris, S., 454
Desvo cuadxtico, 43,378-79
Desvo estndar de una distribucin de medias, 208,
225,280-81
Desvo estndar de una distribucin de diferencias entre
medias, 318
Desvo estndar, 45-51. V a s e tambin varianza
definicin de, 45
descripcin de, 45
ejemplo de, 45,47
frmulas de clculo, 50-51, 65-66
frmulas para, 46-47
segn se describe en publicaciones cientficas, 60-61
Desvo medio, 45n
Desvo promedio, 45n
Desvo, 43
Dewey, Thomas, 164
Diagramas de dispersin, 71-76, 85
cmo crear, 71
ejemplo de, 72-73
Dicotomizacin, 444-445
Diferenciacin relacionada, 91
Direccin de causalidad, 91
Diseo cuasiexperimental, 598
Diseo de investigacin con grupo de control
equivalente y pruebas previa y posterior, 598
Diseo de investigacin con grupo de control
equivalente, 598
Elser, M. J., 14
Encuesta Crossley, 164
Encuesta de Gallup, 164,218
Encuesta de Roper, 164
Encuestas telefnicas, 164,170-71,213
Encuestas, 164, 213
Entrevistas, 60
Eppley, K. R 264
F
Factor agrupacin de medidas repetidas, 458
Factor, 568
Fawzi, M. C. S., 585
'
Punto de corte para, 360,613
tabla F y , 352-53
Fenomenologa, 58-60
Fermat, Pierre, 159
Fidell, Linda, 548
Finley, H. C., 60
Fisher, Ronad A., 352-53,463, 486, 5 S, 533, 578, 579
Foertsch, J., 225
Folwell, A, L., 490
Ford, I. D., 520
Forgatch, M, S., 576-77, 593
Forma de la distribucin de medias, 208-09
Frmula de prediccin con puntuaciones originales, 113
Frmulas de clculo, 50, 84
Frmulas de definicin, 50,84
Frank, S. J., 566
Frecuencia esperada, 465,474-476
Frecuencia observada, 465
Frecuencia relativa esperada, 157
Frecuencia relativa, 157
Frecuencia, 157
Frick, R, W,, 169a, 186,266-67
Frisch, A. S., 335
G
Cableo, 552
Galton, Francis, 81,8 2 ,1 6 8 ,4 6 3 ,5 3 3
Gangestad, S. W., 31,105
Gauss, Kart Friedrich, 148,149
Gnero, 26-28
. Gemsbacher, M. A 225
Gigerenzer, G., 254,579,580
Gire, I.T., 586
Glass, G. V., 167
Gosset, Wilfiam S., 81,276-77,301,302,
352,463,518,533
Grado de correlacin, 79-82.
V a s e tambin coeficiente de correlacin
Grados de libertad del denominador, 359-360
Grados de libertad del numerador, 359-60
Grados de libertad intergrupales, 359-60
Grados de libertad intragrupaes, 359-60
Grados de libertad, 280,315
anlisis de varianza de dos criterios y, 394-96
denominador, 359-360
intragrupaes, 359-360
numerador, 359-360
prueba chi-cuadrado de independencia y, 477-478
Grabara, S., 143
Gran correlacin, 95-99
I
Imn, R. L., 510
independencia, 473
ndice de Atencin aAlternativas, 523
J
anoff-Buman, R., 187
Jehn.K. A, 137
Jung, Cari, 60
K
fant, Immanuel, 552
Keley, H. H 381
Kenney, D. A., 422
Kiein, D. R, 369
Kleinmuntz, B,, 132
Kotovsky, K., 195
Kulik, I A., 447-448
Kunda, Z 451,452
Kurtz, M., 335
Kwan, V. S. Y., 573
L
La poca dorada de la estadstica, 533
Lamben, A . L, 2 9 9 -3 0 6 ,4 1 5 ,4 2 0 ,4 2 1 ,4 2 4 ,4 4 3 ,4 4 7
Narcisismo, 199
Newton, Isaac, 149
Neyman, Jerzy, 578-79
Nezlek, J. B., 136
Niveles de medicin, 5-6
Niveles de significacincondicionales, 183
Norcross, I. C., 28
Normal bivariada, 551
Norman, C., 318,322,334
Nmeros seudo aleatorios, 518
O
Oakes, Michael, 96
Oleson, K. C, 45, 452
Olthoff, R. K 290-93,304
Observacin del participante, 601
Operaciones formales, 381
Orbach, I., 60,397,398
P-
Publicaciones cientficas
anlisis de varianza segn se describe en, 369-70
prediccin bivariadasegn se describe en, 136
procedimientos estadsticos avanzados segn se
describen en, 559-83
prueba ch-cuadrado segn se describe en, 487-88
Punto muestral de corte, 181-83
Puntuacin i, 284,318-19,532-534
Q, 520 [Qs o r t]
R
Rango, 43q, 94
Razn F , 351,352,532-34
V a s e tambin estimacin intergrupal de varianza;
estimacin intragrupal de varianza
anlisis de varianza de dos criterios y, 420
del efecto interactivo, 421,422
determinacinde, 421,424
de los efectos principales, 421
frmulas del, 358
Reber, P. J 195
Reduccin proporcional del error. V a s e porcentaje de
varianza explicada
Reflejar, 502
Registros de rango y orden, 506
Registros, 4-5
Regla de la adicin, 173-74
Rega de la multiplicacin, 174
Regresin! correlacin mltiples, 125-26,128
coeficientes beta de, 126-127
controversias, 135-36
correlaciones y, 126-27
definiciones de, 125
ejemplo de, 128-29, 133-135
frmulas de, 130,133
jerrquica, 561-563,564
limitaciones, 135-36
s
Sanbonmatsu, D. M., 28
SantoToms deAquiso, 552
Sedlmeier, R, 254
Seleccin aleatoria, 60
Seleccincasual, 162
Seleccin sistemtica, 368-69
Sellis, R. M., 567,568
Sesgo de respuesta, 605
Sesgo del experimentador, 603
Shah, F. P., 137
Shamsuddin, K., 335
Shapiro, D. A., 269,591
Shapiro, D 269
Sharp, Maa, 463
Shaver, Philip, 345,349, 352-53, 399, 541
Shear,264
Shi, L., 491
Shreider.Yu. A,,331
Siege, M., 200
Sigma, 37,46,162
Significacin estadstica, 91,261-62,266-67
niveles convencionales de, 183
Significacin prctica, 261:62
Significacin.Vase significacin prctica; significacin
estadstica
Smbolos estadsticos, 37,46,111,162,165,280
Simpson, O. J., 143
Simpson, Thomas, 149
Sknner, B. R, 58,601
Snedecor, George, 353
Sociologa, 170
Sondeos de opinin, 164
Sondeos, 164
Speed,A.,31,105
Stasney, R., 28
Steil, Janice, 479,485,487
Stipek, D. J., 195-96
Sumade desvos cuadrticos, 43,-378-79
estimaciones de la varianza poblacional y, 379
frmulas de clculopara, 405
Sumade errores cuadrticos 121
Supresin, 135n
Supuestos, 296
T
t de Student. Vaseprueba t
Tabachnick, Brbara, 548
Tabla chi-cuadrado, 466
Tabla de nmeros aleatorios, 518
Tabla F, 352-53,359-60
Tablar, 282-84
Tablas de contingencia, 473
Tablas de frecuencias agrupadas, 7-1V
cmo crear, 9-10
definicin de, 8
ejemplo de, 10-11
Tablas de frecuencias, 2-11
agrupadas, 8-11
controversias, 24-25
definicin de, 2
ejemplode, 6
limitaciones, 24-25
procedimientos paracrear, 6-7
segn se describen en publicaciones cientficas,
28-30
tamaos de intervalos iguales en, 9,25-26
tipos de, 4
u
Unidad causativa, 463
Utilizacin de clculos estadsticos multvariados, 548
y
Valenzuela, 322,324,328,334,342
Validez concurrente, 605
Validez de constracto, 605-606
Validez de contenido, 605
Validez de criterio, 605
Validez extema, 603
Validez intema, 603
Validez predictiva, 605
Validez. V ase tambin conftabilidad
concurrente, 605
criterio, 605
de constructo, 605-06
de contenido, 605
predictiva, 605
sesgo de respuesta, 605
Valor crtico, 181
Valor estadstico chi-cuadrado, 462,465-72
clculo de, 466
controversias, 486-87
definicin de, 466
distribucin de, 466-67
limitaciones, 486-87
Valores atpicos, 496
Valores diferenciales
desvo estndar de, 301
media poblaconal de, 289-90
potencia de estudios que utilizan, 302
Valores, 3-5
Van Aken, M, A. G., 339
Van Lange, P, M., 402
Variable categrica, 462
Variable de criterio, 71,110
Variable dependiente, 70-71,110,596
Variable nominal, 5,462
Variables cuantitativas, 4
Variables de prediccin, 71,109
Variables de rango y orden, 5
W
Watts, W., 129
Wechsler, H 30-31
Weller, A., 303-04
Weller, L , 303-04
Windelband, Wilhelm, 58
Wiseman, H., 225
Wong, M. M 428,440
Wortman, C. B., 582
Wright, L 129
Wrightsmaa, L. S., 36 In
Wundt, Wilhelm, 58
X
X-barra, 37
Y
Yates, Frank, 518
Yerkes-Dodson law, 414
Argentina
Av. Regimiento de ios Patricios 1959
{C1266AAF) Buenos Aires
Argentina
Tel, (54-11} 4309-6100
Fax (54-11) 4309-6199
E-mail: mfo@pearsoned.com.ar
Amrica Central-Panam
Barrio La Guara, Moravia
75 metros norte,
Del Portn Norte del Club La Guara
San Jos, Costa Rica
Tel. (506) 235 72 76
Fax (506) 29728 52
E-mail: envwong@racsa.co.cr
Brasil
Ra Emilio Goeldi 747, Lapa
(05065-110) Sao Paulo -SP
Brasil
Tel. (5511) 36111-0201
Fax (5511)36111-0654
Caribe
Monte Mal!, 2do. piso, suite 21 -B
Av. Muoz Rivera
Hato Rey
Puerto Rico 00918-4261
TeL (787) 751-4830
Fax (787) 751-1677
E-mal: awicarib@caribe.net
yawlcarib@caribe.net
Chile
Av Manuel M onttl452
Providencia
Santiago, Chite
Tei. (562) 269 2089
Fax (562) 2746158
E-mail: nfopear@pearsoned.c!
Colombia
Carrera 68 22-55
Santa F de Bogot, D.C.
Colombia
Tel. (571) 405-9300
Fax (571) 405-9330
Espaa
Nuez de Baiboa120
(28006) Madrid
Espaa
Tel. (3491)590-3432
Fax (3491) 590-3448
Estados Unidos
One Lake Street
Upper Saddle River
NJ 07458
Tel. (201) 236-7000
Fax: (201) 238-3400
Mxico
Calle Cuatro No. 25 2do piso
Fracc. Industrial Alce Blanco
(53370), Naucalpan de Jurez
Estado de Mxico
Tei. (305) 3870700
Fax(525)3870811
Uruguay
Casa juana de Amrica
Av. 8 de Octubre 3061
(11600) Montevideo
Uruguay
Tel./Fax (5982) 486-1617